發(fā)布時(shí)間:2023-10-09 15:04:43
序言:作為思想的載體和知識(shí)的探索者,寫(xiě)作是一種獨(dú)特的藝術(shù),我們?yōu)槟鷾?zhǔn)備了不同風(fēng)格的5篇社交媒體研究,期待它們能激發(fā)您的靈感。
(一)傳播視頻主題多樣化,音樂(lè)、體育具有較高熱門(mén)度通過(guò)對(duì)YouTube上具有一定點(diǎn)擊量、較為熱門(mén)視頻的分析可知,其內(nèi)容主要涉及中國(guó)的音樂(lè)、飲食、影視、娛樂(lè)、習(xí)俗等方面,對(duì)于中國(guó)文化的呈現(xiàn)是多方面的。由于視頻分享網(wǎng)站的視聽(tīng)多媒體特性,音樂(lè)主題的樣本占到了30.1%,其中既有中國(guó)的古典音樂(lè),也有現(xiàn)代的流行音樂(lè),還有對(duì)國(guó)外音樂(lè)如《江南style》的中國(guó)式改造。影視劇尤其是中國(guó)的電影在YouTube上也有一定的收看比例,但數(shù)量不多,比重約為8.3%。飲食文化是中國(guó)對(duì)外文化傳播中得到國(guó)外受眾較多關(guān)注的內(nèi)容,在YouTube中的關(guān)注度也僅次于音樂(lè)和體育,比重約為10.5%。此外,YouTube的熱門(mén)視頻中,還包括人文景觀(guān)和旅游類(lèi)、武術(shù)類(lèi)、習(xí)俗類(lèi)、綜合類(lèi)等內(nèi)容,但比重較低。具體情況詳見(jiàn)圖1所示。
(二)中國(guó)文化形象以正面為主,少部分領(lǐng)域呈現(xiàn)負(fù)面形象本研究對(duì)于視頻樣本涉及的中國(guó)文化形象的評(píng)價(jià)性質(zhì)進(jìn)行了1~5分的量表編碼,其中非常正面為1分,比較正面為2分,中性為3分,比較負(fù)面為4分,非常負(fù)面為5分。依據(jù)以上得分標(biāo)準(zhǔn)統(tǒng)計(jì),最后得分為2.56,說(shuō)明文化形象還是偏向正面的。本研究還設(shè)置了“正面評(píng)價(jià)數(shù)/負(fù)面評(píng)價(jià)數(shù)的比值”指標(biāo)來(lái)考察視頻的受眾評(píng)價(jià)度(見(jiàn)圖2),大部分視頻的正面評(píng)價(jià)都大大超出其負(fù)面評(píng)價(jià),負(fù)面評(píng)價(jià)數(shù)超過(guò)正面評(píng)價(jià)的僅占6.87%。其他學(xué)者在對(duì)YouTube等國(guó)際新興自媒體、社交媒體的研究中指出,環(huán)境、民族宗教等議題涉及到的中國(guó)形象偏向負(fù)面[4]。與之相比,中國(guó)在YouTube中的文化形象呈現(xiàn)出相對(duì)的“正能量”。從內(nèi)容的傾向以及受眾的評(píng)價(jià)反饋來(lái)看,文化傳播的負(fù)面形象主要集中在飲食、體育等方面。中國(guó)盡管具有優(yōu)秀的飲食文化,但YouTube上展現(xiàn)的中國(guó)飲食文化形象仍有較多的且影響較大的負(fù)面內(nèi)容,《LACRUELDADENLACOMIDACHI-NA》、《SOPRENDENTESOBRELACOMIDACHI-NA》、《DigustingLiveAnimalEatingInChina》、《SnakedinnerinChinaVeryCool》等展示中國(guó)烹飪食用蛇、鼠、活魚(yú)、貓等不佳內(nèi)容的視頻大都具有逾百萬(wàn)次的觀(guān)看量,而與之相比,《舌尖上的中國(guó)》這樣展示博大精深、源遠(yuǎn)流長(zhǎng)的中國(guó)飲食文化的作品在YouTube上平均只有幾十萬(wàn)的觀(guān)看次數(shù)。作為現(xiàn)代社會(huì)和消費(fèi)文化重點(diǎn)的體育領(lǐng)域也成為YouTube上中國(guó)負(fù)面形象的來(lái)源之一,較多體現(xiàn)在體育道德和體育精神不足等方面,這也是需要糾偏和改善之處。
(三)觀(guān)看次數(shù)和受眾反饋熱度呈現(xiàn)較大落差,總體傳播效果仍需加強(qiáng)文化傳播的視頻由于內(nèi)容和質(zhì)量的參差不齊,其本身的分異也屬情理之中。但是作為依據(jù)熱門(mén)程度的非概率抽樣,本研究中的樣本還是顯現(xiàn)出較明顯的冪律分布特征,少數(shù)具有高度點(diǎn)擊量的視頻占據(jù)分布曲線(xiàn)的頂端位置,而大多數(shù)視頻的觀(guān)看次數(shù)迅速下滑,在200萬(wàn)次左右呈現(xiàn)出顯著拐點(diǎn),超過(guò)200萬(wàn)觀(guān)看次數(shù)的視頻約為11.5%,觀(guān)看次數(shù)最高的也只有500多萬(wàn)次(見(jiàn)圖3)。而在同樣以“China”為關(guān)鍵詞的未分類(lèi)的前530個(gè)熱門(mén)視頻樣本總體庫(kù)中,觀(guān)看次數(shù)超過(guò)200萬(wàn)次的約為22%,最高觀(guān)看次數(shù)達(dá)到8000多萬(wàn)次,文化向度相比之下仍然偏“冷”。從受眾評(píng)論次數(shù)來(lái)看,視頻在受眾反饋熱度上的差別也十分懸殊,評(píng)論數(shù)超過(guò)7000條的約為7%,多數(shù)視頻的受眾參與評(píng)論狀況以“長(zhǎng)尾”之勢(shì)在低位徘徊(見(jiàn)圖4)。而在具有高受眾評(píng)論度的文化內(nèi)容視頻中,負(fù)面內(nèi)容占到了半數(shù)。這些都顯示著中國(guó)文化在社交媒體平臺(tái)中的視聽(tīng)傳播,亟待加強(qiáng)優(yōu)秀的精品內(nèi)容、經(jīng)典內(nèi)容的建設(shè),增強(qiáng)其傳播效果。以韓國(guó)《江南style》音樂(lè)視頻為例,其在You-Tube上已有逾17億的觀(guān)看次數(shù)和600多萬(wàn)條的受眾評(píng)論。“時(shí)至今日,《江南style》已不僅是一個(gè)文化產(chǎn)品,……它已變成幫助推銷(xiāo)韓國(guó)出口商品,包括飲料、化妝品乃至電器的文化品牌。而對(duì)于韓國(guó)政府來(lái)說(shuō),《江南style》則儼然成了其在軟實(shí)力建構(gòu)上的標(biāo)志性成果。”對(duì)于我國(guó)的文化強(qiáng)國(guó)建設(shè)來(lái)說(shuō),需要高度重視社交媒體的文化特質(zhì)和功能,大力引導(dǎo)和鼓勵(lì)社交網(wǎng)絡(luò)文化產(chǎn)品創(chuàng)作精品供給,大力推動(dòng)更多、更優(yōu)秀的文化視聽(tīng)內(nèi)容通過(guò)YouTube的全球舞臺(tái)走向和融入世界。圖4視頻的受眾評(píng)論數(shù)變化曲線(xiàn)圖
(四)電視節(jié)目是傳播的主要來(lái)源形式國(guó)際社交媒體文化傳播具有多種多樣的形式,如影視劇、MTV、紀(jì)錄片、微電影、自拍視頻等。對(duì)于當(dāng)前階段的中國(guó)文化傳播來(lái)說(shuō),最主要的來(lái)源形式還是電視節(jié)目,包括電視的新聞節(jié)目、娛樂(lè)節(jié)目、直播轉(zhuǎn)播節(jié)目等,電視節(jié)目在各類(lèi)形式的視頻數(shù)量中所占比例達(dá)到了54%,其中娛樂(lè)節(jié)目所占過(guò)半,《中國(guó)達(dá)人秀》、《中國(guó)好聲音》等電視節(jié)目成為中國(guó)文化國(guó)際傳播的新興重要力量,反映了YouTube上中國(guó)文化傳播的娛樂(lè)化態(tài)勢(shì)。此外,由于YouTube和社會(huì)化媒體具有內(nèi)容分享、自媒體的特征,錄像、網(wǎng)友自拍攝內(nèi)容也占較大比例,達(dá)到17%。MV、MTV等音樂(lè)視頻的YouTube傳播也比較便捷,占到了12%。電影的傳播由于其他渠道的競(jìng)爭(zhēng)和替代,其比重不大。紀(jì)錄片、宣傳片、網(wǎng)友自制自創(chuàng)視頻的比重都很小,有待繼續(xù)提升。具體情況詳見(jiàn)圖5所示。圖5各類(lèi)形式視頻所占比例
(五)國(guó)內(nèi)外不同來(lái)源的視頻在數(shù)量和形式上存在較顯著差異從這些關(guān)于中國(guó)文化的視頻制作來(lái)源國(guó)來(lái)看,國(guó)外拍攝制作的只占30.08%,中國(guó)拍攝制作的占到了67.67%,未知來(lái)源的為2.26%。無(wú)論是國(guó)內(nèi)的還是國(guó)外的,各類(lèi)新聞節(jié)目、娛樂(lè)節(jié)目、直播節(jié)目等電視節(jié)目都占據(jù)著視頻來(lái)源的主體。從傳播實(shí)效來(lái)看,國(guó)外視頻的平均觀(guān)看次數(shù)為1180736次,國(guó)內(nèi)視頻為1113730次,差別不大。其中,來(lái)源于國(guó)內(nèi)的視頻內(nèi)容主要取自國(guó)內(nèi)的電視節(jié)目,約占61%,其主體包括中央電視臺(tái)和地方電視臺(tái)的娛樂(lè)、新聞節(jié)目,此外也有一小部分的國(guó)產(chǎn)電影和專(zhuān)題宣傳片。來(lái)源于國(guó)外的視頻內(nèi)容中,電視節(jié)目占到了45%,紀(jì)實(shí)錄像占到了35%。國(guó)外視頻中錄像所占比例大大高于國(guó)內(nèi),這也體現(xiàn)出國(guó)外的視頻制作者、提供者對(duì)直接進(jìn)入中國(guó)拍攝錄像的依賴(lài)程度。總體上看,中國(guó)文化的國(guó)際影響力生成還必須依靠自身的內(nèi)容制作與供給,同時(shí)也不能忽視國(guó)外在對(duì)于中國(guó)文化的間接傳播和二次傳播中所起的作用。
(六)“傳統(tǒng)中國(guó)”文化傳播的豐富程度顯著超出現(xiàn)代文化我國(guó)文化“走出去”的戰(zhàn)略和舉措中,悠久深厚的傳統(tǒng)文化一直是對(duì)外傳播的重要資源。在You-Tube中,“傳統(tǒng)文化依賴(lài)癥”表現(xiàn)比較顯著,中國(guó)傳統(tǒng)文化的傳播內(nèi)容豐富、數(shù)量較多,涉及飲食文化、人文景觀(guān)和文化遺產(chǎn)、傳統(tǒng)的風(fēng)俗習(xí)慣、古典音樂(lè)、中國(guó)功夫等。而中國(guó)現(xiàn)當(dāng)代新興文化成果、文化要素的呈現(xiàn)則相對(duì)單薄,大部分集中在電視節(jié)目、影音節(jié)目和當(dāng)代競(jìng)技體育項(xiàng)目等方面,缺乏豐富有力的“現(xiàn)代中國(guó)”文化形象。以題為《ThisisChina》的一個(gè)熱門(mén)視頻為例,它對(duì)中國(guó)的呈現(xiàn)主要還是故宮、舞獅、琵琶、茶、餃子、太極拳、京劇等傳統(tǒng)文化符號(hào),而該片段只在最后幾十秒中出現(xiàn)鳥(niǎo)巢等現(xiàn)代文化要素,時(shí)間短,且內(nèi)容意象簡(jiǎn)單、貧瘠。從另一個(gè)角度來(lái)說(shuō),中國(guó)的當(dāng)代文化通過(guò)一些影視節(jié)目加強(qiáng)了向國(guó)際社會(huì)“走出去”的力度,但仍然缺乏優(yōu)秀的現(xiàn)代文化資源。有研究者指出,“以往在大力展示中國(guó)古代文明的過(guò)程中,給國(guó)際公眾留下了太多傳統(tǒng)中國(guó)的意象。‘古色古香的中國(guó)’在一定程度上遮蔽了現(xiàn)代中國(guó)的魅力和形象”。YouTube中優(yōu)秀的現(xiàn)代中國(guó)文化形象的建構(gòu),不僅需要加大現(xiàn)代文化精品的建設(shè)力度,而且還需要改善現(xiàn)代文化因子的傳播結(jié)構(gòu)。
二、對(duì)策建議
YouTube已是全球化時(shí)代的典范新媒體和占有很大市場(chǎng)及流量份額的重要信息平臺(tái)。當(dāng)前,中國(guó)文化在YouTube中的國(guó)際傳播還存在一些薄弱環(huán)節(jié)和方面,加強(qiáng)YouTube中中國(guó)文化的傳播,不僅是針對(duì)YouTube的個(gè)案需要,也是以YouTube為重要代表的社會(huì)性媒體和視聽(tīng)新媒體的迫切訴求。
(一)加強(qiáng)國(guó)際社交媒體的視聽(tīng)精品內(nèi)容建設(shè),夯實(shí)文化走出去的資源基礎(chǔ)盡管我國(guó)并不缺乏視聽(tīng)文化資源,但是在國(guó)際社交媒體的舞臺(tái)上,還是凸顯出承載中國(guó)文化的精品視聽(tīng)內(nèi)容在建設(shè)和供給上的短板,尤其缺乏我國(guó)自制的并得到廣泛傳播的優(yōu)秀視聽(tīng)作品和經(jīng)典力作。以點(diǎn)擊收看狀況為例,YouTube中動(dòng)輒上千萬(wàn)收看次數(shù)的熱門(mén)視頻并不罕見(jiàn),而本研究中觀(guān)看次數(shù)居前的熱門(mén)視頻其平均觀(guān)看次數(shù)只有112萬(wàn)多次,絕大多數(shù)的觀(guān)看次數(shù)不超過(guò)200萬(wàn),這體現(xiàn)著社交媒體的經(jīng)典力作在YouTube上傳播的匱乏。就文化主題的熱度來(lái)看,文化方面的視頻在觀(guān)看次數(shù)居前的530個(gè)視頻樣本中占25%,屬于YouTube傳播的主要維度之一,這既說(shuō)明文化傳播在YouTube中具有豐富的受眾需求和發(fā)展?jié)摿Γ诧@示著當(dāng)前對(duì)于這種需求和潛力的重視及開(kāi)發(fā)的不足。我國(guó)需要推動(dòng)適合于社交媒體傳播的優(yōu)質(zhì)視聽(tīng)文化建設(shè),及時(shí)開(kāi)展和實(shí)施對(duì)外文化傳播的社交媒體戰(zhàn)略。
(二)引導(dǎo)和發(fā)揮網(wǎng)民主體的作用,推動(dòng)社交媒體時(shí)代的“公眾文化外交”就本研究而言,來(lái)源于國(guó)內(nèi)的熱門(mén)視頻大多數(shù)仍是電視節(jié)目和電影,而普通民眾拍攝或自行制作的視頻只占很小一部分。不隸屬于任何正式傳媒機(jī)構(gòu)或文化組織的網(wǎng)民,其自拍或自制的DV和視頻內(nèi)容未必十分精致,卻由于貼近受眾需求,主題鮮活、生動(dòng)等原因也可以取得良好反響。如leeds212上傳的題為《VeryfunnyChinesewowvid-eo》(國(guó)內(nèi)題為《魔怔世界》)的一個(gè)草根自制視頻在YouTube中獲得了120多萬(wàn)次的觀(guān)看量,這已經(jīng)大大超出國(guó)內(nèi)一些熱門(mén)的電視、音樂(lè)、電影的收看量。國(guó)外民間主體對(duì)中國(guó)的文化經(jīng)典、風(fēng)土習(xí)俗、飲食、人文景觀(guān)等文化內(nèi)容的拍攝紀(jì)錄和紀(jì)實(shí),呈現(xiàn)出比國(guó)內(nèi)間接推廣更為直接有效的傳播力,但是這些視頻的質(zhì)量及其所反映的中國(guó)形象都需要進(jìn)一步的引導(dǎo)和優(yōu)化。作為一種社交媒體和典型的“自媒體”,YouTube凸顯著個(gè)體性、社會(huì)性的網(wǎng)民在內(nèi)容制作、國(guó)際信息擴(kuò)散中的巨大作用,也提出對(duì)于公眾文化外交的迫切需求。
(三)調(diào)整社交媒體對(duì)外文化傳播的要素結(jié)構(gòu),加大中國(guó)現(xiàn)代文化傳播力度國(guó)家的對(duì)外文化傳播應(yīng)是傳統(tǒng)與現(xiàn)代要素的整合與平衡,中國(guó)在現(xiàn)代化和文化強(qiáng)國(guó)建設(shè)的進(jìn)程中,也要注意避免過(guò)多的歷史文化要素對(duì)現(xiàn)代文化形象的遮蔽。當(dāng)前,YouTube中的中國(guó)傳統(tǒng)文化因子較為豐富,而有效的現(xiàn)代文化傳播在結(jié)構(gòu)上相對(duì)滯后,當(dāng)代語(yǔ)境下新的文化內(nèi)容及其傳播形式與社交媒體的融合都有待進(jìn)一步加強(qiáng)。要積極促進(jìn)傳統(tǒng)媒體的“社交化”和國(guó)際化發(fā)展,探索微電影等適合于社交媒體受眾特點(diǎn)和互動(dòng)特征的媒介產(chǎn)品的國(guó)際傳播,重點(diǎn)關(guān)注音樂(lè)、藝術(shù)等當(dāng)代文化領(lǐng)域社交媒體的轉(zhuǎn)換和傳播,進(jìn)行社交媒體平臺(tái)中文化走出去的資源整合、組織整合與平臺(tái)整合,對(duì)我國(guó)社交媒體平臺(tái)中反映中國(guó)當(dāng)代文化的優(yōu)秀視聽(tīng)作品開(kāi)展系統(tǒng)的推廣工程,推動(dòng)中國(guó)當(dāng)代文化形象的構(gòu)建和整體文化形象的塑造。
自2011年開(kāi)始,我國(guó)政府機(jī)構(gòu)逐漸開(kāi)始借助微博推動(dòng)政府部門(mén)的信息服務(wù)由“國(guó)家模式”向“社會(huì)模式”轉(zhuǎn)變,將“被動(dòng)式”信息服務(wù)轉(zhuǎn)向“主動(dòng)式”信息服務(wù)。國(guó)家檔案局局長(zhǎng)楊冬權(quán)2011年在全國(guó)檔案宣傳工作會(huì)議上指出,要進(jìn)一步創(chuàng)新檔案宣傳形式,注重發(fā)揮各種新興媒體的宣傳作用,運(yùn)用各種新的宣傳形式,比如動(dòng)漫形式、網(wǎng)絡(luò)視頻的形式、微博的形式等,吸引更多的宣傳受眾。目前,我國(guó)檔案部門(mén)已經(jīng)積極參與到社交媒體的使用中,但同美國(guó)檔案館相比,社交媒體在應(yīng)用范圍、形式、運(yùn)用策略和政策以及取得成效等方面有很大的差距,美國(guó)檔案館運(yùn)用社交媒體的成功經(jīng)驗(yàn)值得我們借鑒和學(xué)習(xí)。
一、中美檔案館運(yùn)用社交媒體的比較
(一)社交媒體的應(yīng)用范圍。目前,我國(guó)檔案館對(duì)社交媒體的應(yīng)用十分有限。國(guó)家檔案館尚未使用社交媒體,省級(jí)檔案館對(duì)社交媒體的應(yīng)用水平參差不齊,總體上仍比較滯后。據(jù)相關(guān)統(tǒng)計(jì),在我國(guó)31個(gè)省級(jí)( 直轄市、 自治區(qū), 不含港澳臺(tái)地區(qū)) 綜合檔案館網(wǎng)站中,應(yīng)用博客或微博的僅有5個(gè),占16%;應(yīng)用百科的有6個(gè),占19%;應(yīng)用RSS或訂閱的有11個(gè),占35%;設(shè)置論壇的有14個(gè),占45%;設(shè)置留言板的有27個(gè),占87%。我國(guó)一些偏遠(yuǎn)地區(qū),如甘肅、、內(nèi)蒙古地區(qū)的檔案館尚未運(yùn)用任何形式的社交媒體工具。
美國(guó)國(guó)家檔案館從2009年在YouTube網(wǎng)站上開(kāi)設(shè)界面并創(chuàng)建了第一個(gè)“推特”(Twitter)微博賬戶(hù)開(kāi)始,逐步將檔案宣傳拓展到博客、微博、百科以及社交網(wǎng)絡(luò)領(lǐng)域。由于Web2.0社交媒體工具在美國(guó)十分流行,美國(guó)檔案館利用社會(huì)媒體服務(wù)信息,與用戶(hù)交流是十分普遍的。據(jù)調(diào)查,2012年,美國(guó)50個(gè)州檔案館中,有42個(gè)將社交媒體應(yīng)用于檔案工作中,社交媒體的應(yīng)用率達(dá)到84%,并且這些檔案館的網(wǎng)站都提供YouTube、Facebook、Twitter、Blog等多渠道的交流工具,并專(zhuān)門(mén)開(kāi)設(shè)反饋通道,收集用戶(hù)的意見(jiàn)。
(二)社交媒體的運(yùn)用形式。根據(jù)國(guó)內(nèi)社交媒體營(yíng)銷(xiāo)專(zhuān)家唐興通的觀(guān)點(diǎn),社交媒體可大致分為8類(lèi):社會(huì)關(guān)系網(wǎng)絡(luò)、視頻分享網(wǎng)絡(luò)、照片分享網(wǎng)絡(luò)、合作詞條網(wǎng)絡(luò)、新知共享網(wǎng)絡(luò)、內(nèi)容推選媒體、商務(wù)關(guān)系網(wǎng)絡(luò)、社會(huì)化書(shū)簽。目前,我國(guó)檔案館運(yùn)用的社交媒體形式有論壇、RSS訂閱、百科、微博、博客。按功能劃分,微博、博客、論壇屬于以話(huà)題為紐帶的信息平臺(tái),RSS訂閱屬于個(gè)性化的信息推送平臺(tái),若將其歸類(lèi),筆者認(rèn)為都應(yīng)劃為內(nèi)容推選媒體一類(lèi);百科則屬于合作詞條網(wǎng)絡(luò)。可見(jiàn),在我國(guó),人們耳熟能詳?shù)纳缃幻襟w工具如“人人網(wǎng)”“開(kāi)心網(wǎng)”“豆瓣”“QQ空間”“優(yōu)酷”“土豆”等社會(huì)關(guān)系網(wǎng)絡(luò)、視頻和照片的分享網(wǎng)絡(luò)尚未運(yùn)用于我國(guó)的檔案工作中。
美國(guó)檔案館運(yùn)用的社交媒體種類(lèi)繁多、形式多樣。以美國(guó)國(guó)家檔案館為例,到2013年5月,已在13個(gè)社交平臺(tái)上開(kāi)設(shè)了145個(gè)社交媒體項(xiàng)目。這些社交媒體按功能可分為網(wǎng)絡(luò)平臺(tái)、社交網(wǎng)絡(luò)平臺(tái)、文件的分享與存儲(chǔ)平臺(tái)三大類(lèi),每類(lèi)社交平臺(tái)包含多種社交工具,如網(wǎng)絡(luò)平臺(tái)包括Twitter、Blog、Wiki、Mashups、tumblr等,用戶(hù)憑借這些工具能隨時(shí)獲得國(guó)家檔案館更新的各類(lèi)信息;社交網(wǎng)絡(luò)平臺(tái)包括facebook、foursquare等,這些媒體工具為公眾提供了相互交流與協(xié)作的空間;文件的分享與存儲(chǔ)平臺(tái)包括Flicker 、Youtube、Pinsterest、Ustream等照片、視頻分享與存儲(chǔ)工具。可見(jiàn),美國(guó)國(guó)家檔案館幾乎運(yùn)用了所有種類(lèi)的社交媒體工具,并將不同類(lèi)型、不同用途的社交媒體工具結(jié)合使用,充分實(shí)現(xiàn)了與公眾的互動(dòng)。
(三)社交媒體傳遞的信息內(nèi)容。我國(guó)檔案館運(yùn)用社交媒體所傳遞的信息內(nèi)容多為檔案部門(mén)的行政信息、動(dòng)態(tài)新聞,形式以文本和圖片為主。以微博為例,一些檔案部門(mén)的微博只是進(jìn)行一些轉(zhuǎn)發(fā),很多還與檔案工作無(wú)關(guān);檔案部門(mén)原創(chuàng)的微博內(nèi)容大多為工作動(dòng)態(tài)、工作要聞,沒(méi)有對(duì)館藏資源進(jìn)行深入挖掘。微博如何更新、微博主題如何選擇等沒(méi)有清晰的定位,造成檔案部門(mén)微博的內(nèi)容無(wú)特色、主題不突出。因此,檔案部門(mén)的微博很少會(huì)受到評(píng)論和轉(zhuǎn)發(fā)。此外,博客、論壇和網(wǎng)絡(luò)社區(qū)的檔案信息多為檔案界人士的交流信息及成果展示,這為業(yè)內(nèi)人員相互學(xué)習(xí)搭建了平臺(tái),但與普通公眾的互動(dòng)度不高。
美國(guó)檔案館利用社交媒體傳遞著豐富的信息內(nèi)容,除行政信息外,美國(guó)檔案館對(duì)館藏資源進(jìn)行深入挖掘,以文字、圖片、視頻、音頻等多種形式展現(xiàn)給公眾。例如公眾可利用微博和博客分享檔案館的最新信息并進(jìn)行互動(dòng)交流;通過(guò)訪(fǎng)問(wèn)“Our Archives”Wiki分享關(guān)于美國(guó)國(guó)家檔案館的館藏及參與者的研究;可以在Flickr上對(duì)美國(guó)國(guó)家檔案館館藏的照片進(jìn)行下載、標(biāo)注標(biāo)簽、發(fā)表評(píng)論和注釋?zhuān)煌ㄟ^(guò)YouTube觀(guān)看館藏的部分視頻資料;通過(guò)Facebook和檔案館保持聯(lián)系,進(jìn)行互動(dòng)交流等。
(四)運(yùn)用社交媒體的策略和政策。中國(guó)在社交媒體上的應(yīng)用正處于迅猛發(fā)展之中,如政府可通過(guò)政務(wù)微博進(jìn)行政府信息公開(kāi)、新聞?shì)浾撘龑?dǎo)、傾聽(tīng)民眾呼聲;企業(yè)可利用社交媒體工具進(jìn)行商業(yè)活動(dòng),開(kāi)展商業(yè)宣傳。由于社交媒體具有參與性、公開(kāi)性、交流性、對(duì)話(huà)性等基本特征,人們通過(guò)社交媒體傳遞信息、分享觀(guān)點(diǎn),易引起廣泛關(guān)注。目前,我國(guó)一些企業(yè)和商家在運(yùn)用社交媒體進(jìn)行營(yíng)銷(xiāo)時(shí)都采取了相應(yīng)的積極策略和政策。然而,政府部門(mén)尚未針對(duì)社交媒體的運(yùn)用制定出相關(guān)的策略和政策,檔案部門(mén)亦是如此。
為充分發(fā)揮社交媒體在檔案資源傳播方面的積極作用, 美國(guó)國(guó)家檔案館于2010 年12 月在其官方網(wǎng)站上正式公布了社交媒體策略,積極倡導(dǎo)社交媒體在檔案工作中的廣泛應(yīng)用,確定與社交媒體合作的核心價(jià)值,即合作、領(lǐng)導(dǎo)、激勵(lì)、多元、團(tuán)體、開(kāi)放。策略的制定在于促進(jìn)政府、團(tuán)體和公民間的溝通和交流,以充分挖掘檔案信息的各種價(jià)值,更好地為用戶(hù)提供利用服務(wù)。2011年2月,美國(guó)國(guó)家檔案館又出臺(tái)了《Web2.0背景下社交媒體平臺(tái)文件管理指南》,就社交媒體給檔案工作帶來(lái)的新問(wèn)題作出了解釋并提出應(yīng)對(duì)的策略,如社交媒體平臺(tái)的分類(lèi)、聯(lián)邦政府文件的界定、社交媒體平臺(tái)與聯(lián)邦政府文件產(chǎn)生的關(guān)系、使用社交媒體后文件管理所面臨的挑戰(zhàn)、社交媒體服務(wù)商責(zé)任等。此外,美國(guó)國(guó)家檔案館還制定了社交媒體政策,對(duì)每種社交媒體的使用都作出詳細(xì)規(guī)定,如用戶(hù)的年齡要求、信息的內(nèi)容要求等。
(五)運(yùn)用社交媒體取得的成效。目前,社交媒體在我國(guó)各級(jí)檔案部門(mén)雖然得以初步運(yùn)用,但成效一般。根據(jù)中國(guó)人民大學(xué)檔案網(wǎng)站調(diào)查與測(cè)評(píng)項(xiàng)目組的調(diào)查顯示,我國(guó)省級(jí)檔案館網(wǎng)站的網(wǎng)上交互指標(biāo)平均得分率僅為42.75%,其中最能體現(xiàn)交互功能的網(wǎng)上業(yè)務(wù)咨詢(xún)、網(wǎng)上論壇得分普遍偏低,分別為0.21和0.23。筆者對(duì)檔案微博的使用情況進(jìn)行調(diào)查,截至2014年6月25日12點(diǎn),在新浪微博開(kāi)通微博并進(jìn)行認(rèn)證的省級(jí)檔案部門(mén)(不含直轄市、自治區(qū)、港澳臺(tái)地區(qū))共有6個(gè)。通過(guò)對(duì)檢索數(shù)據(jù)的分析,發(fā)現(xiàn)檔案館微博數(shù)量偏低,日均量大多1條左右,而每條微博平均評(píng)論量不足1條。
可見(jiàn),社交媒體在實(shí)際應(yīng)用中,其交互功能尚未發(fā)揮出來(lái)。大部分檔案館雖然設(shè)置了“網(wǎng)上咨詢(xún)”模塊,但是回復(fù)速度慢,難以滿(mǎn)足訪(fǎng)問(wèn)者的及時(shí)需求。博客、微博主題不突出、時(shí)效性較差,導(dǎo)致用戶(hù)與檔案館之間的交流和溝通很難深入。
在美國(guó),社交媒體的利用掀起了美國(guó)檔案資源傳播的。2009年,在社交媒體利用之初,美國(guó)國(guó)家檔案館在Youtube網(wǎng)站“推特”(twitter)微博賬戶(hù)上傳的一段視頻的日點(diǎn)擊播放量達(dá)到了1.5萬(wàn)人次。在9個(gè)月內(nèi),美國(guó)國(guó)家檔案館上傳影片的點(diǎn)播量已超過(guò)10萬(wàn)次,視頻點(diǎn)播量超過(guò)50萬(wàn)次。檔案資源傳播速度之快,數(shù)量之大前所未有。從近期美國(guó)國(guó)家檔案館的統(tǒng)計(jì)來(lái)看,各種社交媒體的訪(fǎng)問(wèn)量總體呈上升趨勢(shì),例如Twitter,2014年1月至4月,微博客的用戶(hù)瀏覽數(shù)量不斷遞增,4個(gè)月內(nèi)用戶(hù)瀏覽數(shù)量增加了28830人次。在這些社交媒體中,F(xiàn)acebook和Flickr最受公眾歡迎,2014年2月Flickr的訪(fǎng)問(wèn)量達(dá)到9,925,559人次。由此可見(jiàn),美國(guó)國(guó)家檔案館借助社交媒體開(kāi)展檔案文化傳播取得驚人成效。
三、美國(guó)檔案館成功運(yùn)用社交媒體的優(yōu)勢(shì)分析
通過(guò)比較發(fā)現(xiàn),我國(guó)檔案館在社交媒體運(yùn)用方面同美國(guó)檔案館相比有很大的差距。筆者認(rèn)為,我國(guó)檔案館運(yùn)用社交媒體的現(xiàn)狀可概況為以下幾個(gè)點(diǎn),即社交媒體的應(yīng)用范圍小;運(yùn)用形式比較單一、交流途徑有限;缺少相關(guān)策略、政策的引導(dǎo)和規(guī)范;公眾的參與度低,社交媒體的運(yùn)用尚未取得實(shí)質(zhì)性的成效。美國(guó)檔案館成功地將社交媒體應(yīng)用于檔案工作中,筆者認(rèn)為有以下幾方面的優(yōu)勢(shì)。
(一)社交媒體形式多樣,內(nèi)容豐富。美國(guó)國(guó)家檔案館及各地分館采用多種形式的社交媒體工具,從Twitter、Blog等信息工具,到Flickr、YouTube等圖片、視頻分享平臺(tái),以及Facebook、Foursquare等社交網(wǎng)絡(luò),公眾不僅能夠了解檔案館的最新動(dòng)態(tài),瀏覽形式多樣的館藏資源,同時(shí)還可通過(guò)互動(dòng)平臺(tái)及時(shí)表達(dá)想法、反饋意見(jiàn)。目前,美國(guó)檔案館已開(kāi)設(shè)140多個(gè)社交媒體專(zhuān)頁(yè)和項(xiàng)目,全方位多渠道地把館藏資源和相關(guān)信息推介給公眾。
(二)美國(guó)國(guó)家檔案館的積極倡導(dǎo)。美國(guó)國(guó)家檔案館作為聯(lián)邦政府檔案工作的最高管理機(jī)構(gòu),積極倡導(dǎo)社交媒體在全國(guó)檔案工作中的廣泛應(yīng)用,并積極發(fā)揮表率作用,率先在日常工作中使用新技術(shù)和方法。同時(shí),美國(guó)國(guó)家檔案館還了社交媒體策略,即促進(jìn)檔案工作者間革命性的交流與協(xié)作;創(chuàng)建與政府社區(qū)對(duì)話(huà)的空間和平臺(tái);建立和加強(qiáng)與研究人員、公民檔案管理者的聯(lián)系。該策略旨在從檔案工作團(tuán)體、政府社區(qū)、公民檔案者三個(gè)層面來(lái)促進(jìn)檔案資源的共享與共建。
〔關(guān)鍵詞〕社交媒體;信息可信度;評(píng)估;綜述
〔中圖分類(lèi)號(hào)〕G203 〔文獻(xiàn)標(biāo)識(shí)碼〕A 〔文章編號(hào)〕1008-0821(2016)12-0164-06
〔Abstract〕Information credibility assessment research in social media not only contributes to the development and improvement of network information resource management theory,but also helps to improve the effectiveness of social media monitoring public opinion,social media search,social recommendation and so on.The paper firstly reviewed the researches at home and abroad about the social media information research,information credibility research,and social media information credibility assessment research,and then pointed out the problems existing in information credibility assessment research of domestic social media,and finally put forward the solution to it.
〔Key words〕social media;information;credibility;assessment;review
1 研究的意義
隨著互聯(lián)網(wǎng)技術(shù)和移動(dòng)技術(shù)的突飛猛進(jìn),社交媒體盛行,人人可做信息的制造者,制造的信息極為豐富。然而,在這豐富信息的背后,隱藏著漫天飛舞的謠言、病毒般傳播的虛假照片和視頻,這給人們幸福的生活、社會(huì)的穩(wěn)定帶來(lái)了嚴(yán)重的隱患。為了遏制虛假不良信息傳播,營(yíng)造健康向上的網(wǎng)絡(luò)環(huán)境,信息可信度評(píng)估就成了迫在眉睫的問(wèn)題,社交媒體信息急需“鑒定師”和“測(cè)謊儀”。
社交媒體信息可信度評(píng)估研究既有較高的學(xué)術(shù)價(jià)值,也有較強(qiáng)的應(yīng)用價(jià)值。具體來(lái)說(shuō),學(xué)術(shù)價(jià)值表現(xiàn)在研究社交媒體信息可信度評(píng)估并探討虛假信息的生成機(jī)制、傳播模式、治理措施,是對(duì)社交媒體環(huán)境下網(wǎng)絡(luò)信息資源管理理論的豐富、發(fā)展與完善。應(yīng)用價(jià)值表現(xiàn)在研究社交媒體信息可信度評(píng)估有助于社交媒體用戶(hù)判斷信息的可信性,營(yíng)造誠(chéng)信健康的互聯(lián)網(wǎng)環(huán)境,也有助于提高社交媒體信息輿情監(jiān)控、社交媒體信息引導(dǎo)、社交媒體搜索、社會(huì)化推薦等方面的效果。
2 社交媒體信息研究
社交媒體(Social Media)是通過(guò)Web2.0技術(shù)實(shí)現(xiàn)的一類(lèi)支持用戶(hù)自主創(chuàng)造和交換內(nèi)容的媒體,如Twitter、Facebook、Youtube、LinkedIn、Wiki、微博、微信、QQ、論壇、人人網(wǎng)等。自1973年Lipkin、Szpakowski和Felsenstein 3人在美國(guó)加州伯克利市建立全球第一個(gè)公共電子公告牌系統(tǒng) Community Memory后,BBS以及網(wǎng)絡(luò)社區(qū)等早期的社交媒體開(kāi)始映入人們的眼簾。《2015年全球社會(huì)化媒體、數(shù)字和移動(dòng)業(yè)務(wù)數(shù)字統(tǒng)計(jì)趨勢(shì)》報(bào)告表明:全球社交媒體活躍用戶(hù)約占全球人口的29%。
2.1 國(guó)外研究
社交媒體的相關(guān)研究從20世紀(jì)80年代開(kāi)始,在2005年左右開(kāi)始進(jìn)入快速發(fā)展階段,發(fā)文量有逐年增加的趨勢(shì)。在國(guó)際期刊中,發(fā)表社交媒體論文較多的要屬《Computers in Human Behavior》。近兩年,關(guān)于社交媒體的國(guó)際會(huì)議主要有ASONAM、SMP、MISNC、SMAP、SCSM。國(guó)外學(xué)者研究?jī)?nèi)容主要集中在以下4個(gè)方面:
2.1.1 社交媒體信息利用研究
社交媒體在商業(yè)領(lǐng)域、教育領(lǐng)域、公共管理領(lǐng)域等都有廣泛的應(yīng)用[1]。如在營(yíng)銷(xiāo)領(lǐng)域,利用社交媒體信息,可以獲知消費(fèi)者態(tài)度和行為[2],可以獲知客戶(hù)交流和推薦對(duì)營(yíng)銷(xiāo)的影響[3-4],可以獲知社交媒體信息對(duì)營(yíng)銷(xiāo)管理功能的影響[5]。
2.1.2 社交媒體信息檢索與信息推薦研究
側(cè)重于社交媒體信息檢索與信息推薦方法的研究。社交媒體信息的檢索采用主題模型[6]、社會(huì)網(wǎng)絡(luò)[7]、本體[8]等檢索方法。比如,Hong和Davison(2010)使用標(biāo)準(zhǔn)主題模型進(jìn)行社交媒體Twitter信息的檢索。社交媒體信息的推薦采用內(nèi)容推薦[9]、協(xié)同過(guò)濾[10]、時(shí)序推薦[11]、位置推薦[12]、社會(huì)化推薦[13]等方法。比如,Levandoski等(2012)提出位置感知推薦系統(tǒng)(LARS)[12]。
2.1.3 社交媒體信息傳播研究
側(cè)重于反映信息傳播傳播規(guī)律的社交媒體信息傳播模型的構(gòu)建以及通過(guò)模型的構(gòu)建對(duì)實(shí)際問(wèn)題進(jìn)行預(yù)測(cè)等方面的研究。如Galuba等(2010)通過(guò)研究1 500萬(wàn)URL在不同Twitter用戶(hù)之間的300小時(shí)傳播,提出了基于內(nèi)容流行度、用戶(hù)影響力和傳播速度的線(xiàn)性閾值模型[14]。Adar和Adamic(2005)通過(guò)研究信息在博客中傳播的模式和動(dòng)力學(xué)特性,提出用傳染病模型來(lái)描繪信息傳播的機(jī)理[15]。Asur和Huberman(2010)采用來(lái)自的聊天數(shù)據(jù)通過(guò)簡(jiǎn)單的線(xiàn)性回歸模型預(yù)測(cè)電影票房的收入[16]。
2.1.4 社交媒體用戶(hù)隱私研究
在探討社交媒體用戶(hù)隱私現(xiàn)存問(wèn)題的基礎(chǔ)上,提出了相應(yīng)的隱私保護(hù)方法。如Viswanath等(2010)首先研究Sybil防御的缺陷,在其基礎(chǔ)上探討了替代Sybil防御的方法[17]。Conti等(2011)采用FaceVPSN解決社交媒體用戶(hù)隱私問(wèn)題[18]。
2.2 國(guó)內(nèi)研究
國(guó)內(nèi)學(xué)者的社交媒體研究最早可追溯至20世紀(jì)90年代末,但從2005年后起關(guān)于社交媒體的論文才逐漸表現(xiàn)出增長(zhǎng)態(tài)勢(shì)。國(guó)內(nèi)研究?jī)?nèi)容主要集中在:
2.2.1 社交媒體信息傳播研究
研究?jī)?nèi)容包括:①社交媒體信息傳播模式研究。如韓佳等(2013)提出了基于改進(jìn)SIR的在線(xiàn)社交網(wǎng)絡(luò)信息傳播模型[19]。姜景等(2015)構(gòu)建表征謠言信息與辟謠信息傳播機(jī)理的Lotka-Volterra競(jìng)爭(zhēng)模型[20]。②社交媒體信息傳播中存在的問(wèn)題與對(duì)策研究。如閻俊(2015)探討微博傳播存在的問(wèn)題及原因,并提出了加強(qiáng)微博內(nèi)容管理、增強(qiáng)把關(guān)意識(shí)、提高微博用戶(hù)的媒介素養(yǎng)等對(duì)策[21]。③社交媒體信息傳播效果研究。如陳遠(yuǎn)和袁艷紅(2012)以新浪微博作為數(shù)據(jù)來(lái)源,把信息覆蓋人數(shù)、評(píng)論數(shù)、轉(zhuǎn)發(fā)數(shù)作為微博信息傳播效果的量化指標(biāo),從縱橫向兩個(gè)角度研究新浪微博信息傳播過(guò)程造成的效應(yīng)[22]。
2.2.2 社交媒體輿情分析與監(jiān)測(cè)研究
如張J等(2014)以打砸日系車(chē)系列突發(fā)公共事件為實(shí)例,探討其在新浪微博和新浪新聞平臺(tái)上輿情傳播的特征與規(guī)律[23]。張瑜等(2015)對(duì)新浪微博熱門(mén)話(huà)題“北京單雙號(hào)限行常態(tài)化”下的微博進(jìn)行了數(shù)據(jù)采集,將輿情演化劃分為潛伏、成長(zhǎng)、爆發(fā)、衰退、波動(dòng)、死亡6個(gè)階段,并對(duì)各階段進(jìn)行情感分析,為輿情治理提供了支持[24]。唐濤(2014)在分析網(wǎng)絡(luò)輿情五要素的基礎(chǔ)上,探討移動(dòng)互聯(lián)網(wǎng)輿情的新特征,指出面臨的新挑戰(zhàn),并從信息分析、信息篩選、信息引導(dǎo)等方面提出對(duì)策[25]。
2.2.3 社交媒體營(yíng)銷(xiāo)研究
如唐興通(2012)的著作《社會(huì)化媒體營(yíng)銷(xiāo)大趨勢(shì):策略與方法》系統(tǒng)總結(jié)了社交媒體營(yíng)銷(xiāo),并對(duì)眾多社交媒體工具在實(shí)際工作中的應(yīng)用提供了具體的建議[26]。張淼(2014)提出了企業(yè)完善社交媒體營(yíng)銷(xiāo)策略的“9+3”模式[27]。劉曉燕和鄭維雄(2015)采用社會(huì)網(wǎng)絡(luò)分析方法研究企業(yè)微博營(yíng)銷(xiāo)傳播的效果[28]。
3 信息可信度研究
3.1 國(guó)外研究
信息可信度(Information Credibility)是指人們對(duì)信息可相信程度的認(rèn)識(shí)。它由值得信賴(lài)(Trustworthiness)和專(zhuān)業(yè)性(Expertise)兩個(gè)關(guān)鍵要素組成[29]。信息可信度比較系統(tǒng)的研究始于20世紀(jì)50年代的傳播領(lǐng)域。Hovland和同事的工作具有里程碑的意義[30]。信息可信度最初關(guān)注的是傳播者的可信度。國(guó)外對(duì)傳統(tǒng)媒體信息可信度的研究主要是從信源可信度、內(nèi)容可信度、渠道可信度三方面展開(kāi)的。隨著互聯(lián)網(wǎng)的出現(xiàn),網(wǎng)絡(luò)信息可信度的評(píng)估被提上了議事日程。研究情況可歸納如下:
3.1.1 網(wǎng)絡(luò)信息可信度評(píng)估的理論模型
主要有Fogg(2003)的P-I理論模型、Wathen和Burkell(2002)的評(píng)判模型、Sundar(2008)的MAIN Model、Hilligoss和Rieh(2008)的統(tǒng)一模型、Metzger(2007)的雙處理模型以及Lucassen等(2013)的3S模型(修訂版)。以上理論模型是由情境、用戶(hù)特征、操作性、處理過(guò)程這些側(cè)面的若干部分構(gòu)建而成的。
3.1.2 網(wǎng)絡(luò)信息可信度研究?jī)?nèi)容
主要有對(duì)網(wǎng)絡(luò)新聞的可信度研究、對(duì)搜索引擎結(jié)果的可信度研究以及對(duì)維基百科內(nèi)容的可信度研究。比如,Nagura等(2006)通過(guò)比較關(guān)于同一主題不同網(wǎng)頁(yè)的相似度來(lái)計(jì)算每個(gè)網(wǎng)頁(yè)的可信度[31]。Yamamoto和Tanaka(2011)利用用戶(hù)可信度評(píng)判模型對(duì)網(wǎng)頁(yè)搜索結(jié)果進(jìn)行重新排序,以便從Web搜索結(jié)果的列表中用戶(hù)可以更高效的找到可信的網(wǎng)頁(yè)[32]。Adler等(2008)以文章長(zhǎng)度、版本數(shù)量和基于貢獻(xiàn)數(shù)量的作者聲譽(yù)建立模型,計(jì)算出維基百科文章的可信度[33]。
3.1.3 網(wǎng)絡(luò)信息可信度研究方法
主要采用定量研究法。比如,Olteanu等(2013)在調(diào)查網(wǎng)頁(yè)的各種特征(文本內(nèi)容、鏈接結(jié)構(gòu)、網(wǎng)頁(yè)設(shè)計(jì)等)的基礎(chǔ)上,經(jīng)過(guò)統(tǒng)計(jì)分析方法篩選出關(guān)鍵的特征,采用監(jiān)督學(xué)習(xí)算法來(lái)推斷網(wǎng)頁(yè)內(nèi)容的可信度[34]。與網(wǎng)絡(luò)信息可信度有關(guān)的典型系統(tǒng)有日本的WISDOM和Honto?Search。
3.1.4 影響力較大的項(xiàng)目和國(guó)際會(huì)議
影響力較大的項(xiàng)目有互聯(lián)網(wǎng)可信度研究(The Web Credibility Research)項(xiàng)目,影響力較大的國(guó)際會(huì)議有WICOW(Workshop on Information Credibility on the Web)。
3.2 國(guó)內(nèi)研究
1993年的《鑒別虛假信息五法》是國(guó)內(nèi)發(fā)表的早期論文。2004年至今,相關(guān)研究進(jìn)入快速發(fā)展期。相對(duì)于國(guó)外較多研究評(píng)估算法和評(píng)估系統(tǒng),國(guó)內(nèi)研究重點(diǎn)在于定性分析上,大多采用問(wèn)卷調(diào)查及專(zhuān)家訪(fǎng)談法等進(jìn)行人工評(píng)估。國(guó)內(nèi)研究?jī)?nèi)容主要有:
3.2.1 側(cè)重于信息可信度影響因素研究
比如,龔思蘭等(2013)針對(duì)評(píng)論信息的文本內(nèi)容、長(zhǎng)度、情感傾向、時(shí)效性、者、商家活動(dòng)等特征,通過(guò)問(wèn)卷調(diào)查方式對(duì)大學(xué)生消費(fèi)群體進(jìn)行在線(xiàn)商品評(píng)論信息可信度影響因素實(shí)證分析[35]。蔣洪梅(2013)運(yùn)用理論分析輔以實(shí)證研究的方法,從宏觀(guān)的社會(huì)系統(tǒng)、中觀(guān)的政策法規(guī)、微觀(guān)的媒介與受眾3個(gè)視角分析網(wǎng)絡(luò)新聞信息可信度的影響因素[36]。
3.2.2 側(cè)重于信息可信度指標(biāo)體系的構(gòu)建
比如,胡紅亮(2013)按照信息源、信息加工、信息傳播和信息應(yīng)用等方面采用德?tīng)柗茖?zhuān)家調(diào)查法建立了學(xué)術(shù)著作可信度的基本評(píng)價(jià)模型[37]。潘勇和孔棟(2007)基于第三方認(rèn)證機(jī)構(gòu)的視角,構(gòu)建了電子商務(wù)網(wǎng)站的信用評(píng)價(jià)指標(biāo)體系及評(píng)價(jià)因素集,并建立灰色關(guān)聯(lián)信用評(píng)估模型[38]。當(dāng)然,也有少量基于機(jī)器學(xué)習(xí)的信息可信度自動(dòng)化評(píng)估實(shí)驗(yàn)研究,比如,馬偉瑜(2011)提出一種采用改進(jìn)的PageRank算法評(píng)估網(wǎng)頁(yè)信息可信度的方法[39]。
4 社交媒體信息可信度評(píng)估研究
4.1 國(guó)外研究
國(guó)外相關(guān)研究較早。社交媒體信息可信度的相關(guān)研究隨著B(niǎo)BS的出現(xiàn)隨之展開(kāi),最早可追溯到20世紀(jì)80年代。目前可以說(shuō),研究處于繁榮期。國(guó)外研究情況可歸納如下:
4.1.1 社交媒體信息可信度評(píng)估研究?jī)?nèi)容
研究?jī)?nèi)容主要包括:①不實(shí)信息的判斷識(shí)別。如Qazvinian等(2011)提取Twitter信息的文本特征、網(wǎng)絡(luò)特征和微博元素特征,構(gòu)建貝葉斯分類(lèi)器甄別謠言[40]。Zhao等(2015)通過(guò)研究查詢(xún)帖以便及早識(shí)別社交媒體謠言[41]。②話(huà)題新聞的可信度評(píng)估。如Castillo等(2011)選取了有關(guān)用戶(hù)特征、文本特征、主題特征、信息傳播特征,采用J48決策樹(shù)評(píng)估Twitter中話(huà)題新聞的可信度[42]。
4.1.2 社交媒體信息可信度評(píng)估方法
評(píng)估方法主要有監(jiān)督學(xué)習(xí)[43],統(tǒng)計(jì)分析[44],與可信信息來(lái)源的相似性比較[45-46],社交網(wǎng)絡(luò)的鏈接結(jié)構(gòu)分析與主題模型的利用[47]等。它們主要采用自動(dòng)評(píng)估,具體來(lái)說(shuō):①選取的特征:選取的特征主要是用戶(hù)特征、文本特征、信息傳播特征。比如,西班牙的Castillo和智利的Mendoza、Poblete(2011)選取用戶(hù)特征(如注冊(cè)時(shí)間、粉絲量、好友量),文本特征(如是否包含#標(biāo)簽、是否包含問(wèn)號(hào)、Tweet中包含的URL數(shù)量、是否轉(zhuǎn)發(fā)),主題特征(如帶#標(biāo)簽Tweet的比例、Tweet數(shù)量、Tweet的平均長(zhǎng)度、Tweet的平均情感分值、積極情緒或消極情緒的比例),以及信息傳播特征(如傳播樹(shù)的深度),采用J48決策樹(shù)評(píng)估Twitter信息的可信度[42]。②評(píng)估的方法:大多通過(guò)構(gòu)建SVM分類(lèi)器、Bayesian分類(lèi)器、Decision Tree分類(lèi)器等方法,并對(duì)結(jié)果進(jìn)行分類(lèi),以達(dá)到評(píng)估社交媒體信息可信度的目的。上例Castillo等采用J48決策樹(shù)構(gòu)建分類(lèi)器,并對(duì)結(jié)果進(jìn)行分類(lèi),從而評(píng)估Twitter信息的可信度[42]。當(dāng)然,也有通過(guò)對(duì)結(jié)果進(jìn)行排序的實(shí)例,從而達(dá)到評(píng)估社交媒體信息可信度的目的。比如,Gupta和Kumaraguru(2012)采用Rank-SVM與PRF相結(jié)合的方法,按照可信度得分對(duì)Twitter信息進(jìn)行排序[43]。
4.1.3 有較大影響的在研項(xiàng)目與系統(tǒng)
由歐盟資助七國(guó)科研人員聯(lián)合攻關(guān)的PHEME項(xiàng)目研究的重點(diǎn)是社交媒體信息的真實(shí)性,該項(xiàng)目在國(guó)際上有較大影響。Jacob Ratkiewicz等(2011)開(kāi)發(fā)出可實(shí)時(shí)追蹤Twitter上政治謠言的Truthy系統(tǒng)[48]。Gupta等(2014)、Lorek等(2015)分別開(kāi)發(fā)出一款可自動(dòng)評(píng)估推文可信度的工具TweetCred、TwitterBOT[49-50]。
4.2 國(guó)內(nèi)研究
2007年《博客信息“可信度不亞于紐約時(shí)報(bào)”?》拉開(kāi)了國(guó)內(nèi)探討社交媒體信息可信度評(píng)估的序幕。目前研究還處于發(fā)展的初期。社交媒體信息可信度評(píng)估研究主要有:
4.2.1 社交媒體信息可信度影響因素研究
如劉雪艷和閆強(qiáng)(2013)探討政府微博中的熱點(diǎn)事件信息可信度的影響因素[51]。丁科芝(2015)從信息傳播者、渠道、信息內(nèi)容和用戶(hù)基本信任觀(guān)念4個(gè)方面構(gòu)建社交網(wǎng)絡(luò)可信度影響因素模型[52]。薛傳業(yè)等(2015)從信息來(lái)源可信度、信息傳播渠道可信度、信息內(nèi)容可信度以及信息評(píng)論反饋多維度探討了突發(fā)事件中社交媒體信息可信度的影響因素[53]。
4.2.2 構(gòu)建社交媒體信息可信度指標(biāo)體系研究
它大多采用問(wèn)卷調(diào)查及專(zhuān)家訪(fǎng)談法進(jìn)行人工評(píng)估。屈文建和謝冬(2013)從站點(diǎn)層次、版塊層次、主題層次、內(nèi)容層次4方面,采用模糊綜合信用評(píng)估模型對(duì)網(wǎng)絡(luò)學(xué)術(shù)論壇信息可信度進(jìn)行評(píng)估[54]。莫祖英等(2013)從微博信息量、信息內(nèi)容質(zhì)量、信息來(lái)源質(zhì)量和信息利用情況等方面進(jìn)行問(wèn)卷調(diào)查,采用層次分析法構(gòu)建微博信息質(zhì)量評(píng)估模型[55]。當(dāng)然國(guó)內(nèi)也有少量自動(dòng)化評(píng)估的例子。比如,賀剛等(2013)引入關(guān)鍵詞分布特征和時(shí)間差等新特征,基于SVM算法來(lái)預(yù)測(cè)新浪微博信息是否為謠言[56]。程亮等(2013)提出基于BP神經(jīng)網(wǎng)絡(luò)模型及改進(jìn)其激發(fā)函數(shù),同時(shí)引入沖量項(xiàng),對(duì)微博話(huà)題在傳播過(guò)程中演變?yōu)橹{言進(jìn)行檢測(cè)[57]。路同強(qiáng)(2015)采用半監(jiān)督學(xué)習(xí)算法檢測(cè)微博謠言,但不足之處在于未考慮信息的深層特征[58]。
4.3 存在的問(wèn)題
對(duì)比國(guó)內(nèi)外研究情況,可發(fā)現(xiàn)國(guó)內(nèi)研究存在如下問(wèn)題:
4.3.1 研究?jī)?nèi)容
關(guān)于社交媒體信息可信度研究,國(guó)內(nèi)外目前以微博研究較多。與國(guó)外豐富的研究?jī)?nèi)容相比,國(guó)內(nèi)在該領(lǐng)域的研究還主要集中于對(duì)影響因素以及特征的探討上。
4.3.2 研究方法
國(guó)外定量研究較多,很多涉及自動(dòng)化評(píng)估,而國(guó)內(nèi)定性研究較多,大多采用問(wèn)卷調(diào)查法、專(zhuān)家訪(fǎng)談法等進(jìn)行人工評(píng)估。
總之,現(xiàn)有研究大多是針對(duì)Twitter等英文社交媒體,其研究成果大多不能直接應(yīng)用于中文社交媒體。盡管也有少量研究是面向中文社交媒體的,但研究成果零散,還缺乏系統(tǒng)性。另外,在特征選擇上,選擇范圍面較窄,考慮社交媒體深層的隱含特征較少。
5 結(jié) 語(yǔ)
為了解決中文社交媒體的可信度評(píng)估問(wèn)題,在吸收前人研究的基礎(chǔ)上[59-63],很有必要對(duì)中文社交媒體信息可信度進(jìn)行系統(tǒng)研究,特別是在參考國(guó)外信息可信度評(píng)估系統(tǒng)的基礎(chǔ)上,很有必要研制開(kāi)發(fā)中文社交媒體信息可信度評(píng)估系統(tǒng),實(shí)現(xiàn)中文社交媒體信息可信度的自動(dòng)評(píng)估。在進(jìn)行中文社交媒體信息可信度評(píng)估中,應(yīng)注意下列問(wèn)題:
1)評(píng)估要在對(duì)信息資源分類(lèi)的基礎(chǔ)上,對(duì)不同的類(lèi)別采用不同的評(píng)估指標(biāo)體系,以提高評(píng)估工作的科學(xué)性和合理性。
2)評(píng)估既要重視定性評(píng)估,也要重視定量評(píng)估,尤其是自動(dòng)化評(píng)估。特別是在大數(shù)據(jù)環(huán)境下,應(yīng)針對(duì)評(píng)估的實(shí)際需求,制定科學(xué)的評(píng)估方案,選擇恰當(dāng)?shù)脑u(píng)估方法,構(gòu)建適合評(píng)估工作需要的自動(dòng)化評(píng)估系統(tǒng)。
3)評(píng)估指標(biāo)、評(píng)估模型的選取以及參數(shù)的訓(xùn)練,既要考慮研究結(jié)果的精確度,又要考慮系統(tǒng)的運(yùn)算時(shí)間。
4)評(píng)估模型構(gòu)建后,不僅要進(jìn)行實(shí)驗(yàn)室評(píng)估,還應(yīng)進(jìn)行實(shí)際效果評(píng)估。
參考文獻(xiàn)
[1]Ngai,E.W.T.,Moon,K.K.,Lam,S.S.,Chin,E.S.K.and Tao,S.S.C..Social media models,technologies,and applications[J].Industrial Management and Data Systems,2015,115(5):769-802.
[2]Gamboa,A.M.and Gonalves,H.M..Customer loyalty through social networks:lessons from Zara on Facebook[J].Business Horizons,2014,57(6):709-717.
[3]Jin,S-A.A.and Phua,J.Following celebrities tweets about brands:the impact of Twitter-based electronic word-of-mouth on consumers source credibility perception,buying intention,and social identification with celebrities[J].Journal of Advertising,2014,43(2):181-195.
[4]Colliander,J.and Dahlén,M.Following the fashionable friend:the power of social media[J].Journal of Advertising Research,2011,51(1):313-320.
[5]Moncrief,W.C.,Marshall,G.W.and Rudd,J.M..Social media and related technology:drivers of change in managing the contemporary sales force[J].Business Horizons,2015,58(1):45-55.
[6]Hong,Liangjie and Davison,B.D..Empirical study of topic modeling in twitter[C]∥Proceedings of the First Workshop on Social Media Analytics(SOMA10).ACM,New York,NY,USA,2010:80-88.
[7]Kleinberg,J.M..Authoritative sources in a hyperlinked environment[J].Journal of the ACM,1999,46(5):604-632.
[8]Tobar,C.M.,Germer,A.S.,Adan-Coello,J.M.,and De Freitas,R.L..Information retrieval in Wikis using an ontology[J].Computational Science and Engineering,2009:826-831.
[9]Kim,Y.and Shim,K.TWILITE:A recommendation system for Twitter using a probabilistic model based on latent Dirichlet allocation[J].Information Systems,2014:59-77.
[10]Ramesh,A.,Anusha J.,Clarence,J.M.T..A novel,generalized recommender system for social media using the collaborative-filtering technique[J].ACM SIGSOFT Software Engineering Notes,2014:1-4.
[11]Zimdars,A.,Chickering,D.M.,and Meek,C.Using Temporal Data for Making Recommendations[C]∥Proceedings of the Seventeenth conference on Uncertainty in artificial intelligence(UAI01),Jack Breese and Daphne Koller(Eds.).Morgan Kaufmann Publishers Inc.,San Francisco,CA,USA,2001:580-588.
[12]Levandoski,J.J.,Sarwat,M.,Eldawy,A.and Mokbel,M.F..LARS:A Location-Aware Recommender System[C]∥IEEE 28th International Conference on Data Engineering,Washington,DC,2012:450-461.
[13]Jamali,M.and Ester,M.Trust Walker:a random walk model for combining trust-based and item-based recommendation[C]∥Proceedings of the 15th ACM SIGKDD international conference on Knowledge discovery and data mining(KDD09).ACM,New York,NY,USA,2009:397-406.
[14]Galuba W,Aberer K,Chakraborty D,Despotovic Z,Kellerer W.Outtweeting the twitterers-predicting information cascades in microblogs[C]∥Proceedings of the 3rd Workshop on Online Social Networks,USENIX Association,Boston,MA,USA,2010:1-9.
[15]Adar,E.and Adamic,L.A..Tracking Information Epidemics in Blogspace[C]∥Proceedings of the 2005 IEEE/WIC/ACM International Conference on Web Intelligence(WI05).IEEE Computer Society,Washington,DC,USA,2005:207-214.
[16]Asur,S and Huberman,B.A..Predicting the Future with Social Media[C]∥2010 IEEE/WIC/ACM International Conference on Web Intelligence and Intelligent Agent Technology(WI-IAT),Toronto,2010:492-499.
[17]Viswanath,B.,Post,A.,Gummadi,K.P.,and Mislove,A.An analysis of social network-based Sybil defenses[J].Acm Sigcomm Computer Communication Review,2010,40(4):363-374.
[18]Conti,M.,Hasani,A.,and Crispo,B.Virtual Private Social Networks[C]∥Proceedings of the 1st ACM Conference on Data and Application Security and Privacy(ACM SIGSAC CODASPY 2011),San Antonio,TX,USA,2011:39-50.
[19]韓佳,肖如良,胡耀,等.在線(xiàn)社交網(wǎng)絡(luò)中信息傳播模式的特征分析[J].計(jì)算機(jī)應(yīng)用,2013,(1):105-107,111.
[20]姜景,李丁,劉怡君.基于競(jìng)爭(zhēng)模型的微博謠言信息與辟謠信息傳播機(jī)理研究[J].數(shù)學(xué)的實(shí)踐與認(rèn)識(shí),2015,(1):182-191.
[21]閻俊.微博傳播的問(wèn)題與對(duì)策研究[D].錦州:渤海大學(xué),2015:1-38.
[22]陳遠(yuǎn),袁艷紅.微博信息傳播效果實(shí)證研究[J].信息資源管理學(xué)報(bào),2012,(3):28-34.
[23]張,孫霄凌,朱慶華.突發(fā)公共事件輿情傳播特征與規(guī)律研究――以新浪微博和新浪新聞平臺(tái)為例[J].情報(bào)雜志,2014,(4):90-95.
[24]張瑜,李兵,劉晨.面向主題的微博熱門(mén)話(huà)題輿情監(jiān)測(cè)研究――以“北京單雙號(hào)限行常態(tài)化”輿情分析為例[J].中文信息學(xué)報(bào),2015,(5):143-151,159.
[25]唐濤.移動(dòng)互聯(lián)網(wǎng)輿情新特征、新挑戰(zhàn)與對(duì)策[J].情報(bào)雜志,2014,(3):113-117.
[26]唐興通.社會(huì)化媒體營(yíng)銷(xiāo)大趨勢(shì):策略與方法(第2版)[M].北京:清華大學(xué)出版社,2012:1-235.
[27]張淼.社會(huì)化媒體在市場(chǎng)營(yíng)銷(xiāo)中的應(yīng)用研究[D].北京:首都經(jīng)濟(jì)貿(mào)易大學(xué),2014:1-47.
[28]劉曉燕,鄭維雄.企業(yè)社會(huì)化媒體營(yíng)銷(xiāo)傳播的效果分析――以微博擴(kuò)散網(wǎng)絡(luò)為例[J].新聞與傳播研究,2015,(2):89-102,128.
[29]Fogg,B.J.,and Tseng,H.The elements of computer credibility[C]∥Proceedings of the SIGCHI conference on Human Factors in Computing Systems,Pittsburgh,Pennsylvania,USA,1999:80-87.
[30]Rieh,S and Danielson,D.Credibility:A Multidisciplinary Framework[J].Annual Review of Information Science and Technology,2007:307-364.
[31]Nagura,R.,Seki,Y.,Kando,N and Aono,M.A method of rating the credibility of news documents on the web[C]∥Proceedings of the 29th annual international ACM SIGIR conference on Research and development in information retrieval(SIGIR06).ACM,New York,NY,USA,2006:683-684.
[48]Ratkiewicz,J.,Conover,M.,Meiss,M.,Gonalves,B.,Patil,S.,F(xiàn)lammini,A.and Menczer,F(xiàn).Truthy:mapping the spread of astroturf in microblog streams[C]∥Proceedings of the 20th international conference companion on World wide web(WWW11).ACM,New York,NY,USA,2011:249-252.
[49]Gupta,A.,Kumaraguru,P.,Castillo,C.,and Meier,P.TweetCred:Real-Time Credibility Assessment of Content on Twitter[C]∥Social Informatics.Springer International Publishing,2014:228-243.
[50]Krzysztof,L.,Jacek,S.W.,Michal,J.L.,and Amit,G.Automated Credibility Assessment on Twitter[J].Computer Science,2015,(2):157-168.
[51]劉雪艷,閆強(qiáng).政府微博中的熱點(diǎn)事件信息可信度研究[J].北京郵電大學(xué)學(xué)報(bào):社會(huì)科學(xué)版,2013,(2):6-12.
[52]丁科芝.社交網(wǎng)絡(luò)信息可信度研究[D].武漢:華中師范大學(xué),2015:1-61.
[53]薛傳業(yè),夏志杰,張志花,等.突發(fā)事件中社交媒體信息可信度研究[J].現(xiàn)代情報(bào),2015,(4):12-16.
[54]屈文建,謝冬.網(wǎng)絡(luò)學(xué)術(shù)論壇信息可信度的灰度分析[J].圖書(shū)情報(bào)知識(shí),2013,(2):112-118.
[55]莫祖英,馬費(fèi)成,羅毅.微博信息質(zhì)量評(píng)價(jià)模型構(gòu)建研究[J].信息資源管理學(xué)報(bào),2013,(2):12-18.
[56]賀剛,呂學(xué)強(qiáng),李卓,等.微博謠言識(shí)別研究[J].圖書(shū)情報(bào)工作,2013,(23):114-120.
[57]程亮,邱云飛,孫魯.微博謠言檢測(cè)方法研究[J].計(jì)算機(jī)應(yīng)用與軟件,2013,(2):226-228,262.
[58]路同強(qiáng),石冰,閆中敏,等.一種用于微博謠言檢測(cè)的半監(jiān)督學(xué)習(xí)算法[J].計(jì)算機(jī)應(yīng)用研究,2016,(3):744-748.
[59]Ginsca,A.L.,Popescu,A.,and Lupu,M.Credibility in Information Retrieval[J].Foundations and Trends in Information Retrieval,2015:355-475.
[60]Lazar,J.Meiselwitz,G.and Feng,J.Understanding Web Credibility:A Synthesis of the Research Literature[M].Now Publishers Inc,2007:1-80.
[61]Zafarani,R.Abbasi,M.A.,and Liu,H.社會(huì)媒體挖掘[M].北京:人民郵電出版社,2015:1-240.
(浙江工商大學(xué)學(xué)院 浙江 杭州 310018)
摘 要: 社交媒體是把雙刃劍,一方面它具有鍛煉大學(xué)生情感表達(dá)能力、減少現(xiàn)實(shí)交流障礙以及節(jié)約交往成本等多方面的積極影響;另一方面,它也在一定程度上疏離了現(xiàn)實(shí)同學(xué)關(guān)系、弱化了現(xiàn)實(shí)交往能力、降低了人際信任度。高校輔導(dǎo)員應(yīng)引導(dǎo)大學(xué)生在全面把握社交媒體的基礎(chǔ)上合理利用社交媒體,構(gòu)建和諧的同學(xué)關(guān)系。
關(guān)鍵詞 :社交媒體;大學(xué)生;同學(xué)關(guān)系;高校輔導(dǎo)員
中圖分類(lèi)號(hào):G641 文獻(xiàn)標(biāo)識(shí)碼:A doi:10.3969/j.issn.1665-2272.2015.14.044
中國(guó)互聯(lián)網(wǎng)絡(luò)信息中心的《第35次中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》顯示,截至2014年12月,學(xué)生群體在中國(guó)網(wǎng)民中占比23.8%,在所有群體的互聯(lián)網(wǎng)普及率中居于高位。大學(xué)生思維敏銳,接收新事物能力強(qiáng),更是處于技術(shù)創(chuàng)新浪潮的最前端,社交媒體也因不斷地發(fā)展創(chuàng)新得到大學(xué)生的青睞。社交媒體極大地豐富和拓展了大學(xué)生人際交往的方式和內(nèi)容,但它的負(fù)面效應(yīng)不容忽視。正確引導(dǎo)大學(xué)生使用社交媒體,構(gòu)建和諧同學(xué)關(guān)系成為高校輔導(dǎo)員的重要任務(wù)。
1 社交媒體概述
社交媒體是建立在萬(wàn)維網(wǎng)的技術(shù)資源基礎(chǔ)上,允許用戶(hù)創(chuàng)建和交換各方面信息的應(yīng)用程序。其典型代表是騰訊QQ、新浪微博、微信、人人網(wǎng)等。當(dāng)今時(shí)代,越來(lái)越多的大學(xué)生熱衷于社交媒體,花費(fèi)在社交媒體上的時(shí)間越來(lái)越多,這與社交媒體的以下四方面特征密不可分。
1.1 交互性與共享性
馬克思認(rèn)為人的本質(zhì)是一切社會(huì)關(guān)系的總和,每個(gè)人都有與他人溝通交流的心理需求。通過(guò)社交媒體,用戶(hù)可以隨時(shí)保持溝通、給別人發(fā)表評(píng)論,還可以將所見(jiàn)所聞第一時(shí)間出去與其他用戶(hù)共同分享。這種互動(dòng)與共享能夠使用戶(hù)結(jié)交來(lái)自世界各地的朋友,拓展人際網(wǎng)絡(luò),滿(mǎn)足現(xiàn)實(shí)生活中不能滿(mǎn)足的交往、情感需求。
1.2 開(kāi)放性與平等性
當(dāng)今大學(xué)生開(kāi)放程度高,個(gè)體意識(shí)強(qiáng),平等觀(guān)念深。社交媒體使交往不再受時(shí)間、空間等因素的限制,加之有些社交媒體為匿名登陸,使得信息與獲取的自由性進(jìn)一步增強(qiáng),便于大學(xué)生找到自己的“圈子”發(fā)展興趣。這樣,社交媒體打破傳統(tǒng)媒體的精英運(yùn)作模式,原先傳播者與受眾的失衡關(guān)系得到平衡。因此,社交媒體的開(kāi)放是基于所有人的開(kāi)放,它為每個(gè)人提供了更為公平的機(jī)會(huì),開(kāi)放和平等成為社交媒體發(fā)展的動(dòng)力和源泉。
1.3 娛樂(lè)性與個(gè)性化
冰心曾說(shuō)過(guò),娛樂(lè)至少與工作有同等的價(jià)值,或者說(shuō)娛樂(lè)是工作的一部分。當(dāng)今社會(huì),娛樂(lè)必不可少,絕大部分社交媒體都有供用戶(hù)來(lái)娛樂(lè)消遣的板塊,如QQ游戲、QQ寵物、QQ空間日志,以及微博、微信等媒體提供的娛樂(lè)圖片、視頻以及各種熱門(mén)話(huà)題;社交媒體大都具有強(qiáng)烈的個(gè)性化色彩,具體表現(xiàn)在主頁(yè)裝飾、頁(yè)面排版以及聊天背景等細(xì)節(jié)設(shè)置上,用戶(hù)可以以多種形式、轉(zhuǎn)載、評(píng)論信息。
1.4 融合性與“碎片化”
社交媒體是報(bào)紙、雜志、電視、廣播等媒介融合的有效平臺(tái),兼容文字、圖片、動(dòng)畫(huà)、聲音、影像等多種傳播形態(tài),通過(guò)不同的組合方式來(lái)表述、發(fā)送信息,這能夠滿(mǎn)足不同用戶(hù)的個(gè)性化需求。同時(shí),許多社交媒體要求發(fā)送內(nèi)容簡(jiǎn)短精煉,信息的這種碎片化傾向使大學(xué)生能夠隨時(shí)隨地學(xué)習(xí)新知識(shí),充分利用零散時(shí)間,如微電影、微視頻等“微”事物廣受大學(xué)生的青睞。
2 社交媒體對(duì)大學(xué)同學(xué)關(guān)系的影響
2.1 社交媒體對(duì)大學(xué)同學(xué)關(guān)系的正面影響
(1)有利于鍛煉大學(xué)生的情感表達(dá)能力。《詩(shī)經(jīng)》中傳唱千載的“嚶其鳴矣,求其友聲。相比鳥(niǎo)矣,猶求友聲”,傳遞出每個(gè)人內(nèi)心深處對(duì)與人交往、表達(dá)的渴望。然而,有些大學(xué)生因不善交際或害羞、自卑、社交恐懼等心理障礙的禁錮,在現(xiàn)實(shí)生活中不善于同別人互動(dòng)交流,無(wú)法充分表達(dá)自己的情感,甚至把自己孤立起來(lái),阻礙了正常的同學(xué)交往。社交媒體具有匿名性、開(kāi)放性、平等性等特征,這為大學(xué)生提供了充足的鍛煉機(jī)會(huì),更好地滿(mǎn)足大學(xué)生情感的表達(dá)與傳遞,使大學(xué)生在現(xiàn)實(shí)生活中溝通更自由。
(2)有利于減少大學(xué)生人際交往的客觀(guān)障礙。大學(xué)生來(lái)自四面八方,每個(gè)人生活習(xí)慣不同,家庭背景等亦存在差異,交流起來(lái)很容易出現(xiàn)誤解甚至產(chǎn)生矛盾。科技的飛速發(fā)展實(shí)現(xiàn)了麥克盧漢“地球村”的預(yù)言,社交媒體的出現(xiàn)打破了傳統(tǒng)交往基于血緣、地緣的格局。通過(guò)社交媒體,大學(xué)生有機(jī)會(huì)充分接觸不同地域的道德風(fēng)俗習(xí)慣、倫理規(guī)范以及思想觀(guān)念等,能開(kāi)闊眼界,更好地了解各地域同學(xué)的生活習(xí)慣,進(jìn)而使大學(xué)生增強(qiáng)對(duì)交流信息的理解,減少交流過(guò)程中的摩擦和碰撞,交往起來(lái)更得心應(yīng)手。
(3)有利于大學(xué)生節(jié)約交往成本。高校班級(jí)概念逐漸淡化,同班同學(xué)日常見(jiàn)面機(jī)會(huì)逐漸減少,毋庸置疑,同學(xué)間要經(jīng)常性的互動(dòng)交流才能保持同學(xué)關(guān)系的穩(wěn)定性和持久性。然而,專(zhuān)注于現(xiàn)實(shí)交往成本過(guò)高,網(wǎng)絡(luò)交往是現(xiàn)實(shí)交往的重要補(bǔ)充,社交媒體成為人際聯(lián)絡(luò)的好幫手。同學(xué)間可以通過(guò)網(wǎng)絡(luò)保持聯(lián)系。一方面,大學(xué)生無(wú)需話(huà)費(fèi)只需要WIFI或者流量就可以使用社交媒體來(lái)維持人際關(guān)系,節(jié)約了經(jīng)濟(jì)成本;另一方面,使用社交媒體只需動(dòng)動(dòng)手指就能關(guān)注對(duì)方動(dòng)態(tài),及時(shí)掌握最新資訊,社交媒體使人際交往變得更加方便和快捷,節(jié)省了大量的時(shí)間和精力。
(4)有利于緩解大學(xué)生的日常壓力。大學(xué)生在校內(nèi)會(huì)面臨來(lái)自生活、學(xué)習(xí)上的各種壓力,面對(duì)這些壓力產(chǎn)生的消極情緒,有些大學(xué)生往往得不到社會(huì)支持系統(tǒng)(家長(zhǎng)、老師等)的慰藉,轉(zhuǎn)而把目光投向社交媒體。社交媒體具有開(kāi)放性、平等性以及娛樂(lè)性等特征,大學(xué)生可以在網(wǎng)上痛痛快快地打游戲、開(kāi)開(kāi)心心地看視頻、隨心所欲地聊天……他們就像一條自由自在的魚(yú)兒遨游在大海里。這樣,不良情緒就能隨著手指擺動(dòng)而“煙消云散”,積極情緒便會(huì)“撲面而來(lái)”,這種積極情緒有益于和諧同學(xué)關(guān)系的構(gòu)建與維護(hù)。
2.2 社交媒體對(duì)大學(xué)同學(xué)關(guān)系的負(fù)面影響
(1)疏離現(xiàn)實(shí)同學(xué)關(guān)系。社交媒體內(nèi)在的交互性、開(kāi)放性、自由性、娛樂(lè)性等特征,使部分大學(xué)生瀏覽各大社交網(wǎng)站成為一種習(xí)慣,以至于吃飯走路甚至在同學(xué)聚餐等公共活動(dòng)中都要時(shí)不時(shí)聊QQ、玩微信、刷微博,有些人甚至形成了社交媒體依賴(lài)。結(jié)果,大學(xué)生交往有廣度而缺乏深度,缺乏心靈溝通,增加了內(nèi)心的孤獨(dú)感。寢室同學(xué)關(guān)系更是如此,馬斯洛需求層次理論認(rèn)為歸屬感是人的基本需求,同住一個(gè)屋檐下的室友很少有機(jī)會(huì)靜下心來(lái)真誠(chéng)地溝通,他們把歸屬感轉(zhuǎn)移到各種虛擬網(wǎng)絡(luò)社區(qū),導(dǎo)致同學(xué)情感上趨于冷漠、疏離,以至有人畢業(yè)時(shí)要“感謝室友的不殺之恩”。
(2)弱化現(xiàn)實(shí)交往能力。在網(wǎng)絡(luò)上扮演好角色比在生活中容易,開(kāi)放、平等、自由的社交媒體使大學(xué)生在交往中更加具有隨意性。大學(xué)生在現(xiàn)實(shí)生活中交往要受到外部環(huán)境,個(gè)人角色及言語(yǔ)、聲調(diào)、表情、姿勢(shì)、服裝等太多非語(yǔ)言信息的束縛,長(zhǎng)時(shí)間的網(wǎng)絡(luò)交往使他們難以適應(yīng)二者間的角色轉(zhuǎn)換,以至于對(duì)現(xiàn)實(shí)交往力不從心。他們找機(jī)會(huì)逃離現(xiàn)實(shí)交往,向網(wǎng)絡(luò)尋求安慰,把更多的時(shí)間花在社交媒體上。
(3)降低人際信任度。社交媒體具有匿名性、開(kāi)放性的特點(diǎn)。這導(dǎo)致網(wǎng)上道德約束力不強(qiáng),網(wǎng)民可以在這個(gè)虛擬的空間中自由交流,這給那些不法行為帶來(lái)了施展機(jī)會(huì),網(wǎng)上虛假信息遍布,道德失范現(xiàn)象嚴(yán)重,網(wǎng)絡(luò)詐騙、網(wǎng)絡(luò)犯罪等時(shí)有發(fā)生。大學(xué)生社會(huì)經(jīng)驗(yàn)、人生閱歷不足,在虛擬的網(wǎng)絡(luò)世界很容易受騙,一旦被騙,就會(huì)對(duì)他們正在成長(zhǎng)的心靈產(chǎn)生巨大影響,他們會(huì)本能地對(duì)周?chē)耸バ湃危乐贡瘎≡俅伟l(fā)生;即使沒(méi)有被騙經(jīng)歷,經(jīng)常看到網(wǎng)上曝光的龐雜負(fù)面的新聞,亦會(huì)把社會(huì)上的不信任帶到現(xiàn)實(shí)生活中,導(dǎo)致同學(xué)之間的信任度降低,使人際關(guān)系蒙上陰影。
3 合理利用社交媒體,構(gòu)建和諧的大學(xué)同學(xué)關(guān)系
社交媒體給大學(xué)同學(xué)關(guān)系帶來(lái)的影響有利有弊,是利大于弊還是弊大于利?問(wèn)題的關(guān)鍵是能否合理運(yùn)用社交媒體。合理用之,利大也;過(guò)度用之,弊大也。
3.1 利用社交媒體開(kāi)展教育工作
大學(xué)生使用社交媒體的潮流勢(shì)不可擋,輔導(dǎo)員也應(yīng)該積極順應(yīng)這一潮流,使之為構(gòu)建和諧同學(xué)關(guān)系服務(wù)。因此,輔導(dǎo)員應(yīng)該熟練掌握主流社交媒體,盡可能與大學(xué)生成為好友,及時(shí)掌握他們的思想動(dòng)態(tài),減少他們?nèi)穗H交往中的困惑;在上網(wǎng)交流的過(guò)程中向大學(xué)生提供一些關(guān)于人際交往的方法、技巧以及心理健康方面的知識(shí),為現(xiàn)實(shí)人際交往做好理論鋪墊;同時(shí),輔導(dǎo)員還應(yīng)經(jīng)常性地在主流社交媒體上分享一些集思想性、趣味性、創(chuàng)新性于一體的優(yōu)秀資源,讓大學(xué)生充分吸收正能量。
3.2 幫助大學(xué)生提高社交媒體素養(yǎng)
社交媒體對(duì)同學(xué)關(guān)系的消極影響反映出大學(xué)生的社交媒體素養(yǎng)有待提高,輔導(dǎo)員要幫助大學(xué)生提高社交媒體素養(yǎng),就應(yīng)該教育大學(xué)生:全面、準(zhǔn)確地認(rèn)識(shí)和對(duì)待社交媒體——既要認(rèn)識(shí)到它可以鍛煉情感表達(dá)能力、減少交流障礙等有利的一面,又要清醒地認(rèn)識(shí)到它消極的一面,使之為我所用;從我做起,促進(jìn)網(wǎng)絡(luò)文明化、道德化——在提高防范意識(shí)、提高信息批判能力以及自覺(jué)抵制不良信息的影響的同時(shí),還要自覺(jué)傳播正能量(比如,與他人聊天時(shí)聊一些高雅的、有品位的話(huà)題,使聊有所得);合理控制上網(wǎng)時(shí)間——大學(xué)生要加強(qiáng)自律,抵制社交媒體的誘惑,把更多的時(shí)間、精力用于現(xiàn)實(shí)交往和其他更有意義的事情上。
3.3 組織豐富多彩的校園活動(dòng)
現(xiàn)實(shí)交往是“本”,網(wǎng)絡(luò)交往是“末”,要防止大學(xué)生本末倒置或者舍本逐末,輔導(dǎo)員應(yīng)該充分發(fā)揮大學(xué)生社團(tuán)的重要作用,積極加強(qiáng)線(xiàn)下工作,經(jīng)常性地開(kāi)展為大學(xué)生喜聞樂(lè)見(jiàn)的校園活動(dòng),如讀書(shū)月活動(dòng)、體育周活動(dòng)、辯論賽、演講比賽、節(jié)日晚會(huì)等。這不但能夠減少大學(xué)生的上網(wǎng)時(shí)間、發(fā)展業(yè)余愛(ài)好找到自己的“圈子”,而且能夠提供廣闊的平臺(tái)為大學(xué)生鍛煉現(xiàn)實(shí)人際交往能力,提高交際水平。
3.4 重視構(gòu)建和諧寢室同學(xué)關(guān)系
清華大學(xué)朱令案、馬加爵案以及復(fù)旦大學(xué)投毒案等幾起惡性殺人事件都是發(fā)生在寢室內(nèi),寢室人際關(guān)系原本就存在問(wèn)題,社交媒體出現(xiàn)后更使某些寢室人際關(guān)系雪上加霜。輔導(dǎo)員應(yīng)有針對(duì)性的加強(qiáng)和諧的寢室同學(xué)關(guān)系的構(gòu)建,可行性路徑為:鼓勵(lì)學(xué)生設(shè)計(jì)健康豐富的寢室文化;定期進(jìn)入學(xué)生宿舍了解大學(xué)生的學(xué)習(xí)、生活狀況;多開(kāi)展以寢室為單位的活動(dòng)。這樣能更好地增強(qiáng)室友間的默契和凝聚力,讓寢室成為情感溝通的場(chǎng)所,成為大學(xué)生的“心靈港灣”。
4 結(jié)語(yǔ)
社交媒體以其鮮明的特征成為大學(xué)生使用的主流媒體,它給大學(xué)生帶來(lái)了平等、自由,卻使他們喪失了安全感、歸屬感。輔導(dǎo)員應(yīng)在倡導(dǎo)、鼓勵(lì)大學(xué)生現(xiàn)實(shí)交往的基礎(chǔ)上引導(dǎo)他們合理利用社交媒體。這樣,大學(xué)生才能找到心靈的最佳歸屬,使那顆冰冷、孤獨(dú)的心得到縷縷溫情與安撫;才能在共同的學(xué)習(xí)和生活中形成互相關(guān)心、相互幫助、互相促進(jìn)、良性競(jìng)爭(zhēng)的一種積極狀態(tài);才能在美好而短暫的青春年華里充分吸收營(yíng)養(yǎng)、綻放光芒。
參考文獻(xiàn)
1 巴巴拉·M·紐曼.社交媒體影響青少年同伴關(guān)系:友誼、孤獨(dú)感和歸屬感[J].中國(guó)青年研究,2014(2)
2 馬克思,恩格斯.馬克思恩格斯選集[M](第一卷).北京:人民出版社,1995
3 嚴(yán)三九.新媒體概論[M].北京:化學(xué)工業(yè)出版社,2011
4 王曉霞.現(xiàn)實(shí)與虛擬社會(huì)人際關(guān)系的文化研究[M].北京:中國(guó)社會(huì)科學(xué)出版社,2010
關(guān)鍵詞:語(yǔ)義標(biāo)注 社交媒體 信息抽取
中圖分類(lèi)號(hào): TP311 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1003-6938(2013)05-0095-05
1 引言
社交媒體的數(shù)據(jù)文本短、噪聲大,多為對(duì)話(huà),數(shù)據(jù)實(shí)時(shí)發(fā)生,需要基于時(shí)間和上下文的即時(shí)分析處理。如何實(shí)時(shí)、有效和經(jīng)濟(jì)地去訪(fǎng)問(wèn)和集成這些多語(yǔ)言的數(shù)據(jù),是一個(gè)嚴(yán)峻挑戰(zhàn),目前的各種技術(shù)在準(zhǔn)確性、可伸縮性和便攜性方面都有所欠缺。
語(yǔ)義標(biāo)注把語(yǔ)義模型和自然語(yǔ)言結(jié)合在了一起,可以看作是本體和非結(jié)構(gòu)化或半結(jié)構(gòu)化文檔之間的關(guān)聯(lián)進(jìn)行雙向動(dòng)態(tài)的生成過(guò)程,從技術(shù)的角度來(lái)講,語(yǔ)義標(biāo)注是通過(guò)參照在本體里的URI的元數(shù)據(jù), 從本體(類(lèi)、實(shí)例、屬性或者關(guān)系等)里標(biāo)注在文本里出現(xiàn)的概念。使用文本里出現(xiàn)的新的實(shí)例去增強(qiáng)本體的方法也稱(chēng)為本體填充。
社交媒體的自動(dòng)語(yǔ)義標(biāo)引可以用于基于語(yǔ)義的搜索、瀏覽、過(guò)濾、推薦、可視化分析用戶(hù)以及用戶(hù)之間的社交網(wǎng)絡(luò)和在線(xiàn)行為的語(yǔ)義模型建立,還有其他的應(yīng)用場(chǎng)合例如知識(shí)管理、競(jìng)爭(zhēng)情報(bào)、客戶(hù)關(guān)系管理、電子政務(wù)、電子商務(wù)等。
目前的語(yǔ)義標(biāo)注技術(shù)主要是針對(duì)新聞文章或者其他較為正式、篇幅較長(zhǎng)的Web內(nèi)容,由于社交媒體自身具有內(nèi)容較短、噪聲大、跟時(shí)間相關(guān)、用戶(hù)產(chǎn)生內(nèi)容等這些鮮明的特點(diǎn),給語(yǔ)義標(biāo)注技術(shù)的發(fā)展帶來(lái)新的挑戰(zhàn)。
2 社交媒體語(yǔ)義標(biāo)注的方式
語(yǔ)義標(biāo)注可以采用手工、自動(dòng)化或半自動(dòng)化等多種方式進(jìn)行。
Passant等[1]提出了語(yǔ)義微博框架模型,以便用戶(hù)給博文手動(dòng)的添加機(jī)器可讀的語(yǔ)義,該框架也支持通過(guò)主題標(biāo)簽與關(guān)聯(lián)開(kāi)放數(shù)據(jù)進(jìn)行連接。Hepp等[2]提出了一個(gè)新的對(duì)微博進(jìn)行手工語(yǔ)義標(biāo)注句法,能映射成RDF語(yǔ)句,該句法支持標(biāo)簽、本體屬性,例如FOAF和在同一個(gè)微博里多個(gè)RDF語(yǔ)句之間關(guān)系。盡管手工語(yǔ)義標(biāo)注具有一定的價(jià)值,但是每天騰訊、新浪等百萬(wàn)條微博的涌現(xiàn),亟需自動(dòng)的語(yǔ)義標(biāo)引方法。
信息抽取,作為一個(gè)自然語(yǔ)言分析的方式,日益成為在非結(jié)構(gòu)化文本和在本體中的規(guī)范化知識(shí)之間建起溝通橋梁的關(guān)鍵技術(shù)。基于本體的信息抽取就是適用于語(yǔ)義標(biāo)注的任務(wù),傳統(tǒng)的信息抽取和基于本體的信息抽取的一個(gè)顯著區(qū)別就是規(guī)范化的本體作為系統(tǒng)的輸入和輸出,有些信息抽取系統(tǒng)只是把系統(tǒng)輸出和本體做一個(gè)映射,這些系統(tǒng)嚴(yán)格來(lái)講,應(yīng)該稱(chēng)為面向本體的系統(tǒng)。基于本體的信息抽取另一個(gè)顯著的特點(diǎn)是它不僅僅發(fā)現(xiàn)被抽取的實(shí)體的類(lèi)型,而且還要把它跟目標(biāo)知識(shí)庫(kù)里的關(guān)于它的語(yǔ)義描述關(guān)聯(lián)起來(lái),通常用一個(gè)URI方式識(shí)別它,在抽取過(guò)程中需要在文檔內(nèi)和文檔間進(jìn)行命名實(shí)體、術(shù)語(yǔ)、關(guān)系等自動(dòng)識(shí)別和共指消解。
關(guān)聯(lián)開(kāi)放數(shù)據(jù)資源,例如DBpedia,YAGO和Freebase等已經(jīng)成為語(yǔ)義標(biāo)注本體知識(shí)的關(guān)鍵來(lái)源,也作為用來(lái)消歧的目標(biāo)本體知識(shí)庫(kù),他們提供了交叉引用、領(lǐng)域無(wú)關(guān)的數(shù)萬(wàn)條類(lèi)和關(guān)系以及數(shù)百萬(wàn)條的實(shí)例,一個(gè)關(guān)聯(lián)、互補(bǔ)的代名詞的資源集合,對(duì)應(yīng)于維基百科的條目和其他外部數(shù)據(jù)的概念和實(shí)例,豐富的類(lèi)層次用于細(xì)粒度分類(lèi)命名實(shí)體,而關(guān)于數(shù)百萬(wàn)實(shí)例和對(duì)應(yīng)維基百科條目的鏈接的知識(shí)也是基于本體抽取系統(tǒng)的一個(gè)特點(diǎn)。
3 社交媒體語(yǔ)義標(biāo)注的主要方法
3.1 關(guān)鍵短語(yǔ)抽取
自動(dòng)抽取出的關(guān)鍵句可以表示出一個(gè)文檔或文檔集的主題,但不能有效的表達(dá)論點(diǎn)或者所有的觀(guān)點(diǎn),關(guān)鍵短語(yǔ)抽取因此被認(rèn)為是一種淺表知識(shí)抽取,它也作為降維手段,允許系統(tǒng)處理較小集合的重要的術(shù)語(yǔ)而不是全文,用于上下文的語(yǔ)義標(biāo)注和索引。
一些關(guān)鍵詞語(yǔ)方法利用了術(shù)語(yǔ)共現(xiàn)形成術(shù)語(yǔ)的圖,邊為一對(duì)術(shù)語(yǔ)共現(xiàn)的距離,給頂點(diǎn)分配一定的權(quán)重,W Wu等研究表明這一類(lèi)的術(shù)語(yǔ)抽取方法相對(duì)依賴(lài)于文本模型的方法,在Twitter數(shù)據(jù)上表現(xiàn)更優(yōu)。這些基于圖的方法在從Twitter中抽取關(guān)鍵短語(yǔ)之所以取得了良好的效果,原因在于這個(gè)領(lǐng)域包括了大量的冗余,有利于形成關(guān)鍵詞摘要。但主題的多樣性增加了抽取一系列相關(guān)和準(zhǔn)確的關(guān)鍵詞的難度,Xin等[3]在關(guān)鍵詞組抽取中結(jié)合了主題建模來(lái)解決該問(wèn)題。
當(dāng)前的相關(guān)研究主要是使用該方法來(lái)產(chǎn)生新的標(biāo)簽,Qu等[4]在基于詞性標(biāo)簽的基礎(chǔ)上,從n-gram產(chǎn)生候選的關(guān)鍵短語(yǔ),然后使用一個(gè)監(jiān)督邏輯回歸分類(lèi)器進(jìn)行過(guò)濾。該方法還可以和分眾分類(lèi)法進(jìn)一步結(jié)合,產(chǎn)生標(biāo)簽簽名,例如把分眾分類(lèi)法中的每一個(gè)標(biāo)簽和加權(quán)的、語(yǔ)義相關(guān)的術(shù)語(yǔ)聯(lián)系起來(lái),針對(duì)新的博文和帖子,進(jìn)行比較和排序這些標(biāo)簽,從而推薦一些最相關(guān)的標(biāo)簽。
3.2 社交媒體中的基于本體的實(shí)體識(shí)別
基于本體的實(shí)體識(shí)別一般分為兩個(gè)步驟:實(shí)體識(shí)別和實(shí)體聯(lián)接,實(shí)體識(shí)別階段主要根據(jù)一個(gè)本體識(shí)別出文本中出現(xiàn)的所有的類(lèi)和實(shí)例,而實(shí)體聯(lián)接階段則是使用文本中的概念信息,結(jié)合從本體中的知識(shí),來(lái)選擇一個(gè)正確的URI。
3.2.1 基于維基百科的方法
目前實(shí)體識(shí)別和聯(lián)接的主要研究都是使用維基百科作為龐大的、免費(fèi)的、人工標(biāo)引的訓(xùn)練語(yǔ)料庫(kù)。典型的目標(biāo)知識(shí)庫(kù)例如DBpedia和YAGO等都是來(lái)源于維基百科,提供了一個(gè)實(shí)體URI和相應(yīng)的維基百科頁(yè)面的直接映射。
基于實(shí)體消歧的方法主要是使用一個(gè)字典,里面有每個(gè)實(shí)體URI的標(biāo)簽,包括維基百科的實(shí)體頁(yè)面,重定向(用于同義詞和縮寫(xiě)),消歧頁(yè)(對(duì)具有相同名稱(chēng)的多個(gè)實(shí)體)和鏈接到維基百科頁(yè)面時(shí)使用的錨定文本。這本詞典用于識(shí)別所有候選實(shí)體的URI,然后把這些候選的URI進(jìn)行排序,給出一個(gè)置信分?jǐn)?shù)。如果在目標(biāo)知識(shí)庫(kù)里面,沒(méi)有匹配的實(shí)體,就返回空值。
一個(gè)廣泛使用的基于維基百科的語(yǔ)義標(biāo)注系統(tǒng)是DBpedia Spotlight[5],這是一個(gè)免費(fèi)的可定制的Web系統(tǒng),它通過(guò)DBpedia的URIs標(biāo)注文本,它的目標(biāo)是DBpedia本體,包含了三十多個(gè)頂級(jí)類(lèi)和272個(gè)類(lèi),通過(guò)顯式地列出他們或一個(gè)SPARQL查詢(xún),來(lái)限制哪些類(lèi)(或者它的子類(lèi))用于命名實(shí)體識(shí)別,這個(gè)算法首先通過(guò)查找一個(gè)來(lái)源于維基百科的URI詞匯字典挑選候選的實(shí)體,然后使用向量空間模型對(duì)URI進(jìn)行排序,每一個(gè)DBpedia資源都和一個(gè)文檔相關(guān)聯(lián),構(gòu)建的每一段文字里都使用到在維基百科里的概念。
LINDEN框架[6]在基于維基百科的信息外,還充分利用了YAGO里更豐富的語(yǔ)義信息,這種方法很大程度上依賴(lài)于Wikipedia-Miner工具,該工具用來(lái)分析有歧義的實(shí)體的上下文和發(fā)現(xiàn)出現(xiàn)在維基百科里的概念。在TACKBP2009數(shù)據(jù)集上的評(píng)測(cè)表明LINDEN超過(guò)了所有的只基于維基百科的系統(tǒng),但目前LINDEN還沒(méi)有和DBpedia Spotlight在同一數(shù)據(jù)集進(jìn)行測(cè)試比較。
3.2.2 面向社交化媒體的方法
命名實(shí)體識(shí)別方法一般都是在較長(zhǎng)、較常規(guī)的文本上進(jìn)行訓(xùn)練,當(dāng)作用在較短和更多噪聲的社交媒體內(nèi)容上的時(shí)候,效果較差。面向社交媒體的方法融合了語(yǔ)言和社交媒體專(zhuān)門(mén)的特性,盡管每個(gè)博文提供了很少的內(nèi)容,但可以從用戶(hù)資料、社交網(wǎng)絡(luò)和回復(fù)中發(fā)現(xiàn)更多的附加信息。
Ritter 等[7]通過(guò)使用Freebase作為一個(gè)大規(guī)模已知實(shí)體來(lái)源,提出了命名實(shí)體分類(lèi)的問(wèn)題,如果沒(méi)有考慮到上下文,直接進(jìn)行實(shí)體查找和類(lèi)型分配,只能得到38%的F值,其中35%的實(shí)體是歧義的,具有多個(gè)類(lèi)型,而30%的實(shí)體沒(méi)有在Freebase中出現(xiàn)過(guò)。如果使用被標(biāo)記的主題模型,考慮到每個(gè)實(shí)體字符串出現(xiàn)的上下文和在Freebase類(lèi)型上的分布,命名實(shí)體分類(lèi)的F值提高到了66%。
Ireson 等[8]研究了在Flickr網(wǎng)站上命名標(biāo)簽的地名消歧問(wèn)題。這個(gè)方法是在Yahoo! GeoPlanet語(yǔ)義數(shù)據(jù)庫(kù)的基礎(chǔ)上,為每一個(gè)地點(diǎn)實(shí)例都提供一個(gè)URI,與一個(gè)相關(guān)地點(diǎn)的分類(lèi),這個(gè)標(biāo)簽消歧的方法利用了其他分配給照片的標(biāo)簽,用戶(hù)上下文(一個(gè)用戶(hù)分配給他所有照片的標(biāo)簽)和擴(kuò)展用戶(hù)上下文(考慮到用戶(hù)聯(lián)系人的標(biāo)簽),這種基于社會(huì)化網(wǎng)絡(luò)上下文的使用顯著地提高了整體消歧的準(zhǔn)確性。
另一個(gè)附加和隱藏的語(yǔ)義是微博里的主題標(biāo)簽,Laniado 等[9]詳細(xì)調(diào)查了三千六百多萬(wàn)條微博里的主題標(biāo)簽語(yǔ)義,使用了四種度量指標(biāo):使用頻率、使用的一致性、穩(wěn)定性和專(zhuān)門(mén)性。這些度量用來(lái)決定哪些主題標(biāo)簽可以被用作標(biāo)示符,連接到Freebase URIs上,通過(guò)從分眾完成的在線(xiàn)詞匯表,添加主題標(biāo)簽的定義,主題標(biāo)簽也可以作為語(yǔ)義信息的附加來(lái)源。Mendes等[10]通過(guò)簡(jiǎn)單地在DBpedia里查找,而沒(méi)有進(jìn)一步的消歧就完成了語(yǔ)義標(biāo)注。用戶(hù)相關(guān)的屬性和社會(huì)關(guān)系都在FOAF里了,而語(yǔ)義標(biāo)注通過(guò)MOAT本體來(lái)實(shí)現(xiàn)。
Gruhl等[11]關(guān)注了語(yǔ)義標(biāo)注的消歧元素,審視了處理高度歧義的情況,例如歌曲音樂(lè)專(zhuān)輯的名稱(chēng)。他們提出的方法首先限制用于產(chǎn)生候選的MusicBrainZ本體的部分,通過(guò)過(guò)濾掉所有在給定文本里沒(méi)有提到的音樂(lè)家的信息,然后運(yùn)用詞性標(biāo)注和名詞詞組組塊,把這些信息作為支持向量機(jī)分類(lèi)器的輸入,在此基礎(chǔ)上進(jìn)行消歧。這個(gè)方法對(duì)關(guān)于三位音樂(lè)家的MySpace帖子的語(yǔ)料集做了測(cè)試,盡管本體很大,但有關(guān)文本很快被找到,具有較高的效能。
3.2.3 商業(yè)化實(shí)體識(shí)別服務(wù)
現(xiàn)有大量的商業(yè)在線(xiàn)實(shí)體識(shí)別服務(wù)用實(shí)體標(biāo)注文檔,給文檔指派關(guān)聯(lián)數(shù)據(jù)URIs,NERD在線(xiàn)工具可以輕松地在用戶(hù)上傳的數(shù)據(jù)集上進(jìn)行比較,還可以整合他們的結(jié)果,把結(jié)果映射到關(guān)聯(lián)開(kāi)放數(shù)據(jù)云上。
Zemanta[12] 是一個(gè)在線(xiàn)標(biāo)注工具,最初專(zhuān)門(mén)用于博客和郵件內(nèi)容,幫助用戶(hù)通過(guò)推薦來(lái)插入標(biāo)簽和鏈接。Open Calais[13]是另外一個(gè)語(yǔ)義標(biāo)注的商業(yè)化Web服務(wù),Abel等利用它在新聞相關(guān)的微博里識(shí)別命名實(shí)體,目標(biāo)實(shí)體一般是地理位置、公司、人員、地址或聯(lián)系電話(huà)等,而被抽取出來(lái)的事件和事實(shí)一般涉及以上的實(shí)體,例如公司競(jìng)爭(zhēng)者、聯(lián)盟等。實(shí)體標(biāo)注包括URL,允許通過(guò)http訪(fǎng)問(wèn)在關(guān)聯(lián)數(shù)據(jù)中的這個(gè)實(shí)體的更多信息。目前OpenCalais連接到8個(gè)關(guān)聯(lián)數(shù)據(jù)集上,包括它自帶的數(shù)據(jù)庫(kù),如DBpedia,Wikipedia,IMDB等,廣泛涉及到了本體中的實(shí)體類(lèi)別。Calais的主要局限性是專(zhuān)有的性質(zhì)問(wèn)題,例如用戶(hù)通過(guò)Web服務(wù)發(fā)送文檔來(lái)進(jìn)行標(biāo)注,接受標(biāo)注的結(jié)果,但是他們不能給Calais一個(gè)不同的本體來(lái)進(jìn)行標(biāo)注,或者定制實(shí)體抽取的方式。
3.3 情感監(jiān)測(cè)和觀(guān)點(diǎn)分析
自動(dòng)情感監(jiān)測(cè)技術(shù)主要分為基于詞匯的方法和機(jī)器學(xué)習(xí)的方法,基于詞匯的方法主要依賴(lài)于一個(gè)情感詞匯庫(kù),包含了已知和預(yù)先收錄的情感術(shù)語(yǔ),而機(jī)器學(xué)習(xí)的方法利用淺表語(yǔ)法或語(yǔ)言的特性。大多數(shù)情感和觀(guān)點(diǎn)分析方法沒(méi)有或者很少利用到語(yǔ)義,例如把博文分為積極、消極或中性情感,是建立在n-grams和詞性信息的技術(shù)上。這些方法會(huì)導(dǎo)致數(shù)據(jù)量少的問(wèn)題。Saif等[14]證明了使用語(yǔ)義概念代替單詞能顯著提高極性分類(lèi)的準(zhǔn)確性,這個(gè)方法使用了AlchemyAPI來(lái)進(jìn)行語(yǔ)義標(biāo)注,它包括了30個(gè)實(shí)體類(lèi),絕大部分是人物、公司、城市和組織等。這個(gè)方法在斯坦福Twitter情感數(shù)據(jù)集上作了評(píng)估測(cè)試,性能超過(guò)了其他沒(méi)有使用語(yǔ)義的現(xiàn)有方法。語(yǔ)義標(biāo)注還可以用來(lái)完成挑戰(zhàn)性的觀(guān)點(diǎn)挖掘任務(wù),結(jié)合來(lái)源于WordNet等上的情感詞匯,使用基于規(guī)則的實(shí)體識(shí)別器來(lái)識(shí)別出微博里的人物、政治團(tuán)體和所持觀(guān)點(diǎn),然后進(jìn)行語(yǔ)義分析,使用模式來(lái)產(chǎn)生三語(yǔ)組,表示出觀(guān)點(diǎn)持有者和投票意愿。
3.4 跨媒體聯(lián)接
由于微博內(nèi)容比較短,如果不參考外部資源的上下文內(nèi)容,很難被理解,所以需要跨媒體的自動(dòng)聯(lián)接。Abel等把微博和當(dāng)前的新聞故事連接在一起改善微博的語(yǔ)義標(biāo)注的準(zhǔn)確性,探索了一些聯(lián)接策略:利用出現(xiàn)在微博里的URL,微博和新聞文章的TF-IDF相似性,主題標(biāo)簽和基于實(shí)體的相似性(例如OpenCalais識(shí)別出來(lái)的語(yǔ)義實(shí)體和主題)等。Hubmann-Haidvogel等[15]使用在線(xiàn)新聞從Twitter,YouTube和Facebook上匯總關(guān)于社交媒體關(guān)于氣候變化的內(nèi)容。
4 社會(huì)媒體的語(yǔ)義標(biāo)注改進(jìn)途徑
目前的社交媒體語(yǔ)義標(biāo)注方法有很多的局限性,很多方法就像關(guān)鍵詞和主題抽取一樣,只能解決淺表問(wèn)題,而基于本體的實(shí)體和事件識(shí)別并沒(méi)有取得在較長(zhǎng)的文檔上那樣高的準(zhǔn)確度和召回率。語(yǔ)義標(biāo)注方法只適用于它們訓(xùn)練和評(píng)估的數(shù)據(jù),在社交媒體標(biāo)準(zhǔn)數(shù)據(jù)集的訓(xùn)練算法也是有限的,使用命名實(shí)體類(lèi)型和事件標(biāo)注的微博條數(shù)一般都小于1000條,需要來(lái)自不同社交媒體類(lèi)型更大的共享評(píng)測(cè)語(yǔ)料集,如果通過(guò)傳統(tǒng)人工的方法進(jìn)行,則不可能完成。
4.1 眾包
一種改善自動(dòng)標(biāo)注的途徑是進(jìn)行眾包,ZenCrowd[16]系統(tǒng)把大規(guī)模的實(shí)體和在Amazon Mechanical Turk上的微任務(wù),能夠自動(dòng)連接到LOD云上的文字部分不交給標(biāo)引員,只是在難以解決的情況下才咨詢(xún)標(biāo)引員,這樣顯著提高了標(biāo)注結(jié)果。歐盟FP7資助的Xlike項(xiàng)目[17]也嘗試眾包去解決社交媒體廣泛使用的非正式語(yǔ)言的非規(guī)則性,提高標(biāo)注的準(zhǔn)確性。Gate Teamware[18]是一個(gè)基于網(wǎng)絡(luò)的協(xié)同標(biāo)注工具,支持分布式團(tuán)體工作,可以為非專(zhuān)業(yè)的標(biāo)引員進(jìn)行個(gè)性化定制使用。
4.2 利用Web of Data上的海量知識(shí)
另一種改善社交媒體語(yǔ)義標(biāo)注的途徑是更好的利用Web of Data上的海量知識(shí),目前大部分局限在維基百科、DBpedia和YAGO上,使用網(wǎng)絡(luò)數(shù)據(jù)的一大問(wèn)題是,由于常用詞和停用詞的大量使用等造成的歧義,需要自動(dòng)化的領(lǐng)域分類(lèi)的步驟,確保特定領(lǐng)域的LOD(關(guān)聯(lián)開(kāi)放數(shù)據(jù))資源被用于標(biāo)引相關(guān)領(lǐng)域內(nèi)的社交媒體。使用網(wǎng)絡(luò)數(shù)據(jù)面臨的第二大問(wèn)題是健壯性和可伸縮性,在面臨LOD資源的噪聲知識(shí)時(shí),在處理有噪音的、語(yǔ)法不規(guī)則的語(yǔ)言的時(shí)候,能保持一定的健壯性,考慮到Web of Data的規(guī)模,設(shè)計(jì)基于本體的算法時(shí),算法要在維持較高的計(jì)算水平的同時(shí),又能有效的加載和查詢(xún)這些大規(guī)模的知識(shí)庫(kù)。最后一個(gè)有效利用網(wǎng)絡(luò)數(shù)據(jù)資源的障礙是相當(dāng)有限的可用詞匯信息。除了維基百科上的資源,其他的詞匯信息大多數(shù)局限在RDF標(biāo)簽。這就限制了他們?cè)诨诒倔w的信息抽取和語(yǔ)義標(biāo)注上的使用。近期很多學(xué)者都專(zhuān)注于利用協(xié)作完成的維基學(xué)科去建設(shè)跨語(yǔ)言詞匯資源。它包含了很多外來(lái)詞和新詞,并且不斷被貢獻(xiàn)者社區(qū)進(jìn)行更新,可以在分析用戶(hù)內(nèi)容時(shí)作參考使用。針對(duì)英語(yǔ)和德語(yǔ),目前正在進(jìn)行的工作有建立UBY[19],這是一個(gè)綜合的、大規(guī)模、語(yǔ)義-詞匯資源,它基于維基百科、WordNet和其他的LOD資源。有些研究還關(guān)注基于語(yǔ)言的本體建設(shè),提出把語(yǔ)言信息和本體元素進(jìn)行關(guān)聯(lián)的模型,這些都為跨語(yǔ)言語(yǔ)義標(biāo)注系統(tǒng)的建設(shè)進(jìn)行了有益的嘗試。
5 結(jié)語(yǔ)
盡管社交媒體的語(yǔ)義標(biāo)注技術(shù)還有很多的改進(jìn)空間,但語(yǔ)義標(biāo)注的結(jié)果已經(jīng)被應(yīng)用在從社交媒體流的隱形信息中自動(dòng)獲得用戶(hù)和社交網(wǎng)絡(luò)的模型的方法上。為了更好的挖掘出隱含語(yǔ)義信息,處理多噪聲的動(dòng)態(tài)社交媒體流,我們需要探索更加穩(wěn)定、準(zhǔn)確的大規(guī)模實(shí)體和事件識(shí)別方法,需要進(jìn)一步細(xì)化意見(jiàn)挖掘算法用于目標(biāo)識(shí)別,解決時(shí)間波動(dòng)性問(wèn)題,對(duì)沖突意見(jiàn)的探測(cè)和建模以及意見(jiàn)匯總。
參考文獻(xiàn):
[1]A. Passant, J. G. Breslin, and S. Decker. Rethinking microblogging:open, distributed, semantic[C]. Proceedings of the 10th International Conference on Web Engineering,2010:263-277.
[2]M. Hepp. HyperTwitter: Collaborative knowledge engineering via Twitter messages[C].Knowledge Engineering and Management by the Masses-17th International Confe
rence EKAW 2010,2010:451-461.
[3]W. Xin, Z. Jing, J. Jing, H. Yang, S. Palakorn, W. X. Zhao,J. Jiang, J. He, Y. Song, P. Achananuparp, E. P. Lim, andX. Li. Topical keyphrase extraction from Twitter[C].Proceedings of the 49th Annual Meeting of the Association for Computational Linguistics: Human Language Technologies, HLT ’11,2011:379-388.
[4]L. Qu, C. Müller, and I. Gurevych. Using tag semantic network for keyphrase extraction in blogs. In Proceedings of the 17th Conference on Information and Knowledge Management,2008:1381-1382.
[5]Dbpedia Spotlight[EB/OL].[2013-06-02].http:///projects/dbp-spotlight/.
[6]W. Shen, J. Wang, P. Luo, and M. Wang. LINDEN: Linking named entities with knowledge base via semantic knowledge[C].Proceedings of the 21st Conference on World Wide Web,2012:449-458.
[7]A. Ritter, S. Clark, Mausam, and O. Etzioni. Named entity recognition in tweets: An experimental study[C]. Proc. of Empirical Methods for Natural Language Processing (EMNLP), Edinburgh, UK, 2011.
[8]N. Ireson and F. Ciravegna. Toponym resolution in social media[C]. Proceedings of the 9th International Semantic Web Conference (ISWC),2010:370-385.
[9]David Laniado and Peter Mika. Making sense of Twitter[C].International Semantic Web Conference(1),2010:470-485.
[10]P. N. Mendes, A. Passant, P. Kapanipathi, and A. P. Sheth. Linked open social signals[C]. Proceedings of the 2010 IEEE/WIC/ACM International Conference on Web Intelligence and Intelligent Agent Technology, 2010:224-231.
[11]D. Gruhl, M. Nagarajan, J. Pieper, C. Robson, and A. Sheth. Context and Domain Knowledge Enhanced Entity Spotting in Informal Text[C]. Proceedings of the 8th International Semantic Web Conference (ISWC’2009), 2009.
[12]Zemanta[EB/OL]. [2013-06-03]. http://.
[13]Opencalais[EB/OL].[2013-06-03]. http:///.
[14]H. Saif, Y. He, and H. Alani. Alleviating data sparsity for Twitter sentiment analysis[C]. Proceedings of the #
MSM2012 Workshop, CEUR,2012.
[15]A.Hubmann-Haidvogel,A. M. P. Brasoveanu, A. Scharl, M. Sabou, and S. Gindl. Visualizing contextual and dynamic features of micropost streams[C].Proceedings of the #MSM2012 Workshop, CEUR, 2012.
[16]G. Demartini, D. E. Difallah, and P. Cudré-Mauroux. Zen-Crowd: Leveraging probabilistic reasoning and crowdsourcing techniques for large-scale entity linking[C].Proceedings of the 21st Conference on World Wide Web, 2012:469-478.
[17]Xlike[EB/OL].[2012-06-05]. http:///.
[18]Kaling Bontcheva, Hamish Cunningham, Ian Roberts, Angus Roberts, Valentin Tablan, Niraj Aswani, and Genevieve Gorrell. GATE Teamware: A Web-based, Collaborative Text Annotation Framework[J/OL]. [2013
-06-03].http://eprints.whiterose.ac.uk/75937/.