首頁
公益播報
公益匯
愛心匯
進社區(qū)
爆料官
公益咖
武漢慈善
希望工程
武漢殘聯(lián)
創(chuàng)新創(chuàng)業(yè)
見義勇為
新聞
娛樂
旅游
武漢晚報
食品安全
法治武漢
退休學(xué)堂
首頁
>
即時新聞
> 正文
謠言or真相?三個步驟告訴你,準確率超八成
2019-03-01 14:51:00
來源: 錢江晚報
調(diào)整字體
分享
阿里巴巴達摩院科學(xué)家造了一個識別謠言的神器
AI謠言粉碎機,謠言識別準確率達81%
達摩院NLP團隊成員李泉志
昨天,一篇《為拯救爸媽朋友圈,達摩院造了“謠言粉碎機”》的文章,在朋友圈刷屏,引來一片鼓掌叫好:“這下終于不用費勁勸導(dǎo)爸媽了!”
文章說的是,阿里巴巴達摩院的科學(xué)家,造了一個謠言粉碎機,這是一個算法模型,可以識別真假新聞,未來也能應(yīng)用在各大領(lǐng)域。
這是怎樣一種算法?準確率高嗎?真的可以終結(jié)謠言?記者聯(lián)系到了正在大洋彼岸的“謠言粉碎機”的創(chuàng)造者李泉志。
“粉碎機”的前生功能
是為記者提供可靠線索
《速轉(zhuǎn)!科學(xué)家發(fā)現(xiàn):一味中藥48小時可殺死60%癌細胞!》《晚上喝白開水的朋友,再不看就晚了!》《專家說了,這樣?xùn)|西千萬別吃!》……
你有沒有收到過父母發(fā)來的這些“關(guān)懷”?又有多少次是抱著“算了算了,你開心就好”的心態(tài)結(jié)束話題?
“不能保證百分之百準確,但基本可以判斷是否為謠言?!崩钊荆_摩院NLP團隊的核心成員之一,畢業(yè)于清華大學(xué),后在美國獲得自然語言理解方向的博士學(xué)位,目前在達摩院的西雅圖辦公室工作。
在加入達摩院前,他曾是路透社重要的“情報官”:通過機器篩選成千上萬的網(wǎng)絡(luò)信息,為數(shù)千位一線記者提供可靠線索。
“AI謠言粉碎機”就是借助自然語言實現(xiàn)的。在剛剛結(jié)束的SemEval(自然語言處理領(lǐng)域的國際權(quán)威比賽,由國際計算語言學(xué)學(xué)會舉辦)全球語義測試中,“AI謠言粉碎機”創(chuàng)造了假新聞識別準確率的新紀錄,達到了前所未有的81%。
判斷一個新聞?wù)婕?br> 要分三個步驟
“AI謠言粉碎機”要怎么去判斷是否為謠言呢?李泉志說,分三步——
首先,該模型會找到最初的信息源,分析用戶畫像,包括:專業(yè)領(lǐng)域,此前傳播或轉(zhuǎn)發(fā)過什么,是個人還是機構(gòu),注冊時間,活躍規(guī)律等,來判斷發(fā)布者是否“可靠”。最后根據(jù)不同態(tài)度的人群比例、各自的信譽度等信息,計算出此新聞的可信度。
第二步,尋找網(wǎng)上所有的信息源,看看鏈接的域名,是否來自可信網(wǎng)站,比如新華社、政府醫(yī)藥管理局等。
第三步,將正文里關(guān)鍵的論證提煉為知識點,與知識圖譜里的權(quán)威知識庫做匹配驗證。如果毫無聯(lián)系、自相矛盾,減分。
李泉志解釋,“AI謠言粉碎機”會考慮一部分人類的想法,更多的則是 AI的運用。人工智能有很多人類比不了的地方,比如當一個流言在社交網(wǎng)站上傳播很快的時候,我們很難去判斷真假,不知道誰接收到了,是出于什么原因轉(zhuǎn)發(fā),不同的人對此的評價是什么,而這些AI可以做到?!凹偃鐏硪粋€流言,人可以通過網(wǎng)站去查證,但是AI可以快速把科學(xué)研究、新聞拉出來,加上后臺知識庫的對比,做一個驗證。人腦中有基本判斷,但是沒有大型的知識庫?!崩钊菊f。
就拿“AI謠言粉碎機”的訓(xùn)練樣本來說,就要分至少兩個層面:首先拿底層的2億條信息,幾百萬條新聞,訓(xùn)練語言樣本;再將模型進行謠言的真實性訓(xùn)練。“是一個復(fù)雜且費時的過程?!崩钊颈硎?。
誰制造謠言,論文是否抄襲
未來粉碎機還有更多功能
其實,要建這樣一個數(shù)據(jù)模型,并不容易。李泉志坦言,他在前一家公司就開始研究,到如今,也還需繼續(xù)完善。他們有一個小團隊專門在研究這一技術(shù),因為,總體來說這不是一個單獨能列出來的技術(shù),是自然語言所有技術(shù)的綜合。
目前,該模型也并未應(yīng)用于阿里巴巴的任何業(yè)務(wù)中,李泉志坦言,數(shù)據(jù)模型需要不斷被“訓(xùn)練”,也需要得到社會的認同,而這些,都不是短時間內(nèi)能解決的。
可以想象的是,“AI謠言粉碎機”未來將被應(yīng)用的多個場合。
比如,可以識別論文是否為抄襲,用技術(shù)從個人的寫作風格、方法論、主題等多維度去判斷是否為抄襲。過去有人說某年輕作家后期的作品由人代筆,以后用AI就能分析得出結(jié)論。
另一方面,可以協(xié)助警方找到真正謠言的制造者。通過AI去追蹤傳播路徑,從傳播路徑中,將傳播分解,可以發(fā)現(xiàn)規(guī)律,比如傳播了哪些用戶,用戶是什么反應(yīng),是簡單的轉(zhuǎn)發(fā),還是贊成、反對,還是進行了二次加工?
“當然,該模型也還是需要更多的語言訓(xùn)練。比如有些用戶轉(zhuǎn)發(fā)時,說的是反話、諷刺,有些是隱喻,不知是否是真實的情緒表達,這些作為機器很難對此做出判斷,但是通過大量的訓(xùn)練,是可以實現(xiàn)的?!崩钊颈硎荆蛨F隊會繼續(xù)研究該模型。(朱銀玲)
【編輯:彭向東】
上一篇:
九旬老人身患16種疾病以醫(yī)院為家醫(yī)護為他慶祝壽
下一篇:
關(guān)注居民健康走進社區(qū)舉辦“魚刺卡喉”急救科普講座
為你推薦
公益播報
公益匯
進社區(qū)
長江評論:讓志愿者精神成為城市之光
2019-03-01
北京明倫公益基金會參加“一帶一路”減貧國際合作論壇
2019-03-01
全國紅十字系統(tǒng)第二屆眾籌扶貧大賽湖北賽區(qū)啟動儀式暨培訓(xùn)會在漢舉行
2019-03-01
質(zhì)量抽檢來了還想“躲貓貓”?2次不開門將被請出市場,還會納入失信名單
2019-03-01
武漢市低保標準再次提高 城市居民每人每月提至780元
2019-03-01
長江評論:讓志愿者精神成為城市之光
2019-03-01
北京明倫公益基金會參加“一帶一路”減貧國際合作論壇
2019-03-01
全國紅十字系統(tǒng)第二屆眾籌扶貧大賽湖北賽區(qū)啟動儀式暨培訓(xùn)會在漢舉行
2019-03-01
質(zhì)量抽檢來了還想“躲貓貓”?2次不開門將被請出市場,還會納入失信名單
2019-03-01
武漢市低保標準再次提高 城市居民每人每月提至780元
2019-03-01
市民文旅大講堂16日開講啦 跟你說說旅途中要注意的事
2019-03-01
從今天起,請叫他們“小水杉”,25萬武漢軍運會志愿者有了昵稱
2019-03-01
黨紀法規(guī)知識競賽上線“斗魚”直播,“廉潔宣傳”平臺多形式新
2019-03-01
10萬人次參與 武漢16家圖書館接力"閱讀馬拉松"
2019-03-01
這堂黨紀法規(guī)教育課在斗魚直播 2.7萬人線上參與
2019-03-01
BRT各站電梯19時停運,網(wǎng)友建議:晚停半小時
2019-03-01
70多名黨員和入黨積極分子走進大悟革命老區(qū)
2019-03-01
73個“軍體聯(lián)國家代表隊”齊聚武昌,這個迷你“軍運會”好燃
2019-03-01
新“瞪羚企業(yè)”可獲無償資助,武漢將出臺系列措施激發(fā)民間投資活力
2019-03-01
武漢市低保標準再次提高,城市居民每人每月提至780元
2019-03-01
熱點推薦
1、400年漢劇煥發(fā)新活力 央視戲曲頻道專題聚焦首屆中國(武漢)漢劇藝術(shù)節(jié)
2、"中國好人"公交780路司機李福斌:"他讓我看到了武漢人的熱情與友善"
3、好開心!35名留守兒童游東湖找“課文里的小動物”
4、長江主軸左岸大道極致段全線貫通,6車道,人行道在堤頂,能看江景
5、膚白貌美大長腿!這群白衣天使今天刷屏網(wǎng)絡(luò)……
6、老公cosplay護士妻子 幫忙招募獻血者
7、"國際護士節(jié)"前走進武漢特殊病房 看到一群這樣的白衣天使
8、巴基斯坦留學(xué)生要帶“漢派講解”回家鄉(xiāng)
即時新聞
1、新潮聲丨?共同富?!で嗄暾f?唱響新時代的“共富”號子
2、全國首個!舟山創(chuàng)新打造的江海直達船舶“運力池”投運!
3、長江航道工程局有限責任公司舉辦地方政府專項債培訓(xùn)
4、三峽后續(xù)工作長江中游重點河段航道維護性疏浚工程順利通過竣工驗收
5、截至8月11日24時疫情防控及全國中高風險地區(qū)最新情況
6、@2023屆大中專畢業(yè)生,來領(lǐng)補貼!
7、剛剛,首發(fā)!
8、連續(xù)5天!紅色預(yù)警!
武漢
1、看!雷軍年度演講分享穿越人生低谷的感悟
2、贊!贊!贊!彭場愛心企業(yè)再捐52萬片口罩
3、武漢東站開通,乘客感慨:回老家探親、辦事更方便了
4、武漢今年首批科技成果轉(zhuǎn)化中心出爐,5家上榜
5、雷軍年度演講頻上熱搜榜,首次披露造車進展
6、全球同“蒸烤”!北極都熱到穿短袖了?! | 圖一條
7、后備廂集市、夜場植物園…… 沉浸式夜游帶來夏日江城新體驗
8、武漢市企業(yè)國有資產(chǎn)交易管理專題培訓(xùn)成功舉辦
站點地圖
qq:3403719454