謠言or真相？三個(gè)步驟告訴你準(zhǔn)確率超八成

來源：錢江晚報(bào) 2019-03-01 08:37:56

謠言or真相？三個(gè)步驟告訴你準(zhǔn)確率超八成

阿里巴巴達(dá)摩院科學(xué)家造了一個(gè)識(shí)別謠言的神器

AI謠言粉碎機(jī)，謠言識(shí)別準(zhǔn)確率達(dá)81%

昨天，一篇《為拯救爸媽朋友圈，達(dá)摩院造了“謠言粉碎機(jī)”》的文章，在朋友圈刷屏，引來一片鼓掌叫好：“這下終于不用費(fèi)勁勸導(dǎo)爸媽了!”

文章說的是，阿里巴巴達(dá)摩院的科學(xué)家，造了一個(gè)謠言粉碎機(jī)，這是一個(gè)算法模型，可以識(shí)別真假新聞，未來也能應(yīng)用在各大領(lǐng)域。

這是怎樣一種算法?準(zhǔn)確率高嗎?真的可以終結(jié)謠言?記者聯(lián)系到了正在大洋彼岸的“謠言粉碎機(jī)”的創(chuàng)造者李泉志。

“粉碎機(jī)”的前生功能

是為記者提供可靠線索

《速轉(zhuǎn)!科學(xué)家發(fā)現(xiàn)：一味中藥48小時(shí)可殺死60%癌細(xì)胞!》《晚上喝白開水的朋友，再不看就晚了!》《專家說了，這樣?xùn)|西千萬別吃!》……

你有沒有收到過父母發(fā)來的這些“關(guān)懷”?又有多少次是抱著“算了算了，你開心就好”的心態(tài)結(jié)束話題?

“不能保證百分之百準(zhǔn)確，但基本可以判斷是否為謠言。”李泉志，達(dá)摩院NLP團(tuán)隊(duì)的核心成員之一，畢業(yè)于清華大學(xué)，后在美國(guó)獲得自然語言理解方向的博士學(xué)位，目前在達(dá)摩院的西雅圖辦公室工作。

在加入達(dá)摩院前，他曾是路透社重要的“情報(bào)官”：通過機(jī)器篩選成千上萬的網(wǎng)絡(luò)信息，為數(shù)千位一線記者提供可靠線索。

“AI謠言粉碎機(jī)”就是借助自然語言實(shí)現(xiàn)的。在剛剛結(jié)束的SemEval(自然語言處理領(lǐng)域的國(guó)際權(quán)威比賽，由國(guó)際計(jì)算語言學(xué)學(xué)會(huì)舉辦)全球語義測(cè)試中，“AI謠言粉碎機(jī)”創(chuàng)造了假新聞識(shí)別準(zhǔn)確率的新紀(jì)錄，達(dá)到了前所未有的81%。

判斷一個(gè)新聞?wù)婕?/strong>

要分三個(gè)步驟

“AI謠言粉碎機(jī)”要怎么去判斷是否為謠言呢?李泉志說，分三步——

首先，該模型會(huì)找到最初的信息源，分析用戶畫像，包括：專業(yè)領(lǐng)域，此前傳播或轉(zhuǎn)發(fā)過什么，是個(gè)人還是機(jī)構(gòu)，注冊(cè)時(shí)間，活躍規(guī)律等，來判斷發(fā)布者是否“可靠”。最后根據(jù)不同態(tài)度的人群比例、各自的信譽(yù)度等信息，計(jì)算出此新聞的可信度。

第二步，尋找網(wǎng)上所有的信息源，看看鏈接的域名，是否來自可信網(wǎng)站，比如新華社、政府醫(yī)藥管理局等。

第三步，將正文里關(guān)鍵的論證提煉為知識(shí)點(diǎn)，與知識(shí)圖譜里的權(quán)威知識(shí)庫(kù)做匹配驗(yàn)證。如果毫無聯(lián)系、自相矛盾，減分。

李泉志解釋，“AI謠言粉碎機(jī)”會(huì)考慮一部分人類的想法，更多的則是 AI的運(yùn)用。人工智能有很多人類比不了的地方，比如當(dāng)一個(gè)流言在社交網(wǎng)站上傳播很快的時(shí)候，我們很難去判斷真假，不知道誰接收到了，是出于什么原因轉(zhuǎn)發(fā)，不同的人對(duì)此的評(píng)價(jià)是什么，而這些AI可以做到。“假如來一個(gè)流言，人可以通過網(wǎng)站去查證，但是AI可以快速把科學(xué)研究、新聞拉出來，加上后臺(tái)知識(shí)庫(kù)的對(duì)比，做一個(gè)驗(yàn)證。人腦中有基本判斷，但是沒有大型的知識(shí)庫(kù)。”李泉志說。

就拿“AI謠言粉碎機(jī)”的訓(xùn)練樣本來說，就要分至少兩個(gè)層面：首先拿底層的2億條信息，幾百萬條新聞，訓(xùn)練語言樣本;再將模型進(jìn)行謠言的真實(shí)性訓(xùn)練。“是一個(gè)復(fù)雜且費(fèi)時(shí)的過程。”李泉志表示。

誰制造謠言，論文是否抄襲

未來粉碎機(jī)還有更多功能

其實(shí)，要建這樣一個(gè)數(shù)據(jù)模型，并不容易。李泉志坦言，他在前一家公司就開始研究，到如今，也還需繼續(xù)完善。他們有一個(gè)小團(tuán)隊(duì)專門在研究這一技術(shù)，因?yàn)?，總體來說這不是一個(gè)單獨(dú)能列出來的技術(shù)，是自然語言所有技術(shù)的綜合。

目前，該模型也并未應(yīng)用于阿里巴巴的任何業(yè)務(wù)中，李泉志坦言，數(shù)據(jù)模型需要不斷被“訓(xùn)練”，也需要得到社會(huì)的認(rèn)同，而這些，都不是短時(shí)間內(nèi)能解決的。

可以想象的是，“AI謠言粉碎機(jī)”未來將被應(yīng)用的多個(gè)場(chǎng)合。

比如，可以識(shí)別論文是否為抄襲，用技術(shù)從個(gè)人的寫作風(fēng)格、方法論、主題等多維度去判斷是否為抄襲。過去有人說某年輕作家后期的作品由人代筆，以后用AI就能分析得出結(jié)論。

另一方面，可以協(xié)助警方找到真正謠言的制造者。通過AI去追蹤傳播路徑，從傳播路徑中，將傳播分解，可以發(fā)現(xiàn)規(guī)律，比如傳播了哪些用戶，用戶是什么反應(yīng)，是簡(jiǎn)單的轉(zhuǎn)發(fā)，還是贊成、反對(duì)，還是進(jìn)行了二次加工?

“當(dāng)然，該模型也還是需要更多的語言訓(xùn)練。比如有些用戶轉(zhuǎn)發(fā)時(shí)，說的是反話、諷刺，有些是隱喻，不知是否是真實(shí)的情緒表達(dá)，這些作為機(jī)器很難對(duì)此做出判斷，但是通過大量的訓(xùn)練，是可以實(shí)現(xiàn)的。”李泉志表示，他和團(tuán)隊(duì)會(huì)繼續(xù)研究該模型。(朱銀玲)

關(guān)鍵詞：謠言真相準(zhǔn)確率計(jì)算

圖片版權(quán)歸原作者所有，如有侵權(quán)請(qǐng)聯(lián)系我們，我們立刻刪除。
新化月報(bào)網(wǎng)報(bào)料熱線：886 2395@qq.com

相關(guān)文章

鹽田港東作業(yè)區(qū)自動(dòng)化碼頭建設(shè)啟動(dòng) 項(xiàng)目總投資約144.9億元

陜南三市生態(tài)旅游推介會(huì)舉辦現(xiàn)場(chǎng)簽訂7個(gè)文旅項(xiàng)目

南京西寧深化東西部協(xié)作攜手推進(jìn)高質(zhì)量發(fā)展

你可能會(huì)喜歡

品嘗到的每一滴國(guó)惜醬酒，都與它們有關(guān)！

給貨物貼上“綠碼”，跨越速運(yùn)實(shí)現(xiàn)運(yùn)輸流程可視化、透明化！

最近更新

市政協(xié)委員建議推動(dòng)出臺(tái)《重慶市民營(yíng)企業(yè)發(fā)展促進(jìn)條例》高質(zhì)量集聚發(fā)展“專精特新”中小企業(yè)2022-01-15

噴灑消毒劑2.9噸！鶴壁鶴山區(qū)對(duì)城區(qū)公共場(chǎng)所集中消殺2022-01-15

大慶兩會(huì)看檢察 | 漫看大慶檢察“高光”時(shí)刻（一）2022-01-15

@所有焦作人坐火車不用再帶身份證了2022-01-15

從警前VS從警后，一同追憶那段“芳華”！2022-01-15

速看！福州這個(gè)路段出行有變2022-01-15

【長(zhǎng)三角日?qǐng)?bào)】紹興原市委書記馬衛(wèi)光，任杭州市政協(xié)黨組書記2022-01-15

西安市新城區(qū)發(fā)布關(guān)于在外人員返鄉(xiāng)有關(guān)事項(xiàng)的通告2022-01-15

大幅提速！長(zhǎng)春中院首次適用二審民事案件獨(dú)任制審判2022-01-15

天津津南檢察：“既要抓好防疫，也要辦好案件”2022-01-15

豫警文苑丨黑夜卡口，藏著最深的愛和最亮的光2022-01-15

全省法院實(shí)現(xiàn)訴訟費(fèi)繳退費(fèi)“線上辦” 傳統(tǒng)線下繳退費(fèi)功能為何仍保留？2022-01-15

受疫情影響西安部分區(qū)縣蔬菜滯銷，亟需各方助力解決2022-01-15

恩施州6個(gè)重大交通運(yùn)輸項(xiàng)目集中開工！總投資32億元2022-01-15

【15號(hào)用】3崗招聘若干人！45歲以下可報(bào)！五險(xiǎn)一金＋包食宿！2022-01-15

國(guó)際科技合作助推湖南優(yōu)勢(shì)領(lǐng)域提升國(guó)際競(jìng)爭(zhēng)力2022-01-15

延安城區(qū)新增車位3100個(gè) 有效破解停車難2022-01-15

鴻星爾克入選2021年“誠(chéng)信之星”！2022-01-15

菏澤農(nóng)商行新興支行開展包片行政村信貸產(chǎn)品推介活動(dòng)2022-01-15

鞏義市：黨員“雙報(bào)到”進(jìn)社區(qū) 為民服務(wù)“不打烊”2022-01-15

廣東珠海1月15日新報(bào)告1例本土確診病例2022-01-15

大降價(jià)！阜陽即將啟動(dòng)2022-01-15

北京專報(bào)丨國(guó)家衛(wèi)健委：天津疫情仍在持續(xù)發(fā)展，西安疫情進(jìn)入收尾階段2022-01-15

陜西對(duì)符合解除隔離條件人員落實(shí)后續(xù)7天居家健康監(jiān)測(cè)措施2022-01-15

信陽消防聯(lián)合多部門開展應(yīng)急實(shí)戰(zhàn)演練2022-01-15

城西區(qū)：“紅色存折”讓社區(qū)志愿服務(wù)更有溫度2022-01-15

乘動(dòng)車忘帶身份證可開電子證明2022-01-15

陜西組建2400人的省級(jí)醫(yī)療團(tuán)隊(duì) 支援本土確診病例救治工作2022-01-15

“德爾塔”與“奧密克戎”，救治有何不同？2022-01-15

手拉手共成長(zhǎng) 長(zhǎng)沙清水塘北辰小學(xué)孩子“牽手”湘西娃2022-01-15