智源人工智能算法大賽現(xiàn)已正式啟動(dòng)!本次比賽由北京智源人工智能研究院主辦,清華大學(xué)、北京大學(xué)、中科院計(jì)算所、曠視、知乎等協(xié)辦,總獎(jiǎng)金超過 100 萬元,旨在以全球領(lǐng)先的科研數(shù)據(jù)集與算法競賽為平臺(tái),選拔培育人工智能創(chuàng)新人才。


?? 任務(wù)描述
比賽將提供知乎上的問題、話題、用戶畫像和用戶回答記錄等數(shù)據(jù)。希望選手可以預(yù)測某個(gè)專家是否會(huì)接受某個(gè)用戶就某個(gè)問題向他發(fā)出的回答邀請(qǐng)。
為了協(xié)助選手更好地搭建模型,本次比賽提供了 10 萬個(gè)話題數(shù)據(jù)、180 萬個(gè)問題和 475 萬個(gè)回答數(shù)據(jù)、190 萬個(gè)脫敏的用戶畫像和回答記錄數(shù)據(jù),以及 1000 萬條邀請(qǐng)數(shù)據(jù)。
?? 數(shù)據(jù)集
比賽將提供知乎的問題信息、用戶畫像、用戶回答記錄,以及用戶接受邀請(qǐng)的記錄,要求選手預(yù)測這個(gè)用戶是否會(huì)接受某個(gè)新問題的邀請(qǐng)。
1. 問題信息。包括<問題id、問題創(chuàng)建時(shí)間、問題的話題、問題的文本、問題的描述等>;
2. 用戶的回答。包括<回答id、問題id、作者id、回答的文本、回答時(shí)間、點(diǎn)贊數(shù)、收藏?cái)?shù)、感謝數(shù)、評(píng)論數(shù)>等;
3. 用戶人畫像數(shù)據(jù)。包括<用戶id、性別、活躍頻次、關(guān)注話題、長期興趣、鹽值>等;
4. <topic、token(詞)、單字 64維embedding> 數(shù)據(jù);
5. 最近一月的邀請(qǐng)數(shù)據(jù)包括<問題id、用戶id、邀請(qǐng)時(shí)間、是否回答>。。

?? 任務(wù)描述
為應(yīng)對(duì)當(dāng)前虛假新聞泛濫的現(xiàn)狀,將虛假新聞帶來的危害最小化,我們?cè)O(shè)立此賽題以促進(jìn)對(duì)虛假新聞自動(dòng)化檢測方法的研究。針對(duì)虛假新聞的特點(diǎn),我們?cè)O(shè)立了三個(gè)子任務(wù):
Task 1:虛假新聞文本檢測:文本是新聞信息的主要載體,對(duì)新聞文本的研究有助于虛假新聞的有效識(shí)別。具體任務(wù)為:給定一個(gè)新聞事件的文本,判定該事件屬于真實(shí)新聞還是虛假新聞。
Task 2:虛假新聞圖片檢測:虛假新聞圖片是指虛假新聞中的配圖。在虛假新聞中,新聞配圖往往也包含著豐富的信息,有助于虛假新聞的判別。具體任務(wù)為:給定一張圖片,要求參賽者判斷該圖片是虛假新聞圖片還是真實(shí)新聞圖片。
Task 3:虛假新聞多模態(tài)檢測:隨著多媒體技術(shù)的發(fā)展,新聞當(dāng)中通常都包含著文本與圖片等多模態(tài)信息,不同模態(tài)之間既存在著增強(qiáng)關(guān)系,同時(shí)也包含著互補(bǔ)信息。如何充分利用多模態(tài)信息進(jìn)行虛假新聞檢測仍是一項(xiàng)具有挑戰(zhàn)的工作,為此,我們?cè)O(shè)立虛假新聞多模態(tài)檢測子任務(wù)以促進(jìn)該領(lǐng)域研究。具體任務(wù)為:給定一條新聞的多模態(tài)內(nèi)容,包括文本、配圖、用戶特征等,要求參賽者判斷該新聞屬于虛假新聞還是真實(shí)新聞。
?? 參考論文清單
為便于參賽選手了解已有方法,主辦方整理了參考論文清單:
除了首批發(fā)布的數(shù)據(jù)外,其余 8 道賽題將于未來兩個(gè)月內(nèi)陸續(xù)發(fā)布。北京智源人工智能研究院副院長、清華大學(xué)計(jì)算機(jī)系教授唐杰表示:“本次智源的數(shù)據(jù)算法大賽,一方面促進(jìn)了數(shù)據(jù)共享,提升數(shù)據(jù)使用效率,另一方面以賽代訓(xùn),提升了廣大學(xué)生和工程人員的技術(shù)水平,很有意義。”
人工智能正以前所未有的速度改變這個(gè)世界,也在改變我們探索自然,連接彼此,生產(chǎn)內(nèi)容,制造產(chǎn)品的方式。業(yè)內(nèi)人士普遍認(rèn)為,依托北京智源人工智能研究院強(qiáng)大的科研實(shí)力和數(shù)據(jù)開放計(jì)劃,2019 智源人工智能算法大賽將成為促進(jìn)學(xué)科交叉,推動(dòng)算法進(jìn)展,發(fā)掘潛力人才的重要活動(dòng)。
來源 | BAAI