久久精品久久久,色综合久久网,日韩二区三区 http://www.dreamadream.cn 新一代人工智能開源開放平臺 Wed, 29 Dec 2021 07:24:24 +0000 zh-Hans hourly 1 https://wordpress.org/?v=6.8.1 http://www.dreamadream.cn/wp-content/uploads/2025/04/favicon.png 行業資訊 – 啟智社區 http://www.dreamadream.cn 32 32 解讀人工智能的 2021:超大規模預訓練模型爆發,自動駕駛迎來商業化前夜 http://www.dreamadream.cn/%e8%a7%a3%e8%af%bb%e4%ba%ba%e5%b7%a5%e6%99%ba%e8%83%bd%e7%9a%84-2021%ef%bc%9a%e8%b6%85%e5%a4%a7%e8%a7%84%e6%a8%a1%e9%a2%84%e8%ae%ad%e7%bb%83%e6%a8%a1%e5%9e%8b%e7%88%86%e5%8f%91%ef%bc%8c%e8%87%aa/ http://www.dreamadream.cn/%e8%a7%a3%e8%af%bb%e4%ba%ba%e5%b7%a5%e6%99%ba%e8%83%bd%e7%9a%84-2021%ef%bc%9a%e8%b6%85%e5%a4%a7%e8%a7%84%e6%a8%a1%e9%a2%84%e8%ae%ad%e7%bb%83%e6%a8%a1%e5%9e%8b%e7%88%86%e5%8f%91%ef%bc%8c%e8%87%aa/#respond Wed, 29 Dec 2021 07:24:24 +0000 https://new.openi.org.cn/%e8%a7%a3%e8%af%bb%e4%ba%ba%e5%b7%a5%e6%99%ba%e8%83%bd%e7%9a%84-2021%ef%bc%9a%e8%b6%85%e5%a4%a7%e8%a7%84%e6%a8%a1%e9%a2%84%e8%ae%ad%e7%bb%83%e6%a8%a1%e5%9e%8b%e7%88%86%e5%8f%91%ef%bc%8c%e8%87%aa/ 微信圖片_20211229153113.jpg

即將過去的 2021 年,又是跌宕起伏的一年。疫情仍沒有結束的苗頭,缺芯造成的供應鏈中斷此起彼伏,與此同時,數字化、智能化轉型已是大勢所趨。全球企業和機構在不斷學會適應“新常態”,并從中捕捉新的商業機會。

2021 年, 人工智能領域依然熱潮洶涌。AphaFold2 成功預測 98%蛋白質結構,預訓練大模型迎來大爆發,自動駕駛邁入商業化試點探索新階段,元宇宙概念東風勁吹,首個關于 AI 倫理的全球協議通過,商湯科技即將摘得“AI 第一股”… 前沿技術突破令人欣喜,落地應用“潤物細無聲”般深入各行業,業界也開始正視人工智能的問題和挑戰。

在歲末年初之際,InfoQ 采訪了眾多行業專家,回顧了 2021 年人工智能大模型、深度學習框架、 NLP、智能語音、自動駕駛、知識圖譜等各項 AI 技術的發展情況,并展望了未來一年可能的技術趨勢。

2021 年度 AI 技術突破

人工智能預測蛋白質結構

12 月 15 日,Nature 發布了《2021 年十大科學新聞》;12 月 17 日,Science 緊隨其后,公布了《2021 年度十大科學突破》。Nature 和 Science 都將「人工智能預測蛋白質結構」評為本年度最重要的發現,Science 更是將其列為“2021 年十大科學突破進展”之首。

長期以來,蛋白質結構的預測一直是生物學領域的研究熱點和難點。傳統的蛋白質結構探測方法主要有三種:X 射線晶體學、核磁共振和冷凍電鏡。但這些方法成本較高,研究周期漫長,且進展有限。

人工智能為這一困擾生物學界數十年的難題按下了快進鍵。

今年 7 月,蛋白結構兩大 AI 預測算法 —— DeepMind 的 AphaFold2 和華盛頓大學等機構研發的 RoseTTAFold 相繼開源。

AphaFold2“解鎖”98%人類蛋白質組

7 月 16 日,DeepMind 在 Nature 發表論文,宣布已利用 Alpha Fold2 預測了 35 萬種蛋白質結構,涵蓋了 98.5%的人類蛋白質組,及其他 20 種生物幾乎完整的蛋白質組。研究團隊還公布了 AlphaFold2 的開源代碼和技術細節。

RoseTTAFold 可十分鐘內計算出蛋白質結構

同日,華盛頓大學蛋白設計研究所 David Baker 教授課題組及其他合作機構在 Science 上發表論文 ,公布了其開源蛋白質預測工具 RoseTTAFold 的研究結果。研究團隊探索了結合相關思想的網絡架構,并通過三軌網絡獲得了最佳性能。三軌網絡產生的結構預測精度接近 CASP14 中的 DeepMind 團隊的 AlphaFold2,且速度更快、所需計算機處理能力更低。僅用一臺游戲計算機,在短短十分鐘內就能可靠地計算出蛋白質結構。

其他研究進展

8 月,中國研究人員使用 Alpha Fold2 繪制了近 200 種與 DNA 結合的蛋白質結構圖。11 月,德國和美國的研究人員利用 Alpha Fold2 和冷凍電鏡繪制了核孔復合物的結構圖。12 月 22 日,深勢科技推出了蛋白結構預測工具 Uni-Fold,在國內首次復現谷歌 Alphafold2 全規模訓練并開源訓練、推理代碼。

AI 技術 2021 年發展總結與展望

人工智能邁向“煉大模型”階段

今年是超大規模預訓練模型的爆發之年。

去年,GPT-3 橫空出世,這個具有 1750 億參數規模的預訓練模型所表現出來的零樣本與小樣本學習能力刷新了人們的認知,也引爆了 2021 年 AI 大模型研究的熱潮。

谷歌、微軟、英偉達、智源人工智能研究院、阿里、百度、浪潮等國內外科技巨頭和機構紛紛展開大模型研究和探索。

超大規模預訓練模型的“軍備競賽”

2021 年 1 月,Google 推出的 Switch Transformer 模型以高達 1.6 萬億的參數量打破了 GPT-3 作為最大 AI 模型的統治地位,成為史上首個萬億級語言模型。

國內研究機構也不甘示弱。今年 6 月,北京智源人工智能研究院發布了超大規模智能模型“悟道 2.0”,達到 1.75 萬億參數,超過 Switch Transformer 成為全球最大的預訓練模型。

值得一提的是,今年國產化大模型研發工作進展飛速,華為、浪潮、阿里、百度等都發布了自研的大模型。

浪潮人工智能研究院首席研究員吳韶華向 InfoQ 表示,現在業界提高模型參數量有兩種技術路線,產生兩種不同的模型結構,一種是單體模型,一種是混合模型。如浪潮的源大模型,華為的盤古大模型、百度的文心大模型、英偉達聯合微軟發布的自然語言生成模型 MT-NLG 等走的都是單體模型路線;而智源的悟道模型、阿里 M6 等走的是混合模型路線。

預訓練模型技術新進展

OPPO 小布智能中心、 NLP 算法工程師曾冠榮認為,預訓練模型在今年取得的重要技術進展有:

  • 知識表示和學習機理進一步創新突破 隨著對預訓練模型的深入理解,預訓練模型的知識學習和表征的機理逐步明確,人們得以更加順利地往模型里注入需要其學習的知識,在這些知識的加持下,對復雜任務的應對能力得到了大幅提升。

  • 對比學習、自監督和知識增強

以對比學習為中心,多種增強方法為工具的方式能進一步提升預訓練模型的語義理解和表征能力,增強方法的深入讓模型自監督成為可能,讓對比學習對樣本,尤其是正樣本的依賴降低,數據依賴的降低勢必讓模型對少樣本甚至無樣本任務的適應性提升,模型能更好地完成這類型的任務,這將讓預訓練模型落地的成本再降低一個層次。

降低 AI 規模化落地的門檻

預訓練大模型降低了 AI 應用的門檻,解決了 AI 應用的兩個難題:數據和行業知識。它既不需要大量的標注數據,又保障了基礎底座。

在預訓練模型的業務定制優化和應用方面,曾冠榮認為,從第一個預訓練語言模型 BERT 發布至今,已在多個熱門任務下得到應用,逐步從一種“潮流”變成前沿技術的“基本操作”,如預訓練模型已成為機器翻譯領域的基礎關鍵性技術。此外,預訓練模型也成為大系統中的一部分,發揮著其語義理解的優勢。

無論是業界還是科研,對預訓練模型的使用方式逐漸靈活,能從預訓練模型中拆解出適合任務的部分并組裝到自己的實際任務模型中。

時至今日,對預訓練大模型的性能優化仍未終止,在學界,仍有大量的研究在預訓練模型的落地能力上努力,壓縮、剪枝、蒸餾的工作仍起到重要作用。不止于算法本身,編譯、引擎、硬件等方面的優化也在大步邁進。

小結和展望

吳韶華認為,整體而言,現在大規模預訓練模型的研究,包括模型結構的演進和落地仍處在探索階段,各家的持續探索正在不斷擴大對大規模預訓練模型的認知邊界。

“大規模預訓練模型是人工智能的最新技術高地,是對海量數據、高性能計算和學習理論原始創新的全方位考驗”,清華大學教授、智源大模型技術委員會成員劉知遠在接受 InfoQ 采訪時展望了明年大模型的發展趨勢。

劉知遠表示,他明年將重點關注兩個層面的問題:

一是人工智能技術正呈現“大一統”趨勢,如預訓練模型在 Prompt Tuning 等技術的支持下可用于很多不同的任務,再如 Transformer 模型框架正在從自然語言處理擴展到計算機視覺模態,接下來我們也許會看到更多的從框架、模型和任務等方面推進人工智能技術趨向統一的工作;另一個問題是,隨著預訓練模型規模增大,如何更好更高效地實現任務適配和推理計算,將是讓大模型飛入千家萬戶的重要技術。

國產深度學習框架不再是“技術的跟隨者”

過去十年涌現了大量的 AI 算法和應用,這背后都離不開開源深度學習框架提供的支持。

開源深度學習框架是 AI 算法研發和 AI 應用落地的“腳手架”,幫助 AI 研究員和開發者大幅降低算法研發門檻,提升研發效率。

IDC 的調研顯示,中國人工智能領域 90%以上的產品都使用了開源的框架、庫或者其他工具包。

新進展,新趨勢

深度學習框架的發展核心是跟隨著深度學習領域的發展而前進的。

開源深度學習框架曠視天元 MegEngine 研發負責人許欣然在接受 InfoQ 采訪時,分享了過去這一年他所觀察到的深度學習的新進展:

(1)以 ViT、Swin 為代表的 Transformer 類模型開始向 NLP 以外的領域進軍,在更多場景中展現威力,讓“大”模型的趨勢愈演愈烈。

相應的,深度學習框架也在訓練大模型方面進展頗多(如 DeepSpeed+ZeRO),多種混合并行方案層出不窮。無論是深度學習框架還是硬件廠商,都在思考 Transformer 是否是會長期固定的計算 pattern。

(2)A100 這類顯卡的誕生,催生了一股從動態圖回到靜態圖的趨勢。本身對動態圖更友好的框架也紛紛嘗試通過編譯的方式提升效率,比如 PyTorch 的 LazyTensor、Jax 的 XLA。 很多國產框架也在嘗試通過動靜結合的方式提升效率,比如曠視天元 MegEngine 推出的 Tensor Interpreter、MindSpore 的 Python 代碼轉靜態圖的方案等。

此外,MLIR 和 TVM 這兩個深度學習編譯器領域的燈塔都在快速增長,如何靠機器做好編譯也正成為各個深度學習框架研發的主要方向。同時隨著深度學習方法的持續發展,也誕生了更多的新興框架,如圖神經網絡領域的 DGL。

技術自立之路

近兩年,國產深度學習框架陸續開源且發展迅速,逐漸在開源框架市場占有一席之地。

在技術研發方面,國產框架不再是技術的“跟隨者”的角色,研發出了很多領先的創新點,比如 MegEngine 的 DTR 技術、OneFlow 的 SBP 并行方案和 MindSpore 的 AKG 等等。此外,在功能、代碼質量和文檔等方面都達到了很高的水準。

在開源生態建設方面,各家也都持續投入,通過開源社區扶植、產學研合作等方式,助力國產開源生態的發展和人才培養。

業界現有的主流深度學習框架多來自國外大廠,目前,國內企業自研的深度學習框架還沒有哪一款進階成為國際主流的學習框架。

許欣然坦言,國產深度學習框架在生態建設上還有很長的路要走,既需要持續投入、不斷完善生態建設,也需要找到差異化的技術競爭點,充分結合我國國情和國產硬件,發揮好自身的技術優勢和更好的生態洞察力。

研發難點

現階段,在深度學習框架方面,業界普遍面臨的研發難點主要體現在以下三個方面:

(1)在訓練側,NPU 開始入場,不少廠商已經做出自己的訓練芯片,如何高效對接訓練 NPU 仍待解決;

(2)學術研究發展迅速,框架技術需要持續跟進,這為框架研發帶來了一定挑戰。接下來一段時間會持續一段大 Transformer 的趨勢,那么,下一個趨勢是什么?

(3)算力提升速度更多地開始依賴 DSA 硬件,只是單純的手寫 kernel 已難以支撐,框架需要更多的編譯技術、domain knowledge 才能不斷提升訓練效率。 隨著 NPU、GPU 等芯片的快速迭代,包括 MLIR、XLA、TVM 在內的編譯技術將受到更多關注。

將更好地支持大模型訓練

隨著大模型的持續火熱,預期深度學習框架將在并行策略、重計算等能力上不斷提升,以更好地支持大模型的訓練。

同時,目前訓練大模型仍需消耗大量資源,如何依靠深度學習框架的力量節省計算資源,甚至在更小規模上完成任務,將是一個值得探索的技術方向。

智能語音這一年:技術突破不斷,工業落地加速

語?領域的?規模預訓練模型層出不窮

字節跳動 AILAB 語?技術總監?澤君向 InfoQ 表示,2021 年度,智能語音技術的演進呈現出三個層面的趨勢:

(1)基礎建模技術在打破領域邊界加速融合,如 Transformer 系列模型在?然語?、視覺和語?領域都展現出?致性的優勢,頗有“?統江湖”的意思。

(2) 超?規模?監督學習技術(self-supervised learning)在上述多個領域展現出很強的通?學習能?,即在海量?標簽數據上訓練?規模通?預訓練模型,然后?少量有標簽數據做精細調整就能取得?常好的效果。

過去?年里,基于這種兩段訓練模式的超?模型不斷刷新各項學術算法競賽紀錄,在?業界也成為?種模型訓練和調優范式。

最近?年,Facebook、亞?遜、?歌和微軟等公司的研究學者陸續提出語?領域的?規模預訓練模型, 如 Wav2vec、 HuBERT、 DecoAR、 BigSSL、WavLM 等。

(3)除基礎技術外,在不同應?場合場景下,多個領域模態的技術也在快速相互融合,形成視覺、語?和語義結合的多模態綜合系統,如虛擬數字?。

工業界落地加速

整體來說,智能語?技術在?業界的落地不斷加速,來?業務和技術兩個?向的合?共同作?牽引和驅動應?落地。

從應?場景的牽引看,???如短中?視頻業務,在全球仍保持著較?的增?速度,視頻內容創作者和內容消費者活躍度很?;另???,疫情令居家辦公和遠程協作的需求增?,智能語?技術能在視頻會議中提供通信增強和語?識別等關鍵能?,為參會者提供更佳的會議體驗;以智能汽?和虛擬現實 VR/AR 為代表的新場景不斷出現,需要更?便、更低延遲、更沉浸式的語?交互體驗。

從核?技術的驅動看,基礎模型改進和?監督技術不斷提升著模型性能上限,同時多模態技術融合使得技術?案的能?越來越強,可?持更復雜的場景并帶來更好的體驗。

商業化難點主要在于商業模式選擇

馬澤君認為,現階段,智能語音商業化的難點主要是商業模式探索和路線選擇的問題,具體包括如何更好地滿?需求,控制成本以及保證交付質量。

???,AI 商業模式探索需要始終圍繞需求展開,提升模型效果和在真實場景中解決用戶或客戶的問題不能等同。解決實際問題需要 AI 研發?員深?業務場景,理解需求和條件限制,找到合理的產品技術?案,并不斷思考和抽象功能和技術,沉淀通?的技術解決?案,探索驗證可規模化的標準產品,降低定制周期和代價。

另???,AI 技術研發成本?常?,如何通過優化算法低對領域數據依賴,建設?動化平臺降低??消耗和提升研發流程效率對成本控制?常關鍵。

最后還要重視交付質量和售后服務。只有同時做好上述三個環節,才能完成從需求到交付到服務的整個鏈路,從而奠定規模商業化的基礎。

端到端和預訓練等技術仍然值得關注

  • 端到端序列建模技術

(1)準確率和推理速度更上?層樓的端到端技術值得期待,其中對?機制(alignment

mechanism)是端到端序列建模的關鍵。字節跳動 AILAB 正在探索的連續整合發放 CIF 模型(Continuous Integrate-and-Fire)是一種創新的序列端到端建模對齊機制,具有軟對齊、計算代價低和容易擴展的特性。

(2)在端側設備上的端到端語?識別和合成技術落地值得關注,特別是輕量級、低功耗、?準確度和定制靈活的端到端語?識別和合成技術。

(3)端到端語?識別技術?向的熱詞定制和領域?適應技術?常可能有重?進展。

  • ?監督預訓練技術 (1)超?數據規模和模型 size 的語??監督預訓練技術值得關注,語??監督預訓練的 BERT 已經出現(Wav2vec2.0/Hubert), 語??監督預訓練的 GPT-3 很可能在 2022 年到來。

(2)多模態語??監督預訓練技術也?常吸引?,該技術可能會極?地提升預訓練模型的表征能?,從?帶來?監督預訓練技術更?范圍的落地應?。

(3)無監督預訓練技術在語?合成、?樂分類、?樂識別領域的應?同樣值得關注,借助?監督預訓練的聲學?頻表征,可以有效提升下游任務的性能。

  • 語?對抗攻擊與防御技術。 (1)語?領域的對抗攻擊,從攻擊?段上來看,將從當前的?盒攻擊,進?步進化成?盒攻擊;從攻擊內容來看,將從當前流?的 untarget 攻擊進化成 target 攻擊。

群雄逐鹿,誰能贏得自動駕駛之戰?

2021 年,自動駕駛領域格外熱鬧。

造車熱

今年,互聯網大廠、新造車勢力和傳統企業紛紛進場布局自動駕駛,可以說能下場的巨頭們基本上都下場造車了,自動駕駛“戰場”群雄逐鹿,不知未來誰執牛耳?

在資本市場上,自動駕駛也備受追捧。據零壹智庫分析,繼 2016-2018 年熱潮之后,2021 年自動駕駛領域迎來第二次投資熱潮。今年 11 月,Momenta 完成超 10 億美元 C 輪系列融資,創下本年度自動駕駛領域最大規模融資記錄。

商業化前夜

Robotaxi 是自動駕駛最有價值的商業模式,現階段,很多自動駕駛技術公司都在做 Robotaxi 的嘗試。今年,很多自動駕駛車輛從封閉路測場地走向真實道路。百度、小馬智行、文遠知行、等企業已實現面向公眾的示范運營,開始探索商業化。11 月,國內首個自動駕駛出行服務商業化試點在北京正式啟動,百度和小馬智行成為首批獲許開展商業化試點的企業。業內人士認為,這標志著國內自動駕駛領域從測試示范邁入商業化試點探索新階段。

今年,自動駕駛卡車賽道也格外火熱,量產和商業化均提速,頭部玩家走向上市。近日,毫末智行董事長張凱在接受 InfoQ 等媒體采訪時談到了自動駕駛卡車的發展,他表示,相對乘用車輔助自動駕駛運行場景的復雜性,RoboTruck 具有一些優勢,例如長時間運行在較暢通的高速公路上,運行場景相對簡單。現階段,RoboTruck 走得是類似于乘用車般從輔助駕駛到無人駕駛漸進式的發展路線。從發展前景看,Robotruck 具備商業化閉環的可行性,但自動駕駛系統的量產將會是一個坎。

毫末智行 COO 侯軍認為,2021 年是自動駕駛的爆發之年。一方面,得益于技術的持續進步、市場需求、政策加持、資本看好等各方面因素,高級別自動駕駛在落地探索方面,已有了初步的成果;另一方面,智能駕駛商業化落地也在快速滲透,開始走向量產時代。

2022,這些技術將是下半場競爭勝負的關鍵

根據張凱的預判,“2022 年將是自動駕駛行業發展最為關鍵的一年。乘用車輔助駕駛領域的競爭將會正式進入下半場,而下半場競爭的場景將會是城市開放場景。其他場景的自動駕駛也將正式進入商業化元年”。

張凱認為,2022 年,多項自動駕駛技術值得關注。

(1)數據智能將成為自動駕駛量產決勝的關鍵。 數據智能體系是自動駕駛商業化閉環的關鍵所在,搭建高效、低成本的數據智能體系有助于推動自動駕駛系統不斷迭代前行。

(2)Transformer 與 CNN 技術深度融合,將會成為自動駕駛算法整合的粘合劑。Transformer 技術幫助自動駕駛感知系統理解環境語義更深刻,與 CNN 技術深度融合能解決 AI 大模型量產部署的難題,這是自動駕駛行業下半場競爭的關鍵技術。

(3)大算力計算平臺將在 2022 年正式量產落地,Transformer 技術與 ONESTAGE CNN 技術都需要大算力計算平臺做支撐。

(4)隨著自動駕駛系統的量產和規模化,激光雷達與機器視覺組成的 AI 感知技術,將與大算力計算平臺深度融合,這將大幅提升自動駕駛感知、認知模塊的運行效率。

NLP,黃金時代持續?

這幾年,NLP 處于快速發展階段。去年,多位 NLP 專家評判,NLP 迎來了大爆發的黃金時代。那么今年,NLP 的發展情況如何?

基于提示的微調技術迅速流行

作業幫產研中心蔣宏飛博士告訴 InfoQ,今年基于提示的微調 (prompt-based tuning)的技術迅速流行起來,這是一種人類知識和大模型較高效的結合模式。該技術是今年較值得關注的新進展。

“今年 NLP 在基礎模型方面沒有大的突破。預訓練模型方面,今年涌現了很多很大的模型,但整體上同質化也較嚴重,對于工業界實踐效果來講,往往按照‘奧卡姆剃刀’原則,傾向于使用最適當的如 Bert 往往就夠了”蔣宏飛表示。

現階段,NLP 技術在發展過程中還存在不少技術挑戰,其中之一便是很難獲取到大量高質量的標注數據。深度學習依賴大規模標注數據,對于語音識別、圖像處理等感知類任務,標注數據相對容易,但 NLP 往往是認識類任務,人的理解都有主觀性,且任務和領域眾多,導致大規模語料標注的時間成本和人力成本都很大。

與 CV、語音識別相比,NLP 項目在業務中落地往往較慢

NLP 落地項目往往和業務強相關。不像圖像識別、語音識別,通用能力在具體業務也有大量落地場景,業務和算法協作邊界和指標相對好確定。而 NLP 項目在業務中落地往往會比較慢,需要上下游不斷深度磨合對齊。

NLP 解決的是最難的認知智能,而人類語言的歧義性、復雜性、動態性令其挑戰重重。但 NLP 商業化落地必須面對這些本質的難題,所以不太可能有通用性的“一招吃遍天”的技術方案。

“盡管現在的預訓練模型一直在往這個方向努力,但我認為起碼目前這種 Transformer 式的,或者更通用地說,DNN 這種蜂巢智能式的技術范式不太行。所以,大家能看到也有不少研究學者在知識圖譜類的各種其他范式上在做努力”蔣宏飛說。

通用性的模型既然走不通,那垂類單一具體場景任務為什么也不能快速搭建?這個問題又涉及到數據的問題。數據標準的對齊、數據標注一致且高效、數據覆蓋度和均衡度、長尾數據的處理、數據動態漂移等都是 NLP 從業者每天面對的麻煩事。而相關的方法論和基礎工具還很不系統、不齊備,這是未來想達到快速商業化目的前必須打好的基礎。

明年,NLP 將在哪些場景實現規模化落地?

2022 年,NLP 的大規模化應用可能會出現在以下行業出現突破:

  • 教育智能化

  • 場景化高標準機器輔助翻譯,如專業領域文檔翻譯、會議實時翻譯等。

  • 服務運營智能化:培訓、銷售、營銷、服務等場景的智能化。

  • 外文學習/寫作智能輔助,參考 Grammarly 和 Duolingo 的快速發展。

  • 醫療智能化。文本廣泛存在于電子病歷、臨床試驗報告、醫學產品說明書、醫學文獻中。分析、挖掘和利用這些文本,有大量且能直接使用的場景,可能會有突破式發展。

  • 代碼智能分析。代碼 bug 識別、代碼智能優化等。

2022 年,NLP 值得關注的技術點

  • 基于提示的微調 (prompt-based tuning)的技術。

  • 具有邏輯推理的文本生成技術、具有良好控制性以及一致性的文本生成技術。文本生成要在嚴肅場景用起來就必須滿足這些,否則只能應用在娛樂場景。

  • 多模態技術。如 NLP+CV、 NLP + Image、 NLP+ Speech 等。

  • 主動學習、數據增強等。NLP 大規模快速落地時的很多痛點需要這些技術來緩解。

  • 代碼智能。代碼問題識別、代碼翻譯、自動代碼優化、代碼工作量評估(如 Merico 的方案)。

元宇宙概念大火,計算機視覺是基石技術之一

回首過去的一年,OPPO AI 技術產品化專家(語音語義和計算機視覺以及多模態融合方向)何苗總結了計算機視覺在工業界和學術界的進展。

具身智能,從被動式 AI 轉向主動式人工智能

具身智能(embodied AI),強調智能體(agent)要與真實世界進行交互,并通過多模態的交互 — 不僅僅是讓 AI 學習提取視覺上的高維特征,被“輸入”的認知世界,而是通過“眼耳鼻舌身意”六根來主動獲取物理世界的真實反饋,通過反饋進一步讓智能體學習并使其更“智能”、乃至“進化”。

今年 2 月,李飛飛提出了一套新的計算框架—— DERL(deep evolution reinforcement learning)深度進化強化學習。她提到了生物進化論與智能體進化的關系,并借鑒了進化論的理論應用于假設的智能體的進化學習中。

進入元宇宙,需要智能感知和交互這張門票

今年,元宇宙概念大火,各家紛紛入局。

Facebook 極為推崇元宇宙,為了表示投入元宇宙的決心,今年,Facebook 改名為 meta,并宣布 “all in 元宇宙”。

扎克伯格提出云宇宙需要具備八要素,其中之一是 Presence 開發平臺/套件。Presence 是 meta 為 Oculus VR 頭顯開發者提供的元宇宙基礎開發套件,提供的即為基于計算機視覺和智能語音技術的工具集,分別是 insight sdk、interaction sdk 和 voice sdk。

進入元宇宙需要智能感知與交互技術這張門票,而這張門票里的視覺和語音技術是最重要的基石。

趨勢一:面向內容生成的 AIGC

元宇宙世界需要孿生大量現實世界的物體或是對于現實世界的人物進行重建,而這些海量的重建必然不能按照傳統游戲世界中的方法,由 CG 工程師一個個手工制作,這樣效率遠遠無法滿足實際場景的需求。因此面向內容生成的 AIGC(算法層面)是必要的。相關技術方向包括:圖像超分、domain 遷移、外推、類似 CLIP(對比式語言圖像預訓練模型,可以從自然語言監督中有效學習視覺模型)的隱式神經表示 — 通過文字描述來生成圖像等多模態的(CV+NLP)等相關技術。

趨勢二:SCV 合成

虛擬現實引擎有專門的生成合成數據的組件,這些合成數據不僅美觀,而且有助于訓練更好的算法。

生成/合成的數據不僅是元宇宙的必備要素,也是訓練模型的重要原料。如果有合適的工具來構建數據集,就可省去繁瑣的給數據手工打標的過程,更好地對計算機視覺算法進行開發和訓練。

知名數據分析公司 Gartner 認為在未來 3 年中,合成數據將比真實數據更占優勢。在合成計算機視覺(SCV)中,我們使用虛擬現實引擎訓練計算機視覺模型,并將訓練好的模型部署到現實世界。

制約知識圖譜商業化落地的主要問題在于標準化

重要技術進展

知識圖譜技術在過去這一年取得的重要技術進展有:

知識抽取方面,多模態信息抽取在同時處理文本和視頻方面取得了進展;知識表示方面,自注意力機制的知識表示方法越來越走向實用;知識應用方面,很多行業開始構建行業知識庫,用于各類下游任務。

明略科技資深科學家張杰在接受 InfoQ 采訪時指出,現階段,在知識圖譜方面,業界普遍面臨的研發難點主要體現在兩個方面:算法方面,針對非結構化數據的信息抽取和實體對齊的準確度難以保障直接商用,需人工校驗;工程方面,行業圖譜構建成本高,需要大量的人工標注,另外構建進度也不是一蹴而就,需要業務專家不斷運維。

張杰預測,2022 年,領域預訓練語言模型和 Prompt 在知識圖譜中的應用,有望使得信息抽取環節得到進一步提升。針對技能性知識的抽取技術和多模態抽取技術,商用前景廣闊。

應用落地進展

2021 年,知識圖譜技術的應用落地,在 ToC 場景中仍主要用于搜索、推薦的提升,在 ToB 場景中集中在可視化上。

張杰認為,現階段,制約知識圖譜商業化落地的主要因素在于標準化,行業圖譜的 schema 很難在企業內部大范圍內達成認知的一致性,影響了后續的標注、抽取、應用。

2022 年,知識圖譜技術的大規模化應用可能會在制造業出現突破,制造業的知識密度高、重視標準化,頭部企業重視數字化建設,積累了大量原始數據。

2022 年,值得關注的重要技術趨勢

人工智能工程化

近兩年,人工智能工程化(AI Engineering)格外受關注。在 Gartner 發布的 2021 年和 2022 年重要戰略技術趨勢中,人工智能工程化都被列入其中。人工智能工程化是一種實現人工智能模型操作化的綜合方法。

不久前,Gartner 高級研究總監高挺曾在接受 InfoQ 采訪時表示,AI 工程化本質上是 AI 在企業中大規模、全流程的落地過程,盡管目前大家現在對 AI 期待很高,但實際上 AI 目前的應用仍然是被低估的。因為,很多 AI 項目的價值只能體現在一些“點對點”的一次性的方案中。將 AI 大規模落地的工程化方法(包含 DataOps、ModelOps 和 DevOps)總和起來,便是“AI 的工程化”的一整套體系。

人工智能工程化對企業有很多好處,企業在進行人工智能落地的時候,落地效率、落地廣泛度會更高。

可以預見,人工智能工程化將會是未來 2-3 年需要持續關注的方向,人工智能工程化應該關注三大核心要點:數據運維、模型運維、開發運維。

Gartner 預測,到 2025 年,10%建立人工智能工程化最佳實踐的企業從其人工智能工作中產生的價值將至少比 90%未建立該實踐的企業高出三倍。

生成式 AI 漸成趨勢

生成式人工智能(Generative Artificial Intelligence)也被 Gartner 評為 2022 年重要戰略技術趨勢之一。

該機器學習方法從其數據中學習內容或對象,并運用數據生成全新、完全原創的實際工件。人們可以用 AI 來創造出一些新事物,如內容創作、創建軟件代碼、輔助藥物研發等。

近日,機器學習大牛吳恩達發文回顧了 AI 在 2021 年的四個重要進展,其中之一便是,AI 生成音頻內容呈現出主流化傾向。現在音樂家和電影制作人們,已經習慣于使用 AI 支持型音頻制作工具。

在國內的優酷、愛奇藝等視頻平臺,AI 也已經廣泛用于音、視頻的內容生產和創作中,如 AI 輔助視頻制作、智能字幕生成、智能翻譯、特效生成等。

Gartner 認為,未來一段時間內,AI 會逐漸從一個做判斷的機器變成一個做創造的機器。預計到 2025 年,生成式人工智能將占所有生成數據的 10%,而目前這一比例還不到 1%。

不過該技術還存在一定的爭議,如會被濫用于詐騙、欺詐、政治造謠、偽造身份等,存在道德和法律風險。

元宇宙,狂熱的新風口

2021 年,可能沒什么技術名詞比“元宇宙”熱度更高了。全球很多公司都在講元宇宙的概念,認為元宇宙是指向互聯網的“終極形態”。如今,移動互聯網的紅利已經見頂,不知道互聯網的盡頭是否會是元宇宙?

所謂元宇宙,是一個虛擬時空間的集合, 由一系列的增強現實(AR), 虛擬現實(VR) 和互聯網(Internet)所組成。元宇宙的實現,仰賴一系列前沿技術作支撐,包括人工智能、VR/VR、5G、云計算、大數據、區塊鏈等基礎設施。

元宇宙中可以重點關注的細分賽道有 VR/AR 、游戲、社交、Metahuman 等。文娛基金易凱資本在其元宇宙報告中也表示,長期看好基于上述形態的底層技術公司。易凱資本預測,在未來十年,元宇宙概念將依舊集中于社交、游戲、內容等娛樂領域,到 2030 年會滲透到提升生產生活效率的領域。

寫在最后

總結人工智能在 2021 年的發展,涌現了不少激動人心的重大突破,人工智能也正在賦能、改變甚至顛覆許多行業。當然也仍有很多難點需要投入更多時間攻克。

近日,李彥宏對 AI 的未來發表評論:“人機共生”時代,中國將迎來 AI 黃金十年。而未來十年,AI 技術應用門檻將顯著降低,為各行各業的智能化轉型提供技術“大底座”。

人工智能發展已漸入深水區,期待明年以及之后的 10 年,人工智能能夠在技術和落地上取得更多進展,為下一個“黃金十年”而努力。

采訪嘉賓介紹(按姓名首字母排序):

何苗,OPPO AI 技術產品化專家

侯軍,毫末智行 COO

蔣宏飛,作業幫產研中心

劉知遠,清華大學教授、智源大模型技術委員會成員

?澤君,字節跳動 AILAB 語?技術總監

吳韶華,浪潮人工智能研究院首席研究員

許欣然,曠視天元 MegEngine 研發負責人

曾冠榮,OPPO 小布智能中心、 NLP 算法工程師

張杰,明略科技資深科學家

張凱,毫末智行董事長

來源 | InfoQ

]]>
http://www.dreamadream.cn/%e8%a7%a3%e8%af%bb%e4%ba%ba%e5%b7%a5%e6%99%ba%e8%83%bd%e7%9a%84-2021%ef%bc%9a%e8%b6%85%e5%a4%a7%e8%a7%84%e6%a8%a1%e9%a2%84%e8%ae%ad%e7%bb%83%e6%a8%a1%e5%9e%8b%e7%88%86%e5%8f%91%ef%bc%8c%e8%87%aa/feed/ 0
北航成立人工智能研究院:整合全校AI資源,建設“新工科”典范 http://www.dreamadream.cn/%e5%8c%97%e8%88%aa%e6%88%90%e7%ab%8b%e4%ba%ba%e5%b7%a5%e6%99%ba%e8%83%bd%e7%a0%94%e7%a9%b6%e9%99%a2%ef%bc%9a%e6%95%b4%e5%90%88%e5%85%a8%e6%a0%a1ai%e8%b5%84%e6%ba%90%ef%bc%8c%e5%bb%ba%e8%ae%be/ http://www.dreamadream.cn/%e5%8c%97%e8%88%aa%e6%88%90%e7%ab%8b%e4%ba%ba%e5%b7%a5%e6%99%ba%e8%83%bd%e7%a0%94%e7%a9%b6%e9%99%a2%ef%bc%9a%e6%95%b4%e5%90%88%e5%85%a8%e6%a0%a1ai%e8%b5%84%e6%ba%90%ef%bc%8c%e5%bb%ba%e8%ae%be/#respond Fri, 17 Jan 2020 08:14:06 +0000 https://new.openi.org.cn/%e5%8c%97%e8%88%aa%e6%88%90%e7%ab%8b%e4%ba%ba%e5%b7%a5%e6%99%ba%e8%83%bd%e7%a0%94%e7%a9%b6%e9%99%a2%ef%bc%9a%e6%95%b4%e5%90%88%e5%85%a8%e6%a0%a1ai%e8%b5%84%e6%ba%90%ef%bc%8c%e5%bb%ba%e8%ae%be/
北航成立人工智能研究院:整合全校AI資源,建設“新工科”典范

近日北京航空航天舉行人工智能研究院成立大會,這也是繼武漢大學在2019年11月22日成立人工智能研究院之后,又一雙一流高校具體落實人工智能工作布局。

北航成立人工智能研究院:整合全校AI資源,建設“新工科”典范

校黨委書記曹淑敏、校長徐惠彬,人工智能研究院院長鄭志明、黨委書記金蓉為研究院揭牌。從左到右依次為金蓉、徐惠彬、曹淑敏和鄭志明。

新成立的人工智能研究院院長由鄭志明院士擔任。鄭院士是北京航空航天大學教授,2017年當選為中國科學院院士,主要工作集中于空天信息安全與復雜信息系統等數學與信息交叉領域的研究。他創立了動力學密碼——基于代數和動力學融合的密碼分析原理和方法,突破空天信息安全高速、低耗、多模式等技術瓶頸,研制成功系列空天安全新裝備并列裝。

北航成立人工智能研究院:整合全校AI資源,建設“新工科”典范

鄭志明院士
 

據鄭志明院士表示,北航人工智能研究院將以面向科學數據的精準智能理論為基礎,并由智能理論核心、智能技術平臺和智能應用系統組成建設路線和下一步規劃設想。鄭志明院士在發言表示:特別要指出的是,我校人工智能發展論證的結論,與當前很多國內外人工智能研究機構的研究特點有非常顯著的不同。我們是在原有的良好的理論、技術、應用基礎上開展的。今后人工智能的發展,無論理論、技術還是應用,都將會遷移到面向科學數據的精準智能理論之上,這個理論是我們學校多年發展起來的理論。從精準智能理論原始創新導出顛覆性的技術,到變革性的應用,不僅學術站位高,同時將推動我校航空航天和信息技術領域的重大創新,并產生系列重要成果。我們有信心在學校黨委領導下,走在理論最前沿,占領技術的新制高點,取得產業的新優勢。起點越高,難度越大,這將是一個多學科深度交叉的難題,唯有發揚北航空天報國精神,堅持‘十年磨一劍’的科學精神,同時不拘一格,狠抓青年與杰出人才的引進、培養和國際高水平學術交流。

北航的人工智能研究由來已久

在北京航空航天官方網站中,人工智能研究院已經成為和微電子學院、軟件學院等同級別的獨立學院,不過關于人工智能研究院的官方網站尚在建設中,其中師資力量預計和招生規模等更詳細的信息尚未公布。根據之前北航人工智能專業招生信息,其教師隊伍或將以計算機學院教師為主體,部分師資會來自校內學科交叉單位以及來自國內領軍企業和研究院所的研究人員。

北航成立人工智能研究院:整合全校AI資源,建設“新工科”典范

北航官網:學院列表
 

北航的人工智能相關學科的評估表現非常優秀,其中軟件工程,計算機科學與技術等評級都是A類及A+類,在之前的人工智能專業招生中,北航計劃招收30名本科生,以計算機學院為承載學院,聯合數學與系統科學學院、經濟管理學院、自動化科學與電氣工程學院、大數據科學與腦機智能高精尖中心等單位實施專業交叉培養模式,注重全面提高學生的綜合素質、拓展學生的專業面向,增強學生的社會適應力和競爭力。北航是作為人工智能研究重點高校之一,有著大量的創新成果,在理論研究領域李未院士、潘云鶴院士、高文院士、陳純院士等一批院士在國內率先發起人工智能重大專項論證。在2019年科技部“新一代人工智能”重大項目公示中,北航2個項目入選,分別是《基于互聯網的群智涌現機理與計算方法》和《面向群體行為的群智激發匯聚研究》,入選項目數量并列各高校第2。北航的人工智能核心課程體系設置具有兩個顯著特點。首先,數學比重高。除了數學分析、概率、代數外,人工智能專業還設置了最優化方法及智能計算中的數學。其次,知識面寬泛。必修課中包含了認知科學與控制科學相關課程。

教育部50家人工智能院所的小目標基本實現

2018年4月2日,教育部印發的《高等學校人工智能創新行動計劃》明確提出,為了“加強人工智能領域人才培養”,“到2020年建立50家人工智能學院、研究院或交叉研究中心”。

據雷鋒網 AI科技評論了解,截止2020年1月14為止,我國各高校和科研單位已經相繼成立了近 50 所,基本完成《計劃》的目標。

來源 | 雷鋒網

]]>
http://www.dreamadream.cn/%e5%8c%97%e8%88%aa%e6%88%90%e7%ab%8b%e4%ba%ba%e5%b7%a5%e6%99%ba%e8%83%bd%e7%a0%94%e7%a9%b6%e9%99%a2%ef%bc%9a%e6%95%b4%e5%90%88%e5%85%a8%e6%a0%a1ai%e8%b5%84%e6%ba%90%ef%bc%8c%e5%bb%ba%e8%ae%be/feed/ 0
權威排名,全球最具影響力的2000名AI學者榜單,中國AI研究不足凸顯 http://www.dreamadream.cn/%e6%9d%83%e5%a8%81%e6%8e%92%e5%90%8d%ef%bc%8c%e5%85%a8%e7%90%83%e6%9c%80%e5%85%b7%e5%bd%b1%e5%93%8d%e5%8a%9b%e7%9a%842000%e5%90%8dai%e5%ad%a6%e8%80%85%e6%a6%9c%e5%8d%95%ef%bc%8c%e4%b8%ad%e5%9b%bdai/ http://www.dreamadream.cn/%e6%9d%83%e5%a8%81%e6%8e%92%e5%90%8d%ef%bc%8c%e5%85%a8%e7%90%83%e6%9c%80%e5%85%b7%e5%bd%b1%e5%93%8d%e5%8a%9b%e7%9a%842000%e5%90%8dai%e5%ad%a6%e8%80%85%e6%a6%9c%e5%8d%95%ef%bc%8c%e4%b8%ad%e5%9b%bdai/#respond Tue, 14 Jan 2020 06:29:26 +0000 https://new.openi.org.cn/%e6%9d%83%e5%a8%81%e6%8e%92%e5%90%8d%ef%bc%8c%e5%85%a8%e7%90%83%e6%9c%80%e5%85%b7%e5%bd%b1%e5%93%8d%e5%8a%9b%e7%9a%842000%e5%90%8dai%e5%ad%a6%e8%80%85%e6%a6%9c%e5%8d%95%ef%bc%8c%e4%b8%ad%e5%9b%bdai/ 對于CSRankings,人工智能領域的學者應該都并不陌生。 它以全球高校和研究機構在計算機領域的頂級學術會議上「發表論文數量」作為主要依據,對各個研究領域的學者和研究單位進行排名。由于近幾年來中國學者在各大頂會中發表的論文數量迅速增長,我們可以時不時地看到 “**大學世界排名第**” 的新聞出現。這樣的聲音對于剛剛有起色的中國人工智能領域的研究來講確實能夠起到提振士氣的作用。然而我們不得不承認的一點是,中國在AI學術研究上與美國相比還有巨大的差距。CSRankings單靠論文數量進行排名,在一定程度上已經不能真實地反映我國(各高校、研究單位)在人工智能領域的研究水平。

權威排名,全球最具影響力的2000名AI學者榜單,中國AI研究不足凸顯

為了能夠真實地反映人工智能領域學者的研究水平以及國家發展水平,1月11日,清華-中國工程院知識智能聯合研究中心和清華大學人工智能研究院推出了「AI 2000人工智能全球 2000 位最具影響力學者榜單(AI 2000 Most Influential Scholar Award)」。

AI 2000的主要負責人、清華大學教授唐杰向雷鋒網表示,從2017年起,他們便開始策劃 AI 2000,榜單排名依托于唐杰教授所開發的學術搜索引擎Aminer,通過計入過去 10年內學者們在各大AI頂會和期刊中發表論文的引用率來進行評估。

不同于CSRankings以“論文數量”為唯一標準,AI 2000的評選主要以發表在核心頂會和期刊上論文的引用率為主,這也在一定程度上能夠體現一個學者的“學術影響力”。

另一方面,AI 2000 的排名更加側重于“創新”,而非“資深”。因此,AI 2000 只考慮過去 10年內發表的論文,而非學者整個學術生涯中的全部貢獻。據唐杰教授表示,之所以選擇“10年”,是因為“時間太短體現不出一項工作的影響力,而時間太長則無法反映學者當前的影響力”。

1、AI 2000 評選

AI 2000 的榜單涵蓋了人工智能學科20個子領域。具體遴選方法為,每個子領域每年選出10名獲獎者,未來10年共產生2000名;每年的遴選,將參考過去十年該領域最有影響力的會議和期刊發表論文的引用情況,排名前10的學者當選該領域當年【AI 2000最具影響力學者獎】,排名前100的其他學者獲【AI 2000最具影響力學者提名獎】;每個領域的期刊和會議由技術委員會專家確定。

權威排名,全球最具影響力的2000名AI學者榜單,中國AI研究不足凸顯

20個子領域分別為:經典AI(AAAI/IJCAI)、機器學習、計算機視覺、自然語言處理、機器人、知識工程、語音識別、數據挖掘、信息檢索與推薦、數據庫、人機交互、計算機圖形、多媒體、可視化、安全與隱私、計算機網絡、計算機系統、計算理論、芯片技術和物聯網。

每個子領域所參考的頂級會議和期刊是根據《CCF 推薦國際學術期刊和會 議目錄》和 ACM 計算分類系統相關子領域的 A 類期刊和會議作為數據的來源。然后征求相關專家和團體意見,補充新涌現的學科頂級期刊和會議。以下列表給 出了 20 個子領域所采用的頂級會議和期刊。

權威排名,全球最具影響力的2000名AI學者榜單,中國AI研究不足凸顯
權威排名,全球最具影響力的2000名AI學者榜單,中國AI研究不足凸顯

2、入榜情況

1)經典人工智能領域(AAAI/IJCAI)

權威排名,全球最具影響力的2000名AI學者榜單,中國AI研究不足凸顯

經典AI的排名主要依據AAAI和IJCAI的論文引用數據。在這個領域中,香港科大楊強教授以入選論文總引用量3929排在經典人工智能領域第一名。前10名中,有7位華人學者,除了楊強教授外,還包括西北工業大學聶平飛教授(5)、清華大學孫茂松教授(6)、南京大學周志華教授(7)、清華大學劉知遠副教授(8)、南洋理工大學Sinno Jialin Pan副教授(9)、匹茲堡大學Heng Huang教授(10)。這說明在AAAI和IJCAI這兩個頂會中,華人學者呈現出絕對霸榜的態勢。

2)機器學習領域

權威排名,全球最具影響力的2000名AI學者榜單,中國AI研究不足凸顯
Ilya Sutskever教授以入選論文總引用量92071 排在機器學習領域第一名。而著名學者Geoffrey Hinton則以70250排名第二,Yoshua Bengio以55930排名第三。Ian Goodfellow 和Jeffrey Dean分別排名第 7名和第 10 名。在機器學習領域的前十名中,沒有華人出現。

3)計算機視覺

權威排名,全球最具影響力的2000名AI學者榜單,中國AI研究不足凸顯
計算視覺領域也是華人身影最多的一個領域,前10名中有6位華人。排在計算機視覺領域第一名的是著名青年學者何愷明,入選論文總引用量70524。隨之其后的是孫劍、任少卿、Xiangyu Zhang,入選論文總引用量分別為64419、50104、47322。值得一提的是計算機視覺領域的知名學者李飛飛和湯曉鷗分別以入選論文總引用量31856和27521分別排名第8名和第10名。

4)自然語言處理領域

權威排名,全球最具影響力的2000名AI學者榜單,中國AI研究不足凸顯
自然語言處理領域,Manning 以入選論文總引用量 37912,當之無愧的排在第一名。Yoshua Bengio和吳恩達(Andrew Y. Ng)分別排在第 4 和第 6 名。曾有一位學者警示說“NLP的研究仍然是白人占統治地位”,從排名中可以看出,此言不虛,在排名前 100的學者中,亞裔身影寥寥無幾,國內NLP領域最著名的學者何曉東、周明、劉挺等人榜單排名也僅在30多名。

5)機器人領域

權威排名,全球最具影響力的2000名AI學者榜單,中國AI研究不足凸顯
Freiburg大學的Wolfram Burgard以入選論文總引用量9597排名第一。機器人領域鮮少有亞裔身影,前10名(甚至前20名)都沒有亞裔身影。可見我們需要提升的空間還很大。

6)知識工程領域

權威排名,全球最具影響力的2000名AI學者榜單,中國AI研究不足凸顯
Christian Bizer排名第一。該領域前 100 名中無一華人。

7)語音識別領域

權威排名,全球最具影響力的2000名AI學者榜單,中國AI研究不足凸顯
在語音識別領域,Geoffrey Hinton排名第一。著名華人學者俞棟、鄧力分別排名第5名和第 8 名。

8)數據挖掘領域

權威排名,全球最具影響力的2000名AI學者榜單,中國AI研究不足凸顯
數據挖掘領域著名的青年學者Jure Leskovec排名第一,而這一領域的巨擘韓家煒則排名第三。這也說明,AI 2000 的排名更加側重“最新”的影響,而非“資深”。值得注意的是,數據挖掘領域也是華人最為擅長的領域之一,前 10 名中有七位都是華人學者,按先后順序分別為韓家煒(3)、陳天奇(4)、陳衛(6)、俞士綸(7)、王亞軍(8)、唐杰(9)、鄭宇(10)。

9)信息檢索與挖掘領域

權威排名,全球最具影響力的2000名AI學者榜單,中國AI研究不足凸顯
在信息檢索與挖掘領域,韓國和日本的學者居多。韓國學者Haewoon Kwak排名第一。Jure Leskovec在這一領域也排名第 5。華人學者蔡達成、Qiaozhu Mei和謝幸分別排名第10 、12和13名。

10)數據庫領域

權威排名,全球最具影響力的2000名AI學者榜單,中國AI研究不足凸顯
Michael J. Franklin 排名第一,其學生、華人學者Reynold Xin也位列第 9 名。在數據庫領域,清華大學的李國良教授排名第 24 位。

11)人機交互領域

權威排名,全球最具影響力的2000名AI學者榜單,中國AI研究不足凸顯

人機交互領域排名第一的是微軟科學家Meredith Ringel Morris,這也是所有20個領域排名第一的唯一一位女性科學家。在這一領域中,很遺憾,也鮮少有華人身影。

12)計算機圖形學領域

權威排名,全球最具影響力的2000名AI學者榜單,中國AI研究不足凸顯
MIT的Frédo Durand排名第一。華人中排名最高的是西蒙弗雷澤大學大學的張皓教授(13),其次是浙江大學周昆教授(22)、清華大學胡事民教授(23)、微軟亞研郭百寧博士(30)、微軟亞研童欣博士(31)、北京大學陳寶權教授(32)。

13)多媒體領域

權威排名,全球最具影響力的2000名AI學者榜單,中國AI研究不足凸顯
加州大學Trevor Darrell教授排名第一。在這一領域,著名青年學者、阿里副總裁賈楊清位列第二名(共有7位并列第二),依圖CTO顏水成排名第 12名。值得注意的是,這一領域也是華人扎堆的領域,排名前 100名的學者中 70%的都是華人。

14)可視化領域

權威排名,全球最具影響力的2000名AI學者榜單,中國AI研究不足凸顯
可視化領域的第一名是華盛頓大學的Jeffrey Heer教授。香港科大屈華民教授和清華大學劉世霞教授分別排名第 3 名和第 4 名。浙大巫英才教授、北大袁曉如研究員、浙大周昆教授也分別排名第 15、20、22名。

15)安全與隱私

權威排名,全球最具影響力的2000名AI學者榜單,中國AI研究不足凸顯
加州伯克利分校David Wagner教授排名第一。在這一領域,毫無疑問仍然白人居多,盡管有少量華人身影,大多也是在美國任教,前 100名的榜單上沒有國內學者身影。

16)計算機網絡

權威排名,全球最具影響力的2000名AI學者榜單,中國AI研究不足凸顯
斯坦福大學的Wireless Networks領域著名學者Sachin Katti排名第一。在這一領域,印度裔學者居多,華人中阿里巴巴的張明博士位居第 13 名。

17)計算機系統領域

權威排名,全球最具影響力的2000名AI學者榜單,中國AI研究不足凸顯
Michael Acheson Isard排名第一,而谷歌的著名科學家Jeffrey Dean緊隨其后排名第二。而華人學者Yuan Yu、陳建民、陳智峰分別排名第 6、 7、7(并列)名。

18)計算機理論領域

權威排名,全球最具影響力的2000名AI學者榜單,中國AI研究不足凸顯
IBM 的Craig Gentry博士排名第一。這一領域鮮少有華人身影,在卡內基梅隆大學執教的彭泱助理教授排名21,清華大學朱澤園排名第38名。

19)芯片技術領域

權威排名,全球最具影響力的2000名AI學者榜單,中國AI研究不足凸顯
這一領域,MIT的Anantha教授排名第一,緊隨其后是著名華人學者叢京生,而清華大學教授汪玉、楊華中也分別排名第 9 名和第 10 名。值得注意的是剛剛入選ACM Fellow的阿里巴巴達摩院著名學者謝源排名第 34 名。

20)物聯網領域

權威排名,全球最具影響力的2000名AI學者榜單,中國AI研究不足凸顯
盡管物聯網的應用在我國呼聲很高,但排名前十的僅有一位新加坡華人學者Rui Zhang教授。排名第一的是Jeffrey Andrews教授。注:AI 2000排名榜數據會動態更新,以上數據采集截止到2020年1月11日12點。實時信息可查看網站 https://www.aminer.cn/ai2000,以網站為準。

3、數據分析

AI 2000 的發布報告也對入圍的 2000名學者數據進行了簡單分析,得出以下幾點結論:

1)美國學者數量領跑全球

根據學者當前就職機構地理位置進行劃分,2000名學者中有1128名來自美國,占比61.4%;盡管中國排名所有國家中的第二名,但也僅有173名,占比9.4%;其次是德國111名。

權威排名,全球最具影響力的2000名AI學者榜單,中國AI研究不足凸顯

2)美國機構數量多實力強

統計各領域高引學者數 TOP10 的研究機構如下圖所示,

權威排名,全球最具影響力的2000名AI學者榜單,中國AI研究不足凸顯

位居首位的是谷歌公司,共 168 人入選榜單,也是唯一一家學者數過百的機構。從國家分布來看,只有清華大學為中國入選機構,其余均為美國研究機構,且美國機構學者總體人 數遙遙領先。此外,各領域榜首機構統計如下圖所示。

權威排名,全球最具影響力的2000名AI學者榜單,中國AI研究不足凸顯

谷歌在經典人工智能等9個領域的學者數量都位居榜首;麻省理工學院在機器人以及計算理論2個領域的學者數量位居榜首;微軟在數據挖掘以及信息檢索與推薦2個領域的學者數量位居榜首;其他領域的榜首分布在不同的機構中,其中,中國科學院在多媒體領域的學者數量最多。

3)男女比例差異明顯

AI 2000報告也對所有上榜學者性別做出統計。男性在各領域中均占多數,共 1661人;女性學者稀少,共 176 人。其中,機器學習領域的男性學者比例最高,達 97%;人機交互領域的女性學者比例最高,但也只占該領域的 24%。

權威排名,全球最具影響力的2000名AI學者榜單,中國AI研究不足凸顯

4)研究領域多點開花

AI 2000的學者中,有多位學者的研究方向涉及了多個領域,其中有2位學者出現在四個領域,他們分別是Yoshua Bengio以及Alex J. Smola;此外,有20位學者出現在三個領域,有117位學者出現在兩個領域。

權威排名,全球最具影響力的2000名AI學者榜單,中國AI研究不足凸顯

5)國家發展趨勢

AI 2000 國家趨勢分析如下圖所示:
權威排名,全球最具影響力的2000名AI學者榜單,中國AI研究不足凸顯

圖中每條色帶表示一個國家,其寬度表示該國家在當年的研究熱度,與當年該國論文數量呈正相關,每一年份中按照其熱度由高到低進行排序。通過國家趨勢分析可以發現熱度 TOP10 的國家分別是:United States(美國)、China(中國)、United Kingdom(英國)、Germany(德國)、 Canada(加拿大)、Japan(日本)、Australia(澳大利亞)、South Korea(韓國)、 Italy(意大利)、France(法國)。當前研究熱度最高的國家是美國,從全局熱度來看,美國早期就有著領先優勢并一直保持著最高的熱度,同時中國的研究熱度緊隨美國之后。

6)國家合作

美國的研究優勢還不僅僅表現在研究人員多或者發表論文多,在國際合作上美國也表現出絕對優勢。AI 2000根據論文中的單位信息,將作者映射到各個國家中,進而統計了各國之間的論文合作情況,合作論文數量 TOP10 的關系如下圖所示:

權威排名,全球最具影響力的2000名AI學者榜單,中國AI研究不足凸顯
在合作論文數量上,中美合作的論文數遙遙領先;在合作對象上,絕大多數的合作關系都包含美國,體現出了美國的突出地位。這也從側面告訴我們,中國要想發展,應當加強國際合作。

參考資料:
[1] AI 2000人工智能全球最具影響力學者,https://www.aminer.cn/ai2000

[2] https://static.aminer.cn/misc/pdf/pdf/ai2000.pdf

來源 | 雷鋒網

]]>
http://www.dreamadream.cn/%e6%9d%83%e5%a8%81%e6%8e%92%e5%90%8d%ef%bc%8c%e5%85%a8%e7%90%83%e6%9c%80%e5%85%b7%e5%bd%b1%e5%93%8d%e5%8a%9b%e7%9a%842000%e5%90%8dai%e5%ad%a6%e8%80%85%e6%a6%9c%e5%8d%95%ef%bc%8c%e4%b8%ad%e5%9b%bdai/feed/ 0
騰訊開源云服務器操作系統Tencent Linux http://www.dreamadream.cn/%e8%85%be%e8%ae%af%e5%bc%80%e6%ba%90%e4%ba%91%e6%9c%8d%e5%8a%a1%e5%99%a8%e6%93%8d%e4%bd%9c%e7%b3%bb%e7%bb%9ftencent-linux/ http://www.dreamadream.cn/%e8%85%be%e8%ae%af%e5%bc%80%e6%ba%90%e4%ba%91%e6%9c%8d%e5%8a%a1%e5%99%a8%e6%93%8d%e4%bd%9c%e7%b3%bb%e7%bb%9ftencent-linux/#respond Tue, 14 Jan 2020 06:24:51 +0000 https://new.openi.org.cn/%e8%85%be%e8%ae%af%e5%bc%80%e6%ba%90%e4%ba%91%e6%9c%8d%e5%8a%a1%e5%99%a8%e6%93%8d%e4%bd%9c%e7%b3%bb%e7%bb%9ftencent-linux/ 近日,騰訊云宣布開源其云服務器操作系統 TencentOS 內核(TencentOS Server Kernel,又稱 Tencent Linux,簡稱 Tlinux)。

騰訊介紹,相比業內其它版本 Linux 發行版,Tencent Linux 在資源調度彈性、容器支持、系統性能及安全等層面極具競爭力,特別適合云環境。

TencentOS Kernel 是騰訊云物聯網操作系統 TencentOS tiny 之后,TencentOS 家族對外開源的第二個項目。TencentOS 是騰訊云操作系統系列,由騰訊云架構平臺部主力研發,覆蓋數據中心、桌面系統、邊緣設備和物聯網終端等應用場景,提供云平臺構建、接入和應用能力。

騰訊云操作系統團隊表示:“將騰訊云服務器操作系統內核 TencentOS Kernel 開源,不僅可以與全球開發者共享騰訊云在服務器操作系統領域的技術和經驗,還能夠汲取全球服務器操作系統領域的優秀成果和創新理念,助力整體服務器操作系統生態的繁榮。”

具體看看該項目的特點:

專用資源調度方案,增強系統彈性伸縮能力

傳統 Linux 系統中,公平性是資源調度算法的核心邏輯。公平的調度能最大程度提供系統通用性。然而,這種公平會造成資源有效利用率的低下,系統的彈性能力大大受限,業務無法按照需求進行資源的分配回收,包括資源的數量與資源的質量,如資源分配速度、搶占能力等。

Tencent Linux 研發了專用的資源調度算法,大幅提升整機的資源彈性。業務可以根據需求指定資源分配的數量和級別,從相同數量不同級別的資源獲得的系統服務存在明顯差別。

同時,Tencent Linux 研發的 CPU 彈性調度算法,在離在線業務混布場景下收益十分顯著。在不影響在線業務質量的前提下,整機的 CPU 利用率最高提升 3 倍,部分業務場景下可將整機 CPU 利用率提升至 90%。

資源隔離增強

資源的安全隔離始終是容器虛擬化平臺的核心問題,社區內核提供的隔離特性遠遠不能滿足業務的需求,一些基本的系統狀態信息、CPU 信息與磁盤狀態信息等均未做隔離,部分場景下甚至直接導致業務不可用。

Tencent Linux 從業務需求出發,首先對必要的系統狀態,比如 cpuinfo、stat、loadavg、meminfo、vmstat、diskstats 與 uptime 等進行隔離增強,保證容器中的應用能獲得正確的系統狀態信息。

更重要的是,系統還提供包括 NVME IO 隔離等特性,徹底解決 IO 控制組在多隊列設備場景資源利用率低、不支持按比例隔離等問題,保證了不同場景下的 IO 隔離效果。

系統安全與性能優化

業界的內核熱補丁技術主要是針對 X86 架構進行開發,缺少對 ARM64 等架構的支持。Tencent Linux 通過實現類 FMENTRY、FTRACE with REGS 功能,給 KPATCH 中增加 ARM64 支持等實現了針對 ARM64 架構的內核熱補丁方案。

同時,Tencent Linux 提供進程 GDB 禁止功能,阻止跨進程獲取內存、加載動態庫等,保障業務進程的數據安全。

性能方面,Tencent Linux 針對計算、存儲和網絡子系統都進行了優化,例如 PAGE CACHE LIMIT 功能,限制 page cache 的使用率,盡量使系統剩余的內存能夠滿足業務的需求;系統還新增多個 sysctl/proc 控制接口、內核啟動參數等優化用戶體驗。

來源 | 開源中國

]]>
http://www.dreamadream.cn/%e8%85%be%e8%ae%af%e5%bc%80%e6%ba%90%e4%ba%91%e6%9c%8d%e5%8a%a1%e5%99%a8%e6%93%8d%e4%bd%9c%e7%b3%bb%e7%bb%9ftencent-linux/feed/ 0
深度強化學習走入「死胡同」,繼續死磕電子游戲還是另辟蹊徑? http://www.dreamadream.cn/%e6%b7%b1%e5%ba%a6%e5%bc%ba%e5%8c%96%e5%ad%a6%e4%b9%a0%e8%b5%b0%e5%85%a5%e3%80%8c%e6%ad%bb%e8%83%a1%e5%90%8c%e3%80%8d%ef%bc%8c%e7%bb%a7%e7%bb%ad%e6%ad%bb%e7%a3%95%e7%94%b5%e5%ad%90%e6%b8%b8%e6%88%8f/ http://www.dreamadream.cn/%e6%b7%b1%e5%ba%a6%e5%bc%ba%e5%8c%96%e5%ad%a6%e4%b9%a0%e8%b5%b0%e5%85%a5%e3%80%8c%e6%ad%bb%e8%83%a1%e5%90%8c%e3%80%8d%ef%bc%8c%e7%bb%a7%e7%bb%ad%e6%ad%bb%e7%a3%95%e7%94%b5%e5%ad%90%e6%b8%b8%e6%88%8f/#respond Mon, 13 Jan 2020 03:27:30 +0000 https://new.openi.org.cn/%e6%b7%b1%e5%ba%a6%e5%bc%ba%e5%8c%96%e5%ad%a6%e4%b9%a0%e8%b5%b0%e5%85%a5%e3%80%8c%e6%ad%bb%e8%83%a1%e5%90%8c%e3%80%8d%ef%bc%8c%e7%bb%a7%e7%bb%ad%e6%ad%bb%e7%a3%95%e7%94%b5%e5%ad%90%e6%b8%b8%e6%88%8f/ 2019 年,深度強化學習可以算得上 AI 研究的 Top 關鍵詞之一。

無論是 DeepMind 星際2 AI 「AlphaStar」血虐人類玩家,還是 OpenAI 最終因太過強大而被認為可能有風險所以不公開發布的語言模型 GPT-2,無疑都在過去一年中最轟動的 AI 大事件之列,也吸引了 AI 社區的越來越多的研究者投身深度強化學習研究之列。

然而,也有很多反對的聲音認為深度強化學習現在的一系列成果,其實更像是一種虛假的「繁榮」。

本文作者朱仲光便是其中的一位。他指出,深度強化學習會給研究者們尤其是各位不明真相的大眾帶來「離通用人工智能越來越近」的錯覺,而更為嚴重的是,深度強化學習會耗費掉研究者們本可以用來研究其他更重要的問題和更有前景的方向的時間和精力。

他的具體觀點,我們下面來看:

一、2019 年都過去了,并沒有離現實世界更進一步

隨著 2019 年的結束,我想回顧一下人工智能所取得的進展。在這一年,AI 社區尤其將深度強化學習大肆宣揚為下一個朝著通用人工智能(AGI)前進的革命性的一步。

通用人工智能,顧名思義,就是指能夠像人類一樣以一種通用的方式學習萬事萬物的計算機算法。

近年來,研究者們針對深度強化學習開展了大量研究工作,現在也逐漸取得了一定進展。

圍繞深度強化學習的想法和期望是,理論上,我們能輕而易舉地訓練一個能做任何事情的智能體,比如開車、疊衣服、玩電子游戲、打掃房間、玩魔方等等,并且所有智能體的學習過程都不需要人工干涉。其中一些實驗已經取得一些成功,你可以教一個深度強化學習的智能體玩一些電子游戲和棋類游戲,但是一旦涉及現實世界,進入生產系統,這些實驗都會以失敗告終。

據我所知,2019 年都過去了,仍然沒有出現任何能夠使用深度強化學習技術的生產系統。

二、到底解決哪些問題,才有意義?

深度強化學習系統有許多問題,我并不打算詳細討論這些問題的細節,因為有很多博客文章已經討論過這些問題。感興趣的讀者可參考下文:

  • 《Deep Reinforcement Learning Doesn't Work Yet》,https://www.alexirpan.com/2018/02/14/rl-hard.html

如果這些問題中有一部分得到改善或解決,例如找到更抽象的方式來表征神經網絡內部的信息,我也不會太驚訝,但如果不能解決我所認為的核心問題,即有關手動設置獎勵的問題,那所謂的「改善」或「解決」也就意義不大了。

在深度強化學習中,我認為大部分時間都花在了設計獎勵函數來讓智能體完成想讓它做的事情。用更傳統的機器學習術語來說,獎勵函數就是目標函數,指的是算法利用獎勵函數來了解系統是否朝著正確的方向運行,模型得到的獎勵越多,它就「越好」。

比如教一支機械臂疊衣服,假如說你有一堆褲子,那么你如何編寫獎勵函數來讓機械臂正確地疊這些褲子呢?當向另外一個人解釋這一點時,聽起來很簡單,只是「把褲子疊成整齊的一堆」,但是計算機并不知道這些規則的含義。

對于每一個實驗,你設計的獎勵必須要讓計算機在完全不知道自己實際正在做什么的情況下,可以自己衡量自己的運行過程。因此,你設計的獎勵程序可以在機械臂碰到褲子時就開始給它獎勵,之后再針對是否正確抓住了褲子以及移動了褲子,來給它更多獎勵得分。

那如何基于機械臂在實際折疊褲子中的表現給予獎勵?疊三次可以得分嗎?沒有將褲子疊皺又得多少分?

最終,你花了太多時間試圖去引導智能體遵循正確的路徑,以至于它基本上處在完全的監督之下。

理論上,你的確可以讓一個人監督著整個訓練過程,這個人可以為系統采取的每一個動作指定一個分數,但這種方式是不能泛化的。

這些深度強化學習系統需要基于數萬到數百萬次的迭代來試驗動作的每一個變化,以找出實現最終目標的正確序列,個人很難監控計算機采取的所有步驟。研究者也正在積極探索,試圖將這個范圍縮小至有限次數的學習,但對我來說,這只是試圖改進一些從根本上而言沒有意義的東西。

在你試圖訓練機器人折疊褲子的過程中,你可能需要不斷調整獎勵函數,因為它可能會意外地撕破褲子、弄掉一些零部件、不把褲子翻出來就直接折疊,或者以看起來毫無意義的奇怪方式折疊褲子。這樣的話,獎勵的設計變成了一個試驗性的過程,即通過反復的嘗試和試錯來確定什么是有效的獎勵。有無數的報告記錄了深度強化學習模型做出的各種意想不到的動作。

強化學習通常被劃分為除監督機器學習和無監督機器學習以外的第三類,但在我看來,它其實就是監督學習。
當前的強化學習實現步驟是這樣的:你開始訓練模型,然后你看著它失敗然后「死掉」,接著你花費大量的時間一次又一次調整獎勵函數,直到你「有可能」得到一個理想的結果,但僅僅是「有可能」。

這個過程中有哪一步你沒有給系統提供訓練數據?事實上你把整個過程復雜化了,你僅僅是把答案以間接的方式提供給智能體,而這恰恰讓一切變得更加困難。

如果計算機要從周圍的環境中學習,那必須在一個 100% 無監督的環境里進行。

三、當公關大于實質進步,會帶來哪些危害?

那么,為什么關于深度強化學習的炒作如此之多?

如果你站在一個抽象的角度來看待深度強化學習,你就會知道它被描述為一個隨著時間的推移從其環境中學習的智能體。

這似乎是絕對正確的,而且確實「很像」是真的,所有生物都是從出生開始學習如何從其環境中生存和行動。

我們之所以知道這一點,是因為我們做了許多實驗,經驗告訴我們,如果我們改變和限制新生有機體的環境,它們會學到不同的東西,行為也會有所不同。

深度強化學習與諸如監督分類的傳統機器學習方法有很大的不同,傳統的機器學習是一個靜態模型,它獲取原始數據和答案并最終建立一個模型用于生產。在傳統的深度強化學習框架中,系統犯錯的部分就是信號的來源。這些人工智能體必須直接從它們自身和環境中學習,而不是從我們提供給它們的某種人工獎勵函數中學習。

當 DeepMind 推出一個單一的不進行任何人為干涉就可以學會玩 Atari 電子游戲的深度強化學習智能體時,人們認為這種智能體可以泛化到其他領域的各種問題,甚至是通用人工智能。

但我們所了解到的是,有機體和人類所做的大多數事情,都無法建模成通過讓智能體持續優化從而盡可能獲得更多獎勵的電子游戲。不要被「深度強化學習不需要人為干涉就能夠在游戲中獲勝」的新聞所愚弄!設計獎勵這一操作仍然存在,并且在 40 年前,當電子游戲制造商雇傭整支隊伍來制作這些游戲時,就已存在這種操作。

很多人都誤認為深度強化學習是實現通用人工智能的下一個創舉,甚至谷歌也「過分熱情」地花了 5 億多美元收購 DeepMind,希望把人工智能提升到一個新的水平。與此同時,AI 社區似乎也把深度強化學習當成了圣杯,因為它是在某種程度上與我們所處的世界最接近的機器學習形式,盡管實際上還相差甚遠。

我們最終實現的不過是一些「小把戲」,這些智能體也不過是可以玩各種各樣的電子游戲、棋類游戲的小 AI 玩具。
從更傳統的機器學習方法向深度學習轉變的主要好處是,不再需要手動的工程設計。理論上,你可以給模型提供一堆數據,運行優化算法,它不需要你手動編寫特征提取代碼也能進行學習。因此,深度學習已經被應用到部分強化學習中,主要體現在智能體以像素的形式接收感知數據的部分,但是仍然需要研究者花大部分時間來手動設計程序。

這在我看來,深度學習并沒有發揮什么作用!我甚至沒有具體討論其他深度強化學習問題,比如如果你需要稍微調整一下目標,那么你就要準備好重新訓練整個系統,以及環境中的細微變化通常也會導致整個系統徹底失敗,等等。通往通用人工智能的路還很長……

現在DeepMind 和 OpenAI 這樣頂尖的機器學習研究機構,仍然在深度強化學習研究上投入主要的時間和資源。他們不斷地用發布公關新聞轟炸互聯網,展示他們正在取得的巨大進步:深度強化學習系統可以下圍棋,玩 StarCraft、Dota 2,玩魔方等等。

我很困惑,為什么他們繼續花那么多時間來開發有明確的定義規則和得分的系統、能在游戲中獲勝的深度強化學習系統?

我相信現在每個人都明白,如果有足夠多的時間、金錢和計算機來機械地訓練每一個可能的動作,深度強化學習系統幾乎可以在任何游戲中獲勝。我認為他們大部分的策略僅僅是用一些「小把戲」來不斷制造公關效應,以展示最新的深度強化學習系統如何在下一個最佳游戲中大獲全勝,這樣他們就可以繼續從那些不太「懂行」的人那里獲得投資,比如微軟最近給 OpenAI 的  投了10 億美元,谷歌則繼續作為 DeepMind 的「存錢罐」給其投入資金。

DeepMind 最近,也就是在被谷歌收購 5 年后的一個成功案例是,他們訓練了一個深度強化學習的智能體來下圍棋、國際象棋、將棋和玩 Atari 游戲。是的,更多的電子游戲!!!

我的本意并不是抨擊他們,我真的很高興他們仍然在為實現通用人工智能貢獻力量。但問題是,他們制造了很多錯誤的認知,并最終導致大量的人力物力浪費在「死胡同」上。

首先,他們發布的所有公關言論,比如「我們的文本生成模型(GPT-2)太危險了,不能發布」,使得普通大眾認為我們離通用人工智能更近了,然而 AI 行業中的每個人都明白并沒有更近。

其次也是更重要的是,他們錯誤地引導著人工智能研究者們花更多的時間在深度強化學習上。許多研究人員和黑客從這些研究深度學習的公司那里看到了一波又一波為深度強化學習「叫好」的 PR 新聞,當他們原本可以將精力集中在更大、更根本的問題上時,他們卻花費了無數的時間去破解那些相同的問題。

四、要實現通用人工智能,真正要做的是什么?

如果人工智能和通用人工智能要向前發展,我認為是時候停止讓深度強化學習系統玩電子游戲,轉而集中精力解決更棘手的問題了。

所幸 DeepMind 和 OpenAI 的確有花時間解決其他問題,但正如我所說,深度強化學習似乎仍然是他們的主要關注點。

目前的深度強化學習系統似乎可以很好地契合已經有基礎訓練的系統。遷移學習中的智能體已經對其環境和自身有了基本的了解。我們不妨觀察一個人類嬰兒的學習歷程:從出生開始,她(他)首先開始學習觀察形狀和顏色,移動手指,觸摸物體,控制自己的身體,辨別聲音,學習有關重力、物理、墜落、蠕動、彈跳的知識,學習物體恒常性等。每一個人或有機體都會在不同程度上經歷這些學習過程。

通常在嬰兒掌握了大量的知識之后,即當她(他)可以走路、抓握物體、自己上廁所、進行基本的交流等等之后,接下來就是更為正式的訓練,比如家長會送孩子去學校,孩子在學校中會經歷一個結構性更強的學習過程:學校通過家庭作業、評分以及測驗訓練孩子從課程中學習知識。

當前的深度強化學習系統似乎原本可以很好地適用于這種形式化的訓練,在這種訓練中,當智能體對環境有了基本的了解之后,系統可以清晰地、最大程度自動化地給所期待達成的目標指定分數。比方說如果孩子不能背誦 ABC 這三個字母,記為不及格,但如果他們能背誦整個字母表則記為及格。

當前深度強化學習技術正在本末倒置,我們正試圖訓練計算機從零開始完成一些復雜的任務,這種訓練有時可能會有效,但由于這些模型是針對特定的任務而不是泛化能力而訓練的,它們對自己的環境沒有泛化的了解,最終導致系統過于脆弱,效果也不是很好。

只要獎勵函數的問題沒有被解決,再多新的學習算法,如BP 算法、DQN、PPO、DDPG、TRPO 都無法真正解決深度強化學習的問題。

我確信我們會有一些進步,也許會在 Starcraft 中贏得更多的分數,但是如果沒有一個根本性的架構轉變,來實現智能體在無監督的情況下從環境中進行學習,那么這些所謂的進步對于我們實現通用人工智能這一偉大夢想,也就沒有太多的意義。

我自己的假設是,針對學習體的獎勵函數實際上是由維持穩態和將「意外」最小化的動力所驅動的。

穩態是生物維持生存所需的穩定條件的過程。任何有機體都要生存,都必須保持其身體與外界環境分離。生物饑餓的時候要進食,疲倦的時候要睡覺,口渴的時候要喝水,受傷的時候要休息,被獵殺的時候要逃離,炎熱的時候要讓自己涼快一點等等。有機體在環境中行動時,這些與生俱來的原始信號指導著它們該做什么和該關注什么。如果它們不能勝任這些事情,則會導致有機體內失去平衡,最終導致過早死亡。

當生物在四處游蕩時,它會建構自己的感知運動交互作用模型以及與周圍世界交互作用的環境,該模型開始把各種事件匯聚到一起:天黑的時候應該比較冷;當我打嗝,我應該聽到打嗝的聲音;當我向左移動,我應該看到視野在 X 軸上變化;當一只動物走在我前面,它應該繼續向前移動;當我的手指在杯子上掃過,我應該感受到光滑的表面;當我通過聲帶發出聲音,我應該能在我的耳朵里聽到相應的聲音等等。

如果有什么意外的事情發生,有什么東西偏離了它的模型,那么該模型會重新調整它的預期,直到得到它所預期的結果,這也可能會導致更多的移動。如果最終不能得到預期的結果,那么真正的「意外」就會出現,這些神經元就被標記為「需要更新模型」,在這種情況下,重新學習和重新優化可能會實時發生,也可能是在機體處于睡眠狀態時發生。

優化過程會在智能體的內部環境模型和實際環境之間進行,并持續優化以使意外最小化。神經科學和哲學已經在很長一段時間里對這些思想展開過討論,比如 Andy Clark 提出的預測處理的思想以及 Karl Friston 提出的自由能量原理(Free Energy Principle)。

據我所知,這些思想還沒有成功地應用于機器學習環境中。我認為這其中有很多技術問題:如何在計算機中模擬穩態狀態,如何存儲模型的內部表征,智能體的感官和環境之間的低分辨率以及低保真環境等等。

我并非意在采用一個煽動性的標題來寫這篇文章,但我也無法以一種更恰當的方式來向人們說明「當前的深度強化學習架構從根本上而言就是錯的」這一問題。

我們不需要更多可以玩多種電子游戲的深度強化學習模型,我們需要實現的模型是這樣的:它可以在完全無監督的環境中學習智能體和環境之間的泛化表征。這種新的架構可以被稱為「深度強化學習 3.0」、「積極推理」、「預測處理」或其他完全不同的東西,但是請不要再在這個「死胡同」上浪費時間了。

深度強化學習的研究已經取得了一些很有成效且有趣的成果,但是時候繼續前進了。誰能找到方法來構建一個可以在無監督情況下從環境中學習的泛化的人工智能系統,誰就會對 AI 領域做出巨大的貢獻并推動這個領域繼續向前發展。

來源 | 雷鋒網

]]>
http://www.dreamadream.cn/%e6%b7%b1%e5%ba%a6%e5%bc%ba%e5%8c%96%e5%ad%a6%e4%b9%a0%e8%b5%b0%e5%85%a5%e3%80%8c%e6%ad%bb%e8%83%a1%e5%90%8c%e3%80%8d%ef%bc%8c%e7%bb%a7%e7%bb%ad%e6%ad%bb%e7%a3%95%e7%94%b5%e5%ad%90%e6%b8%b8%e6%88%8f/feed/ 0
微軟北大聯合提出換臉 AI 和臉部偽造檢測器,演繹現實版「矛與盾」? http://www.dreamadream.cn/%e5%be%ae%e8%bd%af%e5%8c%97%e5%a4%a7%e8%81%94%e5%90%88%e6%8f%90%e5%87%ba%e6%8d%a2%e8%84%b8-ai-%e5%92%8c%e8%84%b8%e9%83%a8%e4%bc%aa%e9%80%a0%e6%a3%80%e6%b5%8b%e5%99%a8%ef%bc%8c%e6%bc%94%e7%bb%8e/ http://www.dreamadream.cn/%e5%be%ae%e8%bd%af%e5%8c%97%e5%a4%a7%e8%81%94%e5%90%88%e6%8f%90%e5%87%ba%e6%8d%a2%e8%84%b8-ai-%e5%92%8c%e8%84%b8%e9%83%a8%e4%bc%aa%e9%80%a0%e6%a3%80%e6%b5%8b%e5%99%a8%ef%bc%8c%e6%bc%94%e7%bb%8e/#respond Wed, 08 Jan 2020 06:29:39 +0000 https://new.openi.org.cn/%e5%be%ae%e8%bd%af%e5%8c%97%e5%a4%a7%e8%81%94%e5%90%88%e6%8f%90%e5%87%ba%e6%8d%a2%e8%84%b8-ai-%e5%92%8c%e8%84%b8%e9%83%a8%e4%bc%aa%e9%80%a0%e6%a3%80%e6%b5%8b%e5%99%a8%ef%bc%8c%e6%bc%94%e7%bb%8e/ 近日,微軟研究院與北京大學的研究小組共同提出了一種全新的 AI 換臉框架 FaceShifter,以及一種檢測偽造人臉圖像的方法 FaceX-Ray。前者可以極大提高換臉的高保真度,而后者則用于檢測出復雜偽造人臉圖像。

一個致力于造假,一個專注于打假;光是聽起來,就不禁讓人聯想到「矛」與「盾」的故事。那到底哪個更勝一籌呢?VB 發布了的相關內容介紹了這兩個成果,雷鋒網 AI 開發者將其整理及編譯如下。

微軟北大聯合提出換臉 AI 和臉部偽造檢測器,演繹現實版「矛與盾」? 

人臉技術研究背景

目前,最先進的機器學習算法不僅可以完成對地點或物體的圖像改變與生成,以 Deepfake 為代表的 AI 換臉技術甚至已經可以達到以假亂真的換臉效果;但由于換臉技術的濫用可能會為社會帶來一系列惡劣影響,研究人員也在不斷探索該技術的原理,并希望能夠解決這一難題。

就在最近,這一技術又有了新的進展。微軟研究院和北京大學的研究小組發表的兩篇學術論文中,他們分別提出了一種用于生成高保真和遮擋感知的人臉交換框架——FaceShifter,以及一種用于檢測偽造人臉圖像的方法——FaceX-Ray。

微軟北大聯合提出換臉 AI 和臉部偽造檢測器,演繹現實版「矛與盾」?

與現有的方法相比,微軟研究的面容轉換
 

據相關研究人員表示,與多個現行基線方法相比,這兩種方法都能在不犧牲性能的情況下取得更好的效果,而且它們所需的數據比以前的方法少得多。

無訓練換臉——FaceShifter

從相關資料可以看到,FaceShifter 能夠將目標圖像中的人替換為源圖像中的另一個人的同時,保留其頭部姿勢、面部表情、燈光、顏色、強度、背景和其他屬性特征。

雖然像 Reflect 和 FaceSwap 這樣的應用程序聲稱可以相當準確地做到這一點,但是微軟論文的合著者表示 FaceShifter 對姿態和視角的變化則敏感度更高。

微軟北大聯合提出換臉 AI 和臉部偽造檢測器,演繹現實版「矛與盾」? 

取源圖像中的臉來替換目標圖像中的面,換臉結果顯示在右邊
 

圖片來源:FaceShifter論文(https://arxiv.org/pdf/1912.13457.pdf)

FaceShifter 通過使用生成性對抗網絡(GAN)來提高換臉的保真度,它主要由兩部分架構組成。第一部分主要利用利用自適應注意力非正規化(AAD)層的新生成器整合人臉合成圖片的特征和屬性,該層可以自適應地學習整合面部屬性的位置;第二部分則重點解決面部遮擋問題,這部分則包括了一個新的啟發式錯誤確認細化網絡(HEAR-Net),可利用重建圖像與其輸入之間的差異來識別遮擋。

微軟北大聯合提出換臉 AI 和臉部偽造檢測器,演繹現實版「矛與盾」? 

更多來自 FaceShifter 的樣本

研究小組稱,「該框架在生成任意真實圖像相對的換臉圖像時,無需特定的訓練,都顯示出了優越的性能。大量實驗表明,該框架明顯優于以前的人臉交換方法。」

可以看到,在一項定性測試中,FaceShifter 保留了人臉形狀,并自動適應換臉圖像的光線和圖像分辨率。此外,即使是從互聯網上抓取的「狂野面孔」,該框架也能夠在不依賴人工注釋數據的情況下恢復異常區域——包括眼鏡、陰影和反射效果,以及其它不常見的遮擋。

灰度打假 FaceX-Ray

而與 FaceShifter 相比,FaceX-Ray 則恰好是偽造頭像的克星。正如研究人員在相應的論文中所指出的那樣,我們確實需要這樣的工具來防止偽造圖像被濫用的情況。

2019 年 6 月曾有份報告披露,一名間諜利用人工智能生成的個人資料圖片愚弄 LinkedIn 中的聯系人;而就在去年 12 月,Facebook 發現數百個賬戶上面都有使用人工智能合成的假面像來作為個人資料照片。

微軟北大聯合提出換臉 AI 和臉部偽造檢測器,演繹現實版「矛與盾」? 

各種面部操作方法的視覺結果,包括自監督生成的混合圖像
 

談回 Face X-Ray 檢測技術,它與現有方法不同,它不需要事先知道操作方法或人工監督;相反的是它會生成灰度圖像,顯示給定的輸入圖像是否可以分解為來自不同來源的兩個圖像的混合。

研究人員表示這一想法是可行的,因為大多數操作換臉的方法,都會有「將已改變的面部混合到現有背景圖像中」這一步驟。但每幅圖像都有自己獨特的標記,這些標記是從硬件(如傳感器和鏡頭)或軟件組件(如壓縮和合成算法)引入的,并且這些標記往往在整個圖像中也以類似的方式呈現。

微軟北大聯合提出換臉 AI 和臉部偽造檢測器,演繹現實版「矛與盾」? 

生成訓練樣本概述

因此,Face X-Ray 不需要依賴于與特定人臉操作技術相關聯的偽影知識,并且支持它的算法可以在不使用任何方法生成假圖像的情況下進行訓練。

在一系列實驗中,研究人員在 FaceForensics++(一個包含 1000 多個用四種最先進的人臉置換方法生成的原始剪輯的大型視頻語料庫),以及另一個包含由真實圖像構建的混合圖像的訓練數據集上訓練了 Face X-Ray。

他們評估了 FaceX-Ray 使用四個數據集進行概括的能力,其中包括:

  • 上述 FaceForensics++語料庫的一個子集;
  • 谷歌發布的數千個 deepfake 影視集合,deepfake 檢測挑戰賽的圖像;
  • Celeb DF,一個包含 408 個數據集真實視頻的語料庫和 795 個減少了視覺偽影的合成視頻。

結果表明,Face X-Ray 能有效地識別出未被發現的偽造圖像,并能可靠地預測融合區域。研究人員指出,該方法依賴于混合步驟的存在,因此它可能不適用于全合成圖像,并且它可以無法成功檢測出對抗性樣本的真偽。但撇開這一點,這也算是朝通用化面部偽造圖像檢測工具邁出的有希望的一步。

原文地址:
https://venturebeat.com/2020/01/06/microsoft-researchers-propose-face-swapping-ai-and-face-forgery-detector/ 
FaceShifter 論文地址:
https://arxiv.org/pdf/1912.13457.pdf 
FaceX-Ray 論文地址:

https://arxiv.org/pdf/1912.13458.pdf 

來源 | 雷鋒網
作者 | 楊鯉萍

]]>
http://www.dreamadream.cn/%e5%be%ae%e8%bd%af%e5%8c%97%e5%a4%a7%e8%81%94%e5%90%88%e6%8f%90%e5%87%ba%e6%8d%a2%e8%84%b8-ai-%e5%92%8c%e8%84%b8%e9%83%a8%e4%bc%aa%e9%80%a0%e6%a3%80%e6%b5%8b%e5%99%a8%ef%bc%8c%e6%bc%94%e7%bb%8e/feed/ 0
從 AlphaGo 到具有人類智慧的 AI 究竟有多遠?Fran?ois Chollet 有了一些新想法 http://www.dreamadream.cn/%e4%bb%8e-alphago-%e5%88%b0%e5%85%b7%e6%9c%89%e4%ba%ba%e7%b1%bb%e6%99%ba%e6%85%a7%e7%9a%84-ai-%e7%a9%b6%e7%ab%9f%e6%9c%89%e5%a4%9a%e8%bf%9c%ef%bc%9ffrancois-chollet-%e6%9c%89%e4%ba%86%e4%b8%80/ http://www.dreamadream.cn/%e4%bb%8e-alphago-%e5%88%b0%e5%85%b7%e6%9c%89%e4%ba%ba%e7%b1%bb%e6%99%ba%e6%85%a7%e7%9a%84-ai-%e7%a9%b6%e7%ab%9f%e6%9c%89%e5%a4%9a%e8%bf%9c%ef%bc%9ffrancois-chollet-%e6%9c%89%e4%ba%86%e4%b8%80/#respond Tue, 07 Jan 2020 02:55:45 +0000 https://new.openi.org.cn/%e4%bb%8e-alphago-%e5%88%b0%e5%85%b7%e6%9c%89%e4%ba%ba%e7%b1%bb%e6%99%ba%e6%85%a7%e7%9a%84-ai-%e7%a9%b6%e7%ab%9f%e6%9c%89%e5%a4%9a%e8%bf%9c%ef%bc%9ffrancois-chollet-%e6%9c%89%e4%ba%86%e4%b8%80/
從 AlphaGo 到具有人類智慧的 AI 究竟有多遠?Fran?ois Chollet 有了一些新想法
圖片來自Alex Castro / The Verge
 
測量人工智能的「智慧」是計算機科學領域中最棘手但最重要的問題之一。如果你不明白你今天制造的機器是否比昨天更聰明,那你怎么知道你在進步?

乍一看,這似乎不是問題。其中一個回答是:「顯然人工智能越來越聰明」。僅從所有涌入這一領域的資金和人才就可以看出來。也可以回顧一下 AI 領域實現的一系列里程碑,例如 AI 在圍棋上打敗人類,以及像圖像識別等在十年前根本不可能落地的應用現在開始變得無處不在。我們怎么能說 AI 這個領域不是在進步?

另一個回答是,這些成就并不是衡量「智慧」的良好標準。AI在國際象棋和圍棋中擊敗人類確實令人印象深刻,但是如果在解決一般的問題時,一個正在蹣跚學步的孩子甚至一只老鼠都能讓最聰明的計算機「不知所措」,AI 又有什么用?

這是人工智能研究人員、谷歌軟件工程師、機器學習界知名人士François Chollet 對當下的 AI 做出的評論。Chollet 是 Keras 庫的作者,而 Keras 則是一個被廣泛應用的開發神經網絡的程序,是當代人工智能的脊柱。他還編寫了大量關于機器學習的教科書,并在 Twitter 開設了專欄分享自己對于 AI 領域的觀點,廣受歡迎。

在最近一篇題為《測量智慧》的論文中,Chollet 還提出了一個論點,即人工智能世界需要重新定義什么是「智慧」以及什么不是「智慧」。Chollet 指出,如果研究人員想在通用人工智能方面取得進展,他們需要回顧過去流行的基準,如電子游戲和棋類游戲,并開始思考讓人類變得聰明的技能,比如我們所具有的概括和適應的能力。

在接受 The Verge 雜志的電子郵件采訪時,Chollet 闡述了他對這個問題的看法,談到了他為什么認為人工智能目前的成就被「歪曲了」,以及我們將來如何衡量「智慧」,為什么關于超級人工智能的恐怖故事(如 Elon Musk 和其他人所說)會毫無根據地把控住公眾的想象力。

從 AlphaGo 到具有人類智慧的 AI 究竟有多遠?Fran?ois Chollet 有了一些新想法

FrançoisChollet是AI框架Keras的發明者,也是Google的軟件工程師

為了將Chollet 的觀點表述得更為清晰,本文對采訪做了一定編輯。

問:在您的論文中,您描述了塑造人工智能領域的兩個不同的「智慧」概念:一種「智慧」表現為能夠勝任廣泛的任務的能力,另一種則優先考慮適應能力和泛化能力,即人工智能應對新挑戰的能力。現在哪個框架的影響力更大,帶來了什么樣的影響?

Chollet:該領域發展的頭 30 年里,最有影響力的觀點是前者:「智慧」是一套靜態的程序和顯性的知識庫。現在,觀點則向另一個相反的方向偏倚:AI 社區定義「智慧」的主流方法還是一張「白紙」,或者用一個更確切的比喻來說,是「新初始化的深層神經網絡」。然而不幸的是,這是一個基本上沒有受過挑戰、甚至幾乎沒有經過檢驗的框架。這些問題有著很長的學術歷史(確切地說是幾十年的歷史),我認為即便是現在,AI 領域對「智慧」也沒有太多認識,也許是因為現在在做深度學習的人,大多數都是在 2016 年之后才加入這個領域的。

這種知識壟斷現象從來都不是什么好事,尤其是在回答這些理解尚不足的科學問題時。它對于領域內的研究者提出一系列的問題帶來了很大的限制,也限制了人們追求的思想空間。我認為現在研究者們逐漸開始意識到了這個現象。

問:在您的論文中,您還提出,人工智能需要更好地定義「智慧」才能進步。您提到,現在研究人員專注于在靜態測試(例如在電子游戲和棋類游戲中獲勝)中對性能進行基準測試。為什么您覺得這種測量「智慧」的方式是不足夠的呢?

Chollet:是這樣的,一旦你選擇了一個衡量標準,你將會為了實現這一標準而采取任何可以采用的捷徑。例如,如果你把下棋作為衡量「智慧」的標準(我們從 20 世紀 70 年代到 90 年代都是這么做的),你最終會得到一個下棋的系統,僅此而已。而根本沒有理由去思考這個系統到底對其他事情有什么益處。你最終讓系統實現了樹狀搜索和極小化極大算法,但這并不能教會系統任何關于人類智能的知識。如今,研究者們在 Dota 或 StarCraft 等電子游戲中追求高超技能,將此作為實現了通用「智慧」的典型代表,則陷入了完全相同的智力陷阱。

這也許并不明顯,因為在人類看來,技能和「智慧」是密切相關的。人類的大腦可以利用它的通用「智慧」來獲得完成特定任務的技能。一個真正擅長象棋的人可以被認為是相當聰明的,因為,我們隱約知道他們必須用自己的通用「智慧」來從零開始學習下棋。他們不是為下棋而生的。所以我們知道,他們可以把這種通用「智慧」指向許多其他任務上,并學會同樣很高效地完成這些任務。這就是所謂的「通用性」。

但是機器沒有這樣的限制,機器完全可以為下棋而設計。因此,我們對人類所做的推論——「會下棋,因此一定很聰明」,就失效了,我們的擬人假設不再適用。通用「智慧」可以產生完成特定任務的技能,但絕對不能反過來說,完成特定任務的技能可以產生通用「智慧」。所以對于機器而言,技能和智慧是完全正交的。你可以獲得針對任何特定任務的特定技能,只要你可以用無限數據作為這種任務的樣例(或者花費無限的工程資源),但這仍然不能讓機器更接近通用「智慧」。

我最主要的觀點是,在任何一項任務中獲得超高技能,都不能作為「智慧」的標志。除非這項任務實際上是一項元任務,它涉及讓機器在一系列以前未知的問題上獲得新技能。這正是我所提倡的「智慧」的基準。

從 AlphaGo 到具有人類智慧的 AI 究竟有多遠?Fran?ois Chollet 有了一些新想法

人工智能實驗室的研究人員在《星際爭霸2》中觀察他們的人工智能AlphaStar如何對付人類玩家。圖片來自DeepMind

問:如果當前的這些基準無法幫助我們發展擁有更通用、更靈活的「智慧」的人工智能,那么為什么它們如此受歡迎?

Chollet:毫無疑問,AI在特定的知名電子游戲中擊敗人類冠軍的成就很大程度上是由報道這些項目的媒體所推動的。如果公眾對這些浮躁的,而且很容易被誤解為通往超人類通用人工智能的重要進步的「里程碑」不感興趣,那么研究人員將做些別的事情。

我覺得這有點可悲,因為研究應該回答開放的科學問題,而不是產生公關效應。如果我開始用深度學習以超人類的水平「解決」《魔獸爭霸 3》,你可以肯定的是,只要我有足夠的工程人才和計算能力(對于這樣的任務來說,這大約需要幾千萬美元),我就一定能達到目的。然而一旦我做到了,我能學到關于「智慧」和泛化能力的什么東西嗎?坦白說,什么也學不到。充其量,我會掌握有關擴展深度學習的工程知識。所以,我并不真正將其視為科學研究,因為它沒有教給我們任何我們不知道的東西,也沒有回答任何開放性的問題。如果問題是,「我們能在超人類的水平上玩 X 游戲嗎?」答案是肯定的:「可以,只要你能夠生成足夠密集的訓練環境的樣本,并將其輸入到一個有效表達的深度學習模型中」,早在前一段時間,我們就已經知道了這一點。(事實上,在 AIs 達到 DOTA2 和 StarCraft II 的冠軍級別之前的一段時間,我就表達過這樣的觀點。)

問:您認為這些項目的實際成果是什么?這些項目的結果在多大程度上被誤解或歪曲

Chollet:我看到的一個明顯錯誤的陳述是,這些高技能的游戲系統代表著「可以處理現實世界的復雜性和不確定性的人工智能系統的真正進步」。(正如 OpenAI 在給用來玩 DOTO2 的程序 OpenAI 5 發布的新聞稿中所宣稱的那樣)。它們并不能代表人工智能的進步。如果它們真的可以,這將是一個非常有價值的研究領域,但事實并非如此。以 OpenAI 5 為例,它最初不能處理 Dota2 的復雜性,因為它是用 16 個字符來訓練的,不能泛化到整個游戲中,整個游戲有超過 100 個字符。它經過了 45,000 年的游戲訓練,然后再一次注意到對于訓練數據的需求如何隨著任務的復雜度增長。而即便經過這么長時間的訓練,得到的模型依舊被證明是非常脆弱的:在這種 AI 對外發布能供人類與之對戰后,即便是非冠軍的人類玩家,也能夠找到能十拿九穩地打敗它的策略。

如果你希望有一天能夠處理現實世界的復雜性和不確定性,你就必須開始問一些問題,比如什么是泛化?如何衡量和最大化學習系統的泛化能力?這與向一個大的神經網絡投入 10 倍的數據并進行計算完全是正交的,這樣它的技能就能提高一點點。

問:那么,對于這個領域來說,什么是更好的測量「智慧」的標準呢?

Chollet:簡而言之,我們需要停止評估針對事先已知的任務的技能(比如象棋、Dota 或 StarCraft),而是開始評估「技能獲得能力」。這是指只使用系統事先不知道的新任務,來測量系統開始執行任務的先驗知識并測量系統的樣本效率(即完成任務所需的數據量)。系統需要的信息(先前的知識和經驗)越少,它就越聰明,而今天的人工智能系統真的一點也不聰明。

此外,我認為我們對「智慧」的衡量應該使「似人性」更加明確,因為可能存在不同類型的「智慧」,而我們實際上就是在隱含地談論類人的「智慧」,這包括試圖理解人類與生俱來的先驗知識。人類的學習是極其高效的,他們只需要很少的經驗就可以獲得新技能,但他們并不是從頭開始學習:除了一生積累的技能和知識外,他們還利用與生俱來的先驗知識來學習。

我最近的論文提出了一個新的基準數據集 ARC(「Abstraction and Reasoning Corpus」,意為「抽象和推理語料庫」),它看起來很像智商測試。ARC 是一組推理任務,其中每個任務都通過一小段演示(通常是三個演示)進行解釋,你應該從這幾個演示中學習如何完成任務。ARC 采取的立場是,你的系統所評估的每一項任務都應該是全新的,而且應該只涉及符合人類先天知識的知識。例如,它不能以語言作為特征。目前,ARC 完全可以在沒有任何口頭解釋或先前訓練的前提下由人類完成,但它完全不能被任何我們已經嘗試過的人工智能技術所解決。這是一個巨大且明顯的信號,表明了有一些事情正在發生,也表明我們需要新的想法。

從 AlphaGo 到具有人類智慧的 AI 究竟有多遠?Fran?ois Chollet 有了一些新想法

Chollet 為他的新 ARC 基準數據集提出的「智慧」測試的一個例子。圖片來自 François Chollet

問:您認為只通過在這些問題上投入更多的計算能力,人工智能世界能夠繼續進步嗎?有人認為,從發展歷史上看,這是提高績效的最成功的方法,而其他人則認為,如果我們沿著這條路走下去,我們很快就會看到收益遞減。

Chollet:如果你在做一個特定的任務,這種觀點是絕對正確的:在垂直任務上投入更多的訓練數據和計算能力將提高針對該任務的能力。然而在幫助你理解如何實現人工智能的通用性方面,它會讓你一無所獲。

如果你有一個足夠大的深度學習模型,并且針對一個特定任務在跨輸入輸出空間的密集采樣上訓練它,那么它將學習解決這個任務,不管是什么——不論是 Dota 還是 StarCraft,凡是你能想到的。這是非常有價值的,并且在機器感知問題中有著幾乎無限的應用。這里唯一的問題是,你需要的數據量是一個任務復雜度的組合函數,所以即使是稍微復雜的任務,計算也會變得非常昂貴。

以自動駕駛汽車為例。數以百萬計的訓練環境也不足以讓一個端到端的深度學習模型學會安全駕駛汽車。首先,這就是L5 自動駕駛還沒有完全實現的原因。其次,最先進的自動駕駛系統主要是符號模型,它們使用深度學習將這些人工設計的模型與傳感器數據連接起來。所以如果深度學習可以泛化的話,我們在 2016 年就應該擁有了 L5 自動駕駛,并且它采用一種大型神經網絡的形式。

從 AlphaGo 到具有人類智慧的 AI 究竟有多遠?Fran?ois Chollet 有了一些新想法

自動駕駛汽車的發展比許多人預測的要慢得多。圖片來自Vjeran Pavic / The Verge

問:最后,考慮到您所說的當前人工智能系統的限制,似乎有必要問一下對于「一個非常強大的 AI 在未來將會給人類帶來毀滅性的傷害」的「超級智能恐懼論」,您認為這種擔憂合理嗎?

Chollet:不,我認為關于超級智能的論述是沒有根據的。我們從未創造過一個自主的智能系統,也絕對沒有跡象表明我們能夠在不遠的將來創造一個。(這也并不是當前人工智能的發展方向。)而且如果我們真的在遙遠的未來創造了一個這樣的系統,我們也完全沒有辦法推測它會具備什么特征。用一個比喻來說,這有點像在 1600 年問:「彈道學進展很快!所以,如果我們有一門可以摧毀整個城市的大炮會怎么樣呢,我們如何確保它只會殺掉壞人?」這是一個相當畸形的問題,在對我們所討論的系統尚缺乏任何知識的情況下進行辯論,這個問題充其量只是一個哲學爭論。

這種「超級智能恐懼論」有一個很大的問題是它們掩蓋了今天人工智能有可能變得相當危險這一事實。并非AI 系統實現了超級智能才能證實 AI 應用潛藏著危險。我此前寫過關于使用人工智能來實現算法宣傳系統的文章,也有其他人寫過算法偏見、在武器系統中使用人工智能,或者把人工智能當作極權主義的控制工具的文章。

有一個關于 1453 年君士坦丁堡被圍困的故事,講的是當這座城市與奧斯曼軍隊作戰時,它的學者和統治者卻在爭論天使的性別。這個故事告訴我們,我們投入越多的精力和注意力討論天使的性別,或者假設超級人工智能的價值取向時,我們處理人工智能技術當下存在的現實而緊迫的問題的精力和注意力就越少。現在,有一個出名的技術領導者喜歡把超級人工智能描繪成對人類生存的威脅。好吧,雖然這些想法能夠極大地吸引媒體的注意,但卻并沒有討論在我們的道路上那些部署不夠準確的、會導致交通事故和生命損失的自動駕駛系統所引發的道德問題。

問:如果一個人接受這些評論,即目前這些恐懼還沒有技術基礎作為支撐,那么您認為為什么超級智能的論述如此受歡迎呢?

Chollet:最后我只能說,這是一個好故事,而人們往往會被好故事所吸引。它與末世宗教的故事相似并不是巧合,因為宗教故事會隨著時間的推移而不斷演變并且會經過人們一再挑選,以與人們產生強烈的共鳴并有效傳播。出于同樣的原因,你也可以在科幻電影和小說中找到這種論述。這種論述被用在小說里,與它跟宗教故事相似以及作為一種理解人工智能發展方向的方式而流行起來的原因都是一樣的:它是一個好故事,而人們需要故事來理解這個世界。人們對這些故事的需求,遠遠超過對理解「智慧」的本質或理解推動技術進步的因素的需求。

via https://www.theverge.com/2019/12/19/21029605/artificial-intelligence-ai-progress-measurement-benchmarks-interview-francois-chollet-google

來源 | 雷鋒網

]]>
http://www.dreamadream.cn/%e4%bb%8e-alphago-%e5%88%b0%e5%85%b7%e6%9c%89%e4%ba%ba%e7%b1%bb%e6%99%ba%e6%85%a7%e7%9a%84-ai-%e7%a9%b6%e7%ab%9f%e6%9c%89%e5%a4%9a%e8%bf%9c%ef%bc%9ffrancois-chollet-%e6%9c%89%e4%ba%86%e4%b8%80/feed/ 0
周杰倫cos油畫、鋼鐵俠穿越,北大微軟新方法讓換臉更驚艷 http://www.dreamadream.cn/%e5%91%a8%e6%9d%b0%e4%bc%a6cos%e6%b2%b9%e7%94%bb%e3%80%81%e9%92%a2%e9%93%81%e4%be%a0%e7%a9%bf%e8%b6%8a%ef%bc%8c%e5%8c%97%e5%a4%a7%e5%be%ae%e8%bd%af%e6%96%b0%e6%96%b9%e6%b3%95%e8%ae%a9%e6%8d%a2/ http://www.dreamadream.cn/%e5%91%a8%e6%9d%b0%e4%bc%a6cos%e6%b2%b9%e7%94%bb%e3%80%81%e9%92%a2%e9%93%81%e4%be%a0%e7%a9%bf%e8%b6%8a%ef%bc%8c%e5%8c%97%e5%a4%a7%e5%be%ae%e8%bd%af%e6%96%b0%e6%96%b9%e6%b3%95%e8%ae%a9%e6%8d%a2/#respond Tue, 07 Jan 2020 02:48:28 +0000 https://new.openi.org.cn/%e5%91%a8%e6%9d%b0%e4%bc%a6cos%e6%b2%b9%e7%94%bb%e3%80%81%e9%92%a2%e9%93%81%e4%be%a0%e7%a9%bf%e8%b6%8a%ef%bc%8c%e5%8c%97%e5%a4%a7%e5%be%ae%e8%bd%af%e6%96%b0%e6%96%b9%e6%b3%95%e8%ae%a9%e6%8d%a2/ 換臉效果不夠真實,能讓你看出破綻?看看北大和微軟的研究者如何生成更加真實的換臉效果,如何解決遮擋、光線等各種問題。

換臉是非常吸引人的一種應用,開發者可以用 VAE 或 GAN 做出非常炫酷的效果。一般而言,換臉會將 A 臉特征換到 B 臉上,同時保留 B 臉的神情或動態。像 FaceSwap 這樣開源項目已經能生成非常真實的假臉視頻,不過仔細看看仍然會發現有的地方存在模糊,有的地方轉換不太自然。

那么怎樣才能生成轉換更自然,效果更真實的換臉視頻?這就是這篇論文的研究目的,研究者新模型不僅感官上更真實,同時還保留了比其它前沿方法更多的個人特征。

下面我們先看看效果:

研究者同時從網絡上下載人臉圖像以展示 FaceShifter 的強大能力。如圖 11 所示,新方法可以處理不同情況下(如夸張的動作、非常見光照以及極其復雜的面部遮擋)的人臉圖像。

研究者此次提出了一種新型的兩段式框架——FaceShifter。這個框架可以完成高保真的換臉過程,在面部有遮擋時依然可以很好地工作。不像那些只利用有限信息就完成換臉任務的框架,該框架中的第一部分就自適應地整合了目標圖像的所有屬性以生成高保真的換臉圖片。

此外,研究者提出了一種新型的屬性編碼器以提取人臉圖像的多級屬性,同時提出了一種基于 Adaptive Attentional Denormalization (AAD) 的新型生成器,自適應地整合人臉合成時所需的特征和屬性。

為了解決臉部遮擋的問題,研究者在框架中加入了第二部分——Heuristic Error Acknowledging Refinement Network (HEAR-Net)。這個網絡通過自監督的方式,在沒有人工標注的情況下實現異常區域的修復。

下面,讓我們看看這種高逼真度的換臉到底是怎么樣的。

論文:FaceShifter: Towards High Fidelity And Occlusion Aware Face Swapping

論文地址:https://arxiv.org/pdf/1912.13457.pdf

換臉的缺陷與改進

換臉技術就是將目標圖像中人臉的面部特征替換為源圖像人臉的對應部分,同時還要保留一些如頭部動作、臉部表情、光線、背景等基本屬性。由于這一技術在電影合成、電腦游戲以及隱私保護等方面有很廣泛的應用前景,這一技術已經廣泛引起了視覺和圖像領域的關注。

最近,基于 GAN 的一些工作已經取得了很不錯的結果。但是,如何生成真實且保真的圖像依舊是個很大的難題。
因此我們這項工作的重點之一就是提高換臉后圖像的保真度。為了讓結果在感官上更具吸引力,如何讓合成的換臉圖像無縫融入新臉,同時保持原有姿勢表情,這就是我們要研究的重點。也就是說,換臉圖像的渲染應當忠于目標圖像的光線(方向,強度,顏色等),被交換的臉也應該跟目標圖像有相同的分辨率。

這些都不是僅僅 Alpha 或是 Poisson 混合能夠解決的,我們真正需要的是讓換臉過程可以自適應地繼承目標圖像完整屬性信息,這樣目標圖像的屬性(亮度、分辨率等)就可以讓換臉后的圖像變得更加真實。

然而,以前的方法要么忽略了這一需求,要么就是無法自適應或者完整地集成這些信息。具體來說,以往的許多方法僅利用目標圖像的姿態和表情來指導換臉過程,然后利用目標人臉 Mask 將人臉混合到目標圖像中。這一過程容易產生一些缺陷,因為:

1)在合成換臉圖像時,除了姿態和表情外,對目標圖像的了解很少,很難保證場景光照或圖像分辨率等目標屬性不發生變化;2)這樣的混合將丟棄位于目標 Mask 外部的源面部特征。

因此,這些方法不能保持源標識的面形,我們在圖 2 中展示了一些典型的失敗案例。

圖 2:之前方法在 FaceForensics++數據集上的失敗案例
 
為了實現高保真的人臉交換結果,在框架的第一階段,我們設計了一個基于 GAN 的網絡以對目標屬性進行徹底的自適應集成,并稱之為自適應嵌入集成網絡(Adaptive Embedding Integration Network,AEI-Net)。我們對網絡結構做了兩個改進:

1)我們提出了一種新的多級屬性編碼器,用于提取各種空間分辨率下的目標屬性,而不是像 RSGAN[28] 和 IPGAN[5] 那樣將其壓縮成單個向量;

2)提出了一種有 Adaptive Attentional Denormalization(AAD) 層的新型生成器器,該發生器自適應地學習了在何處集成屬性以及特征的嵌入。與 RSGAN[28]、FSNet[27] 和 IPGAN[5] 的單級集成相比,這種自適應集成為結果帶來了相當大的改進。

通過這兩個改進,我們提出的 AEI-Net 可以解決圖 2 中光照不一致和人臉形狀不一致的問題。

此外,處理面部的遮擋一直是換臉的挑戰。Nirkin 等人的方法中對人臉進行分割并訓練以使其能感知到臉部的遮擋部分,我們的方法可以以一種自監督的方式學習恢復人臉異常區域,而且不需要任何人工標注。我們觀察到,當把同一張人臉圖像同時作為目標圖像和源圖像,并輸入到一個訓練良好的 AEI 網絡時,重建的人臉圖像跟輸入圖像有多處改變,這些改變所在的位置基本上就是臉部遮擋的區域。

因此,我們提出了一種新的 Heuristic Error Acknowledging Refinement Network (HEAR-Net),在這種重構誤差的指導下進一步精化結果。重要的是,這個方法不止是能修正臉部遮擋,它還可以識別很多其他的異常類型,如眼鏡、陰影和反射效應。

我們提出的兩段式換臉框架 FaceShifter 與場景無關。一旦訓練完成,該模型就可以應用于任何新的人臉對,而不需要像 DeepFakes 和 Korshunova 等人的 [21] 那樣找特定的受試者訓練。實驗結果表明,與其他先進的方法相比,我們的方法獲得的結果更真實、更可靠。

FaceShifter 模型什么樣

我們的方法需要輸入兩張圖像——提供人臉特征的源圖像 X_s 以及提供動作、表情、光線、背景等屬性的目標圖像 X_t。最終的換臉圖像是通過兩段式框架 FaceShifter 生成的。在第一階段中, 我們的 AEINet 自適應地基于集成信息生成了一個高保真的換臉結果


。在第二階段,我們使用 Heuristic Error Acknowledging Network (HEARNet) 來處理面部遮擋,并對結果進行改進,最后的結果用

表示。
自適應嵌入集成網絡(Adaptive Embedding Integration Network)
在第一階段,我們希望生成一個高保真(擁有源圖像 X_s 特征,且保留目標圖像 X_t 動作等屬性)的人臉圖像。為了達到這一目標,我們的方法包含三個模塊:
i)從源圖像中抽取特征的特征編碼器 z_id(X_s);
ii)從目標圖像 X_t 抽取屬性的多級屬性編碼器 z_att(X_t);
iii)基于 Adaptive Attentional Denormalization (AAD) 生成換臉圖像的生成器。

啟發式誤差修正網絡(Heuristic Error Acknowledging Refinement Network)
盡管 AEINet 第一階段的換臉結果
已經能很好的獲取目標圖像的動作、表情、光照等屬性,但是當目標臉部圖像 Xt 中對臉部有遮擋時,這種遮擋就很難被繼承下來。為了解決這個問題,過去的一些方法 [30,29] 加入了一個新的臉部分割網絡。這個網絡的訓練數據需要進行大量標注(哪一部分有遮擋),而且這種有監督方式可能很難識別出未知的遮擋方式。

對于面部遮擋問題,我們提出了一種啟發式的方法。如圖 4(a) 所示,當目標圖像中的臉被遮擋時(頭發或是帽子上的鐵鏈),有一部分遮擋會在換臉過程中小時。同時,我們發現,就算我們把同一張圖同時作為源圖像和目標圖像輸入給訓練好的 AEI-Net,這種遮擋還是會在重建的圖像中消失。此時這種輸出與輸入的誤差,就可以作為我們定位面部遮擋的依據,我們把這種依據叫做輸入圖像的啟發式錯誤,因為這個誤差啟發性的表征了異常發生的位置。

實驗效果怎么樣

與過去方法的比較

1. 定性對比

圖 5 展示了我們在 FaceForensics++數據集上與 FaceSwap [2], Nirkin et al. [30], DeepFakes [1] 和 IPGAN [5] 的比較。

圖 6 則展示了我們的方法與最新方法 FSGAN 的對比。
 

由于 FaceSwap [2], Nirkin et al. [30], DeepFakes [1] 和 IPGAN [5] 的策略都是先生成臉部區域圖像,然后將其嵌入到目標臉中,我們可以從比較中明顯的看出這些方法的嵌入誤差。

這些方法生成的所有人臉與其目標人臉有著完全相同的人臉輪廓,而且源人臉的形狀也被忽略了(圖 5 第 1-4 行及圖 6 第 1-2 行)。除此之外, 他們的研究結果一定程度上忽略了目標圖像的一些重要信息,如光照(圖 5 第 3 行,圖 6 第 3 – 5 行),圖像分辨率(圖 5 第 2 行和第 4 行)。由于 IPGAN[5] 的矩陣只描述了單一級別的屬性,因此其所有樣本都顯示出了分辯率下降的問題。同時,IPGAN 也不能很好地保存目標面部的表情,如閉上的眼睛(圖 5 第 2 行)。

我們的方法很好地解決了所有這些問題,實現了更高的保真度——保留了源人臉(而非過去的目標人臉)的臉部輪廓,且保證了目標圖像(而非過去的源人臉)的光線與圖像分辨率。我們的方法在處理面部遮擋問題上的表現甚至可以超過 FSGAN [29]。

2. 定量對比

我們使用不同的人臉識別模型 [41] 提取特征向量,并采用余弦相似度來度量特征差距。我們從 FaceForensics++的原始視頻中為每個測試集中的換臉結果匹配了一張最接近的臉,以檢查這張臉是否屬于正確的源視頻。表 1 中的 ID 就是使用該方法獲得的平均準確率,這個方法可以用來測試特征保留能力。我們提出的框架獲得了更高的 ID 分數,且檢索范圍很大。

3. 人為評估

我們做了三次用戶調研,以評測本模型的表現。我們讓用戶從以下選項中選擇:i)與源臉最相似的圖像;ii)與目標圖像有最相似動作、表情、光照的圖像;iii)最真實的圖像。

表 2 展示了每個方法在其研究中的平均被選取率。這個結果現實我們的模型在大范圍上超過了其余三個模型。

框架分析

圖 7:AEI-Net 與三個 baseline 模型的對比結果
 

圖 8:在不同特征級上,AAD 層中基于注意力機制的 Mask Mk 可視化。
圖 9:基于屬性嵌入的查詢結果
 
圖 10:第二階段中修正結果展示了 HEAR-Net 在各種誤差(遮擋、反光、動作微移、顏色)上的強大能力。
來源 | 機器之心
]]>
http://www.dreamadream.cn/%e5%91%a8%e6%9d%b0%e4%bc%a6cos%e6%b2%b9%e7%94%bb%e3%80%81%e9%92%a2%e9%93%81%e4%be%a0%e7%a9%bf%e8%b6%8a%ef%bc%8c%e5%8c%97%e5%a4%a7%e5%be%ae%e8%bd%af%e6%96%b0%e6%96%b9%e6%b3%95%e8%ae%a9%e6%8d%a2/feed/ 0
首個“AI面試法案”在美國伊利諾斯州實施,保護面試者的權利就這么簡單? http://www.dreamadream.cn/%e9%a6%96%e4%b8%aaai%e9%9d%a2%e8%af%95%e6%b3%95%e6%a1%88%e5%9c%a8%e7%be%8e%e5%9b%bd%e4%bc%8a%e5%88%a9%e8%af%ba%e6%96%af%e5%b7%9e%e5%ae%9e%e6%96%bd%ef%bc%8c%e4%bf%9d%e6%8a%a4%e9%9d%a2/ http://www.dreamadream.cn/%e9%a6%96%e4%b8%aaai%e9%9d%a2%e8%af%95%e6%b3%95%e6%a1%88%e5%9c%a8%e7%be%8e%e5%9b%bd%e4%bc%8a%e5%88%a9%e8%af%ba%e6%96%af%e5%b7%9e%e5%ae%9e%e6%96%bd%ef%bc%8c%e4%bf%9d%e6%8a%a4%e9%9d%a2/#respond Fri, 03 Jan 2020 03:02:08 +0000 https://new.openi.org.cn/%e9%a6%96%e4%b8%aaai%e9%9d%a2%e8%af%95%e6%b3%95%e6%a1%88%e5%9c%a8%e7%be%8e%e5%9b%bd%e4%bc%8a%e5%88%a9%e8%af%ba%e6%96%af%e5%b7%9e%e5%ae%9e%e6%96%bd%ef%bc%8c%e4%bf%9d%e6%8a%a4%e9%9d%a2/ 隨著 AI 技術逐漸發展、大眾以及企業對 AI 的了解越來越多,也有越來越多的企業嘗試讓 AI 參與到公司的決策中來,比如參與到招聘中。AI 算法可以做的事有很多,包括招聘廣告的定向推廣、簡歷篩選,乃至在視頻面試中分析面試者的面部表情。

不過這整個過程對面試者來說都是不透明的,被算法評價的一方并不知道系統是如何分類、打分、排序的。除了面試者一方不知情之外,算法是否會引入額外的偏見、讓面試過程變得不公平也是有疑問的。美國伊利諾斯州從 2020 年 1 月 1 日起實施的“人工智能視頻面試法案”(Artificial Intelligence Video Interview Act)就打算開始插手這個過程。

這個法案是美國所有的州中首個實施的此類法案。法案的目標是讓面試者對這些基于 AI 的面試工具的運轉情況有更多了解。具體來說這個法案有三項基本要求:

  1. 如果企業要使用 AI 工具評價面試者和某個職位的匹配程度,那么企業必須明確告知面試者。
  2. 企業還需要向面試者解釋這些 AI 工具是如何運行的,以及這些工具會把哪些常見性格特點作為評判依據
  3. 要保護面試者的隱私,只有具備足夠的專業知識或者技術知識的人才可以在面試后回看面試錄像,而且如果面試者提出了要求,那么企業必須在提出要求的一個月內刪除這個面試者的所有視頻。

這項法案看起來是積極的一步,但實際上,這個法案針對的 AI 種類非常有限,而且也沒有對企業如何使用 AI 提出任何要求,很難說這個法案的實施能起到多大程度的實際作用。

關注科技運用與人權之爭的非盈利組織 Upturn 的高管 Aaron Rieke 對媒體表示:“對整個招聘流程來說,這能起到的作用很小。”法案談到了用來分析視頻的 AI 工具,但用來評價面試者的 AI 工具遠不止和視頻分析相關的那些。而且法案也沒法確保當你要求不要讓 AI 工具評價你的時候,企業是否還會公正地考慮你是否符合職位。“所以,如果你要求法案中的權利,所需要付出的代價是可能完全不會再被企業考慮的話,這個法案就起不到多大作用了。”除此之外,企業對 AI 工具的解釋也可能是寬泛的、高度抽象的,并不能幫助面試者建立更好的理解。

來源 | 雷鋒網

]]>
http://www.dreamadream.cn/%e9%a6%96%e4%b8%aaai%e9%9d%a2%e8%af%95%e6%b3%95%e6%a1%88%e5%9c%a8%e7%be%8e%e5%9b%bd%e4%bc%8a%e5%88%a9%e8%af%ba%e6%96%af%e5%b7%9e%e5%ae%9e%e6%96%bd%ef%bc%8c%e4%bf%9d%e6%8a%a4%e9%9d%a2/feed/ 0
昇騰路標,AI路口:2020給智能世界另一個選擇 http://www.dreamadream.cn/%e6%98%87%e8%85%be%e8%b7%af%e6%a0%87%ef%bc%8cai%e8%b7%af%e5%8f%a3%ef%bc%9a2020%e7%bb%99%e6%99%ba%e8%83%bd%e4%b8%96%e7%95%8c%e5%8f%a6%e4%b8%80%e4%b8%aa%e9%80%89%e6%8b%a9/ http://www.dreamadream.cn/%e6%98%87%e8%85%be%e8%b7%af%e6%a0%87%ef%bc%8cai%e8%b7%af%e5%8f%a3%ef%bc%9a2020%e7%bb%99%e6%99%ba%e8%83%bd%e4%b8%96%e7%95%8c%e5%8f%a6%e4%b8%80%e4%b8%aa%e9%80%89%e6%8b%a9/#respond Fri, 03 Jan 2020 02:53:28 +0000 https://new.openi.org.cn/%e6%98%87%e8%85%be%e8%b7%af%e6%a0%87%ef%bc%8cai%e8%b7%af%e5%8f%a3%ef%bc%9a2020%e7%bb%99%e6%99%ba%e8%83%bd%e4%b8%96%e7%95%8c%e5%8f%a6%e4%b8%80%e4%b8%aa%e9%80%89%e6%8b%a9/ 2019年,我們在暢想什么樣的未來?

城市中的智能視覺體系隨時保障著每個人的安全;自動駕駛汽車暢通無阻;AI幫我們研制出攻克絕癥的新藥;在浩瀚星空中找到能源甚至生命……所有這些,是我們每個人的夢境。2019年這些景象似乎依舊很遠,但這一年,改變確實正在發生。

機器視覺、自動駕駛、AI生物研究,這些指向未來的關鍵技術,都將來自AI的不斷探索;而AI能夠發展,又將建立在智能算力的牢固地基之上;而智能計算的根源,是AI芯片。

今天,AI芯片很可能是未來一個科技發展周期的軸心,已經成為了眾人皆知的常識。而這個產業到底發生了哪些改變,在2019年有哪些進展,可能并不完全為大眾所知。

事實上,在AI所需的訓練+推理全流程里,能夠提供核心芯片支撐的企業非常稀少。而與歷史上數次芯片迭代所不同的是,這次能夠提供核心芯片的名單里,有了中國玩家的身影。

2018年10月,華為發布了昇騰系列芯片,這標志著華為AI戰略正式拉開帷幕。而當2019即將過去,昇騰度過了走入現實世界的第一個365天,在盛大的誕生日之后,它都做了什么?影響了什么?改變了什么?

讓我們以AI芯片的全球產業局勢為開端,一起梳理一下“昇騰紀”帶來的全場景AI元年。

回憶結束時我們會發現,AI世界不僅迎來了一個芯片系列,更是迎來了一條新的道路,一個新的選擇。

時代的分野

從經典計算,到圖像計算、移動處理器,芯片的發展史告訴我們,每個新類型芯片的創生周期里,一般都只會留存兩到三家最終的芯片提供商。而另一個事實是,大型芯片的提供商往往都來自美國。

2012年,英偉達的工程師偶然間發現了GPU與深度神經網絡的耦合性,為英偉達打開了一個無比誘人的“蛋糕倉庫”。2017年,重磅投入AI技術的谷歌,用TPU補完了AI芯片這一關,并將之作為谷歌云的殺手锏之一。這也是在華為發布昇騰之前,唯二的兩家AI訓練芯片提供商。

而當AI技術開始為全球共同關注,有可能改變各個產業的生產方式時,剛進入這個領域的開發者與企業,會發現芯片算力的選擇如此之少。TPU只能基于谷歌云調用,并且排隊艱難。而英偉達的推理和訓練用顯卡都是標準的“緊俏商品”,一般開發者很難買到。甚至有了開發者苦英偉達久矣的說法。

而2019年的另一些事實告訴我們,一味依靠美國芯片是有風險的,尤其在AI算力需要注入各行各業這個前提下。
假如故事如CPU和GPU時代一樣發展,那么最終可能又是一個美國領先、其他國家等待模仿的劇本。AI之路可能會像PC和互聯網一樣,讓中國開發者首先學會的是等待。

然而在時代的洪流靜靜流淌時,突然一個新的岔路產生了。華為發布了昇騰系列處理器,讓AI處理器提供商的數量從二變成了三。所謂“三生萬物”,一個新的參與者,代表著一系列新的選擇。

比如說,英偉達的AI芯片是從顯卡業務而生,它的產業思路都基于顯卡體系,不覆蓋開發框架和開發工具;而谷歌的TPU圍繞谷歌云服務,無法進入邊緣、終端場景。與二者相異,華為作為網絡、計算、存儲多領域的技術貫通企業,在業內首先提出了“全棧全場景AI”,基于達芬奇架構,讓AI算力貫穿從芯片到算法開發的所有流程,覆蓋從訓練到推理的所有場景,這直接指向現實的AI應用和開發場景。于是,我們從昇騰的路標看去,能看到其他企業未曾抵達過的遠方。

在全球AI基座的視野里,昇騰是一個新的選擇,而且是一個完全不同的選擇。

Portfolio的力量

如果說2018年昇騰的出世,給智能計算產業標明了一個新的方向。那么當時針撥動到2019,昇騰的商用化進展就是順延這個方向做出了真實的進展。一條AI之路在算力迷霧中顯露了出來。

昇騰的2019,可以由底座到應用,分成三個階段來闡述:即算力底座、產業平臺,與生態應用。

在底座層面,這一年中的核心事件就是昇騰910處理器投入商用。在此之前,應用于AI推理場景的昇騰310處理器以及打下了堅實的產業基礎,構筑了Atlas智能計算平臺這個產業樞紐。而AI領域真正的重型武器——訓練芯片,則讓昇騰算力基座進入了全棧完整形態,構建了真正的Portfolio。

2019年8月,華為正式發布昇騰910處理器,并且宣布昇騰910和Mindspore開發框架隨即進入商用。這一款AI處理器代表著業內最強的AI算力,也代表著華為已完成全棧全場景AI解決方案(Portfolio)的構建。昇騰910的出現,對整個AI產業來說帶來了三個實際改變:

1、AI訓練算力極限被突破,算力能夠更輕易、更低成本被獲取。

2、昇騰系列的全場景打通,構筑了云邊端一體化AI的全新可能。

3、全棧AI,提供給開發者和應用者更優質的開發效率,導致產業智能化的耦合加速發生。

全棧全場景AI的力量,在2019年真實注入了AI產業世界。而在這重力量之上,華為又凝結出了智能計算面向千行百業、全棧全場景的產業支撐。

Atlas的底座

作為一系列AI處理器,昇騰310和910投入產業應用中,需要具象化成具體的產業形態,而這一過程并不是簡單的封裝和調參。各行業、各場景不同的智能化需求,以及配套產生的不同基礎設施缺口,意味著智能計算產品必須具備多元性、產業性,以及全場景適配的特點,以此解決不同場景、不同需求下的AI算力適配。

而這一缺口,也恰恰是英偉達和谷歌都無法填補的,其中需要大量ICT技術和商業理解作為引擎,這也給了華為機會與責任。華為在2019年給出的答案,叫做Atlas。

2019年4月,在智能計算大會深圳站,華為Atlas人工智能計算平臺正式發布,開啟了Atlas商用和規模銷售的進程。
Atlas的名字來源于古希臘神話中托起宇宙的大力神。Atlas平臺包括多款能夠使用不同場景、不同需要的智能計算產品,它的全面性與多樣化,恰好對應了托起AI天空的意向。在4月首批上市的Atlas產品,主要基于昇騰310提供的AI推理能力,主要包括Atlas 200 AI加速模塊、Atlas 300 AI加速卡、Atlas 200 DK AI開發者套件、Atlas 500智能小站四款產品,能夠覆蓋邊端側多個場景,實現AI算力的全面覆蓋。

而在9月18日的華為全聯接大會上,華為副董事長胡厚崑重磅發布了全球最快AI訓練集群Atlas 900,這款產品匯聚了華為數十年的技術積淀,是當前全球最快的AI訓練集群。Atlas 900由數千顆昇騰910 AI處理器互聯構成,總算力達到256P~1024P FLOPS @FP16,相當于50萬臺電腦的計算能力。Atlas 900的問世,標志著華為智能計算正式進入“重武器”時代,形成了從訓練到推理的完整AI算力布局。同時,Atlas家族也加入了基于昇騰910處理器的訓練卡Atlas 300及AI訓練服務器Atlas 800。

2019年,產業價值獨特,技術差異化明顯的Atlas系列產品也收獲了一系列榮譽。比如在3月,華為“Atlas 300 AI加 速卡”及“Atlas 500智能小站”憑借全新的設計理念,榮獲了著名的紅點設計大獎。6月在在東京舉行的Interop展會,經IT權威專家多項目嚴格評審,華為Atlas 500智能小站憑借 “超強AI算力、云邊協同、邊緣部署”等特性,獲得了2019 Interop東京展Best of Show Award大獎。

短短一年間,Atlas經歷了商用發布、產業補完,以及行業認可的全過程。而更重要的,是這一年中Atlas已經將智能計算的應用價值推進到了產業中,讓行業生態體驗到了昇騰帶來的全新選擇。

千行百業的智慧涌動

與任何技術一樣,AI的最終評價標準是要落進現實。從昇騰到Atlas,下一站是千行萬業的智能應用。在2019年,昇騰并沒有讓觀眾等待,而是拿出了一系列具有充分想象力的智能驅動案例。

比如在全聯接大會上,華為與上海天文臺合作,在天文界著名的SKA項目中,用Atlas 900來作為新的智能計算支持。這一合作改變了天文界的效率規則,以SKA所拍攝的20萬顆星體數據為例。一位天文學家需要169天才能完成的星體搜索,Atlas 900只需要10秒就可以完成。從天文開始,地址勘探、能源探索、計算,這些AI面前最重的挑戰,正在被昇騰和Atlas一個個解開。

在我們的生活中,也有大量產業正在被Atlas所改變。比如遙感、智能安防、質檢等諸多領域都能看到Atlas200、300等產品的身影。眾多產業正在被AI所改變,比如一個令人印象深刻的案例,是2019年9月,南方電網深圳供電局與華為共同發布了基于昇騰的電網創新方案。通過“以系統智能分析為主、人工判斷為輔”的新模式,原本需要20天才能完成的現場巡視工作,輸電監控指揮中心現在僅需2小時就可完成,巡檢效率提高了80倍,真實改變了產業生產效率。

在2019年臨近尾聲時,昇騰和Atlas又帶來了一個重磅消息。11月29日,華為與鵬城實驗室在深圳共同發布了鵬城云腦Ⅱ一期。被稱為“AI國家隊”的鵬城實驗室,將使用Atlas 900作為云腦Ⅱ的計算底座,從而使云腦Ⅱ邁進千P級算力。從而為計算機視覺、自然語言、自動駕駛、智慧交通、 智慧醫療等各類基礎性研究提供全新的智能計算基礎。
在應用之外,華為還在2019年積極推進了基于昇騰和Atlas的生態建設。以開發者大會、產學研合作等方式,將昇騰的魅力對外開放,引導開發者和研究者探索昇騰的使用場景,用AI創造更多價值。在11月5日,HUAWEI ECO-CONNECT EUROPE 2019上,華為正式發布基于昇騰的歐洲AI生態計劃。宣布未來5年投入1億歐元,與產業組織、20萬開發者,500家 ISV 伙伴、50所研究機構與大學共同啟動歐洲AI生態計劃。這意味著昇騰的生態之旅已經開啟了全球性布局,為全球共同的AI之路提供新的可能。

回顧2019年帶來的改變,AI開發者應該有很多感慨。如果AI世界沒有昇騰和Atlas系列,那么開發者和各行業應用者、學生研究者,都只能去適應AI算力稀缺、開發兼容性不強的開發環境。換言之,2019年“昇騰紀”的開啟,讓眾多開發者不用再去適應苛刻的AI環境,而是讓AI基礎設施去適配自己的需求與夢想。

規則被撬動,改變已到來。

在“昇騰-Atlas-千行萬業”這條AI之路被打通之后,眾多產業的智能化進程將被改寫,開發者的腦洞基礎可能被改寫和顛覆。這是一個時代的分野,是智能時代的另一個選擇。

8月,在2019上海世界人工智能大會中,科技部宣布將依托華為建設基礎軟硬件國家新一代人工智能開放創新平臺,面向各行業、初創公司、高校和科研機構等的AI應用與研究,以云服務和產品軟硬件組合的方式,提供全流程、普惠的基礎平臺類服務。

基礎軟硬件平臺是AI的基座與必經之路,也是全球AI發展中的戰略高點。華為是目前國內唯一具備全棧全場景AI能力的廠商,其在“AI國家隊”扮演的角色,恰好能說明昇騰處理器與智能計算產業的關鍵價值。

“華為在通用計算和AI計算領域堅持戰略投入,持續創新,通過解決世界級計算技術難題,為世界提供最強算力。”——這句昇騰的諾言,在2020已經不是將來時。

來源 | 億歐網

]]>
http://www.dreamadream.cn/%e6%98%87%e8%85%be%e8%b7%af%e6%a0%87%ef%bc%8cai%e8%b7%af%e5%8f%a3%ef%bc%9a2020%e7%bb%99%e6%99%ba%e8%83%bd%e4%b8%96%e7%95%8c%e5%8f%a6%e4%b8%80%e4%b8%aa%e9%80%89%e6%8b%a9/feed/ 0
主站蜘蛛池模板: 亚洲精品一区二区三区四区 | 亚洲精品久久婷婷丁香51 | 欧美一级全黄 | 欧美国产激情二区三区 | 久久精品欧美一区二区三区不卡 | 国产精品尤物 | 久久精品亚洲精品 | 999精品国产人妻无码系列久久 | 亚洲国产精品久久久久久网站 | 又黄又爽免费无遮挡在线观看 | 久久好在线视频 | 久久乐国产精品 | 国产成人综合在线观看网站 | 欧美高清成人 | 亚洲一区二区免费看 | 欧美日日操 | av在线电影网址 | 韩国三级午夜理伦三级三 | 日本午夜大片免费观看视频 | 欧美视频二区 | 亚洲香蕉毛片久久网站老妇人 | 日本高清香蕉色视频在线观看 | 亚洲精品无码成人A片在线虐 | 欧美一级大片免费观看 | 美女国内精品自产拍在线播放 | 综合精品在线 | 国产精品一区二区久久久久 | 国产麻豆| 欧美日本一 | 欧美午夜一艳片欧美精品 | 国产伦理一区二区三区 | 福利网在线 | 国产精品天天天天影视 | 综合一区二区三区 | 99久久精品国产自免费 | 午夜丰满少妇高清毛片1000部 | 久久久青草 | 欧美浮力影院 | 中文字幕在线一区 | 久久久国产视频 | 天天操天天插 |