發(fā)布時間: 2017年06月28日
你考慮購買的新家附近有多少個公園?一家餐廳里的最佳晚餐和酒的搭配是什么?回答這些日常問題需要進(jìn)行關(guān)系推理,這種更高級思維的構(gòu)成部分對于人工智能(AI)來說很難操控。現(xiàn)在,谷歌公司深度思維分公司下屬的研究人員設(shè)計了一個簡單的算式來處理類似的邏輯推理——而且它已經(jīng)在一個復(fù)雜成像理解測試中戰(zhàn)勝了人類。
人類在關(guān)系推理——用邏輯聯(lián)系和對比位置、序列及其他實體的一種思維——方面通常較為擅長。但AI的兩個主要種類——統(tǒng)計和符號發(fā)展出類似能力的速度卻很緩慢。統(tǒng)計AI或機器學(xué)習(xí)擅長于模式識別,但卻并不擅長使用邏輯。而符號AI能夠利用已經(jīng)決定的規(guī)則推理關(guān)系,但卻不擅長動態(tài)學(xué)習(xí)。
新研究提出了跨越這一溝壑的方法:一種進(jìn)行關(guān)系推理的人工智能神經(jīng)網(wǎng)絡(luò)。類似于神經(jīng)在大腦中連接的方式,神經(jīng)網(wǎng)絡(luò)會將微小的程序連在一起,通過協(xié)作在數(shù)據(jù)中尋找模式。它們可以擁有處理圖像、剖析語言或者甚至是學(xué)習(xí)游戲的特別架構(gòu)。在這種情況下,新的“關(guān)系網(wǎng)絡(luò)”可以被連接以對比各個場景中的每一對物體。“我們正在明確地讓這個網(wǎng)絡(luò)發(fā)現(xiàn)事物之間存在的關(guān)系?!痹撜撐墓餐髡摺惗厣疃人季S分公司計算機學(xué)家Timothy Lillicrap說。
他和團(tuán)隊用若干任務(wù)驗證了它們的關(guān)系網(wǎng)絡(luò)。第一個網(wǎng)絡(luò)是回答一個單一圖像中事物之間的關(guān)系,如立方體、球和圓柱。例如:“藍(lán)色物體前有一個物體,它的形狀和灰色金屬球右邊藍(lán)綠色的小物體形狀相同嗎?”對于這一任務(wù),關(guān)系網(wǎng)絡(luò)可以與另外兩種神經(jīng)網(wǎng)絡(luò)相結(jié)合:一個是識別圖像中的物體,另一個是解釋問題。在很多圖像和問題上,其他機器學(xué)習(xí)算式的正確率是42%到77%。人類得分是92%。而新關(guān)系網(wǎng)絡(luò)聯(lián)合體的正確率是96%,已經(jīng)超過了人類的推理分?jǐn)?shù),研究人員在近日發(fā)表于預(yù)印本服務(wù)器 arXiv的文章中報告了這一成果。
深度思維團(tuán)隊還在基于語言的一項任務(wù)中測驗了該神經(jīng)網(wǎng)絡(luò),其中它會收到諸如“Sandra撿起足球”“Sandra去辦公室”等表述。隨后它會收到一些問題,如“足球在哪里?”(辦公室)。它在大多數(shù)類型的問題上表現(xiàn)得與多數(shù)AI算式一項出色,而且在所謂的推理問題方面尤其出色。例如,“Lily是一只天鵝。Lily是白色的。Greg是一只天鵝。Greg是什么顏色的呢?”(白色)。對于此類問題,關(guān)系網(wǎng)絡(luò)得分可達(dá)98%,而其競爭者的得分在45%左右。最終,該算式分析了10個球在周圍彈跳的動態(tài)模式,其中一些球被隱形彈簧或木棒連接在一起。關(guān)系網(wǎng)絡(luò)能夠利用這個動態(tài)模式,識別90%以上的連接。它隨后后同樣的訓(xùn)練方法識別移動點及其他為代表的人類形式。
“他們的方法的一個優(yōu)勢是在概念上特別簡單?!奔~約波士頓大學(xué)計算科學(xué)家、并未參與此項研究的Kate Saenko說,她也開發(fā)了一個能夠回答關(guān)于圖像復(fù)雜問題的算式。Lillicrap說,這種簡單性——大多數(shù)進(jìn)展被囊括在一個方程式中——使其能夠與其他網(wǎng)絡(luò)相結(jié)合,正如在物體比較任務(wù)中所做的那樣。論文將此稱為“一種簡單的即插即用模塊”,可讓該系統(tǒng)的其他部分聚焦其擅長之處。
“我對這些結(jié)果感到震撼?!奔又菟固垢4髮W(xué)計算機學(xué)家Justin Johnson說,他共同開發(fā)了物體對比任務(wù)。Saenko 補充說,神經(jīng)網(wǎng)絡(luò)未來有一天將有助研究社會網(wǎng)絡(luò)、分析監(jiān)控錄像或是指導(dǎo)自動化汽車。
為了獲得像人一樣的靈活性,Johnson說,它將需要學(xué)習(xí)回答更多具有挑戰(zhàn)性的問題。做到這一點可能不僅需要對比一組事物,而是要有效地對比三個事物、兩對事物,或是一個更大集合中的幾對事物?!拔覍﹂_發(fā)能夠想出其自身策略的模型非常感興趣?!彼f,“深度思維正在建設(shè)一種特殊的推理模型,那將不是進(jìn)行更加普遍意義上的關(guān)系推理。但目前它依然是朝著正確方向邁出了極重要的一步?!?/p>