發(fā)布時(shí)間: 2017年01月06日
在開始用視頻游戲《我的世界》做研究之前,José Hernández-Orallo就對(duì)它非常熟悉。這位來(lái)自西班牙瓦倫西亞理工大學(xué)的計(jì)算機(jī)學(xué)家曾設(shè)計(jì)了機(jī)器智能的基準(zhǔn),他第一次看到自己的孩子在三維虛擬世界里玩游戲,該游戲聚焦解決問(wèn)題,而非打怪獸。
2014年,微軟收購(gòu)了《我的世界》,其科學(xué)部門微軟研究讓科學(xué)家可以獲取該游戲的新版本,從而讓計(jì)算機(jī)軟件以及人們可以探索和定制三維環(huán)境。隨后,微軟邀請(qǐng)了包括Hernández-Orallo在內(nèi)的一些外部研究人員下載這個(gè)游戲世界的機(jī)器識(shí)別版本。2015年7月,微軟將游戲向所有人免費(fèi)開放,目標(biāo)是加速人工智能的進(jìn)展。
現(xiàn)在,其他的公司也在跟著做。2016年12月5日,美國(guó)谷歌公司位于英國(guó)倫敦的深層思維開辟了自己的三維虛擬世界——深層思維實(shí)驗(yàn)室,供外部開發(fā)商下載和定制。該公司最初設(shè)計(jì)的這個(gè)虛擬世界旨在訓(xùn)練其人工智能程序。兩天后,舊金山一家科研公司OpenAI也公布了一個(gè)“元平臺(tái)”,使人工智能軟件可以更容易地與數(shù)十個(gè)三維游戲互動(dòng),這些游戲最初的使用對(duì)象是公眾以及一些網(wǎng)頁(yè)瀏覽器和智能手機(jī)應(yīng)用程序,企業(yè)家Elon Musk是該公司聯(lián)合創(chuàng)始人之一。
三家公司均以前所未有的方式向研究人員和軟件開發(fā)商提供更方便的程序測(cè)試方法,并通過(guò)教授他們?cè)陬愃普鎸?shí)世界的新情況下駕駛使程序獲得新技能。“類似這樣的環(huán)境在未來(lái)的人工智能中有著極為重要的作用。”西雅圖華盛頓大學(xué)機(jī)器學(xué)習(xí)研究專家Pedro Domingos說(shuō)。
數(shù)十年來(lái),游戲一直是人工智能的試驗(yàn)臺(tái),但其典型特征是,相關(guān)算式跟隨預(yù)先設(shè)定的策略在運(yùn)算。近年來(lái),注意焦點(diǎn)轉(zhuǎn)向讓機(jī)器根據(jù)其自身經(jīng)驗(yàn)來(lái)學(xué)習(xí)。2015年初,深度思維揭示了一種算法,該算法可以自學(xué)如何將經(jīng)典的雅達(dá)利街機(jī)游戲玩得比人類更好,其方法是通過(guò)試錯(cuò),而不是被告之游戲的目標(biāo)。
不過(guò),類似的游戲是簡(jiǎn)單的二維世界。而類似“第一人稱”《我的世界》的三維視頻游戲可以將玩家嵌入一個(gè)虛擬環(huán)境中,從而與真實(shí)世界更加接近,并形成更加復(fù)雜的試驗(yàn)臺(tái)。
除了操縱以及與預(yù)先設(shè)定的結(jié)構(gòu)進(jìn)行交互之外,《我的世界》的用戶可以使用虛擬磚塊建造特定的結(jié)構(gòu)?,F(xiàn)在,軟件開發(fā)商可以獲得的版本叫作Malmo,它可以讓算式做同樣的事情。例如,Hernández-Orallo正在用它探索環(huán)境是否可以用來(lái)創(chuàng)建機(jī)器智能的基準(zhǔn)。算式可以排列磚塊使其看起來(lái)像一個(gè)特定的物體,或者可以在迷宮中導(dǎo)航,從而可以比圖靈機(jī)驗(yàn)證更廣泛的技能。圖靈機(jī)是機(jī)器智能最著名的測(cè)試,聚焦人工智能像人類一樣的聊天能力。
《我的世界》對(duì)人工智能試驗(yàn)臺(tái)產(chǎn)生如此大吸引力的一個(gè)因素是,它已經(jīng)能夠讓玩家用輸入信息的方式交流。這有助于人工智能學(xué)習(xí)在真實(shí)世界中與人合作,英國(guó)劍橋微軟研究計(jì)算機(jī)學(xué)家Katja Hofmann說(shuō),正是他帶領(lǐng)的團(tuán)隊(duì)建立了Malmo。
虛擬世界對(duì)于開發(fā)旨在最終像物理機(jī)器人一樣操作的人工智能尤其有用,Hofmann說(shuō),因?yàn)槎ㄖ七@樣的環(huán)境價(jià)格更加低廉,而且在真實(shí)世界中也更快、更安全。它們還能讓機(jī)器研究者單純地關(guān)注這個(gè)方程式中的智能部分,而物理機(jī)器人的機(jī)械挑戰(zhàn)可能會(huì)分散注意力。
除了Hernández-Orallo之外,微軟還與一系列正在使用Malmo的研究實(shí)驗(yàn)室合作。但Hofmann推測(cè),還有更多用戶在使用它,用戶可能在100家左右。
深度思維實(shí)驗(yàn)室同樣讓研究人員創(chuàng)建類似迷宮的結(jié)構(gòu),它們的算式可以學(xué)習(xí)收集獎(jiǎng)勵(lì)以及駕駛。深度思維還在嘗試整合“更多的自然元素”,如將地形和植物融入平臺(tái),該機(jī)構(gòu)一名女發(fā)言人稱?,F(xiàn)在,這個(gè)環(huán)境是開放的,該公司希望其他研究人員可以讓環(huán)境對(duì)算式產(chǎn)生更大挑戰(zhàn)?!巴ㄟ^(guò)開源,我們讓更廣泛的研究界參與到環(huán)境塑造中來(lái)?!彼f(shuō)。
OpenAI的變化平臺(tái)被命名為“宇宙”,它將相關(guān)實(shí)驗(yàn)進(jìn)一步向前推進(jìn)。通過(guò)為同樣的人工智能提供多種完全不同的環(huán)境并進(jìn)行抽樣,它有助攻克該領(lǐng)域最艱巨的一個(gè)問(wèn)題:面臨新情況時(shí)創(chuàng)建能夠使用早先經(jīng)驗(yàn)的算式。例如,深部神經(jīng)網(wǎng)絡(luò)模仿了視覺(jué)皮層中的腦細(xì)胞層,可以很快地學(xué)習(xí)三維迷宮導(dǎo)航,但它卻不能將知識(shí)轉(zhuǎn)而用于導(dǎo)航其他迷宮?!叭绻淖兞嗣詫m的顏色,這個(gè)系統(tǒng)就會(huì)迷失?!盚ernández-Orallo說(shuō),“最先進(jìn)的技術(shù)就會(huì)完全失敗?!?/p>
微軟正在讓Malmo可在“宇宙”上獲得?!叭绻幸粋€(gè)社區(qū)平臺(tái),將會(huì)加速每個(gè)成員的發(fā)展?!監(jiān)penAI創(chuàng)始人之一和首席技術(shù)官Greg Brockman說(shuō)。