發(fā)布時間: 2017年03月06日
近日,研究人員開發(fā)的一個人工智能(AI)系統(tǒng),它在終極、無限德州撲克中戰(zhàn)勝了人類。而在幾星期前,另一AI系統(tǒng)則在德州撲克單挑中戰(zhàn)勝了人類。相關(guān)論文近日刊登于《科學(xué)》雜志。
近年來,人工智能獲得數(shù)次突破,在諸如國際象棋和圍棋等游戲中戰(zhàn)勝人類。不過,這些游戲的一個共同特點(diǎn)是,棋手可能有完全信息。但撲克不同,讓這種游戲難得多的原因是每個玩家對可能的玩法有著不對稱的信息。
近日,加拿大阿爾伯塔大學(xué)計算機(jī)系的Matej Morav ík研發(fā)了一個被稱為DeepStack的AI系統(tǒng),它在每3000次無限德州撲克比賽后,具有統(tǒng)計意義地打敗了11名職業(yè)撲克選手中的10名(它也打敗了第11名選手,但結(jié)果不具有統(tǒng)計學(xué)顯著意義)。
研究人員表示,在游戲的每個時間點(diǎn),DeepStack會重新計算游戲策略,而不是將可能玩法計算到最后,它對允許進(jìn)行的玩法深度和類型做了限制。這將可能的決策點(diǎn)從超過10160個減少至大約107個(160和7是上標(biāo)),DeepStack的電腦芯片能在5秒鐘內(nèi)完成決策。
這種AI系統(tǒng)將有助于解決涉及信息不對稱的現(xiàn)實世界問題,例如捍衛(wèi)戰(zhàn)略資源和做出重要的醫(yī)療建議等。