發(fā)布時間: 2016年11月15日
人工智能(AI)什么時候取得突破?以什么方式取得突破?在過去的兩年里,學(xué)術(shù)界、產(chǎn)業(yè)界和大眾的認(rèn)知都對人工智能進(jìn)行著越來越細(xì)化的描述。實際上,人工智能不僅是發(fā)展火熱的自動駕駛汽車、圖像識別、語音識別,還是非常嚴(yán)肅的理論、數(shù)學(xué)、哲學(xué)、認(rèn)知科學(xué)的綜合。
當(dāng)下的人工智能已經(jīng)被我們簡化到深度神經(jīng)網(wǎng)絡(luò)、人臉識別、圖像識別以及一個個現(xiàn)實的機(jī)器人身上。當(dāng)年提出AI的學(xué)者可以成為圖靈獎得主、信息論創(chuàng)始人和諾貝爾獎得主,他們從最基礎(chǔ)的領(lǐng)域詮釋了對未來人工智能的憧憬,也為人工智能可以在各種產(chǎn)品上進(jìn)行應(yīng)用提供了開創(chuàng)性的理論基礎(chǔ)。
歷史總在往前進(jìn),因為個人計算機(jī)、互聯(lián)網(wǎng)的不斷發(fā)展,大數(shù)據(jù)及計算能力的不斷增強(qiáng),人工智能已經(jīng)迎來第三次發(fā)展浪潮。將來,人類的每一項工作或許都能夠被分解出來,都可以逐步被日益發(fā)展的人工智能所替代。
短期內(nèi)仍要基于大數(shù)據(jù)
人工智能為什么重要?人類在動物界的突破是因為我們對語言的精確掌握,語言能更好地描述世界,描述人和人之間的關(guān)系。
語言和語音相對應(yīng),這些在人工智能里面非常重要。過去兩年當(dāng)中由于越來越多的人接觸運算智能、感知智能和認(rèn)知智能,有些人相信隨著神經(jīng)科學(xué)、腦科學(xué)的發(fā)展,我們可以掌握大腦中的拓?fù)浣Y(jié)構(gòu)和思考規(guī)律,甚至可以用計算機(jī)、量子計算機(jī)來模擬這個過程,這就是腦科學(xué)與人工智能的結(jié)合。
另外,互聯(lián)網(wǎng)和將要到來的物聯(lián)網(wǎng)將給人類帶來大量的數(shù)據(jù),利用大數(shù)據(jù)和現(xiàn)有的神經(jīng)網(wǎng)絡(luò)可以構(gòu)建出大數(shù)據(jù)人工智能,其處理的數(shù)據(jù)維度和數(shù)據(jù)量是人腦不能負(fù)載的。
這兩種思路都需要對人的大腦進(jìn)行進(jìn)一步研究,可能在幾十年之后,科研工作者就能夠指出人工智能的本質(zhì)和實現(xiàn)強(qiáng)人工智能的必由道路,但在最近的五到十年里,人工智能仍會基于大數(shù)據(jù)來運行,工業(yè)上的應(yīng)用紅利將會不斷產(chǎn)生。
科大訊飛在產(chǎn)業(yè)發(fā)展上獲得的進(jìn)步,總結(jié)經(jīng)驗主要有三大因素。第一是深度神經(jīng)網(wǎng)絡(luò);第二是大數(shù)據(jù),大數(shù)據(jù)并不只是規(guī)模比較大,其真正有價值的部分在于實際數(shù)據(jù)和真正應(yīng)用中的數(shù)據(jù)概率分布相同。這在機(jī)器學(xué)習(xí)當(dāng)中是一個非常重要的理論,即訓(xùn)練數(shù)據(jù)概率的分布必須和實際使用中測試的數(shù)據(jù)概率分布相同。另外,利用互聯(lián)網(wǎng)和移動互聯(lián)網(wǎng)的快速迭代,小步快跑的產(chǎn)品優(yōu)化方式可以快速優(yōu)化人工智能系統(tǒng),也就是漣漪效應(yīng)。
利用在工業(yè)界的經(jīng)驗和過去在人工智能技術(shù)方面的積累,科大訊飛在2014年的發(fā)布會上正式提出訊飛超腦計劃,并且提出要瞄準(zhǔn)運算智能、感知智能和認(rèn)知智能當(dāng)中最難的部分——認(rèn)知智能進(jìn)行突破。
努力突破認(rèn)知智能
如何實現(xiàn)認(rèn)知突破?人類的大腦是生物界當(dāng)中的杰作,我們可以在不同的視覺和聽覺之間進(jìn)行切換。利用這樣的框架結(jié)構(gòu),訊飛超腦包括兩個層面的組織:感知層面上的神經(jīng)感知系統(tǒng),上升到概念層面,在概念層面會進(jìn)行最重要的關(guān)于知識的表達(dá)、概念的推理和最后的決策,在做完這些決策以后還要把信息返回到感知層面。
利用這樣的結(jié)構(gòu),科大訊飛結(jié)合過去五六年中在深度神經(jīng)網(wǎng)絡(luò)領(lǐng)域作出的不懈努力,其在國內(nèi)首次將深度神經(jīng)網(wǎng)絡(luò)用于語音識別。科大訊飛在隨后的幾年當(dāng)中將深度神經(jīng)網(wǎng)絡(luò)拓展到語音合成,再到自然語言理解、語言評測、圖像識別等各個方面。
作文是非常復(fù)雜的事,對一篇作文評分不僅要給出多少分?jǐn)?shù),還得給出給這個分?jǐn)?shù)的理由,更要有評語。用機(jī)器學(xué)習(xí)的方法,科大訊飛已經(jīng)使得機(jī)器人找到一種映射關(guān)系,從過去的很多已經(jīng)打過分的作文當(dāng)中找到這種映射,從而讓機(jī)器能夠批改作文,而且準(zhǔn)確度相當(dāng)高。
進(jìn)一步探索
技術(shù)的成果給科大訊飛帶來哪些成績?在今年的暴風(fēng)雪語音合成大賽上,科大訊飛再次獲得第一名,這體現(xiàn)了用深度神經(jīng)網(wǎng)絡(luò)做語音合成的最新進(jìn)展。
科大訊飛作為牽頭單位整合國內(nèi)29家機(jī)構(gòu)參與國家第一個人工智能重大專項——類人答題機(jī)器人。目前科大訊飛用基于CFN框架的語義和簡答題系統(tǒng)進(jìn)行很好的融合,在中文的材料閱讀上取得不錯進(jìn)展。
在人機(jī)交互界面,科大訊飛也有最新進(jìn)展,過去的人機(jī)交互是一個單工交互的系統(tǒng),語音識別、語義理解是分別進(jìn)行的,現(xiàn)在AIUI是多工交互,很多計算機(jī)及智能硬件的用戶用了該系統(tǒng)之后分析,交互的成功率從原來的40%提升到現(xiàn)在的90%以上。
科大訊飛作為一個平臺型的技術(shù)公司,將這些技術(shù)以免費、商用或者VIP的不同形式開放給用戶。因為我們相信,將來中國在本輪人工智能浪潮中一定能夠占據(jù)優(yōu)勢,無論是核心技術(shù)積累還是在互聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)積累的產(chǎn)業(yè)優(yōu)勢,我們可以在中國用人工智能改變世界,而且我們絕不會滿足于只在中國使用人工智能,我們一定能夠把人工智能技術(shù)發(fā)展到世界的更高水平,并且應(yīng)用到生活的方方面面中去。