發(fā)布時間: 2017年09月07日
當地時間9月2日,華為首個人工智能移動計算平臺——“麒麟970”(Kirin970)在德國柏林國際消費電子展(IFA2017)橫空出世。這在展會現場引來巨大關注的同時,幾乎也讓處在地球另一端的國內業(yè)界沸騰,而相關行業(yè)媒體更是紛紛報道——大家有理由如此興奮,因為此刻談論的可是全球首個“AI Inside”的手機芯片,是人類第一次將人工智能計算單元嵌入到手機芯片這樣的方寸之間。
麒麟970最吸引人目光的當屬其核心人工智能處理單元——為移動端AI設計的計算架構 NPU(Neural Network Processing Unit,神經網絡處理器)。這種獨立的NPU不容小覷,在處理圖像識別等人工智能任務上,NPU的性能密度大幅優(yōu)于CPU和GPU(圖像處理單元)。
人工智能在近年“大火”以來,將專門用于進行AI相關計算的處理單元嵌入手機芯片系統(SoC),是國內外許多芯片廠商夢寐以求的,甚至蘋果公司曾宣布將推出“Apple Neural Engine”(蘋果神經計算引擎)來應對未來移動端的AI應用需求。沒想到,這一次來自中國的華為走在了前面。
全球首個AI inside手機芯片
與寒武紀聯系密切
于半導體芯片發(fā)燒友而言,麒麟970有許多閃光點值得玩味:采用臺積電(TSMC)10nm制程工藝,方寸間集成55億個晶體管,功耗降低20%;配置華為自研升級的相機雙ISP(圖像信號處理單元),支持人臉追焦、場景檢測;采用先進的4.5G LTE技術,支持全球最高LTE Cat.18通信規(guī)格,實現了業(yè)界最高的1.2Gbps峰值下載速率……但最為矚目的,還是首次加入功耗更低、超高性能密度的NPU。
談及NPU對于手機AI計算任務的提升,華為技術有限公司高級副總裁、消費者業(yè)務群CEO余承東在發(fā)布會上自信滿滿:相較于四個Cortex-A73核心,處理相同AI任務,NPU計算架構擁有約 50 倍能效和 25 倍性能優(yōu)勢。
更直觀一點的感受是,根據華為內部測試結果,在沒有NPU時麒麟970每分鐘能處理97張圖像,而集成了NPU后的處理速度是每分鐘2005張圖像。
憑借這樣的表現,NPU可以稱得上是支撐麒麟970智能計算的大腦中樞。
而更為人們津津樂道的是,此番華為得以先人一步在手機SoC上部署NPU,與AI芯片領域的新銳獨角獸公司——寒武紀科技不無關系。
華為發(fā)布麒麟970之初,許多人就開始想象低調的華為是如何在短時間之內生長出將AI計算單元集成到手機芯片上的能力。緊接著,從中科院計算所流出的一封對華為發(fā)布麒麟970計算平臺的賀信讓情勢明朗起來:
“……我所企業(yè)寒武紀公司研制并具有自主知識產權的‘寒武紀1A深度學習處理器’是國際上首個商用深度學習處理器產品,在人工智能應用上達到了四核CPU 25倍以上的性能和50倍以上的能效此次,麒麟970芯片集成寒武紀1A處理器作為其核心人工智能處理單元,實現了手機上本地、實時、高效的智能處理……”
這封賀信在記者所在的一個計算相關討論群組一經發(fā)布后,群內紛紛對寒武紀公司表達贊嘆之意,而記者的微信朋友圈內也出現不少類似信息,其中不乏來自計算所一些接近寒武紀團隊的科研人員。當《中國科學報》記者就此向寒武紀科技創(chuàng)始人、CEO陳天石求證時,他表示“現在還在保密期,要到10月下旬才能公開”。而巧合的是,首款搭載麒麟970的華為Mate10手機也是在10月下旬(16日)面向全球發(fā)布。
強強聯合
這一次中國芯技術領先
事實上,圍繞 AI 任務進行專有加速的芯片有很多,但無論是谷歌 TPU(張量處理器)還是英偉達新一代Tesla V100 GPU加速器,都是為服務器端進行設計的,而在移動端對于機器學習任務加速的芯片封裝還未出現。華為這款移動端 AI 芯片麒麟 970,正是填補了這一空白。
而華為麒麟970上的NPU封裝,基本已坐實是與寒武紀強強聯手的結晶,這也意味著,填補了移動端AI芯片這塊空白的是真正的“中國芯”。
“華為麒麟970的出色性能顯示我國在芯片上真是越來越強大,這種能力證明了底層核心技術,中國已經居于世界前列?!敝袊ㄐ艠I(yè)知名觀察家、飛象網總裁項立剛在接受《中國科學報》記者采訪時說。
“寒武紀公司的技術產品受到了學術界和工業(yè)界的認可,在此我也相信,是寒武紀和華為的強強聯合,將人工智能帶入終端,經過幾年的發(fā)展,定能給我們的生活帶來改變?!敝袊茖W技術大學計算機系一位要求匿名的在讀博士生在接受記者采訪時說,NPU這種性能提升可以讓此前很多無法在移動端使用的機器學習應用走向工程化和實用化。
“搭載寒武紀1A的華為麒麟970芯片是全球首款移動AI芯片,而且是基于最先進的10nm工藝,圖像識別性能是iPhone7 Plus的5倍,三星S8的20倍??梢哉f真正地強強聯合打造了全球領先的技術。”中科院計算所副研究員鴻雁(化名)對該芯片的應用充滿期許:“這款芯片將用于華為Mate 10手機,拭目以待?!?/p>
移動AI時代到來
尚需培育人工智能中國芯生態(tài)
清華大學微納電子學系主任、中國半導體行業(yè)協會集成電路設計分會理事長魏少軍曾公開表示:“人工智能芯片只有進入手機,才真正能夠獲得新生。如果只給互聯網企業(yè)用,一定沒有量。所以不解決進入手機、家庭(的問題),人工智能芯片沒有希望?!?/p>
中國工程院院士、中星微電子有限公司董事長鄧中翰也曾在接受《中國科學報》記者采訪時表示:芯片是人工智能技術發(fā)展的源頭,可謂“得芯片者得天下”,能否開發(fā)出具有超高運算能力、符合市場需求的芯片,是人工智能領域各路豪強爭霸的關鍵。
而今,有了芯片,下一步是什么?陳天石的答案是:生態(tài)。
寒武紀CEO陳天石過去在接受記者采訪時曾一再提到:“芯片的成敗,除了本身的效率之外,生態(tài)是非常關鍵的環(huán)節(jié)。沒有配套的應用和軟件,很難在市場上獲得成功?!彼嘎?,這也是他們下力氣推動國產AI指令集的原因:“只要國產AI指令集立住了,中國主導世界AI產業(yè)的機會可能就到來了。”
有業(yè)內人士認為,華為和寒武紀的合作,對構建國內企業(yè)的AI生態(tài)提供了重要的參考價值。該專業(yè)人士表示,在龍頭企業(yè)數量和企業(yè)研發(fā)能力方面,中美兩國還有一定的差距。人工智能芯片業(yè)態(tài)可能是實現換道超車的機會,但真要實現起來還需要更多國內企業(yè)共同參與、共同努力。
華為對AI生態(tài)的構建持開放態(tài)度。在發(fā)布會上,余承東表示:“用戶需求推動科技進步,應用場景促使AI發(fā)展。麒麟970作為人工智能移動計算平臺,我們將開放給更多的開發(fā)者和業(yè)界合作伙伴,提供完善的多應用模式和機器學習框架的支持,共同推動移動AI時代的到來。”
在余承東看來,人工智能手機芯片需要“芯”“端”“云”協同,才能發(fā)揮最大效用?!皞€體智慧的充分發(fā)揮離不開群體智慧的有力支持,人工智能也一樣。”
而看到華為與寒武紀的強強聯合,項立剛也對中國芯產業(yè)保持樂觀:“華為發(fā)布了麒麟970,在河北云谷(固安)的第6代AMLOED生產線也封頂了,這條生產線可以生產供9000萬部手機使用的柔性屏,可大大提升國產屏的占有率,打破日韓在這領域的壟斷。日韓在配件產業(yè)的興起,是手機整機業(yè)發(fā)展為基礎的,相信隨著手機整機業(yè)的發(fā)展,在CPU、存儲芯片、攝像模組、屏幕這些核心配件上,中國企業(yè)會加大投入,未來5年下一代技術會成為爭奪焦點。外國企業(yè)面對這種競爭只能降價,最后被擠壓。中國企業(yè)會越來越掌握主動權?!?/p>