發(fā)布時間: 2016年06月21日
在北京市海淀區(qū)一座十余層高大廈的一間展廳內(nèi),一臺電腦屏幕上顯示著大廈入口來往車輛的信息?!叭绻羞`規(guī)情況,攝像頭就能夠在第一時間識別出來,并將相關(guān)車輛信息實時報告給監(jiān)督者?!睆堩崠|介紹說。
賦予攝像頭這一識別及判斷能力的載體僅是一塊長寬約兩厘米的正方形銀色芯片。6月20日,張韻東所在的中星微 “數(shù)字多媒體芯片技術(shù)”國家重點實驗室舉行新聞發(fā)布會稱,其發(fā)明的中國首款嵌入式神經(jīng)網(wǎng)絡(luò)處理器(NPU)芯片誕生,并已于今年3月6日實現(xiàn)量產(chǎn)。
這款被命名為“星光智能一號”的芯片,蘊含了當前計算機領(lǐng)域最前沿的生物人腦神經(jīng)網(wǎng)絡(luò)仿生學創(chuàng)新技術(shù),且對嚴重依賴國外進口產(chǎn)品的中國集成電路產(chǎn)業(yè)來說,也是實現(xiàn)“彎道超車”的一次踴躍嘗試。它標志著我國在神經(jīng)網(wǎng)絡(luò)處理器領(lǐng)域的研究和開發(fā)上取得了重大突破;使我國視頻監(jiān)控行業(yè)發(fā)展由模擬時代、數(shù)字時代跨入智能時代,在全球確立領(lǐng)先地位。
集成“大腦”的“眼睛”
“原來的視頻處理芯片只是相當于一只‘眼睛’。要把采集到的海量音視頻數(shù)據(jù)傳到后臺進行識別,再把結(jié)果通知給人,沒辦法做到實時分析?!睋卧搰抑攸c實驗室執(zhí)行主任的張韻東比喻說。而“星光智能一號”可以讓“眼睛”具備人腦的功能,將后臺的智能判斷提到了前端,可實時地識別更高級的智慧信息,如身份證號碼、車牌號、一個人是誰。
為了了解其對人臉的識別能力,一名男記者現(xiàn)場邀請長相跟他相像的一名工作人員一起“刷臉”。果然,在讀取身份證之后,攝像頭在不到1秒鐘的時間內(nèi)就判斷出工作人員才是本人。
“星光智能一號”之所以能“看懂”這些信息,該實驗學術(shù)委員會主任楊曉東介紹說,是因為它集成了NPU處理器內(nèi)核以及國家標準音視頻編解碼器(SVAC Codec),是全球首顆具備深度學習人工智能的嵌入式視頻采集壓縮編碼系統(tǒng)級芯片。該實驗室自主研發(fā)的嵌入式NPU,徹底顛覆了采用傳統(tǒng)馮諾依曼架構(gòu)的CPU(中央處理器),賦予其“大腦”一樣的分析功能。
當前,人工智能的好戲剛剛揭幕?!熬矸e神經(jīng)網(wǎng)絡(luò)(CNN)算法已成為智能機器視覺領(lǐng)域的研究熱點?!痹搶嶒炇仪度胧饺斯ぶ悄茼椖拷M組長昝勁文在接受《中國科學報》采訪時說,該算法通過仿生人腦的神經(jīng)網(wǎng)絡(luò),可降低網(wǎng)絡(luò)模型的復雜程度,在處理海量輸入數(shù)據(jù)、大規(guī)模乘累加運算、稀疏權(quán)值矩陣等方面具有優(yōu)勢。
然而,傳統(tǒng)CPU運行CNN算法效率不高。中星微NPU采用“數(shù)據(jù)驅(qū)動并行計算”架構(gòu),使算機的能耗比“至少提高了兩三個數(shù)量級”,特別擅長處理視頻、圖像類的海量多媒體數(shù)據(jù),使得人工智能在嵌入式機器視覺應(yīng)用中可以大顯身手。
“馮諾依曼架構(gòu)的編程方式是在一條線上寫代碼,一條條指令順序執(zhí)行;我們是在二維的平面上編寫程序,使數(shù)據(jù)并行傳輸,過程比以前單線的編程更加復雜。”該實驗室神經(jīng)網(wǎng)絡(luò)處理器項目組組長周林均告訴《中國科學報》記者。
據(jù)介紹,中星微每個NPU處理器有4個內(nèi)核,每個內(nèi)核有兩個數(shù)據(jù)流處理器,每個數(shù)據(jù)流處理器有8個長位寬或16個短位寬的SIMD(單指令多數(shù)據(jù))運算單元?!斑@樣每個NPU處理器就包含了128個并行處理單元,相當于高速公路上有128個車道并行,讓海量數(shù)據(jù)通過?!睆堩崠|比喻說。這使得每個NPU處理器具有每秒38G Ops(標準化數(shù)字標牌接口規(guī)范)的長位寬處理能力或76G Ops的短位寬處理能力。
“彎道超車”在于創(chuàng)新
據(jù)張韻東透露,“星光智能一號”現(xiàn)已銷售數(shù)十萬件,成功在視頻監(jiān)控領(lǐng)域?qū)崿F(xiàn)產(chǎn)業(yè)化,并可廣泛應(yīng)用于智能駕駛輔助、無人機、機器人等嵌入式機器視覺領(lǐng)域。
此次,中星微率先在全球?qū)崿F(xiàn)對該芯片的量產(chǎn)應(yīng)用,可謂是中國企業(yè)實現(xiàn)對國外集成電路產(chǎn)業(yè)“彎道超車”的一次成功嘗試。
在信息時代,集成電路產(chǎn)業(yè)已成為全球各國必爭的戰(zhàn)略制高點。但當前中國該產(chǎn)業(yè)形勢卻相當嚴峻。工信部數(shù)據(jù)顯示,我國十余年來集成電路進口額長期處于各類商品之首,每年達2000億元左右。
這種依賴性隨時可將中國通信產(chǎn)業(yè)置于難以預(yù)料的風險之中。例如今年3月7日,中興通訊因被美國商務(wù)部實施出口限制措施而停牌。因該公司對美國零部件和軟件供應(yīng)商的依賴,嚴重損害了其手機終端和電信設(shè)備業(yè)務(wù),造成的損失額估計達1000億元以上。
當前,人工智能已成為下一代信息產(chǎn)業(yè)浪潮最重要的推手和顛覆性的技術(shù),微軟、高通、谷歌以及美國宇航局支持的KnuEdge等公司紛紛推出的自己的NPU。對此,張韻東和同事認為,中國集成電路產(chǎn)業(yè)要想實現(xiàn)趕超,答案就在于自主創(chuàng)新?!拔覀儽热思衣浜筇?,現(xiàn)在新的技術(shù)不斷涌現(xiàn),我們要把握整個行業(yè)格局變化重新洗牌的機會?!睆堩崠|說。
堅持自主創(chuàng)新原則,重點投入核心技術(shù)研發(fā)與標準的制定,這是中星微多年來形成的科研模式。成立于1999年的中星微,在2001年開發(fā)出第一塊具有中國自主知識產(chǎn)權(quán)的圖像處理芯片“星光一號”,結(jié)束了中國無“芯”的歷史;在2010年與公安部第一研究所牽頭制定了SVAC國家標準,是全球第一個針對視頻監(jiān)控的音視頻編解碼標準。這兩項成果使其兩次獲得國家科技進步一等獎。
“數(shù)字多媒體芯片技術(shù)”國家重點實驗室成立于2010年,圍繞數(shù)字多媒體芯片的應(yīng)用基礎(chǔ)和關(guān)鍵技術(shù)開展研究。此次中星微推出的神經(jīng)網(wǎng)絡(luò)處理器和嵌入式視頻監(jiān)控芯片,正是對“創(chuàng)新驅(qū)動發(fā)展”的實踐。據(jù)悉該芯片現(xiàn)已申請16項專利?!敖裉?,我們敢說我們的芯片誕生了,是進行了3年多的開發(fā),每一顆芯片都經(jīng)過嚴格的測試?!睆堩崠|說。
后摩爾時代的探索
“正如業(yè)界所言,‘隨著逐步逼近香農(nóng)定理、摩爾定律的極限,面對大流量、低延時的理論還未創(chuàng)造出來’。大家感到前途茫茫,找不到方向?!睆堩崠|說。而NPU正是一塊“引玉之磚”。
根據(jù)摩爾定律,集成電路上可容納的元器件數(shù)目,約每隔兩年便會增加一倍,性能也將提升一倍。這一發(fā)展曲線在超過半個世紀里一直與預(yù)測的一樣“完美”。然而從2010年開始,這一增長節(jié)奏逐漸放緩。
“現(xiàn)在,半導體工藝已經(jīng)逼近量子尺度,摩爾定律的盡頭近在眼前。而傳統(tǒng)CPU受限于散熱問題,其時鐘頻率更早趨于上限?!睆堩崠|說?!袄碚撋?,極限時鐘頻率是1000G,但傳統(tǒng)CPU受限于散熱,達不到10G。否則,芯片過燙、溫度過高就沒辦法正常工作?!?/span>
如此一來,人們設(shè)想的嵌入式高級機器人還能否實現(xiàn)呢?對此,張韻東表示,后摩爾定律時代有幾條不同的路徑,一種觀點是繼續(xù)推進摩爾定律,即繼續(xù)在新型材料、工藝制程和器件結(jié)構(gòu)上努力,將摩爾定律再推進一步,在單位面積上可以實現(xiàn)更高的集成度;另一種觀點是超越摩爾定律,即通過系統(tǒng)集成單顆芯片或是多芯片堆疊的方式,實現(xiàn)更多的功能。
張韻東表示,中星微的觀點是走“智能摩爾”的路線,即不否認相關(guān)技術(shù)的物理制約,推進信息層面的技術(shù)創(chuàng)新?!斑@一方面還遠遠沒有達到極限,如何進一步借鑒人類智慧機理,如何把原始數(shù)據(jù)提升到有用的信息,在信息層面還有很多技術(shù)有待創(chuàng)新?!?/span>
此次,“星光智能一號”就聚集了北京、廣東、天津、山西、江蘇等地的研發(fā)力量,采用了先進的過億門級集成電路設(shè)計技術(shù)及超亞微米芯片制造工藝,實現(xiàn)投片量產(chǎn)。未來,該實驗室將采用更加接近生物人腦的工作機理方式,推出更低功耗、更高運算新能的下一代神經(jīng)網(wǎng)絡(luò)處理器。“人腦的奧秘現(xiàn)在還遠遠沒有被了解。”張韻東說,“研究新型的計算架構(gòu),提升信息處理的性能功耗比,這可能是下一次信息革命的關(guān)鍵點?!?/span>