發(fā)布時間: 2020年08月10日
近日,兩年一度的世界計算機視覺領(lǐng)域頂級學(xué)術(shù)會議ECCV2020的各項挑戰(zhàn)賽結(jié)果出爐,在圖像分類賽中,阿里安全的人工智能分類技術(shù)力壓三星、深蘭科技、同濟(jì)大學(xué)等國內(nèi)外多支隊伍,獲得該賽道冠軍。
與其他比賽動輒使用十幾萬的數(shù)據(jù)不同,ECCV2020分類比賽共有1000個類別,每個類別僅有50張圖片作為訓(xùn)練數(shù)據(jù)。比賽要求選手在不使用任何預(yù)訓(xùn)練模型和額外數(shù)據(jù)情況下,從零訓(xùn)練模型——這無疑給模型訓(xùn)練制造了巨大難度。換言之,參賽隊伍需要打造一個高效能、低成本的分類人工智能(AI)模型。
據(jù)阿里安全圖靈實驗室算法工程師夜清介紹說,阿里安全智能算法團(tuán)隊從三個技術(shù)方向進(jìn)行了突破:利用隨機抽取的兩張圖像,使用數(shù)據(jù)增強并進(jìn)行拼接,最大程度豐富訓(xùn)練樣本資源;設(shè)計新的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),加入顯著性特征模塊挖掘樣本的特點,提升分類性能;利用分層語義結(jié)構(gòu),讓AI模型更好地挖掘數(shù)據(jù)。
這一高效的AI分類技術(shù)最終脫穎而出。阿里安全圖靈實驗室資深算法專家華棠說,該技術(shù)間接解決了計算資源消耗和數(shù)據(jù)標(biāo)注的人力成本問題,為自動駕駛、物體識別、智慧城市等應(yīng)用提供了新的思路和方法。
目前,阿里安全這項基于小規(guī)模圖像的高效AI分類技術(shù)已應(yīng)用在知識產(chǎn)權(quán)商標(biāo)識別、通用商品識別和動植物保護(hù)等場景中。
華棠以某知名品牌運動鞋上新為例解釋說:“一段時間內(nèi)我們僅能獲得該產(chǎn)品的配色和幾個不同角度的圖片。在僅有少量商品展示圖的情況下,通過高效AI分類方案,我們在新產(chǎn)品問世的極短時間內(nèi)就能實現(xiàn)新款商品識別能力的覆蓋,可大大降低新產(chǎn)品被‘山寨’的風(fēng)險?!?/span>
夜清進(jìn)一步介紹說,該方法還可以與自監(jiān)督學(xué)習(xí)有效結(jié)合,在學(xué)習(xí)更好的數(shù)據(jù)表征基礎(chǔ)上,指導(dǎo)模型高效學(xué)習(xí),獲得更好的識別能力。
在“戴口罩人臉識別”問題上,這一AI分類技術(shù)也能派上用場。阿里安全圖靈實驗室資深算法專家薛暉介紹說,疫情期間,摘下口罩“刷臉”不但麻煩還不安全,應(yīng)用高效AI分類技術(shù)可顯著降低模型初始化的數(shù)據(jù)需求量、可快速訓(xùn)練模型,從而解決了戴口罩的人臉識別問題。
阿里安全相關(guān)負(fù)責(zé)人介紹說,作為新一代安全架構(gòu)安全技術(shù)層的核心AI技術(shù),目前高效AI方案對內(nèi)已賦能阿里多個業(yè)務(wù)場景,如淘寶視頻、淘寶直播、優(yōu)酷等平臺的知識產(chǎn)權(quán)保護(hù),為數(shù)字基建的安全建設(shè)提供樣本參考,對外則通過綠網(wǎng)直接服務(wù)大中小企業(yè)。