7月30日消息,在CVPR 2019的低功耗圖像識別挑戰賽(LPIRC ,Low-Power Image Recognition Challenge)上,阿里AI獲得在線圖像分類任務第一名。阿里AI識別百萬圖像的算法,在手機上也能跑起來了。
CVPR是計算機視覺領域的頂級學術會議,低功耗圖像識別挑戰賽由IEEE Rebooting Computing (RC)項目負責發起,通過識別準確率、執行速度和能量消耗三項指標,考察AI視覺識別技術在輕量級設備上的表現。
阿里AI參加了挑戰賽三項任務之一的在線圖像分類。比賽使用Pixel 2 手機,要求AI在 10 分鐘內分類20000 張圖像,考察分類速度和精度。

挑戰賽使用Imagenet數據集作為訓練數據,AI學習了約 120 萬張涵蓋1000個類別的圖像,實現67.4%的分類精度,比官方提供的基準線高3.5%。在最終的測試中,阿里AI實現了23ms的單張圖片分類速度,排名第一。
這項技術可將深度學習算法壓縮40到100倍,便捷地部署于端側設備,在智能手機、自動駕駛、工業自動化等領域應用前景廣闊。
好的深度學習模型通常擁有復雜的結構和巨大的參數量,必須借助云端的大數據處理能力和高性能芯片的算力運行。如果移到端側,就得搭載體積大、功耗高的設備。比如無人車,它們在行駛過程中實時收集大量路況數據,一部分在云端處理,一部分在本地處理。相比云端計算,本地計算不容易受時延影響,但受限于功耗,本地服務器能夠承擔的任務很有限。

阿里達摩院線下智能團隊為端側人工智能提供了解決方案。基于目前主流的移動端輕量級網絡,該團隊設計了一個快速小型網絡,在低分辨率圖像輸入情況下仍能保持較高的分類精度。利用量化技術,該模型還可進一步壓縮,在幾乎無損精度的同時提升速度。
如果把該算法部署于無人車,就能在維持原有性能的前提下大大降低處理器功耗;或在不犧牲功耗的情況下大大提升處理器性能,甚至將部分云端處理任務挪到本地。
目前,這項技術已在衛星遙感影像分析上顯示威力。衛星遙感影像常被用來監測土地、河流等自然資源,單張影像大小以GB為單位。同樣規模的影像分析任務,傳統人力方法需要幾個月,交給AI則只要幾分鐘。部署在GPU服務器、TX2端上盒子等的低功耗圖像識別技術,能以非常高的精度、極速完成海量圖片識別。