速途網3月11日消息(報道:李楠)今日,阿里安全專家發布了一項新研究,只要用簡單的激光筆,就可以讓AI模型不再有效。在這個研究中,他們設計了一種算法,可模擬光束對AI模型進行“攻擊”,這種測試方法在現實世界中得到了驗證,且“攻擊”極易操作,對現有基于AI的視覺系統更具威脅,例如基于AI視覺的自動駕駛。
當不同頻譜的光束打在同一個物體上,AI可能將該物體識別錯誤,比如將停車標識識別成順利通行。難以想象,假如一個人正在飛奔的自動駕駛汽車上閉眼休息,AI將“前有危險”識別成“通行”后直接墜入萬丈懸崖;或者直接無法識別前方行人,對于行人而言將有多么危險。

“攻擊AI遠非需要人為去制造對抗樣本,一支簡單的激光筆就可以。我們想通過這個研究揭示AI模型一些之前沒有被探索過的‘錯誤’,從而‘強壯’AI,讓它未來能抵擋這種‘攻擊’,也讓相關從業者重視提高AI模型的安全性。”阿里安全圖靈實驗室負責人薛暉說道。
除了以“一束光”測試AI視覺的安全性,最近圖靈實驗室發布了多項涉及AI安全的研究成果,比如多項文字識別與檢測、利用自監督建立視頻表征學習方法與提升半監督行為檢測的算法框架、AI樣本對抗、偽造人臉檢測、AI對人臉與人聲匹配的雙重模態識別、視頻描述AI生成技術等囊括AI“視覺”“聽覺”“大腦”“免疫性”等多方研究,這10項涉及AI安全的新一代安全架構研究成果均被國際頂會CVPR2021收錄。
“在AI安全前沿技術上進行探索,一是為了讓AI更安全,二是為了讓AI助力安全,三是為解決具體社會問題尋找提效的新途徑。”薛暉說。
互聯網內容越來越朝著視頻化的方向發展,每天用戶上傳和瀏覽的數量也在不斷增長,視頻中所可能存在的內容風險,如色情、恐怖、暴力等信息也對內容安全造成威脅,安全技術人員有必要通過機器來對視頻內容進行理解。
因此,阿里安全高級算法工程師陳達與阿里安全實習算法工程師鄧超睿一起開展了自頂向下的密集型視頻描述生成研究,通過算法對給定視頻自動生成對視頻內容進行描述的一段文字,提前過濾不良內容,守護互聯網清朗健康環境。
書樂是阿里安全圖靈實驗室的一名女性算法專家,她認為算法應該是有“溫度”“柔軟”的,希望能在保護大眾隱私的基礎上,更加高效地解決機場、火車站、車庫、游樂場等環境下走失兒童、老人的尋找問題。
以往行人重識別模型在實際部署中,面臨著訓練數據的采集場景與模型部署場景存在差異的問題,比如模型地訓練場景是機場,但在火車站可能不好用,模型精度會降低。因此,書樂的研究集中在提升AI模型的泛化能力上,以適用于不同的部署場景,且不用識別人臉,通過衣著、步態等,即可提升找尋效率。
高級算法專家越豐十分關注AI對抗樣本的問題,高質量的DeepFake人臉偽造視頻更容易被制作并引發不良影響,而真實場景的偽造視頻數據分布和視頻質量參差不齊,他們正在通過尋找一個更魯棒的方法提升檢測AI檢測算法的實用性。
“安全部署要前置,無論是AI本身的安全,還是AI可以助力解決的安全問題與社會問題,這就是從源頭構筑安全的核心理念。”薛暉表示,希望在廣闊的AI安全研究的新領域中,能有更多新生力量加入,迸發出有創造性和想象力的研究,最終應用到人們的生活中,真正服務大眾,解決難題。