近日,螞蟻數科2項研究成果分別入選“歐洲計算機視覺會議(ECCV)”和“國際機器學習大會(ICML)”,可實現無需人工打標數據的情況下,通過自監督學習、強化學習等方法訓練模型輸出可信結果。據悉,兩項成果將被應用于視頻版權保護和智能問答領域。作為人工智能領域的頂級國際學術會議,2024年ECCV、ICML的論文接收率分別為27.5%、27.9%。
入選2024年歐洲計算機視覺會議(ECCV)的論文《基于區域令牌表征的自監督視頻抄襲定位》核心解決版權保護場景的行業難題——視頻抄襲定位,即判斷兩個視頻中是否存在抄襲片段,并確定對應的起止時間。當前常用的抄襲片段定位算法依賴大量的人工標注數據訓練模型。受視頻時間長、比對工作量大等因素影響,人工標注的成本極高。螞蟻數科AI團隊提出了一個自監督學習的框架,通過算法自動生成豐富的訓練樣本,對特征模型、定位模型進行訓練,實驗結果表明,該?法無需使?任何??標注數據,即可超越當前最先進的標注數據訓練?法。同時,論文還創新性地在視覺Transformer模型(ViT)上增加了一種區域令牌(Regional Token)結構,使得模型可以關注到“畫中畫”等局部區域,增強抄襲識別的準確率和完整性。螞蟻數科早在2019年就開始探索AI技術在版權保護領域的落地應用,這是團隊研究成果第五次入選國際頂會。

圖說:國際頂級會議ECCV2024
此外,在智能對話領域的研究成果也取得突破性進展。今年5月入選2024年國際機器學習大會(ICML)的論文《基于強化學習的檢索增強大語言模型可信對齊》由中國科技大學、合肥綜合性國家科學中心人工智能研究所、螞蟻數科聯合申報。論文針對大語言模型容易遭受幻覺困擾、制造無效內容的問題,提出了基于強化學習的“可信對齊”策略,該策略的目標不只是“滿足用戶偏好”,而希望激勵模型生成更可信的內容。相比傳統基于專家標注樣本的監督訓練方式,“可信對齊”訓練的模型更注重基于給定的上下文和邏輯給出可信的判斷。實驗結果表明,該方案比開源基礎模型的準確率提升55%,與準確答案的對齊成本降低83%。此外,“可信對齊”在生成文字的流暢度方面比傳統方法提升30%,良好的性能將有利于語言模型在TO B嚴謹行業的應用落地。

圖說:國際頂級會議ICML2024
自監督學習被認為是機器智能達到人類水平的關鍵,其最大的特點是不依賴人工標注的數據標簽,可自主觀察和學習、提取有用的特征,并應用于各種任務,與人類學習的方式相似。自監督學習在為模型訓練降本提效的同時,具備更好的知識泛化能力和持續學習能力,研究對推動AI發展有著深遠意義。