近期,國(guó)際計(jì)算機(jī)視覺大會(huì)(ICCV)官方網(wǎng)站陸續(xù)公布了ICCV2021計(jì)算機(jī)視覺挑戰(zhàn)賽成績(jī),來自螞蟻保險(xiǎn)科技的選手摘得“遮擋視頻實(shí)例分割”挑戰(zhàn)賽的第一名。名列前茅的還有美國(guó)卡耐基梅隆大學(xué)和德國(guó)亞琛工業(yè)大學(xué)等先進(jìn)研究機(jī)構(gòu)。
ICCV由IEEE(電氣與電子工程師協(xié)會(huì))主辦,與計(jì)算機(jī)視覺模式識(shí)別會(huì)議(CVPR)和歐洲計(jì)算機(jī)視覺會(huì)議(ECCV)并稱為計(jì)算機(jī)視覺方向的三大頂級(jí)會(huì)議。
ICCV2021遮擋視頻實(shí)例分割挑戰(zhàn)賽,既Occluded Video InstanceSegmentation(簡(jiǎn)稱OVIS)競(jìng)賽。OVIS主要特點(diǎn)是視頻里存在大量多種多樣物體之間的遮擋,要求算法能檢測(cè)、分割、跟蹤視頻里所有的物體。

實(shí)例分割是計(jì)算機(jī)視覺中的基礎(chǔ)問題之一。目前,靜態(tài)圖像中的實(shí)例分割業(yè)界已經(jīng)進(jìn)行了很多的研究,但是對(duì)(遮擋)視頻的實(shí)例分割的研究相對(duì)較少。而真實(shí)世界中的攝像頭所接收的,無論是自動(dòng)駕駛背景下車輛實(shí)時(shí)感知的周圍場(chǎng)景,網(wǎng)絡(luò)媒體中的長(zhǎng)短視頻,還是智能理賠流程中的憑證識(shí)別,大多數(shù)都是視頻流信息而非純圖像信息。因而研究視頻理解的模型有著十分重要的意義。基于視頻級(jí)別的實(shí)例分割技術(shù)相比圖像級(jí)別,其優(yōu)點(diǎn)在于可以充分利用物體跨幀的連續(xù)性和時(shí)態(tài)上下文線索,但同時(shí)也對(duì)計(jì)算資源提出更高要求。
視頻實(shí)例分割是2019年由業(yè)內(nèi)學(xué)者提出的新任務(wù),自提出起便得到了Facebook、字節(jié)跳動(dòng)、騰訊等國(guó)內(nèi)外公司的關(guān)注,目前該領(lǐng)域還處于發(fā)展初級(jí)階段。
該技術(shù)在視頻流中的理賠憑證理解、電商險(xiǎn)理賠商品識(shí)別,視頻面訪,寵物身份識(shí)別等保險(xiǎn)場(chǎng)景中起到作用。螞蟻保險(xiǎn)推出的智能理賠服務(wù)可以利用該技術(shù)處理上述復(fù)雜場(chǎng)景。
目前,視頻實(shí)例分割技術(shù)已經(jīng)應(yīng)用于螞蟻保險(xiǎn)的智能理賠場(chǎng)景中,大大提升理賠效率和準(zhǔn)確率。例如,利用該技術(shù)可以更便捷的識(shí)別視頻流中的理賠憑證,從一摞紙中把最上面的憑證主體切割提取出來(圖1)。
此外,以寵物險(xiǎn)為例,除了利用鼻紋識(shí)別技術(shù)識(shí)別寵物之外,如下面視頻中的四張圖(圖2)所示,算法模型可以將相互遮擋的三只貓?bào)w準(zhǔn)確分割,從而進(jìn)行就更精準(zhǔn)的動(dòng)物身份識(shí)別。
同時(shí),該技術(shù)未來在企業(yè)貸款的憑證上傳,自動(dòng)駕駛的場(chǎng)景理解,短視頻或直播中的人物背景分離等應(yīng)用場(chǎng)景也會(huì)有廣泛的應(yīng)用價(jià)值。

圖1:理賠憑證切割

圖2:遮擋寵物分割