劃重點:
- 隨著技術的日益成熟,面部識別公司的業務不再僅限于執法機構,走向了學校以及商店等更多組織。目前大多數公司的主要業務都是向組織授權軟件,但其商業模式仍在不斷涌現。
- 對面部識別客戶的監管、完善的數據安全,綜合性的訓練工具能夠減輕人們的擔憂。
- 目前幾乎沒有任何法律來限制面部識別的使用,不少組織呼吁加快相關立法步伐。
【編者按】隨著面部識別的精確度日益提高,數十家初創企業和谷歌微軟亞馬遜等科技巨頭正在向酒店、零售店、甚至學校和夏令營推銷面部識別服務。而勝出者將是那些能夠在不產生所謂假陽性的情況下,以更高精確度識別出人臉的公司。隨著行業的蓬勃發展和競爭日趨激烈,相關公司通過各種途徑開發算法,獲取更多人臉訓練集,尋求更多商業模式。而在這一過程中,由于法律監管方面的不完善,也存在一系列問題和擔憂。日前《財富》雜志撰文對行業現象進行了深入分析。
以下是文章正文:
面部識別是一項功能強大的技術,也是一個欣欣向榮的行業。如今,數十家初創企業和科技巨頭正在向酒店、零售店、甚至學校和夏令營推銷面部識別服務。相比于五年前,新算法識別各種人臉的精確度更高,因而相關業務正在蓬勃發展。為了改進這些算法,公司往往會對算法進行包括數十億張人臉數據的訓練,通常也不需要征得任何人的同意。事實上,你自己的面孔很有可能是面部識別公司所使用“訓練集”的一部分,要么就是公司客戶數據庫中的組成部分。
消費者可能會對一些公司用于捕捉他們面部表情的策略感到驚訝。在至少三個已知的案例中,公司是通過用戶手機上的照片應用程序獲取了數百萬張面部圖片。目前,面部識別軟件幾乎沒有任何法律限制,這意味著消費者根本無法阻止公司以各種方式使用他們的面部數據。
2018年,一部攝像機收集到了乘客們匆匆經過華盛頓特區附近機場捷運線時的各種表情。實際上捷運線和乘客都不是真實存在的,整個系統只是美國國家科學技術研究院(NIST)展示如何在“公開環境”中收集人臉的一個場景。這些人臉將成為美國國家標準與技術研究院(NIST)反復舉辦的競賽一部分,邀請全球各地的公司來測試他們的面部識別軟件。
在機場捷運線的演示中,志愿者們允許該機構使用他們的面部數據。這也是面部識別技術早期的運行模式——學術研究機構煞費苦心地說服人們允許他們將各種人臉導入數據集。如今,各個公司已經走在了面部識別的技術前沿,他們不太可能要求某人明確同意自己的面孔被使用,他們壓根就不需要所謂的許可。
市場研究公司Market Research Future指出,包括Face++和Kairos等行業領導者在內的諸多公司,正在面部識別軟件市場展開激烈競爭。這個市場每年增長20%,預計2022年將達到每年90億美元的規模。他們的商業模式包括向越來越多的客戶發放軟件許可,而客戶將其面部識別軟件應用于各種場景。
在開發最優軟件的競賽中,勝出者是那些能夠在不產生所謂假陽性的情況下,以更高精確度識別出人臉的公司。與人工智能的其他領域一樣,開發更好的面部識別算法意味著要收集大量數據進行訓練。雖然公司可以使用政府和大學編制的經批準數據集,比如說耶魯大學開發的人臉數據庫,但這些訓練集規模相對較小,包含的人臉不超過幾千張而已。
這些官方數據集還有其他限制。其中的許多人臉數據集缺乏種族多樣性,或者無法描繪出能夠改變現實世界中人臉顯現方式的條件,比如說陰影、帽子或妝容。為了開發能夠在“公開環境”中發現特定人臉的面部識別技術,公司往往需要更多的圖像。
“幾百張是不夠的,幾千張也是不夠的。你需要數以百萬計的圖像。如果你的訓練數據集中沒有眼鏡男或有色人種的面部圖像,你就不會得到準確的識別結果。”加利福尼亞面部識別公司首席執行官彼得·特雷普(Peter Trepp)表示。該公司主要幫助零售商篩選潛入商店的可疑人員。
提供面部數據的應用程序
公司可以從哪里獲得數以百萬計的面部圖像來訓練它的軟件?其中一個來源是警方的面部照片數據庫,這些照片可以從政府機構公開獲得,也可以從私營公司那里買到。例如,總部位于加利福尼亞的Vigilant Solutions公司就能夠提供1500萬張人臉數據集,該公司將這些圖像當作其面部識別“解決方案”的一部分。
然而,一些初創公司發現了一個更好的人臉來源:個人相冊應用程序。這些應用程序可以編輯存儲在手機上的照片,通常包含同一個人在各種姿勢和場景下的多張照片。這對于面部識別公司來說是一個豐富的訓練數據來源。
Ever AI 首席執行官道格·阿利(Doug Aley)稱,“我們的客戶甚至需要識別出數千種不同場景中的同一個人。即便你戴著帽子站在陰影里,也要叫出你的名字。”Ever AI是舊金山的一家面部識別初創公司,其于2012年以EverRoll的名稱成立,起初推出了一款幫助消費者管理手機照片的同名應用程序。
Ever AI已經從Khosla Ventures以及其他硅谷風投公司那里籌集了2900萬美元。該公司參加了NIST近期舉辦的面部識別競賽,在“臉部特寫”(Mugshots)挑戰中排名第二,并在“公開環境人臉”(Faces in the Wild)挑戰中排名第三。阿利將這一成績歸功于公司龐大的照片數據庫,據估計該數據庫中存儲有130億張圖片。
當Ever AI還只是一款照片應用時,其激進的營銷做法就引發了業界爭議,并導致蘋果在2016年暫時禁止EverRoll進入其蘋果應用商店。值得注意的是,該應用誘導用戶向所有手機聯系人發送推廣鏈接,這一策略在硅谷被稱為“增長黑客”(growth hacking)。用戶還指責EverRoll吞噬了他們的數據。
德克薩斯州肖像工作室老板格雷格·米勒(Greg Miller)在2015年的一篇Facebook評論中寫道:“它做的第一件事就是收集你所有的電話號碼,然后立即給所有人發信息……然后就開始把你所有的照片都放到云端。”
四年后米勒沮喪地發現,這個曾經被稱為EverRoll的應用程序仍然保存著他的照片,現在成了一家面部識別公司。
米勒在接受采訪時表示:“不,我根本沒有意識到這一點,我根本沒有不同意。”“所有這些信息被追蹤是一個真正的問題。再也沒有什么隱私了,這讓我非常害怕。”
然而阿利表示,該公司不會分享人臉數據庫中有關個人的識別信息,只使用這些照片訓練軟件。他補充說,Ever AI類似于一個人們可以選擇退出的社交媒體網絡。阿利還否認了Ever AI從公司成立之初就打算成為一家面部識別公司的說法,稱放棄這款現已關閉的照片應用程序是一個商業決策。目前,Ever AI的客戶正將其面部識別軟件應用于各種活動,包括企業ID管理、零售、電信和執法。
Ever AI并不是唯一一家曾經提供消費者照片應用的面部識別公司。另一個例子是位于舊金山的初創公司Orbeus,其在2016年被亞馬遜悄然收購,該公司曾提供一款名為PhotoTime的照片管理軟件。
據Orbeus的一名老員工說,這家初創公司所擁有的人工智能技術,以及公共場合下的大量人像照片,使其成為頗具吸引力的收購目標。
“亞馬遜正在尋找這種能力。他們買下了所有東西,然后關閉了這款應用。”這名員工以保密協議為由,拒絕透露姓名。
如今這款名為PhotoTime的應用程序已不復存在,不過亞馬遜仍在繼續推銷Orbeus的面部識別軟件Rekognition。
亞馬遜拒絕透露Orbeus的照片應用程序如何被用于訓練其面部識別軟件,只是說自己收集數據用于人工智能項目,其中也包括各種來源的面部識別數據。亞馬遜補充稱,它不使用客戶的Prime照片服務來訓練算法。
另一家使用消費者照片應用訓練面部識別算法的公司是Real Networks。這家公司總部位于西雅圖,曾以其上世紀90年代的在線視頻播放器而聞名,如今專門開發能夠識別學校里孩子面孔的軟件。與此同時,該公司還面向家庭用戶推出了一款名為RealTimes的智能手機應用。一位批評人士表示,這款應用是公司獲取面部數據的借口。
“這個應用程序能夠讓用戶為自己的照片制作視頻幻燈片。想象一下,媽媽會把孩子照片的視頻幻燈片發給奶奶,這些圖像再被用來訓練識別孩子的臉。這太可怕了。”喬治敦大學(Georgetown University)教授克萊爾·加維(Clare Garvie)如是指出。他曾經發表了一篇有關面部識別技術的有影響力報告。
Real Networks證實,這款照片應用程序有助于改善其面部識別工具,但補充說它也使用了額外的數據源。
在所有公司使用照片應用程序收集面部數據進行訓練的案例中,相應公司都沒有得到消費者的明確許可。相反,這些公司似乎通過應用的服務條款從法律層面獲得了用戶的同意。
然而,這已經比其他一些面部識別公司所做的好多了。據NIST面部識別競賽負責人帕特里克·格羅瑟(Patrick Grother)說,面部識別公司編寫程序從SmugMug或Tumblr等網站上“抓取”圖片很常見。在這些情況下,甚至連得到那些最終出現在訓練集的人同意的所謂借口都沒有。
美國全國廣播公司(NBC)最近的一篇新聞報道強調了這種“自助”做法。該報道詳細描述了IBM如何從照片共享網站Flickr上抓取了100多萬張人臉圖像,用于公司的人工智能研究。而IBM研究部門人工智能技術主管約翰·史密斯(John Smith)告訴NBC,該公司致力于“保護個人隱私”,并會與那些尋求從數據集中刪除數據的人合作。
所有這些都引發了人們的疑問:公司應該采取哪些措施來保護他們所收集的面部數據,政府是否應該提供更多的監督。隨著面部識別技術的應用范圍日趨廣泛,開始為大大小小的公司的業務提供動力,這些問題的解決只會變得更加緊迫。
從商店到學校
面部識別軟件并不鮮見。這種技術的原始版本早在20世紀80年代就已經存在,當時美國數學家開始將人臉定義為一系列數值,并使用概率模型來進行匹配。佛羅里達州坦帕市的安保人員在2001年的超級碗比賽上使用了這種技術,而賭場也已經使用了很多年。但在最近幾年,情況發生了變化。
NIST的格羅瑟說:“面部識別正在經歷一場革命。”他指出在那些轉瞬即逝或畫質差人像上的表現最為明顯,“基礎技術已經發生了變化。舊的技術已經被新一代算法所取代,它們非常有效。”
面部識別技術的這場革命得益于兩個因素,其也正在更廣泛地改變人工智能領域。首先是新興的深度學習科學,這是一種類似人腦的模式識別系統。第二個是前所未有的海量數據,可以在云計算的幫助下以更低成本進行存儲和解析。
毫無疑問,最先充分利用這些新發展的公司是谷歌和Facebook。2014年,社交網站Facebook推出了一個名為“DeepFace”的程序,該程序可以識別兩張臉是否屬于同一個人,準確率為97.25%,與人類在同一測試中的得分相當。一年后,谷歌通過其FaceNet程序將識別準確率一舉提高到100%。
如今,谷歌、Facebook和微軟等科技巨頭在人臉識別領域處于領先地位,這在很大程度上是因為它們可以訪問大量的人臉數據庫。盡管如此,越來越多初創公司的面部識別準確度也在不斷提高,因為他們堅持在不斷增長的面部軟件市場中尋找利基市場。
僅在美國,就有十幾家諸如Kairos和FaceFirst這樣的初創公司。市場研究公司PitchBook的數據顯示,硅谷一直在擁抱這個行業。該公司披露,過去幾年發生了數十宗投資交易,過去三年的平均總投資為7,870萬美元。以硅谷的標準來看,這并不是一個令人瞠目結舌的數字,但它反映了風險投資家的一個重大賭注,即至少有幾家面部識別初創公司將迅速成長為大公司。
面部識別公司的商業模式仍在不斷涌現。目前大多數公司的主要業務都是向組織授權軟件。Crunchbase的數據顯示,像Ever AI和FaceFirst這樣的初創公司年營收普遍相對較低,從200萬美元到800萬美元不等。與此同時,亞馬遜和其他科技巨頭并沒有透露他們有多少營收來自面部識別軟件授權。
多年來,最熱衷于面部識別的付費客戶一直是執法機構。然而最近,包括沃爾瑪在內的更多公司正在使用該軟件來識別和了解進入他們實體店的消費者。
FaceFirst的客戶肯定就是這種情況。這家總部位于加利福尼亞的初創公司向數百家零售商銷售面部識別軟件,其中包括一元店和藥店。該公司首席執行官特雷普說,他的大部分客戶都在使用這項技術識別篩查進入商店的可疑人員,但越來越多的零售商正在測試這項技術的其他用途,比如說識別VIP客戶或自家員工。
與此同時,亞馬遜似乎在尋找面部識別商業模式方面撒下了一張大網。據報道,這家零售巨頭除了向警方推銷產品外,還在與酒店合作加快客戶入住手續的辦理。
“來自世界各地的公司來到亞馬遜說,‘這就是我們希望你們做的’。然后你會發現那才是你的最佳選擇,是整個市場最感興趣的地方。”在亞馬遜收購面部識別公司Orbeus時加入其中的一位匿名人士表示。
就亞馬遜而言,這些努力并非沒有爭議。去年7月,一家非營利組織對其軟件進行測試,將每一位國會議員的臉與一個被判重罪的人像數據庫進行比對。測試結果出現了28例假陽性,其中大多數國會議員為有色人種。作為回應,該組織呼吁禁止執法部門使用面部識別技術。與此同時,亞馬遜自家員工也向該公司施壓,要求其證明向警察部門、美國移民和海關執法部門出售軟件的正當性。
包括紐約州民主黨眾議員杰羅德·納德勒(Jerrold Nadler)和俄勒岡州民主黨參議員羅恩·懷登(Ron Wyden)在內的一些國會議員已經要求政府問責局調查面部識別軟件的使用情況。包括微軟總裁布拉德·史密斯(Brad Smith)在內的大企業領導人也對這項技術的應用感到不安。他在去年12月呼吁政府進行監管。
盡管人們的擔憂不斷加劇,隨著企業找到新的應用場景來銷售面部識別技術,其涉及范圍正在擴大。比如家庭照片應用程序開發商Real Networks正在向全美各地的中小學校學校免費提供其軟件。該公司表示,現在有數百所學校正在使用它。在接受采訪時,該公司首席執行官羅勃·格拉澤 (Rob Glaser)表示,他發起這一倡議的初衷是為了解決有關學校安全和槍支管控的爭議問題。目前,Real Networks的網站正在大力宣傳其技術,稱其可以讓活動主持人“認出每一位粉絲、客戶、員工或客人”。
Real Networks并不是唯一一家專注于兒童面部識別產品的公司。德克薩斯州一家名為Waldo的創業公司正在向數百所學校、少兒體育聯盟和夏令營提供這項技術。在實際操作中,這涉及使用Waldo的軟件掃描學校攝像機或官方攝影師拍攝的圖像,然后將孩子的臉與父母提供的圖像數據庫進行匹配。那些不想參加的家長可以選擇退出。
據該公司首席執行官羅德尼o賴斯(Rodney Rice)介紹,學校每年都會拍攝數萬張照片,其中只有少數幾張照片會出現在年鑒上。他說,面部識別是一種有效的方式,可以把剩余的照片分發給那些想要留下回憶的人。
賴斯說:“你還可以把孩子在學校的照片發給祖父母。”該服務目前已經在美國30多個州開展業務。
Waldo和FaceFirst的發展現狀表明,企業正在幫助實現面部識別的普及。不久前,面部識別技術還只是科幻小說中的內容。隨著技術擴展到更多領域,越來越多的公司將收集我們的人臉圖像,要么用于訓練他們的算法,要么用于識別客戶和罪犯。當然與之同時,出現錯誤或誤用的可能性也在不斷增加。
面部識別的未來
在科幻劇《黑鏡》(Black Mirror)中,一位焦慮的母親對女兒的交往對象憂心忡忡。為了確認他的身份,她將這名男子的面部照片上傳到消費者面部識別服務上。軟件會立即顯示他的名字和工作地點,然后這位母親就去找他了。
這種情況一度牽強附會,如今卻觸手可及。盡管人們對面部識別一直存在擔憂,但公司甚至個人對面部識別的使用卻帶來了更多隱私方面的風險。
隨著越來越多的公司開始銷售面部識別技術,隨著我們的面部圖像出現在越來越多的數據庫中,該軟件可能會受到偷窺者和跟蹤者的更多注意。商人和房東也可以用它來識別自認為不受歡迎的人,并悄悄停止提供住房或服務。
一家非營利組織的政策分析師杰伊o斯坦利(Jay Stanley)表示:“任何擁有攝像機和人流量大地方的人,都可以開始編譯一個圖像數據庫,然后使用分析軟件來查看某人是否與所編譯的圖像匹配。”
此外還有黑客入侵的風險。網絡安全公司Gemini Advisors安全專家安德烈巴里賽維奇(Andrei Barysevich)說,他發現印度國家生物識別數據庫的個人資料被盜,在暗網的網站上公開出售。他還沒有發現有美國的人臉數據庫被出售,但他補充說:“這只是時間問題。如果發生這樣的事情,從酒店或零售商處竊取顧客的面部數據可能會幫助犯罪分子實施欺詐或身份盜竊。”
隨著這項技術在缺乏監管的情況下傳播開來,限制其濫用的最大希望可能在于軟件制造商自己。在接受采訪時,面部識別初創公司的首席執行官們都表示,他們非常關注隱私風險。
首席執行官們還提出了兩種方法,可以限制市場濫用他們的技術。第一種是與軟件購買者緊密合作,以確保客戶不會隨意部署軟件。例如,Ever AI的阿利表示,其公司所遵循的標準比亞馬遜更高。
在回答如何監管技術濫用的問題時,亞馬遜提供了一份由亞馬遜云服務Amazon Web Services海外人工智能服務負責人馬特·伍德(Matt Wood)此前發表的聲明,指出該公司禁止非法或有害他人的活動。
面部識別公司高管提到的另一個可能隱私保護措施是使用技術手段,確保數據庫中的人臉信息不會被黑客入侵。
Waldo首席執行官賴斯說,人臉數據是以哈希加密的形式存儲。這意味著,即使發生數據泄露,個人隱私也不會受到損害,因為黑客無法使用哈希來重建人臉及其身份信息。這一點得到了其他人的贊同。
賴斯還擔心,立法人員制定使用面部技術的規則可能弊大于利。他說:“不分良莠全盤否定,制定一系列瘋狂的規定,這將是一個笑話。”
與此同時,一些開發面部識別軟件的公司正在使用新技術,可能會減少算法訓練對大量人臉數據的需求。邁阿密面部識別初創公司Kairos就是這樣一個例子。凱羅斯的客戶中有一家大型連鎖酒店。據首席安全官斯蒂芬·摩爾(Stephen Moore)稱,Kairos正在開發“合成”面部數據,以生成各種面部表情和光照條件。他說,這些“人造臉”意味著公司可以依靠更少的真實面孔來開發產品。
無論對面部識別客戶的監管、亦或完善的數據安全,甚至綜合性的訓練工具都可以減輕一些與公司使用我們面部信息有關的隱私擔憂。與此同時,FaceFirst的特雷普認為,隨著我們對這項技術越來越熟悉,對它的擔憂將會逐漸減少。他甚至認為,科幻電影《少數派報告》中的面部識別情景將開始變得司空見慣。
“千禧一代更愿意交出自己的臉。那個(少數派報告)世界正在到來,”他表示。“如果處理得當,我認為人們會接納它、喜歡它,這將是一個積極的體驗。這不會讓人覺得毛骨悚然。”
也有人則不那么樂觀。盡管圍繞這項技術的爭議越來越大,但目前幾乎沒有任何法律來限制面部識別的使用。只有伊利諾斯州、德克薩斯州和華盛頓州例外,這三個州在使用人臉圖像之前需要征得一定程度的同意。而這些法律并沒有經過真正的檢驗,其中只有伊利諾斯州是個例外,消費者可以通過提起訴訟來行使這項權利。
目前,伊利諾斯州相關法律涉及一宗Facebook的高調上訴案件。該案件中Facebook聲稱獲取人臉圖像的法律限制并不應該延伸到數字掃描。2017年Facebook和谷歌進行了一次不成功的游說活動,試圖說服伊利諾伊州議員修改該法。今年1月底,伊利諾伊州最高法院裁定,如果消費者就未經授權使用他們信息的生物識別技術提起訴訟,不必出示自己受到傷害的證明,這讓這項法律的支持者更為積極。
其他州也在考慮立法問題。但在聯邦層面的關注甚少。然而,本月參議員布萊恩·沙茨(Brian Schatz)和羅伊·布朗特(Roy Blount)提出了一項方案,要求公司在公共場所使用面部識別技術,或者與第三方共享人臉數據之前必須獲得許可。
喬治敦大學的研究人員加爾維也贊成用法律來監管這項技術。她說,“面部識別面臨的一個挑戰是,由于訓練數據庫的存在,它的普及速度快得令人難以置信。我們的臉被采集的次數太多了。”她說。“長期以來,關于指紋的采集方式和采集時間都有規定,但與之不同的是,面部識別技術沒有規定。”