色视频www在线播放国产成人 _亚洲第一激情av_在线播放豆国产99亚洲_国产亚洲精品福利_午夜伦全在线观看_这里只有精品丝袜_欧美少妇精品_欧美成人午夜电影_成人在线免费观看黄色_欧美日韩亚洲综合一区二区三区_欧美高清xxxxxkkkkk_久久精品国产99久久6

阿里人工智能走過5年 第一背后靠的什么?

來源:機(jī)器之能 作者:四月

「邁出象牙塔,踏進(jìn)商業(yè)場,科學(xué)家如何自證價(jià)值?」

過去五年,阿里在全球人工智能的激烈賽道上悄然跑進(jìn)了第一梯隊(duì),背后一群以達(dá)摩院稱號(hào)對(duì)外示人的科學(xué)家群體愈發(fā)神秘撩人。

這是一群野心勃勃的科學(xué)家,親手打破旁人艷羨的舒適區(qū),踏入充滿禁忌的未知地,只為尋覓更廣闊的舞臺(tái)。他們一生都致力「求證」,或于學(xué)術(shù)理論,或于技術(shù)價(jià)值,并愿意承擔(dān)隨之而來的冒險(xiǎn)和境遇窘迫。

這五年,阿里經(jīng)歷了人工智能技術(shù)長征的發(fā)端與突圍,而他們,也經(jīng)歷了一場巨大的冒險(xiǎn)與自證。

初見之時(shí),你或許會(huì)訝異他們滔滔不絕地談起「買單」、「落地」、「規(guī)模化」等商業(yè)味濃厚的字眼,全然沒了學(xué)究氣,仿若一位身居一線的創(chuàng)業(yè)者心心念念……

直到你聽說過那段既艱難又幸運(yùn)的歲月,一切便了然于心——唯有越了解真相,才會(huì)變得越務(wù)實(shí)。

人生的絕妙之處也在于此,改變他們的不是早年風(fēng)光的求學(xué)路,也并非當(dāng)下所擁有的物質(zhì)地位,而是源于一次又一次被質(zhì)疑和誤解后的絕地「自證」——不同于象牙塔里、試驗(yàn)臺(tái)前的公示推理和仿真驗(yàn)證,商業(yè)場上的「自證」需要拿出實(shí)實(shí)在在的業(yè)務(wù)指標(biāo)和實(shí)際效果,正如阿里辦公區(qū)里那句隨處可見的標(biāo)語——「NO DATA,NO BB」。

強(qiáng)壓之下的「自證」氛圍造就了科學(xué)家們近乎苛刻現(xiàn)實(shí)的技術(shù)價(jià)值觀。

待繁務(wù)卸下,他們重拾赤子之心,沉浸于算法公式和理論推理的樂趣。但人生并不總有自由浪漫的時(shí)刻,更漫長的是披荊斬棘的孤獨(dú)與煎熬。

通過和近十位阿里巴巴人工智能科學(xué)家的對(duì)話與交流,本文試圖還原阿里打造人工智能技術(shù)體系的荊棘路,以及路途中科學(xué)家們的內(nèi)心征途。

1 . 既艱難又幸運(yùn)

多年以后,遇上北京的霧霾天,漆遠(yuǎn)沒準(zhǔn)依然會(huì)想起那個(gè)加班的春節(jié)——西大望路的阿里媽媽會(huì)議室里,一桌人戴著口罩開著會(huì),工位上的空氣凈化器呼呼作響,窗外是望不到對(duì)面樓的霧霾天。

回國前,漆遠(yuǎn)已經(jīng)在腦海中羅列過一連串的適應(yīng)清單,以備回國后的各種挑戰(zhàn),而「迷霧危機(jī)」大概是被遺漏的最重要的一條,它不僅來自于北京的天氣,還包括那個(gè)大膽的決定。

漆遠(yuǎn)曾走過一條無數(shù)理工男夢想的坦途:31 歲麻省理工大學(xué)博士畢業(yè),39 歲成為一流大學(xué)終身教授,定居美國,擁有寬敞明亮的實(shí)驗(yàn)室和獨(dú)棟別墅,一位美麗的太太以及兩個(gè)可愛的孩子,一年兩次固定的長假足以讓他兼顧工作和生活的完美平衡。

直到一次大膽的決定,漆遠(yuǎn)親手打破了這種平衡。在拒絕谷歌、Facebook、百度等公司的邀約后,漆遠(yuǎn)決定歸國到杭州工作,選擇了當(dāng)時(shí)看起來「最沒有技術(shù)范兒」的阿里。

2014 年 9 月 19 日,時(shí)任阿里巴巴合伙人的王堅(jiān)帶著漆遠(yuǎn)來到紐交所,共同見證了阿里巴巴的上市,7 位敲鐘人全是阿里電商的買家和賣家,卻沒有一位是科學(xué)家。

面向華爾街,這家彼時(shí)市值 2400 億美金的公司并不滿足被定義為一家「電商公司」。他正在謀劃一個(gè)嶄新而宏偉的「想象力故事」,以便讓公司在未來獲得更強(qiáng)勁的增長動(dòng)力。

他明白,前沿技術(shù)會(huì)是這個(gè)故事的主角,緊接著 iDST(數(shù)據(jù)科學(xué)與技術(shù)研究院 Institute of Data Science & Technologies)宣布成立,漆遠(yuǎn)和金榕成為早期創(chuàng)始人。

但彼時(shí)彼地,故事聽起來不免有些冒險(xiǎn)主義——中國互聯(lián)網(wǎng)市場仍處在模式創(chuàng)新的初級(jí)階段,一家以商業(yè)利益為本的企業(yè)憑什么打造技術(shù)驅(qū)動(dòng)的研究院?國內(nèi)幾乎沒有任何成功的營運(yùn)模式可以參考。

未知的挑戰(zhàn)首先降臨到了早期創(chuàng)始人和研究機(jī)制身上。

漆遠(yuǎn),現(xiàn)達(dá)摩院金融智能實(shí)驗(yàn)室 負(fù)責(zé)人

加入阿里后,漆遠(yuǎn)接到的首個(gè)任務(wù)是打造一套大規(guī)模機(jī)器學(xué)習(xí)平臺(tái),落地到淘寶的廣告平臺(tái)阿里媽媽。他清楚地記得,當(dāng)時(shí)手里攥著兩千萬特征,14 天的數(shù)據(jù)。由于數(shù)據(jù)量太少,他計(jì)劃積累到半年數(shù)據(jù)后再啟動(dòng)。

同時(shí),他還提交了一份申請(qǐng)數(shù)千臺(tái)服務(wù)器的計(jì)劃。這并不是一筆小數(shù)目,直到現(xiàn)在一塊英偉達(dá)的計(jì)算卡仍然要價(jià) 2000 美金,計(jì)劃討論后就被否決了。

等了半年,服務(wù)器仍沒有撥下來,巧婦也難為無米之炊。「當(dāng)時(shí)沒有 CPU 集群,整個(gè)集團(tuán)都沒有」,漆遠(yuǎn)說道,「同事們認(rèn)為,『你們這幫教授老師過來,基本不懂業(yè)務(wù),也不懂技術(shù)』」。

秀才遇到兵,有理說不清。漆遠(yuǎn)的團(tuán)隊(duì)陷入了不能「自證」的悖論里:沒有 CPU 集群,如何證明自己的算法和技術(shù)高效?不能證明自己的算法和技術(shù)高效,如何爭取到 CPU 集群?

漆遠(yuǎn)曾試圖據(jù)理力爭,僵持狀態(tài)幾近半年,「團(tuán)隊(duì)一度走在解散的邊緣」。

金榕是 iDST 的另一位創(chuàng)始人,美國密歇根州立大學(xué)終身教授,曾獲得過美國國家科學(xué)基金會(huì)獎(jiǎng)(漆遠(yuǎn)也獲得過該獎(jiǎng))——有超過 200 位諾貝爾獎(jiǎng)得主都獲得過這個(gè)獎(jiǎng)金的資助。

金榕,現(xiàn)達(dá)摩院機(jī)器智能研究領(lǐng)域 負(fù)責(zé)人

金榕帶領(lǐng)團(tuán)隊(duì)為「聚劃算」提供流量分發(fā)的技術(shù)優(yōu)化,團(tuán)隊(duì)很自然地把低價(jià)商品排列在搜索和推薦結(jié)果的前列以提升成交量,卻忽視了對(duì)業(yè)務(wù)本質(zhì)的理解——低價(jià)雖可刺激購買,卻讓目標(biāo)用戶群從二三城市轉(zhuǎn)移到三四線城市。

「雖然 GMV 上去了,但產(chǎn)品的價(jià)值都變了」,金榕說道。

業(yè)務(wù)為技術(shù)開路,科學(xué)家們卻在無意中篡改了產(chǎn)品的內(nèi)核,「短板暴露得非常明顯」,金榕談道。當(dāng)時(shí)團(tuán)隊(duì)多為研究背景,精通基礎(chǔ)理論,卻缺少業(yè)務(wù)理解和工程實(shí)踐經(jīng)驗(yàn),所以看不到技術(shù)到產(chǎn)品中間的巨大鴻溝。

「你們要想在阿里發(fā)揮出真正的價(jià)值,就必須克服這些困難」,當(dāng)時(shí)的阿里 COO 張勇找到金榕和幾個(gè)骨干說道。

既然不夠熟悉業(yè)務(wù),那就去到第一現(xiàn)場吧!

于是,iDST 的早期科學(xué)家們兵分多路,以電商和金融兩大核心業(yè)務(wù)為首,深入到產(chǎn)品和工程里。金榕帶著團(tuán)隊(duì)進(jìn)入到淘寶和天貓的搜索事業(yè)部,漆遠(yuǎn)和幾位同事去了螞蟻金服,做語音的團(tuán)隊(duì)則留在了阿里云。后來這被稱為阿里科學(xué)家們的「上山下鄉(xiāng)」運(yùn)動(dòng)。

技術(shù)的覺醒并不止于高層,更早些,一股從下至上的創(chuàng)新力量就竄上了頭,內(nèi)部創(chuàng)新的文化開始流行——「只要你的老大不反對(duì),就是對(duì)你最大的支持」。

2013 年的十一國慶,李昊印象尤其深刻。他沒有旅游計(jì)劃,也不用回老家走街串巷,而是一人悶頭在辦公室里搗鼓。一連七天,他都在工位上敲打著鍵盤,像是著了魔。

終于,趕在假期結(jié)束前,他長舒一口氣——Demo 跑通了,由一塊 GPU 搭上一臺(tái)主機(jī),純手寫的用于圖像搜索的深度學(xué)習(xí)算法。再簡陋不過的裝置,但結(jié)果令人欣慰——比傳統(tǒng)算法的準(zhǔn)確度有了明顯提升。

正值第三次人工智能浪潮起勢,ImageNet 大賽進(jìn)入到第三屆,深度學(xué)習(xí)教父 Geoff Hinton 和他學(xué)生設(shè)計(jì)的 AlexNet 在賽事中大放異彩,基于深度神經(jīng)網(wǎng)絡(luò)的思路一舉解決了圖像分類的棘手難題,至此開啟神經(jīng)網(wǎng)絡(luò)百家爭鳴的盛況,更深、更寬的網(wǎng)絡(luò)層出不窮。

李昊從外文網(wǎng)站上讀到這些消息時(shí)備受鼓舞,他博士畢業(yè)于中科院光電技術(shù)研究所,來阿里不到一年,滿腔學(xué)以致用的迫切。

李昊,阿里巴巴資深算法專家

早在 2010 年,谷歌豪擲 1 億美金收購圖像購物搜索網(wǎng)站 Like.COM,掀起全球圖像搜索的風(fēng)口。文字搜索場景有限,圖片描述更為加精確,微軟、亞馬遜、百度紛紛出手,阿里也順勢投資了一家圖搜購物網(wǎng)站(現(xiàn)名為「淘淘搜」),通過識(shí)別圖片上的實(shí)體物品來索引網(wǎng)絡(luò)上對(duì)應(yīng)的店鋪鏈接。

遺憾的是,隨著移動(dòng)互聯(lián)網(wǎng)時(shí)代的到來,圖搜風(fēng)口很快熄火,手機(jī)實(shí)拍圖的普及,讓搜索結(jié)果越來越不可控,圖搜應(yīng)用體驗(yàn)大幅受挫,不少創(chuàng)業(yè)公司瀕臨倒閉。

「實(shí)拍圖的比對(duì)相比 PC 的原圖難得不是一星半點(diǎn),已經(jīng)不是傳統(tǒng)圖搜技術(shù)能應(yīng)付過來的」,李昊說道。

既然傳統(tǒng)圖搜技術(shù)已經(jīng)無以為繼,那在視覺領(lǐng)域技驚四座的深度神經(jīng)網(wǎng)絡(luò)能否奏效?為此,李昊花了整個(gè)國慶假期來驗(yàn)證這個(gè)想法。

「他很興奮,一直給這個(gè)看,給那個(gè)看,非常大力地推廣」,李昊回憶起將Demo交給主管時(shí)的場景。就這樣,團(tuán)隊(duì)爭取到一次向時(shí)任淘寶 CEO 展示的機(jī)會(huì),這次是直接在手機(jī)端演示——手機(jī)拍照,實(shí)拍圖和庫里已有圖片做比對(duì)檢索,找到和相似的照片顯示——相比傳統(tǒng)算法提升了一倍。

很快,「圖像搜索」項(xiàng)目在 2014 年正式啟動(dòng),目標(biāo)是落地到手淘(手機(jī)淘寶應(yīng)用)平臺(tái)。剛來阿里三個(gè)月的潘攀被任命為負(fù)責(zé)人,兼顧算法、工程、產(chǎn)品的統(tǒng)籌,團(tuán)隊(duì)力量充沛。潘攀畢業(yè)于美國伊利諾伊大學(xué)芝加哥分校博士,此前在美國三菱波士頓研究院、北京富士通研發(fā)中心從事視覺領(lǐng)域的研發(fā)工作。

潘攀,現(xiàn)達(dá)摩院視覺智能研究領(lǐng)域 資深算法專家

延續(xù)此前團(tuán)隊(duì)推動(dòng)的技術(shù)路徑,「圖搜」采用深度學(xué)習(xí)技術(shù),隨之成為阿里歷史上最早采用深度學(xué)習(xí)技術(shù)并上線的 C 端應(yīng)用產(chǎn)品。

和大多數(shù)互聯(lián)網(wǎng)公司戰(zhàn)略先行的思路不同,阿里在技術(shù)探索的早期并沒有大刀闊斧地批項(xiàng)目,而是從現(xiàn)有的核心業(yè)務(wù)盤子上找切口,克制而謹(jǐn)慎地實(shí)驗(yàn)性驗(yàn)證,然后才推動(dòng)落地。

「當(dāng)組織里的算法和研發(fā)比較少,更多是由業(yè)務(wù)和產(chǎn)品構(gòu)成時(shí),就決定了大家對(duì)于技術(shù)不確定性的理解會(huì)非常有限」,潘攀說道,「對(duì)于一家互聯(lián)網(wǎng)公司,做項(xiàng)目就一定要做出來,看得到結(jié)果」。

這是一個(gè)又艱難又幸運(yùn)的過程,當(dāng)行動(dòng)早于認(rèn)知,缺少資源、無人信任、無法施展等困境便接踵而來,這既是商業(yè)公司的盈利性質(zhì)所決定的,也是新生事物萌芽期所必經(jīng)的考驗(yàn)。

但幸運(yùn)的是,無論是自上而下的理想主義,還是自下而上的創(chuàng)新力量都得以保留,幸免于曇花一現(xiàn)的口號(hào)和想法。

火種尚存便可以燎原。

2. 坐在金山上啃饅頭

「坐在金山上啃饅頭」,這是漆遠(yuǎn)加入 iDST 時(shí)聽馬云說過的話。金山就是阿里巴巴擁有的豐富數(shù)據(jù)。但是即便坐擁金山啃饅頭,也難以一口吃成個(gè)大胖子,「如果數(shù)據(jù)的價(jià)值不能被挖掘出來,那不過就是普通的土壤」。

隨著深度學(xué)習(xí)算法與模型的普及應(yīng)用,「調(diào)參」工作成為大部分算法工程師的日常,淘寶和天貓的搜索團(tuán)隊(duì)一開始也不例外。

因?yàn)樯疃葘W(xué)習(xí)算法的不可解釋性,很多基于該技術(shù)的方案就像是一個(gè)「黑盒」,模型中的參數(shù)選擇和調(diào)整成了一件難捉摸的事,往往意味著繁瑣而毫無頭緒,沒有技術(shù)含量。

在漆遠(yuǎn)看來,光是調(diào)參遠(yuǎn)不能建立起技術(shù)體系,「雖然屬于工程層面的工作,但仍需要科學(xué)的思想指導(dǎo)——最好的工程指導(dǎo)就是科學(xué),否則你就只能是一名調(diào)參工程師」。

與漆遠(yuǎn)秉持同一觀點(diǎn)的還有金榕。「原來我們都是做些調(diào)參工作,直到金榕老師來了之后才把我們帶上正軌」,李昊談道,「他常反問我們,深度學(xué)習(xí)為什么能奏效?你能從理論上解釋嗎?」

「圖搜」項(xiàng)目之后,李昊便來到了搜索技術(shù)部——阿里最為核心的算法部門之一。在這里,李昊遇到了前來深入業(yè)務(wù)第一線的金榕。

李昊當(dāng)時(shí)的主要工作是為深度學(xué)習(xí)模型進(jìn)行壓縮與加速優(yōu)化,一般做法是套用現(xiàn)有模型,但金榕通常會(huì)提供新的思路,「他給了我們一堆的公式,讓我們?nèi)ピ嚒梗@一試就是三個(gè)月,也沒出結(jié)果。

當(dāng)李昊和同事懷著忐忑的心情找到金榕,他并沒有因此責(zé)備,反而給予鼓勵(lì),「如果三個(gè)月就能做出來,那就是太簡單了,繼續(xù)去做吧!」直到第四個(gè)月算法總算跑通。這套算法將Embedding 技術(shù)結(jié)合深度學(xué)習(xí)引入到搜索業(yè)務(wù)中,明顯提升了淘寶主搜索的 GMV。

李昊回憶,當(dāng)時(shí)金榕還做了一套非常長的理論證明,證明算法是可收斂的,并在內(nèi)部分享,「他當(dāng)時(shí)給予我們的理論指導(dǎo),正是我們所稀缺的」,李昊對(duì)此十分感激。

來到螞蟻金服的漆遠(yuǎn)則接到了智能客服的項(xiàng)目,通過智能交互機(jī)器人來解決支付寶的客服問題。這一次,他順利很多,獲得當(dāng)時(shí)集團(tuán)客戶服務(wù)部負(fù)責(zé)人戴珊的支持后(戴珊是阿里巴巴早期創(chuàng)始的十八羅漢之一),很快爭取到了資金和資源進(jìn)行技術(shù)的驗(yàn)證。

在阿里科技發(fā)展早期,以阿里合伙人為代表,形成了一股來自理想主義的推動(dòng)力量。

2015 年的雙十一,首次采用深度學(xué)習(xí)技術(shù)的支付寶客服實(shí)現(xiàn)了 94% 語音自助,這意味著有 94% 打來的電話不再需要轉(zhuǎn)接到人工服務(wù),次年,這個(gè)數(shù)字提升到 97%。去除掉人工智能團(tuán)隊(duì)的人員工資和計(jì)算資源成本,智能客服項(xiàng)目為公司節(jié)省了一個(gè)多億。

所謂「知人善用,人盡其才」,技術(shù)工具同樣如此,唯有了解 AI,才能用好 AI。

要在一家互聯(lián)網(wǎng)公司里樹立起對(duì)于新技術(shù)的認(rèn)知和信仰并非易事,這為科學(xué)家們?cè)O(shè)置了一道又一道的障礙欄,甚至不可避免地造成了人員流失。

但回過頭來看,或許正是有了「上山下山」的共事經(jīng)歷,才算是真正打通了「研發(fā)」和「業(yè)務(wù)」的對(duì)話體系,讓陽春白雪和下里巴人從此互融。

技術(shù)之后,便是產(chǎn)品工程化的進(jìn)階挑戰(zhàn)。

哪怕有高層支持,也不意味著就此被保駕護(hù)航,伴隨而來的反而是更大的壓力。圖搜立項(xiàng)的第一年就設(shè)定了明確目標(biāo)——日活過百萬,「打從立項(xiàng)之初就不再是實(shí)驗(yàn)性的了」。

與初期的深度學(xué)習(xí)算法探索不同,后期的挑戰(zhàn)就像無底洞一樣填不滿。

「問題的關(guān)鍵在于,我們不是在做一個(gè)獨(dú)立的 APP,而是讓它落在手淘上」,潘攀說道,「而且還是阿里最為核心的業(yè)務(wù)平臺(tái)」。落地手淘,意味著圖搜需要調(diào)用手淘的底層接口,需要針對(duì)淘寶內(nèi)部的鏈路架構(gòu)做額外定制和調(diào)配,而淌通這些鏈路就是最大挑戰(zhàn)。

在視覺領(lǐng)域,大規(guī)模圖片的壓縮極其消耗算力,這為大規(guī)模的圖搜訪問埋下了隱患,一次意外報(bào)警讓潘攀記憶猶新。

一天,圖搜的服務(wù)器突然被拖垮,后臺(tái)出現(xiàn)報(bào)警。

經(jīng)過緊急排查,團(tuán)隊(duì)才發(fā)現(xiàn),原來是淘系后臺(tái)針對(duì)圖像上傳的默認(rèn)壓縮功能拖垮了服務(wù)器。默認(rèn)壓縮主要針對(duì)低頻、小訪問量的媒體上傳需求,但并沒有考慮到圖搜的特殊情況——數(shù)據(jù)規(guī)模大,且需要實(shí)時(shí)識(shí)別,所以已經(jīng)在前端預(yù)設(shè)壓縮功能。換句話說,淘系的圖片默認(rèn)壓縮對(duì)于圖搜反而是一種負(fù)擔(dān)。

在發(fā)生警報(bào)之前,大家都忽略了這么細(xì)微的接口。潘攀談道,「很多時(shí)候就是這樣,即使我們自己考慮到位了,但如果要連接到更大的系統(tǒng)上,還是會(huì)出問題」。

上線并不意味著挑戰(zhàn)結(jié)束,比如,還有深不可測的入口。潘攀清楚地記得,圖搜第一次上線的位置是手淘的一個(gè)四級(jí)菜單里。「四級(jí)」,則意味著你首先要在首頁里找到「發(fā)現(xiàn)」,然后點(diǎn)開「特色服務(wù)」,點(diǎn)擊「更多」,再……

作為阿里最為核心的業(yè)務(wù)戰(zhàn)場,手淘的態(tài)度顯而易見——「愿意給技術(shù)機(jī)會(huì),但也要求風(fēng)險(xiǎn)可控」。

機(jī)會(huì)需要爭取,更需要「自證」其價(jià)值。

從最初上線的數(shù)千日活,過百萬,過千萬,一直到突破 2000 萬,圖搜應(yīng)用一路躍升為淘寶首頁導(dǎo)購類目的第一。但與此同時(shí),外界的質(zhì)疑聲不斷,「我印象特別深,每一年大家都在問,數(shù)據(jù)還能增長嗎?……你還在做呀?做啥呢?」潘攀說道。

不被理解似乎成為開拓者的宿命,漆遠(yuǎn)回憶早期的探索時(shí)期,「當(dāng)時(shí)對(duì)我最大的鍛煉就是,不被理解是正常的」。

這或許可以稱之為某種樂觀主義,但毋庸置疑,對(duì)于技術(shù)的信仰正是面對(duì)困境和誤解時(shí)不可或缺的堅(jiān)實(shí)力量。

經(jīng)歷過焦灼而艱難的資源「抗?fàn)帯购螅徇h(yuǎn)手中的分布式機(jī)器學(xué)習(xí)平臺(tái)終于啟動(dòng),為了盡早讓平臺(tái)上線,團(tuán)隊(duì)放棄年底休假,春節(jié)期間留守奮戰(zhàn),骨干密集開會(huì)頭腦風(fēng)暴。「當(dāng)時(shí)切身地感受到了團(tuán)隊(duì)的戰(zhàn)斗力,大家真的是非常相信,只要上線效果一定能好」,漆遠(yuǎn)回憶。

雙十一期間,平臺(tái)首次實(shí)現(xiàn)淘寶、天貓個(gè)性化推薦的大規(guī)模應(yīng)用。那一年的阿里巴巴集團(tuán)算法大獎(jiǎng)上,漆遠(yuǎn)帶領(lǐng) 80 人的團(tuán)隊(duì)包攬了 16 項(xiàng)獎(jiǎng)中的 6 項(xiàng)。現(xiàn)在,漆遠(yuǎn)作為達(dá)摩院金融智能方向的負(fù)責(zé)人,帶領(lǐng)團(tuán)隊(duì)構(gòu)建面向金融經(jīng)濟(jì)場景的智能分析與決策技術(shù)。

另一邊,在經(jīng)歷了搜索類目擴(kuò)增、數(shù)據(jù)優(yōu)化、算法迭代等多方面的升級(jí)后,「圖搜」項(xiàng)目完成三次入口躍遷,終于在 2015 年雙十一期間進(jìn)入首頁。讓潘攀頗為自豪的是,圖搜的數(shù)據(jù)一直依靠自然增長,幾乎沒有調(diào)用過手淘的商業(yè)推廣資源。

入口升級(jí)的本質(zhì)是一個(gè)不斷「自證」的過程,由技術(shù)和技術(shù)背后的推動(dòng)者們?cè)谝淮斡忠淮蔚奶魬?zhàn)中完成,繼而固化下來成為阿里技術(shù)產(chǎn)品的迭代傳統(tǒng)。

不同于象牙塔里、試驗(yàn)臺(tái)前的公示推理和仿真驗(yàn)證,商業(yè)場上的「自證」需要實(shí)實(shí)在在的業(yè)務(wù)指標(biāo)和實(shí)際效果,正如阿里辦公區(qū)里那句隨處可見的標(biāo)語——「NO DATA,NO BB」。

高速增長的背后是兩年一次的系統(tǒng)大改,「阿里其實(shí)非常講究創(chuàng)新,我們一般都不炒冷飯」,潘攀說道,他將圖搜系統(tǒng)的發(fā)展分為三個(gè)時(shí)期,「每一次升級(jí)不僅是算法進(jìn)步,而是整體思路的提升」。

「數(shù)據(jù)、系統(tǒng)、算法三個(gè)互為一體。對(duì)數(shù)據(jù)認(rèn)知和處理方法的不同視角,催生了與之匹配的算法和工程系統(tǒng),所以升級(jí)是整個(gè)系統(tǒng)層面的」。

項(xiàng)目早期,數(shù)據(jù)量少,還需要人工標(biāo)注,所以研究為之匹配的小模型的系統(tǒng)和算法;隨后訓(xùn)練數(shù)據(jù)解放,團(tuán)隊(duì)嘗試通過用戶行為的三類數(shù)據(jù)(查詢數(shù)據(jù)、點(diǎn)擊數(shù)據(jù)、未點(diǎn)擊數(shù)據(jù))分析出數(shù)據(jù)與排序間的邏輯關(guān)系,三元組的 Deep Ranking 框架生成,與之對(duì)應(yīng)的訓(xùn)練框架、系統(tǒng)升級(jí)迭代;去年,圖搜開始接入超大規(guī)模并行處理平臺(tái),釋放數(shù)十億級(jí)數(shù)據(jù)的訓(xùn)練能力。

與百度識(shí)圖、微信掃一掃、京東拍照購等市面上的其他圖搜應(yīng)用不同,阿里更強(qiáng)調(diào)「通用化」能力,比如不僅能支持手淘所有的實(shí)體商品檢索,還包括二維碼、植物、垃圾等非商品的識(shí)別與分類。這些功能統(tǒng)統(tǒng)集成在圖搜一個(gè)窗口里,不用再二次跳轉(zhuǎn),平均日活達(dá)到 2000 萬以上。

在研究員的成長道路上,經(jīng)歷一次完整的技術(shù)工程化落地的意義重大,它不僅錘煉了實(shí)戰(zhàn)能力,更為其提供了深入了解業(yè)務(wù)所想、業(yè)務(wù)所需的窗口。

「這段經(jīng)歷讓我們明白了應(yīng)該創(chuàng)造和推動(dòng)什么樣的技術(shù),知道哪些技術(shù)更有可能落地成為產(chǎn)品,以及如何讓一個(gè)產(chǎn)品能夠有效地支撐業(yè)務(wù)」,金榕談道。

可以說,從研發(fā)到業(yè)務(wù)的實(shí)戰(zhàn)積累正是阿里打造AI 技術(shù)落地體系的基石。

如今,這套思想貫徹到阿里大大小小的技術(shù)思路中。比如,在語音技術(shù)團(tuán)隊(duì)今年推出的語音合成技術(shù) KAN-TTS(Knowledge-Aware Neural TTS)中,團(tuán)隊(duì)就事先考慮到了不同環(huán)境下的模型部署環(huán)境,并進(jìn)行框架設(shè)計(jì)和效率優(yōu)化,綜合各項(xiàng)需求的關(guān)鍵算法改進(jìn)多達(dá)20余項(xiàng),最終實(shí)現(xiàn)了無論是在云端還是終端,甚至是 CPU 存儲(chǔ)有限情況下的最快速度部署。

一項(xiàng)技術(shù)能否在設(shè)計(jì)之初就考慮到項(xiàng)目部署階段遇到的各種實(shí)際問題,正是技術(shù)落地體系成熟的重要標(biāo)志。

3. 中國研究院沒有Benchmark

「它是阿里巴巴國際化業(yè)務(wù)的技術(shù)生命線,如果沒有這些能力,阿里巴巴很難稱之為一家國際化公司」,這段底氣十足的話出自司羅。

他是阿里達(dá)摩院語言技術(shù)實(shí)驗(yàn)室負(fù)責(zé)人,帶領(lǐng)百余人的隊(duì)伍進(jìn)行自然語言理解、機(jī)器翻譯、認(rèn)知智能等底層技術(shù)的開發(fā),這些技術(shù)被譽(yù)為人工智能皇冠上的明珠。

司羅,現(xiàn)達(dá)摩院語言技術(shù)實(shí)驗(yàn)室 負(fù)責(zé)人

司羅專注于機(jī)器學(xué)習(xí)、NLP 等領(lǐng)域的研究,2012 年成為普渡大學(xué)計(jì)算機(jī)系終身教授后,一舉奠定了其在學(xué)術(shù)圈的地位。同金榕、漆遠(yuǎn)一批,司羅在 2014 年加入 iDST,是阿里建立人工智能技術(shù)體系的早期成員。

相較于視覺、語音更貼近前端用戶的技術(shù),語言則更偏向底層,以原子化能力的形式起作用,扮演著賦能和支撐的角色。正因?yàn)檫@個(gè)特點(diǎn),它對(duì)于大型互聯(lián)網(wǎng)技術(shù)公司而言往往不可或缺,但技術(shù)團(tuán)隊(duì)卻又是極其分散的。

既然如此,為何不集中力量打通?

于是,語言技術(shù)恰好成為了技術(shù)平臺(tái)化的最佳試驗(yàn)場。

2016 年 10 月,對(duì)于司羅和 NLP 團(tuán)隊(duì)而言是一個(gè)重要的時(shí)間節(jié)點(diǎn)。此前,他們忙于承接一個(gè)個(gè)「項(xiàng)目」,先后參與過「聚劃算」、「AIios」「淘寶頭條」等項(xiàng)目。

在這之后,司羅領(lǐng)到任務(wù)——將 NLP 的「大中臺(tái)」建立起來,換句話說,阿里各業(yè)務(wù)線的 NLP 不再各自為營。

為了讓其他業(yè)務(wù)線接入平臺(tái),司羅采取了「品牌效應(yīng)」的打法。

是的,在公司內(nèi)部,同樣需要建立品牌,尤其在打造規(guī)模化平臺(tái)的過程中。

「首先要有非常貼身的服務(wù),然后讓重點(diǎn)的頭部用戶用起來,逐步地讓他們認(rèn)識(shí)到 NLP 平臺(tái)和解決方案的好處,再通過種子用戶將我們的技術(shù)價(jià)值傳播出去」,司羅知無不言地分享了品牌效應(yīng)的打造「套路」。

而正是因?yàn)榧夹g(shù)平臺(tái)化的出現(xiàn),讓這只百余人的隊(duì)伍能夠支持阿里系 600余個(gè)業(yè)務(wù)方,每天調(diào)用量達(dá)到了兩萬億次。

這是 NLP 技術(shù)影響力從量變到質(zhì)變的飛躍。

沿用同樣的思路,司羅帶領(lǐng)的另一條技術(shù)分支——機(jī)器翻譯技術(shù)也實(shí)現(xiàn)了規(guī)模化的業(yè)務(wù)支撐能力,為阿里全球化電商平臺(tái)上的買賣雙方提供 20 多種語言,48 種語言方向的機(jī)器翻譯服務(wù),覆蓋歐洲、亞洲、美洲與中東地區(qū)的絕大多數(shù)國家。

阿里的圖搜應(yīng)用在技術(shù)平臺(tái)化升級(jí)后,從最早的支持手淘平臺(tái)到目前落地到淘系的六個(gè)主流 APP,一舉成為全球最大的圖搜應(yīng)用系統(tǒng)。「這是淘系業(yè)務(wù)的市場份額決定的」,潘攀說道。

從單個(gè)功能應(yīng)用,到十個(gè)、百個(gè)、數(shù)百個(gè)的業(yè)務(wù)方支持,每天被億級(jí)用戶使用,技術(shù)平臺(tái)化的戰(zhàn)略得到了有效驗(yàn)證與認(rèn)可。尤其對(duì)于技術(shù)人員而言,通過平臺(tái)化的過程,單點(diǎn)技術(shù)的影響力不斷被泛化,技術(shù)的品牌效應(yīng)不斷地被放大。

但對(duì)于當(dāng)下的阿里而言,平臺(tái)化尚非終點(diǎn),「上云」更是一片廣闊的天地。

阿里內(nèi)部的海量業(yè)務(wù)和長期實(shí)戰(zhàn)的檢驗(yàn),為技術(shù)與方案移植到阿里云平臺(tái)提供了硬核實(shí)力。司羅表示,NLP 平臺(tái)和機(jī)器翻譯平臺(tái)已經(jīng)先后在阿里云上的人工智能板塊上線,供第三方的云計(jì)算客戶使用。

從單純的技術(shù)算法,到集成為業(yè)務(wù)和應(yīng)用中的產(chǎn)品,再到平臺(tái)化和大規(guī)模可復(fù)制化的云計(jì)算商品,這是一條阿里人自己走出來的 AI 落地路。

是時(shí)候?qū)⑦@條路子固化下來了!

2017 年 10 月 11 日,是阿里人工智能技術(shù)體系開宗明義的日子。

阿里巴巴 CTO 張建鋒宣布成立達(dá)摩院

杭州云棲大會(huì)現(xiàn)場,阿里巴巴 CTO 張建鋒宣布達(dá)摩院正式成立,計(jì)劃未來 3 年里投入超過 1000 億元,用于涵蓋基礎(chǔ)科學(xué)和顛覆式技術(shù)創(chuàng)新的研究。iDST 作為達(dá)摩院旗下最大的機(jī)器智能實(shí)驗(yàn)室分支,由金榕任帶隊(duì)。

時(shí)至今日,再談大公司建立研究院已不是新鮮事,但適應(yīng)于中國本土市場環(huán)境的成功模板仍然寥寥可數(shù)。

培養(yǎng)出中國最早一批 AI 研究員的微軟亞洲研究院被冠以「黃埔軍校」之名頻頻提起,投入巨大過于前沿的谷歌 X 實(shí)驗(yàn)室、DeepMind,IBM Waston 研究院形象「高大上」卻不夠接地氣。

中國互聯(lián)網(wǎng)公司已經(jīng)開始重點(diǎn)布局,但難以與公司業(yè)務(wù)平起平坐,百度幾大研究體系已被收編進(jìn)技術(shù)平臺(tái),騰訊四大實(shí)驗(yàn)室依附于各大業(yè)務(wù)呈分散狀。

至于阿里,在達(dá)摩院之前的三年探索和走過的彎路為其積累了不少寶貴經(jīng)驗(yàn),但如何乘勝追擊更進(jìn)一步成為領(lǐng)導(dǎo)者的新命題。

在金榕看來,達(dá)摩院的設(shè)立主要有兩個(gè)目標(biāo):一是把達(dá)摩院的 AI 基礎(chǔ)能力(原子能力)放到平臺(tái)上支撐所有業(yè)務(wù)。比如阿里內(nèi)部跟語音識(shí)別有關(guān)的業(yè)務(wù)都會(huì)使用達(dá)摩院的底層語音平臺(tái),但會(huì)根據(jù)具體業(yè)務(wù)做定制化的改變。

二是上云,通過內(nèi)部核心業(yè)務(wù)驗(yàn)證后,用戶的接受度和滿意度達(dá)到一定指標(biāo),產(chǎn)品上云商業(yè)化,進(jìn)一步放大價(jià)值,服務(wù)整個(gè)社會(huì)。

說到這,四年前王堅(jiān)為金榕描繪 iDST 藍(lán)圖,三句不離「Benchmark」的畫面在我眼前浮現(xiàn)。

「我記得從第一天起,王堅(jiān)就一直跟我們說 iDST 的 Benchmark 的是什么?」金榕說道。(Benchmark,基準(zhǔn),常用于性能測試中的表達(dá)。)

王堅(jiān)認(rèn)為是斯坦福研究院(簡稱 SRI,1970 年脫離斯坦福大學(xué)后,更名為「斯坦福國際咨詢研究院」)。「那里的基礎(chǔ)研究和其他地方都不一樣,不僅創(chuàng)造出了最好的理論知識(shí),還能把技術(shù)變成產(chǎn)品,產(chǎn)品收益再反哺到學(xué)術(shù)」,金榕回憶道,那時(shí)常舉的一個(gè)例子就是鼠標(biāo)的發(fā)明。

不止于鼠標(biāo),從手術(shù)機(jī)器人到航天靜電放電棒,從個(gè)人助理 Siri 再到癌癥治療,二戰(zhàn)后的斯坦福研究所幾乎成了硅谷高科技公司科技創(chuàng)新的「智慧之源」,不僅創(chuàng)造了新的行業(yè)、數(shù)十億美元的市場價(jià)值,還有持久的社會(huì)價(jià)值。

「一旦看到收益,人們很容易就聚焦在收割單個(gè)業(yè)務(wù)的成果上,而缺少更深入挑戰(zhàn)的動(dòng)力」,金榕認(rèn)為這也是達(dá)摩院——阿里 AI 技術(shù)中臺(tái)設(shè)立的意義——跳出單個(gè)業(yè)務(wù)成果,讓技術(shù)更深入,再往前跨一步,用更少的人力實(shí)現(xiàn)價(jià)值最大化。

經(jīng)過兩年的建設(shè),達(dá)摩院人才濟(jì)濟(jì),超過半數(shù)科學(xué)家具有名校博士學(xué)位,部分是美國、歐洲學(xué)成回國,辦公室分布在四個(gè)國家、八個(gè)主要城市,其中機(jī)器智能團(tuán)隊(duì)擁有 20 多位知名大學(xué)教授,近 10 位 IEEE FELLOW。

而在達(dá)摩院之外,阿里還有一些更為分散化、業(yè)務(wù)化的人工智能能力,并非走中臺(tái)化的路子,但仍是不可或缺的一環(huán)。比如天貓精靈、搜索和廣告部的人工智能技術(shù)應(yīng)用、螞蟻金服的客服機(jī)器人等,它們與核心業(yè)務(wù)方貼合地更為緊密,以便技術(shù)更快地產(chǎn)生效益。

要為這樣一支龐大而高規(guī)格的研究團(tuán)隊(duì)設(shè)置課題并不是件容易事。

此前,我在與某公司 AI 實(shí)驗(yàn)室負(fù)責(zé)人交流時(shí),對(duì)方就曾透露過選題上的兩難局面——一方面既要兼顧業(yè)務(wù)需求和 KPI 導(dǎo)向,另一方面還不能忘記前瞻性研究和技術(shù)布局。

整日埋頭對(duì)接業(yè)務(wù)需求容易退化為業(yè)務(wù)部門的附屬團(tuán)隊(duì)?但面對(duì)前沿課題的不確定性,究竟該冒多大的險(xiǎn),才能保證既有結(jié)果又具備開創(chuàng)性?

當(dāng)我將同樣的問題拋給阿里的人工智能科學(xué)家時(shí),得到了相似的回答,「這看起來是個(gè)問題,但在阿里就不是個(gè)問題」。

延續(xù)技術(shù)到產(chǎn)品、產(chǎn)品再到商業(yè)化的研究和落地機(jī)制,技術(shù)研發(fā)與商業(yè)利益的問題將得以平衡,而且必須平衡。

「在阿里如果只是發(fā)發(fā)論文、做做研究則意味著工作只做到了一半,無法獲得真正的認(rèn)可,或者是比較低的認(rèn)可」,潘攀說道。

與此同時(shí),在技術(shù)平臺(tái)化與產(chǎn)品規(guī)模化的過程中,還伴隨著水到渠成的技術(shù)成果轉(zhuǎn)化。

在被譽(yù)為人工智能世界杯的 CVPR 2019 WebVision 競賽中圖像分類競賽中,阿里以 82.54% 的識(shí)別準(zhǔn)確率獲得冠軍,而這背后的技術(shù)能力正是阿里「圖搜」應(yīng)用開出的果實(shí)。

談到更為宏觀的議題布局,金榕認(rèn)為投資者思維或許是一個(gè)思路。

作為一名投資人,標(biāo)的無非兩種,一是比較切實(shí)可靠的項(xiàng)目,但是收益比較少;另一種則是高風(fēng)險(xiǎn),但回報(bào)高,即所謂的「High Risk High Take Off」。幾乎所有投資公司的投資組合都是這兩種的混合。

作為研發(fā)部門,金榕會(huì)將技術(shù)資源進(jìn)行分層。一部分投資在相對(duì)較容易見到結(jié)果的領(lǐng)域上,具備確定性;還有一部分投入在可長周期回報(bào)的項(xiàng)目。「在這樣一個(gè)投資組合中,肯定有項(xiàng)目要失敗,但能保證團(tuán)隊(duì)整體的成長和健康」,金榕談道。

正好,他剛帶隊(duì)打完了一場「High Risk」的戰(zhàn)役。

那是阿里正在研發(fā)的自主云上人工智能加速芯片 NPU,達(dá)摩院承擔(dān)了部分算法工作,讓 NPU 在阿里的技術(shù)架構(gòu)上跑出最高性能。

為了能拿到 CTO 的「戰(zhàn)投」,金榕預(yù)先設(shè)置了一個(gè)非常高的指標(biāo),即假設(shè)所有條件都處于非常理想的條件下,相比 GPU 的性能有了不小的提升。

硬著頭皮上,一年多下來,終于收獲了理想結(jié)果。在金榕看來,設(shè)定高目標(biāo)雖然可能會(huì)引發(fā)焦慮和不適,但高目標(biāo)的每一次落地都將為團(tuán)隊(duì)實(shí)力帶來顯著提升,「這對(duì)于打造榮譽(yù)感,提振團(tuán)隊(duì)士氣非常奏效」。

在阿里內(nèi)部有一句話,「最好的團(tuán)建就是打一場勝仗」,融入阿里文化后的科學(xué)家們也開始明白這個(gè)道理了。

金榕身上所展現(xiàn)的冒險(xiǎn)精神,一部分來自他的個(gè)人性格,一部分還受到阿里早期技術(shù)氛圍的感染。早年間,王堅(jiān)力排眾議主導(dǎo)開發(fā)阿里云計(jì)算平臺(tái)時(shí),就常以一個(gè)「瘋子」的形象活躍在公司內(nèi)部。

「如果你當(dāng)真要解決難題,就需要調(diào)動(dòng)你所有的膽量和勇氣去接受挑戰(zhàn)」,金榕談道。

在計(jì)算機(jī)研究領(lǐng)域,通常將非常棘手的問題稱之為「NP-Hard」,大多數(shù)研究員一旦碰到這樣的問題都會(huì)給出否定的結(jié)論。但金榕的團(tuán)隊(duì)所推崇的恰是「Solve The Ban Problem」。

「在商業(yè)社會(huì),用戶和商家才不會(huì)在乎這個(gè),你不能因?yàn)?NP-hard 就止步」,金榕談道,「這對(duì)我來講是非常重要的原則,但凡這個(gè)研究是能夠產(chǎn)生巨大價(jià)值,就應(yīng)該全身心投入」。

不畏「禁忌」、冒險(xiǎn)而大膽——這是我從他人口中未曾聽說過的達(dá)摩院。

一脈相承的風(fēng)格不可避免地將滲透進(jìn)團(tuán)隊(duì),一旦拔得頭籌就將能讓每個(gè)成員體會(huì)到以一當(dāng)十的驚險(xiǎn),擁有勝者的姿態(tài),繼而發(fā)展成為阿里 AI 精神內(nèi)核的一部分。

當(dāng)上層建筑搭建完整,更為底層的技術(shù)正亟待突破,最為核心的指標(biāo)在于算力。

早年間漆遠(yuǎn)接手的首個(gè)項(xiàng)目大規(guī)模分布式機(jī)器學(xué)習(xí)平臺(tái),隨后由達(dá)摩院智能計(jì)算實(shí)驗(yàn)室負(fù)責(zé)人周靖人帶隊(duì)不斷迭代和完善,已經(jīng)進(jìn)入到第三代版本 PAI 3.0。今年三月加盟阿里的 AI 知名青年科學(xué)家賈揚(yáng)清還將為 PAI 注入更多力量。

賈揚(yáng)清畢業(yè)于美國加州大學(xué)伯克利分校計(jì)算機(jī)科學(xué)博士,加入阿里前在 Facebook 擔(dān)任工程總監(jiān),負(fù)責(zé)大規(guī)模人工智能平臺(tái)的架構(gòu)。他是 AI 深度學(xué)習(xí)框架 Caffe、Caffe2、Pytorch 的重要貢獻(xiàn)者之一,并曾參與谷歌人工智能平臺(tái) TensorFlow 的工作,GoogleNet 作者的之一。

因?yàn)樯疃葘W(xué)習(xí)框架領(lǐng)域的諸多貢獻(xiàn),賈揚(yáng)清在人工智能開發(fā)者群體中具有頗高人氣,在今年 7 月的阿里云峰會(huì)上,賈揚(yáng)清首次以阿里人身份亮相,不斷有年輕人過來和他談話與合影。

賈揚(yáng)清,現(xiàn)阿里巴巴計(jì)算平臺(tái)事業(yè)部 總裁

正值浙江一帶的酷暑,采訪室十分悶熱。「我是紹興人,沒法抱怨這天氣」,賈揚(yáng)清笑著說道。清華碩士畢業(yè)后,賈揚(yáng)清就長居海外,因?yàn)檗D(zhuǎn)戰(zhàn)阿里而經(jīng)常回國。紹興距離杭州不到 80 公里,來到阿里,不僅是回國,更是回鄉(xiāng),賈揚(yáng)清臉上有些止不住的喜悅。

和賈揚(yáng)清前后腳來到阿里的還有黃非,在金榕和司羅兩位老師的力薦下加入。黃非畢業(yè)于卡內(nèi)基梅隆大學(xué)博士,曾任 ACL、NLPCC 等領(lǐng)域主席、IJCAI 資深程序委員,在 Facebook 時(shí)負(fù)責(zé)機(jī)器翻譯和知識(shí)平臺(tái)。加入阿里后負(fù)責(zé)組建和領(lǐng)導(dǎo)國際化機(jī)器翻譯創(chuàng)新團(tuán)隊(duì)。

一如當(dāng)年的漆遠(yuǎn)、金榕一樣,這些年輕科學(xué)家們帶著由衷的使命感和期待來到「金山」,期待著實(shí)現(xiàn)自我價(jià)值的同時(shí),也為阿里經(jīng)濟(jì)體和中國互聯(lián)網(wǎng)做出應(yīng)有的貢獻(xiàn)。

4. 阿里的底牌

當(dāng)一件事物愈發(fā)完美或者強(qiáng)大,外界在其身上所寄托的期望值也將越來越高。

「最開始,公司只是希望技術(shù)能用在業(yè)務(wù)上得到一個(gè)好效果。今天,是真正希望我們能夠用技術(shù)創(chuàng)造未來,一個(gè)新的由技術(shù)驅(qū)動(dòng)的阿里巴巴」,金榕停了一會(huì)繼續(xù)說道,「這個(gè)期望遠(yuǎn)高于技術(shù)難題,是一個(gè)非常大的命題」。

一個(gè)技術(shù)驅(qū)動(dòng)的阿里巴巴?可能嗎?

在絕大部分人的眼中,對(duì)于阿里的定義仍然是一家依靠電商業(yè)務(wù)驅(qū)動(dòng)的互聯(lián)網(wǎng)公司。在 2019 財(cái)年的財(cái)報(bào)里,阿里的核心業(yè)務(wù)包括電商業(yè)務(wù)、阿里云、大文娛和創(chuàng)新業(yè)務(wù)四大板塊,其重要性依次排開。其中,電商業(yè)務(wù)創(chuàng)造了 3234 億收入,總營收占比高達(dá) 86%。

「這正是外界看不太懂的地方,我們可不可能創(chuàng)造未來?」

在金榕眼里,這個(gè)未來似乎已經(jīng)依稀可見,「我給你舉個(gè)例子,至少我自己是非常受激勵(lì)的,5G 技術(shù)就是突破口之一。隨著 5G 和高清視頻技術(shù)的發(fā)展,整個(gè)視頻內(nèi)容產(chǎn)業(yè)鏈都會(huì)帶來全新的變化,是對(duì)每一個(gè)環(huán)節(jié)的重塑……」

AI 之后,5G 之前,前瞻性的技術(shù)布局和技術(shù)融合或?qū)榘⒗锊葴?zhǔn)下一個(gè)時(shí)代節(jié)點(diǎn)。

讓我們把時(shí)間線拉近一些,現(xiàn)在或者近期的幾年內(nèi),在阿里的主營業(yè)務(wù)之下,還有什么能稱之為源動(dòng)力或者底牌的東西?

歐文武,阿里巴巴資深算法專家

眼前這位入職阿里 12 年的算法專家或許知道答案。

他叫歐文武,娃娃臉上時(shí)常掛著微笑,憨態(tài)可掬。他被視為「最懂中國女人的男人」,因?yàn)樗孟窨偰懿碌侥阆胭I點(diǎn)什么,然后在恰當(dāng)?shù)臅r(shí)候送到你眼皮底下。

歐文武是阿里巴巴搜索事業(yè)部總監(jiān),資深算法專家,負(fù)責(zé)淘寶推薦算法團(tuán)隊(duì),利用搜索和推薦技術(shù)讓電商產(chǎn)品推薦流,也就是人們常說的「千人千面」。

談到推薦業(yè)務(wù),賈揚(yáng)清曾在他的內(nèi)部分享《關(guān)于人工智能的一點(diǎn)淺見》中這樣描述:在阿里和很多互聯(lián)網(wǎng)企業(yè)中有一個(gè)「沉默的大多數(shù)」的應(yīng)用,就是推薦系統(tǒng):它常常占據(jù)了超過 80% 甚至 90% 的機(jī)器學(xué)習(xí)算力,如何將深度學(xué)習(xí)和傳統(tǒng)推薦系統(tǒng)進(jìn)一步整合,如何尋找新的模型,如何對(duì)搜索和推薦的效果建模,這些可能沒有像語音和圖像那么為人所知,卻是公司不可缺少的技能。

在阿里就有兩支重要團(tuán)隊(duì)負(fù)責(zé)這個(gè)「沉默的大多數(shù)」的應(yīng)用——搜索事業(yè)部與阿里媽媽。

雖然都做推薦系統(tǒng),技術(shù)與平臺(tái)相通,但和阿里媽媽強(qiáng)調(diào)變現(xiàn)的屬性不同,搜索事業(yè)部的推薦業(yè)務(wù)更看重用戶體驗(yàn),強(qiáng)調(diào)探索和發(fā)現(xiàn)的樂趣以增加平臺(tái)粘性,商業(yè)味道更淡薄。

而這看似的放手實(shí)則意味深長。

在 2018 年 Q3 財(cái)報(bào)會(huì)議前夕,阿里巴巴董事會(huì)臨時(shí)做出了一個(gè)反常決定——短期內(nèi)不對(duì)推薦推送等廣告庫存增量進(jìn)行貨幣化。簡言之就是停止對(duì)淘系平臺(tái)上的個(gè)性化推薦的規(guī)模商業(yè)化。

隨后的財(cái)報(bào)會(huì)議上,高盛銀行、匯豐銀行、花旗銀行的分析師們對(duì)該決定窮追不舍地發(fā)問,商業(yè)化時(shí)間點(diǎn)、利潤率、廣告創(chuàng)收等被反復(fù)提及,可見其分量和位置。但高管們?nèi)允乜谌缙俊?/p>

「千人千面」正是這塊「暫時(shí)未被商業(yè)化」業(yè)務(wù)背后的核心技術(shù)力量,它被視為「阿里的底牌」,是阿里基于技術(shù)驅(qū)動(dòng)業(yè)務(wù)的核心體現(xiàn),有望成為驅(qū)動(dòng)阿里未來營收增長的新引擎。

在電商業(yè)務(wù)的轉(zhuǎn)型期,推薦流業(yè)務(wù)蘊(yùn)藏著極大的價(jià)值潛力。隨著平臺(tái)上的商品越來越多,對(duì)所有用戶采用同一套搜索算法,已經(jīng)不能再滿足用戶的多樣化需求。垂直電商領(lǐng)域新型競爭對(duì)手的出現(xiàn)也倒逼著阿里對(duì)推薦業(yè)務(wù)進(jìn)行更深入的探索。

「它不僅僅展示了流量的增長,更體現(xiàn)出轉(zhuǎn)化率的增長」,阿里巴巴集團(tuán) CFO 武衛(wèi)說道,「推薦流為商家創(chuàng)造的價(jià)值,與淘寶在 10 年或 15 年所帶來的流量和交易價(jià)值并不是一回事,這背后還有消費(fèi)者參與的價(jià)值。該模式為商家提供了操盤工具,能夠親手來運(yùn)營和管理他們的用戶群體」。

極大的價(jià)值潛力,同時(shí)也意味著極大的業(yè)務(wù)挑戰(zhàn)。

光是在工程層面要應(yīng)付大規(guī)模數(shù)據(jù)就是一個(gè)難題。一般地,T 級(jí)(1 Tera Byte(TB)= 1024 GB)已經(jīng)是相當(dāng)大體量的數(shù)據(jù)存儲(chǔ)單位,但在歐文武部門,每天面對(duì)的是上升了三個(gè)數(shù)量級(jí)以后的 P 級(jí)(1 Peta Byte(PB) = 1024 TB)數(shù)據(jù)。

「這么大量的數(shù)據(jù),數(shù)據(jù)處理的方法,計(jì)算數(shù)據(jù)的準(zhǔn)確性和一致性都是挑戰(zhàn)」,他說道。

目前淘寶和天貓平臺(tái)有 7 億多用戶,每個(gè)用戶在平臺(tái)上留下的行為特點(diǎn)、訴求方向都極其分散,即重疊的數(shù)據(jù)很少,體現(xiàn)在技術(shù)層面就是數(shù)據(jù)的稀疏性,這對(duì)算法模型的體量和復(fù)雜程度提出了更高要求。

阿里內(nèi)部有個(gè)說法,推薦部門的算法是阿里最難進(jìn)的算法崗位。在招人方面,歐文武表示,他更傾向于應(yīng)屆生,團(tuán)隊(duì)目前 50 人左右,博士生 40%,清華北大畢業(yè)的將近一半。

團(tuán)隊(duì)維持在每年兩到三次大規(guī)模升級(jí)的節(jié)奏,「大升級(jí)就是以前那套全推翻,重建一套」,歐文武說道,小規(guī)模的升級(jí),比如加些新特征,改改模型等,則頻率高很多。

阿里每個(gè)財(cái)年都會(huì)依據(jù)各部門制定相關(guān) KPI,歐文武并沒有透露具體的 KPI。但他會(huì)在公司的KPI基礎(chǔ)上給團(tuán)隊(duì)開個(gè)小灶,制定一套「內(nèi)部 KPI」——比公司的要高出不少。

他通常會(huì)逐一拆分成許多個(gè)小目標(biāo),有人做用戶數(shù)據(jù),有人做匹配,有人做個(gè)性化排序……大概 20 多個(gè)小目標(biāo)同時(shí)推進(jìn)。

歐文武將其比喻成造車,車體需要拆分成很多零部件,大問題也要拆分成子問題,這樣每個(gè)子問題就能更準(zhǔn)確地評(píng)價(jià),依據(jù)每個(gè)小問題再設(shè)定成不同的目標(biāo),然后拼湊在一起以求大目標(biāo)可控。

目標(biāo)要可控,但算法講究靈活。

和一般算法追求極致的精準(zhǔn)性不同,推薦的算法還需要投其所好,新穎性和多樣性都是歐文武團(tuán)隊(duì)要考慮的維度。

以前,傳統(tǒng)推薦算法主要是通過歷史日志訓(xùn)練模型,缺少對(duì)用戶未知需求的探索,十分有限;技術(shù)迭代后,現(xiàn)在多采用演化算法、強(qiáng)化學(xué)習(xí)算法、非傳統(tǒng)的 AI 算法等多種算法融合,以求解決一個(gè)多目標(biāo)平衡的問題。

當(dāng)算法推薦不再局限于財(cái)務(wù)指標(biāo),歐文武希望建立一個(gè)與用戶共同成長的 Life-Long 式模式。在歐文武看來,當(dāng)下的推薦,停留在用戶單次訪問時(shí)長和瀏覽深度的指標(biāo)優(yōu)化;而更長遠(yuǎn)來看,用戶能否留存才是關(guān)鍵。

「滿意度不止在短期,而是長期的滿足和收獲。比如在購買之后,商品的安裝、使用、保養(yǎng)……全鏈路的購物體驗(yàn)都可以做」,歐文武說道。

參照線下的傳統(tǒng)購買場景,推薦的角色將不再局限于一名「導(dǎo)購員」,因?yàn)橛脩粲|達(dá)商品的每一個(gè)階段都在發(fā)生改變,推薦的內(nèi)涵也正在從商品推薦擴(kuò)寬消費(fèi)推薦,這也正是「李佳琦賣口紅」效應(yīng)興起的邏輯。

據(jù)阿里員工透露,推薦算法目前在關(guān)鍵指標(biāo)數(shù)據(jù)上有超過搜索的趨勢,未來潛力可觀。正如騰訊在微信廣場實(shí)驗(yàn)廣告位的價(jià)值,在推薦機(jī)制下,廣告除了帶來交易的價(jià)值,還有品牌展示和市場推廣等更多元的價(jià)值。

「我們?cè)谶@個(gè)方面仍然很克制,希望保持可持續(xù)性的增長」,歐文武說道,「不能用今天透支未來」。

在電商業(yè)務(wù)之后,云計(jì)算業(yè)務(wù)已經(jīng)上升到集團(tuán)的主要營收的第二位,阿里云智能總裁張建鋒在今年提出了「ALL in Cloud」的戰(zhàn)略。依托于云計(jì)算平臺(tái),阿里搭建了 AI 技術(shù)向 B 端產(chǎn)業(yè)賦能的各級(jí)大腦模塊,比如已經(jīng)成長為國家級(jí)人工智能開放創(chuàng)新平臺(tái)的城市大腦。

城市大腦是阿里第一個(gè)「原生于云場景」的重點(diǎn)業(yè)務(wù),它完全構(gòu)建在云上,打破了攝像頭與紅綠燈的割裂,讓攝像頭看到的數(shù)據(jù),告訴紅綠燈應(yīng)該如何優(yōu)化,從而實(shí)現(xiàn)大規(guī)模實(shí)時(shí)交通事故檢測。

3 年多以來,阿里的城市大腦走出杭州,在北京(西城、通州)、上海、蘇州、澳門、吉隆坡等境內(nèi)外十幾個(gè)城市落地。據(jù)城市大腦的技術(shù)負(fù)責(zé)人——達(dá)摩院高級(jí)研究員華先勝透露,平均一個(gè)星期的時(shí)間,城市大腦就可完成一個(gè)城市的技術(shù)部署。

華先勝,達(dá)摩院城市大腦實(shí)驗(yàn)室 負(fù)責(zé)人

而在計(jì)算層,「新一代計(jì)算引擎」已經(jīng)成為支撐起阿里千億成交額、每秒數(shù)萬筆交易的核心底層技術(shù),MaxCompute(離線計(jì)算)、Flink(實(shí)時(shí)計(jì)算)、PAI(人工智能)被視為這項(xiàng)技術(shù)背后的「三駕馬車」。

賈揚(yáng)清領(lǐng)導(dǎo)的阿里云智能計(jì)算平臺(tái)事業(yè)部,主要負(fù)責(zé)大數(shù)據(jù)計(jì)算和人工智能平臺(tái)。對(duì)于將大數(shù)據(jù)和人工智能兩大平臺(tái)打通這件事,賈揚(yáng)清深有感觸,「這樣的融合很具有前瞻性,阿里是全球少數(shù)的幾個(gè)把大數(shù)據(jù)和人工智能放在一起的部門。未來大數(shù)據(jù)和人工智能未來的結(jié)合將越來越緊密。」

在談到與達(dá)摩院的合作時(shí),他將其比喻成「我們都是『躺平了』來支持」。

所謂計(jì)算平臺(tái),要義之一,則是解決算力瓶頸。

這也是阿里的新一代神經(jīng)網(wǎng)絡(luò)芯片 NPU 的設(shè)計(jì)初衷,在賈揚(yáng)清看來,通過更底層的技術(shù)探索更大的計(jì)算潛力,切口在于「解耦」。

雖然谷歌用 TPU & TensorFlow 證明了硬件與框架融合模式的算力無窮,但別忘了還有英偉達(dá)——沒有框架,仍然成為了王者——背后的心法就在于「解耦」——解開硬件與框架綁定的枷鎖。

「解耦」的關(guān)鍵在于定義模型并讓其標(biāo)準(zhǔn)化,這需要下溯到編譯器層面。

「編譯器的優(yōu)化不僅能夠挖掘出現(xiàn)有硬件平臺(tái)的更強(qiáng)算力,還將在新硬件平臺(tái)上基于機(jī)器學(xué)習(xí)自動(dòng)迭代,大大縮短人力優(yōu)化軟件的時(shí)間」,而這也正是賈揚(yáng)清加入阿里后的目標(biāo)所指。

當(dāng)更深、更強(qiáng)、更底層的算力挖掘成為全球人工智能市場的主旋律,阿里 AI 迎來了「算法+芯片」的AI2.0時(shí)代:先后投資寒武紀(jì)、耐能等 AI 芯片團(tuán)隊(duì),收購中天微、先聲互聯(lián)等芯片標(biāo)的,成立「平頭哥」芯片公司。

目前,阿里已經(jīng)發(fā)布基于 RSIC-V 架構(gòu)的智能 IoT 芯片玄鐵,AI 語音 FPGA 芯片 Ouroboros設(shè)計(jì),基于云端的神經(jīng)網(wǎng)絡(luò)芯片「Ali-NPU」也已經(jīng)在路上。它們標(biāo)志著阿里 AI 技術(shù)「從軟到硬」的深化,也預(yù)示著 AI 將更為長久地驅(qū)動(dòng)著阿里經(jīng)濟(jì)體成長。

「因?yàn)闃I(yè)務(wù)需要發(fā)展,原來很多技術(shù)精力都聚焦在業(yè)務(wù)上,直到有一天,我們會(huì)非常迫切地希望,從技術(shù)出發(fā),用科技來驅(qū)動(dòng)業(yè)務(wù),然后培育出一些全新的業(yè)務(wù)」,蔣國飛聊起螞蟻金服的技術(shù)發(fā)展路線時(shí)說道。

他是達(dá)摩院金融科技研究領(lǐng)域負(fù)責(zé)人,同時(shí)也是螞蟻金服副總裁。對(duì)照阿里巴巴,他認(rèn)為,「阿里體量更大,所以已經(jīng)走到了前頭」。

當(dāng)技術(shù)晉升為一家互聯(lián)網(wǎng)公司的必需品時(shí),打造行之有效的研發(fā)體系則是不可回避的議題。

研究院或者實(shí)驗(yàn)室等機(jī)構(gòu)的設(shè)定本取自于學(xué)院體系,外殼借用倒是無妨,但如果連內(nèi)核和運(yùn)營模式也一同照搬到商業(yè)場,很大的概率就是水土不服止于襁褓。

在外殼之下,研究的機(jī)制、團(tuán)隊(duì)的建設(shè)、不同對(duì)話體系的打通、技術(shù)與業(yè)務(wù)的平衡,前瞻性與KPI的融合…才是商業(yè)公司研發(fā)體系的靈魂,一切尚需從長計(jì)議。

從2014年設(shè)立阿里最神秘部門iDST到如今人才濟(jì)濟(jì)的達(dá)摩院,阿里人工智能走過了既艱難又幸運(yùn)的五年,梳理出這套技術(shù)體系的機(jī)制和脈絡(luò)得以看清阿里人工智能的底色,推而廣之,或?qū)⒊蔀榛ヂ?lián)網(wǎng)公司打造人工智能技術(shù)體系的方法。

(0)
上一篇 2019年8月29日 16:16
下一篇 2019年8月29日 16:54
国产精品国产三级国产普通话蜜臀 | 国产日韩在线视频| 超碰在线亚洲| 性视频1819p久久| 精品国产精品国产偷麻豆| 国产欧美精品一区二区| 亚洲国产一区二区精品专区| 日韩久久久久久久| 成人午夜短视频| 中文字幕亚洲乱码| 精品国产31久久久久久| 久久久久久国产精品免费无遮挡 | 97精品久久久午夜一区二区三区| 国产二区视频在线播放| 亚洲免费三区一区二区| 美国一级片在线免费观看视频| 欧美一级一级性生活免费录像| 午夜激情在线播放| 久久久久久一区二区三区| 久久福利综合| 亚洲一区三区在线观看| 中文字幕av在线一区二区三区| 四色成人av永久网址| 欧美xxxx在线观看| 亚洲精品视频一二三区| 91视频免费在线观看| 久久99精品国产麻豆婷婷| 97公开免费视频| 欧美午夜宅男影院| 欧美三区四区| 国产精品美乳一区二区免费| 天堂成人免费av电影一区| 国产精品免费成人| 欧美性xxxxxxxx| 粉嫩一区二区三区在线观看| 91九色单男在线观看| 国产伦精品一区二区三区在线观看| 成人满18在线观看网站免费| 91精品国产高清一区二区三区| 日韩成人精品| 欧美激情一区二区三区在线视频| 久久一日本道色综合| 超碰国产在线观看| 欧美人在线观看| 亚洲国产mv| 欧美黑人又粗又大又爽免费| 欧美伊人久久久久久久久影院 | 精品国产一区二区三区久久| 亚洲精品小说| 男人和女人啪啪网站| 欧美日韩国产不卡| 永久免费精品视频| 亚洲精品一区二区三区樱花 | 久久久久久com| 久久久999| 亚洲午夜在线观看视频在线| 成人综合电影| 国产成人在线视频播放| 最新日本视频| 亚洲欧美激情精品一区二区| 狠狠色狠狠色综合婷婷tag| 国产激情91久久精品导航| 美女福利一区二区三区| 性色av一区二区三区| 先锋亚洲精品| 成人在色线视频在线观看免费大全| 91精品福利视频| 久久视频免费| 欧美福利精品| 综合久久一区二区三区| 日本黄色免费在线| 91视频99| 中文字幕一区二区三区四区 | 精品亚洲国产成人av制服丝袜| 成年人免费网站| 亚洲欧美国内爽妇网| 91久久在线| 国产欧美一区二区在线观看| 男人插曲女人视频免费| 亚洲福利在线看| 这里只有精品在线| 网上成人av| 最近2019年好看中文字幕视频 | 91精品国产综合久久男男| 久久久久国产精品麻豆| 成年男女免费视频网站不卡| 精品1区2区| 色婷婷综合久久久久中文一区二区 | 天堂一区二区三区 | 写真片福利在线播放| 久久成人一区二区| 国产一区二区三区在线观看免费视频| 国产毛片av在线| 成人av资源在线播放| 亚洲永久免费视频| 欧美调教视频| 欧美黑人又粗又大又爽免费| www.久久久久| 成人精品视频一区二区三区尤物| 超碰在线caoporn| 久久精品国产理论片免费| 色婷婷av一区二区| 亚洲色图网站| 免费a级毛片在线观看| 91久久久久久久久久久| 午夜精品久久久久| 久久在线播放| 中日韩一区二区三区| 国产精品亚洲精品| 欧美日韩国产麻豆| 欧美va亚洲va日韩∨a综合色| 四虎在线免费看| 成人在线观看av| 欧美另类变人与禽xxxxx| 亚洲深夜福利| 图片区小说区亚洲| 永久久久久久| 中文字幕亚洲在线| 久久久国产精品麻豆| 美女福利一区| 在线看a视频| 成人av免费电影| 在线播放一区二区三区| 日韩电影在线免费| 蜜桃视频动漫在线播放| av影院在线播放| 久久99精品久久久久久琪琪| 国产精品久久久久久久久免费樱桃| 久久不见久久见国语| 韩国免费在线视频| 亚洲精品高清视频| 日韩中文字幕在线播放| 国产日产欧美一区| 四季av一区二区三区免费观看| 午夜免费播放观看在线视频| 中文字幕日韩一区二区三区不卡| 色偷偷偷亚洲综合网另类| 国产精品萝li| 欧美涩涩网站| 最近在线中文字幕| 成人天堂av| 国产一区在线观| 在线电影av不卡网址| 国产精品美女一区二区在线观看| 成人激情免费视频| 青草av在线| 成人精品视频一区二区| 国产精品黄页免费高清在线观看| 91麻豆精品国产自产在线| 国产麻豆成人传媒免费观看| 欧美视频精品全部免费观看| 亚洲日本高清| 九九久久九九久久| 欧美在线一区二区视频| 91精品国产欧美日韩| 久久综合久久鬼色| 99久久综合狠狠综合久久aⅴ| 成人三级小说| 成人午夜影院| 神马影院我不卡| 久久久久久久久久久网站| 欧美视频一区二| 久久综合九色综合97婷婷| 亚洲国产一成人久久精品| 亚洲人体视频| 中文字幕在线观| 欧美视频在线第一页| 国产欧洲精品视频| 亚洲欧美日韩高清| 狠狠色噜噜狠狠狠狠97| 成人毛片在线观看| 中文字幕人成人乱码| 四虎成人精品一区二区免费网站| 久草福利在线| 91人人澡人人爽人人精品| 日日噜噜噜噜夜夜爽亚洲精品| 欧美亚洲在线观看| 亚洲裸体xxxx| 欧美在线观看一区二区| 日本一区二区综合亚洲| 免费观看在线综合色| 97在线精品| 亚洲国产一区二区三区网站| jizzjizz亚洲| 尤物视频免费在线观看| 日本新janpanese乱熟| 亚洲欧洲在线一区| 91九色露脸| 欧美黑人xxxx| 欧美精品一区二区久久久| 精品久久久久久中文字幕大豆网 | 干日本少妇首页| 久久国产精品免费一区| 国产精品99导航| 日韩三级影视基地| 亚洲护士老师的毛茸茸最新章节| 色哟哟在线观看一区二区三区| 国产精品网站在线观看| 国产99久久久久久免费看农村| 媚黑女一区二区|