如今,只要在淘寶輸入“斬男色”或“XXX明星同款”就能一鍵搜索到自己想要的商品,如此懂人的技術背后其實是阿里巴巴先進的知識圖譜技術。它構建成阿里平臺治理背后的最強“商品大腦”,能從近20億件的商品中撈出對應商品,滿足消費者的購物需求。9月26日上午,阿里平臺治理部在杭州召開新聞發布會,首次向外界解密三萬億平臺成交額背后的“商品大腦”。
“阿里知識圖譜就是一個‘超級大腦’,包含百億條信息實體和百億條信息關聯邊。”會上,阿里巴巴平臺治理部資深總監錢磊介紹:“商品大腦”由智能識別引擎、智能推理引擎和商品知識三部分組成,運行原理類似人體大腦。“智能識別引擎從信息中提取語義,類似于人腦的感知系統;智能推理引擎可以利用已有知識做推理,而商品知識類似于人腦的記憶系統,是知識存儲的單元。”

(圖說:阿里巴巴資深總監錢磊揭秘阿里三萬億背后的“商品大腦”。)
錢磊在發布會上舉例說明“商品大腦”理解輸入的過程,比如說買家輸入“我需要一件漂亮的真絲絲巾”,“商品大腦”會通過語法詞法分析來提取語義要點“一”、“漂亮”、“真絲”、“絲巾”這些關鍵詞,從而幫買家搜索到合適的商品。
在導購中為讓發現更簡單,“商品大腦”還學習了大量的行業標準,比如說全棉、低糖、低嘌呤等。“先進的大腦還有與時俱進的優點。”據錢磊介紹,“商品大腦”可以從公共媒體、專業社區的信息中識別出近期熱詞,跟蹤熱點詞的變化,由運營確認是否成為熱點詞,這也是為什么買家在輸入斬男色、禁忌之吻、流蘇風等熱詞后,出現了自己想要的商品。
此外,智能的“商品大腦”還能通過算法識別出場景。“比如我輸入海邊,結果中就會出現泳衣、游泳圈、防曬霜、沙灘裙等商品。”錢磊說。
據了解,“商品大腦”可以24小時對平臺上的近20億件商品進行管控。錢磊介紹,在商品上架階段,平臺可以每秒審核5千條商品信息,發現那些假貨、山寨、濫發和品牌堆砌的商品,比如說“2016小香家同款高仿”這樣的寶貝描述。把文字PS進商品圖片中也不怕,管控體系還可以每秒掃描2.2萬張商品圖片,發現圖上的“牛皮癬”。
“讓發現變簡單、讓判斷更智能。”錢磊最后表示:“這個知識圖譜無論是對知識產權保護,還是提升消費者購物體驗,都具有非常重大的意義。”