近日,ACM國際多媒體會議(ACM Multimedia 2023)舉辦的社交媒體UGC熱度預測比賽(Social Media Prediction 2023)公布了最終成績,其中,網易從全球工業界和學術屆的眾多參賽隊伍中脫穎而出,超過去年阿里達摩院創造的記錄,奪得冠軍。據了解,網易從2017年開始在十余款游戲落地UGC推薦場景,針對多種UGC場景沉淀了具有業界領先水平的通用建模方案。
ACM MM(ACM International Conference on Multimedia)是計算機圖形學與多媒體領域的頂級國際會議,也是中國計算機學會(CCF)推薦的A類學術會議之一。由全球最大、影響力最廣的國際計算機學會 ACM(Association for Computing Machinery)發起,其評選的圖靈獎(A.M. Turing Award)更是計算機領域的最高榮譽。這一榮譽的取得,不僅證明了該團隊在推薦算法技術領域的卓越能力,也進一步展示了網易在推動AI技術應用方面的領先地位。
本次賽題是社交平臺多媒體UGC內容的熱度預測,涵蓋了照片、用戶信息、圖像、文本、時間等多模態信息,對技術要求跨越了自然語言處理(NLP)、計算機視覺(CV)、推薦系統(REC)等多個領域,對技術儲備是個不小的挑戰。面對這一挑戰,網易憑借多年在UGC業務中的技術積累和方案打磨,將業務中積累的算法模型遷移到比賽中,從比賽伊始就一路領先,最終獲得了冠軍的殊榮,且相關論文也被會議接收,彰顯了卓越的技術實力和創新能力。
在游戲領域,UGC 可用于擴展游戲體驗、提高用戶參與度和留存率,是一種具有成本效益的營銷形式。豐富、與眾不同、個性化的UGC內容,不僅能夠滿足用戶多樣化的需求,也使產品更具吸引力和互動性,更能增加用戶黏性。玩家自制的內容不僅能讓現有的用戶持續體驗到新鮮感而留存,還能在社交平臺上進一步擴散,吸引更多潛在用戶。
對于UGC推薦,他們將問題理解為以下幾個方面:
- 玩家體驗和作者體驗的平衡:從玩家體驗的角度出發,分發的應該是最熱門的內容和最符合玩家偏好的內容。然而,對于一些作者的新作品,由于缺乏歷史數據,難以確定用戶是否會喜歡,因此不會將其直接分發給用戶。這種做法會導致嚴重的馬太效應,使新的優質內容難以成為熱門,也無法激勵作者,不利于長遠發展。
- 多模態特征的重要性:UGC內容以絢麗的Feed流形式呈現給用戶,一張卡片所能承載的信息有限而珍貴。除了常見的標題、作者、簡介等文字信息外,還蘊含著推廣圖、快照短片等引人入勝的圖片信息,主題音樂等音頻信息,以及點贊數、瀏覽數等統計信息。然而,僅憑統計數據和用戶行為序列這些容易建模的信息,我們只能勉強揣測用戶的喜好。這種粗略推斷既無法充分發掘UGC內容的潛能,又容易受到馬太效應的限制,無法真正“激活”未被挖掘的優秀內容。
- 內容冷啟動的難點:毋庸置疑,卓越的內容必須獲得足夠的曝光,方能充分驗證其卓越之處,并找到那些真正喜歡它的用戶。那么,我們是否可以通過冷啟動的方式為其提供曝光呢?然而,曝光流量可貴無比,給予過多的冷啟動機會可能導致內容受眾的減少,直接影響用戶體驗,更不用說某些敏感玩家只是試探性地探索一番,若未能吸引他們,他們很可能會迅速離開。因此,除了前文提及的文字、圖片、音頻等內在信息可用于冷啟動之外,還必須考慮用戶特征以及在短暫曝光后對內容曝光的增加或降低,以及曝光應更多面向哪個群體。所有這些要素都必須被充分考慮,方案的復雜度呈指數級上升。
- 分發多樣性的必要性:為了實現長遠發展,不僅需要給與用戶當下最滿足需求的內容,還需要提供多樣化的內容選擇,豐富用戶的閱讀和觀看體驗。用戶不再局限于熱門內容,而是能夠發現更多風格各異、獨具特色的作品。這種多樣性不僅能夠滿足用戶的個性化需求,也能夠拓寬用戶的視野,讓他們體驗到更多不同領域的精彩內容,提升用戶的長期體驗。
- 數據的稀疏性:數據稀疏性呈現出雙重維度的挑戰,即用戶行為的稀疏和UGC內容的反饋稀疏。這種稀疏性使得我們難以準確揣摩用戶的偏好,也讓一些卓越作品黯然失色。為了克服數據的稀疏性,我們需采用創新的數據采集和分析方法,結合實時用戶反饋和行為數據,甚至在游戲業務中善用其它場景的用戶行為。借助這些手段,我們能以更迅速、更全面的方式洞察用戶需求,為他們提供更加豐富、個性化的內容推薦。當我們克服數據的稀疏性時,才能真正激發卓越作品的潛能,提升整體用戶體驗,推動UGC平臺踏上可持續發展之路。
網易自2015年起,一直致力于在游戲中利用數據智能技術改善玩家體驗,在精細化運營、個性化推薦技術領域助力上百款產品實現營收增長。 對于UGC業務,他們已經沉淀了一套高效的接入方案, 當前接入的業務涉及UGC地圖推薦、社區帖子推薦、UGC外觀推薦、直播推薦等,均在參與率、游玩時長等指標上獲得提升。