
“我們正在加大投資人工智能模型,為我們的產品賦予新的功能,并提升對內容和廣告的精準推薦能力。我們不僅致力于將領先的人工智能能力定位為自身業務發展的倍增器,也讓其為我們的企業客戶,乃至整個社會創造價值。”騰訊董事會主席兼首席執行官馬化騰在2023年第三季度財報中表示。

據悉,騰訊本季度總收入為人民幣1546億元,同比增長10%。同時財報中還表示,騰訊正在升級自研基礎模型騰訊混元,將其部署到內部產品中,并向外部企業客戶開放使用。
隨著混元大模型的發布,騰訊也正式將全面擁抱大模型作為未來的發展方向。目前我國人工智能市場大模型數量已經趨于飽和,如何通過大模型為企業開辟商業化路徑,為用戶賦能實際生產生活新方式已經成行業新的競爭高地。

對此,大模型之家將依照《人工智能大模型產業創新價值研究報告》提出的“AQUA”評價體系,從模型能力、任務處理能力、應用生態等六個維度對騰訊混元大模型展開多角度全方位的評測。
模型能力
模型規模:混元大模型的參數規模超過千億,是目前國內最大的中文語言模型之一。模型規模的提升可以持續提高模型的泛化能力和通用能力,使模型能夠處理更多的場景和任務。
訓練數據量:混元大模型的預訓練語料超過2萬億tokens,覆蓋了多個領域和主題的中文文本。訓練數據量的增加可以提升模型的語言理解和生成能力,使模型能夠學習到更豐富和更深層的語言知識。訓練數據量是大語言模型優化的關鍵,可以為模型提供更多的語言樣本和語言規律,提高模型的質量和效果。
訓練算力:混元大模型采用了騰訊自研的訓練框架和優化策略,利用騰訊云的高性能計算集群,實現了低成本、高效率的大模型訓練。訓練算力的提升可以縮短模型的訓練時間,提高模型的訓練質量,使模型能夠快速迭代和優化。訓練算力作為大語言模型實現的基礎,為大模型帶來更多的計算資源和計算能力,提高模型的性能和穩定性。
任務處理能力
通過AQUA任務處理能力測試環節,大模型之家發現混元大模型具有非常出色的聯系上下文能力,混元大模型能夠理解并保持對整個對話歷史的把握。其上下文理解能力使得模型能夠準確解讀前文的語境,從而更好地回應用戶的提問。

再對評測問題的“追問”,混元大模型不僅可以給出正確的答案還可以在接下來的多輪對話中豐富用戶的需求,這樣的模型能夠保持一致性,確保在整個對話過程中回答的信息不產生矛盾??梢造`活地適應對話中的變化,處理新引入的信息,能夠在對話的不同輪次中保持一致的語境。使得混元大模型更具智能,并且在復雜的任務中表現更為出色。
從混元大模型的任務處理表現上可以看出,模型在訓練中使用了大規模的數據集,使其能夠涵蓋多樣的語境和主題,從而更全面地理解不同領域的知識。通過廣泛訓練思路幫助模型在處理各種領域和主題的對話時表現得更為靈活和全面。大模型通常采用先進的注意力機制,能夠在處理長文本序列時更好地關注重要的部分,確保對話的一致性和準確性。

值得一提的是混元大模型在一輪對話中還設置了清除上下文關聯功能,通過此功能可以讓使用者快速的校準在對話出現問題或錯誤的情況,對于需要精準回答當前問題而不受先前對話歷史影響的場景,清除上下文關聯功能有助于控制對話的方向,確保模型專注于當前上下文而不被過去的信息干擾。

同時,該功能可以讓混元大模型更獨立于先前的語境,從而提高模型對于不同問題和場景的適應性和魯棒性。

在測試中,大模型之家還發現混元大模型基本上在所有的回答后都會給出相應的擴展內容,特別是在客觀選擇題上,都會給出正確的答案以及各個選項的解釋。在內容創作方面,混元大模型生成的答案不會吝惜文字,在目前市場上的同類產品具有很強的競爭力。
泛化能力
在泛化能力上,混元大模型可以通過語音、文字、圖片等多種方式與用戶交互,根據用戶的需求,提供相應的輸出方式增加用戶的溝通效率和體驗,適應不同的場景和設備。混元大模型可以對多種模態的信息進行理解和生成,如圖文對齊、圖像描述、圖像檢索、圖像問答、圖像摘要、圖像分類等。

除多模態能力外,在多場景支持領域,混元大模型目前支持如文檔場景、會議場景、廣告場景和營銷場景應用,可以提供文檔創作、文本潤色、文本校閱、表格公式及圖表生成、智能問答、文本摘要、文本分類等能力,提高場景的適應性和效率。
混元大模型會議場景
應用應用拓展能力

混元大模型不僅可以作為基底模型,為不同產業場景構建專屬應用,還可以作為基礎設施,支持騰訊的各種產品和應用能力。目前,騰訊云、騰訊廣告、騰訊游戲、騰訊金融科技、騰訊會議、騰訊文檔、微信搜一搜、QQ瀏覽器等超過50個騰訊業務和產品,已經接入騰訊混元大模型測試,并取得初步效果。
其中,騰訊會議通過接入混元大模型實現了會前、會中、會后全流程的體驗重塑,從而有效提升了會議的效率和質量。這也代表混元大模型在應用拓展方面具備卓越的能力,能夠為各類產品和服務提供更為智能、高效、豐富的體驗。這表明混元大模型在騰訊多元化業務生態中發揮著關鍵的角色,并為不同業務領域的需求提供了有效的解決方案
開放性指標

在開放性指標中,騰訊云業務也為混元大模型帶來多重部署方式,面向豐富的業務場景,提供整套行業和技術解決方案。混元大模型作為騰訊云的核心產品之一,騰訊云業務提供的高性能計算資源為大模型的訓練和推理提供了強有力的支持。

通過與騰訊云的其他產品和服務相結合,實現多語言、多模態、多場景的泛化能力,為用戶提供更智能、更便捷、更有趣的體驗,促進產品和服務的創新。同時,騰訊云還可以提供多層次的安全措施,包括數據加密、訪問控制等助力數據安全和隱私保護。
大模型之家認為,騰訊的龐大用戶基礎為騰訊在人工智能時代提供了先天性的資源優勢。騰訊擁有超過10億的通信和社交用戶,以及超過1億的視頻、音樂、文學等數字內容用戶,通過匯聚來自各種業務領域的龐大用戶群體的數據,能夠為混元大模型提供豐富、多樣的訓練樣本,從而提升模型的訓練效果和泛化能力。這樣的數據基礎為模型的智能化和個性化提供了有力的支持,使其能夠更準確地理解用戶需求和行為。

