
9月7日,在2023騰訊全球數字生態大會上,騰訊混元大模型正式發布。早在發布會前一天,騰訊就已經揭示了其相關命名和圖標。
而今日在發布會上,騰訊混元大模型正式開啟公測,目前需要排隊預約體驗。

圖為9月7日騰訊安全公眾號

圖源:騰訊云
騰訊集團高級執行副總裁、云與智慧產業事業群CEO湯道生表示,騰訊將邁入“全面擁抱大模型”時代,他指出,大模型需要基于產業場景,與企業數據融合,才能釋放出最大的價值,“騰訊將立足于未來,立足于實效,讓數字化工具在產業中用起來、用得好。
全鏈路自主研發,混元大模型超越ChatGPT

圖源:網絡
從2021年開始,騰訊先后推出千億和萬億參數的NLP稀疏大模型,打破CLUE三大榜單紀錄,實現在中文理解能力上的新突破。近期,騰訊的混元AI萬億大模型登頂權威中文測評基準CLUE榜首并超越人類水平。
目前,騰訊混元大模型參數規模超千億,預訓練語料超2萬億tokens,擁有強大的中文創作能力、復雜語境下的邏輯推理能力以及可靠的任務執行能力。
有數據顯示,混元大模型采用騰訊太極機器學習平臺自研的機器學習框架,太極AngelPTM訓練框架的訓練速度相比業界主流框架提升1倍,AngelHCF推理框架的推理速度比業界主流框架提升1.3倍。

圖源:騰訊
此外,混元大模型依托于騰訊領先的基礎設施,騰訊云星星海自研服務器、騰訊云高性能算力集群性能提升3倍,自研星脈高速網絡3.2T通信帶寬,實現10倍通信性能提升。
基于此,混元大模型在算法層面進行了一系列自研創新,提高了模型可靠性和成熟度。

圖源:騰訊
針對大模型出現的“幻覺”問題,騰訊優化了預訓練算法及策略,讓混元大模型的幻覺相比主流開源大模型降低了30%至50%;
通過強化學習的方法,讓混元大模型學會識別陷阱問題,對不安全問題說“不”,面對安全誘導類問題的拒答率提升20%;
通過位置編碼優化,提高了超長文的處理效果和性能,結合指令跟隨優化,讓產出內容更符合字數要求,提升超長文本的生成和續寫能力;

圖源:騰訊
騰訊提出思維鏈的新策略,有效強化模型對問題的拆解和分步思考的傾向,讓應用助手能夠像人一樣結合實際的應用場景進行思維推理。
在現場演示中,騰訊并沒有對混元大模型進行現場的“刁難”測試,而是通過5個簡單的問題,揭開了混元大模型的“神秘身份”。
1.你是誰?
2.混元的核心技術架構是什么?
3.混元的模型參數量有多大?
4.混元的訓練數據截止到什么時候?
5.作為混元大模型,你有什么特長和優點?

圖源:騰訊

圖源:騰訊
從現場演示透露出的一些信息可以看到,混元大模型的核心架構基于Transformer,進行多輪迭代,并具有一定調用外部插件工具的能力;參數量達到千億級別,當前版本的混元大模型知識截止到2023年7月,在現場中,騰訊集團副總裁蔣杰還提到混元大模型的知識庫還將不斷更新,將進行每月迭代。
而在第5個問題中,演示工作人員打錯“特點”做“特長”,混元大模型也能夠進行糾正理解。
蔣杰還在現場出題,考驗混元大模型在實際場景中是否具備邏輯推理能力:“買一堆咖啡,上午喝了一半,下午又喝了剩下的一半,這時還剩30杯,一共買了多少杯”

圖源:騰訊
混元大模型也能夠實現快速響應,利用數學方程進行推理并回答正確。

圖源:騰訊
在信通院測評中,混元大模型在模型開發中共測試29個能力項,模型能力中共測試37個能力項,綜合評級4+級,獲當前最高分。并在中文理科高考題子項、數學題子項均超越GPT4。

圖源:騰訊
目前,混元大模型已實現與騰訊會議、騰訊文檔、騰訊廣告、騰訊游戲、騰訊金融科技、微信搜一搜、QQ瀏覽器等超過50個騰訊業務和產品結合,并取得初步效果。
其中混元大模型在廣告場景中的應用,實現適應行業與地域特色、滿足千人千面要求以及文字、圖片、視頻的自然融合,蔣杰更是表示混元大模型超越Midjourney、超過開源的SD模型。不需爭搶,混元+業務打造騰訊技術底座

圖為騰訊集團副總裁蔣杰
此前,馬化騰曾表示騰訊不急于推出大模型半成品。此次,騰訊集團副總裁蔣杰將當下推出的混元大模型,定義成一個“可用”“可實踐”的版本。
蔣杰表示,大模型的發展不能也不會只靠燒錢推動,一定需要落地到具體的場景產生價值,落的場景越多,使用的用戶越多,產生的商業價值、數據越多,通用大模型的訓練成本就會被攤的越薄、推理成本也就降的越低,而模型能力卻會更強

圖源:騰訊
在發布會上,騰訊宣布混元大模型今日起對外開放,用戶可通過騰訊云進行體驗,支持直接調用 API 接口,或者將混元作為基底模型,在公有云上進行精調。
目前的混元大模型版本支持多輪對話、內容創作、邏輯推理、知識增強等功能,多模態文生圖也將在后續上線。

圖源:混元大模型
收費方面,騰訊混元大模型將為每個在白名單中的已實名騰訊云企業賬號提供累計10萬 token的免費調用額度,開通服務后即可使用。在免費額度用完后,按如下價格進行計費:騰訊混元大模型高級版每1000 token收費0.14元。(注:1token約等于1個中文漢字或3個英文字母)
蔣杰在接受媒體采訪時表示,其實今天騰訊大模型的應用就是跟騰訊業務的深度結合,今天是和騰訊會議的結合,與騰訊文檔的結合,那未來可以是跟微信的結合,QQ、騰訊視頻、騰訊音樂等的結合。
清華大學人工智能研究院視覺智能研究中心主任鄧志東表示,大模型的價值在于應用。只有在多樣化的實際應用場景中賦能智能經濟與智能社會的發展,才能找到產業價值,同時也才能成就大模型自身。

大模型之家認為,騰訊此次推出混元大模型,是作為國內領先的技術企業發展的必然,將混元大模型結合騰訊自身業務場景,能夠實現數據訓練庫的不斷擴充和數智化業務的提升,助力推動中國人工智能行業新發展,同時,混元大模型的推出也是騰訊在推進數字化轉型、加快技術創新方面的重要舉措,混元大模型具體表現如何,讓我們一起拭目以待!