9月17日,國際數(shù)據(jù)公司(IDC)公布的《中國大模型公有云服務市場分析,2025H1》報告指出,2025年上半年,中國公有云上大模型調用量達536.7萬億Tokens。其中,火山引擎以49.2%的市場份額位居中國市場第一,阿里云、百度智能云分別占比27%、17%,位列第二、第三位。
(統(tǒng)計口徑:各大云廠商對外部客戶提供的大模型公有云服務調用量,不包含自有業(yè)務調用。如火山引擎統(tǒng)計,不包括抖音APP、豆包APP、即夢APP等字節(jié)跳動一方產(chǎn)品調用量。)

今年,隨著推理模型、多模態(tài)模型能力的進一步提升,模型調用的商業(yè)模式逐漸成熟。IDC指出,相比2024全年114萬億Tokens的市場規(guī)模,僅2025年上半年就實現(xiàn)了近400%的增長。市場增長的驅動力一方面來源于原有的泛互聯(lián)網(wǎng)、企業(yè)級的應用場景的擴展以及客戶群體下沉,另一方面來源于不斷豐富的模型體系。
市場持續(xù)快速增長的同時,2025年上半年,火山引擎憑借49.2%的份額依然穩(wěn)居市場第一,且份額占比有所提高。此前,IDC公布2024年大模型公有云調用量,火山引擎以46.4%的市場份額位居中國市場第一。

中國公有云大模型調用量月度環(huán)比增長,2025H1中國大模型公有云服務市場按照Tokens計算的調用量達5367270億次。
IDC預測,未來中國生成式AI軟件將持續(xù)高速增長,在基礎模型持續(xù)創(chuàng)新、模型開發(fā)應用工具鏈不斷完善以及智能體的爆發(fā)下,該市場規(guī)模2028年將達到482.4億元人民幣,未來仍將有數(shù)百倍增長空間。
Agent應用爆發(fā)前,火山引擎多模態(tài)和深度推理大模型需求高漲
IDC報告指出,AI應用將是未來驅動模型調用的最核心因素,尤其是智能體的爆發(fā)。其中,多模態(tài)和深度推理大模型成為最主要的遷移力。
在多模態(tài)模型的需求上,近75%的組織已經(jīng)評估了采用多模態(tài)基礎模型和單模態(tài)基礎模型的應用程序,預計多模態(tài)模型將提供更豐富、更細致入微的功能。 使用多模態(tài)基礎模型構建的應用程序可以處理和整合多種類型的數(shù)據(jù),這些數(shù)據(jù)更豐富、更能感知上下文,從而大大提高準確性、效率和用戶體驗。
這也是各大云廠商在今年發(fā)力的重點:火山引擎、阿里云、騰訊云等大模型云廠商在語音、圖像、視頻等多模態(tài)領域迅速迭代。其中,火山引擎豆包大模型家族自2024年推出以來,多模態(tài)模型效果持續(xù)領先。
今年,火山引擎相繼推出豆包大模型1.6、豆包·視頻生成模型Seedance pro、豆包·實時語音模型、豆包·圖像創(chuàng)作模型Seedream 4.0等,其中多個大模型登頂Artificial Analysis、LMArena競技場。這些多模態(tài)大模型有效加速了AI應用落地。

Seedream 4.0位居Artificial Analysis 文生圖榜單第一

Seedream 4.0位居Artificial Analysis 圖像編輯榜單第一
*截至 2025年9月

Seedream 4.0位居LMArena文生圖榜單第一

Seedream 4.0位居LMArena圖像編輯榜單第二
*截至 2025年9月
同時,今年2月DeepSeek-R1,加速了國內市場,從模型訓練向推理服務遷移。
隨著市場迅速向推理服務遷移,推理Tokens量級變大,企業(yè)也越來越重視資源效率、管理運營成本和可持續(xù)發(fā)展。
IDC指出,火山引擎為用戶提供了豐富的大模型以及完善的工具鏈,通過更優(yōu)性能的推理服務,其MaaS平臺火山方舟2025H1按照Tokens計算的調用量實現(xiàn)了398.2%倍增長,增長的驅動力一方面來源于客群的擴展,另一方面來源于Agent應用。
面向Agent應用,火山引擎提供了極致服務,能做到模型的API在吞吐、并發(fā)、首字延遲、平均延遲、成本優(yōu)化、資源保障、安全可信這些客戶可感知指標上,均為行業(yè)領先。同時,火山引擎還提供了先進技術,在算子層(算法優(yōu)化)、系統(tǒng)層(PD分離)對模型進行了深度優(yōu)化,包括:PD分離架構、KV-Cache緩存加速、自研推理加速引擎 xLLM、自研 vRDMA 網(wǎng)絡等。
除了模型本身,IDC認為,Agent廣泛滲透需要全棧技術的重構。AI時代,技術主體正在從Web、APP逐漸變成Agent,這意味著開發(fā)范式將發(fā)生重大變化。
在承接最多市場需求的推動下,火山引擎率先推出以大模型為核心、以生產(chǎn)級可用的復雜Agent為負載的AI云原生架構,幫助開發(fā)者屏蔽底層硬件差異和開發(fā)復雜性,直接從云端獲得高質量、低成本的 Tokens,加速企業(yè)Agent落地和業(yè)務創(chuàng)新。
AI+泛互聯(lián)網(wǎng)深度融合,各行業(yè)加速AI滲透
隨著模型能力的持續(xù)提升、以復雜Agent為核心的AI云原生基礎設施進一步完善,新場景正在被不斷解鎖。此前,火山引擎在今年6月Force大會上透露Tokens消耗快速增長背后,AI工具的Tokens消耗在快速增長,5個月增長了4.4倍。
其中AI搜索增長10倍,AI 編程增長了8.4倍。視覺理解模型則是另一個助推器。比如,K12的在線教育,由于VLM模型能力不斷提升,Tokens消耗5個月增長了12倍,而新出現(xiàn)的智能巡檢,視頻檢索等數(shù)個場景也快速實現(xiàn)日均百億tokens的突破。
IDC報告指出,預計大模型服務市場仍有百倍以上空間,用戶群體正在從泛互到傳統(tǒng)企業(yè)滲透。在行業(yè)里,大模型的應用不斷深化。
在消費電子行業(yè),企業(yè)將大模型應用在語音助手,創(chuàng)作工具,效率提升等諸多場景,全球Top10手機廠商有9家和火山引擎深度合作。
在汽車行業(yè),大模型覆蓋了從智能座艙,到智能營銷,到自動駕駛標注等全流程場景,豆包大模型助力奔馳、寶馬、奧迪、特斯拉、蔚來等八成主流汽車AI升級。
在金融行業(yè),火山引擎為客戶提供智能展業(yè)、投顧、投研等大模型應用方案,已服務華泰證券、國信證券等數(shù)十家券商和基金公司,招商銀行、浦發(fā)、民生等70%的系統(tǒng)重要性銀行。
在教育行業(yè),火山引擎面向教學服務、科研輔助、師生服務和管理輔助等場景,提供大模型解決方案,已與北京大學、浙江大學、南開大學等超五成985高校達成合作,持續(xù)推動高等教育智能化轉型。