9月5日,在騰訊全球數字生態大會上,騰訊集團副總裁、云與智慧產業事業群COO兼騰訊云總裁邱躍鵬發布“騰訊云智算”品牌,幫助產業突破技術瓶頸,加速釋放AI生產力。
作為“算存網數一體”的高性能智算底座,騰訊云智算在穩定性和性能上都有不錯的表現:集群千卡單日故障數已經刷新到0.16,是行業水平的1/3;1分鐘就能完成萬卡checkpoint寫入,數據讀寫效率是業界10倍;千卡集群的通信時間縮短到6%,是業界一半。通過整合軟硬件技術能力,騰訊云智算集群從機器上架到開始訓練還可以做到只需1天,相比業界以月為單位也大為縮短。
在下午的AI基礎設施專場上,騰訊云副總裁李力表示,騰訊云智算具有三個特點,包括同源同構、云原生、以及場景驅動。一方面,騰訊云多年的發展歷程中,持續堅持公有云、專有云、分布式云走統一的技術路線,代碼一致,這些經驗將在騰訊云智算中得到體現;另一方面,騰訊云已經支撐騰訊集團自有業務完成了上云,完成了業界最大的云原生實踐,騰訊云智算會將云原生上所有的生態體系與AI融合,打造AI原生云。另外,騰訊云智算是在200多萬客戶過去十年給騰訊云的磨煉中誕生的,有充分的場景驗證)。

(騰訊云副總裁 李力)
集合優勢云產品,打造高性能AI基礎設施
騰訊云智算整合了騰訊云高性能計算HCC、高性能網絡IHN星脈、高性能云存儲、加速框架、容器、向量數據庫、智算套件等騰訊云優勢產品,能夠為AI創新輸出性能領先、多芯兼容、靈活部署的智算產品能力。
騰訊云異構計算副總經理宋丹丹介紹,騰訊云HCC高性能計算集群擁有全球領先的算力性能,可以達到比原廠商推薦優化19%到30%的性能。HCC可以提供業界最高的3.2T超高互聯帶寬,算力性能較前代提升高達3倍。
騰訊云智算除了具有領先的性能表現,在部署上也非常靈活,支持公有云、私有云以及分布式云的部署。騰訊專有云TCE研發負責人王旻表示,不同客戶對彈性、靈活性、數據隱私和自主可控的需求各不相同,智算基礎設施也需要滿足公有云和專有云等多種模式。同時,除了智算能力外,也會給私有化客戶帶來其他一些收益:全面安全合規、開放兼容,覆蓋智算、通算、超算等多種場景的全棧智能解決方案,行業云能力,以及騰訊云完整運營/運維的產品與理念。
騰訊云虛擬化產品總經理陳立東介紹了新發布的AI大模型加速解決方案TACO。其中,TACO-LLM,加速語言生成的效率,可以獲得1.8倍到2.5倍的性能提升,百萬Token推理成本低于0.5美元,運營成本降低超過一倍,并與業界的開源模型都完成了適配;TACO-DiT是一款專為DiT模型設計的并行推理引擎,旨在解決高清圖像與長時一致性視頻生成中,因輸入序列增長導致的計算量激增問題;面向傳統AI,騰訊云提供qGPU技術提升GPU的利用率。
騰訊云網絡VPC產品負責人王營表示,騰訊云智能高性能網絡IHN星脈面向AI場景,打造超高速規模網絡。IHN支持超10萬卡的集群,并支持異構網絡接入。
AI時代,場景對存儲的需求也發生了很大變化。騰訊云存儲產品總經理陳崢表示,騰訊云智算所采用的AIGC云存儲解決方案可實現對AIGC生命周期的全覆蓋,高度匹配大模型的各類存儲需求。在數據采集環節騰訊云提供數據遷移服務;數據清洗環節和訓練推理環節,騰訊云通過GooseFS提供分布式緩存能力,可以將數據調度到近計算節點,加速數據的訪問;數據治理環節,數據萬象服務可以為海量的預訓練數據和推理數據提供數據質量的保證,確保數據的合規性,保障大模型輸入和輸出都有可靠的質量。
騰訊云分布式云產品負責人楊志華在分享中表示,騰訊云分布式云的解決方案通過把公有云部署在本地,使得公有云能力可以1:1復制到用戶的本地,并提供高達400種云產品的選擇,既包括常用的計算網絡存儲、數據庫、中間件,也包括眾多的辦公協同、營銷工具。目前,分布式云已有超過20個行業得到了廣泛的實踐和產品的打磨,幫助企業構建數據本地化的云平臺。
騰訊云AI企業級自研分布式向量數據庫接入AI的效率比傳統方案提升10倍,運行穩定性高達99.99%。支持千億級向量規模、500萬并發吞吐,并且相同成本情況下性能達到業界的1.5-5倍。
多場景落地,釋放AI生產力
這目前,騰訊云智算服務了90%以上的國內頭部大模型頭部企業,也幫助了一大批IDC廠商走向AIDC轉型,在互聯網企業、大模型廠商、金融行業、政企行業、AI開發等多個場景,騰訊云智算也在助力客戶加速釋放AI生產力。
元象科技的大語言模型是廣東省2023年第一批通過國家備案的大語言模型,最新版本的MoE模型只用了數百億級別的預算量就可以達到數千億級別的模型效果。元象大模型產品中心總監張玥介紹,騰訊云提供的充足的算力、可靠的算力平臺和先進的網絡,有效支持了元象的大語言模型的順利落地,讓大語言模型更好的發揮了效能。
廣州尚航信息科技股份有限公司深耕算力基礎設施服務領域,提供業界領先的智算中心、AI算力、云計算。為互聯網、人工智能、政府、新能源等多個行業提供AIDC綜合服務、AI算力、云綜合服務等,是客戶及合作伙伴最可靠的智算基礎設施服務商。尚航科技與騰訊云戰略合作以來,雙方基于互信共贏的發展戰略,共筑AI算力底座。尚航科技借助騰訊云技術拓展業務版圖,打造尚云SunClouds云算力平臺,依托尚航堅實的AIDC基礎設施、GPU算力集群、本地網絡和騰訊云TCE技術,尚航搭建了具有全棧IaaS+PaaS+安全能力的綜合型算力平臺,為眾多行業客戶提供高效、穩定且安全的算力資源。尚航與騰訊云的戰略合作,將為客戶提供更便捷的一站式算力服務體驗,同時也將推動AI算力行業的發展。未來期待與更多行業伙伴攜手,響應國家戰略,助推新質生產力發展,為數字經濟的發展貢獻力量。
會上,騰訊云智算還宣布和海南怡和中能實業投資有限公司、上海燧原科技股份有限公司、廣州尚航信息科技股份有限公司等共建產業高效能云智算中心。本次合作簽約,將充分發揮各方優勢互補,圍繞研發、服務、銷售等全領域開展企業數智化轉型合作和,共同推進云計算和人工智能產業融合、創新及發展。

“生成式AI的興起給整個云基礎設施建設提出了更高的要求,隨著騰訊云智算的發布,我們希望能夠一站式地把高性能計算、高性能存儲、高性能網絡等各方面的優勢技術能力,為企業客戶的AI創新探索,創造更多價值。”騰訊云副總裁沙開波表示。