DeepSeek的爆火出圈為國產芯片同時帶來了機會與挑戰。一方面,新銳模型和AI原生應用的爆發會產生更多算力需求,但同時,由于國產芯片在底層架構和軟件生態上的差異,如何高效適配AI模型并充分發揮算力潛力成為國產芯片領域亟待解決的問題。
近日,北京電子數智科技有限責任公司(以下簡稱“北電數智”)依托其“寶塔·模型適配平臺”成功完成DeepSeek V3/R1全尺寸模型與海光DCU、華為、壁仞科技、沐曦等多款國產芯片的混元算力適配,為開發者和企業提供了更靈活、高效的算力支持。
技術創新:DeepSeek模型性能領先
DeepSeek模型作為國產AI技術的代表,采用了多項創新技術,包括混合專家系統(DeepSeekMoE)、多頭潛在注意力機制(MLA)以及自研訓練框架。這使DeepSeek在大幅減少算力開銷的情況下實現了R1模型與OpenAI o1相當、V3模型與OpenAI 4o相當的性能表現,展現出高推理效率和低訓練成本的優勢。

寶塔·模型適配平臺:抹平芯片差異,異構算力高效支撐模型
北電數智“寶塔·模型適配平臺”抹平了不同芯片架構的差異,快速實現對DeepSeek模型的優化支持和硬件適配。用戶無需關注底層硬件技術細節,平臺會根據模型調用需求自動匹配合適的算力資源,大幅降低了開發門檻。目前,該平臺已完成24款基座大模型的適配工作,為開發者提供了更多算力選擇。
混元推理技術:優化效率,降低成本
針對DeepSeek類超大模型的推理任務,數據中心的集群化推理技術顯得尤為重要,例如PD分離(Prefill-Decode分離)技術就可由不同芯片完成不同階段推理任務實現。北電數智的混元推理技術路線與DeepSeek的技術路線高度契合,能有效解決算力不足問題,為大規模AI應用創造便利條件。
推動國產算力發展:從適配到生態建設
DeepSeek的發展為行業帶來了深刻啟示:只有滿足國產原生模型的算力需求,才能真正推動包含國產算力在內的中國AI產業發展。為全面挖掘國產芯片性能潛力與適配能力,北電數智還推出了“星火·國產算力AI原生適配認證”,促進國產模型與國產算力的深度融合,推動國產芯片在AI原生應用場景中的迭代與創新。
企業版內測上線:助力AI應用落地
目前,北電數智已正式開通企業版內測服務,通過“北京數字經濟算力中心”為廣大企業和開發者提供便捷、高效的算力支持。無論是模型訓練還是推理任務,用戶都可以在多芯混元算力環境下輕松構建和部署基于DeepSeek模型的AI應用。
北電數智的一系列舉措,為國產AI芯片與模型的協同發展提供了新思路。未來,隨著更多企業和開發者加入,國產算力生態也將迎來更加廣闊的發展空間。