
2023年伊始,繼國內百度文心一言、商湯日日新SenseNova大模型體系、以及阿里巴巴通義千問、科大訊飛星火大模型等相繼發布之后,華為也加入AI大模型的行列。
近日,有媒體報道稱,華為公司即將推出一款名為”盤古Chat”的多模態千億級大模型產品,直接與ChatGPT進行競爭。
有資料顯示,盤古大模型于2020年11月在華為云內部立項成功,對于盤古大模型定位,華為內部團隊確立了三項最關鍵的核心設計原則:
一是模型要大,可以吸收海量數據;
二是網絡結構要強,能夠真正發揮出模型的性能;
三是要具有優秀的泛化能力,可以真正落地到各行各業的工作場景。
隨著國內多家企業相繼推出類ChatGPT大模型,華為為了展示自己的大模型領域的積累,“盤古Chat ” 也即將問世。消息稱,“盤古Chat ”預計將于今年7月7日舉行的華為云開發者大會 (HDC.Cloud 2023) 上對外發布并開啟內測,其產品主要面向To B / G市場,即政企端客戶。
首個千億參數中文預訓練大模型
盤古Chat將打破人工智能“語言霸權”
公開資料顯示,目前華為“盤古系列AI大模型”基礎層主要包括NLP大模型、CV大模型、以及科學計算大模型等,上層則是與合作伙伴開發的華為行業大模型。

今年4月,在人工智能大模型技術高峰論壇上,華為云人工智能領域首席科學家田奇曾分享了“盤古大模型的進展及其應用”。他表示,盤古NLP大模型覆蓋的智能文檔檢索、智能 ERP、小語種大模型等落地領域,2022年華為剛交付了一個阿拉伯語的千億參數大模型。在應用方面,盤古大模型可以應用于智能客服、機器翻譯、語音識別等多個領域,提供AI技術支持。
根據華為公布的一份論文數據顯示,華為盤古PanGu-Σ大模型參數最多為1.085萬億,基于華為自研的MindSpore框架開發。論文中表示,PanGu-Σ大模型在對話方面的整體表現可能已接近GPT-3.5的水平。
自然語言處理(NLP)的技術演進和應用一直是最熱門的賽道。然而,在AI演進的過程中,英語作為世界通用語言,占據了這個領域優勢地位。就如同GPT3,英文占比為92.7%、法語1.8%、德語1.5%而中文語料只占0.1%。這意味著,英文之外的語料匱乏,會導致使用這些語種的國家在發展AI大模型的過程中遭遇更多阻力。
據介紹,盤古Chat是首個千億參數中文預訓練大模型,其中CV大模型則首次達到30億參數的規模。華為官方表示,盤古CV大模型業界最大CV大模型、首次實現兼顧判別與生成能力,并在ImageNet上展現出領先的小樣本學習能力;盤古氣象大模型提供秒級天氣預報;紫東·太初是全球首個圖、文、音三模態大模型。
盤古大模型作為一款具有超大規模參數的產品,相比一般的大模型訓練成本更高。但值得注意的是,大模型的參數量,并不意味著與其在語言處理方面的準確度和質量成正比。而在公開資料中,盤古大模型在語義理解方面仍存在一定的局限性,特別是處理復雜語言結構和語義推理方面。
大模型之家認為,中國發展大模型是形勢所需,國內企業需要加強自主創新,掌握核心技術,避免被外部勢力“卡脖子”,提升國家的競爭力和影響力。不過,目前市場上推出的大模型存在嚴重的趨同性,且多以“類ChatGPT”的形式亮相,因此華為盤古Chat能否通過自身的量變引起質變,仍然需要等到7月正式問世后才能得出結論。
入局大模型賽道
華為產業鏈能否迎風翻盤?
AI將進一步驅動各行各業的生產能力、生產效率從量變到質變,實現跨越式發展,而隨著華為盤古Chat的推出,這也對計算提出了新要求。
與其他廠商相比,華為的優勢或在于擁有完整的產業鏈和較強的算力調配能力。據浙商證券此前披露,在訓練千億參數的盤古大模型時,華為團隊調用了超過2000塊的昇騰910芯片,進行了超2個月的數據訓練能力。
華為公司作為國內科技企業標桿,在AI芯片、算力等方面堅持國產化,其中,昇騰全棧AI軟硬件平臺構筑智能世界的基石,昇騰計算產業生態不斷發展完善,為盤古大模型提供了底層算力支撐。
然而,在AI算力領域,英偉達具有絕對優勢,旗下算力卡不僅成為了人工智能企業的香餑餑,甚至面對供貨的封鎖,甚至不惜加價購買英偉達顯卡。而面對美國制裁,華為的AI芯片開發與生產被迫停滯。
華為內部稱,每年大模型訓練調用GPU/TPU卡超過4000片,3年的大模型算力成本高達9.6億元人民幣。

在華為盤古大模型產業鏈上,多家上市公司都與華為保持著深度合作。在盤古Chat正式發布后,相關公司有望從中受益。
值得注意的是,盤古大模型由NLP大模型、CV大模型、多模態大模型、科學計算大模型等多個大模型構成,通過模型泛化,解決傳統AI作坊式開發模式下不能解決的AI規模化、產業化難題,可以支持多種自然語言處理任務,包括文本生成、文本分類、問答系統等。
此外,在應用方面,盤古大模型可賦能多個行業,如智能輿情,智能營銷,智能巡檢,智慧物流等多種場景。
不過,由于“盤古Chat”主要面向政企端客戶,大模型之家推測,盤古Chat應該不會大規模開放使用,通過強調功能的定制化,以及部署的數據安全性探索政企市場。這或將意味著華為的“盤古Chat”需要更多依賴華為現有的合作伙伴體系去推廣,通過與現有合作伙伴的深度合作,華為可以利用其合作伙伴的渠道和市場資源,可能需要更多時間去經歷市場驗證和達成行業共識。
隨著國內越來越多的人工智能企業正在積極探索大模型的應用,可以預見的是,在AI發展紅利的驅動之下,將不斷強化我國在大模型領域的核心競爭力,并提升我國在數據安全方面的治理能力,為我說實現數字化轉型和智能化發展提供有力支持。