速途網訊(報道:喬志斌)9月17日,由中國人工智能學會、江西省科學技術廳、南昌市人民政府共同主辦的2023第十二屆中國智能產業高峰論壇(CIIS 2023)在江西南昌開幕。中國工程院戴瓊海院士、趙春江院士,蔣昌俊院士等多位高校科研院所和企業嘉賓分享學術前沿、展示技術創新,共同推動智能產業高質量發展。百度自研大語言模型“文心一言”表現亮眼,獲得了學術和產業界的高度贊譽。
“文心一言在8月31日率先面向全社會開放服務,首日回答了網友3342萬個問題,細分使用場景包括各類寫作、文案創意、問答、咨詢、代碼等十分廣泛。”百度集團副總裁、深度學習技術及應用國家工程研究中心副主任吳甜在論壇報告中分享了文心一言的用戶使用以及其背后的技術創新。

大模型技術在過去幾年取得了快速的發展,特別是重新定義了人機交互方式,從圖形用戶界面(GUI)走向了自然語言交互(LUI)。大語言模型具備了理解、生成、邏輯、記憶這四項重要能力,可與人進行自然的交互,輔助人完成文圖創作、規劃、解題、編程等學習、工作、生活和陪伴等場景下方方面面的需求,成為出色的智能助理。據IDC、人民數據、新華網、清華大學等眾多機構的評測報告顯示,百度文心大模型3.5版支持下的文心一言中文能力突出;綜合能力在評測中超過ChatGPT,遙遙領先于其他大模型,穩居國內第一。
從“文心一言”的技術架構圖來看,其底層是從數萬億數據和數千億知識中融合學習得到的預訓練大模型,可謂“讀書破億卷”。在預訓練大模型的基礎上,采用有監督精調、人類反饋的強化學習、提示(Prompt)技術等讓文心一言的輸出更符合人們對它的預期。同時百度還研發了知識增強、檢索增強、對話增強等獨有技術,從準確性、邏輯性、時效性、安全性等方面提升文心一言的模型效果。
吳甜表示,提升大語言模型能力主要面臨三方面的技術挑戰,一是要提升效果,二是要追求效率,三是要實際可用。文心一言在效果、效率、應用方面開展了系統化和綜合性的技術工作,為用戶帶來服務體驗的持續提升。
效果方面,“文心一言”通過多種策略優化數據源及數據分布、基礎模型長文建模、多類型多階段有監督精調、多任務自適應有監督精調、多層次多粒度獎勵模型等技術創新,全面提升基礎通用能力;在檢索增強和知識增強的基礎上,通過知識點增強,提升對世界知識的掌握和運用;通過大規模邏輯數據構建、邏輯知識建模、多粒度語義知識組合以及符號神經網絡,提升邏輯能力;通過構建數據、內容、模型和系統安全的全面安全體系,保障大模型的安全性。
效率方面,百度自主創新的深度學習平臺“飛槳”和“文心大模型”協同優化,通過端到端自適應混合并行訓練技術以及壓縮、推理、服務部署的持續優化,文心大模型訓練速度達到原來的3倍,推理速度達到原來的30多倍。
應用方面,面向場景的數據驅動、提示構建和插件增強,讓文心一言能夠更好地滿足各種場景需求。其中插件方面,文心一言已上線百度搜索、覽卷文檔、E 言易圖、說圖解畫、一鏡流影等原生插件,具備了生成實時準確信息、長文本摘要和問答、數據洞察和圖表制作、基于圖片的創作和問答、文生圖/視頻等能力,并將通過插件生態,攜手開發者持續擴展文心一言的能力邊界。
論壇現場,吳甜展示了文心一言在市場分析、代碼輔助、智能辦公等場景下的操作過程和應用效果,原本數周的工作在幾分鐘之內就可以完成,帶來了顯著的效率提升。
“以文心一言為代表的大語言模型,正帶來通用人工智能的曙光,將重塑人們生產和生活的方式,重構智能產業格局。”技術發展之快,一日千里,而有應用的技術方顯價值。大語言模型、生成式AI成為全民的熱點,如何把先進技術轉化為先進生產力,仍需政產學研用全產業鏈全方位的戮力協同,建設AI技術基礎設施和生態,共同推動產業智能化升級。