
在大模型蓬勃發展的推動下,人工智能正牽動著一場覆蓋全行業、全領域的科技變革,而開源大模型已在這場變革中樹立起不可或缺的地位。革命性的自然語言處理和生成能力賦予了企業和開發者前所未有的機會,構建更智能、更高效的應用和服務。在商業應用、數據分析、教育培訓等領域展現出巨大潛力。
8月7日,元象XVERSE公司宣布開源其百億參數的高性能通用大模型XVERSE-13B,可免費商用。據官方介紹,XVERSE-13B是目前同尺寸中效果最好的多語言大模型,在多項權威的標準中文和英文測評中,性能超越了Llama-2-13B、Baichuan-13B等國內外開源模型代表。
對此,「大模型之家」獨家對話元象XVERSE,就開源大模型對企業、行業的價值與影響等多角度帶來專業的觀點與分析。以開源打造互聯網時代主流模式
元象XVERSE向大模型之家表示,XVERSE-13B是完全開源,支持免費商用。企業本意就是為了推動國產大模型開源生態與產業應用的繁榮發展。如果技術發展,能推動生態和產業發展,我們自然能創造更多、更大的價值。

開源性質將促進知識的共享和合作,打破信息孤島,使知識普惠化成為可能。這將使得知識和技術不再受限于特定的機構或地區,有助于縮小數字鴻溝,提高社會中更多人的數字素養水平。
強大自然語言處理和生成能力將在各個行業和領域產生深遠影響。在醫療領域,它可以用于輔助醫療診斷、藥物研發等;在金融領域,可以用于智能投資分析、風險評估等;在教育領域,可以推動個性化教育、智能輔導等;在媒體領域,可以改善內容生成和新聞報道。
除此之外,開源大模型還有助于加速科研進展,為研究人員提供更強大的工具,推動各領域的創新。據元象XVERSE介紹,哈爾濱工業大學已經率先使用XVERSE-13B大模型推進相關研究工作。哈工大計算機科學與技術學院張偉男教授表示,“開源是互聯網時代主流模式,不僅能貢獻社區,推動技術持續創新,還能利用協同解決算法透明性、穩定性、公眾信任度等共性問題。”多數據領跑,讓AI寫作“用事實說話”
XVERSE-13B大模型基于標準Transformer結構,在1.4萬億高質量、多樣化tokens的訓練數據上,從零訓練(train from scatch)了130億參數大模型,支持40多種語言,上下文窗口大小為8192。
1.4萬億tokens為XVERSE-13B帶來了更豐富和多樣化的語言知識,能夠處理更復雜和多變的自然語言任務。8192的上下文窗口大小,說明模型能夠捕捉到更長距離的語義關系,但也需要更多的計算資源。

元象XVERSE向大模型之家介紹:“訓練XVERSE-13B我們使用的是千卡算力,網絡采用ROCE(RDMA over Converged Ethernet)是一種基于以太網的RDMA(Remote Direct Memory Access)協議,單機規格1.6Tbps。提升推理速度和效果是我們正在探索的工作,也是后續的優化方向。”
除此之外,大模型之家注意到在XVERSE-13B的測評過程中選擇了AGIEval、GAOKAO-Bench等評測方法進行測試,這些評測方法主要為圍繞一些國內外專業的官方入學和職業資格考試。

在回答“當面對非官方中文語言理解和邏輯推理時將如何避免XVERSE-13B回答出現‘幻覺’?”的問題時,對此元象XVERSE表示:好的團隊基因是大模型獲得良好的效果的重要原因。元象在2021年成立時就有完整的AI技術與人才布局。目前大模型團隊有多位來自騰訊、百度和IDEA研究院等機構的技術專家,在NLP和搜索領域有深厚技術積累,對語言數據和高質量語料理解深入,在快速迭代模型方面經驗豐富。
為了避免回答出現幻覺,元象采用了多樣化且準確的數據進行訓練,讓模型盡可能地多學習。從擬人的角度看,其實人有時候也會出現“空耳”以及理解偏差的情況,但元象會努力讓模型避免此類問題。從2022年開始,公司就針對“基于動態知識引入的事實一致性對話生成”這一關鍵核心課題進行深入研究,希望在結合上下文與背景信息時,減少與事實不符或錯誤背景描述的情況,讓AI實現從寫作“自然流暢”到“用事實說話”的技術跨越。深度結合自身業務,以AI驅動“端云協同”3D互動技術
元象作為國內領先的AI與元宇宙技術服務公司,致力于打造AI驅動的3D內容生產與消費一站式平臺,通過大模型賦能自身業務將成為公司未來發展的重要方向。元象表示:XVERSE-13B是一個通用大模型,能與任何有需要的行業和業務結合,企業認為它在醫療、教育、文旅、金融和娛樂等行業將具有更大的發展前景。

除此之外,大模型也可能會對高智能數字人、未來人機交互帶來顛覆性影響,這些是元宇宙內容的重要組成部分,XVERSE-13B也將提供強大技術后盾。
基于強大的語言理解和生成能力,以及結合元象原有的3D圖形能力、語音技術能力,XVERSE-13B可以為高智能數字人提供更加豐富和多樣化的內容來源和表現形式,使得高智能數字人更加逼真和智能。同時,由于大模型可以支持多種語言和任務,并且可以根據用戶輸入或反饋進行自適應調整,它們可以為未來人機交互提供更加靈活和個性化的交互方式,使得未來人機交互更加自然和流暢。
元象XVERSE創始人姚星表示:“真實世界的感知智能(3D),與真實世界的認知智能(AI),是探索通用人工智能(AGI)的必由之路,也是元象持續探索3D與AI前沿技術的動力。”作為“端云協同”3D互動技術的引領者,元象通過自研引擎和前沿AI算法驅動,為用戶打造全新元宇宙體驗,助?各?業3D化,實現自由「定義你的世界」愿景。

在《人工智能大模型產業創新價值研究報告》中指出:大模型產業價值的關鍵,在于降低人工智能的使用門檻,將其特征與能力與各種場景結合,以實現場景效率的提升。開源大模型可以通過大規模的數據和參數,學習到更多的語言和知識,從而提高人工智能的通用性和泛化能力。同時,通過預訓練和微調的機制,簡化人工智能的開發流程,降低人工智能的技術門檻和成本。
正如元象XVERSE所述,XVERSE-13B已基本實現國產可替代,公司也期待為國產大模型發展貢獻一份力量。開源大模型本意還是讓更多的開發者、用戶可以直接部署和使用,推動生態和產業的發展為主。同時企業也支持在許可范圍內,開發者對XVERSE-13B 修改得到模型衍生品,對于模型衍生品中付出創造性勞動的部分,開發者可以主張該部分的知識產權。
大模型之家認為開源大模型為社會的可持續發展提供了豐富的資源和可能性,作為人類共同智慧的橋梁,開源大模型將為社會創造更加智能、包容和進步的未來,引領我們邁向一個全球化、數字化的智慧文明時代。