今年以來,大語言模型(Large Language Model,LLM)是無疑最熱門的話題之一。從GPT-3到LLaMA-2,這些擁有數十億甚至數千億參數的模型,展現了驚人的涌現與邏輯能力,被行業視為人類走向通用人工智能(AGI)的起點。
然而在大模型的發展路徑上,開源與閉源的抉擇爭論一直存在。

放眼全球的大模型企業,對于開源的態度也不盡相同。例如OpenAI的GPT-4和百度的文心一言至今則堅持閉源,將其模型技術保留在內部,可能是出于商業機密的考慮。而Meta則選擇了開源的道路,相繼面向“學術研究用途”開源了LLaMA和LLaMA-2模型,這種做法有助于促進學術領域的共享與合作,推動整個科技社區的發展。
此外,還有一些企業采取了混合策略,即在學術領域開源部分模型,在商業探索上采用閉源策略。比如百川智能在學術領域選擇了開源Baichuan2-7B、Baichuan2-13B,為研究者提供了更廣泛的使用空間。然而,在商業探索上,百川智能采用了相對封閉的策略,將Baichuan2-53B保持為閉源,以保護商業利益和技術的競爭優勢。
在國內大模型開源領域,阿里云旗下的通義千問一直是該領域的領頭羊。12月1日,阿里云舉辦通義千問發布會,不僅開源了通義千問720億參數模型Qwen-72B,同時還宣布Qwen-1.8B和音頻大模型Qwen-Audio開源,實現了包括通用大語言模型、視覺語言模型和音頻大模型在內的“全尺寸、全模態”的開源。
在大模型之家看來,能夠堅定地將通義千問開源,其背后是不僅對于阿里云對大模型發展階段的判斷、自身的優勢以及現階段業務發展的重心有了更為清晰的理解,同時,填補中國大語言模型開源領域空白。
大模型操作系統呼之欲出,通義千問填補中國開源領域空白
行業內,常常把大模型的開源與閉源的爭論,類比為移動互聯網時代的Android與iOS之爭。然而,爭論的實質不僅僅是技術能力的對比,更是圍繞著生態的爭奪。在大模型時代,構建一個強大的應用生態,就需要一個穩固的基座大模型,而這個基座大模型便是未來大模型時代的操作系統。
目前,國內開源的大模型領域呈現出一片百花齊放的景象。根據中國新一代人工智能發展戰略研究院發布的《2023中國新一代人工智能科技產業發展報告》,截至目前,國內大模型總數已達到238個,涵蓋了中文、英文、多語言等不同語種,以及通用、對話、視覺語言、音頻等不同模態。這些模型的開源,為國內的人工智能領域提供了豐富的資源和選擇,也展現了國內的技術實力和創新活力。
盡管目前國內大模型的開源生態中有許多大模型涌現,但真正開源的基座卻相對匱乏。所謂開源基座,就是指那些具有高性能、高穩定、高兼容、高可擴展等特點的大模型,它們可以作為其他大模型的基礎,進行繼續預訓練、微調、部署等,支撐大模型的應用開發和技術創新。
開源基座的重要性,在于它們可以降低大模型的使用門檻,提高大模型的使用效率,促進大模型的生態建設,推動大模型的社會價值。
在這個背景下,通義千問系列模型的開源顯得尤為重要,因為它不僅在性能上超越了國外的開源標桿,而且完全免費、可商用,為國內的開發者和研究人員提供了強大的支持和便利。
通義千問系列模型在大模型開源領域的貢獻首先體現在其性能方面。通過一系列的權威基準測評,通義千問系列模型在同等參數規模下展現出優越的性能,不僅超越了國外標桿模型,更在國內大模型開源生態中站穩了腳跟。具體而言,Qwen-72B作為最新開源的720億參數模型,基于3T tokens高質量數據訓練,在10個權威基準測評中奪得開源模型最優成績,在10個權威基準測評中創下了開源模型最優成績,成為業界最強的開源大模型。
然而,要想構建一個健全的大模型生態,單一性能的強大并不足夠。通義千問系列模型的獨特之處還在于其全尺寸的開源,從1.8B到72B,通義千問以其卓越的技術實力和前瞻性的視野,率先實現了全尺寸的開源大模型系列。這種全尺寸的開源意味著通義千問提供了從小型應用到大型場景的全方位支持,為開發者提供了更廣泛的選擇空間。這種開源的全尺寸,填補了國內開源大模型領域的空白,也為國內的開發者搭建了一個更為豐富、靈活的大模型生態。
擁抱開源,營造更好的社區生態
眾所周知,開源作為已經成為了軟件行業的一個重要趨勢,它推進了技術的共享,加速了技術進步和標準化進程,為更多開發者提供了改進和創新的機會。開源社區為開發者提供了強大的支持,幫助他們加快開發進程、提高軟件質量,并促進更好的協作。這些優勢共同為開源社區和技術生態的發展奠定了堅實基礎,同時也推動了大模型的快速發展。
通義千問系列大模型,通過開源這一方式,通義千問系列大模型不僅提供了免費、可商用的模型,還提供了完善的文檔、教程、工具和平臺,讓用戶可以方便地使用模型,并積極與社區和合作伙伴進行交流和合作,讓用戶可以獲取更多的資源和支持。
除了通義千問這一開源大模型基座之外,阿里云還積極匯聚行業中領先的大模型,尤其是適合中文語言環境下的大模型,為泛AI開發者提供靈活、易用、低成本的一站式模型服務產品。2022年11月,阿里云和CCF開源發展委員會共同發起的“魔搭社區”(ModelScope)正式上線,如今已經成為國內最活躍的AI的模型社區之一。
至今,魔搭社區已發展成為匯聚工業級領先模型和數據的平臺,有超過2300個優質AI模型,絕大部分為中文模型,并涵蓋不同語種、模態、領域和任務。用戶可以在此發現、學習、定制和分享模型,同時享受完善的文檔、教程、工具和平臺支持。魔搭社區還具備強大的系統指令能力,使企業能輕松地定制自己的AI助手,也為開發者提供學習與探索的平臺。
此外,魔搭社區還重視與高校、合作伙伴的交流合作。它與20多所頂級院校開展學術合作,通過舉辦高校巡回沙龍、聯合開發課程等方式,支持高校學子對AI大模型等前沿技術的探索。此外,魔搭社區還與多個開源工具和框架進行技術對接,確保用戶可以更好地理解和利用模型。
賦能中小企業,打造行業基座
在“百模大戰”的背景之下,在各個榜單中“爭第一”幾乎成為了它們的必修課,因為只有“第一”才能證明自己的與眾不同,才能獲得被更多人記住的機會。然而,渴望脫穎而出的背后,每家大模型企業目的也不盡相同。例如有的巨頭企業為的是通過能力為大模型積累更多的商業化機會,有的初創企業急于通過成績完成最初的資本積累,而通義千問則將更多的目光聚焦于產業——打造基于通義千問大模型底座的大模型產業生態。
雖然大模型賦能千行百業早已成為行業共識,但是大模型從零開始訓練的成本、耗時、數據之高,仍然是橫于眾多企業踏入大模型領域前的一道門檻。因此,通過在現有可商用的開源大模型的基礎上進行知識增強或是針對性的微調,發展面向特定場景的專業大模型產品。
然而,中小企業和開發者在AI開發中,卻面臨著諸多的問題和困難。首先,技術門檻高,導致許多企業和開發者難以掌握和使用大模型的相關技術。其次,資源不足,導致許多企業和開發者難以投入和支持大模型的研發和應用。最后,平臺缺失,導致許多企業和開發者難以找到和利用大模型的相關服務和工具。這些問題和困難,嚴重制約了中小企業和開發者的AI技術的創新和應用。
因此,在全球AI技術角力的大背景之下,采用國內大模型開發底座的需求也呼之欲出。以通義千問系列大模型為例,不僅提供了高性能、高穩定、高兼容、高可擴展的基礎模型,還提供了強大的系統指令(System Prompt)能力,讓用戶只用一句提示詞就可定制自己的AI助手,讓大模型具備角色扮演能力。這些模型和能力,為用戶提供了豐富的創造空間,讓用戶可以根據自己的需求和想法,構建更適合的模型和應用。
同時,通義千問還整合了各方面的資源和技術力量,為開發者提供了一個全面的技術支持平臺。這個平臺包括了數據處理、模型訓練、應用開發等各個環節所需的工具和服務,幫助開發者更加高效地進行開發工作。此外,通義千問還為開發者提供了豐富的數據集和模型庫,幫助他們更好地解決實際應用中的問題。
在教育領域,通義千問系列大模型可以作為智能教學助手,幫助學生和老師進行學習和教學。比如由浙江大學、高等教育出版社和阿里云聯合發布的智海-三樂教育垂直大模型,它以教科書級別的高質量語料為基礎,基于通義千問70億參數模型Qwen-7B進行訓練,結合專業指令數據集進行預訓練和微調。這使得模型具備了智能問答、試題生成、學習導航和教學評估等能力,并已在全國多所高校得到應用。
在智慧辦公領域,瓴羊Quick BI的智能小Q助手上,基于通義千問開源大模型研發,并加入BI的行業知識,微調訓練Qwen基座模型,使之具備NL2SQL/NL2DSL能力,用戶可以通過對話使用小Q生成美觀的報表、幫助用戶快速生成報表摘要,并將摘要結果加入儀表板,甚至能分析數據的異常情況,幫助定位業務問題。降低了數據決策的門檻。
此外,在娛樂方面,它可以作為智能娛樂助手,根據用戶喜好和場景生成有趣的內容,提供智能推薦和引導,增加娛樂體驗,同時根據用戶語言和情緒生成適合的回應,增強娛樂互動和溝通。在商業領域,通義千問可以作為智能商業助手,根據企業產品和服務提供專業介紹和說明,提供智能咨詢和推薦,提高商業吸引力和轉化率,并根據客戶需求和反饋生成合適的答案和建議,提供智能服務和支持,提升商業滿意度和忠誠度。
不僅如此,基于大模型的能力,還可以和現實世界中的機器人相結合,不僅可以加速生產制造的智能化流程,還可以成為通用的人工智能大腦,打造能接受人類以自然語言提出的任務,并理解、拆解、規劃、執行任務幫助傳統制造商升級產品。在具身智能時代,為每個專業設備都將迎來智能化升級的機會。
寫在最后
盡管關于開源商業化的爭論在行業內仍然持續,但在大模型之家看來,“開源與商業化無緣”是個偽命題,在軟件開發層面,行業內不僅有微軟、谷歌、Meta等巨頭為開源界作出巨大貢獻,也有紅帽一樣的深植于開源操作系統服務的企業。而在硬件領域,在產業全面走向智能化的大勢所趨之下,行業對于算力的需求也將到達前所未有的高度,這對于阿里云這種智能化時代下的算力基礎設施提供商而言,也帶來了業務增長的全新機遇。
更為重要的是,只有行業的繁榮發展,才能孕育出更多的商業機遇。在這一進程中,以通義千問為代表的國產開源大模型正在發揮著無可替代的推動作用。大模型之家相信,隨著這些大模型的持續進化和推廣,國內的大模型開源生態建設將成為推動行業智能化的新基座,引領我們進入一個全新的AI時代。



