速途網(wǎng)9月18日訊(報道:龍翔)中國AI團隊 DeepSeek 再獲突破 —— 其核心團隊完成、梁文鋒任通訊作者的 DeepSeek-R1 推理模型研究論文,不僅登上國際權威期刊《自然》封面,DeepSeek-R1更成為全球首個經獨立同行評審的主流大語言模型,填補行業(yè)關鍵空白。


據(jù)悉,與今年1月發(fā)布的DeepSeek-R1的初版論文相比,本次論文披露了更多模型訓練的細節(jié),并正面回應了模型發(fā)布之初的蒸餾質疑。
2025年初,當DeepSeek R1模型發(fā)布時,其卓越的推理能力和極低的開發(fā)成本瞬間引發(fā)全球科技股震蕩,英偉達等AI龍頭企業(yè)市值蒸發(fā)數(shù)千億美元,DeepSeek也一戰(zhàn)成名。
而后,DeepSeek延續(xù)在深度推理方面的領先優(yōu)勢。同時,DeepSeek-R1也是全球首個經過同行評審的主流大語言模型。Nature評價道:目前幾乎所有主流的大模型都還沒有經過獨立同行評審,這一空白“終于被DeepSeek打破”。
有行業(yè)專家認為,該成果不僅標志中國自主大模型獲國際頂尖學術認可,更為主流大模型建立 “學術評審標桿”,推動行業(yè)從 “商業(yè)快速迭代” 轉向 “商業(yè)價值與學術嚴謹并重”,倒逼技術透明化與成果可驗證性提升,為全球 AI 領域規(guī)范發(fā)展提供范本。
論文鏈接: