色视频www在线播放国产成人 _亚洲第一激情av_在线播放豆国产99亚洲_国产亚洲精品福利_午夜伦全在线观看_这里只有精品丝袜_欧美少妇精品_欧美成人午夜电影_成人在线免费观看黄色_欧美日韩亚洲综合一区二区三区_欧美高清xxxxxkkkkk_久久精品国产99久久6

百川發(fā)布最強(qiáng)循證增強(qiáng)大模型M2 Plus,幻覺(jué)率相比DeepSeek降低3倍

速途網(wǎng)10月22日消息(報(bào)道:李楠)今日,百川智能發(fā)布循證增強(qiáng)醫(yī)療大模型Baichuan-M2 Plus,同步升級(jí)配套應(yīng)用百小應(yīng)并開(kāi)放API。這是百川自8月開(kāi)源Baichuan-M2以來(lái)的又一次重要?jiǎng)幼鳌Tu(píng)測(cè)顯示,M2 Plus的醫(yī)療幻覺(jué)率較通用大模型顯著降低,相比DeepSeek低約3倍,優(yōu)于美國(guó)最火醫(yī)療產(chǎn)品OpenEvidence,可信度比肩資深臨床醫(yī)生水準(zhǔn)。

通用大模型固有的幻覺(jué)問(wèn)題導(dǎo)致其在嚴(yán)肅醫(yī)療場(chǎng)景中難以真實(shí)應(yīng)用。國(guó)內(nèi)眾多醫(yī)院雖積極嘗試部署和優(yōu)化DeepSeek,但實(shí)際效果不盡人意。反觀大洋彼岸的現(xiàn)象級(jí)醫(yī)療大模型產(chǎn)品OpenEvidence,能給我們重要的啟示。該產(chǎn)品因符合醫(yī)學(xué)認(rèn)知的循證增強(qiáng),已有40%美國(guó)醫(yī)生在臨床場(chǎng)景中注冊(cè)使用,每月咨詢(xún)量達(dá)1650萬(wàn)次。兩天前,該公司C輪融資2億美金,估值達(dá)60億美元。

百川M2 Plus首創(chuàng)六源循證推理(EAR)范式,打造“醫(yī)生版ChatGPT”,讓大模型技術(shù)在輔助臨床診療場(chǎng)景邁過(guò)“敢用、可用”關(guān)鍵門(mén)檻,不僅適合中國(guó)醫(yī)療環(huán)境,在美、日、英的醫(yī)療評(píng)測(cè)中均超過(guò)OpenEvidence,代表中國(guó)在世界大模型擂臺(tái)上再下一城。

首創(chuàng)六源循證推理范式,把循證做“全”、檢索做“準(zhǔn)”、推理做“對(duì)”

(一)六源循證:打造從原始研究到真實(shí)世界的完整知識(shí)體系

循證醫(yī)學(xué)(Evidence-Based Medicine, EBM)作為現(xiàn)代醫(yī)學(xué)知識(shí)體系的核心范式,是確保醫(yī)療決策可信的關(guān)鍵。

通用大模型像一個(gè)“博學(xué)但不可靠”的專(zhuān)家,即便有搜索增強(qiáng),也會(huì)因?yàn)橹R(shí)來(lái)源混雜不符合循證醫(yī)學(xué)范式。

百川不僅主動(dòng)屏蔽了互聯(lián)網(wǎng)的非專(zhuān)業(yè)信息來(lái)源,只使用權(quán)威來(lái)源的醫(yī)學(xué)證據(jù),還在此基礎(chǔ)上構(gòu)建了從證據(jù)、到實(shí)踐、再到真實(shí)世界反饋六層證據(jù)類(lèi)型的知識(shí)體系:

  • 原始研究層: 索引海量醫(yī)學(xué)期刊論文4000余萬(wàn)篇,超過(guò)PubMed收錄數(shù)量,涵蓋基礎(chǔ)與臨床研究成果,是循證鏈條的起點(diǎn);
  • 證據(jù)綜述層: 整合系統(tǒng)評(píng)價(jià)和Meta分析等高等級(jí)證據(jù),提供經(jīng)過(guò)匯總的研究結(jié)論;
  • 指南規(guī)范層: 引入國(guó)際和國(guó)內(nèi)權(quán)威機(jī)構(gòu)發(fā)布的臨床指南、專(zhuān)家共識(shí)和行業(yè)標(biāo)準(zhǔn),確保回答符合最新規(guī)范;
  • 實(shí)踐知識(shí)層: 包含臨床病例報(bào)道、一線專(zhuān)家經(jīng)驗(yàn)和診療技巧等實(shí)用知識(shí),貼近醫(yī)療實(shí)踐場(chǎng)景;
  • 公共健康教育層: 匯集權(quán)威科普和公共衛(wèi)生知識(shí),如疾病預(yù)防宣教、健康指導(dǎo)等內(nèi)容,服務(wù)大眾健康教育;
  • 監(jiān)管與真實(shí)世界層:?涵蓋藥監(jiān)部門(mén)公告、臨床試驗(yàn)登記及大規(guī)模真實(shí)世界研究數(shù)據(jù)等信息,以反映最新的監(jiān)管動(dòng)態(tài)與人群研究結(jié)果;

這個(gè)金字塔形的“六源”,是一層一層演化而來(lái):原始層回答“事實(shí)是否存在”、證據(jù)層回答“結(jié)論是否一致”、指南層回答“行業(yè)如何規(guī)范”、實(shí)踐層回答“醫(yī)生應(yīng)如何決策”、公共層回答“患者應(yīng)如何理解”、真實(shí)世界層回答“是否存在新風(fēng)險(xiǎn)”。這讓模型從“生成答案”走向“據(jù)實(shí)回答”,實(shí)現(xiàn)了從語(yǔ)言可信度知識(shí)可信度的躍升。

(二)循證檢索:從“找得到”躍升到“找得準(zhǔn)”

傳統(tǒng)的RAG檢索往往追求“找得到”,而循證檢索追求“找得準(zhǔn)”。

M2 Plus采用PICO框架(人群Population、干預(yù)Intervention、對(duì)照Comparison、結(jié)局Outcome)思維,將查詢(xún)轉(zhuǎn)化為結(jié)構(gòu)化醫(yī)學(xué)問(wèn)題,并在六源數(shù)據(jù)庫(kù)中進(jìn)行分層匹配。例如:當(dāng)輸入“老年OSA患者使用CPAP能否改善高血壓?”時(shí),系統(tǒng)優(yōu)先在高等級(jí)證據(jù)(系統(tǒng)綜述、RCT元分析)中搜索,并自動(dòng)辨識(shí)研究質(zhì)量、樣本量、置信區(qū)間與結(jié)局指標(biāo)。

這種方法克服了通用RAG的兩大缺陷:一是缺乏醫(yī)學(xué)語(yǔ)義理解(無(wú)法區(qū)分CPAP療效與依從性分析);二是無(wú)法辨別文獻(xiàn)可靠性(新聞與指南同權(quán))。在此基礎(chǔ)上,M2 Plus能夠三步精準(zhǔn)鎖定“鐵證”:

第一步,智能提問(wèn):自動(dòng)將用戶(hù)問(wèn)題拆解成多個(gè)專(zhuān)業(yè)的PICO查詢(xún),進(jìn)行“地毯式”證據(jù)搜索,兼顧精度與廣度。

第二步,精準(zhǔn)鎖定:通過(guò)自研的Medical Contextual Retrieval技術(shù),完整保留文獻(xiàn)的臨床因果鏈,避免信息割裂。

第三步,證據(jù)排序:內(nèi)置“審稿人”模型,自動(dòng)評(píng)估證據(jù)等級(jí)(如RCT、Meta分析),將最可信、最相關(guān)的“鐵證”優(yōu)先呈現(xiàn)。

(三)循證推理:讓模型“像醫(yī)生一樣思考”

如果說(shuō)“六源循證”解決了醫(yī)療AI知識(shí)從哪來(lái)的問(wèn)題,“PICO智能檢索”解決了如何快速找到正確證據(jù)的問(wèn)題,那么最關(guān)鍵的一步是如何確保AI在手握證據(jù)時(shí),不會(huì)“自由發(fā)揮”、脫離事實(shí)胡亂回答。

百川智能在M2 Plus中引入“循證增強(qiáng)訓(xùn)練”機(jī)制,為模型的回答過(guò)程“上了一道鎖”,從根本上改變了其生成邏輯,讓它學(xué)會(huì)“引用,而非臆測(cè)”。

首先,在訓(xùn)練中獎(jiǎng)勵(lì)“引用”,懲罰“臆測(cè)”,準(zhǔn)確引用權(quán)威來(lái)源(如指南、文獻(xiàn))時(shí)會(huì)獲得高分,一旦回答脫離了檢索到的證據(jù)就會(huì)受到懲罰;

其次,內(nèi)置“證據(jù)評(píng)估器”,模型被訓(xùn)練得能夠自動(dòng)評(píng)估檢索到的證據(jù)質(zhì)量,優(yōu)先采納高可信度的信息(如RCT、Meta分析),并將其無(wú)縫嵌入到推理鏈中;

第三,句句有據(jù),可回溯、可驗(yàn)證:經(jīng)過(guò)訓(xùn)練,M2-Plus的回答風(fēng)格發(fā)生了根本性改變,在輸出關(guān)鍵結(jié)論時(shí),會(huì)自動(dòng)附上參考文獻(xiàn)、指南出處等來(lái)源,這賦予了AI回答更高的可解釋性與可信賴(lài)度。

幻覺(jué)最低,達(dá)到與人類(lèi)資深臨床專(zhuān)家同等可信度

這種“循證驅(qū)動(dòng)”的生成邏輯,讓M2 Plus幾乎杜絕了無(wú)中生有的內(nèi)容。在多場(chǎng)景評(píng)測(cè)中,其綜合幻覺(jué)率在所有大模型當(dāng)中最低,相較DeepSeek R1最新版降低3倍,顯著領(lǐng)先OpenEvidence。不僅如此,在病史分析、診斷思路、治療方案等真實(shí)復(fù)雜的核心醫(yī)療場(chǎng)景中,達(dá)到了與人類(lèi)資深臨床專(zhuān)家同等的可信度。

301醫(yī)院的姜醫(yī)生提問(wèn),“目前公認(rèn)最有效的基因治療藥物靶向足細(xì)胞遞送方案有哪些?”很多通用大模型回答這個(gè)問(wèn)題時(shí)都產(chǎn)生了明顯幻覺(jué),而M2 Plus的回答不僅查到了全球最新研究成果,還能按納米系統(tǒng) / AAV病毒載體等維度分類(lèi)。姜醫(yī)生贊嘆:“引用文獻(xiàn)非常具有專(zhuān)業(yè)性、且信息源緊貼頂刊ERA等最新進(jìn)展,對(duì)足細(xì)胞基因治療這么前沿的方向,能幫我快速了解國(guó)際熱點(diǎn)技術(shù)路線,少走彎路。”

北京天壇醫(yī)院的熊醫(yī)生,在研究目前PACAP在偏頭痛中的研究進(jìn)展如何時(shí)發(fā)現(xiàn),頭痛相關(guān)的研究越來(lái)越多,想找到真正有價(jià)值的文獻(xiàn)并不容易,多數(shù)大模型給出的答案都因幻覺(jué)問(wèn)題而不可用。他試用百小應(yīng)時(shí)看到,“能梳理全球PACAP偏頭痛研究,從機(jī)制到III期臨床試驗(yàn)自動(dòng)串聯(lián)證據(jù)鏈,不僅回答問(wèn)題,更讓醫(yī)生站在未來(lái)看科研進(jìn)展。”

無(wú)論是專(zhuān)業(yè)醫(yī)療問(wèn)題還是常規(guī)醫(yī)療問(wèn)答 M2 Plus都會(huì)引用權(quán)威醫(yī)學(xué)證據(jù)

多國(guó)醫(yī)學(xué)考試斷崖領(lǐng)先,醫(yī)學(xué)知識(shí)運(yùn)用能力超越人類(lèi)醫(yī)生

美國(guó)執(zhí)業(yè)醫(yī)師資格考試(USMLE)是評(píng)估臨床知識(shí)和推理能力的黃金標(biāo)準(zhǔn),即便是經(jīng)驗(yàn)豐富的臨床專(zhuān)家,要突破90分也極具挑戰(zhàn)。在此項(xiàng)考試中,M2-Plus取得了驚人的97分,不僅遠(yuǎn)超人類(lèi)考生平均水平,更與GPT-5的成績(jī)持平,穩(wěn)居全球第一梯隊(duì),展示了其世界級(jí)的臨床問(wèn)題解決能力。

中國(guó)執(zhí)業(yè)醫(yī)師資格考試(NMLE)及格線為360分,對(duì)于廣大醫(yī)學(xué)生而言,能考到450分以上已是高分,超過(guò)500分則被視為“學(xué)神”級(jí)別。M2 Plus取得了568分的“碾壓級(jí)”成績(jī),在所有公開(kāi)測(cè)試的主流大模型中位列第一,充分證明其對(duì)中國(guó)臨床指南和醫(yī)療實(shí)踐的掌握已爐火純青。

如果說(shuō)執(zhí)醫(yī)考是“從業(yè)門(mén)檻”,那么中國(guó)碩士研究生招生考試臨床醫(yī)學(xué)綜合能力(西醫(yī))考試則是頂尖醫(yī)學(xué)生競(jìng)爭(zhēng)的“華山論劍”。該考試不僅知識(shí)面廣,且題目設(shè)計(jì)極為復(fù)雜,對(duì)臨床思維要求高。通常,能考到280分以上的考生,都是協(xié)和、北醫(yī)等頂尖學(xué)府的頭部學(xué)霸。M2 Plus在此項(xiàng)考試中取得了282分。同時(shí),在日本、英國(guó)、澳大利亞等國(guó)高級(jí)醫(yī)師職稱(chēng)晉升考試中,準(zhǔn)確率85%以上,遠(yuǎn)超各國(guó)及格線。

這些壓倒性的成績(jī)充分說(shuō)明,M2 Plus 在復(fù)雜醫(yī)學(xué)知識(shí)運(yùn)用上的能力,已經(jīng)超越了人類(lèi)醫(yī)生水準(zhǔn)。

“醫(yī)生版ChatGPT”推動(dòng)醫(yī)療AI邁入可信可用階段

接入M2 Plus的百小應(yīng)已在各大手機(jī)應(yīng)用商店更新,成為”醫(yī)生版ChatGPT”。為方便電腦端使用,網(wǎng)頁(yè)版(ying.ai)也同步上線。

除了需要高效地輔助臨床決策,醫(yī)生還開(kāi)始面對(duì)新的挑戰(zhàn):患者用DeepSeek自診和帶著DeepSeek就醫(yī)的現(xiàn)象越來(lái)越多。雖然知道大模型可能有幻覺(jué)和偏頗,但沒(méi)有時(shí)間和精力去甄別哪句對(duì)哪句錯(cuò)。通過(guò)百小應(yīng),醫(yī)生有了面對(duì)通用模型挑戰(zhàn)的“專(zhuān)屬武器”。

對(duì)于希望深入理解診斷、治療、預(yù)后、病因、檢查等背后科學(xué)邏輯的患者及家屬,面對(duì)復(fù)雜的就醫(yī)環(huán)境和不同醫(yī)生給出的診療方案,百小應(yīng)讓他們有機(jī)會(huì)獲得最新最權(quán)威的知識(shí)、頂尖專(zhuān)家的思維和視角,得到無(wú)限耐心的專(zhuān)業(yè)解答。

Baichuan-M2 Plus也提供了標(biāo)準(zhǔn)化API接口,醫(yī)院信息化部門(mén)、互聯(lián)網(wǎng)醫(yī)療、大健康服務(wù)等各類(lèi)泛醫(yī)學(xué)機(jī)構(gòu),以及從事醫(yī)療AI行業(yè)的開(kāi)發(fā)者,則可以通過(guò)API將循證推理接入服務(wù)場(chǎng)景,提升AI服務(wù)的醫(yī)學(xué)專(zhuān)業(yè)性。

通過(guò)開(kāi)源Baichuan-M2、發(fā)布Baichuan-M2 plus、百小應(yīng),開(kāi)放API,百川致力于持續(xù)提升AI醫(yī)療在真實(shí)臨床場(chǎng)景的可用性,推動(dòng)大模型在嚴(yán)肅醫(yī)療場(chǎng)景進(jìn)入落地可用新階段。

(0)
上一篇 2025年10月22日 13:21
下一篇 2025年10月22日 15:26
亚洲资源中文字幕| 99久久999| 成人激情电影一区二区| 国产校园另类小说区| 国产综合av| www污在线观看| 亚洲一级片在线看| 国产成人av一区二区三区在线| av小说在线播放| 亚洲欧美丝袜| 日韩精品丝袜在线| 国产精品99久久久久| 性欧美freehd18| 日韩中文字幕三区| 久久影院资源网| 成a人片国产精品| 久久视频免费| 高清hd写真福利在线播放| 日本道色综合久久影院| 亚洲影院在线观看| 亚洲一区在线| 二区三区在线观看| 在线观看一区二区三区三州| 国产香蕉精品视频一区二区三区| 国产一区二区三区日韩| 午夜av成人| 日本中文字幕高清| 国产成人精品日本亚洲| 精品久久久精品| 91久久夜色精品国产九色| 中文字幕欧美日韩在线| 麻豆91精品| 国产精品yjizz视频网| 日韩a级黄色片| 久久精品免费播放| 亚洲视频一区在线观看| 久久久久久久久久久9不雅视频 | 日本黄色一区二区| 亚洲精品系列| а√天堂资源官网在线资源| 精品无码国产一区二区三区av| 欧美人成在线视频| 性做久久久久久| 日韩午夜在线| 成人福利片在线| 国产精品视频一区二区图片| 国产a一区二区| 亚洲护士老师的毛茸茸最新章节| 99久久精品久久久久久清纯| 欧美天堂影院| 国产综合在线观看| 一区二区日本伦理| 久久99精品久久久久久青青91| 亚洲国产毛片aaaaa无费看 | 999一区二区三区| 久久久久久中文| 欧美日韩国产激情| 久久av资源网| 日本亚洲不卡| 超碰在线免费播放| 欧美成人黑人猛交| 97伦理在线四区| 一区二区三区国产在线观看| 亚洲免费观看高清在线观看| 国产精品一级| 欧洲大片精品免费永久看nba| 人操人视频在线观看| 欧美性猛交内射兽交老熟妇| 国产经典一区二区| 欧美精品一区二| 亚洲精品va在线观看| 日韩成人免费电影| 精品综合久久88少妇激情| 黄色网在线播放| 日本黄大片一区二区三区| 蜜桃视频成人| 91av视频在线播放| 亚洲第一区中文字幕| 一区二区三区日韩| 国产高清精品在线| 欧美一区激情| 欧美成人精品午夜一区二区| 国产原创视频在线观看| 国产乱xxⅹxx国语对白| 亚洲人成77777| 国产精品中文字幕在线观看| 在线观看视频99| 欧美猛男超大videosgay| 国产精品免费视频网站| 韩国一区二区在线观看| 婷婷亚洲最大| 国产成人精品久久二区二区| 亚洲欧美综合色| 欧美bbbbb| 99久久视频| 国产精品亚洲欧美日韩一区在线| 精产国品自在线www| 免费亚色电影在线观看| 久久这里只有精品18| 精品久久久久久中文字幕动漫| 91成人天堂久久成人| 精品视频中文字幕| 在线观看av不卡| 亚洲精品水蜜桃| 成人免费视频app| 亚洲精品综合| 第四色成人网| av自拍一区| 性欧美freesex顶级少妇| 亚洲图区欧美| 福利在线白白| 免费看污污网站| 九九久久九九久久| 欧美精品v日韩精品v国产精品| 成人国产亚洲精品a区天堂华泰| 欧美国产日韩在线| 国产一区二区三区久久精品| 日韩欧美一二三四区| 欧洲一区二区三区免费视频| 亚洲国产精品久久艾草纯爱| 中文字幕不卡三区| 91麻豆成人久久精品二区三区| 久久爱另类一区二区小说| 国产农村妇女精品一区二区| 欧美色一级片| 国产精品毛片一区二区在线看| 日韩极品少妇| 97成人在线| 国产精品白丝久久av网站| 欧美男女交配| 午夜伦理福利在线| 日本不卡1234视频| rebdb初裸写真在线观看| 1区2区在线观看| 国内精品久久久久久野外| av大片在线观看| 国产三区四区在线观看| 久草在线免费福利资源| 极品白浆推特女神在线观看| 亚洲а∨精品天堂在线| 在线免费激情视频| 亚洲免费av一区二区| 四虎国产精品永远| 九色视频网站在线观看| 国产乱理伦片a级在线观看| 成人午夜在线观看视频| av网站在线免费观看| 日本在线看片免费人成视1000| av电影在线观看一区二区三区| 免费一级毛片在线观看| 黄色网址在线播放| 成人在线免费公开观看视频| 久久国产精品高清一区二区三区| 黄色在线视频观看网站| 成人在线免费公开观看视频| 男人影院在线观看| 免费av不卡在线观看| 91福利在线免费| 91超碰在线播放| 第84页国产精品| 欧美成人一二区| 久久免费视频66| 欧美亚洲激情| 欧美99在线视频观看| 99精品视频免费观看视频| 老司机午夜免费精品视频| 久久福利视频一区二区| 国产白丝网站精品污在线入口| av不卡在线观看| 亚洲欧洲日韩一区二区三区| 精品久久久久久久久久久久久久| 欧美日韩综合不卡| 亚洲精品二三区| www欧美日韩| 日韩av男人的天堂| av激情久久| 在线精品亚洲一区二区| 能在线观看的av| 最色在线观看| av免费在线免费观看| 国产成人免费9x9x人网站视频| 果冻天美麻豆一区二区国产| 91免费精品| 蜜臀久久99精品久久久画质超高清 | 日韩欧美亚洲日产国产| 99国产精品白浆在线观看免费| av片中文字幕| 视频在线91| 丝袜在线观看| 亚洲视频资源| 国产精品97| 久久99精品久久久久久动态图 | 日本免费精品| 99久久综合| 久久99精品久久久久久动态图 | 国产情侣第一页| 又黄又爽毛片免费观看| 国产美女性感在线观看懂色av| 亚洲天堂免费电影| 中文精品一区二区|