百川智能近期宣布推出其醫(yī)療領(lǐng)域的增強(qiáng)大模型Baichuan-M2,該模型在HealthBench基準(zhǔn)測(cè)試中取得了60.1的高分。值得注意的是,Baichuan-M2以32B的參數(shù)規(guī)模,超越了OpenAI的gpt-oss120b模型(得分57.6),以及其他多個(gè)世界領(lǐng)先的開源大模型,如Qwen3-235B、Deepseek R1和Kimi K2。
回溯至今年年初,百川智能率先在行業(yè)內(nèi)發(fā)布了“AI患者模擬器”,通過真實(shí)數(shù)據(jù)創(chuàng)建了涵蓋不同年齡、性別和癥狀的上萬個(gè)虛擬患者,并模擬了數(shù)百萬次的診療過程。基于這一創(chuàng)新范式,百川智能開源了Baichuan-M1,這是業(yè)內(nèi)首個(gè)醫(yī)療增強(qiáng)模型。
經(jīng)過七個(gè)月的技術(shù)迭代,百川智能升級(jí)了患者模擬器,并引入了端到端的強(qiáng)化學(xué)習(xí)機(jī)制。這一改進(jìn)使得Baichuan-M2在HealthBench等評(píng)測(cè)標(biāo)準(zhǔn)上取得了更為顯著的突破。
為了滿足醫(yī)療領(lǐng)域用戶對(duì)于隱私保護(hù)的嚴(yán)格要求,百川智能對(duì)Baichuan-M2進(jìn)行了深度輕量化處理。量化后的模型精度幾乎不受影響,能夠在RTX4090顯卡上單卡部署。與DeepSeek-R1 H20的雙節(jié)點(diǎn)部署方式相比,這一方案的成本降低了57倍。Baichuan-M2針對(duì)國產(chǎn)主流芯片進(jìn)行了開發(fā)和適配,使得大多數(shù)醫(yī)療機(jī)構(gòu)能夠利用現(xiàn)有硬件條件實(shí)現(xiàn)快速部署。
針對(duì)急診、門診等需要快速交互的場景,Baichuan-M2的MTP版本基于Eagle-3架構(gòu)進(jìn)行了優(yōu)化,在單用戶場景下實(shí)現(xiàn)了74.9%的token處理速度提升。






