百度文心大模型4.5系列正式邁出了開(kāi)源的重要步伐,這一消息在科技界引起了廣泛關(guān)注。今日,百度官方宣布,文心大模型4.5系列不僅全面開(kāi)源,還同步提供了API服務(wù),為開(kāi)發(fā)者提供了極大的便利。
此次開(kāi)源,百度一次性推出了涵蓋多個(gè)任務(wù)需求的10款模型,從47B參數(shù)的混合專家(MoE)模型到輕量級(jí)的0.3B稠密型模型應(yīng)有盡有,滿足了文本、多模態(tài)等多種應(yīng)用場(chǎng)景的需求。這些模型的權(quán)重與代碼均完全開(kāi)放,開(kāi)發(fā)者可以通過(guò)飛槳星河社區(qū)、HuggingFace以及百度智能云千帆平臺(tái)輕松下載并使用。

值得注意的是,文心大模型4.5系列遵循的是Apache 2.0協(xié)議,這一舉措不僅彰顯了百度的開(kāi)放態(tài)度,也為學(xué)術(shù)研究和產(chǎn)業(yè)應(yīng)用提供了強(qiáng)有力的支持。在模型數(shù)量、類型、參數(shù)豐富度以及開(kāi)源的寬松度和可靠性等方面,百度此次均展現(xiàn)出了十足的誠(chéng)意。
文心大模型4.5系列在MoE架構(gòu)上提出了一種創(chuàng)新性的多模態(tài)異構(gòu)模型結(jié)構(gòu),這種結(jié)構(gòu)在保持甚至提升文本任務(wù)性能的同時(shí),顯著增強(qiáng)了多模態(tài)理解能力。其優(yōu)越的性能得益于多模態(tài)混合專家模型預(yù)訓(xùn)練、高效訓(xùn)練推理框架以及針對(duì)模態(tài)的后訓(xùn)練等關(guān)鍵技術(shù)。這些模型均使用了飛槳深度學(xué)習(xí)框架進(jìn)行高效訓(xùn)練、推理和部署,在大語(yǔ)言模型的預(yù)訓(xùn)練中,模型FLOPs利用率高達(dá)47%。
實(shí)驗(yàn)結(jié)果顯示,文心大模型4.5系列在多個(gè)文本和多模態(tài)基準(zhǔn)測(cè)試中均達(dá)到了業(yè)界領(lǐng)先水平,特別是在指令遵循、世界知識(shí)記憶、視覺(jué)理解和多模態(tài)推理任務(wù)上表現(xiàn)尤為突出。在文本模型方面,該系列模型在主流基準(zhǔn)評(píng)測(cè)中超越了DeepSeek-V3、Qwen3等模型;而在多模態(tài)模型方面,則基于強(qiáng)大的視覺(jué)感知能力和豐富的視覺(jué)常識(shí),在視覺(jué)常識(shí)、多模態(tài)推理等評(píng)測(cè)中優(yōu)于閉源的OpenAI模型。
文心大模型4.5系列中的輕量模型也表現(xiàn)出色,文心4.5-21B-A3B-Base文本模型效果與同量級(jí)的Qwen3相當(dāng),而文心4.5-VL-28B-A3B多模態(tài)模型在同量級(jí)開(kāi)源模型中更是達(dá)到了頂尖水平,甚至能與更大參數(shù)的模型一較高下。

為了讓開(kāi)發(fā)者更好地利用這些模型,百度還基于飛槳提供了開(kāi)源的產(chǎn)業(yè)級(jí)開(kāi)發(fā)套件,這些套件廣泛兼容多種芯片,大大降低了模型的后訓(xùn)練和部署門檻。作為國(guó)內(nèi)最早投入AI研發(fā)的企業(yè)之一,百度在算力、框架、模型到應(yīng)用的全棧布局上構(gòu)建了顯著的技術(shù)優(yōu)勢(shì)。此次文心大模型4.5系列的開(kāi)源,也標(biāo)志著百度在框架層與模型層實(shí)現(xiàn)了“雙層開(kāi)源”,為開(kāi)發(fā)者提供了更加全面和便捷的工具鏈支持。






