在2025年的春節(jié)前夕,大模型領(lǐng)域迎來(lái)了一場(chǎng)意想不到的“狂歡”。DeepSeek,這家初出茅廬的大模型公司,以一記重拳震撼了整個(gè)AI界——它正式開(kāi)源了DeepSeek-R1,這款模型在數(shù)學(xué)、代碼及自然語(yǔ)言推理等方面,與OpenAI的o1正式版并駕齊驅(qū)。
這一消息如同平地驚雷,讓眾多AI研究者瞠目結(jié)舌,紛紛揣測(cè)DeepSeek是如何在硬件受限的條件下實(shí)現(xiàn)這一壯舉的。據(jù)悉,DeepSeek采用了一系列技術(shù)創(chuàng)新,大幅降低了模型對(duì)算力的需求,同時(shí)實(shí)現(xiàn)了性能的提升。英偉達(dá)市值的劇烈波動(dòng),更是成為了這場(chǎng)“AI地震”的余波。
DeepSeek的技術(shù)創(chuàng)新引發(fā)了廣泛討論。許多觀點(diǎn)認(rèn)為,它在算力受限的困境中,走出了一條與OpenAI截然不同的道路。而大洋彼岸的硅谷,對(duì)DeepSeek的態(tài)度也頗為微妙,從最初的贊譽(yù)有加,到后來(lái)的網(wǎng)絡(luò)攻擊與審查,這背后折射出的是中國(guó)AI崛起的巨大沖擊力。
回望過(guò)去兩年,中國(guó)大模型領(lǐng)域的發(fā)展猶如脫韁野馬,狂飆突進(jìn)。文心一言、豆包、可靈等國(guó)產(chǎn)大模型,已在多個(gè)垂直賽道中嶄露頭角,跨過(guò)了曾經(jīng)看似不可逾越的“護(hù)城河”。
以視頻生成領(lǐng)域?yàn)槔?,OpenAI在2024年春節(jié)期間推出了Sora,被視為視頻生成技術(shù)的里程碑。然而,僅過(guò)了半年,可靈便橫空出世,以文生視頻技術(shù)的實(shí)質(zhì)性領(lǐng)先,讓硅谷首次感受到了“中國(guó)AI技術(shù)的獨(dú)特優(yōu)勢(shì)”。

在語(yǔ)音通話(huà)方面,GPT-4o為ChatGPT帶來(lái)了實(shí)時(shí)語(yǔ)音通話(huà)能力,但用戶(hù)體驗(yàn)卻差強(qiáng)人意。相比之下,豆包實(shí)時(shí)語(yǔ)音大模型在2025年初正式上線時(shí),其擬人度、有用性、情商、通話(huà)穩(wěn)定性及對(duì)話(huà)流暢度均令人驚艷。且該功能在豆包App中全面開(kāi)放,人人皆可免費(fèi)使用,填補(bǔ)了國(guó)產(chǎn)大模型在“端到端語(yǔ)音系統(tǒng)”上的空白。
而DeepSeek-R1的橫空出世,更是將這場(chǎng)“AI狂歡”推向了高潮。這款僅用550萬(wàn)美元訓(xùn)練的模型,在短短幾周內(nèi)便從Deepseek-v3基座進(jìn)化為擁有堪比OpenAI o1的思維鏈推理能力。其背后的純強(qiáng)化學(xué)習(xí)路線及面向H800的大量?jī)?yōu)化創(chuàng)新,成為了業(yè)界熱議的焦點(diǎn)。
值得注意的是,推理模型雖是當(dāng)前最熱門(mén)的方向之一,但也存在局限性。大模型推理基于當(dāng)前已知數(shù)據(jù),一旦遭遇錯(cuò)誤的推理路徑,便可能陷入死循環(huán)。因此,提升檢索增強(qiáng)能力顯得尤為重要。而在這方面,文心一言無(wú)疑是國(guó)內(nèi)RAG(檢索增強(qiáng)生成)能力最領(lǐng)先的大模型應(yīng)用。
作為國(guó)內(nèi)搜索領(lǐng)域的佼佼者,百度在RAG技術(shù)上擁有得天獨(dú)厚的優(yōu)勢(shì)。它基于搜索技術(shù)的積累,推出了百度AI原生檢索,持續(xù)保持領(lǐng)先。從RAG能力實(shí)測(cè)來(lái)看,國(guó)內(nèi)外主流大模型中,百度文心一言的綜合表現(xiàn)最為出色。
在實(shí)際測(cè)試中,文心一言甚至在某些任務(wù)上超越了OpenAI的ChatGPT。例如,在回答關(guān)于春節(jié)檔電影細(xì)節(jié)、春晚節(jié)目等內(nèi)容時(shí),文心一言能夠準(zhǔn)確回應(yīng);而ChatGPT雖能檢索到信源,卻無(wú)法生成準(zhǔn)確答案。在回答關(guān)于春晚語(yǔ)言類(lèi)節(jié)目、國(guó)際新聞等問(wèn)題時(shí),文心一言同樣展現(xiàn)出了更高的準(zhǔn)確性和全面性。




百度在RAG技術(shù)上的優(yōu)勢(shì),得益于其在中文深度理解、多模態(tài)檢索、垂直領(lǐng)域定制化及實(shí)時(shí)數(shù)據(jù)整合能力等方面的深厚積累。這使得文心一言在中文互聯(lián)網(wǎng)、企業(yè)服務(wù)、政務(wù)等場(chǎng)景中更具實(shí)用性和競(jìng)爭(zhēng)力。百度研發(fā)的“理解-檢索-生成”協(xié)同優(yōu)化的檢索增強(qiáng)技術(shù),更是顯著提升了大模型技術(shù)及應(yīng)用的效果。
隨著DeepSeek等中國(guó)大模型廠商的崛起,OpenAI昔日的“技術(shù)黑盒”正被逐一破解。從復(fù)制Sora到復(fù)制o1,中國(guó)大模型廠商已經(jīng)證明了自己的實(shí)力。知名AI研究者吳恩達(dá)也表示,中國(guó)在生成式人工智能方面正在趕超美國(guó)。借助Qwen、Kimi、InternVL和DeepSeek等模型,中國(guó)正在迅速縮小與美國(guó)的差距,并在視頻生成等領(lǐng)域取得了領(lǐng)先地位。






