Anthropic公司于近日正式揭曉了其最新的技術成果——Claude Opus 4.1模型。這一版本相較于今年5月推出的Claude 4系列,在編碼、推理和執(zhí)行指令方面實現(xiàn)了顯著提升。
據(jù)Anthropic官方介紹,Claude Opus 4.1在SWE-bench Verified評估中的軟件工程準確性達到了74.5%,相較于Claude Sonnet 3.7的62.3%和Claude Opus 4的72.5%,進步顯著。新模型在深度研究、數(shù)據(jù)分析,特別是細節(jié)追蹤和代理搜索方面的能力尤為突出。
相較于Opus 4,Opus 4.1在多項功能上均有所提升,特別是在多文件代碼重構(gòu)方面的表現(xiàn)令人矚目。Rakuten Group的測試顯示,Opus 4.1能夠精準定位大型代碼庫中的錯誤并進行修正,而不會進行不必要的調(diào)整或引入新錯誤。
Windsurf的基準測試報告指出,Opus 4.1在初級開發(fā)者測試中的表現(xiàn)相較于Opus 4有了顯著提升,這一性能飛躍與從Sonnet 3.7到Sonnet 4的升級相當。
即日起,Claude Opus 4.1模型正式向Claude客戶開放。用戶可以通過Claude Code、Anthropic的API、亞馬遜Bedrock以及谷歌云的Vertex AI平臺使用該模型。
值得注意的是,Anthropic還在社交媒體上透露,未來幾周內(nèi)將發(fā)布對模型的重大改進,這無疑讓業(yè)界對Claude系列模型的后續(xù)升級充滿期待。與此同時,OpenAI也預計將在本周內(nèi)發(fā)布新動態(tài)。






