人工智能領(lǐng)域近日迎來了一項重要進展,AI公司Anthropic宣布成功推出Claude 3.7 Sonnet1,這一新模型被譽為Anthropic迄今為止最為智能,同時也是市場上首個混合推理模型。
據(jù)Anthropic介紹,Claude 3.7 Sonnet不僅具備即時響應(yīng)的能力,還能向用戶展示擴展的、逐步的思考過程。這對于API用戶來說尤為友好,因為他們可以對模型的思考時間進行精細化的控制。
此次推出的Claude 3.7 Sonnet,Anthropic明確表達了其目標(biāo)是與OpenAI的o1、o3-mini,以及DeepSeek的R1、Grok 3 Beta等模型一較高下。特別是在編碼和前端Web開發(fā)方面,Claude 3.7 Sonnet展現(xiàn)出了顯著的改進。

除了Claude 3.7 Sonnet這一重量級模型外,Anthropic還推出了Claude Code,這是一款用于代理編碼的命令行工具。目前,Claude Code以有限的研究預(yù)覽版形式提供,它允許開發(fā)人員直接從終端將大量工程任務(wù)委托給Claude處理。
值得注意的是,Claude 3.7 Sonnet現(xiàn)已全面上線,覆蓋Claude的所有計劃,包括免費版、專業(yè)版、團隊版和企業(yè)版,以及Anthropic API、Amazon Bedrock和Google Cloud的Vertex AI等平臺。除免費層外,所有界面均提供擴展思考模式。
在收費方面,Claude 3.7 Sonnet在標(biāo)準和擴展思維模式下,每百萬輸入令牌收費3美元(大約可輸入750,000個單詞),每百萬輸出令牌收費15美元。這一價格定位使其相較于OpenAI的o3-mini(每百萬輸入令牌1.10美元,每百萬輸出令牌4.40美元)和DeepSeek的R1(每百萬輸入令牌55美分,每百萬輸出令牌2.19美元)更為昂貴。但值得注意的是,o3-mini和R1是嚴格的推理模型,而Claude 3.7 Sonnet則是一款混合模型。
Anthropic強調(diào),Claude 3.7 Sonnet的開發(fā)理念與市場上的其他推理模型有所不同。他們認為,推理應(yīng)該是前沿模型的綜合能力,而非完全獨立的模型。正如人類使用單個大腦進行快速反應(yīng)和深度思考一樣,Claude 3.7 Sonnet也兼具這兩種能力。

Claude 3.7 Sonnet在多個方面體現(xiàn)了這一理念。首先,它既是普通的LLM,又是推理模型。用戶可以根據(jù)需求選擇模型是正常回答,還是在回答前進行更長時間的思考。在標(biāo)準模式下,Claude 3.7 Sonnet是Claude 3.5 Sonnet的升級版;而在擴展思考模式下,它會在回答前進行自我反思,從而提升在數(shù)學(xué)、物理、指令遵循、編碼等多項任務(wù)上的表現(xiàn)。

當(dāng)通過API使用Claude 3.7 Sonnet時,用戶還可以控制思考的預(yù)算。他們可以設(shè)定Claude的思考標(biāo)記不超過某個數(shù)值,而無論該數(shù)值是多少,其輸出都會被限制在128K標(biāo)記以內(nèi)。這為用戶在速度和成本之間提供了權(quán)衡的空間。
在開發(fā)Claude 3.7 Sonnet的過程中,Anthropic還減少了對數(shù)學(xué)和計算機科學(xué)競賽問題的優(yōu)化,而是將更多精力放在了更能反映企業(yè)實際使用LLM方式的現(xiàn)實任務(wù)上。






