亚洲激情综合在线,国产大秀视频在线一区二区,日韩视频免费在线观看

亚洲视频二区_亚洲欧洲日本天天堂在线观看_日韩一区二区在线观看_中文字幕不卡一区

公告：魔扣目錄網為廣大站長提供免費收錄網站服務，提交前請做好本站友鏈：【網站目錄：http://www.430618.com 】，免友鏈快審服務（50元/站），

網站：52011
待審：79
小程序：12
文章：1184964
會員：801

阿里通義千問升級推理模型，Qwen3-30B-A3B-Thinking-2507能力大幅提升并開源

發布時間：2025-07-31 15:33:52 作者：網友整理

阿里通義千問近期宣布了一項重大進展，正式推出了其最新的推理模型Qwen3-30B-A3B-Thinking-2507。相較于今年4月推出的Qwen3-30-A3B模型，新版本在多個關鍵領域實現了顯著提升。

在數學推理方面，Qwen3-30B-A3B-Thinking-2507在AIME25評測中取得了85.0的高分，這一成績彰顯了其強大的數學解題能力。同時，在代碼能力測試LiveCodeBench v6中，該模型也獲得了66.0的分數，兩項核心推理能力均超越了Gemini2.5-Flash（thinking）和Qwen3-235B-A22B（thinking）。

新模型在知識水平方面也取得了顯著進步。在GPQA和MMLU-Pro等評測中，Qwen3-30B-A3B-Thinking-2507的表現均優于其前身。這意味著它在處理廣泛的知識性問題時，能夠提供更準確、更全面的答案。

除了推理能力和知識水平外，Qwen3-30B-A3B-Thinking-2507在通用能力方面也表現出色。在寫作（WritingBench）、Agent能力（BFCL-v3）、多輪對話和多語言指令遵循（MultiIF）等評測中，該模型均超越了Gemini2.5-Flash（thinking）和Qwen3-235B-A22B（thinking）。這些結果表明，新模型在處理復雜、多變的場景時，能夠展現出更高的靈活性和適應性。

Qwen3-30B-A3B-Thinking-2507還支持更長的上下文理解。它原生支持256K tokens，并可擴展至1M tokens，這在處理大型文本或復雜對話時尤為重要。新模型的思考長度也有所增加，官方建議在處理高度復雜的推理任務時，設置更長的思考預算以充分發揮其潛力。