阿里巴巴旗下的通義千問近日宣布,其旗艦版Qwen3模型迎來了一次重要更新,推出了名為Qwen3-235B-A22B-Instruct-2507-FP8的新版本,該版本特別引入了“非思考模式”的增強功能。
據官方介紹,此次更新的Qwen3模型在多項通用能力上實現了顯著提升,尤其是在指令遵循、邏輯推理、文本理解、數學運算、科學知識、編程技能及工具使用等方面。在多個權威測評中,如GQPA(知識評估)、AIME25(數學競賽模擬)、LiveCodeBench(編程能力測試)、Arena-Hard(人類偏好對齊測試)以及BFCL(智能體能力評估)等,Qwen3均展現出了卓越的性能,超越了Kimi-K2、DeepSeek-V3等頂級開源模型,以及Claude-Opus4-Non-thinking等領先的閉源模型。
除了通用能力的提升,Qwen3新模型還在幾個關鍵性能方面實現了增強。首先,在多語言環境下,模型對于長尾知識的覆蓋能力有了顯著提升,能夠更好地理解和處理多種語言中的復雜信息。其次,在主觀及開放性任務中,模型對用戶偏好的契合能力得到了加強,能夠生成更加貼合用戶需求、質量更高的回復和文本。新模型的長文本處理能力也大幅提升至256K,進一步增強了其上下文理解能力。
此次更新的Qwen3模型已經在魔搭社區和HuggingFace平臺上開源發布,供開發者和研究人員免費使用。這一舉措無疑將推動人工智能領域的技術創新和應用發展,為更多行業帶來智能化的解決方案。
Qwen3新模型的推出,標志著阿里巴巴在人工智能領域的研究和應用又邁上了一個新的臺階。隨著技術的不斷進步和應用場景的不斷拓展,我們有理由相信,未來Qwen3將在更多領域發揮重要作用,為人們的生活和工作帶來更多便利和價值。






