中國電商巨頭阿里巴巴旗下的通義千問團隊近日再次傳來捷報,其最新推出的開源大語言模型Qwen3-Coder-480B-A35B-Instruct,在軟件開發領域掀起波瀾。
就在不久前,通義千問團隊剛剛發布了Qwen3-235B-A22B-2507模型,這款非推理大語言模型憑借卓越表現,迅速躍居全球領先地位,即便是與谷歌、OpenAI等美國科技巨頭的專有AI模型相比也毫不遜色。而此次推出的Qwen3-Coder,更是專注于軟件開發領域,為程序員們帶來了全新的助力。
Qwen3-Coder模型設計精妙,能夠處理復雜的多步驟編程工作流程,只需數秒或數分鐘,便能創建出功能完備的應用程序。這一特性使其在智能體編程任務中,與Claude Sonnet-4等專有產品形成了有力競爭,并在開源模型中創造了新的基準分數。
更為Qwen3-Coder采用了Apache 2.0開源許可證,這意味著任何企業都可以免費獲取、下載、修改、部署,并在其商業應用中使用該模型,無需向阿里巴巴或任何其他方支付任何費用。這一舉措大大降低了企業的成本,同時提供了更高的選擇性。
在第三方基準測試中,Qwen3-Coder表現優異,其“感知編程”功能更是受到了AI高級用戶的高度評價。用戶可以通過自然語言進行編程,無需遵循正式的開發流程和步驟,極大地提高了編程效率。有專家甚至稱贊其為迄今為止最好的編程模型。
Qwen3-Coder現已在Hugging Face、GitHub、通義千問聊天平臺、阿里巴巴通義千問API以及眾多第三方編程和AI工具平臺上上線。企業可以根據自身需求,選擇合適的平臺進行使用。
該模型不僅功能強大,其架構也頗具特色。Qwen3-Coder采用了專家混合(MoE)模型架構,總參數高達4800億,每次查詢可激活350億參數。同時,該模型原生支持256K Token上下文長度,通過YaRN技術可外推至100萬Token,使其能夠在單次處理中理解和操作整個代碼倉庫或冗長文檔。
在智能體評估套件中,Qwen3-Coder在開源模型中取得了領先性能。在智能體瀏覽器使用、多語言編程和工具使用等任務中,該模型也展現出了出色的表現。視覺基準顯示,在代碼生成、SQL編程、代碼編輯和指令跟隨等類別中,Qwen3-Coder的訓練迭代均呈現出漸進式改進。
為了方便開發者使用,通義千問還開源了Qwen Code這一CLI工具。該工具支持函數調用和結構化提示,使Qwen3-Coder更容易集成到編程工作流程中。同時,Qwen3-Coder還與多個開發者平臺進行了集成,如Claude Code、Cline、Ollama等,為開發者提供了更多的選擇。
除了強大的功能和靈活的架構外,Qwen3-Coder還受益于先進的后訓練技術。通過代碼強化學習和長期智能體強化學習,該模型在多樣化、可驗證的代碼任務上進行了高質量、執行驅動的學習,并在多輪交互中學會了規劃、使用工具和適應。這些技術使得Qwen3-Coder在模擬真實世界的軟件工程挑戰時表現出色。
對于企業而言,Qwen3-Coder提供了封閉源碼專有模型的開放、高能力替代方案。其強大的編程執行能力和長上下文推理能力,使其特別適用于代碼庫級理解、自動化拉取請求工作流程、工具集成和編排等場景。同時,作為開源模型,企業可以在自己的基礎設施上部署Qwen3-Coder,避免供應商鎖定并更直接地管理計算使用。
開發者們對Qwen3-Coder的初步反應非常積極。多位AI研究員、工程師和開發者在測試了該模型后,紛紛表示其性能卓越,適應性強,且與現有開發堆棧的集成度很高。這些反饋進一步證明了Qwen3-Coder在技術嫻熟用戶群體中的受歡迎程度。
阿里巴巴通義千問團隊的這一創新成果,無疑為軟件開發領域帶來了新的活力和機遇。隨著Qwen3-Coder的廣泛應用和推廣,我們有理由相信,它將為更多的企業和開發者帶來實實在在的幫助和收益。






