【ITBEAR科技資訊】8月3日消息,AI模型社區魔搭ModelScope日前發布了兩款開源模型,即Qwen-7B和Qwen-7B-Chat,這兩款模型由阿里云證實為通義千問的70億參數通用模型和對話模型。與此同時,阿里云也確認這兩款模型均可免費使用,并支持商業應用。通過多個權威測評,Qwen-7B模型的表現遠超國內外同等尺寸模型,成為當前業界最強的中英文7B開源模型。
據ITBEAR科技資訊了解,Qwen-7B是一種支持中英文等多種語言的基座模型,其訓練數據集超過2萬億個token,上下文窗口長度達到8k。而Qwen-7B-Chat則是基于Qwen-7B的中英文對話模型,已經實現了與人類認知的對齊。這兩款模型的開源代碼支持量化,使用戶能夠在消費級顯卡上部署和運行模型。

這一舉措使得用戶無需從頭開始訓練模型,而是可以下載預訓練好的模型并進行微調,從而快速構建高質量的模型。阿里云表示,開源大模型將有助于簡化模型訓練和部署過程,為用戶提供更便捷的服務。

對于Qwen-7B的推出,阿里云早在今年4月便推出了自研大模型通義千問,引發市場強烈需求。此次推出小型化版本的開源模型,有望降低模型使用門檻,使大量中小企業和AI開發者更早地接觸和使用通義千問。阿里云也因此成為國內首個加入大模型開源行列的大型科技企業。
用戶可以直接從魔搭社區下載這兩款模型,也可以通過阿里云靈積平臺訪問和調用它們。阿里云為用戶提供了包括模型訓練、推理、部署和精調等在內的全方位服務,讓用戶可以更輕松地應用這些先進的AI模型。






