昆侖萬維近期在AI領域邁出了重要一步,正式推出了多模態統一預訓練模型Skywork UniPic,并決定將其開源。這一模型集成了圖像理解、文本到圖像生成及圖像編輯三大核心功能,通過大規模高質量數據的端到端預訓練,展現出了強大的通用性和遷移能力。
Skywork UniPic采用了創新的MAR編碼器和SigLIP2主干網絡,打破了傳統多模態模型在語義信息保留上的局限。這一設計使得模型能夠在不同任務間實現深度協同,用戶只需簡單的提示詞,即可完成復雜的圖像理解、生成及風格轉換等操作,比如根據特定場景生成圖片或對已有圖像進行風格化編輯。
在性能表現上,Skywork UniPic以1.5B的參數規模,達到了接近大型統一模型的效果。在指令遵循、復雜指令生成圖像及圖像編輯等基準測試中,該模型均取得了行業領先的成績。尤為它在消費級顯卡上就能流暢運行,大大降低了技術應用的門檻。
Skywork UniPic的成功,離不開其精煉的數據構建體系、專用的Reward Model優化以及漸進式多任務訓練策略。通過高效能語料庫和分層分辨率訓練機制,該模型在性能和訓練效率之間取得了良好的平衡,避免了傳統方法中常見的性能權衡問題。
昆侖萬維此次開源Skywork UniPic,是其推動AI技術普惠的又一重要舉措。此前,該公司已經開源了多個領域的大模型,而Skywork UniPic的加入,將進一步推動AI成為易于獲取的創意工具。用戶現在可以通過指定鏈接,獲取模型的權重、技術報告以及代碼倉庫等核心資源。
對于想要深入了解Skywork UniPic的用戶,以下提供了相關資源的鏈接:
模型權重獲取地址:https://huggingface.co/Skywork/Skywork-UniPic-1.5B
技術報告下載地址:https://github.com/SkyworkAI/UniPic/blob/main/UNIPIC.pdf
代碼倉庫訪問地址:https://github.com/SkyworkAI/UniPic






