火山引擎近日震撼發布豆包1.5深度思考模型,該模型采用先進的MoE架構,總參數量高達200B,但激活參數僅為20B,展現了卓越的性能與效率。在多個基準測試中,豆包1.5的表現均達到了或接近全球頂尖水平,標志著國產推理模型邁出了重要一步。
特別是在數學、編程及科學領域,豆包1.5深度思考模型展現出了超越國內其他推理模型如DeepSeek-R1、QwQ-32B的實力,其能力與OpenAI的o1、o3-mini-high等模型不相上下。尤為在極具挑戰性的通用人工智能測試ARC-AGI上,豆包1.5的得分甚至超過了OpenAI的上述模型,彰顯了其強大的推理與泛化能力。
豆包1.5深度思考模型不僅具備高效的推理能力,還擁有“邊想邊搜”和“視覺理解”等創新功能。企業用戶即日起可在火山方舟平臺上體驗到這一模型。同時,火山引擎還升級了豆包文生圖模型3.0和豆包視覺理解模型,為用戶提供更多元化的服務。
數據顯示,截至今年3月底,豆包大模型的日均tokens調用量已超過12.7萬億,較去年12月增長了3倍,與發布初期相比更是激增了106倍。據IDC報告,2024年中國公有云大模型調用量激增,火山引擎憑借46.4%的市場份額,穩居中國市場首位。
豆包1.5深度思考模型憑借其較小的參數量和激活參數量,實現了更低的訓練和推理成本,即便在高并發場景下也能保持20毫秒的低延遲。其搜索能力尤為突出,不同于傳統推理模型的“先搜索再思考”模式,豆包App通過定向訓練,實現了“邊想邊搜”的智能化體驗。
例如,在推薦露營裝備時,豆包1.5深度思考模型能夠拆解需求、規劃信息、判斷信息完備性,并自主補充搜索信息,最終給出預算范圍內且細致周到的推薦方案。該模型還具備強大的視覺理解能力,能夠結合文字與圖像信息進行綜合思考,如理解菜單內容、分析菜品組成、照顧不同口味和過敏食物等,為用戶提供個性化的點餐建議。
火山引擎透露,為了提升豆包1.5深度思考模型的通用能力,模型團隊優化了數據處理策略,融合了可驗證數據與創意性數據,以滿足各類任務的需求。同時,團隊還采用了創新的雙軌獎勵機制進行大規模強化學習訓練,有效提升了算法的可靠性與優化效率。
在權威基準測試上,豆包1.5深度思考模型同樣表現出色。在數學測試中,其得分與OpenAI的o3-mini-high基本持平;在博士級推理難題測試集GPQA Diamond上,得分與OpenAI的o1、o3-mini-high僅有微小差距;在編程基準測試中,更是實現了接近或超越DeepSeek-R1的成績。特別是在高難度通用人工智能測試ARC-AGI上,豆包1.5深度思考模型以39.9分的優異成績大幅領先OpenAI的o1和o3-mini-high。
全新升級的豆包文生圖模型3.0同樣令人矚目。該模型能夠實現更好的文字排版、實拍級圖像生成以及2K高清圖片輸出,廣泛應用于影視、海報、繪畫、玩偶設計等營銷、電商、設計場景。在最新的文生圖領域權威榜單Artificial Analysis競技場中,豆包文生圖3.0模型已躋身全球第一梯隊。
新版本的豆包視覺理解模型也具備了更強的視覺定位能力,支持多目標、小目標、通用目標的框定位和點定位,以及定位計數、描述定位內容、3D定位等功能。該模型可應用于線下門店巡檢、GUI agent、機器人訓練、自動駕駛訓練等多個領域。例如,通過發送一張草莓圖片給豆包視覺理解模型,它能迅速數出草莓數量并框定其位置。

同時,新版本在視頻理解能力上也取得了顯著提升,包括記憶、總結理解、速度感知、長視頻理解等。結合向量搜索技術,豆包視覺理解模型可直接對視頻進行語義搜索,廣泛應用于安防、家庭看護等商業化場景。






