久久99国产亚洲精品,久久免费国产视频,亚洲欧美日韩在线线精品

公告：魔扣目錄網為廣大站長提供免費收錄網站服務，提交前請做好本站友鏈：【網站目錄：http://www.430618.com 】，免友鏈快審服務（50元/站），

360聯合北大震撼發布！5%參數量逼近Deepseek-R1滿血性能

發布時間：2025-02-25 14:22:18 作者：網友整理

2025年2月24日——由360與北京大學聯合研發的中等量級推理模型Tiny-R1-32B-Preview正式亮相，僅以5%參數，逼近Deepseek-R1-671B的性能。

核心突破：小模型，大能量

? 數學領域：以78.1分(AIME 2024評測)逼近原版R1模型(79.8分)，遠超Deepseek-R1-Distill-Llama-70B(70.0分);

? 綜合性能：在編程(LiveCodeBench 61.6分)、科學(GPQA-Diamond 65.0分)領域全面領先最佳開源70B模型Deepseek-R1-Distill-Llama-70B;

? 效率躍遷：僅需5%參數量，性能達原版R1的95%以上，推理成本大幅降低。

技術革新：領域專精+模型融合

研究團隊使用「分治-融合」策略：

? 基于DeepSeek-R1生成海量領域數據，分別訓練數學、編程、科學三大垂直模型;

? 通過Arcee團隊Mergekit工具智能融合，突破單一模型性能上限，實現多任務均衡優化。

開源承諾：推動技術普惠

? 模型倉庫：https://huggingface.co/qihoo360/TinyR1-32B-Preview

? 即將公開完整技術報告、訓練代碼及部分數據集；

? 踐行開源精神，助力AI社區共筑高效推理新生態。

研發團隊表示：「Tiny-R1-32B-Preview是蒸餾技術的里程碑，未來將持續探索更輕量、更強大的通用模型，推動AI技術普惠化進程。」

360 團隊: Lin Sun, Guangxiang Zhao, Xiaoqi Jian, Weihong Lin, Yongfu Zhu, Change Jia, Linglin Zhang, Jinzhu Wu, Sai-er Hu, Xiangzheng Zhang

北大團隊: Yuhan Wu, Zihan Jiang, Wenrui Liu, Junting Zhou, Bin Cui, Tong Yang

分享到：

標簽：逼近北大震撼參數聯合

網友整理

注冊時間：

網站：5 個小程序：0 個文章：12 篇

文章分類

熱門網站

數獨一種數學游戲，玩家需要根據9

您可以通過答題星輕松地創建試卷

各種考試題，題庫，初中，高中，大學四六

記錄運動步數，積累氧氣值。還可偷

每日養生,天天健康

通用課目體育訓練成績評定