亚洲视频二区_亚洲欧洲日本天天堂在线观看_日韩一区二区在线观看_中文字幕不卡一区

公告:魔扣目錄網為廣大站長提供免費收錄網站服務,提交前請做好本站友鏈:【 網站目錄:http://www.430618.com 】, 免友鏈快審服務(50元/站),

點擊這里在線咨詢客服
新站提交
  • 網站:51998
  • 待審:31
  • 小程序:12
  • 文章:1030137
  • 會員:747

要點:

1. 隨著容量或預訓練數據量的增加,模型性能不斷提升。

2. 論文證實自回歸訓練對于圖像模型學習表征能力具有擴展性。

3. 自回歸目標足以滿足視覺特征的訓練要求,且沒有飽和的跡象。

(ChinaZ.com)1月18日 消息:蘋果公司的研究者通過自回歸圖像模型(AIM)驗證了視覺模型“參數越多性能越強”的規律,進一步證明隨著容量或預訓練數據量的增加,模型能不斷提升性能。AIM能有效利用大量未經整理的圖像數據,訓練方法和穩定性與最近的大型語言模型(LLM)類似。這一觀察結果與之前關于擴展大型語言模型的研究結果是一致的。

雖然本文實驗所使用的模型規模有限,還需進一步探索是否能在更大參數量級的模型上驗證此規律。研究者使用的預訓練目標遵循應用于圖像 patch 序列的標準自回歸模型,通過一系列實驗和研究,驗證了模型容量可以輕松擴展到數十億個參數,同時對下游任務有很好的性能。

image.png

項目地址:https://top.aibase.com/tool/aim

此外,研究者對自回歸目標訓練 ViT 模型的多方面進行了探討,并且重新審視了之前的工作。研究者的實驗報告顯示,在整個訓練過程中,優化目標直接帶來更好的下游性能,而隨著模型容量的增加,損失值和下游任務的準確性都有所提高。這一觀察結果與在 LLMs 中觀察到的趨勢一致,反映了優化目標會直接帶來更好的下游性能。

image.png

在 AIM 的設計參數中,除了擴展寬度,研究者還特別采用了一種簡單設計,使用多層感知機塊,獨立地對每個 patch 進行處理。研究者同時強調,研究的模型規模有限,對更大參數量級的模型上驗證此規律還有待進一步探索。

論文的實驗結果證明了視覺模型同樣遵循「參數越多性能越強」的規律,自回歸訓練對圖像模型具有很好的擴展性,并能夠滿足視覺特征的訓練要求。對未來圖像模型性能提升和優化提供了新的研究方向和思路。

分享到:
標簽:AIM 大模型
用戶無頭像

網友整理

注冊時間:

網站:5 個   小程序:0 個  文章:12 篇

  • 51998

    網站

  • 12

    小程序

  • 1030137

    文章

  • 747

    會員

趕快注冊賬號,推廣您的網站吧!
最新入駐小程序

數獨大挑戰2018-06-03

數獨一種數學游戲,玩家需要根據9

答題星2018-06-03

您可以通過答題星輕松地創建試卷

全階人生考試2018-06-03

各種考試題,題庫,初中,高中,大學四六

運動步數有氧達人2018-06-03

記錄運動步數,積累氧氣值。還可偷

每日養生app2018-06-03

每日養生,天天健康

體育訓練成績評定2018-06-03

通用課目體育訓練成績評定