亚洲视频二区_亚洲欧洲日本天天堂在线观看_日韩一区二区在线观看_中文字幕不卡一区

公告:魔扣目錄網為廣大站長提供免費收錄網站服務,提交前請做好本站友鏈:【 網站目錄:http://www.430618.com 】, 免友鏈快審服務(50元/站),

點擊這里在線咨詢客服
新站提交
  • 網站:51998
  • 待審:31
  • 小程序:12
  • 文章:1030137
  • 會員:747

博雯 發自 凹非寺

量子位 報道 | 公眾號 QbitAI

在煉丹過程中,為了減少訓練所需資源,MLer有時會將大型復雜的大模型“蒸餾”為較小的模型,同時還要保證與壓縮前相當的結果。

這就是知識蒸餾,一種模型壓縮/訓練方法。

不過隨著技術發展,大家也逐漸將蒸餾的對象擴展到了數據集上。

這不,谷歌最近就提出了兩種新的數據集蒸餾方法,在推特上引起了不小反響,熱度超過600:

數據縮至1/5000,模型準確率卻翻倍,谷歌新“蒸餾法”火了

 

像這樣, 將50000張標注圖像的CIFAR-10數據集“蒸餾”縮小至1/5000大小,只基于10張合成數據點進行訓練,模型的準確率仍可近似51%

數據縮至1/5000,模型準確率卻翻倍,谷歌新“蒸餾法”火了

△上:原始數據集 下:蒸餾后

而如果“蒸餾數據集”由500張圖像組成(占原數據集1%大小),其準確率可以達到80%。

兩種數據集蒸餾方法分別來自于ICLR 2021和NeurIPS 2021上的兩篇論文。

數據縮至1/5000,模型準確率卻翻倍,谷歌新“蒸餾法”火了

 


數據縮至1/5000,模型準確率卻翻倍,谷歌新“蒸餾法”火了

 

通過兩階段循環進行優化

那么要如何才能“蒸餾”一個數據集呢?

其實,這相當于一個兩階段的優化過程:

  1. “內部循環”,用于在學習數據上訓練模型
  2. “外部循環”,用于優化學習數據在自然數據上的性能

通過內部循環可以得到一個核嶺回歸(KRR)函數,然后再外部循環中計算原始圖像標注與核嶺回歸函數預測標注之間的均方誤差(MSE)。

這時,谷歌提出的兩種方法就分別有了不同的處理路線:

一、標注解釋 (LS)

這種方法直接解釋最小化KRR損失函數的支持標注集(support labels),并為每個支持圖像生成一個獨特的密集標注向量。

數據縮至1/5000,模型準確率卻翻倍,谷歌新“蒸餾法”火了

△藍:原始獨熱標注 橙:LS生成的密集標注

二、核歸納點 (KIP)

這種方法通過基于梯度的方法將KRR損失函數最小化,以此來優化圖像和可能生成的數據。

以MNIST為例,下圖中的上、中、下三張圖分別為原始的MNIST數據集、固定標注的KIP蒸餾圖像、優化標注的KIP蒸餾圖像。

可以看出,在于對數據集進行蒸餾時,優化標注的效果最好:

數據縮至1/5000,模型準確率卻翻倍,谷歌新“蒸餾法”火了

 

對比已有的DC(Dataset Condensation)方法和DSP(Dataset Condensation with Differentiable Siamese Augmentation)方法可以看到:

如果使用每類別只有一張圖像,也就是最后只有10張圖像的蒸餾數據集,KIP方法的測試集準確率整體高于DC和DSP方法。

在CIFAR-10分類任務中,LS也優于先前的方法,KIP甚至可以達到翻倍的效果。

數據縮至1/5000,模型準確率卻翻倍,谷歌新“蒸餾法”火了

 

對此,谷歌表示:

這證明了在某些情況下,我們的縮小100倍的“蒸餾數據集”要比原始數據集更好。

兩位華人作者

整個項目由蕭樂超(Lechao Xiao)、Zhourong Chen、Roman Novak三人合作完成。

其中蕭樂超為LS方法的論文作者之一,本科畢業于浙江大學的應用數學系,在美國伊利諾大學厄巴納-香檳分校(UIUC)取得博士學位,現在是谷歌大腦團隊的一名科學家。

他的主要研究方向是數學、機器學習和深度學習。

數據縮至1/5000,模型準確率卻翻倍,谷歌新“蒸餾法”火了

 

另一位華人科學家Zhourong Chen則是KIP方法的論文作者之一,本科畢業于中山大學,并在香港科技大學取得了計算機科學與工程系的博士學位,現是google Research的一名軟件工程師。

論文:
[1]https://openreview.net/forum?id=l-PrrQrK0QR
[2]https://openreview.net/forum?id=hXWPpJedrVP

開源地址:
https://github.com/google-research/google-research/tree/master/kip

參考鏈接:
https://ai.googleblog.com/2021/12/training-machine-learning-models-more.html

— 完 —

量子位 QbitAI · 頭條號簽約

關注我們,第一時間獲知前沿科技動態

分享到:
標簽:蒸餾
用戶無頭像

網友整理

注冊時間:

網站:5 個   小程序:0 個  文章:12 篇

  • 51998

    網站

  • 12

    小程序

  • 1030137

    文章

  • 747

    會員

趕快注冊賬號,推廣您的網站吧!
最新入駐小程序

數獨大挑戰2018-06-03

數獨一種數學游戲,玩家需要根據9

答題星2018-06-03

您可以通過答題星輕松地創建試卷

全階人生考試2018-06-03

各種考試題,題庫,初中,高中,大學四六

運動步數有氧達人2018-06-03

記錄運動步數,積累氧氣值。還可偷

每日養生app2018-06-03

每日養生,天天健康

體育訓練成績評定2018-06-03

通用課目體育訓練成績評定