亚洲视频二区_亚洲欧洲日本天天堂在线观看_日韩一区二区在线观看_中文字幕不卡一区

公告:魔扣目錄網為廣大站長提供免費收錄網站服務,提交前請做好本站友鏈:【 網站目錄:http://www.430618.com 】, 免友鏈快審服務(50元/站),

點擊這里在線咨詢客服
新站提交
  • 網站:51998
  • 待審:31
  • 小程序:12
  • 文章:1030137
  • 會員:747

最近,追一科技發布了RoFormerV2模型,憑借追一獨創的旋轉位置編碼技術(RoPE),全面超越了BERT、RoBERTa、Albert、Electra等當前的主流預訓練模型。

在權威的中文NLP(自然語言處理)測試榜單CLUE上,RoFormerV2以僅3億的參數量,超過了若干10億+參數量的模型進入榜單前5名(截止2022年3月21日),同時它也是榜上前5名中參數量最少的模型,基本實現了同一尺度下的模型最優解。

RoFormerV2采用了追一獨創的旋轉位置編碼(RoPE)技術,完全不同于主流的BERT、RoBERTa、Albert、Electra所使用的方法,這讓RoFormerV2與這些模型在效果上拉開差距。

旋轉位置編碼(RoPE)技術是追一在2021年提出,利用向量之間的旋轉角度來表示特征之間的相對關系,這一思路不同于此前所有的方法,知名的技術極客組織EleutherAI認為RoPE是“革命性”的,具有開創式意義。Google在今年提出的FLASH模型論文中則明確指出RoPE對模型的效果有明顯的提升作用,并將其作為模型的默認方法。

同時,RoPE還被用在了許多最新的模型當中,例如EleutherAI新發布的60億和200億參數的GPT模型中就用了RoPE位置編碼。

而Google最近大火的5400億參數的PaLM模型中也采用了追一的RoPE技術,PaLM是一個支持多語種、多任務形式的超大型模型,它不僅可以理解人類語言,還可以理解機器代碼。PaLM在上百個自然語言理解與自然語言生成任務上測試,并在大多數任務上取得了最優效果。這些最新方法都采用了RoPE的設計,進一步驗證了它的優越性,使之有望成為預訓練模型的標準方法。

隨著“大模型”時代的來臨,許多用戶希望用優秀的模型來解決實際問題,但這些“龐然大物”所需要的硬件配置、高額投入,讓人望而卻步。同時, 利用“大模型”進行NLP技術實驗研究,所需要的算力與時間成本越來越高。不管是NLP技術研究還是應用實踐,追一科技都一直致力于開放、開源生態的參與、建設,助力用戶和開發者創新研究。

RoFormerV2作為同體量效果最好的預訓練模型,可以在有限的機器資源下進行訓練與微調并獲得超越體型更大的模型的效果,因此我們將其開源供大家進行研究使用,為推動中文NLP發展繼續貢獻一份力量。

【來源:松果財經

分享到:
標簽:三星 模型 技術 華為 自然語言 參數 效果 方法
用戶無頭像

網友整理

注冊時間:

網站:5 個   小程序:0 個  文章:12 篇

  • 51998

    網站

  • 12

    小程序

  • 1030137

    文章

  • 747

    會員

趕快注冊賬號,推廣您的網站吧!
最新入駐小程序

數獨大挑戰2018-06-03

數獨一種數學游戲,玩家需要根據9

答題星2018-06-03

您可以通過答題星輕松地創建試卷

全階人生考試2018-06-03

各種考試題,題庫,初中,高中,大學四六

運動步數有氧達人2018-06-03

記錄運動步數,積累氧氣值。還可偷

每日養生app2018-06-03

每日養生,天天健康

體育訓練成績評定2018-06-03

通用課目體育訓練成績評定