亚洲视频二区_亚洲欧洲日本天天堂在线观看_日韩一区二区在线观看_中文字幕不卡一区

公告:魔扣目錄網為廣大站長提供免費收錄網站服務,提交前請做好本站友鏈:【 網站目錄:http://www.430618.com 】, 免友鏈快審服務(50元/站),

點擊這里在線咨詢客服
新站提交
  • 網站:52011
  • 待審:79
  • 小程序:12
  • 文章:1184964
  • 會員:801

在人工智能領域邁出重要一步,智元機器人于近日震撼發布了其首個通用具身基座模型——智元啟元大模型Genie Operator-1(簡稱GO-1)。這一創新模型的推出,標志著機器人在理解人類指令、執行多樣化任務方面取得了突破性進展。

GO-1的核心在于其獨特的Vision-Language-Latent-Action(ViLLA)框架,該框架巧妙融合了多模態大模型VLM與混合專家MoE。VLM作為模型的主干網絡,借助互聯網上的海量純文本和圖文數據,賦予了GO-1強大的場景感知和理解能力。而MoE則進一步增強了模型的動作規劃和執行能力,通過隱動作專家模型和動作專家模型的協同工作,GO-1能夠精準地理解并執行復雜的任務。

GO-1展現了五大顯著優勢:采訓推一體化設計,確保了數據采集、模型訓練和推理的無縫銜接;小樣本快速泛化能力,使得模型能夠在極少數據甚至零樣本的情況下快速適應新場景和新任務;一腦多形特性,允許模型在不同機器人形態之間靈活遷移,快速適配各種本體;持續進化機制,借助智元的數據回流系統,模型能夠根據實際執行中遇到的問題數據進行持續學習和優化;人類視頻學習能力,讓模型能夠通過互聯網視頻和真實人類示范進行學習,進一步提升對人類行為的理解。

在構建GO-1的過程中,智元機器人采用了具身領域的數字金字塔結構。底層是互聯網的大規模純文本與圖文數據,為機器人提供通用知識和場景理解的基礎。往上則是大規模的人類操作和跨本體視頻數據,幫助機器人學習各種動作操作模式。再往上則是仿真數據,用于增強模型的泛化能力。而金字塔的頂層,則是高質量的真機示教數據,用于訓練機器人精準的動作執行能力。

ViLLA框架通過預測隱式動作標記(Latent Action Tokens),成功彌合了圖像-文本輸入與機器人執行動作之間的鴻溝。用戶只需用日常語言向機器人發出指令,如“掛衣服”,GO-1便能根據所學習的知識和數據,拆解并執行這一任務。從理解指令的含義和要求,到識別掛衣服的環節,再到理解物體和環境并打通整個任務過程,最終精準完成操作,GO-1展現了驚人的執行能力和智能化水平。

GO-1的應用場景廣泛且多樣。從家庭場景中的準備餐食、收拾桌面,到辦公和商業場景中的接待訪客、發放物品,再到工業等更多場景的其他操作任務,GO-1都能快速實現。這意味著機器人將能夠更多地融入人類的生活和工作,為人類帶來更多便利。

GO-1還具備持續進化的能力。例如,當機器人在做咖啡時不小心將杯子放歪時,它能夠從這次失敗中學習并優化自己的行為,直到成功完成任務。這種自我學習和優化的能力,讓GO-1在面對多變和復雜的真實世界時更加從容。

智元機器人的這一創新成果,無疑為具身智能的發展注入了新的活力。GO-1的出現,不僅解決了具身智能在場景和物體泛化、語言理解、新技能學習以及跨本體部署等方面的難題,更推動了具身智能向通用化、開放化與智能化的方向加速邁進。未來,我們有望看到更多像GO-1這樣的智能機器人,它們將在各個領域發揮更大的作用,為人類創造更加美好的生活和工作環境。

分享到:
標簽:基座 模型 發布
用戶無頭像

網友整理

注冊時間:

網站:5 個   小程序:0 個  文章:12 篇

  • 52011

    網站

  • 12

    小程序

  • 1184964

    文章

  • 801

    會員

趕快注冊賬號,推廣您的網站吧!
最新入駐小程序

數獨大挑戰2018-06-03

數獨一種數學游戲,玩家需要根據9

答題星2018-06-03

您可以通過答題星輕松地創建試卷

全階人生考試2018-06-03

各種考試題,題庫,初中,高中,大學四六

運動步數有氧達人2018-06-03

記錄運動步數,積累氧氣值。還可偷

每日養生app2018-06-03

每日養生,天天健康

體育訓練成績評定2018-06-03

通用課目體育訓練成績評定