【ITBEAR科技資訊】6月26日消息,谷歌旗下的DeepMind公司近日宣布成功研發出一種名為RoboCat的人工智能模型,該模型具備多任務解決和適應的能力,并能夠通過不同的真實世界機器人完成任務。這一突破性進展為機器人技術領域帶來了新的可能性。
RoboCat的靈感來自DeepMind的另一款AI模型Gato,后者具備文本、圖像和事件分析與處理的能力。為了訓練RoboCat,研究人員采集了模擬和真實機器人的圖像和動作數據,其中包括來自虛擬環境中其他機器人控制模型、人類控制機器人以及RoboCat早期版本的數據。
據ITBEAR科技資訊了解,RoboCat的訓練過程包括以下幾個步驟:首先,研究人員利用人類控制的機械臂在模擬或真實環境中進行每個任務或機器人的100到1000次演示,例如拾取齒輪或堆疊積木等。隨后,他們對RoboCat進行微調,針對每個任務創建專門的"衍生"模型,并進行平均約1萬次的訓練。通過結合衍生模型生成的數據和演示數據,研究人員不斷擴大RoboCat的訓練數據集,并訓練出新的RoboCat版本。
最終,RoboCat在模擬和真實世界中完成了總共253個任務的訓練,并在這些任務的141個變體上進行了測試。DeepMind表示,在觀察了1000次人類控制的演示后,RoboCat學會了操作不同類型的機械臂。盡管RoboCat已經在四種具有兩爪臂的機器人上進行了訓練,但該模型也能夠適應一種更復雜的機械臂,該機械臂具備三指夾具和更多的可控輸入。
不過,RoboCat在DeepMind的測試中在不同任務上的成功率存在較大差異,最低成功率為13%,最高可達99%。這些結果是基于1000次演示的訓練數據得出的,如果演示次數減半,成功率也會相應降低。但在某些情況下,DeepMind聲稱RoboCat只需觀察100次演示即可學習新任務。DeepMind的研究科學家李亞歷克斯表示,RoboCat有望進一步降
低學習新任務的難度。他表示,只要提供一定數量的新任務演示,RoboCat就能夠進行微調,并自動生成更多數據以進一步提升性能。研究團隊的未來目標是減少RoboCat學習新任務所需的演示次數,使之少于10次,以進一步提高效率和適應性。這一研究成果對于推動機器人技術的發展具有重要意義,為機器人在各個領域的應用打開了更廣闊的前景。