【ITBEAR科技資訊】6月26日消息,谷歌旗下的DeepMind公司近日宣布成功研發(fā)出一種名為RoboCat的人工智能模型,該模型具備多任務(wù)解決和適應(yīng)的能力,并能夠通過不同的真實世界機器人完成任務(wù)。這一突破性進展為機器人技術(shù)領(lǐng)域帶來了新的可能性。
RoboCat的靈感來自DeepMind的另一款A(yù)I模型Gato,后者具備文本、圖像和事件分析與處理的能力。為了訓(xùn)練RoboCat,研究人員采集了模擬和真實機器人的圖像和動作數(shù)據(jù),其中包括來自虛擬環(huán)境中其他機器人控制模型、人類控制機器人以及RoboCat早期版本的數(shù)據(jù)。
據(jù)ITBEAR科技資訊了解,RoboCat的訓(xùn)練過程包括以下幾個步驟:首先,研究人員利用人類控制的機械臂在模擬或真實環(huán)境中進行每個任務(wù)或機器人的100到1000次演示,例如拾取齒輪或堆疊積木等。隨后,他們對RoboCat進行微調(diào),針對每個任務(wù)創(chuàng)建專門的"衍生"模型,并進行平均約1萬次的訓(xùn)練。通過結(jié)合衍生模型生成的數(shù)據(jù)和演示數(shù)據(jù),研究人員不斷擴大RoboCat的訓(xùn)練數(shù)據(jù)集,并訓(xùn)練出新的RoboCat版本。

最終,RoboCat在模擬和真實世界中完成了總共253個任務(wù)的訓(xùn)練,并在這些任務(wù)的141個變體上進行了測試。DeepMind表示,在觀察了1000次人類控制的演示后,RoboCat學(xué)會了操作不同類型的機械臂。盡管RoboCat已經(jīng)在四種具有兩爪臂的機器人上進行了訓(xùn)練,但該模型也能夠適應(yīng)一種更復(fù)雜的機械臂,該機械臂具備三指夾具和更多的可控輸入。
不過,RoboCat在DeepMind的測試中在不同任務(wù)上的成功率存在較大差異,最低成功率為13%,最高可達99%。這些結(jié)果是基于1000次演示的訓(xùn)練數(shù)據(jù)得出的,如果演示次數(shù)減半,成功率也會相應(yīng)降低。但在某些情況下,DeepMind聲稱RoboCat只需觀察100次演示即可學(xué)習(xí)新任務(wù)。DeepMind的研究科學(xué)家李亞歷克斯表示,RoboCat有望進一步降
低學(xué)習(xí)新任務(wù)的難度。他表示,只要提供一定數(shù)量的新任務(wù)演示,RoboCat就能夠進行微調(diào),并自動生成更多數(shù)據(jù)以進一步提升性能。研究團隊的未來目標(biāo)是減少RoboCat學(xué)習(xí)新任務(wù)所需的演示次數(shù),使之少于10次,以進一步提高效率和適應(yīng)性。這一研究成果對于推動機器人技術(shù)的發(fā)展具有重要意義,為機器人在各個領(lǐng)域的應(yīng)用打開了更廣闊的前景。






