【ITBEAR】9月22日消息,阿里團隊推出新型AI游戲智能體,成功挑戰(zhàn)《黑神話·悟空》
近日,阿里巴巴的研究團隊公布了一項令人矚目的成果:他們開發(fā)了一種新型VARP(視覺動作角色扮演)智能體框架,該框架能夠直接將游戲截圖作為輸入,并通過視覺語言模型進行推理,最終生成Python代碼形式的動作來操作游戲。這一技術(shù)在經(jīng)典國產(chǎn)游戲《黑神話·悟空》上進行了驗證,展現(xiàn)出了令人驚嘆的實力。
據(jù)ITBEAR了解,該團隊以《黑神話·悟空》為研究平臺,定義了12個任務(wù),其中75%與戰(zhàn)斗相關(guān)。他們構(gòu)建了一個包含鍵鼠操作和游戲截圖的人類操作數(shù)據(jù)集,并利用這些數(shù)據(jù)訓(xùn)練出能夠模仿人類玩家操作的AI智能體。值得一提的是,該智能體在90%的簡單和中等水平戰(zhàn)斗場景中取得了勝利,甚至在面對某些精英怪時,其勝率已經(jīng)超過了人類玩家。
這一技術(shù)的實現(xiàn)離不開強大的視覺語言模型(VLMs)的支持。通過情境庫、動作庫和人類引導(dǎo)庫的共同作用,VARP智能體能夠推理和生成適應(yīng)不同游戲場景的動作。此外,人類引導(dǎo)軌跡系統(tǒng)的引入,使得智能體在面對困難任務(wù)時,能夠通過查詢?nèi)祟惒僮鲾?shù)據(jù)來獲取靈感,從而生成新的有效動作。
在與不同AI模型的對比中,阿里團隊的VARP智能體展現(xiàn)出了卓越的性能。無論是在面對小怪還是精英怪時,其表現(xiàn)均達到了人類玩家的水平,甚至在某些方面有所超越。然而,研究團隊也承認,目前的技術(shù)還存在一些局限性,如VLMs的推理速度限制以及缺乏明確的道路引導(dǎo)等問題。
盡管如此,這項研究仍為AI在游戲領(lǐng)域的應(yīng)用開辟了新的道路。未來,隨著技術(shù)的不斷進步和完善,我們有理由期待AI將在游戲行業(yè)中扮演更加重要的角色。
#阿里巴巴# #VARP智能體# #黑神話悟空# #AI游戲# #視覺語言模型#