近日,谷歌旗下的DeepMind團隊震撼發(fā)布了其最新的通用世界模型——Genie 3。這項技術(shù)革新,能夠依據(jù)用戶的文本輸入,迅速構(gòu)造出多樣且互動性強的虛擬環(huán)境,為人工智能與虛擬現(xiàn)實的結(jié)合探索出一條前所未有的道路。
Genie 3的技術(shù)實力令人嘆為觀止:它不僅能以流暢的每秒24幀速率,生成清晰度達到720p的高清3D互動世界,還獨創(chuàng)性地加入了“文本提示觸發(fā)事件”功能。用戶僅憑簡單的文字命令,就能實時調(diào)整虛擬環(huán)境,極大地增強了體驗的沉浸感和用戶的創(chuàng)造力。
作為向通用人工智能(AGI)邁進的關(guān)鍵一步,Genie 3為AI實體提供了一個廣闊且逼真的訓(xùn)練舞臺。同時,它在游戲開發(fā)、教育模擬、創(chuàng)意產(chǎn)業(yè)等多個領(lǐng)域展現(xiàn)出了巨大的應(yīng)用潛力。例如,倉庫機器人可以在此模型創(chuàng)造的虛擬場景中安全地練習(xí)應(yīng)對各種緊急情況,從而提升在實際工作中的表現(xiàn)。
然而,盡管Genie 3前景光明,但它仍面臨一系列技術(shù)難題。目前,它支持的連續(xù)交互時間僅限于幾分鐘,遠未達到理想水平。AI實體在模擬環(huán)境中的交互能力,特別是在處理復(fù)雜多智能體交互方面,仍有待大幅提升。
為了進一步完善模型并評估潛在的倫理問題,DeepMind目前正以研究預(yù)覽的形式,向部分學(xué)者和創(chuàng)作者開放Genie 3,旨在收集專業(yè)的反饋意見,以推動其后續(xù)的迭代與升級。






