在AI領域的一次重大突破中,由知名學者李飛飛共同創立并領導的AI初創企業World Labs,近期揭開了其首個創新成果的神秘面紗——一個能夠僅憑單張圖片就生成可交互3D世界的模型。這一消息迅速引起了業界的廣泛關注。
World Labs的這項新技術,實現了從2D圖片到3D世界的跨越性轉變。與傳統的圖片轉3D產品相比,該模型生成的3D場景不僅高度還原了原始圖片的風格,更賦予了用戶前所未有的互動體驗。用戶可以在瀏覽器中實時與這些場景進行交互,仿佛置身于一個開放世界的游戲中,通過鍵盤和鼠標自由移動、轉換視角,甚至模擬相機的對焦和變焦功能。
World Labs的3D世界生成模型不僅提升了用戶體驗,更在技術上實現了三大突破:連續性、實時控制和正確的幾何結構。這意味著用戶可以在不改變已生成場景的前提下,自由探索、觀察每一個細節,同時享受真實的物理規律和立體感帶來的視覺盛宴。用戶還可以為這些場景添加交互效果和動畫,如聲納、聚光燈和波紋動態效果,使場景更加生動有趣。
World Labs的團隊表示,這項技術有望徹底改變電影、游戲、模擬器等數字媒體的制作方式。他們展示了兩個令人驚嘆的應用案例:一是將梵高等世界名畫轉化為可交互的3D世界,讓用戶能夠身臨其境地欣賞藝術之美;二是將這項技術與其他AI工具結合使用,加速內容創作過程。例如,用戶可以先使用文本生成圖像模型創建圖像,再基于這些圖像生成3D世界,從而快速制作出風格各異的作品。
盡管這項技術還處于早期階段,存在一些限制,如生成的3D場景可探索區域有限,以及偶爾會出現渲染錯誤等,但World Labs的團隊正在不斷努力改進和完善。他們表示,將致力于提高生成世界的大小和擬真度,同時探索更多用戶與場景交互的新方式。
World Labs于今年9月正式宣告成立,是一家專注于空間智能的AI公司。其聯合創始人兼CEO李飛飛,前谷歌云AI負責人、斯坦福大學教授,憑借其深厚的學術背景和豐富的行業經驗,帶領團隊致力于構建大型世界模型(LWM),以感知、生成并交互3D世界。成立不到一周,World Labs就獲得了超過10億美元的估值,并籌集了2.3億美元的風投資金,投資方包括多家知名風投機構和知名企業。
World Labs的成立和技術的突破,標志著生成式AI正邁向一個新的階段——空間智能。隨著技術的不斷進步和應用場景的拓展,我們有理由相信,未來的AI將更加智能、更加人性化,為人類的生活和工作帶來更多的便利和驚喜。