在WAIC 2025大模型論壇的舞臺上,商湯科技帶來了一場技術(shù)盛宴,正式揭曉了其精心打造的「悟能」具身智能平臺。該平臺以商湯的具身世界模型為心臟,借助商湯大裝置的強大算力,為機器人及智能設(shè)備賦予了前所未有的感知力、視覺導航技能以及多模態(tài)交互能力,引領(lǐng)智能終端邁向更高階的自主與智能境界。
「悟能」平臺不僅能夠讓機器人等硬件具備對周遭世界的深刻理解,還能輕松嵌入端側(cè)芯片,展現(xiàn)出極強的環(huán)境適應(yīng)性。在演示環(huán)節(jié),商湯科技的首席執(zhí)行官徐立親自上陣,展示了搭載具身世界引擎的人形機器人。這臺機器人不僅能夠流暢地展示PPT,如“長安的荔枝”般引人入勝,還能自如地翻頁、回答觀眾提問,并適時做出總結(jié),語言風趣,動作自然,贏得了現(xiàn)場陣陣掌聲。

商湯的具身世界模型更進一步,能夠創(chuàng)造出多視角視頻,確保視頻內(nèi)容在時間與空間上的高度一致,使機器不僅能理解、生成,還能編輯真實世界。這一突破意味著,用戶或許能在真實的街道環(huán)境中體驗“極品飛車”般的虛擬冒險,實現(xiàn)空間層面的世界交互。
該模型還能構(gòu)建出包含人、物、場景的4D真實世界。用戶只需輸入簡單的指令,如“在廚房架子上找東西”或“進入娛樂室,右轉(zhuǎn),打開通往院子的門”,具身世界模型便能自動生成相應(yīng)的位置、動作骨架及執(zhí)行指令,展現(xiàn)了其強大的實用性與靈活性。

徐立在會上強調(diào),商湯科技的愿景是通過「悟能」具身智能平臺,助力眾多具身智能企業(yè),實現(xiàn)他們與現(xiàn)實世界深度互動的夢想。這一平臺的推出,無疑為智能科技的發(fā)展注入了新的活力,開啟了人機交互的新篇章。






