在9月16日舉行的“首屆高新科技產業資本峰會暨科創的未來-無疆科創項目聯合發布會”上,AI數字人成為了全場關注的焦點。深蘭科技在會上正式宣布面向全國范圍招募深蘭硅基大腦SaaS平臺合伙人,這意味著AI數字人大規模產業落地已經成為現實,一個可交互AI數字人全民共享的時代正在開啟。
進入2023年以來,隨著ChatGPT的火爆和大模型的流行,人工智能領域的虛擬數字人賽道也開始熱鬧了起來。同時,數字人員工以其高效、精準和可靠的服務,也贏得了各行各業的喜愛和認可。為此,各大廠和科技企業紛紛出手布局,希望搶占這一產業高地。
據IDC在其發布的《IDC PeerScape:AI數字人最佳實踐案例與探索》報告中顯示,百度智能云為中信金控打造的“小信”和為廣西文旅打造的“劉三姐”兩大數字人項目,因其向全社會所展現出的AI數字人給金融服務帶來模式創新,以及為文旅內容生產和營銷賦能,成功入選最佳實踐案例。
在7月舉行的第六屆世界人工智能大會上,商湯科技也帶來了基于“商湯日日新SenseNova”大模型體系推出的“商湯如影SenseAvatar”2D數字人視頻生成平臺。據介紹,該平臺基于AI數字人視頻生成算法、語言大模型、AI文生圖、AIGC等能力,僅需一段5分鐘的真人視頻素材,就可以生成出來聲音及動作自然、口型準確、多語種精通的數字人分身。
值得注意的是,“如影”這個名字寓意為“如影隨形”,是兩個人密不可分,因此很符合數字人的寓意。目前,已經可以開始面向醫療、教育、文旅、商務等行業客戶提供服務,幫助企業和商戶實現高質量、高效率的數字人形象個性化定制和視頻內容創作。
而在6月20日舉行的2023中國(蘇州)獨角獸企業大會上,與會的深蘭科技創始人陳海波正式宣布推出大語言模型SaaS平臺“深蘭硅基大腦SaaS平臺”,并指出“大語言模型+SaaS平臺”的模式可以為AI數字人商業化落地提供可行的路徑。
現在市場上可落地的數字人,從生成方式上來看,大致可以分為視頻合成和AI生成兩種。其中,商湯如影APP采用的就是視頻合成方式,即用戶無需復雜的拍攝剪輯以及文案創作等繁瑣工作,只要打開如影APP,利用APP提供的豐富視頻創作素材庫和AI文案編寫功能,選擇喜歡的視頻模板,根據腳本錄制幾分鐘視頻,并輸入粗略的文案想法,系統就可一鍵生成知識分享、品牌宣傳、短視頻帶貨、培訓宣講、熱點資訊等各類數字人視頻,并將快速生成的播報文案合成進視頻。目前市場上大多數的數字人生成平臺,采用的都是這種方式。
與最初的虛擬人相比,視頻合成數字人在外觀、表情、動作等方面,制作更逼真,在語音、語意、語態以及文案理解方面,能力也有了很大升級,不過在實現人機高效交互方面,能力還比較欠缺。因此,從某種程度上來說,視頻合成數字人還只能算是虛擬人的技術升級版。
而與商湯如影不同,深蘭科技最新宣布開始招募合伙人的深蘭硅基大腦SaaS平臺,是基于深蘭硅基知識大模型而開發,集AI數字人設計、構建、應用、管理于一身的自助式運營平臺,具有零代碼、一鍵生成、低成本等特點。
尤其有別于如影的是,SaaS平臺不僅有“人情味”,而且還“走心”。它為企業提供了一套自主創建企業級“超級智能助理”的快捷方法,并形成標準化平臺服務。企業只需將說明書、操作手冊、常見問題等文檔和數據導入該平臺,系統會自動生成有針對性的知識圖譜,并基于圖譜進行知識、個性化人設等高維數據的定制化訓練,實現數字人形象、性格、知識體系等特征的自主定義,并將其應用于客戶服務、銷售咨詢等人機交互領域,以滿足企業在智能客服、數字員工和行業專家等多個場景的需求。
也就是說,“硅基大腦SaaS平臺”既可以像傳統數字人平臺那樣,能夠讓數字人生成變得更加便捷化、個性化、多元化,以適用于更加豐富的應用場景,還可以賦予數字人“靈魂和人設”,變單項輸出的說教為雙向互動的人機對話,讓數字人服務不僅有科技感,還充滿濃濃的“人氣”。
隨著生成式AI技術、大語言模型技術、知識圖譜技術等與計算機深度學習模型相關的技術領域快速發展,數字人正在從與原形的外表、語音、動作相仿的形似,逐漸向具備強交互能力、學習能力甚至情緒感知能力的神似過渡,數字人產業正在進入一個全新擬人化時代。