在人工智能領域,智譜AI作為大模型賽道的佼佼者,近期公布了其最新的AI應用進展,引發了廣泛關注。在北京智譜GLM OpenDay活動上,智譜AI首席執行官張鵬親自揭曉了兩款創新產品——AutoGLM和GLM-PC。
AutoGLM是智譜AI推出的首個產品化智能體Agent,它基于公司自研的“基礎智能體解耦合中間界面”與“自進化在線課程強化學習框架”。這款智能體能夠通過文字或語音指令模擬人類操作手機,實現了大模型從“言語”到“行動”的范式轉變。目前,AutoGLM已經開啟了“百萬內測”的申請通道,吸引了眾多用戶的關注。
GLM-PC則是另一款令人矚目的產品,它基于CogAgent模型的視覺理解和任務規劃能力,能夠操作計算機的桌面應用。用戶只需通過簡單的一句話,GLM-PC就能快速執行復雜任務。GLM-PC還具備任務規劃、屏幕界面信息理解的能力,能夠根據頁面信息進行計劃更改和自我糾錯,從而精準完成用戶指令。
在發布會上,張鵬表示,AI Agent目前備受矚目,從蘋果的Siri、谷歌的Assistant,到OpenAI即將推出的Operator,全球科技巨頭都在這一領域進行布局。智譜AI率先開放AutoGLM內測,受到了業界的廣泛關注,僅過去一個月,申請頁面就已有超過百萬的用戶訪問。
張鵬還透露,盡管業界對大模型寄予厚望,但這也是一個高投入的領域。信息的理解依賴于底層技術,而底層技術并非單一能力所能涵蓋。若要將AI作為生產力工具,需面對全面性的需求,可能會存在明顯的短板。因此,智譜AI不僅在技術上進行布局,還在產業生態上進行了深入規劃。智譜AI的定位是“開放平臺”,旨在助力合作伙伴改造原有產品,探索新的可能。
在談到Scaling Law時,張鵬表示,盡管由于數據和訓練規模的原因,Scaling Law可能不會像之前預測的那樣指數級上漲,但放寬視野來看,我們仍在尋找現象的本質。他依然對Scaling Law持樂觀態度,認為其仍有很大的發展空間,將繼續推動技術進步。特別是視覺Scaling Law仍在上漲,計算量可能是其發展趨勢的最佳解釋。
成立于2019年的智譜AI,源自清華大學計算機系的技術成果轉化,是清華大學知識工程(KEG)實驗室的衍生企業。作為國內最早進入大模型賽道的公司之一,智譜AI在業界享有“大模型六小虎”之一的美譽。自2023年3月推出千億開源基座對話模型ChatGLM系列以來,GLM大模型已經經歷了四個大版本的迭代,發布了超過20款AI模型技術和產品。
智譜AI聚焦于基座模型的研發投入,以TO B賽道為主,TO C賽道為輔。張鵬曾表示,國內大模型賽道過于擁擠,導致內耗嚴重。更符合商業規律的模式應是先建立基座大模型,再發展行業側模型,最后面向更加細分場景的推理模型。國內創業生態在分層方面較美國略慢,而美國在多樣性方面則擁有更多選項。
在TO B端層面,截至2023年底,智譜AI已擁有超過2000家生態合作伙伴,超過1000個大模型規模化應用,覆蓋了傳媒、咨詢、消費、金融、新能源、互聯網、智能辦公等多個細分場景。在融資方面,智譜AI已完成九輪融資,總額接近60億元人民幣,其中包括多家知名投資機構的參與。
如今,智譜AI全面發力AI智能體應用,已在芯片、應用App、操作系統OS和模型側進行了長時間、全鏈路的布局。智譜AI與高通、三星、英特爾、榮耀、華碩等端側芯片、手機、電腦廠商合作,共同推動大模型應用落地,在AIPC、智能助手等領域取得了顯著成果。
張鵬認為,通過端側芯片性能優化和端云一體架構,Agent不僅能在操作系統OS和應用App上實現用戶體驗變革,還能將其推廣到各類智能設備上,實現基于大模型的互聯互通。今天的Agent已經能夠像人一樣理解界面、規劃任務、使用工具、完成任務,從而更聰明地代替人類行動。
他分析稱,大模型發展至今已逐步具備與人類與現實物理世界互動的能力,包括L1語言能力(已達80%)、L2邏輯能力(多模態能力,已達60%)、L3使用工具的能力(已達30%),甚至L4自我學習的能力也正在逐漸出現。智譜AI致力于將這種“理解”能力融入各行各業及各種場景,不斷探索大模型的“序列輸出”意味著什么,以及應以何種形式呈現。
張鵬在會后交流時表示,看待問題應更多從技術導向和目標導向出發,而不僅僅是局限于單項技術的快速變現。智譜AI的最終目標是幫助大家切切實實地解決生產力的問題,而非簡單盈利。因此,需要更長遠地去做這個事情,從生態建設上也是如此。智譜AI正在與眾多伙伴和客戶合作,共同構建發展自己的應用和商業價值。
在談到AI智能體和搜索的關系時,張鵬提到,在辦公應用場景中,AI Agent助手可以幫助用戶解決一些問題,提升工作效率。智譜AI希望推動AI Agent技術本身的應用產生價值,而搜索是一個重要場景。他強調,AI Agent已經對人機交互形式產生了極大的影響,未來有望基于大模型智能能力實現原生的人與機器交互方式LM-OS,這將從根本上改變人與機器交互的方式。