近期,WakeData惟客數(shù)據(jù)(以下簡稱 “ WakeData ” )完成了新一輪的產(chǎn)品能力升級。就 ToB 企服公司如何融合GPT 大模型,WakeData 給出了自己的答案。
在2022年11月的產(chǎn)品發(fā)布會上,已傳遞出WakeData的“三個堅定”:始終堅定技術(shù)投入,全面夯實核心產(chǎn)品的科技能力和自研率;始終堅定國產(chǎn)化適配能力,支持國產(chǎn)芯片、操作系統(tǒng)、數(shù)據(jù)庫、中間件、國密算法等,并在同領(lǐng)域?qū)崿F(xiàn)對國外廠商的國產(chǎn)化替代;始終堅定擁抱生態(tài),與伙伴共創(chuàng)共贏。
WakeData繼續(xù)新一輪的產(chǎn)品能力升級,憑借過去5年的技術(shù)積累,以及在地產(chǎn)、零售、汽車等行業(yè)和垂直領(lǐng)域的實踐,與戰(zhàn)略伙伴聯(lián)合研發(fā)具有私有化部署能力的行業(yè)大模型WakeMind,將在 AIGC 時代幫助更多企業(yè)自我革命、提升效能,持續(xù)解放生產(chǎn)力。
WakeMind模型的三大平臺層
模型層:母艦平臺將以具有私有化部署和行業(yè)定制能力的WakeMind作為核心引擎,已接入了ChatGPT等大模型,同時支持接入如文心一言、通義千問等多個大模型能力
平臺層:WakeMind基于Prompt提示工程、Plugin、LangChain等方式,實現(xiàn)與接入大模型的高效對話能力。在零樣本學(xué)習(xí)的基礎(chǔ)上,通過Prompt和Plugin管理,讓模型能夠更好的理解上下文信息;通過投喂行業(yè)語料,讓模型快速學(xué)習(xí)行業(yè)知識,并具有行業(yè)和垂直領(lǐng)域的思考推理能力。
應(yīng)用層:WakeMind母艦平臺提供底層能力,通過一架又一架的艦載機去賦能產(chǎn)品應(yīng)用和行業(yè)場景,提升企業(yè)內(nèi)部生產(chǎn)力。
舉個例子,母艦平臺如何賦能惟數(shù)云。企業(yè)在借助惟數(shù)云平臺建設(shè)和使用數(shù)據(jù)資產(chǎn)的過程中,往往需要投入大量專業(yè)的數(shù)據(jù)開發(fā)工程師,參與到業(yè)務(wù)需求分析和數(shù)據(jù)開發(fā)工作中,而大量繁瑣的開發(fā)任務(wù)會導(dǎo)致整個數(shù)據(jù)價值實現(xiàn)周期被拉長?;赪akeMind賦能,只需要通過文本交互,惟數(shù)云就可以自動生成對應(yīng)的數(shù)據(jù)查詢語句,并一鍵執(zhí)行查詢,能夠大幅度提高數(shù)據(jù)查詢、分析、開發(fā)的效率,全面降低數(shù)據(jù)使用的技術(shù)門檻,以實現(xiàn)數(shù)據(jù)人人可用的目標(biāo)。
WakeMind模型的三大特征
1)參數(shù)量更適合行業(yè)化和垂直領(lǐng)域場景。AI生成的內(nèi)容要達到人類水平,往往需要以“預(yù)訓(xùn)練+微調(diào)”的大模型為基礎(chǔ);WakeData聯(lián)合業(yè)界領(lǐng)先的千億參數(shù)多模態(tài)預(yù)訓(xùn)練大模型廠商,通過知識蒸餾和動態(tài)量化,壓縮出100億參數(shù)量的WakeMind模型;在聚焦的行業(yè)和垂直領(lǐng)域,基于P-Tuning V2可以將需要微調(diào)的參數(shù)減少到原來的千分之一,大幅度降低微調(diào)所需要的計算量。
2)具備行業(yè)化和垂直領(lǐng)域能力的文本創(chuàng)造和代碼生成。
3)支持私有化部署和行業(yè)化定制。行業(yè)或垂直領(lǐng)域的頭部企業(yè),更希望具備私有化部署和行業(yè)化定制大模型的能力。而如何在小樣本學(xué)習(xí)和低算力消耗的情況下進行有效的預(yù)訓(xùn)練,已成為行業(yè)化定制模型的技術(shù)門檻。WakeData行業(yè)數(shù)據(jù)和垂直領(lǐng)域數(shù)據(jù)的積累,將使行業(yè)大模型具有行業(yè)Know-How,并形成獨特的競爭優(yōu)勢。
同時,WakeMind采用Transformer架構(gòu),以self-instruct方式生成數(shù)萬的指令遵循樣本數(shù)據(jù),使用SFT(Supervised Fine-Tuning)、RLHF等技術(shù)實現(xiàn)意圖對齊,通過INT8量化后,可大幅降低推理成本,使模型具有私有化部署的可行性
大模型與行業(yè)化預(yù)訓(xùn)練大模型
自O(shè)pneAI發(fā)布ChatGPT以來,給世界帶來了巨大沖擊。其背后的大型語言模型 (Large Language Model,LLM) ,以及RLHF (Reinforcement Learning from Human Feedback) 即以強化學(xué)習(xí)方式依據(jù)人類反饋優(yōu)化的語言模型,得到了廣泛關(guān)注。
WakeData創(chuàng)業(yè)初期,在NLP、CV、語音等領(lǐng)域就發(fā)布了11個AI模型,其中NLP語義分析大模型的應(yīng)用場景最為豐富。例如在低頻高客單價的地產(chǎn)置業(yè)、汽車、品牌零售等行業(yè)領(lǐng)域,SCRM是最有效的潛在客戶和存量客戶經(jīng)營方式之一。WakeData通過行業(yè)語料的積累和特定的預(yù)訓(xùn)練,使AI對行業(yè)產(chǎn)生深刻理解,能夠在對話過程中24小時快速響應(yīng)客戶問題,并且能夠基于會話信息,自動抽取客戶標(biāo)簽,提升客戶畫像的分辨率。
在WakeData,AI大模型能力已經(jīng)覆蓋到從底層客戶數(shù)據(jù)資產(chǎn)構(gòu)建,中層客戶經(jīng)營旅程和經(jīng)營規(guī)則,再到上層的多接觸點營銷鏈路;具備能夠為整個數(shù)字化客戶經(jīng)營的垂直領(lǐng)域‘降本、提效、賦能’的能力。例如在CDP客戶數(shù)據(jù)平臺領(lǐng)域,以前運營人員需要繁瑣的規(guī)則設(shè)計才能圈選到合適的目標(biāo)客群,現(xiàn)在則通過簡單的語言描述和對話,AI即可以輔助找到對應(yīng)的目標(biāo)客群,大幅降低平臺的使用學(xué)習(xí)成本,跨越式的提升使用效率和交互體驗。
在MA營銷自動化領(lǐng)域,WakeData的產(chǎn)品已經(jīng)接入了微信生態(tài)、抖音、小紅書等觸點,并且支持自動化構(gòu)建營銷旅程,提供豐富的旅程模版庫,可以實現(xiàn)“實時的、一對一的、個性化的”用戶觸達。這其中有一個重要的環(huán)節(jié)是個性化營銷素材的生成,包括文本、圖片、圖文混排等,AI大模型可以大幅提升這個部分的效率和質(zhì)量,同時降低成本。
在Loyalty大會員領(lǐng)域,當(dāng)大會員系統(tǒng)橫跨不同行業(yè)、不同業(yè)態(tài)的時候,會員規(guī)則和會員資產(chǎn)拉通就會存在挑戰(zhàn),WakeData的AI大模型基于大量行業(yè)經(jīng)驗和語料訓(xùn)練形成的Prompt引擎,通過簡單會話,描述不同業(yè)態(tài)會員的特性和業(yè)務(wù)訴求,就可以自動生成不同會員規(guī)則的映射邏輯和組合方案。
大模型在行業(yè)和垂直領(lǐng)域的實踐已證明其價值。
WakeMind商業(yè)路徑的三個階段
1)2018-2021年,自有模型應(yīng)用和商業(yè)化探索期?;赪akeData的惟數(shù)云、惟客云、昆侖平臺三條基礎(chǔ)產(chǎn)品線,將自研的NLP大模型在地產(chǎn)、新零售、汽車等行業(yè),以及數(shù)字營銷等垂直領(lǐng)域進行全面的探索和實踐。
2)2022-2023年,WakeMind發(fā)布和母艦平臺建設(shè)期。WakeData聯(lián)合戰(zhàn)略伙伴加速行業(yè)大模型WakeMind的研發(fā),并通過母艦平臺,使WakeMind具備行業(yè)化和垂直領(lǐng)域的定制化能力,具備私有化部署能力,具備通用大模型的接入和管理能力,實現(xiàn)對自有模型不能覆蓋場景的有利補充。
3)2023年及以后,全面進入WakeMind模型應(yīng)用期。 WakeMind基于母艦平臺的能力,全面接入到惟客云、惟數(shù)云、昆侖平臺等產(chǎn)品線,通過行業(yè)知識積累、行業(yè)場景優(yōu)化、行業(yè)提示工程訓(xùn)練,進一步提升模型的行業(yè)化能力,并將在地產(chǎn)、新零售、汽車等行業(yè)發(fā)起更大規(guī)模的商用。與此同時,WakeData自身也基于WakeMind母艦平臺的能力,開始實現(xiàn)自我生產(chǎn)力的革命。
WakeData如何用AI解放生產(chǎn)力
WakeData公司的使命定義為「喚醒數(shù)據(jù)」 ,并已在大數(shù)據(jù)平臺領(lǐng)域布局多年。作為一家TOB企服公司,就「如何運用大模型」WakeData看到了巨大的機遇,并將大模型的運用覆蓋到了兩個方面:一方面是將大模型接入產(chǎn)品,另一方面則幫助企業(yè)內(nèi)部的設(shè)計師、程序員等人群使用大模型進行產(chǎn)品開發(fā)和客戶項目交付。
大模型的接入運用有兩個基本要素,有更適用的場景和具備大數(shù)據(jù)AI能力,WakeData主要的兩款產(chǎn)品“惟客云”與“惟數(shù)云”則為大模型的接入提供了便利。惟客云能夠更方便的基于行業(yè)數(shù)字化應(yīng)用將大模型工具無縫接入,客戶無需關(guān)心應(yīng)用背后的復(fù)雜配置和技術(shù)優(yōu)化;惟數(shù)云則能夠基于行業(yè)幫助場景應(yīng)用優(yōu)化提示工程和垂直模型。而這也是WakeData一直堅持平臺+應(yīng)用的產(chǎn)品方案優(yōu)勢。
與此同時,WakeData將大模型接入產(chǎn)品又分為了兩類,一類是基于產(chǎn)品和行業(yè)業(yè)務(wù)流接入,這類接入的重點在于優(yōu)化體驗和行業(yè)知識,幫助客戶快速、便捷和有效的運用;第二類是基于產(chǎn)品結(jié)和開源大模型深度優(yōu)化垂直場景,這類產(chǎn)品更符合大客戶對抗風(fēng)險和數(shù)據(jù)安全上的訴求,同時基于行業(yè)的理解對模型可以不斷優(yōu)化,可以保持這類客戶在垂直行業(yè)的持續(xù)競爭力。
“企業(yè)在數(shù)字化轉(zhuǎn)型和數(shù)字化客戶經(jīng)營當(dāng)中要融合好大模型,大數(shù)據(jù)和場景是兩個關(guān)鍵要素。”WakeData創(chuàng)始人兼CEO李柯辰表示。
在通常情況下,大模型都需要大量的數(shù)據(jù)進行有效訓(xùn)練,因此具備行業(yè)化的數(shù)據(jù)平臺能力變得至關(guān)重要。近日國家互聯(lián)網(wǎng)信息辦公室發(fā)布了《生成式人工智能服務(wù)管理辦法(征求意見稿)》,其中特別強調(diào)了訓(xùn)練和預(yù)訓(xùn)練數(shù)據(jù)來源的合法合規(guī),以及數(shù)據(jù)的真實性、準(zhǔn)確性、客觀性、多樣性。大模型的價值應(yīng)用場景,更是大模型發(fā)展和商業(yè)化的重要因素;所謂場景就是指我們訓(xùn)練的模型的用途,是否能在合法合規(guī)的前提下,為業(yè)務(wù)創(chuàng)造核心價值。
李柯辰認(rèn)為,場景是運用大模型的環(huán)境,大數(shù)據(jù)和AI技術(shù)基礎(chǔ)是能力;擁有行業(yè)場景和行業(yè)數(shù)據(jù)的企業(yè)在獲得大模型能力時會更快、更有效、更敏捷。
WakeData的兩條核心產(chǎn)品線,正是對這兩大要素的累積;惟數(shù)云作為新一代數(shù)據(jù)平臺,具有強大的大數(shù)據(jù)End-to-End的數(shù)據(jù)處理能力,惟客云作為新一代數(shù)字化客戶經(jīng)營平臺,其中包含了CDP、MA、SCRM、Loyalty等套件,擁有海量的業(yè)務(wù)應(yīng)用場景,并且通過垂直行業(yè)深耕戰(zhàn)略,擁有更強的行業(yè)Know-How,擁有更多有價值的訓(xùn)練樣本數(shù)據(jù)。在2022年惟數(shù)云就發(fā)布5.0版本,其數(shù)據(jù)集成、數(shù)據(jù)計算、數(shù)據(jù)分析和治理、數(shù)據(jù)可視化、數(shù)據(jù)資產(chǎn)化的能力均具有行業(yè)領(lǐng)先的優(yōu)勢。而這些數(shù)據(jù)側(cè)的優(yōu)勢,也成為大模型時代行業(yè)化人工智能應(yīng)用的競爭壁壘。
“在WakeData內(nèi)部已經(jīng)初步形成推進生產(chǎn)力解放的工作氛圍,WakeMind能力在產(chǎn)品設(shè)計、開發(fā)測試、營銷運營等領(lǐng)域,都已經(jīng)展開使用,初步運用已實現(xiàn)人效達到20%的提升。在加快產(chǎn)品研發(fā)的同時,也提升了客戶項目交付的效率,還為客戶的數(shù)字化項目落地節(jié)省了時間成本。。”WakeDataCTO錢勇說到。
昆侖平臺由基礎(chǔ)云、開發(fā)云、集成云三部分組成,是WakeData產(chǎn)品研發(fā)和實施交付過程中非常重要的云原生技術(shù)底座。昆侖平臺開發(fā)云通過WakeMind賦能,工程師已經(jīng)在探索“基于產(chǎn)品文檔,輔助生成對應(yīng)的架構(gòu)設(shè)計、數(shù)據(jù)模型設(shè)計,再輔助生成代碼、檢測代碼的正確性”等方面的應(yīng)用。例如在推進領(lǐng)域驅(qū)動設(shè)計的過程中,WakeMind可以輔助學(xué)習(xí)DDD、輔助工程師進行領(lǐng)域建模;在數(shù)據(jù)建模的過程中,可以通過自然語言交互進行數(shù)據(jù)模型的創(chuàng)建、修改、自動補充完善,快速生產(chǎn)SQL語句;在產(chǎn)品研發(fā)過程中,通過輸入產(chǎn)品文檔,提取和生成產(chǎn)品術(shù)語表,并進行詳細(xì)的解釋說明等。
對普通的工程師來說,在生成規(guī)則類代碼、自動生成單元測試、代碼審查和優(yōu)化等領(lǐng)域,已經(jīng)可以大幅提高開發(fā)效率了。
WakeMind提供全員可用的文案生成助手。
市場部門通過AI的 Text to Video快速構(gòu)建的營銷增長矩陣。
AIGC賦能行業(yè)和垂直領(lǐng)域是必然趨勢,也是WakeData自創(chuàng)業(yè)以來的核心發(fā)展路徑。對于類ChatGPT的技術(shù)和服務(wù),WakeData一直保持開放和擁抱的態(tài)度,并且積極投身其中,在聚焦行業(yè)化經(jīng)營的戰(zhàn)略基礎(chǔ)上,緊緊把握其價值化和商業(yè)化的路徑。惟客數(shù)據(jù)的 WakeMind 行業(yè)大模型,將在 AIGC 時代幫助更多企業(yè)自我革命、提升效能,持續(xù)解放生產(chǎn)力。