騰訊在9月7日召開的數(shù)字生態(tài)大會(huì)上,正式發(fā)布了“混元大模型”。
在大模型競賽風(fēng)起云涌的上半場,騰訊的動(dòng)作并不算快。最早發(fā)布大模型的巨頭是百度。今年3月16日,百度宣布正式推出文心一言,并開放測試邀請(qǐng)。8月31日,百度大模型文心一言面向全社會(huì)開放,個(gè)人可在應(yīng)用商店搜索“文心一言”下載應(yīng)用。
阿里巴巴則在今年4月緊隨百度發(fā)布大模型“通義千問”,阿里云隨即升級(jí)其音頻轉(zhuǎn)寫平臺(tái)“聽悟”,并配備AI驅(qū)動(dòng)的會(huì)議分析能力。7月,阿里云推出生成式AI文生圖模型“通義萬相”。8月,阿里云開源了通義千問70億參數(shù)通用模型和對(duì)話模型,目前這兩款模型均開源、免費(fèi)、可商用。
相比之下,騰訊在去年4月才首次對(duì)外披露了混元AI大模型的研發(fā)進(jìn)展。今年2月初,業(yè)界有傳言稱騰訊在研發(fā)類ChatGPT對(duì)話式產(chǎn)品,成立了混元助手項(xiàng)目組,對(duì)此騰訊回應(yīng)道:“在相關(guān)方向上已有布局”,此后便鮮有相關(guān)消息。
在今年5月的財(cái)報(bào)會(huì)議上,騰訊曾被股東質(zhì)疑公司動(dòng)作相對(duì)百度、阿里較為“遲緩”,當(dāng)時(shí)騰訊CEO馬化騰回復(fù)稱,“互聯(lián)網(wǎng)企業(yè)都有很多積累,我們也一樣在埋頭研發(fā),但并不急于早早做完,把半成品拿出來展示。”
如今亮相的“混元大模型”已然是騰訊的“成品”,那么它究竟如何呢?
對(duì)標(biāo)ChatGPT一直是國內(nèi)大模型的主要基調(diào),“在口語化文本精確理解、超長記錄高效提煉、理解生成實(shí)時(shí)處理上,騰訊混元大模型中文能力已經(jīng)超越GPT3.5。”騰訊副總裁蔣杰稱,“你可以把混元看作是一個(gè)在內(nèi)部開源的模型,公司的每個(gè)業(yè)務(wù)都可以看到我們發(fā)布的所有能力,并基于這個(gè)能力去與應(yīng)用相結(jié)合。”
混元大模型的核心賣點(diǎn)在于,它是由騰訊全鏈路自研的通用大語言模型,可以流暢進(jìn)行專業(yè)領(lǐng)域的多輪對(duì)話,具備強(qiáng)大的中文創(chuàng)作能力,復(fù)雜語境下的邏輯推理能力,以及可靠的任務(wù)執(zhí)行能力,對(duì)行業(yè)更重要的是,混元將作為騰訊云MaaS服務(wù)的底座,客戶可直接調(diào)用或作為基底模型構(gòu)建專屬應(yīng)用。
在數(shù)字生態(tài)大會(huì)上,蔣杰展示了混元大模型“更成熟、更可靠”的能力。
此前,大模型產(chǎn)品經(jīng)常出現(xiàn)答非所問、胡編亂造的“幻覺”問題,蔣杰通過關(guān)羽和秦瓊的問答案例,意在說明預(yù)訓(xùn)練階段通過“探真”算法進(jìn)行事實(shí)修正,經(jīng)過預(yù)訓(xùn)練算法及策略的整體優(yōu)化后,相比其他主流開源大模型,混元大模型降低了30%-50%的幻覺率。在面對(duì)各種誘導(dǎo)提問時(shí),騰訊通過強(qiáng)化學(xué)習(xí)的方法,讓混元大模型學(xué)會(huì)識(shí)別陷阱問題,對(duì)安全誘導(dǎo)類問題的拒答率提升了20%。
減少AI幻覺和提高防騙能力,都是提高C端用戶體驗(yàn)感很重要的兩項(xiàng)能力。騰訊宣稱騰訊云、騰訊廣告、騰訊游戲、騰訊金融科技、騰訊會(huì)議、騰訊文檔、微信搜一搜、QQ瀏覽器等超過50個(gè)騰訊業(yè)務(wù)和產(chǎn)品,已經(jīng)接入騰訊混元大模型測試,并取得初步效果。
從公布的產(chǎn)品矩陣可以看出,混元大模型和其他友商一樣,既有面向ToB領(lǐng)域的云、協(xié)同辦公、文檔編輯等業(yè)務(wù),也有騰訊廣告、騰訊游戲、QQ瀏覽器等面向大量C端用戶的產(chǎn)品。
在ToB領(lǐng)域,采購了混元大模型服務(wù)的企業(yè)客戶可以基于API直接調(diào)用大模型相關(guān)能力,或基于混元定制專屬的行業(yè)大模型。收費(fèi)方面,混元大模型將為每個(gè)在白名單中的已實(shí)名騰訊云企業(yè)賬號(hào)提供累計(jì)10萬token的免費(fèi)調(diào)用額度,免費(fèi)額度用完后,騰訊混元API刊例價(jià)是千tokens 0.14元(1token約等于1個(gè)中文漢字或3個(gè)英文字符),百度為0.012元千tokens,其它大模型為0.018元千tokens。
構(gòu)建大模型的意義在于行業(yè)應(yīng)用。李彥宏在最近的2023百度云智大會(huì)上曾強(qiáng)調(diào),“基于基礎(chǔ)大模型開發(fā)出來的應(yīng)用才是模型存在的意義。”
騰訊下一步將如何在旗下業(yè)務(wù)或產(chǎn)品中實(shí)現(xiàn)大模型落地應(yīng)用,以此促進(jìn)各項(xiàng)業(yè)務(wù)的增長,將備受關(guān)注。尤其是微信和QQ兩大國民級(jí)應(yīng)用,怎么將大模型應(yīng)用和龐大的C端用戶體驗(yàn)結(jié)合,將是騰訊最為關(guān)鍵的部分。
雖然如今混元大模型已發(fā)布,但其能力依然沒有完全展露,騰訊企點(diǎn)分析AI助手在9月只面向大客戶開放內(nèi)測申請(qǐng),微信上的混元大模型小程序還需申請(qǐng)才能內(nèi)測,騰訊旗下諸多游戲產(chǎn)品如何結(jié)合大模型進(jìn)行升級(jí),也并未在發(fā)布會(huì)上詳細(xì)展現(xiàn)。而就微信和QQ是否以及何時(shí)會(huì)接入混元大模型,目前也尚不確定