隨著春節(jié)的喜慶氛圍彌漫全球,一款名為DeepSeek的國(guó)產(chǎn)AI應(yīng)用迅速走紅,不僅彰顯了國(guó)產(chǎn)AI技術(shù)的崛起,也展示了生成式AI所帶來(lái)的前所未有的創(chuàng)新潛力。而在這場(chǎng)AI盛宴中,聲網(wǎng)適時(shí)推出了其Conversational AI Engine(聲網(wǎng)對(duì)話式AI引擎),為DeepSeek等大模型提供了無(wú)縫接入的能力,助力開(kāi)發(fā)者輕松構(gòu)建出超低延時(shí)的對(duì)話式AI應(yīng)用場(chǎng)景。
聲網(wǎng)的這一對(duì)話式AI引擎,是基于全球廣泛認(rèn)可的TEN framework開(kāi)源框架構(gòu)建的,它不僅實(shí)現(xiàn)了行業(yè)領(lǐng)先的650毫秒超低響應(yīng)延遲,還具備對(duì)話人聲鎖定、全模型適配等關(guān)鍵優(yōu)勢(shì),為用戶帶來(lái)更加流暢自然的對(duì)話體驗(yàn)。
聲網(wǎng)Conversational AI Engine的一大亮點(diǎn)是其全模型敏捷適配能力。通過(guò)獨(dú)創(chuàng)的全棧模型兼容體系,該引擎能夠無(wú)縫接入第三方云端大模型服務(wù)、企業(yè)私有化模型以及本地化部署的開(kāi)源模型,實(shí)現(xiàn)跨架構(gòu)模型的快速適配。這一技術(shù)不僅適用于新模型,對(duì)于老模型也同樣友好,通過(guò)標(biāo)準(zhǔn)化API,老模型也能實(shí)現(xiàn)一鍵式快速接入,大大縮短了接入周期,保障了企業(yè)AI模型資產(chǎn)的無(wú)損遷移和持續(xù)價(jià)值轉(zhuǎn)化。
在真實(shí)的對(duì)話場(chǎng)景中,打斷對(duì)方并提出新疑問(wèn)是常有的事,而對(duì)于對(duì)話式AI來(lái)說(shuō),能否支持隨時(shí)打斷也成為了衡量其智能化的一個(gè)重要標(biāo)準(zhǔn)。聲網(wǎng)自主研發(fā)的AI VAD技術(shù),能夠很好地適應(yīng)人類(lèi)對(duì)話的停頓、語(yǔ)氣和節(jié)奏,使得AI在對(duì)話過(guò)程中能夠隨時(shí)優(yōu)雅地打斷對(duì)方,更加貼近人心。
聲網(wǎng)還針對(duì)大模型語(yǔ)音交互中存在的誤打斷問(wèn)題進(jìn)行了優(yōu)化。在嘈雜的環(huán)境中,如商場(chǎng)、地鐵站、咖啡店等,背景人聲和環(huán)境噪音很容易干擾到人與AI的交互,導(dǎo)致AI誤觸發(fā)打斷機(jī)制,停止交互。為了解決這一問(wèn)題,聲網(wǎng)技術(shù)團(tuán)隊(duì)結(jié)合多年積累的AI降噪等音頻對(duì)話處理能力,智能屏蔽交互中的各類(lèi)背景人聲與噪聲干擾,即使在嘈雜環(huán)境中,也能保證對(duì)話的精準(zhǔn)和流暢。據(jù)測(cè)試,在噪雜環(huán)境下,聲網(wǎng)的方案誤打斷率較ChatGPT降低了50%。

除了誤打斷問(wèn)題,多模態(tài)大模型在不穩(wěn)定網(wǎng)絡(luò)環(huán)境下的交互穩(wěn)定性和流暢性也是很多AI企業(yè)需要優(yōu)化的方向。聲網(wǎng)憑借其在音視頻領(lǐng)域的深厚技術(shù)優(yōu)勢(shì)和場(chǎng)景實(shí)踐,通過(guò)實(shí)時(shí)網(wǎng)絡(luò)覆蓋、網(wǎng)絡(luò)超強(qiáng)適應(yīng)、海量終端適配等能力,打造出了全球一致的端云覆蓋體驗(yàn)。即使在網(wǎng)絡(luò)不穩(wěn)定的室外環(huán)境,聲網(wǎng)的智能路由+抗弱網(wǎng)算法也能實(shí)現(xiàn)跨區(qū)域絲滑互動(dòng),即使在面臨80%丟包的情況下,人與AI也能穩(wěn)定交流。

目前,聲網(wǎng)的Conversational AI Engine已經(jīng)開(kāi)放了Private Beta版本的邀請(qǐng)測(cè)試。如果您對(duì)這款對(duì)話式AI引擎感興趣,想要體驗(yàn)Demo或獲取產(chǎn)品測(cè)試接入的服務(wù)支持,可以關(guān)注聲網(wǎng)的官方渠道,了解更多詳情。






