【ITBEAR】智譜公司今日揭曉了其最新研發(fā)成果——GLM-4-Voice,一款端到端情感語(yǔ)音模型。該模型不僅具備情感理解與表達(dá)能力,還能實(shí)現(xiàn)情感共鳴,為用戶帶來(lái)更為真實(shí)的交互體驗(yàn)。用戶現(xiàn)在即可通過(guò)“智譜清言”App,親身體驗(yàn)這一創(chuàng)新技術(shù)。
GLM-4-Voice的亮點(diǎn)在于其豐富的情感表達(dá)和細(xì)膩的變化,能夠準(zhǔn)確傳達(dá)高興、悲傷、生氣、害怕等多種情緒。同時(shí),它還支持語(yǔ)速調(diào)節(jié),用戶可根據(jù)需要隨時(shí)要求加快或放慢語(yǔ)速。該模型還具備隨時(shí)打斷和靈活輸入指令的功能,使得對(duì)話互動(dòng)更加自然流暢。
在語(yǔ)言支持方面,GLM-4-Voice表現(xiàn)出色,不僅支持中英文語(yǔ)音,還能識(shí)別中國(guó)各地方言,如粵語(yǔ)、重慶話、北京話等。該模型還即將上線視頻通話功能,實(shí)現(xiàn)邊看邊說(shuō)的全新交互體驗(yàn)。
智譜的另一大亮點(diǎn)AutoGLM也備受矚目,它具備phone use能力,能夠模擬人類操作手機(jī),無(wú)需用戶手動(dòng)搭建復(fù)雜工作流,操作邏輯與人類相似。
GLM-4-Voice已同期對(duì)外開源,成為智譜首個(gè)開源的端到端多模態(tài)模型。感興趣的用戶可訪問(wèn)以下代碼倉(cāng)庫(kù)了解更多詳情:
https://github.com/THUDM/GLM-4-Voice
GLM-4-Voice的開源將有助于推動(dòng)相關(guān)領(lǐng)域的進(jìn)一步研究與發(fā)展,為行業(yè)注入新的活力。






