【ITBEAR科技資訊】7月20日消息,ElevenLabs于昨日(7月19日)通過(guò)博文向世界宣布,他們已成功推出全新的Turbo v2.5文本到語(yǔ)音AI模型。這款新模型支持包括普通話(huà)在內(nèi)的32種語(yǔ)言,覆蓋了全球近80%的地區(qū),為用戶(hù)提供高品質(zhì)、低延遲的AI對(duì)話(huà)體驗(yàn)。
Turbo v2.5模型的一個(gè)顯著特點(diǎn)是新增了對(duì)越南語(yǔ)、匈牙利語(yǔ)和挪威語(yǔ)的支持。這三種語(yǔ)言分別被8500萬(wàn)、1300萬(wàn)和530萬(wàn)人使用,此舉無(wú)疑將ElevenLabs的AI服務(wù)擴(kuò)展到了更廣泛的用戶(hù)群體。
據(jù)ITBEAR科技資訊了解,此次更新不僅增加了新的語(yǔ)言支持,還顯著提高了印地語(yǔ)、法語(yǔ)、西班牙語(yǔ)、普通話(huà)等27種語(yǔ)言的響應(yīng)速度,其中最高提升了3倍,英語(yǔ)的響應(yīng)速度也提高了25%。這一改進(jìn)得益于Turbo v2.5模型融合了尖端的文本到語(yǔ)音技術(shù)和最新的低延遲模型架構(gòu),使得用戶(hù)能夠在幾乎無(wú)需等待的情況下獲得高質(zhì)量的AI生成音頻。
Turbo模型的快速語(yǔ)音合成功能,在保持音質(zhì)流暢自然的同時(shí),響應(yīng)時(shí)間控制在400毫秒以?xún)?nèi),為用戶(hù)提供了極佳的交互體驗(yàn)。
ElevenLabs,這家總部位于倫敦的公司,自2022年成立以來(lái),一直致力于開(kāi)發(fā)先進(jìn)的人工智能語(yǔ)音模型和工具。他們的服務(wù)能夠創(chuàng)建不同語(yǔ)言、口音和情感的合成語(yǔ)音,極大地豐富了AI語(yǔ)音的應(yīng)用場(chǎng)景。
公司CEO Mati Staniszewski透露,ElevenLabs目前擁有一支由約40名分布在全球的遠(yuǎn)程辦公員工組成的團(tuán)隊(duì),并計(jì)劃在年底前將團(tuán)隊(duì)規(guī)模擴(kuò)大至100人。
在推進(jìn)AI技術(shù)的同時(shí),ElevenLabs也非常重視人工智能內(nèi)容的透明度。他們開(kāi)發(fā)了如AI Speech Classifier等工具來(lái)輔助識(shí)別合成音頻,同時(shí)還在積極探索電影配音等新的應(yīng)用領(lǐng)域。更令人期待的是,他們正在開(kāi)發(fā)一個(gè)平臺(tái),允許用戶(hù)生成AI語(yǔ)音并通過(guò)授權(quán)獲得收益,這無(wú)疑為AI語(yǔ)音技術(shù)的發(fā)展開(kāi)辟了新的商業(yè)模式。






