來源:品玩
Meta 今天推出大模型產品 Voicebox,這是一款語音生成產品。
據 Meta 表示,Voicebox 可以合成英語、法語、德語、西班牙語等六種不同語言的語音,除了可以根據文本生成語音內容外,還可以進行去噪、內容修改,風格轉換等任務。該模型基于 Flow Matching 技術,可以對擴散模型進行改進。

據研究團隊表示,Voicebox 的內容正確率和音頻相似率均優于現有產品,且有著更快的速度。
網友整理
注冊時間:
網站:5 個 小程序:0 個 文章:12 篇
網站
小程序
文章
會員