10 月 20 日消息,世界上大約 7000 種已知的語言中,有 40% 沒有標準的書寫系統。這些沒有文字的語言給現代機器學習翻譯系統帶來了一個獨特的問題,因為翻譯通常需要先將口頭語言轉換為書面文字,翻譯后再將文字還原為語音。不過 Meta 公司 10 月 19 日宣布,已經通過其最新的開源語言人工智能(AI)解決了這個問題。
Meta 公司公布了“第一個由人工智能驅動的無文字語言的語音翻譯系統”,該系統成功地翻譯了閩南語,這是一種主要在臺灣地區使用的口頭語言。
該系統是 Meta 公司人工智能項目的一部分,被稱為“通用語音翻譯器(UST)”。Meta 公司在一份聲明中說:“該翻譯系統是 Meta 人工智能的通用語音翻譯器項目的第一個里程碑,該項目專注于開發人工智能系統,提供所有語言的實時語音到語音翻譯,甚至無文字語言。”該項目正致力于開發更多實時語音到語音的翻譯,以便元宇宙居民更方便地互動。
Meta 說,以前大多數人工智能驅動的語言翻譯工作都集中在書面語言上,但其目標之一是翻譯更多缺乏正式書寫系統的語言。據 Meta 公司稱,目前有 7000 多種語言,但“超過 40% 的語言主要是口語,沒有標準的或廣為人知的書寫系統。”
Meta CEO 馬克-扎克伯格在發布在 Facebook 上的視頻中演示了該用該系統翻譯閩南語,并表示 Meta 公司將對該工具進行開源,以便人們可以使用新的人工智能系統來翻譯更多的語言。
來源:IT之家






