稀宇科技(MiniMax)近期在語音合成技術領域取得了顯著成就,其Speech-02模型在Artificial Analysis排行榜上穩居榜首,彰顯了公司的全球領先地位。更令人興奮的是,該公司正式推出了Voice Design音色設計功能,這一創新技術允許用戶通過自然語言描述來定制個性化音色,實現了語言、口音與音色的全方位自定義。
Voice Design功能的核心優勢在于其高度的靈活性和精確性。據稀宇科技介紹,該功能能夠細致調控音色的多個關鍵要素,涵蓋音頻質量、發聲特性、情感表達以及特定的人物形象。用戶只需簡單輸入一段描述性文本,系統即可智能解析并生成與之匹配的音色編碼。例如,用戶可以要求一個充滿正能量的AI助手聲音,或是尋求一個嚴厲而語速快捷的女聲,Voice Design都能迅速滿足這些個性化需求。
為了直觀展示Voice Design的強大功能,稀宇科技提供了多個音色示例,包括古代俠客的正直洪亮聲、懸疑故事播音員的低沉磁性聲、權威新聞女主播的清晰利落聲,以及推銷員特有的活力語速聲。這些多樣化的音色不僅證明了Voice Design在音色定制方面的卓越能力,也體現了其在滿足不同應用場景需求上的靈活性。
稀宇科技強調,Voice Design的推出有效解決了語音合成領域面臨的兩大難題。一方面,傳統音色庫往往難以覆蓋細分市場的多樣化需求;另一方面,復刻真實人物音色不僅存在版權風險,而且操作過程復雜繁瑣。而Voice Design則為用戶提供了一種無需高質量輸入素材即可快速生成理想音色的解決方案,并且這些音色可以保存下來,用于后續的音頻創作。
稀宇科技的兩代Speech模型已經累計生成了超過1.5億小時的語音內容,并與全球超過30個國家的客戶建立了合作關系。此次Voice Design功能的上線,標志著稀宇科技在語音技術領域的又一次重大突破,也彰顯了其致力于為全球用戶提供更加便捷、高效語音解決方案的堅定承諾。
現在,用戶可以通過稀宇科技的國內版平臺(minimaxi.com/audio)或海外版平臺(minimax.io/audio)親身體驗Voice Design功能,探索語音合成的無限創意與可能。






