昆侖萬維集團在近期的一次技術盛宴中,正式揭曉了其AI音樂創作領域的最新力作——Mureka V7.5模型。這一發布不僅為SkyWork AI技術周畫上了圓滿的句號,更在音樂創作界掀起了波瀾。
作為技術周的壓軸產品,Mureka V7.5模型在中文歌曲創作上展現出了非凡的實力。它在音色、演奏技巧以及歌詞表達和情感傳遞上均實現了質的飛躍。得益于對中文音樂風格的深刻洞察,該模型能夠完美捕捉從古典民歌到現代流行金曲的各種音樂韻味,充分展現了中文音樂的多元魅力。
為了讓人聲表現更加真實且充滿情感,Mureka V7.5在自動語音識別技術上進行了深度優化。它能夠細致入微地捕捉演唱中的每一個細節,包括唱詞的清晰度、氣息的運用以及情感的波動。通過智能分析,模型能夠自然地劃分樂句,確定換氣與停頓的位置,從而大大提升了生成音樂的流暢度和真實感。這種對細節的精準把控,使得AI生成的歌曲在演繹中文歌曲特有的韻律和氣息時,更加貼近真人的表現。
與此同時,昆侖萬維語音團隊還帶來了另一項創新成果——MoE-TTS,這是一個基于Mixture of Experts的角色描述語音合成框架。MoE-TTS打破了傳統語音合成的局限,允許用戶通過自然語言描述來精確控制聲音的特征和風格。即使僅依賴開源數據,該技術也能在角色貼合度上媲美甚至超越市面上的閉源商業產品。這一突破性的成果,為描述性語音合成領域帶來了新的解決方案。
MoE-TTS結合了預訓練大語言模型的文本理解能力和語音專家模塊的合成能力,通過模態路由實現了各模態的獨立優化,確保了知識的無損失傳遞。在復雜描述的場景下,MoE-TTS展現出了卓越的風格表現力貼合度和整體貼合度,為用戶提供了前所未有的語音合成體驗。這一技術的推出,預示著語音合成領域將從“封閉標簽式控制”向“自然語言自由控制”的新階段邁進。
目前,MoE-TTS仍在持續優化中,昆侖萬維計劃將其集成至Mureka-Speech平臺,作為全球開發者和創作者的強大工具。屆時,用戶將能夠輕松享受到開放、高效且可定制的描述性語音合成服務。
昆侖萬維集團通過Mureka V7.5和MoE-TTS的發布,再次證明了其在AI音樂創作和語音合成領域的領先地位。這些創新技術不僅為音樂創作和語音合成帶來了全新的可能性,更為相關領域的研究和發展注入了新的活力。全球用戶現在即可訪問www.mureka.ai,親身體驗Mureka V7.5模型的強大功能,探索音樂創作的無限創意。






