近日,出門問問(股票代碼:02438.HK)宣布其語音大模型“序列猴子”成功獲得上海市生成式人工智能服務備案認證,這一成就標志著該公司在多模態大模型領域的又一重要里程碑。
“序列猴子”語音大模型以出門問問自主研發的“序列猴子”大模型為基礎,結合了第六代TTS引擎MeetVoice Pro和語音合成標記語言(SSML)技術,旨在提供多樣化的文本與語音應用功能。該模型不僅具備將文字迅速轉換為自然流暢的語音的能力,還包含了聲音克隆、發音校正以及智能文案創作等創新功能。

其中,聲音克隆功能通過深度學習訓練語音樣本,生成極具自然感和表現力的合成聲音;發音校正功能則確保了語音合成的準確性,特別是對于發音不準或多音字的處理;智能文案創作功能則能夠為用戶提供多樣化的文案改寫建議,極大地提升了文案創作的效率。
出門問問旗下的“魔音工坊”(海外版為DupDub)是“序列猴子”語音大模型的重要應用之一。作為一款集文案、配音、剪輯于一體的AI軟件,“魔音工坊”在國內外擁有超過800萬注冊用戶,付費用戶超過60萬。該軟件不僅具備軟件配音、文字轉語音、真人配音等傳統功能,還引入了聲音商店、效率工具、聲音克隆及視頻編輯等創新功能,并擁有聲音克隆、聲音搜索、情感合成/角色遷移以及聲音合成等先進技術。
“魔音工坊”依托“序列猴子”大模型,僅需3-10秒的短音頻即可實現聲音克隆,并支持跨語言遷移和情感語氣生成。其海外版DupDub還支持多語言生成,包括英語、法語、日語、西班牙語、葡萄牙語、泰語等多種語言。

出門問問自成立以來,一直專注于生成式AI和語音交互技術的研發,為全球多個國家和地區提供AI智能硬件、AI政企服務以及面向創作者的AIGC產品。該公司以“讓AGI觸手可及,讓AI成為每個人的副駕駛”為愿景,致力于打造國際領先的通用大模型,并通過AI技術、產品及商業化的三位一體發展,成為全球AI CoPilot的引領者。
在內容創作者領域,出門問問通過AIGC技術賦能內容創作,構建了豐富的AIGC CoPilot產品矩陣。除了“魔音工坊”及其海外版“DupDub”外,還包括AI數字分身“奇妙元”及海外版“LivGen”、企業AI交互式數字員工生成平臺“奇妙問”以及可一鍵成片的AI短視頻生成平臺“元創島”等。這些產品共同打造了一站式內容創作平臺,幫助創作者實現高效的內容生成。

在應用和大模型的垂直整合下,出門問問形成了獨特的AIGC商業模式。相較于傳統的ToB和ToC模式,AIGC公司可以形成服務SMB(中小企業)或Professional Consumer(專業消費者)的新商業模式。這種商業模式既避免了傳統ToB的項目制模式,也避免了與ToC互聯網巨頭的流量競爭。
在“產模結合”戰略和ToSMB/ToPC商業模式的指引下,出門問問的AIGC產品已經累計服務了超過1500萬用戶,注冊用戶數量超過1000萬,其中付費用戶數量達到約86.5萬。公司成功地從傳統的AI項目制模式轉型為可持續增長的AIGC業務模式。






