2023年6月8日,“實時音視頻產(chǎn)業(yè)創(chuàng)新發(fā)展論壇”在北京成功召開,本次論壇重磅發(fā)布了中國信通院首輪實時音視頻產(chǎn)品能力評測結(jié)果,并聚焦實時音視頻產(chǎn)業(yè)深化發(fā)展、核心技術(shù)突破方向、行業(yè)應(yīng)用場景等熱點話題,邀請企業(yè)專家代表共同探討未來實時音視頻行業(yè)發(fā)展的新范式。
聲網(wǎng)視頻 SDK 成為首批通過信通院權(quán)威評測的RTC產(chǎn)品,在核心能力、工程化擴展能力、智能化能力、安全保障能力等多個方面滿足評測要求,各項指標(biāo)均表現(xiàn)優(yōu)異,業(yè)內(nèi)領(lǐng)先。此外,聲網(wǎng)還獲頒了《實時音視頻服務(wù)基礎(chǔ)能力要求及評估方法》、《金融實時音視頻服務(wù)能力要求及評估方法》、《智能雙錄系統(tǒng)基礎(chǔ)能力要求》核心參編單位證書。
新一代聲網(wǎng)SDK,可實現(xiàn)更好的實時互動效果,可支持 4K 60fps 極致高清畫質(zhì)、48kHz超高音質(zhì)和3D 空間音頻,提供沉浸式互動體驗;支持超過30個平臺開發(fā)框架和30000多款終端機型;支持百萬人大頻道,千萬級并發(fā)能力,在網(wǎng)絡(luò)架構(gòu)設(shè)計上能夠應(yīng)對10倍以上的負(fù)荷,在80%丟包下實現(xiàn)流暢音視頻通話;并具有以下特點和能力:
· 方便集成:只需執(zhí)行簡單統(tǒng)一的 API 即可實現(xiàn)模塊化功能的集成,將實時互動模塊集成效率提高約 95%。
· 可擴展性設(shè)計:模塊化和可擴展的 SDK 設(shè)計風(fēng)格賦予了聲網(wǎng) SDK 良好的可擴展性,更有利于開發(fā)者基于聲網(wǎng)云市場插件生態(tài)快速搭建好用的實時互動應(yīng)用。
· 多路媒體流:支持同時發(fā)布多路音頻或視頻流到一個或多個頻道,且支持多種音頻或視頻采集來源,例如:多路攝像頭,多路屏幕,多路麥克風(fēng),多路自采集。
· 內(nèi)置媒體播放器,減小 SDK 包體積,簡化 API 的調(diào)用步驟、減少集成時間,支持將媒體播放器的音視頻流推送到任意頻道,統(tǒng)一管理音視頻,使 APP 具有更高的穩(wěn)定性。
· 打造生態(tài)系統(tǒng):可容納眾多開發(fā)者的實時音視頻 APP 社區(qū),提供多種擴展組合。添加并開啟云市場插件后,開發(fā)者可以實現(xiàn)更為豐富的實時音視頻互動功能。
· 聲網(wǎng)的實時互動技術(shù)服務(wù)覆蓋全球 200 多個國家和地區(qū),同時聲網(wǎng)遵循國際認(rèn)可的信息安全和隱私保護(hù)標(biāo)準(zhǔn)以及行業(yè)要求,致力于采用國際最佳實踐來建設(shè)隱私和安全管理體系,目前已通過 ISO 27001、ISO 27017、ISO 27018 、 ISO 27701標(biāo)準(zhǔn)認(rèn)證,完成 SOC2 “信任服務(wù)”鑒證。
目前聲網(wǎng)SDK 已廣泛應(yīng)用在企業(yè)協(xié)作、金融、保險、醫(yī)療、社交直播、游戲電競等20余行業(yè)賽道的200多種場景。特別是針對泛娛樂領(lǐng)域大火的實時合唱場景,聲網(wǎng)推出了行業(yè)首個完整的實時合唱解決方案,不僅有效解決合唱超低延時、伴奏同步對齊、合唱人數(shù)靈活性、高音質(zhì)保障等一系列問題,聲網(wǎng)還提供 50ms 超低延時耳返、歌詞同步、歌唱美聲、音浪頻譜等一系列功能。在數(shù)字化領(lǐng)域較常遇到的遠(yuǎn)程操控場景,聲網(wǎng)實時音視頻回傳延時低至100ms,滿足無人礦卡、無人集卡、無人車、無人機、機器人等多種應(yīng)用場景,提供高實時、高可靠、高質(zhì)量的遠(yuǎn)程操作與體驗保障。
在主題分享環(huán)節(jié),聲網(wǎng)RTC平臺產(chǎn)品負(fù)責(zé)人和利鵬以《聲網(wǎng) RTC Next Gen SDK 為下一代場景而生》為主題,面向?qū)崟r互動行業(yè)日益復(fù)雜的場景需求和多樣化的開發(fā)群體,分享了聲網(wǎng)在探索優(yōu)化實時互動架構(gòu)新范式、打造新一代實時互動引擎的實踐經(jīng)驗。
和利鵬介紹,之前的 RTC 場景只是簡單的將音視頻“線上化”,現(xiàn)在則需要更多的還原線下場景,如元宇宙K歌、元宇宙辦公、辦展等等,行業(yè)對這些新場景的需求不斷涌現(xiàn)。
除了新出現(xiàn)的場景,已有場景的需求也在升級,如用戶日常生活中經(jīng)常用到的在線視頻溝通,因為居家等私密環(huán)境,都基本用上了虛擬背景。進(jìn)一步就會有對虛擬背景聲的需求,比如在嘈雜的辦公室中將雜音、噪音換成一個舒緩的音樂,構(gòu)造一個舒適的溝通氣氛等等;以及在元宇宙場景中,最重要的一個技術(shù)就是空間音效,通過空間音效進(jìn)行方位、遠(yuǎn)近識別。此外,在數(shù)字化轉(zhuǎn)型的大趨勢下,如金融、醫(yī)療、保險等行業(yè)都在數(shù)字化、線上化,這些行業(yè)對視頻如4K60、8K30的這種超高清畫質(zhì)就會有一定的訴求。
行業(yè)之前是基于 RTC 為主的通訊,主要就是人的溝通,現(xiàn)在演進(jìn)到實時互動,主要是人、物、空間的還原,除了音視頻外還包含信令、白板、IM等能力,能夠提供道具、物品等同步,以及非語義的信息交換,具備場景的規(guī)模多元化。所以,RTC 關(guān)注的是人,但實時互動更關(guān)注整體,如周圍所在的環(huán)境,以及環(huán)境中的道具,構(gòu)造出一種在場陪伴的沉浸感。
從行業(yè)上來看,目前大家認(rèn)知 RTC SDK 相對來說都是封閉的,擴展能力受限,無法快速滿足新場景、新需求。現(xiàn)在情況變化了,聲網(wǎng)想要做的是,“不封閉,易擴展”,即對內(nèi)架構(gòu)開放、對外行業(yè)生態(tài)共建。架構(gòu)開放,就是模塊解耦即模塊接口通用標(biāo)準(zhǔn)化,有了這種標(biāo)準(zhǔn)接口,更多的合作伙伴就可以自足去開發(fā)自己擅長的能力組件,豐富組件模塊,從而讓最終的開發(fā)者可以快速的去搭建復(fù)雜場景,促使更多的合作伙伴加入去開發(fā)更豐富的功能,最終讓行業(yè)生態(tài)更好的發(fā)展。