亚洲视频二区_亚洲欧洲日本天天堂在线观看_日韩一区二区在线观看_中文字幕不卡一区

公告:魔扣目錄網(wǎng)為廣大站長(zhǎng)提供免費(fèi)收錄網(wǎng)站服務(wù),提交前請(qǐng)做好本站友鏈:【 網(wǎng)站目錄:http://www.430618.com 】, 免友鏈快審服務(wù)(50元/站),

點(diǎn)擊這里在線咨詢客服
新站提交
  • 網(wǎng)站:51998
  • 待審:31
  • 小程序:12
  • 文章:1030137
  • 會(huì)員:747

一、噪聲降低通訊質(zhì)量

噪聲在我們?nèi)粘I钪惺殖R?jiàn),例如,鼠標(biāo)點(diǎn)擊聲、鍵盤(pán)聲、空調(diào)聲、廚房碗碟碰撞聲。所以音頻質(zhì)量往往決定了在音視頻通訊場(chǎng)景中的通話體驗(yàn),而噪聲又是決定了音頻質(zhì)量是否良好的關(guān)鍵因素,如何對(duì)音頻進(jìn)行噪聲處理,是工程師們繞不開(kāi)的問(wèn)題。

以兩個(gè)簡(jiǎn)單的用戶場(chǎng)景為例,了解下日常生活中我們經(jīng)常受到困擾的時(shí)刻:

場(chǎng)景一:Eric 在家中進(jìn)行視頻會(huì)議,受到來(lái)自鄰居的裝修噪音干擾,導(dǎo)致對(duì)方聽(tīng)不清 Eric 的線上會(huì)議報(bào)告;

場(chǎng)景二:Lily 是某平臺(tái)音樂(lè)主播,在一次直播中進(jìn)行了吉他彈唱,該平臺(tái)將吉他伴奏的聲音識(shí)別為噪音并進(jìn)行降噪,導(dǎo)致聽(tīng)眾端收聽(tīng)體驗(yàn)不佳。

以上為我們?cè)谌粘I钪薪?jīng)常會(huì)遇到的噪音場(chǎng)景,那么用戶在面對(duì)這種噪音問(wèn)題時(shí),是否無(wú)解?

二、ZEGO 首發(fā)業(yè)內(nèi)“場(chǎng)景化 AI 降噪”解決方案

ZEGO 即構(gòu)科技在本次 Express SDK 3.0 升級(jí)方案中,針對(duì)以往 AI 降噪能力進(jìn)行了重磅升級(jí),并針對(duì)不同用戶場(chǎng)景在業(yè)內(nèi)首次推出場(chǎng)景化 AI 降噪解決方案。

即構(gòu)場(chǎng)景化 AI 降噪方案可以自動(dòng)識(shí)別不同場(chǎng)景,可進(jìn)行無(wú)感知切換,智能調(diào)整 AI 降噪策略提供給用戶最佳的降噪效果。本次升級(jí),不僅對(duì)之前 AI 降噪的效果進(jìn)行了優(yōu)化,還首次針對(duì)音樂(lè)場(chǎng)景推出智能 AI 降噪,還原高保真音質(zhì)。

1.通訊場(chǎng)景,消除人聲以外的全部噪聲

針對(duì)一般通訊場(chǎng)景,ZEGO 提出輕量級(jí)的神經(jīng)網(wǎng)絡(luò)降噪方法 —— ZegoAIDenoise。ZegoAIDenoise 采用傳統(tǒng)算法和深度學(xué)習(xí)相結(jié)合的 Hybrid 方法,為了降低性能開(kāi)銷(xiāo),采用頻域分成子帶方案,并無(wú)限縮小深度學(xué)習(xí)網(wǎng)絡(luò)模型,用盡量小的網(wǎng)絡(luò)模型達(dá)到更好的降噪效果。

在實(shí)時(shí)處理的性能測(cè)試方面,默認(rèn)采樣率 32kHz,幀長(zhǎng) 10ms,在 1.4G Hz主頻的 iPhone 6上,CPU 性能開(kāi)銷(xiāo)為 1% 左右,與 WebRTC 的通用降噪相當(dāng)。所以,ZegoAIDenoise 無(wú)論在降噪效果、泛化能力,還是性能開(kāi)銷(xiāo)上,都取得了長(zhǎng)足的進(jìn)步。

ZegoAIDenoise 對(duì)于平穩(wěn)和非平穩(wěn)噪聲都有很好的降噪效果,保證了語(yǔ)音的質(zhì)量和語(yǔ)言清晰度,同時(shí)將性能開(kāi)銷(xiāo)控制在一個(gè)很低的量級(jí),與傳統(tǒng)降噪算法相當(dāng),成功覆蓋大部分中低端機(jī)型,保留純凈語(yǔ)音,提升用戶的通話體驗(yàn)。

處理聲音類(lèi)型:主要處理包括鼠標(biāo),鍵盤(pán)聲,敲擊,空調(diào),廚房碗碟、嘈雜餐廳、環(huán)境風(fēng)聲,咳嗽、吹氣等非人聲噪聲以及去除小房間的人聲混響。

通訊場(chǎng)景下的降噪前后對(duì)比

2.音樂(lè)場(chǎng)景,還原高保真音質(zhì)

在音樂(lè)場(chǎng)景中,AI 降噪容易將音樂(lè)識(shí)別成噪聲,并對(duì)其進(jìn)行降噪處理,這樣會(huì)對(duì)音樂(lè)造成極大的損傷,嚴(yán)重影響音樂(lè)場(chǎng)景中的用戶體驗(yàn),因此,即構(gòu)在本次場(chǎng)景化 AI 降噪方案中也包含了針對(duì)音樂(lè)場(chǎng)景的降噪處理。

首先,即構(gòu)為了提高對(duì)于音樂(lè)場(chǎng)景的識(shí)別準(zhǔn)確率,對(duì)數(shù)十種歌曲風(fēng)格(如輕音樂(lè)、古典音樂(lè)以及流行音樂(lè)等)、樂(lè)器(如吉他、鋼琴、小提琴等)采集了上萬(wàn)條音頻數(shù)據(jù),并對(duì)現(xiàn)有數(shù)據(jù)進(jìn)行數(shù)據(jù)增廣以增加模型的泛化性并進(jìn)行特征提取和訓(xùn)練。

同時(shí),為了減少非音樂(lè)的誤判問(wèn)題,即構(gòu)采集了豐富的噪聲和人聲數(shù)據(jù)進(jìn)行對(duì)比訓(xùn)練,同時(shí)區(qū)分不同信噪比下的音樂(lè)加以識(shí)別以保證最優(yōu)音質(zhì),最終完成 99% 的識(shí)別率。并且,在極高識(shí)別率的情況下可達(dá)到音頻處理 0 延時(shí),無(wú)額外性能消耗。

為了全面覆蓋音樂(lè)場(chǎng)景,提升全程體驗(yàn),我們采用多幀平滑后處理技術(shù),使識(shí)別速度達(dá)到 400ms,保證音樂(lè)能夠從伴奏的“第一個(gè)旋律”起,就能被快速識(shí)別。

最終,即構(gòu)場(chǎng)景化 AI 降噪利用自研音樂(lè)檢測(cè)算法對(duì) mic 輸入進(jìn)行音樂(lè)識(shí)別,在聲卡、近場(chǎng)彈唱或其他外放設(shè)備播放音樂(lè)的場(chǎng)景下自動(dòng)調(diào)整降噪等級(jí),保證音樂(lè)的高保真音質(zhì),降低對(duì)音樂(lè)的音質(zhì)損傷。

處理聲音類(lèi)型:支持識(shí)別音樂(lè)元素豐富的場(chǎng)景,如伴奏/樂(lè)器等。

音樂(lè)場(chǎng)景下的降噪前后對(duì)比

觀看上方視頻后我們可以明顯的感受到,一般降噪處理的過(guò)程中會(huì)將音樂(lè)/伴奏誤識(shí)別為噪音,進(jìn)行降噪處理,而在即構(gòu)場(chǎng)景化 AI 降噪處理中,通過(guò)智能識(shí)別并調(diào)整處理策略,真實(shí)還原音樂(lè)現(xiàn)場(chǎng),避免了對(duì)于噪音場(chǎng)景的誤判。

三、場(chǎng)景應(yīng)用

上述提到的兩個(gè)用戶場(chǎng)景,在接入即構(gòu)場(chǎng)景化 AI 降噪解決方案后可取得明顯改善:

場(chǎng)景1:去除線上會(huì)議中除人聲外的噪音后,Eric 和同事們獲得了良好的線上會(huì)議體驗(yàn)

場(chǎng)景2:避免了在彈唱場(chǎng)景中主播的伴奏被識(shí)別為噪音的痛苦,Lily 讓聽(tīng)眾端收獲了和主播端音質(zhì)無(wú)差別的收聽(tīng)體驗(yàn)。

關(guān)于 ZEGO 即構(gòu)科技本次發(fā)布的場(chǎng)景化 AI 降噪解決方案的使用場(chǎng)景可以歸納為:

五、總結(jié)

ZEGO 即構(gòu)科技場(chǎng)景化 AI 降噪,無(wú)論是在穩(wěn)態(tài)還是非穩(wěn)態(tài)的噪聲環(huán)境、一般通訊場(chǎng)景或者音樂(lè)場(chǎng)景,都能取得飛躍般的降噪效果,旨在用高質(zhì)量的音頻降噪有效提升用戶的實(shí)時(shí)互動(dòng)體驗(yàn)。

目前,ZEGO Express 3.0 SDK 已正式提供場(chǎng)景化 AI 降噪功能,開(kāi)發(fā)者可以在使用麥克風(fēng)采集聲音時(shí)對(duì)聲音進(jìn)行降噪處理,獲得高保真音質(zhì),提升用戶通話體驗(yàn)!

“RTI ”代表一切為實(shí)現(xiàn)媲美甚至超越現(xiàn)實(shí)的實(shí)時(shí)互動(dòng)場(chǎng)景下所需要用到的所有產(chǎn)品和技術(shù)組合,除了核心的 RTC、IM、直播之外,還包括 Avatar、Al 視覺(jué)、狀態(tài)同步等等。相較于 RTC 更強(qiáng)調(diào)互動(dòng),不以予以信息的交換為唯一目標(biāo),旨在以數(shù)字化方式,創(chuàng)造用戶所需的共享時(shí)空,滿足其精神需求,并輔以配套的可視化服務(wù)體系保障更好的互動(dòng)。

分享到:
標(biāo)簽:發(fā)聲 音質(zhì) 極致 首發(fā) 降噪 場(chǎng)景 行業(yè) 技術(shù)
用戶無(wú)頭像

網(wǎng)友整理

注冊(cè)時(shí)間:

網(wǎng)站:5 個(gè)   小程序:0 個(gè)  文章:12 篇

  • 51998

    網(wǎng)站

  • 12

    小程序

  • 1030137

    文章

  • 747

    會(huì)員

趕快注冊(cè)賬號(hào),推廣您的網(wǎng)站吧!
最新入駐小程序

數(shù)獨(dú)大挑戰(zhàn)2018-06-03

數(shù)獨(dú)一種數(shù)學(xué)游戲,玩家需要根據(jù)9

答題星2018-06-03

您可以通過(guò)答題星輕松地創(chuàng)建試卷

全階人生考試2018-06-03

各種考試題,題庫(kù),初中,高中,大學(xué)四六

運(yùn)動(dòng)步數(shù)有氧達(dá)人2018-06-03

記錄運(yùn)動(dòng)步數(shù),積累氧氣值。還可偷

每日養(yǎng)生app2018-06-03

每日養(yǎng)生,天天健康

體育訓(xùn)練成績(jī)?cè)u(píng)定2018-06-03

通用課目體育訓(xùn)練成績(jī)?cè)u(píng)定