【ITBEAR】8月28日消息,近日,釘釘宣布推出了一項創(chuàng)新的視頻會議功能,該功能借助阿里巴巴的通義聽悟技術(shù),實現(xiàn)了在會議中對發(fā)言人的智能區(qū)分和定位,極大地提升了參會者的沉浸感和專注度。這項新功能已經(jīng)成功集成到釘釘會議室Rooms軟件中,并廣泛適配了市場上各類生態(tài)會議硬件。
在混合會議場景下,尤其是線下會議室中多人并排而坐,而線上參會者只能看到一個小窗口畫面時,常常難以辨認(rèn)是誰在發(fā)言,這嚴(yán)重影響了會議的參與體驗。當(dāng)會議內(nèi)容繁雜、時間冗長時,會議組織者也會面臨挑戰(zhàn),難以根據(jù)發(fā)言人來整理會議紀(jì)要。釘釘會議的這一新能力正是針對這一痛點進行優(yōu)化的,無論是實時字幕顯示、雙語翻譯,還是閃記功能(即會議智能紀(jì)要),都能準(zhǔn)確識別不同的發(fā)言人,讓參會者更加聚焦于內(nèi)容的討論,同時也減輕了會后紀(jì)要整理的工作量。
據(jù)ITBEAR了解,這一功能的背后是通義實驗室語音團隊研發(fā)的CAM++模型。該模型通過大規(guī)模數(shù)據(jù)訓(xùn)練,強化了說話人識別和連續(xù)語音數(shù)據(jù)聚類算法,從而提升了識別的準(zhǔn)確率。同時,它還基于語義理解來識別說話人的轉(zhuǎn)換,實現(xiàn)了對會議室中不同發(fā)言人的實時準(zhǔn)確區(qū)分和定位。目前,釘釘會議的發(fā)言人區(qū)分功能已經(jīng)與億聯(lián)網(wǎng)絡(luò)、看到科技、MAXHUB等多家會議硬件廠商完成了適配,共同打造出AI時代下軟硬一體的會議解決方案,為用戶帶來更加高效的會議體驗。
釘釘會議已經(jīng)廣泛應(yīng)用于新能源、制造、零售、金融、物流、互聯(lián)網(wǎng)等多個行業(yè),為寧德時代、云南白藥、安踏集團、顧家家居、申通快遞、人民日報、一汽集團、民生證券、微博等眾多行業(yè)領(lǐng)軍企業(yè)提供了服務(wù)。這一創(chuàng)新功能的推出,無疑將進一步鞏固釘釘在視頻會議領(lǐng)域的領(lǐng)先地位,并推動企業(yè)級會議體驗的全面升級。