語音技術圈頂會之一INTERSPEECH 2020,以“Cognitive Intelligence for Speech Processing”為主題,即將登陸上海。2020口音英語語音識別技術研討會暨挑戰賽(以下簡稱2020AESRC)作為本年度INTERSPEECH的旗艦技術活動,計劃于2020年10月25日在中國上海同步舉行。
競賽背景
英語作為最具影響力的全球性交流語言之一,與其相關的英語語音識別系統也在學術界和工業界受到廣泛關注。 當前階段,標準英語ASR系統已經能夠獲得較高的識別正確率,滿足一定場景的商用要求,但是口音英語識別仍然是具有挑戰性的課題,商用系統往往通過大量的口音標注數據覆蓋來緩解口音帶來的識別性能影響。
口音語音識別面臨著口音本身的不一致性、語速與音素發音的多變性帶來的建模難題。另外,帶有口音標注的語音數據的短缺也嚴重限制了相關研究的開展。
Interspeech 2020口音英語語音識別挑戰賽 (Interspeech2020 Accented English Speech Recognition, AESR) 向參賽者開放了來自不同國家的共八種口音英語數據,覆蓋了各種發音特點、口音輕重,旨在加強英語語種識別、口音語音識別的研究交流。期待來自學術界與工業界的學術研究者能夠相互切磋,有所收獲。
賽道介紹
賽道1:口音種類識別
使用官方提供的各種口音英語的訓練數據,訓練語種分類模型。提交測試集合上的語種識別結果。
賽道2:口音英語語音識別
使用規則限定的訓練數據,訓練語音識別模型。提交測試集合上的語音識別結果文本。測試集合中會出現訓練集外的口音以驗證模型泛化性能。
指定數據
數據堂向參賽者提供8個國家(俄羅斯、韓國、美國、葡萄牙、日本、印度、英國、中國)的口音英語數據,每個國家20小時,總量160小時。
訓練數據將與按如下格式組織的metadata同時開放。
兩個賽道中允許使用Librispeech數據 http://www.openslr.org/12/
獎項設置
參賽日程
2020年8月20日 參賽報名截止
2020年8月21日 組委會提供訓練數據
2020年9月22日 組委會提供測試集
2020年9月24日 參賽團隊提交測試結果
2020年9月30日 組委會公布評測結果
2020年10月9日 參賽團隊提交方案介紹
2020年10月25日 獲獎團隊頒獎
競賽指導委員會競
聯合主辦單位
中國計算機協會語音對話與聽覺專業組
西北工業大學音頻語音與語言處理研究組
上海交通大學智能語音實驗室
新加坡南洋理工大學計算機科學與工程學院
美國約翰霍普金斯大學語言與語音處理中心
西安高新產業技術開發區軟件園發展中心
陜西鯤鵬生態創新中心
數據堂(北京)科技股份有限公司
大賽面向語音技術愛好者,高等院校、科研單位、企業、創客團隊等人員均可報名參賽,每位選手只能加入1支隊伍。