zh
姓名格式错误
公司名称格式错误
数据堂严格遵守用户隐私条款,您所填写的信息我们会严格保密,请放心填写~
来源: 数据堂
2019年IEEE自动语音识别与理解研讨会将于2019年12月14日至18日在新加坡圣淘沙举行。ASRU 研讨会是IEEE语音和语言处理技术委员会(SLTC)的旗舰技术活动。该研讨会每两年举办一次,将来自学术界和工业界的顶级专家和研究人员聚集在一起,对包括语音识别与理解在内的语音领域广泛研究议题展开深入探讨。
在我们日常交流中经常会有中文语境下英文单词夹杂的现象,语种混杂(Code-switch)是一种常见的语言现象,也是当前语音识别技术面临的重要挑战之一。数据堂作为此次ASRU的白金赞助商,为促进国内外语种混杂语音识别方面的研究,联合西北工业大学音频语音与语言处理研究组、中国计算机学会语音对话与听觉专业组举办首届中英混杂语音识别挑战赛暨 2019Automatic Speech Recognition and Understanding Workshop(以下简称ASRU)研讨会。评测颁奖将在ASRU2019国际会议上进行。
赛道设置(暂定)
Track1:
传统语音识别,固定语言模型。组委会提供ARPA格式的n-gram中英混杂语言模型,参赛者只能使用该语言模型,主要考察参赛者混杂声学建模能力,声学模型的搭建只能使用指定数据。
Track2:
传统语音识别,开放语言模型。参赛者可以使用任意文本训练语言模型,声学建模只能使用指定数据训练,考察参赛者综合能力。
Track3:
端到端语音识别。参赛者使用基于神经网络的端到端语音识别方案搭建系统,不能使用外接的语言模型,只能使用指定数据进行模型训练。
*注:报名参加评测的队伍必须提交结果。
指定数据
数据堂提供【500小时中文普通话语音数据】和【200小时中英文混读语音数据】,纯英文数据使用librispeech数据。参赛者只允许使用这些语音数据进行模型训练、系统搭建以及进行数据增广(本次竞赛不支持使用上述数据之外的其他任何数据)。
数据获取
数据获取将在8月23日报名截止之后至9月2日之前,提供数据下载链接,敬请关注数据堂官网www.datatang.com
测试
组委会提供测试集,测试以MER(mixed error rate)进行评估。其中,中文部分计算汉字准确率,英文部分计算词准确率。
参赛日程(暂定)
奖项设置
*需特别注意
①以上所有提及金额均为税前金额;
②获奖评定需选手按要求提供材料及团队成员名单。
竞赛指导委员会
(排名不分先后)
报名方式
报名邮箱:ASRU2019@datatang.com
邮件主题:【中英混杂竞赛-队伍名称】,并附报名表。
扫描上方二维码下载竞赛报名表
*注:具体细则将于近期公布,敬请关注数据堂官网www.datatang.com