zh
姓名格式错误
公司名称格式错误
数据堂严格遵守用户隐私条款,您所填写的信息我们会严格保密,请放心填写~
2020年,语音圈的顶会之一Interspeech以“Cognitive Intelligence for Speech Processing”为主题,汇聚全球语音领域研究人员、人工智能从业者、业内知名企业等深入交流与探讨。作为Interspeech2020的旗舰技术活动,口音英语语音识别技术国际研讨会(以下简称2020AESRC)将采取线上举办的形式,旨在吸引全球范围内从事英语语音识别的研究人员。
目前,标准英语ASR系统已经能够获得较高的识别正确率,但带有口音识别能力的英语识别系统仍然是具有挑战性的课题。难点主要源于口音本身的不一致性语速与音素发音的多变性,同时,数据的欠缺也严重限制了相关研究的进行。结合以上背景特别发起本次竞赛。
使用官方提供的各种口音英文的训练数据,训练语种分类模型。提交测试集合上的语种识别结果。
使用规则限定的训练数据,训练语音识别模型。提交测试集合上的语音识别结果文本。
数据堂将为参赛者提供总量为160小时的采集自8个国家(俄罗斯、韩国、美国、葡萄牙、日本、印度、英国和中国)的口音英语数据,每种口音数据约20小时。
时长 |
每种口音约20小时,共8种口音 |
语言与 口音类型 |
来自俄罗斯、韩国、美国、葡萄牙、日本、印度、英国和中国的带口音的英文 |
音频格式 |
16kHz,16bit,单声道wav |
录音环境 |
相对安静的室内,手机录音 |
音频内容 |
日常交流为主,包含人机交互等场景 |
字段 |
描述 |
SEX |
说话人性别 |
AGE |
说话人年龄 |
ACT |
口音类别 |
MIT |
录音设备 |
SCC |
录音环境 |
LBR |
音频时长 |
ORS |
原始文本 |
参赛报名截止
2020.08.31组委会提供训练数据
2020.08.31组委会提供测试集
2020.09.22参赛团队提交测试结果
2020.09.24组委会公布评测结果
2020.09.30参赛团队提交方案介绍
2020.10.09线上技术交流暨颁奖
2020.12.05一等奖1名:10,000元人民币
二等奖2名:5,000元人民币
三等奖3名:2,000元人民币
一等奖1名:10,000元人民币
二等奖2名:5,000元人民币
三等奖3名:2,000元人民币
注:奖金金额均为税前金额
挑战赛向来自全社会的高等院校、科研单位与互联网企业的队伍开放。
注:大赛主办和技术支持单位如有机会接触赛题背景业务、产品、数据的员工,则自动放弃参赛资格。(排名不分先后)
谢磊 |
西北工业大学 |
钱彦旻 |
上海交通大学 |
Shinji Watanabe |
美国约翰霍普金斯大学 |
Chng Eng Siong |
新加坡南洋理工大学 |
丰强泽 |
数据堂(北京)科技股份有限公司 |
中国计算机学会
语音对话与听觉专业组
西北工业大学
音频语音与语言处理研究组
上海交通大学
智能语音实验室
新加坡南洋理工大学
计算机科学与工程学院
美国约翰霍普金斯大学
语言与语音处理中心
陕西鲲鹏生态创新中心
西安高新产业技术开发区
软件园发展中心
数据堂(北京)科技股
份有限公司
提示:
参赛团队 B、I、U2、K2、M2仅提交了Track2结果。参赛团队D2、O3仅提交了Track1结果。参赛团队Q3结果行数不足。
竞赛解释权归数据堂(北京)科技股份有限公司所有