zh

姓名格式错误

公司名称格式错误

数据堂严格遵守用户隐私条款,您所填写的信息我们会严格保密,请放心填写~

口音英语语音识别技术研讨会暨挑战赛-数据堂

赛道设置

Track1口音种类识别

使用官方提供的各种口音英文的训练数据,训练语种分类模型。提交测试集合上的语种识别结果。

Track2口音英语语音识别

使用规则限定的训练数据,训练语音识别模型。提交测试集合上的语音识别结果文本。

指定数据

数据堂将为参赛者提供总量为160小时的采集自8个国家(俄罗斯、韩国、美国、葡萄牙、日本、印度、英国和中国)的口音英语数据,每种口音数据约20小时。

时长

每种口音约20小时,共8种口音

语言与
口音类型

来自俄罗斯、韩国、美国、葡萄牙、日本、印度、英国和中国的带口音的英文

音频格式

16kHz,16bit,单声道wav

录音环境

相对安静的室内,手机录音

音频内容

日常交流为主,包含人机交互等场景

训练数据将与按如下格式组织的metadata同时开放
字段

描述

SEX

说话人性别

AGE

说话人年龄

ACT

口音类别

MIT

录音设备

SCC

录音环境

LBR

音频时长

ORS

原始文本

两个赛道中允许使用Librispeech数据http://www.openslr.org/12/

参赛日程

奖项设置

注:奖金金额均为税前金额

参赛对象

挑战赛向来自全社会的高等院校、科研单位与互联网企业的队伍开放。

注:大赛主办和技术支持单位如有机会接触赛题背景业务、产品、数据的员工,则自动放弃参赛资格。

竞赛指导委员会

(排名不分先后)

谢磊

西北工业大学

钱彦旻

上海交通大学

Shinji Watanabe

美国约翰霍普金斯大学

Chng Eng Siong

新加坡南洋理工大学

丰强泽

数据堂(北京)科技股份有限公司

报名参赛与数据协议

下载报名表

联合主办单位

常见问题

下载2020AESRC常见问题解答

评测及排名

口音英语语音识别技术研讨会暨挑战赛-数据堂-评测及排名 口音英语语音识别技术研讨会暨挑战赛-数据堂-评测及排名

提示:

参赛团队 B、I、U2、K2、M2仅提交了Track2结果。参赛团队D2、O3仅提交了Track1结果。参赛团队Q3结果行数不足。

2020AESRC评测测试集抄本

下载测试集抄本

竞赛解释权归数据堂(北京)科技股份有限公司所有