zh

姓名格式错误

公司名称格式错误

数据堂严格遵守用户隐私条款,您所填写的信息我们会严格保密,请放心填写~

语音识别语音识别数据解决方案

语音数据解决方案_语音识别语音识别数据解决方案
中文普通话语音数据集全部由来自中国本土发音人进行录制。覆盖不同年龄段,如低幼儿童、青少年、成年人、老年人等;覆盖不同地域发音人的不同习惯,如重口音普通话、台湾普通话、中英混读语音数据等;同时,中文普通话也覆盖室内室外不同场景,如家居、车载等场景的唤醒词、命令词等普通话语音数据。
语音数据解决方案_自有版权语音数据集-中文普通话,约20000小时
中国地区方言语音数据集涵盖了来自八大方言区本土发音人录制的语音数据,包括粤语语音数据集、上海话数据集、闽南话数据集、昆明方言数据集、武汉方言数据集、长沙方言数据集、四川方言数据集等。
语音数据解决方案_自有版权语音数据集-中国地区方言,约10000小时
各国人说英语语音数据集包含了美式英语,英式英语,中国人说英语,德国人说英语,法国人说英语,加拿大人说英语等各国人说英语的数据集。
语音数据解决方案_各国人说英语语音数据集
亚洲语系数据集包含了来自印尼、日本、韩国、越南、马来、泰国等国家的本土发言人录制的印地语语音数据集,日语语音数据集,韩语语音数据集,越南语语音数据集,马来语语音数据集,泰语语音数据集。
语音数据解决方案_自有版权语音数据集-亚洲语系,约6000小时
欧洲语系语音数据集包含了来自德国、法国、俄罗斯、西班牙、意大利等国家本土发音人的德语语音数据集、法语语音数据集,俄语语音数据集,西班牙语音语数据集,意大利语音语数据集等。
语音数据解决方案_自有版权语音数据集-欧洲语系,约10000小时
其他语系主要包括巴西人录制的巴西葡萄牙语数据集,以色列人录制的希伯来语数据集。
语音数据解决方案_自有版权语音数据集-其他语系,约2500小时

语音识别数据定制化解决方案

数据堂支持录音环境、场景、设备的多样化定制,并且支持多语种、多年龄、多地域等条件的语音采集定制,可根据不同场景、内容、语种等条件,支持对语音数据进行转写、切割等多种标注方式。

多段落标注

支持将语音拆分成多段落进行标注

唤醒词采集

支持不同语种、语速、录音环境、录音设备、年龄等唤醒词采集定制需求

儿童语音采集

支持多国、不同性别、语种、年龄段的儿童语音采集定制

场景语音采集

支持车载、家居、会议室、室外、专业录音房等不同场景的语音采集定制需求

语音数据采集定制

数据堂具备中文普通话,中文方言,外语等朗读及自然对话语音数据采集的定制能力,同时支持定制化场景如家居、会议、客服等业务场景的语料设计、筛选发音人,语音采集等。

我要定制
语音数据解决方案_数据标注私有化部署,充分保障企业数据安全

数据标注私有化部署,充分保障企业数据安全

数据标注平台拥有上百套数据标注工具集

我要定制

语音识别