语音识别——方言语音数据产品

来源：数据堂 2019-02-18

语音识别如今已经走过了漫长的道路，尽管通过机器学习实现了技术上的突飞猛进，如今的语音识别系统仍然有许多不完美的地方，其中一点就是带有歧视性。在最近报道出的《华盛顿邮报》委托进行的一项研究中，谷歌和亚马逊生产的智能音箱，它能够听懂非美国口音的可能性比本土用户低百分之三十。方言识别成为了语音识别技术的一大待突破的障碍。

论方言识别率的必要性

“十里不同音，百里不同俗”是中国的语言现状。中国共有56个民族，除了回族没有自己的语言之外，其他所有民族都有自己的语言，在各个方言区中又分布着多种土语。据不完全统计，中国至少有80种以上的语言。除此之外，由于受到方言的影响，很多人的普通话会有一定的口音存在。无论是目前的智能家居产品还是未来某些语音识别产品的应用，方言的识别是不可或缺的。

训练数据越多越好

语音识别的专业基础包括了算法基础、数据知识和开源平台，其中算法基础是语音识别系统的核心知识，包括了声学机理、信号处理、声学模型、语言模型和解码搜索等。训练数据是语音识别准确率不断提升的关键。语音识别中的口音差异是一个数据问题。语料库中语音样本的数量和多样性越高，得到的模型就越精确。随着越来越多不同方言说话的语音数据做训练，语音识别能力就会不断提高。

数据堂自有版权各地区方言语音系列数据产品包含：

1000小时武汉方言录音数据
1000小时昆明方言录音数据
1000小时长沙方言录音数据
1032小时上海方言手机采集语音数据
738小时维语手机采集语音数据
1652小时粤语手机采集语音数据
1044小时闽南语手机采集语音数据
312人东北方言手机采集语音数据
463人河南方言手机采集语音数据
370人杭州方言手机语音采集数据
250人苏州方言手机语音采集数据

……

数据规格：

格式：16kHz，16bit，wav，单声道
录音环境：相对安静的室内，无回声
录音内容：通用口语；交互；家居命令；方言用语；数字
设备：苹果手机、安卓手机
标注特点：文本转写；噪音符号；特殊标识符
应用场景：语音识别，机器翻译；声纹识别
准确率：句准确率百分之九十五（噪音符号和其他标识符的准确率不计入在内）

关于数据堂

数据堂（北京）科技股份有限公司，成立于2011年（股票代码：831428），专业的人工智能数据服务提供商，致力于为全球人工智能企业提供数据获取、处理及数据产品服务。数据堂总部位于北京，拥有8家全资和控股子公司，并在硅谷设立美国子公司，目前在南京、保定、合肥、贵阳等地设有多个专业数据处理中心。数据堂数据采集范围遍及全球30多个国家，合作伙伴遍布世界10多个国家。公司创始人及合伙人来自Stanford University、NEC、中国移动等知名高校和高科技公司。数据堂已成功为国内外众多企业提供人工智能数据产品与服务，包括百度，腾讯，阿里巴巴、奇虎360、联想、科大讯飞等国内顶级互联网和高科技企业，Microsoft、NEC、Canon、Intel、Samsung、Nuance、Fujitsu等企业及在华研发机构。

专业的人工智能数据服务提供商

销售热线：13051623904

数据堂官方微信

京ICP备11010828号-1 京公网安备 11010802026079号法律声明与隐私权政策

电话
留咨
合规

提交成功！感谢您支持数据堂。

确定

暂无数据

取消

呼叫

安全合规

数据堂符合并遵守数据保护条例对隐私数据保护的要求，并且已通过ISO27001信息安全管理体系、ISO9001质量管理体系认证。

手机格式错误

请填写姓名

请填写手机号码

请填写公司全称

请填写企业邮箱

需求描述格式错误

需求描述不能为空

联系我们

姓名

手机

公司名称

企业邮箱

需求

提交

点击下载

企业邮箱格式错误