zh

姓名格式错误

公司名称格式错误

数据堂严格遵守用户隐私条款,您所填写的信息我们会严格保密,请放心填写~

语音识别——方言语音数据产品

来源: 数据堂

语音识别如今已经走过了漫长的道路,尽管通过机器学习实现了技术上的突飞猛进,如今的语音识别系统仍然有许多不完美的地方,其中一点就是带有歧视性。在最近报道出的《华盛顿邮报》委托进行的一项研究中,谷歌和亚马逊生产的智能音箱,它能够听懂非美国口音的可能性比本土用户低百分之三十。方言识别成为了语音识别技术的一大待突破的障碍。


论方言识别率的必要性

“十里不同音,百里不同俗”是中国的语言现状。中国共有56个民族,除了回族没有自己的语言之外,其他所有民族都有自己的语言,在各个方言区中又分布着多种土语。据不完全统计,中国至少有80种以上的语言。除此之外,由于受到方言的影响,很多人的普通话会有一定的口音存在。无论是目前的智能家居产品还是未来某些语音识别产品的应用,方言的识别是不可或缺的。


训练数据越多越好

语音识别的专业基础包括了算法基础、数据知识和开源平台,其中算法基础是语音识别系统的核心知识,包括了声学机理、信号处理、声学模型、语言模型和解码搜索等。训练数据是语音识别准确率不断提升的关键。语音识别中的口音差异是一个数据问题。语料库中语音样本的数量和多样性越高,得到的模型就越精确。随着越来越多不同方言说话的语音数据做训练,语音识别能力就会不断提高。


数据堂自有版权各地区方言语音系列数据产品包含:

  • 1000小时 武汉方言录音数据

  • 1000小时 昆明方言录音数据

  • 1000小时 长沙方言录音数据

  • 1032小时 上海方言手机采集语音数据

  • 738小时 维语手机采集语音数据

  • 1652小时 粤语手机采集语音数据

  • 1044小时 闽南语手机采集语音数据

  • 312人 东北方言手机采集语音数据

  • 463人 河南方言手机采集语音数据

  • 370人 杭州方言手机语音采集数据

  •   250人 苏州方言手机语音采集数据

    ……


数据规格:

  • 格式:16kHz,16bit,wav,单声道 

  • 录音环境:相对安静的室内,无回声 

  • 录音内容:通用口语;交互;家居命令;方言用语;数字 

  • 设备:苹果手机、安卓手机 

  •   标注特点:文本转写;噪音符号;特殊标识符 

  •   应用场景:语音识别,机器翻译;声纹识别

  •   准确率:句准确率百分之九十五(噪音符号和其他标识符的准确率不计入在内)



关于数据堂

数据堂(北京)科技股份有限公司,成立于2011年(股票代码:831428),专业的人工智能数据服务提供商,致力于为全球人工智能企业提供数据获取、处理及数据产品服务。数据堂总部位于北京,拥有8家全资和控股子公司,并在硅谷设立美国子公司,目前在南京、保定、合肥、贵阳等地设有多个专业数据处理中心。数据堂数据采集范围遍及全球30多个国家,合作伙伴遍布世界10多个国家。公司创始人及合伙人来自Stanford University、NEC、中国移动等知名高校和高科技公司。数据堂已成功为国内外众多企业提供人工智能数据产品与服务,包括百度,腾讯,阿里巴巴、奇虎360、联想、科大讯飞等国内顶级互联网和高科技企业,Microsoft、NEC、Canon、Intel、Samsung、Nuance、Fujitsu等企业及在华研发机构。


18

122