zh
姓名格式错误
公司名称格式错误
数据堂严格遵守用户隐私条款,您所填写的信息我们会严格保密,请放心填写~
来源: 数据堂
方言朗读语音数据集
东北方言语音数据集
所有发音人均使用东北方言朗读文本,录音内容丰富,覆盖近30多个领域的客户咨询以及短信文本。句子由专业标注人员人工转写校对,句准确率95%,可用于语音识别,声纹识别等任务。获取数据样例:https://datatang.com/dataset/info/speech/49
四川方言语音数据集
来自四川盆地发音人在安静的室内环境下的录音数据,录音内容广泛,覆盖日常短信及多领域客户咨询。句子平均重复次数1.3次,平均句长12.5字。由四川本地人参与质检校对,文本转写更精准,匹配主流安卓、苹果系统手机。
获取数据样例:https://datatang.com/dataset/info/speech/52
粤语语音数据集
来自广东省发音人,在安静的室内环境下的录音数据。录音内容广泛,覆盖50 万句常用口语语句,包括微博高频词、日常用语等。句子平均重复次数1.5次,平均句长12.5字。匹配主流安卓、苹果系统手机,句准确率达95%,可用于语音识别,声纹识别等任务。获取数据样例:https://datatang.com/dataset/info/speech/54
维吾尔语语音数据集
来自维吾尔族聚居区的人参与录制,男女均衡。录音内容为30万维语口语化句子,录音环境为安静的室内。所有句子均经过人工精准转写,准确率高。获取数据样例:https://datatang.com/dataset/info/speech/46
河南方言语音数据集
由河南本地人员参与录音,口音正宗。录音内容广泛,覆盖日常短信及多领域客户咨询。同时由河南本地人参与质检校对,文本转写更精准,匹配主流安卓、苹果系统手机,可用于语音识别、声纹识别等任务。获取数据样例:https://datatang.com/dataset/info/speech/48
方言自然对话语音数据集
四川方言自然对话语音数据集
近2000名四川本地发音人参与录制,录制时长约为800小时,以自然方式进行面对面交流,不限制话题进行自由发挥,领域广泛,语音自然流利,符合实际对话场景。人工转写文本,句准确率达95%,可应用于语音识别,声纹识别等任务。获取数据样例:https://datatang.com/dataset/info/speech/1065
河南方言自然对话语音数据集
近1000名河南本地发音人参与录制,录制时长约为500小时,以自然方式进行面对面交流,针对指定的多个话题进行自由发挥,领域广泛,语音自然流利,符合实际对话场景。人工转写文本,句准确率达95%,可应用于语音识别,声纹识别等任务。获取数据样例:https://datatang.com/dataset/info/speech/1113
粤语自然对话语音数据集
近1000名河南本地发音人参与录制,以自然方式进行面对面交流,针对指定的多个话题进行自由发挥,领域广泛,语音自然流利,符合实际对话场景。人工转写文本,句准确率达95%,可应用于语音识别,声纹识别等任务。
获取数据样例:https://datatang.com/dataset/info/speech/1026