zh

姓名格式错误

公司名称格式错误

数据堂严格遵守用户隐私条款,您所填写的信息我们会严格保密,请放心填写~

语音标注工具介绍

来源: 数据堂

人工智能业内普遍认为,语音将成为下一个重要的技术平台,近年来随着人工智能理论与技术的迅猛发展,语音识别(ASR)、语音合成(TTS)技术在不断突破。虽然理论技术取得了长足进步,但是在实际应用过程中仍绕不开数据标注这一话题,训练数据的准确性很大程度上影响了算法模型的表现。


4个月前,Mozilla 发布了其开源语音识别数据集项目 Common Voice 的最新版本,并宣布其已成为当前全球最大的人类语音数据集。接下来我们聊聊这些语音数据集是如何生产的。


之前介绍了语音标注工具Praat的使用方法,我想说的是Praat真的非常难用,今天找到一款在web上运行的语音数据标注工具,可以自主配置。


1. 配置标注工具


2.预览标注工具


选择是否转写:即是否是需要将音频转写为文字。


最长语音切割时长:即最长需要标注几秒,视你的素材而定。把这个定义清楚,防止标注人员把语音切割过长。


选择或增加分层:系统默认给出了常用的角色、性别,可以根据你的需要增加或减少分层。


判断项:可针对噪音、发音重叠等情况做特殊处理。填写具体的标注规则,方便标注人员实时查看 



接下来你可以试用一下刚才配置的标注工具,可以转写音频,标注角色、性别、噪音等。可以拖拽时间段、播放每一段的音频,体验还是非常好的,标注效率也会大大提高。


3.上传待标注数据


按照系统要求上传待标注的语音数据。


4.发布标注项目


在平台上选择一个标注团队为你标注,输入你要求的合格率、工期要求等等,和标注团队确定好价格和预付费就好了。


5.验收导出标注结果


标注团队完成标注后,你可以在线上验收标注结果,不合格的话可以回滚,让标注团队重新标注。结算之后就能导出数据了。


实际当中同标注团队沟通过,转写一小时的语音大约要150-200元左右,当然还要看各位具体的需求和标注难度。希望未来大厂们将更多的语音数据开源出来推动科技进步,开源万岁!


(部分内容摘自网络,如有侵权,请联系删除。)

48

255