语音标注工具介绍

来源：数据堂 2019-12-10

人工智能业内普遍认为，语音将成为下一个重要的技术平台，近年来随着人工智能理论与技术的迅猛发展，语音识别（ASR）、语音合成（TTS）技术在不断突破。虽然理论技术取得了长足进步，但是在实际应用过程中仍绕不开数据标注这一话题，训练数据的准确性很大程度上影响了算法模型的表现。

4个月前，Mozilla 发布了其开源语音识别数据集项目 Common Voice 的最新版本，并宣布其已成为当前全球最大的人类语音数据集。接下来我们聊聊这些语音数据集是如何生产的。

之前介绍了语音标注工具Praat的使用方法，我想说的是Praat真的非常难用，今天找到一款在web上运行的语音数据标注工具，可以自主配置。

1. 配置标注工具

2.预览标注工具

选择是否转写：即是否是需要将音频转写为文字。

最长语音切割时长：即最长需要标注几秒，视你的素材而定。把这个定义清楚，防止标注人员把语音切割过长。

选择或增加分层：系统默认给出了常用的角色、性别，可以根据你的需要增加或减少分层。

判断项：可针对噪音、发音重叠等情况做特殊处理。填写具体的标注规则，方便标注人员实时查看。

接下来你可以试用一下刚才配置的标注工具，可以转写音频，标注角色、性别、噪音等。可以拖拽时间段、播放每一段的音频，体验还是非常好的，标注效率也会大大提高。

3.上传待标注数据

按照系统要求上传待标注的语音数据。

4.发布标注项目

在平台上选择一个标注团队为你标注，输入你要求的合格率、工期要求等等，和标注团队确定好价格和预付费就好了。

5.验收导出标注结果

标注团队完成标注后，你可以在线上验收标注结果，不合格的话可以回滚，让标注团队重新标注。结算之后就能导出数据了。

实际当中同标注团队沟通过，转写一小时的语音大约要150-200元左右，当然还要看各位具体的需求和标注难度。希望未来大厂们将更多的语音数据开源出来推动科技进步，开源万岁！

（部分内容摘自网络，如有侵权，请联系删除。）

专业的人工智能数据服务提供商

销售热线：13051623904

数据堂官方微信

京ICP备11010828号-1 京公网安备 11010802026079号法律声明与隐私权政策

提交成功！感谢您支持数据堂。

确定

暂无数据

取消

呼叫

安全合规

数据堂符合并遵守数据保护条例对隐私数据保护的要求，并且已通过ISO27001信息安全管理体系、ISO9001质量管理体系认证。

手机格式错误

请填写姓名

请填写手机号码

请填写公司全称

请填写企业邮箱

需求描述格式错误

需求描述不能为空

联系我们

姓名

手机

公司名称

企业邮箱

需求

提交

点击下载

企业邮箱格式错误