由海天瑞声和清华大学发起,厦门大学、西北工业大学及昆山杜克大学联合主办的第五届“东方语种识别竞赛”开始报名啦!
在今年的竞赛中,为了让参赛者们更好地评估自己的系统,以及为初次参赛的参赛者提供可以快速复现的系统,厦门大学智能语音实验室(XMUSPEECH)提供了基于Kaldi和Pytorch两个开源平台的基线系统:基于Kaldi的i-vector系统和x-vector系统,基于Pytorch的x-vector系统。
OLR基线系统可以帮助初次接触语种识别的参赛者快速搭建一套语种识别系统;另外,厦门大学智能语音实验室同时开源了ASV-Subtools工具,ASV-Subtools工具相比于其他开源工具的优势在于其整合了Pytorch的训练和Kaldi的前端后端处理,不仅可用在今年的语种识别竞赛,还可用于声纹识别系统的搭建。
ASV-Subtools提供了完整的基于shell脚本的recipe供参赛者快速搭建一套语种识别系统或者复现OLR基线系统。在提供的run.sh这一个脚本中就可以实现基于i-vector和x-vector的语种识别系统搭建,得到符合竞赛要求的输出分数文件。
ASV-Subtools工具同时整合了Kaldi工具和Pytorch工具:使用Pytorch来训练模型,其余流程使用Kaldi处理。除了ASV-Subtools中提供的配置选项外,使用者也很容易在Pytorch上补充选项之外的需求,快速自定义神经网络,用于声纹识别模型的训练。
报名请发送以下内容至邮箱:
1. 团队名称;
2. 机构名称;
3. 全部参与者姓名;
4. 队伍负责人姓名;
5. 参赛个人、参赛机构的网站页面或所发布的关于语音的论文(非必选项)。
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。