3月28日,据国外媒体报道,谷歌研究院正在探索让机器合成语音更加自然的方法。谷歌大脑和机器感知团队的成员本周二在博客中公布了一些能让语音更具有表现力的方法示例。
同时,谷歌发布了“云端文本转语音”服务的测试版,提供了与谷歌助手同样的语音合成服务。该服务采用了DeepMind的WaveNet技术,这个技术可以被用于生成非常自然的声音。
有报道显示,谷歌研究员近期发表了两篇论文,提出了新的发音方法,介绍了如何模仿语音中的重音或语调。这两篇论文的技术都是基于Tacotron2。Tacotron2是谷歌去年12月份推出的人工智能系统,使用神经网络进行训练,模仿人类语音。
Tacotron在大部分情况下都可以模拟真人声音,但是却无法模仿说话中的重音和自然语调。Tacotron的联合发明人Wang Yuxuan参与了其中一篇论文研究。研究通过将人类语音片段嵌入计算机语音风格,使合成语音中实现了重音等效果。另一篇论文的研究则使用无监督训练和识别语音模式,并模仿某些语音风格。
在语音技术研发上,去年苹果Siri被众多消费者认为是更加具有表现力的声音。同时去年四月,亚马逊Alexa面向语音应用开发者提供了SSML标签,在语音助手中增加了更丰富的表达,例如停顿、轻语,以及一些感叹词等。
(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )