向脑机接口又迈进一步 人工智能设备读懂唇语

11月29日消息,据外媒报道,一种新型的语音合成器可以跳过语音记录,而直接将说话者嘴部动作转换为语句。

研究人员表示,该设备将能帮助声带麻痹患者发声,向脑机接口又迈进一步。

描述该装置的研究发表在《PLOS计算生物学》期刊上。

这项研究的作者来自法国国家科学研究中心。文章中提到,“这种语音合成器将人体主要语音发音器(舌,颚,口和嘴唇)的运动转换成智能语音。”

说话者的发言,以及嘴部各个部位的位置会被同时记录,然后通过人工智能网络算法进行分析。

此处使用的人工智能算法是基于人类大脑建模的深层神经网络(DNN)。算法设计针对偏复杂的模式识别。

该深层神经网络DNN通过测量舌头、下颚、软腭和嘴唇的协调动作(又称为“发音语音信号”)来识别嘴正在发音的某个词语。

作者解释道,DNN计算模型对这些测量的数据进行训练,将“发音语音信号”转换成“声学语音信号”.

作者提到,“这项研究中,我们让用于训练DNN模型的用户,以及陌生新用户都来测试语音合成器的实时控制性能,从而评估它在是否能很好地成为脑机接口的一部分。

”语音脑机接口将能通过解码皮层的语言相关活动,实时控制语音合成器,从而帮助有严重发声障碍的人恢复交流。

为帮助连声道都无法震动的患者“说话”,科学家将必须掌握如何解码大脑信号,并将其翻译成语音。

使用人工智能来解码语音和语言已有先例。

谷歌不久前推出了多语言之间机器翻译系统。该系统被成为“Zero-Shot翻译系统”,并具有自我学习能力。它能将未学习过的两种语言翻译成一种已经学习过的语言 --换言之,通过人工智能训练学习了如何实现X语言对Y语言的翻译后,系统就能立即自动掌握从X到Z语言的翻译。

Google Brain的博文把这项翻译技术称为神经机器翻译系统(Google Neural Machine Translation ,简称GNMT)。


企业会员

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。

2016-11-29
向脑机接口又迈进一步 人工智能设备读懂唇语
11月29日消息,据外媒报道,一种新型的语音合成器可以跳过语音记录,而直接将说话者嘴部动作转换为语句。

长按扫码 阅读全文

Baidu
map