非凡成就:AI将人类的思想活动转化为文本信息

AI领域,或许我们马上就能达成一项令人印象深刻且难以置信的里程碑成就——使得我们在语音识别方向上的取得丰硕成果现在就如同小孩子的游戏:人工智能(AI)系统可以直接将我们的大脑活动转化为完整的文本信息。

这不是科幻小说的剧情。从动物模型到人类参与者,脑机接口在过去的几十年中得到了长足进展,实际上已经能看到胜利的曙光。

加州大学旧金山分校张氏实验室的神经外科医生爱德华·张领导的团队使用一种新方法来解码脑皮层的电活动:由植入大脑的电极采集皮层活动期间发生的电脉冲。

有4名癫痫患者在脑部安装了用于监测癫痫症状的植入物,UCSF团队借此机会进行了一项辅助实验:让参与者大声朗读并重复句子,用电极记录他们的大脑活动。

然后,将这些数据输入到神经网络中,该网络会根据实验的音频记录来分析与某些语音签名(例如元音,辅音或嘴巴动作)相对应的大脑活动模式。

此后,另一个神经网络解码了语义的表达形式(从重复的30–50个口头句子收集而来),并仅基于单词的皮层签名来预测所说的内容。

在最佳状态下,该系统可以提供足够低的误码率(WER),其中只有3%脑信号被错误转译。

错误的例子包括:“博物馆每天晚上都会聘请音乐家”,预测为“博物馆每个昂贵的早上都会聘请音乐家”; “蛋糕的一部分被狗吃掉了”被预测为“蛋糕的一部分是饼干”;和“蒂娜·特纳是流行歌手”变成了“#¥·特纳是流行歌手”。

在最不准确的情况下,错误翻译在语义上或语音上都与原文毫无关系:“她穿着温暖的羊毛工作服”被解释为“绿洲是海市蜃楼”。

尽管如此,尽管存在着明显的错误,总体而言,该系统仍可构成基于AI的脑活动解码的新基准,并且其最佳状态与专业的人类语音转录系统相当。

当然,与通常的人类语音语言打交道的专业语言转文字软件必须能够处理成千上万个单词。相比之下,AI脑接口系统目前只有有限的大约250个特定单词的皮质签名。

尽管还有许多障碍,但研究团队认为,该系统有一天可以帮助丧失语言能力的人说话或者让失去肢体的人单纯利用意念操作假肢。如果有可能做到这一点,那将是一件了不起的成就——远远超出了理论科学的范畴。

作者解释说:“在长期携带植入物的参与者中,可用的训练数据量将比本研究中使用的语音语素大几个数量级,AI的词汇量和灵活性可被极大地扩展。”

论文发表在《自然·神经科学》上。

本文译自 sciencealert,由译者 majer 基于创作共用协议(BY-NC)发布。

(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )

赞助商
2020-04-03
非凡成就:AI将人类的思想活动转化为文本信息
在AI领域,或许我们马上就能达成一项令人印象深刻且难以置信的里程碑成就——使得我们在语音识别方向上的取得丰硕成果现在就如同小孩子的游戏:人工智能(AI)系统可以直接将我们的大脑活动转化为完整的文本信息

长按扫码 阅读全文

Baidu
map