高层速读
关键信息:微软亚洲研究院宣布开发出第一个机器翻译系统,该系统在通用新闻报道测试集newstest2017的中-英测试集上达到了人类水平,在自然语言处理上,实现了媲美人类专业译者的里程碑式突破。
由微软亚洲研究院与雷德蒙研究院的研究人员组成的团队周三宣布,他们已经开发出了第一个机器翻译系统,该系统在通用新闻报道测试集newstest2017的中-英测试集上达到了人类水平。当100分是标准满分时,微软的系统得分69.9,专业译者68.6。
微软表示,他们对来自各种在线报纸的大约2000个句子样本进行了反复测试,并将测试结果与机器翻译的结果进行了比较,甚至聘请了双语语言顾问,以进一步验证机器翻译的准确性。
首个媲美人类专业译者的里程碑式突破
这个名为newstest 2017的数据集是去年秋天在WMT 17的研究会议上发布的,由专业人员从在线报纸样本翻译而来,因此,研究人员能够如此迅速地达到这一成果,可以说是机器翻译领域的里程碑,特别是机器翻译是人们几十年来一直试图解决的问题。微软指出,许多人甚至认为,机器翻译与人类水平相同的目标永远不会实现。
黄学东院士在微软的博文中表示:“在机器翻译任务中,实现人与人之间的平等是我们所有人的梦想,我们只是没想到这么快就能成功。”同时研究人员也提醒大家,这并不代表人类已经完全解决了机器翻译的问题,只能说明我们离终极目标又更近了一步。
近年来,人工智能和语音识别技术的进步使得语音助理能够进入我们的手机和家庭,帮助消费者完成日常的计算任务,控制智能家居设备,以及聊天和娱乐。但是,对网页或新闻文章进行机器翻译,仍然会造成难以理解的语言上的混乱。因为机器翻译最多能准确翻译字面意思,但几乎不可能用任何深刻的语言来供你深入理解文章。要想真正理解长篇文章,你需要人的帮助。
但,即使是不同的译者,翻译一个句子的方式也可能略有不同,你不能说两者谁对谁错。“机器翻译要比单纯的模式识别任务复杂得多”微软亚洲副院长、从事该项目的自然语言处理小组负责人周明说,“人们可以用不同的词来表达完全相同的东西,但你不一定能说哪个更好。”
微信搜索【AI商业报道】,获取国内外AI巨头新动向及行业资讯!
神经网络使翻译更加流畅、自然
微软还指出,人工智能的最新技术—— 神经网络,为研究人员实现了这一突破做出了贡献。深层神经网络是一种训练人工智能系统的方法,使研究人员能够创造出更流畅、更自然的翻译。考虑到更广泛的使用场景,以前的方法称为统计机器翻译。
微软的研究人员在系统中添加了自己的训练方法,以提高系统的准确性,这相当于人们一次又一次地检查自己的翻译作业,以确保它是正确的。
周明表示,“由于翻译没有唯一的标准答案,它更像是一种艺术,因此需要更加复杂的算法和系统去应对。”自然语言计算组基于之前的研究积累,在此次的系统模型中增加了另外两项新技术:联合训练(Joint Training)和一致性规范(Agreement Regularization),以提高翻译的准确性。
联合训练可以理解为用迭代的方式去改进翻译系统,用中英翻译的句子对去补充反向翻译系统的训练数据集,同样的过程也可以反向进行。一致性规范则让翻译可以从左到右进行,也可以从右到左进行,最终让两个过程生成一致的翻译结果。
▲微软中-英翻译系统试用界面
“这一机器翻译研究成果可以应用到人工智能的各个领域中”周明说。此外,它今后还将能够准确、自然地翻译其他语言,同时应用到微软的商用多语言翻译系统产品中。
除了微软,谷歌的研究人员也一直在致力于机器翻译,包括使用神经网络的中英文查询机器学习技术。这些技术已经被用于改进谷歌面向消费者的产品中,比如谷歌翻译的App,以及谷歌搜索。
微信搜索【AI商业报道】,获取国内外AI巨头新动向及行业资讯!
- 蜜度索骥:以跨模态检索技术助力“企宣”向上生长
- 消息称塔塔集团将收购和硕印度iPhone代工厂60%股份 并接管日常运营
- 苹果揭秘自研芯片成功之道:领先技术与 整合是关键
- 英伟达新一代Blackwell GPU面临过热挑战,交付延期引发市场关注
- 马斯克能否成为 AI 部部长?硅谷与白宫的联系日益紧密
- 余承东:Mate70将在26号发布,意外泄露引发关注
- 无人机“黑科技”亮相航展:全球首台低空重力测量系统引关注
- 赛力斯发布声明:未与任何伙伴联合开展人形机器人合作
- 赛力斯触及涨停,汽车整车股盘初强势拉升
- 特斯拉首次聘请品牌大使:韩国奥运射击选手金艺智
- 华为研发中心入驻上海青浦致小镇房租大涨,带动周边租房市场热潮
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。