搜狗王小川:2020年 机器翻译的某些指标可以赶上人类翻译

北京时间5月20日,2018全球人工智能技术大会(GAITC)在北京召开。作为中国人工智能技术和产业领域规模最大、影响力最强的专业会议之一,GAITC邀请到了中国工程院院士李德毅、图灵奖得主姚期智、欧洲科学院院士汉斯·乌思克尔特等数十位业界专家,共同献上了数场精妙绝伦的主题演讲和对话。搜狗CEO王小川应邀在活动上发表了主题为《语言AI之路与挑战》的演讲。他回顾了人工智能在语言领域取得的进展,并指出“到2020年,机器翻译在一些指标上可以赶上人类翻译。”

搜狗王小川:2020年 机器翻译的某些指标可以赶上人类翻译

作为国内用户量第四大的互联网公司,搜狗多款产品获得了市场的认可,搜狗输入法市场占有率多年保持第一的位置,搜狗搜索引擎市场份额为中国第二。基于在语言领域积累的海量数据和领先能力,搜狗率先布局了以语言为核心的人工智能战略。

从软件到硬件,搜狗让AI技术能够融入每个人的生活,构建起翻译、问答、辅助对话等使用场景。

搜狗翻译:让华语世界连接全世界

翻译是搜狗近两年来着力发展的方向。搜狗CEO王小川介绍道:“搜狗机器翻译是以搜狗独创的基于神经网络的机器翻译技术为算法;同时,凭借搜狗输入法、搜狗搜索引擎多年用户使用积累,产生了丰富语料供AI自主学习。”经过大量的训练和积累后,搜狗神经网络机器翻译的准确率愈发提高,屡获国际大奖。在国际学术赛事WMT 2017中,获中译英系统八项机器评价指标中的七项第一。

神经网络机器翻译技术,目前已经在搜狗的核心产品中进行应用:搜狗输入法上线翻译功能,用户可在聊天场景中进行中、英、日、韩等语言的翻译;搜狗搜索中的英文搜索频道,可以帮助用户用英文搜索全世界。此外,搜狗还上线了翻译App,帮助有专业需求的用户进行声音、图片和文字的翻译。

2018年,搜狗的两款智能硬件——旅行翻译宝、录音翻译笔正式发售。这两款产品是搜狗神经网络机器翻译技术、语音识别技术、OCR图像识别等高精尖技术的集合性落地,让AI机器翻译技术融入到生活和工作场景中,让每个人都可以享受AI技术给生活带来的便利。

值得一提的是,本次大会的所有中英互译同传字幕均由搜狗机器同传提供。随着演讲者的话语,字幕条即刻滚动更新,因其迅速的反应、准确的翻译,获得了参会嘉宾的认可。王小川表示:“机器和翻译人员还是有距离的。我们内部研发人员认为,在2020年时,可以在一些指标上赶上真人翻译,一些地方甚至会更好,一些地方还有不足。”

搜索的未来是问答 让回答一步到位

作为国内第二大搜索引擎公司,搜狗一直致力于搜索技术的深耕和应用。去年,搜狗问答机器人汪仔参加《一站到底》,与节目中顶尖选手同场竞技并取得胜利;今年的搜狗答题助手也帮许多人在“直播答题”类竞赛中获得了名次和奖金。但王小川显然并不满足于现有成绩,他断言:“搜索的未来是问答。未来搜索引擎不应该只给用户一个网页,而是给用户直接提供答案,这中间包含着知识推理和检索的能力。”

对此,他进行了更多的阐释:“搜索引擎所做的不仅仅是搜索、检索,更需要完成阅读理解,因为用户输入的关键词五花八门,问题的真实意思是机器所不能确定的。”比如,有网友搜索“王者荣耀排位上分最好的时间段”而最佳答案其实是“需要组队、有给力的队友”。这些语言的多样性、问题的不确定性,都是搜索引擎、问答产品在未来需要面临的问题。在这个方面,搜狗和学界持续合作,共同搭建数据库、解决更多的问题。在双方的通力合作下,相信搜狗会带来更加贴合用户心理的问答产品。

AI辅助对话:不炒“自动回复”冷饭

日前,在谷歌I/O大会上,主讲人请虚拟语音助手Duplex自行预约理发,测试中的Duplex在思维逻辑、对答正确性和速度方面,甚至还有极其类似真人的语音语调,都令业界惊叹。

与这款虚拟语音助手类似的“搜狗辅助对话”,或许是被大多数人忽略的一项功能,它不同于以往的“任务型对话”如siri,“聊天机器人”如微软小冰,不再是机器按照模板对人类的问题进行反馈,而是基于大数据,对人类对话时最可能出现的回复进行提示,由人类来掌控最终决定权,敲定最终回复的话语。机器所做的是为人类提高效率,而不是代替人类去回复、去思考。

而人类点选的动作和主动输入的动作,也是对机器提供答案的评价,这类评价数据,可以为机器的自主学习、自主更新提供资料,便于机器辅助对话性能的优化提升。如今,机器辅助对话的应用场景已由手机短信扩展到聊天软件,针对用户多样化、趣味性、个性化的表达需求,搜狗也在持续研究更复杂的检索模型、 学习模型,让“搜狗辅助对话”实现更好的效果。

在演讲的最后,搜狗公司CEO王小川透露,搜狗输入法致力于自然交互,搜狗搜索则以知识计算为主,搜狗会考虑将二者的功能结合——“搜狗将不断研发新的智能硬件产品,会在各种垂直领域推出虚拟个人助理,帮助用户更好地表达和获取信息。”


企业会员

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。

2018-05-23
搜狗王小川:2020年 机器翻译的某些指标可以赶上人类翻译
北京时间5月20日,2018全球人工智能技术大会(GAITC)在北京召开。

长按扫码 阅读全文

Baidu
map