12月19日,“2018 AI Challenger全球AI挑战赛”总决赛答辩暨颁奖典礼上传来了好消息: 金山软件集团(以下简称“金山”)旗下AI Lab的两支队伍第一次参加此项大赛,便以黑马姿态一路领先,与来自全球81个国家的企业、高校研发团队经过多轮比拼,最终以大比分优势包揽了本年度AI Challenger“英中文本机器翻译”比赛的冠亚军。
创新工场董事长兼首席执行官李开复与金山办公副总裁姚冬、金山AI Lab负责人李长亮博士合影
AI Challenger旨在“用AI挑战真实世界的问题”,架设了面向全球人工智能人才的开源数据集和编程竞赛平台,致力于推动AI在科研与商业领域结合,打造良性可持续的AI科研与应用新生态。
此次金山派出的两支参赛队伍双双获奖,不仅证明了金山团队在人工智能科技领域的团队实力与创新潜能,还以出色的成绩为金山成立三十周年奉上了一份贺礼。
全球AI挑战赛2018冠军团队合影
机器翻译技术领域 新生力量崛起
机器翻译被誉为自然语言处理领域“皇冠上的明珠”,它能够促进消弭文化隔阂、加强世界交流,使语言不再成为妨碍不同语言文化民众的沟通壁垒。
1954年,IBM启动了“Georgetown-IBM”实验,用一台大型机将60个俄语句子翻译成英文。这项实验被学术界视为历史上首次机器翻译。其后的几十年里,许多科学家不断尝试各种技术思路,如基于样例、基于规则、基于统计等等,机器翻译的研究几经起落,直到基于神经网络、 学习的机器翻译技术出现,才让“全世界无障碍沟通”的梦想成为可能。
2018 AI Challenger“英中文本机器翻译”赛道上,所有的参赛队伍均可自由选择机器翻译技术,但都需要根据评测方提供的数据,训练自己的机器翻译系统。评测方使用机器翻译的客观考核指标(BLEU、NIST、TER)来评分,其中BLEU是最主要的评估指标。在今年的比赛中,数据总量达到1300万句对,且其中具有上下文情景的中英双语数据达到300万句对,相比去年大幅扩容。
来自金山AI Lab的一支参赛队伍以客观成绩领先其他对手3个BLEU值,答辩成绩超过其他队伍30分的明显优势获得冠军;另一支参赛团队则以优异成绩获得亚军。
第一次参加这样的世界性大赛,就能与斯坦福大学、清华大学、中科院、BAT、科大讯飞、网易等“顶级豪门”同享人工智能盛宴,并且在机器翻译主赛道取得不俗的成绩,这表明,近年来坚决投入AI研发的金山开始逐渐收获回报。机器翻译技术领域,新生力量已然崛起。
金山AI Lab年轻且富于朝气,事实上,团队参与本次比赛的初衷就是用奖项来检验团队能力——2017年5月,由雷总亲自挂帅,金山开始加大在AI领域的研发投入,成立了涵盖图像、语音、语言等多个研究方向的AI团队,汇集了来自中科院、北京大学、墨尔本大学、哈工大等高校的优秀毕业生。金山AI团队在短时间里建立了鲁棒的机器翻译框架,搭建了训练和调优的基础设施,并且配备了强大的底层计算服务能力,最终在本次大赛中全程领跑、一举折桂。
探索核心技术 加速AI落地
百年前,严复先生提出“信达雅”的翻译质量三原则,当前由机器翻译的文字刚刚触及“信”与“达”的层次,还远达不到“雅”的要求,但从实用的角度考虑,机器翻译技术已足以打造出高效、可依赖的跨语言智能辅助翻译服务。今后,金山将努力为WPS、词霸等产品的用户提供稳定的、接近人工水平的翻译,用户将可以体验即时文本转译、同声语音传译等智能服务。
除机器翻译以外,金山AI Lab还在图像、文本、语音等多个方向展开深入探索。金山邀请中科院李长亮博士加盟,主持AI Lab。正是在李博士的带领下,在此次大赛上,几名年轻研究人员才能创新出层次注意力机制、高斯搜索等独特算法,在工程细节、特征提取等方面积累先进经验。目前,金山已为相关算法、技术申请专利,并在国际顶级会议上发表相关论文。与此同时,金山更关注将技术与产品服务 融合,完成技术落地。目前金山正在探索集成多种人工智能技术,实现人机协作,助力金山办公场景智能化。
周虽旧邦,其命维新。今天,三十岁的金山始终坚持技术立业,不断自我突破转型,不断打造创新产品,服务亿万用户。当前,AI已成为金山的长期战略,公司正全力以赴探索核心技术,寻求持续突破。
金山未来,AI在路上。
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。