近日,今日头条人工智能实验室与北京大学联合研发的写稿机器人xiaomingbot获得了吴文俊人工智能科学技术奖。这个奖项以吴文俊院士命名,被外界誉为“中国智能科学科技最高奖”,据说代表中国人工智能学界的重大突破与最高荣誉。
吴文俊先生是我国著名数学家、中国科学院院士。他在纯数学和应用数学的多个领域都作出了杰出贡献。前半生中,他用30多年时间,在代数拓扑学的研究领域取得了一系列奠基性成就,其中最著名的便是“吴公式”的建立;上世纪50年代初,吴文俊先生放弃了国外优越的研究条件,毅然回国。他的这份情怀,影响着无数后来者。
花甲之年,吴文俊老先生毅然转身,开创与拓扑学毫不相关的数学机械化研究领域,开创了里程碑式的“吴方法”。耄耋之年,他仍在密切关注新的科研进展和新涌现的人才。他曾一再表示:“中国的人工智能不能走外国人的老路,要在原创科学和基础理论研究方面实现突破。
今日头条是今年“吴文俊奖”获奖项目中唯一以企业载体获得专业类奖项的机构,过去这一通常只授予顶尖高校、重点实验室和科研机构。
此次获奖的写稿机器人xiaomingbot早在2016年6月就已经在今日头条上线。里约奥运会期间,通过对接奥组委的数据库信息,xiaomingbot曾写过200余篇赛事报道,包括乒乓球、网球、羽毛球和女足等比赛,累计获得200万用户阅读。它撰写的文章可以涵盖比赛时间、实时比分、运动员信息等主要新闻要素,可读性与职业记者相差无几。
奥运会上线时,xiaomingbot与其他机器人相比就有明显优势。根据人民网研究院的报道,比起美联社的WordSmith、华盛顿邮报的Heliograf、第一财经的DT稿王等,今日头条写稿机器人xiaomingbot实现了很多黑科技。比如:
一、写稿速度更快——2秒内完成稿件并上传至媒体发布
xiaomingbot的撰写发布速度几乎与电视直播同步,从数据库对接、信息搜集、文本生成、润色完成报道,最后发布、推送到今日头条手机客户端,只需用时两秒。
二、拟人化程度更高——并非千篇一律
根据比赛选手的排名、赛前预测与实际赛果的差异、比分悬殊程度等情况,xiaomingbot可以自动调整生成新闻的语气,并使用感情色彩的词语,如「实力不俗」、「笑到了最后」等。
三、发布稿件类型多样——短讯及长文章
xiaomingbot不仅可以发布赛事消息的短讯,还可以生成整场比赛的赛事简报类长文章。
四、图片识别筛选——可实现自动上传图片功能
xiaomingbot可以通过语言理解与图像识别,在数据库中自动选取并在文章中插入赛事图片,让稿件图文并茂更加生动形象。
奥运会后xiaomingbot还在持续撰写NBA、CBA、中超、意甲等体育赛事的文章,包括很多场诸如“亚迪拉-席尔瓦4:0赫巴-阿勒吉 不费吹灰之力经济奥运会乒乓球女单下一轮”这样的冷门比赛,xiaomingbot也均有报道。根据今日头条统计,xiaomingbot文章的阅读率与人类创作者基本持平。
近期,xiaomingbot已完成最新一轮升级,除体育新闻,xiaomingbot在今日头条上撰写的文章现已涵盖科技、财经、房产等十几个分类,并且对多个领域的每日热点做持续的跟踪报道。据悉,xiaomingbot已与光明网、《财经》杂志、大河报等主流媒体达成战略合作,向其进行优质内容输出。
对机器写稿而言,它的核心技术是自然语言理解,同时会涉及机器学习、数据挖掘、 学习、知识图谱等多项技术。自然语言处理是人工智能领域难度最大的课题之一。相对于语音和视觉来说,语言是高度抽象化的表现。一方面,人类语言具有复杂性,同一句话可能代表不同含义。另一方面,正确理解人类语言还要有足够的背景知识,比如对成语和歇后语的理解。这些都是自然语言理解进一步发展需要克服的难题。
因此很多人所忧虑的机器是否会取代记者,短时间内来看是很难的。正如今日头条李磊所言,“我们做新闻机器人的目的并不是取代新闻记者,而是帮助记者创作出更高质量的内容。”
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。