文 ▍李东楼(微信号:lidonglou)
在美国导演斯派克·琼斯编剧并执导的一部科幻爱情片《她》(Her)当中,语音交互几乎成为了人们与手机、电脑等设备进行交互的唯一手段,打电话、写信、处理工作邮件等等,都通过语音向计算机发出指令。而且其中的人工智能操作系统OS1还与人类有了情感交流,谈起了恋爱,而影片的背景被设定在2025年,也就是从现在算起九年之后。
当然,我们无法预测,人工智能在九年后究竟会不会发达到这个地步?但眼下可以肯定的是,人工智能技术确实已经开始从实验室逐步走近我们的生活,尤其是今年年初的谷歌alphago围棋机器人和李世石的人机对决大战,更是让人们首次见识到人工智能的强大之处。而在昨天,搜狗语音发布了不仅“能听会说”,还具有“能理解会思考”的能力的语音交互引擎技术—知音,这再次刷新了在场所有人对于人工智能技术发展的认知。
搜狗知音引擎发布,展现搜狗在人工智能方面的自信
就如同影片《她》当中,男主人公通过语音写信一般,基于语音识别和语义理解技术方面的进步,搜狗语音早已达到了可以实时转写的地步。值得一提是,在昨天的发布会上,嘉宾的发言就通过搜狗知音交互引擎实时转写并呈现在大屏幕上,不仅语音识别速度快,而且准确率也相当高,基本上能够达到90%以上,令人惊叹技术的进步。
而这还只是搜狗知音引擎的简单“炫技”,除了语音识别之外,根据搜狗CTO杨洪涛介绍,搜狗知音引擎还支持用户直接用自然语言进行纠错,比如用户可以说:“把‘张’修改为立早‘章’,或者把‘张’修改为文章的’章’。并且还支持多轮对话,比如用户说我要去首都机场,搜狗知音引擎便会问 T1还是 T2,当用户确定航站楼后,它会问是出发还是接人。这就意味着搜狗知音引擎能够处理更加复杂的交互逻辑,以及更好的感知用户语音请求背后的真正需求,这显然语音交互方面的一大技术进步。
要知道,在两年前,尤其是苹果Siri的推出,语音交互作为一种面向未来的交互方向,就备受各大互联网公司的重视和看好。包括搜狗、百度、微软等科技公司都推出了语音助手产品,期待产品能够作为移动互联网的一大入口。不过,现在看来,无论是Siri,还是微软的小娜,都在用户短暂的热捧之后,渐渐沉默。事实上,这其实算是第一代的人工智能初级产品,这些产品更多的是扮演着一个小助手或者秘书的角色,只能够简单的处理一些打电话、发短信、天气预报查询等等,一旦遇到稍微复杂的问题,语音助手便无法处理,一般都只好卖萌耍滑,这就使得产品的实用性并不强,用户尝试使用更多的是抱着娱乐的心态,而并不是真正的刚性需求。
不过,时隔两年之后,各大科技公司的语音交互技术有了显著的提升。尤其是在这次搜狗发布的语音交互引擎技术当中更能够感受到技术的进步之快。根据了解,目前搜狗的语音交互引擎技术已经应用在包括搜狗输入法、搜狗搜索、搜狗地图等在内的搜狗全线产品当中,而根据搜狗语音交互中心负责人王砚峰在现场的演示,运用在搜狗搜索、搜狗地图导航等应用上的搜狗语音交互引擎技术,在语音识别率以及多轮语音交互的处理等方面,已经显著领先于竞争对手。
而且,这并不是搜狗第一次展现自己在智能语音方面的技术能力,以及布局人工智能技术的决心。在今年6月份的搜狗输入法十周年上,搜狗CEO王小川就提出了将人工智能定位搜狗输入法的下一阶段战略发展的新方向,搜狗CTO杨洪涛则首次透露了搜狗输入法的快速分享、聪明回复和妙笔修饰等目前正在研发的三个能够增强用户表达能力的人工智能新技术;而在7月份刚刚结束的奇点创新者峰会上,搜狗CEO王小川更是直接邀请一名现场观众上台直接演示完全通过自然语音来发送一段短信息,这也体现了搜狗在其人工智能技术方面的强大自信。
搜狗知音引擎发布背后,搜狗早有“预谋”
另一方面,尽管搜狗今年才开始陆续对外展示自己在人工智能技术实力,但显然搜狗在人工智能的研究和布局并不是刚刚开始。实际上,搜狗在人工智能领域的研究和布局早已开始,搜狗CTO杨洪涛在知音交互引擎发布会上就透露:“搜狗从12年开始研发智能语音技术,并在13年开始进行 学习,自然交互和知识计算是搜狗在人工智能领域的两大战略方向,目前搜狗在人工智能领域的研发已经全面展开。”
搜狗在人工智能领域的布局不仅起步早,而且与谷歌、百度等搜索引擎公司一样,属于天生就拥有人工智能基因的公司。这是因为搜索引擎拥有海量的搜索数据,而通过数据挖掘之后,便能够实现人工智能的最后一个阶段-机器 学习。也因如此,我们看到,谷歌不仅推出了围棋机器人alphago,更是在更名为Alphabet后,全面转型成为了人工智能公司;而百度同样将人工智能作为其未来的一大发展方向。搜狗则在今年第一季度发布财报时,由搜狗CEO王小川首次明确其成为“中国人工智能领域的创新者和领先公司”的决心和野心。而与此相伴随的则是在人工智能技术方面的大手笔投入。最具有代表型的便是,今年4月份向清华大学捐赠1.8亿元,与其联合成立“清华大学天工智能计算研究院”,深入开展人工智能领域的前沿技术研究。这意味着搜狗开始全面从搜索引擎公司升级成为人工智能公司。
实际上,搜狗之所以能够在智能语音技术方面能够如此大的突破,除了具有人工智能基因和提早布局之外,更重要的还是要归功于搜狗在此前十几年的过程中,积累的数亿用户以及由此每天产生的海量交互数据,而这些为机器学习提供了优秀的“土壤”,也使得人工智能越来越聪明。搜狗语音交互引擎这一成果取得的背后,显然离不开日均语音搜索次数增长超过4倍的搜狗搜索和拥有海量词库、日均语音输入超过1.4亿次的搜狗手机输入法,正是这两大产品联手让搜狗智能语音成为目前国内语音输入功能使用量最大的移动手机产品,而这就意味着搜狗的语音交互技术有更多的“学习”机会。
不过,尽管搜狗语音交互引擎技术在当下已经足够让人惊艳,但是离电影《她》当中所描述的人工智能场景还有距离。比如《她》当中人工智能OS1除了帮助处理工作和生活琐事之外,还能够与人类恋爱,并深刻理解人类复杂的感情。显然,现在通过自然语言实现人机交互只是人工智能的第一步,未来真正实现拟人化的交流甚至更高级的情感交流才是更高的境界,也因如此,下一次搜狗们能够推出什么样的惊艳的产品或技术就更值得期待。
李东楼是著名的泛科技和营销类自媒体。除了这里,他还是新浪优秀专栏作者和科技名博,并是钛媒体、百度百家、新浪创事记、创业邦、快鲤鱼等多个专业科技网站专栏作者,搜狐IT、今日头条自媒体认证作者,百度阅读认证作家、《经理人杂志》、《东方国门》等传统媒体长期撰稿人。微信公众号:瑞莱观点
免责声明:此文内容为第三方自媒体作者发布的观察或评论性文章,所有文字和图片版权归作者所有,且仅代表作者个人观点,与 无关。文章仅供读者参考,并请自行核实相关内容。投诉邮箱:editor@fromgeek.com。
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。