(原标题:跟智能机器人谈感情 选谁配音很重要)
人工智能助理未来将并不仅限于“助理”的角色,甚至能够成为未来的“爱人”
在近期风靡全球的《西部世界》(Westworld)和《真实的人类》(Humans)等一系列美国科幻剧中,人工智能正在成为主角。
在现实生活中,虽然人工智能只是在特定领域使用,但是它正在以语音助理等方式出现在我们身边,并久而久之让人们依赖它们。很多人都有和Siri交谈的经历,甚至有网友用尽手段要求Siri演唱爆款神曲PPAP(“笔-菠萝-苹果笔”),自己在一边偷着乐。
“高德地图因为用了林志玲的配音,用户下载数量大增。”上海威盛电子语音交互部门研发总监张国峰对第一财经记者表示,“我们曾经调查过用户对于声音的喜好,品味区别很大。这就好比‘百里挑一’。”
而脸书(Facebook)最新通过网络投票选出了新的人工智能助手Jarvis配音者——好莱坞著名男演员摩根·弗里曼。人机交互专家认为,弗里曼在《冒牌天神》中扮演天神的角色,并为自然纪录片《帝企鹅日记》作旁白配音,他的声音和Jarvis此前的配音者小罗伯特·唐尼(RobertDowneyJr.)非常不同,能给用户带来新鲜感。虽然也有人质疑弗里曼的声音“太老了”,不像“助理”反而像“爷爷”。
美国媒体调侃说,这或许是因为扎克伯格害怕使用女声会冒犯了他的太太。
温柔体贴的“萨曼莎”
一个有趣的例子是,若言(化名)一直把他的任天堂WiiFit语音助手设置成女性的声音,结果不料一天他开机的时候系统却自动蹦出了男性声音,并在开始指导他做运动前说:“你平时的教练今天请假了。”若言对此感到非常不适应。
这在某种程度上说明,我们与人工智能间无意之中建立起来超越人与机器的亲密关系。
女性机器人的声音总是被赋予比较特别的挑衅力,尤其在当下社会的文化氛围中。一个最典型的例子就是斯派克·琼斯执导的电影《她》(Her)。由斯嘉丽·约翰逊(ScartletJohnson)配音的人工智能系统OS1的化身萨曼莎拥有迷人的声线,温柔体贴而又幽默风趣,这让主人公西奥多与萨曼莎很快发现他们如此的投缘,而且存在双向的需求与欲望。
这也是为什么从苹果iPhone的Siri再到GPS导航系统,人工智能开发者大多选用女声作为智能助理。微软最新的人工智能助手微软小娜(Cortana)和亚马逊的Alexa也都是女声。其中,苏珊·贝内特(SusanBennett)是苹果虚拟助理Siri最知名的声优,已经帮助数百万iPhone用户找到了最近的熟食店,虽然在iOS7中她已经被取代。而微软小娜的声音则来自简·泰勒(JenTaylor)。
使用女声一方面是因为她们“恭谦有礼,适合于传统服务者的角色”,另一方面也是因为女声更能够吸引男性的注意力。要知道,人工智能助理的使用者大多数为男性,而且他们还倾向于“调戏”智能助力。此外,苹果、Google、Facebook和亚马逊等公司人工智能开发部门超过70%的员工都是男性。
不难发现,使用名人的声音也是这些科技企业在为人工智能助手选择声音时首要考虑的。比如为数不多的使用男声的Facebook的人工智能助手Jarvis之前的配音就是钢铁侠的演员小罗伯特·唐尼。美国媒体调侃说,这或许是因为扎克伯格害怕使用女声会冒犯了他的太太。在很多时候,男性使用女声助理,会引起伴侣的不满。
事实上,用明星的声音俘获用户已经成为人工智能助理创新的要素。人们总是倾向于听到熟悉而且有名的声音,而不是冷淡的机器发声。最好的例子就是,“嗲妹妹”林志玲为高德带来了更多使用者。
芝麻科技创始人、CEO朱智告诉第一财经记者,语音交互系统声音的选择最近引起业内广泛的讨论。他说:“虽然众口难调,不同人的喜好不一样,但是我想可以有一个分类的方式,比如说根据用户标签分类,白领和小资用一种声音,妈妈或者孕妇用另一种声音,当然也可以提供多个声音版本让用户自己选择。”
机器将变成“爱人”
人工智能助理声音悦耳动听可以为用户带来精神上的愉悦是一方面,但是更重要的是,富有亲和力的声音能够提高人机交互的效率。当人们喜欢上人工智能助理的声音,不仅能够对他们助理的错误更加包容,而且更有意愿去和他们的助理互动交流。在“调戏”机器人的过程中,却能够帮助机器获取更多数据,从而起到培训机器学习的作用。
不过,也并非所有的科技公司都有Facebook、亚马逊、高德这样的资金实力去请明星配音。出门问问创始人CEO李志飞对第一财经记者表示:“我们会请声音清甜、普通话标准的口模来对人工智能系统进行配音。大明星花费高,但是好处是人们喜欢听到自己熟悉的声音。”
一些小的初创公司认为,目前更应该把钱投入到研发中。张国峰向第一财经记者表示:“目前人机交互的主要技术还是在于语音合成技术,比如如何正确断句、如何控制语调等。英文相对简单很多,只有问句才会用到声调,但中文每个字都有调。”
张国峰所说的语音合成技术,是一种能够逼真模拟人声的技术。今年9月谷歌的DeepMind实验室刚刚公布在这一领域的新突破。DeepMind的WaveNet语音合成系统能够模仿人类的声音,生成的原始音频比现有的技术和人类声音的差异缩小了一半。不过谷歌的研发人员表示,这种语音交互系统需要更加强大的计算能力,近期还不会被应用到真实世界中。
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。