7月4日- 5日,2018百度AI开发者大会在北京国家会议中心隆重举行,大会上展示了众多落地化成果。此次大会上百度首次举办AI设计论坛,百度设计体验委员会主席、百度人工智能交互设计院院长、百度用户体验中心总经理关岱松及设计团队分享了百度在AI设计和用户体验方面的经验及思考,共同交流AI智能美学及创意等方面的最前沿发展。论坛上百度与湖南大学的战略合作正式启动,整合百度在AI交互设计领域的优势和湖南大学先进的科研能力,双方将共建联合创新实验室及博士后基地,在AI设计领域进行更多更有价值的合作与探索。
百度人工智能交互设计院自成立以来,围绕智能语音交互界面设计节点开展了大量人因工程实验,分享了一系列的研究结论,这些结论已经被写入DuerOS的设备准出准入规范和设计指导原则之中,帮助DuerOS和开发者打造更符合人的需求和习惯的语音交互流程。进入人机交互研究的2.0阶段,百度人工智能交互设计院分享了他们在外观、自然交互、情感交互等领域的前沿探索案例,将AI时代做研究的方法升级,打造类人交互的智能体。
以下为演讲实录:
大家好,我是百度AI交互设计院的研究员李璇,去年11月百度成立了行业内第一个交互设计研究机构,很高兴借此机会跟大家分享我们的研究成果。面对AI时代为人机交互带来的巨大变化,如何通过研究引领交互设计,这是我们持续在探索的问题,而我们找到的答案,是人因工程。
什么是人因工程?通俗地说就是我们做设计,要把人知道的、不知道的自己,以做工程的思维,精准、量化、全面地研究得透透的,然后运用给到设计中。
人因工程不是一个全新的领域。在工业时代,人使用机器来提高生产效率,人机互动是纯物理的机械互动,人因工程研究的是人生理各方面的阈限,基于这些阈限做出在人可以承受的范围内效率最大化的设计。
在信息时代,人使用机器的替代一部分的认知劳动,人机互动是虚拟的认知交流,人因工程研究人的认知规律,来优化信息传递。
过去,人因工程奠定了对人体特征、认知规律进行研究和并运用于设计的基础,到了AI时代,因为人机交互方式和关系的变化,人因工程又有了新的延伸。
首先,AI技术让机器越来越像人,机器可以通过语音、手势、眼神等人类最自然的方式与人进行交流,甚至开始被赋予人的外形。人类不再需要去适应机器,而是机器适应人。其次,AI技术让机器越来越懂人,机器不仅懂我们的语言、肢体,甚至懂我们的动机、文化。此外,当机器越来越像人的时候,人机关系也会发生变化。人们过去对机器是冷冰冰的,但现在会将越来越多对人的情感、需求和预期都投射到机器上,机器带给人的体验变得更加复杂。
所以,AI时代的人因工程,将不仅仅关乎人的能力、行为、限制和特点,也关乎社会、文化和心理,是真正以人类为中心的系统工程。那么在这样的方法论和研究范畴中,我们具体在怎么做呢?
1.0将智能语音作为新交互方式,定义语音交互标准
对于人来说,语音对话是最自然、最高效的交流方式,语音交互是AI时代新交互形态的开端,但其实整个行业对语音交互设计还有很多疑问,为此,定义语音交互的体验标准是我们工作的开始。
首先,我们梳理出五个节点,通过唤醒、响应、输入、理解、输出,人和机器完成每一次的语音对话,为了打造好的语音对话体验,每一个节点都会对应很多设计要点需要被研究和定义。我们系统地梳理每个节点下的设计要点,并在这个框架下去逐步开展精细的实验,以确定最优的机器参数和反馈水平。比如从声学角度,研究了什么样的声音好听、怎么样的唤醒词好发音;从语言学角度,研究机器和人对话,什么样的话术好;从视觉认知角度,研究不同距离下的字号显示……最终我们输出了一系列的研究结论,并应用到了DuerOS的设备准出准入规范和设计指导原则之中,帮助DuerOS和开发者们打造更符合人的需求和习惯的语音交互流程。
2.0打造类人交互的智能体
在完成了对大部分语音交互节点的研究后,我们开始更加深入地去思考如何在此基础上,让人机交互更加类人,让人在面对AI产品的时候更加感知到它是一个智能体而不仅仅是机器。围绕这一点,在这里想跟大家分享我们认为在不久的未来比较重要的三个方面。
外观
首先,我们认为作为一个智能体,外观很重要,它影响着人对AI产品的第一印象和预期。围绕外观,可研究的问题有很多,而经常被争论的一个问题是,智能产品是否应该像人及多大程度上像人,即拟人度的问题,分享一点我们的研究。
我们将拟人度分为面部拟人和全身拟人进行拆解,然后通过实验去研究用户对不同拟人度的认知和喜好度,得到了一些有趣的结果。
比如在脸部造型上,两个眼睛或两个眼睛加鼻子的五官设计是相对比较保险的,增加嘴巴容易形成两极分化,说非常喜欢和非常不喜欢的比例都会增高,所以如果我们要进行拟人的脸部设计,对是否要“嘴巴”需要慎重。在全身拟人的设计上,“手”是一个关键部位,如果想要进行全身的拟人,最好将手带上。
这只是探讨外观的其中一项研究,我们还研究智能产品的设计风格、材质、尺寸、形状等等,并探得了人们对于不同智能产品的外观的认知要点和心理原型。
自然交互
在当下语音交互体验持续优化的基础上,我们认为走向自然交互是人机交互方式的发展趋势。所谓的自然交互是以人为中心,参照人类信息输入输出通道的交互方式。人类通过视、听、触、味、嗅接收信息,通过文字、语音、肢体、眼神、表情等来进行表达。
在人的信息接收方面,视觉和听觉能够满足90%以上的信息需求。所以,机器在自然交互中的信息输出,最重要的是解决如何有效的让视觉和听觉信息相互配合的问题。在这个方面,我们借助眼动仪对用户视觉资源分配情况进行了量化研究,衡量了不同设计方案中视听信息的配合情况。
在人的信息表达方面,语言结合肢体,尤其手势是人类最常见、也最自然的表达方式。虽然人们在生活中经常使用手势,但如何将人类自然手势转化为人机交互语言,目前没有成熟的交互方案,大家都还没有经验。
我们邀请用户来到实验室,去观察要实现各种操作时,用户最自然的手势反应。我们得到了近800个手势,根据通用性和可理解性进行筛选,形成一套最优手势集。然后,借助绿野仙踪的方法,也就是通过后台人为操作来实现的用户体验手势交互效果,我们让用户摆脱遥控器,用语音和手势来操控设备,借助脑电、肌电等技术对操作过程中的情感体验、心理负荷及操作疲劳进行测量,我们去衡量交互操作背后的自然体验,最终筛选出在不同情境和操作下手势和语音配合最优的设计方案,也应用到了DUEROS的设计中。
对于自然交互,我们还会去探讨更多的感知觉通道,来完善自然交互的设计。语音交互还是自然交互,对于机器来说都是交互通道的问题,触碰的是人的感知觉。而继续进化的下一步,我们认为是情感交互。这将是一个很大的飞越,它让机器可以触碰人的内心。
情感交互
情感交互是让机器具有类似人一样观察、理解和表达情绪的能力,而要做到这一点,机器需要对人情绪进行准确地识别和合理的应对。
人与人进行交流时,通过表情、内容、语气语调、肢体四个通道来表达和接受情绪情感。达尔文说过,能够从表情中识别情绪从而对对方的行为作出预判,是动物得以生存进化的重要技能。为此表情无疑是最主要也最被广泛研究的,让机器识别人类情绪的重要课题,我们正在进行这方面的研究。
在情绪应对方面,我们研究高情商的人怎么应对愤怒、挫败等负面情绪,研究咨询师怎么开导痛哭流涕的来访者,研究好朋友和陌生人在表达关心时候的差别,从中提取好的应对策略赋予机器。为了验证这些应对策略,我们在实验中通过VR模拟场景诱发用户的情绪,然后让AI去平复。关于情绪识别和应对的研究,也应用到了机器人的交互设计之中,期待未来跟大家分享更多。
最后,作为专注于研究的团队,我们还想分享在面对这些全新领域时,研究方法上的一些心得。
第一,因为研究领域越来越前沿,我们需要在研究中去创造体验交互和场景。
第二,由于我们追求的是更加多元、立体的体验,我们需要越来越多的引入生理测量来度量交互体验,目前脑电、肌电和眼动是相对成熟的工具。
第三,人脸、声纹、语气等识别技术帮助我们获得大量隐藏在行为背后的数据,如用户的情绪、需求、动机等,而大数据的运算帮助我们构建常模。
过去我们为基础语音交互定义标准,未来我们将投入更多的精力去打造能够进行自然交互、情感交互的智能体。
而基于心理学对人的构建,认知、情感和意志,所以在更超前的地方,我们还可以研究探讨如何赋予机器意志、让他可以有目的、有动机地进行主动交互,以及在类人互动下的人机关系,甚至人和机器两个物种之间的伦理问题。
未来的路还很长,百度AI交互设计愿意与大家进行持续的交流和探讨,一起成为AI交互设计领域的开路者和探路者。谢谢大家!
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。