百度AI交互设计院前沿探路 打造类人交互智能体

7月4日- 5日,2018百度AI开发者大会在北京国家会议中心隆重举行,大会上展示了众多落地化成果。此次大会上百度首次举办AI设计论坛,百度设计体验委员会主席、百度人工智能交互设计院院长、百度用户体验中心总经理关岱松及设计团队分享了百度在AI设计和用户体验方面的经验及思考,共同交流AI智能美学及创意等方面的最前沿发展。论坛上百度与湖南大学的战略合作正式启动,整合百度在AI交互设计领域的优势和湖南大学先进的科研能力,双方将共建联合创新实验室及博士后基地,在AI设计领域进行更多更有价值的合作与探索。

百度人工智能交互设计院自成立以来,围绕智能语音交互界面设计节点开展了大量人因工程实验,分享了一系列的研究结论,这些结论已经被写入DuerOS的设备准出准入规范和设计指导原则之中,帮助DuerOS和开发者打造更符合人的需求和习惯的语音交互流程。进入人机交互研究的2.0阶段,百度人工智能交互设计院分享了他们在外观、自然交互、情感交互等领域的前沿探索案例,将AI时代做研究的方法升级,打造类人交互的智能体。

 

以下为演讲实录:

 

 

大家好,我是百度AI交互设计院的研究员李璇,去年11月百度成立了行业内第一个交互设计研究机构,很高兴借此机会跟大家分享我们的研究成果。面对AI时代为人机交互带来的巨大变化,如何通过研究引领交互设计,这是我们持续在探索的问题,而我们找到的答案,是人因工程。

 

什么是人因工程?通俗地说就是我们做设计,要把人知道的、不知道的自己,以做工程的思维,精准、量化、全面地研究得透透的,然后运用给到设计中。

 

人因工程不是一个全新的领域。在工业时代,人使用机器来提高生产效率,人机互动是纯物理的机械互动,人因工程研究的是人生理各方面的阈限,基于这些阈限做出在人可以承受的范围内效率最大化的设计。

 

在信息时代,人使用机器的替代一部分的认知劳动,人机互动是虚拟的认知交流,人因工程研究人的认知规律,来优化信息传递。

 

过去,人因工程奠定了对人体特征、认知规律进行研究和并运用于设计的基础,到了AI时代,因为人机交互方式和关系的变化,人因工程又有了新的延伸。

 

首先,AI技术让机器越来越像人,机器可以通过语音、手势、眼神等人类最自然的方式与人进行交流,甚至开始被赋予人的外形。人类不再需要去适应机器,而是机器适应人。其次,AI技术让机器越来越懂人,机器不仅懂我们的语言、肢体,甚至懂我们的动机、文化。此外,当机器越来越像人的时候,人机关系也会发生变化。人们过去对机器是冷冰冰的,但现在会将越来越多对人的情感、需求和预期都投射到机器上,机器带给人的体验变得更加复杂。

 

所以,AI时代的人因工程,将不仅仅关乎人的能力、行为、限制和特点,也关乎社会、文化和心理,是真正以人类为中心的系统工程。那么在这样的方法论和研究范畴中,我们具体在怎么做呢?

 

1.0将智能语音作为新交互方式,定义语音交互标准

 

对于人来说,语音对话是最自然、最高效的交流方式,语音交互是AI时代新交互形态的开端,但其实整个行业对语音交互设计还有很多疑问,为此,定义语音交互的体验标准是我们工作的开始。

 

 

首先,我们梳理出五个节点,通过唤醒、响应、输入、理解、输出,人和机器完成每一次的语音对话,为了打造好的语音对话体验,每一个节点都会对应很多设计要点需要被研究和定义。我们系统地梳理每个节点下的设计要点,并在这个框架下去逐步开展精细的实验,以确定最优的机器参数和反馈水平。比如从声学角度,研究了什么样的声音好听、怎么样的唤醒词好发音;从语言学角度,研究机器和人对话,什么样的话术好;从视觉认知角度,研究不同距离下的字号显示……最终我们输出了一系列的研究结论,并应用到了DuerOS的设备准出准入规范和设计指导原则之中,帮助DuerOS和开发者们打造更符合人的需求和习惯的语音交互流程。

 

2.0打造类人交互的智能体

 

在完成了对大部分语音交互节点的研究后,我们开始更加深入地去思考如何在此基础上,让人机交互更加类人,让人在面对AI产品的时候更加感知到它是一个智能体而不仅仅是机器。围绕这一点,在这里想跟大家分享我们认为在不久的未来比较重要的三个方面。

 

 

外观

 

首先,我们认为作为一个智能体,外观很重要,它影响着人对AI产品的第一印象和预期。围绕外观,可研究的问题有很多,而经常被争论的一个问题是,智能产品是否应该像人及多大程度上像人,即拟人度的问题,分享一点我们的研究。

 

我们将拟人度分为面部拟人和全身拟人进行拆解,然后通过实验去研究用户对不同拟人度的认知和喜好度,得到了一些有趣的结果。

 

比如在脸部造型上,两个眼睛或两个眼睛加鼻子的五官设计是相对比较保险的,增加嘴巴容易形成两极分化,说非常喜欢和非常不喜欢的比例都会增高,所以如果我们要进行拟人的脸部设计,对是否要“嘴巴”需要慎重。在全身拟人的设计上,“手”是一个关键部位,如果想要进行全身的拟人,最好将手带上。

 

这只是探讨外观的其中一项研究,我们还研究智能产品的设计风格、材质、尺寸、形状等等,并探得了人们对于不同智能产品的外观的认知要点和心理原型。

 

自然交互

 

在当下语音交互体验持续优化的基础上,我们认为走向自然交互是人机交互方式的发展趋势。所谓的自然交互是以人为中心,参照人类信息输入输出通道的交互方式。人类通过视、听、触、味、嗅接收信息,通过文字、语音、肢体、眼神、表情等来进行表达。

 

 

在人的信息接收方面,视觉和听觉能够满足90%以上的信息需求。所以,机器在自然交互中的信息输出,最重要的是解决如何有效的让视觉和听觉信息相互配合的问题。在这个方面,我们借助眼动仪对用户视觉资源分配情况进行了量化研究,衡量了不同设计方案中视听信息的配合情况。

 

在人的信息表达方面,语言结合肢体,尤其手势是人类最常见、也最自然的表达方式。虽然人们在生活中经常使用手势,但如何将人类自然手势转化为人机交互语言,目前没有成熟的交互方案,大家都还没有经验。

 

 

我们邀请用户来到实验室,去观察要实现各种操作时,用户最自然的手势反应。我们得到了近800个手势,根据通用性和可理解性进行筛选,形成一套最优手势集。然后,借助绿野仙踪的方法,也就是通过后台人为操作来实现的用户体验手势交互效果,我们让用户摆脱遥控器,用语音和手势来操控设备,借助脑电、肌电等技术对操作过程中的情感体验、心理负荷及操作疲劳进行测量,我们去衡量交互操作背后的自然体验,最终筛选出在不同情境和操作下手势和语音配合最优的设计方案,也应用到了DUEROS的设计中。

 

对于自然交互,我们还会去探讨更多的感知觉通道,来完善自然交互的设计。语音交互还是自然交互,对于机器来说都是交互通道的问题,触碰的是人的感知觉。而继续进化的下一步,我们认为是情感交互。这将是一个很大的飞越,它让机器可以触碰人的内心。

 

情感交互

 

情感交互是让机器具有类似人一样观察、理解和表达情绪的能力,而要做到这一点,机器需要对人情绪进行准确地识别和合理的应对。

 

人与人进行交流时,通过表情、内容、语气语调、肢体四个通道来表达和接受情绪情感。达尔文说过,能够从表情中识别情绪从而对对方的行为作出预判,是动物得以生存进化的重要技能。为此表情无疑是最主要也最被广泛研究的,让机器识别人类情绪的重要课题,我们正在进行这方面的研究。

 

在情绪应对方面,我们研究高情商的人怎么应对愤怒、挫败等负面情绪,研究咨询师怎么开导痛哭流涕的来访者,研究好朋友和陌生人在表达关心时候的差别,从中提取好的应对策略赋予机器。为了验证这些应对策略,我们在实验中通过VR模拟场景诱发用户的情绪,然后让AI去平复。关于情绪识别和应对的研究,也应用到了机器人的交互设计之中,期待未来跟大家分享更多。

 

最后,作为专注于研究的团队,我们还想分享在面对这些全新领域时,研究方法上的一些心得。

 

第一,因为研究领域越来越前沿,我们需要在研究中去创造体验交互和场景。

 

第二,由于我们追求的是更加多元、立体的体验,我们需要越来越多的引入生理测量来度量交互体验,目前脑电、肌电和眼动是相对成熟的工具。

 

第三,人脸、声纹、语气等识别技术帮助我们获得大量隐藏在行为背后的数据,如用户的情绪、需求、动机等,而大数据的运算帮助我们构建常模。

 

 

过去我们为基础语音交互定义标准,未来我们将投入更多的精力去打造能够进行自然交互、情感交互的智能体。

 

而基于心理学对人的构建,认知、情感和意志,所以在更超前的地方,我们还可以研究探讨如何赋予机器意志、让他可以有目的、有动机地进行主动交互,以及在类人互动下的人机关系,甚至人和机器两个物种之间的伦理问题。

 

未来的路还很长,百度AI交互设计愿意与大家进行持续的交流和探讨,一起成为AI交互设计领域的开路者和探路者。谢谢大家!