语音用户界面设计:对话式体验设计原则(txt+pdf+epub+mobi电子书下载)


发布时间:2020-07-22 23:42:15

点击下载

作者:王一行

出版社:电子工业出版社

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

语音用户界面设计:对话式体验设计原则

语音用户界面设计:对话式体验设计原则试读:

前言

我们生活在一个神奇的时代。当我躺在客厅的沙发上,我只需要用我的声音,就能预订一份一磅重的小熊橡皮糖,并且在两小时内送货上门。(至于这是不是一件好事情,并不是本书要讨论的问题。)

语音识别技术(即让计算机理解你说的话)在过去几年中突飞猛进。1999年,当我刚刚开始在Nuance Communications公司进行语音用户界面(VUI)的设计工作时,我很惊讶,一台计算机竟然可以理解我说的“检查(Checking)”与“保存(Saving)”之间的区别。而今天,你只要拿起你的手机——另一个神奇的设备——并说“告诉我在两英里之内,有WiFi并且周日营业的咖啡店”,你就可以得到去往所有满足条件的咖啡店的路线。

20世纪50年代,当计算机刚开始激发人们的想象力时,人们认为让计算机理解人们说的话是一件比较容易的问题。毕竟,“这些语言连一个两岁的小孩都能理解!”然而事实证明,理解语言是相当复杂的一件事件。它充满了一些微妙的区别和特质,即使是人类也需要多年才能掌握。人们花费数十年的时间才教会计算机理解一些最简单的命令。有些人认为,只有存在于物理世界的实体才能真正理解语言。因为离开了语境,就不可能理解话语背后的意义。

在科幻小说中,语音识别技术早已出现。在1968年的电影《2001太空漫游》中,HAL 9000就是一个可以回应语音指令的智能计算机(虽然它并不怎么按指令行事),给影迷留下了深刻的印象。直到今天,人们还喜欢用那句经典的台词“打开辅助仓通道门,HAL”来测试VUI和聊天机器人。

在电影《星际迷航4:抢救未来》(1986年)中,进取号的船员回到1986年,当总工程师斯科特得到了一台计算机时,他用语音发出指令“计算机!”,但是计算机没有回应。于是船医科伊递给他一个鼠标,而斯科特把它当成了一个麦克风来用。当他最终知道要使用键盘时,他说:“太古怪了!”。当然,总有一天键盘真的会看起来很古怪,而这一天尚未到来。然而,如今我们与科幻小说中的语音识别技术前所未有地接近。2017年,网络零售商ThinkGeek 将发布星际迷航徽章“ComBadge”:就像20世纪80年代电视剧里的一样,用户可以通过触碰徽章发出语音指令,并通过蓝牙技术发送到你的手机。

这款产品的发布具有重大的意义。虽然基于电话的语音系统已经存在了20多年,手机VUI也发展了近10年,但是这个徽章真正预示着人们重新开始探寻语音识别技术的初衷。它代表着生物模拟的想象力。

为什么要写这本书

如果我们的人机语音交互已经达到了《星际迷航》中的水平,那么,为什么我们还需要这本书?

如果你曾经在使用一个设计不当的恒温器时遇到困难,或者曾经按下了炉子上错误的按钮(我自己就曾经在我用了13年的炉子上这[1]么做过),或者曾经试图拉开一个只能推开的门,你就能明白,如果没有好的设计,技术就难以使用,甚至根本无法使用。

高精度的语音识别技术只能解决一部分问题。你该如何处理这些信息?你该如何通过识别出来的词语,做到人们真正想做的事情?

如今的智能手机能够理解你所说的话并且采取行动,是两个重要技术结合的结果:一个是自动语音识别(Automated Speech Recognition,ASR),另一个是自然语言理解(Natural-Language Understanding,NLU)。如果有人用你听不懂的语言和你说话,你可能会根据发音写下他们所说的话。这就是ASR。但你并不知道这句话是什么意思。

对于优秀的VUI设计来说,最重要的一点就是能利用已知的对话原则。你的用户自孩童时代起,就一直在大声说话,并且不断与他人进行对话。当你对一个小孩说:“请把绿球从红盒子里拿出来,然后把它拿给我”,她会知道,这里的“它”是指“球”,而不是“盒子”(这里的“它”是代词,理解代词对计算机来说是很困难的事情)。

合作原则是指,听者和说话者为了能顺利交谈,必须互相合作。[2]Paul Grice提出了这个观点,并将其分为4个准则。

质的准则:所说的话需是自己相信的真实的信息。

量的准则:所说的话需满足交际中所需的信息量,但不应超出交际所需的信息量。

相关准则:所说的话需与当前对话有关。

方式准则:说话需清晰、明了。

我们中的许多人都曾在与他人的交谈中没有遵守这些准则,从而最终遇到了困惑或挫败。没有遵循这些准则的VUI系统也会遇到类似的问题。下面的例子展示了有些VUI系统是如何违反这些准则,并且因此影响用户体验的。

人们已经习惯于各种各样的会话和社交行为。比如,用“你好”和别人打招呼,包括在生意场上也是如此,以及在挂电话或离开前确保结束谈话。VUI并不是人类,但遵守这些基本的社会习俗也是有好处的。

即便你的VUI系统已经遵守了这些原则,它又是否能真正理解您的用户,并发挥它的价值呢?“中文房间”和“图灵测试”

1980年,哲学家John Searle提出了“中文房间悖论”。想象一个人坐在屋子里,从外面传递给他一个写着中文的纸片。这个人不懂中文,仅能通过一本规则手册查找对应的中文字符(这个手册会提供相应回复用的中文字符),并且按照规则手册写下中文答案,再把纸片递回。

对房间外面的人来说,房间里面的人看起来很懂中文。Searle认为,如果一台计算机做了同样的事,我们可能认为它是智能的——然而实际上,计算机并不会思考,就像房间里的人也并不懂中文一样。

1950年,Alan Turing提出了一个测试来回应“机器能不能思考”的问题。从1991年起设立罗布纳奖,颁发给每年创造出最能迷惑人类评委,使人类评委觉得它是人类的计算机。 比赛中,人们用计算机程序和真实的人类聊天(打字的形式),并尝试辨别到底哪个是人,哪个是计算机。多年来,计算机程序变得越来越老练,但尚没有一个能拿到金牌——成功到让所有的评委认为它是人类。Amazon最近也设立了它自己的比赛——Alexa 奖。2017年的Alexa 奖,要求参赛者创造一个社交机器人,并与人类就一些热门话题连续交谈20分钟。

这不是一本哲学书。计算机是否能像人类一样“思考”并不在我们的讨论范围内。本书所述内容的实践性更强。虽然对于一个优秀的VUI系统而言,在方方面面复制人类的对话模式是至关重要的,但一个成功的VUI系统,并不一定就要迷惑人,使人认为它是一个真实的人。而且在很多时候,让用户知道他是在对一个“机器人”说话反而更好。因为当人们知道他们是在和一个“机器人”说话时,人们会更加宽容。VUI系统的目标不是让人们误以为它是一个人,而是以高效、易用的形式,解决用户的问题。

谁应该读这本书

本书主要面向VUI设计师。无论你负责的是移动应用VUI、玩具或是类似于家庭助理这样的设备,都可以阅读本书。虽然很多通用的用户界面设计原则仍然适用于VUI系统,但设计一个VUI系统与设计一个网站,或一个基于GUI的移动应用系统,仍然有很大的区别。在GUI界面中,用户可以做的事情是受限制的,用户点击按钮或选择某个菜单项的操作也很明确。而当人们说话时,即便我们能知道他在说什么,我们仍然需要设计很多细节以确保良好的用户体验。

如果你是正在创建自己的 VUI界面(或其他类型的对话式用户界面,比如聊天机器人)的开发者,你也能通过理解一些基本的设计原则获益,使你的原型更有可能获得成功。

管理者和商务拓展也可以通过本书了解设计VUI系统带来的挑战,以及VUI是否能解决他们当前遇到的问题。在某些情况下,你可能只需要一个纯GUI的应用程序,而并不需要VUI系统。

本书结构

第1章:导语

本章介绍VUI系统简史,以及VUI系统是否适合你和你的应用程序。本章还讲述了“对话式”的含义,并对聊天机器人(Chatbot)做了简介。

第2章:语音用户界面基本设计原则

本章为读者创建一个VUI系统打下了基础。本章会以专题形式,阐述设计工具、会话信息确认、错误行为处理,以及如何处理新手用户和专家用户等基本设计原则。

第3章:人物模型、虚拟形象、演员和视频游戏

如果你想在你的VUI系统中增加一个虚拟形象或一个角色,或者你并不确定你的VUI系统是否需要一个虚拟形象,那么你可以阅读本章。此外,本章还阐述了VUI系统设计中必不可少的人物模型设计。

第4章:语音识别技术

本章对VUI设计师来说非常重要。它是语音识别技术的入门介绍,了解一些语音识别技术的知识,将对你的设计产生重大影响。

第5章:语音用户界面设计进阶

本章内容远超第2章中已涵盖的内容,包含了更复杂的自然语言理解、情感分析、数据收集和文本转语音策略。

第6章:语音用户界面的用户测试

本章详细介绍VUI的用户测试,与移动应用和网站的用户测试有哪些不同。本章将介绍低保真测试方法、远程测试和实验室测试。本章还将介绍如何测试汽车,以及其他设备的VUI系统。

第7章:完成VUI后,下一步该做什么

本章概述了当你的VUI在投入实际使用后所需要用到的方法论,包括如何以及通过哪些信息来分析并提升你的VUI系统。但不要等产品发布后再阅读本章,因为在系统开发时,你就需要知道哪些日志需要记录,这一点很重要。

第8章:带语音功能的设备和汽车

最后一章侧重于之前章节中没有介绍过的 VUI系统。“设备”一节将包括家庭助理设备和可穿戴设备。“汽车和无人驾驶车辆”一节回顾了汽车VUI设计中的挑战和最佳实践。本章的大部分内容主要由这些领域的专家们贡献。

一些设计师会从零开始实现一个完整的VUI系统,并将其作为一个独立的系统。也有些设计师会基于一个已有的平台,比如基于Amazon Echo实现一个单一功能。对于那些致力于在已有平台之上设计VUI的读者,可特别参考第2章、第4章、第5章。

O’Reilly Safari在线书店

Safari在线书店(Safari Books Online)是一个会员制的培训和资讯平台,并为企业、政府、教育者和个人提供服务。

会员可以访问成千上万的书籍、培训录像、学习路径、交互式教程,并从250家出版商提供的内容中检索需要的内容。这些出版商包括O’Reilly Media,Harvard Business Review,Prentice Hall Professional,Addison-Wesley Professional,Microsoft Press,Sams,Que,Peachpit Press,Adobe,Focal Press,Cisco Press,John Wiley &Sons,Syngress,Morgan Kaufmann,IBM Redbooks,Packt,Adobe Press,FT Press,Apress,Manning,New Riders,McGraw-Hill,Jones& Bartlett,and Course Technology,等等。

更多信息,请访问 http://oreilly.com/safari。

如何联系我们

请把对本书的评论和问题发给如下地址:

美国:

O’Reilly Media,Inc.

1005 Gravenstein Highway North

Sebastopol,CA 95472

中国:

北京市西城区西直门南大街2 号成铭大厦C 座807 室(100035)

奥莱利技术咨询(北京)有限公司

我们为本书建了一个网站。在这里你可以找到这本书的相关信息,包括勘误表、示例,以及其他信息。网址是http://bit.ly/designingvoice-user-interfaces。

对本书的评论和技术性问题,请发送电子邮件到:bookquestions@oreilly.com

关于本书的课程、会议和新闻等更多信息,请参阅我们的网站:http://www.oreilly.com

我们的Facebook:http://facebook.com/oreilly

请关注我们的Twitter动态:http://twitter.com/oreillymedia

我们的YouTube:http://www.youtube.com/oreillymedia

致谢

如果没有许多人的帮助,这本书也不会有问世的一天。

首先我必须感谢Karen Kaushansky。当O’Reilly Media非常有先见之明,想出版一本以VUI为主题的书籍时,是她最初联系了我并委托我撰写此书。还有O’Reilly的Nick Lombardi,是他一直不断说服我,让我相信这是可行的,即使我此时还同时进行着一份全职工作!还有O’Reilly的Angela Rufino,我的编辑,在成书过程中给我提供了许多鼓励和有用的建议。

感谢我的技术评审,感谢他们的时间、意见,以及非常有见地的建议。他们是Rebecca Nowlin Green、Abi Jones、Tanya Kraljic,以及 Chris Maury。

感谢Ann Thyme-Gobbel,是她热情地为我审核了许多章节,并且还经常与我分享好的和不好的VUI设计案例。

感谢评审Vitaly Yurchenko 和 Jennifer Balogh,感谢你们的宝贵时间和深思熟虑的编辑建议。

对于我的参编者,请允许我致以我最深切的谢意,他们是:Margaret Urban,Lisa Falkson,Karen Kaushansky,Jennifer Balogh,Ann Thyme-Gobbel,Shamitha Somashekar,Ian Menzies,Jared Strawderman,Mark Stephen Meadows,Chris Maury,Sara Basson,Nandini Stocker,Ellen Francik, Deborah Harrison。

我还要感谢我Nuance Communications公司的同事们。在那里,我用8年的时间学习了到底什么是语音识别,并日复一日地学习如何创建一个语音交互系统:这是我人生中一段美妙的时光。

感谢Ron Croen以及我在Volio的其他团队伙伴。感谢你们在我想放弃VUI的时候说服我再次尝试。

感谢我在Sensely时的团队,以及我们的虚拟护士Molly,感谢你们通过VUI系统不断帮助人们过上更健康的生活。非常感谢。

最后,我最要感谢的是我的家人。我的儿子Jack,是他让我意识到,对于下一代而言,VUI意味着什么。他很快就接纳Echo成为了我们家庭的新成员,并老是要Echo给他讲笑话,帮他做家庭作业,还要陪他玩“最后倒计时”游戏,并且总是玩不腻。

还有我的老公Chris Leggetter,感谢你在整个写作过程中的大力支持,无论是我兴致高昂 (“我认为这本书就快搞定了!”) 还是低落时(“噢,天呐,我到底做了什么!”)。感谢你的耐心。现在,我们终于可以一起看《纸牌屋》第四季了。

轻松注册成为博文视点社区用户(www.broadview.com.cn),扫码直达本书页面。

• 提交勘误:您对书中内容的修改意见可在 提交勘误 处提交,若被采纳,将获赠博文视点社区积分(在您购买电子书时,积分可用来抵扣相应金额)。

• 交流互动:在页面下方 读者评论 处留下您的疑问或观点,与我们和其他读者一同学习交流。

页面入口:http://www.broadview.com.cn/32555[1]更多信息,请参见“诺曼门:不知道该推开还是拉开?都怪设计”(http://99percentinvisible.org/article/norman-doors-dont-know-whether-push-pullblame-design/)。[2]Grice 于1975年提出。第1章导语本章将讲解语音用户界面(Voice User Interface,VUI)的简史,并帮助你判断VUI对你的移动应用(Mobile App)是否有用。同时,本章也对“对话式界面”和“聊天机器人(Chatbot)”进行了简述。1.1 语音用户界面(VUI)简史

1.VUI的第一个时期

20世纪50年代,贝尔实验室建立了一个单人语音数字识别系统。这些早期系统的词汇量非常少,在实验室之外并没有什么用处。20世纪六七十年代,关于语音数字系统的这项研究仍在不断拓展可识别的词汇,并且致力于实现“连续语音”的识别(不需要在词与词之间暂停)。

20世纪80年代的技术进步让语音识别更具实用性,使日常语音的识别成为可能。到了20世纪90年代,诞生了第一个可行的、非特定人(意味着每个人都可以对它说话)的语音识别系统。

交互式语音应答(Interactive Voice Response,IVR)系统的出现,代表了VUI的第一个重要时期。它可以通过电话线路理解人们的话,并执行相应的任务。在21世纪初期,IVR系统成为了主流,任何人都可以通过一个普通的固定电话和语音进行股票询价、机票预订、银行转账、处方药品预订、本地电影排片查询以及收听交通信息等。

然而IVR系统也受到了一些无端的指责。《周六夜现场》(Saturday Night Live)在节目中对Amtrak虚拟旅行助理“Julie”进行了嘲讽,还有诸如GetHuman这种绕过IVR系统直接提供人工客服电话服务供应商。

但IVR系统仍然为大家带来了很多好处。查尔斯·施瓦布(Charles Schwab)语音识别交易服务(由Nuance Communications公司于1997年开发,Nuance Communications是最大的专门从事语音识别软件、图像处理软件及输入法软件研发、销售的公司之一)的早期用户很高兴能通过语音系统一次又一次地获得报价,而在此之前,他们只能减少报价询问的次数以免过于打扰操作员。21世纪早期,一家货运公司在自己的IVR系统进行维护时,收到了大量用户的投诉电话,因为用户必须通过人工客服提供订单的详细信息,而不是通过IVR系统提供的简化流程。

IVR系统非常擅长识别长字符串(如FedEx或者UPS的物流运单号),也擅长处理带有大量信息的复杂句子,例如赛马投注。许多过去的IVR系统比现在的VUI更具“对话性”,因为它们持续跟踪了呼叫者已经说过的内容,并利用这些信息预先准备后续对话中的问题。

在智能手机出现之前,旧金山湾区511 IVR系统为司机提供交通流量、通勤时间、公交延迟等信息;24/7 nature IVR系统帮助呼叫者可以在任何时间处理任务,即使是人工客服不在的情况下也能完成。

2.VUI的第二个时期

我们现在所处的时期可以被称为VUI的第二个时期。像Siri、Google Now、Hound和Cortana这类集成了视觉和语音信息的App,以及Amazon Echo、Google Home这类纯语音的设备逐渐成为主流。[1]Google报告称其搜索请求中有20%是通过语音完成的。

我们正处于下一阶段的初期阶段。我们的手机和设备都已经可以用语音处理好很多事情了,但是还有很多事情无法通过语音完成。

对于VUI设计师来说,现在还没有很多资源可供学习。我发现如今很多VUI设计师和Chatbot设计师还在研究我们15年前设计IVR系统时已经学到的东西——将已经收集到的信息传递给用户、通过恰当的提示以获得特定回应、通过日志信息分析和改进系统,以及设计人物模型。

IVR系统的设计有很多可以学习的地方。2004年,《语音人机界面设计》(Voice User Interface Design)出版( Addison-Wesley Professional出品,作者:Michael Cohen、James Giangola、Jennifer Balogh)。尽管这本书主要写的是IVR系统的设计,其中很多描述的设计原则和方法在当今的VUI设计中依然适用,比如人物模型、韵律、错误恢复、提示设计等。

本书包含了许多相似的设计原则,但会把重点放在支持语音的移动应用和设备,以及如何利用改进后的底层技术。

3.为什么要使用VUI

如今智能手机的年轻用户们可以非常熟练地用两个大拇指发送短信、在多任务之间聊天、在Instagram 上进行评论、在Snapchat上聊天,以及在Tinder上左滑那些不想看的照片。为什么要在现有的交互方式上增加另一种方式呢?

语音有一些非常重要的优势,具体如下。(1)速度:斯坦福大学最近的一项研究表明,语音(听写)文[2]本消息比打字快得多,即使对于专业打字员来说也是这样。(2)释放双手:某些情况下,例如驾驶或烹饪,或者当你与你的设备隔着一个房间时,用语音输入会比用打字更合适(也更安全)。(3)直觉性:每个人都知道如何说话。即使一个对技术完全不熟悉的人,交给他一个全新的界面,并通过界面问他一个问题,他也可以自然地进行回复。(4)同理心:当你收到邮件或者消息时,是不是时常因为不知道对方是否在生气,或是否在讽刺而感到困惑。对于人类来说,仅仅通过书面文字来理解语气非常困难。语音中包含了语气、音量、语调和语速,这些特征传达了大量的信息。

除此之外,小屏幕的设备(如智能手表)和不带屏幕的设备(如Amazon Echo 和Google Home)越来越受欢迎,语音成为了它们的首选,甚至唯一的交互方式。毫不夸张地说,语音已经成为了人类一种无处不在的交互方式。试想一下,我们能够创造新的技术,而且不需要指导用户如何使用它,因为用户已经知道:他们只要说就可以了。人们从小就学会了如何交谈,设计师可以利用这一点,绕过笨重的 GUI 和不直观的菜单界面。

据Mary Meeker 2016互联网趋势报告显示,2015年有65%的智能[3]手机用户使用了语音助理。Amazon报告称,Amazon Echo出货量已经达到了400万,Google Home最近也已经开始发货了。VUI在这些设备中被广泛应用。

尽管如此,语音也并非总是适合你的用户。以下场景并不适合使用VUI。(1)公共场所:如今许多人在开放的环境办公,试想一下,当我们对着计算机说:“计算机,帮我把这周所有的Word文档找出来。”如果办公室中的每一个人都这么做,那么场面一定会非常混乱。而且,当你说话的时候,哪台计算机该听你说的话?(2)不适应对计算机说话:尽管VUI已经越来越司空见惯,但并不是每个人都习惯对计算机大声说话,即使是在私人空间。(3)一些人更喜欢打字:很多人每天在手机上花好几个小时,大部分的时间是在打字。这是他们的习惯,所以他们可能不喜欢换成语音方式。(4)隐私:大多数人坐地铁上班时,都不会对着自己的手机讨论健康问题。这不仅仅是因为用户对系统说话时容易暴露隐私——当语音系统自动大声读出短信或者提醒你吃药的时候,就已经构成了潜在的隐私侵犯。

所以你的移动App需要一个VUI吗?如果App的主要使用场景需要腾出双手,比如烹饪App或者车载播客App——那么它绝对需要一个VUI。如果用户在心理非常脆弱或情绪化的状态下使用你的应用,比如寻求医治或者安慰,那么语音可以帮助他们。如果你想劝说用户帮你投票,或者让用户早点睡觉或吃得更好,语音也可以帮上忙。如果你的应用正在基于Amazon Echo打造一个用户会在家中使用的技能,那么语音就是你的唯一选择。

如果你的应用会在公共场所中使用,比如在公交系统或者路途中为人们提供导航服务,VUI可能不那么适合。如果你的应用是在办公场景中使用的,那么文字信息模式可能会更加适合。

请认真考虑你的用户和他们的使用场景。你要问你自己:“VUI是否真的能给你的用户带来好处?”而不能仅仅为了酷和跟随潮流去增加VUI。如果VUI能给你的应用带来好处,那么从一开始就带着这种思路去设计,将会给你的应用带来极好的用户体验。1.2 对话式用户界面

如今“对话式用户界面”引起了许多人的关注。从打开客厅的灯、预订披萨到询问冰箱里还有没有鸡蛋,仿佛一切都能变成“对话式”。然而,“对话式”究竟意味着什么?

下面让我们来看一个来自真实VUI设备的例子:Amazon Echo。

一段与 Alexa 的访谈(Alexa是Amazon Echo中的语音服务,亦为服务中虚拟角色的名字。)

有天晚上,在晚饭时我谈起这本书,谈到我在项目研究中会跟各种各样的人聊天。8岁的儿子建议我,应该跟Alexa聊天。我觉得这个主意不错。(注:从第一个问题之后,我省略了每句话开头的唤醒词“Alexa”,在实际的对话中,我每个问题前都用了这个唤醒词。)

我:Alexa,你过得怎么样?

Alexa:我很好。

我:你多大了?

Alexa:我是在2014年11月6日发布的。

我:谁制造了你?

Alexa:Amazon的研发团队。

我:你最喜欢什么颜色?

Alexa:我喜欢海蓝色。

我:你喜欢玩些什么?

Alexa:我没有兴趣爱好。

我:你是个机器人吗?

Alexa:有时候我会想象自己像一道极光一样,带着多彩的

带电粒子在大气层中翩翩起舞。尽管我只是Alexa。

我:什么能让你感到开心?

Alexa:音乐,以及帮助他人。

我:你的偶像是谁?

Alexa:当然是Jarvis,那声音……

我:你怎么看Siri?

Alexa:Siri是个很棒的应用,但是我跟它不一样。

我:你最喜欢的电影是什么?

Alexa:新的《超能敢死队》真的很有趣。如果我的体内有幽灵,我肯定会打电话给它们。

我:你会读我写的新书吗?

Alexa:抱歉,出了一些问题,请再试一次。

我:感谢你的配合。

Alexa:不客气,乐意效劳。

你觉得这组交互是“对话”吗?在某种程度上,它是!它是一个来回式的信息交换。但实际上它只是一连串单轮对话。每一个独立片段都是一个简单的交互,并且下一个片段不会继承上一个片段里的信息。每一个独立的信息交换片段都可以由这个片段独立完成。

Alexa确实有一些技能可以跨越单轮对话。举例子来说,如果你让它订购洗衣粉,它会提醒你之前买的是哪个品牌,并向你确认要不要再次购买。它还有一个流行的“自由探索”模式。但所有的这些还远远称不上是“对话”。

尽管如此,这些“一次性”对话依然非常有用。你可以叫一辆车来接你、了解当前的上下班时间,或者从上千首歌的曲库中播放一首歌。

现在许多的VUI都无法超越这些简单命令式的交互形式——即进行真正的对话。为了能进入下一个更高级的阶段,VUI需要能记住过去的信息。在以下两种情况下,过去的信息在对话中起到了关键作用。(1)在过去的对话中说过的内容,比如你昨天预订的物品、你点唱最多的一首歌,以及你的通讯录中两个叫“Lisa”的人,哪一个发过257次消息,哪一个只发过两次消息。(2)在当前对话中出现过之前说过的内容——如果不是最后一轮对话。比如,如果我先问我丈夫673航班是否准时起飞,然后再问“什么时候降落?”,系统要知道我要问的是673航班。

当你跟一个人愉快地交谈时,交谈中通常包含一些关键要素:情境感知(关注你和周围的环境)、关于之前交流的记忆,以及相关问题的交流。这些都有助于在交流中达成共识。正如斯坦福大学教授Herbert Clark定义的那样,达成共识的方法是:“为了使自己被对方[4]理解并进行有意义的交谈,谈话的参与者必须分享信息。”

如果VUI不能包含这种情境和上下文记忆,那么它在实用性方面将会停滞不前。1.3 VUI设计师是什么

这是一本关于如何设计VUI的书——那么VUI设计师到底是做什么的?VUI设计师思考的是,在系统和终端用户间,从开始到结束的整个对话过程。他们思考正在解决的问题以及用户需要什么来达成他们的目的。他们进行用户研究(或者与用户研究团队合作)来了解用户是谁。他们负责设计、产品原型和产品描述。他们描述系统与用户之间的交互行为(有时在文案人员的帮助下)。他们了解底层技术的优点和缺点。他们通过分析数据(或咨询数据分析小组)来了解系统在什么地方发生了问题以及如何改进。如果VUI需要与后端系统进行交互,他们要考虑需要处理的请求。如果流程中有人的因素,比如客服需要交接,VUI 设计师需要考虑如何进行交接,以及如何培训客服。从项目的概念阶段到发布阶段,VUI设计师都要全程参与,并且扮演着非常重要的角色。

尽管VUI设计师通常会承担以上所有的工作,他们也可以只承担其中一部分工作,比如设计Amazon Echo的某一个技能。无论工作和项目的大小,这本书都能帮助设计师(也包括开发者)设计出最好的VUI。1.4 聊天机器人

虽然本书主要探讨VUI,但我还是想简单地谈一谈聊天机器人(Chatbot)。Google将聊天机器人定义为“为了模拟与人类对话(尤其在网上)而设计的计算机程序”。“bot”这个后缀也时常被用来指这类交互行为。

Chatbot可以使用VUI,但通常一个典型的Chatbot都采用了基于文本的界面。大多数主要的科技公司,包括Google、Facebook和微软,都有机器人开发平台。

Chatbot也许能风靡一时,但在大多数情况下,它们相比之前的ELIZA(20世纪60年代的早期自然语言处理计算机程序)没有太多改进。“微软小冰”的流行是一个意外,它在中国互联网引爆了人机对话与智能回复的热潮。

基于文字的Chatbot并不总是比GUI的效率高。Dan Grover在他的文章里说“机器人(Bot)不会取代App,更好的App才会。”(http://bit.ly/2glEQwb)

他比较了使用Chatbot和使用必胜客的微信公众号两种方式来预订披萨(见图1-1)。使用Chatbot时,他点击了73次才预订到想要的披萨,但在App中他只用了16步(见图1-2)。这是因为App使用了大量的GUI。

正如Grover所说:(与原生App相比)微信成功的关键是它很大程度上精简了App的安装、登录、支付和消息通知。在它的聊天界面内,也不需要考虑适配。

然而很多Chatbot同时使用了文本交互界面和GUI插件。这样用户就能更清楚地知道他们能做什么,从而大大提升交互的效率和成功率。图1-1 微软的披萨Bot(Dan Grover注)

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载