语音用户界面设计：对话式体验设计原则(txt+pdf+epub+mobi电子书下载)-txtepub下载

作者：王一行

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

语音用户界面设计：对话式体验设计原则试读：

前言

我们生活在一个神奇的时代。当我躺在客厅的沙发上，我只需要用我的声音，就能预订一份一磅重的小熊橡皮糖，并且在两小时内送货上门。（至于这是不是一件好事情，并不是本书要讨论的问题。）

语音识别技术（即让计算机理解你说的话）在过去几年中突飞猛进。1999年，当我刚刚开始在Nuance Communications公司进行语音用户界面（VUI）的设计工作时，我很惊讶，一台计算机竟然可以理解我说的“检查（Checking）”与“保存（Saving）”之间的区别。而今天，你只要拿起你的手机——另一个神奇的设备——并说“告诉我在两英里之内，有WiFi并且周日营业的咖啡店”，你就可以得到去往所有满足条件的咖啡店的路线。

20世纪50年代，当计算机刚开始激发人们的想象力时，人们认为让计算机理解人们说的话是一件比较容易的问题。毕竟，“这些语言连一个两岁的小孩都能理解！”然而事实证明，理解语言是相当复杂的一件事件。它充满了一些微妙的区别和特质，即使是人类也需要多年才能掌握。人们花费数十年的时间才教会计算机理解一些最简单的命令。有些人认为，只有存在于物理世界的实体才能真正理解语言。因为离开了语境，就不可能理解话语背后的意义。

在科幻小说中，语音识别技术早已出现。在1968年的电影《2001太空漫游》中，HAL 9000就是一个可以回应语音指令的智能计算机（虽然它并不怎么按指令行事），给影迷留下了深刻的印象。直到今天，人们还喜欢用那句经典的台词“打开辅助仓通道门，HAL”来测试VUI和聊天机器人。

在电影《星际迷航4：抢救未来》（1986年）中，进取号的船员回到1986年，当总工程师斯科特得到了一台计算机时，他用语音发出指令“计算机！”，但是计算机没有回应。于是船医科伊递给他一个鼠标，而斯科特把它当成了一个麦克风来用。当他最终知道要使用键盘时，他说：“太古怪了！”。当然，总有一天键盘真的会看起来很古怪，而这一天尚未到来。然而，如今我们与科幻小说中的语音识别技术前所未有地接近。2017年，网络零售商ThinkGeek 将发布星际迷航徽章“ComBadge”：就像20世纪80年代电视剧里的一样，用户可以通过触碰徽章发出语音指令，并通过蓝牙技术发送到你的手机。

这款产品的发布具有重大的意义。虽然基于电话的语音系统已经存在了20多年，手机VUI也发展了近10年，但是这个徽章真正预示着人们重新开始探寻语音识别技术的初衷。它代表着生物模拟的想象力。

为什么要写这本书

如果我们的人机语音交互已经达到了《星际迷航》中的水平，那么，为什么我们还需要这本书？

如果你曾经在使用一个设计不当的恒温器时遇到困难，或者曾经按下了炉子上错误的按钮（我自己就曾经在我用了13年的炉子上这[1]么做过），或者曾经试图拉开一个只能推开的门，你就能明白，如果没有好的设计，技术就难以使用，甚至根本无法使用。

高精度的语音识别技术只能解决一部分问题。你该如何处理这些信息？你该如何通过识别出来的词语，做到人们真正想做的事情？

如今的智能手机能够理解你所说的话并且采取行动，是两个重要技术结合的结果：一个是自动语音识别（Automated Speech Recognition，ASR），另一个是自然语言理解（Natural-Language Understanding，NLU）。如果有人用你听不懂的语言和你说话,你可能会根据发音写下他们所说的话。这就是ASR。但你并不知道这句话是什么意思。

对于优秀的VUI设计来说，最重要的一点就是能利用已知的对话原则。你的用户自孩童时代起，就一直在大声说话，并且不断与他人进行对话。当你对一个小孩说：“请把绿球从红盒子里拿出来，然后把它拿给我”，她会知道，这里的“它”是指“球”，而不是“盒子”（这里的“它”是代词，理解代词对计算机来说是很困难的事情）。

合作原则是指，听者和说话者为了能顺利交谈，必须互相合作。[2]Paul Grice提出了这个观点，并将其分为4个准则。

质的准则：所说的话需是自己相信的真实的信息。

量的准则：所说的话需满足交际中所需的信息量,但不应超出交际所需的信息量。

相关准则：所说的话需与当前对话有关。

方式准则：说话需清晰、明了。

我们中的许多人都曾在与他人的交谈中没有遵守这些准则，从而最终遇到了困惑或挫败。没有遵循这些准则的VUI系统也会遇到类似的问题。下面的例子展示了有些VUI系统是如何违反这些准则，并且因此影响用户体验的。

人们已经习惯于各种各样的会话和社交行为。比如，用“你好”和别人打招呼，包括在生意场上也是如此，以及在挂电话或离开前确保结束谈话。VUI并不是人类，但遵守这些基本的社会习俗也是有好处的。

即便你的VUI系统已经遵守了这些原则，它又是否能真正理解您的用户，并发挥它的价值呢？“中文房间”和“图灵测试”

1980年,哲学家John Searle提出了“中文房间悖论”。想象一个人坐在屋子里，从外面传递给他一个写着中文的纸片。这个人不懂中文，仅能通过一本规则手册查找对应的中文字符（这个手册会提供相应回复用的中文字符），并且按照规则手册写下中文答案，再把纸片递回。

对房间外面的人来说，房间里面的人看起来很懂中文。Searle认为,如果一台计算机做了同样的事，我们可能认为它是智能的——然而实际上，计算机并不会思考，就像房间里的人也并不懂中文一样。

1950年，Alan Turing提出了一个测试来回应“机器能不能思考”的问题。从1991年起设立罗布纳奖，颁发给每年创造出最能迷惑人类评委，使人类评委觉得它是人类的计算机。比赛中，人们用计算机程序和真实的人类聊天（打字的形式），并尝试辨别到底哪个是人，哪个是计算机。多年来，计算机程序变得越来越老练，但尚没有一个能拿到金牌——成功到让所有的评委认为它是人类。Amazon最近也设立了它自己的比赛——Alexa 奖。2017年的Alexa 奖，要求参赛者创造一个社交机器人，并与人类就一些热门话题连续交谈20分钟。

这不是一本哲学书。计算机是否能像人类一样“思考”并不在我们的讨论范围内。本书所述内容的实践性更强。虽然对于一个优秀的VUI系统而言，在方方面面复制人类的对话模式是至关重要的，但一个成功的VUI系统，并不一定就要迷惑人，使人认为它是一个真实的人。而且在很多时候，让用户知道他是在对一个“机器人”说话反而更好。因为当人们知道他们是在和一个“机器人”说话时，人们会更加宽容。VUI系统的目标不是让人们误以为它是一个人，而是以高效、易用的形式，解决用户的问题。

谁应该读这本书

本书主要面向VUI设计师。无论你负责的是移动应用VUI、玩具或是类似于家庭助理这样的设备，都可以阅读本书。虽然很多通用的用户界面设计原则仍然适用于VUI系统，但设计一个VUI系统与设计一个网站，或一个基于GUI的移动应用系统，仍然有很大的区别。在GUI界面中，用户可以做的事情是受限制的，用户点击按钮或选择某个菜单项的操作也很明确。而当人们说话时，即便我们能知道他在说什么，我们仍然需要设计很多细节以确保良好的用户体验。

如果你是正在创建自己的 VUI界面（或其他类型的对话式用户界面，比如聊天机器人）的开发者，你也能通过理解一些基本的设计原则获益，使你的原型更有可能获得成功。

管理者和商务拓展也可以通过本书了解设计VUI系统带来的挑战，以及VUI是否能解决他们当前遇到的问题。在某些情况下，你可能只需要一个纯GUI的应用程序，而并不需要VUI系统。

本书结构

第1章：导语

本章介绍VUI系统简史，以及VUI系统是否适合你和你的应用程序。本章还讲述了“对话式”的含义，并对聊天机器人（Chatbot）做了简介。

第2章：语音用户界面基本设计原则

本章为读者创建一个VUI系统打下了基础。本章会以专题形式，阐述设计工具、会话信息确认、错误行为处理，以及如何处理新手用户和专家用户等基本设计原则。

第3章：人物模型、虚拟形象、演员和视频游戏

如果你想在你的VUI系统中增加一个虚拟形象或一个角色，或者你并不确定你的VUI系统是否需要一个虚拟形象，那么你可以阅读本章。此外，本章还阐述了VUI系统设计中必不可少的人物模型设计。

第4章：语音识别技术

本章对VUI设计师来说非常重要。它是语音识别技术的入门介绍，了解一些语音识别技术的知识，将对你的设计产生重大影响。

第5章：语音用户界面设计进阶

本章内容远超第2章中已涵盖的内容，包含了更复杂的自然语言理解、情感分析、数据收集和文本转语音策略。

第6章：语音用户界面的用户测试

本章详细介绍VUI的用户测试，与移动应用和网站的用户测试有哪些不同。本章将介绍低保真测试方法、远程测试和实验室测试。本章还将介绍如何测试汽车，以及其他设备的VUI系统。

第7章：完成VUI后，下一步该做什么

本章概述了当你的VUI在投入实际使用后所需要用到的方法论，包括如何以及通过哪些信息来分析并提升你的VUI系统。但不要等产品发布后再阅读本章，因为在系统开发时，你就需要知道哪些日志需要记录，这一点很重要。

第8章：带语音功能的设备和汽车

最后一章侧重于之前章节中没有介绍过的 VUI系统。“设备”一节将包括家庭助理设备和可穿戴设备。“汽车和无人驾驶车辆”一节回顾了汽车VUI设计中的挑战和最佳实践。本章的大部分内容主要由这些领域的专家们贡献。

一些设计师会从零开始实现一个完整的VUI系统，并将其作为一个独立的系统。也有些设计师会基于一个已有的平台，比如基于Amazon Echo实现一个单一功能。对于那些致力于在已有平台之上设计VUI的读者，可特别参考第2章、第4章、第5章。

O’Reilly Safari在线书店

Safari在线书店（Safari Books Online）是一个会员制的培训和资讯平台，并为企业、政府、教育者和个人提供服务。

会员可以访问成千上万的书籍、培训录像、学习路径、交互式教程,并从250家出版商提供的内容中检索需要的内容。这些出版商包括O’Reilly Media,Harvard Business Review,Prentice Hall Professional,Addison-Wesley Professional,Microsoft Press,Sams,Que,Peachpit Press,Adobe,Focal Press,Cisco Press,John Wiley &Sons,Syngress,Morgan Kaufmann,IBM Redbooks,Packt,Adobe Press,FT Press,Apress,Manning,New Riders,McGraw-Hill,Jones& Bartlett,and Course Technology，等等。

更多信息，请访问 http://oreilly.com/safari。

如何联系我们

请把对本书的评论和问题发给如下地址：

美国：

O’Reilly Media,Inc.

1005 Gravenstein Highway North

Sebastopol,CA 95472

中国：

北京市西城区西直门南大街2 号成铭大厦C 座807 室（100035）

奥莱利技术咨询（北京）有限公司

我们为本书建了一个网站。在这里你可以找到这本书的相关信息，包括勘误表、示例，以及其他信息。网址是http://bit.ly/designingvoice-user-interfaces。

对本书的评论和技术性问题，请发送电子邮件到：bookquestions@oreilly.com

关于本书的课程、会议和新闻等更多信息，请参阅我们的网站：http://www.oreilly.com

我们的Facebook：http://facebook.com/oreilly

请关注我们的Twitter动态：http://twitter.com/oreillymedia

我们的YouTube：http://www.youtube.com/oreillymedia

致谢

如果没有许多人的帮助，这本书也不会有问世的一天。

首先我必须感谢Karen Kaushansky。当O’Reilly Media非常有先见之明，想出版一本以VUI为主题的书籍时，是她最初联系了我并委托我撰写此书。还有O’Reilly的Nick Lombardi，是他一直不断说服我，让我相信这是可行的，即使我此时还同时进行着一份全职工作！还有O’Reilly的Angela Rufino，我的编辑，在成书过程中给我提供了许多鼓励和有用的建议。

感谢我的技术评审，感谢他们的时间、意见，以及非常有见地的建议。他们是Rebecca Nowlin Green、Abi Jones、Tanya Kraljic，以及 Chris Maury。

感谢Ann Thyme-Gobbel，是她热情地为我审核了许多章节，并且还经常与我分享好的和不好的VUI设计案例。

感谢评审Vitaly Yurchenko 和 Jennifer Balogh，感谢你们的宝贵时间和深思熟虑的编辑建议。

对于我的参编者，请允许我致以我最深切的谢意，他们是：Margaret Urban,Lisa Falkson,Karen Kaushansky,Jennifer Balogh,Ann Thyme-Gobbel,Shamitha Somashekar,Ian Menzies,Jared Strawderman,Mark Stephen Meadows,Chris Maury,Sara Basson,Nandini Stocker,Ellen Francik, Deborah Harrison。

我还要感谢我Nuance Communications公司的同事们。在那里，我用8年的时间学习了到底什么是语音识别，并日复一日地学习如何创建一个语音交互系统：这是我人生中一段美妙的时光。

感谢Ron Croen以及我在Volio的其他团队伙伴。感谢你们在我想放弃VUI的时候说服我再次尝试。

感谢我在Sensely时的团队，以及我们的虚拟护士Molly，感谢你们通过VUI系统不断帮助人们过上更健康的生活。非常感谢。

最后，我最要感谢的是我的家人。我的儿子Jack，是他让我意识到，对于下一代而言，VUI意味着什么。他很快就接纳Echo成为了我们家庭的新成员，并老是要Echo给他讲笑话，帮他做家庭作业，还要陪他玩“最后倒计时”游戏，并且总是玩不腻。

还有我的老公Chris Leggetter，感谢你在整个写作过程中的大力支持，无论是我兴致高昂（“我认为这本书就快搞定了！”）还是低落时（“噢,天呐，我到底做了什么！”）。感谢你的耐心。现在，我们终于可以一起看《纸牌屋》第四季了。

轻松注册成为博文视点社区用户（www.broadview.com.cn），扫码直达本书页面。

•　提交勘误：您对书中内容的修改意见可在提交勘误处提交，若被采纳，将获赠博文视点社区积分（在您购买电子书时，积分可用来抵扣相应金额）。

•　交流互动：在页面下方读者评论处留下您的疑问或观点，与我们和其他读者一同学习交流。

页面入口：http://www.broadview.com.cn/32555[1]更多信息，请参见“诺曼门：不知道该推开还是拉开？都怪设计”（http://99percentinvisible.org/article/norman-doors-dont-know-whether-push-pullblame-design/）。[2]Grice 于1975年提出。第1章导语本章将讲解语音用户界面（Voice User Interface，VUI）的简史，并帮助你判断VUI对你的移动应用（Mobile App）是否有用。同时，本章也对“对话式界面”和“聊天机器人（Chatbot）”进行了简述。1.1　语音用户界面（VUI）简史

1.VUI的第一个时期

20世纪50年代，贝尔实验室建立了一个单人语音数字识别系统。这些早期系统的词汇量非常少，在实验室之外并没有什么用处。20世纪六七十年代，关于语音数字系统的这项研究仍在不断拓展可识别的词汇，并且致力于实现“连续语音”的识别（不需要在词与词之间暂停）。

20世纪80年代的技术进步让语音识别更具实用性，使日常语音的识别成为可能。到了20世纪90年代，诞生了第一个可行的、非特定人（意味着每个人都可以对它说话）的语音识别系统。

交互式语音应答（Interactive Voice Response，IVR）系统的出现，代表了VUI的第一个重要时期。它可以通过电话线路理解人们的话，并执行相应的任务。在21世纪初期，IVR系统成为了主流，任何人都可以通过一个普通的固定电话和语音进行股票询价、机票预订、银行转账、处方药品预订、本地电影排片查询以及收听交通信息等。

然而IVR系统也受到了一些无端的指责。《周六夜现场》（Saturday Night Live）在节目中对Amtrak虚拟旅行助理“Julie”进行了嘲讽，还有诸如GetHuman这种绕过IVR系统直接提供人工客服电话服务供应商。

但IVR系统仍然为大家带来了很多好处。查尔斯·施瓦布（Charles Schwab）语音识别交易服务（由Nuance Communications公司于1997年开发，Nuance Communications是最大的专门从事语音识别软件、图像处理软件及输入法软件研发、销售的公司之一）的早期用户很高兴能通过语音系统一次又一次地获得报价，而在此之前，他们只能减少报价询问的次数以免过于打扰操作员。21世纪早期，一家货运公司在自己的IVR系统进行维护时，收到了大量用户的投诉电话，因为用户必须通过人工客服提供订单的详细信息，而不是通过IVR系统提供的简化流程。

IVR系统非常擅长识别长字符串（如FedEx或者UPS的物流运单号），也擅长处理带有大量信息的复杂句子，例如赛马投注。许多过去的IVR系统比现在的VUI更具“对话性”，因为它们持续跟踪了呼叫者已经说过的内容，并利用这些信息预先准备后续对话中的问题。

在智能手机出现之前，旧金山湾区511 IVR系统为司机提供交通流量、通勤时间、公交延迟等信息；24/7 nature IVR系统帮助呼叫者可以在任何时间处理任务，即使是人工客服不在的情况下也能完成。

2.VUI的第二个时期

我们现在所处的时期可以被称为VUI的第二个时期。像Siri、Google Now、Hound和Cortana这类集成了视觉和语音信息的App，以及Amazon Echo、Google Home这类纯语音的设备逐渐成为主流。[1]Google报告称其搜索请求中有20%是通过语音完成的。

我们正处于下一阶段的初期阶段。我们的手机和设备都已经可以用语音处理好很多事情了，但是还有很多事情无法通过语音完成。

对于VUI设计师来说，现在还没有很多资源可供学习。我发现如今很多VUI设计师和Chatbot设计师还在研究我们15年前设计IVR系统时已经学到的东西——将已经收集到的信息传递给用户、通过恰当的提示以获得特定回应、通过日志信息分析和改进系统，以及设计人物模型。

IVR系统的设计有很多可以学习的地方。2004年，《语音人机界面设计》（Voice User Interface Design）出版（ Addison-Wesley Professional出品，作者：Michael Cohen、James Giangola、Jennifer Balogh）。尽管这本书主要写的是IVR系统的设计，其中很多描述的设计原则和方法在当今的VUI设计中依然适用，比如人物模型、韵律、错误恢复、提示设计等。

本书包含了许多相似的设计原则，但会把重点放在支持语音的移动应用和设备，以及如何利用改进后的底层技术。

3.为什么要使用VUI

如今智能手机的年轻用户们可以非常熟练地用两个大拇指发送短信、在多任务之间聊天、在Instagram 上进行评论、在Snapchat上聊天，以及在Tinder上左滑那些不想看的照片。为什么要在现有的交互方式上增加另一种方式呢？

语音有一些非常重要的优势，具体如下。（1）速度：斯坦福大学最近的一项研究表明，语音（听写）文[2]本消息比打字快得多，即使对于专业打字员来说也是这样。（2）释放双手：某些情况下，例如驾驶或烹饪，或者当你与你的设备隔着一个房间时，用语音输入会比用打字更合适（也更安全）。（3）直觉性：每个人都知道如何说话。即使一个对技术完全不熟悉的人，交给他一个全新的界面，并通过界面问他一个问题，他也可以自然地进行回复。（4）同理心：当你收到邮件或者消息时，是不是时常因为不知道对方是否在生气，或是否在讽刺而感到困惑。对于人类来说，仅仅通过书面文字来理解语气非常困难。语音中包含了语气、音量、语调和语速，这些特征传达了大量的信息。

除此之外，小屏幕的设备（如智能手表）和不带屏幕的设备（如Amazon Echo 和Google Home）越来越受欢迎，语音成为了它们的首选，甚至唯一的交互方式。毫不夸张地说，语音已经成为了人类一种无处不在的交互方式。试想一下，我们能够创造新的技术，而且不需要指导用户如何使用它，因为用户已经知道：他们只要说就可以了。人们从小就学会了如何交谈，设计师可以利用这一点，绕过笨重的 GUI 和不直观的菜单界面。

据Mary Meeker 2016互联网趋势报告显示，2015年有65%的智能[3]手机用户使用了语音助理。Amazon报告称，Amazon Echo出货量已经达到了400万，Google Home最近也已经开始发货了。VUI在这些设备中被广泛应用。

尽管如此，语音也并非总是适合你的用户。以下场景并不适合使用VUI。（1）公共场所：如今许多人在开放的环境办公，试想一下，当我们对着计算机说：“计算机，帮我把这周所有的Word文档找出来。”如果办公室中的每一个人都这么做，那么场面一定会非常混乱。而且，当你说话的时候，哪台计算机该听你说的话？（2）不适应对计算机说话：尽管VUI已经越来越司空见惯，但并不是每个人都习惯对计算机大声说话，即使是在私人空间。（3）一些人更喜欢打字：很多人每天在手机上花好几个小时，大部分的时间是在打字。这是他们的习惯，所以他们可能不喜欢换成语音方式。（4）隐私：大多数人坐地铁上班时，都不会对着自己的手机讨论健康问题。这不仅仅是因为用户对系统说话时容易暴露隐私——当语音系统自动大声读出短信或者提醒你吃药的时候，就已经构成了潜在的隐私侵犯。

所以你的移动App需要一个VUI吗？如果App的主要使用场景需要腾出双手，比如烹饪App或者车载播客App——那么它绝对需要一个VUI。如果用户在心理非常脆弱或情绪化的状态下使用你的应用，比如寻求医治或者安慰，那么语音可以帮助他们。如果你想劝说用户帮你投票，或者让用户早点睡觉或吃得更好，语音也可以帮上忙。如果你的应用正在基于Amazon Echo打造一个用户会在家中使用的技能，那么语音就是你的唯一选择。

如果你的应用会在公共场所中使用，比如在公交系统或者路途中为人们提供导航服务，VUI可能不那么适合。如果你的应用是在办公场景中使用的，那么文字信息模式可能会更加适合。

请认真考虑你的用户和他们的使用场景。你要问你自己：“VUI是否真的能给你的用户带来好处？”而不能仅仅为了酷和跟随潮流去增加VUI。如果VUI能给你的应用带来好处，那么从一开始就带着这种思路去设计，将会给你的应用带来极好的用户体验。1.2　对话式用户界面

如今“对话式用户界面”引起了许多人的关注。从打开客厅的灯、预订披萨到询问冰箱里还有没有鸡蛋，仿佛一切都能变成“对话式”。然而，“对话式”究竟意味着什么？

下面让我们来看一个来自真实VUI设备的例子：Amazon Echo。

一段与 Alexa 的访谈（Alexa是Amazon Echo中的语音服务，亦为服务中虚拟角色的名字。）

有天晚上，在晚饭时我谈起这本书，谈到我在项目研究中会跟各种各样的人聊天。8岁的儿子建议我，应该跟Alexa聊天。我觉得这个主意不错。（注：从第一个问题之后，我省略了每句话开头的唤醒词“Alexa”，在实际的对话中，我每个问题前都用了这个唤醒词。）

我：Alexa，你过得怎么样？

Alexa：我很好。

我：你多大了？

Alexa：我是在2014年11月6日发布的。

我：谁制造了你？

Alexa：Amazon的研发团队。

我：你最喜欢什么颜色？

Alexa：我喜欢海蓝色。

我：你喜欢玩些什么？

Alexa：我没有兴趣爱好。

我：你是个机器人吗？

Alexa：有时候我会想象自己像一道极光一样，带着多彩的

带电粒子在大气层中翩翩起舞。尽管我只是Alexa。

我：什么能让你感到开心？

Alexa：音乐，以及帮助他人。

我：你的偶像是谁？

Alexa：当然是Jarvis，那声音……

我：你怎么看Siri？

Alexa：Siri是个很棒的应用，但是我跟它不一样。

我：你最喜欢的电影是什么？

Alexa：新的《超能敢死队》真的很有趣。如果我的体内有幽灵，我肯定会打电话给它们。

我：你会读我写的新书吗？

Alexa：抱歉，出了一些问题，请再试一次。

我：感谢你的配合。

Alexa：不客气，乐意效劳。

你觉得这组交互是“对话”吗？在某种程度上，它是！它是一个来回式的信息交换。但实际上它只是一连串单轮对话。每一个独立片段都是一个简单的交互，并且下一个片段不会继承上一个片段里的信息。每一个独立的信息交换片段都可以由这个片段独立完成。

Alexa确实有一些技能可以跨越单轮对话。举例子来说，如果你让它订购洗衣粉，它会提醒你之前买的是哪个品牌，并向你确认要不要再次购买。它还有一个流行的“自由探索”模式。但所有的这些还远远称不上是“对话”。

尽管如此，这些“一次性”对话依然非常有用。你可以叫一辆车来接你、了解当前的上下班时间，或者从上千首歌的曲库中播放一首歌。

现在许多的VUI都无法超越这些简单命令式的交互形式——即进行真正的对话。为了能进入下一个更高级的阶段，VUI需要能记住过去的信息。在以下两种情况下，过去的信息在对话中起到了关键作用。（1）在过去的对话中说过的内容，比如你昨天预订的物品、你点唱最多的一首歌，以及你的通讯录中两个叫“Lisa”的人，哪一个发过257次消息，哪一个只发过两次消息。（2）在当前对话中出现过之前说过的内容——如果不是最后一轮对话。比如，如果我先问我丈夫673航班是否准时起飞，然后再问“什么时候降落？”，系统要知道我要问的是673航班。

当你跟一个人愉快地交谈时，交谈中通常包含一些关键要素：情境感知（关注你和周围的环境）、关于之前交流的记忆，以及相关问题的交流。这些都有助于在交流中达成共识。正如斯坦福大学教授Herbert Clark定义的那样，达成共识的方法是：“为了使自己被对方[4]理解并进行有意义的交谈，谈话的参与者必须分享信息。”

如果VUI不能包含这种情境和上下文记忆，那么它在实用性方面将会停滞不前。1.3　VUI设计师是什么

这是一本关于如何设计VUI的书——那么VUI设计师到底是做什么的？VUI设计师思考的是，在系统和终端用户间，从开始到结束的整个对话过程。他们思考正在解决的问题以及用户需要什么来达成他们的目的。他们进行用户研究（或者与用户研究团队合作）来了解用户是谁。他们负责设计、产品原型和产品描述。他们描述系统与用户之间的交互行为（有时在文案人员的帮助下）。他们了解底层技术的优点和缺点。他们通过分析数据（或咨询数据分析小组）来了解系统在什么地方发生了问题以及如何改进。如果VUI需要与后端系统进行交互，他们要考虑需要处理的请求。如果流程中有人的因素，比如客服需要交接，VUI 设计师需要考虑如何进行交接，以及如何培训客服。从项目的概念阶段到发布阶段，VUI设计师都要全程参与，并且扮演着非常重要的角色。

尽管VUI设计师通常会承担以上所有的工作，他们也可以只承担其中一部分工作，比如设计Amazon Echo的某一个技能。无论工作和项目的大小，这本书都能帮助设计师（也包括开发者）设计出最好的VUI。1.4　聊天机器人

虽然本书主要探讨VUI，但我还是想简单地谈一谈聊天机器人（Chatbot）。Google将聊天机器人定义为“为了模拟与人类对话（尤其在网上）而设计的计算机程序”。“bot”这个后缀也时常被用来指这类交互行为。

Chatbot可以使用VUI，但通常一个典型的Chatbot都采用了基于文本的界面。大多数主要的科技公司，包括Google、Facebook和微软，都有机器人开发平台。

Chatbot也许能风靡一时，但在大多数情况下，它们相比之前的ELIZA（20世纪60年代的早期自然语言处理计算机程序）没有太多改进。“微软小冰”的流行是一个意外，它在中国互联网引爆了人机对话与智能回复的热潮。

基于文字的Chatbot并不总是比GUI的效率高。Dan Grover在他的文章里说“机器人（Bot）不会取代App，更好的App才会。”（http://bit.ly/2glEQwb）

他比较了使用Chatbot和使用必胜客的微信公众号两种方式来预订披萨（见图1-1）。使用Chatbot时，他点击了73次才预订到想要的披萨，但在App中他只用了16步（见图1-2）。这是因为App使用了大量的GUI。

正如Grover所说：（与原生App相比）微信成功的关键是它很大程度上精简了App的安装、登录、支付和消息通知。在它的聊天界面内，也不需要考虑适配。

然而很多Chatbot同时使用了文本交互界面和GUI插件。这样用户就能更清楚地知道他们能做什么，从而大大提升交互的效率和成功率。图1-1　微软的披萨Bot（Dan Grover注）

试读结束[说明：试读内容隐藏了图片]

下载完整电子书

语音用户界面设计：对话式体验设计原则试读：

相关推荐

精神洗礼：建国初期知识分子思想改造运动广泛开展(txt+pdf+epub+mobi电子书下载)

银河帝国7：基地与地球(txt+pdf+epub+mobi电子书下载)

创业是一场有节制的游戏(txt+pdf+epub+mobi电子书下载)

销售冠军都是聊天高手：不会聊天，怎么做销售(txt+pdf+epub+mobi电子书下载)

公共支出分析(txt+pdf+epub+mobi电子书下载)

幸福教育 从心开始——中国人民大学幼儿园教育成果集(txt+pdf+epub+mobi电子书下载)

中介费用纠纷的处理(房屋买卖纠纷)(txt+pdf+epub+mobi电子书下载)

仁济济人：仁济医院早期故事(txt+pdf+epub+mobi电子书下载)

软土区地铁深基坑研究与实践(txt+pdf+epub+mobi电子书下载)

2018年河北公务员录用考试专项教材：常识判断【考点精讲＋典型题（含历年真题）详解】(txt+pdf+epub+mobi电子书下载)

注册会计师行业组织治理研究(txt+pdf+epub+mobi电子书下载)

C# 程序设计教程(第4版)(txt+pdf+epub+mobi电子书下载)

中国人的修养(txt+pdf+epub+mobi电子书下载)

React与Redux开发实例精解(txt+pdf+epub+mobi电子书下载)

黑板到底该谁擦(txt+pdf+epub+mobi电子书下载)

九段HR中国企业人力资源管理一本通(txt+pdf+epub+mobi电子书下载)

听孩子说，胜过对孩子说(txt+pdf+epub+mobi电子书下载)

上海房地产发展报告(2015-2016)(txt+pdf+epub+mobi电子书下载)

中公2018浙江省事业单位考试专用教材综合基础知识(txt+pdf+epub+mobi电子书下载)

海洋油气工程概论(txt+pdf+epub+mobi电子书下载)

最新文章

人生就要不断精进(txt+pdf+epub+mobi电子书下载)

做个心智成熟的人：人生可以不走弯路(txt+pdf+epub+mobi电子书下载)

跟谁都能聊不停：一看就能用的魔鬼搭讪学(txt+pdf+epub+mobi电子书下载)

赴美留学必知(txt+pdf+epub+mobi电子书下载)

我的男友(txt+pdf+epub+mobi电子书下载)

中国东北与东北亚古代交通史(txt+pdf+epub+mobi电子书下载)

幸福生活讲座(txt+pdf+epub+mobi电子书下载)

情商决定一生(txt+pdf+epub+mobi电子书下载)

夜雨寄北(txt+pdf+epub+mobi电子书下载)

让学生热爱学习(txt+pdf+epub+mobi电子书下载)

On Dreams(txt+pdf+epub+mobi电子书下载)

我的史学人生(txt+pdf+epub+mobi电子书下载)

Creo2.0完全学习手册(txt+pdf+epub+mobi电子书下载)

2018年陕西省军转干部安置考试《公共基础知识》题库【真题精选＋章节题库＋模拟试题】(txt+pdf+epub+mobi电子书下载)

假如给我三天光明(txt+pdf+epub+mobi电子书下载)

带出高效执行力(txt+pdf+epub+mobi电子书下载)

北史（四）(txt+pdf+epub+mobi电子书下载)

影响力的企业富豪(上册)(txt+pdf+epub+mobi电子书下载)

商界40年：逐鹿人(1999-2008)(txt+pdf+epub+mobi电子书下载)

The Boats of the Glen Carrig(txt+pdf+epub+mobi电子书下载)

幸福教育从心开始——中国人民大学幼儿园教育成果集(txt+pdf+epub+mobi电子书下载)