当大数据遇见物联网——智能决策解决之道(txt+pdf+epub+mobi电子书下载)


发布时间:2020-05-18 09:04:46

点击下载

作者:乔乔·莫雷伊

出版社:清华大学出版社

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

当大数据遇见物联网——智能决策解决之道

当大数据遇见物联网——智能决策解决之道试读:

译者序

继计算机、互联网和移动通信之后,物联网在现今信息产业中的地位无可比拟,它在各个行业中的发展也是如日中天,备受瞩目。物联网诞生于互联网和移动互联网高速发展的时代,迎合了所有行业对数据联网的迫切需求。今天,联网设备早已不仅仅是智能手机和计算机,而是覆盖到了智能家居、交通物流、工业和医疗保健等各种不同的领域。此外,各个领域每时每刻都在产生大量的数据,人们也无时无刻不在思考,如何才能高效地对这些数据加以分析和利用。而物联网无疑相当于一座价值连城的宝藏,它产生的海量数据中所蕴含的价值无法估量。因此,物联网的真正价值仍亟须人们去深入挖掘充分利用,以创造更为美好的未来。

如何对物联网尤其是企业的商业问题进行数据分析并解决问题,这正是本书的价值所在。在本书中,作者没有采用人人熟知的“大数据分析”甚至“数据科学”这些热词做相关论述,而是精辟地提出了“决策科学”的概念,将“决策科学”与“数据科学”的细微区别阐述清楚。通过决策科学在物联网中的应用,自然而然地向读者阐明了这两者的交叉点—智能决策的重要性和影响。同时循序渐进地将各种统计分析技术和机器学习算法,与物联网商业用例分析紧密结合,深入浅出地介绍给读者。

市面上关于大数据分析的书籍浩如烟海,但是针对决策科学和物联网结合应用,分析解决实际商业问题的书籍并不多见。本书作者采用平实朴素的语言,将现实生活中的物联网案例娓娓道来,让读者对决策科学、物联网以及智能决策在这些案例中的分析和应用了如指掌。即使没有具备数据分析基础但又对这些主题感兴趣的读者,也能跟随作者清晰严谨的思路轻松地完成本书的阅读,并且最终不仅能够掌握本书的实用知识和分析技术用以解决实际的商业问题,而且也能够领会其中的奥妙拓展视野。

作者在

序言

中已向读者介绍了本书以及各个章节的主要内容。因此,我在此就不再赘述,感兴趣的读者可以仔细阅读序言以了解本书概要。这里,我想和读者分享翻译本书时的一些心得体会,希望有助于读者理解本书的内容,同时也希望能够由此向各位同行和专业人士虚心求教,以便日后改进。

本人在实际工作中也遇到过许多类似的情况,如曾在公司时为美国Breault Research Organization,Inc.的高级光学系统分析软件产品进行市场推广。在推广这些产品的过程中,与国内外著名的高校、科研院所和企业交流时,并没有将他们业已熟知且广泛采用的术语翻译成中文。如果为了翻译而翻译,生硬地将业界专业人士熟知的术语翻译出来,反而会造成理解和交流上的障碍。这在科技口译上也是如此,本人数年来在为上述公司做技术交流现场翻译实践中,也切身体会到这一点。所以,根据受众的实际情况,而选择相应合适的翻译策略,是非常有必要的。由此也深深认同作者在本书第5章中讨论如何判断模型达到学习饱和度时提出的观点,即通过数据分析实践从观察中而非仅仅依靠数学计算得出一个判断标准。

因此,阅读本书不仅能够掌握决策科学应用在物联网商业用例的分析技能,在对R语言进行熟练运用、精通智能决策之奥妙的同时,也能学习作者在数据分析时的科学严谨态度和清晰的逻辑思维。

此外,我还要由衷地感谢我的先生赵勇。在我繁忙翻译期间,他针对书中涉及数学的部分提出专业的意见,并且就一些内容提出犀利但颇具建设性的建言,激励我深入探索不熟悉的领域。感谢亲朋挚友的鼓励和支持,我才得以克服种种困难最终完成这本书的翻译。

本书的翻译由吴骅组织完成。参与本书翻译的还有王学昌、周娟、刘红军、王玲、郑正正、秦双夏、莫鸿强、李远明、陶日然、黄善斌、廖义奎、杨莉灵等人,感谢这些人士帮助。没有他们的帮助就无法完成这项工作。由于水平有限,译文中的不当之处在所难免,恳请同行及各位读者朋友不吝赐教。译者序言

物联网和决策科学一跃成为时下业界最为热门的话题。可是,我们今天要解决的问题变得越来越不清晰、不确定和不稳定,解决问题的方法也是变得如此。而且,解决问题从使用数据科学解决一个具体问题,演变成为了应用决策科学解决问题的一门技术。物联网为企业提供了一个千载难逢的机遇,将人们的生活变得愈加轻松,但是若要实现这一目标,惟有利用决策科学方能物尽其用。《智能决策—当大数据遇见物联网》(Smarter Decisions—The Intersection of Internet of Things and Decision Science)将有助读者了解物联网和决策科学的细微差别,通过解决现实生活中的工业和消费物联网用例,切实地帮助读者做出明智决策。本书着重解决一个根本问题。因此,书中整个过程都是借助生动有趣且通俗易懂的商业用例,采用决策科学行业标准框架去解析、设计、执行并阐述问题。在解决商业用例的同时,我们会利用最流行的开源软件“R语言”,学习一套完整的数据科学系统,即描述性分析(descriptive analytics)、探查性分析(inquisitive analytics)、预测性分析(predictive analytics)和规范性分析(prescriptive analytics)四者相结合的系统。阅至本书结尾,读者将完全领悟到在物联网中做出决策的复杂性,并且能够将书中知识应用于任何项目中。本书主要内容

第1章 物联网和决策科学:采用现实生活中直观易懂的例子,清晰概述了本书两个最重要的主题。本章简明扼要地讲述物联网及其演变,以及物联网(Internet of Things, IoT)、工业物联网(Industrial IoT, IIoT)、工业互联网(Industrial Internet)和万物互联(Internet of Everything, IoE)四者的主要区别。此外,通过问题以及问题在其体系中的发展演变来诠释决策科学。最后,本章探索问题解决框架,研究解决问题的决策科学方法。

第2章 物联网问题体系研究和用例设计:本章引出一个现实生活中的物联网商业问题,应用第1章所学的一个成熟结构化问题解决框架,帮助读者实际设计问题的解决方案。本章还介绍了物联网中的两个主要领域即资产互联(connected assets)和运营互联(connected operations),以及用于解析和设计商业问题解决方案的各种工具和思想领导力框架(thought leadership frameworks)。

第3章 探索性决策科学在物联网中的应用内容和原因:采用R语言进行探索性数据分析,着重切实解决第2章设计的物联网商业用例。选取一个匿名和屏蔽数据集用于商业用例,同时依托实践练习帮助读者把握决策科学描述性分析和探查性分析这两个阶段。本章通过执行单变量分析、双变量分析以及各种统计检验来验证结果,回答两个基本的问题即(探索性决策科学)“是什么”和“为什么”,以此阐述问题的解决方案,呈现本章内容。

第4章 预测性分析在物联网中的应用:利用预测性分析增强商业用例解决方案。在本章中,我们回答了“何时”这个问题,更清晰有效地解决问题。与此同时,探讨了线性回归、Logistic回归和决策树等多种统计模型,解决第3章商业用例在探查性分析阶段出现的不同预测性问题。还通过直观的例子来理解算法的数学功能,以及解释结果的简单方法,这些都为物联网的预测性分析奠定了基础。

第5章 利用机器学习增强物联网预测性分析:尝试采取随机森林、XgBoost等尖端机器学习算法和多层感知器等深度学习算法,改进第4章中预测建模练习的结果。经由改进算法而获得了改进后的结果后,利用决策科学的3个不同分析层面:描述性分析、探查性分析和预测性分析,最终完成了商业用例的解决方案。

第6章 决策科学结合物联网的分析速成:本章自始至终尝试解决另一个崭新的物联网用例,巩固了迄今为止学习到的解决问题的技巧。通过速成的学习模式,对解析、设计和解决物联网问题的整个过程进行阐述。

第7章 规范性科学与决策:利用一个假设用例介绍决策科学的最后一层分析,即规范性分析。本章选择数个简单易学的例子来说明,一个问题从描述性分析到探查性分析、预测性分析,最后到规范性分析再周而复始地演变整个过程。在应用规范性分析解决问题的过程中,我们详细探讨了做出决策和撰写故事的技术,以将分析结果清清楚楚地展示出来。

第8章 物联网的颠覆性创新:本章通过对一些像雾计算、认知计算、下一代机器人、基因组学和自动驾驶汽车的研究,探讨了目前物联网的颠覆性创新。最后,简要介绍了物联网的隐私和安全问题。

第9章 物联网的光明前景:讨论了物联网前所未有的发展会在不久的将来如何从根本上改变人们的生活。本章探讨了新型物联网商业模式的前瞻性话题,例如资产/设备即服务,还有汽车互联向智能汽车以及人类互联向智能人类的演变。本书所需的配置

为了让学习效率更高,读者须配备一台安装有Windows、Mac或Ubuntu系统的计算机。

下载并安装R语言来执行本书中的代码。可通过CRAN网站下载安装R语言,网址为http://cran.r-project.org/。书中全部代码都是用RStudio编写的。RStudio是一个R语言的集成开发环境,下载网址为http://www.rstudio.com/products/rstudio/。

本书中使用的不同R语言包可以免费下载并安装在上述所有操作系统上。本书面向的读者

本书旨在为有志于物联网分析项目的数据科学和物联网爱好者或项目经理而编写。如果读者掌握了R语言库的基本知识,则会胜人一筹,但是本书在对结果进行解释时不会受代码影响。任何没有具备技术知识的数据科学和物联网爱好者不仅可以跳过代码读取输出结果,而且仍然能够应用这些结果。小节标题介绍

在这本书内,读者会发现一些经常出现的标题,如做好充分准备、操作步骤、工作原理、知识拓展以及参考资料。

为了清楚说明如何完成一个设计流程,本书使用如下小节标题。做好充分准备

本节告诉读者在设计流程中需要什么,介绍如何配置所需的软件或初始设置。操作步骤

本节包含设计流程所遵循的步骤。工作原理

本节通常是针对前一小节所发生的事情做出详细解释。知识拓展

本节包含有关设计流程的其他信息,让读者对设计流程有更多的了解。参考资料

本节为设计流程提供其他有用信息的链接。体例

在本书中,读者将看到许多用以区分不同类型信息的文本样式。下面是这些样式的一些例子,以及对它们含义的解释。

一个代码块文本样式设置如下:

任何命令行输入或输出书写如下:

在菜单或对话框中,读者在屏幕上看到的单词将显示在文本中,如下:“从管理面板中选择系统信息”。表示警告或重要事项。表示技巧提示。读者反馈

我们非常欢迎读者反馈。读者可随时随地告知我们对这本书的看法—喜欢或不喜欢哪些内容。读者反馈对我们不可或缺,这些反馈会帮助我们编撰读者所需的内容,让读者最大限度地从中获益。

如果是一般的反馈意见,只需发电子邮件至feedback@packtpub.com,并在邮件主题中注明书名。

如果读者擅长某专业主题,并且对写作或撰写书籍感兴趣,请参阅我们的作者指南,网址为www.packtpub.com/authors。客户支持

对于购买了帕克特出版有限公司书籍的读者朋友,我们还会提供相应的支持服务。下载示例代码

读者可以登录自己的账户下载本书的示例代码文件:http://www.packtpub.com。如果读者从其他地方购买了本书,请访问http://www.packtpub.com/support并注册账户,之后我们会将文件直接发送给读者。

下载代码文件步骤如下:(1)使用电子邮件地址和密码登录或注册我们的网站。(2)将鼠标指针悬停在顶部的SUPPORT选项卡上。(3)单击Code Downloads&Errata。(4)在Search搜索框中输入书名。(5)选择要下载代码文件的书籍。(6)从已购书籍的下拉菜单中选择。(7)单击Code Download下载代码。

也可登录帕克特公司网站,单击书籍网页上的Code Files按钮下载代码文件。在Search搜索框中输入书名后可访问上述页面。请注意,读者首先要登录自己的账户才可访问。

下载文件后,请确保使用最新版的解压缩软件将文件夹解压: WinRAR / 7-Zip适用于Windows。 Zipeg / iZip / UnRarX适用于Mac。 7-Zip / PeaZip适用于Linux。

这本书的代码包也存放在GitHub上:https://github.com/PacktPublishing/Smarter-Decisions-The-Intersection-of-Internet-of-Things-and-Decision-Science。我们还从现有丰富的书籍和视频资料中提供了其他代码捆绑包:https://github.com/PacktPublishing/。欢迎读者查看!勘误表

尽管我们已经竭尽全力确保内容的准确性,但仍然无法保证完全没有错误。如果读者在本书中发现了错误(可能是文本或代码的问题)并且能向我们反映,我们将不胜感激。这样不仅能让其他读者免受误导,同时也会帮助我们改进该书的后续版本。如果读者发现任何错误,请通过http://www.packtpub.com/submit-errata向我们反映。登录网站后选择相应的书籍,单击Errata Submission Form勘误提交表格链接,然后输入勘误详情。一旦读者的勘误被验证,所提交的勘误信息会被采纳,而且这些勘误将被上传到我们的网站或添加到该书勘误部分下的现有清单中。

如果要查看以前提交的勘误表,请转至https://www.packtpub.com/books/content/support,然后在搜索栏中输入书名。所查询的信息会在Errata勘误小节中出现。版权保护

互联网上受版权保护的资料被盗版是所有媒介都面临的一个问题。帕克特公司非常认真地保护我们自己的版权和许可。如果读者在互联网上发现有任何非法盗版我们的作品,请立即给我们提供盗版网址或网站名称以便我们采取合适的补救措施。

读者可通过copyright@packtpub.com与我们联系,将可疑的盗版内容链接发给我们。

我们衷心感谢读者的帮助,在保护作者和我们自己的同时,我们也会尽心尽力地为读者发行更有价值的书籍。读者反馈

如果读者对本书内容有任何问题,请通过questions@packtpub.com与我们联系,我们将尽最大努力解决这些问题。第1章物联网和决策科学物联网(IoT)和决策科学一跃成为时下业界最津津乐道的话题。人们对物联网或许不乏耳闻目睹,亦希望能够对物联网洞悉底蕴。可是令人失望的是,互联网上给物联网和决策科学冠以诸多名称和定义,但是这些名称和定义的差异却含糊不清,让人无从辨别。此外,决策科学从一个新兴领域发展成为近年来业内发展最快、最普遍的横向领域之一。随着数据的容量、多样性和准确性的不断提高,决策科学对于产业而言越来越有价值。利用数据揭示出潜在的模式和隐匿其中的洞见来解决商业问题,使企业能够发挥更佳的影响力和更高的准确性,进而采取行动也更加容易了。数据是这个产业的新石油。随着物联网的蓬勃发展,人们如今正处于一个奇妙的世界里,越来越多的设备与互联网连接,传感器也捕获到越来越多重要的粒度(数据)维度,而这些维度从未被接触过。物联网改变了游戏规则,它将大量的设备互联在一起;业界正迫不及待地要去挖掘物联网的巨大潜力以将其物尽其用。在决策科学的帮助下,物联网的真正价值和重大影响得以变成现实。物联网本身就已产生出海量的数据,人们可以利用决策科学和物联网两者的协作,从中攫取洞见深入解析并做出更为明智的决策。本书将通过运用一种结构化方法来解决现实生活中的物联网商业问题,让读者对物联网和决策科学有深入细致的了解。在本章中,首先介绍物联网和决策科学问题解决的基本原理,并且学习以下概念: 了解物联网并揭秘M2M、物联网(IoT)、万物互联(IoE)和工业物联网(IIoT)。 深入挖掘物联网的逻辑堆栈。 研究问题的生命周期。 探索问题的全貌。 解决问题的技术。 问题解决框架。本章着重介绍构建问题和用例必备的基础知识和概念,因此强烈建议读者深入探索本章。由于本章没有实践练习,相信大多数软件工程师会跳过这部分内容,直接转到后面的章节。但是,后面的章节在上下文中会频繁引用这里阐述的概念和观点。因此,读者在继续浏览本书之前,仔细阅读本章是非常重要的。1.1 了解物联网

在开始学习物联网前,先试着从最简单的语义构造来理解它。这里有两个简单的词可以帮助理解整个概念,即互联网和物。那么互联网是什么?它基本上是一个拥有许多计算设备的网络。同样,物是什么?它可能是指具有互联网连接的现实生活的任何实体。那么此时从物联网解读出了什么信息?物联网即是一个连接物的网络,一旦连接到网络就可以传输和接收来自其他物的数据。这就是对物联网简明扼要的描述。

现在来看看这个定义。物联网可被定义为不断增长的物(实体)的网络,这些物的网络具有互联网连接的功能,而且也具备与其他互联网设备和系统之间相互通信的功能。物联网中的物通过传感器在设备运行过程中捕获重要信息,而设备具有互联网连接功能,可以帮助这些物传输信息并与其他设备和网络进行通信。而今当人们讨论物联网时,还出现了众多像工业互联网、M2M、万物互联等一些类似的术语,人们发现很难理解这些术语之间的差异。在分辨这些模糊不清的术语差异,了解物联网在产业中的演变之前,先来观察一个简单的现实生活场景,探明物联网到底是什么。

举一个简单的例子来揭开物联网是如何运作的。比如在家庭中,您和妻子都是上班族,十岁的儿子还在上学。夫妻俩上班的地点各异。但是,您的家中配备了不少智能设备,例如智能微波炉、智能冰箱和智能电视。此时您还在办公室里忙于工作,而您的智能手机却收到儿子乔什已放学回到家的通知(乔什用他自己的智能钥匙打开了门)。于是,您用智能手机启动家里的微波炉,加热事先放在里面的三明治。乔什从智能家居控制器上也收到了消息,知道您已经给他热好了三明治。他狼吞虎咽吃完了三明治后,开始为准备数学考试复习功课,而您也继续埋头工作。过了一会儿,又收到消息得知妻子已经到家了(她也有一把同样的智能钥匙)。您突然意识到需要回家辅导儿子的数学功课。这时您再次拿起智能手机,为三人设置空调温度,同时点开应用程序对冰箱除霜。十五分钟后您迈进家门的那一刻,屋子里的空调温度早就调好了。然后您就走向冰箱从里面拿出一罐果汁,和儿子在沙发上讨论一些数学问题。这个生活场景非常直观地诠释了物联网,对吗?

上述场景究竟是如何发生的?而您又是如何通过手机访问和控制一切的?这正是物联网的工作原理!设备之间可以相互通信,也可以根据收到的信号采取相应的措施,如图1.1所示。图1.1

仔细观察这个一模一样的场景。您正在办公室里,通过智能手机访问空调、微波炉、冰箱和家庭控制器。毫无疑问,这些设备具有互联网连接功能,一旦连接到网络,它们就能够发送和接收来自其他设备的数据,根据信号采取行动。一个简单的协议可以帮助这些设备理解并发送数据和信号到连接了网络的大量异构设备上。稍后将细细探究这个协议以及这些设备是如何相互通信的。但是,在此之前,先详细介绍这项科技的起源,以及为何现今会涌现出各式各样的名称用于物联网。1.2 揭秘M2M、物联网、工业物联网和万物互联

现在粗略了解了物联网之后,这就去揭开它起源的面纱。随后将要探明的几个问题是:物联网在市场上是否属于一种新兴事物?它是什么时候开始的?又是如何开始的?M2M、物联网、万物互联等以及所有这些不同名称之间的区别是什么如此等等类似的问题。倘若人们试图了解的物联网基本原理,也就是说,在一个网络中相互连接的机器或设备,并不是一个真正全新的、极具挑战性的事物,那么人们讨论的到底是什么呢?

早在大多数人能够想到之前,关于机器间相互通信的讨论就已经热火朝天地开始了,而当时这种现象被称为机器对机器数据(Machine to Machine Data)。1950年年初,部署用于航空和军事行动的大量机器需要自动化通信和远程访问服务和维护。而一切起源均来自遥测技术。这是一个高度自动化的通信过程,从中收集数据,对偏远或无法接近的地理区域进行测量,再通过一个蜂窝或有线网络发送到接收器,为进一步的行动进行监视工作。为了更透彻地理解这一点,举一个载人航天飞机进行太空探索的例子。在航天飞机上安装了大量的传感器,监测宇航员的身体状况、环境以及航天飞机的状况。这些传感器收集到的数据,会被发送回地球上的分站,在那里的一个团队利用这些数据来分析以及采取进一步的行动,如图1.2所示。在同时期里,工业革命达到了顶峰,各行各业部署了大量机器。虽然在一些行业里遭遇到了灾难性的失败,但是机器对机器通信和远程监控也在迅速增长。图1.2

因此,机器对机器数据也就是M2M诞生了,而且主要是用于遥测技术。遗憾的是,M2M并没有达到应有的程度,这主要是因为它开发时生不逢时。当时,蜂窝连接既不普遍,也不便宜,安装传感器和开发基础架构来收集数据,无疑是一个天价交易。因此,只有一小部分商业和军事用例采用了M2M。

后来,星移斗转,世事变更。互联网诞生了并呈指数繁荣增长。连接到互联网的设备数量也迅猛激增。计算能力、存储容量以及通信和技术基础架构大规模扩展。此外,将设备连接到其他设备的需求也在不断增长,为此配置基础架构的成本变得无比实惠且易于掌控。物联网于是就在这种万事俱备的良好时机中顺势出场。M2M和物联网最初的主要区别在于后者使用因特网(IPV4/6)作为媒介,而前者使用蜂窝或有线连接进行通信。然而,这主要还是因为它们演变的时间。今日的重型工程行业已经部署了通过IPV4/6网络进行通信的机器,被称为工业物联网(IIoT)或有时称为M2M。两者之间的差异是微乎其微的,并且在有些情况下可以互换使用。因此,尽管M2M实际上是物联网的始祖,但而今两者几乎没有太大差别。M2M或工业物联网正在积极地推动物联网在工业领域的颠覆性创新。

IoE即万物互联,是最近在媒体和互联网上出现的一个术语。这个词是由思科公司用一个非常直观的定义创造而来的。它强调人类是生态系统中的一个维度。这是一种定义物联网更广泛的组织方式。万物互联在逻辑上将物联网生态系统分解为更小的组件,并以一种非同小可的创新方式简化了生态系统。万物互联将其生态系统划分为以下4个逻辑单元: 人。 流程。 数据。 物。

万物互联建立在物联网的基础之上,被定义为人、数据、流程和物的网络连接。总而言之,与物联网相关的所有术语都各有差异,但是核心上它们又是相同的,即通过一个网络相互连接的各种设备。而为术语取一个风格各异的名称,给其所涉及的业务赋予更切实的内涵,例如工业物联网和M2M用于(B2B)重工业、制造业和能源垂直行业,而消费物联网用于B2C行业等。1.3 深入挖掘物联网的逻辑堆栈

清晰认识了物联网及其类似术语之后,紧接着来对这个生态系统一探究竟。为方便起见,学习堆栈的4个逻辑组件时,本书将IoE(万物互联)简称为IoT(物联网),如图1.3所示。图1.3

当将物联网生态系统分解为逻辑单元时,它包含了人、流程、数据和物。下面开始简要介绍这些组件。1.3.1 人

人们每天都在使用设备和其他人进行交互。通信可以指人对人、人对设备或设备对设备。把人看作物联网生态系统中的一个单独的维度,是一个至关重要的举措,因为理解这个问题的复杂性极具挑战。人在互动的任意一端发挥作用时,此时任何形式的通信都会发生,因此这会嵌入一种本质上以人为维度的独特模式。现在举一个例子以更清楚地理解这一点。大多数人使用Facebook、Twitter、LinkedIn等社交媒介,与多个人/朋友连接。此时,通信路径主要是人对人。比如前面的例子,就出现了人对设备和设备对人的通信路径(智能手机和微波炉之间的通信)。将人作为一个维度,每个人在与系统交互的方式上都会有所不同。一个人可能会发现Facebook的新界面难以操作,但是他的一个朋友可能会觉得简单易用。真正的问题是,每个人都很熟练,但是技能因人而异。由一个人确定的互动特征也许会体现出一小群体的特征。

世界上有六十多亿人口,其中超过六分之一的人口早已连接起来了。由于人口众多,也代表了不同地域、不同文化、不同思维和不同行为的一大批人群,因此定义一套通用的规则或特征来界定人际互动无疑是一个巨大的挑战。相反,如果以更具建设性的方式理解人的维度,就能抓住机会更准确地捕捉到人的行为特征,通过最好的方式帮助他们从生态系统中受益。

随着物联网的崛地而起,拥有的传感器能够捕获到比以往更细致详尽的信息和特征。这时,如果能够精确地将人定义为一个完整的维度,那么个性化的体验将完全改变游戏规则。智能手表行业正在全力以赴想让产品更加个性化;倘若成功的话,就会在即将到来的智能革命浪潮中,摇身一变成为其中的关键一员。1.3.2 流程

对流程最清晰的定义是,将正确的信息在正确的时间提供给正确的人员/系统所需要的一切东西。技术、协议、业务逻辑、通信基础架构等在内的各个方面都属于流程维度。从广义上讲,它们可以分为两个部分:技术流程和业务流程。紧接着简略地探讨这两个组件,以便对流程维度也知之甚详。1. 技术

物联网流程维度所需的技术包括软件、协议和基础架构。下面将通过流程的3大方面来了解技术流程。(1)软件

软件主要由操作系统组成。物联网中的设备需用一种特殊的操作设备。诸如智能冰箱、智能微波炉等智能设备需要使用运行在这些设备上的操作系统,才能成为网络中的活动组件。发送、处理和接收数据,或者执行指令并发送信号到设备相应的控制器以执行操作,这些执行的任务会各不相同。现在问题出现了,为什么这些设备要用到一个特殊的操作系统呢?为什么不能采用UNIX/Linux、Windows、Mac,甚至Android这些现有丰富的系统?这是与之前在智能手机上使用Android而不是现有的操作系统的原因是如出一辙的。由于连接到物联网网络的设备很小或有时非常微小。理想情况下,这些设备配备较弱的计算能力,较少的内存和较短的电池寿命。在它们上面运行一套完整的操作系统几乎是不可能的。需要一个专门设计的操作系统,可以应对设备的有限内存、处理能力和电池寿命,同时提供最大的功能将设备标记为智能设备。谷歌公司(Google Inc.)最近推出了一款名为Brillo的物联网设备操作系统。Brillo是一款基于Android的嵌入式操作系统,专为低功耗和内存受限的物联网设备而设计。它提供物联网设备所需的核心平台服务,以及为开发人员/硬件供应商免费提供一套开发人员工具包,让操作系统在其设备上运行并在设备上增加附加服务。一些类似的例子如苹果公司(Apple Inc.)的Watch OS用于Apple Watch上,谷歌公司的Android Wear用在智能手表等。很快,就可以期待一大批运行Brillo的设备以及大量的应用程序出现,这些应用程序可进行额外的安装,实现更好的功能(与Google Play应用商店非常相似)。(2)协议

一旦设备启用软件,就需要获得一个协议,以帮助它们与网络中的其他异构设备进行通信。为了更清晰地理解这一点,回忆本书的第一个例子,在那个例子中可以使用智能手机对冰箱除霜。智能手机需能与冰箱进行通信,而冰箱也要知道智能手机到底在传达什么信息。由于异构设备品类繁多,这个通信路径变得越来越复杂。因此,需用一个简化的协议将复杂的过程进行抽象,让设备之间能够有效地进行通信。谷歌公司最近推出了一个名为Weave的开源协议。Weave基本上是一个物联网协议,即一个物联网设备的通信平台,支持设备设置、手机到设备到云的通信以及移动设备和网络的用户交互。无论是品牌方还是制造商,Weave都通过降低设备互操作性,提高了开发人员的工作效率。(3)基础架构

基础架构可以简单地定义为操作系统、通信协议和所有其他必要组件的集成,以协调物联网用例的环境。所有主要的云基础架构提供商如今都致力于提供一个物联网专业化的环境。谷歌公司推出了IoT Cloud Solutions物联网云解决方案,亚马逊公司(Amazon.com, Inc.)推出了AWS IoT,微软推出了Azure IoT Suite等。所有这些解决方案都将不同的系统整合在一起,从而使生态系统具有可扩展性和灵活性。深入细究这些解决方案套件超出了本书的范围。2. 业务流程

流程维度的第二部分是业务流程。它基本上涵盖了管理物联网生态系统中所连接设备的通信和操作的一套规则和流程。时至今日还没有一个具体的定义可以用在流程上,关于这个主题的讨论也超出了本书所涵盖的范围。但是,本书会在第3章“探索性决策科学在物联网中的应用内容和原因”和第4章“预测性分析在物联网中的应用”中,在解决物联网用例时,仔细研究这一问题。1.3.3 物

物成为物联网生态系统的不可或缺的关键。这些物包括任何形式的传感器、执行器或其他类型的设备,可以集成到机器和设备中,以帮助它们连接到互联网并与其他设备和机器进行通信。这些物在它们的生命周期中一直活跃着,而且会感知事件,捕获重要的信息并与其他设备进行通信。

一个典型的例子就是前面用例中所提到的冰箱、电视机或微波炉。安装在这些设备上的传感器能够捕获数据,将信息/信号发送到其他设备用于下一步行动。1.3.4 数据

数据无疑是物联网生态系统中最具增值潜力的一个要素。当今,连接到互联网的设备抓取了海量的数据,这些数据能够体现出所连接设备最细粒度层级的信息。但是,这种数据的规模非常巨大。存储和处理如此庞大而多样的数据,让人们不禁追问这些数据是否真的具有价值。从真正意义上而言,大部分数据的生命本质上都十分短暂,它们在产生后一时半刻内价值就转瞬即逝。随着技术和计算能力的不断提高,设备如今能够处理的数据量和存储量都无比巨大,而人们可以利用这种能力来发掘比原始数据更多更好的价值。通过执行多种算法以及应用业务规则,在将数据发送到服务器之前,从数据中提取出诸多有用的价值。这就需要将多个学科结合起来解决问题并创造价值。

为了更透彻地理解这一点,现举一个安装在智能手表上的计步器的例子。它不只是报告人们行走的步数,还能计算出消耗的卡路里,活动所需的平均时间,与前些天活动指标相差了多少,离设定目标还差多远,以及与朋友比较的结果如何诸如此类其他社交信息等。为了在本地捕获和处理所有这些信息,将最终结果发送到可以直接存储数据以供将来采取行动的服务器,需要将多个学科融会贯通才能有效地完成这项任务。数学、商业、技术、设计思维、行为科学等都需要结合在一起来解决问题。实际上,如果将从设备捕获的原始数据发送到服务器,就算这些数据可供将来使用,那么这样做还是毫无成效的。如今人们设计出了各式各样的新算法,用于分析这些本地输入的数据,实时提供丰富、精炼和可付诸行动的洞见。本书将在第8章“物联网颠覆性创新”中更详细地探讨雾计算。智能手表(如Microsoft Band)和自动驾驶汽车(如Tesla Model S)是理解真实场景的最佳示例,人们可以在这些场景中挑战实时研究处理数据,从中获得真知灼见并采取行动。从真正意义上而言,数据实质上是一种为物联网这些产业解决最后一英里价值传递的东西。因此,将数据处理当作物联网堆栈中单独的一个维度来看待。1.4 问题的生命周期

至此对物联网已略有体会,也理解了物联网的逻辑堆栈:人、流程、数据和物。本书的核心内容是应用决策科学解决物联网商业问题。自从人类进化以来,解决问题一直是一门技术。本小节将阐述问题的生命周期,了解问题是如何不断演变的。透彻理解这个主题对于解决物联网更复杂的问题至关重要。

每个行业都在试图解决问题。电子零售解决了工作繁忙的消费者去实地购物的麻烦,印刷机解决了消费者需要印制大量文件的问题等。一些深怀远见卓识的企业,如苹果公司,先由自己创造出问题然后再去解决问题。iPod和iPad毫无疑问是这场革命的见证。解决问题最大的挑战在于问题的演变。倘若深入研究问题的生命周期,则能够理解问题起初从一团乱麻,再到混沌不清,最后演进至清晰明朗的状态,如此周而复始,如图1.4所示。图1.4

下面举个简单例子以更清楚地理解这一点。比如市场营销问题。每家企业都希望通过市场营销来更好地推销他们的产品和服务。自古以来,市场营销一直是一个问题。假设印刷机发明后,市场营销也随之开始了。最初,营销问题处于一团乱麻的阶段,这时分析师团队试图找到最佳策略以助推销产品或服务。当时,报纸和平面媒体是唯一的宣传媒介,问题的策略和性质都受限于这两者。当一个问题属于全新的问题时,这个问题即处于一团乱麻的阶段;人们对如何解决这个问题毫无头绪。于是尝试通过实验和研究来了解该问题。逐渐地,获得一些关于系统和问题的知识,接着又确定出一些卓越的策略和方针来解决这个问题。此时,问题发展到了混沌不清的阶段。在这个阶段,依然不清楚问题的解决方法,但对如何去解决问题取得了较好的理解。最后,许多人经过大量的研究和实验,并且分享了他们取得的结果和理解,最终可能会获得一个具体的方法,以此作为一个完整的指南去解决这个问题。此时,问题就进入了清晰明朗的阶段。也就到达了问题解决方法的顶峰,人们对如何去解决问题获得了比较清晰的认识。然而,好景不长,在此期间一种颠覆性创新突然冒出来了,让好不容易到达清晰明朗状态的问题土崩瓦解,重返一团乱麻的阶段。在市场营销的例子中,人们当时采用的平面媒体和报纸宣传属于营销的最佳策略,但是当广播出现后却变得溃不成军。一夜之间,问题的性质发生了变化,需要采取截然不同的方法来解决问题。之前专家们虽然找到了解决问题的具体方法和策略,可是当问题重回到一团乱麻的阶段时,他们不得不从头开始寻求问题的解决之道。问题的生命周期仍然不断地演变,当电视蜂拥进入市场,以及后来社交媒体遍地开花之时,这种情况又故态重现。今日,随着社交媒体的蓬勃兴起以及在新领域的锐意开拓,市场营销问题虽身陷混沌不清的状态中,但目前尚属稳定。不过随着虚拟现实和增强现实的不断涌现,预计很快又将重返到一团乱麻的阶段。

为了显得更真实,接下来把这个场景与目前最新的问题结合起来。比如一位社交媒体分析师试着解决以下问题:根据一个用户的行为,优化Facebook新闻馈送中赞助广告的投放目标。如果发现这个用户是一个足球爱好者,则会在他订阅的新闻中植入一个运动服饰品牌的广告。为简单起见,假设他是第一个这样做的人,而且以往未曾有人尝试过这种做法。那么,问题目前尚处于一团乱麻的状态。因此,从逻辑上讲,互联网上没有任何参考资料或材料能够帮助或有助于研究。解决问题的首要任务是识别用户的兴趣爱好。一旦用户被确定为对足球感兴趣的潜在用户,需要在他订阅的新闻中植入赞助广告。那么,如何发现用户的兴趣?虽然有各种各样的指标可以帮助发现用户的兴趣爱好,但是为了一切从简,假设用户的兴趣爱好完全由他在个人页面发布的状态更新来确定。

那么,通过简单地分析这个用户更新的状态,可以界定他的兴趣爱好。如果“足球”这个词或任何热门足球运动员或足球队的名字出现次数超过了预设阈值,则认为此用户对足球情有独钟,因此他会是潜在的广告投放目标。基于这个简单的规则,创建出更优的策略和算法,在最短的时间内以最少的精力找到潜在用户,极大地提高了准确性。问题也逐渐从一团乱麻的阶段向混沌不清的阶段发展。此时对这个问题也取得了一定的认识。尽管还没能找到最好、最有效的解决方案,但无须做太多研究,也绝对形成了一个不错的想法,可以就此开始并找到一个解决方案。一段时间以来,我们和其他抱有类似想法的人进行着各种实验,发表各种博客和研究论文的结果,帮助他人从我们的方法和实验中学习到更多。终有一天,人们会试尽全面的解决方案方法,发现最好和最有效的解决方案,以对所研究的领域进行分析,这一刻终究会到来的。最后,问题到达了顶峰—即清晰明朗的阶段。

假若有一天,Facebook和其他社交媒体巨头猝不及防地发布了一个新功能。用户可以共享照片以及他们的状态更新。那么,用户使用社交网络的方式将会发生根本性的变化。人们往往发布更多的照片而非文字更新。所有曾被认为十分成功的思想领导力框架、研究论文和博客,此时似乎都变得毫无成效。我们不知道如何分析用户更新的照片,了解他们的兴趣爱好。更为糟糕的是,这个问题又回到了一团乱麻的阶段。这些重大变化一再发生。照片之后,可能会是视频,然后是音频等,这种情况会循环往复地出现。最近,社交网络上的用户行为发生了巨大变化。人们发布的照片比输入任何评论或状态更新要多得多。这些照片可能是也可能不是用户想要传达的信息的象征,冷嘲热讽或许才是目的。在互联网上病毒传播的模因(meme)并没有明确的信息嵌入其中。它可能只是用户想要评论的讽刺或简单的表情。而希望借助算法和计算机,分析这些图像的含义,理解用户传达的信息,了解他们的兴趣爱好,这无疑是一项颇具挑战性的任务。

因此,了解问题的生命周期有助于为问题的演变做好充分准备,以期更快更好地调整问题解决策略。1.5 问题的全貌

此刻肯定会有以下两个问题一直萦绕在脑海中挥之不去。 为什么认识问题的生命周期至关重要? 这如何为解决物联网问题增加价值?

在解决问题的同时,了解问题的当前状态对分析师而言格外重要。在解决问题时,因为数据科学家知道处于当前状态的问题发生变化是不可避免的,因而总会为问题生命周期的下一个状态做好准备。如果问题目前处于清晰明朗的状态,那么与问题处在一团乱麻或混沌不清阶段时相比,数据科学家投入的时间和精力将大大降低。在清晰明朗的阶段,问题所需的时间也是最少的。与问题生命周期中从任何一个阶段向下一个阶段的转换相比,从清晰明朗阶段到一团乱麻的转变时间更加短。在认识到问题的生命周期规律后,一家企业/数据科学家就会准备好应对短期内必然会发生的根本性变化。需要制定出一些灵活适用的解决方案,为问题的下一次变化做好准备。同样,如果问题出现在混沌不清的阶段,要将许多解决方案设计成针对特定用例或行业可以实施的方案。最后,当解决方案处于一团乱麻状态时,解决问题的方案将更多的是一种基于服务的方案而不是基于产品的。这时要将待解决问题的实验和研究的量,在一团乱麻状态下达到最高,而在清晰明朗状态下则为最少,如图1.5所示。图1.5

那么,这与物联网和决策科学以及这两个学科的交叉有什么关系呢?与物联网相比,决策科学在产业中更加普遍也更加流行。决策科学对数据进行了大量的实验和研究,从中挖掘真知灼见并增加数据的价值,这让决策科学目前处于混沌不清的阶段。另一方面,物联网属于一种新兴事物,仍需大量的研究和实验才能取得实质性成果,因此物联网尚处在一团乱麻的阶段。但是,当人们谈论这两者的交叉点时,是在处理一系列有趣的问题。一方面,现在一个相当成熟的决策科学的生态系统早已存在,通过实验给行业带来了实实在在的价值,而物联网还未脱离初始阶段。这两者的交叉部分是一个前景十分光明且利润极为丰厚的商业领域。另一方面,目前这个交叉点正处于一个从一团乱麻到混沌不清的阶段。不久,人们将亲眼目睹产业内大规模物联网用例的实质性结果发布,而这也将瞬间引发“物联网决策科学”产品化革命。而今对物联网决策科学所进行的实验迅猛增长,目前所取得的初始结果似乎前景无量。物联网决策科学正趋向混沌不清的状态发展,这一天为期不远了。

铭记这一点,接着学习解决问题的基础知识,同时为用例演变为混沌不清的状态时刻准备着。具体理解问题生命周期后,下面来详细探究问题的全貌。

那么,问题的全貌指的是什么?为什么要费力劳神去了解它呢?

最简单的一个答案是,理解问题的当前状态只是一个维度,但了解问题的类型是解决问题的一个更为重要的部分。下面对这个部分避繁就简地进行介绍。如果要了解问题的全貌,请参阅下面的图示,试着从频率和影响这两个维度上看问题。就像其他散点图一样,这个图也可以分为4个主要区域。 低影响:低频率。 低影响:高频率。 高影响:低频率。 高影响:高频率。

除了这4个部分,还可以识别出一个包含了所有这些区域其中一部分的大圆/大圈。在此圆圈内,问题可属于高频率或低频率,也可具有高影响或低影响。因此,把这个区域命名为不确定性区域,如图1.6所示。图1.6

现在继续了解在上述区域中突显了什么样的问题。每家企业都会遇到许许多多的问题。其中一些问题格外频繁,隔三岔五就发生,而另一些问题则十分罕见,鲜有发生。有些问题可能会产生巨大的影响,而有些可能只显现细微的影响。比如一家拥有数百到数千名员工的大型企业,有一些问题发生频率可能很低,影响也可能较低。此时通常

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载