数联网——大数据如何互联(txt+pdf+epub+mobi电子书下载)


发布时间:2020-05-25 16:16:11

点击下载

作者:段云峰 鄂海红

出版社:人民邮电出版社

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

数联网——大数据如何互联

数联网——大数据如何互联试读:

前言

我们已经从IT时代快速迈进了DT时代。在DT时代,万数互联的社会如何发展,本书将对其进行详解。

目前,大数据在国内甚是火热,许多企业在完成内部数据的沉淀和积累过程后,逐步进入数据的开放与共享阶段。互联网的哲学,即“开放与共享”。封闭的数据仅服务于企业本身,而开放的数据将服务于整个社会,并能带来更显著的效益。数联网(Internet of Data)的概念就是在这样一个时代产生的。数联网是以互联网为承载网络,通过标准的格式、接口、协议,进行数据的交换和互联,以更加丰富的数据维度,实现数据联通之后的各种业务应用。数联网将打通企业彼此间的壁垒,完成数据的互联互通,盘活企业的数据资产,这种升级是一种质变!

推动和实施国家大数据战略最重要的方面是以数据整合和共享为途径,推动实现技术融合、业务融合和数据融合,打通信息壁垒,实现跨层级、跨地域、跨系统、跨部门、跨企业的协同管理和服务。大数据的国家战略布局和实施,无处不体现着“万数互联”的建设目标。

数联网将“站”在互联网的肩膀上,推进互联网向更深层次发展,带动社会发生本质变革。

主要内容

第1章探讨了数联网在演进过程中所引发的各种变革和思考,希望给阅读者以启示。该章阐述了数联网产生的历史背景、大数据到数联网演进的必然性、数联网的概念和架构、数联网的关键内容、数联网与互联网的关系、数联网发展的意义及其多行业中的应用等内容。回顾过去,互联网的作用是解决人类信息交流问题,而数联网则面向数据的连接,解决数据的互通问题;数联网在数据连接的基础上,提供各种标准化的计算能力和更加丰富的应用,驱动企业和社会的本质变革。

数据的内容千差万别,数联网需要首先解决数据的联通问题。本书的第2章探讨和分析了数联网构建的基础——数联网的标准化问题,包括数据表示的标准化、数据传输的标准化、数据交换的标准化、数据应用接口的标准化、跨域数据互操作的标准化等内容。这种数据的联通,就像构筑高速公路的过程:给出基础建设的要求,给出高速公路上的运行标准要求,促成不同车辆在高速公路上规范、高速运行,大大提升车辆的通行率。

本书的第3章深入浅出地探讨了数联网的技术架构问题。首先,我们比照互联网的七层架构设计数联网的层次架构;其次,我们详细讲解如何解决数联网互联中数据的标准表述、数据标准化寻址、数据的浏览、数据的应用、数据的安全等相关问题。

数联网带来了新的管理问题。本书的第4章围绕数联网的生态圈探讨了数据管理架构的构建和演变。除了单点数据管理架构中的元数据管理、数据质量管理、数据标准、数据字典、数据安全、数据采集、传输、加工、处理、使用等内容,数联网管理还涉及从单点的数据管理架构延伸到多点链接的数联网生态体系的数据管理问题,如数联网中的域名、开源工具、数据编辑、参与主体等内容。

每一种创新都源于应用的需求。本书的第5章介绍了数联网的业务应用。数联网将催生新的搜索引擎、新的电商、新的社交网络、新的计算网络,让大数据的应用场景随着数据维度的丰富而产生更多的想象空间。这将对现有的互联网格局产生颠覆性的影响。

数联网的发展会面临各种各样的问题。本书的第6章探讨数联网面临的相关问题及其解决方案。在数联网时代,升级的不仅是互联网技术,更是商业模式的突破。如果说物联网是个万亿元级的市场,那么数联网也可以达到万亿元级的规模,甚至更加庞大,因为物联网也是数联网的一种数据输入源。因此,在如此庞大的规模下,如何借鉴已有的方法提出适用于数联网的解决方案是本章的核心。

数联网将促进电信行业的“凤凰涅槃”。本书的第7章描述了数联网对电信行业的影响。数联网解决了信息的互联问题,它为电信运营商进行电信大数据领域的合作拓展创造了条件。如何将电信的网络运维经验移植到数联网,实现数据价值的最大化;如何将数联网与边缘计算相结合;如何利用数联网完成电信行业的华丽转型。数联网为电信行业提供了“涅槃”的可能,运营商的数据积累也为数联网的发展奠定了基础,电信行业与数联网是相辅相成、互惠互利的。

数据的互联将开创新时代,为世界插上“智慧”的翅膀,更为中国带来了战略机遇。本书的第8章深入地分析了中国如何从互联网大国到数联网强国。今天的数联网如同几十年前刚刚萌芽的互联网、十余年前的物联网,即将朝气蓬勃地发展,未来的数联网将会以更加成熟的姿态展现在世界面前。

本书的读者对象

●正在经历大数据变革或准备大数据变革的制造业、服务业等企业人士;

●大数据行业的工作人士;

●大数据相关专业的本科生和研究生;

●具有一定的大数据知识,并想进一步提高的人士;

●进行大数据规划的企业、政府人员;

●对大数据感兴趣,想了解大数据基础知识的人士。

致谢

感谢北京邮电大学计算机学院的鄂海红副教授与我共同撰写本书。感谢中国移动的各位领导和同事,其中徐海勇、陶涛、黄岩、尚晶、徐萌等为本书的编写提供了参考和建议。

感谢北京邮电大学计算机学院的白杨(第3、4章)、张田宇(第2、6章),中国移动通信集团有限公司的叶青(第7章)在书籍编写过程中所做的贡献。

感谢北京邮电大学PCN&CAD中心的曹师久、江裕锋、刘庆、秦景坤、张城城、张崇宇、赵文骏在数联网相关研究的过程中所做的贡献。感谢东方国信公司的黄晓宇、史富伟、刘垚等同志的辛苦工作。

本书在编写的过程中,得到了公司领导和业界朋友的各种帮助,也希望以此书回报各位的关心和照顾。

最后,感谢所有在大数据和数联网实践路上共同努力的同事朋友们,让我们共同迎接数联网的来临!  第1章 概述

本节将介绍数联网的基本概念、数联网的基础知识和基本架构、与数联网相关的技术问题、数联网的业务应用和管理难点,以及与数联网相关的关键问题。

数联网能够为中国带来更多的战略发展机遇,激励各个行业飞跃发展,改善民众生活方式。

数联网将是数字中国的基础架构,将深刻影响各个行业,将是中国实现弯道超车的战略机遇!|1.1 互联网之后是什么|

互联网是20世纪60年代在个人计算机还未出现就已经出现的概念。互联网的主旨思想是将世界上所有的计算机连接起来(起初只是连接几台计算机)。随着个人计算机的发展、手机的出现和移动互联网的发展,互联网从各个方面改变了我们的生活。

我们可以在互联网上购物,也可以在互联网上看电影;在互联网上与朋友进行交流,分享自己的旅游照片;在互联网上搜索自己感兴趣的文章,发表自己的意见等。

但是,互联网是站在计算机的角度来思考世界的,而大数据则是站在数据的角度去观察世界。两者能否联系起来改变我们对世界的感知呢?1.1.1 互联网如何升级

互联网解决的是各种计算机的连接问题。经过50多年的发展,世界上的计算机被连接起来,由此产生了各种业务场景,人类科技史实现了一次巨大飞跃。1.1.1.1 互联网连接改变世界

计算机连接成互联网之后,世界为之改观,我们的生活和学习工作模式都发生了彻底的改变。

互联网已经成为我们生活不可缺少的基础设施。当前,人们不仅要解决衣、食、住、行的需求,更要解决信息通信的需求。图1-1展示了计算机互联的场景。图1-1 互联网将“孤立”的计算机连接起来1.1.1.2 如何将底层通信升级为大数据通信

互联网是面向计算机通信的,这种通信建立在TCP/IP基础上,每台上网的计算机被分配一个IP地址(静态或者动态),然后进行识别和信息传输工作。这种通信的层级比较低,以二进制信息传输为主。所有的通信,不论是图片、视频,还是各种数据,最终都要被转换成为二进制数据,然后进行传输。

如果传输的对象是数据,那么能否建立一个面向数据传输的网络,让用户透明地感知各种数据,寻找自己需要的数据;同时,用户能够正确理解数据的内容,对数据进行计算,生成自己需要的结果呢?

互联网通信如何升级成为大数据通信呢?这就需要“数联网”来解决。1.1.2 大数据面临的挑战

互联网的出现,尤其是移动互联网的发展,产生了海量的大数据,但是这些大数据被分裂地存放在各机构中。例如:淘宝网站将用户的各种购物数据进行了存储,用于分析用户的购物喜好等行为,但是这些数据并没有对外公开。

这种现象,很像当年没有连接互联网时的单机时代出现的情景,每台计算机有自己的信息、自己的CPU,且彼此间没有连接,没有信息交换。1.1.2.1 孤立的数据湖水无法汇成江海

当每个机构的大数据数量足够大时,就形成了数据“湖水”。每个机构都在自己的数据“湖水”中劳作,分析自己的用户,寻找自己机构管理中的问题。例如:中国通信企业根据自己的用户话单等数据,分析出用户的喜好行为,对用户进行手机报等增值业务的营销。

但这种数据分析只能源于机构自身的数据,用户在其他领域的消费数据无法被收集,例如:用户在京东网站上购买了哪些商品,用户在工商银行每月消费了多少钱等。

湖水最终要汇入大海,那么每个机构的数据能否互联起来,汇成大数据的“海洋”呢?1.购车分析

举例而言:张博士要购买一辆汽车,他有购车的预算、购买的车型范围(例如从A、B、C三款车中挑选)以及对车辆性能的考量(如油耗、安全性等)。目前的场景是,张博士要在各个网站浏览,寻找A、B、C这三款车的各个方面的数据,收集车友们实际的油耗数据,查找碰撞的事故数据,再对比各个卖车点的价格数据和售后数据,然后才能决定购买哪款车,在哪里买等。2.用户评价、产品评测、市场销量、广告效果等维度

能否直接获取关于A、B、C三款车型的相关数据呢?

如果有了数联网,张博士就可以直接搜索A、B、C三款车在不同销售点的售价数据,直接收集相关车友的实际油耗数据进行测算,收集各种事故碰撞数据进行分析。

此外,张博士也可以直接收集用户评价数据(如各个用户给出的几星服务数据)、产品测试数据(如不同媒体的刹车距离实测数据)、市场销售数据(如当地市场的保有率数据)、广告效果数据(如某广告的回搜率数据)等。

有了这些数据,张博士可以对A、B、C三款车型有更加量化的分析,结合自己的需求,他就可以进行理性选择。

互联网解决了信息的不对称问题,而数联网解决了数据的不对称问题。1.1.2.2 非结构化数据的“淹没”问题

有人会想,目前的搜索引擎也可以完成上述这些数据的收集工作。实际情况是,我们目前自己在互联网上搜索上述数据时(尤其是非结构化数据),我们所需要的数据常常会被“淹没”。而且这种非结构化数据,需要我们一张照片、一张照片地去读、去分析,十分麻烦。

首先,这些搜索引擎已经被大量的碎片信息淹没,我们需要每个链接、每个链接地去阅读、去识别,且不一定能找到自己想要的数据。

其次,这些数据是零碎的,我们要将每条数据记录下来,然后去汇总、整理。

最后,我们无法收集到所有的数据,因为很多数据是不对外公开的。例如,交通事故后的碰撞照片很难从外部获取。

据IBM公司测算,目前那些大公司的数据库中只有7%的信息真正派上了用场。

搜索引擎工作的对象是互联网上公开的文档,搜索引擎只是提供一种链接,并不能进行数据分析,用户需要自己逐条去阅读、辨别数据。当数据规模十分庞杂时,传统的搜索引擎实际已经丧失了信息搜索能力。

其结果就是,我们通过搜索引擎找数据,翻过几个无效页面之后,就选择放弃了。因为我们已经被淹没在各种无效的“链接”里,而搜索引擎却并未“与时俱进”地提供数据分析能力,帮助我们甄别出有用的信息。1.1.2.3 从处理结构化数据开始

我们才刚刚开始拥有处理非结构化数据的能力,但却积累了几十年处理结构化数据的经验。

例如,如果张博士需要的各种买车相关数据都存在各个机构的数据库中,而这些数据库都对他开放,那么问题就简单了。

张博士可以直接连接上这些数据库,选择自己需要的数据,然后直接进行记录、计算,形成自己的数据分析结论。1.结构化数据的连接

结构化数据目前存在各个机构的数据库或者数据仓库中。这些数据库中的结构化数据,已经经过了初步的信息加工和处理,数据质量得到了基本保障。那么,能否先将不同机构数据库中的数据连接起来解决一些问题呢?

在每个机构的内部,不同的IT系统之间,通过数据接口,结构化数据互联工作已得以实现。有的企业通过数据仓库,已经完成了内部数据的汇总、整理工作。目前急切需要的是开放这些数据仓库中不敏感的数据,将其进行联接,产生价值。

例如,张博士买车的数据,可以从汽车企业内部数据库中获取,或者从媒体公开的数据库中获取。将这些数据互联之后,张博士可以对A、B、C三款车型进行量化和分析。2.如何将非结构化数据变成结构化数据

网络上有大量的非结构化数据,如何对这些非结构化数据进行处理是目前我们遇到的主要问题。目前解决这些问题的主要方法依然是将这些非结构化数据转换成为结构化数据,然后对其进行分析(例如:数据分析者先将用户的一段语音进行识别转换,先转换成为文本文件;然后通过爬虫技术,分析哪些关键词出现的频率最高;最后通过一定的算法,判断该段录音文字反映的主要内容是什么)。

而对于能够拆出其中视频录音对话文件的视频资料,也可以采用上述方法,给出该段视频文件的内容标签和关键摘要,据此给出检索依据。

例如,A型车的某段车友越野视频中会有描述该车通过了什么路段、效果如何等录音信息,通过分析录音文件,用户可以判断该段视频是A型车进行野外泥泞路段的越野视频。据此,张博士可快速获取自己所需的有效信息,避免查看大量无关视频而浪费时间。3.非结构化数据能否直接被处理

非结构化数据是否能够不转换成为结构化数据而直接被处理呢?答案是肯定的。运用谷歌的图像处理技术,用户可以直接分析一张合影照片中每个人的表情,如哪几个人是微笑的、哪几个人是沮丧的、哪几个人是难过的等。据此,用户可以判断这种照片的表情归属。

这种计算是基于计算机视觉中的图像分析进行的,目前还在探索阶段,需要耗费大量的计算资源,远没有结构化数据的计算那么简单。

但互联网中80%以上是非结构化数据,未来,非结构化数据的处理能力将决定着大数据应用的前景。1.1.2.4 如何让数据流通起来

大数据面临的另一个挑战是,如何让这些机构内部的大数据流通起来,让这些大数据不仅可以满足机构内部的营销和管理需求,也能带来外部的服务效益和价值。

每个机构在收集整理其内部大数据时,都是为了内部营销和管理。用户资料(姓名、性别、年龄等)和用户行为数据(如购买了哪些商品等)都是以对内服务为主要目的的,如果其不能满足机构内部管理需要,就会被丢弃。

那么,如何让这些数据发挥可为其他机构服务的价值呢?1.流通的数据带来价值

学过经济学的读者应该知道,只有能够流通的物品,才能被称为商品,才会在流通中产生价值。企业内部的数据如果不流通,其价值也是有限的。例如,淘宝的数据如果仅服务于阿里巴巴公司,则仅可以提升阿里巴巴公司的市场营销能力;但如果被公布出来,就可以帮助整个电商零售行业发现市场的一些趋势,甚至是中国经济的一些走势。如果再补充一些京东等电商平台的数据,这种趋势预测会更加准确,从而可以辅助政府进行政策决策。

同样地,淘宝如果将数据向银行业进行流通,可以帮助银行分析出高端用户在网购时有哪些需求和特点;同时,淘宝也可以看出哪些网购用户是银行的高端用户,从而对这些用户可以进行高档商品的专项营销活动,提升商品营销效果。

由此可见,如果企业内部的数据能够进行体外流通,是可以带来很大价值的。2.流通的原则亟待探索

让各机构打开自己的数据库进行数据流通,就要探讨有关的具体原则。

第一,这种数据流通不能侵害用户隐私。不能将用户的隐私数据进行流通,因为这将损害用户的利益,并最终损害企业的利益。

第二,这种数据流通不能侵害企业利益。例如,淘宝可能不会愿意将自己的用户数据与京东分享,因为京东的市场占有率没有淘宝大,这种分享可能会导致部分用户从淘宝流失到京东。

第三,数据流通要坚持互惠互利的“共赢”原则。参与数据流通的各方,都可以在数据流通/交换中获得利润。例如,淘宝和银行进行数据流通,会提高彼此对于用户的深度分析能力,提高彼此的市场占有率,这种共赢的模式是数据流通的主流。

第四,数据流通要有足够的管控手段。这包括提供安全的数据流通手段以及建立互信的诚信机制,以避免数据泄露,降低使用风险等。1.1.3 封闭是“背道而驰”

过去的几十年,每个机构都在积极进行各自IT系统的建设工作,积累了大量的数据。例如,中国某通信企业积累了200PB的各种数据,但是,这些数据目前都是不能对外开放的。封闭的数据仅能服务于自身,而开放的数据将服务于整个社会,带来更显著的效益。

互联网的哲学就是“开放和共享”。但是在传统的IT系统建设思维中,每个企业、每个部门都将自己建的IT系统和数据据为己有,认为是自己的资产。企业内部要想打通数据壁垒,将所有的IT系统连接起来,建立企业级数据仓库都很不容易,更何况企业间的数据流通呢?

然而,开放和共享是大势所趋!企业在完成了企业级数据仓库的建设之后,即将面临着如何将自己的数据价值最大化的问题。企业内部的数据,其价值仅是服务企业内部管理;而在企业外部流通的数据则可以提供更广阔的想象空间,带来巨大的商业价值。

通过中国通信企业的内部数据,我们能够看出通信行为的变迁,看出人们关心的热点有哪些偏移,识别出人群迁徙的轨迹等。这些数据可以服务政府的旅游部门,也可以服务于旅游企业等。1.1.3.1 从打开彼此的数据库开始

那么,如何打开机构间数据封闭的壁垒呢?答案是打开彼此的数据库。在法律允许的情况下,在保障用户隐私等前提下,企业可将部分非敏感数据开放出来,因为一些对自己企业没有用处的数据可能对别人意义重大。

在确定了可以开放的数据范围之后,企业就可以将这些数据库进行开放,可以通过以下形式进行开放。(1)提供对外数据服务的接口

外部用户可通过接口调用数据,并分析数据。例如,张博士通过使用A型车企业的内部数据库,了解该车的各种生产情况及其返修情况等。(2)提供数据库对外用户权限

外部用户可直接登录到该数据库,直接访问相关的数据库表,并进行有关的汇总计算等操作。例如,张博士可以直接登录到A型车企内部的MYSQL数据库,并进行有关的汇总、查询等操作。

企业要开放数据库,还要提供数据库的有关结构信息,包括有哪些数据、这些数据存放在什么库表中、每个字段的详细定义等。

随着云计算的出现,更多的数据被存放在Hadoop环境下的HDFS文件中。数联网同样面临着如何利用这些存放在Hadoop环境中的数据的问题。1.1.3.2 开放的数据更具价值

前文已经阐述过,开放的数据才会更有价值。就像互联网,如果当时所有的计算机都不愿意联网,不愿意分享自己的信息,互联网就不会发展到今天。

同样地,自己企业的数据量再“大”,也无法和世界的数据量进行对比。每个企业的数据库,如果不被开放,可能就只拥有几十个使用用户,而一旦被开放,将会有几百、几千甚至几万的使用用户,这些用户会从各个角度分析数据,将数据的价值最大化,从而促进整个社会的共同进步和发展。1.“横看成岭侧成峰”——不同角度看数据

数据要被开放的一个主要原因是,每个企业的数据都是站在企业自身角度产生的数据,而企业对数据的理解也是站在自身的角度。古诗“横看成岭侧成峰”说明,我们如果换个角度对这些数据进行解读,也许会有新的理解。

举例说明,通信企业能够看到某个高校某个专业学生群体的上网时间分布,而这群学生上网的时间集中在上午的10:00—11:00,通信企业关心的是,是否需要在这个时间段给学生们提供一个优惠的资费套餐,促进学生产生更多的上网流量。而站在学校角度,如果这个学生群体在这个时间段上网时间居多,是否证明这个时段的课程授课效果很不理想,学生们没有认真听讲,而是在用手机上网呢?学校据此可以从另一个角度去评估老师的授课效果和学生的学习状态。2.衍生的大数据生态链和商业模式

开放的数据能够带来很多新的商业模式。互联网因为具备开放的属性,才衍生出如此多的商业模式,从而在为各方带来利润的同时,也极大丰富了人们的生活内容。

各种数据开放的商业模式都会产生自己的生态链,带动相关产业的发展。

数据在开放的过程中,就会带来对数据质量管理水平提升的要求,这就催生了数据质量管理咨询企业的诞生。只有好的数据才能卖出更高的价格。

未来,数联网在进行数据开放的过程中,也会催生更多的商业模式,要对这些模式进行探索,相应也会产生很多新的公司,带来更多的经济效益。1.1.3.3 如何解决理念问题

要让数据被开放,我们首先要解决理念问题。

各个机构在开放自己的数据时,必然面临理念层面的问题。例如,企业会考虑这些数据能够带来哪些收益、数据开放会带来哪些风险、数据开放是否会泄露自己机构的核心机密等。

因此,必须要有一些企业先解放思想、勇于探索,主动开放自己的数据。这些企业与其他人共享的过程中会产生显著的优势,进而会带动其他企业跟进前行。

这种开放的理念也需要不断地被宣传。互联网的发展离不开大学生群体的推动,因为他们可以在BBS上看到别人的故事,然后也会开始分享自己的故事。在毕业之后,这些学生群体将这种分享的理念带到各自工作中,将其扩展到社会的各个领域。

既然互联网能够让大家共享自己的信息,那么数联网也一定能够让大家共享自己的数据。1.数据是私有的吗

要解决数据开放的理念问题,就要澄清一个观念,那就是数据是私有的吗?

从理念而言,各机构收集到用户数据之后,就会据为己有,把其当作自己的私有财产。但是在法理层面,这些数据是否应该属于用户自己(用户只是没有能力存储、处理数据),而由企业代为存储和处理呢?因此,用户在接受某个企业服务时所产生的数据,归属权在法理上目前是不明确的。用户是否有权要求企业提供自己的数据、告知自己的使用习惯等,这些内容在法律上还处于探索阶段。

由此,哪些数据是私有的、如何界定数据的归属权等问题还处于讨论阶段。2.构建“共享”“共赢”的理念

互联网改变了人们的精神状况,网民在互联网上分享自己的游记、自己的情感故事等内容,同时也分享着别人的喜、怒、哀、乐。互联网催生了“共享”“共赢”的理念。数联网构建在互联网之上,同样也将继承互联网这种“共享”“共赢”的理念。

例如,中国移动在与招商银行构建用户征信服务系统,并对外提供服务时,中国移动能够获得用户的真实身份、交往圈特征、用户消费特征等信息;而招商银行有用户在银行的借贷信息、消费信息等。在获得用户的授权之后,中国移动和招商银行将数据进行共享,并可以为第三方企业提供比较可靠的某个用户的征信信息。1.1.4 大数据的“智慧”如何联网

大数据能够解决企业的数据积累问题,之后可以将这些数据应用于对企业的精准营销和精细管理中。大数据在企业中的应用,可以为企业的各种活动提供量化指导。1.1.4.1 数据基础上的“智慧”

科学管理之父弗雷德里克·温斯洛·泰勒1898年前后在伯利恒钢铁公司(Bethlehem Steel Company)进行了著名的“铁锹实验”。通过观察和量化分析,他发现每个工人每锹铲铁矿石的最佳重量约为21磅(1磅=0.4536kg)。由此,他根据不同的原材料(煤矿、铁砂等),设计了不同形状、大小的铁锹。

这一研究的结果是非常杰出的,它推动堆料场的劳动力规模从400~600人减少为140人,使得平均每人每天的操作量从16吨提高到59吨,每个工人的日工资从1.15美元提高到1.88美元。

这种基于数据的量化分析,奠定了现代科学管理的基础。同样地,企业中的大数据也可以服务于内部的精细化管理,为企业管理注入“智慧”。

例如,中国移动通过数据分析进行了4G业务换卡促销活动,某市公司在进行用户分群之后,设定个性化营销用语,并将其在用户查询业务时触发。结果,该活动触及2.9万用户,换卡用户达到2980户,换卡率达到10%。1.1.4.2 从单人“智慧”到众人“智慧”

每个企业基于自己的大数据系统,能够实现自己的“智慧”升级。但是,如果将这些数据联网,就可以实现从单人“智慧”到众人“智慧”的升级。

例如,很多人都会玩中国象棋,会根据自己的经验,拥有自己的下棋方式和方法。但职业的象棋手一定要记忆大量的象棋“定式”,知道各种棋局的“死活”。这些定式组成了棋谱,棋谱因此汇聚了很多前人的经验和教训,聚集了“众人智慧”。而一位象棋高手究其一生,所下的棋数量是有限的,只有学习前人的积累的精华(棋谱),他才能进入更高的层次。

同样地,企业的“智慧”也需要借鉴别人的经验,从而降低自己的决策风险。1.1.4.3“智慧”互联“智慧”的互联首先要解决数据的互联,而这正是数联网的基础。

有了数联网基础之后,企业的“智慧”也可以互联。每个企业可利用自己的大数据,形成自己的智慧经验,构建自己的知识库。

例如,中国移动在不同的省公司间,经常要进行经验的交流和分享,甚至构建统一的“营销知识库”,目的就是要进行“智慧”的互联,提升每个省公司的“智慧”程度。1.知识库的构建

每个企业的“智慧”,都可以通过“知识库”的形式被存储。首先,这些知识要被分类,包括用户、产品、营销等;其次,这些知识要被管理,图1-2所示为某企业的知识库功能架构。

单点的知识库生产完成之后,企业就可以考虑知识库的联网问题。某个企业如果吸纳了其他企业的知识库,无疑将极大丰富自身“知识”的种类和内容。图1-2 某企业知识库的功能架构

这种智慧的互联和汇集,在宏观角度上类似于神经网络中的神经元的增加,更多的记忆单元和计算单元可以显著提升“智慧”的能力。

目前,人工智能的进展主要集中于深度学习算法和大数据,而数联网将极大地扩展大数据的范围,数联网中的计算节点,也将增加深度学习的计算能力,促进人工智能更上一层楼。2.新时代的医疗——DIY的可能

在智慧互联的场景中,最吸引人的是医疗的变化。

每个医生都有自己的医疗知识库,如果将这些知识进行联网,就可以形成智慧医疗。

例如,A医院脑外科的知识库如果与B医院脑外科的知识库进行互联,就可以丰富在脑外科手术中的各种病例及处理方法,这时的知识库已经变成了“A+B”医院的知识库。

那么,这种知识库如何对外开放呢?病人可以在知识库中自己寻找与自己类似的病例,大致了解处理的过程和结果,这也促进了病例分析的DIY过程。

这种方式,提升了医病过程的透明度,也提升了病人和医生间的相互理解度,进而降低医疗事故的发生率。

这种病例数据的丰富,也为后期人工智能在医学领域的应用奠定了基础。|1.2 从大数据到数联网|

互联网的发展催生了海量的大数据,而这些大数据只有连接起来,才能够发挥更大的作用和价值。

大数据强调了数据的“量”,这种从TB到PB级海量数据的处理能力(主要是单点处理能力),是大数据面临的首要问题。而数联网强调的是单个大数据节点间的互联,强调的是群体的处理能力,这两者相辅相成,共同“培养”了未来数据的处理、分析能力。1.2.1 历史溯源1.2.1.1 单点大数据的历史

计算机数据处理的发展历程,是从单点数据处理发展到联网数据处理的过程。1.纸带

最早的计算机是将数据存储在打孔纸带上,通过带孔为1,无孔为0,对数据进行记录和处理,这是计算机的最初数据存储形式。借助这些纸带,通过光电信号转换,借助二进制形式,计算机对各种数据进行存储、处理,如图1-3所示。图1-3 计算机的打孔纸带2.文件

纸带作为数据存储形式之后,又出现了磁带和磁盘作为数据存储介质。数据是通过文件进行存储的。文件是由一些字符的串行组成的,其中二进制文件一般是指除了文本文件以外的文件。

在文件系统阶段,数据以文件为单位被存储在外部存储器上,由操作系统统一管理。操作系统为用户使用文件提供了友好界面。文件的逻辑结构与物理结构脱钩,程序和数据分离,使数据与程序有了一定的独立性。用户的程序与数据可分别被存放在外部存储器上,各个应用程序可以共享一组数据,这就实现了以文件为单位的数据共享。

文件是计算机数据存储的一种早期形式,记录最简单的数据结构和少量的数据内容。3.数据库

1970年,IBM的研究员E.F.Codd博士在刊物《Communication of the ACM》上发表了一篇名为“A Relational Model of Data for Large Shared Data Banks”的论文,提出了关系模型的概念,这奠定了关系模型的理论基础,这篇论文被普遍认为是数据库系统历史上具有划时代意义的里程碑。

1974年,IBM的Ray Boyce和Don Chamberlin将Codd关系数据库的12条准则的数学定义以简单的关键字语法表现出来,里程碑式地提出了结构化查询语言(Structured Query Language,SQL)。SQL的功能包括查询、操纵、定义和控制,是一个综合的、通用的关系数据库语言,同时又是一种高度非过程化的语言,只要求用户指出做什么而不需要指出怎么做。

1979年,Oracle公司引入了第一个商用SQL关系数据库管理系统;1983年,IBM推出了DB2数据库产品。

在文件系统阶段,人们在信息处理中关注的中心问题是系统功能的设计,因此程序设计占主导地位,而在数据库方式下,数据开始占据了中心位置,数据的结构设计成为信息系统的核心,而应用程序则以既定的数据结构为基础进行设计。4.数据仓库

1991年,W.H.Bill Inmon发表了《构建数据仓库》,并给出了数据仓库的定义:数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持管理决策。

数据仓库是在数据库已经大量存在的情况下,为了解决数据资源的进一步挖掘和决策需要而产生的,它并不是所谓的“大型数据库”。数据仓库中的数据是在对原有分散的数据库数据进行抽取、清理的基础上经过系统加工、汇总和整理得到的。数据仓库的数据主要供企业决策分析之用。某个数据一旦进入数据仓库,一般情况下将被长期保留。

企业数据仓库的建设以现有企业业务系统和大量业务数据的积累为基础。数据仓库不是静态的概念,只有把信息及时交给需要这些信息的使用者,供他们做出改善其业务经营的决策,信息才能发挥作用,信息才有意义。而数据仓库的根本任务是把信息加以整理归纳和重组,及时供相应的管理决策人员所用。因此,从产业界的角度看,数据仓库的建设是一个工程,也是一个过程。5.大数据中心“大数据”是指由多方搜集而来以多元形式存在的庞大数据组,往往具有实时性。在企业销售的环境中,这些数据可能来自社交网络、电子商务网站、顾客来访记录,除此之外,还有许多其他来源。

大数据的特点有以下4点。第一,数据体量巨大。大数据从TB级别,已经跃升到PB级别。第二,数据类型繁多。大数据包括网络日志、视频、图片、地理位置信息等。第三,价值密度低。以视频为例,在连续不间断的监控过程中,可能有用的数据仅仅出现一两秒。第四,处理速度快。1秒定律,这一点也是大数据和传统的数据挖掘技术的本质区别。

大数据中心相较数据仓库最大的变化是,要存储大量的非结构化数据,处理的技术依赖云计算等新的计算模式。

由数据处理技术发展的历程可以知道,单点数据处理能力在逐步加强。在企业的内部,数据处理历程也是沿着上述的历程发展的。1.2.1.2 互联的历史

我们从另一个角度回顾一下计算机联网的历程。从早期的远程终端连接阶段开始,计算机联网经历了计算机网络(局域网和广域网),到现在的计算机互联网时代。

计算机进行互联的过程,改写了社会发展的历史,对人们生活、工作等各个方面产生了深远的影响。1.计算机联网的发展

计算机网络是指将地理位置不同的具有独立功能的多台计算机及其外部设备,通过通信线路连接起来,在网络操作系统、网络管理软件及网络通信协议的管理和协调下,实现资源共享和信息传递的计算机系统。(1)从局域网到广域网

局域网(Local Area Network,LAN)就是作用于局部地区范围内的网络,它所覆盖的地区范围较小。局域网对计算机的数量配置没有太多的限制,少的可以只有两台,多的可达几百台。一般来说,在企业局域网中,工作站的数量在几十到两百台。在网络上,其所涉及的地理距离从几米至几十千米。局域网一般位于一座建筑物或一个单位内,不存在寻径问题,不包括网络层的应用。

这种局域网的特点是连接范围窄、用户数少、配置容易、连接速率高。10Gbit/s以太网拥有目前最快的局域网速率。IEEE 802标准委员会定义了多种主要的局域网:以太网(Ethernet)、令牌环网(Token Ring)、光纤分布式接口网络(FDDI)、异步传输模式网(ATM)以及最新的无线局域网(WLAN)。

广域网(Wide Area Network,WAN)也称为远程网,所覆盖的范围比城域网(Metropolitan Area Network,MAN)更广,它一般是由不同城市之间的局域网或者城域网进行互联形成的,覆盖的地理范围可达几百千米到几千千米。因为距离较远,信息衰减比较严重,所以这种网络一般要租用专线,通过IMP(Interface Message Processor,接口报文处理器)和线路连接,构成网状结构,解决循径问题。这种广域网因为所连接的用户多,而总出口带宽有限,所以用户的终端连接速率一般较低,通常为9.6 kbit/s~45Mbit/s。

这些网络形式都是早期计算机进行互联的形式。(2)TCP/IP下的互联网

互联网始于1969年美国的阿帕网,它是指网络与网络之间所串联成的庞大网络,这些网络以一组通用的协议相连,形成逻辑上的巨大单一的国际网络。

互联网使用一种专门的计算机语言(协议),以保证数据安全、可靠地到达指定的目的地。这种语言分为TCP(Transmission Control Protocol,传输控制协议)和IP(Internet Protocol,网间协议)两部分。

互联网将世界上的计算机进行了广泛连接,用户可以在互联网上寻找到各种资料。2.数据库连接

互联网解决了计算机的物理连接问题,但是数据库如何进行连接,依旧是个难题,原因如下:首先,各种企业采用了不同的数据库产品,有关的数据模型也千差万别,其对数据的理解相距甚远;其次,很多企业将自己的数据库视为私有财产,不愿意分享有关的数据内容;最后,现有的技术和理念还无法完全解决数据库连接等问题,虽然前期一些企业进行了一定程度的技术层面的尝试,但远远还不够。(1)通过接口连接

连接两个数据库最简单的办法就是通过接口对其进行连接。

开放数据库连接(Open Database Connectivity,ODBC)是微软公司开放服务结构(WOSA,Windows Open Services Architecture)中有关数据库的一个组成部分,它建立了一组规范,并提供了一组对数据库访问的标准——应用程序编程接口(Application Programming Interface,API)。这些API利用SQL来完成大部分任务。开放数据库连接(Open Database Connectivity,ODBC)本身也提供了对SQL的支持,用户可以直接将SQL语句发送给ODBC。ODBC是微软提出的数据库访问接口标准。ODBC定义了访问数据库API的一个规范,这些API独立于不同厂商的数据库管理系统(Database Management System,DBMS),也独立于具体的编程语言。

微软的ODBC文档是用C语言描述的,许多实际的ODBC驱动程序也是用C语言写的。

一个基于ODBC的应用程序对数据库的操作不依赖任何DBMS,不直接与DBMS打交道,所有的数据库操作由对应的DBMS的ODBC驱动程序完成。也就是说,用户不论是访问FoxPro、Access还是Oracle数据库,均可用ODBC API。由此可见,ODBC的最大优点是能以统一的方式处理所有的数据库。

Java数据库连接(Java Data Base Connectivity,JDBC)是一种用于执行SQL语句的Java API,可以为多种关系数据库提供统一访问,它由一组用Java语言编写的类和接口组成。JDBC提供了一种基准,数据库开发人员据此可以构建更高级的工具和接口,进而编写数据库应用程序。

JDBC对Java程序员而言是API,对实现与数据库连接的服务提供商而言是接口模型。JDBC为程序开发提供标准的接口,并为数据库厂商及第三方中间件厂商实现与数据库的连接提供了标准方法。

ODBC不适合直接在Java中使用,因为它使用C语言接口。从Java调用本地C代码在安全性、实现、坚固性和程序的自动移植性方面都有许多缺点。JDBC可以被想象成被转换为面向对象接口的ODBC,而面向对象的接口对Java程序员来说更易于接受。(2)建立“联邦”机制

数据联邦的出现是为了解决企业内部异构数据库的访问问题。IBM提出了较多相关的概念。

DB2数据联邦引入了虚拟数据库的概念,这个虚拟数据库是通过连接多个异构数据源而创建的。DB2数据联邦的用户可以随意查询存储在联邦系统中任意位置的数据,而不必担心数据的位置、实际数据源系统的SQL种类或者存储的能力。

通过数据联邦,用户可以透明地访问企业内部各种异构数据库,获取数据结果。3.企事业服务总线(ESB)

企业的内部要进行数据的连接,也会采用服务总线技术。

企业服务总线(Enterprise Service Bus,ESB)是传统中间件技术与XML、Web服务等技术结合的产物。ESB可以提供比传统中间件产品更为廉价的解决方案,同时它还可以消除不同应用之间的技术差异,让不同的应用服务器协调运作,从而实现不同服务之间的通信和整合。从功能上看,ESB提供了事件驱动和文档导向的处理模式,以及分布式的运行管理机制,它支持基于内容的路由和过滤,具备了复杂数据的传输能力,并可以提供一系列的标准接口。

ESB的功能有隐藏复杂性,简化访问,允许开发人员使用通用的、规范的查询,访问异构系统的数据细节。

基于ESB的理念,企业数据总线(Enterprise Data Bus,EDB)概念出现了。它是指集成各个原始数据库并对外提供一种有规则的、可控的数据连接的存储服务。

ESB和EDB都是站在企业内部角度,力图解决异构环境的数据联通问题,建立一个通用的访问总线,避免每个不同系统间“一对一”的网状连接模式。

为了屏蔽不同数据库的差异,某电信企业采用了数据封装的模式,将底层的数据加上一个封装层,屏蔽不同的数据库产品和不同的数据模型差异等。同时,该模式通过统一的逻辑SQL语句调用不同数据库中的数据,满足上层应用需要,如图1-4所示。图1-4 某电信企业的数据封装架构

其中,数据封装的功能架构包含了数据服务组件和数据服务管理两部分。

数据服务组件的封装从支撑业务需求的角度出发,通过消息交换模式、数据组织方式、数据服务描述和数据服务实现等技术手段完成。数据服务组件是具体的服务实体,实现具体的数据处理逻辑和数据操作功能。

数据服务管理主要负责对接收到的请求方的消息进行控制和管理,各类应用作为数据服务请求方,发送请求消息给数据服务管理模块。当数据服务管理模块接收到具体的请求后,会对请求的消息进行安全控制、查找及路由等工作,再将请求的消息参数发送给数据服务组件。数据服务组件负责接收数据服务管理模块的消息,将请求的消息参数与数据仓库中的数据进行交互,并将应答的消息返回给数据服务管理模块,最后,数据服务管理模块负责将应答的消息返回给数据服务请求方。4.企事业间的数据互联

大多数企业在内部数据连接方面已经积累了几十年的经验,但对于如何进行企业间的数据互联了解甚少。(1)如何从“一对一”到“统一”

企业间的数据互联采用的基本都是“一对一”的模式,即两个企业针对要交换的数据内容,逐一设定有关的数据交换接口,然后根据一定的管理要求,定时或者实时地传送数据。

这种连接基本是“一对一”的,不同系统间会有网状的连接关系,这种连接的管理十分复杂,在质量保障方面也较困难。(2)数据互联的“TCP/IP”

互联网借助底层的TCP/IP解决了有关连接的问题,同时,借助该协议,互联网可以完成对计算机的寻址,其上的HTTP还可帮助完成对网页的获取。企业间数据互联的过程,是否也能参考互联网的连接模式,建立类似底层的“TCP/IP”,然后自动寻址和传输,解决数据的自动连接问题呢?

大型互联网企业尝试的方法是提供统一的API调用。例如,淘宝提供了几百个对外开放的数据访问API函数,外部应用可以通过API函数调用,访问相关数据。但是这种模式是以淘宝为访问目的的,并不是以数据交互的角度进行的。例如,淘宝的数据如果要和百度的数据进行大范围的交互,这种API调用的模式就无法满足需求了。

因此,我们需要一种普遍的技术架构和模式,让所有的数据企业平等地进行连接,平等地进行交互。1.2.2 万数互联

互联网已经让世界上的计算机从物理上连接起来;同时,通过浏览器,用户初步实现了信息连接和交互。那么每台计算机上都有大量的数据,很多是以Hadoop文件等形式存放的,如何将这些数据连接起来呢?1.2.2.1 从万物互联到万数互联

在物联网的发展过程中,人们提出了“万物互联”的概念,即将所有的物品通过“物联网”进行连接。物联网是叠加在互联网之上的,复用底层的TCP/IP,在上层完成有关的通信行为。

那么,我们是否可以借助“物联网”的思路,通过“数联网”解决“万数互联”的问题呢?答案是肯定的。

数联网是站在数据互联的角度,区别于物联网中“物”的互联,数联网的这种连接层级也要高一些。数据连接要解决数据的标准、数据寻址、数据语义表述等方面的问题,建立在数联网上的业务应用也将十分丰富,比如数据级的共享服务。例如,淘宝如果将自己的用户数据和京东的用户数据进行融合,将会对用户有更深刻的理解和分析,了解用户更全面的需求特征。

物联网增加可互联的范围,而数联网通过对数据的分析,可提升对互联网内容的深度解析和理解,图1-5为物联网架构。图1-5 物联网架构1.2.2.2 大数据是否为单节点概念

大数据的概念更多强调数据的数量、数据的类型和数据的处理能力,从概念和目前的实践过程来看,它更多是关注一个企业内部的数据,因此更像是单节点的数据概念。但笔者以为,大数据更应该扩展其外延,应该关注企业间的数据互联,应该站在“数联网”的角度去解决大数据的处理及发展问题。

有了数联网的铺垫,大数据才会有“质”的提升,其研究范围才会更加广阔,商业模式才会更加丰富,技术扩展才会更加广泛,从而助力新一轮产业升级。1.2.2.3 从真实的世界到数据的世界

我们眼前看到的是真实的世界,房子、景点、人物等都是真实存在的。但站在数据的角度,房子会包含价格、位置、户型等属性,景点会包含内容、特点、游客量等属性,人物则将包含姓名、性别、年龄、收入、爱好等属性,这些属性均可以通过数据被量化描述。

例如,游客可以看到北京的“鸟巢”国家体育场,可对其形状、大小、功能等产生感官的认知。但在数据世界里,“鸟巢”的数据属性被描述为:外形结构主要由巨大的门式钢架组成,共有24根桁架柱;建筑顶面呈鞍形,长轴为332.3m,短轴为296.4m,最高点高度为68.5m,最低点高度为42.8m;大跨度屋盖支撑在24根桁架柱之上,柱距为37.96m;“鸟巢”体育场于2003年12月24日开工建设,2008年423月完工,总造价22.67亿元,工程总占地面积21×10m,场内观众坐席约为91000个。

通过这些数据,我们可以对“鸟巢”有更加量化、更加深刻的认知,且这种认知超过了主观的认知。通过这些丰富的大数据的积累,我们可以构筑一个数据的世界,反映真实世界的量化存在状态。因此,在大量数据的映射下,现实世界会映射为一个数据的世界。1.2.2.4 享受大数据连接的乐趣——数据互联

如果现实的世界可以通过大数据被映射为一个数据的世界,那么这些数据通过互联将为我们提供一个更加全面、更加量化的描述空间。

例如,我们要了解华为手机在电商的用户评价情况,在传统模式下,我们需要在淘宝、京东、1号店分别收集数据,然后进行格式及语义转换(如淘宝上按照星级满意度打分,而京东按照五分制打分,两者格式间要转换并统一),才能获取完整的用户满意度情况。

我们如果使用数联网,即可将淘宝、京东、1号店的用户满意度情况统一表述,如都用星级满意度打分,这样就可以直接调用相关数据,并直接进行汇总计算,生成华为手机在几家电商网站的用户满意度情况。1.2.3 如何让应用丰富起来

任何技术的发展,都要依靠应用的驱动,那么数联网会提供哪些业务应用呢?1.2.3.1 从互联网应用引申

将互联网的典型应用引申到数联网中。互联网是借助TCP/IP,将计算机进行连接,然后通过HTTP,借助网页浏览器(如IE浏览器)对计算机中的数据进行存取访问,实现比较容易的信息访问。

那么在数联网中,我们首先要解决数据的连接问题,然后借助基于数据的类似HTTP和网页浏览器的数据浏览器,实现自由的数据访问和获取。

数联网在实现数据的自由访问之后面临的首要问题就是,如何对各种数据进行检索,构建基于超数据(Hyper Data)的数据搜索引擎。1.从文件检索到数据检索

互联网的搜索引擎类应用是建立在文件检索的基础上的。谷歌和百度都是通过爬虫模式,爬取互联网上各种文件的存放位置,并建立关键字索引,然后将其提供给用户供其检索和查找。

在数联网中,我们可以在数据库开放的基础上,给出各种数据的检索依据,直接根据有关的数据库元数据进行描述,找到需要的数据库,然后根据类SQL,直接从数据库中检索所需的数据结果。

例如,在传统的百度引擎中,用户输入“黄山毛峰”关键字,将检索出所有出现黄山毛峰的文章;而在数联网中,用户如果输入“黄山毛峰”,将检索出所有包含黄山毛峰内容的数据库,用户可以通过类SQL,逐个从数据库中查询黄山毛峰的相关数据,如某个数据库中黄山毛峰的销售量、黄山毛峰的产出量、黄山毛峰的销售价格等具体的数据内容。2.用户的跨域视图

有了数联网后,我们就可以获取用户的跨域数据。这些数据将涵盖各个领域,如张博士的购车需求数据、购买电商商品的数据、他在沃尔玛超市购买商品的数据及其旅游的线路数据等。

如此,我们可以依据张博士的各种喜好,建立全方位跨域的视图。该视图会包括其喜欢的车型、购买哪些品牌的商品、旅游喜欢冒险还是观光等,这些数据会有助于我们对张博士形成一个全面的认知。

当然,这些数据的获取要建立在合规合法的前提下,如果张博士不愿意公开相关数据,则要保护这些隐私数据。用户统一视图举例如图1-6所示。图1-6 用户统一视图举例3.产品的跨域视图

有了数联网之后,我们也可以获得产品的跨域视图。例如,针对某款型号的宝马车,我们可以了解:哪些用户购买了该款车,哪些用户关注了这款车却没有买;用户对这款车使用的油耗真实数据;这款车在各种车祸事件中的表现数据;用户对这款车认可的卖点标签等。如此,我们可以对宝马的这款汽车,形成360°全方位的量化认知,且这种认知是足够客观、足够有说服力的。

这些数据会促进产品的良性发展,避免欺诈行为的出现,督促每个生产厂商认真把控产品质量和品牌信誉,促使其为用户提供更加优质的产品和良好的服务。1.2.3.2 大数据单点应用的互联升级

大数据的应用在数联网的基础上,也将呈现截然不同的应用景观。

例如,针对用户阮小二的征信情况,工商银行只拥有他在自己银行的消费数据,只能基于他在工商银行的消费、贷款情况进行计算,算出其征信打分情况;而淘宝只有阮小二在淘宝网站上的消费数据,只能基于这些数据进行征信计算;京东白条业务也只能基于阮小二在京东消费的数据进行征信计算。

如果阮小二只是在淘宝上购物,在工商银行中没有存、贷过款,在京东上也没有购物,那么只有淘宝的用户征信计算是相对靠谱的,而工商银行和京东网站将对阮小二的信誉情况一无所知。

有了数联网后,工商银行和京东网站可以在法规允许的条件下直接联网获取阮小二在淘宝上的相关信息数据和行为数据(如其在建设银行的贷款还款征信等),丰富自己的征信计算模型,计算出更加可靠的征信打分数据。1.2.4 让大数据流动起来,带来效益

每个企业内部的大数据都会在自身内部发挥价值,但这些数据的作用也仅限于内部应用而已。如果让这些大数据通过数联网流动起来,其将会从不同的角度,发挥更大的价值。1.2.4.1“赠人玫瑰手有余香”——分享的乐趣

大数据“蜗居”在一个企业的内部,只能带来针对这个企业的有限价值;这些数据如果被分享出去,就可以发挥更大的价值。

例如,医院病人的病例数据,在去除法规不允许公开的敏感内容之后,如果实现互联,那么医药企业就可以直接跟踪和分析使用自己药品的病人的用药效果情况;其他医院的医生也可以丰富病例,甚至可以直接查阅部分疾病的处理案例;病人也可以找寻其他医院的病例情况,为自己寻找最佳的治疗医生,与医生共同探讨最好的治疗方案。这种医院数据的公开与流动,将对“治病救人”,产生深远的影响。这种分享的精神,是互联网精神的本质,也将是数联网的本质!1.2.4.2 提升数据管理水平

如果数据能够流通起来,那么将极大地提高数据管理的水平。每个企业的数据都是内部的,数据质量的管理是依赖少数人的技术、业务经验形成的。而如果数据被公开并流动起来,那么不同企业间的数据质量将相互验证,更多人将参与到数据质量管理工作中,这会极大地提升数据管理水平。

这种多维度、多角度数据的相互验证,将极大地提升数据的准确程度,让数据质量更加让人信服。1.2.5 共享经济下的数据共享

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载