极简区块链:你一定爱读的有趣通识书(txt+pdf+epub+mobi电子书下载)


发布时间:2020-08-09 01:53:00

点击下载

作者:有道AI翻译

出版社:电子工业出版社

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

极简区块链:你一定爱读的有趣通识书

极简区块链:你一定爱读的有趣通识书试读:

译者序

一本由人工智能主攻完成翻译的书籍诞生了。

其实从整本书的原文输入到完成输出中文,整个过程还不到半分钟,而且完全没有人工干预。本次翻译技术采用了行业领先的有道神经网络翻译(Youdao Neural Machine Translation,YNMT)技术。2017年4月,网易有道公司发布了自主研发的神经网络翻译技术引擎,这意味着有道翻译从上一代的统计翻译技术(SMT)迈入了目前全球先进的神经网络翻译(NMT)的新阶段。自从谷歌公司2016年发布这项最先进的人工智能翻译技术以来,神经网络翻译大幅度改进了以往机器翻译的质量。最重要的是,随着语料数据的积累和机器的不断学习,每年翻译结果在不断地向人工翻译水平靠近。显而易见的是,居住在这个“地球村”上的人们在语言交流过程中越来越多地开始使用机器翻译。

两年前,人工智能行业大火,并在2017年被正式写入政府工作报告,AI一度成为社会话题。自然语言处理是AI应用的一个分支,相比于上一代统计翻译技术,业内人把神经网络翻译技术比喻成一个“黑盒子”,因为它是一个端到端的输入/输出过程,至于中间过程全部交由深度学习训练过的机器进行处理,它是如何得出的结果,人类亦无法对其进行定义。

神经网络翻译是否会成为翻译的终极解决手段,我们还不得而知,但是美国发明家雷·库兹韦尔曾预言,到2029年机器翻译就可以达到人工翻译的水平。当然,为了达到出版的标准,读者面前的这本书是在机器翻译完成之后,由有道人工翻译团队的译员辅助校正翻译完成的。我们不得不承认,想要使现在机器翻译的结果在“信、达、雅”等多个维度上完全与人类比肩,我们还有很长的一段路要走。书中难免会有疏漏之处,请各位读者海涵。

在此,非常感谢电子工业出版社的各位领导和工作人员,他们是一群有胆识、敢于创新的先锋出版人,对本书的出版给予了大力支持。最后,我们共同期待更多人工智能项目的落地,以更好地造福社会。网易有道AI团队

作者序

区块链,鲜为人知的故事

我阅读过很多有关比特币和区块链的书籍。在公开渠道,此类信息的数量实在是多得令人难以置信。这些信息虽然体量庞大,但却有失全面!虽然它们看似在澄清问题,但却让人摸不着边际。虽然它们在概念上非常简单,但是在技术上又似乎异常复杂!“分布式账本”究竟是如何被赋予了如此之多的特性和功能,以至于它能够从根本上“颠覆”我们的作业方式?

您会发现,大部分的书籍都在不厌其烦地重复着相同的观点:无线电频率识别(RFID)技术终于可以应用到各种场合,每一种场合都会让我们获益良多。

当前市面上的书籍,要么是讨论这种新范式引发的技术革命能够带来的诸多优点,要么是对各种平台和它们的运作原理进行阐述。

在本书中,我将尝试使用一种新的方式来展开论述,平衡各种评论、规则和解释。我将通过谨慎地选用各种文本、插图、图片和参考资料,跨越不同时间线和技术范畴,从过去、现在和未来的角度进行阐述。

虽然本书中大部分内容皆为原创,但是笔者深知,书中的很多概念和图表会让读者感到似曾相识。在书中,读者可以看到很多重要著作的影响;我认为,只有这样,读者才能获得最有用的信息。同时,如果其他作者使用本书的观点,即便是在未提及本书作者的情况下,我也会备感荣幸。毕竟,区块链是一种“宗教”,需要具有传教士般热情的人士通过可免费获得的开源技术使其不断扩散,让现实世界的技术去中心化和民主化!笔者非常愿意看到本书能够“少一些夸夸其谈,多一些内容展示,从而激发读者的独立思考”。

读完本书之后,您可能仍有很多问题没有获得解答,某些概念的解释方式也可能存在错误,或者概念本身已经受到新平台的挑战(例如,比特币平台的不可更改性可能会受到量子计算的挑战),但这本身也是这一技术的固有特点。它发展迅猛,在不同时期存在不同的(有时是相互矛盾的)解读。的确,它可以为您的思考提供大量的精神食粮,激发您的好奇心,挑战您的思维!

如今,想要读懂市面上的大部分书籍,您要么必须是一位博览群书的读者,要么是一位技艺精湛的程序员。

这些书籍以不同的风格来围绕同一个话题展开,但从来没有哪本书能够教会读者如何构建一种有效的解决方案。一本真正有益的书籍要教会读者:

· 如何思考;

· 如何行动;

· 未来的真正走向。

让我们通过这本书发掘区块链技术的过去、现在和未来……

希望通过本书,您能踏上一个轻松愉快的区块链之旅。

| 第一篇 |起源之谜

01 区块链的崛起

目前,世界上仍有很多人认为区块链不过就是比特币!这也从侧面印证了比特币在世界范围内给我们带来的巨大影响。可以说,比特币是一种最佳的“颠覆性”技术!它充满神秘性,却有助于建立人和人之间的信任;它以过程为驱动,却能激发人们的创业文化;大部分情况下它的用途仅限于各种“交易和状态”,但却影响了每一种人们可以想象的到的业务;从本质上说,它撼动了传统互联网中心化的根基。比特币并不是由哪一个“所有者”运营的,但是它仍然创造了巨大的价值和多样的经济活动。在我们并不知道“它到底是什么”“是谁引发了这一切”的情况下,区块链的故事只不过是一个以各种方式影响我们生活的侦探小说式的谜题。对我们来说,区块链的发明者的真实身份仍然是一个谜。但是,令人振奋的消息是,像微软、IBM、思科、英特尔、甲骨文、华为、亚马逊、SAP等“中心化”的巨头科技企业也纷纷加入了这场运动的支持者的行列,即便这意味着这些企业的业务模式会受到诸多方面的挑战!

以比特币的诞生为标志,区块链崛起之时恰逢大数据开始普及,人们对与日俱增的中心化力量的反感也不断增强。

通过将权力交还到用户个体和联网设备手中,区块链不仅在很大程度上保护了用户的身份,而且还催生出一个客户和创业者得以充分授权、企业风险有望大幅降低的时代。

只有那些积极拥抱变革的企业才能够通过设计良好、执行有力的区块链平台收获效益,无法做到这一点的企业,很可能会在这一巨大转型中被扫进历史的垃圾堆。在这一重大变革面前,我们要么是参与到这一不断扩张的宇宙中来,要么是很快陷入万劫不复的黑洞!

因此,拥抱这一新范式,加入这一新“宗教”吧!02 解开比特币起源之谜《泰晤士报》2009年1月3日电:财政大臣即将申请第二轮的银行救助。——中本聪的“创世区块”

谁才是真正的中本聪?对于全球数百万人感兴趣的来说,这是一个令人困扰的问题。比特币这一杰作的创造者究竟是一位天才级的数字货币专家、加密专家、数学家、电脑程序设计师、超级象棋大师、天才营销大师、反对中心化和过度规制的活动家,以及最重要的,没有伺机在自己的账户中大肆囤积比特币,也没有因追逐盛名而牺牲自己的匿名身份(也恰恰是这种匿名性才从根本上支撑了这种加密货币的价值)的人士,还是某位德高望重、有能力领导此类人士并与他们通力合作完成某项共同事业的人?

让我们看一下主要的“可疑对象”。

中本聪(Satoshi Nakamoto),比特币及其原始参考实现(Reference Implementation)的设计者所使用的名称。中本聪还设计了首个区块链数据库,作为实现的一部分。同时,他还首次解决了电子货币的双重支付(Double Spending)的问题。巧合的是,哈尔·芬尼(Hal Finney)的邻居也叫“中本聪”,但是在面对质问时,这位邻居表示并不清楚有关比特币的技术细节。

哈尔·芬尼(Hal Finney)曾经是一位密码朋克(Cypherpunk),他表示:“对我来说,非常明显的一个问题是,我们当前正面临着诸多的问题,例如隐私权的丧失、无所不在的计算机化、大规模数据库和愈加严重的中心化等,而大卫·查姆(David Chum)向我们指明了一种完全不同的前进方向,把权力交到个体而非政府或企业手中。计算机这种工具可以用来解放和保护人,而非控制人。”他是比特币的早期用户,曾经从比特币的创始人中本聪那里收到过第一笔比特币交易。芬尼曾经在多利安·中本聪(Dorian Satoshi Nakamoto)居住的城市(加利福尼亚天普市)生活长达10年之久,这更让人怀疑他可能就是比特币的创始人。但是芬尼否认了这种猜测。

戴维(Wei Dai)是一位电脑工程师和密码朋克,因创办B-money并开发 Crypto++库而名声大噪。戴维是美国专利5724279和6081598的发明人,这两项专利由微软公司持有。

戴维曾在华盛顿州雷德蒙的微软公司密码学研究小组任职。任职微软期间,他参与了某些专业应用软件密码系统的研究、设计和执行。加入微软之前,戴维曾担任马萨诸塞州阿克顿市TerraSciences公司的程序员。戴维获得了华盛顿大学的理学学士学位,并辅修了数学专业。戴维在密码学领域做出了很多贡献,并且还发现了影响SSH2的重大密码块链(CBC)漏洞和BEAST漏洞(Browser Exploit Against SSL/TLS)。

尼克·萨博(Nick Szabo)是一位计算机科学家、法律学者和密码学家,在数字合约和数字货币研究方面有很深的造诣。他1989年毕业于华盛顿大学,并获得计算机科学学位。1998年,萨博为一种名为“Bit Gold”的去中心化数字货币设计了机制。虽然该货币没有得以实施,但却被普遍认为是“直接促成比特币架构的前驱”。财经畅销书作者多米尼克·弗里斯比(Dominic Frisby)曾对萨博进行了研究,并且提供了一些间接证据,但是弗里斯比也承认,这并不能证明萨博就是中本聪。在参加俄罗斯RT电视台的《凯瑟报告》(Keiser Report)栏目时,弗里斯比说:“我的结论是,在全世界只有这么一个人在特定知识领域中拥有足够的广度和深度,这个人就是他……”。2014年7月,萨博在写给弗里斯比的一封邮件中说道:“谢谢您让我了解这些事情。但若您认为我就是中本聪,恐怕是认错人了。不过对此我也习以为常了。”

笔者认为,中本聪很显然是比特币项目中诸多的伟大传奇人物之一。他就生活在我们身边(这一点毋庸置疑!),而中本聪所发挥的巨大作用则在于将这些天才般的专业人士聚集在一起,并且很可能仅仅需要整合上文提到的四位人物的各种能力即可达成!

在创造区块链这种不朽技术之后,其创造者将比特币背后的这种现象级创新剥离开来,不加任何形式的干涉,不对这种了不起的发明提出任何主张,至今仍保持一种慷慨淡泊的态度。从这一点来说,再没有什么人能够比区块链技术的创造者更加伟大了。03 什么是区块链

什么是区块链?

比特币区块链

在以比特币为代表的加密货币区块链中,区块链被定义为一种区块的连接列表。该列表中包含了全部的比特币账目信息,以加密货币单位(比特币)或其小计量单位(1比特币=1 000 000聪)记录相应钱包地址组中每个地址的未花费的交易输出(Unspent Transaction Output,UTXO)。每个地址都对应一个公匙和一个私匙。公匙用于检查交易信息和私匙是否允许持有人花费 UTXO单位,而私匙则允许持有人花费与公匙相关联的UTXO。

因此,区块链是一种用于存储和转移巨大价值的工具,这也决定了严格保证密码(钱包的密码短语和每个地址的私匙)私密性的重要性。图3.1 公有链

公有链(Public Blockchain)

比特币和以太坊都是典型的公有链,但与比特币核心(Bitcoin Core)不同,以太坊虚拟机(Ethereum Virtual Machine)能够处理各种类型的应用,因此也可以称作“世界计算机”。它不仅能够对交易进行储存,而且还可以对已变更状态下各地址的值进行更新。

以太坊可以让任何类型的业务以点对点、可持续的方式通过智能合约和去中心化组织等概念形式进行交易,确保决策时很少需要人为干预。

图3.1简要描述了公有链的原理。

企业链(私有和许可链)图3.2 私有链

超级账本(Hyperledger)、企业以太坊联盟(Enterprise Ethereum)、Quorum和Corda都是典型的企业链平台。基于这类企业级应用,IBM将“区块链”定义为一种针对新一代交易应用的点对点分布式账本技术,在简化企业流程的同时,它还可以极大地提高安全性、透明度和可信度。

图3.2简要描述了私有链的原理。

区块链的参与者都有哪些?

对于比特币和以太坊来说,各节点之间的交易通过辨识公匙、地址或化名(Pseudonym)来进行,除非投入大量的精力进行IP地址追踪,否则很难通过这些信息在现实世界中追溯到相应的实体。

虽然比特币的创始人仍然是一个谜,但是,据说截至2018 年5月1日,这些最初发明人对应的地址中所携带的比特币价值已接近80亿美元。

以太坊的创始人来自某个基金会,该基金会对于以太坊网络的运行所起到的作用不大,交易主要在使用化名的各方之间进行。

对于企业链来说,交易主要在无相互信任的节点之间进行,各节点都有确定的身份和凭证,通过一定的会员识别方式进行验证。

在基于区块链的业务中,参与者激励机制都有哪些呢?

比特币和以太坊等公有链业务依靠某种加密资产机制来激励经济活动和价值创造活动;对于由正式成员或会员联盟所发起和运行的企业链来说,激励主要来自各区块链解决方案所衍生出的多种优势,例如在简化业务流程的同时可以极大地提高信任度、责任性、透明度和作业效率。

区块链中存储了哪些数据?

区块链中包含了每个公匙及其已创建的所有地址的详细信息,以及平台中所进行的全部交易等信息;而钱包则包含了所有地址及其相关联的公匙和相应的私匙的信息。

钱包通过节点与区块链网络建立联系(钱包可以嵌入节点用以存储所有的交易信息,也可以单独作为一个.dat文件仅存储在计算特定地址的余额时所需的交易信息)。

比特币区块链网络使用LevelDB数据库来存储所有的键值对和交易信息,通过区块浏览器网站可实现对此类信息的查询。

这些数据都存储在哪里呢?

Block子目录

·  blk*.dat

所存储数据为实际比特币区块,这些数据以网络格式存储,并直接以原始数据形式转储到磁盘上。它们仅用于重新扫描钱包内的缺失交易信息、重新组织到链的不同部分,并将块数据提供给正在同步的其他节点。

· blocks/index subdirectory

这是一个LevelDB数据库,其中包含有关所有已知块的元数据,以及在元数据磁盘上的位置等信息。如果没有这些信息,那么寻找某个区块就会非常缓慢。

Chainstate子目录

这是一个LevelDB数据库,包含当前所有未花费的交易输出的紧凑表示,以及有关交易来源的一些元数据。对于验证新传入的区块和交易来说,这些数据十分必要。理论上讲,我们可以通过区块数据(见 Reindex命令行选项)重建Chainstate,但是这要花费相当长的时间。没有Chainstate仍可以实施验证,但这意味着要在所有区块(截至2017年11月,其大小为150 GB)中对每一个花费输出进行扫描。

以太坊

以太坊使用哈希值来进行所有信息的识别。不过,哈希是均匀随机分布的识别符。LevelDB可以保持键值的组织性。因此,以太坊在Geth客户端使用了LevelDB。选择该客户端的原因包括以下几点。

· 进程内数据库(即,不需要运行其他软件)。

· GO语言的原生实现(即,跨平台实现GO语言支持的所有项目)。

· Key/Value存储[即,Value为任意二进制大型对象(BLOB),无模式约束]。

· 现代化的数据存储(即,多层磁盘存储,并在后台进行组织)。

· 可靠的业绩记录(即,很多公司和其他数据库都是建立在Geth客户端基础之上的)。

超级账本(Hyperledger)

在Hyperledger Fabric中,有两个地方用于“存储”数据:账本和状态数据库。账本即为实际的“区块链”,它是一个基于文件的用以储存序列化区块的账本。每个区块记录一笔或多笔交易。每笔交易包含一个读写集合,用以规定一个或多个键/值(Key/Value)对。账本是既定的数据源,不可更改。

状态数据库保存了任一给定键中已知的提交值。当节点(Peer)验证和提交交易时,就会向状态数据库输入数据。状态数据库可以通过重新处理账本进行重建。目前,状态数据库主要通过两种方式重建:嵌入式LevelDB和外部CouchDB。

另外,Hyperledger Fabric还为各交易方之间的各私有链接都配备了通道(Channel)。每个通道还配有单独的账本。

比特币会储存区块链上所有交易地址给出的输入和输出的详细信息,以及由此所创建的所有公匙和相应的地址。

另外,比特币还允许使用 OP_RETURN指令在区块链中存储消息。这可以让发送者在一个区块中以输出的形式存储多达40字节的数据,但该输出为不可花费型交易输出。

比特币的发明者“中本聪”就在创世区块中嵌入了“《泰晤士报》2009年1月3日电:财政大臣即将申请第二轮的银行救助”这则消息。

谁拥有比特币区块链?其他区块链和应用的所有权结构是怎样的?

比特币区块链是一种公有链,任何人都可以通过它从事交易、下载、存储和挖矿等活动。它更像一个去中心化的自治组织,不存在任何所有者。任何与软件升级等问题有关的决策都会以建议的形式上传到GitHub等公共门户上,在社区范围内进行投票表决。重大提议需要有 95%以上的赞成票才能被采纳。

核心网络的升级可能会导致区块链出现“软分叉”,但是当某组矿工对开发团队所提出的执行存在分歧,并开始使用带有不同功能的新区块链时,就会出现区块链的“硬分叉”。

比特币现金(Bitcoin Cash)和比特币黄金(Bitcoin Gold)就是通过这种硬分叉而形成的新加密货币。

对于以太坊来说,该公有链的运行方式更像是一个去中心化的自治平台(DAP),但是由以太坊基金会(Ethereum Foundation)从远处进行监督;而对于像 Hyperledger Fabric、Corda、Quorum、Multichain等私有链,单一方发行的区块链由明确的发行者(Identified Promoter)进行管理;而联盟区块链则由发行者集团所代表的法定人数(Quorum)管理。

对于以公有链为后台的去中心化的自治组织(DAO)来说,决策是以程序化的方式得以推动的,发起者则按照所采用的共识机制预先宣布行为准则,对区块链的管理进行监督。

图3.3分别展示了几种重要的去中心化应用与中心化应用。图3.3 去中心化应用与中心化应用

面对使用量的快速增加,比特币、以太坊这类公有链是如何扩大规模的?

比特币和以太坊平台通过“改进项目”(BIP和EIP)来获得支持。其他的公共平台也可以通过大量的改进项目获得积极的支持,这些项目通常通过原生货币或代币等机制对改进者进行激励。对于比特币来说,相关提案会发布在GitHub,引起对 bitcoin.org负有监督责任的非正式领导机构的注意,然后通知矿工成员进行表决通过。对于其他区块链来说,基金会会由创始人及其合作伙伴组成的管理机构对改进建议的执行进行监督。

主流平台在规模管理方面所讨论和实施的主要策略包括以下几种。

变更共识算法

比特币区块链及某些版本的以太坊区块链所遵守的工作量证明(Proof of Work)机制在达成某项确定性共识时会消耗大量的资源。以太坊平台很快将转向以“权益证明”(Proof of Stake)为基础的共识机制,该机制将涉及可忽略的能源消耗。

一些新生代的公有链平台采用了“PoW”和“PoS”的变体为基础的共识算法,如PoET、 DPOS等,进而最大限度地降低资源的使用和浪费。这些话题将在本书后面的章节被谈到。

企业区块链使用“权威证明(PoA)”“实用拜占庭容错算法(PBFT)”“节点到节点(N2N)”,以及它们的变种等能源效率较高的算法来达成决定性共识。

为了防止区块链的膨胀,企业区块链还会使用与 IPFS、Swarm、大规模数据库(如BigChainDB、FlureeDB)、云数据库(如 IPDB)、去中心化存储系统(如 Storj、 SIA)等相连接的外部数据库。

为了提高公有链的处理能力,数据库分库分表(Sharding)、隔离见证(Segwit)、侧链(Sidechain)等概念也得到了应用。

数据库分库分表

数据库分库分表是指在数据库或搜索引擎中对数据进行水平分区。单个分区被称为分片(Shard)或数据库分片。每个分片被存储在单独的数据库服务器中,用于分散负载。

隔离见证(隔离见证共识层)

隔离见证出自比特币改进建议第BIP141号。其目的是解决交易的可锻性(Transaction Malleability)问题——即在挖掘过程中、确认交易前,通过改变交易代码来制造双重支付的机会。该协议缓解了因区块链大小限制而导致的比特币交易速度降低的问题。它将交易分割为两个部分,从原始部分中删除解锁签名(“Witness”数据),并在结束时将其作为一个单独的结构附加上去。

侧链

侧链通过生成功能更加广泛的楔入式链,实现用户资产和主链(比特币)资产的互操作性,使相关的组织用户更加充分地利用比特币等主要区块链平台的力量。然而,一般认为,侧链仍然较容易受到双重支付的攻击。目前,“工作量证明的非交互式证明”(Non-Interactive Proofs of Proofs of Work,NiPoPoW)这类解决方案的效果仍然有待确认。| 第二篇 |崛起背景04 "数据”为王!——数据倡导者的迅速崛起

我们只相信上帝,其他人都必须携数据而来。——爱德华兹·戴明

即便是几十年后的今天,在人类技术获得突飞猛进的发展之后,这一在企业界广为人知的名言仍然具有深刻的现实意义。

数据科学家、密码学家、网络安全专家等被认为是当前最性感的职业。这毫不奇怪。因为,数据收集、分析、管理、操纵等是支撑当前最伟大成就的关键力量。

不管是历届美国总统大选的获胜者,还是谷歌、亚马逊、Facebook、Netflix、微软、沃尔玛、苹果、特斯拉等巨头企业的崛起,还是像中国这种曾经在科技领域籍籍无名的国家迅速在人工智能和机器学习等尖端技术领域里异军突起,这些都与数据管理技术的充分利用和发掘是分不开的。毕竟,没有数据集的收集就谈不上机器学习。

曾经有人说,数据是垃圾,信息才是力量。从国家到国王、从警察到公司,人们不遗余力地试图在正确的时间、正确的地点安排正确的人,以便搜罗正确的信息,达到管理舆论、赢得战争或在竞争中占领先机等目的。

20世纪后半叶,互联网的出现让各种实体可以通过Web 1.0这种单向传播媒介向受众传播信息。

Web 2.0让用户能够与信息发布者进行互动,并且向发布者提供体验、需求的反馈和相关建议。电子商务的出现和普及让消费者可以从事各种交易,并且提供有关自身及其购买行为的更多信息。互联网给消费者带来了巨大的便利性,使用户能够提供自身的关键信息,这也反过来为营销公司精准定位目标客户铺平了道路。

包括谷歌和雅虎在内的高级搜索引擎的出现为消费者提供了巨大的便利,同时也使得网民在一切事务上都对其产生了完全的依赖性。

21世纪初,数字营销与电子商务的结合成了热门话题,以此为代表的谷歌、Facebook一跃成为超级巨星企业,为其创始人和投资人创造了巨额财富的同时,还因其所提供的各种设施、便利和自我表达模式成了最受客户青睐的企业。

随后的Web 3.0使得P2P的传播成为可能,同时人工智能开始植入谷歌、苹果和Facebook等企业提供的服务中。“语义网络”让消费者可以将他们的需求反馈给聊天机器人并获得即时回应。最近兴起的物联网革命使相关企业可以通过联网设备对消费者的活动进行360度的追踪和监控,进而使用所收集的数据为用户提供前所未有的便利。家庭自动化、智能空间、自动化伴侣及高度友好的聊天机器人等概念开始融入世界各地的人们的生活当中。

然而,所有这些发展都是要付出一定代价的。隐私的丧失、数据泄露的威胁及“单点式的所有权和控制权”的失效所带来的全方位风险使得世界面临着难以预料的后果。

营销人员对数据的痴迷及数据行业随后的发展,推动了特大型数据集管理工具的发展。当这些数据管理工具与分析工具、人工智能和机器学习算法结合起来时,消费者手中的掌控力就开始向大型的中心化企业倾斜了。数据所释放的力量让企业积累了巨额财富,同时也使个体面临各种肆无忌惮的攻击,可以说,这让监管者和广大网民认识到保护身份信息的重要性。毕竟,亡羊补牢,尚且不晚。

与这种环境相关的各种风险得到了广泛的披露,进而催生了各种监管行动,如《欧盟数据保护条例》(GDPR),以及区块链这类无监管平台。它们在一定程度上有助于风险的管理,但同时也带来了诸多挑战。

爱沙尼亚是世界上最小的国家之一,只有130万人口,但是却因为孕育出Skype这样的企业而闻名于世。爱沙尼亚是世界上数字技术最为发达的国家之一,作为 D5(Digital Five)会员国(其他成员国为英国、韩国、以色列、新西兰),爱沙尼亚绝对可以称得上当今世界的一个奇迹。

爱沙尼亚推出的电子市民身份卡堪称世界上最为先进的身份卡。在国民数字意识和健康档案的数字化方面,爱沙尼亚也位居世界前列,它利用Guardtime公司的区块链技术,实现了人口的数字化全覆盖。在互联网自由指数方面,爱沙尼亚也处于世界最高水平,同时该国还是“物联网”(IoT)技术的最大倡导者。当大多数人还从未听说过不断涌现的物联网设备和边缘计算(Edge Computing)时,爱沙尼亚已经开始研究霭计算(Mist Computing)。霭计算作为雾计算(Fog Computing)的下一代技术,比边缘计算至少领先两步,当它与区块链技术的安全性能相合之后,将会使物联网设备更好地对抗恶意软件攻击。

时至今日,世界各地的人们仍未从2016年10月发生的“分布式拒绝服务”(Distributed Denial of Service,DDOS)攻击中缓过神来。当时,仅仅是由于价值10万卢比的物联网终端受到了僵尸网络的破坏,就使得多个世界级互联网门户网站受到恶意定向流量的冲击而被迫中止业务。HIS发布的调查结果显示,目前全世界已经有超过200亿个联网设备在运行,在这种情况下,如何才能避免这类攻击呢?

作为物联网设备渗透率最高的国家,爱沙尼亚充分发挥物联网技术的优势,利用边缘计算、雾计算和区块链等赋能技术充分保障设备安全,从很多方面来讲,该国已经做好了应对未来攻击的准备。世界其他国家和地区是否也可以借鉴这种发展路径呢?

一方面,我们正生活在一个最令人兴奋的时代,另一方面,我们的时代也充满了前所未有的危机。世界经济论坛发布的《2018全球风险报告》认为,网络攻击和数据造假已经成为未来几年内威胁全球稳定的因素。就在不久前,我们已经目睹了这类事件的发生,它们使得几乎所有的世界顶级企业(如谷歌、雅虎、Facebook和很多跨国银行)都受到了肆意攻击,而一般观点认为,这些企业的网络安全水平应该很高,它们应该能够很好地保障用户利益。

值得庆幸的是,微软、IBM、谷歌、思科和英特尔等企业正在通力合作,不断推出各种必要的新技术,帮助我们更好地管理这些不断增长的风险。

目前,那些对用户隐私权的丧失负有一定责任的中心化组织也开始行动起来,通过各种方式让我们的世界变得更加安全。

让我们一起回顾这场扣人心弦的旅程,看一看数据是如何从“质量”范式转变为“控制权”范式的,权力又是如何重新转移到我们这些“智能化”端点手中的。

要点总结如下。

· 云计算满足了快速访问大量数据的需求。

· 边缘计算利用设备、网关、软件和计算设备,可以让物联网设备产生的数据在更靠近数据生成端的位置进行处理,而无须将数据通过漫长的路径发送到数据中心或云端。

· “雾”指边缘设备和云之间的网络连接。雾计算将云计算模式延伸至网络边缘,其目的是在云计算网络中仅传输有价值的数据。因此,它有助于设备辨认潜在的入侵者或威胁。

· 霭计算是一种轻量级形式的云计算,它利用的是网络结构最边缘处的微型计算机和微型控制器。在数据发送到云计算平台以后,霭计算将数据提供给边缘计算节点及雾计算节点。05 数字营销的崛起:这一切是如何开始的

数字营销的崛起

在21世纪早期,要了解目标消费者和网站访客,您只需要了解以下几个方面的信息:姓名、年龄、位置、性别、电子邮件、上网时间偏好和大体的社会经济地位。

数字营销通过追踪客户搜索信息、产品和服务时所访问的网站和门户,获得了迅猛的发展。图5.1简要描述了数字营销的发展过程。

移动和智能手机技术的出现和普及一方面将权力交还到消费者手中,另一方面也使消费者不断暴露于“智能”营销者的追踪、定位和诱导性活动中,使营销者攫取了超额利润。那些没有充分利用数字营销的企业要么损失巨大,要么生存困难。如今,Facebook和LinkedIn已然成为备受网络营销者吹捧的平台,而其他的社交媒体,如Twitter、Pinterest、Instagram 和WhatsApp等,也不断透过心理学和社会学角度为受众提供有价值的信息。图5.1 数字营销发展史

大约25年前,也就是1993年4月30日,蒂姆·伯纳斯·李(Tim Berners-Lee)向世界推出了万维网(Word Wide Web),他宣称,万维网是一个向所有人开放的开源项目。早在1989年3月,伯纳斯就在一份题为《一个有关信息管理的提案》的文件中提出了万维网设想。他预想了一个全球数以百万计的计算机通过一个共同的平台相互连接并协同工作的世界。

1990年10月,伯纳斯撰写了Web三大基本技术(您可能在网络浏览器的某些组件中看到过它们)。

· HTML:超文本置标语言。Web的标记(格式化)语言。

· URI:统一资源标识符。一种用来标识各网络资源的唯一“地址”。通常也称作RUL。

· HTTP:超文本传输协议。用于实现链接资源在网络上的提取。

在欧洲核子研究中心(CERN)庇护下成长起来的互联网,在1993年4月以免专利使用费的形式正式向公众开放。1994年,伯纳斯移居美国,并在麻省理工学院创办了万维网联盟(W3C),并一直担任联盟主席至今。

具有讽刺意味的是,伯纳斯在早期创办 Web社区时所遵循的基本原则,恰恰也是区块链技术的根基。

· 去中心化:无须许可、无领导机构、无单点故障、无随意性控制或审查。

· 非歧视原则:订阅不同级别服务的用户享有同样的平等权。

· 自下而上的设计:开源实现,人人参与。

· 普遍性:横跨所有人群的无国界沟通。

· 共识性:透明性高、全程参与W3C开放标准的制定。

万维网最初作为连接世界社区的一种开源工具而问世,经过飞跃式的发展,现在已经成长为有史以来最大的杀手级应用。图5.2 互联网的演进

随着新技术的推出和普及,互联网获得了持续发展,同时网络用户的数量也出现了突飞猛进的增长。图5.2和图5.3展示了互联网的发展过程。

Web 1.0仅仅实现了传播组织主张、帮助潜在客户了解组织的存在等目的,大多数情况下,这些活动都是单方面的。

Web 2.0让用户能够实时地与网站所有者、公司进行沟通。这促成大量用户生成数据,加入互联网浪潮的客户数量开始呈指数级增长,他们体验着前所未有的便利。互联网和社交媒体的爆炸式增长也是这场革命所带来的分支。

Web 3.0时代,智能手机和高带宽网络的普及使得网络连接无所不在,更进一步促进了人们的沟通。图5.3 相关数据

所有这些发展都带来了数据流的爆炸式增长,强大的营销企业使用最新的工具和技术以人们难以想象的方式深入理解买家的行为。一个以憧憬去中心化世界为起点的时代,最终成为少数人所掌握的工具,同时,早期的网络社区理应解决的单点故障(Single Point of Failure,SPOF)威胁反而愈演愈烈。作为用户生成数据的大力倡导者,这些强大的营销组织已然登上了主导者的位置,对于这种反差,图5.4以一种幽默的方式展现了营销者不仅能预测消费者的行为方式,而且还能提出具体的行动建议这一事实。图5.4 谷歌比萨!

数字营销生态系统

如今的数字营销生态系统大体可以用图5.5表示。图5.5 数字营销生态系统

消费者

消费者在网络上搜索信息,从生产商、线上或线下网络平台购买产品,并留下大量的数字足迹。

生产商和广告主

生产商和分销商向消费者提供商品和服务,利用广告代理商或在线平台的服务直接推向消费者,以实现销售最大化。

出版商

出版商收集访客数据,建立访客档案,以实现对访客的流量来源、人口统计学特征、心理和社会资料等全部信息的访问。他们还可以直接或在分析顾问的帮助下对信息进行分析。

主要的广告出版商及其相关特征如图5.6所示。图5.6 社交媒体网站对比——业务或品牌营销

广告代理商

广告代理商、客户,以及提供各种产品和服务的生产商共同制定计划,将营销预算投资到各媒体平台,以期产生综合性和累积性的影响并获得预期结果。当企业进行此类投资时,可以对投资回报率(ROI)进行实时追踪并对营销活动进行微调,因此,网络广告已经成为企业媒体计划的主要组成部分。

广告平台

广告平台利用先进的算法在出版商和生产商、广告代理商之间搭建起一座桥梁,通过网络流量为产品和服务制造持续性的印象,进而有效地发挥智能中间人的作用。

一个组织实施的综合性数字营销策略可以用图5.7来表示。图5.7 综合性数字营销策略

分析服务

分析服务提供商尤其擅长对流量的构成进行全面的分析,并为出版商及其承包商提供相应的洞察结果。利用这些洞察结果,出版商可以实现精确的客户定位。

这也是近期因违规使用 Facebook用户数据、卷入美国总统大选丑闻的剑桥分析(Cambridge Analytica)这类公司所擅长的业务。

剑桥分析公司通过其发布的一款APP收集Facebook用户及其好友的信息。

利用270 000名Facebook用户在“This Is Your Digital Life”这款 APP中分享的数据,这家公司收集了 5000多万名Facebook用户的数据。用户授权该第三方应用获取数据,使得该APP早在2015年就可以获取用户好友的相关信息,直接导致 5000万(后期增加至 8700万)用户的信息被收集。而该APP的开发者将这些数据提供给剑桥分析公司的行为,违反了Facebook的服务条款。剑桥分析公司使用人口统计学、消费者行为、互联网活动等方面的信息,以及其他公共和私有信息来源,来收集选民的数据。根据英国《卫报》的报道,剑桥分析公司在未获得用户许可或用户不知情的情况下,使用了从数百万Facebook用户中提取的心理学数据。联合通讯社报道,该公司的另一个信息来源是一款名为“Cruz Crew”的移动APP,该 APP主要追踪用户的物理活动和联系人等信息,因此,相对于其他涉及总统候选人的APP来说,该APP侵犯了更多的个人隐私。

今天,对于美国的任何一个个体,我们都获取了 4000到5000个数据点……因此,我们可以为美国2.3亿成年人中的每一个人都建立人格模型。——剑桥分析公司首席执行官亚历山大·尼克斯(Alexander Nix)

剑桥分析公司称,该公司使用“数据增强和受众细分技术”进行“心理因素分析”,以提供有关“对目标受众的更加深入的见解”。该公司使用大五人格(OCEAN)量表对人格特质进行测量。该公司称,通过使用了一种名为“行为微观定位”(Behavioural Micro Targeting)的技术,他们可以预测相关主体的“需求”及这些需求随时间推移而产生的变化。因此,该公司可以为来自政界、政府和企业界的不同客户提供“更好的、更可执行的涉及关键受众的观点”,以满足客户的利益。根据记者萨沙·伊森博格(Sasha Issenberg)的报道,剑桥分析公司甚至可以辨别出某个个体自身都不了解的一些特质。

这种在用户不知情或未获得用户授权的情况下使用个人数据来建立复杂的用户个性模型的做法,引发了道德和隐私方面的问题。虽然剑桥分析公司在美国境外运营,但是由于欧洲的法律更加严格,因此,此类行为在欧洲也是不合法的。尽管Cruz经常谈及要保护个人信息,防止政府滥用,但是他在剑桥分析公司运营的数据库却普遍被认为是一种针对“政治选民的监控”。

针对剑桥分析公司使用 Facebook用户数据这一问题,该公司的一位发言人表示,这些用户在注册时就已经赋予了服务提供商相关权限,但是Facebook则认为,剑桥分析公司“误导受众或滥用信息”等行为违反了Facebook的政策。2015年,Facebook表示正在对该事件进行调查。2018年3月,Facebook宣布,由于战略传播实验室(Strategic Communication Laboratories)未能删除通过不正当手段收集的 Facebook用户数据,Facebook已经暂停了该企业的账户。

APP和第三方平台

目前,在互联网和各类平台上运行着大量的APP,用以帮助网站提高用户参与度、提供娱乐内容和获得额外的营收。虽然 APP所有者可以访问平台流量相关的所有详细信息,但是囿于保密协议的约束,他们不得以任何商业方式使用此类信息,也不得将细节信息透露给未获得授权的其他方。剑桥分析公司通过Facebook平台上的某APP提供商获取了此类信息,并利用这些信息来辨识目标消费者,塑造有利于特朗普的舆论环境,进而提高特朗普在竞选过程中的受欢迎度。

尽管亚历山大·尼克斯辩称,由于选民只会接收他们在乎的信息,因此数据收集和微观定位技术会给他们带来好处,但是,数字权利保护组织则担心个体的相关信息在他们“毫不知情”且没有任何控制力的情况下被收集、存储和分享。

2018年3月,Facebook遭到了强烈的舆论反对,深陷舆论旋涡,截至3月20日,Facebook的市值蒸发了370亿美元。由于Facebook陷入出售个人数据牟利的丑闻,某项评估显示,对Facebook仍抱有信任的用户份额只剩下41%。3月26日,在5000万用户的数据落入政治咨询企业剑桥分析公司这一丑闻暴露之后,美国联邦贸易委员会宣布对 Facebook公司展开公开调查。

不管 Facebook或剑桥分析公司的动机是什么,该事件已经造成了巨大的损害,并推动全球企业彻底地审查自身保护用户隐私的做法。

对于企业来说,非常重要的一点是要掌握与企业产品相关的所有沟通和交流,不管是与客户、竞争者、合作伙伴、员工之间的沟通,还是发生在各种社交媒体上的沟通。对这些信息进行分析有助于企业积极地管理这些信息的潜在影响,这叫作网络声誉管理,同时它也涉及使用高级工具对大量数据进行的分析。为检测营销活动的有效性并寻找合适的行动方案,企业经常使用的社交媒体监控工具包括图5.8展示的几种。图5.8 社交媒体监控工具06 客户关系管理

对于营销者来说,客户关系管理(CRM)是一种重要的工具,它可以帮助营销者实现客户终生价值的最大化。CRM的目标主要包括以下三点。

· 实现销售力量覆盖效益的最大化。

· 实现潜在客户转化率的最大化。

· 实现正常客户运营时间的最大化并将客户满意度转化为客户支持。

这就意味着,从线索生成周期到客户关系的终结,这整个业务期间营销者都要对客户进行追踪,最大限度地提高业务效益。虽然某些进步企业实施了各种积极的措施来提高客户满意度和客户支持率,但这些措施在客户关系的整个生命周期内也产生了大量的数据集。

客户关系管理的目标是依据不同的互动水平,在各个互动周期内,对潜在客户的开发过程、潜在客户与客户转化之间的紧密度、相关销售团队成员在此过程中的互动表现等进行追踪。图6.1展示了CRM漏斗模型。

一个管理良好的CRM解决方案可以保证所有的潜在客户都能得到各个部门应有的尊重和关注。图6.1 CRM漏斗图6.2 CRM功能维度

虽然订单生成和执行过程主要由销售和营销部门参与,但是在此过程中,客户服务部门的职责是保证客户投诉能够得到妥善的解决,最大限度地减少客户的痛苦感,同时提高客户的满意度。技术支持部门的职责则是最大度地降低在客户身上运用的资产的运行时间,并尽可能地提高效率,实现投资回报率的最大化。图6.2展示了客户关系管理的功能维度。

在任何一个组织的客户关系管理中,科技都发挥着重要的作用。不同的活动对应不同的互动阶段,有些阶段要依靠技术帮助,而大多数阶段则要通过一个运行良好的体系来实现。如图6.3所示。图6.3 CRM头尾流程图

多数组织都会使用网站与潜在客户进行沟通和互动,并利用着陆页开展在线营销活动。

从客户访问在线门户,到联系公司业务代表,整个过程中的各个阶段都伴随着信息收集活动,从而机构可以通过恰当的授权和补救措施处理客户的不满和退货。

机构还要对照行业标准对这些活动进行设计,确保客户响应部门始终处于不断被挑战的状态,以便实现潜在客户转化周期内的收入最大化。

同样,所有这些活动都会产生大量的数据,而有能力精通这一流程的组织则将会赢得最大份额的客户收益。图6.4 理想的CRM情境

对于任何一个组织来说,一个理想的CRM系统(如图6.4所示)应该整合整个实体内的所有后台和前端系统,提供客户、客户需求、潜力及能够主动追踪和处理的事宜的统一视图,进而最大限度地提高业务和服务的效益。大多数企业都梦想自己的客户不仅满意度高,而且愿意成为企业产品或服务的倡导者,进而产生更多的推荐客户,增加消费。

毫无疑问,这也会产生大量的数据,需要在整个客户互动周期内对其进行追踪和管理。07 大数据的演化和启示

大数据的演化

Web 2.0使大规模商业互动不断增加,导致了大量数据的产生,这虽然为发布商获得深入洞察提供了难得的机会,但是从短期来看还带来了一定的问题。图7.1 存储单位

20世纪80年代以来,全世界的人均信息存储能力大约每40个月就会翻一番;截至2012年,全世界每天产生的数据为2.5 EB(2.5×1018)。IDC发布的报告预测,2013年至2020年期间,全球数据量将会出现指数级的增长,从 4.4 ZB增加到44 ZB。IDC预测,到2025年,数据总规模将会达到163 ZB。图7.1展示了多种数据存储单位,图7.2则通过举例帮助我们理解数据规模。

对于大型企业来说,其中一个问题在于该由谁来掌管能够影响整个组织的大数据计划。同时,组织的数据源数量和数据复杂程度的不断增加,使得数据处理作业的速度开始降低。

数据具有以下几个特点。

· 多样性

· 高速性

· 体量

· 真实性

· 价值性(存在于需要挖掘的数据之中)

尽管我们总是可以使用大量的统计工具和技术来分析数据,进而得出正确的推论和相应的对策,但事实证明,规模不断增加的数据是难以控制的。

这里列举了 5种能够在企业内部创造商业价值和机会的数据分析技术。这些技术赋予了使用者巨大的能力,使他们能够准确地定位目标消费者并获得较高的市场份额。换言之,数据管理技术的倡导者将有能力对数据中所蕴含的价值进行挖掘。在这5类分析技术中,所需要的分析能力的复杂性和商业价值的规模呈依次升高的趋势。

描述性分析:对历史数据进行分析,为过往的活动和表现提供简单的洞察,以便理解过去的行为或结果。

诊断性分析:使用历史数据辨识产品失效模式并确定失效根源。一旦理解并诊断出问题根源,通过将问题根源输入至知识管理工具,即可确定相应的解决方案。

预测性分析:使用建模、数据挖掘和机器学习等技术分析实时和历史数据,发现数据模式,预测未来事件。

规范性分析:一旦完成未来事件(结果)的预测,就要对所建议的下一步骤或决策进行确认、评估,这些过程可以以自动化的方式实施。

认知性分析:认知性分析可以为今后业务的发展提供正确的认识和视野,它不仅可以为相应的问题提供答案,而且还可以助力管理层以前瞻性的视角提出正确的问题,积极预测未来并对未来做好准备。图7.2 理解数据规模

较为开明的组织会积极利用各种从内部和外部获得的数据。任何组织都有必要采用结构化方法,以便捕获并利用数据流,以最大限度地提高数据分析和应用程序产生的业务影响,从而预测未来性能。以保险服务公司为例,实施数据分析的典型五阶段方法如图7.3所示。图7.3 数据分析的经典五阶段方法

数据来源

随着各类活动和企业数量的增加,全世界所产生的数据和数据消费规模也迅速增加。图7.4 数据量的指数级增长

一家组织的相关数据可以从各种信息来源(内部和外部)以各种形式进行收集,例如文本、图片、JSON文件、视频、音频等,并进行精简化存储,以备未来处理之用。这进而促成了数据湖(Data Lake)的形成。图7.5展示了数据湖模型,图7.6则具体分析了数据湖的工作原理和重要性等相关信息。图7.5 数据湖模型图7.6 理解数据湖

数据处理

随着科技不断渗透到组织职能的各个方面,各种类型的数据也开始激增,使用高级技术对数据进行提取、存储、处理和分析也成了一种必要手段。

鉴于此,联合创始人Doug Cutting和Mike Cafarella推出了Hadoop项目。

Apache Hadoop

Apache Hadoop是一款旨在通过使用多计算机网络解决海量数据的计算问题的开源软件工具集合。它为基于MapReduce编程模型的分布式存储和大数据处理提供了软件框架。Apache Hadoop最初用于计算机集群中(目前仍然普遍使用),不过它也可以应用在高端硬件集群中。Hadoop中的所有的模块在设计时都考虑了这样一个假设:硬件故障是常见的问题,这一问题应当通过某种结构框架自动解决。

Apache Hadoop的内核包含了一个名为Hadoop分布式文件系统的存储部分及一个由 MapReduce编程模型构成的处理部分。Hadoop将文件分割为大型区块,并将其分布在集群的各个节点。之后,它会将包装过的代码转化为节点,实现对数据的并行处理。这种方法利用了局部性数据的优势,使节点对可访问的数据进行操纵。在传统的并行文件系统中,数据由巨型计算机体系架构通过高速网络进行分布,与之相比,在Apache Hadoop技术下数据集的处理更加快速和高效。

Apache Hadoop的基础框架包括以下几个模块。

· Hadoop Common:包含其他Hadoop模块所需的资料库和实用程序。

· Hadoop YARN:2012年推出,这是一款负责管理集群计算资源,并利用这些资源安排用户所需的应用程序的平台。

· Hadoop MapReduce:应用MapReduce编程模型进行大型数据处理。

Hadoop这一名称不仅仅意味着上述的各种基础模块和子模块,而且还代表一种生态系统或可以在 Hadoop之上或与Hadoop一起安装的其他软件包的集合,包括 Apache Pig,Apache Hive,Apache HBase,Apache Phoenix,Apache Spark,Apache Zookeeper,Cloudera Impala,Apache Flume,Apache Sqoop,Apache Oozie和Apache Storm。

Hadoop框架主要由Java语言写成,某些本机代码由C语言和命令行实用工具写成,作为Shell脚本。虽然MapReduce 的Java代码非常普通,不过任何编程语言都可以与“Hadoop Streaming”同时使用来执行用户程序的“Map”和“Reduce”部分。Hadoop生态系统中的其他项目提供了更加丰富的用户界面。

Hadoop既可以部署在传统的数据中心,也可以部署在云端。部署在云端时,企业就不必为硬件配置或具体的设置发愁。目前提供云服务的企业有微软、亚马逊、CenturyLink Cloud IBM、谷歌和甲骨文。

Hadoop分布式文件系统

Hadoop分布式文件系统(Hadoop Distributed File System,HDFS)是一种在普通廉价服务器上存储数据的分布式文件系统,可在整个集群中提供非常高的总带宽。

HDFS是Hadoop架构组件之一,是一款以Java语言编写的分布式、可扩展和可移植的文件系统。由于HDFS不符合可移植操作系统接口(POSIX)规范,因此有些人也将其看作是某种数据存储,但是它确实也提供了与其他文件系统类似的Shell命令和 Java应用编程界面(API)方法。尽管由于NameNode的临界性,Hadoop集群中提供了供NameNode使用的冗余选项,但是一个Hadoop集群名义上只包含一个单一的NameNode和一个数据节点集群。每个数据节点按照具体的HDFS区块协议构成网络内的数据块。文件系统使用 TCP/IP端口进行通信。客户端使用远程过程调用(RPC)进行彼此之间的通信。

HDFS可在多个主机上存储大型文件(通常是以GB和TB为单位的大容量文件)。它通过在多个主机间对数据进行复制来呈现数据的可靠性,因此,从理论上讲它不需要在主机上安装独立磁盘冗余阵列(RAID)存储[不过,为了提高输入输出(I/O)性能,某些 RAID配置仍然是非常有用的]。HDFS的默认副本系数为3,这意味着数据会在3个节点上进行复制:2个在相同的机架,1个在另一不同机架。数据节点之间可以进行对话,以实现数据的平衡调整、副本的移动,并且保证数据的高复制率。HDFS并不完全符合POSIX要求,这是因为POSIX文件系统的要求与Hadoop应用的目标有所差异。不完全符合 POSIX文件系统要求所带来的优势是数据吞吐率的提高,以及它可以支持某些非POSIX操作(如Append)。

HDFS中的数据存储和数据查询如图7.7所示。图7.7 HDFS中的数据存储和数据查询

Hadoop的应用

Hadoop可实现对组织各部门在各种活动所产生的不同类型数据的收集、存储、查询、分析和报告,并将结果显示在相应的面板界面中,进而实现实时监测和功能优化。

Hadoop生态系统的另一个重要方面是它为所存储的数据提供了内置的容错能力和灾难恢复模式,为 Master节点提供元数据和指向数据节点中所存储的实际数据的备用节点,其默认副本系数为3。

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载