大数据智能核心技术入门:从大数据到人工智能(txt+pdf+epub+mobi电子书下载)


发布时间:2020-09-16 04:26:40

点击下载

作者:杜圣东

出版社:电子工业出版社

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

大数据智能核心技术入门:从大数据到人工智能

大数据智能核心技术入门:从大数据到人工智能试读:

作者介绍

杜圣东,西南交通大学信息科学与技术学院(人工智能研究院)讲师,大数据与人工智能方向在职博士,硕土与本科毕业于重庆大学计算机学院。兼任多家单位技术顾问和大数据培训专家,曾为中国中车集团、广州地铁集团、成都铁路局等多家企事业单位做大数据和人工智能培训讲座。首次提出了敏捷大数据方法论,在数据挖掘、商业智能、机器学习和交通、政务、医疗大数据等领域有10余年的系统研发、管理与咨询经验。迄今为止,主研国家自然科学基金和国家重点研发计划项目4项、主持企业课题和产品研发20余项,获得专利和软件著作权6项,发表论文10余篇。内容简介

本书跟从大数据和人工智能应用的融合之路,通过分析和解读整个数据驱动智能核心技术,希望能给读者提供一个大数据智能核心技术体系的入门学习和应用参考指南。本书前半部分内容重在核心技术解读:包括大数据智能的概论、大数据智能核心技术体系的多维解读、深度学习关键技术要点的分析,大数据智能应用三段论和敏捷大数据方法论的提出等内容。后半部分内容重在应用实践的探讨,深入分析了当前大数据智能独角兽Palantir、AlphaGo、Watson等核心产品和技术,并从个人学习到工程实践,从企业应用到政府治理,从业务理解到技术选型等多个层面,逐一解读大数据智能技术在学习、应用过程中面临的关键问题、陷阱,并给出参考意见。

本书通过核心技术解读帮助读者学习、理解、应用大数据智能,具有重要的参考价值。本书适合的读者包括关注大数据和人工智能相关技术领域的在校学生、个人学习者和研发工程师、技术主管、企业高管、政府管理人员等。

未经许可,不得以任何方式复制或抄袭本书之部分或全部内容。

版权所有,侵权必究。

图书在版编目(CIP)数据

大数据智能核心技术入门:从大数据到人工智能/杜圣东著.—北京:电子工业出版社,2019.4

ISBN 978-7-121-35684-1

Ⅰ.①大… Ⅱ.①杜… Ⅲ.①数据处理②人工智能 Ⅳ.①TP274②TP18

中国版本图书馆CIP数据核字(2018)第280890号

责任编辑:石倩

印刷:

装订:

出版发行:电子工业出版社

北京市海淀区万寿路173信箱 邮编:100036

开本:720×1000 1/16 印张:15.5 字数:285.2千字

版次:2019年4月第1版

印次:2019年4月第1次印刷

定价:49.00元

凡所购买电子工业出版社图书有缺损问题,请向购买书店调换。若书店售缺,请与本社发行部联系,联系及邮购电话:(010)88254888,88258888。

质量投诉请发邮件至zlts@phei.com.cn,盗版侵权举报请发邮件至dbqq@phei.com.cn。

本书咨询联系方式:010-51260888-819,faq@phei.com.cn。

自序

我们所生活的世界,就像一片数据混沌(Data Chaos),大数据爆炸式增长并以惊人的速度进行传播,社交网络的实时性打破了数据发布的时空限制,信息流动的速度、广度和深度让传统管理决策模式面临挑战,还有科技高速发展所带来的冲击都在加大未来的不确定性。如何从数据混沌中发现规律,成为预测未来的“先知”,是历代人类的梦想。不管是古人的占卜,前几年的专家系统、数据挖掘、商业智能,还是当下的机器学习、人工智能、深度学习等技术应用,都源于降低未来的不确定性这一本源需求。软件在加速吞噬物理世界,大数据在淹没我们有限的大脑认知,而大部分人对其技术原理和特性却知之甚少。我们寄希望于大数据智能技术这根“救命稻草”,帮助我们面向过去,发现数据规律,归纳已知;面向未来,学习数据趋势,预测未知,从而提升对事物的理解和决策处置能力。然而,要达到这一目标并不容易,人工智能发展60年,进展缓慢,直到现在才出现些许曙光。

DT(Data Technology)时代,大数据驱动的人工智能技术生逢其时,从战胜人类顶尖棋手、帮助发现引力波到自动驾驶、精准医疗、安全防控等,就像望远镜改变了我们对宇宙的看法,显微镜改变了我们对微观世界的认知,而通过大数据智能技术来解构我们亲手塑造的数字世界,代表了一种新的认知范式。可以预见的是,随着深度智能技术的高速发展和这一拨“猫”“狗”AI 工程的野蛮生长,人类正在大踏步迈入大数据智能时代。面对兴起的大数据智能热潮,如何应对新兴技术应用带来的挑战?我们又有多少深入的理解?对于技术、架构、算法、伦理、趋势知多少?甲骨文CEO Larry Ellison(拉里·埃里森)曾说过:“信息科技是唯一能媲美好莱坞的产业,技术明星可能比荧幕明星陨落得更快。”前沿信息技术从来不缺流行词,从IT到DT,从移动互联网到物联网,从云计算到框计算,从数据库到数据湖,从云存储到区块链,从大数据到大数据智能。当谈及人工智能时,更是这样,有机器智能,还有计算智能;有机器学习,还有深度学习;有感知计算,还有认知计算;有Watson还有AlphaGo;有 TensorFlow 还有 Pytorch。一堆眼花缭乱的技术名词和系统框架,让人云里雾里,内行要全面掌握已是困难重重,外行要摸出门道,可谓难上加难。

面对庞杂的大数据智能科学与技术生态体系,还有眼花缭乱的技术热词,有的是新瓶装旧酒,有的是全新的技术理念和架构,有的是一阵风突然冒出又很快散去,有的是三起两落几十年而不倒……上述种种技术我们如何快速入门,把握重点,理解本质,并有效学习和应用?这是一大挑战!市面上的同领域作品要么偏社科解读,浮于概念介绍;要么偏技术细节,局限于某个技术点。

如何从业务到技术,从学习到实践,从治理到应用,抽丝剥茧、拨开数据驱动智能科学与技术迷雾,洞察大数据和人工智能相关技术生态的全景视图,构建完整的大数据智能知识结构与技术体系?这是一大难题!笔者跟从大数据和人工智能应用的融合之路,通过分析和解读整个数据驱动智能科学技术,希望能给读者提供一个大数据智能核心技术体系的入门学习和应用参考指南。本书写作初衷即基于此,无奈水平有限、涉猎有限、精力有限,难免有遗误的地方,还望同行批评指正。如能为读者提供一点点有益的参考,则心愿足矣。

杜圣东

2018年10月

轻松注册成为博文视点社区用户(www.broadview.com.cn),扫码直达本书页面。

● 提交勘误:您对书中内容的修改意见可在提交勘误处提交,若被采纳,将获赠博文视点社区积分(在您购买电子书时,积分可用来抵扣相应金额)。

● 交流互动:在页面下方读者评论处留下您的疑问或观点,与我们和其他读者一同学习交流。

页面入口:http://www.broadview.com.cn/35684

第1章 大数据智能概论

1 大数据现象的本质

大数据源起:先知的诱惑[1]

大数据(Big Data)时代,我们周围充斥着各种不同的信息、理论、观点,还有“噪声”。软件在加速吞噬物理世界,数字化、信息化、网络化之后正在走向虚拟化、智能化,我们所生活的世界,就[2]像一片信息混沌(Information Chaos)。大数据一直在爆炸式增长,并以惊人的速度进行传播,前沿信息技术高速发展所带来的冲击加大了未来的不确定性。不管是线上还是线下,当我们接收的数据和信息越来越多时,面临的选择就越多,如若不善于过滤、挖掘和分析,进行各种决策时就可能会造成负面影响,从而放大我们对未来不确定性的焦虑。小到个人选择,大到国家决策,都在这样一片混沌中煎熬着。[3]如何从信息混沌中发现有价值的规律,成为预测未来的“先知”,[4]抑或是少出几只“黑天鹅”。这是历代人类的梦想,不管是古人的占卜、算命,还是前些年的专家系统、数据挖掘、商业智能,还是当下的机器学习、人工智能、深度学习等技术和应用,都源于我们对未来不确定性的担忧,当然还有应对庞杂信息管理时的失控状态。物理世界正在信息化、软件化,而大部分人对其原理和特性却知之甚少,就像我们的金融交易系统一样,一旦出现黑天鹅事件,系统越复杂,[5]造成的冲击就越大,而机器学习、深度学习等黑箱算法应用正在加剧这一趋势。另外,高速网络和社交软件的实时性打破了数据生成和发布的时空限制,信息流动的速度和广度让传统管理与决策面临挑战。

随着舍恩伯格教授的《大数据时代:生活、工作与思维的大变革》[6]一书的面世,让我们认识到了大数据的重要性。只要抓住大数据这根救命稻草,我们就有机会做“先知”吗?从而更有能力把自己和周遭的信息世界管理得更好吗?在一定程度上讲是这样的,但我们也要知道,任何技术都是把双刃剑,大数据的可预测性、大数据的迭代性本质和应用闭环特征,创造了一种新的认知范式和管理、决策思维。但数据分析模型的黑箱和操作的自动化,却削弱了我们对数据问题本身的理解和深度探索能力(在没有大数据工具的条件下),机器的量化分析、智能学习能力与人的主观决策判断在短时间内还难以有机融合。大数据应用为什么难以落地,虽然我们已经不缺模型算法、计算和数据资源,但还是缺乏提出正确问题和有效利用大数据分析工具解决问题的能力,就好比用大炮没有打到蚊子,我们不能说大炮没用,而会说这个人的方法搞错了。

案例分析《大数据时代:生活、工作与思维的大变革》提出的三大核心观点《大数据时代:生活、工作与思维的大变革》一书提出了几个颠覆传统认知的核心观点:

一是不需要抽样的样本,而是要全体数据。比如传统的人口调查或产品品牌评价分析,多是基于小数据抽样的统计方法,因为当时条件下很难有获取大数据的渠道,而且如果要做全样本分析,则人力、物力的投入极其巨大。大数据时代,基于移动互联网、物联网、社交网络等技术,在一定程度上解决了全体数据源采集的问题,但也不能一概而论,很多情况下要获取全体数据是不现实的,需要抽样小数据进行辅助分析。

二是大数据并不精确,而是混杂的。这是相对于大数据的多源异构性特点来讲的,全体数据一定是来源于多个渠道的,数据格式多样化,再加上大规模的量级,大数据集中包含“噪声”、错误或偏差数据项都很正常,这就需要大数据处理技术能包容这一问题。基于大数据的简单模型预测往往比基于小数据的复杂模型预测更有效,这个观点首次由Google提出,深度学习的广泛应用验证了这一观点。

三是大数据分析要解决的关键问题不是因果关系,而是重在相关性分析。这个说法存在较大争议,理想的大数据技术不应该只解决相关性分析,还要能解决因果的推理,只是相关性分析相对更容易实现。

上述观点的提出可以说是对统计学时代的传统分析方法提出了质疑,大数据时代DT技术的变革,其核心理论基础多是基于上述几点。从《琅琊榜》看大数据本质

从前些年的物联网、云计算到现在的大数据和人工智能,为什么这些信息技术能够兴起并备受各方关注?大数据现象的本质是什么?[7]怎么认识和理解大数据智能?笔者不想再向大家啰唆4V还是5V,而是来谈谈一部武侠剧《琅琊榜》。为什么叫《琅琊榜》,因为有一个高端神秘的大数据公司——琅琊阁,每年都会发布武林高手排行榜,并为各方提供及时的情报服务。

要理解大数据技术,我们可以分析一下琅琊阁的这些榜单到底是怎么排出来的,为什么琅琊阁的情报服务让皇家也趋之若鹜。我们都知道,现代的各种排行榜,都是以海量数据作为基础进行深度分析的。影片开头青山绿水之间的琅琊阁地宫就是座海量“大数据中心”(分布式存储,见图 1-1),江左盟广布天下的分站和盟员就是数据采集端(手机 APP、网站、传感器等设备终端),而飞鸽传书就是古时候的高速信息传输通道(物联网、移动互联网),当然琅琊阁还有帮隐秘的数据科学家(负责数据挖掘分析和智能预测建模),所以才能成就广为人知的麒麟之才——梅长苏,“麒麟才子,得之可得天下”的关键不在于梅长苏个人,而在于他背后的神秘大数据公司琅琊阁。图1-1 琅琊阁的“大数据中心”

不管是书家笔下的军师诸葛亮、刘伯温,还是抗战轶事中的林彪将军,都是善于收集和分析情报的数据科学家。只要掌握足够的数据和信息,就能对事物的本质,对时局和对手有深入的认识,足不出户而知天下事。大数据时代更是这样,我们每个人的一切都在加速数字化,吃穿住行用,甚至我们的身体和思想本身在各大IT巨头的数据中心里都能找到对应的数字副本,只要能集中分析这些大数据,就能从多个层面解码任何一个人。在万物互联和数字化、网络化的世界,控制了信息流就控制了一切,而不仅仅只是获得商业垄断优势,从广义上讲,大数据崇拜的本质是希望获取更多的信息权,毕竟,掌握信息权和做“先知”的诱惑太大。当然,除了数据,还有对人事的把握、对时机的掌控等,这一系列大数据智能技术之外的因素也很重要,否则关键数据的缺失就会让分析结果“差之毫厘,谬以千里”。从《琅琊榜》看大数据,历史就是大数据,观历史可预知未来,有人先知先觉,有人后知后觉,有人不知不觉,关键取决于对大数据智能技术的应用和把握!

案例分析 关于4V和5V的争论

IBM提出了大数据的5V特性:高速性(Velocity)、多样化(Variety)、大体量(Volume)、价值性(Value)、准确性(Veracity)。这几个V的阐述其实有不准确的地方,不同领域不同数据类型的大数据,很难说都符合上述特征。比如大数据的 Value,有些大数据的价值密度高,也有一些价值密度低(比如做欺诈检测,正负样本严重不平衡,有价值的欺诈样本更是少之又少,这类应用对大数据的分析模型提出了较高要求)的大数据集。同样,大数据的Velocity,有些数据分析应用(比如Hadoop的Mapreduce离线批处理框架,在非实时应用的场景下,计算处理多放在系统资源空闲时运行,尽量不与在线服务的资源需求相冲突)的处理速度可能比较慢,时效性要求并不高。

2 大数据是个“筐”,什么都能往里装

近年来,随着物联网、云计算、大数据、人工智能等前沿信息技术的高速发展,我们已然迈入大数据时代。数据被喻为大数据时代的[8]石油,如何拥有继陆权、海权、空权之后的数权,已经上升为各国的重大科技战略。大数据除了描述一种数据规模形态,不同的组织和成员对大数据的需求和理解都可能不同,不同的研究机构和技术协会对大数据的定义也有差异。大数据可以说是一种社会现象,或一种方法论,或一套技术体系,或一种认知挖掘过程,很难有一个标准的定义。那大数据应用的目的是什么呢?一般来讲,就是通过采集、存储、挖掘和分析海量的非抽样大数据集进行辅助智慧决策支持,即使很多情况下并不具备全量数据的采集条件,很多时候基于抽样的或局部范围的大数据集分析也是具有应用价值的。图1-2 大数据不完全技术和业务概览图大数据技术业务概览

大数据整个技术体系纷繁复杂。比如,大数据源的采集如果基于传感器,则离不开物联网,如果用智能手机,则离不开移动互联网;大数据海量存储要具备高扩展性,就离不开云计算的支持;大数据计算处理采用的机器学习、深度学习建模存在性能瓶颈,需要做并行计算和分布式计算扩展;大数据要互动展示、辅助决策,则离不开数据可视化技术的支持。另外,面向行业的大数据分析有金融大数据、交通大数据、医疗大数据、政务大数据、电商大数据、工业大数据……面向多模态数据的大数据分析有文本大数据、图像大数据、视频大数据等。总之,大数据应用涉及的相关业务和技术范畴十分广泛(见图1-2)。为什么叫大数据智能

为什么本书主题定为“大数据智能”(Big Data Intelligence,BDI)?虽然大数据范围很广,但其终极目标,可以说是利用一系列前沿信息技术实现海量数据条件下的人类深度洞察和决策智能化,最终走向普适的人机融合!这不仅是传统信息化管理的扩展延伸,也是人类社会发展管理,甚至是运作方式智能化的核心技术驱动力。换句话说,数据大不等于大数据,大数据本身只是集成的数据集,没有特定的应用场景,没有智能算法的支持,除了提供基本的信息查询和检索之外,大数据本身很难产生更多的附加价值。所以,大数据智能代表的是大数据和人工智能的深度融合,通过大数据的智能学习、挖掘和分析,面向过去,发现数据规律,归纳已知;面向未来,挖掘数据趋势,预测未知,从而提高人们对事物的理解和决策处置能力,最终实现各行各业的普适智能。不管是商业智能、机器智能、人工智能,还是智能客服、智能问答、智能推荐、智慧医疗、智慧交通等相关应用、技术和系统,其本质都是在朝着这一目标演进。

3 何谓大数据智能

图灵的智能之问

大数据如何通过智能算法学习和预测产生价值,大数据如何智能化处理?或者说机器如何智能?系统如何智能?这可谓仁者见仁,智者见智,从早期的符号派智能到专家系统,从数据挖掘到商业智能,再从机器学习到深度学习,这个过程曲折而有趣。我们先来看看艾伦·图灵是如何探讨智能这一问题的,作为计算机科学和人工智能领域的先驱,图灵在 1950 年发表的著名论文Computing Machinery and [9]Intelligence中,详细讨论了机器能否拥有智能这一问题,但这也只是个开放性的讨论,其实图灵也未能定义什么是智能,但其提出了著[10]名的“图灵测试”(见图1-3)。直到1956年的达特茅斯(Dartmouth)学术会议,人工智能(Artificial Intelligence,AI)这一学科概念才被正式提出,其参考定义为:“研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门技术科学。”[11]人工智能研究通过了解人类智能的实质,并研发出一种新的能以人类智能相似的方式做出反应的智能机器。真正的人工智能应该还可以对人的意识、思维的信息过程进行模拟,这将涉及意识、自我、思维、心理、记忆等问题,但由于人类对大脑神经科学和上述问题还知之甚少,所以人工智能的发展比预想的要慢得多。图1-3 图灵测试示意图

一般来讲,智能是知识与智力的总和,符号派 AI 研究人员认为知识是智能行为的基础,智力是获取知识、运用知识的能力,它来自人脑的思维活动,同时,对外界事物的感知和认知能力,也是智能的重要基础及组成部分,智能还涉及意识、心理和记忆等复杂问题。概括来讲,智能至少包括三个方面的能力:理解、分析和解决问题的能力;归纳、演绎推理能力;自适应生存和发展能力。机器和系统要智能,至少具备初步的自动控制、分析推断和自适应学习能力,AI发展了60多年,上述真正意义上的智能,可以说直到现在都还没有诞生。值得一提的是,迄今为止,我们对人类智能本身都还知之甚少,图灵当时做了个比较乐观的预测,他预测在2000年左右,机器极有可能会通过“图灵测试”,拥有初步的智能行为,现在看来这一时间延后了,从当前语言学习、自然语言处理和神经科学的技术发展现状、问题来看,要解答图灵的智能之问,还需要AI研究人员继续付出艰辛的努力。大数据如何助力人工智能

虽说大数据和人工智能没有必然联系,但从近几年深度学习的发展趋势来看,基于大数据的深度学习为弱人工智能(相对于强人工智

[12]能)的普及应用提供了关键技术支撑和成功应用范例。从某种程度上讲,没有大数据的“喂养”,就没有深度学习的成功,当前人工智能领域实现的阶段性突破,都跟大数据驱动的深度学习有莫大关[13]系。比如AlphaGo、自动驾驶、图像识别、语言识别等各领域的重大进展,都有深度学习的影子。

从人类社会发展的四个典型时代来看(见图1-4),从农业时代到工业时代,通过机械动力的优化,放大了我们的体力,让我们得以改造物理世界;从工业时代到信息时代,通过信息化和网络化等数字优化,放大了我们的时空感知能力;从信息时代到智能时代,将通过大数据和智能算法的优化,放大我们的脑力,从而改造提升我们的智能化管理和决策水平,强化我们理解问题的洞察能力。图1-4 人类社会发展的四个典型时代

设想,在未来的智能时代,如果你是一名警察,只需要手握连接安全云(全国公安大数据智能决策中心)的智能终端,那么摄像头照到的任何事物,包括人脸、车牌、身份证等,不仅能追溯到当事人的历史信息(比如有无前科、犯罪记录、家庭环境等,这些现在就可以做到),而且能预知当事人的行为趋势,有多大概率会违法、犯法[14](就像电影《少数派报告》一样,当然这种机器学习预测行为会触及人类社会更深层的隐私问题);如果你是一位农民,用你的智能手机,照照田间地头,就能了解到这个农作物长的什么虫,该用什么药,还能知道基于当前情况,农作物生病会持续多长时间,会减产多少,就像京东的“猪脸识别应用竞赛”,不只是一般的信息化养猪,而是希望能实现个性化、定制化养猪;如果你是一名医生,通过医疗智能终端,则不仅能了解到体检者当前的各项健康指标,而且能预测体检者的某些大病概率;上述种种,都是大数据智能技术的典型应用场景,对于未来的大数据智能,上述场景的实现时间不会太遥远。所以,近几年来,领先的IT公司(如Google、Facebook、苹果、微软、亚马逊、华为、阿里、百度等)无不在大数据智能领域投下了重注,不管是技术、人才,还是资金,都堪称大手笔。

为什么领先的 IT 公司对大数据驱动的智能技术如此关注?各行各业都对大数据和人工智能寄予厚望?这都有赖于机器学习,特别是深度学习这些年的突破性发展(当然也有炒作的因素,后续章节我们会详细探讨),深度学习作为人工智能新兴的关键技术,被 AI 研究和应用人员寄予厚望。从技术角度看,一方面是物联网、移动互联网的大数据采集,以及基于云的大数据存储计算、大数据的分布式集群化管理;另一方面是专家系统、数据挖掘和人工智能、深度学习技术的高速发展。两大智能关键技术方向在加速汇聚。大数据智能的深度融合之路

如果大数据智能是一个人,那么眼耳鼻舌身意和神经感知就是物联网,环境感知的一切信息就是大数据,获取知识和记忆的无限大脑存储就是云计算,而人工智能负责经验的积累、学习和智慧决策。大数据智能技术的应用是指基于大数据和人工智能分析引擎,通过基于云计算的大规模机器学习、深度学习或强化学习等关键技术,对海量数据进行智能处理、挖掘和分析预测,帮助我们深度洞察数据中所包含的价值信息和关键知识,或通过建立自动、闭环、迭代的智能学习系统寻求相关问题的最佳解决方案,从而提升我们的认知、管理和决策能力。换句话说,大数据智能的成功普及将是传统信息化的终点,信息化走向智能化之后,整个高科技助力的相关产业链(包括传统产业的升级)都会产生质的变化(见图1-5)。图1-5 从大数据到大数据智能的融合式发展

总之,大数据智能是大数据与人工智能的深度融合,而这种融合趋势是不可避免的,怎么更快速、更明智地进行智能分析和辅助决策是关键,而智慧决策的自动化和自学习化是大数据智能系统发展的必然,也是下一个待突破的AI堡垒。这种融合将加速各领域的技术创新和智能应用的爆发,比如加快药物研发进程、精准诊断疾病、安全自动驾驶、保障公共安全,以及许多尚未发明的重大创新应用。后大数据时代,我们需要大数据智能。

4 大数据智能三要素

智能时代将由大数据、算法和算力三者驱动,为什么这样讲,这一拨 AI热潮的兴起有三个关键原因。

一是通过物联网和移动物联网等技术的大规模普及应用,大数据的爆炸式增长成为常态,产生了大数据燃料。随着互联网、移动互联网和物联网的高速发展,可以说已经构建了地球人类文明以来最强大的知识库、数据库和记忆库,然而大数据燃料还在源源不断地补充。[15]

二是得益于强化学习和深度学习算法设计训练的突破,在机器学习和智能算法层面进行了极大的拓展,让机器学习算法得以走出实验室,应用于工业界。这也是通过大数据分析预测解决不确定性问题的可行路径之一,大数据条件下的多方博弈和复杂性预测问题,越发难以应用传统数据建模技术加以解决。由于客观世界的复杂性和大数据的相关性,传统人工设定的浅层学习模型和编程规则更是难以应用于大数据挖掘分析和预测,而神经网络的再次崛起已经让机器缓缓睁开了眼睛,不仅能看图说话还能听会道,初步具备了对外在环境的感知能力。

三是GPU计算设备的普及,为大规模深度学习提供了强有力的计算资源。数据:智能燃料

如果大数据智能是我们要飞抵的AI星球,那么大数据就是火箭燃料,数据是智能系统与环境交互的第一手资料。AlphaGo为什么能在短短几个月时间内学会围棋,而且战胜了人类顶尖棋手?归根结底,离不开棋谱大数据的支持(初期版本),短短几天就能学习和对弈上百万盘棋谱,而人类顶尖棋手一辈子才下多少盘棋?人类的成长是一样的道理,幼儿经过几百天的数据训练,而且是在看到的物体、听到的话语等输入数据很有限的条件下,就能激发大脑里的神经网络,形成基本的听说经验和学习能力。我们大脑接收和处理的数据越多,面对相应复杂问题的挑战时,学习、反应和决策能力就越强。所以,大数据是智能诞生的关键要素之一,这一论断在绝大多数情况下是成立的,即使如Alpha Go的升级版AlphaGo Zero,虽然能抛开数百万盘人[16]类的棋谱,直接学习围棋规则,但是其通过强化学习自动生成了更多的学习棋谱,本质上自我对战学习的过程还是在应用大数据,只是这个大数据是其“左右互搏”自己产生的,而不是基于人类棋谱大数据。算法:智能引擎

深度学习的核心技术是几十年前就已经提出的人工神经网络,如果将人工神经网络比作火箭发动机一代,那么深度学习就是火箭发动[17]机二代,升级了训练方式(Hinton首创),拓展了发动机功能[18][19][20](GAN、LSTM、NTM等一系列新的深度神经网络结构被提[21]出),加装了高性能计算设备GPU(做游戏显卡起家的Nvidia居功至伟),当然最重要的是还有了大数据燃料,这样一来,我们飞抵人工智能星球的能力就大大增强了。这也是为什么神经网络换“马甲”为深度学习之后,能取得突破性进展(图像、语音、翻译等多个领域接近或超过人类)的本质原因,上述三个方面的天时、地利、人和发挥了关键作用。

学习算法作为大数据智能的核心引擎,面对传统浅层机器学习算法的瓶颈,如何拓展其处理能力是关键,而我们好像抓住了深度学习这一救命稻草。大数据与智能引擎算法好比一对互相学习、共同进步的兄弟:一方面,AI基础理论技术的发展为大数据机器学习和智能系统的构建提供了更丰富的模型和算法,如深度神经网络的突破,衍生出了一系列智能技术和算法(深度学习、强化学习、迁移学习、对抗学习等);另一方面,大数据为智能引擎的发展提供了算法优化的关键动力和燃料,数据规模大了之后,传统机器学习算法面临挑战,要加速、要改进、要做并行化处理等。总之,当前的大部分弱 AI 应用都遵从数据驱动智能这一技术路线,暂时还难以绕开大数据。算力:智能加速

大数据智能的成功,数据、算法和算力,一个都不能少。自从深度学习于2012年大放异彩以来,GPU计算走入我们的生活并日益普及,从此大规模深度神经网络的训练再无大的性能瓶颈。最早的神经网络已提出了数十年,为什么现在才能大规模应用,这跟计算机的高性能处理能力有莫大关系。大数据的处理离不开高性能计算(High Performance Computing,HPC),其核心目标就是解决算力这一根本问题,这些是实现大数据智能的必备要件(见图1-6)。图1-6 高性能计算资源(DWAVE量子计算机、太湖之光超算系统、AlphaGo的集群环境)

当机器拥有比人脑强上亿倍的计算能力(如Google的数据中心有上百万台服务器集群),拥有互联网上亿级实例数据的训练条件时(如互联网千亿级网页数据、机器自我对战的海量模拟演练数据等),再结合深度神经网络算法、强化学习算法和启发式搜索算法,弱 AI 应用的普及和爆发只是时间早晚的问题,所以很多专家讲要小心人工智能,虽然有些观点稍显夸张,但从技术角度看也不是没有道理的。依托强大的算力、算法和数据,大数据智能技术已经可以帮助我们从宇宙中找到引力波,帮助解码我们的致病基因序列,可以让汽车自动驾驶数十万公里……

5 大数据智能的马太效应

DT技术新解

从前些年到现在,物联网、云计算、大数据、人工智能等前沿信息技术领域,逐个火了一遍。这是信息时代向智能时代转变的必然。2014年,马云提出了一个观点:“人类正从 IT 时代走向 DT 时代。”他认为 IT (Information Technology)技术以自我控制、自我管理为主,而DT(Data Technology)技术,则以融合分享、服务大众、激发生产力为主。信息技术跨入数据技术时代,那么“信息”变成了“数据”有什么玄妙?为什么以前叫信息,现在叫数据?我们换个角度来理解DT技术,这跟我们大脑的信息处理能力有关!信息时代,我们接触的是小数据,传统管理信息系统查询出来的记录、统计报表等,这些小数据对我们的大脑来讲,其实就是直接的信息,因为我们能快速把数据加工成能理解的信息。大数据时代,我们被海量的数据、资讯淹没了,所以从数据样本的规模来讲,信息的价值密度降低了,有用的信息反而更难获取了,一眼看去只剩下海量数据,而要把大数据提炼成有价值的小数据,除非你掌握高效的大数据分析技术和工具,才能从海量数据中抽取、提炼出有价值的信息,从而获得深度洞察力!大数据时代的搜索引擎就是很好的例子,好的搜索引擎会让我们很快找到有价值的信息,而坏的搜索引擎却很可能会误导我们,搜索引擎对我们获取信息如此重要,其本质也是一种大数据的抽取和提炼。

更严重的问题是,数据大爆炸还带来了数据“噪声”和假数据,大数据里面很可能含有很多垃圾数据和虚假数据,这类数据有人为的也有因机器出错产生的。就像在某些搜索引擎搜索诊病相关内容会有假药信息。我们的大脑被正确的数据淹没还好,要是被垃圾数据淹没,后果可想而知!我们的微信朋友圈信息、微博信息有多少是真、多少是假、多少是噪音、多少是有价值的知识,很多内容经不起推敲(比如有基于大数据的舆情分析技术,基于深度学习的假新闻识别技术)。大数据和自媒体时代,权威的知识在逐步弱化,对大数据的精心包装和控制成为可能。这对个人来讲,获取真实的、有价值的信息,其成本(包括知识成本和技术成本)只会越来越高。那对企业、机构和政府来讲呢?也是一样的结果,IT在向DT发展的过程中,大数据条件下获取有价值信息的代价会越来越大!这考验的不仅仅是个人的信息获取能力,各行各业领导的决策能力同样面临着极大的挑战。

技术洞察 DT技术泛型的变革

马云从社科角度提出了DT时代这一创新理念,IT时代是以自我控制、自我管理为主的,而DT时代,则以服务大众、激发生产力为主。如果从技术角度来解读(见表1-1):IT技术重在数据治理,通过信息化获取基础数据,把数据管起来,小数据的价值密度高,大脑认知还可以理解;DT 技术重在数据应用,特别是在大数据价值密度较低的情况下,如不善于过滤、提炼和挖掘,被数据“噪声”淹没的风险较大,依托DT技术提升工作效率和业务水平势在必行。IT 技术崇尚“个人英雄主义”,DT 技术崇尚分享的“集体主义”,分布式协作和融合共享(如Hadoop、Spark等的系统架构)基于DT技术生态,站在巨人的肩膀(云计算、云服务)上更容易成功,比如APP生态、三方公共服务接口的便捷使用等。表1-1强者越强,弱者越弱

李开复曾提到硅谷这几年的一个现象:“做深度学习的人工智能博士,一毕业就能拿到200到300万美元的年收入,这是有史以来没[22]有发生过的。”与之相比的是,美国大学生的平均终生薪金收入是230万美元,可见各大IT巨头在深度学习和人工智能这个领域押下了多重的筹码,IT巨头们在赌一个所谓的“风口”。我们从人类社会的发展来看,经历了农业时代、工业时代和当今的信息时代,借助大数据、智能算法和高性能计算资源,现在正是跨越智能时代的关键节点,很大程度上就看这拨以深度学习为代表的大数据智能技术,能否担当得起如蒸汽机、电灯和互联网这样重大的历史性变革技术使命。在高科技领域,一项顶级技术或产品的研发骨干为公司带来的长远价值很多时候是难以估量的,越是技术实力强的企业,越能吸引顶级人才的加入。这种集聚效应带来的负面效应也很明显,对其他同领域中小企业造成的压力显而易见,顶级团队产品的垄断优势会让普通企业的产品根本无法生存,只能退而求其次寻求差异化来竞争。总之,一位顶级人才的100万美元年薪可能意味着数十位,甚至数百位普通工程师的失业,强者越强,弱者更弱所带来的产业垄断问题会越来越明显。

大数据智能三要素决定了加速垄断的基因:闭环大数据资源、顶级机器学习技术团队、大规模服务集群的算力,三者都需要极高的技术门槛和强大的人力、物力、财力支持。而大数据和人工智能的核心优势在于规模效应,你的业务量越大、业务覆盖性越广,数据规模就越大,大数据智能技术投入的成本就越容易被摊薄,而获取的长远价值就越巨大。近年来,不少创业团队或顶级人才被阿里系、腾讯系或百度系悉数收割,可见一斑。国外以Google为例,可以说没有Andy Rubin(安卓创始人,开启了移动互联网时代)、Hinton(深度学习开创者)、Demis Hassabis(AlphaGo创始人)、Fei-Fei Li(ImageNet创始人)等一票大牛的加入,就没有Google当今的AI霸主地位。另外,企业巨头和政府是适合大数据智能的超级玩家,这也是为什么大数据独角兽 Palantir 的产品只有政府版和金融版的原因!这些巨头们的产品和技术,我们会在第5章进行详细解读。挑战才刚刚开始

虽然大数据智能目前还处于弱 AI 应用阶段,但越是强大的技术,其自身发展的速度越是难以想象的,当Google的自动驾驶狗(已行驶超200万公里)、医疗狗(DeepMind各种疾病诊断AI已初显身手)、翻译狗(Google几十种语言的自动翻译)、军事狗、金融狗等各种“狗”连成一片的时候,工业机器人必将走出牢笼,变身各种机器助手进入到你我的家里和办公室里,而“狗”的服务端则会像电力一样提供源源不断的智能服务,那时弱 AI 应用普及的时代就来到了。

这一发展趋势下的首要问题是如何解决安全、垄断和对传统社会[23]各方面造成的负面影响?这是马斯克创立OpenAI联盟的原因。智能时代的若干企业大数据中心、政府大数据中心和地球上的数朵大云,将会插上智能科学的翅膀,成为AI时代的关键基础设施,到时大数据技术如何演化,国家又会呈现出怎样的社会形态,现在还无法知晓。但可以肯定的是,不管是国家、企业还是个人,大数据智能高速发展带来的马太效应才刚刚开始。主要挑战表现在如下几个方面。(1)对个人来讲,如何跟上这一拨技术革命,不至于被自动化、智能化的机器劳动力所淘汰,是未来个人学习、工作和生活面临的最大挑战。大数据智能的发展速度只会越来越快,我们工作的变化也会越来越快。IBM的Watson在有足够病例和病理知识的输入下,其[24]对一般病症的判定准确率已经相当于初级医生的水平,换句话说,它可以替代大多数社区医院的医生。其在律师行业的应用也能作为助理律师处理一般性事务。面对各产业领域的智能化应用变革,机器劳动力正在汹涌而来,很多的蓝领或白领工作将被取代,这是毫无疑问的,在这种情况下,我们该怎么升级自己的学习能力和知识体系以适应智能时代的革命?需要引起我们的重视。(2)对企业来讲,大数据信息的加工速度代表了未来企业的生产力。各大企业的智能云端战略在加速人工智能生态的突破,从现在互联网企业的布局可见一斑,BAT的格局短期内难以撼动,出现滴滴、摩拜、Airbnb等新兴大数据商业模式,大浪淘沙式的竞争越发激烈。大数据智能时代会加剧这一趋势,强者越强,弱者越弱,AI的顶端容不下几位玩家,不管是智慧云还是智能端,都会是这样。智能化的产品服务能力将会越来越重要。(3)对国家来讲,科技加速在推动社会各领域演变加速的同时,也会对经济和治理生态进行重构。从某种程度上讲,大数据智能的发展不只是技术问题,同时也是社会问题,比如失业问题、社会伦理道德问题、产业结构问题、隐私和安全保护问题等。特别是面对强 AI 技术的研发和应用,如何保障安全控制和降低技术革命的负面影响?值得高层决策者深思。

当然,大数据智能的应用还存在着变数,那就是人工智能发展几十年,历史上数次悲观或乐观的预测大多失败了,未来数十年内会不会产生突变呢?谁也说不准,另外强 AI 能否实现,这得看未来数十年或数百年里,是否有某位大牛提出了机器智能的终极算法?抑或是 Google 机器农场中的某个深度网络初步解码了人类大脑的学习机制。总之,大数据智能的崛起在昭示着弱 AI 的觉醒,而强AI的研发对于人类而言却是吉凶莫测。[1] 大数据参考定义:大数据是指一些使用目前现有数据库管理工具或传统数据处理技术很难处理的大型而复杂的数据集。其挑战包括采集、管理、存储、搜索、共享、分析和可视化。整合更大数据集的目的是为了通过数据分析来挖掘出更大价值。[2] 混沌:1963 年,美国气象学家爱德华·罗伦兹提出混沌理论(chaos),即非线性系统具有的多样性和多尺度性。混沌理论认为,在混沌系统中,初始条件十分微小的变化,经过不断放大,其未来状态会产生极其巨大的差别。[3] 先知:宗教里的一个概念,一般指对宇宙、人类社会或自然科学方面的大事能提前了解或能准确预言的人。[4] 黑天鹅:代表不可预测的重大稀有事件,意料之外却又改变一切。人们总是对一些事物视而不见,并习惯于以有限的生活经验和信念来解释这些意料之外的事件。[5] 黑箱算法:常指一些机器学习算法,一般由程序员编写模型,自动从数据中学习出模式和规律,而如何学习这个过程却难以或无法解释。[6] 维克托·迈尔-舍恩伯格,肯尼思·库克耶,ViktorMayer-Schonberger,等.大数据时代:生活、工作与思维的大变革[M].浙江人民出版社,2013.[7] 4V、5V:一般指Volume,数据总量大;Variety,多源异构——数据种类和来源多样化;Value,数据价值密度相对较低;Velocity,数据增长速度快,处理速度快,时效性要求高。5V就是在4V的基础上加上Veracity,强调数据质量,如准确性、可信度。[8] 数权:关于数据、信息的控制权,大数据的获取正和土地、海洋、制空权等资源的获取一样重要,正在逐步成为促进社会生产力发展的重要资源。但数据本身的归属权、交易权和隐私权等问题还在摸索和探讨之中。[9] Machinery C.Computing machinery and intelligence-AM Turing[J].Mind,1950,59(236):433.[10] 图灵测试:图灵采用“问”与“答”的模式,即观察者与两个测试对象(测试对象和观察者隔开)进行通话,其中一个是人,另一个是机器。要求观察者在不看测试对象外形的情况下,不断提出各种问题,从而辨别回答者是人还是机器。当人不能区分回答是机器行为还是人的行为时,就说明做出回答的机器是智能的。[11] 罗素,诺维格,殷建平.人工智能:一种现代的方法.北京:清华大学出版社,2013.[12] 弱AI(Artificial Narrow Intelligence,ANI):1980 年 UC Berkeley 哲学教授 John Searle 提出弱人工智能以及强人工智能的分类,弱人工智能是处理特定问题,机器只能模拟我们的行为表现,而不是真的懂得思考,可看成是人类的工具。强人工智能(Artificial General Intelligence,AGI)则认为机器具有与人相同,甚至超越人类程度的思考、感知、智慧等能力。当前AI的主要研究和应用集中在弱人工智能方面,比如AlphaGo只能下围棋而不能做其他工作,这种机器看起来像是智能的,但其内核没有类人的推理能力和自主意识。能否能实现强AI,是否有必要发展强AI,还有争议。[13] AlphaGo:直译为阿尔法围棋,亦被音译为阿尔法狗、阿法狗、阿发狗等,是于2014年开始由英国伦敦DeepMind公司(后被Google收购)开发的人工智能围棋程序,并于2016年在与李世乭的人机大战中以4∶1获胜。[14] 《少数派报告》:2002年的一部科幻电影,讲的是人类研发出了能提前侦察人脑电波的“先知”,来知晓某个人的犯罪倾向,从而提前进行预防。[15] 深度学习(Deep Learning)源于人工神经网络的研究,其概念由Geoffrey Hinton等人于2006年提出,深度学习是一种基于多层深度神经网络结构的自动特征学习算法,通过组合低层特征形成更加抽象的高层表示特征,以发现数据中的分布式表示,并进行有效分类和预测。[16] 强化学习(Reinforcement Learning)是指从环境状态到行为映射的学习,以使系统行为从环境中获得的累积奖励值最大。其核心是学习一个最佳策略,使得一个智能体(agent)知道应该在什么状态下采取什么行动,来获取最大的回报或激励。[17] Hinton,G.E.,S.Osindero,and Y.-W.Teh,A fast learning algorithm for deep belief nets.Neural computation,2006.18(7):p.1527-1554.[18] Goodfellow I J,Pougetabadie J,Mirza M,et al.Generative Adversarial Networks[J].Advances in Neural Information Processing Systems,2014,3:2672-2680.[19] Hochreiter S,Schmidhuber J.Long Short-Term Memory[J].Neural Computation,1997,9(8):1735-1780.[20] Alex Graves,Greg Wayne,and Ivo Danihelka.Neural Turing machines.arXiv preprint arXiv:1410.5401,2014.[21] GPU:最早是指图形处理器单元(Graphics Processing Unit,GPU),又称视觉处理器、显示芯片,是一种专门在计算机或其他终端设备上进行图像运算的微处理器。当前GPU已经不再局限于图形处理,Nvidia的GPU通用计算技术,可以用于浮点运算、并行计算等多个方面,GPU可以提供数十倍乃至上百倍于CPU的性能,已经成为深度学习计算加速的标配。[22] 李开复:我在硅谷看到的最前沿科技趋势。[23] OpenAI是一个非营利性的人工智能研究联盟,致力于AI的安全性研究,目的是使未来的通用AI能由人类控制。[24] IBM的Watson认知智能解决方案。

第2章 多维度解构大数据智能技术

1 “四位一体”看大数据智能

最近几年,以大数据和人工智能为代表的前沿信息技术,发展速度惊人。笔者在第1章说到大数据的本质就是希望获得洞察历史和未来的魔幻水晶球,毕竟做“先知”的诱惑太大,而大数据智能的核心目标就是降低决策过程中的不确定性,希望能预见未来。

行业大数据和人工智能技术的融合,促进了各行各业的加速变革,以适应大数据智能技术带来的挑战。基于深度学习技术的AlphaGo,不仅在围棋领域战胜了人类顶尖高手,其向医疗健康领域的拓展速度更是惊人,基于深度学习技术的皮肤癌诊断、眼疾诊断和[1]心脏病预测等已经达到或超过普通医生的水平。如何抢占大数据和人工智能的应用高地,同时掌握相关核心技术和知识产权,是各国大数据和AI战略聚焦的焦点。本章我们就来看看大数据智能到底是怎么回事,是由怎样的关键技术体系在支撑,为什么有如此大的吸引力,炒作?泡沫?抑或是DT技术的大势所趋。大数据智能技术的四个维度

大数据与人工智能到底是什么逻辑关系?这就不得不说说其他几个前沿信息技术领域。这些年最核心的DT技术基本可以从物联网、云计算、大数据和人工智能四个维度加以概括。

为什么这样讲?结合移动互联网、物联网、云计算、人工智能这[2]几个高科技领域一起来看,移动互联网的兴起是大数据时代的分水岭,在移动互联网之前的PC互联网时代,传统的企业信息化系统多是小数据或结构化大数据;进入移动互联网时代之后,特别是Android和iPhone智能手机的普及,让每个人都成为数据产生器,甚至不需要你输入,你的位置、关注、社交等就会产生海量的数据,还有越来越广泛的企业移动应用和物联网应用,产生的数据量十分惊人。可以说没有移动互联网的普及,我们无法这么快就进入大数据时[3]代。从技术角度讲,移动互联网也属于物联网技术范畴,物联网的发展不只是让人和智能手机作为数据生产者,更是能让越来越多的电子设备、传感器、甚至道路、建筑等基础设施本身都成为数据发生器和接收器。

四位一体看大数据智能技术(见图2-1),这就好比我们人体一样,物联网(移动互联网)构造了眼耳鼻舌身等感官,主要功能是负责各类数据的自动采集;大数据是各种物联感官获取的海量感受信息,数据规模太大之后,需要云计算的分布式架构来进行无瓶颈的记忆和存储,反过来云计算的并行计算能力也促进了大数据的高效智能化处理;而基于大数据智能分析、学习、预测的人工智能就是我们最终获得的价值规律、认知经验和知识智慧。当然,人工智能模型的训练也需要大规模云计算资源的支持,构建的智能模型也能反作用于物联网,更优化、更智能地控制各种物联网前端设备,这个过程中的数据、指令交互和应用部署是一种典型的云—端互联架构。图2-1 四位一体看大数据智能技术

大数据智能为什么离不开物联网和云计算?主要基于如下两点。(1)物联网是大数据的采集端和智能服务的发布端,是智能服务于人和机器的重要载体,就像现在的智能手机和机器人。同时,物联网也是互联网、传统电信网等的信息承载体,让所有能行使独立功能的普通物体实现互联互通的网络。当前人工智能领域深度学习这一关键技术的突破,得益于大数据驱动,而大数据得益于可穿戴物联网设备和智能手机等的应用普及。(2)云计算是大数据智能处理分析的基础支撑平台,提供动态可扩展的高性能存储和计算能力,支持海量数据资源的动态管理和智能模型的高性能学习。其技术实现是基于互联网进行相关服务的推送、使用和交付。通过这种方式,云中共享的软硬件资源和计算服务可以按需提供给各种服务终端和设备。

智能时代的基础IT和DT架构将是基于上述四种关键技术维度的整合。2018年 3 月,微软宣布肢解原来最重要的Windows部门,而组建两个新的大部:一个是体验和设备部;另一个是云计算和人工智能平台部。可以看出,微软的重组,就是打算四位一体练就大数据智能[4]“神功”,希望能在DT时代继续保持霸主地位。云计算的支撑地位

上述两点,云计算(Cloud Computing)是必选项,下面我们就来看看云计算为什么于大数据智能如此重要。IBM的创始人Watson曾有个论断:“我认为全球大概只需要五台计算机就够了。”这在几十年前看似不可能,但大数据和人工智能的规模效应和集聚效应正在使这一预言逐步成为现实。

云计算技术是由分布式计算(Distributed Computing)、并行处理(Parallel Computing)和网格计算(Grid Computing)共同演进发展而来的。最初萌芽于亚马逊公司的“弹性计算云”(EC2)。而云计算概念的成功更多是定位于一种新兴的商业计算模型,它将计算任务分布在大量计算机构成的资源池上,使各种应用系统能够根据需要获取计算资源、存储资源和各种软硬件服务。通过服务器集群,包括计算服务器、存储服务器、宽带服务等虚拟资源的自我维护和管理,降低整个系统的单位处理能力成本,因此云计算也被称为一种“革命性的计算模型”。

云计算是一种能够通过网络以便利的、按需付费的方式获取计算资源(包括网络、服务器、存储、应用和服务等)并提高其可用性的模式,这些资源来自一个共享的、可配置的资源池,并能够以最省力和无人干预的方式获取和释放。虚拟化和服务化是云计算的两个核心要素,服务一般分为以下三个层面(见图2-2)。

● SaaS侧重于应用级服务,通过网络提供应用软件级服务,如CRM、OA等管理系统。

● PaaS侧重于平台级服务,提供服务器基础软件平台或者开发环境服务,如基础的数据库管理和Web应用容器等。

● IaaS侧重于基础设施级服务,用户通过网络就可以从计算基础设施资源池中获得计算、网络、存储等资源服务。图2-2 云计算特点及三层服务

云计算的本质是数据共享计算模式与服务共享计算模式的结合体,通过虚拟化技术构建大规模的分布式计算资源池,将系统的计算分布在系统资源池,统筹考虑系统资源效率,实现按需访问计算机各类资源,从而提高整个系统的使用效率。从用户角度看,其通过远程的调用,将处理数据的服务程序在购买或租赁的云平台进行,既能满足业务需求,业务可扩展性也比较好,且无前期的大量硬件投资,更无须担心硬件和基础软件的维护,而数据存储在云资源池,大大提高了数据的安全性和可靠性,并降低了IT资源的管理成本。

案例分析 华为的“云—管—端”

2010年,华为提出了“云—管—端”新一代ICT(信息通信技术)架构:云,是各种企业服务的数据中心和计算中心,代表业务的DT化,负责海量大数据的处理和分析,由华为的EI云和FusionCloud私有云等技术进行支撑;管,指网络IP化,负责海量信息的传输,依托华为的强大通信技术,以HSPA/LTE、FTTx、IP+光、NG-CDN 构建新一代网络基础架构,以支撑信息和服务的互联互通。端,代表智能终端,无处不在的智能终端是云服务面向用户的直接载体,也是大数据的采集器,依托多样化的智能终端服务企业应用和互联网应用。华为提出“云—管—端”的ICT信息服务新架构,是为了顺应DT时代技术变革带来的企业运营模式转型需求(见图2-3)。图2-3 华为FusionCloud架构图,面向企业服务的“云—管—端”架构,来源:华为官网

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载