腾云:云计算和大数据时代网络技术揭秘(txt+pdf+epub+mobi电子书下载)


发布时间:2020-06-01 14:08:05

点击下载

作者:徐立冰

出版社:人民邮电出版社

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

腾云:云计算和大数据时代网络技术揭秘

腾云:云计算和大数据时代网络技术揭秘试读:

前言

我真正系统地接触网络技术是从一本名叫《CCNA学习指南》(Richard Deal著)的书开始的,此书并不是思科的官方教材,在亚马逊网上书店的CCNA相关搜索结果中甚至排不进前三页。之后我又阅读了被誉为“网络圣经”的《TCP/IP详解卷1:协议》。

直到多年以后,我才意识到自己当初是个幸运儿,这两本书帮助我快速地建立起数据网络的理论框架,花最少的时间渡过了学习一门新知识最开始的那段迷茫、苦闷的阶段。《CCNA学习指南》虽然名不见经传,但它同《TCP/IP详解卷1:协议》一起向读者诠释了优秀技术书籍应该具备的素质,即用最浅显的语言将复杂理论背后的逻辑直白地剖析出来,就好象杨振宁给大学生教授基础物理一样,通过生动、形象的语言将所有的现象最后都归结为几条基本的物理规律。只要掌握了这些基础规律,就能直接抓住事物的本质,以后即使碰到没见过的情况,也能快速分析出个大概,达到“授之以渔”的目的。

可惜的是,我发现那样优秀的书籍真是可遇而不可求,大部分技术书籍满足于描述现象,止步于探究逻辑。在中文技术书籍的领域,这样的情况更加严重。作为对未知抱有渴求的年轻人,在阅读了大量这样的技术文献后,脑袋里装满了各种规则和指标,对规则背后更深层的力量却仍然一无所知。这样的现象日复一日地在身边重复,直到有一天我突然问自己:“为什么不写一点自己喜欢看的东西呢?”。

我开始在国内很有影响的技术网站“弯曲评论”上发表一系列以“拨云见日”为题目的技术文档,主题是剖析当下热门的新一代网络技术。没想到这些文章收到了热烈的反响,“弯曲评论”的站长陈怀临先生也破天荒地表达了赞许。这让我有了更多的干劲,于是便诞生了把我所知道的东西都写出来的计划。

而定下“云计算网络”的主题也是一个有趣的过程。云计算这两年快速发展,其中的网络技术是非常重要的基础,而与之对应的中文资料却非常少,即使偶尔有一两篇文章,也难成系统,大家都在很辛苦地盲人摸象。客观地说,目前引领网络技术发展的仍然是聚集在硅谷的一群高科技公司,碰巧我的工作能够接触到大量的前沿网络技术,同时又需要频繁地与用户交流他们的实际需求,这样的工作性质使得我可以以一个非常宽广且客观的视角来观察这个行业的技术发展趋势,说得通俗一点就是既有“望远镜”又有“放大镜”。手握这样的条件,我来撰写这个主题就具备了先天的优势,也许主观条件和客观条件同时就绪的人还真的不多,结果我的这本书就误打误撞成了国内第一本系统描述云计算相关网络技术的书籍。

然而,在真正开始写作之后,我才发现好书奇货可居的原因。了解一个道理是一回事,能将它讲出来则是另一回事,而要把它讲得漂亮并用书面语言形成于纸面上则又要高上几个层次。这需要作者自己首先理解到120分,然后才可能说出80分的道理。所以写作的过程对于我来说也是一个重新学习的过程,不断地质疑、推倒、重建,在这个学习过程中我再次深深地为那些经典的网络协议设计所折服,我在书中有意识地记录下这个过程,并急切地渴望通过文字把我对这些理论的理解同更多的人分享。

说回本书的内容,数据网络的真正爆发是近十几年的事情。在这十几年中,网络技术几乎是以百米冲刺的速度在跑一场马拉松,各种理论和协议标准层出不穷,这说明当前的网络架构远未达到完美,还有巨大的潜力可以挖掘。如果你在周五晚7点来到北京的国贸地区,最惹眼的不是繁华的城市霓虹,而是高架桥上一眼望不到边的蠕动着的汽车尾灯。成千上万的车辆拥堵在城市主干道上,已经成为阻碍城市运转效率的痼疾。数据网络之于方兴未艾的云计算来说,正好像城市交通之于和谐发展。地铁早高峰时段的“人肉罐头”一日不解决,广大上班族的心头就一日不能轻松。我们今天面对着云计算的巨大潜能,如何能在网络技术上做好准备,迎接即将到来的浪潮之巅,是这个行业中每一个希望探得先机的从业者需要考虑和面对的问题。

这本书是我第一次持续这么长的写作计划,断断续续地拖了大半年。我必须感谢图灵公司的杨海玲和陈冰两位老师,没有他们的鼓励与帮助,我这个没有任何写作经验的菜鸟不可能完成这个庞大的计划;我要感谢陈漪,她在很多专业方面给了我非常多建设性的意见;我还要谢谢陈怀临老师开办的“弯曲评论”网站,这里是“拨云见日”启航的地方,也是国内少有的高含金量网络技术社区,本书就是试着实践其学习、分享的宗旨的一次尝试;我还要谢谢李聪的支持,没有李聪的支持和鼓励,本书不可能成形;最后,我还要感谢我在思科的同事,特别是我的三位老板孙伟、张斌和刘洋,他们在技术工作上表现出来的专业与敬业是我给这本书定下的标准。

尽管已尽最大努力,但由于个人的知识有限,本书在内容和编写方面难免存在疏漏和问题,欢迎大家批评指正。虽然我的写作难以达到《CCNA学习指南》和《TCP/IP详解卷1:协议》那样的高度,但是我希望这本书能够成为中文技术书籍中的一本诚意之作,为有志于网络技术的朋友提供一点实实在在的帮助。徐立冰2013年1月27日第一部分缘起篇第1章云计算的兴起

云计算是一个内涵丰富而模糊的名词,说它丰富是因为云计算已经席卷了IT行业的方方面面,说它模糊是因为少有人能清晰地把握住它的本质。认识云计算是认识云计算网络的前提,本书将从剖析云计算的含义开始,带着大家认识云和云计算网络。

本章将由探究云计算的身世开始,逐渐揭开云计算身上的迷雾,带领大家认识云计算的特征,接着向大家介绍什么是IaaS/PaaS/SaaS,以及公有云/私有云/混合云/社区云等几种云计算的类型划分,最后说明在企业IT环境中,云计算的优势何在。

如果你是一个心急的读者,你大可跳过第一章直接进入后面详细介绍网络技术的部分,但我还是推荐你花一点时间来熟悉云计算的基本概念,这不但将带给你更多的阅读乐趣,而且对更好地把握云计算网络的本质也大有帮助。

1.1 云计算的身世

今时今日,身为一个IT从业人员如果不能忽悠两句云计算,那简直是不可想象的!云计算的影响力已经席卷了各个角落,不管有没有关系的厂家都把自己的产品往云计算的大旗上靠,以赶上世纪初的这股潮流。这么看起来,云计算可以算是继个人电脑、互联网后的又一个革命性技术,将在未来数年内统领IT行业的发展方向,并改变我们使用信息技术的方式。

然而,你也许想象不到,今天大红大紫的云计算概念,实际上在上世纪中叶已经诞生了,经过几十年的发展,云计算已经从一个科学家脑海里对未来世界的畅想,落地为实实在在的产品影响着我们每天的生活。趁着这个机会,让我们先走进历史,回首云计算从孕育到成熟的过程。

1.1.1 “上古”时期,摩尔定律刚起步

上世纪60年代是一个百废待兴的时代,从东方到西方,所有人都提着一股“大干快上”的气势,民用领域的科学技术开始快速发展,计算机刚刚开始用上半导体器件,准备进入后来被称为“摩尔定律”的通道,一切的一切在今天的人们看来都充满着一种梦幻、复古的气息。

有时候你不得不承认人类的想象力是推动这个世界前进的内在动因,就在这个绝大多数人还没用过计算器的时代,来自斯坦福大学的科学家John McCarthy就表示“计算机可能变成一种公共资源。”这句话在当时听上去的效果,就好像杨利伟升空后马上有人告诉你火星房地产市场将会急剧升温一样,有着极度超前的逻辑。

John McCarthy并不是唯一一个做出如此预测的学者,1966年Douglas Parkhill在他的著作The Challenge of the Computer Utility中对这个理论有个更加具体的描述,他将计算资源类比为电力公司,并提出了私有资源、公有资源、社区资源等概念,类似动态扩展、在线发布等今天被频繁提起的云计算特性,在Douglas Parkhill的这本书中已经有了非常详尽的描述。

Douglas Parkhill的理论还有一个更加具体的诠释者,著名的ARPAN(Advanced Research Projects Agency Network——高级研究计划署网络。这是世界上第一个数据包交换网络,是因特网的前身)负责人J.C.R.Licklider将计算资源与他熟悉的数据网络做了结合,提出了“从任意地点通过网络访问计算机程序”的设想。John McCarthy教授在上世纪60年代就提出了云计算的概念

所有这些伟大的思想在那个泛黄的年代里碰撞、激荡,启迪了无数人对计算机朦胧的畅想。虽然提出这些基本概念的先辈科学工作者们并没有看到自己的思想落地生根,他们甚至不知道“云计算”这个特定的词汇,但是他们提出的这些理念非常明确地指明了计算机发展的方向,明确地说明了计算与网络相辅相成的关系。

从上世纪60年代的故事中,我们可以看到云计算不是一个偶然的技术产物,它是计算机技术演进的必然方向,是从计算机诞生第一天起就注定发生的技术革命。而数据网络作为分发服务的渠道,与计算资源的整合也是这个过程中必不可少的一环。

1.1.2 从互联网大爆炸中诞生

如果你是一名IT老兵,那你对世纪之交的那场互联网泡沫一定记忆犹新。上世纪90年代后期,世界经济形势一片大好,在美联储低利率刺激下,大量资金涌入以互联网为代表的高新技术行业,一大批互联网企业上演着“车库创业→获得风险投资→业务快速扩张→纳斯达克上市→30岁退休”的神话。

然而这个失去理智的局面只持续了很短一段时间,随着1999年到2000年上半年美联储连续六次加息,资本市场给出了剧烈的反应,无数指着靠烧钱撑到上市的互联网公司一夜间失去了资金来源,即使已经上市的公司,股票也一泻千里。正如今天一句时髦的话所说“潮水退去才发现大部分人在裸泳”。2000年互联网泡沫破灭,纳斯达克科技股跳水

然而,这场疯狂的盛宴带给我们的并不只有疯狂的记忆,不少有价值的想法趁着宽松的融资环境得到了一试身手的机会,现代的云计算模式便诞生于90年代末的这次互联网大潮。

1997年,Ramnath ChellAppa教授在他的一次演讲中第一次提出了“云计算/Cloud Computing”这个词,他指出“计算资源的边界不再由技术决定,而是由经济需求来决定”。换句话说,计算资源的形式可以是动态的,这种形式根据人们的需求而变化,如果你不在机房内但却需要操作软件程序,那么自然会有一种方式让你能够远程登录计算机。Ramnath ChellAppa教授的理论重复了上世纪60年代那些科学家的思想,但同上世纪60年代不同,技术的发展使得Ramnath ChellAppa教授的理论已经可以找到现实中的模型。

在互联网泡沫盛极而衰的1999年,一家对后世产生深远影响的公司成立了,它的名字是Salesforce.com。Salesforce.com是现在公认的云计算先驱,它由几个前Oracle高管成立,主要向企业客户销售基于云的SaaS(Software as a Service——软件即服务,云计算的一种服务类型。本章1.4节将详细介绍)产品。Salesforce.com自成立的第一天起就表现出鲜明的特色,例如这个“.com”并不是好事的媒体加上去的,而是正式名称的一部分,Salesforce.com通过这个方式告诉世人,它是一家带着网络基因诞生的公司。

Salesforce.com对云计算产业的重要意义不仅在于它通过销售SaaS服务,成长为一家年销售额超过20亿美元的公司,更重要的是Salesforce.com第一次将SaaS服务大规模地销售给了企业用户。Salesforce.com的主要产品是CRM(Customer Relationship Management),即客户关系管理系统。这个领域一向是SAP、Oracle这种玩家统治的地盘,企业客户利用CRM来处理他们最宝贵的客户资源和市场数据,并指导下一个季度的销售策略,对于企业的IT部门来说,保证CRM的稳定和高效是优先级最高的工作。普通用户使用的在线服务标准同企业用户的标准完全不在一个层面上,我们在家用Gmail发个邮件这种行为,在CRM的管理人员看起来根本没有任何说服力。你能想象一家年收入几十亿美元的公司将它的CRM系统从坐落在自己精密机房内的一排嗡嗡作响的IBM主机挪到一个小小的浏览器内吗?况且这个浏览器访问的数据中心还完全不在这家公司的掌控之内!但是Salesforce.com做到了,它不但做到了,而且做得相当不错,今天它的客户名单内包括一大串像通用电气、荷兰航空、富国银行、Comcast、NBC、电子艺界这样的名字,这些名字一点都不像是买不起昂贵的服务器而不得不使用廉价在线方案的小公司。Salesforce.com的客户包含大量大型企业

Salesforce.com的成功之处在于它头一次证明了基于云的服务不仅仅是大型业务系统的廉价替代品,它还可以是真正提高企业运营效率、促进业务发展的解决方案,同时可以在可靠性方面维持一个极高的标准。至此之后,最苛刻的企业用户开始全面拥抱云计算,我们终于迎来了云计算掀起的第一个高潮。

1.1.3 接棒Amazon

时间进入21世纪的第一个十年,接棒Salesforce.com将云计算推向下一个高峰的是在线零售商Amazon。Amazon是一家非常重视客户体验的公司,当发展到一定规模的时候,它发现自己的数据中心在大部分时间只有不到10%的利用率,剩下90%的资源都闲置着,这些资源仅有的作用是被用来缓冲圣诞购物季这种高峰时段的流量。于是Amazon开始寻找一种更有效的方式来利用自己庞大的数据中心,其目的是将计算资源从单一的、特定的业务中解放出来,在空闲时提供给其他有需要的用户。这个计划首先在内部实施,得到的回馈相当不错,Amazon接着便将这个服务开放给外部用户,并命名为AWS(Amazon Web Service——亚马逊网络服务)。

初期的AWS只是一个简单的线上资源库,虽然它依托Amazon的品牌光环吸引了不少注意力,但在大多数时候,人们只是将AWS当作一个互联网公司吸引眼球的玩票行为。这种情况持续了3年左右,直到Amazon在2006年发布了令AWS名声大噪的EC2。

EC2是Elastic Compute Cloud的缩写,是一款面向公众提供基础架构云服务的产品。简单来说,EC2在云端模拟了一个计算机运行的基本环境,如果你接触过虚拟机技术,那么EC2可以看作一个架构在云端的虚拟机。打个比方,你需要为一个为期三个月的项目搭建一台Windows Server 2008服务器,有了EC2之后你不用采购服务器、配置硬件,只需要向Amazon申请一个为期3个月的账号,然后将你的Windows Server 2008应用上传到Amazon的服务器上就完成部署了。Amazon会提供一个公共网关,通过这个网关你可以访问架设在Amazon数据中心内的这个Windows Server 2008服务器的所有功能。Amazon AWS是标志性的云计算服务

之所以说EC2是一个里程碑式的产品,是因为EC2是业界第一个将基础架构大规模开放给公众用户的云计算服务。EC2在Salesforce.com之后将云计算的服务对象带入了更广泛的领域,云计算的用户不再拘泥于某种特定的服务类型上,他们可以在EC2的平台上搭建从Linux到Windows的任何业务。更棒的是这些业务的体量可大可小,能够随着用户的需求而增减。根据Amazon网站上的公开报价显示,如果你只是使用一个最简单的Linux,其价格为每小时8美分!想一想,只需要你掏不到一块钱,就能体验跟世界第一在线零售商店同等级的数据中心服务,这难道不是一件非常神奇、非常酷的事情吗?

除了EC2之外,Amazon还发布了S3、SQS等其他云计算服务,组成了一个完整的AWS产品线。如果说Salesforce.com是给人们做了云计算的启蒙,那么Amazon则用AWS引爆了云计算这座火山,云计算从此正式成为IT产业的主声部。

1.1.4 百花齐放的年代

继Amazon AWS之后,各种类似的云计算产品开始层出不穷地冒出来,云计算不再只是一个阳春白雪的概念,而是所有人追逐的方向。短短几年内,Amazon就不再是市场上唯一的IaaS(Infrastructure as a Service——基础架构即服务,云计算的一种服务类型。本章1.4节将详细介绍)提供商,Microsoft等巨头纷纷涌进这个领域。市场上的主流云服务提供商

除了数量的增长,云计算类型也变得日益丰富,Salesforce.com和Amazon AWS分别代表了SaaS和IaaS两种云计算服务,除此之外的第三种服务PaaS(Platform as a Service——平台即服务)也快速发展起来。2009年,Google开始对外提供Google App Engine服务,Google App Engine是一个PaaS服务,它搭建了一个完整的Web开发环境,用户可以在浏览器里面开发和调试自己的代码,然后直接部署到Google的云平台上,并对外发布服务。以Google App Engine为代表的PaaS服务补齐了云计算的产品版图,从此用户可以在基于云的环境中找到绝大部分计算资源。理论上来说,如果你对服务器硬件已经感到厌倦,那么你已经可以将它们淘汰掉,将你的应用搬迁到这些互联网上的云平台中。

云计算蓬勃发展的另一个特征是,围绕在线资源的应用开始快速出现。2009年,第一个基于Amazon AWS API(Application Program Interface——应用程序接口)的私有云平台Eucalyptus出现,通过Eucalyptus,你可以利用Amazon AWS的计算和存储资源打造自己的私有云架构。类似这样的技术进一步完善了云计算平台的安全性和可靠性,并打通了它和企业用户原有应用平台之间的通道。同年中,信息研究机构Gartner预测企业用户将从基于设备的IT建设模型往基于单个用户需求的云计算模型转变。

进入21世纪的第二个十年,云计算已经进入了百花齐放的时代。人们现在已经不再谈论云计算是否可行,这早已不是一个问题,现在的问题是云计算未来的发展方向,怎样将云计算的潜力充分发挥出来,以帮助我们塑造一个更加高效的IT系统和互联网世界。这个问题的答案涉及到非常广泛的内容,因为云计算是对现有IT模式颠覆性的革新,原有的建设思路必然会受到冲击,其中数据网络就是一个重要的领域。本书的目的正是描述在新时代的云计算环境中,数据网络技术的进化,以及这种进化反过来给云计算带来的影响。

1.2 云计算的DNA

回顾完云计算的历史,让我们把注意力集中到一个最基本的问题上:什么是云计算?这是一个被反复提到、反复回答之后,又反复提出的问题,这本身就是一个非常有趣的现象,因为当无线局域网开始流行后,你不会一直听到有人问“什么是无线局域网?”;802.1X(一种二层认证服务,本书第3章将做详细介绍)安全认证广泛部署后,你也不会一直听到有人问“什么是802.1X?”,这说明云计算本身是一个非常抽象的概念,要准确地把握其内涵不是一件容易的事,另一方面,这又表示云计算是有着强大生命力的技术发展方向,否则不会有越来越多的人翻来覆去地尝试弄懂这个问题。下面,就让我们从辨明云计算的真实身份开始,展开云计算网络的旅程吧!

不同人从不同角度解释了云计算的含义,这些解释五花八门,各有各的道理,我觉得要理解一件事物的本质就是要抓住其独有的特征,就好像你描述鲸鱼的时候一定会提到“这是地球上最大的哺乳动物,生活在海洋里”,这样的论述一针见血地说明了鲸鱼的特征,就好像将它的DNA展现出来一样精确。

云计算作为一种独特的IT服务模式,也有其独有的DNA,纵观各方观点,我认为CSA(Cloud Security Alliance——云计算安全联盟)在“Security Guidance For Critical Areas Of Focus In Cloud Computing V3.0”中比较精确地说明了云计算的本质:

 “云计算的本质是一种服务提供模型,通过这种模型可以随时、随地、按需地通过网络访问共享资源池的资源,这个资源池的内容包括计算资源、网络资源、存储资源等,这些资源能够被动态地分配和调整,在不同用户之间灵活地划分。凡是符合这些特征的IT服务都可以称为云计算服务。”

——“Security Guidance For Critical Areas Of Focus In Cloud Computing V3.0”

 

上面的定义很好地说明了云计算的本质。为了将这个定义更方便地匹配到现实世界的IT架构中,NIST(U.S.National Institute of Standards and Technology——美国国家标准与技术学院)提出了一个定义云计算的标准——“NIST Working Definition of Cloud Computing/NIST 800-145”。这个文档中提到一个标准的云计算需要具备五个基本元素,分别是:通过网络分发服务、自助服务、可衡量的服务、资源的灵活调度,以及资源池化。这个标准还提到云计算按照服务类型可以分为IaaS、SaaS和PaaS三类,而按照部署模式可分为公有云、私有云、混合云和社区云四种。NIST提出的云计算架构图“NIST 800-145被业界普遍接受的原因是其提出的云计算五大要素非常简练地说明了一个云计算系统的特征,只有同时具备这五点的IT架构才可以被称为云服务架构,通过这五个特征能够快速地将云计算系统同传统IT系统区分开来,抓住这五点就好像在亲子鉴定中准确地抓住了特征DNA,能够快速地把云计算从庞杂的IT服务类型中提取出来。

1.3 云计算的五大特征

我们先来看一看这五大要素的具体内容,后文再对部署模式和服务模式做介绍。

1.3.1 自助式服务

云计算与传统架构的区别,从用户接触云计算的第一步就体现出来了。用户大多通过自助方式获取服务。例如在WebEx公司推出的在线会议系统中,用户自助挑选会议类型、设定参会人数、上传会议资料,然后点击“确定”即可。WebEx的后台服务器便会在指定时间将与会人员连接到一个虚拟在线会议室中。云服务提供商并不需要人工干预这个流程,所有的细节都是用户自己在网页上选择决定的。用户可以通过WebEx的页面设置丰富的会议选项

自助式服务也是区分简单的B/S架构与真正云计算的一个重要标准,让我们来看一个反面例子,在WebEx出现之前,市场上很早就有很多提供多方语音会议服务的公司,用户只需要购买点卡就可以通过拨打特殊号码进行多方会议甚至多媒体视频会议,这同WebEx的概念非常相似,但在这类会议服务中,如果用户需要从一个普通的多点会议变更成一个能远程控制对方电脑桌面的多人培训时,往往要致电服务提供商,由服务提供商的工作人员人工改变服务类型,甚至重开一个新的服务接入号。而在WebEx系统中,所有这一切用户只需要在网页中简单地点几下鼠标就完成了。以往的会议服务仅仅是将提供多方会议服务的设备从分散的用户机房集中到统一的中心机房,其软硬件设施仍然是僵化的传统架构,无法自动跟上用户需求的快速变更,仍然需要人工干预来完成资源的重新划分和调整,称不上是真正的云计算。

自助式的服务方式充分发挥了云计算后台架构强大的运算能力,同时,用户也获得了更加快捷、高效的体验。

1.3.2 通过网络分发服务

在云计算出现之前,当人们需要使用计算机完成工作时——例如写一本书——都会购买一台计算机。这句话听上去比较可笑,但这就是真实情况,因为我们必须实际接触到这台电脑,才能享受到它提供的服务。

云计算的第二个重要特征就是要打破这种一一对应的关系,因为大量的云计算服务都是通过网络来传递的。

还是以写书为例,当云计算真正普及后,理论上我不需要拥有一台配置完备的PC机,我只需要在iPad上登录Google Docs,就能够进行在线写作。Google Docs提供了绝大部分的电子文档编辑功能,其在线存储功能的可靠性甚至比我自己买一块移动硬盘来保存我的文稿效果还要好。通过Google Docs写作,我不需要新添置计算机,不需要购买Office软件,我需要的只是一条网线,然后就可以通过任何带Web浏览器的设备进行工作了。Google Docs的界面同Office软件非常类似

通过网络分发服务打破了地理位置的限制、打破了硬件部署环境的限制,只要有网络就有计算,革命性地改变了我们使用电脑的习惯。

1.3.3 资源池化

资源池化是个很时髦的名词,它也是由云计算引申出来的概念。在云计算中,计算资源——CPU、存储、网络等等——有了新的组织结构,也就是资源池。所有设备的运算能力都被放到一个池内,再进行统一分配。

如果你觉得这种说法过于抽象,想象一下下面的场景:一个企业内部的开发人员向IT部门申请了一台服务器,这台服务配有一颗Intel X5600 2.4G CPU、32GB内存、500GB硬盘、1Gbps上联链路,虽然IT满足了他的需求,但这台服务器并不真实存在,它也许只是从一台配置为4路CPU、2TB内存、采用集中式存储、配置双路10Gbps网卡的服务器中切割出来的一部分而已。

对于IT部门来说,计算资源不再以单台服务器为单位,云计算打破了服务器机箱的限制,将所有的CPU和内存等资源解放出来,汇集到一起,形成一个个CPU池、内存池、网络池,当用户产生需求时,便从这个池中配置能够满足需求的组合。在传统的IT架构中,这几乎是天方夜谭,上面那个例子中,如果用户请求的服务器配置在机房内正好找不到空闲的设备,那么只有两种选择,要么IT部门新采购一台设备,要么用户修改需求,显然不管是哪一种都会降低效率或增加成本。

资源的池化使得用户不再关心计算资源的物理位置和存在形式,IT部门也得以更加灵活地对资源进行配置。

1.3.4 资源的灵活调度

资源的灵活调度是资源池化的下一步发展。目前广为流行的云计算服务,例如WebEx、Amazon EC2等,都有一个明显的特征,就是云计算服务商总是可以满足用户不断增长的需求。在WebEx平台上,已经有召开过同时上千人参与的全球视频会议,而WebEx表示这个人数仍然没有达到上限。

这就是云计算在资源调度方面的灵活性,由于计算资源已经被池化,因此云计算服务提供商可以非常快速地将新设备添加到这个资源池中,满足不断增长的需求。对于用户来说,这种感觉就好像只要愿意付账单,就可以即时要求无限制的资源。

另一个著名的例子发生在OMGPOP游戏公司,这家公司开发了迅速走红的手机游戏“Draw Something/你画我猜”,在6个星期内,在线用户数从0暴涨到2500万,然后被Zynga以2亿美元闪电收购。通过云计算平台,OMGPOP在这6个星期内高效地扩展了后台系统的容量,从容地应对了2500万用户产生的数据洪流,可以说,没有云计算技术,OMGPOP不可能保证高水平的用户体验,也就不会有后来2亿美元的商业奇迹。OMGPOP的Draw Something游戏在6个星期内取得2500万用户

1.3.5 可衡量的服务

云计算的最后一个特点是对计算资源的衡量。一个完整的云计算平台会对存储、CPU、带宽等资源保持实时跟踪,并将这些信息以可量化的指标反映出来。基于这些指标,云计算平台运营商或管理企业内部私有云的IT部门,能够快速地对后台资源进行调整和优化。

NIST提出的以上这五点非常形象地提炼出不同云计算模式的共性,是蕴藏在云计算系统内的DNA。在绝大部分获得成功的云服务身上,都能轻易找到这五点特征。Amazon AWS的EC2就是一个典型的例子,Amazon EC2的服务全部可以在Amazon AWS的网站上自助开通,用户通过网络获取Amazon EC2的后台计算资源。Amazon EC2支撑了很多从零起步成长起来的大型互联网公司,例如位置签到服务公司Foursquare等。Amazon EC2有一个完善的后台管理系统,能够在不同的数据中心之间调配资源,满足瞬息万变的用户需求,所有这些,将Amazon EC2塑造成一个优秀的成功的云服务提供商,也帮助我们界定出优秀云计算服务的基本模型。

1.4 IaaS/PaaS/SaaS,它们都是什么

前文谈到了云计算的分类方式,在谈论云计算的场合时,PaaS、SaaS和IaaS是常常被提起的热门字眼,它们代表了最基础的云计算服务模式,了解这些模式的特点和区别是进行所有基础架构——包括网络——设计的前提。

虽然云计算的服务模式仍在不断进化,但业界普遍接受将云计算按照服务的提供方式划分为三个大类:SaaS(Software as a Service——软件即服务)、PaaS(Platform as a Service——平台即服务)和IaaS(Infrastructure as a Service——基础架构即服务)。PaaS基于IaaS实现,SaaS的服务层次又在PaaS之上,三者分别面对不同的需求。IaaS提供的是用户直接访问底层计算资源、存储资源和网络资源的能力;PaaS提供的是软件业务运行的环境;SaaS是将软件以服务的形式通过网络传递到客户端。下面分别看看三者的详细定义。三种云计算模式的关系

1.4.1 位于最底层,基础架构即服务——IaaS

IaaS通过虚拟化技术将服务器等计算平台同存储和网络资源打包,通过API接口的形式提供给用户。用户不用再租用机房,不用自己维护服务器和交换机,只需要购买IaaS服务就能够获得这些资源。Amazon是目前最大的IaaS服务提供商之一,Amazon EC2不但包括基本的基础架构环境,还通过自身强大的数据中心为用户提供一定级别的高可用性保障,用户购买Amazon的服务后无需再担心数据中心双活(冗余)、业务数据备份等工作。

1.4.2 IaaS之上,平台即服务——PaaS

PaaS构建在IaaS之上,在基础架构之外还提供了业务软件的运行环境,个人网站常常用到的“虚拟主机”实际就属于PaaS的范畴,个人站长只需要将网站源代码上传到“虚拟主机”的地址,“虚拟主机”会自动运行这些代码生成对应的Web页面。除了形成软件本身运行的环境,PaaS通常还具备相应的存储接口,这些资源可以直接通过FTP等方式调用,用户无需从头进行裸盘的初始化工作。

PaaS面向的用户是没有能力或者不愿意维护一个完整运行环境的开发人员和企事业单位,通过使用PaaS服务,他们可以从繁琐的环境搭建中抽身出来,将更多的精力投入到业务软件的开发中。同IaaS相比,PaaS提供的服务类型更加丰富,因为软件的生态系统本身就呈现百花齐放的状态,且PaaS可以基于IaaS服务搭建,初期的硬件投入较小,所以PaaS服务提供商的数量和种类也较IaaS更多,互联网上比较著名的PaaS包括Google App Engine和Microsoft Azure等。

1.4.3 最上层,软件即服务——SaaS

SaaS是最成熟、知名度最高的云计算服务类型,在云计算真正变得火热之前,软件即服务本身就已经是一个非常流行的概念了。SaaS的目标是将一切业务运行的后台环境放入云端,通过一个瘦客户端——通常是Web浏览器——向最终用户直接提供服务。最终用户按需向云端请求服务,而本地无需维护任何基础架构或软件运行环境。

SaaS同PaaS的区别在于,使用SaaS的不是软件的开发人员,而是软件的最终用户。一个PaaS用户如果通过Web方式向外分发其服务,则其提供的也就是SaaS服务。SaaS诞生多年来,不但发展出成熟的技术模型,而且已经是一个经过验证的成功商业模式,Salesforce.com通过向大企业销售云端CRM服务已经成长为一家年收入超过20亿美元的纳斯达克上市公司。

1.5 各种云——私有云/社区云/公有云/混合云

根据NIST的定义,云计算按照部署模式可以分为私有云、公有云、混合云与社区云四种,不同的部署模式对基础架构提出了不同的要求,在正式进入云计算的网络设计之前,我们有必要弄清几种云计算部署模式之间的区别。私有云是部署在企业内部,服务于内部用户的云计算类型;社区云是由数个有共同利益关系或目标的企业和组织共同构建的云计算业务,其服务面向这几个组织的内部人员;公有云一般是由云服务运营商搭建,面向公众的云计算类型;混合云则是包含了两种以上类型的云计算形式。

1.5.1 私有云

私有云的建设、运营和使用都在某个组织或企业内部完成,其服务的对象被限制在这个组织内部,对外没有公开接口。一个企业的软件开发部门是最有可能部署私有云的场景之一,开发部门需要频繁地在不同的硬件环境中进行软件测试,参考我们之前在“资源池化”中举的例子,通过在测试服务器上部署云平台,开发部门能够在最短的时间内变更服务器配置,从而加快开发流程,而不增加硬件投资。

私有云不对组织外部的用户提供服务,但是私有云的设计、部署与维护可以交由组织外部的第三方完成,也就是说,企业或事业单位在建设自己的私有云系统时,可以充分利用外部咨询公司和系统集成商的能力,不必事必躬亲,将所有工作大包大揽给自己的IT部门。

1.5.2 公有云

与私有云对立的概念就是公有云,公有云也是我们日常接触最多的云服务种类。从Microsoft Office 365到Amazon EC2再到Dropbox,这些著名的云服务都是面向公众的公有云。

公有云通常由一个云服务运营商维护,通过互联网向公众提供服务,任何人都可以申请、使用公有云资源。公有云的受众规模不局限于一地,一旦发布出来,全世界的人都可以通过网络申请使用,因此,公有云的规模一般很大,对可靠性、安全性的要求也更高,其基础架构的组成往往也更加复杂。

1.5.3 社区云

社区云是面向一群有共同目标、利益的用户群体提供服务的云计算类型。社区云的用户可能来自不同的组织或企业,因为共同的需求走到一起,社区云向这些用户提供特定的服务,满足他们的共同需求。

由大学等教育机构维护的教育云就是一个标准的社区云业务,大学和其他高等机构将自身的教育资源放到云平台上,向校内外的用户提供服务。在这个模型中,用户除了在校学生,还可能有在职进修学生、其他科研机构的研究人员等,这些用户来自不同的机构,但因为共同的课程作业或研究课题走到一起。

社区云虽然也面向公众提供服务,但与公有云的区别在于,社区云的目的性更加强,社区云的发起者往往是有着共同目的和利益的机构,而公共云则是面向公众提供特定类型的服务,这个服务可以被用于不同的目的,一般没有限制。所以,社区云的规模通常也比公有云小。

1.5.4 混合云

混合云顾名思义就是两种或两种以上云计算的综合,混合云可以是公有云与私有云的混合,也可以是私有云与社区云的混合。混合云服务的对象非常广泛,包括特定组织内部的成员,以及互联网上的开放受众。混合云架构中有一个统一的接口或管理平面,不同的云计算模式通过这个结构以一致的方式向最终用户提供服务。

同单独的公有云、私有云或社区云相比,混合云具备更大的灵活性和可扩展性,企业在部署云计算时常常面临瞬息万变的需求,混合云在应对需求的快速变化时有无可比拟的优势。

为了更好的理解混合云的概念,我们来看一个具体的例子。Vmware为了完善自身的混合云解决方案,2011年在其云计算管理平台vCloud中添加了vConnector组件,通过这个组件,vSphere的管理员可以在一个vCloud界面内管理企业内部私有云的虚拟机和企业外部的公有云资源,这些公有云资源包括由Verizon、BlueLock和Colt等公司提供的基于VMware vSphere架构的云计算服务。管理人员在统一的vCloud界面中可以直接在公有云和私有云之间调动虚拟机、虚拟程序和软件模板等资源。vConnect可以在单一界面内显示公有云和私有云资源

混合云的出现极大地拓展了云计算的优势,企业用户在私有云能力不足时,能够快速借用外部公有云的资源,从而保证业务不因资源不足而断线。

1.6 云计算的独有优势

相较于传统的IT架构,云计算具备鲜明的特点和独特的优势,正是这些优势使得云计算的概念刺激着大众的眼球,让云计算即使还在襁褓阶段就声名远播。

1.6.1 降低成本

这几乎是所有人对云计算的第一印象,云计算自打出生起就被贴上了高性价比解决方案的标签。更准确地说,云计算不止是一个廉价的选择,还能够让用户更灵活地支配他们的预算。

以前用户搭建一个IT系统的时候需要采购全套的服务器、网络、存储设备,现在有了云计算技术,他可以把所有的软件都放到云端运行,甩掉维护一大堆硬件的麻烦。更妙的是,系统刚上线用户较少时,他可以只租用一个较小的网络出口,随着业务不断成熟,用户可以线性地增加网络带宽,而不会出现购买了一个昂贵的核心交换机,而业务流量迟迟保持在低水平,投入的资金被白白浪费的情况。

让IT资源随着业务需求的增长而增长、减少而减少,这才是云计算优化成本的精髓,用户现在付出的每一分钱都使在了刀刃上,在一个成熟的云计算环境中,不会出现闲置的计算资源,所有的资源都被分配到需要的地方,不多不少。

1.6.2 扩展性

扩展性是另一个云计算常常被人提起的特色,夸张一点说,一旦你将业务放入云计算环境,你就无需再担心带宽不足或存储空间不够这样的问题。

大部分IT工作人员都对以下这种升级流程耳熟能详,隔个两三年进行一次业务评估,找出老化或不足的设备,然后申请预算购买新的软硬件,待申请到预算做完升级后,接下来三年内机房内的设备就不会再有大的变化,万一出现资源不足的情况要重新申请预算采购新设备那真比登天还难,更糟糕的是当初负责设计的人员可能还会被扣上“计划不足、水平不够”的帽子。但是说实话,很多时候连老板都不知道公司两年后是什么情况,区区一个IT运维小兵怎么说得清这两年里需要用到多少块硬盘呢?所以比较常见的情况是,IT部门在做预算时往往按照容量的上限申请,这个上限一般都远远高于实际需求,所以机房内会出现大量闲置的设备。

这显然不是一个合理的状态,但却是常态。其原因是传统的IT架构扩展起来太困难,扩张一次就伤筋动骨,不但要采购大量设备,还涉及到与原有系统的合并,弄不好就要频繁中断业务,你随便抓一个身边做IT运维的朋友,问问他喜不喜欢做系统割接,他一定会瞪着你丢过来一句话“有病吧!”。熬夜割接是每一个IT运维人员的噩梦

在这一点上云计算的优势就非常明显了,通过自助式的服务,用户可以随时随地地添加、减少计算资源,最重要的是这种增减底层资源的做法对上层业务的影响被限制在最小的范围。IT人员无需关心新设备与老系统的互联,无需关心数据往新存储盘柜的迁移,无需关心原来的配置命令在新的服务器上是否可用,无需关心新网卡的驱动是否正确,所有这些让人头疼的麻烦全都没有了,你说棒不棒?反正我觉得好极了!

1.6.3 高可靠性

数据中心的可靠性同投资一般成正比关系,配置了备用电源的机房肯定比普通机房可靠,而在不同的物理地点部署备份机房可以提供的灾难恢复时间一定比单一的数据中心短。每个人都希望得到高可靠的数据服务,但不是每个公司都有能力为数据中心做那么大的投资。

如果你是一间中型服装公司的机房管理员,你所掌管的机房内服务器数量一般在100台以下,很少有老板会为这样规模的IT系统投资两地三中心的备份机制,可是一旦机房瘫痪,你所承担的压力一点也不比那些大企业的IT部门主管小。

云计算为那些没有能力建设高等级灾备设施的用户提供了另一个选择。也许你已经有过这样的经历,历年来周游各地的照片已经积累了几千张,数量有好几个GB,这些照片记录了你生活中最宝贵的时光,保存在什么地方好呢?普通的电脑硬盘和外置硬盘的故障率太高,光盘介质的稳定保存时间只有两三年,而在线相册则不存在这些问题。目前网上有大量的在线相册服务,不但容量几乎无上限,而且只要服务商不倒闭(这个几率比你摔坏移动硬盘的几率要低得多)就能够安全地存放你的照片,即使你自己的设备断电、损坏,这些照片仍然安全地呆在在线服务商的存储空间内。在线相册几乎可以永久保存你的相片

云计算服务供应商拥有高等级的机房设施和完善的备份机制,云计算用户虽然只是用了这其中的一部分资源,但是他得到的服务是一致的。云计算的基础设施虽然部署在用户看不到的地方,但它能提供的高可靠性等级往往比用户自建的机房还要高。

1.6.4 远程访问

在讨论云计算的五大要素时,我们曾指出云计算通过网络向用户提供服务,基于网络的服务方式既是云计算的特点,也是云计算的优势。

互联网经过十多年的发展已经遍布了世界的每一个角落,只要用户可以接入网络,就能够享受云计算服务。通过网络远程分发将极大地改变IT服务的提供方式,以往需要将所有人集中到一起举行的会议,现在参会人员可以分散在世界各地,花费在差旅上的时间更少,用于开展业务的时间更多。

1.6.5 模块化

云计算通常以模块化的方式提供服务,例如用户可以在邮件、CRM、OFFICE等多种服务类型之间自由组合,根据用户自身的情况在适当的时间选择适当的种类和适当容量的云服务内容。

1.6.6 高等级服务

服务质量是云计算另一个独特的优势。一般来说,对外提供大规模云计算业务的公司都拥有较强的技术实力,较之普通企业的IT部门,这些云计算服务商拥有大批经验丰富的技术专家。维持这样一个专家队伍的费用是很高的,如果他们单为一家公司服务,成本会让大多数机构的财务主管们心脏病发作。而云计算服务提供商的专家队伍不是为一个客户服务,他们可以同时为大量的用户提供自己的专业知识,这样平摊到每个用户头上的成本就很低了,而对于最终用户来说,则享受到了以前从来不可能接触到的专业级服务。第2章云与网的关系

前文揭示了云计算的一个重要特征就是通过网络分发服务。从本章开始我们将正式进入云计算网络的世界,探究新一代网络技术在云计算环境中发挥的作用。

同云计算一样,数据网络也是一个非常宽泛的概念,为了便于大家理解,本书以在云计算环境中至关重要的数据中心为基础,将网络分为数据中心内的网络和数据中心外的网络两个部分进行描述。本章将重点介绍这种划分的依据、每部分的具体内容,以及两部分之间的联系。明确地掌握这种划分关系将帮助你建立一个清晰的大局观,这对详细了解每项技术所起的作用大有裨益。除此之外,本书最后几章还将涉及部分新一代网络设备的架构和特点,这些新的产品设计思路同云计算网络的发展紧密相连,将帮助我们更加深入地掌握云网络的技术发展脉络。

2.1 以数据中心为界,云计算网络的外延与内涵

如果你已经读过第一章,就应该了解到数据网络对云计算的重要性,用户只有通过网络才能访问丰富多彩的云服务。网络就是一条连接用户和云计算系统的通道,它的表现直接决定了用户最终体验的好坏。因此深入掌握云计算架构中的网络技术,是参与云计算系统设计的工程技术人员的基本功。

但是学习网络知识并不是一项轻松的任务,我完全可以给那些有志于一探究竟的朋友泼一盆冷水,如果没有恰当的引导和方向,一头扎进网络世界的结果可能是彻底迷失其中,不得其门。不像软件开发、硬件架构等技术,数据网络的内容非常繁杂,不但有林林总总的技术派别,而且还存在不同的维度。

从云计算用户的角度来看,网络只是终端设备同后台架构之间的一团云,或者一条线缆。不过这条线缆可不简单,从网络分层的维度来看,现代数据网络可以从上到下分为应用层、传输层、网络层、数据链路层等等好几个层面;从地理范围的维度来看,网络存在局域网、广域网、城域网等不同类型;而从传输效率的维度来看,还有百兆链路、千兆链路、万兆链路等多种不同速率的链路……每一种分类标准都有其存在的意义,说明了网络对上层业务提供的不同服务类型之间的差异。

看来要说清楚云计算中的网络,首先要拿准方向,找出网络与云计算关系最密切的分类方式,再有针对性地切入,方能达到豁然开朗的效果。对数据网络的划分常常误入歧途

在考虑了多种方式后,我最终决定以数据中心的边缘为界,将网络分为数据中心的外部网络和数据中心的内部网络两部分,以此来组织本书的内容。数据中心是云计算中至关重要的组成部分,托管了云计算中的所有计算资源,用户使用云服务的时候,背后驱动云计算架构的正是数据中心机房内的一台台服务器。

云计算业务对网络的要求在数据中心内外是截然不同的,内部的网络承载的是云计算的核心计算资源,好似连接大脑细胞的神经;而外部网络则将计算行为的结果分发到不同的外部世界,覆盖了更加广泛的区域。如果将云计算比作一个智者,云计算的内部网络就是其思想内涵的一部分,而外部网络则是其深邃思想的无限延伸。数据中心的内部网络和外部网络

2.2 外延——关注用户体验

数据中心的外部网络也就是数据中心出口同最终用户设备之间的网络链路,这条链路的质量直接决定了用户的体验。如果一个云计算业务的内部机制非常完美,但是在传递给用户的过程中出现纰漏,那么所有精妙的设计都将前功尽弃。

为了提供一个良好的用户体验,我们可以从可靠、安全和灵活三个方面考虑外部网络的设计。

2.2.1 可靠的网络

可靠是数据网络设计的基本原则,在云计算环境中,可靠的重要性显得尤为突出。当用户选择云服务的时候,其期望值是云计算能够提供同本地软、硬件类似的服务体验,一条不可靠的网络链路可能引起程序响应缓慢和数据丢失,这显然对加强用户信心没什么帮助。现在非常流行的云点播就是一种对网络可靠性要求非常高的云计算业务,当用户将视频文件上传到云点播服务器上进行解码时,解码完成的图像数据将通过网络传输到用户的电脑屏幕上,如果网络连接很糟糕,你得到的将是一帧一帧跳动的画面时,这个时候你还会有兴趣使用这个服务吗?

网络可靠性的基础是QoS(Quality of Service——网络服务质量保证),指的是数据网络中的一种控制机制,根据不同业务数据的优先级有针对性地分配带宽、缓存等网络资源。当网络资源不足的时候,QoS可以保证优先级高的数据包得到优先处理,从而使对应的上层业务获得更好的网络服务。本书会结合云计算业务的特点,向大家介绍在云计算环境中怎样规划网络QoS,从而搭建一个可靠的远程网络链路。

2.2.2 安全的网络

毫无疑问,网络安全是云计算得以存在的根基,这在第一章中也反复提到了。用户在使用云计算服务时,不可避免会将私有数据上传到数据中心内部进行处理。在从用户设备发送到数据中心的这一段时间内,用户数据将在公用的网络链路上传输,暴露给所有的互联网用户;当数据中心处理完用户数据,相应结果中同样包含了用户的个人信息,要将这个结果返还给用户还要经过这段不安全的链路,另一方面,接受到这个结果的是用户本人,还是其他冒充身份的黑客,这也是一个问题。

因此保证网络链路的安全,也是数据中心外部链路的建设重点。本书将从认证和加密,这两个网络安全建设的层面,来描述怎样杜绝黑客和其他攻击对云计算环境中个人信息的威胁。

2.2.3 灵活的网络

云计算的一个特点是终端用户的广泛性,使用云服务的用户不再局限在PC机前,用户可以用手机登陆云服务,用平板电脑登陆云服务,而这些新的个人电子设备都是通过无线接入网络的,用户的位置是随时变化的。另一方面,云计算数据中心通常基于虚拟化技术搭建,虚拟机的出现使得计算资源不再锁死在一个地方,而是在不同的机柜、甚至不同的数据中心之间漂移。

可见云计算的用户和计算资源都表现出了极大的移动性,而连接两者的网络就必须在不断移动的情况下,将用户的请求和服务器计算的结果准确地送到新的位置。

为了实现这种灵活的网络策略,业界提出了不少新的思路,本书将在第6章集中介绍这些新技术、新架构。

2.3 内涵——关注系统效率,下一代数据中心的网络平台

如果说数据中心外部的网络关注的是用户体验,那么数据中心内部网络的重点则是系统效率。

数据中心内部的网络,又可以简称为数据中心网络,是近年来发展极为迅猛的一个领域,新标准、新架构、新产品层出不穷。由于云计算在软件层面提出了不少创新,创新的计算行为也产生了新的数据流量模型和机房建设模式。网络作为连接数据中机房内所有设备的基础平台,也随之发生变化。

这种变化最开始是被动的,但网络的更新逐渐优化了上层业务的行为,反过来成为数据中心变革的一股动力。其中最有代表性的新技术就是DCB(Data Center Bridge——数据中心以太网标准集),DCB是由制定以太网的标准化组织IEEE(Institute of Electrical and Electronics Engineers——电气与电子工程师协会)开发的面向下一代数据中心的网络标准,同传统以太网相比,DCB在可靠性、效率上有了革命性的变化,使得以太网由一个“尽力而为”的网络链路转变为“不会丢包”的可靠网络。在DCB的基础上,又产生了将以太网数据和FC SAN(Fiber Channel Storage Area Network光纤存储网络)流量合二为一的FCoE(Fiber Channel over Ethernet——基于以太网的光纤存储网络)技术,这极大地改变了机房布线的方式。除此之外,针对虚拟化环境,数据网络也有不少创新,如新的虚拟接入、虚拟网卡等等,这些新技术不仅仅是针对云计算的优化,甚至逐渐开始影响到下一代数据网络的发展方向。

本书在第三篇中将详细介绍具有代表性的新型数据中心网络技术,力求为读者呈现新一代数据中心基础网络架构的全貌。

除了以上提到的网络技术本身的发展,承载这些技术的网络硬件设备近年来在架构和设计思路上也不断创新,本书在第四篇将挑选与数据中心关系密切的网络设备新技术,进行有针对性的介绍。

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载