数据中心虚拟化技术权威指南(txt+pdf+epub+mobi电子书下载)


发布时间:2020-09-23 13:39:40

点击下载

作者:【巴西】Gustavo A. A. Santana

出版社:人民邮电出版社

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

数据中心虚拟化技术权威指南

数据中心虚拟化技术权威指南试读:

前言

“我对学习数据中心技术很感兴趣,应该如何开始呢?”

自从我第一次听到这个问题,我见过很多 IT 专业人士,面对令人晕头转向的数据中心新技术开发,变得不堪重负。从我的角度来看,这种挫折主要是由于试图去理解这个问题,却没有被正确地引入到有关这些复杂的环境的最根本的概念和定义。而这些观点一直是我给他们建议的基础。

然而,随着岁月的流逝,我发现回答这个问题变得更复杂。可以理解的是,这些专业人士的背景也被要求日益多样化,主要是因为数据中心技术在不同的知识领域不断地融合,如网络、存储、应用、服务器、布线以及其他,等等。而令我懊恼的是,我不得不承认,要创建一个对这些技术有效的介绍,将会是一项越来越难完成的任务。

在开发了许多学习方法和定制化培训后,我决定写一本书来挑战自己,这本书将涵盖先进的数据中心技术和它们所依赖的核心概念。从一开始,这些庞杂技术细节让我意识到我是多么接近这个任务,就像编写甲壳虫乐队传记一样。而且这一确切想法启发了我去遵循最佳音乐出版的步骤:我不得不使用一个统一的主题,它可以为这些技术的陈述提供一个坚实的支柱。这对我而言是相当容易的,我的结论是,虚拟化是这个主题。

如今,虚拟化通过以下的技术深深植根于数据中心设备之中,这些技术有:虚拟内存、虚拟网关、VLAN、VRF、虚拟环境、VDC、vPC、VNTag、VPLS、OTV、虚拟的 LUN、VSAN、IVR、NPV、 FCoE、虚拟机、服务配置文件、虚拟联网、虚拟网络服务,等等。所有这些成功的技术都有一个共同的特点: 它们都是用来提供资源优化的。正因如此,学习上述技术为解决以下问题提供了机会。● 传统的数据中心部署及其局限性;● 每项虚拟化技术的好处和它们的行为;● 这些技术所提供的在数据中心设计和架构上的变化。

虚拟化还改变了数据中心环境中的人力配置。从“现实的链条”获得了解放,技术团队能够简化操作任务,并加快新 IT 模式的采用,比如云计算。有了这样一个中心主题,就只剩下一个问题了——如何处理它。目标和方法

本书通过对主要的基础设施虚拟化技术的系统检查,循序渐进地介绍了创新的数据中心技术。书中还特意介绍了基本概念和定义,这也是那些从事现代数据中心设计的专业人士所要求的。

由于主要集中在3个主要的数据中心基础设施领域(网络、存储和服务器),本书既不拘泥于某个单一的产品,也不是作为配置指南。相反,它充分利用了广泛的思科数据中心产品组合(其他来自于思科生态系统合作伙伴和联盟的解决方案)来分析每项虚拟化技术的行为,并提供虚拟化数据中心的架构视角。

除了提供这些领域发展的技术解释外,本书还将通过一系列与以下相关联的主题,探讨每一项虚拟化技术:● 虚拟化分类系统(在第 1 章中介绍),它快速提示读者特定技术

的主要特征;● 一种技术初级读本,它强调这个虚拟化技术所克服的物理挑战;● 该技术的详细分析,包括其特点、可能性、扩展性、结果和影响;● 一个真实世界中使用的案例,演示了所审查技术的“实际作用”。

我坚信,设计和部署必须是互补的过程。因此,本书含有实际的配置案例,这是专门创建用以说明每项虚拟化技术及其在数据中心设计中的适用性。尽管如此,我也包含了一些不常用的拓扑结构,目的是要特别强化本书一直探讨的概念。读者对象

本书提供了针对数据中心虚拟化技术的深入探讨(从概念到实施),适合初学者和经验丰富的 IT 专业人士来阅读。● 具备基本的网络和操作系统的知识,并对现代数据中心设计、部

署和基础设施优化技术感兴趣的读者;● 思科数据中心认证,包括 CCNA 数据中心、CCNP 数据中心以

及 CCIE 数据中心的读者;● 专注于某单一的数据中心技术领域,而且希望能学到一些更广泛

的架构知识,以加速职业发展的专业人士。内容结构

随着互联网带来的信息爆炸,在 21 世纪,教育必须始终为非结构化数据的随机堆积提出替代方案。因此,我特意采用建构主义者的学习理论原则(如系统的分析和概念合成)在整本书中讲述内容。虽然每个章节可以不按照顺序去阅读,但书中所设计的排列是为了提供解释的逻辑顺序,为读者带来一个更受益的学习体验。

尽管博客和微博会发布并提供及时信息更新,本书旨在提供完整的知识体系,并协调章节之间的秩序和关联。

第 1 ~ 17 章以及附录覆盖了以下主题。● 第 1 章,“虚拟化的历史和定义”:这个入门章节呈现了数据中

心环境虚拟化的发展历史,并通过一些说明性的例子,提供了虚

拟化的统一定义。本章也提出了一种分类系统(被称为“虚拟化

分类学”),这将贯穿全书,并迅速向读者推出虚拟化新技术。● 第 2 章,“数据中心网络演进”:使用以太网协议的演变作为画

布,本章主要论及的内容用于传统数据中心的网络拓扑管理,还

讨论了虚拟化能够给这些网络带来的常规优势。● 第 3 章,“网络虚拟化入门”:重点解释了虚拟局域网(VLAN)

和虚拟路由转发(VRF),本章对这些完善的虚拟化技术结构进

行了深入的分析,并阐明本书的方法,揭示隐藏在常识背后的重

要概念。● 第 4 章,“ACE虚拟环境”:本章讨论数据中心中网络服务的重要

性,重点介绍了服务器的负载均衡器。本章提出了当数据中心应

用环境扩张时,虚拟环境可作为增加灵活性和优化硬件资源的重

要工具。● 第 5 章,“即时交换机:虚拟设备环境”:本章详细介绍了虚拟

设备环境( VDC)的创新特点,这也显示了它们在富有挑战性

的数据中心网络方案中的适用性。● 第 6 章,“生成树欺骗”:本章论证了虚拟化技术,如以太网通

道和虚拟端口通道(vPC)技术是如何突破生成树协议的(STP)限制来适应数据中心网络的严格要求。它还引入了一个

两层多路径技术 FabricPath,为替代这些环境中的STP提供了最

安全的路径。● 第 7 章,“带阵列扩展器的虚拟机箱”:阵列扩展器(FEX)构成

了一种在数据中心网络接入层提供布线优化和网络管理整合的虚

拟化技术。本章充分探讨了这项技术的多种方式。● 第 8 章,“两个数据中心的传说”:在地理位置不同的数据中心

站点之间实现两层域扩展,这个经典问题在本章中进行了讨论。

它基于前几章所研究的概念,提供多种不同的虚拟化技术的实践

检验,能够解决这个挑战。● 第 9 章,“存储的演进”:本章探讨了当今数据中心中所使用的

与存储访问技术相关的主要概念。这也解释说明了虚拟化是如何

扎根于存储数据的定义之中。● 第 10 章,“SAN 孤岛”:虚拟存储区域网络(VSAN)可以以一

个简单而优雅的方式来克服光纤通道架构的挑战。本章提出了一

些必备的协议概念,以了解它们是如何应用于真实世界场景的。● 第 11 章,“私密身份”:本章介绍了 3 种虚拟化技术,它们的掩

饰手法有利于数据保护、环境隔离和存储区域网络的扩展性。● 第 12 章,“统一线缆”:融网络和存储虚拟化概念于一体,本章

全面考察了数据中心桥接(DCB)和以太网上的光纤通道(FCoE)所带来的 I/O 整合的细节和优点。● 第 13 章,“服务器的演进”:本章介绍现代服务器架构相关的主

要概念。同时还介绍了服务器虚拟化,并描述了 21 世纪伊始,

它是如何改变数据中心的运行风格的。本章还涉及统一计算的定

义,并解释了其创新的架构原则如何大大简化服务器环境。● 第 14 章,“改变特性”:尽管服务器虚拟化已经帮助实现数据中

心内服务器负载的合理化,但在这些环境中去维护和管理“裸

机”服务器配置仍被视为重大挑战。本章演示了在这些场景中服

务配置文件如何能带来多个服务器虚拟化效益。● 第 15 章,“跨越机架”:本章演示了书中所探讨的技术是如何牢

牢交织在一起的,同时也展示了服务器虚拟化是如何彻底改变网

络的。它通过对 VMware 的 vSwitch、Nexus 1000V 和虚拟机阵

列扩展器(VM-FEX)的分析,提出了虚拟网络概念。● 第 16 章,“移动目标”:虚拟机可以在不同的主机和地点之间迁

移,这种方式也已经改变了网络服务的部署。本章探讨了解决方

案所提供的服务的独特性,如虚拟防火墙(虚拟安全网关 VSG

和 ASA 1000V),虚拟加速器(虚拟广域应用服务 vWAAS),以

及虚拟路由器(CSR 1000V)。同时,还提出了一种特殊的网络

服务——站点选择服务,并介绍了一些解决方案来优化客户端

会话路由,以实现虚拟机漫游。● 第 17 章,“虚拟数据中心和云计算”:本章巩固了贯穿全书的概

念,讨论了 1+1 如何能大于 2,多种虚拟化技术的部署如何创造

出一个完美的“云计算”风暴,以及这种 IT 交付模式是如何影

响数据中心网络的演进。● 附录 A,“思科数据中心产品系列”:为保持本书的重点针对于虚

拟化概念和特征行为,本附录包含所有思科数据中心的产品描

述,在实际部署中会应用到这些技术。● 附录 B,“IOS、NX-OS 和应用控制软件命令行接口基础”:如果

您不习惯于来自不同网络操作系统的命令行界面,本附录会向您

介绍它们最典型的特征和定义。本书中使用的图标第1章虚拟化的历史和定义

坦白地说,虚拟化就是欺骗。

即使我们拒绝相信它,但制假、造假以及伪装正在像创作和创意一样成为我们生活的一部分。事实上,整个艺术和科学专门致力于对感知的操纵。

然而,随着个人计算机的普及,“虚拟化”这个广泛使用的术语已经脱离了其技术本身,成为一种共同语言、流行文化和理念。自20世纪90年代互联网热潮的早期,任何与Web相关的活动均被称为“虚拟”,这已然成为了一种完完全全的老生常谈(或只是懒于写出来)。然而,通过菲利浦•狄克的科幻小说、让•鲍德里亚的后现代主义研究,以及最近的电影(如《黑客帝国》和《盗梦空间》)的影响,模拟现实的概念依然使得我们当前这个谙熟技术的社会为之入迷。

根据牛津英语词典解释,在计算领域范畴内,虚拟是指“物理上并不存在,而是通过软件实现并呈现出来的做法”。因此,相同情况下,可以这样说,一个虚拟元素是某个元素的一种特定的抽象。

抽象或考虑事物独立于其组织或属性的过程,天然就存在于信息技术(Information Technology,IT)之中。实际上,计算机科学中的许多领域都是建立在抽象层之上的。

计算机数据本身就是一个抽象的实体,这是因为它可以代表着任何东西,从家用电器到日常生活。对计算机系统而言,符号和表征是日常操作的原始数据。但作为用户,我们必须添加一个额外的抽象层,来正确解读这些数据的含义。

如果抽象的概念在IT中是如此常见,那又如何解释为什么最近几年人们对虚拟化技术越来越痴迷呢?这种虚拟化趋势在数据中心的硬件核心更是如此。自2005年以来,虚拟化早就深深根植于这些环境的战略发展之中,并且这种痴迷还在持续增长:在2012年国际数据公司(International Data Corporation,IDC)所做的一项调查中,几乎40%的首席信息官(Chief Information Officers,CIO)已经将虚拟化作为他们首要考虑的问题。

因此,这些基础设施都遭到虚拟服务器、虚拟网络、虚拟存储、虚拟设备和其他“虚拟技术”的逆袭,正如这些技术承诺的一样,减少了对现实的束缚。广义而言,这些技术设计为数据中心环境带来了以下好处:● 降低成本,提高资产利用率;● 更稳定和更高的可用性;● 简化操作流程。

考虑到操作运营方面占据了数据中心的绝大部分开支,虚拟化技术被期望能以魔幻的方式工作,在无需对系统以及流程进行全面改造情况下,方便快捷地实现上述好处。

然而,虚拟化可能会带来如下所述的一些问题:● 所有的这些技术是否真的能带来这么多好处?● 什么是虚拟设备?它近乎是一个设备吗?会实现得更好吗?● 所有的虚拟化技术是否都一样?

本书旨在通过对一组统称为“数据中心虚拟化”的技术分析,来回答这些问题。其主要目的是解释如何以及为什么这些技术在数据中心的发展以及架构大变迁中发挥了重大的作用。1.1 数据中心的基本定义

数据中心是这样的一个特殊设施,它被设想用来为一个或多个组织安置、管理和支持那些被认为至关重要的计算资源。一个特别复杂的架构、一个典型的数据中心包含:特殊建筑结构、电源备份结构、冷却系统、专用室(例如入口和电信接入)、设备机柜、结构化布线、网络设备、存储系统、服务器、主机、应用软件、物理安全系统、监控中心,以及许多其他支持系统。所有这些资源及其相互关系均由专门人员(本地或远程)管理。

图 1-1 描述了数据中心物理视图和它的一些主要组件。图1-1 数据中心

图 1-1 描绘了一个单一数据中心机房的情况,而现实世界中的模块数据中心可包括多个类似的跨越不同楼层或建筑物的机房环境。除了大小不同之外,数据中心也可以根据其所支持系统的关键程度,在其基础设施的鲁棒性上发生变化。

为了实现利润的增长,业务对 IT 的依赖越来越强烈,数据中心毫无疑问在过去的十年间已经成为大家关注的焦点。对于公司而言,正如人们预期的一样,所有的数据中心组件正协调工作,以保障以下商业应用具备足够的服务等级协议(Service-Level Agreement,SLA):商业智能(Business Intelligence,BI)、客户关系管理(Customer Relationship Management,CRM)、数据仓库(Data Warehouse,DW)、电子商务、企业资源规划(Enterprise Resource Planning,ERP)、供应链管理(Supply Chain Management,SCM)和其他诸多系统。

不是所有的数据中心都是公司自有的。事实上,数据中心的操作复杂性也促使多家公司已将其系统安置于所指定的运营商数据中心之内。1.1.1 数据中心的演进

在过去六十年间,我们看见数据中心在特征以及用途上都发生了很大变化,演绎了同一时期计算机系统所经历的变革。然而,重要的是,我们发现这些演进已经不同程度地发生于世界各地的各个行业。

图1-2直观地概览了数据中心的演变情况。图1-2 数据中心演变阶段

您可以将数据中心 1.0 阶段视为一份“艺术许可协议”,因为这些设施被简单地称为计算机室。自 20 世纪 50 年代以来机房空间均被用来安装大型系统,这些通常是由 IBM 和其他厂商设计的又大、又特殊的装置,需要更多空间来更好地放置它们的中央处理单元(Central Processing Units,CPU)和外围设备(存储设备、终端、打印机,等等)。

基于庞大的软件体系结构,这些集中的系统需要一个 IT 上更严密的控制,并由此获得较高的资源利用率。

20世纪80年代,随着“客户端 - 服务器”应用模型被越来越多地采用,数据中心 2.0 阶段开始形成。借助个人计算机(Personal Computer,PC)的普及,应用环境开始从大型机向更小的“服务器”平台迁移,并且通过安装在 PC 机上的客户端应用程序来实现访问。

随着 20 世纪 90 年代互联网热潮兴起,计算机资源再次被聚集到互联网数据中心,那时往往需要改造不再使用的大型计算机房。互联网和基于 Web 的应用的发展产生惊涛骇浪,加强了服务器向正确设计的数据中心进一步集中。

就性能预测和软件模块化而言,客户端 - 服务器的模式被纳入到应用协议层之中,在这里每一层都表征了部署专用服务器来执行特定的功能。一个分层应用架构的最有名的例子就是三层模型,其中包括:呈现、应用(或业务逻辑)和数据库服务器。提示:三层应用模型将在第4章中进一步细化。

随着这些设施的局限性日益突出,数据中心进入了3.0阶段。在 20 世纪末以及21世纪初,数据中心的空间和功耗不断趋于饱和,而扩容和部署新设施显然是一个昂贵的解决方案。

矛盾的是,当时 IT 部门发现,数据中心的资源利用率低得令人尴尬。举个例子,2005 年思科IT 的一份研究报告指出:当时服务器和网络设备平均利用率只占其能力的 20%。离散的网络、服务器以及存储资源带来的烟囱式的应用是造成这种局面的根本原因。

为了提高资源的利用率以及促进操作简单化,这个阶段所具备的优化特点是对一系列数据中心项目改造。所有这些举措,大多数均由基础设施合并项目所组成,通过合并项目,实现了一个公司内对大量设备组件、流程甚至基础设施的简化和标准化。

同时,基于先进虚拟化技术的项目也开始得到部署总之,它们的目标是:● 统一架构下环境隔离;● 离散资源聚集形成共享池;● 操作程序简化,最好能使用自动化技术。1.1.2 作业区以及数据中心架构

在一些技术刊物中,只注重纯技术方面的分析,人为因素往往被忽视。虽然这也许是一个可以理解的方法,但是它隐藏了对以下问题的一系列解释:“为什么随着时间的推移,技术 A 替换了技术 B ?”

在我看来,忽视“被称为智人的 IT 组件”智能性,是对数据中心这类极其复杂环境的研究所不能承受的。因此在本书中,您将会看到多次提及人力资源对数据中心设计和部署的影响。即使这有时会受到质疑,但这些决策确实揭露了许多理论和现实之间相当有趣的关联。

数据中心操作人员通过分为高度专业化的技术支持团队,如服务器、存储、网络、应用、布线、 设施,以及其他,等等。随着数据中心的发展,这些团队可以进一步划分,一直到公司的首席执行官(Chief Executive Officer,CEO)可能是两个不同团队的唯一掌管人。

图 1-3 描述了一个真实的数据中心的组织结构,说明了前面提到的的情况。图1-3 数据中心组织注意:这些架构可以根据组织的个体特性以及每个行业的特点

而发生很大变化。

在图 1-3 中,您可以看到数据中心技术是如何在不同的决策领域进行分布的,这里表征为首席信息官(Chief Information Officer,CIO)、首席财务官(Chief Financial Officer,CFO)和首席安全官(Chief Security Officer,CSO)。

然而,数据中心解决方案或许并不像图1-3所示的那样独立工作。事实上,它们是相互依存的。例如:● 每机架的服务器数量取决于电源动力分配设计;● 网络设计必须依据每个机架安装多少服务器以及共提供多少个接

口;● 数据中心网络设备的物理位置会影响结构布线设计;● 线缆可以布在活动地板下;● 活动地板会对冷却系统产生直接影响,而冷却系统通常是消耗电

力最高的。

在数据中心“万物互联”的环境中,一个团队的单独决定可能会损害整个设施。因此,在整合数据中心如何演变过程中,强烈推荐站在端到端角度去考虑。

数据中心架构是这样的一套指令,由它驱动着所有数据中心设施的设计。如果一个数据中心是一座城市的话,数据中心的架构师就相当于城市规划师,按照附近的街道容量(网络)以及公共停车位的数量(存储)来统筹部署建筑(服务器)。同样的专业人员还必须能够处理“社区”之间的差异性,就像大型机和低端服务器一样。

为了避免整个设施被多年前的决定所“绑架”,数据中心架构在未来技术的演进上应该有一个清晰的愿景。所以,它必须清晰地看到不同技术的生命周期。虽然每个周期的持续时间的变化在很大程度上取决于多个因素,如行业和地理。下面所列为我在职业生涯中所发现的各技术平均生命周期。● 建筑:10 ~ 15年。● 布线:7 ~ 10年。● 网络:3 ~ 5 年。● 存储:1 ~ 2 年。● 服务器:6 ~ 18个月。

尽管很少有人羡慕这份工作,但我相信数据中心架构师对于任何组织的 IT 战略而言均是一个关键的职位。考虑到一些数据中心项目可以花费数十亿美元,这种专业职能可以作为一个公司商业目标和 IT 预算之间的主要纽带。

理解数据中心不同技术之间的关系也会影响融合解决方案的发展。因此,一些企业采用数据中心支持图来迎合这些“灰色”领域知识的增长。1.2 数据中心虚拟化起源

本书的主要目标之一就是正确描述那些所谓数据中心虚拟化趋势的技术特征。在最初的研究过程中,通过切身体会,我遇到过各种对虚拟化的单一解答或仅仅单方面的定义,例如:● 虚拟化使得您可以在一台物理机器上运行多个虚拟机,每个虚拟

机跨越多个环境,共享一台物理计算机的资源;● 虚拟化提供了一个“物理到逻辑”的存储设备抽象,它提供了对

复杂的、消耗资源的基础设施和实体的一个简单和一致的表征;● 网络虚拟化指的是叠加在一个共同的物理基础设施之上,逻辑隔

离网络分区。每个分区在逻辑上都是和其他分区相互隔离的,并

且必须表现得像在专用的网络一样,以此来提供私密性、安全性、

独立的策略集、 服务等级甚至路由决策。

尽管一开始有点令人失望,但从技术的角度来看,很容易认识到虚拟化必须放置在一定环境里才具备意义。虚拟化一词本身就是一个通用术语,可以包罗万象,从社会网络到模拟现实。

此外,“真正虚拟化”这一术语对我而言似乎总是一个矛盾。

为了给数据中心虚拟化技术提出一个统一的定义,我决定先分析其关联性。作为对这些言论观察的直接结果,请允许我介绍一些历史上的虚拟化技术,以便更好地说明这种常见行为,而它们在现代的虚拟化解决方案中仍然存在。1.2.1 虚拟内存

存储可以被定义为按照若干时间间隔来保留计算所使用数据的能力。从一开始起,计算机至少部署两个级别的存储。● 主存储器(或主内存):可以直接由 CPU 和访问,通常是易失

性的。● 二级存储器(或辅助内存):它要求一个额外的系统来传输数据

到主存储器之中,通常是非易失性的。根据定义,它会是更大、

更便宜的存储器,但要比主存储器慢。

在20世纪 50 年代,主内存通过磁核直接部署,而辅助内存则是基于磁鼓旋转方式实现。那时,程序员在编写代码时,需要努力使它不会超过主内存大小。有时候,他们不得不使用一个特定的策略将数据转移到辅助内存之中,从而释放主内存空间以满足程序中更多数据的处理。

1959 年,曼彻斯特大学的阿特拉斯团队发明了一种自动机制,解除了程序员对上述存储分配的烦恼。正如其他任何好主意一样,虚拟内存只是基于一个简单的概念:使用辅助内存作为主内存的扩展。

图 1-4 展示了这种虚拟化技术。图1-4 虚拟内存

使用虚拟内存,计算机的 CPU 可以直接访问虚拟内存的一个地址,无需知道它位于主内存或者辅助内存。在这项技术中,虚拟化机制必须执行下列操作:(1)将虚拟内存地址转化为主内存或辅助内存的位置;(2)在这两个存储设备之间转换数据;(3)选择哪些数据将被合理放置在更快的主内存之中。

采用这种做法,一个仿真的主内存呈现给了 CPU,这带来了内存扩展的优势并且增强了程序代码的复用性。

虚拟内存是最新计算机操作系统(如微软 Windows 和 Linux)的一个重要组成部分。常用的虚拟内存方法被称之为分页,这项技术中,被称为页面的同类数据块就是从辅助内存中重新获得的,实现了非连续数据存储。虚拟内存的原理同样适用于“高速缓冲存储器”的创建。提示:计算机存储和内存技术将会分别在第 9 章以及第 13 章

予以更多、更详细的探讨。1.2.2 大型机虚拟化

1972 年,与新的一代的处理器(System/370)一起,IBM官方同时发布了大型机虚拟化解决方案。这个概念是建立在对大型机体系结构进行仿真的基础上,允许一个操作系统被透明地运行在一个虚拟机(Virtual Machine,VM)之上。

图 1-5 进一步说明了这种虚拟化技术的基本概念。图1-5 大型机虚拟化

如图1-5所示,VM/370 操作系统包含一个叫做控制程序(Control Program,CP)的软件组件,也可以称之为超级监督者(hypervisor)。这个软件负责虚拟机的创建、资源共享、设备管理、虚拟存储管理和其他传统的操作系统任务。在这种情况下,每个大型机用户可以通过与会话监控系统(Conversational Monitor System,CMS) 交互,来实现自己的专用处理器仿真。

对于 IBM 而言,当时每一个新处理器发布时,客户总会面临操作系统迁移问题,而虚拟机为此迁移提供了一个解决方案。毕竟,使用这种虚拟化,一台独立的大型机可以同时安装不同版本的操作系统(包括另一个 CP 实例)。

自大型机虚拟化形成以后,这方面虚拟化的努力实际上开始于 8 年前的一种替代方案,称为分时共享技术,其目的也是将昂贵的大型机资源分配给不同用户。总之,分时共享通过挂起当前用户的作业,并在内存中保存其用户状态,然后加载另一个用户状态的方式,为每个用户提供了一个平等的大型机资源的时间片。

分时共享机制可以被认为是一个“陈旧的”虚拟化技术,因为每个用户均会错误地认为他完全控制另外的计算机。然而,与虚拟机截然不同的是,所有用户共享相同的操作系统,不存在不平等的、 不适当的资源分配情况,也不会处于相同的故障域之中。

这两个概念对当前计算机系统界也是非常重要的。如今,分时共享已是多任务操作系统中的基石,虚拟机则是数据中心 3.0 阶段的旗舰技术。1.2.3 热备份路由器协议

在TCP/IP网络架构中,一台主机通常使用一个路由器接口作为其默认网关来将数据包转发到另一个 IP 子网。尽管在一个局域网(Local-Area Network,LAN)中可以部署多台路由器,然而绝大多数的TCP/IP 协议栈只允许为每个主机定义一个默认网关。

上述情况暴露了这种体系下与生俱来的一个单点故障,当含有主机所定义网关 IP 地址的那台路由器产生故障时,流量将会中断。

为了克服这种限制,思科公司在 1998 年创建了一个被称为热备份路由器协议(Hot Standby Router Protocol,HSRP)的解决方案(图 1-6)。

如图1-6所示,HSRP 通过以下过程来提供默认网关的冗余性:● 两台路由器发送 HSRP Hello 消息来表述参数状态,如所配置虚

拟 IP 地址、HSRP 组以及优先级;● 通过这些报文,它们发现并决定哪台路由器应该被选举出为本地

主机提供虚拟 IP 地址(和派生的虚拟MAC 地址)。具备更高优

先级的接口总是当选为活动接口;● 如果活动接口故障,其他 HSRP 路由器就会感知到这种失效,

于是一个新路由器就会来模拟这个相同的虚拟 IP。如果 WAN 接

口失败,路由器也可以降低活动接口的优先级。图1-6 热备份路由器协议

1998 年,HSRP 获得了互联网工程任务组(Internet Engineering Task Force,IETF)的批准,包含在信息注释请求(Request for Comments,RFC)2281 之中。尽管它激发了其他类似的协议,如虚拟路由器冗余协议(Virtual Router Redundancy Protocol,VRRP)以及网关负载均衡协议(Gateway Load Balancing Protocol,GLBP),但 HSRP 依然以两个版本方式——HSRP v1 和 v2——广泛部署于数据中心和校园网络。1.2.4 定义虚拟化

通过前一节介绍的虚拟化技术(虚拟内存、大型机虚拟化以及 HSRP),您可以看到以下相似之处。● 仿真:在所有例子中,均各自仿真了先前存在的资源(主内存,

大型机以及默认网关的 IP 地址)。● 透明:毫无疑问,IT 资源的使用(CPU、大型机用户、TCP/IP

主机)均无法区分是仿真资源还是物理实体。● 好处:与 IT 物理资源(内存扩展、资源优化和高可用性)相比,

这些例子均带来各自的好处。

因此,以使用数据中心基础设施技术为背景,这本书将采用以下的定义: “虚拟化是 IT 资源的透明仿真,为其消费者带来物理形态中无法获得的好处”。正如您将在本书后续的章节中看到,虚拟机基本上可以提供两种不同风格的仿真。● 模拟:假装拥有某些并不存在的特征行为。● 伪装:利用别人的知识,掩饰其真实属性的行为。

另一方面,从单一地址的变更到一个全新逻辑结构的建造,透明在这些技术中有很大差异。同样,受益的范围也是非常多样化的,有时甚至包括原先并没有计划的附带优势。1.2.5 数据中心虚拟化的时间轴

根据现有虚拟化的定义,更容易在相同的群集下归类数据中心基础设施技术。所以,下面的时间表通过一系列的里程碑描述了这个群集的进化对数据中心现状的影响。● 1957 年:分时共享(斯坦福大学)。● 1962 年:虚拟内存(曼彻斯特大学)。● 1972 年:虚拟机(IBM)。● 1984 年:虚拟局域网(贝尔通信研究所)。● 1987 年:独立磁盘冗余阵列(加州大学伯克利分校)。● 1994 年:以太网通道(卡尔帕娜)。● 1996 年:虚拟路由和转发(思科)、逻辑单元号(舒格特联

盟)。● 1997 年:虚拟磁带库(IBM)、异步传输模式上的局域网仿真(Bay 网络以及 Madge 网络)。● 1998 年:热备份路由器协议(思科)。● 1999 年:x86 虚拟化(VMware)。● 2001 年:存储虚拟化(DataCore)和 VMware ESX(VMware)。● 2003 年:防火墙虚拟环境(思科)、虚拟 SAN(思科)、

XEN(剑桥大学)、vMotion(VMware)。● 2004 年:微软虚拟服务器(微软)。● 2005 年:MetroCluster(NetApp),SAN 卷控制器(IBM)和

Invista(EMC)。● 2006 年:服务器负载均衡虚拟环境(思科)、N_Port 标识符虚

拟化(Emulex、IBM、McData)、弹性计算云(亚马逊)。● 2007 年:虚拟交换系统(思科)、KVM(开源)。● 2008 年:FCOE 以太网光纤通道(思科、Emulex、QLogic)、

虚拟设备环境(思科)、Hyper-V(微软)。● 2009 年:vSphere 虚拟基础设施(VMware)、虚拟端口通道(思科)、矩阵扩展器(思科)、统一计算系统(UCS)服务配

置文件、分布式虚拟交换机(VMware)。● 2010 年:重叠传输虚拟化(思科 OTV)、虚拟机阵列扩展器(思科)、VPLEX(EMC)、Open vSwitch(开源)、

FabricPath(思科)、vCloud Director(VMware)、

OpenStack(Rackspace 和 NASA)。● 2011 年:虚拟网络数据通道(思科)、虚拟局域网扩展(VMware、思科、Red Hat、Citrix、其他)、OpenFlow(开放网

络基金会)、思科云智能自动化(思科)。● 2012 年:ASA 1000V(思科)、vCloud 套件(VMware)、思科

OpenStack Edition(思科)、思科开放网络环境(思科)。注意:这个时间轴不是数据中心虚拟化技术的一个详尽清单。

它只是说明了随着时间的推移基础设施虚拟化的发展,以及

与本书内容显著相关的技术。1.3 虚拟化技术分类

虽然正式的定义有助于理解技术之间的相似点,但对某单一技术的分析要求关注它们的不同之处。基于这个意图,本书提出了一个分类系统,旨在协助分析各种虚拟化技术。

在古希腊,分类法的字面意思是“一种布置方法”。通俗而言,分类法为一组元素内的变化和关联提供了一个高层次的视野。

毫无疑问,最著名的分类法是生物学,它基于科学观察到的生物特性,为生物体定义了层次化分组。在现代生物分类法中,每个层次组均给定一个排名,如(从最一般的到最具体的)域(Domain)、界(Kingdom)、门(Phylum)、纲(Class)、目(Order)、科(Family)、属(Genus)以及种(Species)。

因为每个组均可被分割为子组,直到一个物种被完全归类,所以,生物分类法图形上可以以树状形式表示。图 1-7 通过一个当前被认可的“生命之树”小子集举例说明了生物分类机制。

为了简单起见,图 1-7 只是描述了 4 个级别(域、界、门、纲)。从真核生物域(多细胞生物) 以及动物界(动物),展现了如下的 3 个门。● 脊索动物门:所汇集的动物包括那些带有鳃裂、背神经索、脊索,

以及在生命阶段有肛后尾的。其子集包括有哺乳纲、鸟纲和爬行

纲。● 节肢动物门:包括那些带有一个外部骨架、一个分段躯体和多关

节肢的无脊椎动物。昆虫纲、蛛形纲、 唇足纲均属于这个门。● 扁形动物门:双侧不分段的软体动物,无体腔。它们也可以分为

几个子类,如图中所描述的绦虫纲、涡虫纲和吸虫纲。

此外,图 1-7 说明了来自 3 个不同门的动物(鸭、蝴蝶和涡虫)。

除了由分类定义的类型之外,物种可以被进一步按照其他的信息来分类,如地理分布、大小、识别特征和生命周期等。这种分类模型反映出来的特征正如本书所研究的并应用于数据中心虚拟化技术的分组。图1-7 生物分类的例子

从此,每个虚拟化“物种”将会按照以下特征进行分类:● 仿真;● 类型和子类型;● 可扩展性;● 技术领域和子领域;● 优势。

此刻,我相信您已经清楚了仿真的含义(通过它,IT 资源将通过虚拟化而生成)以及优势(虚拟化的好处)。因此,在后续的章节中将接着讨论虚拟化的其他功能特征。1.3.1 虚拟化分类

尽管与生物圈相比虚拟化技术在种类变化上远远不及,但我们的分类系统也可以从层次化分类中受益。在虚拟化技术中,第一层将被简单称为分类和将涉及的物理组件数量和逻辑组件数量之间的比例。

如图 1-8 所示为 3 种类型的虚拟化技术。

在池化虚拟技术中,几个物理组件会同时工作从而组建一个单独的逻辑实体,这些逻辑实体与原来的实体分享其特征。如图 1-8 所示,动物世界里的一个类比是一群鸭子,它们按照更加符合空气动力学的“V”形队伍飞行,增加了效率和单一个体的范围(巧合的是,字母“V”也存在于大多数虚拟化技术的命名之中)。

池化技术可以进一步分为两个子类。● 同构:资源池中的所有组件都是由相似的组件所组成。● 异构:这里,资源池由不同的物理组件所组成,并可以部署某些

层次结构。在这种情况下,虚拟实体必须具有相似性,至少物理

资源池中要有一个。

根据前面章节(“数据中心虚拟化起源”)中的例子所解释,虚拟内存就可以归类为采用异构子类所实现的池化虚拟技术(因为虚拟内存是由两个不同的存储设备所组成,它们是主内存和辅助内存)。图1-8 虚拟化类型

根据定义,在抽象虚拟化技术中,为了创建一个逻辑实体,仿真不会增加或减少物理组件的数量。在这些技术中,一个物理资源创建一个单独的虚拟组件来提供不同的特征,以实现设备或用户交互。如图 1-8 所示,以 Caligomennon(猫头鹰蝶)所使用的模仿为例说明了这些技术,而这些技术也被用作防御其猎食者的一种机制。

关于书中所分析到的全部虚拟化技术,我发现了以下两个抽象子类。● 地址重映射:当只改变地址或标识符时,逻辑设备共享物理实体

的属性。● 结构化:是指一个不共享设备格式的虚拟组件部署其虚拟化。例

如,两个路由器可以通过一个隧道,创建一条虚拟背靠背连接。

按照这种分类法,HSRP 使用了地址重映射子类的方式,部署一个抽象虚拟化。注意:尽管多个路由器接口可以作为同一 HSRP 组的一部

分,但常见的情况是,一个组内只能有一个活动 IP。然

而,以这种分类法,可认为 GLBP(多个网关之间部署负载

平衡)是一种池化虚拟技术。

最后,分区虚拟化技术的特点是采用独立的逻辑分区来模拟物理资源的特点。尽管有点粗略,但图 1-8 中,涡虫类从原始标本中创造了完美的生命副本,其演示了动物界中的镜像行为。

本书分类学将分区技术划分为以下两个类型。● 资源分配型:可以为每一个虚拟分区预留物理资源的资产。● 没有资源分配型:对于每个创建的分区,没有资源控制部署。

回顾前面章节中所讨论的内容,“大型机虚拟化”,IBM 虚拟机毫无疑问符合这个分区虚拟化类型,并且属于资源分配型。1.3.2 虚拟化的可扩展性

与虚拟化技术相关的一大风险是:仿真可以被盲目地接受。我常常见到工程师在虚拟化技术上非常自信,以至于他们已经完全忘记了在设计时考虑其局限性。

为了避免灾难性的情况,强烈建议读者清楚地了解每个虚拟化技术的可扩展性,如:● 可以池化在一起的设备的最大数量;● 每个设备的地址重映射的最大数量;● 分区的最大数量。1.3.3 技术领域

正如动物物种可以定位于一个单独的地理区域,虚拟化技术也可以放置在一个“技术领域”。这些抽象的位置在前面章节中已被简单提到。

在过去的 30 年里,数据中心基础设施虚拟化解决方案附属于 3 个基本领域:服务器、存储和网络。“定位”一个虚拟化技术到这 3 个领域中的其一,会进一步指定可能与它们有直接交互的运营团队。

对于本书中所探讨的虚拟化技术,图 1-9 说明了其技术定位。图1-9 技术领域和虚拟化技术

就像生物物种不知道虚幻的界限一样,图 1-9 描绘的大量技术可能属于一个以上的技术领域。最近的趋势反映出,为了达到操作简化和资源优化的目的,技术整合已经在数据中心中实现。注意:尽管应用虚拟化技术(如Java虚拟机JVM和SAP

Netweaver景观虚拟化管理LVM)也可以在我们的分类系统

提供另一个领域,但它们超出了本书的范围。如图 1-9 所示,

本书的重点是针对基础设施的虚拟化技术。

这一分类系统往前更进一步,可以对每个技术领域内进行子分区内定义。因此,子分区将准确地指明在单一技术领域最常用的组件中,“哪里”正在被执行虚拟化。例如,存储虚拟化可以在以下位置执行。● 存储设备:代表着数据存放的位置。● 主机:代表了能有效检索和保存数据的计算机系统。● 互连:包括主机和存储设备之间的网络或媒介。

在服务器技术中,虚拟化肯定会发生在计算机系统内部。然而在这些设备内,有多个组件可以被有效地部署虚拟化。● 硬件:不依赖于所安装的任何操作系统提供虚拟化。● 操作系统:软件层直接控制服务器硬件,并因此提供了虚拟化特

性。● 应用:虚拟化是通过运行在服务器操作系统之上的一个标准应用

来执行的。提示:服务器的虚拟化将在第 13 章详细讨论。

一般来说,网络虚拟化是在网络设备上执行的(尽管在本书中对于这个陈述有显著例外)。尽管如此,这些虚拟化技术可以分布在网络平面之中,它代表着网络设备中不同的功能组件。

网络虚拟化技术可以聚合、创建或分割一个(或更多)如下平面。● 数据平面:处理穿越两个或两个以上网络接口的流量(穿越数据

包)。负责大部分流入这些设备的数据,它也被称为转发平面。● 控制平面:处理直接送往网络设备本身和起源于其他设备的流

量。例如,来自路由协议的控制数据包,控制数据平面的行为。● 管理平面:运行组件用于设备管理,如命令行界面(command-

line interface,CLI)、简单网络管理协议(Simple Network

Management Protocol,SNMP)。这个平面通常会与第三方软件

交互,可以修改控制平面和数据平面的行为。

图 1-10 描绘了本书所包含用于虚拟化技术的分类领域和分区。图1-10 数据中心虚拟化技术的领域和分区注意:本书将只采用网络平面来为存储网络技术建立分区。这

是因为从存储的角度来看,它们显然与分区互连相对应。此

外,为了简单起见,统一计算系统(Unified Computing

System,UCS)服务配置文件将被归类为服务器虚拟化技

术。1.3.4 分类的例子

下面我将示范这个分类系统是如何开展实际工作的(后文简称为虚拟化分类)。在表 1-1 中,我将使用它来对前一章节“数据中心虚拟化起源”中所描述的技术进行分组。表1-1 根据虚拟化分类学进行虚拟化技术分类虚拟虚拟内存大型机虚拟化HSRP化分类虚拟主内存大型机路由器接口IP地址对象类型池化分区抽象子类异构资源分配地址重映射型取决于硬件可255组,每组中包含一可扩1取决于实现用性以及软件台活动路由器以及一台展性12版本备份路由器技术存储和服务器服务器网络领域主机(存储)硬子领件或操作系统操作系统数据平面域(服务器)内存扩展和代码资源优化和软优势默认网关高可用性的可重用性件兼容性1

阿特拉斯计算机的虚拟内存最初是由16000字的主内存和96000字的辅助存储所组成。2

这些值是参考HSRP v1版本给出的。

显然,这个分类系统并不是对虚拟化技术进行分类唯一的途径。本书中主要是用来对一个技术进行分析之前,为其提供快速的可视化。

然而,作为对这个特别系统的辩护,让我指出一个事实:自瑞典

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载