数据中心系统工程及应用(txt+pdf+epub+mobi电子书下载)


发布时间:2020-06-09 07:28:56

点击下载

作者:康楠

出版社:人民邮电出版社

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

数据中心系统工程及应用

数据中心系统工程及应用试读:

前言

数据中心源自早期电子计算机领域的计算机房,到了1997年我国早期公共数据通信网建成,将数据中心带入了互联网时代,数据中心成为社会信息化和互联网发展的基石。进入2008年,随着网络技术、信息安全技术、存储技术,以及各类应用技术的成熟,数据中心进入了第二个发展时期。2010年伊始,以云计算技术为核心的第三代数据中心时代来临。据IDC 咨询(国际数据公司)最新报告称,云计算将在未来几年内继续影响着整个IT行业的发展进程,预计到2015年的时候,公共云服务市场将由2010年的215亿美元增加到729亿美元。作者认为,随着移动互联网、云计算、信息化的普及发展,数据中心的重要性和基础性地位日益凸显,所蕴涵的新技术发展迅速,需要重新从一个专门学科的角度来诠释。

在本书编写过程中,作者查阅了大量的业务、技术文献资料、咨询报告、标准规范,经总结梳理成10章。本书涵盖了数据中心运营管理方面的服务等级管理、信息安全管理、运行维护、绿色节能、网络技术、建设布局规划、虚拟化技术、产品设计等领域的内容。本书的特点是重点问题突出,具有一定的市场前瞻性,技术性内容均贴近数据中心生产运营的实际情况,图表资料翔实。本书特别适合国内、外数据中心运营企业、电信运营商、行业组织与技术标准机构、高校科研单位的业务、技术、研究人员使用,是专业性较强且通俗易懂的工具书。

本书旨在对高校中未来从事与数据中心相关专业的本科生、研究生,以及目前数据中心运营从业单位的技术、业务人员,全面系统掌握相关理论知识提供参考和帮助。本书可作为高校参考教材和行业培训教材使用。

本书参考和借鉴了大量国内外专家、学者、同行的论文、著作、资料等,从多角度、深层次进行分类研究、分析、提炼,书中不能一一列出其出处,在此一并对行业各界前人们的积累和知识贡献表示衷心的感谢!

由于时间紧张和本人专业水平的局限,书中尚有很多不足之处和未详细阐明的问题,敬请批评指正。作者编写本书的目的在于创新“数据中心系统工程及应用”的学科建设,未来更期待业内专业人士进一步针对数据中心专业研编相关著作,共同推进我国数据中心产业的发展。本书编辑邮箱:liuyang@ ptpress.com.cn。康楠2013年1月于北京西单第1章 数据中心发展概论

随着信息化社会和互联网经济的发展,语音、数据、视频等多网融合应用日益增加,电子商务市场蓬勃发展,企业内部信息应用系统外包,加上3G和智能终端引发的新一轮移动互联网投资热潮等,都促进了对数据中心的市场需求,数据中心业务在全球范围内有了巨大的发展,在国内的迅猛发展更是史无前例。

从信息产业经济的总体发展趋势来看,数据中心的市场前景是巨大的。我国国民经济和社会发展的计划中指出,将对经济结构进行战略性调整,大力推进国民经济和社会信息化,加强信息基础设施建设,以信息化带动工业化,发挥后发优势,实现生产力跨越式发展。这种社会发展趋势从宏观上决定了互联网信息服务业的发展方向。随着互联网用户的迅速增长和企业信息化过程的加速以及电子商务的逐渐成熟,数据中心的发展仍将有极大的市场空间。

据Salomon Smith Barney研究显示,数据中心拥有广阔的市场前景,全球范围内的数据中心的业务量正以 40%的增长速率发展。2011年 10 月,国务院出台《关于加快培育和发展战略性新兴产业的决定》,明确了“十二五”战略规划中云计算在我国发展的必要性,云计算在政策和市场两方面将得到大力推进。据预测,未来 5年我国云计算产业链规模可达7 500亿至10000亿元人民币。面对市场发展,众多的电信服务企业、互联网公司、IT公司迅速崛起,都想来分一杯羹。但对于数据中心运营企业来说,面对市场发展更应注重的是服务竞争力,做好基本服务,如带宽接入、托管空间、供电能力和空调制冷等物理要素,同时能够提供对客户托管服务器的监测、报告和安全管理等增值服务及应用,以及更高层次的解决方案,如网站建设和电子商务等,以特色服务谋求生存之道。1.1 数据中心定义

首先看一下科技企业界曾经描述的关于数据中心的几种定义。维基百科给出的定义是“数据中心是一整套复杂的设施。它不仅仅包括计算机系统和其他与之配套的设备(例如通信和存储系统),还包含冗余的数据通信连接、环境控制设备、监控设备以及各种安全装置”。谷歌在其发布的《The Datacenter as a Computer》一书中,将数据中心解释为“多功能的建筑物,能容纳多个服务器以及通信设备。这些设备被放置在一起是因为它们具有相同的对环境的要求以及物理安全上的需求,并且这样放置便于维护”,而“并不仅仅是一些服务器的集合”。行业中对数据中心的几类定义如下。(1)广义的企业数据中心(Enterprise Data Center,EDC)通常是指在一个由企业自建的物理空间内实现数据信息的集中处理、存储、传输、交换、管理。计算机设备、服务器设备、网络设备、存储设备等通常认为是数据中心机房的关键设备。关键设备运行所需要的环境因素,如供电系统、制冷系统、机柜系统、消防系统、监控系统等通常被认为是关键的物理基础设施。(2)互联网数据中心(Internet Data Center,IDC)是指为互联网内容提供商(ICP)、政府、企业、媒体和各类网站,提供大规模、高质量、安全可靠的专业化服务器托管、空间租用、高速网络带宽接入以及 ASP 应用集成平台支撑等业务。IDC是对入驻(Hosting)企业、商户或网站服务器群托管的场所;是电子商务平台赖以安全运作的基础设施,也是支持企业及其商业联盟(其分销商、供应商、客户等)实施信息服务价值链的平台。(3)云计算数据中心(Cloud computing Data Center,CDC)作为下一代数据中心,是基于“云计算”技术架构为特征,将IT系统和数据中心基础设施合二为一,以崭新的业务模式为使用者提供高性能、低成本、弹性的持续计算能力和存储服务,支持各种不同的企业级信息化应用。云计算数据中心中包括计算资源、存储资源、电力能源、交互能力,以及弹性、负载均衡及虚拟化资源部署方式,而所有的计算、存储资源都是以服务的方式提供的,这种新型服务最大的好处在于合理配置整网络内的资源,提高IT系统能力的利用率,降低成本、节能减排,真正实现数据中心的绿色、集约化。

数据中心必须具备大规模的场地及机房设施,高速可靠的内、外部网络环境,系统化的监控支持手段等一系列数据存放环境条件,还提供对服务器监管、流量监控等网络管理方面的服务能力。基于这一环境,可对外提供依托于Internet的一系列由主机托管到应用外包等不同层次的服务。图 1-1 是位于国家体育场鸟巢西北侧的中国联通奧运数字北京大厦数据中心。图1-1 中国联通奥运数字北京大厦数据中心

数据中心不仅是一个局房设施概念,网络同等重要,它构成了网络基础资源的一部分,是互联网和信息化发展的“基石”,它提供了一种高速、高层级的数据传输和接入服务。当前,数据中心服务更被广大用户所关注,提供综合全面的解决方案,为政府、企业IT管理提供更为专业化的服务,使得用户能够迅速借助网络开展业务,把精力集中在其核心业务策划和网站建设上,而减少IT方面的后顾之忧。数据中心改变了以往互联网的运作和经营模式,使得参加互联网的每一方都能专注其主体业务。1.2 数据中心的发展历程1.2.1 数据中心发展历程

数据中心(Data Center)的根源来自早期计算机领域巨大的计算机房。早期计算机系统体积非常大,本身就需要占用很大的空间,同时运行和维护也都很复杂,需要在一个特殊的环境中运行,因此需要许多电缆连接所有的组件,如标准机架安装设备、高架地板和电缆盘(或安装在屋顶或架空在地板下)。此外,过去的计算机也需要大量的电力,会产生大量的热量,通过专用的计算机房和冷却系统可以对散热效果进行较好的控制。安全也很重要,当时计算机是很昂贵的设备,主要用于军事目的或重要的经济科研领域。因此,对计算机的访问受到了严格的控制。比如在我国石油勘探行业就流传着“玻璃房子”的故事:美国为防止早期从美国进口的计算机被用于军事用途,往往派美国人来管控计算机房,中国人上机还需要得到批准才行。这就是数据中心早期机房的雏形。

1945年,美国生产了第一台全自动电子数字计算机“埃尼阿克”(英文缩写词是ENIAC,即ElectronicNumerical Integrator And Calculator,中文意思是电子数字积分器和计算器)。它是美国奧伯丁武器试验场为了满足计算弹道需要而研制成的。这台计算机1946年2月交付使用,共服役 9年。它采用电子管作为计算机的基本元件,每秒可进行 5000 次加减运算。它使用了18000只电子管、10000只电容、7000只电阻,体积3000立方英尺(1立方英尺=0.028 316 8立方2米),占地170m,重量30t,耗电140~150kW,是一个名副其实的庞然大物。在革命性地开启了人类计算时代的同时,也顺带开启了与之配套的数据中心的建设发展。

事实上,从发明计算机到目前网络盛行的橫跨66年的大时间尺度来看,人类社会的计算方式经历了从集中主机到分散运算再到数据大集中的历程,这个过程当然不是简单的往复的过程。

第一阶段:1945~1971年,计算机器件组成主要以电子管、晶体管为主,体积大、耗电高,主要运用于国防、科学研究等军事或者准军事机构。由于计算消耗的资源过大、成本过高,因此计算的各种资源集中也就是必然的选择。同时,也诞生了与之配套的第一代的数据中心机房。UPS、精密机房专业空调就是在这个阶段诞生的。

第二阶段:1971~1995年,随着大规模集成电路的迅速发展,计算机除了向巨型机方向发展外,更多地朝着小型机和微型机方向快速演进。1971年末,世界上第一台微型计算机在美国旧金山南部的硅谷应运而生,它开创了微型计算机的新时代。在这个阶段,计算的形态总的来说是以分散为主,分散与集中并存。因此,数据中心的形态也就必然是各种小型、中型、大型机房并存的态势,特别是中、小型机房得到了爆炸式的发展。

第三阶段:1995~2009年,互联网的兴起被视为IT行业从发明计算机之后的第二个里程碑。互联网的兴起本质上是对计算资源的优化与整合。而对人类社会分散计算资源的整合是计算发展本身的内在要求与趋势。在这个阶段,计算资源再次集中的过程绝不是对第一阶段的简单复制。典型的特点有两个,一是分散的个体计算资源本身的计算能力急速发展,如摩尔定律和其后的多核技术;二是个体计算资源被互联网整合,而这种整合现在也成了一个关键环节,并不断演进。刀片服务器、高速互联网、IPv6、虚拟化、云计算等均沿着上述思路发展。

第四阶段:2010年以来,数据中心建设的理念在发展中更加趋于成熟和理性,不断地超越原来“机房”的范畴,日益演进为企业内部的支撑平台以及对外运营的业务平台。计算机房在这个阶段呈现出了一种更为独立的新形态——数据中心。数据中心按规模划分为部门级数据中心、企业级数据中心、互联网数据中心以及云计算数据中心等。一个典型的数据中心常常跨多个供应商和多个产品的组件,包括主机设备、数据备份设备、数据存储设备、高可用系统、数据安全系统、数据库系统、基础设施管理平台,等等。

与上述发展相对应的,数据中心的业务经营发展可以粗略划分为3 个阶段,每一阶段服务形态有所不同,但都体现基础设施的特性。

第一阶段主要是场地、电源、网络线路、通信设备等基础电信资源和设施的托管和线路维护服务,多由电信企业提供,客户包括行业、大型企业等。这个阶段被广泛称为主机托管(hosting service)。

第二阶段是 20 世纪 90年代互联网的高速发展带动了网站数量的激增,各种互联网设备如服务器、存储器、交换机、路由器等设备和资源的集中放置,维护需求提高,主机托管、网站托管(web hosting service)是主要业务类型,这个阶段互联网数据中心(IDC)被广泛认可。数据中心服务企业围绕主机托管服务的同时,也提供包括数据存储备份、安全管理、互联网接入等服务,数据中心成为互联网公司和企业客户IT基础设施的核心。

第三阶段的数据中心概念被扩展,大型化、虚拟化、综合化成为服务的主要特征,尤其是云计算技术引入后,数据中心突破了原有的场地出租、线路带宽共享、主机托管维护、应用托管等服务,更注重数据的存储和计算能力的虚拟化、设备维护管理的综合化。新型数据中心采用高性能基础架构,实现资源按需提供服务,并通过规模运营降低能耗。同时,云计算数据中心概念被提出,其本质上还是在数据中心的物理基础设施上,采用虚拟化等云计算技术,提供传统的数据中心业务和各种新型云产品及网络应用服务。

当前,数据中心正处于从第二阶段向第三阶段的转型期,传统电信企业和数据中心企业基于数据中心进行升级,如 AT&T、NTT、中国联通、中国电信、世纪互联等。多家领先的互联网企业,如腾讯、百度、阿里巴巴采用新技术建设大规模的新型数据中心,一方面满足自身业务发展的需要,同时也为第三方和最终用户提供IaaS、PaaS、SaaS 等新型云产品服务。目前,多国政府已经将网络数据与信息资源看成影响国家科技创新和产业发展的战略性资源和核心竞争力,支持海量数据存储和处理的数据中心以及相关技术被提高到国家战略层面进行部署。

从全球范围内看,国际领先的大型电信运营商跟随其大企业客户的商业全球化扩张延伸着数据中心服务范围,这些电信企业在全球多点建设数据中心以提供全球化的服务覆盖,而且业务范畴针对企业的网络应用需求不断拓展。如图1-2所示,AT&T在全球11个国家拥有40个数据中心,NTT公司在全球部署了28个数据中心,而且这个数字目前还在继续扩大。国际上部分领先企业的传统产品(线路、空间出租等)与增值服务(网络安全、数据应用等)收入占比甚至达到1∶9。预计未来几年,随着网站内容的视频化以及移动互联网的快速启动,全球数字内容海量存储和处理需求的提高,以及容灾备份需求的大幅度提升,全球数据中心市场发展将迈上新的发展台阶,市场将呈现出竞争全球化、服务个性化等特征。图1-2 AT&T全球覆盖数据中心托管服务布局数据中心系统工程及应用1.2.2 数据中心功能演进

从功能特征上看,随着技术的发展和应用及对IT认识的深入,数据中心的内涵已经发生了巨大的变化。从功能内涵的发展演进角度,可将数据中心分为4 个大的阶段,即数据存储中心阶段、数据处理中心阶段、数据应用中心阶段和数据运营服务中心阶段。(1)数据存储中心阶段

在数据存储中心阶段,数据中心主要承担的功能是数据存储和管理,在信息化建设早期,用来作为OA 办公应用系统机房或电子文档的集中管理场所。此阶段的典型特征是:

① 数据中心仅仅是便于数据的集中存放和管理。

② 数据单向存储和应用。

③ 救火式的维护。

④ 无新技术的应用。

⑤ 功能比较单一,对整体可用性需求也很低。(2)数据处理中心阶段

在数据处理中心阶段,基于局域网的M RP(Manufacturing Resource Planning,生产制造资源计划)、ERP(Enterprise Resource Planning,企业资源计划),以及其他的行业应用系统开始普遍应用,数据中心开始承担核心计算的功能。此阶段的典型特征是:

① 面向核心计算。

② 数据单项应用。

③ 专门的人员进行集中维护。

④ 关注对计算效率及对运营效率的提高。

⑤ 整体上可用性较低。(3)数据应用中心阶段

在数据应用中心阶段,随着大型企业基于广域网或互联网的应用开始普及,信息资源日益丰富,开始关注挖掘和利用信息资源。组件化技术及平台化技术广泛应用,数据中心承担着核心计算和核心的业务运营支撑,适应灵活的需求变化成为数据中心的主要特征之一,“信息中心”理念显现。此阶段的特征是:

① 面向业务需求,提供可靠的业务支撑。

② 提供单向的信息资源服务。

③ 对系统维护上升到管理的高度,从事后处理到事前预防。

④ 开始关注IT的绩效。

⑤ 要求较高的可用性。(4)数据运营服务中心阶段

当前从现在技术发展趋势分析,基于互联网技术、组件化、平台化的技术将更加广泛地应用。数据中心基础设施的智能化,使得运营借助IT技术实现高度自动化,组织对IT系统依赖性加强。数据中心将承担着核心运营支撑、信息资源服务、核心计算、数据存储和备份,并确保业务可持续性计划实施等。业务运营对数据中心的要求将不仅仅是支持,而是提供持续可靠的服务。在这个阶段,数据中心将演进成为机构的数据运营服务中心。此阶段的特征是:

① 从管理和维护各种信息资源,到运营信息资源,确保价值最大化。

②IT应用随需应变,系统更加柔性;与业务运营融合,很难将业务与IT系统独立分开。

③IT服务管理成为一种标准化的工作,并借助IT技术实现集中的自动化管理。

④ 重点关注IT绩效和IT服务质量。

⑤ 数据中心要求具有极高的可用性。1.3 新一代数据中心的发展趋势1.3.1 全球数据中心发展趋势

2010年以来,全球数据中心市场保持稳步增长。据Gartner预测,市场规模会从2010年的20亿美元提高到2015年的44.6亿美元,年复合增长率为14.3%。据Gartner统计,截止到2010年底,全球的数据中心总量为339万个,这个数字包括为第三方服务的数据中心、企业自建的数据中心,还包括大量企业自用的小型数据机房。其中美国和西欧的数量分别达到了96万和68万,接近全球总量一半。中国约有45.6万个,占全球总量的8%。详见图1-3。图1-3 Gartner统计2010年全球数据中心数量

另据中国IDC圈《2011~2012年中国IDC行业发展研究报告》显示,2011年,全球IDC市场保持平稳增长的趋势,整体市场规模达到 222.6 亿美元,增速为21.5%,详见图 1-4。在云计算、虚拟化以及新型节能技术的推动下,各国 IDC的发展呈现出虚拟化、智能化、绿色化的特征。图1-4 2007~2011年全球数据中心市场规模及增长趋势

全球方面,随着欧美经济的波动及欧美国家对数据中心的调整,预计在未来 5年内,行业资源将从饱和度较高的欧洲地区向新兴地区倾斜,亚太等新兴市场的IDC发展将更快速,未来几年是亚太地区数据中心部署和升级的高增长期。欧美传统数据中心业务市场已经基本饱和,大型电信运营商继续在全球其他区域建设数据中心,以增强企业的全球化服务能力。新建的多为大型云计算数据中心,以提供新型的IaaS、PaaS 等作为发展方向。亚太成为数据中心增长最快的市场,新兴市场包括中国、印度等的数据中心建设速度突出,未来几年亚太有可能成为世界级服务中心。如中国加大了对电信光网络宽带接入的投资力度,促进电信网、广电网和互联网的融合,促进各个社会领域如医疗、智能电网、公共安全网络、教育等,由此带动数据中心大规模设备升级需求和网络容量扩充需求持续增长。中国、印度是大型数据中心经营者关注的新兴地区,各种大型数据中心扩建和新建在亚太多个地区都不鲜见,同时原有数据中心也在进行结构调整和云计算部署。

亚太地区数据中心建设的动力主要来自以下几个方面。一是经济发展带动亚太企业的业务范围扩展,增加了数据中心的需求;二是很多大中型企业转变观念,在进行数据中心升级时开始放弃自建,转而接受大型数据中心提供者的高质量数据中心的外包服务,以满足高密度布设服务器存储和降低能耗的需求;三是近几年日本地震等重大自然灾害让很多企业认识到,通过部署在不同地区的数据中心实施容灾备份的重要性,例如日本很多企业纷纷在日本本土外寻找合适的数据中心。

日本、新加坡、中国香港、澳大利亚是目前亚太数据中心部署量最高的 4 个地区,几乎所有跨国经营服务的企业均在上述地方设立数据中心。AT&T 在亚太地区有9个数据中心,包括一个新加坡超级数据中心,两个在上海,两个在中国香港。新加坡电信公司(Singapore Telecom)在亚太地区有超过 10 个数据中心,分别位于新加坡、中国香港、澳大利亚和日本,该公司从2011年4月开始提供IaaS 服务。据咨询公司BroadGroup的预计,新加坡的商业数据中心从2010年到2015年将增长50%。

Gartner预测未来 2~3年是亚太地区数据中心部署和升级的高增长期,但该公司同时提醒经营者,由于数据中心能力的大幅度提高,未来2~3年内亚太地区也有可能出现数据中心容量的过度供给,市场竞争程度加倍,价格大幅下行压力加大,需谨慎投资。

当前数据中心产业发展呈现出以下几个基本特点。(1)数据中心产业升级带来新的运营模式

传统的数据中心面临转型,当前很多企业是按照20世纪90年代的标准建设的数据中心,在结构的可靠性、能耗和制冷系统方面都不能满足扩展和升级的需要,使得企业面临高能耗和高运营成本问题。一方面,数据中心未来3年继续增加服务器是必然,另一方面,当前数据中心使用率并不饱和。在数据中心升级转型中,美国依然走在前面,艾默生网络能源于2011年8月公布了一项调查的结果表明:在被调查的主要240家数据中心经营者中,绝大多数数据中心都采用了虚拟化,只有8%的数据中心没有对任何服务器进行虚拟化,并且44%的受访者预计其主要数据中心在未来3年会继续增加物理服务器的数量。但同时调查也指出当前数据中心使用率并不饱和,有 65%的数据中心只使用了不到其计算容量的70%,但超过一半(57%)的受访者仍计划未来3年继续增加服务器。

在这种情况下,企业分别采取措施对现有数据中心的运营模式进行改进,而改进过程也是一个升级的过程。很多数据中心运营者和拥有者都开始筹划或者进行数据中心升级计划,但不同企业的策略有所差异。大型企业数据中心升级转型着重于数据中心的容量和能力升级,比如通过虚拟技术实现设施监控、设备跟踪以及散热管理。中型企业缺乏掌握云计算等数据中心升级技术的能力和人才,因此选择合作者来帮助他们进行完善,或者将自有数据中心迁移到有质量保证的第三方数据中心来改善服务。大量中小型企业更倾向于获得标准的数据中心服务来提高业务开展的灵活性,以此降低成本。(2)传统产品统一化、标准化,新型数据中心业务是未来竞争焦点

当前数据中心业务形态发展呈现的一个特征是传统数据中心业务产品和服务的标准化,包括网络带宽、主机托管、网站托管、资源维护管理等。具体来说,这些服务和产品的提供变得很容易,各服务提供商提供的产品和服务在质量、服务能力上差异小,市场充分竞争。而随着大量新型数据中心的建设和投入使用,会有更多的数据中心投放市场,尤其是在提供的网络应用和业务上,企业IT基础设施和IT资源产品标准化程度不断提高。为了转移产品同时带来利润空间的压缩,数据中心经营者必须通过技术升级和建设标准平台来处理大量企业的服务要求,同时开始寻找新的差异化服务和商业模式。因此IaaS、PaaS等云计算相关业务被认为是未来数据中心的核心竞争力,云计算服务成为差异化服务的基础。在云计算领域,很多企业还普遍缺乏云服务相关的工程技术能力和服务经营经验,因此未来几年内将出现技术合作或者结盟提供服务的方式,以弥补一家企业难以独立支撑所有的云计算业务与其他企业竞争。新型的合作模式有可能会改变整个数据中心的市场格局。推动当前数据中心市场竞争局势的还有“新一代”竞争对手的出现,如 Amazon、Google和ISV,他们的出现预示着该行业的格局将完全改变。

下面来看看各国政府促进新型数据中心发展的新政策。(1)美国

2011年初,美国联邦政府首席信息官VivekKundra签署发布《联邦云计算策略》白皮书,包括云计算定义、云计算转移IT基本构架、云计算改变公共信息部门等方面内容。白皮书指出:云计算迁移过程中的决策步骤,分别是选择迁入云服务、有效部署云服务以及管理服务而不是管理资产。白皮书还提出重新把信息技术定义为从资产到服务的思想。

一是引导关闭部分低效率的政府数据中心,以提升美国政府IT基础设施的效率,并减少开支。美国在2011年重新调整其IDC战略计划,美国计划通过整合联邦政府数据中心和应用程序以及采用“云计算优先”政策来重组政府IT架构,计划在2015年之前将目前政府的2 100个数据中心至少削减掉800个,预计每年节省开支30亿美元。据统计,美国联邦政府数据中心最近10年迅速增长,从1998年的432座增长到现在的2 094座。2011年4月初,美国联邦政府表示计划在年底前关闭 137 座数据中心,以便同时开始积极推行下一代数据中心,鼓励各个部门和企业采用云计算技术。这一计划影响到国防部等16个美国联邦政府机构。

二是鼓励建设新型的政府数据中心。美国联邦政府2012年财政预算显示,在联邦政府每年800亿美元的IT项目支出中,25%的份额(约200亿美元)用于云计算。美国联邦政府各部门必须在18个月内作出本部门完成云计算迁移的具体部署。美国联邦政府机构以及各地方政府正在探讨在电子邮件系统、文档共享等方面部署云计算服务,对Google云模式比较有兴趣。美国国家安全局将在犹他州建立一个占地面积为100 万平方英尺(1 平方英尺=0.09290304平方米)的数据中心,这将成为美国国家安全局的第三个数据中心。这一资金来自于《美国复苏与再投资法案》下政府提供用于宽带基础建设的72亿美元。

三是资金的直接支持。2011年7月,技术美国贸易集团的教育分支——技术美国基金会(TechAmerica Foundation)表示将通过帮助私人企业制定云安全标准并鼓励云供应商之间实现数据可转移性来推动云计算市场的发展。同时将推动美国政府提高基于云服务的应用,以起到带头示范作用,并通过修补采购和预算流程来鼓励机构购买云服务。(2)欧盟

欧洲的数据中心起步较早,2010年市场规模约为33 亿欧元。但由于土地租赁费用等固定成本的昂贵,数据中心进一步扩张的动力不足。欧盟于2010年正式开始启动下一代数据中心研究项目框架组,并积极倡导面向未来互联网的数据中心研究,2011年初提供价值2 140万美元的资助给IBM 与15个欧洲合作伙伴启动一项联合研究项目,包括标准组织、电信、医疗和媒体行业的企业一起开发一种基于目标的、标准化的“智能云”存储架构。该项目被命名为:Vision Cloud面向未来互联网的虚拟化存储服务,项目由IBM 在以色列海法的研究机构主导。

欧洲的主要数据中心市场是英国,其次是德国、法国、西班牙、意大利和荷兰。2010年,欧美成功运营的电信大楼Telehouse投资8000万英镑的新旗舰数据中心正式开放,占地16万平方英尺,是伦敦新数据中心中占地空间第一大的设施,能够提供连接到超过400个运营商和互联网交换中心。微软将斥资 5 亿美元在爱尔兰首都都柏林建立其第一个欧洲数据中心,用来支持欧洲、中东、非洲日益激增的基于网络的音视频需求。

与此相对应的是,欧洲市场数据中心的价格,在2011~2015年将平均增长14%,例如服务器虚拟化和冷却方面,都会令数据中心成本上升。(3)亚洲

韩国政府于2009年12月公布《云计算全面振兴计划》,旨在2014年前使韩国成为世界最高水准的云计算强国。一方面,政府在政务办公方面推进云计算升级,2011年具体的措施包括将电子政府中使用的1 970台利用率较低的服务器虚拟化,并在2012年前置换为高性能服务器。另一方面,为避免企业为开发环境进行投资造成浪费,将由行政安全部主导,在2011年1月开设政府通用云计算中心。针对政府委托的韩国国内企业进行云计算服务的开发项目,政府通用云计算中心将借给其开发与测试所需的云计算资源。

日本经济产业省于2010年8月发布了《云计算与日本竞争力研究》报告,报告称将从完善基础设施建设、改善制度、鼓励创新这 3 方面来推进云计算技术的发展。日本计划在2020年前培育出累计规模超过 40 万亿日元的新市场。具体包括在云计算平台上,基于传感器信息采集技术,挖掘新的需求、创造新的服务;通过扩大远程办公,提升生产力与工作参与度,实现 GDP 助长 0.3%;通过在交通领域引进实时智能管控系统,改善能源使用效率,实现相对于1990年7%的CO减排。为此,日本政府推进国内在更多地区搭建数据中心。同2时,通过云计算技术,提升数据中心的节能环保指标(Datacenter Performance Per Energy,DPPE)及稳定性。同时提出保障措施,包括放松对异地数据存储、服务外包的管制,在充分考虑个人信息匿名化与信息安全的基础上,完善信息使用与传播的规章制度;制定数字化教材等电子出版物的可重复使用制度。

新加坡设有专门针对云计算的计划,但为达到iGov2010计划中关于电子政府的目标,政府也在推进云计算技术的运用。2011年初,新加坡制定了一整套绿色数据中心标准,以帮助数据中心制定必要政策、体系和程序,来提升其能效、降低对环境的影响。由新加坡信息技术标准委员会(ITSC)、新加坡资讯通信发展管理局(IDA)与新加坡标新局(SPRING Singapore)共同制定的《新加坡绿色数据中心标准-能源与环境管理体系(SS564:2010)》是一个认证管理体系,它为数据中心实现节能提供了框架和方法。它是在“计划—执行—检查—行动”(PDCA)持续改进框架基础上,根据现有的国际管理体系标准制定的。新加坡标准还包括用于衡量和跟踪数据中心节能表现,并确定潜在改进方面的建议标准。借助这些标准,数据中心能够采用最佳方法管理他们的电气系统、IT设备和进行数据中心设计。(4)中国

随着国家对战略性新兴产业的重视,对云计算、下一代网络的积极推进,我国数据中心市场迎来了前所未有的发展机遇。根据中国 IDC圈统计,2011年中国 IDC市场规模达到170.8亿元,同比增长67.1%,详见图1-5。增长率持续上升的原因主要来自于资源能力的扩张和增值业务的快速增长。截止到2010年底,我国有跨省经营数据中心企业17户,实现业务收入增长和盈利的企业超过 90%。数据中心市场投资需求非常活跃,是民营资本最关注的电信行业投资领域,外资机构和企业也有较强投资意向,并已经通过为行业或者大型企业建设维护等方式进入市场。数据中心的业务形态从传统的基础业务,如主机租用、服务器托管、线路出租等转向增值业务,包括提供CDN、VPN、网络安全服务、通信服务和网络应用等。图1-5 2006~2011年中国IDC市场规模及增长趋势

物联网、三网融合、网络视频、两化融合、云计算等新技术、新需求极大地推动了我国数据中心市场的需求增长,另一方面基于移动互联网的应用发展迅速,SNS、电子商务等业务的大规模增长也给数据中心带来了持续的使用需求。基于云计算的数据中心建设进一步推进,并成为不少政府园区关注引进的重点项目。电信运营商和地方政府投资建设的大型数据中心也将引发数据中心产业的重构和利益格局的改变。1.3.2 数据中心最新技术发展趋势

新一代数据中心是目前业界的热点,业界主流厂商正针对新一代数据中心提出局部或者整体的解决方案。例如,IBM 推出的“新一代数据中心”业务;惠普称之为“绿色数据中心”或者“下一代数据中心”;DELL 也联合EM ERSON 在业界推广绿色数据中心的解决方案,SUN 知名的Blackbox计划,也就是Sun Modular Datacenter(虚拟化和模块化的数据中心);华为所倡导的USC(Unified Subscriber Center)解决方案,即创新的融合用户数据中心解决方案;思科公司推出的统一计算通信系统(UCS)解决方案(如图1-6所示)等。图1-6 思科公司UCS刀片式服务器

所谓“新一代数据中心”的定义,就是通过采用自动化、资源整合与管理、虚拟化、安全以及能源管理等新技术,解决目前数据中心普遍存在的成本快速增加、资源管理日益复杂、信息安全等方面的严峻挑战,以及能源危机等尖锐的问题,从而打造与行业、企业业务发展相适应的新一代数据中心基础设施。倡导“节能、高效、简化管理”的理念已经成为众多数据中心建设时参考的原则。其技术发展趋势和特征有以下6个方面。(1)数据集中

无论是出于IT成本过高、复杂性过大,还是资源利用率过低等原因,目前几乎所有类型的公司都在尝试将IT资源进行整合和集中,这其中当然也包括了数据中心的整合。集中化的数据更便于备份、冗余和控制。所谓整合,就是将数十个数据中心整合到少数几个中央位置,然后重点在网络、冗余、计算、存储和管理等几个方面加强这少数几个中央数据中心的能力。这一趋势将对很多IT技术和应用产生巨大影响。如数据和应用将越来越多地通过广域网传递给远程用户,由此对广域网架构和管理也产生了影响。而通过 Web、客户机-服务器协议或瘦客户机来提供集中化的应用将成为一种标准,这样将更加便于管理、更新,以及安装补丁来防御安全隐患。(2)安全与可信

安全性并不单指防火墙、IPS/IDS、入侵检测以及防病毒等安全防范措施。实际上,火灾、飓风和其他灾害能在任何时候袭击数据中心。在数据中心建设的初始阶段就应该构建可靠的灾难恢复方案,或建立异地的灾难备份中心,这是当前数据中心建设中需要重视的一大热点问题。在一项调查中显示,约一半的被调查者正在通过重新利用现有数据中心,或构建新设施整合现有数据中心的方式来建立辅助数据中心,以便获得灾难恢复能力,以此保证业务连续性。(3)计算与存储虚拟化

通过虚拟化进行数据中心资源整合是数据中心的发展趋势。数据中心虚拟化正在势不可当地迅猛发展。据IDC(国际数据公司)报告显示,截至2009年,超过50%的新购x86服务器都将默认进行虚拟化。虚拟化分为存储虚拟化和计算虚拟化。存储虚拟化发生在两个层次:块存储(block storage)和文件存储(file storage)。虚拟存储能将不同的物理存储架构作为一个单一的虚拟存储池。计算虚拟化也处于快速发展时期。一些领先的企业已经开发了跨平台的服务器虚拟化软件,允许数据中心的管理者聚集或分隔服务器计算服务。一个物理服务器既能提供多个虚拟服务器的服务,也能被整合到服务器组作为一个单一的虚拟服务器提供服务。虚拟化技术能够改善IT资源的再利用和提高灵活性,以适应不断变化的需求和工作量;同自动化技术以及策略管理一起使用,资源的效率将得到极大的改善;灵活性将成为根据需要自动调整的功能,服务将能够从整体上进行管理以保证高水平的弹性。(4)绿色节能

绿色数据中心在机械、照明、用电和计算机系统等方面的设计为的是最大限度地提升能源利用效率和尽可能减小对环境造成的污染和影响。建设和运行一个绿色数据中心需要采用先进的技术和设计思路。目前IT设备的能源消耗,只占整个数据中心能耗的30%,而制冷、配电设备的能源消耗要占到 50%~60%,其他如灯光照明占到 10%。快速的能源增长给数据中心在环境控制、电源与冷却、空间管理等方面造成了巨大的压力。此外,在多数情况下,不动产折旧成本上的因素也限制了IT占地面积的扩展(服务器机架占用的地面空间)。因此,业界都力求在低密度机架和发热量及功耗极高的高密度机架之间寻求一种平衡。(5)流程自动化

在不需要大幅增长预算和人力的情况下,管理好数据中心资源的快速增长,是数据中心管理者共同面临的严峻挑战。虚拟化可在一定程度上控制这种增长,但虚拟化还会增加管理和自动化工具上的要求。实现IT管理流程自动化,是降低数据中心IT操作成本和复杂性的一个关键目标。(6)快速便捷部署

如何更加快速部署应用软件,为业务系统提供支持,提升行业、企业的竞争实力,也是目前数据中心建设中非常关注的问题。构建信息系统本身不是目的,目的是为业务提供支撑。在如今的IT技术发展环境下,为每一个应用单独开发业务应用系统的模式,显然已经不能够满足业务快速发展的需求,因此信息系统的自适应能力以及自动化的水平,已成为迫在眉睫需要解决的问题。第2章 数据中心服务质量管理

为规范数据中心服务标准,针对不同客户群提供差异化服务,促进效益的提升,真正实行“优质优价”,按照地理位置、硬件设施、网络条件、服务水平、人员配备等因素,可将数据中心分为五星级、四星级、三星级、二星级、一星级 5 个服务等级。星级标准体系的建立充分吸取了国际上星级制度的成功经验,以星(★)的多少来标定一家数据中心机房的硬件档次和服务水平,既巧妙地避开了各国语言文字不同的障碍,而且可以使客户一目了然地对数据中心机房的各方面有一个全面的了解。因此星级制度在数据中心行业发展过程中越来越为社会所接受,成为较全面的考核评价体系。2.1 等级设置原则2.1.1 数据中心服务等级设置的基本原则

在等级设置时,根据数据中心机房的软硬件设施和人员配置情况,以及由此产生的服务水平差异,每个等级的产品可以是一处独立的机房,也可以是机房的一部分。各等级的划分条件和特点如下。(1)五星级数据中心代表最高服务水平,通过严格的专业标准认证,提供全业务服务,价格及服务体系在国内处于领先水平。可作为对数据安全有严格要求的政府部门、金融企业、外资企业等重点客户的数据(灾备)中心。(2)四星级数据中心主要面向政府机关、大型企业、知名ISP(互联网接入服务商)/ICP(互联网信息服务商),提供高质量的服务和优先保证的资源,价格高于市场平均水平。(3)三星级数据中心主要面向中小型企业、ISP/ICP,提供较好的产品服务,价格处于市场平均水平。(4)二星级数据中心提供基础业务和一般性服务,能够满足客户的一般业务需求,价格可略低于市场平均水平。(5)一星级数据中心主要面向零散客户,价格较低。

不同等级的数据中心对应相应地区的资费档次标准。2.1.2 数据中心需具备的基本条件

应符合数据中心机房的建设规范,具备并符合机房功能、机房建筑、机房环境、供电系统、空调系统、布线系统、网络系统、KVM 系统、网管系统、网络安全系统、数据存储备份系统等基本条件。典型数据中心机房如图2-1所示。图2-1 中国联通高端数据中心机房内部图1.机房功能

数据中心机房按功能划分为:客户接待室(区)、客户操作室、监控室、核心设备区、普通客户托管区、VIP客户托管区、客户测试室、大客户休息室,其中前5个功能区是不可缺少的部分,其他分区可根据需要设置。此外,还有支撑功能分区,如电池室、UPS室、油机室、高压室、低压室、钢瓶间等。2.机房建筑条件

数据中心机房应设置在交通通信方便、配套设施齐全、安全可靠、自然环境清洁的地点。建筑抗震性强,防雷击、能防御重大洪涝灾害。22地面荷载能力为6~10kN/m(UPS室地面荷载能力为16kN/m)。机房设备区(核心机房、普通客户托管区、VIP客户托管区、电源室)必须采用气体消防系统,并具有完整的消防警示、紧急撤离通道和疏散指示。3.机房环境条件

数据中心机房应在明显处设置服务等级的标识。机房装饰风格简洁明快,装修严禁采用易燃材料,地板应具有良好的防静电、防老化、耐火及防龟裂性能。分区之间采用钢笼或其他轻质材料分隔,不阻碍空调系统的空气循环。VIP 机房在服从机房整体规划和装饰风格的条件下,可根据客户的要求进行个性化装饰。

机房应具有独立的出入口。机房不同的功能分区入口处应设置门禁系统,根据工作人员身份设置权限,在系统中保存出入记录。机房外应有保安人员或门卫 24h 值班,机房应设置全方位实时图像监控系统,定期保存图像记录。

数据中心机房应采用上走线方式,机房应设置上走线架和光纤尾纤专用线槽,交流电缆、直流电缆、信号电缆严禁交叉混走,应有清晰标识。机房内主要走道宽度≥1.5m,次要走道宽度≥0.8m,机架列间间距≥1.0m。机房内应设置包含供电系统、网络组织、管理制度、服务人员名录等内容的图板。4.供电系统

数据中心机房应具有稳定可靠的市电保障,市电引入等级不低于二类。应配置性能可靠的柴油发电机。(1)直流电源供电的质量指标

直流电源电压变动范围,脉动电压和全程最大允许压降应符合表2-1要求。表2-1 直流电源供电的质量指标参照表注:① -48V 电压的离散频率杂音电压允许值即有效值。a.3.4~150kHz,≤5mV 有效值;b.150~200kHz,≤3mV 有效值;c.200~500kHz,≤2mV 有效值;d.500kHz~30M Hz,≤1mV 有效值。② 此项针对带尾电池的-24V 电源供电系统。

直流供电回路接头压降(直流配电屏以外的接头)应符合下列要求,或温升不超过50℃。

1000A 以下,每百安培≤5mV。

1000A 以上,每百安培≤3mV。(2)交流电源供电的质量指标

交流市电电源供电标准应符合表2-2的要求。表2-2 交流市电电源供电标准参照表(3)交流油机电源供电的质量指标

交流油机电源供电标准应符合表2-3的要求。表2-3 交流油机电源供电标准参照表说明:三相供电电压不平衡度不大于4%,电压波形正弦畸变率不大于5%。5.空调系统

机房温度变化范围为18~25℃,湿度变化范围为40%~70%,室内空气每小时循环次数≥30~60次。机房内灰尘粒子应为非导电、非导磁及无腐蚀的粒子。核心网络机房和数据机房必须采用恒温恒湿机房专用空调,其他机房宜采用舒适型空调。空调的供电系统应具有和设备电源同等的重要性和可靠性。6.网络系统

数据中心核心网络设备必须保证冗余性,采用双归链路上行;网络设备需支持端口限速功能、端口汇聚功能、基于SNMP 协议的端口管理、基本QoS 功能、接口卡热插拔等。

维护人员应7×24h实时监测数据中心网络设备运行情况,做到及时检修、及时发现故障、及时汇报,遇到重大故障按照上报流程及时报告,及时排除故障。7.布线系统

在数据中心各功能区统一设置综合布线系统。综合布线系统应采用双星型拓扑结构,该结构下的每个分支子系统都是相对独立的单元,对每个分支单元系统改动都不影响其他子系统。综合布线系统选用的电缆、光缆、各种连接电缆、跳线,以及配线设备等所有硬件设施,均应符合标准规定,布线整齐、规范、编号统一。8.KVM系统

网络原则上需设置KVM系统,但不对所有机房做硬性要求。采用KVM切换设备组成客户主机切换管理系统,达到对托管机房内各台主机的管理,并提供相互独立的客户操作区域。所有的客户可以互不干扰地使用设备管理菜单,方便地操作自身的任意一台设备,并可循环扫描自身的所有设备。9.网管系统

数据中心须有一个功能完善的网络运营支持系统,其功能包括:库存管理、IP地址管理、业务管理、客户管理、故障管理、网络集中监视、流量流向监控分析、网络统计报表等。网络管理系统支持多种操作平台,并能够与多种通用网管平台集成,实现从设备级到网络级全方位的网络管理,支持企业网络和运营商网络。10.网络安全系统

数据中心系统核心网络要求有充分的安全措施,以保障网络服务的可用性和网络信息的完整性。数据中心网络安全至少覆盖防火墙、入侵检测、防范 DDoS 攻击、病毒防范、漏洞扫描、管理安全服务等。11.数据存储备份系统

数据中心原则上需设置数据存储备份系统,为有需求的用户提供备份磁盘空间。数据中心宜采用SAN(Storage AreaNetworking)模式建设数据存储备份系统。12.网络设备和配套设备的维护项目和维护周期

数据中心维护人员应定期巡视机房,对机房环境、温度、湿度、设备运行等进行登记和监视。维护人员对机房内的设施、设备及工具负有管理责任,在巡视检查机房时,应对机房内通信设备、用户设备认真检查,发现问题及时与相关人员联系处理。2.2 各星级服务的参考标准2.2.1 五星级数据中心标准

五星级数据中心除满足2.1.2节的全部要求外,还应满足以下几方面的要求。1.认证条件

数据中心机房通过ISO27001标准认证(或其他同级标准认证)。2.机房条件

机房位于城市中心城区内,交通便利(专门作为灾备中心的数据2中心可位于其他交通方便的地区);机房托管面积≥5000m,机房地2面荷载能力≥10kN/m,室内净高≥3.2m;位于2楼及2楼以上的机房应具有客梯和货梯,货梯载重量≥2.0t;具有核心机房、电源机房、托管机房、监控室、接待区、客户操作室、客户测试室、客户休息室等功能分区;7×24h保安巡逻服务,具有完善的入室登记制度;7×24h视频监控系统,监控录像保存时间≥3个月;机房设置门禁系统,门禁记录保存时间≥1年。3.电源空调

市电引入等级:一类市电;油机配置:n台主用机组;UPS电源:(从两套 1+1 并机UPS电源系统)双路电源引入;电池后备时间≥1h;接地和过电压保护系统设置完善。

机房温度变化范围为21~25℃,湿度变化范围为40%~70%,空调系统具有备用机组。电源及空调节能要求达到绿色环保指标要求。4.数据网络

所在城市具有国际出口网络接入,便捷发展国际业务的条件,数据中心出口直连骨干网、省网或城域网核心层节点,出口带宽≥40Gbit/s;网络设备和线路全部采用冗余配置;具有支持本机房所有设备接入的数字式 KVM 系统;具有包括防火墙、漏洞扫描、DDoS防范、入侵检测、病毒防范、管理安全服务等功能在内的数据中心网络安全系统;具有功能完善的数据中心网络管理系统、网络流量流向分析系统。5.运行维护

拥有高素质的专业维护力量,具有行业内 CCIE(CCNP、CCNA)以及同等级资格认证人员;具有向客户提供所有代理维护和增值服务的能力,能够为客户提供网络安全、数据应用、运行维护等增值服务不少于10种,如流量监测、流量清洗、网络安全、内容加速服务、网络建站服务、网络(系统主机)监测、KVM 远程管理等增值产品服务;具有完善的运行监控设备和监控体系;具有运行日志记录制度,日志保存时间≥1年;具有标准化维护操作流程;具有设备、电路及软件系统定期检测维护制度,对性能不满足需要的设备及材料及时进行更换。6.客户服务

设有专职的客户经理和技术支撑工程师;市场及客户服务人员应了解数据中心的基本构成和技术原理;具有完善的市场和客户服务管理制度;建立完善的标准化业务处理流程;合同签订后 3 个工作日内,为客户开通数据中心业务及数据中心内部网络线路(重要客户开通时限为1 个工作日);定期回访客户,了解客户对数据中心产品的需求和建议,月访问率100%;设置客户服务热线电话,提供7×24h客户服务;具有故障处理制度和标准作业流程,在客户设备出现故障时,为客户提供紧急故障恢复所需要的服务和资源;具有客户服务质量定期分析和流程改进制度;每月客户满意率≥99%,客户投诉处理满意率100%。2.2.2 四星级数据中心标准

四星级数据中心标准除满足2.1.2节的要求外,还应满足以下几方面的要求。1.机房条件2

机房位于城区内,交通便利;机房托管面积≥3000m,机房地面2荷载能力≥8kN/m,室内净高≥3.2m;设在3楼以上的机房具有客梯和货梯,货梯载重量≥2.0t;具有核心机房、电源机房、托管机房、监控室、接待区、客户操作室、客户测试室、客户休息室等功能分区;7×24h保安巡逻服务,具有完善的入室登记制度;7×24h视频监控系统,监控录像保存时间≥2个月;机房设置门禁系统,门禁记录保存时间≥1年。2.电源空调

市电引入等级:一类市电;油机配置:n台主用机组;UPS电源:(从同一套1+1 并机UPS电源系统)双路电源引入;电池后备时间:单机后备≥1h;接地和过电压保护系统设置完善;机房温度变化范围为21~25℃,湿度变化范围为40%~70%,空调系统具有备用机组。电源及空调节能要求达到绿色环保指标要求。3.数据网络

数据中心出口接入省网或城域网核心层节点,出口带宽≥20Gbit/s;网络设备和线路全部采用冗余配置;具有数字式 KVM 系统;具有包括防火墙、漏洞扫描、入侵检测、病毒防范功能在内的数据中心网络安全系统;具有功能完善的网络管理系统。4.运行维护

拥有高素质的专业维护力量,具有行业内 CCIE(CCNP、CCNA)以及同等级资格认证人员;具有向客户提供所有代理维护和增值服务的能力,能够为客户提供网络安全、数据应用、运行维护等增值服务不少于 5 种;具有完善的运行监控设备和监控体系;具有运行日志记录制度,日志保存时间≥1年;具有标准化维护操作流程;具有设备、电路及软件系统定期检测维护制度,定期检查,对性能不满足需要的设备及材料及时进行更换。5.客户服务

设置有专职的客户经理和技术支撑工程师;市场及客户服务人员应了解数据中心的基本构成和技术原理;具有完善的市场和客户服务管理制度;具有标准化业务处理流程;合同签订后3 个工作日内,为客户开通数据中心业务及数据中心内部网络线路(重要客户开通时限为1个工作日);定期回访客户,了解客户对数据中心产品的需求和建议,季度访问率100%;设置客户服务热线电话,提供7×24h客户服务;在客户设备出现故障时,为客户提供紧急故障恢复所需要的服务和资源;具有客户服务质量定期分析和流程改进制度;每月客户满意率≥98%,客户投诉处理满意率100%。2.2.3 三星级数据中心标准

三星级数据中心除满足2.1.2节的基本要求外,还应满足以下几方面的要求。1.机房条件2

机房位于城区内;机房托管面积≥1000m,机房地面荷载能力≥28kN/m,室内净高≥3.2m;设在3楼以上的机房具有客梯和货梯,货梯载重量≥2.0t;具有核心机房、电源机房、托管机房、监控室、接待区、客户操作室、客户测试室、客户休息室等功能分区;机房设置门卫,具有完善的入室登记制度;7×24h 视频监控系统,监控录像保存时间≥1 个月;机房设置门禁系统,门禁记录保存时间≥9个月。2.电源空调

市电引入等级:一类市电;油机配置:n台主用机组;UPS电源:(从同一套1+1 并机UPS电源系统)双路电源引入;电池后备时间:单机后备≥0.5h;接地和过电压保护系统设置完善;机房温度变化范围为21~25℃,湿度变化范围为40%~70%,空调系统具有备用机组。3.数据网络

数据中心出口接入省网或城域网汇聚层节点,出口带宽≥10Gbit/s;网络设备和线路采用冗余配置;具有包括防火墙、病毒防范功能的基本网络安全系统;具有支持基本功能(库存管理、IP 地址管理、故障告警等)的管理系统。4.运行维护

拥有专业维护人员,具有向客户提供所有代理维护和增值服务的能力,能够为客户提供网络安全、数据应用、运行维护等增值服务不少于3种;具有运行监控设备和监控体系;具有运行日志记录制度,日志保存时间≥9个月;具有标准化维护操作流程;具有设备、电路及软件系统定期检测维护制度,定期检查,对性能不满足需要的设备及材料及时进行更换。5.客户服务

设置有客户经理和技术支撑工程师(可兼职);市场及客户服务人员应了解数据中心的基本构成和技术原理;具有完善的市场和客户服务管理制度;具有标准化业务处理流程;合同签订后 5 个工作日内,为客户开通数据中心业务及数据中心内部网络线路(重要客户开通时限为2个工作日);定期回访客户,了解客户对数据中心产品的需求和建议,设置客户服务热线电话,提供7×24h客户服务;具有客户服务质量定期分析和流程改进制度;每月客户满意率≥95%,客户投诉处理满意率100%。2.2.4 二星级数据中心标准

二星级数据中心除满足2.1.2节的基本要求外,还应满足以下几方面的要求。1.机房条件2

机房地面荷载能力≥6kN/m,设在3楼以上的机房需设置客梯;具有客户接待室、客户操作室、监控室、UPS室、设备区、普通客户托管区等功能分区;机房设置门卫,具有完善的入室登记制度;7×24h 视频监控系统,监控录像保存时间≥2 周;机房设置门禁系统,门禁记录保存时间≥6个月。2.电源空调

市电引入等级:二类市电;油机配置:n主1备配置;UPS电源:(从同一套2+1并机UPS电源系统)双路电源引入;电池后备时间:单机后备≥0.5h;接地和过电压保护系统设置完善;机房温度、湿度符合机房标准。3.数据网络

数据中心出口接入城域网汇聚层或接入层节点;网络设备和线路采用冗余配置;具有基本的网络管理系统。4.运行维护

具有向客户提供基本代理维护的能力;具有运行监控设备和监控体系;具有运行日志记录制度,日志保存时间≥6 个月;具有标准化维护操作流程;具有设备、电路及软件系统定期检测维护制度。5.客户服务

具有完善的市场和客户服务管理制度;具有标准化业务处理流程;合同签订后 5 个工作日内,为客户开通数据中心业务及数据中心内部网络线路(重要客户开通时限为2 个工作日);定期回访客户,了解客户对数据中心产品的需求和建议,年访问率90%;设置客户服务热线电话,提供5×8h客户服务;具有故障处理制度和标准作业流程。2.2.5 一星级数据中心标准

一星级数据中心除满足2.1.2节的基本要求外,还应满足以下几方面的要求。1.机房条件2

机房地面荷载能力≥6kN/m,设在3楼以上的机房需设置客梯;具有监控室、UPS室、设备区、普通客户托管区等功能分区;机房设置门卫,具有完善的入室登记制度。2.电源空调

市电引入等级:二类市电;油机配置:n主1备配置;UPS电源:(从同一套2+1并机UPS电源系统)双路电源引入;电池后备时间:单机后备≥0.5h;接地和过电压保护系统设置完善;机房温度、湿度基本符合机房标准。3.数据网络

数据中心出口接入城域网汇聚层或接入层节点。4.运行维护

具有运行日志记录制度,日志保存时间≥6 个月;具有标准化维护操作流程;具有设备、电路及软件系统定期检测维护制度;定期检查。5.客户服务

具有标准化业务处理流程;合同签订后 5 个工作日内,为客户开通数据中心业务及数据中心内部网络线路(重要客户开通时限为2个工作日);定期回访客户,了解客户对数据中心产品的需求和建议;设置有客户服务热线电话。

各星级数据中心主要指标见表2-4。表2-4 数据中心服务等级分级主要指标参照表第3章 数据中心信息安全管理

随着在世界范围内,信息化水平的不断发展,数据中心的信息安全逐渐成为人们关注的焦点,世界范围内的各个机构、组织、个人都在探寻如何保障信息安全的问题。英国、美国、挪威、瑞典、芬兰、澳大利亚等国均制定了有关信息安全的本国标准,国际标准化组织(ISO)也发布了ISO17799、ISO13335、ISO15408等与信息安全相关的国际标准及技术报告。目前,在信息安全管理方面,英国标准ISO27000:2005已经成为世界上应用最广泛与典型的信息安全管理标准,它是在BSI/DISC的BDD/2信息安全管理委员会指导下制定完成的。

ISO27001标准于1993年由英国贸易工业部立项,于1995年英国首次出版BS7799-1:1995《信息安全管理实施细则》,它提供了一套综合的、由信息安全最佳惯例组成的实施规则,其目的是作为确定工商业信息系统在大多数情况所需控制范围的唯一参考基准,并且适用于各类组织。1998年英国公布标准的第二部分《信息安全管理体系规范》,它规定信息安全管理体系要求与信息安全控制要求,它是一个组织的全面或部分信息安全管理体系评估的基础,可以作为一个正式认证方案的根据。ISO27000-1与ISO27000-2经过修订于1999年重新予以发布,1999版考虑了信息处理技术,尤其是在网络和通信领域应用的近期发展,同时还特别强调了商务涉及的信息安全及信息安全的责任。2000年 12 月,ISO27000-1:1999《信息安全管理实施细则》通过了国际标准化组织 ISO的认可,正式成为国际标准ISO/IEC17799-1:2000《信息技术-信息安全管理实施细则》。2002年9月5日,ISO27000-2:2002草案经过广泛的讨论之后,终于发布成为正式标准,同时ISO27000-2:1999被废止。

现在,ISO27000:2005标准已得到了很多国家的认可,是国际上具有代表性的信息安全管理体系标准。许多国家的政府机构、银行、证券、保险公司、电信运营商、互联网公司及跨国企业已采用了此标准对信息安全进行系统的管理,数据中心应依据此标准逐步建立并完善标准化的信息安全管理体系。3.1 数据中心信息安全管理总体要求

管理体系是整个数据中心信息安全管理中最重要的一部分,它是基于业务风险的方法,建立、实施、运作、监控、评审、维护和改进信息安全/IT服务管理,包括组织架构、方针(政策)、策划活动、职责、活动、程序、流程和资源,如图3-1所示。图3-1 持续改进的信息安全管理体系和证书展示

信息安全是保护信息的保密性、完整性和可用性。另外,其他特性如真实性、可确认性、不可否认性和可靠性也可以包括在内。关键三要素分别是:保密性,防止信息被获取或泄露给未经授权的个人、实体或流程;完整性,保护资产准确和完整;可用性,资产仅对授权人员在需要的时候是可访问的或可用的。ISO27001 从 11 个方面建立认证信息安全管理体系(ISMS)应该具备的管理和控制措施,共包括了 39 个控制目标和 133 个控制措施。3.1.1 信息安全管理架构与人员能力要求(见表3-1)表3-1 信息安全管理架构与人员能力要求3.1.2 信息安全管理体系文件要求

根据数据中心业务目标与当前实际情况,建立完善而分层次的数据中心信息安全管理体系及相应的文档,包含但不限于表3-2给出的几方面。表3-2 信息安全管理体系文件要求3.2 信息安全管控要求3.2.1 安全方针(见表3-3)表3-3 安全方针3.2.2 信息安全组织1.内部组织(见表3-4)表3-4 内部组织2.外方管理(见表3-5)表3-5 外方管理3.2.3 信息资产管理1.资产管理职责(见表3-6)表3-6 资产管理职责2.信息资产分类(见表3-7)表3-7 信息资产分类3.2.4 人力资源安全(见表3-8)表3-8 人力资源安全注:这里的人员包括数据中心雇员、承包方人员和第三方等相关人员。3.2.5 物理与环境安全1.安全区域(见表3-9)表3-9 安全区域2.设备安全(见表3-10)表3-10 设备安全3.2.6 通信和操作管理1.运行程序和职责(见表3-11)表3-11 运行程序和职责2.第三方服务交付管理(见表3-12)表3-12 第三方服务交付管理3.系统规划和验收(见表3-13)表3-13 系统规划和验收4.防范恶意代码和移动代码(见表3-14)表3-14 防范恶意代码和移动代码5.备份(见表3-15)表3-15 备份6.网络安全管理(见表3-16)表3-16 网络安全管理7.介质管理(见表3-17)表3-17 介质管理8.信息交换(见表3-18)表3-18 信息交换9.监控(见表3-19)表3-19 监控3.2.7 访问控制(见表3-20)表3-20 访问控制3.2.8 信息系统获取、开发和维护(见表3-21)表3-21 信息系统获取、开发和维护3.2.9 信息安全事件管理(见表3-22)表3-22 信息安全事件管理3.2.10 业务连续性管理(见表3-23)表3-23 业务连续性管理3.2.11 符合性(见表3-24)表3-24 符合性第4章 数据中心运行维护

数据中心运行维护是重中之重的工作,良好的维护质量是确保整个数据中心安全可靠运行的重要保证。要支撑数据中心业务稳定,须按照运行维护要面向网络、面向产品、面向客户的要求,结合客户系统设备特点,本着提供高质量代维服务为原则,不断提高运维意识和业务素质,进一步增强做好运维工作的责任心。

数据中心的运行维护单位要吸取借鉴国内外机房运行维护中的经验,利用电子运维平台等自动化维护手段,进一步规范数据中心运行维护工作,提供可靠、高效的基础设施运行维护、网络通信及安全管理服务。加大运行维护规程的执行力度,各级维护人员严格贯彻落实各项操作规定,不断推进运行维护工作的规范化,提升运行维护的基础管理水平。4.1 运行维护职责与界面4.1.1 运行维护管理部门的主要职责(1)落实、细化数据中心维护规程,编制本单位数据中心维护管理实施细则。(2)下达运行维护指标及 KPI(关键考核项)指标,进行合理的分解,并对指标的完成情况阶段性汇总。(3)编制运行维护作业计划、实施计划和要求。(4)负责保证维护作业计划的全面完成,并督促、汇总、分析维护作业计划的完成情况,解决维护执行中发现的问题。(5)对数据中心运行情况进行综合分析、汇总,对存在的问题找出其质量指标变化或达不到使用要求的原因,提出并采取预防质量下降或改善运行质量的相应解决措施。(6)提出运行维护优化意见和资源使用状况的分析报告。(7)制定数据中心的应急方案和重要设施的保障方案,负责运行中重大故障的排除及抢险工作,并组织相关部门查明原因,制定解决方案及改进措施。(8)负责工程的质量验收,组织维护人员参与数据中心相关工程项目的设计会审、工程质量监督和竣工验收等。4.1.2 现场生产维护部门的主要职责(1)负责7×24h实时监测数据中心网络、设备运行情况,做到及时检修、及时发现故障、及时汇报,遇到重大故障按照上报流程及时报告,及时排除故障。(2)完成运维工单并及时填写和管理好客户开通资料、客户业务变更资料,保证用户资料的完整、准确并与实际相符。(3)负责执行数据中心的应急方案和重要设施的保障方案,配合运行维护管理部门查明原因,负责运行维护中重大故障的排除及抢险工作。4.1.3 各专业运行维护责任界面1.动力专业责任界面(1)动力机房根据用电标准向数据中心机房供电,数据中心机房若有特殊要求,应由动力维护部门协调解决。(2)动力机房至数据中心机房配电设备第一受电端子间的电力线(含第一受电端子)由动力专业维护,该端子以后部分由现场生产维护部门负责维护。(3)对于分散供电系统,应按电源系统的组成方式划分维护责任,动力专业负责到电源供电端子(含供电端子)。(4)分散在机房内的空调设备的维护由动力设备维护部门负责,非动力专业的维护人员未经允许不准操作,发现问题应立即通知动力设备维护部门及时进行处理。(5)动力及环境监控系统的维护由动力设备维护部门负责。(6)数据中心机房应合理使用电能,需要增减(交流、直流、UPS电源)负荷时必须经相应的动力设备维护部门审核,批准后方可实施。客户设备用电负荷增减需求由相关业务部门负责提交。2.IT专业责任界面(1)以数据中心机房的上行链路端口为界,数据中心侧(该端口以下包括路由器或交换机)属数据机房维护,IT设备侧由IT系统专业维护,中间的链路由数据机房专业负责监控。(2)IT系统专业必须按照相关业务流程进行业务申请,数据机房维护人员配合相关维护工作,负责维护与服务器等相关的网络设备和配套设备,IT系统专业负责服务器等软件及硬件的维护。4.1.4 数据中心维护人员的工作要求(1)应严格遵守机房安全保密制度。(2)应做到接待客户热情耐心、周到细致。(3)应定期巡视机房,对机房环境、温度、湿度、设备运行等进行登记和监视。(4)对机房内的设施、设备及工具负有管理责任,在巡视检查机房时,应对机房内通信设备、用户设备认真检查,发现问题及时与相关人员联系处理。(5)应对用户网络、系统进行7×24h监控,发现故障及时进行判断和处理。(6)在接到维护工单后,应主动与用户联系,询问用户托管设备及网络上联的具体情况,了解用户需求。(7)在用户装机之前,维护人员应为用户准备好供用户网络上联用的线路、机架配电、IP 地址分配,并积极配合用户做好装机上架工作。(8)在接到用户端口速率变更或撤机工单后,应积极协助用户做好用户网络、机架的调整工作。(9)数据中心维护人员应7×24h监控用户端口状态及流量情况,发现用户网络问题或有可疑情况时,应及时与用户取得联系,迅速解决问题,最大限度地保证用户系统正常运行。

图4-1展示了中国联通数据中心运行监控的智能化、自动化维护管理系统。图4-1 中国联通数据中心运行监控中心4.2 运行维护管理4.2.1 维护管理内容1.设备维护管理

数据中心设备维护管理、设备资料管理以及业务数据维护管理应依据设备维护的相关规程执行。数据中心主要设备包括网络设备、主机设备、软件及数据。网络设备主要包括路由器、二层交换设备、防火墙等安全设备以及负载均衡等相关设备;主机设备主要包括服务器、磁盘阵列等设备;软件及数据主要包括数据中心设备运行软件、各类操作系统软件、网管软件、漏洞扫描及病毒防护等安全软件,其他网络所使用的具备独立功能的软件,网络配置数据、业务数据。

数据中心网络设备的监控:对各类网络设备的运行状况、系统性能进行监控。被监控的设备包括数据中心网络核心路由器、汇聚交换机、接入交换机等各类设备,实时监测设备的性能、运行情况、系统资源等,统计分析设备对业务的承载能力。同时包含对数据中心网管系统设备的监控,即对网管主机设备、软件系统的监控。

数据中心网络流量的监控:对数据中心机房接入用户至数据中心网络设备的互联链路、数据中心各网络设备之间的互联链路、数据中心核心路由器至本地骨干网之间的互联链路的流量监控,用以分析、统计网络带宽资源的利用率、趋势、模型和用户的业务流量以及发现网络的异常流量。

用户网络连通性的监控:对数据中心机房网络接入用户连通性进行监控,用以实时监测用户的通断,及时发现网络故障。

新建的数据中心相关工程必须经过工程初验,满足设计的各项技术指标和设计要求后正式移交数据中心运行维护部门之后方可进行业务的接入。对于在建工程进行的业务开放,原则上不予实施,特殊情况需经运行维护管理部门批准后方可实施。

数据中心维护单位对管辖范围内的所有数据中心各类设备、电路等应建立准确、完备的资料档案,对所维护范围内用户的相关资料应建立详细、准确的台账信息,并做到及时更新。2.数据中心配套设备管理

用于网络监控的设备,设备之间连接及业务接入的通信线缆、动力线缆、地线、机架电源、空调设备、配线架,及光电转换器、仪表仪器、专业工具、备品备件等。

数据中心配套设备由现场维护部门负责维护。配套设备的选型、工程建设、验收工作应依据相应工程规划。

配套设备维护要求:数据中心指定专人进行日常巡查和管理;未经授权人员不得擅入数据中心机房进行任何操作;现场维护部门值班人员需保障机房内各项设施安全、防火防盜。

数据中心机房配线应遵循以下布线原则:上走线机房在布放各类缆线时,应按照走线槽走向布放,不许在走线槽外布放或跳跃走线槽;应注意高空作业时的安全问题,须实行双人操作制。下走线机房应固定走线槽道,一般在机架前布放信号电缆,在机架后面布放电力电缆,下走线机房在布放各类缆线时,应注意不要碰伤其他已布放的缆线,布放完成后对活动地板要恢复牢固,以防塌陷;信号线和电力电缆应分开布放,不允许混放;临时布放的各类缆线应按上述要求执行;各类缆线布放完毕后,应制作并粘贴相应的标签,做好资料记录。4.2.2 安全管理1.网络系统安全

网络设备的核心处理及交换模块、电源模块必须为1∶1 主备模式;设备采用双/多路冗余供电方式;设备的线路卡要求N∶1 备份;设备必须支持热插拔功能;设备在故障状态下可以实现一定程度上的故障自恢复,包括主备引擎的切换、不中断业务的转发等。

在新设备入网前,必须与现网网络设备进行严格的互通性测试,由新入网设备厂家提供测试报告及测试案例,确保新设备符合相关设备的技术要求。任何设备接入到数据中心网络前必须做好详细的割接实施方案和集成方案,方案必须经过严格的审核。方案中应对实施的风险进行预测并采取相关措施降低风险程度。网络设备必须采用经过厂家测试并正式发布的、性能稳定可靠的内核软件和操作系统软件版本;所采用的硬件和软件产品本身应具备一定的安全功能。

数据机房网络设备原则上设置不少于两台核心设备,并保证核心设备间直连。每台非核心网络设备通过双或多链路上联核心设备,防止单链路失效导致设备脱网。双或多上联链路原则上从本设备的不同板卡引出,连接到不同核心设备或同一核心设备的不同板卡。必须关闭网络设备未使用的物理端口。定期拨测检查带外网管通道,保证其通畅性。

数据中心维护单位应定期查看 IP 网络安全站点的安全公告,跟踪和研究各种 IP 网络安全漏洞和攻击手段,跟踪主机系统使用的操作系统、应用系统最新版本和安全补丁程序的发布情况,以便及时制定相应的对策,做好安全防护工作。当出现由安全问题引起的重大故障时,应及时上报。

数据中心维护人员负责防火墙系统的日常维护工作,并根据网络安全访问控制策略拟定相应的防火墙安全控制准则,并对安全控制准则和访问控制策略的一致性进行校验。如发现客户设备因病毒、攻击或其他原因出现危及网络安全,危及其他客户正常使用的情况,数据中心维护人员应立即通知业务部门,同时积极配合客户协商处理办法。

应开启路由器、以太网交换机日志功能,同时必须保证日志功能对设备性能的影响较小。应针对路由器、交换机配置 AAA 功能。关闭路由器、以太网交换机、服务器上不必要的服务。发现安全漏洞时,应采取必要的防护措施,并及时升级软件版本或安装补丁。

病毒防护和账号口令的管理按照安全管理的相关要求执行。应对网络设备进行周期性安全审计和评估,形成评估报告,对评估报告中发现的安全隐患,应采取措施予以消除,同时做好相关资料的存档。2.日常设备安全管理

各类维护单元应严格执行维护作业计划,每月定期检查网络设备的安全策略配置,并填写和保留有关记录;每月定期进行设备硬件、系统软件、应用软件运行状态检查,及时发现设备运行中的安全隐患,并填写和保留有关记录;每周定期检查安全日志(包括系统访问日志、配置更改日志等),及时发现非法访问和异常配置的安全隐患,并填写和保留有关记录;对网络安全检查中发现的问题,应根据问题的严重性及影响范围制订修补计划,必要时可以寻求专业安全技术厂商的支持并报上级领导审批,在安全组成员的监督下,由安全技术厂商进行滲透性测试,以检查安全问题解决的效果。

主机系统安全:须配置冗余的电源模块,或采用双机热备份,保证避免因单台设备故障而影响业务服务;应部署服务器病毒防护系统,减少病毒对系统和应用软件造成破坏的机会,保证服务器的可用性;杜绝对系统的非授权访问;执行严格的审计策略,以增强系统的安全性;严格管理软件版本及其补丁,保证及时进行服务器软件补丁升级、修补漏洞。

MIB(管理信息库)安全管理:设备MIB 库的读/ 写字串必须设定为非默认值,避免攻击者窃取其中的信息,威胁网络的安全;非必要情况下,不设置写权限;必须通过设备的访问控制列表严格限制可读/写设备MIB 库的主机,原则上禁止从网管网段外访问MIB库;对于不同的网管系统,应设置独立的SNMP 字串和访问控制列表。

远程登录访问控制:确保在所有登录服务的位置设置口令防护,其中设备登录和认证的通信过程应加密,确保AUX 和Console接口设置EXEC 口令;严格限定特定的IP 地址远程登录网络设备或主机设备;对设备的远程登录会话最大无响应连接断开时间应设置为不大于10min。3.安全保密制度

对有关设备、网络组织结构、电路开放信息等机房机密资料不得随意放置,用完后放回资料柜保存好,有关人员不得任意泄露、抄录、复制和擅自带出机房;机房内严禁私自照相、摄像。机房内严禁从事与工作无关的各项活动。数据中心维护人员必须遵守有关安全管理制度,认真执行用电、防火的规定,做好防火、防盜、防爆、防雷、防冻、防潮、防鼠害等工作,确保人身和设备安全。

数据机房维护人员出入机房应佩戴工作证件,进入机房应着防静电工作服、工作鞋。机房应执行安全保卫管理规定,外来人员不得擅自进入机房。外部人员因公进入机房,应经上级批准并由内部业务人员带领方可入内,如须携带与工作相关物品的,需要将所携带物品作详细登记。外籍人员因工作需要进入机房,须严格履行涉外手续,经主管部门批准后,指定中方陪同人员并详细记录进出机房人员的姓名、时间、批准人及工作情况。

机房现场维护人员应遵守动力维护专业的相关制度与管理规定,非专业人员禁止对动力设备进行操作,发现问题应立即通知动力维护单元。当机房的交流供电系统全部停止工作时,现场维护人员应立即向运行维护部门报告,并采取必要措施保证设备安全。

各级维护和管理人员,均应熟悉并严格执行有关安全保密规定。数据中心的所有员工要具有高度的职业道德素质,对用户在机房使用的各种资源信息及资料要严格保密,不能泄露给任何其他人员。运行维护部门应定期检查安全保密制度执行情况。4.故障管理

数据中心故障分为重大故障、较大故障、一般故障、其他故障。(1)重大故障:按工业和信息化部关于《通信网络安全防护管理办法》中规定的标准,通信网络安全防护定级3级以上的数据中心全阻或严重拥塞1h以上;党政军重要机关业务及重保期间业务重大通信阻断。(2)较大故障:通信网络安全防护定级2级以上的数据中心全阻或严重拥塞1h以上。(3)一般故障:其他数据中心全阻或严重拥塞1h以上。(4)其他故障:除上述3类故障以外的数据中心故障。

在发生故障时,应依据“先抢通、后修复”原则及时进行故障处理。发生重大故障或较大故障时应及时向有关部门进行报告。在恢复通信后,应就故障现象、影响范围和时间、故障原因、解决处理情况等进行整理,形成正式的故障报告及时上报。对于一般故障应做好详细记录,定期对故障及处理情况进行汇总统计。故障记录内容应包括:故障现象、故障类型、故障起始时间、故障修复时间、故障历时、原因分析及解决情况、故障处理情况及责任分析等。4.2.3 资源管理1.客户资源维护管理基本规定

数据中心客户资源包括数据中心的客户信息以及客户设备信息。数据中心所有的客户档案归业务部门统一管理,数据中心维护人员应严格遵守安全保密制度保护客户的档案信息。数据中心用户资料是进行统计分析、做好日常性维护工作的重要资料,必须做到记录和统计及时、准确,并妥善保管。2.客户托管设备管理

所有客户设备由客户自身负责维护维修,未经用户授权或许可,数据中心维护人员不得对客户设备进行维护操作。在紧急情况下经用户代表授权许可,维护人员可以协助客户进行简单的设备重启操作。客户设备出现报警等异常情况时,机房现场维护人员应及时根据客户资料通知客户,以便客户及时赶到现场。

数据中心机房现场维护人员须对进出机房的用户设备进行登记,除去客户设备正常的维护性更换以外,客户需要在数据中心机房内增加或者减少设备时,数据中心维护人员需要得到相关业务部门的批准才能允许客户带入或带出设备。数据中心为机笼式和专用机房客户提供钥匙,分别由客户以及数据中心机房保管,并保证只有相关人员能够接触到客户设备,最大限度地保证用户设备管理安全。为重要客户提供的独立机房,除定期维护工作以外,任何人员进入机房须经客户同意。4.2.4 质量管理

数据中心质量管理是对数据中心的各个环节进行质量控制,发现质量隐患,采取预防措施,不断提高设备运行质量和服务质量。1.质量统计项目

机房现场:包括机房UPS使用情况(UPS负荷)、机架用电情况(每架用电量)、机房温度、机房湿度、机房用户机架占用情况。

网络设备:包括网络设备负荷情况(CPU、内存使用率)、网络资源占用情况、网络互联带宽使用情况(峰值流量)、传输资源占用情况(ODF/DDF 联络缆使用率)、用户情况统计。2.故障统计项目

机房现场:包括机房UPS故障、列头柜故障导致机架断电次数及历时;机房空调告警次数;机房门禁系统故障次数及历时;机房监控系统故障次数。

网络设备:包括网络设备发生故障次数及历时;网络互联链路发生中断次数及历时。

依据上述项目的综合统计数据,找出其产生故障和异常现象的原因,找出其质量指标变化或达不到使用要求的原因,提出相应解决措施。应每月召开运行维护质量统计分析会,遇有典型或疑难故障,应组织相关维护专业人员召开专题分析会,研究改进措施。3.业务管理和服务质量管理

根据数据中心业务发展需求,逐步在高等级数据中心开展客户服务质量(SLA)管理,为用户提供服务质量检测报告等服务,为用户提供数据流量、带宽占用情况、是否需要进行接入带宽和处理能力的调整建议等,从而确保用户的服务质量。

业务管理系统应包括以下内容。(1)客户管理,包括客户的信息和合同管理。(2)资源管理,其中数据中心的资源包括机房空间、网络设备端口、流量等。(3)数据中心业务流程管理。(4)数据中心具体业务的审核、管理。(5)客户代表管理模块。(6)用户在线自服务管理。4.2.5 维护作业计划

维护作业的执行及记录:数据中心维护作业计划应报相关运行维护管理部门,获批准后认真执行,所列项目和周期未经批准不得删减变动。维护作业计划完成后,必须详细记录完成情况和测试情况,同时将发现的问题摘要记录并进行相应处理,测试记录应妥善保管。

维护作业应在业务空闲时进行,发现不正常情况应及时处理和详细记录,对于无法处理的问题,应立即向主管负责人报告。在记录里写明作业执行的结果,数据要具体、量化,要求记录发现的问题及处理过程等。如需调整维护作业计划,必须上报上级运维管理单位审核批准后方可调整。内容详见表4-1。表4-1 数据中心网络设备和配套设备的维护项目和维护周期“主备用倒换功能测试”在条件不具备时,需每月进行“备用板卡可用性检查”。作业完成后需填写相应的维护作业记录表。对所有作业计划执行情况需详细记录并签字确认,设备维护主管进行定期审核并签字确认。4.2.6 运行维护指标

为保证数据中心为客户提供优质的服务,在网络稳定性和机房环境方面需要满足下列运行维护指标要求,详见表4-2。表4-2 数据中心运营维护主要指标

当实际网络运行指标达到上述维护指标要求 80%时,维护部门必须提出相关的网络优化、改造、扩容建议和申请,并予以跟踪、记录和备案。

数据中心运行维护指标定义和计算方法如下。(1)网络设备可用率:指网络设备在统计时长内的可用比率。

计算方法:网络设备可用率=(网络设备可用时长/统计时长)×100%。(2)中继电路带宽峰值月平均利用率:指定中继电路在一个月内每日峰值利用率的平均值。

计算方法:中继电路带宽峰值月平均利用率=(当月中继电路带宽每日峰值利用率之和/当月的天数)×100%。(3)机房温度月平均达标率:数据中心机房月度温度达标天数和当月天数百分比。

计算方法:机房温度月平均达标率=(当月温度达标天数/当月的天数)×100%。(4)机房湿度月平均达标率:数据中心机房月度湿度达标天数和当月天数百分比。

计算方法:机房湿度月平均达标率=(当月湿度达标天数/当月的天数)×100%。4.3 面向大客户数据(灾备)中心专业维护规程4.3.1 基本原则

按照“面向网络、面向产品、面向客户”要求,开展大客户数据(灾备)中心运行维护和支撑服务工作,建立符合综合化发展要求的运维组织体系,以用户满意为目标,为客户提供标准化、规范化、高品质的维护服务。机房安全、网络安全是维护工作的基础,运行维护各专业应围绕“安全”开展各项维护和支撑服务工作,保障大客户系统及信息安全。4.3.2 基本任务(1)按照与大客户签订合同中的条款要求进行差异化的服务。(2)严格按照流程开通业务,做好现场服务工作,提高业务开通及时率和客户满意度。(3)强化日常维护管理,充分利用各种技术手段,确保大客户数据(灾备)中心的承载网络和机房配套设备的性能、技术指标,满足该项目产品的稳定、可靠运行,减少故障次数和修复时长,提高维护效率。(4)建立快速响应机制,做好大客户的技术支撑和保障服务。(5)加强资源管理,有效整合、优化配置各类资源,提升维护支撑能力和线路安全及场地安全。保留维护操作痕迹、记录完整日志,相关内容和保存期限满足事件分析、安全取证、独立审计和监督检查需要。(6)明确服务组织架构、职责、界面。4.3.3 维护组织机构

大客户数据(灾备)中心业务的维护支撑工作由运行维护部门负责管理。按照统一管理、分专业维护的原则,建立相应的专属维护队伍。1.维护职责划分

与大客户数据(灾备)中心业务的维护界面以客户设备数据端口、电源插口为分界,客户设备与网络连接的信号线、电源线由维护部门提供并维护。

运行维护部内部相关专业的维护界面划分:与大客户数据(灾备)中心相关的交直流配电屏、UPS、蓄电池、空调等动力设备及新风系统设备由动力专业维护人员负责维护;传输网设备由传输专业人员负责维护;专业电路承载网设备由数据专业人员负责维护;门禁、视频等监控由机房现场维护人员负责维护;机房内综合布线由数据专业配合维护(包括机房内6类线及光纤),如图4-2所示。图4-2 面向大客户数据(灾备)中心的维护分工界面示意图2.各专业维护工作职责(1)运行维护中心:7×24h负责客户数据(灾备)中心机房网管值班、相关传输、数据设备告警监测,记录告警信息;负责门禁系统管理,机房出入人员登记;定期备份视频监控信息;填写网管进出作业记录;负责提供客户数据(灾备)中心服务维护月报相关数据;配合客户数据(灾备)中心应急演练及灾难恢复前的维护数据确认及其他配合工作。配合进行设备进出登记与保管。(2)动力专业:负责7×24h客户数据(灾备)中心机房动力值班及动力、空调、新风、环境温度、湿度、烟雾告警监测,记录告警信息,实施故障处理;负责每4h巡检一次机房的动力、空调、温度、湿度等监测数据(重要节日期间或大客户要求的重要日,每2h巡检一次);负责客户数据(灾备)中心动力、空调、温度、湿度监测设备的定期维护、测试、应急演练,填写维护作业记录;负责客户数据(灾备)中心机房的消防、新风系统维护;负责提供客户数据(灾备)中心服务维护月报相关数据;配合客户数据(灾备)中心应急演练及灾难恢复前的各项基础设施运行数据确认及其他配合工作。(3)传输专业:负责与客户数据(灾备)中心相连的传输设备告警监测,记录告警信息,实施故障处理;传输设备的定期维护、测试、应急演练,填写维护作业记录;新增业务数据配置、联调、性能优化;负责客户数据(灾备)中心机房内其他运营商委托维护的传输设备及其线缆的维护;负责提供客户数据(灾备)中心服务维护月报(或服务水平月报)相关数据;配合客户数据(灾备)中心应急演练及灾难恢复前的维护数据确认及其他配合工作。(4)数据专业:负责与客户数据(灾备)中心相连的数据设备告警监测,记录告警信息,实施故障处理;定期维护、测试、应急演练,填写维护作业记录;新增业务的数据配置、联调、性能优化;配合客户机房综合布线系统维护;负责提供客户数据(灾备)中心服务维护月报相关数据;配合客户数据(灾备)中心应急演练及灾难恢复前的维护数据确认及其他配合工作;在每次得到大客户授权后配合客户数据(灾备)中心机房内设备的简单操作:强弱电线缆的插拔,设备重启等。(5)客户响应中心:负责编制客户数据(灾备)中心应急响应预案、灾难恢复预案以及异地数据(灾备)中心日常运行维护、变更管理、问题管理等运行维护规范;负责服务内容响应、变更,现场情况收集管理与协调;负责客户数据(灾备)中心项目验收文档的保存;负责客户数据(灾备)中心服务月报的汇总、完善及保存,年度信息安全风险评估报告、应急演练及灾难恢复的协调。(6)行政物业部门:积极配合上述专业对客户数据(灾备)中心的运行维护工作。负责客户数据(灾备)中心办公、生活区域提供配套设备、物品的维护、管理。负责7×24h园区、楼宇保安巡逻、安保监控,定期备份监控数据。负责机房、办公及生活区消防维护,填报维护作业数据。配合演练及数据(灾备)恢复期间及其他配合工作。(7)业务部门:负责客户及合作单位接待;客户常驻数据(灾备)中心人员生活安排;受理大客户业务变更及工单派发、客户反馈;负责与大客户联系人的总接口,协调、召集各类会议等。负责合同签订、业务的发起、变更工作以及营收的归纳工作;负责资费核对、收费、销账工作,并做好工作台账;负责专用机房建设期间,大客户来往工作人员的接待工作,包括车辆接送、票务以及住宿房间的预订等工作。4.3.4 各专业维护工作制度1.值班制度

值班人员必须严格遵守值班制度。必须实行7×24h连续值班责任制;值班人员在值班时间内必须坚守岗位,集中精力,随时监测设备有无异常告警,若发现异常情况或接到故障申告,应立即处理,重大故障应立即按照故障升级上报流程进行报告;及时、准确、完整地填写值班交接班日志及维护作业记录;不得随意关闭设备告警,不得人为切断和私人占用业务电话,不得做与工作无关的事情;严格遵守通信纪律、安全保密制度和其他各项故障制度。2.交接班制度

值班人员必须严格遵守交接班制度。交班必须准时、认真,接班人未到岗,交班人不得离岗;交接班内容包括客户平台运行状况、障碍情况,备品备件、文件资料、工具仪表、相关业务通知,上级批示以及需由接班人继续处理的问题;交接班人员应将交接内容逐项内容核实并确认无误,在值班交班日志上签字后,交班人方可离开;交接班过程中发生障碍及事故,应暂停交接,以交班人为主,接班人协助共同处理,直至障碍或事故消除,或处理告一段落后再继续交班;因错交或漏交产生的问题,由交班人员承担责任;因漏接或错接而产生的问题,由接班人员承担责任;交接双方均未发现的问题,由双方共同承担责任。3.维护作业计划管理制度

机房监控纳入电子运维平台管理,其他动力、传输、数据专业根据合同服务内容,各自制定维护作业计划,定期上传、存档;客户维护作业计划制定后,不得随意修改;运维管理人员应定期检查并考核维护作业计划的制定和实施情况。

作业计划内容包括:(1)安保中心

① 门禁系统:门及门禁状态巡视,每天2次,监控数据保留1年。

② 设备监控:录像机内容备份,数据保留1年;录像机时间校对,每月1次;查看存储容量,每月1次。

③ 门禁系统:门禁系统主机时间校对,每月1次。

④ 监控系统:定期对监控录像系统进行维护保养,每季度1次,每次间隔4h。(2)动力专业

① 空调、动力、新风、消防、温度及湿度的巡检,每次间隔4h。

② 空调、UPS性能指标分析,每天1次。

③ 新风机:过滤网检查、清洗,每月1次。

④ 发电机:空载启动测试,每月1次。

⑤ 精密空调:漏水传感器测试,每月1次。

⑥ 消防系统:烟感、温感20%测试,系统检查,每季度1次。

⑦ 发电机:负载启动测试,每季度1次。

⑧ UPS:电池放电测试,每季度进行1次浅度放电测试,每年进行1次深度放电测试。

⑨ 烟感探头、温感探头:实际检测,每半年1次。

⑩ 灭火器:压力测试,每年1次。(3)传输专业(仅举例说明)

① OSN设备性能指标分析,每月1次。

② SDH电路性能指标分析,每月1次。(4)数据专业(仅举例说明)

① ATM设备性能指标分析,每月1次。

② ATM电路性能指标分析,每月1次(按单条电路分析)。4.信息维护安全制度

维护信息共享,根据客户合同要求,运行维护部负责每月的第一周向客户提供维护服务月报。信息安全保密,任何人不得将客户数据(灾备)中心机房的任何信息,在未经大客户同意的情况下以任何形式泄露给第三方。5.数据机房管理制度(1)客户人员出入园区申请制度

客户常驻人员出入园区:客户联系人填写《来访人员出入申请表》,加盖客户公章进行授权,由业务部门提出申请。授权期间,园区行政部门给客户相关人员办理长期出入园区的“出入证”,运维部及园区门岗备案相关信息。出入园区,门卫核实身份证件与出入证信息相符,佩戴“出入证”后进入。

客户临时人员出入园区:包括参观、演练人员。客户联系人填写《来访人员出入申请表》进行授权,业务部门提前3天进行申请。授权期间,出入园区在门卫处登记,提供《来访人员出入申请表》及审批记录,凭身份证件换取“来宾证”,佩戴后进入。

客户应急人员出入园区:客户联系人填写《来访人员出入申请表》,授权到具体人员(注明姓名、身份证号码、手机号码),运维部及园区门岗备案相关信息。该人员在园区门口打电话到运维部确认(姓名、身份证号码、手机号码,三者需与备案同时相符),门卫核实身份证件,凭身份证换取“来宾证”,佩戴后进入。

来访结束,来访人员至门卫处交还“来宾证”并换回有效证件。(2)客户人员出入客户数据(灾备)机房制度

常驻数据(灾备)中心人员,由运维部审核发放授权门禁卡。此卡专人专用,不得外借他人使用,如有遗失应立即上报运维部,并及时办理门禁卡报失。书面授权最长期限为3个月,过期需重新申请。如在授权期限内门禁卡持有人发生离职或调离等变动,客户应提前一周与运维部联系,停止门禁卡的授权。

常驻数据(灾备)中心人员进入机房前,联系运维部进行事件登记,简要说明任务,登记完成并得到运维部授权后刷卡进入。同时,运维部核实进入人员刷卡号与备案信息相符。进入机房后填写《机房出入登记表》,并按表格要求逐一填写。《机房出入登记表》由客户方妥善保管。

临时或应急出入人员进入机房,需联系常驻数据(灾备)中心的客户常驻人员全程陪同。进入机房前,由客户常驻人员联系运维部进行事件登记,记录临时或应急出入机房人员信息,包括姓名、身份证号码,简要说明任务。登记完成并得到运维部授权后,由常驻人员陪同来访者刷卡进入,运维部核实进入人员刷卡号与备案信息相符。进入机房后填写《机房出入登记表》,并按表格要求逐一填写。

离开机房,客户常驻人员联系运维部进行事件登记,登记完成并得到运维部授权后刷卡离开。(3)其他人员出入客户数据(灾备)机房制度

申请流程:非客户单位应急出入机房的系统维护工程师、第三方来访者进入机房,客户常驻人员需预先填写《客户数据(灾备)中心机房来访人员出入申请表》,对相关来访人员进行书面授权。明确授权时间、出入人员及身份证,加盖运维部章,由业务部门审核备案。

来访者进入客户数据(灾备)中心机房,必须由现场值班维护人员、客户常驻人员全程陪同。进入机房前,客户联系运维部进行事件登记,记录双方出入机房人员信息,包括姓名、身份证号码,简要说明任务。登记完成并得到运维部授权后,由现场值班人员刷卡进入。运维部核实进入人员刷卡号与备案信息相符。进入机房后人员填写《机房出入登记表》,并按表格要求逐一填写。

离开机房,客户常驻人员联系运维部进行事件登记,登记完成并得到运维部授权后刷卡离开。(4)机房内管理制度

来访人员须遵守机房相关管理规定,禁止携带任何下列物品,包括:食物和饮料;烟草制品;危险品;酒精、毒品和其他麻醉品;炸药、武器、溶剂、清洁剂及油漆;温度控制器;可能干扰计算机和电信设备的电磁装置;放射性物质;照相、摄影及录音器材(不含磁带备份设备)。

禁止随意操作维护终端及运行设备,不得随意打开机柜门及翻阅机房资料。6.物资管理制度

所指工程物资是指产权属于客户方,在大客户数据中心项目新建工程基本建设期间大客户自行采购的或接受赠送的各种物资,包括为工程准备的材料、未安装的设备。在执行客户数据(灾备)中心交付过渡期间,双方需明确物资登记、管理、存放的要求。7.业务变更管理

业务变更说明:原则上大客户提出业务变更服务应提前1周以邮件形式通知业务部门,由业务部门受理后填写工单,运维部相关专业实施。变更服务保障时间参考表4-3。表4-3 变更服务保障时间参考表8.割接管理

因工程施工、网络建设、网络优化、节点扩容等原因,需要进行网络割接,原则上客户经理需提前一周通知大客户,明确影响业务清单,大客户确认割接时间后方可实施。对由于不可控因素如市政建设、桥路迁改、自然灾害等引起的光缆、电缆等线路紧急割接,由运维部将割接信息提前通知大客户,尽量保证不影响业务的正常进行。与大客户异地数据(灾备)中心有关的割接请求,运维部各专业专项申报割接申请。9.故障处理管理(1)故障处理原则

故障发生时处理要求是先局内后局外,先本端后对端,先重点后一般,先抢通后修复,故障消除后择时复原;主动监控发现的告警,运维部应及时通知相关专业及客户服务响应中心,客户服务响应中心通报给客户经理,客户经理向用户反馈;运维部根据大客户的服务等级及故障等级进行逐级汇报。故障响应及解决时间见表4-4。表4-4 故障响应及解决时间

① 紧急事件包括:

a.机房供配电系统出现故障,影响机房供电安全的事件(如数据中心机房的原因导致市电供电中断,UPS设备故障、备用发电系统故障等)。

b.机房空调系统出现故障,影响机房温湿度的事件。

c.机房门禁系统出现故障,影响机房出入安全的事件。

d.机房消防系统出现故障,影响机房安全的事件。

e.机房安防系统出现故障,影响机房安全的事件。

f.机房环境监控系统出现的故障,对运行造成隐患的事件。

g.机房内出现可疑人物。

h.机房内出现设备或物品丢失。

② 一般性事件包括:

a.任何设备出现非计划掉电的事件。

b.任何强弱电线路出现非计划中断的事件。(2)故障处理流程

设立故障受理电话,包括大客户VIP 服务响应电话、技术服务经理电话、客户经理电话、客户服务响应负责人电话。大客户需指定一固定报故障邮箱和电话报故障密码。

主动发现故障处理流程(4步规定动作)如下。

第一步,通知:在监控发现故障后,运维部立即电话和邮件通知客户常驻人员以及相关人员;

第二步,处理:客户在收到故障通知后,应立即按相应故障流程配合处理;运维部协调相关专业人员处理故障;

第三步,回复确认:故障恢复后应立即回复大客户,在得到客户确认后关闭故障流程;

第四步,事件备案:事件处理完毕后,相关专业需在客户服务水平月报上详细记录本次事件,并分析故障原因,注明解决方式及时间。

客户申报故障处理流程(4步规定动作)如下。

第一步,申报:客户常驻人员或后台监控系统在发现异常时,可通过电话请大客户VIP服务响应中心通知运维部,报障时提供报障密码;

第二步,处理:机房维护值班工程师在收到客户的故障申报后,需立即查找故障,确认故障后,按相应故障流程处理;

第三步,回复确认:故障恢复后应立即回复大客户,在得到客户确认后关闭故障流程;

第四步,事件备案:事件处理完毕后,相关专业需在客户服务水平月报上详细记录本次事件,并分析故障原因,注明解决方案。10.服务质量考核管理

为提升大客户客户满意度,增强客户网络运行效率和快速反应能力,建立大客户服务成功率和服务效率的考核机制。

服务成功率指网络服务成功率:是指在一个统计周期内,大客户使用公司业务的网络可用时间与统计期内总时间之比。指标达标成功率99.7%(参考值)。

网络不可用是指造成大客户业务通信中断,除此之外是指公司发现网络障碍或大客户通过客户服务响应中心报告不可用开始到网络可用为止的时间。网络不可用不包括:客户拥有的设备及线路不可用,如路由器等;双方约定的网路维护、割接、测试导致的不可用;客户方原因导致的网络不可用;备用电路不可用;不可抗力因素导致的网络不可用。

服务效率分为业务变更及故障响应服务效率,严格纳入指标考核。

业务变更服务效率:业务变更服务完成时间≤业务变更管理相关内容。第5章 数据中心基础网络

数据中心基础网络架构运行在布线系统、供电系统等基础系统之上,同时为主机系统和应用系统提供网络连接。基础网络架构的可靠、稳定、高效、安全、可扩展、可管理性将直接关系到上层的主机系统和应用系统,也将直接关系到数据中心业务的顺利运行。总之,网络是数据中心建设框架中重要而又承上启下的一环,网络系统的设计是否完善将直接影响到数据中心的服务质量。数据中心基础网络的设计应按照业务需求,基于开放标准的IP 协议,完成对业务系统、网络资源的有效整合。通过高可用技术和良好的网络设计,实现数据中心可靠运行,保证业务系统的运行连续性。5.1 数据中心技术发展阶段和特性5.1.1 数据中心技术发展的3 个阶段

从第一代专门提供托管服务的数据中心,发展到以电子商务和增值服务为核心的第二代数据中心,目前正向着融合数据、语音等多种服务,使用云技术、模块化服务平台的第三代数据中心发展。

第一代数据中心阶段:提供基础设施托管服务,这一代数据中心的重要特点是提供足够机房空间和高速互联网带宽,以及高性能局域网络的优势和稳定可靠的机房环境,满足用户虚拟主机、主机托管等基本服务。

第二代数据中心阶段:以电子商务和增值服务为核心,除了实现第一代数据中心的全部功能外,还设有专业的服务器和应用管理服务队伍,灵活多样的业务模式,为用户提供各种各样的增值服务和面向IT的全面解决方案。在这个阶段,负载均衡、网络监控、流量优化调度、入侵检测、防DDoS 攻击、漏洞扫描开始在网络中应用。

第三代数据中心阶段:是目前数据中心的发展趋势,随着云计算技术、下一代网络(NGN)的出现,PSTN 网络、移动通信网络和互联网等三大网络将融合为一个整体。新一代的数据中心将会融合下一代网络上的各种数据、语音、图像等多种信息,在数据中心内部提供统一的服务和全面的解决方案。同时,为了融合多种业务信息,新一代的数据中心间采用虚拟化、模块化的服务平台。在统一的系统主干上,使用纵向板卡技术,可以任意插入语音设备、交换设备、服务处理设备、增值服务设备等,在有限的空间内为用户实现面向新一代网络的支撑解决方案。5.1.2 数据中心技术特性要求(1)可靠性:数据中心具备冗余系统以确保能够提供可靠的、不间断的服务,如机房双路供电、后备柴油发电机、服务器UPS供电、冗余的物理光纤以确保至Internet的连接、关键网络设备的备份、冗余的服务器供电系统等。(2)安全性:数据中心的机房要有多层安全保卫设置。非维护人员不允许进入机房进行操作,所有安装配置工作可通过设在网管控制中心的控制台来完成。闭路电视摄像机安装到设备的关键位置,可以随时查看机房情况。在服务器的操作安全上,软件识别技术可提供服务器强有力的接入控制,在网站托管系统中,常规操作只限于服务器的启动和数据备份、恢复,更进一步的操作需要用户方指定授权人的书面授权书。每个机柜、配电柜有专人掌管钥匙,网络设备设有不同级别的多层口令以保证整个网络的安全性。(3)大容量:数据中心可提供大容量的带宽服务,并具备良好的可扩展性,根据业务需求及时提供扩容升级服务。根据用户需求,可提供有服务质量(QoS)保证的数据中心服务,包括不同带宽的专线接入、VPN 业务等。(4)可管控:数据中心网络控制中心可以提供每周7天,每天24h(7×24)不间断的网络监控、技术服务与支持,提供网络连接状况的检测服务,出现问题立即告警并及时通知用户。控制中心同时提供恒温、恒湿的机房环境,自动防火告警等服务。(5)增值性:数据中心除为用户提供从宽带接入、服务器托管和租用服务等基本服务外,还为用户提供网站策划、建设、营销,网站流量统计,网站搜索引擎等一揽子解决方案服务,同时将根据需求提供数据存储备份、异地容灾、CDN 网络加速等一系列的增值服务。5.2 数据中心基础网络5.2.1 数据中心广域网络组织1.数据中心网络出口组织

大型数据中心出口:全国级/省级数据中心共享一套网络设备,共享网络出口;出口应直连本省IP 省网核心节点,或直连城域网或大城域网核心层节点;出口链路应保证每天忙时平均带宽利用率不超过70%,出口链路采用负荷分担的方式工作。

一般数据中心出口:地市级数据中心接入省网或直辖市本地城域网汇聚/接入层节点,或城域网核心层节点,地市级数据中心出口链路应保证每天忙时平均带宽利用率不超过80%。

各级数据中心的网络出口具体连接如图5-1所示。图5-1 国内某电信运营企业数据中心的广域网络组织

上述全国级数据中心、省级数据中心和地市级数据中心的出口组织设计中,具体的链路带宽容量、上联位置可以在工程建设时根据实际的业务量预测、网络现状、流量预测及承载业务种类等进行确定。2.自治域划分

大型数据中心自治域:根据属地化维护的原则,全国级/省级数据中心应全部归属省级分支机构管理的自治域内。对于个别已经在本省数据中心业务中使用了独立自治域号的省级分支机构,可以继续利用该自治域开展业务。

一般数据中心自治域:地市级数据中心归属当地IP 城域网(或大城域网)自治域。5.2.2 数据中心局域网络结构1.数据中心局域网络结构

各级数据中心的局域网络采用分层设计原则,将数据中心局域网络分为Internet接入层、核心层、分布层。详见图5-2所示的数据中心局域网络分层结构。图5-2 数据中心局域网络分层结构(1)Internet接入层:Internet接入层提供数据中心与Internet(本地IP 城域网及全国骨干网)和其他地点数据中心的连接,负责与其连接的NSP(网络服务提供商)和其他地点数据中心交换路由信息,并提供对数据中心局域网络的拒绝服务(Denial of Service,DoS)攻击保护。

Internet接入层配置两台路由器设备,两台路由器可分别通过 GE/POS2.5G/10GE 等高速链路与上联节点路由器相连,两台路由器之间采用GE(具体链路带宽根据业务需求进行调整)的链路连接,通过 BGP4/OSPF/IS-IS 等路由协议来实现不同路径的流量分担,当一台路由器或上联线路出现故障时,路由将自动调整到正常工作的路由器,并通过开启路由协议的快速重路由特性缩短路由收敛时间。(2)核心层:核心层为数据中心局域网络提供高速的数据交换能力,核心层选用两台三层交换机,两台交换机同时工作且互为备份。根据业务需求,两台交换机分别以 GE 或更高速率的端口,采用单链路或捆绑链路上联Internet接入层的两台高端路由器。两台核心交换机之间可通过 1 条或多条 GE 链路连接,以保证数据链路的冗余性,并通过基于端口的速率限制或Diffserv(区分服务体系结构)QoS 策略等优先保证高级别客户的业务流量。(3)分布层:分布层将来自大量低速连接线路的数据汇总到较少的高速线路,并传递到核心层进行数据交换,或进行反向的数据分发。同时,也可用来完成一些需要的策略控制如优先级控制。分布层可选用多个高端口密度的三层交换机或二层交换机。每个交换机应以GE 或FE 同时联接至两台核心交换机,以保证交换能力及线路冗余性。

分布层以下连接各类服务器,包括用户托管的服务器、用户租用的服务器,数据中心对外提供DNS、Web等服务的服务器,数据中心对内提供计费、备份等服务的服务器等,统称为服务器集群(Server Farm)。服务器集群通常直接与分布层交换机相连。在满足带宽需求的前提条件下,可以在分布层下连一层交换机,例如:带宽共享用户的多台服务器可以共享分布层交换机的一个端口。2.局域网络结构设计

针对大型全国级数据中心,由于其客户类型为面向全国互联网用户提供服务的大型ICP、有影响力的知名网站、大中型企业集团,其局域网络多采用3层网络结构。针对省、地市级的数据中心,考虑到网络规模和当前的设备处理能力等多方面因素,可将 Internet接入层与核心交换层合设,以简化网络结构、提高核心设备的使用效率。5.2.3 数据中心网络分级

由于目前国内数据中心业务竞争空前激烈,同时数据中心的客户群体广泛,业务种类及服务质量等需求存在较大差异,因此将全国、省、地市 3 级数据中心的建设与客户需求及业务发展策略相对应,根据数据中心局域网络结构及网络性能方面的差异分为3个类别。

全国级数据中心网络按照一类数据中心要求进行建设,省级数据中心网络根据本地用户业务需求可按照一类/二类数据中心要求进行建设,地市级数据中心网络按照二类/三类数据中心要求进行建设。一至三类数据中心的网络结构和网络性能要求参见表5-1。表5-1 数据中心的网络结构和网络性能要求参照表5.2.4 IP地址

数据中心具有服务器和虚拟网段数量众多的特点,与其他大型局域网络类似,在对其进行IP 地址规划时应注意下列原则。(1)准确估计 IP 地址需求。由于 IP 地址是一种紧缺资源,因此在建设数据中心时有必要事先对需要的 IP 地址数量进行比较准确的估计,以免在业务开展时因缺少 IP 地址影响工作。根据经验数据,数据中心主机托管部分平均有60%左右的服务器需要合法IP 地址,其他部分的服务器平均有80%左右需要合法IP 地址。由于主机托管用户通常需要数据中心为其提供超出实际需要的IP 地址数量以利于将来扩展,而且在划分网段时会浪费一部分IP地址,因此数据中心预备的IP 地址数量应为服务器数量的1.2~1.5倍。(2)在进行IP 地址规划时,尽量使用变长子网掩码(VLSM)技术,减少因划分网段浪费的IP 地址数量。(3)尽量将数据中心的 IP 地址放在整数边界上,例如对 32 个 C 类网段,将其放在×.×.32.0到×.×.63.0,这样可以利用路由聚合(Route Aggregatation)技术减少路由表项,提高路由效率。5.3 网络管理

完备的网络管理是高水平数据中心的重要组成部分。网络管理不仅实现对网络设备的管理,同时实现对关键主机和应用系统的管理,具体可分为故障管理、配置管理、性能管理、安全管理、拓扑管理、报表管理等,数据中心运营单位可参考以下各部分管理功能进行管理流程设计和网管系统的建设。1.故障技术管理

故障管理主要对全网设备的故障、运行状态进行实时监控、历史统计并提供协助排障的手段,应包含告警管理和故障报告管理。(1)告警管理功能

① 告警实时监控,提供声光提示。

② 告警相关性分析,可从众多的告警中找出告警的根源,支持多设备间的相关性分析。按照需求屏蔽非根源告警、找出根源告警,从而使维护人员能够有效地定位、处理故障,减少告警风暴。

③ 支持告警级别重定义,即用户可按照自己的理解来随意定义告警级别。

④ 告警远程通知,支持告警送告警箱、告警转E-mail等。

⑤ 支持告警处理经验存储功能,为设备维护提供参考。

⑥ 用户可创建自己关心告警条件的“告警查询模板”,方便快速查看关心的告警,并可将查询结果生成报表。

⑦ 支持历史告警转存,节省用户存储空间,保证系统高效稳定。

⑧ 支持告警拓扑定位,快速了解产生告警的线路所处的网络位置。(2)故障报告管理功能

① 可产生故障的记录分析报告。

② 报告应包含故障类型、故障原因、故障严重程度等内容。

③ 针对报告功能可进行初始化、终止、挂起、恢复、查询等操作。

④ 系统应支持常规故障的自动排除。2.配置管理

配置管理主要为网络设备提供配置、变更等服务,建立网络设备名称同资源配置之间的映射关系。配置管理应包含如下功能。

① 可对设备进行远程配置管理。

② 可以自动收集、更新、显示网络设备配置。

③ 针对路由器可进行端口 Up/Down 配置、端口镜像配置、端口 L2/L3配置、端口聚合配置、主备倒换、单板复位、ARP 老化时间、L2转发表等的配置。

④ 针对交换机可进行写FLASH、设备复位、DHCP绑定配置(MAC-端口绑定、IP-MAC绑定、IP-MAC-端口的绑定)、DHCP 服务器/中继/客户配置、地址绑定配置、端口配置、端口聚合配置、

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载