云计算数据中心规划与设计(txt+pdf+epub+mobi电子书下载)


发布时间:2020-06-23 00:26:19

点击下载

作者:李劲

出版社:人民邮电出版社

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

云计算数据中心规划与设计

云计算数据中心规划与设计试读:

前言

随着云计算和大数据的兴起,云计算数据中心如雨后春笋般不断出现。未来云计算数据中心的发展势头更猛,以百度、腾讯、阿里巴巴为代表的互联网企业,中国电信、中国移动、中国联通等运营商,以及华为、浪潮等设备提供商,都有已建、在建或筹建的云计算数据中心。一段时间内,云计算中心和传统数据中心将并存,在未来5年内,云计算数据中心每年将以50%的增速发展。

云计算数据中心与传统数据中心的差异在哪里,如何建设和管理先进高效的云计算数据中心,是相关建设人员和管理维护人员面临的主要课题。与之相适应,涉及云计算数据中心的技术和学术研究也非常活跃,出版了大量书籍和文献,为业内人士带来了很大的方便。然而,在云计算数据中心规划设计这个极具经济意义和社会意义的重要领域内,仍然还有许多问题有待深入研究。作者根据多年从事数据中心规划、设计工作的总结和体会,融合近年来所承担的科技项目的有关成果,参考了一些兄弟单位和设备供应商的技术解决方案编写了本书,可以说是在这方面的初步尝试,也希望起到抛砖引玉的作用。

本书第1章从数据中心的发展趋势出发定义本书的重点研究内容。第2章对云计算中心项目建设流程和必要性、可行性的论证提出了相关方法。第3章对云计算中心总体建设方案进行了描述,归纳云计算中心相关建设标准、建设目标和原则、系统架构和各子系统组成等。第4章描述了基础设施相关建设标准。第5章介绍了数据中心电源系统的相关原理和建设方案。第6章对数据中心制冷系统的设计方案进行了详细阐述。第7章介绍了云数据中心的网络系统。第8章系统介绍了云计算系统的规划设计方法。第9章对云计算中心的信息安全提出了要求和解决方案。第10章介绍了数据中心的消防安全解决方案。第11章对云数据中心的运行维护管理提出了建设方案和相关建议。第12章介绍了云计算中心建设项目的招标方案建议。第13章对数据中心的环保、职业安全、职业卫生相关措施提出了建议。第14章对数据中心建设项目实施进度及人员培训提出了相关建议。第15章对项目投资估算提供依据,并对效益与指标分析方法提出了建议,为项目建设提供了评判依据。第16章分析了云数据中心相关项目的风险和风险管理手段。

云数据中心的规划、设计、建设已不再是传统意义上数据中心的规划、设计、建设,而是基于全新云计算技术、基于SDN网络通信技术和全新能源技术的数据中心建设。本书基于国内外相关技术标准,对这些技术进行了系统的总结和梳理,为云计算数据中心的建设提供全面的建设规划设计方案,为从事相关工作的各类工程人员提供相应的支撑。

本书内容繁多,编者的时间和水平有限,难免有所疏漏,请各位读者批评指正。作者第1章概述1.1 数据中心的定义和发展现状

数据中心在维基百科里给出的定义是“数据中心是一整套复杂的设施。它不仅包括计算机系统和其他与之配套的设备(如通信和存储系统),还包含冗余的数据通信连接、环境控制设备、监控设备以及各种安全装置”。谷歌在其发布的The Datacenter as a Computer一书中,将数据中心解释为“多功能的建筑物,能容纳多个服务器以及通信设备。这些设备被放置在一起是因为它们具有相同的对环境的要求以及物理安全上的需求,并且这样放置便于维护,而并不仅仅是一些服务器的集合”。

过去10多年,数据中心无论是在技术上还是部署上都极速发展,变化也快,但粗略来说可划分为3个阶段:第一阶段是以数据中心大集中(Data Center Consolidation)为主的DC 1.0;第二阶段以利用资源虚拟化(Virtualization)和服务动态管理(Dynamic Service Orchestration)为手段,以增加资源共享利用率和资源部署灵活度的DC 2.0,上述两个阶段技术上最大的分野为云计算技术的日趋成熟和大批量部署;第三阶段的DC 3.0是为了适应目前特别是大型网站(OTT)数据处理急速增长的业务需求而产生的,而其中大部分技术业界还在预研阶段,有很大程度的不确定性。

近年来,随着云计算的兴起,数据中心的发展呈大型化发展趋势,2我国每年建成的机房中面积超过3 000m的机房数目逐渐增多,小于23 000m的机房数目逐渐减少。我国在2009年以前建成的主流机房面22积都小于10 000m,直到2009年开始有占地面积大于10 000m的机房。在2011年后,每年建成的主流大型机房中约一半大于10 2000m。

从目前已建数据中心情况来看,三大运营商占据了主流机房数量的69%,第三方IDC运营商占据主流机房的31%。3 000万元~10 000万元投资额的项目在主流项目中占比最高,投资额小于3 000万元的项目占比24%,投资额大于10 000万元的项目占比31%。随着占地面2积大于3 000m的机房数目增多,投资额大于10 000万元的项目占比将越来越高。1.2 云计算发展趋势1.2.1 云计算定义

云计算的定义有多种说法。对于到底什么是云计算,至少有100种解释。现阶段被广为接受的定义是美国国家标准与技术研究院(NIST)提出的:云计算是一种按使用量付费的模式,这种模式提供可用的、便捷的、按需的网络访问,进入可配置的计算资源共享池(资源包括网络、服务器、存储、应用软件、服务),这些资源能够被快速提供,只需投入很少的管理工作,或与服务供应商进行很少的交互。1.2.2 云计算发展简史

1983年,太阳电脑(Sun Microsystems)提出了“网络是电脑”(The Network is the Computer),2006年3月,亚马逊(Amazon)推出了弹性计算云(Elastic Compute Cloud;EC2)服务。

2006年8月9日,谷歌首席执行官埃里克·施密特(Eric Schmidt)在搜索引擎大会(SES San Jose 2006)中首次提出了“云计算”(Cloud Computing)的概念。谷歌“云端计算”源于谷歌工程师克里斯托弗·比希利亚所做的“Google 101”项目。

2007年10月,谷歌与IBM开始在美国大学校园,包括卡内基梅隆大学、麻省理工学院、斯坦福大学、加州大学伯克利分校及马里兰大学等,推广云计算的计划,这项计划希望能降低分布式计算技术在学术研究方面的成本,并为这些大学提供相关的软硬件设备及技术支持(包括数百台个人电脑及BladeCenter与System x服务器,这些计算平台将提供1 600个处理器,支持包括Linux、Xen、Hadoop等开放源代码平台)。而学生则可以通过网络开发各项以大规模计算为基础的研究计划。

2008年1月30日,谷歌宣布在中国台湾启动“云计算学术计划”,与中国台湾的台湾大学、交通大学等学校合作,将这种先进的云计算技术大规模、快速地推广到校园。

2008年2月1日,IBM宣布在中国无锡太湖新城科教产业园为中国的软件公司建立全球第一个云计算中心(Cloud Computing Center)。

2008年7月29日,雅虎、惠普和英特尔宣布一项涵盖美国、德国和新加坡的联合研究计划,推出云计算研究测试床,推进云计算。该计划与合作伙伴创建6个数据中心作为研究试验平台,每个数据中心配置1 400~4 000个处理器。这些合作伙伴包括新加坡资讯通信发展管理局、德国卡尔斯鲁厄大学Steinbuch计算中心、美国伊利诺伊大学香槟分校、英特尔研究院、惠普实验室和雅虎。

2008年8月3日,美国专利商标局网站信息显示,戴尔正在申请“云计算”(Cloud Computing)商标,此举旨在加强对这一未来可能重塑技术架构的术语的控制权。

2010年3月5日,Novell与云安全联盟(CSA)共同宣布一项供应商中立计划,名为“可信任云计算计划”(Trusted Cloud Initiative)。

2010年7月,美国国家航空航天局和包括Rackspace、AMD、英特尔、戴尔等支持厂商共同宣布OpenStack开放源代码计划,微软在2010年10月表示支持OpenStack与Windows Server 2008 R2的集成;而Ubuntu已把OpenStack加至11.04版本中。

2011年2月,思科系统正式加入OpenStack,重点研制OpenStack的网络服务。1.2.3 云计算的特点

云计算通过使计算分布在大量的分布式计算机上,而非本地计算机或远程服务器中,企业数据中心的运行将与互联网更相似,使得企业能够将资源切换到需要的应用上,根据需求访问计算机和存储系统。

好比是从古老的单台发电机模式转向了电厂集中供电的模式,它意味着计算能力也可以作为一种商品进行流通,就像煤气、水电一样,取用方便,费用低廉。最大的不同在于,它是通过互联网进行传输的。

被普遍接受的云计算特点如下。1.超大规模“云”具有相当的规模,谷歌云计算已经拥有100多万台服务器,亚马逊、IBM、微软、雅虎等企业的“云”均拥有几十万台服务器。企业私有云一般拥有数百上千台服务器。“云”能赋予用户前所未有的计算能力。2.虚拟化

云计算支持用户在任意位置、使用各种终端获取应用服务。所请求的资源来自“云”,而不是固定的、有形的实体。应用在“云”中某处运行,但实际上用户无须了解、也不用担心应用运行的具体位置,只需要一台笔记本或者一个手机,就可以通过网络服务来实现我们需要的一切,甚至包括超级计算这样的任务。3.高可靠性“云”采用了数据多副本容错、计算节点同构可互换等措施来保障服务的高可靠性,使用云计算比使用本地计算机更可靠。4.通用性

云计算不针对特定的应用,在“云”的支撑下可以构造出千变万化的应用,同一个“云”可以同时支撑不同的应用运行。5.高可扩展性“云”的规模可以动态伸缩,满足应用和用户规模增长的需要。6.按需服务“云”是一个庞大的资源池,按需购买;云可以像自来水、电、煤气那样计费。7.极其廉价

由于“云”的特殊容错措施,可以采用极其廉价的节点来构成云,“云”的自动化集中式管理使大量企业无须负担日益高昂的数据中心管理成本,“云”的通用性使资源的利用率较之传统的系统大幅提升,因此用户可以充分享受“云”的低成本优势,经常只要花费几百美元、几天时间就能完成以前需要数万美元、数月时间才能完成的任务。

云计算可以彻底改变人们未来的生活,但同时也要重视环境问题,这样才能真正为人类的进步做贡献,而不是简单的技术提升。1.2.4 云计算演化

云计算主要经历了4个阶段才发展到现在这样比较成熟的水平,这4个阶段依次是电厂模式、效用计算、网格计算和云计算。

电厂模式阶段:利用电厂的规模效应来降低电力的价格,并让用户使用起来更方便,且无须维护和购买任何发电设备。

效用计算阶段:在1960年左右,当时计算设备的价格是非常高昂的,远非普通企业、学校和机构所能承受,所以很多人产生了共享计算资源的想法。1961年,人工智能之父麦肯锡在一次会议上提出了“效用计算”这个概念,其核心借鉴了电厂模式,具体目标是整合分散在各地的服务器、存储系统以及应用程序来共享给多个用户,让用户能够像把灯泡插入灯座一样来使用计算机资源,并且根据其所使用的量来付费。但由于当时整个IT产业还处于发展初期,很多强大的技术还未诞生,比如互联网等,所以虽然这个想法一直为人称道,但是总体而言是“叫好不叫座”。

网格计算阶段:网格计算研究如何把一个需要非常巨大的计算能力才能解决的问题分成许多小的部分,然后把这些部分分配给许多低性能的计算机来处理,最后把这些计算结果综合起来攻克大问题。可惜的是,由于网格计算在商业模式、技术和安全性方面的不足,使得其并没有在工程界和商业界取得预期的成功。

云计算阶段:云计算的核心与效用计算和网格计算非常类似,也是希望IT技术能像使用电力那样方便,并且成本低廉。但与效用计算和网格计算不同的是,2014年以来在需求方面已经有了一定的规模,同时在技术方面也已经基本成熟了。1.2.5 云计算发展方向

21世纪10年代云计算作为一个新的技术趋势已经得到了快速的发展。云计算已经造就了一个前所未有的工作方式,也改变了传统的软件工程企业。以下几个方面可以说是云计算现阶段发展最受关注的几大方面。1.云计算扩展投资价值

云计算简化了软件、业务流程和访问服务,并且帮助企业操作和优化他们的投资资源,不仅降低了成本,梳理了有效的商业模式,还提供了更大的灵活性。有很多的企业通过云计算优化他们的投资。在相同的条件下,企业提升了自身创新能力与IT水平,这将会给企业带来更多的商业机会。2.混合云计算的出现

企业使用云计算(包括私人和公共)来补充他们的内部基础设施和应用程序。专家预测,这些服务将优化业务流程的性能。采用云服务是一个新开发的业务功能。在这种情况下,按比例快速变化将成为一个优势。3.以云为中心的设计

越来越多的企业将组织设计作为云计算迁移的元素。这是一个主流趋势,预计增长将随之扩展到不同的行业。4.移动云服务

增长迅速的移动终端,如平板电脑和智能手机在移动服务中发挥了更多的作用。许多这样的设备被用来实现规模业务流程、通信等功能。更多的云计算平台和API将提供移动云服务。5.云安全

人们担心他们在云端的数据安全。正因为此,用户期待看到更安全的应用程序和技术出现。许多新的加密技术、安全协议,在未来会越来越多地呈现出来。1.3 云计算数据中心的演进和发展方向

随着云计算的普及,目前传统数据中心的建设正面临异构网络、静态资源、管理复杂、能耗高等方面的问题,云计算数据中心(以下简称云数据中心)与传统数据中心有所不同,它既要解决如何在短时间内快速、高效地完成企业级数据中心的扩容部署问题,同时要兼顾绿色节能和高可靠性要求。高利用率、一体化、低功耗、自动化管理成为云计算数据中心建设的关注点,整合、绿色节能成为云计算数据中心构建技术的发展特点。

数据中心的整合首先是物理环境的整合,包括供配电和精密制冷等,主要问题是解决数据中心基础设施的可靠性和可用性。进一步的整合是构建针对基础设施的管理系统,引入自动化和智能化管理软件,提升管理运营效率。还有一种整合是存储设备、服务器等的优化、升级,以及推出更先进的服务器和存储设备。艾默生公司就提出,整合创新决胜云计算数据中心。

兼顾高效和绿色节能的集装箱数据中心的出现。集装箱数据中心是一种既吸收了云计算的思想,又可以让企业快速构建自有数据中心的产品。与传统数据中心相比,集装箱数据中心具有高密度、低PUE、模块化、可移动、灵活快速部署、建设运维一体化等优点,成为发展热点。国外企业如谷歌、微软、英特尔等已经开始开发和部署大规模的绿色集装箱数据中心。

通过服务器虚拟化、网络设备智能化等技术可以实现数据中心的局部节能,但尚不能真正实现绿色数据中心的要求,因此,以数据中心为整体目标来实现节能降耗正成为重要的发展方向,围绕数据中心节能降耗的技术将不断创新并取得突破。数据中心高温化是一个发展方向,低功耗服务器和芯片产品也是一个方向。1.4 本书重点研究内容

云计算的蓬勃发展,给云计算数据中心的建设带来了机遇和挑战,建设规模越来越大,建设过程也越来越复杂,建设成本极高。在云计算数据中心的项目建设过程中,完善的规划设计方案将成为项目成败的关键。

本书重点将从如何制定完善的云计算数据中心硬件设施建设项目的规划设计方案的角度,为云计算数据中心建设的投资方、建设方、承建方、设备厂商和相关工程技术人员提供相关的资料和建议。内容涵盖基础设施、电力、制冷、网络及综合布线、云计算系统架构规划、信息安全、机房环境和消防、运行维护和项目建设管理等全过程。本书简洁、全面地介绍了云计算中心项目硬件设施的规划设计,推动云计算数据中心的发展和进步。第2章云计算数据中心项目建设流程和必要性、可行性论证2.1 云计算数据中心建设需求分析2.1.1 需求的产生

随着社会信息化的发展,IT技术的应用越来越普遍,各行各业需要更多的服务器、存储设备来满足这些应用的承载,云计算和大数据分析技术的出现,对服务器和存储设备的使用需求呈几何级数的增加,如何安置和维护好这些IT设备,常常通过数据中心项目来满足需求。需求是产生项目的基本前提。2.1.2 需求识别

需求识别是项目启动阶段的首要工作,需求识别始于需求,问题或机会的产生通过需求建议书终结。云计算数据中心建设项目的需求识别,是为了使项目所期望的目标能以更好的方式来实现,项目建设方要清楚地指定,只有需求明确,设计出好的项目规划方案,承建方才能更准确地把握建设方意图,这对项目是大有益处的。

需求识别是一个过程,需求产生之时也就开始了识别需求。尽管产生了需求,作为数据中心项目的投资或建设方,此时萌发的是要得到什么的愿望,或感觉到缺乏什么,这时候还是一种朦胧的念头,还不清楚具体什么样的数据中心才能满足这种愿望,所期望的还可能只是一个范围,于是就要收集信息和资料、进行调查和研究,从而确定到底是怎样的数据中心才能满足需求。当然在需求识别的过程中还需要考虑一系列的约束条件,需求识别并非想入非非、随意而定的。有时,识别需求也并非是云计算数据中心建设投资方的个体行为,他们可能受到熟知群体的影响,比如数据中心领域的专家等,向他们征求建议,也可能向承建方请求他们的帮助,因为承建方在数据中心建设方面是专家,更能解决专业问题。当云计算数据中心的需求界定之后,就可开始准备需求建议书了,这就是从投资建设方的角度出发,全面详细地论述、表明本项目期望的目标或者期望得到什么,这种期望实质上就是项目目标的雏形。当需求建议书准备完毕后,投资建设方剩下的工作就是向潜在的承建方发送需求建议书(招标文件),以便从回复的项目申请书(应标文件)中评选出候选承建方(中标方),在招标公示流程后签订建设合同。至此需求识别告一段落。

需求的识别过程对投资建设方来说无疑是至关重要的。在现实的案例中,经常会遇到这样的例子,招标文件没有明确的建设需求,往往在实施过程中成为建设双方争论的焦点。责任是明确的:一方面,投资建设方没有明确告诉委托人希望的目标;另一方面,承建方也没有进行充分的调查研究。双方都具有一定的责任。

可以看出,需求识别的过程和作为对于云计算数据中心项目管理是异常重要的,需求识别意味着从开始时就避免了项目投资的盲目性。一份良好的需求建议书便是投资建设方与承建方沟通的基本条件,也是项目取得成功的关键。2.1.3 需求建议书

需求建议书就是从投资建设方的角度出发,全面、详细地向承建方陈述、表达为了满足其已识别的需求应做哪些准备工作。也就是说,需求建议书是承建方发出的,用来说明如何满足其已识别需求的建议书。一份良好的需求建议书,主要包括:满足其需求的项目的工作陈述、对项目的要求、期望的项目目标、客户供应条款、付款方式、项目时间、对承建方的投标响应文件要求等。因此,需求建议书往往作为招标技术文件的一部分,在项目的招投标阶段作为要约发送给潜在的承建方。

好的需求建议书能让项目承建方把握客户所期待的产品或服务是什么,或者说所希望得到的是什么,只有这样,承建方才能准确地进行项目识别、项目构思等,从而面向客户提交一份有竞争力的方案建议书。因此,项目投资建设方的需求建议书应当是全面的、明确的,能够提供足够的信息,以使得承建方能够把握客户的主体思想。

项目投资建设方为了全面、准确地向承建方表达项目的意图,就需要认真、充分地准备一份好的需求建议书,一般应包含以下内容:

1.云计算数据中心项目的总体陈述;

2.项目的目标;

3.项目目标的规定;

4.项目供应;

5.项目的付款方式;

6.项目进度计划;

7.对交付物的评价标准;

8.有关承建方投标的事项;

9.投标方案的评审标准。2.2 云计算数据中心项目建设流程

云计算数据中心项目建设运营周期与一般项目建设流程类似,有一个完整、高效、规范的建设流程,有效地保证网络建设的水平和效率。该流程可以分为3个时期8个阶段,如图2.1所示。图2.1 项目建设全过程

首先是项目前期(立项阶段),包括项目建议书和可行性研究报告两个阶段;其次是建设期(实施阶段),包括初步设计、设备厂商或承建方招标或技术谈判、施工图设计、施工4个阶段;最后是投产期(竣工验收阶段),包括竣工验收(初验、终验)、项目投产两个阶段。

项目建议书主要内容包括:对市场需求、技术发展、现有网络进行初步分析;提出网络的初步建设方案;对建设方案进行比较并选择;投资估算以及投资分析;重点在于多方案比较(技术、经济)。其作用为建设单位对项目做出的初步决策提供依据。

项目可行性研究报告主要内容包括:市场的需求、技术的发展、现有网络的进一步分析;提出初步网络建设方案;建设方案的比较并进行选择;投资估算以及经济分析;重点在于工程的经济可行性(包含建设规模、收入、投资、经营成本的预测)。其目的和作用是作为工程建设单位向政府或决策部门(董事会)申请立项的依据。

初步设计阶段主要内容包括:论述工程建设的理由、工程的建设方案;提出设备选型,采取重大技术措施,对技术指标与经济指标进行分析、研究,方案比选并推荐采用的方案,并进行工程设备配置、工程的投资概算;重点在于工程总体建设方案的比选以及投资概算。其目的是作为工程项目技术上的总体规划,为施工做准备,确定投资额度。初步设计阶段责任单位为项目设计单位。

设备厂商或承建方招标或技术谈判阶段主要内容包括:根据审定的设计方案,编制工程技术规范书;与设备供应商技术谈判;通过招投标等方式确定设备供应商或项目承建方;签订设备购买或项目总承包合同;重点在于技术、商务比较。其目的是保证工程进度、工程质量;采购合适的设备(技术、经济)和承建方。责任单位为建设单位和设计单位。

施工图设计的主要内容包括提出工程实施的具体措施(工程设备配置、工程技术措施);绘制施工图纸;编制工程预算。其目的是指导施工,便于工程竣工、决算。责任单位为设计单位。

施工阶段主要内容为:施工现场复勘;工程施工和设备安装;设备安装后,先对设备单机测试;后对系统段测试;最后联网测试;编制竣工资料。责任单位为项目承建方。

竣工验收阶段主要内容包括:编制工程验收指标;工程验收小组对工程质量全面检验;审查竣工验收报告;确定竣工决算。其目的是尽快将系统投入使用;控制投资规模。工程验收小组人员应由建设、监理、维护管理、生产、设计、施工单位等部门组成。

投产试用期主要内容包括:竣工验收合格的工程由维护生产单位接管运营,根据竣工决算进行固定资产登记。2.3 项目建设可行性论证

可行性分析是通过对项目的主要内容和配套条件,如市场需求、资源供应、建设规模、工艺路线、设备选型、环境影响、资金筹措、盈利能力等,从技术、经济、工程等方面调查研究和分析比较,并对项目建成以后可能取得的财务、经济效益及社会环境影响预测,从而提出该项目是否值得投资以及如何建设的咨询意见,为项目决策提供依据的一种综合性的系统分析方法。可行性分析应具有预见性、公正性、可靠性、科学性的特点。2.3.1 可行性研究的依据

一个拟建项目的可行性研究,必须在国家有关的规划、政策、法规的指导下完成,同时,还必须要有相应的各种技术资料。可行性研究工作的主要依据包括:

① 国家经济和社会发展的长期规划,部门与地区规划,经济建设的指导方针、任务、产业政策、投资政策和技术经济政策以及国家和地方法规等;

② 经过批准的项目建议书和在项目建议书批准后签订的意向性协议等;

③ 由国家批准的资源报告,国土开发整治规划、区域规划和工业基地规划,对于交通运输项目建设要有相关的江河流域规划与路网规划等;

④ 国家进出口贸易政策和关税政策;

⑤ 当地的拟建厂址的自然、经济、社会等基础资料;

⑥ 有关国家、地区和行业的工程技术、经济方面的法令、法规、标准定额资料等;

⑦ 由国家颁布的建设项目可行性研究及经济评价的有关规定;

⑧ 包含各种市场信息的市场调研报告。

可行性研究工作对于整个项目建设过程乃至整个国民经济都有非常重要的意义,为了保证可行性研究工作的科学性、客观性和公正性,需有效地防止错误和遗漏,可行性研究的一般要求如下。(1)首先必须站在客观公正的立场调查研究,做好基础资料的收集工作。对于收集的基础资料,要按照客观实际情况论证评价,如实地反映客观经济规律,从客观数据出发,通过科学分析得出项目是否可行的结论。(2)可行性研究报告的内容深度必须达到国家规定的标准,基本内容要完整,应尽可能多地占有数据资料,避免粗制滥造,搞形式主义。

在做法上要掌握好以下4个要点。

① 先论证,后决策。

② 处理好项目建议书、可行性研究、评估这3个阶段的关系,哪一个阶段发现不可行都应当停止研究。

③ 要将调查研究贯彻始终。一定要掌握切实可靠的资料,以保证资料选取的全面性、重要性、客观性和连续性。

④ 多方案比较,择优选取。对于涉外项目,或者在加入WTO等外在因素的压力下必须与国外接轨的项目,可行性研究的内容及深度还应尽可能地与国际接轨。(3)为保证可行性研究的工作质量,应保证咨询设计单位有足够的工作周期,防止因各种原因造成不负责任、草率行事的现象发生。

具体工作周期应由委托单位与咨询设计单位在签订合同时协商确定。2.3.2 可行性研究主要内容

各类投资项目可行性研究的内容及侧重点因行业特点而差异很大,但一般应包括以下内容。(1)投资必要性。在投资必要性的论证上,一是要做好投资环境的分析,对构成投资环境的各种要素进行全面的分析论证;二是要做好市场研究,包括市场供求预测、竞争力分析、价格分析、市场细分、定位及营销策略论证。(2)技术可行性。主要从项目实施的技术角度,合理设计技术方案,并比选和评价。各行业不同项目的技术可行性的研究内容及深度差别很大。对于工业项目,可行性研究的技术论证应达到能够比较明确地提出设备清单的深度;对于各种非工业项目,技术方案的论证也应达到工程方案初步设计的深度,以便与国际惯例接轨。(3)组织可行性。制定合理的项目实施进度计划、设计合理的组织机构、选择经验丰富的管理人员、建立良好的协作关系、制定合适的培训计划等,保证项目顺利执行。(4)风险因素及对策。主要对项目的市场风险、技术风险、财务风险、组织风险、法律风险、经济及社会风险等风险因素做评价,制定规避风险的对策,为项目全过程的风险管理提供依据。

上述可行性研究的内容,适用于不同行业、各种类型的投资项目。我国缺乏对各类投资项目可行性研究的内容及深度进行统一规范的方法,各地区、各部门制定的各种可行性研究的规定,基本上都是根据工业项目可行性研究的内容为主线制定的,并且基本上是以联合国工业发展组织的《工业项目可行性研究报告编制手册》为蓝本来编写的。我国急需一个各行业通用的、对可行性研究的内容及深度提出共性要求的统一规定,以规范整个可行性研究工作,避免各种非工业项目可行性研究都要参照工业项目的尴尬局面。

一般项目可行性研究的内容,均应设专章论述投资必要性、技术可行性、财务可行性、组织可行性和风险分析等内容。对于工业项目,应设多个章节对原材料供应方案、厂址选择、工艺方案、设备选型、土建工程、总图布置、辅助工程、安全生产、节能措施等技术可行性的各方面内容进行研究。对于非工业项目,应重视项目的经济和社会评价,重点评价项目的可持续性和对经济、社会、环境的影响。

在可行性研究中,咨询工程师应根据项目的特点,合理确定可行性研究的范围和深度,应按照下列步骤开展咨询工作:①了解业主意图;②明确研究范围;③组成项目小组;④搜集资料;⑤现场调研;⑥方案比选和评价;⑦编写报告。第3章云计算数据中心总体建设方案3.1 数据中心建设相关标准

云计算数据中心的建设涵盖了建筑及结构、给排水、电气技术、暖通空调、计算机通信、消防、智能楼宇等多个专业技术,国内和国际上在数据中心总体设计和各专业领域已出台多个相关标准和规范。因此,我们在规划设计云计算数据中心的过程中,不仅要考虑满足客户的需求,同时要遵循标准和规范。本书将以最新的中国国家标准《数据中心设计规范》(GB 50174-2017)为总纲,同时参考美国国家标准学会(ANSI)2005年批准颁布的《数据中心电信基础设施标准》(TIA-942标准),指导云计算数据中心各子系统的规划设计。云计算数据中心的建设相关规范包括以下规范。1.总体规范(1)国家标准《数据中心设计规范》(GB 50174-2017),2018年1月1日生效。包含机房分级及性能要求、机房位置与设备布置、环境要求、建筑与结构、空气调节、电气、电磁屏蔽、机房布线、机房监控与安全规范、给水排水、消防。(2)《互联网数据中心(IDC)工程设计规范》(YD 5193-2014)。主要内容包括互联网数据中心(IDC)的业务、系统组成、IDC分级、机房设施子系统、网络子系统、资源子系统、业务子系统、管理子系统、安全、计费、IP地址与码号、服务质量、能耗、设备配置要求等。(3)美国国家标准学会(ANSI)2005年批准颁布的《数据中心电信基础设施标准》(TIA-942标准)。包含数据中心空间与布局、电源系统、布线路由、冗余、分级标准等。2.建筑及结构规范(1)《电子计算机场地通用规范》(GB/T 2887-2011)。(2)《电信专用房屋设计规范》(YD/T 5003-2014)。(3)《公共建筑节能设计规范》(GB 50189-2015)。(4)《绿色建筑评价标准》(GB/T 50378-2014)。(5)《建筑照明设计标准》(GB 50034-2013)。(6)《建筑装饰装修工程质量验收规范》(GB 50210-2001)。3.给排水规范(1)《建筑给水排水设计规范》(GB 50015-2010)。(2)《室外给水设计规范》(GB 50013-2006)。(3)《室外排水设计规范》(GB 50014-2006)。4.电气技术规范(1)《供配电系统设计规范》(GB 50052-2009)。(2)《10kV及以下变电所设计规范》(GB 50053-2003)。(3)《低压变配电设计规范》(GB 50054-2009)。(4)《3~110kV高压配电装置设计规范》(GB 50060-2008)。(5)《民用建筑电气设计规范》(JGJ 16-2008)。(6)《建筑物防雷设计规范》(GB 50057-2010)。(7)《信息技术设备用不间断电源通用技术条件》(YD/T 1095-2008)。5.暖通空调规范(1)《采暖通风与空气调节设计规范》(GB 50019-2015)。(2)《通风与空调工程施工质量验收规范》(GB 50243-2016)。6.计算机通信规范(1)《综合布线系统工程设计规范》(GB 50311-2015)。(2)《电信机房铁架安装设计标准》(YD/T 5026-2005)。(3)《计算机机房用抗静电活动地板技术条件》(SJ/T 10796-2001)。(4)《数据中心基础设施施工及验收规范》(GB 50462-2015)。(5)《综合布线系统工程验收规范》(GB/T 50312-2016)。7.消防规范(1)《建筑设计防火规范》(GB 50016-2014)。(2)《气体灭火系统设计规范》(GB 50370-2005)。(3)《火灾自动报警系统设计规范》(GB 50116-2013)。8.智能楼宇规范(1)《智能建筑设计标准》(GB/T 50314-2015)。(2)《安全防范工程技术规范》(GB 50348-2004)。(3)《视频安防监控系统工程设计规范》(GB 50395-2007)。3.2 云计算数据中心分类

在数据中心规划时,业界一般会首先考虑数据中心的定位,机房(机楼)的定位决定了数据中心的规模和建设条件。机房的分类主要根据机房的硬件设施,结合软件设施进行分类。这里主要介绍GB 50174-2017和TIA/EIA-942的IDC机房分类。

在数据中心建设过程中,业界可以根据机房的建设目标按照分类要求建设,即机房分类作为机房建设的输入条件,也可能机房先建设好了,根据分类标准归类。在制定数据中心建设方案时,业界需要关注客户业务需求,分析机房的分类规划,作为机房硬件设备配置的输入条件。3.2.1 GB 50174-2017机房分级

数据中心机房应划分为A 、B 、C 三级。设计时应根据机房的使用性质、管理要求及其在经济和社会中的重要性确定所属级别。

符合下列情况之一的数据中心机房应为A 级:(1)电子信息系统运行中断将造成重大的经济损失;(2)电子信息系统运行中断将造成公共场所秩序严重混乱。A 级电子信息系统机房内的场地设施应按容错系统配置,在电子信息系统运行期间,场地设施不应因操作失误、设备故障、外电源中断、维护和检修而导致电子信息系统运行中断。

符合下列情况之一的电子信息系统机房应为B 级:(1)电子信息系统运行中断将造成较大的经济损失;(2)电子信息系统运行中断将造成公共场所秩序混乱。B 级电子信息系统机房内的场地设施应按冗余要求配置,在系统运行期间,场地设施在冗余能力范围内,不应因设备故障而导致电子信息系统运行中断。

不属于A 级或B 级的电子信息系统机房为C 级。C 级电子信息系统机房内的场地设施应按基本需求配置,在场地设施正常运行情况下,应保证电子信息系统运行不中断。

本标准与TIA/EIA-942的区别主要在于等级的划分,A级对应TIA/EIA-942的Tier 4,B级对应TIA/EIA-942的Tier 2,C级对应TIA/EIA-942的Tier 1,Tier 3基本归类为A级。3.2.2 TIA/EIA-942机房分级1.Tier 1机房:基本的机房基础设施(1)基本配置要求

Tier 1机房定义为基本配置机房。基本配置机房内的计算机设备具有无备援容量的电力配送和制冷组件,具有单一或无备份电力配送和制冷分配路径来供应计算机设备。即使有UPS或者发电机,也是单模块系统,具有多处单故障点。(2)性能确认

具有足够的空间容量满足机房设备安装的需求;或许有(也许没有)架空地板;系统故障会影响大部分基础设施系统中的计算机设备、系统和用户体验。(3)操作影响

机房运行易受已计划活动和计划外的活动影响。计划内和计划外的活动都会很容易引起机房整体运行中断。

机房基础设施(系统、组件或分配路径等元素)中断或故障将会影响机房计算机设备的运行。

对于机房基础设施各组件的人为操作错误或自然故障将导致整个数据中心运行中断。

为了实现预防性的维护和维修,基础设施需完全地手动关闭。一般情况下,基础设施每年需要完全关闭一次,确保安全地进行必要的预防性保养和维修工作;紧急情况下,可能需要更频繁的系统关闭;如未定期维修,将大大增加意外中断的风险,以及后续出现严重故障的可能性。

Tier 1数据中心机房的可用性为99.671%。2.Tier 2机房:具冗余组件级机房基础设施(1)基本要求

Tier 2机房具有一些冗余的部件或备援容量组件。具有部分备援容量的电力配送和制冷组件,具有单一或部分备援电力配送和制冷分配路径来供应计算机设备。UPS和发电机的设计容量是N+1,且为单回路设计,因此有单点中断可能。(2)性能确认

冗余部件或备援容量组件可以有计划地从服务中删除,不会导致机房整体运行中断。

数据中心配备架空地板。

对关键分配路线和其他基础设施维护仍需要程序化地关闭设备。删除分配路线或其他备援组件仍需要关闭部分工作的计算机设备。(3)操作影响

机房运行易受已计划活动和计划外的活动所影响。计划内和非计划性的活动引起数据中心中断的可能性小于Tier 1级数据中心。计划外的活动会很容易引起机房整体运行中断。任何计划外的冗余部件失效也许会影响计算机设备。计划外之任何冗余系统中断或故障将会影响计算机设备。

机房基础设施组件的人为操作错误也许会导致机房整体运行中断。

机房基础设施各组件的人为操作错误或自然故障将导致机房整体运行中断。

机房基础设施每年必须完全关闭一次,确保安全地进行必要的预防性保养和维修工作;紧急情况下可能需要更频繁的系统关闭;如未定期维修,将大大增加意外中断的风险,以及后续出现严重故障的可能性。

Tier 2数据中心的可用性为99.741%。3.Tier 3机房:可并行维护级机房基础设施(1)基本要求

Tier 3机房具有冗余部件和备援容量组件;具有多个独立的备援电力配送和制冷分配路径来供给计算机设备;任何时候只需要一个分配路径即可供给计算机设备。

所有的IT设备都是双电源的。数据中心的容错电力遵循规范(版本2.0)所定义的,且正确安装并与该机房基础设施的拓扑架构兼容。任何传输设备,如使用点开关则必须纳入不符合本规范的计算机设备内。(2)性能确认

每个在分配路径中的部件或组件的备份容量部件或组件,都可以有计划地从服务中移除,不会造成任何计算机设备中断。

当备援组件因任何原因导致从服务中被删除时,要有足够的永久备份容量以满足机房的需求。对于大型系统,这意味着是两个独立的通路,必须有充足的处理能力和配电通路,允许在一条通路承担负载工作的同时,另外一条通路进行维护和测试。(3)操作影响

操作人员可以在不引起计算机硬件运行中断的情况下,进行所有计划内的现场活动。计划性的活动包括:保护性和程序式的维护、维修和组件替换,增加或者减少与处理能力相关的部件,对部件和系统测试,节能改造活动以及更多的活动。

机房整体运行易受计划外活动影响。任何计划外活动(如操作错误或者设施部件自然故障)导致的容量系统中断或失效,将会影响计算机设备或机房的整体运行。任何计划外之容量组件或分配要素中断或失效,也许会影响计算机设备。机房基础设施组件的人为操作错误也许会导致机房设备运行中断。

计划内的机房基础设施维修,可以使用备援容量部件和备份分配路径来安全地替代维修设备执行任务。

在维修期间,损坏的风险可能会升高(此类保养状况不会使正常运作达成之等级评定无效)。

在客户的业务需求允许增加成本进行更高级保护时,Tier 3数据中心机房通常可以升级到Tier 4级数据中心机房。

Tier 3数据中心机房的可用性为99.982%。4.Tier 4机房:容错级机房基础设施(1)基本要求

Tier 4机房:容错级机房具有多个独立的、完全隔离的备份容量组件系统,具有独立、多样化的有效分配路径,同时为计算机设备供应电力配送和制冷分配。备份容量组件及多元化分配路径,须配置成N的容量,在基础设施发生任何故障时可以提供计算机设备电力和冷却。

所有的IT设备是双电源的,机房容错电力遵循规范(版本2.0)所定义的并且正确安装,须与该机房基础设施的拓扑架构相同。传输设备如使用点开关,必须纳入不符合本规范的计算机设备内。

基础设施的备份系统和备份分配路径必须完全地彼此隔离(隔间),以防止任何单一事件同时影响主用/备份系统或分配路径。

连续冷却是必需的。(2)性能确认

任何基础设施主用/备用系统及其组件,任何基础设施主用/备用分配路径及其组件的单一故障不会影响到计算机设备的运行。系统会自动自我恢复,以防止故障进一步影响到该机房的整体运行。

每个在分配路径中的备份系统及其组件,都可以有计划地从服务中移除,不会对计算机设备和机房整体运行造成任何影响。

当备份系统及其组件,或分配路径因任何原因从服务中被移除时,机房基础设施有足够的容量,可以满足机房正常整体运行的需求。(3)操作影响

数据中心机房运行不会受计划内事件的影响。Tier 4机房的基础设施的性能和能力可以保证任何计划内活动不会引起关键负载的中断。

数据中心机房运行不会受任何单一计划外活动的影响。数据中心基础设施的容错能力可以为基础设施提供能忍受至少一次的最糟糕的情况——计划外故障或非关键性负载事件的冲击能力。这需要同时工作的两条配送途径,通常是双系统(S+S)的配置;从电力角度考虑,需要两个独立的(N+1)UPS系统。

计划内的机房基础设施维修,可以使用备份系统及其部件和备份分配路径来安全地替代维修设备执行任务。在维修期间,如果备份系统及其部件和备份分配路径关闭,会因基础设施其他分配路径发生故障导致计算机设备损坏以及机房整体运行中断的风险相对升高(此类保养配置不会使正常运作达成的等级评定无效)。

根据消防和供电安全规范要求,由于火灾报警或灭火行动启动了紧急停电程序(EPO),导致停机事件的发生,这可能导致机房运行中断。

全面地达到Tier 4级机房的要求并不容易,需要较大的投资和较长的时段。以下几个要素是Tier 4机房的特征要求:(1)至少3 000 2m以上;(2)70~80个经验丰富的专业化管理人员;(3)独立建筑且功能分区;(4)双系统,双信道甚至多信道备份;(5)可用性达到99.995%。3.3 能效模型评估3.3.1 能效定义《中华人民共和国节约能源法》指出,所谓节能是指加强用能管理,采取技术上可行、经济上合理以及环境和社会可以承受的措施,减少从能源生产到消费各个环节中的损失和浪费,更加有效、合理地利用能源。因此,现代意义的节约能源并不是简单地减少使用能源,降低生活品质,而应该是提高能效,降低能源消耗,也就是“该用则用、能省则省”。能效,即能源效率,一般是指在能源利用中,发挥作用的能源量与实际消耗的能源量之比。从数据中心运营及使用角度看,数据中心的能效可以广义地定义为数据中心服务器所执行的运算任务与任务执行过程中所耗费的总能量之比。3.3.2 数据中心能耗结构

数据中心是能够容纳多个计算机或服务器及与之配套的通信和存储设备的多功能建筑物,它包含一整套的复杂设施,如电源保障系统、环境控制设备、安全装置等。相比于传统的机房,数据中心具有高密度、规模化、高可靠性和运营方式灵活的特点。随着云计算的快速发展,数据中心越来越成为信息存储、处理的重要载体。与一般的建筑设施不同,为了保证计算机系统的安全可靠运行,数据中心能耗一般能达到同样面积的办公楼的100~200倍,如此大的耗电量使能耗管理成为数据中心设计者和运营商需要考虑的重要问题。能耗管理的主要目的是提高能源使用的效率和降低所有与能耗相关的经济及环境代价,具体来说,数据中心的业主关心能耗带来的投资及运营成本,而社会及政府则需要关注高能耗对环境的影响。

一个典型的数据中心主要由冷水机组、室内空调、供配电系统、IT设备及照明等几个部分消耗电能,其中,核心的IT设备,包括计算、存储、网络等,约消耗整个数据中心30%的能耗,而配套及保障设施需要消耗其他约70%的电能。这些配套设施中,为保证IT设备运行所需的温度、湿度环境而使用的制冷设备、室内空调等耗能最多,约占整个数据中心能耗的30%~50%,而用于满足IT设备电压、电流要求及保证供电安全可靠性的UPS及配电单元等电源设备需要消耗约20%~25%的电能。3.3.3 能耗影响因素

影响数据中心能耗的因素很多,包括数据中心的环境影响、设备运行过程中的能源损耗、为保障IT设备安全可靠运行的冗余设备的能源消耗,以及能源管理的效率等。1.设备能源损耗

数据中心的设备能源损耗主要来源于两个部分,第一部分是UPS的转换损耗,通常UPS在负载较高时转换效率为88%~94%,最新的飞轮UPS和高效UPS在正常工作时可作为UPS的旁路,使得总体的转换效率提高到97%。

另外,过长的电力线缆在传输时也会产生不可忽略的损耗,如电缆长度大于100m时,损耗可能高达1%~3%。

空调同样带来效率的降低,一种情况是如果机架距离空调较远时,空调风扇需要增大功率,同时如果冷通道过长,冷热空调混合的机会也会增大,这样会严重降低空调的效率。另一种情况是大型机房采用的冷水主机,通常冷冻水的温度接近10℃,如此低的温度很容易引起空调主机的结露现象,从而降低空调效率。2.低效的能源使用

冷却机组和室内空调是数据中心能耗的重要部分,温度设置过低、气流组织设计不合理都会导致能耗的浪费。

数据中心设计时需要合理配置冷气流输送和热气流排放口的位置、气流组织模式,以及冷热气流的温度。冷却机组输送的冷气与IT设备产生的热气流需要相互隔离,互不干扰。如果冷热气流交汇,那么冷气机组就需要消耗额外的电能用于热气流的降温。

目前绝大多数机房的设置温度为20℃,以确保IT设备不会因过热而宕机。2011年美国采暖、制冷与空调工程师学会(ASHRAE)发布了第3版最新设备的温湿度环境建议标准。

ASHRAE建议数据中心的操作温度在18℃~27℃范围内。据估计数据中心的设置温度每降低1℃,将会多消耗2%~4%的电能,假设IT设备在室温27℃环境下与在20℃环境下运行状况相同,那么将环境温度设为20℃就会浪费约20%的能耗。3.降低能耗的主要措施

美国谷歌公司根据其数据中心建设的十几年经验,总结了降低数据中心能耗的4项措施。(1)气流组织:尽量减少热气流与尚未经过设备的冷气流的混合,室内机到工作点的路径尽可能短,从而减少传输损耗。(2)提高冷通道温度:可将冷通道的温度从18℃~20℃提升到27℃,更高的冷通道温度可提高冷冻水的温度,从而减少主机的工作时间。(3)利用自然冷却技术:例如,冷却塔采用自然蒸发散热的模式,可以极大地降低冷水机组的耗能。谷歌在比利时的机房甚至100%利用自然冷却技术。(4)高性能UPS:配电设备是数据中心高耗能设施之一,降低配电设备的能耗一是要尽量提高电源转化的效率,减少电压电流转换带来的损耗,例如,利用新型飞轮UPS可以将电源转换效率从普通的90%提高到97%;二是尽量缩短高压电源到设备的传输距离以减少线路损耗,例如,采用给每个服务器配置12V直流UPS可以将能耗效率提高到99.99%。3.3.4 数据中心能效评价标准1.基础设施能效

国际上目前比较通行的衡量数据中心能效的指标是PUE和DCiE,其计算公式为:

PUE=数据中心总耗电/IT设备耗电

DCiE=1/PUE=IT设备耗电/数据中心总耗电

在这两个指标中,IT设备耗电被认为是“有意义”的电能,PUE值越高表示该数据中心的能效越低。2.设备能效

尽管PUE定义了数据中心基础设施的能效,但是IT设备自身的能效并未考虑在内。例如,服务器的核心功能是运算和存储,而数据中心输入到每个服务器电能并不是100%应用到运算及存储模块上,通常电源、稳压模块和内部风扇占据了服务器20%以上的能耗。

服务器的能效(SPUE)可以用类似PUE的方法来衡量,即服务器输入电量与有效耗电量之比。其中,有效耗电量是指与运算直接相关的服务器部件,包括主板、CPU、磁盘、内存、输入输出等,但不包含服务器内电源、稳压模块及内部风扇等的能耗。据绿色网格组织统计,SPUE一般为1.6~1.8,因为服务器电源效率约为80%,而绝大多数主板使用的稳压模块有超过30%的能源损耗。3.负载能效

数据中心运营的最终目的是提供计算及应用服务,然而,通常服务器不运行应用程序或处于待机状态时依然要消耗电能,换言之,服务器有用部件所消耗的电能也并非全部“有意义”。由于服务器能耗会随计算负荷的变化而改变,对于终端应用层次服务器能效(LPUE)的测算需要考虑不同计算负荷下能耗的变化。目前国内、国际对不同负载下服务器能效的评估方法有很多研究,但没有统一的标准,因此采用国际权威IT测试组织SPEC发布的统计性能评价基准测试结果是目前可行的一种方法。利用不同服务器平台运行一个标准的应用程序,并对其系统负荷对比,从而排除软件效能对于能耗的影响,关注服务器硬件本身负荷和能耗之间的关系。3.3.5 综合能效评估模型

综上所述,数据中心的能效评价包含3个层次:基础设施、IT设备、服务器负载,严格意义上的能效应该能够体现数据中心所有应用服务所消耗的负载耗能与数据中心的总耗能的关系。

由此,数据中心能效可定义为:

能效(E)=负载耗电/总耗电

受能效控制要求、设施条件等的限制,不同的数据中心可以根据各自的情况决定能效评价的粒度,采用不同的评估指标,如下公式所示:

能效(E)=负载耗电/总耗电=1/PUE(负载耗电=IT设备耗电)

能效(E)=负载耗电/总耗电=(1/PUE)×(1/SPUE)(负载耗电=服务器有效部件耗电)能效(E)=负载耗电/总耗电=(1/PUE)×(1/SPUE)×(计算耗电/服务器有效部件耗电)(负载耗电=计算耗电)

统计资料在强调低PUE值以外,更着重介绍了如何定制服务器,

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载