网络存储与灾难恢复技术(txt+pdf+epub+mobi电子书下载)


发布时间:2020-10-19 21:30:22

点击下载

作者:刘洪发,唐宏

出版社:电子工业出版社

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

网络存储与灾难恢复技术

网络存储与灾难恢复技术试读:

前言

随着信息化建设的迅猛发展,计算机系统已成为各企事业单位的基础设施,数据成为关系到企业生存的重要资源,数据存储和数据安全成为信息化进一步发展的重要基础。震惊世界的“9·11”恐怖袭击事件后,数据存储安全和灾难恢复更引起人们的高度重视。面对信息系统中数据安全的问题,各国都投入了大量资金进行研究,生产厂商生产了各种环境中使用的数据安全产品,各个层次的计算机信息系统的使用者也积极关注自己系统的数据安全问题。

2005年国务院信息化工作办公室下发了《重要信息系统灾难恢复指南》,现已正式升级为国家标准《信息系统灾难恢复规范》,并于2007年11月正式实施。包括银行、证券、保险、电力、民航、铁路、海关、税务等关系国计民生的重要信息系统正在积极建设自己的容灾中心,确保在灾难发生的情况下业务可以持续运行。

数据存储技术是与计算机技术同步发展的。在主机/终端时代,数据主要集中存储在主机上。20世纪80年代后,由于PC的发展,特别是客户机/服务器应用模式的普遍采用,数据可能存储在客户机和服务器中,形成数据存储分布化的倾向。计算机网络化的发展使数据的存储技术、备份和恢复技术发生了革命性的变化。主要表现在:

● 数据存储容量急剧膨胀;

● 数据存储结构网络化,存储系统已经发展成为独立的系统;

● 对数据存储安全更加重视,备份和容灾系统成为保障数据安全的重要系统。

数据的安全和计算机系统的稳定运行成为关系企业生存的大问题。作为信息系统数据安全方面的数据存储安全和灾难恢复技术正在高速发展,在实际应用中具有重要的地位和作用。本书结合目前正在广泛进行的存储和容灾系统的建设,全面讲解了相关的理论与实践。

本书共分7章。

第1章绪言,概述存储技术和灾难备份系统的发展,使读者对存储技术和灾难备份系统的发展,以及建设灾难备份系统的作用和意义有一个概貌的了解。

第2章数据存储技术基础,介绍数据存储的基本理论和数据存储设备的特点。本章从存储基本概念引入,介绍RAID技术、DAS存储、NAS存储、SAN存储、IP SAN存储、分级存储、虚拟存储的概念和技术特点,并介绍了一些常用的存储产品。

第3章数据备份技术,介绍数据备份的作用和意义,数据备份的类型,数据备份系统的构成和常用备份软件及备份技术。

第4章灾难恢复技术,介绍灾难恢复的意义和作用,灾难恢复的策略和等级划分,桌面系统的灾难恢复,以及常用灾难恢复技术。

第5章容灾系统的规划、建设和组织管理,讨论建设数据备份与灾难恢复系统的策略,数据备份与灾难恢复系统的规划,数据备份与灾难恢复系统的设计、实施、演练和组织管理等方面的问题。

第6章应用案例,结合几个不同的灾难备份与恢复系统应用案例,全面介绍数据安全和灾难恢复系统的构成。读者可以根据这些实际案例,深入理解数据存储安全和灾难恢复系统的构成和工作原理。这些系统都是实际工作的应用系统,对读者构建自己的存储备份系统有极大的参考价值。

第7章典型存储备份解决方案,紧密结合目前市场上提供的热销存储备份产品,选择典型的应用情况,给出在不同环境下的存储备份解决方案。在设计建设自己的存储备份系统时,读者可以参考这些方案,了解有关厂家产品及其产品的特点和适用场合。

本书的主要特点是:(1)系统性。以存储系统的发展为主线,使读者不仅了解目前的技术状态,而且了解这种技术出现的背景和这种技术解决了哪些问题,从而可以对该技术有更深入的理解,更好地使用这种技术。(2)实用性。本书介绍的内容是目前正在使用的实用技术,并给出典型系统的技术方案,读者可以直接使用这些技术方案解决自己系统的数据安全问题。(3)先进性。本书介绍的内容是目前正在使用的先进、稳定的技术,同时介绍数据存储安全的技术发展方向。

本书第1章、第2章、第5章、第7章由刘洪发编写,第3章、第4章、第6章由唐宏编写,贾卓生对全书进行了审校。

由于作者水平有限加上时间仓促,书中难免有疏漏不当之处,敬请读者批评指正。

来信请寄wlccyznhf@tom.com。作者2008年3月

鸣谢

本书在编写过程中特别重视理论和实践的结合。书中的大量实例都是业界主要公司大力推广和在用户的生产实践中实际使用的。在本书的编写过程中得到了美国安腾普公司、IBM公司、美国慷孚系统公司、BakBone公司、Symantec公司、杭州华三通讯技术有限公司、DataDomain公司、甲骨文公司、北京同友飞骥科技有限公司、NEC卓越软件科技(北京)有限公司等业界知名公司的大力支持,在此对各公司的大力支持表示感谢。在本书的编写过程中得到了中国计算机用户协会网络分会的关心与支持。在此一并表示感谢。作者2008年3月第1章绪言1.1数据安全的重要性

随着信息化建设的迅猛发展,各行各业的信息进入到计算机系统中。计算机系统逐渐成为各企事业单位运行的基础设施,人们对数据的依赖性越来越高,特别是一些财务数据、客户数据等更是关系到企业生存的重要数据。信息化的深入发展,使信息系统的数据安全问题成为必须予以重视的大问题,特别是那些重要信息系统的数据安全问题,更成为关系国家安全、经济命脉、社会稳定等各方面的重要问题。《国家信息化领导小组关于加强信息安全保障工作的意见》指出,要重点保护基础信息网络和信息系统安全,抓紧建立信息安全保护制度,制定信息安全等级保护的管理办法和技术指南。国务院信息化工作办公室发布了《重要信息系统灾难恢复指南》,规定了对重要信息系统灾难恢复的规划和准备工作的基本要求。

IDG公司对美国发生过灾难的公司的情况进行了统计,其中55%的公司立即倒闭,29%的公司两年后倒闭。在震惊世界的“9·11”恐怖袭击事件中,由于入驻世贸中心的公司数据瞬间被毁,造成公司无法继续运营。一些有远见的公司,由于预先建立了自己的容灾备份系统,使系统可以迅速切换到备份系统中运行或使数据得到快速的恢复,保障了公司的业务连续性。我国也有类似的事件发生。据报道,2003年上海发生轨道工程工地坍塌事件,三座大楼安全受到严重威胁。在危险关头,为保障楼内信息系统中的数据安全,人们冒着生命危险进入即将倒塌的楼内将存放重要数据的磁盘抢出。如果事先建立了容灾备份系统,这种冒险就是没有必要的了。

一系列的灾难事件对信息系统的破坏使我们重新审视我们的信息系统:企业赖以生存和发展的信息系统是安全的吗?计算机硬件毁坏后可以再购买,信息系统损坏后可以重新安装,但信息如果丢失了怎么办?灾难事件具有偶然性,但灾难事件可以避免吗?1.2从计算机系统在数据处理中的地位看数据安全

信息安全问题可能发生在信息处理的各个环节。计算机系统的数据处理过程如图1-1所示。

现实世界中的信息以各种形式存在,如文字、语音、图像等多种形式,其介质主要为纸张、胶片等物质载体。现实世界中信息安全问题主要是数据的载体,即介质的安全,防止介质的丢失与损坏。图1-1 计算机系统的数据处理过程

现实世界中的信息必须经过格式转换才能进入计算机,被计算机接收和处理。正确的数据转换保证计算机中数据的正确性,使计算机数据处理有一个正确的基础。

进入计算机的数据由计算机的信息处理系统进行处理,这依赖于计算机的硬件处理能力和各种信息处理软件。为保证数据的安全性,信息处理软件自身的安全是一个重要问题。

数据经过计算机的处理后,存储在可以保存二进制数据的存储介质中,如磁盘、磁带等。这些数据是在计算机进行数据处理的过程中逐渐积累产生的,在需要的时候经计算机调出,产生人可以识别的格式,交给人们使用。计算机中的数据是数据系统长时间运行的积累,它已经成为一个单位信息系统赖以生存的基础。对这部分数据的保护具有重要的意义。由于计算机中数据存储形式的特殊性,它的保护方法与传统的数据安全保护方法有所不同。

计算机存储系统是计算机的重要组成部分,计算机存储的发展是随着计算机技术的进步和计算机应用的普及而发展的,计算机存储系统的发展也促进了计算机技术发展和应用的进一步发展。

自1946年第一台电子计算机ENIAC在美国加州问世以来,计算机的发展经历了几个主要的发展阶段:早期计算机科研使用发展阶段;计算机主机系统发展阶段;PC系统发展阶段和网络系统发展阶段。

早期的计算机主要用于科研使用,ENIAC用了18 000个电子管和86 000个其他电子元件,有两个教室那么大,运算速度却只有每秒300次各种运算或5000次加法,耗资100万美元以上。尽管ENIAC有许多不足之处,但它毕竟是计算机的始祖,揭开了计算机时代的序幕。第一代计算机的内部元件使用的是电子管。由于一部计算机需要几千个电子管,每个电子管都会散发大量的热量,因此,如何散热是一个令人头痛的问题。电子管的寿命最长只有3000小时,计算机运行时常常发生由于电子管被烧坏而使计算机死机的现象。第一代计算机主要用于科学研究和工程计算。

由于这时的计算机还没有磁盘系统(磁盘系统是IBM公司1956年发明并投入使用的),计算机使用卡片、穿孔纸带、磁带等来存储程序与数据,这些存储方式不仅容量低、速度慢,而且有个大缺陷:它们都是顺序存储,为了读取后面的数据,必须从头开始读,无法实现随机存取数据。1956年9月,IBM公司的一个工程小组向世界展示了第一台磁盘存储系统IBM 350RAMAC(Random Access Method of Accounting and Control),其磁头可以直接移动到磁盘上的任何一块存储区域,从而成功地实现了随机存储。磁盘系统的出现大大提高了计算机信息系统的性能,使航空售票、银行自动化、医疗诊断和航空航天等领域引入计算机成为了可能。

磁盘系统一经问世便得到了快速发展,1973年,IBM公司又发明了Winchester(温氏)硬盘,其特点是工作时磁头悬浮在高速转动的盘片上方,而不与盘片直接接触,这便是现代硬盘的原型。磁盘系统的引入使计算机的应用领域得到了很大的发展。这一时期使用的计算机系统主要是大型主机系统,美国的军事系统、银行系统和重要的工业领域开始使用计算机大型主机系统处理他们的业务。计算机大型主机系统结构如图1-2所示。图1-2 计算机大型主机系统结构

大型主机系统由中央处理器、信息输入设备、前端处理器、网络通信设备、磁盘系统和磁带系统等组成。大型主机使用专用的操作系统,其客户端使用哑终端或智能终端,通过前端处理器与主机连接,使用磁带系统存储数据,形成一套封闭的系统。随着PC的兴起,大型主机的前端设备也由终端逐渐改为使用PC。大型主机在20世纪60年代以后得到了广泛应用,很多大型部门纷纷采用计算机大型主机处理自己的业务。目前很多大型系统仍然使用大型主机系统处理他们的业务。大型主机价格很高,只有重要部门才使用,早期的计算机系统还有一层神秘的面纱,它只是科研工作者和计算机专业人员的专利品,并不为一般人所了解和使用。由于系统相对封闭,大型主机系统的数据安全不是一个很大的问题。

1986年IBM公司推出了具有独立计算能力的个人计算机系统(PC系统), PC系统的出现大大推广了计算机的使用范围。由于价格很低,PC系统得到了迅速发展。PC的大量使用使得大量的数据进入计算机中,计算机中的数据呈现分布存储的状态。由于PC系统处理能力有限,不适合处理大型企业的数据处理问题,随着C语言和UNIX操作系统的兴起,开放式的服务器系统由于其价格优势(相对于大型主机)和处理能力优势(相对于PC)而得到了迅速发展,目前已经成为计算机市场主流。开放式服务器系统沿用了大型主机的存储方式,使用磁盘和磁带作为主要的数据存储方式。

20世纪末期兴起的开放网络(TCP/IP)进一步推进了计算机事业的发展。国际互联网(又称万维网——World Wide Web, WWW)的出现是一个划时代的事件。1990年,Tim Berners-Lee首先使用超文本(hypertext)共享信息,1993年4月,美国国家超级计算应用中心(NCSA)发布了Mosaic浏览器,万维网从此迅速发展。通过浏览器用户可以以图形方式快速方便地浏览服务器端发布的信息,电子邮件(E-mail)系统将用户以无距离的方式联系起来,互联网的巨大优势将全球用户吸引到互联网中。计算机用户迅速增加,计算机中的数据量以指数增长,人们生活和工作的信息迅速数字化,对存储系统提出了更高的要求和挑战。互联网的产生和发展将社会生活的各个方面和计算机网络紧密地联系起来。有学者论断,人类已经从工业时代逐渐进入信息时代。互联网已不仅是人们休闲娱乐的场所,随着重要信息的进入和重要信息系统的使用,互联网已经成了人们学习、生活和工作的虚拟空间,引起了深刻的社会变革。人类社会建立起来的各种制度和法律、法规必然反映到互联网中,信息和数据的安全成为互联网进一步发展必须解决的问题和制约因素。

如果我们将互联网的体系结构和计算机系统加以比较,会发现它们有很多相似之处。互联网中广泛使用的B/S(客户机/浏览器)结构,从某种意义上讲可以认为是两台互为信息驱动的计算机的相互作用。从这种意义上说,互联网是一台结构松散的巨型计算机,某些业界公司甚至得出互联网就是计算机的论断。

由于互联网的开放性,由此产生的安全问题也凸显出来。2001年第一个互联网病毒出现。网络攻击事件、网络病毒、网络盗窃层出不穷。互联网的重要性已经影响到社会生活的稳定,甚至成为敌对双方争夺的目标。互联网中的核心资源是存储在互联网中的数据资源,有效保护互联网中的数据资源成为我们进一步发展的重要课题。

在互联网高速发展的同时,数据的存储、备份、恢复技术也发生了巨大变化,这种变化主要表现在以下几个方面:

• 存储容量急剧膨胀,随着计算机信息服务范围不断扩大,应用

深度不断加深,对存储容量不断提出新的要求。特别是非结构化

数据,如图形数据、影像数据、音频数据、视频数据等,需要很

大的存储容量。

• 对数据访问的时间和方式提出了更高的要求。今天,互联网中

的应用系统往往需要每天24小时、每周7天、每年365天始终处

于可使用状态。在互联网时代,数据是面向世界的,人们可以在

世界的任何地方,以任何方式(有线的和无线的)访问你的数

据。

• 数据存储结构的不同。数据存储技术的发展也基本符合摩尔定

律的规律,目前硬盘中采用的纵向存储技术的存储面密度可达5

~20兆位/平方英寸,并且以每年130%的速度增长。存储设备也

从早期的计算机内的存储发展成为计算机外的独立存储,并进一

步发展到网络存储。

数据安全主要包括:数据的保密性(Confidentiality)、数据的完整性(Integrity)、数据的可用性(Availability)、数据的可鉴别(Authentication)和数据的授权安全。

数据的保密性是指私密信息对于不该得到的人无法获得,通常使用数据加密的手段实现。数据加密确保只有数据的合法拥有者才能唯一地知道数据信息的内容。数据加密后即使非法者得到了这份数据,也无法知道它的真实含义。由于大量敏感信息需要通过公共计算机网络进行交换,密码学走进了计算机网络信息传输的研究领域,成为网络信息安全领域的核心技术,对网络中数据加解密的研究起到了重要作用,产生了很多重要的研究成果。如私钥加密技术、公钥加密技术和各种加密算法。

数据的完整性确保数据在传输或存储的过程中不丢失或被修改,保证数据的使用者得到正确的数据。

数据的可用性是指当合法用户在要求使用数据时数据是可用的,保证系统中的合法用户或被授权者随时且安全地使用系统中的信息和信息系统的服务。

数据的可鉴别保证数据通信的双方身份的合法性,通信双方的身份是合法的,不可抵赖的。

本书主要讨论数据存储安全和灾难恢复的问题。数据安全的威胁主要来源于以下几个方面:计算机病毒、黑客攻击、设备故障、人为操作失误、人为破坏、各种自然灾害及其他不可预见损害。

计算机系统内的数据存储安全有三个层次:数据保护、业务连续性和灾难备份。谈到数据保护、业务连续性和灾难备份的关系,ESG(Enterprise Strategy Group)咨询公司的资深分析师Peter Gerr指出:“如今的数据保护、灾难恢复以及业务连续性三者之间就像是三个同心圆。数据保护的圆圈在最里边,业务连续性在外面一层,灾难恢复在最外面。”换句话说就是,业务连续性和灾难恢复也许对于有些企业来讲是非常需要的,但对于数据的保护却是更加基本的。“不是每个人都必须要制订业务连续性或灾难恢复的计划,但是每个人都肯定需要通过一种或更多种方法去保护他或她的数据。”

现在,几乎所有的公司主管都知道要为自己的IT系统配备一种叫做“备份”的东西。但是是否真正理解所谓“备份”的含义呢。当人们谈论所谓“备份”时,脑子里也许马上就会联想到为整个磁盘系统做一个复制,然后保存在磁带介质上。对“备份”的这种印象主要形成于对早期计算机系统的认识,实事上,随着计算机事业的迅速发展,以灾难备份与灾难恢复为基础的业务连续性问题已经成为计算机系统进一步发展的重要组成部分,形成了一个新的产业。

近年来我国计算机信息系统规划和建设方案不断推陈出新,这些方案往往急于完成计算功能的实现,而对数据的存储和备份管理的重要性重视不够,当系统运行后,缺乏可靠的数据保护措施,等到出现事故后才来弥补,增加了总体成本,甚至造成更大的损失。1.3存储与灾难恢复技术的发展

计算机系统设计中对存储的设计经历了使用计算机内部存储、使用独立的存储设备和使用网络存储几个发展阶段。早期的计算机系统由于需要处理的数据量较小,往往使用计算机内部提供的存储设备就可以解决问题。随着处理数据量的增加、存储技术的进步和对数据安全性要求的提高,使用计算机内部存储设备在扩充性和安全性方面都受到挑战,产生了各种更具扩充性和安全性的存储解决方案。1.存储技术的发展

随着计算机技术的发展,CPU的处理速度大大提高,内存(memory)的存取速度和容量也大幅增加,而数据储存装置(主要是磁盘)——由于其速度很大程度上依赖于机械动作,要想大幅提速非常困难,形成信息技术发展的瓶颈。硬盘存储在数据安全上也是很大问题。现在人们的工作已非常依赖计算机,这一方面使人们的工作效率大大提高,但另一方面潜在的危险也是明摆着的:一旦硬盘的数据损坏,人们长时间的工作就可能毁于一旦。在这种情况下,磁盘阵列技术(也称RAID技术)应运而生,提出了RAID 0、RAID 5的存储结构,生产了各种磁盘阵列设备(独立的存储设备)。磁盘阵列使用磁盘快取控制和RAID技术两个方面的技术,大大提高了磁盘的存取速度,同时提高了磁盘存储数据的安全性。

RAID 5使用容错技术,较好地解决了磁盘数据的安全问题,在磁盘容量不是很大的情况下,两块磁盘同时坏的情况为小概率事件,几乎不可能发生。但是近年来随着光纤(FC)磁盘和SATA磁盘的容量和密度不断增加,使RAID 5的重建时间也不断增加。这样两块磁盘同时坏的概率也增加了,为了解决这个问题,进一步提高磁盘阵列的安全性和可靠性,RAID 6技术随着大容量ATA磁盘的广泛采用又重新引起了业界的重视,并且已经生产出使用RAID 6技术的磁盘阵列。

以提高磁盘存储速度、存储容量和数据安全为目标的存储技术的研究还在不断地进行,方兴未艾。如SCSI、ATA、SATA, SAS技术等都在深入发展,并不断产生新的成果。2.网络存储技术的发展

网络存储是存储领域发展的又一重要发展。2001年是IT存储领域光存储网络、SAN(Storage Area NetWork,存储区域网络)和NAS(Network Attached Storage,网络附加存储)技术的蓬勃发展年。2002~2004年远程数据复制技术迅速发展,形成了DAS(Direct Attached Storage,直接附加存储)、NAS、SAN并存的局面。这些发展一方面为灾难备份的发展打下了良好的基础,另一方面由于多种技术并存,给网络存储带来了存储管理复杂、维护升级成本增加的问题,也不利于信息资源的整合。

存储资源的整合和集中管理是优化存储结构,增强存储系统的可管理性和健壮性的重要手段。如何整合DAS、NAS和SAN为一体的存储网络已经成为技术上的热点问题。美国的FalconStor、NetApp等公司率先推出了IP SAN存储网络产品,实现了多种存储网络的整合。3.灾难备份与恢复技术的发展

随着网络技术、应用技术、存储技术的发展,灾难备份与恢复系统的建设也得到了快速发展。

计算机网络系统已经成为人们生活与办公不可缺少的基础设施,计算机中的数据安全问题已经引起人们的高度重视,成为计算机信息系统进一步发展的关键问题之一。包括银行、证券、保险、电力、民航、铁路、海关、税务等关系国计民生的重要信息系统正在积极建设自己的容灾中心,确保在灾难发生的情况下业务可持续运行。很多计算机公司纷纷推出了自己的备份与灾难恢复系统,如Symantec公司的Veritas, Atempo公司的LiveBackup、Time Navigator、CommVault公司的备份与灾难恢复系统,EMC公司的Legato系统,IBM公司的Tivoli、SVC等。这些产品的推出和应用,大大推动了灾难备份系统的建设和发展。

为了减少容灾中心建设的高额成本,以容灾为目的的服务公司正在兴起,以服务社会为目的的灾难备份中心通过资源共享的方式,减少了灾难备份中心的建设成本,灾难备份中心的运行模式正在探索中。

作为企业核心应用系统的数据保护引起了大多用户的重视,而对桌面系统的保护则处于放任自流的状态。分析指出,台式机与笔记本电脑中存储着大量企业数据,甚至是重要数据,大量的台式机与笔记本电脑都没有任何备份措施,存在着严重隐患。因为桌面系统损害造成的数据损失实际上是很大的,面对频繁的文件丢失、病毒感染、硬盘损坏、笔记本电脑丢失等日常风险,用户不得不重新安装系统,造成工作中断或丢失数据的情况时有发生,损失是很大的。《国家信息化领导小组关于加强信息安全保障工作的意见》指出,要重点保护基础信息网络和关系国家安全、经济命脉、社会稳定等方面的重要信息系统,抓紧建立信息安全保护制度,制定信息安全等级保护的管理办法和技术指南。国务院信息化工作办公室发表的《重要信息系统灾难恢复指南》确定了七个要素并进行了等级划分,为规范我国灾难恢复建设,防止片面强调个别要素忽视整体,指导信息系统的灾难恢复建设,制定各行业的管理办法提供了标准规范,促进了我国灾难恢复系统建设的发展。

信息服务的可用性是人们设计信息服务系统的目标。所谓高可用性,即在需要时得到满足质量要求的信息服务。为了提高信息系统的可用性,人们研究出了多种高可用性技术。其主要技术为:确定最可能发生故障的系统组件,并为其安装配置冗余组件,当某一组件发生故障时另一个组件可以接管它。高可用性计算机系统通常配置有集群服务器、多条输入/输出路径、镜像磁盘、冗余网络等。在历史上,计算机系统的高可用性通常被理解为“无单点故障”,也就是说,将计算机配置成任何一个单件发生故障都不会影响系统的非正常运行。如今人们逐渐认识到该定义的不足,目前已经采用多路磁盘镜像、层叠应用故障冗余和其他技术,来保持系统在多个组件故障发生时的弹性。

随着灾难恢复技术的深入研究,CDP(Contiune Data Protection,持续数据保护)由于其细粒度恢复的特点引起人们的关注。CDP是一种在不影响主要数据运行的前提下,可以实现持续捕捉或跟踪目标数据所发生的任何改变,并且能够恢复到此前任意时间点的方法。

磁带库由于其存储介质完全离线,具有易于保存的特点,在数据备份和灾难恢复中仍然占有重要的地位,近年来磁带库技术仍在快速发展中。

随着存储技术的发展和广泛使用,虚拟存储技术作为存储领域的一支新发展起来的技术,以其提高存储备份速度、简化存储管理及降低企业总体存储拥有成本等方面的优势得到人们的普遍关注,虚拟存储技术正在高速发展。“很多客户开始时误认为灾难备份是技术项目,其实灾难备份项目不是单纯的技术项目,而是业务项目。早期的BCP(业务连续性规划)是最重要的,BCP要占整个项目80%的工作量。”存储专家认为,灾难备份项目强调的是业务不中断而不仅是计算机信息系统不中断。现在客户已经逐渐识到,灾难备份的目的不仅是防止数据丢失,而且是保证业务的连续性,因此从项目名称上,很多客户已经不再称为灾难备份,而是改称为业务连续性项目。灾难备份是一项技术和管理并重的综合性工程。灾难备份系统建设的目的是在灾难发生的情况下实现数据及系统的可用性,在尽可能短的时间内恢复生产系统的使用,将灾难的损失减少到最小的程度。为了达到上述目标,需要建立一套完整可行的灾难恢复流程及相关配套机构,编制灾难恢复计划和应急预案,并经过演练,保证在灾难发生时能够在最短的时间内,有条不紊地恢复系统的正常运行。

随着对信息在信息系统中重要性的深刻理解,ILM(Information Lifecycle Management,信息生命周期管理)的理念应运而生。ILM是一种信息管理模型,对信息从创建、使用到归档和处理进行贯穿其整个生命的管理,其最终目的就是在全企业范围内对所有应用系统中的信息实现有效的主动管理。ILM策略的核心就是根据企业实际情况将信息进行有机地划分,进行分级存储,有效降低企业信息系统的整体成本,提升企业的核心竞争力。1.4中国信息化进程中的数据安全问题

中国互联网络信息资源数量呈指数增长。2005年中国互联网络信息资源数量调查报告指出,截止到2005年12月31日,全国网页字节总数约为67 300GB。随着网页总数的急剧增长,网页字节数也同样出现剧增,一年内增长46 763GB,年增长率达到227.7%。这充分说明我国网上信息量的高速增长,也反映出我国网络信息资源的快速增长。这种增长势头随着网络应用的深入发展进一步增加。如图1-3所示为我国计算机中的数据快速增长图。图1-3 我国计算机中的数据快速增长图

同时报告也指出,在拥有在线数据库的网站中,13.8%的网站拥有在线数据库的其他载体。其中,37.0%的政府网站拥有在线数据库的其他载体,13.1%的企业网站拥有在线数据库的其他载体,22.0%的商业网站拥有在线数据库的其他载体,10.5%的教育科研网站拥有在线数据库的其他载体等,如表1-1所示。表1-1 各类网站数据备份系统统计表

此表说明,大量数据库中的数据没有基本的备份。大量数据处于危险状态。

我国在数据安全和灾难恢复领域与先进国家比较,还处于落后的状态。在很多单位,这个问题还没有引起足够的重视。大量的对单位极为重要的数据资源没有得到有效的保护。很多单位的大量信息已经进入计算机中,并且开展了计算机应用,个别单位甚至取消了纸质介质的双重备份,使计算机数据成为单位赖以运行的唯一数据基础,又没有安全的数据备份措施,这是极其危险的。

我国在数据安全和灾难恢复领域比较落后的原因有客观原因,也有主观原因。我国计算机系统发展时间较短,软、硬件技术相对落后,财力投入不足等是其客观原因。但更重要的还是主观方面的原因,安全意识薄弱、忽视安全工作、存在侥幸心理、满足于信息化高速发展的现状,不能居安思危,没有看到高速信息化背后的风险。只要我们真正重视了,并采取认真的对策,就能大大促进这项工作的开展。

就目前我国信息安全市场的情况进行分析,发展情况还是较好的。有文章报道,在世界IT业发展速度放缓的时候,我国信息安全产品市场依然能够保持高速增长,特别是在《国家信息化领导小组关于加强信息安全保障工作的意见》发表后,国家重要信息系统纷纷开展了数据安全与灾难备份系统的建设,大大促进了这项工作的进展步伐。我国信息安全建设的高速发展主要得益于我国经济的高速增长、政府的重视和政策扶植等多方面的原因。

古人云:有备无患。在计算机信息系统发展的进程中我们必须具有忧患意识,防止灾难事件对我们的事业造成重大损失,使信息技术的应用健康发展。第2章数据存储技术基础

随着计算机应用的深入发展,人们逐渐得到了一个共识:数据是企业信息系统的基础,是企业的重要资源。IT技术的发展经历了三个发展阶段:第一个阶段是以处理器为中心的发展阶段,这个阶段的发展促进了计算机的普及和应用;第二个阶段是以网络技术为中心的发展阶段,这个阶段的发展将计算机通过网络系统联系起来,形成了覆盖全球的网络计算环境;这个阶段的发展也导致了数字化信息的爆炸式增长,从而引发了第三阶段的发展——以数据为中心的发展阶段。目前存储技术正在高速发展中,信息存储系统已经成为国内外研究的重点和新的经济增长点。数据的保护与安全成为企业灾难备份与企业服务连续性的中心问题。

本章讨论数据存储的有关技术、理论与产品,介绍磁盘、磁带、光盘等常用数据存储技术,近年来广泛使用的磁盘与磁盘阵列技术,DAS、NAS、SAN等网络存储系统,虚拟存储,分级存储,最后介绍了一些目前流行的常用存储设备产品。通过本章的学习,读者可以对存储系统的特点及其发展有一个较为清晰的了解,本章也是学习以后章节的基础。2.1常用数据存储技术概述

每个企业都会产生大量的数据,这些数据要存储在容易访问和检索的地方。存储技术在近几年的发展非常迅速,各种新产品、新技术层出不穷,推动了计算机信息系统向着以数据为中心的方向发展。

根据存储介质的物理特性,存储器可以分为半导体存储器、磁面介质存储器和光盘存储器三类。半导体存储器是一种由集成电路技术制造的存储器,它的种类很多,主要用于计算机的内存和U盘等,本书不做详细介绍。磁面存储器使用介质表面的磁性材料的磁化状态来记录信息,主要包括磁带和磁盘两种。光盘存储器是利用激光器产生的激光使光记录介质产生变化达到记录数据的目的。

存储设备(也称存储器)包括存储介质和介质驱动设备两个方面。常用存储设备有磁带机、磁盘机、光盘机、光盘刻录机等设备。磁盘机有硬盘机和软盘机之分,由于技术的发展,软盘机已经由U盘所取代。2.1.1 存储器的主要技术参数

存储器的主要技术参数包括存储容量、存储密度、存取时间、数据传输速率和无故障间隔时间。这些参数是选用存储器的基本性能参数。

存储容量:存储容量是指存储器所能容纳的二进制信息的总量,是存储器的基本性能指标。我们以磁盘存储为例进行说明,与磁带存储、光盘存储的情况基本相同。

磁盘存储设备的容量是记录面数、每面磁道数、每道扇区数和每扇区字节数的乘积。这样计算出来的值是磁盘存储设备能够存储数据量的理论值。实际上,操作系统在使用存储设备时,为了有效地存入和读出数据,存储设备必须有一定的格式,将一个磁盘按照操作系统要求的格式进行划分的过程称为格式化。只有格式化后的磁盘才能被计算机操作系统使用。磁盘格式化前和格式化后容量有区别,格式化后的容量一般为格式化前的80%。磁盘的存储容量一般以字节数为单位。如30GB硬盘,表示硬盘容量为30 000兆字节。

存储密度:存储密度可分为道密度和位密度。道密度的单位为道/英寸,记作Tpi,即每英寸的磁道数。位密度的单位为位/英寸,记作bpi,即每英寸长度上记录的二进制数的位数。

存取时间:存取时间是指读/写磁头从现在位置到达读/写位置的时间。

数据传输速率:数据传输速率是指单位时间内存储设备向主机传送数码的位数或字节数。

无故障间隔时间(MTBF):无故障间隔时间是指磁盘连续正常工作的时间,即两次故障之间的时间间隔。一般磁记录设备的无故障间隔时间为800~20 000 h。2.1.2 常用数据存储设备

目前用于数据存储的存储设备主要有磁盘(包括磁盘阵列)、磁带(包括磁带机和磁带库)和光盘(包括CD-R、CD-RW、DVD-R、DVD-RW等光盘、光盘塔和光盘库设备)。这些存储设备可以通过网络连接起来,形成存储容量很大的网络存储系统。在网络海量存储系统中,磁盘阵列、磁带库、光盘库等存储设备因其信息存储特点的不同,应用环境也有较大区别。磁盘阵列主要用于网络系统中的海量数据的即时存取;磁带库更多的是用于网络系统中的海量数据的定期备份;光盘库则主要用于网络系统中的海量数据的访问。

从性能上来说,磁盘最好,光盘次之,磁带最低。而从价格上来说,单位容量成本磁盘最贵,光盘次之,磁带最低。因为这些不同的存储媒介可应用于不同的存储方式中,这就为我们在不同的应用环境中追求存储设计的最佳性价比提供了条件。2.2磁盘与磁盘阵列2.2.1 硬盘基础知识

磁盘机(又称硬盘)是计算机的重要部件,以容量大、储存速度快、稳定安全等特性成为计算机外存中最主要的一员。计算机的操作系统、应用软件和计算机游戏等都要安装到硬盘上才能使用,用户建立的文件、图片等数据资料都要储存到硬盘才能保存下来。计算机进行运算时,硬盘担任了传送数据到内存,以供CPU进行运算,然后把运算结果储存下来的任务。总之,硬盘是计算机存储数据的主要场所。

磁盘机的物理结构示意图如图2-1所示。计算机数据以文件的形式存储在硬盘里。计算机在读取相应的文件时,必须要符合相应的规则,即硬盘必须分区。我们可以把硬盘与仓库类比,硬盘就像一个仓库,我们在使用仓库前需要在仓库中进行分区,布置格架以便存放物品,对硬盘来讲就是要进行分区。分区从实质上说就是对硬盘的一种格式化(俗称低级格式化)。当我们创建分区时,就已经设置好了硬盘的各项物理参数,指定了硬盘主引导记录(Master Boot Record, MBR)和引导记录备份的存放位置。而对于文件系统以及其他操作系统管理硬盘所需要的信息则是通过以后的高级格式化,即Format命令来实现的。图2-1 磁盘机的物理结构示意图

硬盘分区后,将会被划分为磁面、磁道和扇区。硬盘一般由一片或几片圆形薄膜叠加而成。我们所说的每个圆形薄膜都有两个“面”,这两个面都是用来存储数据的称为磁面(Side)。按照面的多少,依次称为0面、1面、2面、……,每个面都专有一个读/写磁头。按照硬盘容量和规格的不同,硬盘面数(或头数)也不一定相同,少的只有2面,多的可达数十面。各面上磁道号相同的磁道合起来,称为一个柱面(Cylinder)。

磁道(Track):由于磁盘是旋转的,则连续写入的数据是排列在一个圆周上的。我们称这样的圆周为一个磁道。根据硬盘规格的不同,磁道数可以从几百到数千不等;一个磁道上可以容纳数字节的数据,而主机读/写时往往并不需要一次读/写那么多,于是,磁道又被划分成若干段,每段称为一个扇区(Sector)。一个扇区一般存放512KB的数据。扇区也需要编号,同一磁道中的扇区,分别称为1扇区,2扇区,……。

计算机对硬盘的读/写是以扇区为基本单位的。即使计算机只需要硬盘上存储的某个字节,也必须一次把这个字节所在的扇区中的512KB全部读入内存,再使用所需要的那个字节。

硬盘上的数据按照其不同的特点和作用大致分为5部分:MBR区、DBR区、FAT区、DIR区和DATA区。(1)MBR区:主引导记录区,存放硬盘引导程序分区。(2)DBR(Dos Boot Record)区:DBR区是操作系统引导记录区。(3)FAT(File Allocation Table)区:FAT区是文件分配表区。(4)DIR(Directory)区:DIR区是根目录区。(5)DATA区:DATA区是真正意义上的数据存储的地方。

硬盘是计算机中的重要部件之一,不仅价格昂贵,存储的信息更是无价之宝。因此,每个购买计算机的用户都希望选择一个性价比高、性能稳定的好硬盘,并且在一段时间内能够满足自己的存储需要。速度、容量、安全性一直是衡量硬盘的最主要的三大因素。选择硬盘时应该考虑以下几个方面。(1)硬盘容量:原则上说,在尽可能的范围内,硬盘的容量越大越好。一方面用户得到了更大的存储空间,能够更好地面对将来可能潜在的存储需要;另一方面容量越大硬盘上每兆位存储介质的成本就越低。(2)硬盘速度:由于硬盘的读/写离不开机械运动,其速度相对于CPU、内存、显卡等速度要慢得多。从著名的“木桶效应”来看,可以说硬盘的性能决定了计算机的最终性能。硬盘速度的快慢主要取决于转速、缓存、平均寻道时间和接口类型。转速是影响硬盘性能最重要的因素之一,目前市场上流行的是5400r/min(每分钟转数)、7200r/min和10 000r/min的硬盘。(3)平均寻道时间:平均寻道时间是指磁头从得到指令到寻找到数据所在磁道的时间。它描述硬盘读取数据的能力,以毫秒为单位。这个时间越小越好,一般要选择平均寻道时间在10 ms以下的产品。(4)数据传输率:数据传输率分为外部数据传输率(External Transfer Rate)和内部数据传输率(Internal Transfer Rate)。内部数据传输率,即磁头到硬盘的高速缓存之间的数据传输速率,可以说是影响硬盘整体速度的瓶颈。如今各品牌的主流硬盘,容量差不多,平均寻道时间相差不大,转速也多为7200r/min,高速缓存为2 MB左右,外部数据传输率都采用Ultra DMA 100技术,可是内部数据传输率却因品牌及型号不同而呈现较大的差异。选购硬盘时不要忽视对内部数据传输率的关注。外部数据传输率指硬盘的缓存与系统主存之间交换数据的速度。在这项指标中常以Mb/s或Mbps为单位,这是兆位/秒的意思,如果需要转换成MBps(兆字节/秒),就必须将Mbps数据除以8(一字节位数)。例如最大内部数据传输率为240 Mbps,但如果按字节数计算就只有30 MBps,远不到硬盘接口的100 MBps。因此硬盘的内部数据传输率就成了整个系统瓶颈中的瓶颈,只有硬盘的内部数据传输率提高了,再提高硬盘的接口速度才有实在的意义。(5)高速缓存:高速缓存是主机与硬盘进行数据传输时的缓冲池,高速缓存的大小对硬盘速度有较大影响,当然是越大越好。(6)MTBF(连续无故障时间):指硬盘从开始运行到出现故障的最短时间间隔,单位是小时。一般硬盘的MTBF至少在30 000 h或40 000 h。这项指标在一般的产品广告或常见的技术特性表中并不提供,需要时可专门上网到具体生产该款硬盘的公司网址中查询。2.2.2 磁盘接口技术

磁盘接口是磁盘与计算机主机间的连接部件,作用是在磁盘缓存和主机内存之间传输数据。不同的磁盘接口决定着磁盘与主机之间的连接速度,在整个系统中,磁盘接口的性能高低对磁盘整体性能有直接的影响,因此一款磁盘存储设备的接口性能往往是衡量这款产品的关键指标之一。由于磁盘接口是磁盘与主机之间的接口,在使用磁盘时必须使用主机支持的接口类型的磁盘。存储系统中目前普遍应用的磁盘接口主要包括以下几个。1.ATA

ATA(AT Attachment)接口标准是IDE(Integrated Drive Electronics)磁盘的特定接口标准。自问世以来,一直以其价廉、稳定性好、标准化程度高等特点,深得广大中低端用户的青睐,甚至在某些高端应用领域,如服务器应用中也有一定的市场。ATA规格包括了ATA/ATAPI-6、Ultra ATA 100,其中Ultra ATA 100兼容以前的ATA版本,在40-pin的连接器中使用标准的16位并行数据总线和16个控制信号。

最早的接口协议都是并行ATA(Parallev ATA)接口协议。在过去的20年中,PATA成为ATA磁盘接口的主流技术。但随着CPU时钟频率和内存带宽的不断提升,PATA逐渐显现出不足来。一方面,磁盘制造技术的成熟使ATA磁盘的单位价格逐渐降低;另一方面,由于采用并行总线接口,传输数据和信号的总线是复用的,因此传输速率会受到一定的限制。如果要提高传输的速率,那么传输的数据和信号往往会产生干扰,从而导致错误。

在当今的许多大型企业中,PATA现有的传输速率已经逐渐不能满足用户的需求。因此迫切期待一种更可靠、更高效的接口协议来替代PATA,在这种需求的驱使下,串行(Serial)ATA总线接口技术应运而生。2.SATA

SATA(Serial ATA)以它串行的数据发送方式得名。在数据传输的过程中,数据线和信号线独立使用,并且传输的时钟频率保持独立,因此同以往的PATA相比,SATA的传输速率可以达到PATA的30倍。可以说SATA技术并不是简单意义上的PATA技术的改进,而是一种全新的总线架构。SATA使用一条路径来传输数据序列,另一条路径返回响应。控制信息用预先定义的位来传输,并且分散在数据中间,以打包的格式用开/关信号脉冲发送,这样就不需要另外的传输线。

目前SATA有SATA-1和SATA-2两种标准,对应的传输速率分别是150 MBps和300 MBps。首先,从速度这一点上看,SATA已经远远地把PATA硬盘甩到了后面。其次,从数据传输安全角度上看,SATA比PATA抗干扰能力更强。此外,串行的数据线由于只采用了四针结构,因此比起并口,安装起来更加便捷,更有利于缩减机箱内的线缆,有利于散热。

虽然厂商普遍宣称SATA支持热插拔,但实际上,SATA在硬盘损坏的时候,不能像SCSI/SAS和FC硬盘一样,显示具体损坏的硬盘,这样热插拔功能实际上形同虚设。同时,尽管SATA在诸多性能上远远优越于PATA,甚至在某些单线程任务的测试中,表现出了超过SCSI的性能,然而它的机械底盘仍然是为低端应用设计的,在面对大数据吞吐量或者多线程的传输任务时,相比SCSI磁盘,仍然显得力不从心。除了速度之外,在多线程数据读取时,磁盘中磁头频繁地来回摆动,使磁盘过热是SATA需要克服的缺陷。3.SCSI

SCSI(Small Computer System Interface)是一种专门为小型计算机系统设计的存储单元接口协议,通常用于服务器承担关键业务的较大的存储负载。计算机通过SCSI接口可以发送命令到一个SCSI设备,磁盘可以移动驱动臂定位磁头,在磁盘介质和缓存中传递数据,整个过程在后台执行。这样可以发送多个命令同时操作,适合大负载的I/O应用。目前的主流SCSI磁盘都采用了Ultra 320 SCSI接口,能提供320 MBps的接口传输速率。SCSI磁盘也有专门支持热拔插技术的SCA2接口(80-pin),与SCSI背板配合使用,就可以实现磁盘的热拔插。相比ATA磁盘,SCSI体现出以下技术优势。(1)SCSI允许连接更多的存储设备。一般而言,ATA磁盘采用IDE插槽与系统连接,而每个IDE插槽即占用一个IRQ(中断号),而每两个IDE设备就要占用一个IDE通道。虽然附加IDE控制卡等方式可以增加所支持的IDE设备数量,但总共可连接的IDE设备数最多不能超过15个。而SCSI的所有设备只占用一个IRQ,因此它支持的磁盘扩容量要比ATA更大。(2)SCSI的带宽高,Ultra 320 SCSI能支持的最大总线速度为320 MBps。虽然这只是理论值,但在实际数据传输率方面,最快的ATA/SATA硬盘相比SCSI硬盘无论在稳定性和传输速率上,都有一定的差距。(3)SCSI磁盘CPU占用率低、并行处理能力强。

SCSI磁盘品质性能很高,普通的ATA磁盘转速是5400r/min或者7200r/min,而SCSI磁盘是10 000r/min或者15 000r/min, SCSI磁盘的保质期可以达到5年,平均无故障时间达到1 200 000 h。SCSI以其独特的技术优势保障SCSI一直在存储市场占据中流砥柱的地位,但SCSI磁盘一般价格较高。下一代SCSI技术SAS的诞生,则更好的兼容了性能和价格双重优势。4.SAS

SAS(Serial Attached SCSI,串行连接SCSI)磁盘和SATA磁盘相同,都是采用串行技术以获得更高的传输速率,并通过缩短连结线改善内部空间等。

SAS是新一代的SCSI技术,是对SCSI技术的一项变革性发展。它既利用了已经在实践中验证的SCSI功能与特性,又以此为基础引入了SAS扩展器。SAS可以连接更多的设备,同时由于它的连接器较小,SAS可以在3.5英寸或更小的2.5英寸磁盘驱动器上实现全双端口,这对于高密度服务器,如刀片服务器等需要冗余驱动器的场合非常重要。

为保护用户投资,SAS的接口技术可以向下兼容SATA。SAS系统的背板(Backplane)既可以连接具有双端口、高性能的SAS驱动器,也可以连接高容量、低成本的SATA驱动器。用户即使使用不同类型的磁盘,也不需要再重新投资,对于企业用户投资保护来说具有实际意义。

在SAS接口享有种种得天独厚的优势的同时,SAS产品的成本低于FC(光纤通道)存储设备的成本。而正是因为SAS突出的性价比优势,使SAS在磁盘接口领域,给光纤通道存储带来极大的威胁。目前已经有众多的厂商推出支持SAS磁盘接口协议的产品。5.FC

FC(光纤通道)接口标准已经被美国国家标准协会(ANSI)采用,是业界标准接口。通常人们认为它是系统与系统或者系统与子系统之间的互连架构,它以点对点(或是交换)的配置方式在系统之间实现了光缆连接。后来FC的发展囊括了电子(非光学)实现,并且可以用成本相对较低的方法将包括磁盘在内的许多设备连接到主机端口。光纤通道标准集有一个补充,称为FC-AL(光纤通道仲裁环)。FC-AL使光纤通道能够直接作为磁盘连接接口,为高吞吐量性能密集型系统的设计者开辟了一条提高I/O性能水平的途径。目前高端存储产品大都支持FC接口。

光纤通道磁盘以其优越的性能、稳定的传输,在企业存储高端应用中担当重要角色。业界普遍关注的焦点在于光纤接口的带宽。最早普及使用的光纤接口带宽为1Gbps,随后2Gbps带宽光纤产品出现,这种产品统治市场已经长达三年时间。现在最新的带宽标准是4Gbps,目前厂商普遍推出4Gbps相关新品,逐步取代2Gbps光纤产品,成为市场主流。2.2.3 磁盘阵列RAID概念

磁盘阵列又叫RAID(Redundant Array of Inexpensive Disks,也称廉价磁盘冗余阵列), RAID技术将若干磁盘驱动器按照一定要求组成一个整体,整个磁盘阵列由阵列控制器管理。磁盘阵列有许多特点:首先,提高了存储容量;其次,多台磁盘驱动器可并行工作,提高了数据传输率;第三,由于有校验技术,提高了数据传输的可靠性。如果阵列中有一台磁盘损坏,利用其他盘可以重新恢复出损坏盘上原来的数据,而不影响系统的正常工作,并可以在带电状态下更换已损坏的硬盘(即热插拔功能),阵列控制器会自动把重组数据写入新盘,或写入热备份盘而将新盘用做新的热备份盘。另外磁盘阵列通常配有冗余设备,如电源和风扇,以保证磁盘阵列的散热和系统的可靠性。

磁盘阵列能够适应不同环境,适用于不同类型的主机以及不同操作系统环境。因此可以更好地保护投资。2.2.4 RAID的实现方式

目前,RAID技术的实现方式大致分为两种:基于硬件的RAID和基于软件的RAID。基于硬件的RAID是利用RAID适配卡来实现的。基于硬件的RAID又可分为内置插卡式和外置独立式,分别如图2-2和图2-3所示。图2-2 基于硬件的RAID 内置插卡式图2-3 基于硬件的RAID 外置独立式

RAID阵列的核心部件是RAID卡,RAID卡上有自己的处理器,对RAID存储子系统进行控制。RAID卡上的处理器可以自己计算信息校验并完成信息定位等操作,减少了主机CPU的运行时间,提高数据并行传输速率。RAID卡处理器根据用户要求的数据冗余类型,计算数据的存放位置和恢复策略,提高了数据的安全性和可恢复性。

在外置独立式磁盘阵列中,主机的操作系统将RAID阵列视为一个单独的SCSI盘,外置阵列可以灵活地增加驱动器,提高RAID系统存储容量。由于外置独立式磁盘阵列独立于主机,独立运行,通过增加主机通道,形成多通道磁盘阵列,可简单实现双机热备功能。多通道磁盘阵列可以连接多个系统同时使用,使多台主机以集群(Cluster)方式共用磁盘阵列。

软件RAID的RAID控制功能由安装在计算机主机上的软件来完成。Windows NT、NetWare、FreeBSD、Linux等操作系统都提供了这种功能。为实现RAID技术提供了廉价的解决方案。但由于RAID功能依靠主机CPU完成,占用了主机CPU资源,不适合复杂RAID的使用场合。2.2.5 RAID技术的级别

RAID作为高性能的存储系统,已经得到了越来越广泛的应用。

根据数据冗余的方式和数据在磁盘上的存储定位方式,RAID已经发展了多个级别,明确标准的RAID级别分别是RAID 0、RAID 1、RAID 2、RAID 3、RAID 4、RAID 5等。但是最常用的是RAID 0、RAID 1、RAID 3、RAID 5四个级别。其他还有RAID 6、RAID 7、RAID 10、RAID 30、RAID 50等。1.RAID0

RAID 0以数据块为单位分割数据,这些数据块交替并行地写于多个磁盘上。第0块被写到磁盘0中,第1块被写到磁盘1中,依次类推,到写完最后一个磁盘后再回到第一个磁盘,开始下一个循环。由于其读/写操作可以并行进行,因此具有很高的数据传输速率,但它没有数据冗余,因此并不能算是真正意义上的RAID结构。RAID 0只是单纯地提高性能,并没有为数据的可靠性提供保证,而且其中的一个磁盘失效将影响到所有数据。因此,RAID 0不能应用于数据安全性要求高的场合。2.RAID 1

RAID 1是通过磁盘数据镜像实现数据冗余,在成对的独立磁盘上产生互为备份的数据。当原始数据磁盘繁忙时,可直接从原始数据磁盘的镜像复制中读取数据,因此RAID 1可以提高数据读取可靠性。RAID 1是磁盘阵列中单位成本最高的,但提供了很高的数据安全性和可用性。当一个磁盘失效时,系统可以自动切换到镜像磁盘上读/写,而不需要重组失效的数据。3.RAID 0+1

也被称为RAID 10标准,实际是将RAID 0和RAID 1标准结合的产物,在连续地以位或字节为单位分割数据并且并行读/写多个磁盘的同时,为每一个磁盘作磁盘镜像进行冗余处理。它的优点是同时拥有RAID 0的超凡速度和RAID 1的数据高可靠性,但是CPU占用率同样

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载