问题 单项选择题

用户针对待建设的网络系统的存储子系统提出的要求是:存取速度快、可靠性最高、可进行异地存取和备份,则首选方案是()

A.NAS

B.DAS

C.IP SAN

D.FC SAN

答案

参考答案:C

解析:

本题考查存储系统方面的基本知识。

存储系统的主要结构有3种:NAS、DAS和SAN。

在直连方式存储(Direct Attached Storage, DAS)方式中,存储设备是通过电缆(通常是SCSI接口电缆)直接到服务器的。DAS也可称为服务器附加存储(Server-AttachedStorage, SAS)。它依赖于服务器,其本身是硬件的堆叠,不带有任何存储操作系统。

典型的DAS结构如下图所示。

对于多个服务器或多台PC的环境,使用DAS方式设备的初始费用可能比较低,可是在这种连接方式下,每台PC或服务器单独拥有自己的存储磁盘,容量的再分配困难;对于整个环境下的存储系统管理,工作烦琐而重复,没有集中管理解决方案。所以整体拥有成本(TCO)较高。

NAS是一种将分布、独立的数据整合为大型、集中化管理的数据中心,以便于对不同主机和应用服务器进行访问的技术。简单说就是连接在网络上,具备资料存储功能的装置,因此也称为“网络存储器”。它是一种专用数据存储服务器。它以数据为中心,将存储设备与服务器彻底分离,集中管理数据,从而释放带宽,提高性能,降低总成本,保护投资。其成本远远低于使用服务器存储,而效率却远远高于后者。

典型的NAS结构如下图所示。

NAS存储实现了真正的即插即用,它部署简单,存储位置相对灵活,管理容易且成本较低。但是它基于以太网上传输数据,这就给这种方案带来许多不合理、不安全的因数。

存储域网络(Storage Area Network, SAN)用于将多个系统连接到存储设备和子系统。SAN可以被看做是负责存储传输的后端网络,而前端的数据网络负责正常的TCP/IP传输。作为一种新的存储连接拓扑结构,光纤通道为数据访问提供了高速的访问能力,它被设计用来代替现有的系统和存储之间的SCSI I/O连接。

SAN可以将存储网络中的所有存储设备及子系统视为一个大的、单一的存储池,存储资源可独立于服务器访问的扩充到存储池中,允许它们按照要求被测试、格式化、重新捆绑或进行映射,然后按要求将它分配给服务器。

SAN诵讨交换机的级联可轻易地扩充网络的存储容量。SAN体系结构如下图所示。

SAN的最主要的特征之一在于多个服务器可以访问所有SAN上的设备或子系统,因而可以支持高可靠性的群集系统。

早期的SAN采用的是光纤通道(Fiber Channel, FC)技术,所以,以前的SAN多指采用光纤通道的存储局域网络,到了iSCSI协议出现以后,为了区分,业界就把SAN分为FC-SAN和IP-SAN。

存储设备组成单独的网络,大多利用光纤连接,采用光纤通道协议。服务器和存储设备间可以任意连接,I/O请求也是直接发送到存储设备。光纤通道协议实际上解决了底层的传输协议,高层的协议仍然采用SCSI协议,所以光纤通道协议实际上可以看成是SCSIover FC。

存储区域网络的优点如下:服务器和存储设备之间的距离更远(光纤通道网络:10千米相比较DAS的SCSI:25米);高可靠性及高性能;多个服务器和存储设备之间可以任意连接;集中的存储设备替代多个独立的存储设备,支持存储容量共享;通过相应的软件使得SAN上的存储设备表现为一个整体,因此有很高的扩展性;可以通过软件集中管理和控制SAN上的存储设备,提供数据共享。

如果SAN是基于TCP/IP的网络,实现IP-SAN网络。这种方式是将服务器和存储设备通过专用的网络连接起来,服务器通过“Block I/O”发送数据存取请求到存储设备。最常用的是iSCSI技术,就是把SCSI命令包在TCP/IP包中传输,即为SCSI over TCP/IP。

IP SAN的优势在于:利用无所不在的以太网,在一定程度上保护了现有投资。IP存储超越了地理距离的限制,适合于对关键数据的远程备份。IP网络技术成熟,不存在互操作性问题。IP存储减少了配置、维护、管理的复杂度。IP网络已经被IT业界广泛认可——网络管理软件和服务产品可供使用。千兆网的广泛使用大大提高了IP网络的性能,万兆网技术的发展,使IP存储在性能上可以超越FC存储。

由于SAN通常是基于光纤通道的解决方案,需要专用的光纤通道交换机和管理软件,所以SAN的初始费用比DAS和NAS高。

RAID技术旨在缩小日益扩大的CPU速度和磁盘存储器速度之间的差距。其策略是用多个较小的磁盘驱动器替换单一的大容量磁盘驱动器,同时,合理地在多个磁盘上分布存放数据以支持同时从多个磁盘进行读/写,从而改善了系统的I/O性能。小容量驱动器阵列与大容量驱动器相比,具有成本低、功耗小、性能好等优势。低代价的编码容错方案在保持阵列的速度与容量优势的同时保证了极高的可靠性,同时也较容易扩展容量。但是由于允许多个磁头同时进行操作以提高I/O数据传输速度,因此不可避免地提高了出错的概率。

为了补偿可靠性方面的损失,RAID使用存储的校验信息(Stored Parity,Information, SPI)来从错误中恢复数据。最初,Inexpensive一词主要针对当时的另一种技术(Single Large Expensive Disk, SLED)而言,但随着技术的发展,SLED已经过时,RATD和non-RAID皆采用了类似的磁盘技术。因此,RAID现在代表独立磁盘冗余阵列,用Independent来强调RAID技术所带来的性能改善和更高的可靠性。

RAID机制中共分8个级别,工业界公认的标准分别为RAID0~RAID7。RAID应用的主要技术有分块技术、交叉技术和重聚技术。

(1)RAID0级(无冗余和无校验的数据分块):具有最高的I/O性能和最高的磁盘空间利用率,易管理,但系统的故障率高,属于非冗余系统,主要应用于那些关注性能、容量和价格而不是可靠性的应用程序。

(2)RAID1级(磁盘镜像阵列):由磁盘对组成,每一个工作盘都有其对应的镜像盘,上面保存着与工作盘完全相同的数据备份,具有最高的安全性,但磁盘空间利用率只有50%。RAID1主要用于存放系统软件、数据及其他重要文件。它提供了数据的实时备份,一旦发生故障,所有的关键数据即刻就可使用。

(3)RAID2级(采用纠错海明码的磁盘阵列):采用了海明码纠错技术,用户需增加校验盘来提供单纠错和双验错功能。对数据的访问涉及阵列中的每一个盘。大量数据传输时I/O性能较高,但不利于小批量数据传输。实际应用中很少使用。

(4)RAID3和RAID4级(采用奇偶校验码的磁盘阵列):把奇偶校验码存放在一个独立的校验盘上,如果有一个盘失效,其上的数据可以通过对其他盘上的数据进行异或运算得到。读数据很快,但因为写入数据时要计算校验位,速度较慢。

(5)RAID5级(无独立校验盘的奇偶校验码磁盘阵列):与RAID4类似,但没有独立的校验盘,校验信息分布在组内所有盘上,对于大、小批量数据读/写性能都很好。RAID4和RAID5使用了独立存取(Independent Access)技术,阵列中每一个磁盘都相互独立地操作,所以I/O请求可以并行处理。该技术非常适合于I/O请求率高的应用而不太适应于要求高数据传输率的应用。与其他方案类似,RAID4、RAID5也应用了数据分块技术,但块的尺寸相对大一点。

(6)RAID6级:这是一个强化的RAID产品结构。阵列中设置一个专用校验盘,它具有独立的数据存取和控制路径,可经由独立的异步校验总线、高速缓存总线或扩展总线来完成快速存取的传输操作。值得注意的是,RAID6在校验盘上使用异步技术读/写,这种异步仅限于校验盘,而阵列中的数据盘和面向主机的I/O传输仍与以前的RAID结构雷同,即采用的是同步操作技术。仅此校验异步存取,加上Cache存取传输,RAID6的性能比RAID5要好。

(7)RAID7级:是至今为止理论上性能最高的RAID模式,因为它从组建方式上就已经和以往的方式有了重大的不同。以往一个硬盘是一个组成阵列的“柱子”,而在RAID7中,多个硬盘组成一个“柱子”,它们都有各自的通道。这样做的好处就是在读/写某一区域的数据时,可以迅速定位,而不会因为以往因单个硬盘的限制,同一时间只能访问该数据区的一部分,在RAID7中,以前的单个硬盘相当于分割成多个独立的硬盘,有自己的读/写通道,效率也就不言自明了。然而,RAID7的设计与相应的组成规模注定了它是一揽子承包计划。

总体上说,RAID7是一个整体的系统,有自己的操作系统,有自己的处理器,有自己的总线,而不是通过简单的插卡就可以实现的。RAID7所有的I/O传输都是异步的,因为它有自己独立的控制器和带有Cache的接口,与系统时钟并不同步。所有的读/写操作都将通过一个带有中心Cache的高速系统总线进行传输,称之为X-Bus。专用的校验硬盘可以用于任何通道。带有完整功能的即时操作系统内嵌于阵列控制微处理器,是RAID7的心脏,它负责各通道的通信及Cache的管理,也是它与其他等级最大不同点之一。

单项选择题
多项选择题