首页 > 文章中心 > 正文

存储虚拟化技术

存储虚拟化技术

摘要存储技术的发展经历了从单个磁盘、磁带到DAS、NAS、SAN存储网络系统的历程,对存储环境和资源共享的迫切需求推动着存储虚拟化成为主流技术。本文通过对虚拟存储的综述,对虚拟存储化的基本概念、体系结构、实现方法、关键技术做了比较和分析。重点介绍基于网络的虚拟化技术,讨论了其关键技术与主要实现方法。

关键词存储虚拟化;逻辑存储;对称/非对称

1引言

随着信息数字化、网络化开展的各种多媒体处理业务的不断增加,企业的信息量不断增加,面对不断膨胀的数据量和不断增多的物理存储设备,如何能够保证一个存储系统具有高性能的I/O吞吐率、高可靠性和高扩展能力,以及良好的容错性能,成为各个IT产商倾注极大热情去解决的重大问题。特别是由于在存储系统中存在着大量的异构服务器和存储系统,非常有必要进行全面的存储管理,而传统DAS、NAS和SAN等存储形式已无法满足以上对存储设备的需求,所以存储虚拟化逐渐成为共享存储管理的主流技术。

2虚拟存储的概念

存储虚拟化是把不同接口协议(如SCSIiSCSI或FC等)的网络存储设备(如JBOD、RAID和磁带库等)整合成一个虚拟的存储池,根据需要为主机创建和提供虚拟存储卷。存储虚拟化是具存储设备和存储系统的抽象,展示给用户一个逻辑视图,同时将应用程序和用户所需的数据存储操作和具体的存储控制分离。因而可以充分利用异构平台的存储空间,达到最优化的使用效率。

3存储虚拟化的实现

存储虚拟化可以在三个不同的层面上实现,包括了基于专用卷管理软件在主机服务器上实现,或者利用阵列控制器的固件(Firmware)在磁盘阵列上实现;再或者是利用专用的虚拟化引擎在存储网络上实现。具体使用哪种方法来做,应根据实际需求来决定。

3.1主机或服务器级虚拟存储

基于主机或服务器的虚拟存储化实现通常称为逻辑卷管理(Logicalvalumemanager)。磁盘上的物理块或逻辑单元号(LUN)被映射成逻辑卷号。逻辑卷管理软件把多个不同的磁盘阵列映射成一个虚拟的逻辑块空间。通过在服务器上安装虚拟存储管理软件,实现各物理存储体集成映射的。

基于主机或服务器的虚拟化存储实现容易,可在不需要硬件支持的条件下实现形式多样的存储管理,对改善存储系统的可管理性,提高存储的安全性和可靠性很有益处。缺点是兼容性不好,扩展性差,调度工作会影响服务器的性能。

3.2存储设备级的虚拟存储

基于存储设备的虚拟存储针对异构SAN构架,更使用于以存储为核心的环境,它独立于主机,存储设备可以连接多台主机,但存储设备本身不能是异构的,此时虚拟过程是在阵列控制器上完成将一个阵列上的存储容量划分为多个存储空间(LUN,logicalUnitNumber),供不同的主机系统访问。智能的阵列控制器提供数据块级的整合,同时还提供一些附加的功能,例如:LUNMaking缓存,即时快照、数据复制等。配合使用不同的存储系统,基于存储设备的虚拟化模式可以实现性能的优化。但由于存储设备在各个供应商之间互操作性和兼容性较差,如果没有第三方的虚拟软件,基于存储设备的虚拟化经通常能提供一种不完全的虚拟存储化解决方案。

3.3网络级的虚拟存储

基于网络的虚拟化是目前SAN虚拟化的主流技术,通过在存储区域网这一级采用智能化的路由器,交换机或者是增加一个元数据服务器等来实现虚拟化的工作,它通过提供一种中央虚拟化方式将网络中的存储资源集中起来管理,从而降低了TCO,提供了一个“开放的”虚拟实施环境,最有可能支持任何的服务器、操作系统、应用和存储设备。从技术上讲,基于网络的存储虚拟化又分为带内(In-Band)和带外(Out-Band)两种。这两种方式的主要区别在于存储网络中数据I/O与控制信息是否使用同一通道。

3.3.1带内虚拟化的实现模型

带内虚拟化,也称为对称(symmetric)虚拟化。是指虚拟化的操作在服务器和存储设备之间交换数据的通道中执行,存储数据和控制信号使用同一数据通道。因为所有的数据访问都会通过这个引擎,它就可以实现很高的安全性。就像一个存储系统的防火墙,只有允许的访问才能通过,否则就会被拒绝。

带内虚拟化的优点是:可以整合多种存储设备,便于集中式管理,因此具有极高的安全性。但容易造成网络拥塞,降低了性能,同时容易产生瓶颈和单点实效,故在应用中这种结构往往是冗余配置。

目前市场上使用该技术的产品主要有IBM的TotaStorageSVC,HP的VA、EVA系列,HDS的TagmaStore,NetApp的V-Series及H3C的IV5000。

3.3.2带外(outofband)虚拟化

带外虚拟化,又称为非对称(asymmetric)虚拟化,是指虚拟化功能在位于存储数据通道之外的一个设备上实现。数据和命令信息使用不同的通道(如图2所示),应用服务器的I/O命令通过专用的命令通道传至专用的元数据服务器或控制器,获得元数据和数据视图后,再直接通过数据通道得到所需要的数据。由于数据在专用的通道上传输,因此提高了性能,且避免了单点故障和瓶颈,但是在一定程度上增加了用户投资,数据的安全性难以控制,实施难度大于带内模式。

4存储虚拟化网络的关键技术

存储虚拟化的核心工作是物理存储设备到单一逻辑资源池的映射,通过虚拟化技术,为用户和应用程序提供虚拟化磁盘或虚拟卷,而且用户可以根据需求对它进行任意分割,并分配给特定的主机或应用程序,而为用户隐藏或屏蔽了具体物理设备的各种物理特性。实现虚拟存储化关键技术如下:

1)共享冲突与数据一致性

存储虚拟化的一个主要功能是实现存储数据的共享,普通的文件系统只允许对数据进行独占式访问,但是商业应用需要在操作系统和“数据仓库”之间共享数据。数据的不同拷贝应能在不同服务器操作系统所带来的存储共享和并行存储时的I/O访问冲突等。这就需要良好的锁机制算法、多种级别的锁机制以及Cache一致性等技术,来保证数据之间的连贯性和一致性。

2)异构适应性

虚拟存储的另一个主要目标是实现真正意义上的设备互操作性,简化在在由不同主机操作系统和不同设备类型组成的异构存储环境中的系统管理和用户操作,实现真正意义上的存储设备的透明性。

3)系统存储空间的动态扩展

开放系统的计算机模型经历了一个从单一的、大而全的结构过渡到“n-层、分布式的或并行”的结构。每一层都可以独立扩展,保证最优的资源利用率。SAN虚拟化允许按照需要扩充存储资源,而对逻辑层和应用层透明。因此,系统管理员可以以兆字节为单位来扩充存储容量,而不破坏重要的应用。按需存储将是未来实现数据中心的主要驱动力。

4)数据存储与容错策略

由于应用和数据服务是透明的,必须避免越权访问和恶意攻击,数据安全性由整个系统的管理软件来保证,因此保证数据安全性是存储虚拟化技术的难点之一。虚拟存储也必须以较小的容错开销建立容错功能,克服系统单点故障,避免不可恢复的数据损失,同时也必须拥有数据容错备份系统,以保证因不可抗力而丢失的数据拥有的可靠备份。

5总结

海量数据需求在各个应用场合不断增加,由于存储虚拟化技术能够提供系统的高可用性、高可靠性并易于维护,它正在成为存储领域的核心技术。由于存储应用场合的复杂性和不同用户的存储需求的多样化,存储虚拟化技术必须加以丰富和完善(如数据的备份、复制、恢复、远程容灾、快照和多重镜像支持等),以提供良好的个性化服务。

另一方面,从目前来讲,存储虚拟化依然缺乏高度的标准化,不同的虚拟产品间的兼容性还有待进一步提高,必须尽快制定业界公认的存储虚拟化技术标准,以解决操作平台、网络和存储设备等产商及产品之间的互操作性问题,这样才能推动存储虚拟化技术的发展,当然在虚拟存储技术体现其

优越性的同时我们也不能够忽视虚拟技术的一些潜在问题,这样会更有利于虚拟技术向着智能化的方向发展。

参考文献

[1]QichaoXia,LianXingJia.ReserchofIntegrationMilitaryStorageResourcesBasedonStorageVirtualization.IEEEComputerSociety.2006

[2]CharlesMilligan,SidSelkirk.OnlineStorageVirtualization:ThekeytomanagerthedataexplosionIEEEComputerSociety.2006

[3]赵文辉,徐俊,周加林,李晨。网络存储技术[M]。清华大学出版社,2005年

[4]刘朝斌,谢长生,张琨.存储网络虚拟化关键技术的研究与实现.计算机科学2004年(31)

[5]王楠,蒋金虎.存储虚拟化技术研究与比较。洛阳师范学院学报.2007年(2)

[6]谢川,虞勤.虚拟存储及应用分析.数据库与信息管理.2007年