虚拟磁带库在灾备系统中的应用研究
张 磊
(东北大学信息学院,辽宁沈阳110004)E-mail:tianyinlingling@sina.com
摘 要:随着IT系统的广泛深入应用,IT系统的高可用性和容灾能力问题日益成为IT行业关注的一个焦点,容灾系统的建设对于国防、政府、企业都有着重要的意义.本文介绍了近年较为热门的虚拟磁带库备份技术的发展情况和实现方法,阐述了虚拟磁带库的发展概况,通过具体应用实例分析了虚拟磁带库技术在灾备系统中的作用和优化方向,提出了虚拟磁带库的主要发展方向.
关键词:虚拟磁带库;灾难备份;RTO;RPO;磁带;数据恢复
中图分类号:TP391 文献标识码:A 文章编号:1000-1220(2007)06-1149-04
ApplicationResearchofVTLintheDisasterRecoverySystems
ZHANGLei
(CollegeofInformationScienceandEngineering,NortheasternUniversity,Shenyang110004,China)
Abstract:AsITsystembecomesakeycomponentofbusinessprocess,highavailabilityandsecurityoftheinformationsystembecomeanurgentneed.Disasterrecoverysystemhassignificancetonationaldefense,administrations,enterprise.inThispaper.introducethedevelopmentandschemeofvirtualmagnetictapelibrarybackuptechnology.Thearticleexpatiatedonthedevel-opmentofVTL(visualtapelibrary),analyzedthefunctionofVTLinthesystemofdisasterrecoverywiththeappliedexample,andadvancedtheprimarydevelopmentaldirectionofVTL.
Keywords:visualtapelibrary(vtl);disasterrecovery;RTO;RPO;tape;databackup
1 前 言
由于各大企业对于数据安全性的需要,灾难备份产品逐渐推向市场前台,灾难备份技术迅速发展.本文根据灾难备份技术的发展分析了虚拟磁带库技术在整个灾难备份系统中发挥的作用,指出了虚拟磁带库在数据复制和恢复方面的优化方向,对虚拟磁带库的发展方向进行了展望.
也可以是远程的.当本地的生产系统发生故障时,备份系统主机可以连接上备份存储系统,开启业务.
2.1.2 基于操作系统
有些操作系统本身就具有数据跨存储设备的镜像功能.与本机硬盘单镜像设置的不同,这种灾备方式可以由操作系统通过SAN发起在两个存储设备间保存两份相同的数据.当本地的生产系统发生故障时,备份系统主机可以连接上备份存储系统,开启业务[4].2.1.3 基于应用软件
大多数系统或者数据库均有基于应用层的软件灾备解决方案.这种解决方案一般通过日志功能,将数据的更新动作通过网络如实地复制到本地或者远程的备份系统[5].当本地的生产系统发生故障时,备份系统主机无须重新启动,直接可以开启业务.
2.1.4 磁带冷备份
将生产系统的每日备份磁带定期送到安全的地方或者远程的备份机房.当本地的生产系统发生故障时,备份系统主机恢复磁带,然后开启业务.2.2 灾难备份的能力指标
随着备份方式的发展各大计算机公司也提供了很多灾备技术方案如EMC的SRDF、IBM的PPRC、AIX操作系统数据镜像等[6].由于灾备产品的多样化,备份方式的不同,灾难
2 灾难备份技术发展概论
随着\"911\"恐怖事件、网络病毒攻击等人为破坏和海啸、龙卷风、洪水、地震、飓风等天灾对某一地区的摧毁性打击的
不断出现,众多企业因为数据的丢失而倒闭,世界各国对灾难备份的要求越来越高[1].从原来的磁带冷备份发展到了当今提出的\"业务连续性\"灾备水平.从原来的单一的备份方式发展到了现在的多种备份方式[2].2.1 当今主流的灾备方式
当今主流的灾备方式有四种:
2.1.1 基于存储
目前主流的存储设备厂商在其存储产品上均有基于存储设备的灾备解决方案.这种解决方案是一种数据存储的物理镜像,它将数据在物理层面上,在两套存储设备中通过SAN制作或生成两套数据镜像
[3]
.这两套存储设备可以是本地的,
收稿日期:2006-12-20 作者简介:张 磊,男,1982年生,硕士研究生,主要研究方向为计算机软件与理论.1150 小 型 微 型 计 算 机 系 统 2007年
备份的能力也有差别.为了衡量灾备效果世界各国统一了两个衡量指标:
指标1:RTO(RecoveryTimeObjective),RecoveryTimeObjective是指灾难发生后,从I/T系统当机导致业务停顿之刻开始,到IT系统恢复至可以支持各部门运作,业务恢复运营之时,此两点之间的时间段称为RTO.
一般而言,RTO时间越短,即意味要求在更短的时间内恢复至可使用状态.虽然从管理的角度而言,RTO时间越短越好,但是,这同时也意味着更多成本的投入,即可能需要购买更快的存储设备或高可用性软件.
指标2:RPO(RecoveryPointObjective),RecoveryPointObjective是指从系统和应用数据而言,要实现能够恢复至可以支持各部门业务运作,系统及生产数据应恢复到怎样的更新程度.这种更新程度可以是上一周的备份数据,也可以是上一次交易的实时数据.
与RTO目标不同,RPO目标的确定不是依赖于企业业务规模,而是决定于企业业务的性质和业务操作依赖于数据的程度.因此,RPO目标对相同行业的企业而言会有些接近,而对于不同行业的企业来说仍可能会有较大差距[8].
现在提出的\"业务连续性\"具体技术指标是:实现秒级数据丢失,保证恢复时间点指标(RPO)小于2分钟;实现自动化的业务灾难恢复,保证业务恢复时间指标(RTO)小于2小时.为了提高RTO和RPO两个技术指标,企业逐渐放弃使用低速的自动磁带机而改用高速运转的磁盘,同时又不想改变原来磁带的复制方式[9],虚拟磁带库在这个过程中逐渐发展起来,成为了当今灾难备份中的关键技术.
[7]
心互备系统实现了秒级数据丢失,RPO小于2分钟;实现了自动业务级灾难恢复,保证了恢复时间指标RTO小于2小时.
调优工作取得明显成效,在投产运行后对系统日报表进行抽样调查,调优后的峰值延迟时间稳定在12秒以下.原灾备系统的峰值延迟时间在60-90秒之间.重建后数据传输性能有质的突破.日平均延迟时间小于3秒,原灾备系统的平均延迟时间在5-8秒之间,性能有明显改善.
3.2 虚拟磁带库在数据传输中的作用
虚拟磁带库就是在备份服务器或网络端上体现为传统磁带库的磁盘或磁盘阵列.将虚拟磁带库引入灾难备份系统可大大提高数据的复制和恢复速度.引入前后基本的灾备的数据复制过程[10]如图1所示.
3 虚拟磁带库技术分析及其在整个灾备系统中的作用和优化方向
3.1 虚拟磁带库的应用实例
虚拟磁带库越来越多地应用于重组灾备系统.中国某银行数据中心通过利用虚拟磁带库技术实现了南北两大数据中心的互备架构以及对数据的传输速度进行调优.
工程的硬件环境:IBM的z/SERIES主机,包括z990及z900两种类型;ESS-800磁盘;STKVSM4;STK9310磁带库.
该银行虚拟磁带库架构工程主要分为四个阶段.
第一阶段是银行灾难备份与虚拟磁带库技术研究、测试与方案论证阶段;
第二阶段是南北两大数据中心主机系统异地互为灾难备份系统的工程建设阶段;
第三阶段是两大中心主机生产系统的整合及整合后灾难重建阶段;
第四阶段是信息系统连续性运作计划及工程验收阶段.银行以其雄厚的技术实力和有效的组织规划,分四个阶段,历时近四年时间,圆满完成了基于虚拟磁带库的主机灾难备份工程建设的各项任务,建成国际银行业同类体系架构中规模最大的千公里级异地灾难备份和恢复系统,各项技术指标达到国际灾备等级标准的第六级以上,切实实现了信息系统的灾难应急恢复能力.通过虚拟磁带库架构的南北数据中图1 虚拟磁带库引入前后的变化Fig.1 ThechangeofimportingVTL
这里的虚拟带库即磁盘阵列起到了高速缓存的作用,用磁盘为备份介质来存储数据,并且本身能够仿真成物理磁带库的产品.虚拟磁带库的使用方式与传统磁带库几乎相同,但由于采用磁盘作为存储介质,备份和恢复速度可达100MB/s以上,远远高于目前最快的磁带机.同时,磁盘阵列的RAID保护技术使虚拟磁带库系统的可用性、可靠性均比普通磁带库高出若干量级.
3.3 虚拟磁带库的系统结构
虚拟磁带库系统结构是一个三层结构,分别是主机层、虚拟带库层和自动磁带库层,以StorageTek公司的VSM系统为例,如图2所示(见下页).
主机层可以有多个主机(HOST)共享虚拟磁带库;虚拟带库层一般有多台用高端磁盘设备模拟的虚拟存储控制(VSM)设备,保证系统冗余性和更大备份与恢复带宽[11];自动磁带库层可以有一个或多个自动磁带库,磁带库内有物理磁带、带槽、磁带机、机械手等.各层设备之间用光纤通道连接.对于完整的虚拟磁带库系统而言,主机与物理磁带库的磁带机间还有直连通道以及TCP/IP连接.
大型虚拟磁带库系统的VSM存储容量达数TB,自动磁6期 张 磊:虚拟磁带库在灾备系统中的应用研究 1151
带库的存储容量达到数百TB.VSM作为高速主机与低速磁
理磁带在恢复过程中重复装载,一盘虚拟磁带在恢复过程中重复回调,资源(物理磁带、物理磁带机及虚拟磁带)冲突问题等问题.其中最为突出的问题在于虚拟磁带库在恢复自动磁带机时被动的装载磁带机,造成重复装载的问题.提前对恢复的批量作业进行智能控制,如命名规范后将作业文件目录化即进行CATALOG,对照文件名称DSN进行主动回调,部分灾备机构使用这种方法工作效率提高了近一倍[14].但是这只解决了一部分问题,虚拟磁带库的性能还有很大提升空间,如何合理的匹配磁盘与磁带是优化虚拟磁带库的重点.
4 虚拟磁带库的发展前景
虚拟磁带库技术由于在数据备份与恢复性能、海量数据
图2 虚拟磁带库系统结构Fig.2 ThestructureofVTL
带库中间的高速缓冲介质,备份数据先备份到VSM,再自动转移保存到自动磁带库的物理磁带上,数据在VSM和自动
磁带库之间的转移对用户是透明的,有专门的虚拟磁带库管理软件进行管理.
3.4 虚拟磁带库的功能
磁带库系统在整个灾备系统中的结构如图3所示.
共享、数据灾难备份、资源充分利用及性能价格比方面,比起其它解决方案有独特的优势[15],所以虚拟磁带库将会得到普遍应用.
同时虚拟磁带库也存在着弊端,限制虚拟磁带库的发展主要有两个方面:产品价格偏高问题和功能未完善问题.4.1 产品价格问题
由于灾备产品面向的客户主要是医院、银行等对数据的安全性有着极高需要的大型机构,所以主流的灾备产品价格偏高.这使得大部分中小型企业不能使用虚拟磁带库这样的高端产品,而只能使用一些简单的安全性较差的低端产品,甚至放弃使用灾备系统.这很大程度上影响了虚拟磁带库技术的发展和普及.
磁带是用户进行备份的主要介质,长期以来,用户饱受磁带库的各种困扰,其中最为突出的,是机械磁带库设备安全性差和恢复能力欠佳.但是它的价格低廉,如果可以将古老的存储介质磁带和高速运做的磁盘相结合可以节省一部分的资源.在实际的数据备份工作中有海量的数据并不是近期需要的,只是作为一种长期的备份数据,这些数据不需要快速的恢复过程,可以用磁带来进行存储,而磁盘可以运做有效数据量,就能够保证正常的备份恢复速度.
在不同的企业系统中对数据的复制量和数据恢复速度的要求各不相同,这就要求技术管理人员对高速磁盘和低速磁
图3 灾难备份系统结构
Fig.3 Thestructureofdisasterrecovery
其中虚拟磁带库发挥了四项功能[12]:1.生产系统实现本地磁带库备份、同城异地磁带库备份、远程磁带库灾难备份.
2.远程磁带库异地数据恢复,满足异地测试环境数据准备的需要[13].
3.生产中心磁带库和测试中心磁带库相对独立,可以实现很好的逻辑隔离.
4.测试中心本地磁带库是多套测试环境的数据共享平台,满足本地备份与恢复以及本地跨环境数据交换的需要,与生产中心完全独立.
3.5 虚拟磁带库的优化方向
虚拟磁带库在优化了自动磁带机的同时也存在同一盘物带的使用量把握得当,在保证系统灾难备份的要求的同时节省一定的经济开支.4.2 功能问题
相对于价格问题虚拟磁带库的功能问题更为关键,问题主要在于它对备份工作并未带来质的改变,用户对某些功能方面还存在期待.虚拟磁带库在功能方面还有很大的提高空间.
通过新技术更多发挥磁盘在数据管理方面的灵活性是虚拟磁带库的发展趋势.与物理磁带相比,虚拟磁带(磁盘)显然具有快速、灵活的数据管理能力.多线程控制和备份软件的相互兼容将是提高虚拟磁带库的数据管理能力的关键课题.
5 结 语
本文阐述了灾难备份系统的发展概况,根据灾难备份系1152 小 型 微 型 计 算 机 系 统 2007年
统的发展进程提出了虚拟磁带库技术的重要性.通过分析虚拟磁带库的具体技术在整个灾难备份系统架构中的作用提出了一些应用性的优化方向.最后对虚拟磁带库发展前景进行了分析,本文对灾难备份技术的发展有一定的研讨意义.不足之处是由于大型企业考虑安全因素对一些重要技术屏蔽,所以无法给出很具体的企业应用实例数据.References:
[1]GartnerIncorporated.Disastermanagementplanforremoteac-cess[Z].September20,2001.
[2]Fallara.Disasterrecoveryplanning[J].IEEEPotentials.2003,
22(7)55.
[3]CaiWan-dong,HeDe-yong,HanLei,etal.Designandimple-mentofadisasterrecoverysystem[J].ComputerEngineering,2004,30(7):116-117.
[4]LiuYing-feng,QiMing.Technologyandapplicationofdisaster
recovery[J].ApplicationResearchofComputer,2002,6,7-10.[5]XiaoWan-cheng.Analysisandthinkofdisasterreplicationsys-tem[J].InformationNet.2003,5(6):25-42.
[6]ZhangYan,LiZhou-jun,HeDe-quan.Actualityanddevelopment
ofdisasterreplicationandrecoverytechnology[J].ComputerEngineeringandScience,2005,27(2):107-111.
[7]YangXiao-hong,LiJian,YangWei-guo,etal.Analysisandre-searchofinformationsystemdisasterrecoverytechnology[J].ComputerEngineeringandDesign,2005,26(10):2727-2729.[8]XieChang-sheng,HanDe-zhi.Thestepandtechnologyofdisas-terbackup[N].ChineseComputerUsres.2003,5-27.
[9]RoselindaR.Schulman.Disasterrecoveryissuesandsolutions
[J].HitachiDataSystems,2002,3(5):3-5.
[10]ChenTian-qing.Thestepanalysisofdisasterrecoveryconstruc-tion[N].ChinaFinanceComputer,2005,5,14-22.
[11]Symantec.Dataprotectioncustomersolutionsguide[R/OL].
2005.
[12]WangDe-jun,WangLi-na.Researchondisasterrecoverysys-
tem[J].ComputerEngineering,2005,31(6):43-45.
[13]ZhouShi-chao,GuoLi-jiang.Researchonthemodeloflong-dis-tanceapplieddisasterrecoverysystem[J].TheWorldofInfor-mation.2003,2(2):5-6.
[14]HuangWen-yu,WuJia-jia,HuTian.Researchonthebetter
methodofVTLbackupinlargedatacenter[N].Chinafinancenet.2006,7,1-3.
[15]LaoJuan.Disasterreplicationandrecoverytechnologyandpro-jectanalysis[J].ComputerApplicationamdSoftware,2005,22(3):121-122.
附中文参考文献:
[3]蔡皖东,何得勇,韩 蕾,等.一种网络容灾系统的设计与实现
[J].计算机工程,2004,30(7):116-117.
[4]刘迎风,祁 明.容灾技术及其应用[J].计算机应用研究,2002,
6(2):7-10.
[5]肖万成.灾难备份系统的分析与思考[J].信息网络,2003,5(6):
25-42.
[6]张 艳,李舟军,何德全.灾难备份和恢复技术的现状与发展
[J].计算机工程与科学,2005,27(2):107-111.
[7]杨晓红,李 健,杨卫国,等.信息系统容灾技术的分析与研究
[J].计算机工程与设计,2005,26(10):2727-2729.
[8]谢长生,韩德志.容灾备份的等级和技术[N].中国计算机用户.
2003,5-27.
[10]陈天晴.灾难备份建设的流程分析[N].中国金融电脑,2005,5,
14-22.
[12]王德军,王丽娜,等.容灾系统研究[J].计算机工程,2005,31
(6):43-45.
[13]周世超,郭力江.远程应用级容灾系统模型研究[J].通信世界,
2003,2(2):5-6.
[14]黄文宇,吴笳笳,胡 田.大型数据中心虚拟磁带库数据恢复性
能优化方法的研究[N].中国金融信息网,2006,7,1-3.
[15]劳 眷.灾难备份和恢复技术及解决方案分析[J].计算机应用
与软件,2005,22(3):121-122.
因篇幅问题不能全部显示,请点此查看更多更全内容