• 数据备份与灾难恢复

      计算机系统的故障分类以及故障发生的概率分析

      A类:计算机软硬件故障

      发生概率:对于某一企业,发生可能性最大,也最频繁,是经常发生的一类故障; 预防方法:本地双机热备,实现系统冗余,增强业务系统的高可用性。

      B类:人为操作故障 

      发生概率:对管理较严、人员素质较高的企业,偶尔发生;对管理较松、人员培训不足的企业,会经常发生;

      预防方法:提高系统自动化运行管理水平,做好本地数据冷备份,减少人的操作与干预,或制定严格的管理规范,避免误操作。

      C类:资源不足引起的计划性停机 

      发生概率:对于某一企业,随着业务的快速增长,平均每年均会发生如软、硬件升级、系统资源扩充等事件,业务增长越快的企业,发生亦越频繁;

      预防方法:本地双机,系统冗余。 D类:生产地点的灾难 发生概率:对于某一企业,发生概率较小;对于全国范围,有偶然发生的必然性;预防方法:灾难恢复中心。

      故障发生的损失分析及可行性数据保护模式(见右表) 现有备份方式的不足, 几年前我们主要采用主机内置或外置的磁带机对数据进行冷备份,这种方式在数据量不大,操作系统种类单一,服务器数量有限的情况下,不失为一种既经济又简明的备份手段。但随着企业计算机规模的扩大,数据量几何级的增长以及分布式网络环境的兴起,企业将越来越多的业务分布在不同的机器、不同的操作平台上,这种单机的人工冷备份方式越来越不适应当今分布式网络环境,存在以下种种弊端:

      数据管理工作难以形成制度化,数据丢失现象难以避免;

      数据分散在不同的机器、不同的应用上,管理分散,安全性得不到保障;

      难以实现数据库数据的高效在线备份;

      运行着的系统使得维护人员寸步难离,业务人员工作效率下降;

      存储媒体管理困难,如今,用来存储数据的介质越来越多,各种不同系统下存储产生的软盘、磁带、光盘将给管理带来很大的困难;

      历史数据保留比较困难;

      来自非计算机系统因素的隐患,如火灾、地震等灾难后的系统重建和业务数据运作。

      网络备份系统的目标

      理想的备份系统应该是全方位、多层次的。首先,要使用硬件备份来防止硬件故障;如果由于软件故障或人为误操作造成了数据的逻辑损坏,则使用网络存储备份系统和硬件容错相结合的方式。这种结合方式构成了对系统的多级防护,不仅能够有效地防止物理损坏,还能够彻底防止逻辑损坏。

      在网络系统安全建设中必不可少的一个环节就是数据的常规备份和历史保存。一般在生产本地的备份目的主要有两个:一是生产系统的业务数据由于系统或人为误操作造成损坏或丢失后,可及时在生产本地实现数据的恢复;另一个目的是在发生地域性灾难(地震、火灾、机器毁坏等)时,可及时在本地或异地实现数据及整个系统的灾难恢复。

      考虑到生产本地环境安全性原因,常规数据备份一般要求一份数据至少应有两个拷贝,一份放在生产中心以保证数据的正常恢复和数据查询恢复,另一份则要移到异地保存,以保证在生产本地出现灾难后最低限度的数据恢复。此外,更应建立历史归档数据的异地存放制度,从而确保对历史业务数据的可靠恢复与有效稽核的实现。

      综上所述,理想的网络备份系统应该具备以下功能: 集中式管理网络存储备份管理系统对整个网络的数据进行管理。利用集中式管理工具的帮助,系统管理员可对全网的备份策略进行统一管理,备份服务器可以监控所有机器的备份作业,也可以修改备份策略,并可即时浏览所有目录。所有数据可以备份到同备份服务器或应用服务器相连的任意一台磁带库内。

      全自动的备份 

      对于大多数机房管理人员来说,备份是一项繁重的任务。每天都要小心翼翼,不敢有半点闪失,生怕一失足成千古恨。网络备份能够实现定时自动备份,大大减轻管理员的压力。

      备份系统能根据用户的实际需求,定义需要备份的数据,然后以图形界面方式根据需要设置备份时间表,备份系统将自动启动备份作业,无需人工干预。这个自动备份作业是可自定的,包括一次备份作业、每周的某几日、每月的第几天等项目。设定好计划后,备份作业就会按计划自动进行。

      数据库备份和恢复

      在许多人的观念里,数据库和文件还是一个概念。当然,如果你的数据库系统是基于文件系统的,当然可以用备份文件的方法备份数据库。

      但发展至今,数据库系统已经相当复杂和庞大,再用文件的备份方式来备份数据库已不适用。是否能够将需要的数据从庞大的数据库文件中抽取出来进行备份,是网络备份系统是否先进的标志之一。

      在线式的索引 备份系统应为每天的备份在服务器中建立在线式的索引,当用户需要恢复时,只需点取在线式索引中需要恢复的文件或数据,该系统就会自动进行文件的恢复。

      归档管理 用户可以按项目、时间定期对所有数据进行有效的归档处理。提供统一的Open TapeFormat数据存储格式从而保证所有的应用数据由一个统一的数据格式来作永久的保存,保证数据的永久可利用性。 有效的媒体管理备份系统对每一个用于作备份的磁带自动加入一个电子标签,同时在软件中提供了识别标签的功能,如果磁带外面的标签脱落,只需执行这一功能,就会迅速知道该磁带的内容。

      HSM分级存储管理

      对出版业、制造业等易产生大量资料数据的行业而言,资料多属于极占空间的图形影像,且每张设计底稿及文件资料又常需随时保持在线状态。基于管理及成本的考虑,HSM (Hierarchical Storage Management,分级存储管理)系统是一个合适的在线备份解决方案。它利用硬盘、可擦写磁光盘、磁带进行三层式存储管理。所谓分级存储管理系统是一套自动化的网络存储管理设备,会自动判断硬盘中资料的使用频率,自动将不常用的资料移至速度较慢的光盘,而最不常用的资料则移到磁带中,这些都由系统管理员自行设定。在线的资料经过一段时间的搬移后,即可达到最佳化。

      系统灾难恢复

      网络备份的最终目的是保障网络系统的顺利运行。所以优秀的网络备份方案应能够备份系统的关键数据,在网络出现故障甚至损坏时,能够迅速地恢复网络系统。从发现故障到完全恢复系统,理想的备份方案耗时不应超过半个工作日。

      满足系统不断增加的需求备份软件必须能支持多平台系统,当网络上连接上其它的应用服务器时,对于网络存储管理系统来说,只需在其上安装支持这种服务器的客户端软件即可将数据备份到磁带库或光盘库中。

      网络备份存储管理系统简介

      网络数据存储管理系统是指在分布式网络环境下,通过专业的数据存储管理软件,结合相应的硬件和存储设备,来对全网络的数据备份进行集中管理,从而实现自动化的备份、文件归档、数据分级存储以及灾难恢复等。

      为在整个网络系统内实现全自动的数据存储管理,备份服务器、备份管理软件与智能存储设备的有机结合是这一目标实现的基础。

      网络数据存储管理系统的工作原理是在网络上选择一台应用服务器(当然也可以在网络中另配一台服务器作为专用的备份服务器)作为网络数据存储管理服务器,安装网络数据存储管理服务器端软件,作为整个网络的备份服务器。在备份服务器上连接一台大容量存储设备(磁带库、光盘库)。在网络中其他需要进行数据备份管理的服务器上安装备份客户端软件,通过局域网将数据集中备份管理到与备份服务器连接的存储设备上。

      网络数据存储管理系统的核心是备份管理软件,通过备份软件的计划功能,可为整个企业建立一个完善的备份计划及策略,并可借助备份时的呼叫功能,让所有的服务器备份都能在同一时间进行。备份软件也提供完善的灾难恢复手段,能够将备份硬件的优良特性完全发挥出来,使备份和灾难恢复时间大大缩短,实现网络数据备份的全自动智能化管理。目前在数据存储领域可以完成网络数据备份管理的软件产品主要有Legato NetWorker、IBM ADSM、Veritas NetBackup等。 备份策略及恢复计划日常备份制度描述了每天的备份以什么方式、使用什么备份介质进行,是系统备份方案的具体实施细则。在制订完毕后,应严格按照制度进行日常备份,否则将无法达到备份方案的目标。数据备份有多种方式:全备份、增量备份、差分备份、按需备份等。

      全备份:备份系统中所有的数据;

      增量备份:只备份上次备份以后有变化的数据;

      差分备份:只备份上次完全备份以后有变化的数据。

      按需备份:根据临时需要有选择地进行数据备份。

      全备份所需时间最长,但恢复时间最短,操作最方便,当系统中数据量不大时,采用全备份最可靠;但是随着数据量的不断增大,我们将无法每天做全备份,而只能在周末进行全备份,其它时间我们采用所用时间更少的增量备份或采用介于两者之间的差分备份。各种备份的数据量不同:全备份>差分备份>增量备份。在备份时要根据它们的特点灵活使用。

      数据存储基本策略的设定

      数据库全备份:选择在周五(或周六)自动进行。

      数据库增量备份:每晚作批前和批后由Unix或其它主机系统执行,批处理人员触发或由系统自动执行。

      文件全备份:将主机系统和其它服务器的数据作全备份,选择在周日自动进行。

      文件增量备份:在周一到周四(或周五)之间备份文件的增量。

      系统全量:在月初的周日备份系统及数据库的全量。

      系统增量:在其余的时间仅备份系统和数据库配置的增量。

      跟踪备份:实时备份系统增量(事务日志备份)。

      结合以上备份策略,从便于管理和恢复的角度考虑,制订数据分组和存储介质池对应策略,将数据分门别类放在不同编号的磁带组上,并建立不同的存取权限。

      建议建立:

      数据库介质:专门放置数据库信息。

      文件介质:除数据库以外的文件。

      数据库日志和系统日志介质:安全稽核和系统恢复的重要数据记录须较长时间保存,建议由安全管理官员在NT一侧建立管理,形成与主机系统管理人员分离的运行数据记录。

      系统介质:备份系统和系统配置等的变化,做到快速恢复系统。 数据备份工作过程自动备份进程由备份服务器发动。每天晚上,自动按照事先制订的时间表所要求内容,进行增量或全量的备份。由于每天的备份被适当地均衡,峰值备份数据量在周五(或周六)和周日发生。

      批前及批后备份在Unix或其它主机端发起。批处理人员键入触发备份命令,自动按要求备份数据库有关内容。

      其它文件的自由备份。进入软件交互菜单,选择要求备份的文件后备份。 在线跟踪备份。配合数据存储管理软件的数据库在线备份功能,可定义实时或定时将日志备份。

      灾难备份异地存放介质的克隆。自动复制每日完成后的数据,以存放异地作灾难恢复。 灾难恢复灾难恢复措施在整个备份制度中占有相当重要的地位。因为它关系到系统在经历灾难后能否迅速恢复。灾难恢复操作通常可以分为两类。第一类是全盘恢复,第二类是个别文件恢复,还有一种值得一提的是重定向恢复。

      全盘恢复:

      全盘恢复一般应用在服务器发生意外灾难导致数据全部丢失、系统崩溃或是有计划的系统升级、系统重组等,也称为系统恢复。

      个别文件恢复:

      由于操作人员的水平不高,个别文件恢复可能要比全盘恢复常见得多,利用网络备份系统的恢复功能,我们很容易恢复受损的个别文件。只需浏览备份数据库或目录,找到该文件,触动恢复功能,软件将自动驱动存储设备,加载相应的存储媒体,然后恢复指定文件。

      重定向恢复:

      重定向恢复是将备份的文件恢复到另一个不同的位置或系统上去,而不是进行备份操作时它们当时所在的位置。重定向恢复可以是整个系统恢复也可以是个别文件恢复。重定向恢复时需要慎重考虑,要确保系统或文件恢复后的可用性。

      为了防备数据丢失,我们需要做好详细的灾难恢复计划,同时还要定期进行灾难演练。每过一段时间,应进行一次灾难演习。可以利用淘汰的机器或多余的硬盘进行灾难模拟,以熟练灾难恢复的操作过程,并检验所生成的灾难恢复软盘和灾难恢复备份是否可靠。

      结束语 

      一个完整的灾难备份及恢复方案,应包括:备份硬件、备份软件、备份制度和灾难恢复计划四个部分。选了先进的备份硬件后,我们决不能忽略备份软件的选择,因为只有优秀的备份件才能充分发挥硬件的先进功能,保证快速、有效的数据备份和恢复。还需要据企业自身情况制定日常备份制度和灾难恢复措施,并由管理人员切实执行备份制度,否则系统安全将仅仅是纸上谈兵。