CN102508739B - 获取灾难后系统持续数据保护的性能信息的方法及装置 - Google Patents

获取灾难后系统持续数据保护的性能信息的方法及装置 Download PDF

Info

Publication number
CN102508739B
CN102508739B CN2011103220762A CN201110322076A CN102508739B CN 102508739 B CN102508739 B CN 102508739B CN 2011103220762 A CN2011103220762 A CN 2011103220762A CN 201110322076 A CN201110322076 A CN 201110322076A CN 102508739 B CN102508739 B CN 102508739B
Authority
CN
China
Prior art keywords
monitoring
performance information
event
recovery
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2011103220762A
Other languages
English (en)
Other versions
CN102508739A (zh
Inventor
张志�
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Inspur Beijing Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Beijing Electronic Information Industry Co Ltd filed Critical Inspur Beijing Electronic Information Industry Co Ltd
Priority to CN2011103220762A priority Critical patent/CN102508739B/zh
Publication of CN102508739A publication Critical patent/CN102508739A/zh
Application granted granted Critical
Publication of CN102508739B publication Critical patent/CN102508739B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明披露了获取灾难后系统持续数据保护的性能信息的方法及装置,其中方法包括:通过在系统持续数据保护中注入的监测守护模块监测系统中的恢复事件;根据监测的恢复事件获取持续数据保护的性能信息。本发明通过在现有的CDP中注入监测守护模块,来监测到CDP内部动态输入输出的流动、流量的变化等事件的发生,从而自动测试CDP的RTO及其它性能信息,并找到影响系统恢复的瓶颈。

Description

获取灾难后系统持续数据保护的性能信息的方法及装置
技术领域
本发明涉及容灾系统,尤其涉及获取灾难后系统持续数据保护(CDP,Continuous Data Protection)的性能信息的方法及装置。
背景技术
数据的恢复时间目标(RTO,Recovery Time Objective),主要指的是业务系统所能容忍的业务停止服务的最长时间,也就是业务系统从灾难发生后启动恢复到恢复正常服务功能的过程所需要的最短时间周期,是描述CDP性能的一项相关信息。例如,假设业务系统在时间点t1启动恢复,并在时间点t2完成恢复,那么RTO的值就等于t1-t1。容灾系统的RTO的值越小,代表其数据恢复能力越强。此外,描述CDP性能的信息还包括经灾难恢复后数据恢复的一致性或有效性。
目前,国际上通用的容灾系统的评审标准为Share78,包括如下内容:
(1)数据备份/恢复的范围;
(2)灾难恢复计划的状态;
(3)业务中心与容灾中心之间的传输距离;
(4)业务中心与容灾中心之间如何相互连接;
(5)数据是如何在业务中心和容灾中心之间传输的;
(6)当灾难发生时允许丢失的数据量;
(7)如何保证更新的数据及时更新在容灾中心;
(8)容灾中心从灾难后启动恢复至完成恢复进程的能力。
上述Share78只是建立CDP等容灾系统的一种评审标准,对于如何设计自动获得用于这些容灾系统的各项性能数据,从而评估容灾系统的灾难恢复能力,则是一个尚未解决而急需解决的问题。
发明内容
本发明所要解决的技术问题是提供一种获取灾难后系统数据保护的性能信息的方法及装置,能够自动获得用于容灾系统的性能数据。
为了解决上述技术问题,本发明提供了一种获取灾难后系统持续数据保护的性能信息的方法,包括:
通过在系统持续数据保护中注入的监测守护模块监测系统中的恢复事件;
根据监测的恢复事件获取持续数据保护的性能信息。
进一步地,通过在持续数据保护中注入的监测守护模块监测系统中的恢复事件,具体包括:
在持续数据保护中注入监测守护模块;
通过该监测守护模块监测系统输入输出数据流监测恢复事件,包括监测开始恢复事件和结束恢复事件。
进一步地,通过监测守护模块监测系统输入输出数据流监测开始恢复事件和所述结束恢复事件,具体包括:
监测系统中主机设备输入输出总线层的数据流和/或主机设备内设备驱动层的数据流;
当监测到主机设备输入输出总线层和/或块设备驱动层有大量数据流在移动,则判断发生开始恢复事件,并记录发生该开始恢复事件的第一时间;
当监测到主机设备输入输出总线层和/或块设备驱动层的大量数据流的移动停止,则判断发生结束恢复事件,并记录发生该结束恢复事件的第二时间。
进一步地,根据监测的恢复事件获取持续数据保护的性能信息,具体包括:
根据第二时间和第一时间的差,计算恢复时间目标,作为持续数据保护的性能信息之一获取。
进一步地,根据监测的恢复事件获取持续数据保护的性能信息,还包括:
比较灾难发生前备份的数据和恢复后的数据,根据比较结果分析容灾系统恢复能力,作为持续数据保护的性能信息之一获取。
进一步地,该方法还包括:
记录和/或显示持续数据保护的性能信息。
为了解决上述技术问题,本发明提供了一种获取灾难后系统持续数据保护的性能信息的装置,包括相互连接的监测守护模块、恢复性能测试模块,其中:
监测守护模块,用于注入到系统持续数据保护中监测恢复事件;
恢复性能测试模块,用于根据监测的恢复事件获知持续数据保护的性能信息。
进一步地,
监测守护模块通过监测系统输入输出数据流来监测恢复事件,包括监测开始恢复事件和结束恢复事件,并将监测到发生开始恢复事件的第一时间和发生结束恢复事件的第二时间输出给恢复性能测试模块;
恢复性能测试模块根据输入的第二时间和第一时间之差计算恢复时间目标,作为持续数据保护的性能信息之一获取。
进一步地,
监测守护模块通过监测到系统内主机设备输入输出总线层和/或主机设备内块设备驱动层有大量数据流在移动,则判断发生开始恢复事件;通过监测到主机设备输入输出总线层和/或块设备驱动层大量数据流的移动停止,则判断发生结束恢复事件。
进一步地,该装置还包括与所述恢复性能测试模块连接数据获取模块,其中:
恢复性能测试模块在计算恢复时间目标后,向数据获取模块输出数据获取命令;将该数据获取模块返回的灾难发生前备份的数据和恢复后的数据进行比较,根据比较结果分析系统的容灾恢复能力;
数据获取模块,用于根据输入的数据获取命令,将分别获取的灾难发生前备份的数据和恢复后的数据返回给恢复性能测试模块。
进一步地,该装置还包括与所述恢复性能测试模块连接的恢复性能记录模块,其中:
恢复性能测试模块将计算出的所述恢复时间目标、比较结果及分析结论中一种或多种信息作为持续数据保护的性能信息输出给恢复性能记录模块;
恢复性能记录模块,用于记录和/或显示输入的持续数据保护的性能信息。
本发明通过在现有的CDP中注入监测守护模块,来监测到CDP内部动态输入输出(IO,Input Output)的流动、流量的变化等事件的发生,从而获取到CDP的RTO及其它性能信息,并找到影响系统恢复的瓶颈。
附图说明
图1为本发明的获取系统持续数据保护的性能信息的方法实施例的流程图;
图2为图1所示方法实施例的具体应用实例流程图;
图3为本发明的获取系统持续数据保护的性能信息的装置实施例的结构框图。
具体实施方式
以下结合附图和优选实施例对本发明的技术方案进行详细地阐述。应该理解,以下例举的实施例仅用于说明和解释本发明,而不构成对本发明技术方案的限制。
本发明的获取灾难后系统持续数据保护的性能信息的方法实施例,其流程如图1所示,包括如下步骤:
110:通过在CDP中注入的监测守护模块监测系统中的恢复事件;
在此方法实施例中,恢复事件通过监测系统输入输出(IO)数据流监测。系统IO数据流包括主机设备(作为服务端的服务器设备/作为客户端的计算机设备)IO总线层和主机设备内块设备驱动层的数据流。
为了提高监测的精确度,系统IO数据流可通过对主机设备IO总线上数据流监测,也可以通过对块设备驱动层的数据流监测。其中,对主机设备IO总线上数据流监测,例如通过对主机设备插入的网卡(NIC,Network InterfaceCord)上相关总线的数据流量进行监测。
通过对多个层次的IO流监测的分析和对比,自适应地找到最佳监测方式。
120:根据监测的恢复事件获知CDP的性能信息;
监测的恢复事件至少包括开始恢复事件和结束恢复事件。其中,开始恢复事件主要通过发现主机设备IO总线层和块设备驱动层有大量数据流在移动监测到;结束恢复事件主要通过发现系统IO总线层和块设备驱动层大量数据流的移动停止监测到。
130:比较灾难发生前和恢复后的数据,并根据比较结果分析系统数据恢复能力。
如图2所示,是图1所示的方法实施例的一个具体应用实例的流程,包括如下步骤:
210:在CDP中注入监测守护模块;
在CDP中注入的监测守护模块,例如一个监测守护进程。
220:通过监测守护模块监测主机设备IO总线层的数据流和/或设备驱动层的数据流;
230:判断是否有开始恢复事件发生,是则执行步骤240,否则执行步骤250;
在此,通过监测到主机设备IO总线层和/或块设备驱动层有大量数据流在移动,来判断有开始恢复事件发生。
240:记录发生开始恢复事件的时间;
250:判断是否有结束恢复事件发生,是则执行步骤260,否则返回步骤220执行;
在此,通过监测到主机设备IO总线层和/或块设备驱动层大量数据流的移动停止,来判断有结束恢复事件发生。
260:记录发生结束恢复事件的时间,并计算RTO;
其中,RTO=发生结束恢复事件的时间-发生开始恢复事件的时间。
270:比较灾难发生前备份的数据和恢复后的数据,根据比较结果分析容灾系统恢复能力;
本发明可通过消息摘要算法(Message Digest Algorithm MD5)或其它方式对灾难发生前和恢复后的数据进行比较,如果比较结果为一致,则确定数据恢复有效且一致性好,如果比较结果为不一致,则确定数据恢复失败。
280:将计算出的RTO、比较结果以及分析结论作为CDP性能信息记录在日志中,结束流程。
还可以定时地将记录的上述CDP性能信息显示出来。例如通过图表的形式显示RTO随时间发展的态势,即图表的横坐标是时间,纵坐标是RTO数值。
以上所有监测信息均以日志的形式进行记录、备份和归档,并可以对RTO的数值进行分析和比较来找到相关的技术瓶颈。此外,分析结论可用图表的形式呈现。
本发明针对上述方法实施例,相应地还提供了获取灾难后系统持续数据保护的性能信息的装置实施例,其结构如图3所示,包括相互连接的监测守护模块310、恢复性能测试模块320,其中:
监测守护模块310,用于注入到系统的持续数据保护中监测恢复事件;
恢复性能测试模块320,用于根据监测的恢复事件获知CDP性能信息。
在上述装置实施例中,
监测守护模块310通过监测系统输入输出(IO)数据流来监测恢复事件,包括监测开始恢复事件和结束恢复事件,并将监测发生开始恢复数据事件的第一时间和发生结束恢复数据事件的第二时间输出给恢复性能测试模块320;
恢复性能测试模块320根据输入的第二时间和第一时间之差计算获取CDP的RTO信息。
在上述装置实施例中,
监测守护模块310通过监测到主机设备IO总线层和/或块设备驱动层有大量数据流在移动,则判断发生开始恢复事件;通过监测到主机设备IO总线层和/或块设备驱动层大量数据流的移动停止,则判断发生结束恢复事件。
在上述装置实施例中,还包括与恢复性能测试模块320连接数据获取模块330,其中:
恢复性能测试模块320在计算获取RTO信息后,向数据获取模块330输出数据获取命令;将数据获取模块330返回的灾难发生前备份的数据和恢复后的数据进行比较,根据比较结果分析系统的容灾恢复能力;
数据获取模块330,用于根据输入的数据获取命令,将分别获取的灾难发生前备份的数据和恢复后的数据返回给恢复性能测试模块320。
在上述装置实施例中,
恢复性能测试模块320在数据的比较结果为一致时,确定数据恢复有效且一致性好且容灾能力符合规定;在数据的比较结果为不一致时,则确定数据恢复失败且容灾能力不符合规定。
在上述装置实施例中,还包括与恢复性能测试模块320连接的恢复性能记录模块340,其中:
恢复性能测试模块320将计算出的RTO、比较结果及分析结论一种或多种信息作为CDP性能信息输出给恢复性能记录模块340;
恢复性能记录模块340,用于记录和/或显示输入的CDP性能信息。
本发明通过注入事件自动测试CDP的RTO及其它CDP性能信息的方法及装置,能够有效地找到系统影响数据恢复的瓶颈。本发明通过注入的监测守护模块监测系统中的数据恢复事件,不影响CDP的相关性能;该监测守护模块主要是对IO总线数据流进行分析和监测,并不占用CDP的资源,因此不会因为监测到相关事件的发生而影响CDP的性能。
对于本领域的专业人员来说,在了解了本发明内容和原理后,能够在不背离本发明的原理和范围的情况下,根据本发明的方法进行形式和细节上的各种修正和改变,但是这些基于本发明的修正和改变仍在本发明的权利要求保护范围之内。

Claims (7)

1.一种获取灾难后系统持续数据保护的性能信息的方法,其特征在于,包括:
通过在所述系统持续数据保护中注入的监测守护模块监测系统中的恢复事件;
根据监测的所述恢复事件获取所述持续数据保护的性能信息;
其中,通过在所述持续数据保护中注入的监测守护模块监测系统中的恢复事件,具体包括:
在所述持续数据保护中注入所述监测守护模块;
通过所述监测守护模块监测所述系统输入输出数据流监测所述恢复事件,包括监测开始恢复事件和结束恢复事件;
其中,通过所述监测守护模块监测所述系统输入输出数据流监测所述开始恢复事件和所述结束恢复事件,具体包括:
监测所述系统中主机设备输入输出总线层的数据流和/或所述主机设备内设备驱动层的数据流;
当监测到所述主机设备输入输出总线层和/或块设备驱动层有大量数据流在移动,则判断发生所述开始恢复事件,并记录发生该开始恢复事件的第一时间;
当监测到所述主机设备输入输出总线层和/或所述块设备驱动层的大量数据流的移动停止,则判断发生所述结束恢复事件,并记录发生该结束恢复事件的第二时间。
2.按照权利要求1所述的方法,其特征在于,根据监测的所述恢复事件获取所述持续数据保护的性能信息,具体包括:
根据第二时间和第一时间的差,计算恢复时间目标,作为所述持续数据保护的性能信息之一获取。
3.按照权利要求2所述的方法,其特征在于,根据监测的所述恢复事件获取所述持续数据保护的性能信息,还包括:
比较灾难发生前备份的数据和恢复后的数据,根据比较结果分析容灾系统恢复能力,作为所述持续数据保护的性能信息之一获取。
4.按照权利要求3所述的方法,其特征在于,还包括:
记录和/或显示所述持续数据保护的性能信息。
5.一种获取灾难后系统持续数据保护的性能信息的装置,其特征在于,包括相互连接的监测守护模块、恢复性能测试模块,其中:
监测守护模块,用于注入到所述系统持续数据保护中监测恢复事件;
恢复性能测试模块,用于根据监测的所述恢复事件获知所述持续数据保护的性能信息;
其中,还包括与所述恢复性能测试模块连接的数据获取模块,
其中:所述恢复性能测试模块在计算所述恢复时间目标后,向数据获取模块输出数据获取命令;将该数据获取模块返回的灾难发生前备份的数据和恢复后的数据进行比较,根据比较结果分析系统的容灾恢复能力;
数据获取模块,用于根据输入的数据获取命令,将分别获取的灾难发生前备份的数据和恢复后的数据返回给所述恢复性能测试模块;
其中,还包括与所述恢复性能测试模块连接的恢复性能记录模块,
其中:所述恢复性能测试模块将计算出的所述恢复时间目标、比较结果及分析结论中一种或多种信息作为所述持续数据保护的性能信息输出给恢复性能记录模块;
恢复性能记录模块,用于记录和/或显示输入的所述持续数据保护的性能信息。
6.按照权利要求5所述的装置,其特征在于,
所述监测守护模块通过监测系统输入输出数据流来监测所述恢复事件,包括监测开始恢复事件和结束恢复事件,并将监测到发生所述开始恢复事件的第一时间和发生所述结束恢复事件的第二时间输出给所述恢复性能测试模块;
所述恢复性能测试模块根据输入的第二时间和第一时间之差计算恢复时间目标,作为所述持续数据保护的性能信息之一获取。
7.按照权利要求6所述的装置,其特征在于,
所述监测守护模块通过监测到所述系统内主机设备输入输出总线层和/或所述主机设备内块设备驱动层有大量数据流在移动,则判断发生所述开始恢复事件;通过监测到所述主机设备输入输出总线层和/或所述块设备驱动层大量数据流的移动停止,则判断发生所述结束恢复事件。
CN2011103220762A 2011-10-20 2011-10-20 获取灾难后系统持续数据保护的性能信息的方法及装置 Active CN102508739B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2011103220762A CN102508739B (zh) 2011-10-20 2011-10-20 获取灾难后系统持续数据保护的性能信息的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2011103220762A CN102508739B (zh) 2011-10-20 2011-10-20 获取灾难后系统持续数据保护的性能信息的方法及装置

Publications (2)

Publication Number Publication Date
CN102508739A CN102508739A (zh) 2012-06-20
CN102508739B true CN102508739B (zh) 2013-11-13

Family

ID=46220831

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2011103220762A Active CN102508739B (zh) 2011-10-20 2011-10-20 获取灾难后系统持续数据保护的性能信息的方法及装置

Country Status (1)

Country Link
CN (1) CN102508739B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104407940A (zh) * 2014-11-26 2015-03-11 上海爱数软件有限公司 一种快速恢复cdp系统的方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101187948A (zh) * 2007-12-20 2008-05-28 中国科学院计算技术研究所 一种持续数据保护系统及其实现方法
CN101901173A (zh) * 2010-07-22 2010-12-01 上海骊畅信息科技有限公司 一种灾备系统及灾备方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8543542B2 (en) * 2005-02-07 2013-09-24 Mimosa Systems, Inc. Synthetic full copies of data and dynamic bulk-to-brick transformation
US7587418B2 (en) * 2006-06-05 2009-09-08 International Business Machines Corporation System and method for effecting information governance

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101187948A (zh) * 2007-12-20 2008-05-28 中国科学院计算技术研究所 一种持续数据保护系统及其实现方法
CN101901173A (zh) * 2010-07-22 2010-12-01 上海骊畅信息科技有限公司 一种灾备系统及灾备方法

Also Published As

Publication number Publication date
CN102508739A (zh) 2012-06-20

Similar Documents

Publication Publication Date Title
CN102436376B (zh) 用于分布式应用确认的模型检查
US9612936B2 (en) Correlation of source code with system dump information
TWI564732B (zh) A method and apparatus for monitoring user requests to run in a decentralized system
CN101188523A (zh) 告警相关性规则的生成方法及生成系统
US8489941B2 (en) Automatic documentation of ticket execution
CN104699601A (zh) 用于执行状态机驱动的注入的方法和系统
CN111147322A (zh) 5g核心网微服务架构的测试系统及方法
CN102779094A (zh) 终端和软件异常测试方法
US8554727B2 (en) Method and system of tiered quiescing
EP2565790A1 (en) Method and system for injecting simulated errors
CN105808417A (zh) 自动化测试方法及代理服务器
CN105637488A (zh) 追踪源代码用于末端用户监控
CN103617104A (zh) 一种基于ipmi的冗余计算机系统节点故障主被动检测方法
CN111581056B (zh) 基于人工智能的软件工程数据库维护与预警系统
CN111680104B (zh) 数据同步方法、装置、计算机设备及可读存储介质
CN103973516A (zh) 一种数据处理系统中实现监控功能的方法及装置
CN113569234B (zh) 一种用于安卓攻击场景重建的可视化取证系统及实现方法
CN102508739B (zh) 获取灾难后系统持续数据保护的性能信息的方法及装置
CN103064776B (zh) 一种性能监控方法及装置
CN102298112B (zh) 一种可编程逻辑器件的测试方法及系统
CN103823743A (zh) 软件系统的监控方法和设备
CN108984362A (zh) 日志采集方法及装置、存储介质、电子设备
CN111552613A (zh) 线程超时的处理方法、装置以及电子设备
CN111381937A (zh) 一种基于时间基线的实验场景快照生成系统及方法
CN111159051A (zh) 死锁检测方法、装置、电子设备及可读存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20201112

Address after: 215100 No. 1 Guanpu Road, Guoxiang Street, Wuzhong Economic Development Zone, Suzhou City, Jiangsu Province

Patentee after: SUZHOU LANGCHAO INTELLIGENT TECHNOLOGY Co.,Ltd.

Address before: 100085 Beijing, Haidian District on the road to information on the ground floor, building 2-1, No. 1, C

Patentee before: Inspur (Beijing) Electronic Information Industry Co.,Ltd.

TR01 Transfer of patent right