CN105373446A - 一种基于自动演练的系统自动修复方法和装置 - Google Patents

一种基于自动演练的系统自动修复方法和装置 Download PDF

Info

Publication number
CN105373446A
CN105373446A CN201510671371.7A CN201510671371A CN105373446A CN 105373446 A CN105373446 A CN 105373446A CN 201510671371 A CN201510671371 A CN 201510671371A CN 105373446 A CN105373446 A CN 105373446A
Authority
CN
China
Prior art keywords
mistake
information
rehearsal
automatically
automatic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510671371.7A
Other languages
English (en)
Other versions
CN105373446B (zh
Inventor
李德豪
陈伟康
邓俊安
区灿彬
刘开杰
李家昆
武梦洁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
High In Clouds Foshan City Disaster Tolerance Information Technology Co Ltd
Original Assignee
High In Clouds Foshan City Disaster Tolerance Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by High In Clouds Foshan City Disaster Tolerance Information Technology Co Ltd filed Critical High In Clouds Foshan City Disaster Tolerance Information Technology Co Ltd
Priority to CN201510671371.7A priority Critical patent/CN105373446B/zh
Publication of CN105373446A publication Critical patent/CN105373446A/zh
Priority to PCT/CN2016/101841 priority patent/WO2017063555A1/zh
Application granted granted Critical
Publication of CN105373446B publication Critical patent/CN105373446B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Stored Programmes (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于自动演练的系统自动修复方法和装置,包括以下步骤:A、启动数据备份自动演练,出现报错,获取该错误的特征信息;B、根据获取到的错误的特征信息,查询数据库,寻找解决该错误的解决方法;C、执行解决方法,修复错误,继续执行数据备份自动演练。本发明提供一种基于自动演练技术的系统自动修复方法和装置,该方法和装置智能高效,根据工作人员的系统修复经验,定义成智能的数据库,构建成自动修复机制,使数据容灾演练系统更加智能可靠。

Description

一种基于自动演练的系统自动修复方法和装置
技术领域
本发明涉及数据系统修复技术,尤其涉及的是一种基于自动演练的系统自动修复方法和装置。
背景技术
科技发达,依靠IT(InformationTechnology)的情况越来越多,特别是大数据流行,重温、重现或参考历史环境数据的需求不断增加,冷备份的演练变得越加重要。在实际应用中,每天演练中遇到问题,绝大部分都是重复的,传统的方法需要人手处理这些重复的问题,耗时费力,工作效率低。
专利号为2009101698683的发明专利公开了一种集中管理式备份容灾系统,该专利公开了一种利用实体转虚拟技术,构建虚拟平台并进行数据备份自动演练的方法,基于该方法,本发明提出一种智能高效的系统自动修复方法。
发明内容
本发明的目的在于提供一种基于自动演练的系统自动修复方法和装置,在遇到重复的问题时,系统可以自动的进行修复,智能高效。
本发明的技术方案如下:一种基于自动演练的系统自动修复方法,其中,包括以下步骤:
A、启动数据备份自动演练,出现报错,获取该错误的特征信息;
B、根据获取到的错误的特征信息,查询数据库,寻找解决该错误的解决方法;
C、执行解决方法,修复错误,继续执行数据备份自动演练;
所述步骤B中,数据库内部存储有与各错误一一对应的方法数据组,所述方法数据组包括错误的特征信息和解决该错误的方法程序信息;所述特征信息包括该错误的号码信息和该错误的情境信息;
所述步骤B和C中,获取到的错误的特征信息与存储在数据库内部的某一方法数据组所包含的错误的特征信息匹配后,执行该方法数据组所包含的方法程序信息,自动修复错误。
所述的基于自动演练的系统自动修复方法,其中,所述情境信息包括至少一个必然情境信息。
所述的基于自动演练的系统自动修复方法,其中,所述情境信息还包括至少一个偶然情境信息。
一种基于自动演练的系统自动修复装置,其中,包括自动演练模块,用于进行数据备份的自动模拟演练;
错误检测模块,与自动演练模块连接,用于时刻检测自动演练模块在自动演练过程中是否发生错误,同时获取该错误的特征信息;
存储模块,用于存储错误的特征信息和解决该错误的方法程序信息;
查询模块,分别与错误检测模块和存储模块连接,用于根据错误检测模块获取到的错误的特征信息,在存储模块中查询,获取解决该错误的方法程序信息;
修复模块,分别与查询模块和存储模块连接,用于运行查询模块查询得到的方法程序信息,解决错误。
所述的基于自动演练的系统自动修复装置,其中,所述错误的特征信息包括该错误的号码信息和该错误的情境信息。
所述的基于自动演练的系统自动修复装置,其中,所述错误的情境信息包括至少一个必然情境信息。
所述的基于自动演练的系统自动修复装置,其中,所述错误的情境信息还包括至少一个偶然情境信息。
本发明的有益效果:本发明提供一种基于自动演练技术的系统自动修复方法和装置,该方法和装置智能高效,根据工作人员的系统修复经验,定义成智能的数据库,构建成自动修复机制,使数据容灾演练系统更加智能可靠。
附图说明
图1是本发明中基于自动演练的系统自动修复方法的流程图。
图2是本发明中基于自动演练的系统自动修复装置的模块框图。
具体实施方式
为使本发明的目的、技术方案及优点更加清楚、明确,以下参照附图并举实施例对本发明进一步详细说明。
实际应用中,自动演练模块经常会出现一些小错误,例如在自动演练(drill)过程中没有看到数据盘,这时就需要手动将磁盘连接上线(online);又如,在自动演练过程中某些服务没有响应(hayco),这时候需要重新对该时间的节点进行自动演练(drill);又如,在自动演练过程有时会出现mail获取不到,这时候会显示密码错误(tescooversea),此时需要先备份(backup)后再进行自动演练(drill);又如,管理员(servermanager)在获取备份报告时有时候会显示没有变量(增量)(0delta),此时需要在备份报告上面说明备份还没有完成(backupnotfinish)。
由于在自动演练过程中常常出现以上问题,甚至还会出现其他常见问题,每一个报错均需要工作人员手动去查询数据,获取解决办法,十分耗时费力。本发明通过对常见错误的收集、分析,提出一种可以自动解决这些常见问题的系统自能修复方法,不但提高了自动演练系统的可靠性,同时解放了技术人员的劳动力,极大的提高了工作效率。
本发明公开了一种基于自动演练的系统自动修复方法,如图1所示,包括以下步骤:
A、启动数据备份自动演练,出现报错,获取该错误的特征信息;
B、根据获取到的错误的特征信息,查询数据库,寻找解决该错误的解决方法;如果查询不到,则上报给工作人员进行手动处理,同时对这种错误进行备份。
C、执行解决方法,修复错误,继续执行数据备份自动演练。
所述步骤B中,数据库内部存储有与各错误一一对应的方法数据组,所述方法数据组包括错误的特征信息和解决该错误的方法程序信息;所述特征信息包括该错误的号码信息和该错误的情境信息。实际应用中,在初期构建数据库时,需要根据工作人员的经验进行定义,每一个方法数据组定义完毕后,需要反复测试以保证其准确性。
所述步骤B中,获取到的错误的特征信息与存储在数据库内部的某一方法数据组所包含的错误的特征信息匹配后,执行该方法数据组所包含的方法程序信息,自动修复错误。在实际应用中,获取到的错误的特征信息必须要求与存储在数据库内部的某一方法数据组所包含的错误的特征信息完全对应,才可以调用该方法数据组所包含的方法程序信息,进行修复问题,这种方法保证了整个系统运行的准确性。
实际应用中,情境信息包括至少一个必然情境信息,必然情境信息即为发生该错误时所必然出现的现象信息、或必然导致的结果信息。为了提高系统的准确性,可以在情境信息中设置多个必然情境信息,在匹配时,需要所有必然情境信息均一一对应。
实际应用中,情境信息还包括至少一个偶然情境信息,偶然情境信息即为发生该错误时可能出现的现象信息、或偶然导致的结果信息。
本发明同时提出了与该基于自动演练的系统自动修复方法对应的装置,参见图2,包括自动演练模块100,用于进行数据备份的自动模拟演练;错误检测模块200,与自动演练模块100连接,用于时刻检测自动演练模块100在自动演练过程中是否发生错误,同时获取该错误的特征信息;存储模块400,用于存储错误的特征信息和解决该错误的方法程序信息;查询模块300,分别与错误检测模块200和存储模块400连接,用于根据错误检测模块200获取到的错误的特征信息,在存储模块400中查询,获取解决该错误的方法程序信息;修复模块500,分别与查询模块300和存储模块400连接,用于运行查询模块300查询得到的方法程序信息,解决错误。
实际应用中,错误的特征信息包括该错误的号码信息和该错误的情境信息。具体的,错误的情境信息包括至少一个必然情境信息或至少一个偶然情境信息。
应当理解的是,本发明的应用不限于上述的举例,对本领域普通技术人员来说,可以根据上述说明加以改进或变换,所有这些改进和变换都应属于本发明所附权利要求的保护范围。

Claims (7)

1.一种基于自动演练的系统自动修复方法,其特征在于,包括以下步骤:
A、启动数据备份自动演练,出现报错,获取该错误的特征信息;
B、根据获取到的错误的特征信息,查询数据库,寻找解决该错误的解决方法;
C、执行解决方法,修复错误,继续执行数据备份自动演练;
所述步骤B中,数据库内部存储有与各错误一一对应的方法数据组,所述方法数据组包括错误的特征信息和解决该错误的方法程序信息;所述特征信息包括该错误的号码信息和该错误的情境信息;
所述步骤B和C中,获取到的错误的特征信息与存储在数据库内部的某一方法数据组所包含的错误的特征信息匹配后,执行该方法数据组所包含的方法程序信息,自动修复错误。
2.根据权利要求1所述的基于自动演练的系统自动修复方法,其特征在于,所述情境信息包括至少一个必然情境信息。
3.根据权利要求2所述的基于自动演练的系统自动修复方法,其特征在于,所述情境信息还包括至少一个偶然情境信息。
4.一种基于自动演练的系统自动修复装置,其特征在于,包括自动演练模块,用于进行数据备份的自动模拟演练;
错误检测模块,与自动演练模块连接,用于时刻检测自动演练模块在自动演练过程中是否发生错误,同时获取该错误的特征信息;
存储模块,用于存储错误的特征信息和解决该错误的方法程序信息;
查询模块,分别与错误检测模块和存储模块连接,用于根据错误检测模块获取到的错误的特征信息,在存储模块中查询,获取解决该错误的方法程序信息;
修复模块,分别与查询模块和存储模块连接,用于运行查询模块查询得到的方法程序信息,解决错误。
5.根据权利要求4所述的基于自动演练的系统自动修复装置,其特征在于,所述错误的特征信息包括该错误的号码信息和该错误的情境信息。
6.根据权利要求5所述的基于自动演练的系统自动修复装置,其特征在于,所述错误的情境信息包括至少一个必然情境信息。
7.根据权利要求6所述的基于自动演练的系统自动修复装置,其特征在于,所述错误的情境信息还包括至少一个偶然情境信息。
CN201510671371.7A 2015-10-15 2015-10-15 一种基于自动演练的系统自动修复方法和装置 Active CN105373446B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201510671371.7A CN105373446B (zh) 2015-10-15 2015-10-15 一种基于自动演练的系统自动修复方法和装置
PCT/CN2016/101841 WO2017063555A1 (zh) 2015-10-15 2016-10-12 一种基于自动演练的系统自动修复方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510671371.7A CN105373446B (zh) 2015-10-15 2015-10-15 一种基于自动演练的系统自动修复方法和装置

Publications (2)

Publication Number Publication Date
CN105373446A true CN105373446A (zh) 2016-03-02
CN105373446B CN105373446B (zh) 2019-02-22

Family

ID=55375667

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510671371.7A Active CN105373446B (zh) 2015-10-15 2015-10-15 一种基于自动演练的系统自动修复方法和装置

Country Status (2)

Country Link
CN (1) CN105373446B (zh)
WO (1) WO2017063555A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017063555A1 (zh) * 2015-10-15 2017-04-20 佛山市云端容灾信息技术有限公司 一种基于自动演练的系统自动修复方法和装置
CN109697116A (zh) * 2018-08-20 2019-04-30 平安普惠企业管理有限公司 灾备演练方法、装置、设备及可读存储介质
CN111752787A (zh) * 2019-03-26 2020-10-09 中移(苏州)软件技术有限公司 一种资源池容灾演练方法、装置及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020087914A1 (en) * 2000-12-28 2002-07-04 Sarra Anthony N. Repairing applications
CN101719085A (zh) * 2009-12-23 2010-06-02 金蝶软件(中国)有限公司 日志文件的处理方法、装置及系统
CN103530199A (zh) * 2012-07-02 2014-01-22 腾讯科技(深圳)有限公司 一种修复软件运行错误的方法、装置及系统
CN104883704A (zh) * 2014-02-27 2015-09-02 宇龙计算机通信科技(深圳)有限公司 一种移动终端接入点参数的自动纠错方法和装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101466115A (zh) * 2008-12-30 2009-06-24 宇龙计算机通信科技(深圳)有限公司 一种故障检测方法、系统及移动终端
CN102521116A (zh) * 2011-12-29 2012-06-27 苏州佰思迈信息咨询有限公司 一种故障监控软件
CN102768639B (zh) * 2012-06-11 2015-02-18 北京奇虎科技有限公司 操作系统内核级错误定位方法及装置
CN103684828B (zh) * 2012-09-18 2018-08-03 长春亿阳计算机开发有限公司 一种电信设备故障的处理方法和装置
CN105373446B (zh) * 2015-10-15 2019-02-22 佛山市云端容灾信息技术有限公司 一种基于自动演练的系统自动修复方法和装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020087914A1 (en) * 2000-12-28 2002-07-04 Sarra Anthony N. Repairing applications
CN101719085A (zh) * 2009-12-23 2010-06-02 金蝶软件(中国)有限公司 日志文件的处理方法、装置及系统
CN103530199A (zh) * 2012-07-02 2014-01-22 腾讯科技(深圳)有限公司 一种修复软件运行错误的方法、装置及系统
CN104883704A (zh) * 2014-02-27 2015-09-02 宇龙计算机通信科技(深圳)有限公司 一种移动终端接入点参数的自动纠错方法和装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017063555A1 (zh) * 2015-10-15 2017-04-20 佛山市云端容灾信息技术有限公司 一种基于自动演练的系统自动修复方法和装置
CN109697116A (zh) * 2018-08-20 2019-04-30 平安普惠企业管理有限公司 灾备演练方法、装置、设备及可读存储介质
CN111752787A (zh) * 2019-03-26 2020-10-09 中移(苏州)软件技术有限公司 一种资源池容灾演练方法、装置及存储介质

Also Published As

Publication number Publication date
WO2017063555A1 (zh) 2017-04-20
CN105373446B (zh) 2019-02-22

Similar Documents

Publication Publication Date Title
CN110645153B (zh) 风力发电机组故障诊断方法、装置和电子设备
CN104270389A (zh) 一种路由器/交换机安全配置漏洞自动修复方法及系统
CN111199346A (zh) 综合管廊监理方法、装置、计算机设备以及存储介质
CN106779095B (zh) 基于kmp算法的智能变电站设备软压板校核的方法
CN102545204B (zh) 电网故障集的自动生成方法及装置
CN104917460A (zh) 一种光伏电池组件的监测方法及装置
CN105373446A (zh) 一种基于自动演练的系统自动修复方法和装置
CN103942726A (zh) 电网设备状态评价工作智能核查方法
WO2015077196A1 (en) Holistic optimization of distribution automation using survivability modeling to support storm hardening
CN113609119A (zh) 一种数据对账修复方法、装置、存储介质及电子设备
CN105552899A (zh) 一种计算大停电后电网恢复力的方法
CN111765075A (zh) 一种锻造液压机泵源故障预测方法及系统
CN105354102A (zh) 一种文件系统维护和修复的方法和装置
CN105389335A (zh) 一种基于自动演练的数据挖掘分析方法和装置
CN112529217A (zh) 电力设备信息查询方法、系统、装置、设备及存储介质
CN110021933B (zh) 考虑组件故障的电力信息系统控制功能可靠性评估方法
CN109298698B (zh) 一种公共建筑能耗全自动化监测系统
CN109150596B (zh) 一种scada系统实时数据转储方法和装置
CN105335824A (zh) 基于数据中心的配电网故障抢修指挥方法与系统
CN109685682A (zh) 基于关系数据库智能生成调控系统检修操作票的方法
CN104007345A (zh) 一种电站智能设备的入网测试方法及其测试装置
CN112286884A (zh) 一种配电网环网柜拓扑自动生成方法、系统及介质
CN106094790A (zh) 风电设备可靠性管理信息系统
CN104933523A (zh) 一种配电终端测试监控方法
CN109768542B (zh) 一种大规模电网电磁暂态自动建模的继承方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant