CN109460322A - 基于流程调度引擎技术的灾备切换演练系统及方法 - Google Patents
基于流程调度引擎技术的灾备切换演练系统及方法 Download PDFInfo
- Publication number
- CN109460322A CN109460322A CN201811354446.9A CN201811354446A CN109460322A CN 109460322 A CN109460322 A CN 109460322A CN 201811354446 A CN201811354446 A CN 201811354446A CN 109460322 A CN109460322 A CN 109460322A
- Authority
- CN
- China
- Prior art keywords
- calamity
- task
- module
- standby
- prediction scheme
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 91
- 238000005553 drilling Methods 0.000 title claims abstract description 34
- 238000004519 manufacturing process Methods 0.000 claims abstract description 21
- 238000012790 confirmation Methods 0.000 claims description 12
- 230000008520 organization Effects 0.000 claims description 7
- 238000007792 addition Methods 0.000 claims description 6
- 238000012217 deletion Methods 0.000 claims description 6
- 230000037430 deletion Effects 0.000 claims description 6
- 230000000007 visual effect Effects 0.000 claims description 6
- 238000004458 analytical method Methods 0.000 claims description 4
- 238000011017 operating method Methods 0.000 claims description 4
- 238000005457 optimization Methods 0.000 claims description 3
- 238000007619 statistical method Methods 0.000 claims description 3
- 238000005192 partition Methods 0.000 claims description 2
- 230000003252 repetitive effect Effects 0.000 claims description 2
- 238000009414 blockwork Methods 0.000 claims 1
- 238000001514 detection method Methods 0.000 claims 1
- 238000007689 inspection Methods 0.000 claims 1
- 238000007711 solidification Methods 0.000 abstract description 2
- 230000008023 solidification Effects 0.000 abstract description 2
- 230000026676 system process Effects 0.000 abstract description 2
- 150000003839 salts Chemical class 0.000 description 6
- 235000013399 edible fruits Nutrition 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 206010033799 Paralysis Diseases 0.000 description 1
- 230000008033 biological extinction Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005538 encapsulation Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1402—Saving, restoring, recovering or retrying
- G06F11/1415—Saving, restoring, recovering or retrying at system level
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06311—Scheduling, planning or task assignment for a person or group
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Quality & Reliability (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- Educational Administration (AREA)
- Operations Research (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Game Theory and Decision Science (AREA)
- Development Economics (AREA)
- General Engineering & Computer Science (AREA)
- Exchange Systems With Centralized Control (AREA)
- Stored Programmes (AREA)
Abstract
本发明的基于流程调度引擎技术的灾备切换演练系统,包括组织架构管理模块用于定义灾备切换的人员组织架构、资源节点管理模块用于定义灾备操作涉及的对象、预案管理模块用于定义预案的图形化、切换实例管理模块用于对预案执行过程进行管理控制、流程引擎基础服务模块、自动化任务执行基础服务模块、消息提醒基础服务模块以及系统配置模块;流程引擎基础服务模块自动调用自动化任务执行基础服务模块,根据设置自动调用消息提醒基础服务模块,发送提醒短信。本发明还公开了灾备切换演练方法,解决了现有系统流程编排操作复杂和演练的成果难固化的问题,采用数据一致性比对模块,对生产和灾备端的数据进行比对验证,确保灾备数据的可用性。
Description
技术领域
本发明属于信息系统灾备管理技术领域,涉及一种基于流程调度引擎技术的灾备切换演练系统,还涉及灾备切换演练的方法。
背景技术
随着金融行业IT系统规模的不断扩大,银行的日常业务运行高度依赖信息系统,信息系统故障可能会严重影响银行的正常运转,造成巨大的经济损失和不良的社会影响,在银行面临的众多风险中,“IT风险是唯一可以在一瞬间让整个银行陷入瘫痪的风险”。在这种业务与信息系统紧密联系的模式下,一旦出现突发灾备,由此造成关键业务数据丢失或信息系统不能尽快管理运行,将严重影响银行业务的正常运营,严重影响银行的声誉,甚至为银行带来灭顶之灾。
金融行业监管部门一直以来对银行信息科技风险高度重视,针对监管部门的要求和灾备建设的现状,银行业积极开展了各种形式的灾备切换演练,通过演练检验灾备系统的有效性,提高不同岗位人员应对灾备等突发情况的管理能力、技术能力、应急处置能力。目前的灾备切换基本靠人工指挥,人工操作,灾备切换过程中涉及到的部门广、人员多、技术操作复杂度高导致灾备切换演练效果不佳,演练的成果很难固化。部分银行或组织尝试采用了一些灾备切换的管理工具,这些工具有些强调灾备切换指挥管理,有些强调切换流程的编排,有些强调操作命令的调度执行。现有平台多采用基于开源activity流程引擎来作为流程调度的工具,该工具所能够实现的流程编排功能比较全面,流程编排操作相对复杂,对于灾备管理平台的流程编排的使用场景过于繁复,易用性不佳;还有采用SSH登陆操作对象的方式,在该方式下,任务下发为同步模式,平台必须等待操作对象执行完成后,方能返回结果,执行下一步操作,因此不适合受管理对象较多的情况。因此,尚未有一种有效的平台将灾备体系的管理、流程、技术有机整合,同时流程编排的易用性、技术操作脚本调度的可靠性仍存在问题。
发明内容
本发明的目的是提供一种基于流程调度引擎技术的灾备切换演练系统,解决了现有系统流程编排操作复杂和演练效果不佳的问题。
本发明的另一目的是提供一种灾备切换演练的方法。
本发明所采用的技术方案是,基于流程调度引擎技术的灾备切换演练系统,包括人员组织管理模块、资源管理模块、预案管理模块、切换实例管理模块、流程引擎基础服务模块、自动化任务执行基础服务模块、消息提醒基础服务模块以及系统配置模块,系统配置模块部署在生产端和灾备端,内部设置有比对模块,用于检测生产端和灾备端主机资源的一致性;
组织管理模块用于定义灾备切换的人员组织信息;资源管理模块用于定义灾备操作涉及的对象;预案管理模块用于定义预案的具体内容;切换实例管理模块用于对预案执行过程进行管理控制;流程引擎基础服务模块负责实例执行的流程驱动,流程引擎基础服务模块调用自动化任务执行基础服务模块,自动化任务执行基础服务模块用于远程登录受管对象、执行操作脚本,根据设置调用消息提醒基础服务,向相关责任人发送提醒短信。
组织管理模块用于对人员、组织的增删改查,自动生成组织架构图,并且按照角色划分定义不同的工作权限;资源管理模块用于增删、改查远程资源节点基本信息,实现管理数据中心、业务系统、主机资源、软硬件资源和脚本管理的功能;切换实例管理模块包括三种切换模式,分别是切换演练、普通切换和一键切换,在执行过程中调用流程引擎基础服务模块。
远程资源节点基本信息包括IP地址、操作系统类型、支持的任务执行方式、所部属的中间件、数据库;预案管理模块用于预案分时计划可视化创建、预案任务编辑、预案的流程节点创建、编辑,对流程节点位置进行拖拽,具有自适应布局功能,流程节点按照业务逻辑进行分组。
本发明的另一技术方案是,一种基于流程调度引擎的灾备切换演练方法,采用基于流程调度引擎技术的灾备切换演练系统,具体的操作方法包括如下步骤:
步骤1.初始化灾备切换演练系统:通过组织管理模块和资源管理模块录入基础信息,系统配置模块检测生产端和灾备端的受管理对象的一致性;
步骤2.如果生产端和灾备端的系统的一致性没有问题,则预案管理模块进行预案编排,执行步骤3;如果灾备切换演练系统的一致性存在问题,则消息提醒基础服务模块及时向相关人员发送提醒短信,提醒用户检查灾备切换演练系统的配置信息,针对配置有误的信息重复操作步骤1;
步骤3.通过预案管理模块创建预案任务,包括对每个预案任务的流程编排、每个流程中的任务要素的设置以及对预案的一致性检查;
步骤4.切换实例管理模块执行实例,根据实际的灾备任务场景不同,选择四种不同切换模式中的任一种,以实现灾备切换;每一个切换模式将灾备任务的执行结果可以通过设置在生产端和灾备端的监控者可视范围的大屏幕显示,并且灾备任务的执行结果以统计分析表格和切换报告形式上传到数据库中,提供用户实时下载统计分析表格和切换报告;
步骤5.用户通过统计分析表格和切换报告分析灾备切换演练过程中存在的问题,根据存在的问题通过预案管理模块对预案任务进行修改优化,最终实现灾备切换演练。
本发明的其他特点还在于,
步骤1中组织人员管理模块中录入的信息包括人员组织信息和角色权限信息;资源管理模块中录入的信息包括软硬件资源、灾备文档、主机资源信息和脚本信息,其中,脚本信息与主机资源信息绑定。
步骤1中系统配置模块通过内部比对模块,检测生产端和灾备端的主机资源的配置信息是否一致。
步骤3中预案管理模块创建灾备预案任务的具体过程包括如下:
(1)平台管理员新建灾备预案任务,为灾备预案任务添加资源节点和指派灾备预案任务管理员,灾备预案任务管理员从初始化环境中的人员信息中选择;
(2)新建灾备预案任务后,通过图形化的预案编辑器直接通过拖拽的方式编排灾备预案任务流程,针对每个流程的任务节点配置任务要素,包括任务名称、任务编号、任务执行脚本、任务起止时间、任务描述、任务操作对象、任务操作责任人等;
(3)基于配置好的完整预案流程,针对生产端和灾备端的两个任务分别设置一致性检查点,在灾备任务切换执行过程中,检查脚本自动执行,实时了解任务节点实际执行结果是否满足预期目标。
步骤4中切换实例管理模块通过流程引擎基础服务模块调用自动化任务执行基础服务模块进行工作,远程登录,根据实际的灾备任务场景不同,选择不同切换模式的过程包括三种模式:
一是切换演练模式:流程引擎基础服务模块调用自动化任务执行基础服务模块进行工作,远程登录进行真实操作,每个任务的操作需要负责人在界面进行按钮点击确认后自动调用执行;该模式主要用于桌面推演、普通演练等演练场景,便于用户熟悉灾备预案任务的执行流程和责任分工,切换过程不会调度执行脚本;
二是普通切换模式:执行过程通过自动化任务执行基础服务模块下发脚本至灾备端资源主机并自动执行,每个任务的启动工作和对脚本返回结果的确认工作均需要任务操作责任人在页面点击后完成;主要用于普通的正式切换场景;
三是一键式切换模式:流程引擎基础服务模块调用自动化任务执行基础服务模块进行工作,远程登录进行真实操作,每个任务的操作自动调用脚本执行操作;执行过程中平台会根据返回结果成功与否判断是否继续,如果存在脚本执行失败的情况,平台自动暂停实例,人工干预确认后继续执行。
普通切换模式和一键式切换操作模式下,自动化任务执行基础服务模块采用基于saltstack的远程脚本调用方式实现,管理平台master与受管对象minon建立连接后,远程执行指令下发数据流。
本发明的有益效果是,基于流程调度引擎技术的灾备切换演练系统及方法,解决了现有系统流程编排操作复杂、演练效果不佳和演练的成果较难固化的问题。本发明采用通过采用消息队列的任务下发模式,支持更多的受管对象,同时提高了操作执行的效率。现有类似平台不具备内置的数据比对功能,在大多数灾备切换场景下,需要保持生产中心与灾备中心数据的一致性,本发明采用专门的数据一致性比对模块,对生产端和灾备端的数据进行比对验证,确保灾备数据的可用性。
附图说明
图1是本发明的基于流程调度引擎技术的灾备切换演练系统的结构示意图;
图2是本发明的基于流程调度引擎技术的灾备切换演练系统中设备资源信息管理的逻辑图;
图3是基于流程调度引擎技术的灾备切换演练方法的流程图。
具体实施方式
下面结合附图和具体实施方式对本发明进行详细说明。
本发明的基于流程调度引擎技术的灾备切换演练系统,如图1所示,包括人员组织管理模块、资源管理模块、预案管理模块、切换实例管理模块、流程引擎基础服务模块、自动化任务执行基础服务模块、消息提醒基础服务模块以及系统配置模块,系统配置模块部署在生产端和灾备端,内部设置有比对模块,用于检测生产端和灾备端主机资源的一致性;
组织管理模块用于定义灾备切换的人员组织信息,对人员、组织的增删改查,自动生成组织架构图,并且按照角色划分定义不同的工作权限;资源管理模块用于定义灾备操作涉及的对象,用于增删、改查远程资源节点基本信息,可以实现管理数据中心、业务系统、主机资源、软硬件资源和脚本管理的功能,进行文档管理和系统管理;预案管理模块用于定义预案的具体内容,包括流程编排、阶段设置、任务设置和一致性检查,用于预案分时计划可视化创建、预案任务编辑、预案的流程节点创建、编辑,对流程节点位置进行拖拽,具有自适应布局功能,流程节点按照业务逻辑进行分组;切换实例管理模块用于对预案执行过程进行管理控制,包括三种切换模式,分别是切换演练、普通切换和一键切换;切换实例管理模块在执行过程中调用流程引擎基础服务模块,流程引擎基础服务模块负责实例执行的流程驱动,流程引擎基础服务模块调用所述自动化任务执行基础服务模块,自动化任务执行基础服务模块用于远程登录受管对象、执行操作脚本,根据设置调用所述消息提醒基础服务,向相关责任人发送提醒短信或微信。
远程资源节点基本信息包括IP地址、操作系统类型、支持的任务执行方式、所部属的中间件、数据库。
本发明的一种基于流程调度引擎的灾备切换演练方法,具体的操作方法包括如下步骤:
步骤1.初始化灾备切换演练系统:通过组织管理模块和资源管理模块录入基础信息,系统配置模块检测生产端和灾备端的受管理对象系统的一致性;
步骤1中组织人员管理模块中录入的信息包括人员组织信息和角色权限信息;所述资源管理模块中录入的信息包括软硬件资源、灾备文档、主机资源信息和脚本信息,其中,脚本信息与主机资源信息绑定。
步骤1中系统配置模块通过内部比对模块,检测生产端和灾备端的主机资源的配置信息是否一致。
步骤2.如果系统的一致性没有问题,则预案管理模块进行预案编排,执行步骤3;如果灾备切换演练系统的一致性存在问题,则消息提醒基础服务模块及时向相关人员发送提醒短信或微信,提醒用户检查灾备切换演练系统的配置信息,针对配置有误的信息重复操作步骤1;
步骤3.通过预案管理模块创建预案任务,包括对每个预案任务的流程编排、每个流程中的任务要素的设置以及对预案的一致性检查;
步骤3中预案管理模块创建灾备预案任务的具体过程包括如下:
(1)平台管理员新建灾备预案任务,为灾备预案任务添加资源节点和指派灾备预案任务管理员,灾备预案任务管理员从初始化环境中的人员信息中选择;
(2)新建灾备预案任务后,通过图形化的预案编辑器直接通过拖拽的方式编排灾备预案任务流程,针对每个流程的任务节点配置任务要素,包括任务名称、任务编号、任务执行脚本、任务起止时间、任务描述、任务操作对象、任务操作责任人等;
(3)基于配置好的完整预案流程,针对生产端和灾备端的两个任务分别设置一致性检查点,在灾备任务切换执行过程中,检查脚本自动执行,实时了解任务节点实际执行结果是否满足预期目标。
步骤4.切换实例管理模块执行实例,根据实际的灾备任务场景不同,选择四种不同切换模式中的任一种,以实现灾备切换;每一个切换模式将灾备任务的执行结果可以通过设置在生产端和灾备端的监控者可视范围(领导驾驶舱或任务甘特大屏)的大屏幕显示,并且灾备任务的执行结果以统计分析表格和切换报告形式上传到数据库中,提供用户实时下载统计分析表格和切换报告;
步骤4中切换实例管理模块通过所述流程引擎基础服务模块调用自动化任务执行基础服务模块进行工作,远程登录,根据实际的灾备任务场景不同,选择不同切换模式的过程包括三种模式:
一是切换演练模式:流程引擎基础服务模块调用自动化任务执行基础服务模块进行工作,远程登录进行真实操作,每个任务的操作需要负责人在界面进行按钮点击确认后自动调用执行;该模式主要用于桌面推演、普通演练等演练场景,便于用户熟悉灾备预案任务的执行流程和责任分工,切换过程不会调度执行脚本;
二是普通切换模式:执行过程通过自动化任务执行基础服务模块下发脚本至灾备端资源主机并自动执行,每个任务的启动工作和对脚本返回结果的确认工作均需要任务操作责任人在页面点击后完成;主要用于普通的正式切换场景;
三是一键式切换模式:流程引擎基础服务模块调用自动化任务执行基础服务模块进行工作,远程登录进行真实操作,每个任务的操作自动调用脚本执行操作;执行过程中平台会根据返回结果成功与否判断是否继续,如果存在脚本执行失败的情况,平台自动暂停实例,人工干预确认后继续执行。
步骤5.用户通过统计分析表格和切换报告分析灾备切换演练过程中存在的问题,根据存在的问题通过所述预案管理模块对预案任务进行修改优化,最终实现灾备切换演练。
在普通切换模式和一键式切换操作模式下,自动化任务执行基础服务模块采用基于saltstack的远程脚本调用方式实现,管理平台master与受管对象minon建立连接后,远程执行指令下发数据流。过程如下:
(1)用户执行某一命令后,首先调用salt.cli.Saltcmd模块发布命令到master,salt.cli.Saltcmd模块run_job将操作指令封装成命令详细信息后,将发送到本地master的Ret接口,Master Ret接口接收到发送的数据后,会通过chminions.check_minions获取本次需要哪些minions执行,并产生jid,然后在master event接口上进行fire_event操作,之后对数据使用master私钥(master.pem)进行签名salt.cli.Saltcmd模块进行如下操作发布命令master:
a)确认执行的命令是有效的命令;
b)确认发送命令的详细信息,(包括类型、任务ID、时间点、执行账户、命令模块、minion);
c)该命令的jobid任务准备使用指定的账户发布到master;
d)再次确认发布命令的详细信息;
e)确认认证要求minion ID为执行命令是写的ID;
f)核实minion ID认证已经认可;
g)准备调用master pub公钥与minion端公钥进行核对;
h)salt.cli.Saltcmd模块run_job将操作指令封装成命令详细信息后,将发送到本地master的Ret接口;
(2)Master Pull接口接收到数据命令后,会迅速的在Master Pub(消息发布系统)接口上发布命令到minion,同时监听Master端的Event bus(通信库),过滤出本次任务jid所对应的event,用来获取执行结果。master做如下操作发送执行命令到minion:
a)汇总发送命令的详细信息,(包括类型、任务ID、时间点、执行账户);
b)阅读配置文件,再次确认minion id在/etc/salt/minion是否存在;
c)通过ZeroMQ协议,将发送命令的详细信息发往minion;
(3)此时Minion通过PUB/SUB(ZeroMQ采用的是PUB/SUB模型,Pub/Sub模型定义了如何向一个内容节点发布和订阅消息),即可接收到来自于Master Pub接口的消息.Minion接收到消息后,会首先通过本地的master pub_key(minion_master.pub)进行解密,已确保消息来自于Master。解密完成后,本地进行target匹配,如果匹配上,表示需要执行,表示需要执行,发起一个本地线程调用test.py模块执行命令。反之则直接忽略;
(4)Minion执行完毕后,会通过minion_return_pub方法将封装后的结果通过AES(密钥对)加密发送到Master的Ret(4506)接口;
(5)Master Ret接收到minion发送的数据后,会进行AES(密钥对)解密,然后将解密后的结果存储在master本地;
(6)salt.cli.Saltcmd模块通过轮询获取Job执行结果,将结果输出到终端。
Claims (9)
1.基于流程调度引擎技术的灾备切换演练系统,其特征在于,包括人员组织管理模块、资源管理模块、预案管理模块、切换实例管理模块、流程引擎基础服务模块、自动化任务执行基础服务模块、消息提醒基础服务模块以及系统配置模块,所述系统配置模块部署在生产端和灾备端,内部设置有比对模块,用于检测生产端和灾备端主机资源的一致性;
所述组织管理模块用于定义灾备切换的人员组织信息;所述资源管理模块用于定义灾备操作涉及的对象;所述预案管理模块用于定义预案的具体内容;所述切换实例管理模块用于对预案执行过程进行管理控制;所述流程引擎基础服务模块负责实例执行的流程驱动,所述流程引擎基础服务模块调用所述自动化任务执行基础服务模块,所述自动化任务执行基础服务模块用于远程登录受管对象、执行操作脚本,根据设置调用所述消息提醒基础服务,向相关责任人发送提醒短信。
2.如权利要求1所述的基于流程调度引擎技术的灾备切换演练系统,其特征在于,所述组织管理模块用于对人员、组织的增删改查,自动生成组织架构图,并且按照角色划分定义不同的工作权限;所述资源管理模块用于增删、改查远程资源节点基本信息,实现管理数据中心、业务系统、主机资源、软硬件资源和脚本管理的功能;所述切换实例管理模块包括三种切换模式,分别是切换演练、普通切换和一键切换,在执行过程中调用所述流程引擎基础服务模块。
3.如权利要求2所述的基于流程调度引擎技术的灾备切换演练系统,其特征在于,所述远程资源节点基本信息包括IP地址、操作系统类型、支持的任务执行方式、所部属的中间件、数据库;所述预案管理模块用于预案分时计划可视化创建、预案任务编辑、预案的流程节点创建、编辑,对流程节点位置进行拖拽,具有自适应布局功能,流程节点按照业务逻辑进行分组。
4.一种基于流程调度引擎的灾备切换演练方法,其特征在于,采用如权利要求1所述的基于流程调度引擎技术的灾备切换演练系统,具体的操作方法包括如下步骤:
步骤1.初始化灾备切换演练系统:通过组织管理模块和资源管理模块录入基础信息,所述系统配置模块检测生产端和灾备端的受管理对象系统的一致性;
步骤2.如果生产端和灾备端的系统的一致性没有问题,则所述预案管理模块进行预案编排,执行步骤3;如果灾备切换演练系统的一致性存在问题,则消息提醒基础服务模块及时向相关人员发送提醒短信,提醒用户检查灾备切换演练系统的配置信息,针对配置有误的信息重复操作步骤1;
步骤3.通过所述预案管理模块创建预案任务,包括对每个预案任务的流程编排、每个流程中的任务要素的设置以及对预案的一致性检查;
步骤4.所述切换实例管理模块执行实例,根据实际的灾备任务场景不同,选择四种不同切换模式中的任一种,以实现灾备切换;每一个切换模式将灾备任务的执行结果可以通过设置在生产端和灾备端的监控者可视范围的大屏幕显示,并且灾备任务的执行结果以统计分析表格和切换报告形式上传到数据库中,提供用户实时下载统计分析表格和切换报告;
步骤5.用户通过统计分析表格和切换报告分析灾备切换演练过程中存在的问题,根据存在的问题对通过所述预案管理模块对预案任务进行修改优化,最终实现灾备切换演练。
5.如权利要求4所述的基于流程调度引擎的灾备切换演练方法,其特征在于,所述步骤1中组织人员管理模块中录入的信息包括人员组织信息和角色权限信息;所述资源管理模块中录入的信息包括软硬件资源、灾备文档、主机资源信息和脚本信息,其中,脚本信息与主机资源信息绑定。
6.如权利要求4所述的基于流程调度引擎的灾备切换演练方法,其特征在于,所述步骤1中系统配置模块通过内部比对模块,检测生产端和灾备端的主机资源的配置信息是否一致。
7.如权利要求5所述的基于流程调度引擎的灾备切换演练方法,其特征特在于,所述步骤3中预案管理模块创建灾备预案任务的具体过程包括如下:
(1)平台管理员新建灾备预案任务,为灾备预案任务添加资源节点和指派灾备预案任务管理员,灾备预案任务管理员从初始化环境中的人员信息中选择;
(2)新建灾备预案任务后,通过图形化的预案编辑器直接通过拖拽的方式编排灾备预案任务流程,针对每个流程的任务节点配置任务要素,包括任务名称、任务编号、任务执行脚本、任务起止时间、任务描述、任务操作对象、任务操作责任人等;
(3)基于配置好的完整预案流程,针对生产端和灾备端的两个任务分别设置一致性检查点,在灾备任务切换执行过程中,检查脚本自动执行,实时了解任务节点实际执行结果是否满足预期目标。
8.如权利要求5所述的基于流程调度引擎的灾备切换演练方法,其特征特在于,所述步骤4中切换实例管理模块通过所述流程引擎基础服务模块调用自动化任务执行基础服务模块进行工作,远程登录,根据实际的灾备任务场景不同,选择不同切换模式的过程包括三种模式:
一是切换演练模式:流程引擎基础服务模块调用自动化任务执行基础服务模块进行工作,远程登录进行真实操作,每个任务的操作需要负责人在界面进行按钮点击确认后自动调用执行;该模式主要用于桌面推演、普通演练等演练场景,便于用户熟悉灾备预案任务的执行流程和责任分工,切换过程不会调度执行脚本;
二是普通切换模式:执行过程通过自动化任务执行基础服务模块下发脚本至灾备端资源主机并自动执行,每个任务的启动工作和对脚本返回结果的确认工作均需要任务操作责任人在页面点击后完成;主要用于普通的正式切换场景;
三是一键式切换模式:流程引擎基础服务模块调用自动化任务执行基础服务模块进行工作,远程登录进行真实操作,每个任务的操作自动调用脚本执行操作;执行过程中平台会根据返回结果成功与否判断是否继续,如果存在脚本执行失败的情况,平台自动暂停实例,人工干预确认后继续执行。
9.如权利要求8所述的基于流程调度引擎的灾备切换演练方法,其特征在于,所述普通切换模式和一键式切换操作模式下,自动化任务执行基础服务模块采用基于saltstack的远程脚本调用方式实现,管理平台master与受管对象minon建立连接后,远程执行指令下发数据流。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811354446.9A CN109460322B (zh) | 2018-11-14 | 2018-11-14 | 基于流程调度引擎技术的灾备切换演练系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811354446.9A CN109460322B (zh) | 2018-11-14 | 2018-11-14 | 基于流程调度引擎技术的灾备切换演练系统及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109460322A true CN109460322A (zh) | 2019-03-12 |
CN109460322B CN109460322B (zh) | 2021-11-05 |
Family
ID=65610528
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811354446.9A Active CN109460322B (zh) | 2018-11-14 | 2018-11-14 | 基于流程调度引擎技术的灾备切换演练系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109460322B (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109933006A (zh) * | 2019-04-08 | 2019-06-25 | 沈机(上海)智能系统研发设计有限公司 | 数控系统及其控制方法、控制装置及存储介质、终端 |
CN110471803A (zh) * | 2019-07-05 | 2019-11-19 | 华为技术有限公司 | 一种物理硬件操作方法、电子设备、存储介质及芯片 |
CN111144691A (zh) * | 2019-11-27 | 2020-05-12 | 广东电力信息科技有限公司 | 一种灾备调控管理方法及其系统 |
CN112835728A (zh) * | 2021-02-09 | 2021-05-25 | 南方电网数字电网研究院有限公司 | 消息处理方法、装置、计算机设备和存储介质 |
CN113760611A (zh) * | 2021-08-30 | 2021-12-07 | 银清科技有限公司 | 系统站点切换方法、装置、电子设备及存储介质 |
CN114090333A (zh) * | 2021-10-20 | 2022-02-25 | 中核核电运行管理有限公司 | 一种生产管理平台容灾切换管理系统及方法 |
CN114116310A (zh) * | 2021-11-22 | 2022-03-01 | 北京优锘科技有限公司 | 基于json的灾备切换的展示方法、装置、设备和存储介质 |
CN114513439A (zh) * | 2022-02-15 | 2022-05-17 | 海南格子山网络科技有限公司 | 自动化批处理运维方法 |
CN116185723A (zh) * | 2023-04-28 | 2023-05-30 | 杭州美创科技股份有限公司 | 数据库容灾切换演练方法、装置、计算机设备及存储介质 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101799999A (zh) * | 2010-04-06 | 2010-08-11 | 中国石油化工股份有限公司 | 一种事故应急演练系统及方法 |
CN103324715A (zh) * | 2013-06-20 | 2013-09-25 | 交通银行股份有限公司 | 一种灾备系统可用性检测方法及装置 |
CN106095614A (zh) * | 2016-05-27 | 2016-11-09 | 上海新炬网络信息技术有限公司 | 一种数据库容灾演练管控系统 |
CN106209422A (zh) * | 2016-06-28 | 2016-12-07 | 中国银联股份有限公司 | 降低灾备中心系统切换不可用时间的方法及设备 |
CN106713409A (zh) * | 2016-10-21 | 2017-05-24 | 中国电信集团系统集成有限责任公司 | 一种基于SaaS的云灾备系统及方法 |
CN106776140A (zh) * | 2016-12-21 | 2017-05-31 | 博飞信息科技(上海)有限公司 | 超容灾备恢复一体机的装置及方法 |
CN106776127A (zh) * | 2016-12-01 | 2017-05-31 | 中国电信集团系统集成有限责任公司 | 一种基于activity的灾备管理系统和管理方法 |
US20180052743A1 (en) * | 2016-08-17 | 2018-02-22 | Bank Of America Corporation | Disaster recovery tool |
CN108153621A (zh) * | 2018-01-15 | 2018-06-12 | 农信银资金清算中心有限责任公司 | 一种云灾备应急切换管理系统 |
CN108492006A (zh) * | 2018-02-28 | 2018-09-04 | 广东电网有限责任公司信息中心 | 一种层次控制模式的运维作业调度引擎 |
-
2018
- 2018-11-14 CN CN201811354446.9A patent/CN109460322B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101799999A (zh) * | 2010-04-06 | 2010-08-11 | 中国石油化工股份有限公司 | 一种事故应急演练系统及方法 |
CN103324715A (zh) * | 2013-06-20 | 2013-09-25 | 交通银行股份有限公司 | 一种灾备系统可用性检测方法及装置 |
CN106095614A (zh) * | 2016-05-27 | 2016-11-09 | 上海新炬网络信息技术有限公司 | 一种数据库容灾演练管控系统 |
CN106209422A (zh) * | 2016-06-28 | 2016-12-07 | 中国银联股份有限公司 | 降低灾备中心系统切换不可用时间的方法及设备 |
US20180052743A1 (en) * | 2016-08-17 | 2018-02-22 | Bank Of America Corporation | Disaster recovery tool |
CN106713409A (zh) * | 2016-10-21 | 2017-05-24 | 中国电信集团系统集成有限责任公司 | 一种基于SaaS的云灾备系统及方法 |
CN106776127A (zh) * | 2016-12-01 | 2017-05-31 | 中国电信集团系统集成有限责任公司 | 一种基于activity的灾备管理系统和管理方法 |
CN106776140A (zh) * | 2016-12-21 | 2017-05-31 | 博飞信息科技(上海)有限公司 | 超容灾备恢复一体机的装置及方法 |
CN108153621A (zh) * | 2018-01-15 | 2018-06-12 | 农信银资金清算中心有限责任公司 | 一种云灾备应急切换管理系统 |
CN108492006A (zh) * | 2018-02-28 | 2018-09-04 | 广东电网有限责任公司信息中心 | 一种层次控制模式的运维作业调度引擎 |
Non-Patent Citations (2)
Title |
---|
KUMAR, J.S;ZAVERI, M.A;CHOKSI, M: "Task Based Resource Scheduling in IoT Environment for Disaster Management", 《PROCEDIA COMPUTER SCIENCE》 * |
郭晓艳,王扬,孙轶凡,侯丹,章斌: "营销系统应用级灾备体系研究及建立", 《电力信息与通信技术》 * |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109933006A (zh) * | 2019-04-08 | 2019-06-25 | 沈机(上海)智能系统研发设计有限公司 | 数控系统及其控制方法、控制装置及存储介质、终端 |
CN110471803A (zh) * | 2019-07-05 | 2019-11-19 | 华为技术有限公司 | 一种物理硬件操作方法、电子设备、存储介质及芯片 |
CN111144691A (zh) * | 2019-11-27 | 2020-05-12 | 广东电力信息科技有限公司 | 一种灾备调控管理方法及其系统 |
CN112835728B (zh) * | 2021-02-09 | 2024-04-12 | 南方电网数字平台科技(广东)有限公司 | 消息处理方法、装置、计算机设备和存储介质 |
CN112835728A (zh) * | 2021-02-09 | 2021-05-25 | 南方电网数字电网研究院有限公司 | 消息处理方法、装置、计算机设备和存储介质 |
CN113760611A (zh) * | 2021-08-30 | 2021-12-07 | 银清科技有限公司 | 系统站点切换方法、装置、电子设备及存储介质 |
CN113760611B (zh) * | 2021-08-30 | 2024-05-03 | 银清科技有限公司 | 系统站点切换方法、装置、电子设备及存储介质 |
CN114090333A (zh) * | 2021-10-20 | 2022-02-25 | 中核核电运行管理有限公司 | 一种生产管理平台容灾切换管理系统及方法 |
CN114116310A (zh) * | 2021-11-22 | 2022-03-01 | 北京优锘科技有限公司 | 基于json的灾备切换的展示方法、装置、设备和存储介质 |
CN114116310B (zh) * | 2021-11-22 | 2022-11-11 | 北京优锘科技有限公司 | 基于json的灾备切换的展示方法、装置、设备和存储介质 |
CN114513439B (zh) * | 2022-02-15 | 2024-04-02 | 海南格子山网络科技有限公司 | 自动化批处理运维方法 |
CN114513439A (zh) * | 2022-02-15 | 2022-05-17 | 海南格子山网络科技有限公司 | 自动化批处理运维方法 |
CN116185723A (zh) * | 2023-04-28 | 2023-05-30 | 杭州美创科技股份有限公司 | 数据库容灾切换演练方法、装置、计算机设备及存储介质 |
CN116185723B (zh) * | 2023-04-28 | 2023-08-08 | 杭州美创科技股份有限公司 | 数据库容灾切换演练方法、装置、计算机设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN109460322B (zh) | 2021-11-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109460322A (zh) | 基于流程调度引擎技术的灾备切换演练系统及方法 | |
CN107291565B (zh) | 运维可视化自动化作业平台及实现方法 | |
US8265980B2 (en) | Workflow model for coordinating the recovery of IT outages based on integrated recovery plans | |
CN110740053B (zh) | 业务编排方法及装置 | |
CN106330575A (zh) | 一种安全服务平台及安全服务部署方法 | |
CN103002490B (zh) | 一种业务仿真测试系统及其实现方法 | |
CN103530231A (zh) | 一种基于业务流程控制的应用程序测试方法及系统 | |
CN106506256B (zh) | 一种基于平台+插件的设备监控系统及方法 | |
CN111130922A (zh) | 一种机载信息安全自动化测试方法及测试平台 | |
CN112052607A (zh) | 一种针对电网设备和系统的智能化渗透测试方法与装置 | |
CN113641483A (zh) | 一种基于人工智能的机器人流程自动化系统 | |
Garcia-Reinoso et al. | The 5G EVE multi-site experimental architecture and experimentation workflow | |
CN104219404B (zh) | 通信网络应急预案演练方法、系统与服务器 | |
CN113747150B (zh) | 一种基于容器云实现的视频服务系统的测试方法和系统 | |
CN111464350B (zh) | 一种管理异构品牌网络设备的方法及系统 | |
CN107944743A (zh) | 一种大型机系统的运行维护方法、装置及系统 | |
CN108153621B (zh) | 一种云灾备应急切换管理系统 | |
CN105335145B (zh) | 操作结果处理方法、装置及系统 | |
CN115016960B (zh) | 可配置的rpa机器人全流程信息通知处理方法及系统 | |
CN116128212A (zh) | 基于bpmn的城轨车站运营场景编排方法及系统 | |
CN106372859A (zh) | 定时任务控制分析方法及系统、主控服务器 | |
CN113220480A (zh) | 分布式的数据任务跨云调度系统及方法 | |
CN104537090A (zh) | 用户信息标准化数据处理方法和装置 | |
dos Santos et al. | Toward a framework for simulating agent-based models of public policy processes on the jason-cartago platform | |
CN114416126B (zh) | 一种智能推荐训练服务基于Dolphinscheduler的部署方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
PE01 | Entry into force of the registration of the contract for pledge of patent right |
Denomination of invention: A Disaster Recovery Switching Exercise System and Method Based on Process Scheduling Engine Technology Effective date of registration: 20231219 Granted publication date: 20211105 Pledgee: Shaanxi SME financing Company limited by guarantee Pledgor: XI'AN RUILANCHUANG SOFTWARE TECHNOLOGY Co.,Ltd. Registration number: Y2023980072821 |
|
PE01 | Entry into force of the registration of the contract for pledge of patent right |