CN112711510A - 一种业务连续性运行监测自动适配方法及系统 - Google Patents

一种业务连续性运行监测自动适配方法及系统 Download PDF

Info

Publication number
CN112711510A
CN112711510A CN202011593862.1A CN202011593862A CN112711510A CN 112711510 A CN112711510 A CN 112711510A CN 202011593862 A CN202011593862 A CN 202011593862A CN 112711510 A CN112711510 A CN 112711510A
Authority
CN
China
Prior art keywords
disaster
service
subsystem
module
monitoring
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011593862.1A
Other languages
English (en)
Inventor
张涛
戴文艳
王伟宗
洪章阳
王孝文
潘德生
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Evecom Information Technology Development Co ltd
Original Assignee
Evecom Information Technology Development Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Evecom Information Technology Development Co ltd filed Critical Evecom Information Technology Development Co ltd
Priority to CN202011593862.1A priority Critical patent/CN112711510A/zh
Publication of CN112711510A publication Critical patent/CN112711510A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/302Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a software system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3051Monitoring arrangements for monitoring the configuration of the computing system or of the computing system component, e.g. monitoring the presence of processing resources, peripherals, I/O links, software programs

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

一种业务连续性运行监测自动适配方法及系统,涉及业务连续性技术领域,包括监测子系统、数据管理子系统、灾难模拟子系统、容灾备份子系统和自动适配子系统。本发明通过监测子系统对各个业务节点的监测;通过数据管理子系统生成镜像数据群组;通过灾难模拟子系统处理镜像数据群组;通过容灾备份子系统将模拟灾难发生的业务流切换到备份链路;通过自动适配子系统对灾难模拟的反应情况进行分析,做出业务连续性评估,实现整体上对业务的自动适配,增强了业务的连续性能,减小业务中断状况的发生概率,提高了处理业务中断状况的效率。

Description

一种业务连续性运行监测自动适配方法及系统
技术领域
本发明涉及业务连续性技术领域,尤其涉及一种业务连续性运行监测自动适配方法及系统。
背景技术
业务连续性是计算机容灾技术的升华概念,一种由计划和执行过程组成的策略,其目的是为了保证企业包括生产、销售、市场、财务、管理以及其他各种重要的功能完全在内的运营状况百分之百可用。可以这样说,业务连续性是覆盖整个企业的技术以及操作方式的集合,其目的是保证企业信息流在任何时候以及任何需要的状况下都能保持业务连续运行现。现有企业在应对业务中断状况时效率不高,导致业务连接性不足,不利于企业运行的安全性和稳定性。
发明内容
(一)发明目的
为解决背景技术中存在的技术问题,本发明提出一种业务连续性运行监测自动适配方法及系统。本发明通过监测子系统对各个业务节点的监测;通过数据管理子系统生成镜像数据群组;通过灾难模拟子系统处理镜像数据群组;通过容灾备份子系统将模拟灾难发生的业务流切换到备份链路;通过自动适配子系统对灾难模拟的反应情况进行分析,做出业务连续性评估,实现整体上对业务的自动适配,增强了业务的连续性能,减小业务中断状况的发生概率,提高了处理业务中断状况的效率。
(二)技术方案
为解决上述问题,本发明提供了一种业务连续性运行监测自动适配系统,包括监测子系统、数据管理子系统、灾难模拟子系统、容灾备份子系统和自动适配子系统;监测子系统包括监测模块和数据采集模块,用于各个业务节点的监测,并采集该节点的实时数据流信息;数据管理子系统包括数据汇总模块、数据处理模块和数据镜像模块,对监测模块采集的所有数据进行汇总、分类、加权处理,并生成对应的镜像数据群组;灾难模拟子系统包括灾难生成模块、灾难投放模块和灾难模拟模型,将镜像数据群组投放至灾难模拟模型,并根据业务权重随机生成的灾难场景,处理镜像数据群组;容灾备份子系统包括演练模块、计时模块和判断模块,在灾难模拟子系统触发灾难模拟模型时,所运行的二层拓扑协议将模拟灾难发生的业务流切换到备份链路,并记录反应时间,且判断该备份链路是否顺畅;自动适配子系统包括结果分析模块和调整模块,根据灾难模拟结果以及容灾备份子系统应对灾难模拟的反应情况进行分析,做出业务连续性评估,再对业务节点的各项工作参数进行调整。
优选的,监测模块的监测对象包括计算节点状态、网络状态、文件系统状态、队列状态和作业状态。
优选的,数据采集模块对各业务节点数据流的特征数据进行提取。
优选的,调整模块包括自动调整单元和手动调整单元;自动适配子系统根据业务连续性评估结果对业务节点的各项工作参数做出自动调整,并再次评估,评估结果未到达设定值时,需要管理者手动调整。
优选的,调整模块用于各节点对服务器的占用比例、频率进行调整。
本发明又提出一种业务连续性运行监测自动适配方法,包括上述系统,方法步骤如下:
S1、建立灾难模拟模型,并通过机器学习,不断提高模拟等级;
S2、在各个业务节点设置监测终端,对该节点上的数据行为进行监测,并采集该节点的实时数据流信息;
S3、将监测模块采集的所有数据进行汇总、分类、加权处理,并生成对应的镜像数据群组;
S4、将镜像数据群组投放至灾难模拟模型,并根据业务权重随机生成的灾难场景,处理镜像数据群组,查找业务漏洞;
S5、在灾难模拟子系统触发灾难模拟模型时,所运行的二层拓扑协议将模拟灾难发生的业务流切换到备份链路,并记录反应时间,且判断该备份链路是否顺畅;
S6、根据灾难模拟结果以及容灾备份子系统应对灾难模拟的反应情况进行分析,做出业务连续性评估,自动适配子系统根据业务连续性评估结果对业务节点的各项工作参数做出自动调整,并再次评估,评估结果未到达设定值时,需要管理者手动调整。
本发明的上述技术方案具有如下有益的技术效果:
本发明通过监测子系统对各个业务节点的监测,并采集该节点的实时数据流信息;通过数据管理子系统对监测模块采集的所有数据进行汇总、分类、加权处理,并生成对应的镜像数据群组;通过灾难模拟子系统将镜像数据群组投放至灾难模拟模型,并根据业务权重随机生成的灾难场景,处理镜像数据群组;通过容灾备份子系统在灾难模拟子系统触发灾难模拟模型时,将模拟灾难发生的业务流切换到备份链路,并记录反应时间,且判断该备份链路是否顺畅;通过自动适配子系统对灾难模拟的反应情况进行分析,做出业务连续性评估,再对业务节点的各项工作参数进行调整;实现整体上对业务的自动适配,增强了业务的连续性能,减小业务中断状况的发生概率,提高了处理业务中断状况的效率。
附图说明
图1为本发明提出的一种业务连续性运行监测自动适配系统的结构框图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明了,下面结合具体实施方式并参照附图,对本发明进一步详细说明。应该理解,这些描述只是示例性的,而并非要限制本发明的范围。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本发明的概念。
实施例1
如图1所示,本发明提出的一种业务连续性运行监测自动适配系统,包括监测子系统、数据管理子系统、灾难模拟子系统、容灾备份子系统和自动适配子系统;监测子系统包括监测模块和数据采集模块,用于各个业务节点的监测,并采集该节点的实时数据流信息;数据管理子系统包括数据汇总模块、数据处理模块和数据镜像模块,对监测模块采集的所有数据进行汇总、分类、加权处理,并生成对应的镜像数据群组;灾难模拟子系统包括灾难生成模块、灾难投放模块和灾难模拟模型,将镜像数据群组投放至灾难模拟模型,并根据业务权重随机生成的灾难场景,处理镜像数据群组;容灾备份子系统包括演练模块、计时模块和判断模块,在灾难模拟子系统触发灾难模拟模型时,所运行的二层拓扑协议将模拟灾难发生的业务流切换到备份链路,并记录反应时间,且判断该备份链路是否顺畅;自动适配子系统包括结果分析模块和调整模块,根据灾难模拟结果以及容灾备份子系统应对灾难模拟的反应情况进行分析,做出业务连续性评估,再对业务节点的各项工作参数进行调整。
在一个可选的实施例中,监测模块的监测对象包括计算节点状态、网络状态、文件系统状态、队列状态和作业状态。
在一个可选的实施例中,数据采集模块对各业务节点数据流的特征数据进行提取。
在一个可选的实施例中,调整模块包括自动调整单元和手动调整单元;自动适配子系统根据业务连续性评估结果对业务节点的各项工作参数做出自动调整,并再次评估,评估结果未到达设定值时,需要管理者手动调整。
在一个可选的实施例中,调整模块用于各节点对服务器的占用比例、频率进行调整。
实施例2
本发明又提出一种业务连续性运行监测自动适配方法,包括上述系统,方法步骤如下:
S1、建立灾难模拟模型,并通过机器学习,不断提高模拟等级;
S2、在各个业务节点设置监测终端,对该节点上的数据行为进行监测,并采集该节点的实时数据流信息;
S3、将监测模块采集的所有数据进行汇总、分类、加权处理,并生成对应的镜像数据群组;
S4、将镜像数据群组投放至灾难模拟模型,并根据业务权重随机生成的灾难场景,处理镜像数据群组,查找业务漏洞;
S5、在灾难模拟子系统触发灾难模拟模型时,所运行的二层拓扑协议将模拟灾难发生的业务流切换到备份链路,并记录反应时间,且判断该备份链路是否顺畅;
S6、根据灾难模拟结果以及容灾备份子系统应对灾难模拟的反应情况进行分析,做出业务连续性评估,自动适配子系统根据业务连续性评估结果对业务节点的各项工作参数做出自动调整,并再次评估,评估结果未到达设定值时,需要管理者手动调整。
本发明通过监测子系统对各个业务节点的监测,并采集该节点的实时数据流信息;通过数据管理子系统对监测模块采集的所有数据进行汇总、分类、加权处理,并生成对应的镜像数据群组;通过灾难模拟子系统将镜像数据群组投放至灾难模拟模型,并根据业务权重随机生成的灾难场景,处理镜像数据群组;通过容灾备份子系统在灾难模拟子系统触发灾难模拟模型时,将模拟灾难发生的业务流切换到备份链路,并记录反应时间,且判断该备份链路是否顺畅;通过自动适配子系统对灾难模拟的反应情况进行分析,做出业务连续性评估,再对业务节点的各项工作参数进行调整;实现整体上对业务的自动适配,增强了业务的连续性能,减小业务中断状况的发生概率,提高了处理业务中断状况的效率。
应当理解的是,本发明的上述具体实施方式仅仅用于示例性说明或解释本发明的原理,而不构成对本发明的限制。因此,在不偏离本发明的精神和范围的情况下所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。此外,本发明所附权利要求旨在涵盖落入所附权利要求范围和边界、或者这种范围和边界的等同形式内的全部变化和修改例。

Claims (6)

1.一种业务连续性运行监测自动适配系统,其特征在于,包括监测子系统、数据管理子系统、灾难模拟子系统、容灾备份子系统和自动适配子系统;
监测子系统包括监测模块和数据采集模块,用于各个业务节点的监测,并采集该节点的实时数据流信息;数据管理子系统包括数据汇总模块、数据处理模块和数据镜像模块,对监测模块采集的所有数据进行汇总、分类、加权处理,并生成对应的镜像数据群组;灾难模拟子系统包括灾难生成模块、灾难投放模块和灾难模拟模型,将镜像数据群组投放至灾难模拟模型,并根据业务权重随机生成的灾难场景,处理镜像数据群组;容灾备份子系统包括演练模块、计时模块和判断模块,在灾难模拟子系统触发灾难模拟模型时,所运行的二层拓扑协议将模拟灾难发生的业务流切换到备份链路,并记录反应时间,且判断该备份链路是否顺畅;自动适配子系统包括结果分析模块和调整模块,根据灾难模拟结果以及容灾备份子系统应对灾难模拟的反应情况进行分析,做出业务连续性评估,再对业务节点的各项工作参数进行调整。
2.根据权利要求1所述的一种业务连续性运行监测自动适配系统,其特征在于,监测模块的监测对象包括计算节点状态、网络状态、文件系统状态、队列状态和作业状态。
3.根据权利要求1所述的一种业务连续性运行监测自动适配系统,其特征在于,数据采集模块对各业务节点数据流的特征数据进行提取。
4.根据权利要求1所述的一种业务连续性运行监测自动适配系统,其特征在于,调整模块包括自动调整单元和手动调整单元;自动适配子系统根据业务连续性评估结果对业务节点的各项工作参数做出自动调整,并再次评估,评估结果未到达设定值时,需要管理者手动调整。
5.根据权利要求1所述的一种业务连续性运行监测自动适配系统,其特征在于,调整模块用于各节点对服务器的占用比例、频率进行调整。
6.一种业务连续性运行监测自动适配方法,包括上述权利要求1-5中任一项所述的系统,其特征在于,方法步骤如下:
S1、建立灾难模拟模型,并通过机器学习,不断提高模拟等级;
S2、在各个业务节点设置监测终端,对该节点上的数据行为进行监测,并采集该节点的实时数据流信息;
S3、将监测模块采集的所有数据进行汇总、分类、加权处理,并生成对应的镜像数据群组;
S4、将镜像数据群组投放至灾难模拟模型,并根据业务权重随机生成的灾难场景,处理镜像数据群组,查找业务漏洞;
S5、在灾难模拟子系统触发灾难模拟模型时,所运行的二层拓扑协议将模拟灾难发生的业务流切换到备份链路,并记录反应时间,且判断该备份链路是否顺畅;
S6、根据灾难模拟结果以及容灾备份子系统应对灾难模拟的反应情况进行分析,做出业务连续性评估,自动适配子系统根据业务连续性评估结果对业务节点的各项工作参数做出自动调整,并再次评估,评估结果未到达设定值时,需要管理者手动调整。
CN202011593862.1A 2020-12-29 2020-12-29 一种业务连续性运行监测自动适配方法及系统 Pending CN112711510A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011593862.1A CN112711510A (zh) 2020-12-29 2020-12-29 一种业务连续性运行监测自动适配方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011593862.1A CN112711510A (zh) 2020-12-29 2020-12-29 一种业务连续性运行监测自动适配方法及系统

Publications (1)

Publication Number Publication Date
CN112711510A true CN112711510A (zh) 2021-04-27

Family

ID=75546294

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011593862.1A Pending CN112711510A (zh) 2020-12-29 2020-12-29 一种业务连续性运行监测自动适配方法及系统

Country Status (1)

Country Link
CN (1) CN112711510A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115437851A (zh) * 2022-11-03 2022-12-06 联通(广东)产业互联网有限公司 数据中心容灾处理系统及方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110060722A1 (en) * 2009-09-07 2011-03-10 Icon Business Systems Limited Centralized management mode backup disaster recovery system
CN103905252A (zh) * 2014-04-03 2014-07-02 北京邮电大学 一种基于灾难模拟的灾备系统评估工具
CN108322332A (zh) * 2017-12-28 2018-07-24 贵阳忆联网络有限公司 一种数据灾难响应系统及方法
CN108446207A (zh) * 2017-02-16 2018-08-24 腾讯科技(深圳)有限公司 计算机系统容灾能力评估方法、装置及系统
CN111176974A (zh) * 2019-07-09 2020-05-19 腾讯科技(深圳)有限公司 容灾测试方法、装置、计算机可读介质及电子设备

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110060722A1 (en) * 2009-09-07 2011-03-10 Icon Business Systems Limited Centralized management mode backup disaster recovery system
CN103905252A (zh) * 2014-04-03 2014-07-02 北京邮电大学 一种基于灾难模拟的灾备系统评估工具
CN108446207A (zh) * 2017-02-16 2018-08-24 腾讯科技(深圳)有限公司 计算机系统容灾能力评估方法、装置及系统
CN108322332A (zh) * 2017-12-28 2018-07-24 贵阳忆联网络有限公司 一种数据灾难响应系统及方法
CN111176974A (zh) * 2019-07-09 2020-05-19 腾讯科技(深圳)有限公司 容灾测试方法、装置、计算机可读介质及电子设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115437851A (zh) * 2022-11-03 2022-12-06 联通(广东)产业互联网有限公司 数据中心容灾处理系统及方法
CN115437851B (zh) * 2022-11-03 2023-01-13 联通(广东)产业互联网有限公司 数据中心容灾处理系统及方法

Similar Documents

Publication Publication Date Title
CN111885012B (zh) 基于多种网络设备信息采集的网络态势感知方法及系统
CN105159964B (zh) 一种日志监控方法及系统
CN110891283A (zh) 一种基于边缘计算模型的小基站监控装置及方法
CN111176879A (zh) 设备的故障修复方法及装置
CN107872457B (zh) 一种基于网络流量预测进行网络操作的方法及系统
CN109034580B (zh) 一种基于大数据分析的信息系统整体健康度评估方法
CN101808351A (zh) 业务影响分析方法和系统
CN112350854B (zh) 一种流量故障定位方法、装置、设备及存储介质
CN110493146B (zh) 一种边缘智能网络感知平台及控制方法
CN106452941A (zh) 网络异常的检测方法及装置
CN112001443A (zh) 网络行为数据的监控方法、装置、存储介质及电子设备
CN117093461A (zh) 一种时延检测分析的方法、系统、设备和存储介质
CN112711510A (zh) 一种业务连续性运行监测自动适配方法及系统
CN107528705A (zh) 故障处理方法及装置
CN116723136B (zh) 应用fcm聚类算法的网络检测数据的方法
CN110647086B (zh) 一种基于运行大数据分析的智能运维监控系统
CN109634808B (zh) 一种基于关联分析的链式监控事件根因分析方法
CN104883275B (zh) 一种通信设备的日志缓存方法及系统
CN113742400B (zh) 一种基于自适应约束条件的网络数据获取系统及方法
CN110097381A (zh) 一种应用于机场服务的投诉自动识别预警系统及方法
WO2022100146A1 (zh) 互联网性能监控方法及系统
CN101917699B (zh) 基于用户的随机上报信令跟踪方法和装置
CN112579391A (zh) 一种基于人工智能的分布式数据库自动运维方法及系统
CN117149527B (zh) 一种服务器数据备份与恢复系统及方法
CN115914039B (zh) 一种网络性能监测装置及其监测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210427