CN104751238A

CN104751238A - 基于研判分析和优先级判定的备用调度解决方法

Info

Publication number: CN104751238A
Application number: CN201510098556.3A
Authority: CN
Inventors: 周晨曦; 刘嘉华; 陈龙; 孙峰; 康睿; 郭波
Original assignee: State Grid Corp of China SGCC; State Grid Jiangsu Electric Power Co Ltd; Nari Information and Communication Technology Co; Nanjing NARI Group Corp; Information and Telecommunication Branch of State Grid Jiangsu Electric Power Co Ltd
Current assignee: State Grid Corp of China SGCC; State Grid Jiangsu Electric Power Co Ltd; NARI Group Corp; Nari Information and Communication Technology Co; Information and Telecommunication Branch of State Grid Jiangsu Electric Power Co Ltd
Priority date: 2015-03-06
Filing date: 2015-03-06
Publication date: 2015-07-01
Anticipated expiration: 2035-03-06
Also published as: CN104751238B

Abstract

本发明公开了一种基于研判分析和优先级判定的备用调度解决方法，利用时延递归算法和研判分析方式来智能确认总部调度监测系统（IMS系统）的故障状态，自动启用备调机制，并采用机器学习技术来对分析过程进行优化，并通过复合式优先级算法生成增量式的级联数据包，实现了故障期间监测数据的无缝恢复，具有良好的应用前景。

Description

基于研判分析和优先级判定的备用调度解决方法

技术领域

本发明涉及一种基于研判分析和优先级判定的备用调度解决方法，属于信息运行备用调度技术领域。

背景技术

为了强化信息运行管控能力，持续提升业务支撑水平，实现国家电网公司的信息系统的实时运行监控、各类信息资源的统一调度、信息安全的一体化联合防御和集团化应急处置，国家电网公司党组决策建设了公司级信息通信系统调度运行监控中心，现由国网信通公司承担全部实时调度工作任务。

国家电网公司信息通信系统调度(以下简称国网信通调度)对国网总部、一级部署、直属单位集中部署信息系统及一、二级骨干通信网、信息网进行直接调度管理，对统建二级部署信息系统、灾备系统及三、四级骨干通信网、信息网进行实时监视和调度指挥，在保障信息通信系统稳定、高效支撑公司生产经营业务开展方面具有重要意义。国网信通调度通过信息运维综合监管系统(以下简称“IMS”)开展信息运行调度监测工作，为全网的信息系统运行维护工作提供全面监视和保障。

国家电网公司全面建设了北京、上海、西安三地灾备中心并实现了包括IMS系统在内的全网各类业务系统的数据级灾备，但此种灾备方式并不能完全满足总部信息运行调度的备调需求，存在以下缺点：一是只能实现数据备份和恢复，原系统故障期间依然无法开展调度监测工作；二是数据的灾备过程较为缓慢，至少需要2小时的时间来完成数据恢复，无形中增加了原系统故障期间的监测数据缺失量。

综上所述，针对近年来自然灾害频发和调度应急的实际情况，为了更好地保障信息通信调度业务连续性和稳定性，完善信息通信调度的备用调度体系，有必要开展针对总部国网信通调度专用的备用调度建设研究工作。同时，鉴于当前国网信息运行调度的实时特性与重要性，应当优先开展基于IMS系统的信息运行调度备调方法的研究。

发明内容

本发明的目的是克服近年来自然灾害频发和调度应急的实际情况，为了更好地保障信息通信调度业务连续性和稳定性，完善信息通信调度的备用调度体系，有必要开展针对总部国网信通调度专用的备用调度建设研究工作的问题。本发明的基于研判分析和优先级判定的备用调度解决方法，利用时延递归算法和研判分析方式来智能确认总部调度监测系统(IMS系统)的故障状态，自动启用备调机制，并采用机器学习技术来对分析过程进行优化，并通过复合式优先级算法生成增量式的级联数据包，实现了故障期间监测数据的无缝恢复，具有良好的应用前景。

为了达到上述目的，本发明所采用的技术方案是：

一种基于研判分析和优先级判定的备用调度解决方法，其特征在于：包括以下步骤，

步骤(1)，灾备中心灾备端系统、省电力公司生产端系统对总部调度监测系统的运行状态进行远程业务探测，采用固定的探测周期的周期性业务状态探测方式；

步骤(2)，若探测到故障时，对探测周期采用时延递减算法，执行多次关联性探测后确认告警；否则，返回步骤(1)；

步骤(3)，灾备中心灾备端系统、省电力公司生产端系统通过执行针对告警来源和告警明细内容的机器学习式研判分析，确认故障类型，若判断为总部调度监测系统停运，则灾备中心灾备端系统、省电力公司生产端系统同步启动备用调度模块；否则，返回步骤(1)；

步骤(4)，省电力公司生产端系统启动备用调度模块后，将本地调度监测数据采用增量式数据包的方式发送至灾备中心灾备端，由灾备中心灾备端系统履行总部调度监测系统的监测职能；

步骤(5)，当总部调度监测系统恢复运行后，灾备中心灾备端系统、省电力公司生产端系统各自停止备用调度模块和数据转发机制，并执行数据恢复过程；

步骤(6)，总部调度监测系统在数据恢复过程中，通过执行时间和重要性的双维度复合式优先级算法，对故障期间的监测数据面向总部调度监测系统进行分段恢复，直到故障期间监测数据完全恢复至总部调度监测系统。

前述的基于研判分析和优先级判定的备用调度解决方法，其特征在于：步骤(2)，若探测到故障时，对探测周期采用时延递减算法，执行多次关联性探测后确认告警的方法，包括以下步骤，

(1)设置可配置的初始探测周期t₁，t₁等于5min，在第一次探测到故障时，根据公式(1)，计算第n递减后的探测频率t_n，

t_{n} = \frac{2}{3 (n + 1)} \times t_{n - 1} + \frac{1}{12} - - - (1)

其中，n为递减次数；

(2)根据计算的每次递减后的探测频率t_n，重复步骤(1)，若还是探测到故障，继续下一次递减后的探测频率t_n，直到t_n小于0.5min时，每次均探测到故障，则确认告警。

前述的基于研判分析和优先级判定的备用调度解决方法，其特征在于：步骤(3)灾备中心灾备端系统、省电力公司生产端系统通过执行针对告警来源和告警明细内容的机器学习式研判分析，确认故障类型的方法，包括以下步骤，

(1)各灾备中心灾备端系统、省电力公司生产端系统对历史数据和探测数据的检验分析，并与实际出现过的故障、预存的结果库进行比对，通过定量分析确定故障源；

(2)若出现新的故障源，不是实际出现过的故障且不存在预存的结果库，则通过人工判断故障类型，并将该故障情况录入预存的结果库中，完成一次学习过程。

前述的基于研判分析和优先级判定的备用调度解决方法，其特征在于：步骤(6)，总部调度监测系统在数据恢复过程中，通过执行时间和重要性的双维度复合式优先级算法，对故障期间的监测数据面向总部调度监测系统进行分段恢复的方法，包括以下步骤，

(1)在总部调度监测系统在数据恢复过程中，各灾备中心灾备端系统、省电力公司生产端系统将监测数据、故障期间的备用监测数据加以区分；

(2)优先向总部调度监测系统发送实时监测数据，并对故障期间的各灾备中心灾备端系统、省电力公司生产端系统的备用监测数据，根据公式(2)，对各灾备中心灾备端系统、省电力公司生产端系统的故障期间的备用监测数据的第i指标的时间维度和故障重要性维度两个方面的优先级加权来判断，该指标的最终发送优先级，并进行数据发送，

F_{i} = \frac{i * p %}{\frac{60 - b_{1} - (5 - b_{1} \mod 5) + b_{2} - b_{2} \mod 5}{5} + (a_{2} - a_{1} - 1) * 12} + \frac{S_{i} (Σ_{j = 1}^{n} G_{j} Z_{j}) * (100 - p) %}{S_{\max} (Σ_{j = 1}^{n} G_{j} Z_{j})} - - - (2)

其中，F_i为第i个指标的发送优先级，确定故障时间区间为a₁时b₁分至a₂时b₂分，p％为时间维度在整个优先级中的权重，G_j为第j种故障的数量，Z_j为第j种故障的权重，m为每组监测数据包中m个指标，S_i为每组监测数据包第i个指标的重要度值，S_max为每组监测数据包中指标重要度值最大的指标重要度，S_i/S_max为每组监测数据包第i个指标的相对重要度。

本发明的有益效果是：本发明的基于研判分析和优先级判定的备用调度解决方法，利用时延递归算法和研判分析方式来智能确认总部调度监测系统(IMS系统)的故障状态，自动启用备调机制，并采用机器学习技术来对分析过程进行优化，并通过复合式优先级算法生成增量式的级联数据包，实现了故障期间监测数据的无缝恢复，并具有以下优点，

1)多重手段保障主调状态探测(总部调度监测系统的运行状态)的结果更准确，包含了周期性探测、时延递减探测、探测结果研判分析三个阶段，最大限度地保障了探测结果和故障判断的准确性；

2)自增长与自调整的探测结果库，本利用性能历史数据和实时探测数据，分析出合理的故障结果，并不断自主扩充和优化故障结果库，减少了人工设置及判断的工作量；

3)分散、递进的高效数据恢复机制，采用各灾备中心灾备端系统、省电力公司生产端系统同时向总部主调恢复数据的方式，并通过优先级算法合理安排数据恢复过程，能保障在最短时间内完成总部系统中故障数据的对应补充。

附图说明

图1是本发明的基于研判分析和优先级判定的备用调度解决方法的流程图。

图2是本发明的总部调度监测系统、灾备中心灾备端系统、省电力公司生产端系统三者之间的数据流向图。

图3是本发明的故障期间的监测数据的级联指标数据包的示意图。

具体实施方式

下面将结合说明书附图，对本发明作进一步说明。以下实施例仅用于更加清楚地说明本发明的技术方案，而不能以此来限制本发明的保护范围。

本发明的基于研判分析和优先级判定的备用调度解决方法，利用时延递归算法和研判分析方式来智能确认总部调度监测系统(IMS系统)的故障状态，自动启用备调机制，并采用机器学习技术来对分析过程进行优化，并通过复合式优先级算法生成增量式的级联数据包，实现了故障期间监测数据的无缝恢复，如图1所示，具体包括以下步骤，

步骤(2)，若探测到故障时，对探测周期采用时延递减算法，执行多次关联性探测后确认告警，其包括以下步骤，

t_{n} = \frac{2}{3 (n + 1)} \times t_{n - 1} + \frac{1}{12} - - - (1)

其中，n为递减次数；

(2)根据计算的每次递减后的探测频率t_n，重复步骤(1)，若还是探测到故障，继续下一次递减后的探测频率t_n，直到t_n小于0.5min时，每次均探测到故障，则确认告警；

否则，返回步骤(1)；

步骤(3)，灾备中心灾备端系统、省电力公司生产端系统通过执行针对告警来源和告警明细内容的机器学习式研判分析，确认故障类型，包括以下步骤，

(2)若出现新的故障源，不是实际出现过的故障且不存在预存的结果库，则通过人工判断故障类型，并将该故障情况录入预存的结果库中，完成一次学习过程，这里通过历史数据和运行数据的机器学习，可以不断提升故障分析可靠性和效率，在一段时间的运行后即可全部完善系统研判分析机制，相比人工遍历判断效率更高且成本更小；

若判断为总部调度监测系统停运，则灾备中心灾备端系统、省电力公司生产端系统同步启动备用调度模块；否则，返回步骤(1)；

其中，省电力公司生产端系统的备用调度机制，包含业务探测、告警、数据转发和数据恢复4部分功能，当探测并确认了总部系统故障时，发出告警，并将发送给总部的监测级联数据转而发送给相应的灾备端备调模块，以实现总部系统故障期间的全网信息运行调度监测，最后的数据恢复模块是在探测到或接收到总部系统恢复运行的信号后，归档故障备调期间的监测数据，并通过优先级算法执行数据恢复过程，将在步骤(6)进行；

灾备中心灾备端系统的备用调度模块，分为监测和管理两部分内容，

监测部分是将总部系统中最核心的调度监测内容加以复制性展现，以保障总部系统故障期间能完全支撑其调度监测工作。备调监测的内容包括全网业务系统状态、核心运行指标、信息网运行状态等；

管理部分与生产端类似，包括业务探测、告警、切换控制和数据恢复4部分功能，探测、告警两部分功能同样是完成本发明中步骤一的任务，切换控制部分在确认了故障告警之后，有两种进一步的处理方式，一是自动完成备调机制的切换，激活灾备端的备调监测页面，从其备调数据库中抽取实时监测数据进行展现；二是由人工进行手动切换，以最大限度地保障切换的可靠性与准确性；两种方式可通过用户配置来选择。数据恢复部分同样是将故障期间灾备中心的相关监测数据进行归档，并通过优先级算法执行数据恢复过程；

步骤(6)，总部调度监测系统在数据恢复过程中，通过执行时间和重要性的双维度复合式优先级算法，对故障期间的监测数据面向总部调度监测系统进行分段恢复，直到故障期间监测数据完全恢复至总部调度监测系统，其中通过执行时间和重要性的双维度复合式优先级算法，对故障期间的监测数据面向总部调度监测系统进行分段恢复的方法，包括以下步骤，

(1)在总部调度监测系统在数据恢复过程中，灾备中心灾备端系统、省电力公司生产端系统将监测数据、故障期间的备用监测数据加以区分；

(2)优先向总部调度监测系统发送实时监测数据，并对故障期间的备用监测数据，根据公式(2)，对故障期间的备用监测数据的第i指标的时间维度和故障重要性维度两个方面的优先级加权来判断，该指标的最终发送优先级，并进行数据发送，

F_{i} = \frac{i * p %}{\frac{60 - b_{1} - (5 - b_{1} \mod 5) + b_{2} - b_{2} \mod 5}{5} + (a_{2} - a_{1} - 1) * 12} + \frac{S_{i} (Σ_{j = 1}^{n} G_{j} Z_{j}) * (100 - p) %}{S_{\max} (Σ_{j = 1}^{n} G_{j} Z_{j})} - - - (2)

其中，F_i为第i个指标的发送优先级，确定故障时间区间为a₁时b₁分至a₂时b₂分，p％为时间维度在整个优先级中的权重，G_j为第j种故障的数量，Z_j为第j种故障的权重，m为每组监测数据包中m个指标，S_i为每组监测数据包第i个指标的重要度值，S_max为每组监测数据包中指标重要度值最大的指标重要度，S_i/S_max为每组监测数据包第i个指标的相对重要度，以保证时间重要度和权重重要度数值相近，提升准确度。

在最终完成故障期间备调数据的恢复后，完全停止灾备中心灾备端系统、省电力公司生产端系统，整个调度系统恢复正常运行。

如图2所示，本发明中的总部调度监测系统(简称总部系统)、灾备中心灾备端系统(简称灾备端)、省电力公司生产端系统(简称生产端)三者之间的流向为：

正常运行情况下，生产端将省市电力公司的实时监测数据发送至总部系统，灾备端将灾备中心的实时灾备监测数据发送至总部系统，以辅助总部系统完成对全网信息系统的实时调度监测；

总部系统故障期间，生产端将省市公司的实时监测数据转而发送至对应的备调灾备端，而灾备端将自身的灾备监测数据、生产端发来的生产运行数据集中展现，临时履行总部调度监测职能；

总部系统恢复运行后，生产端与灾备端执行数据恢复机制，在优先发送各自实时监测数据的前提下，将备调期间的监测数据加以归档、分析，按优先级打包后逐步恢复至总部系统中。

如图3所示，本发明的故障期间的监测数据的级联指标数据，包应包含如下字段：

(1)数据序列(ID)：作为系统内部识别该数据的唯一性ID标识；

(2)时间字段(Time)：该监测指标的时间属性，也是时间维度权重的重要计算标志；

(3)指标名称(Name)：该监测指标的名称；

(4)指标数值(Value)：该监测指标的数值，若是备调期间监测到了省市公司或灾备中心的信息系统运行故障，则会在数值中体现；

(5)总部发送标志位：表征该指标是否已发送至总部系统；

(6)灾备发送标志位：表征该指标是否已发送至灾备备调系统；

(7)时间维度优先级：表征该监测指标在时间维度上的优先级，通常遵循就近原则，优先发送实时和最靠近的指标；

(8)故障维度优先级：表征该监测指标在故障重要性维度的优先级，故障的重要性由用户在配置表中提前设置，并作为最终完整优先级中的算法依据；

(9)指标最终优先级：表征该监测指标经过复合式优先级算法，将时间维度和故障重要性维度综合计算出的最终优先级，以该优先级数值为依据执行数据恢复操作。

备调期间的监测数据依据上述数据包格式进行归档，并在优先级计算完成后，将数据序列、时间字段、指标名称和指标数值四项属性作为级联数据上传至总部系统。

以上显示和描述了本发明的基本原理、主要特征及优点。本行业的技术人员应该了解，本发明不受上述实施例的限制，上述实施例和说明书中描述的只是说明本发明的原理，在不脱离本发明精神和范围的前提下，本发明还会有各种变化和改进，这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

Claims

1.基于研判分析和优先级判定的备用调度解决方法，其特征在于：包括以下步骤，

2.根据权利要求1所述的基于研判分析和优先级判定的备用调度解决方法，其特征在于：步骤(2)，若探测到故障时，对探测周期采用时延递减算法，执行多次关联性探测后确认告警的方法，包括以下步骤，

t_{n} = \frac{2}{3 (n + 1)} \times t_{n - 1} + \frac{1}{12} - - - (1)

其中，n为递减次数；

3.根据权利要求1所述的基于研判分析和优先级判定的备用调度解决方法，其特征在于：步骤(3)灾备中心灾备端系统、省电力公司生产端系统通过执行针对告警来源和告警明细内容的机器学习式研判分析，确认故障类型的方法，包括以下步骤，

4.根据权利要求1所述的基于研判分析和优先级判定的备用调度解决方法，其特征在于：步骤(6)，总部调度监测系统在数据恢复过程中，通过执行时间和重要性的双维度复合式优先级算法，对故障期间的监测数据面向总部调度监测系统进行分段恢复的方法，包括以下步骤，

F_{i} = \frac{i * p %}{\frac{60 - b_{1} - (5 - b_{1} \mod 5) + b_{2} - b_{2} \mod 5}{5} + (a_{2} - a_{1} - 1) * 12} + \frac{S_{i} (Σ_{j = 1}^{m} G_{j} Z_{j}) * (100 - p) %}{S_{\max} (Σ_{j = 1}^{m} G_{j} Z_{j})} - - - (2)