CN110717665B - 基于调度控制系统故障辨识及趋性分析系统和方法 - Google Patents

基于调度控制系统故障辨识及趋性分析系统和方法 Download PDF

Info

Publication number
CN110717665B
CN110717665B CN201910940783.4A CN201910940783A CN110717665B CN 110717665 B CN110717665 B CN 110717665B CN 201910940783 A CN201910940783 A CN 201910940783A CN 110717665 B CN110717665 B CN 110717665B
Authority
CN
China
Prior art keywords
fault
monitoring
risk
analysis
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910940783.4A
Other languages
English (en)
Other versions
CN110717665A (zh
Inventor
齐玉商
刘进峰
王亚静
邓捷
王冠
陈雄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hubei Central China Technology Development Of Electric Power Co ltd
State Grid Corp of China SGCC
Original Assignee
Hubei Central China Technology Development Of Electric Power Co ltd
State Grid Corp of China SGCC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hubei Central China Technology Development Of Electric Power Co ltd, State Grid Corp of China SGCC filed Critical Hubei Central China Technology Development Of Electric Power Co ltd
Priority to CN201910940783.4A priority Critical patent/CN110717665B/zh
Publication of CN110717665A publication Critical patent/CN110717665A/zh
Application granted granted Critical
Publication of CN110717665B publication Critical patent/CN110717665B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • G06Q10/06312Adjustment or analysis of established resource schedule, e.g. resource or task levelling, or dynamic rescheduling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/20Administration of product repair or maintenance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/06Electricity, gas or water supply

Abstract

本发明提供一种基于调度控制系统故障辨识及趋性分析系统和方法,该系统包括系统监视模块、专家库管理模块、故障辨识及分析处理模块、及风险趋势分析及智能辅助决策模块,系统监视模块和专家库管理模块均分别与故障辨识及分析处理模块、及故障辨识及分析处理模块连接。本发明基于调度控制系统故障前后各异常特征,将人工神经网络人工智能技术应用于电网调度控制系统领域,依托数据检测和清洗、垂直搜索、异常数据辨识等技术,实现系统实时运行状态感知且全景模拟的智能辅助服务,集成先进的实时状态感知、量化态势评估,实现智能电网调度控制系统故障的实时监测、动态辨识与分析、风险预估、智能响应和高效服务,提升系统安全风险预处理能力。

Description

基于调度控制系统故障辨识及趋性分析系统和方法
技术领域
本发明涉及电力调度自动化领域,具体是一种基于调度控制系统故障辨识及趋性分析系统和方法。
背景技术
目前电力调度控制系统主要功能为电网基础数据采集与监控,二次数据分析和高级应用,但调度控制系统对于自身系统故障、通道故障、数据异常等告警尚处于初级阶段,调度控制系统对于系统故障无法给出确切原因,并且没有风险提前预判和分析功能,系统的故障排除和风险判断只能依靠人工巡检和日志分析,运维人员主要依据事先编制的故障预案文件和运行经验进行故障处置,通过查阅非结构化的预案文本和知识,并对照调度控制系统中告警信息和日志信息进行处置,整个过程依赖于运维人员水平和巡检频率,极大耗费了运维人员精力,且效率较低。
发明内容
针对现有技术存在的上述不足,本发明提供一种基于调度控制系统故障辨识及趋性分析系统和方法,可实现调度控制系统实时运行状态感知且全景模拟的智能辅助服务,提升系统安全风险预处理能力。
一种基于调度控制系统故障辨识及趋性分析系统,包括系统监视模块、专家库管理模块、故障辨识及分析处理模块、及风险趋势分析及智能辅助决策模块,系统监视模块和专家库管理模块均分别与故障辨识及分析处理模块、及故障辨识及分析处理模块连接;
所述系统监视模块,与调控系统、二次安全防护系统、调度数据网系统连接,用于智能监测系统网络状态、服务器运行状态、业务运行状态、重要数据运行状态、业务关键指标状态、系统运行日志,并将监视内容和结果发送给与之相连的故障辨识及分析处理模块、风险趋势分析及智能辅助决策模块,对于异常情况主动给出告警;
所述故障辨识及分析处理模块,用于通过利用系统监视模块对调控系统、二次安全防护系统和调度数据网系统的监视结果,在发现系统故障后结合专家库进行分析处理,若故障不符合异常特征,则继续进行监视,若确实发生故障,则智能进行故障处理;
所述风险趋势分析及智能辅助决策模块,用于通过系统监视模块对调控系统、二次安全防护系统、调度数据网系统进行监视,当发现系统存在风险异常,则通过风险趋势分析及智能辅助决策模块结合专家库进行诊断分析,若风险异常不符合异常特征,则返回进行进行监视,若判断风险异常存在,则进行风险预警并给出解决方案,辅助故障解决。
进一步的,所述专家库管理模块集知识发现与积累、知识发布于一体,提供完善的专家库管理支撑服务,同时作为故障辨识处理专家库系统,专家库涵盖大量框架化、程式化的故障处理案例并基于过程式知识表示法、知识模型表示法和面向对象知识表示法,通过采用继承和封装技术,减少系统故障分析过程的冗余性,快速建立故障处理的理论知识和知识运用的方法,将故障处理集框架化、程式化,将文本内容转化为机器可识别的操作步骤,便于系统检索、分析和直接执行,为人工智能提供训练样本,为调度自动化运维人员提供有效的帮助,其具体实现方式如下:
导入框架化、机构化的故障处理集,形成知识库,供人工智能训练及故障处理;
系统各运行程序运行逻辑及运行节点异常特征;
将自主学习,自主辨别和处理的故障形成案例并入专家库;
导入各系统使用手册和说明文档管理,并支持分类和检索。
进一步的,所述故障辨识及分析处理模块采用人工神经网络ANN、人工智能技术进行故障辨识及智能分析处理,其具体的步骤如下:
首先,通过人工神经网络构建系统故障集原型,通过分析被诊断系统各个组成设备和程序的属性,并用不同层次类来描述设备和程序对应的故障异常特征,即赋予“神经元”属性,并通过神经网络传导来实现描述整个系统故障情况下的动态行为,故障异常特征包括:设备异常特征、网络异常特征、异常告警特征、安防策略特征、接口程序特征、日志错误信息特征;所有异常特征用于神经元传递及触发故障机制。“神经元”属性即系统监视模块所监视之应用状态属性、设备状态属性、网络状态属性,各属性之间的连接关系称之为“神经网络”;
其次,结合专家库管理模块所提供的大量和充分的故障实例,形成故障诊断模型的训练样本集,运用DS学习算法对样本集进行训练,通过训练学习使系统实现知识的自我组织,自我学习能力,经学习后,在神经元及它们之间的有向权重连接中蕴涵了处理问题的知识;
最后,系统借助人工神经网络神经元属性,以及人工干预的方法,不断加强对人工智能的训练。
进一步的,所述风险趋势分析及智能辅助决策模块具体实现方法如下:利用机器学习tree-bee和卷积神经网络算法,结合智能监视结果、故障辨识及多维分析过程,设置故障规则及对应解决方案,通过thought-->study-->way方式模拟人工思维及处理方式,利用智能监视内容,分析各系统运行数据以及故障前系统各项异常特征,根据系统发生故障,监视信息作为驱动输入,按照“神经元”知识指导的推理策略调动知识库在故障中的程序规则或设备状态搜索求得故障预测的结果,用附加动量因子对系统模型结构进行诊断,并改变动量因子的取值,并使用局部逼近的径向基函数实现的系统的故障预测,用“神经元”的属性及状态作为输入,可能的故障位置作为输出,当程序规则的条件部分与诊断输入信息相匹配,就将该规则作为可用规则放入候选队列中,再通过冲突消解,将其作为进一步推理的证据直至得到诊断结果,最终实现对风险的趋性分析;
趋性分析结果结合专家库各类故障模型,对于可能导致的的后果智能给出风险提示和解决方案。
一种基于调度控制系统故障辨识及趋性分析方法,其特征在于采用上述系统进行,所述方法包括如下步骤:
步骤一、故障智能辨识与处理:通过利用系统监视模块对调控系统、二次安全防护系统和调度数据网系统的监视结果,在发现系统故障后结合专家库进行分析处理,若故障不符合异常特征,则继续进行监视,若确实发生故障,则智能进行故障处理;
步骤二、风险趋势分析及智能辅助决策:通过系统监视模块对调控系统、二次安全防护系统、调度数据网系统进行监视,当发现系统存在风险异常,则通过风险趋势分析及智能辅助决策模块结合专家库进行诊断分析,若风险异常不符合异常特征,则返回进行进行监视,若判断风险异常存在,则进行风险预警并给出解决方案,辅助故障解决。
进一步的,所述步骤一具体为:
首先,通过人工神经网络构建系统故障集原型,通过分析被诊断系统各个组成设备和程序的属性,并用不同层次类来描述设备和程序对应的故障异常特征,即赋予“神经元”属性,并通过神经网络传导来实现描述整个系统故障情况下的动态行为,故障异常特征包括:设备异常特征、网络异常特征、异常告警特征、安防策略特征、接口程序特征、日志错误信息特征;所有异常特征用于神经元传递及触发故障机制。“神经元”属性即系统监视模块所监视之应用状态属性、设备状态属性、网络状态属性,各属性之间的连接关系称之为“神经网络”;
其次,结合专家库管理模块所提供的大量和充分的故障实例,形成故障诊断模型的训练样本集,运用DS学习算法对样本集进行训练,通过训练学习使系统实现知识的自我组织,自我学习能力,经学习后,在神经元及它们之间的有向权重连接中蕴涵了处理问题的知识;
最后,系统借助人工神经网络神经元属性,以及人工干预的方法,不断加强对人工智能的训练。
进一步的,所述步骤二具体为:
利用机器学习tree-bee和卷积神经网络算法,结合智能监视结果、故障辨识及多维分析过程,设置故障规则及对应解决方案,通过thought-->study-->way方式模拟人工思维及处理方式,利用智能监视内容,分析各系统运行数据以及故障前系统各项异常特征,根据系统发生故障,监视信息作为驱动输入,按照“神经元”知识指导的推理策略调动知识库在故障中的程序规则或设备状态搜索求得故障预测的结果,用附加动量因子对系统模型结构进行诊断,并改变动量因子的取值,并使用局部逼近的径向基函数实现的系统的故障预测,用“神经元”的属性及状态作为输入,可能的故障位置作为输出,当程序规则的条件部分与诊断输入信息相匹配,就将该规则作为可用规则放入候选队列中,再通过冲突消解,将其作为进一步推理的证据直至得到诊断结果,最终实现对风险的趋性分析;
趋性分析结果结合专家库各类故障模型,对于可能导致的的后果智能给出风险提示和解决方案。
本发明基于调度控制系统故障前后各异常特征,将人工神经网络人工智能技术应用于电网调度控制系统领域,依托数据检测和清洗、垂直搜索、异常数据辨识等技术,实现系统实时运行状态感知且全景模拟的智能辅助服务,集成先进的实时状态感知、量化态势评估,实现智能电网调度控制系统故障的实时监测、动态辨识与分析、风险预估、智能响应和高效服务,提升系统安全风险预处理能力。
附图说明
图1是本发明基于调度控制系统故障辨识及趋性分析系统的结构示意图;
图2是本发明中故障辨识及分析处流程流程图;
图3是本发明中趋性分析及辅助决策流程图。
图中:1—系统监视模块,2—专家库管理模块,3—故障辨识及分析处理模块,4—风险趋势分析及智能辅助决策模块,5—调控系统,6—二次安全防护系统,7—调度数据网系统。
具体实施方式
下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述。
请参阅图1,本发明基于调度控制系统故障辨识及趋性分析系统其中一个实施例包括系统监视模块1、专家库管理模块2、故障辨识及分析处理模块3、及风险趋势分析及智能辅助决策模块4,系统监视模块1和专家库管理模块2均分别与故障辨识及分析处理模块3、及故障辨识及分析处理模块4连接。
所述系统监视模块1,与调控系统5、二次安全防护系统6、调度数据网系统7连接,用于智能监测系统网络状态、服务器运行状态、业务运行状态、重要数据运行状态、业务关键指标状态、系统运行日志等,对于异常情况主动给出告警,告警方式包括弹窗、电话、短信、app推送等方式。其中所述调控系统5用于变电站和电厂数据采集和监视,所述二次安全防护系统6用于调控系统至变电站、电厂后台装置的端口限制和数据加密处理,所述调度数据网系统7用于提供数据采集所需的通道和网络。
所述系统监视模块1的具体监视内容如下:
调度控制系统监视:通过数据库提供的DCI接口,从数据库HISDB/ALARM模式告警表中下获取调控系统5的运行信息,包括:交换机工况(表switch_warn,获取交换机状态及端口状态),应用状态(app_gk,获取应用主备机切换及投退状态),数据库资源信息(data_base_resource,获取数据库资源信息),通道工况(channel_gk,获取通道切换及投退情况);
调度数据网监视:通过调度数据网系统7提供的对外接口(DADC),实时获取通信链路上骨干网路由器,接入网路由器实时运行状态,主站至各厂站链路状态,获取底层数据交换及系统交互流量包,实时监视调度数据网各节点运行状态;
二次安防系统监视:调度数据网系统7主要是通过对网络安全监视平台进行数据接入,接口方式采用数据库访问及约定的接口文件方式获取,数据库访问网络安全监视平台主要包括:主站至厂站隧道运行状态(sd_state),主站与厂站交互状态告警信息(chan_gk);接口文件主要是导出主站与厂站之间安防加密策略,包括IP地址信息,端口开放信息;通过以上两种方式实时监测隧道状态及加密策略情况。
所述系统监视模块1还用于将监视内容和结果发送给与之相连的故障辨识及分析处理模块3、风险趋势分析及智能辅助决策模块4。
所述故障辨识及分析处理模块3,用于通过利用系统监视模块1对调控系统5、二次安全防护系统6和调度数据网系统7的监视结果,在发现系统故障后结合专家库进行分析处理,若故障不符合异常特征,则继续进行监视,若确实发生故障,则智能进行故障处理。具体的,其用于实现对故障的进一步分析和处理,对上述系统监视模块1所监视的内容和故障进行分析,故障辨识是在总结原有大量系统故障处理过程和人工处理经验的基础上利用人工智能技术,模拟人工思维方式,学习人工处理过程,通过分析调控系统5的故障,再结合二次安全防护系统6和调度数据网系统7智能监测获取的结果,综合分析各系统可能存在的故障点,智能分析系统日志、程序运行日志、进程状态、业务状态、网络状态、服务器资源状态等手段实现故障的智能诊断,准确定位故障原因,给出智能化解决方案。
所述专家库管理模块2,集知识发现与积累、知识发布于一体,提供完善的专家库管理支撑服务。同时作为故障辨识处理专家库系统,专家库涵盖大量框架化、程式化的故障处理案例并基于过程式知识表示法、知识模型表示法和面向对象知识表示法,通过采用继承和封装技术,减少系统故障分析过程的冗余性,快速建立故障处理的理论知识和知识运用的方法,将故障处理集框架化、程式化,将文本内容转化为机器可识别的操作步骤,便于系统检索、分析和直接执行,为人工智能提供训练样本,为调度自动化运维人员提供有效的帮助。具体实现方式如下:
(1)导入框架化、机构化的故障处理集,形成知识库,供人工智能训练及故障处理;
(2)系统各运行程序运行逻辑及运行节点异常特征;
(3)将自主学习,自主辨别和处理的故障形成案例并入专家库;
(4)导入各系统使用手册和说明文档管理,并支持分类和检索。
所述专家库管理模块2将上述内容框架化、程式化,将文本内容转化为机器可识别的操作步骤,便于系统检索、分析和直接执行。
所述故障辨识及分析处理模块3采用人工神经网络(artificialneuralnetwork)ANN、人工智能技术进行故障辨识及智能分析处理,其具体的步骤如下:
首先,通过人工神经网络构建系统故障集原型,通过分析被诊断系统各个组成设备和程序的属性,并用不同层次类来描述设备和程序对应的故障异常特征,即赋予“神经元”属性,并通过神经网络传导来实现描述整个系统故障情况下的动态行为。故障异常特征包括:设备异常特征、网络异常特征、异常告警特征、安防策略特征、接口程序特征、日志错误信息特征等,所有异常特征用于神经元传递及触发故障机制。“神经元”属性即系统监视模块1所监视之应用状态属性、设备状态属性、网络状态属性等,各属性之间的连接关系称之为“神经网络”。
其次,结合专家库管理模块2所提供的大量和充分的故障实例,形成故障诊断模型的训练样本集,运用DS学习算法对样本集进行训练,通过训练学习使系统实现知识的自我组织,自我学习能力。经学习后,在神经元及它们之间的有向权重连接中蕴涵了处理问题的知识,它的知识表达是隐式的并具有一定的联想和泛化能力,对已训练的故障诊断模型,执行计算速度会更快,故障处理效率也就更高。
最后,系统借助人工神经网络神经元属性,以及人工干预的方法,不断加强对人工智能的训练,提升故障辨识和分析处理的准确度。整个故障智能辨识的难点在于人工学习需要大量经验总结、场景模拟和实践才能做到自主全面分析各项故障因素的能力,最终达到故障自动辨识、自动处理的目的。
图2为故障辨识及分析处流程,通过系统监视模块1对调控系统5、二次安全防护系统6、调度数据网系统7进行监视,发现系统故障后通过故障辨识及分析处理模块3结合专家库管理模块2进行分析处理,若故障不符合异常特征,则继续进行监视,若确实发生故障,则智能进行故障处理。
具体实施例如下:
scada应用故障:人工神经网络通过系统监视模块1监视到调控系统5各应用状态,各应用作为“神经元”,赋予“正常、故障、断网、退出”等运行状态,其中“故障、断网、退出”作为异常状态,其异常特征通过智能监视showservice显示结果判断,进一步触发“神经元”传导,主动分析包括及$HOME/bin下对应core信息,数据库/HISDB/ALARM进程告警信息,$HOME/var/log/sys_process.log报错日志信息,以2019-08-01 12:23:35,scada应用故障为例:
showservice监视结果判断具体发生故障时间及故障应用,发现2019-08-01 12:23:35分,scada应用故障;
系统结合专家库管理模块2中应用故障处理方法,智能处理,通过“seeproc”命令运行结果检查具体故障进程,发现为scada应用关键进程sca_point故障退出;
通过“find.-name‘$HOME/bin/core*sca_point””检查$HOME/bin下程序异常core文件,确定sca_point程序异常;
通过“grep"run unusual,exit"$HOME/var/logsys_process.log|grep'servicescada'|awk'{print$4$12}'|sed's/process_id:/:/g'|sed's/err_type:/:/g'|sed's/src_host_name:/:/g'|sed's/s:/:/g'|sed's/,//g'|sort-u`”获取$HOME/var/log/sys_process.log日志报错信息,定位scada应用关键进程sca_point故障退出;
通过“SELECT OCCUR_TIME,PROCESS_NAME,SERVICE_NAME,CONTENT FROMPROCESS_GK WHERE OCCUR_TIME=TO_DATE(‘2019-08-01 12:23:35’,‘yyyy-MM-dd HH24:mm:ss’)AND PROCESS_NAME=‘sca_point’”检索数据库HISDB/ALARM进程工况表(process_gk)内容,定位出故障进程sca_point;
结合专家库,判断出sca_point进程由于配置文件异常损坏导致程序运行出现异常,程序core掉后导致scada应用出现故障,系统根据故障案例处理办法,更换正常配置文件,重新运行程序后系统恢复正常。
某厂站通道故障:通过统监视模块1监视到调控系统5至各厂站通道状态,根据FES通道监视结果定位具体故障通道,利用ping厂站IP、厂站交换机地址、厂站网关、主站网关、telnetip端口等方式进行故障判定,同时利用ssh登录调度数据网相关路由器、交换机查看相关厂站通信运行状态以及二次安防加密策略情况,综合判定之后给出通道故障原因及解决办法;以某厂站通道中断为例进行判断,调控系统5前置服务器地址为10.88.33.1,厂站RTU地址为10.101.58.1,厂站交换机地址10.101.58.100,厂站网关为10.101.58.254,端口为2404:
通过调控系统5前置服务器10.88.33.1,ping厂站10.101.58.1,如果ping的通,telnet ip端口不通,判定为站端服务问题或安防加密策略问题;
若ping厂站RTU10.101.58.1不通,ping厂站交换机10.101.58.100通,判定为站端网络问题或安防加密策略问题;
若ping厂站交换机10.101.58.100不通,判定为安防加密策略问题及交换机问题;
若ping厂站网关10.101.58.254不通,ping厂站交换机10.101.58.100不通,判定为数据网或安防加密策略问题;
通过系统监视模块1监测调度数据网系统7各路由器,发现数据网各路由器节点网络状态正常;
通过系统监视模块1监测二次安全防护系统6缺失至厂站端IP的安防加密策略;
系统结合调控系统5ping的结果,调度数据网系统7及二次安全防护系统6监视结果,最终确定为加密策略问题,系统根据故障处理案例,自主添加安防加密策略,开通10.88.33.1对厂站RTU地址为10.101.58.1的2404端口访问。
所述风险趋势分析及智能辅助决策模块4,是在对系统监视模块1监视内容和故障处理结果进行分析的基础上,结合各系统运行数据,主动捕捉故障前系统各项异常特征(设备异常特征、网络异常特征、异常告警特征、安防策略特征、接口程序特征、日志错误信息特征等),将系统可能存在的风险及趋势推送给运维人员,辅助其对系统进行风险预判和评估,风险趋势分析的难点在于故障前系统异常特征的把控和捕捉,以及模拟人工思维和处理方式,快速定位本系统问题以及系统间故障问题,智能给出风险趋势及解决方案,最终达到提前消除和规避风险的目的,其实现方法如下:
利用机器学习tree-bee和卷积神经网络算法,结合上述智能监视结果、故障辨识及多维分析过程,设置故障规则及对应解决方案,通过thought-->study-->way方式模拟人工思维及处理方式,利用智能监视内容,分析各系统运行数据以及故障前系统各项异常特征,根据系统发生故障,监视信息作为驱动输入,按照“神经元”知识指导的推理策略调动知识库在故障中的程序规则或设备状态搜索求得故障预测的结果(由网络结构信息、设备状态、系统间的连接和异常特征的属性等组成)。用附加动量因子对系统模型结构进行诊断,并改变动量因子的取值,并使用局部逼近的径向基函数实现的系统的故障预测,用“神经元”的属性及状态作为输入,可能的故障位置作为输出,当程序规则的条件部分与诊断输入信息相匹配,就将该规则作为可用规则放入候选队列中,再通过冲突消解,将其作为进一步推理的证据直至得到诊断结果,最终实现对风险的趋性分析。趋性分析结果结合专家库各类故障模型,对于可能导致的的后果智能给出风险提示和解决方案。
图3为趋性分析及辅助决策流程,通过系统监视模块1,对调控系统5、二次安全防护系统6、调度数据网系统7进行监视,当发现系统存在风险异常,则通过风险趋势分析及智能辅助决策模块4结合专家库进行诊断分析,若风险异常不符合异常特征,则返回进行进行监视,若判断风险异常存在,则进行风险预警并给出解决方案,辅助故障解决。
图3是趋性分析及辅助决策流程图,其具体实施案例如下:
磁盘越限风险:系统通过系统监视模块1获取异常特征:sca1-1服务器“/分区”使用率90%且持续增长。系统通过卷积神经网络开始分析与之相关的风险项,以磁盘分区占用率较高为信号输入,按照“神经元”知识指导的推理策略调动知识库在故障中的程序规则或设备状态搜索求得故障预测的结果:“/分区”磁盘占用率过高不及时处理会导致根分区空间占满,从而导致服务器运行日志和运行程序读写异常,造成服务器变慢,系统功能异常等不可预计故障风险。磁盘清理可分为两类,一类为确认可清除内容,一类为风险清除内容,确认可清除内容由“神经元”属性确定,可为操作系统日志、系统程序日志等,风险清除内容为暂无法确定归属,需人工干预方可确认,具体分析如下:
结合专家库分析,“/分区”具体使用情况可通过“du-sh/*”进行分析处理;
最终分析可清理内容包括“/var/log/spool/clientmqueue/*”、“/var/log/memory.log*”、等大文件,以及部分“/tmp/*”文件;
“/var/log/spool/clientmqueue/*”日志为操作系统消息邮件垃圾,“/var/log/memory.log*”日志为操作系统记录日志,可直接清理,前置清理方式为“ls|xargs rm*”,后者情况方式为“cat/dev/null>memory.log”
“/tmp/*”文件无法确定内容,系统给出风险提示,推送运维人员进行处理。

Claims (7)

1.一种基于调度控制系统故障辨识及趋性分析系统,其特征在于:包括系统监视模块(1)、专家库管理模块(2)、故障辨识及分析处理模块(3)、及风险趋势分析及智能辅助决策模块(4),系统监视模块(1)和专家库管理模块(2)均分别与故障辨识及分析处理模块(3)、及故障辨识及分析处理模块(4)连接;
所述系统监视模块(1),与调控系统(5)、二次安全防护系统(6)、调度数据网系统(7)连接,用于智能监测系统网络状态、服务器运行状态、业务运行状态、重要数据运行状态、业务关键指标状态、系统运行日志,并将监视内容和结果发送给与之相连的故障辨识及分析处理模块(3)、风险趋势分析及智能辅助决策模块(4),对于异常情况主动给出告警;
所述故障辨识及分析处理模块(3),用于通过利用系统监视模块(1)对调控系统(5)、二次安全防护系统(6)和调度数据网系统(7)的监视结果,在发现系统故障后结合专家库进行分析处理,若故障不符合异常特征,则继续进行监视,若确实发生故障,则智能进行故障处理;
所述风险趋势分析及智能辅助决策模块(4),用于通过系统监视模块(1)对调控系统(5)、二次安全防护系统(6)、调度数据网系统(7)进行监视,当发现系统存在风险异常,则通过风险趋势分析及智能辅助决策模块(4)结合专家库进行诊断分析,若风险异常不符合异常特征,则返回进行进行监视,若判断风险异常存在,则进行风险预警并给出解决方案,辅助故障解决。
2.如权利要求1所述的基于调度控制系统故障辨识及趋性分析系统,其特征在于:所述专家库管理模块(2)集知识发现与积累、知识发布于一体,提供完善的专家库管理支撑服务,同时作为故障辨识处理专家库系统,专家库涵盖大量框架化、程式化的故障处理案例并基于过程式知识表示法、知识模型表示法和面向对象知识表示法,通过采用继承和封装技术,减少系统故障分析过程的冗余性,快速建立故障处理的理论知识和知识运用的方法,将故障处理集框架化、程式化,将文本内容转化为机器可识别的操作步骤,便于系统检索、分析和直接执行,为人工智能提供训练样本,为调度自动化运维人员提供有效的帮助,其具体实现方式如下:
(1)导入框架化、机构化的故障处理集,形成知识库,供人工智能训练及故障处理;
(2)系统各运行程序运行逻辑及运行节点异常特征;
(3)将自主学习,自主辨别和处理的故障形成案例并入专家库;
(4)导入各系统使用手册和说明文档管理,并支持分类和检索。
3.如权利要求1所述的基于调度控制系统故障辨识及趋性分析系统,其特征在于:所述故障辨识及分析处理模块(3)采用人工神经网络ANN、人工智能技术进行故障辨识及智能分析处理,其具体的步骤如下:
首先,通过人工神经网络构建系统故障集原型,通过分析被诊断
系统各个组成设备和程序的属性,并用不同层次类来描述设备和程序对应的故障异常特征,即赋予“神经元”属性,并通过神经网络传导来实现描述整个系统故障情况下的动态行为,故障异常特征包括:设备异常特征、网络异常特征、异常告警特征、安防策略特征、接口程序特征、日志错误信息特征;所有异常特征用于神经元传递及触发故障机制。“神经元”属性即系统监视模块(1)所监视之应用状态属性、设备状态属性、网络状态属性,各属性之间的连接关系称之为“神经网络”;
其次,结合专家库管理模块(2)所提供的大量和充分的故障实例,形成故障诊断模型的训练样本集,运用DS学习算法对样本集进行训练,通过训练学习使系统实现知识的自我组织,自我学习能力,经学习后,在神经元及它们之间的有向权重连接中蕴涵了处理问题的知识;
最后,系统借助人工神经网络神经元属性,以及人工干预的方法,不断加强对人工智能的训练。
4.如权利要求1所述的基于调度控制系统故障辨识及趋性分析系统,其特征在于:所述风险趋势分析及智能辅助决策模块(4)具体实现方法如下:利用机器学习tree-bee和卷积神经网络算法,结合智能监视结果、故障辨识及多维分析过程,设置故障规则及对应解决方案,通过thought-->study-->way方式模拟人工思维及处理方式,利用智能监视内容,分析各系统运行数据以及故障前系统各项异常特征,根据系统发生故障,监视信息作为驱动输入,按照“神经元”知识指导的推理策略调动知识库在故障中的程序规则或设备状态搜索求得故障预测的结果,用附加动量因子对系统模型结构进行诊断,并改变动量因子的取值,并使用局部逼近的径向基函数实现的系统的故障预测,用“神经元”的属性及状态作为输入,可能的故障位置作为输出,当程序规则的条件部分与诊断输入信息相匹配,就将该规则作为可用规则放入候选队列中,再通过冲突消解,将其作为进一步推理的证据直至得到诊断结果,最终实现对风险的趋性分析;
趋性分析结果结合专家库各类故障模型,对于可能导致的的后果智能给出风险提示和解决方案。
5.一种基于调度控制系统故障辨识及趋性分析方法,其特征在于采用权利要求1-4中任一项所述系统进行,所述方法包括如下步骤:
步骤一、故障智能辨识与处理:通过利用系统监视模块(1)对调控系统(5)、二次安全防护系统(6)和调度数据网系统(7)的监视结果,在发现系统故障后结合专家库进行分析处理,若故障不符合异常特征,则继续进行监视,若确实发生故障,则智能进行故障处理;
步骤二、风险趋势分析及智能辅助决策:通过系统监视模块(1)对调控系统(5)、二次安全防护系统(6)、调度数据网系统(7)进行监视,当发现系统存在风险异常,则通过风险趋势分析及智能辅助决策模块(4)结合专家库进行诊断分析,若风险异常不符合异常特征,则返回进行进行监视,若判断风险异常存在,则进行风险预警并给出解决方案,辅助故障解决。
6.如权利要求5所述的基于调度控制系统故障辨识及趋性分析方法,其特征在于:所述步骤一具体为:
首先,通过人工神经网络构建系统故障集原型,通过分析被诊断系统各个组成设备和程序的属性,并用不同层次类来描述设备和程序对应的故障异常特征,即赋予“神经元”属性,并通过神经网络传导来实现描述整个系统故障情况下的动态行为,故障异常特征包括:设备异常特征、网络异常特征、异常告警特征、安防策略特征、接口程序特征、日志错误信息特征;所有异常特征用于神经元传递及触发故障机制。“神经元”属性即系统监视模块(1)所监视之应用状态属性、设备状态属性、网络状态属性,各属性之间的连接关系称之为“神经网络”;
其次,结合专家库管理模块(2)所提供的大量和充分的故障实例,形成故障诊断模型的训练样本集,运用DS学习算法对样本集进行训练,通过训练学习使系统实现知识的自我组织,自我学习能力,经学习后,在神经元及它们之间的有向权重连接中蕴涵了处理问题的知识;
最后,系统借助人工神经网络神经元属性,以及人工干预的方法,不断加强对人工智能的训练。
7.如权利要求5所述的基于调度控制系统故障辨识及趋性分析方法,其特征在于:所述步骤二具体为:
利用机器学习tree-bee和卷积神经网络算法,结合智能监视结果、故障辨识及多维分析过程,设置故障规则及对应解决方案,通过thought-->study-->way方式模拟人工思维及处理方式,利用智能监视内容,分析各系统运行数据以及故障前系统各项异常特征,根据系统发生故障,监视信息作为驱动输入,按照“神经元”知识指导的推理策略调动知识库在故障中的程序规则或设备状态搜索求得故障预测的结果,用附加动量因子对系统模型结构进行诊断,并改变动量因子的取值,并使用局部逼近的径向基函数实现的系统的故障预测,用“神经元”的属性及状态作为输入,可能的故障位置作为输出,当程序规则的条件部分与诊断输入信息相匹配,就将该规则作为可用规则放入候选队列中,再通过冲突消解,将其作为进一步推理的证据直至得到诊断结果,最终实现对风险的趋性分析;
趋性分析结果结合专家库各类故障模型,对于可能导致的的后果智能给出风险提示和解决方案。
CN201910940783.4A 2019-09-30 2019-09-30 基于调度控制系统故障辨识及趋性分析系统和方法 Active CN110717665B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910940783.4A CN110717665B (zh) 2019-09-30 2019-09-30 基于调度控制系统故障辨识及趋性分析系统和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910940783.4A CN110717665B (zh) 2019-09-30 2019-09-30 基于调度控制系统故障辨识及趋性分析系统和方法

Publications (2)

Publication Number Publication Date
CN110717665A CN110717665A (zh) 2020-01-21
CN110717665B true CN110717665B (zh) 2022-11-25

Family

ID=69212096

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910940783.4A Active CN110717665B (zh) 2019-09-30 2019-09-30 基于调度控制系统故障辨识及趋性分析系统和方法

Country Status (1)

Country Link
CN (1) CN110717665B (zh)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111314137A (zh) * 2020-02-18 2020-06-19 国家电网有限公司 信息通信网络自动化运维方法、装置、存储介质和处理器
CN111401731A (zh) * 2020-03-13 2020-07-10 贵州电网有限责任公司 一种基于人工智能学习的风险控制辅助决策方法及系统
CN111650921A (zh) * 2020-05-20 2020-09-11 国网江苏省电力有限公司泰州供电分公司 一种智能电网调控控制系统设备故障诊断方法及系统
CN111729211B (zh) * 2020-07-20 2022-04-08 中国科学院近代物理研究所 医用重离子治癌回旋加速器控制装置
CN111949501A (zh) * 2020-08-14 2020-11-17 中国工商银行股份有限公司 It系统运行风险监控方法及装置
CN112187514A (zh) * 2020-09-02 2021-01-05 上海御威通信科技有限公司 一种数据中心网络设备智能运维系统、方法及终端
CN112737829A (zh) * 2020-12-23 2021-04-30 大连理工大学人工智能大连研究院 一种挖掘装备故障诊断系统集成的方法及系统
CN112764852A (zh) * 2021-01-18 2021-05-07 深圳供电局有限公司 一种用于智能录波主站的运维安全监测方法、系统及计算机可读存储介质
CN112967556A (zh) * 2021-03-05 2021-06-15 浙江展杭自动化科技有限公司 一种带有工业人工智能的配电教学装置
CN113254061B (zh) * 2021-06-02 2021-11-09 深圳前海大道金融服务有限公司 基于规则引擎的业务决策方法、系统及存储介质
CN113592111A (zh) * 2021-07-30 2021-11-02 上海健康医学院 一种核电设备故障智能化处理方法及系统
CN113311715B (zh) * 2021-07-30 2021-12-07 中国人民解放军海军工程大学 一种复杂机电设备的故障辨识与溯源方法
CN113985814A (zh) * 2021-10-25 2022-01-28 东华大学 一种基于数字孪生的加工过程自适应控制方法
CN114422392B (zh) * 2021-12-17 2024-03-15 广西壮族自治区公众信息产业有限公司 一种智能风险监控系统及风险监控的方法
CN115618303B (zh) * 2022-11-10 2023-08-22 南京北泰电力科技有限公司 基于信息融合技术的调度自动化监测及故障定位系统
CN116155956B (zh) * 2023-04-18 2023-08-22 武汉森铂瑞科技有限公司 一种基于梯度决策树模型的多路复用通信方法及系统
CN116703284B (zh) * 2023-08-03 2023-10-17 八爪鱼人工智能科技(常熟)有限公司 应用于冷库管理系统的故障识别方法及人工智能服务器
CN116937575A (zh) * 2023-09-14 2023-10-24 济南高品伟业信息科技有限公司 一种网格系统用的能源监控管理系统
CN117458711A (zh) * 2023-10-26 2024-01-26 国网安徽省电力有限公司马鞍山供电公司 一种基于物联网的电网调度工作监测管理系统

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102243497B (zh) * 2011-07-25 2013-10-02 江苏吉美思物联网产业股份有限公司 用于工程机械的基于物联网技术的远程智能分析服务系统
CN103679293A (zh) * 2013-12-20 2014-03-26 长园深瑞继保自动化有限公司 智能变电站告警和辅助决策系统
CN108830457A (zh) * 2018-05-14 2018-11-16 国网辽宁省电力有限公司 基于人工智能的电网运行监视与控制全景管理系统

Also Published As

Publication number Publication date
CN110717665A (zh) 2020-01-21

Similar Documents

Publication Publication Date Title
CN110717665B (zh) 基于调度控制系统故障辨识及趋性分析系统和方法
EP3798846B1 (en) Operation and maintenance system and method
CN109800127A (zh) 一种基于机器学习的系统故障诊断智能化运维方法及系统
KR100976443B1 (ko) 홈네트워크 오류 예측 시스템 및 그 방법
CN108388950A (zh) 基于大数据的变压器智能运维方法及系统
CN113283704A (zh) 基于知识图谱的电网故障智能处置系统及方法
CN111047082A (zh) 设备的预警方法及装置、存储介质和电子装置
CN105337765A (zh) 一种分布式hadoop集群故障自动诊断修复系统
CN113542039A (zh) 一种通过ai算法定位5g网络虚拟化跨层问题的方法
CN111884347B (zh) 多源电力信息融合的电力数据集中控制系统
CN111431754A (zh) 配用电通信网故障分析方法和系统
CN109586239A (zh) 智能变电站实时诊断及故障预警方法
CN113052993A (zh) 一种基于告警信息联动的故障巡检方法及装置
CN115170344A (zh) 调控系统运行事件智能处理方法及装置、介质及设备
CN115809183A (zh) 基于知识图谱的信创终端故障发现及处置的方法
CN113283602A (zh) 基于离线知识学习和在线动态修正电网系统故障诊断方法
CN113421018A (zh) 通信网络维护方法及装置、电子设备、存储介质
CN115877198A (zh) 基于边缘计算的一二次融合开关故障诊断预警系统
CN111666978A (zh) 一种it系统运维大数据的智能故障预警系统
CN112803587A (zh) 一种基于诊断决策库的自动化设备状态智能巡视方法
US11596823B2 (en) Operating a fire control system
CN115208059A (zh) 一种变电站动力与环境监控告警处理系统及方法
CN114726708A (zh) 一种基于人工智能的网元设备故障预测方法及系统
CN114139747A (zh) 基于人工智能技术的AIOps智能运维系统
CN113076217A (zh) 基于国产平台的磁盘故障预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20200121

Assignee: Beijing Xijia Chuangzhi Data Technology Co.,Ltd.

Assignor: HUBEI CENTRAL CHINA TECHNOLOGY DEVELOPMENT OF ELECTRIC POWER Co.,Ltd.

Contract record no.: X2023980050666

Denomination of invention: Fault identification and convergence analysis system and method based on scheduling control system

Granted publication date: 20221125

License type: Common License

Record date: 20231208

EE01 Entry into force of recordation of patent licensing contract