CN112580961B - 基于电网信息系统运行风险预警方法及装置 - Google Patents
基于电网信息系统运行风险预警方法及装置 Download PDFInfo
- Publication number
- CN112580961B CN112580961B CN202011473224.6A CN202011473224A CN112580961B CN 112580961 B CN112580961 B CN 112580961B CN 202011473224 A CN202011473224 A CN 202011473224A CN 112580961 B CN112580961 B CN 112580961B
- Authority
- CN
- China
- Prior art keywords
- risk
- state
- power grid
- early warning
- information system
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
- G06Q50/06—Electricity, gas or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Abstract
本发明公开了一种基于电网信息系统运行风险预警方法,包括:获取电网信息系统预设时间多个时间节点下的运维数据;对电网信息系统正常运行状态下同一指标、相同时间节点下的数据进行线性回归分析,设置运维数据指标的阈值或阈值范围,根据阈值或阈值范围判断运维数据是否超出正常范围;对异常原因进行分析,判定运行风险类型;若检测指标存在风险状态,则判定故障等级,并进行预警。本发明还公开了一种基于电网信息系统运行风险预警装置。本发明通过对数据中心运行数据进行分析,挖掘系统运行风险,提升了边缘数据中心运维能力与效率;合理识别边缘运行风险,分级别递进预警运行风险确保无人值守时系统的准确执行。
Description
技术领域
本发明涉及电力系统技术领域,特别涉及一种基于电网信息系统运行风险预警方法及装置。
背景技术
电网信息系统对众多行业有着重要的影响,因此,对于电网信息系统的运维工作十分重要。边缘数据中心的设备规模比较小,有些甚至是微型的,当集群化后,电网信息系统的运行维护工作变得非常复杂,不利于边缘数据中心集群效能的发挥,其运维复杂原因主要有两个:一是运维人员的配置没有达到大型数据中心的规模,使得运维效率较低;二是非现场监控时很难掌握边缘数据中心运行风险实际情况,使得调度人员到现场处理时的维护针对性较差。所以,边缘数据中心运行风险预警是发挥边缘计算整体效能的重要措施之一,通过对边缘站点运行数据进行分析,提升边缘数据中心运维的能力与效率。
现有技术中对电网信息系统运行状态的风险预警多数是建立在对电网运行数据的采样分析和特征提取的基础上,结合大数据信息加工和信息处理技术,提取反应电网信息系统运行工况的特征参量,采用特征聚类分析方法来进行风险预测和判断,但该方法忽略了同一时间节点下数据之间的联系,以及信息系统故障状态和非故障状态之间的联系,减小预测结果的准确性。
发明内容
发明目的:针对以上问题,本发明目的是提供一种基于电网信息系统运行风险预警方法及装置。
技术方案:本发明所述的一种基于电网信息系统运行风险预警方法,包括如下步骤:
步骤一:获取电网信息系统预设时间多个时间节点下的运维数据;
步骤二:对电网信息系统正常运行状态下同一指标、相同时间节点下的数据进行线性回归分析,设置该运维数据指标的阈值或阈值范围,根据阈值或阈值范围判断运维数据是否超出正常范围,若超出则进入步骤三;
步骤三:对异常原因进行分析,判定运行风险类型,进行预警;
步骤四:若检测指标存在风险状态,则判定故障等级,并进行预警。
所述步骤一中每个时间节点之间的时间间隔相同。
所述步骤一运维数据至少包括以下一种:CPU、内存、存储利用率、I/O带宽、网络延时、带宽、服务器温度、风扇转数、环境温度、湿度。
所述步骤二中采用的是一元线性回归方程,并将方程取值范围作为阈值或阈值范围。
所述步骤三运行风险类型包括异常状态、隐患状态、风险状态以及故障状态。
进一步,所述运行风险类型评判标准为:
由可知原因造成系统运行异常,则判定为异常状态;
由不可知原因造成系统运行异常,则判定为隐患状态;
若被判定为隐患状态后,运维数据与阈值或阈值范围之间差距呈现增加趋势,则将隐患状态升级为风险状态;
若对系统运行造成影响,则判定为故障状态。
进一步,所述可知原因包括:人为因素,如业务人员处理临时操作;软件运行异常,是指在无人员干预的情况下,软件自身运行状态出现异常。
进一步,所述不可知原因是指硬件运行异常,包括磁盘异常、内存异常、进程僵死、队列堵塞。
所述步骤四故障等级分为低、中、高三级。
进一步,所述故障等级判定依据是根据被标注为风险状态的指标与关键业务指标之间的相关度,若相关度高则故障等级为高,相关度中则故障等级为中,相关度低则故障等级为低。
进一步,所述关键业务指标是指与业务最直接关系的业务指标,如活跃用户数和响应时间。
进一步,所述相关度计算公式为
式中Cov(Dr,Ds)表示被标注为风险状态的指标序列和关键业务指标序列的协方差,用来计算两个变量的总体误差;D(Dr)表示被标注为风险状态的指标序列的方差;D(Ds)表示关键业务指标序列的方差。
进一步,相关系数R用来评判相关度的等级,若R∈[0,0.3),则相关度为低;若R∈[0.3,0.7],则相关度为中;若R∈9(0.7,1],则相关度为高。
本发明所述的一种基于电网信息系统运行风险预警装置,包括:
采集模块,获取电网信息系统预设时间多个时间节点下的运维数据,并发送给数据分析模块;
数据分析模块,对电网信息系统正常运行状态下同一指标、相同时间节点下的数据进行线性回归分析,设置运维数据指标的阈值或阈值范围,根据阈值或阈值范围判断运维数据是否超出正常范围,若超出则将结果发送给风险判定模块;
风险判定模块,对异常原因进行分析,判定运行风险类型,进行预警;
故障判定模块,若风险判定模块检测的指标存在风险状态,则判定故障等级,并进行预警。
进一步,所述风险类型包括异常状态、隐患状态、风险状态以及故障状态。
进一步,所述运行风险类型评判标准为:
由可知原因造成系统运行异常,则判定为异常状态;
由不可知原因造成系统运行异常,则判定为隐患状态;
若被判定为隐患状态后,运维数据与阈值或阈值范围之间差距呈现增加趋势,则将隐患状态升级为风险状态;
若对系统运行造成影响,则判定为故障状态。
进一步,所述故障等级分为低、中、高三级,故障等级判定依据是根据被标注为风险状态的指标与关键业务指标之间的相关度,若相关度高则故障等级为高,相关度中则故障等级为中,相关度低则故障等级为低。
进一步,利用相关系数R用来评判相关度的等级,若R∈[0,0.3),则相关度为低;若R∈[0.3,0.7],则相关度为中;若R∈9(0.7,1],则相关度为高。
有益效果:本发明与现有技术相比,其显著优点是:
1、本发明通过对数据中心运行数据进行分析,挖掘系统运行风险,提升了边缘数据中心运维能力与效率,并且针对边缘数据中心提出四种不同运行风险状态;
2、在保障数据中心稳定运行的同时,合理识别边缘运行风险,分级别递进预警运行风险,明确故障预警方法的差异,确保无人值守时系统的准确执行;
3、考虑了同一时间节点下数据之间联系,以及信息系统故障状态和非故障状态之间的联系,提高预警准确性;
4、精准投放现场运维力量,让现场检修更有针对性。
附图说明
图1为本发明预警方法流程图;
图2为本实施例中业务在线用户数指标和从异常升级至风险状态指标曲线。
具体实施方式
参见图1流程图,本实施例所述的基于电网信息系统运行风险预警方法,包括如下步骤:
步骤一:获取电网信息系统预设时间多个时间节点下的运维数据;
其中每个时间节点之间的时间间隔相同,时间节点平均分布于预设的时间期间内的。当预设的时间期间为10个连续的自然日,在时间期间内每10秒采集相应的运维数据,则每个自然日有8640个运维数据采集点。运维数据包括:CPU、内存、存储利用率、I/O带宽、网络延时、带宽、服务器温度、风扇转数、环境温度、湿度。
步骤二:对电网信息系统正常运行状态下同一指标、相同时间节点下的数据利用一元线性回归方程进行分析,并将线性方程的取值范围作为该运维数据指标的阈值或阈值范围,根据阈值或阈值范围判断运维数据是否超出正常范围,若超出则进入步骤三;
步骤三:对异常原因进行分析,判定运行风险类型,并进行预警;
运行风险类型包括异常状态、隐患状态、风险状态以及故障状态。
运行风险类型评判标准为:由可知原因造成系统运行异常,则判定为异常状态;由不可知原因造成系统运行异常,则判定为隐患状态;若被判定为隐患状态后,运维数据与标准阈值之间差距呈现增加趋势,则将隐患状态升级为风险状态;若对系统运行造成影响,则判定为故障状态。
可知原因包括:人为因素,如业务人员处理临时操作;软件运行异常,是指在无人员干预的情况下,软件自身运行状态出现异常。不可知原因是指硬件运行异常,包括磁盘异常、内存异常、进程僵死、队列堵塞。
步骤四:若检测指标存在风险状态,则判定故障等级,并进行预警。
故障等级分为低、中、高三级。故障等级判定依据是根据被标注为风险状态的指标与关键业务指标之间的相关度,若相关度高则故障等级为高,相关度中则故障等级为中,相关度低则故障等级为低。
关键业务指标是指与业务最直接关系的业务指标,如活跃用户数和响应时间。
相关度计算公式为
式中Cov(Dr,Ds)表示被标注为风险状态的指标序列和关键业务指标序列的协方差,用来计算两个变量的总体误差;D(Dr)表示被标注为风险状态的指标序列的方差;D(Ds)表示关键业务指标序列的方差。
相关系数R用来评判相关度的等级,若R∈[0,0.3),则相关度为低;若R∈[0.3,0.7],则相关度为中;若R∈9(0.7,1],则相关度为高。
利用本发明的方法对某社区的边缘数据中心运行风险进行预警分析,根据预设的阈值进行分析,发现了一个经常发生的异常状态,持续升级至风险预警后,进行故障判断,如图2所示,选取业务在线用户数指标和从异常升级至风险状态的指标曲线,参照相关度计算公式进行相关性计算,得到相关系数R值为0.81,则判定故障级别为高,表示业务故障随时会发生。
因此,判断此边缘站点的业务存在发生高风险的异常,随时会影响关键业务指标,根据预测结果安排运维工作人员赶赴现场将相关运行业务的节点进行迁移切换,将发现异常的节点设备进行重新启动,避免系统运行过程中故障的发生,进而保障系统运行的稳定性。
本实施例所述的一种基于电网信息系统运行风险预警装置,包括:
采集模块,获取电网信息系统预设时间多个时间节点下的运维数据,并发送给数据分析模块;
数据分析模块,对电网信息系统正常运行状态下同一指标、相同时间节点下的数据进行线性回归分析,设置运维数据指标的阈值或阈值范围,根据阈值或阈值范围判断运维数据是否超出正常范围,若超出则将结果发送给风险判定模块;
风险判定模块,对异常原因进行分析,判定运行风险类型,进行预警;
故障判定模块,若风险判定模块检测的指标存在风险状态,则判定故障等级,并进行预警。
其中风险类型包括异常状态、隐患状态、风险状态以及故障状态。
运行风险类型评判标准为:
由可知原因造成系统运行异常,则判定为异常状态;
由不可知原因造成系统运行异常,则判定为隐患状态;
若被判定为隐患状态后,运维数据与阈值或阈值范围之间差距呈现增加趋势,则将隐患状态升级为风险状态;
若对系统运行造成影响,则判定为故障状态。
故障等级分为低、中、高三级,故障等级判定依据是根据被标注为风险状态的指标与关键业务指标之间的相关度,若相关度高则故障等级为高,相关度中则故障等级为中,相关度低则故障等级为低。利用相关系数R用来评判相关度的等级,若R∈[0,0.3),则相关度为低;若R∈[0.3,0.7],则相关度为中;若R∈9(0.7,1],则相关度为高。
Claims (11)
1.一种基于电网信息系统运行风险预警方法,其特征在于,包括如下步骤:
步骤一:获取电网信息系统预设时间多个时间节点下的运维数据;
步骤二:对电网信息系统正常运行状态下同一指标、相同时间节点下的数据进行线性回归分析,设置运维数据指标的阈值或阈值范围,根据阈值或阈值范围判断运维数据是否超出正常范围,若超出则进入步骤三;
步骤三:对异常原因进行分析,判定运行风险类型,进行预警;
步骤四:若指标存在风险状态,则判定故障等级,并进行预警;
所述步骤三运行风险类型包括异常状态、隐患状态、风险状态以及故障状态;
所述步骤二采用的是一元线性回归方程,将方程取值范围作为阈值或阈值范围。
2.根据权利要求1所述的基于电网信息系统运行风险预警方法,其特征在于,所述运行风险类型评判标准为:
由可知原因造成系统运行异常,则判定为异常状态;
由不可知原因造成系统运行异常,则判定为隐患状态;
若被判定为隐患状态后,运维数据与阈值或阈值范围之间差距呈现增加趋势,则将隐患状态升级为风险状态;
若对系统运行造成影响,则判定为故障状态。
3.根据权利要求2所述的基于电网信息系统运行风险预警方法,其特征在于,所述可知原因包括:人为因素,包括业务人员处理临时操作;软件运行异常,是指在无人员干预的情况下,软件自身运行状态出现异常;
所述不可知原因是指硬件运行异常,包括磁盘异常、内存异常、进程僵死、队列堵塞。
4.根据权利要求1所述的基于电网信息系统运行风险预警方法,其特征在于,所述步骤四故障等级分为低、中、高三级,所述故障等级判定依据是根据被标注为风险状态的指标与关键业务指标之间的相关度,若相关度高则故障等级为高,相关度中则故障等级为中,相关度低则故障等级为低。
5.根据权利要求4所述的基于电网信息系统运行风险预警方法,其特征在于,利用相关系数R用来评判相关度的等级,若R∈[0,0.3),则相关度为低;若R∈[0.3,0.7],则相关度为中;若R∈(0.7,1],则相关度为高。
6.根据权利要求1所述的基于电网信息系统运行风险预警方法,其特征在于,所述步骤一中每个时间节点之间的时间间隔相同。
7.根据权利要求1所述的基于电网信息系统运行风险预警方法,其特征在于,所述步骤一运维数据包括CPU、内存、存储利用率、I/O带宽、网络延时、带宽、服务器温度、风扇转数、环境温度、湿度。
8.一种基于电网信息系统运行风险预警装置,其特征在于,包括:
采集模块,获取电网信息系统预设时间多个时间节点下的运维数据,并发送给数据分析模块;
数据分析模块,对电网信息系统正常运行状态下同一指标、相同时间节点下的数据进行线性回归分析,设置运维数据指标的阈值或阈值范围,根据阈值或阈值范围判断运维数据是否超出正常范围,若超出则将结果发送给风险判定模块;
风险判定模块,对异常原因进行分析,判定运行风险类型,进行预警;
故障判定模块,若风险判定模块检测的指标存在风险状态,则判定故障等级,并进行预警;
所述风险类型包括异常状态、隐患状态、风险状态以及故障状态;
所述数据分析模块采用的是一元线性回归方程,将方程取值范围作为阈值或阈值范围。
9.根据权利要求8所述的基于电网信息系统运行风险预警装置,其特征在于,所述运行风险类型评判标准为:
由可知原因造成系统运行异常,则判定为异常状态;
由不可知原因造成系统运行异常,则判定为隐患状态;
若被判定为隐患状态后,运维数据与阈值或阈值范围之间差距呈现增加趋势,则将隐患状态升级为风险状态;
若对系统运行造成影响,则判定为故障状态。
10.根据权利要求8所述的基于电网信息系统运行风险预警装置,其特征在于,所述故障等级分为低、中、高三级,故障等级判定依据是根据被标注为风险状态的指标与关键业务指标之间的相关度,若相关度高则故障等级为高,相关度中则故障等级为中,相关度低则故障等级为低。
11.根据权利要求10所述的基于电网信息系统运行风险预警装置,其特征在于,利用相关系数R用来评判相关度的等级,若R∈[0,0.3),则相关度为低;若R∈[0.3,0.7],则相关度为中;若R∈(0.7,1],则相关度为高。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011473224.6A CN112580961B (zh) | 2020-12-15 | 2020-12-15 | 基于电网信息系统运行风险预警方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011473224.6A CN112580961B (zh) | 2020-12-15 | 2020-12-15 | 基于电网信息系统运行风险预警方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112580961A CN112580961A (zh) | 2021-03-30 |
CN112580961B true CN112580961B (zh) | 2022-09-09 |
Family
ID=75134888
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011473224.6A Active CN112580961B (zh) | 2020-12-15 | 2020-12-15 | 基于电网信息系统运行风险预警方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112580961B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113705854A (zh) * | 2021-07-13 | 2021-11-26 | 上海烟草集团有限责任公司 | 风机电流异常监测预警方法 |
CN113934795A (zh) * | 2021-10-19 | 2022-01-14 | 国网山东省电力公司平邑县供电公司 | 一种基于分布式管理的电网预警系统 |
CN114137421B (zh) * | 2021-11-30 | 2023-09-19 | 章鱼博士智能技术(上海)有限公司 | 电池异常检测方法、装置、设备及存储介质 |
CN114677037B (zh) * | 2022-04-12 | 2022-10-18 | 淮北工科检测检验有限公司 | 一种基于数据处理的电力设施运行质量检测系统 |
CN114466393B (zh) * | 2022-04-13 | 2022-07-12 | 深圳市永达电子信息股份有限公司 | 轨道交通车地通信潜在风险监测方法和系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105354614A (zh) * | 2015-10-21 | 2016-02-24 | 国家电网公司 | 一种基于大数据的电网信息运维主动预警方法 |
CN110245053A (zh) * | 2019-06-20 | 2019-09-17 | 中国工商银行股份有限公司 | 故障预测诊断方法及系统 |
-
2020
- 2020-12-15 CN CN202011473224.6A patent/CN112580961B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105354614A (zh) * | 2015-10-21 | 2016-02-24 | 国家电网公司 | 一种基于大数据的电网信息运维主动预警方法 |
CN110245053A (zh) * | 2019-06-20 | 2019-09-17 | 中国工商银行股份有限公司 | 故障预测诊断方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN112580961A (zh) | 2021-03-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112580961B (zh) | 基于电网信息系统运行风险预警方法及装置 | |
CN108415789B (zh) | 面向大规模混合异构存储系统的节点故障预测系统及方法 | |
CN109977535B (zh) | 一种线损异常诊断方法、装置、设备及可读存储介质 | |
US7693982B2 (en) | Automated diagnosis and forecasting of service level objective states | |
US20230384355A1 (en) | Non-intrusive load monitoring method | |
CN111459700A (zh) | 设备故障的诊断方法、诊断装置、诊断设备及存储介质 | |
CN111353911A (zh) | 电力设备运维方法、系统、设备和存储介质 | |
CN112799898B (zh) | 基于分布式故障检测的互联系统故障节点定位方法及系统 | |
WO2018184304A1 (zh) | 一种网元健康状态的检测方法及设备 | |
CN104221475A (zh) | 用于照明控制的光传感器的故障检测、定位及性能监控 | |
US9235463B2 (en) | Device and method for fault management of smart device | |
CN104574219A (zh) | 电网业务信息系统运行工况的监测预警方法及系统 | |
CN110569876A (zh) | 非侵入式负荷识别方法、装置及计算设备 | |
CN109491339B (zh) | 一种基于大数据的变电站设备运行状态预警系统 | |
Gao et al. | Modeling probabilistic measurement correlations for problem determination in large-scale distributed systems | |
CN111984442A (zh) | 计算机集群系统的异常检测方法及装置、存储介质 | |
CN115858303B (zh) | 一种基于Zabbix的服务器性能监控方法及系统 | |
CN115865649A (zh) | 一种智能运维管理控制方法、系统和存储介质 | |
CN111309502A (zh) | 固态硬盘寿命预测方法 | |
CN114781476A (zh) | 一种量测设备故障分析系统和方法 | |
CN112882898B (zh) | 基于大数据日志分析的异常检测方法、系统、设备及介质 | |
CN102761429B (zh) | 一种异常话单处理方法与系统 | |
CN115114124A (zh) | 主机风险的评估方法及评估装置 | |
CN116307886A (zh) | 一种企业生产状态的实时监测方法及装置 | |
CN101923605B (zh) | 铁路防灾风预警方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |