CN111950853A - 一种基于信息物理双侧数据的电力运行状态白名单生成方法 - Google Patents

一种基于信息物理双侧数据的电力运行状态白名单生成方法 Download PDF

Info

Publication number
CN111950853A
CN111950853A CN202010674120.5A CN202010674120A CN111950853A CN 111950853 A CN111950853 A CN 111950853A CN 202010674120 A CN202010674120 A CN 202010674120A CN 111950853 A CN111950853 A CN 111950853A
Authority
CN
China
Prior art keywords
data
forest
white list
physical
weight
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010674120.5A
Other languages
English (en)
Other versions
CN111950853B (zh
Inventor
王�琦
蔡星浦
汤奕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southeast University
Original Assignee
Southeast University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southeast University filed Critical Southeast University
Priority to CN202010674120.5A priority Critical patent/CN111950853B/zh
Priority claimed from CN202010674120.5A external-priority patent/CN111950853B/zh
Publication of CN111950853A publication Critical patent/CN111950853A/zh
Application granted granted Critical
Publication of CN111950853B publication Critical patent/CN111950853B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Evolutionary Computation (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • General Engineering & Computer Science (AREA)
  • Marketing (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Water Supply & Treatment (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • General Health & Medical Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • Supply And Distribution Of Alternating Current (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于信息物理双侧数据的电力运行状态白名单生成方法,属于计算、推算或计数的技术领域。主要包含离线仿真提取各类事件数据,数据预处理,特征学习,最终训练得到白名单模型。基于硬件在环的信息物理联合实时仿真系统,对确定系统在确定运行方式下的各种可能正常事件、故障事件和网络攻击行为进行仿真,获取事件状态信息侧和物理侧变化数据。将双侧数据共同输入改进孤立森林的模型中进行训练。该方法可帮助电网在稳态运行时,有效辨识故障类型其确定其为网络攻击行为的可能,有助于电网制定预先防御措施,保障电力系统安全稳定运行。

Description

一种基于信息物理双侧数据的电力运行状态白名单生成方法
技术领域
本发明涉及电力系统网络安全技术,具体涉及一种基于信息物理双侧数据的电力运行状态白名单生成方法,属于计算、推算或计数的技术领域。
背景技术
随着通信技术的快速发展,电力系统逐渐成为一个信息物理系统(CPS,Cyber-Physical Systems)。信息技术使电网侧控制日趋智能化的同时也带来了新的网络攻击风险。目前,电力系统对网络攻击的检测仅限于信息侧且方法局限于基于既定规则的异常风险排除,对于针对物理侧工程故障的攻击类型具有较大的漏检风险。由于电力系统中信息与物理系统的深度耦合特性,双侧的行为往往存在隐性的关联。本发明旨在从信息侧和物理侧数据中挖掘异常状态构建更准确的白名单模型。
发明内容
本发明的发明目的是针对上述背景技术的不足,提供了一种基于信息物理双侧数据的电力运行状态白名单生成方法,通过错误类型反馈缩小孤立森林算法中最优权值参数的搜索空间实现白名单模型的有向优化,进而提高了异常事件的识别率,解决了基于既定规则的异常风险排除方法检测物理侧工程故障的攻击类型时有较大漏检风险的技术问题。
本发明为实现上述发明目的采用如下技术方案:
一种基于信息物理双侧数据的电力运行状态白名单生成方法,包括以下三个步骤。
步骤一,基于仿真平台,通过随机改变系统的状态,模拟可能发生的各种事件,采集稳态下的系统信息侧和物理侧双侧的数据m组,一次仿真对应一组数据。
步骤二,将m组数据中N组正常事件下的采集数据作为训练样本,,输入至动态权值孤立森林算法中进行学习;剩余的(m-N)组数据作为验证样本,验证模型的效果。通过调整机器学习的各项参数,获得的较优的模型作为白名单模型;动态权值孤立森林算法包括如下两个分步骤:
步骤1)从总数为N的训练数据集每次均匀抽样(有放回)ψ条数据,采用现有孤立森林算法构建隔离L棵树;确定子森林的集成规模,在L棵隔离树中系统抽样构建主森林检测器;
步骤2)根据错误学习样本反馈修正模型:若将异常样本判断为正常,则减小路径偏短的树(对该样本适应度较低)在总期望值中的权值,增加路径较长的树的权值,如式(1)所示;反之,则优化方向相反,
Figure BDA0002583444090000021
式(1)中,hi(x)代表样本x在第i个子森林中的平均路径长度;c(n)代表L棵孤立树的平均路径长度;U,V分别代表优化前后子森林权值的变化量集合。
步骤三:将新发生事件下采集的数据输入至训练好的白名单模型,白名单模型输出判断新事件为正常事件还是异常事件的结果。
本发明采用上述技术方案,具有以下有益效果:
本发明的故障辨识方法通过在联合仿真平台仿真已知的可能发生在线路上的各种事件的数据,相对于实际系统中较少发生的攻击场景,可以通过仿真获得大量数据;针对目前单纯依靠信息单侧数据的异常辨识方法,提出了综合信息侧和物理侧数据的事件采集数据来描述事故过程。为了获得更快的计算速度,更高的辨识精度,结合机器学习的方法进行训练,通过错误类型反馈缩小集成孤立森林算法最优权值参数的搜索空间,实现了模型的有向优化,进而能够实现基事件类型的准确识别。本发明方法主要有以下优点:
(1)由于电力CPS信息物理的深度耦合,信息侧的行为、状态和物理侧的工况通常存在某种关联,因此基于双侧信息可以更有效的挖掘电力CPS事件特征,有助于异常行为的判断。
(2)双侧协同的攻击感知可以结合物理侧的工况对攻击行为的危害程度作出更恰当的判断,有助于后续防御资源、防御手段的分配。
附图说明
图1为本申请电力运行状态白名单生成方法的流程图。
图2为硬件在环的信息物理联合实时仿真平台的通讯架构图。
图3为构建动态权值孤立森林的流程图。
图4为IEEE 14节点的系统图。
图5为IEEE 14节点的通信拓扑图。
具体实施方式
下面结合附图对发明的技术方案进行详细说明。
以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
本发明为一种基于信息物理双侧数据的电力运行状态白名单生成方法,主要包含离线仿真提取各类事件数据,数据预处理,特征学习,最终训练得到白名单模型。基于硬件在环的信息物理联合实时仿真系统,对确定系统在确定运行方式下的各种可能正常事件、故障事件和网络攻击行为进行仿真,获取事件状态信息侧和物理侧变化数据。将双侧数据共同输入改进孤立森林的模型中进行训练。
具体实施步骤如图1所示,一种基于信息物理双侧数据的电力运行状态白名单生成方法包括如下三个步骤。
步骤一,基于仿真平台,通过随机改变系统的状态,模拟可能发生的各种事件,采集稳态下的系统信息侧和物理侧双侧的数据m组,一次仿真对应一组数据。
信息侧信息包括:所有信息链路流量、传输数据量、链路利用率、信息节点CPU使用率。物理侧信息包括:各个节点的电量测值压、线路的潮流数据。
正常事件包括:不同负荷情况下系统的正常稳态运行状态;各类正常电力系统业务的指令传输和通信行为。异常事件包括:针对不同信息节点的DDoS攻击事件;针对不同通信链路的DDoS。
可采用的仿真平台例如硬件在环的信息物理仿真平台如图2所示。用OPAL-RT仿真物理侧过程,OPNET仿真通信过程,C语言开发的控制中心模拟收发数据、处理数据和下达控制指令过程。
步骤二,将m组数据中的正常事件下采集的数据作为训练样本,共N组,输入动态权值孤立森林算法中进行学习;剩余部分(m-N)作为验证样本,验证模型的效果。通过调整机器学习的各项参数获得较优的模型,作为白名单模型。
动态权值孤立森林的整体流程如图3所示,包括两个分步骤:
步骤1)从总数为N的训练数据集每次均匀抽样(有放回)ψ条数据,采用现有孤立森林算法构建L棵隔离树,,在L棵隔离树中系统抽样构建主森林检测器以确定子森林的集成规模;
步骤2)根据错误学习样本反馈修正模型:若将异常样本判断为正常,则减小路径偏短的树(对该样本适应度较低)在总期望值中的权值,增加路径较长的树的权值,如式(1)所示;反之,则优化方向相反。
Figure BDA0002583444090000041
式(1)中,AUC代表系统工作特征曲线面积,用于量化模型检测异常事件的性能;hi(x)代表样本x在第i个子森林中的平均路径长度;c(n)代表第n次迭代过程中L棵孤立树的平均路径长度;F(i)、F'(i)为优化前后第i个子森林的权值;U、V分别代表优化前后子森林权值的变化量集合;ui、vi为优化前后第i个子森林权值的变化量。
具体算法如下所示:
Figure BDA0002583444090000042
步骤三:新事件数据输入时,通过白名单模型输出的结果,判断事件为正常事件还是异常事件。
本实施例通过联合仿真平台,以图4所示IEEE 14节点电力拓扑和图5所示通信拓扑为例,通过随机改变负荷情况和通信事件(延时、误码),采集不同场景下的数据,通过RT-LAB收集包括节点电压、线路潮流的电力物理侧量测量,,通过OPNET记录信息侧信息。
白名单选取了不同工况下的双侧运行数据,信息侧数据目前包括信息链路流量、传输数据量、链路利用率、进程CPU占用率,对于16条链路和14个节点,共62维数据;物理侧数据包括各个节点的电压,线路的潮流,共34维。白名单数据共450组。
每个样本随机采四个时刻,间隔为1秒的双侧数据,正常事件450组,异常事件50组。
在评估异常检测算法的性能时常用受试者工作特征曲线(receiver operatingcharacteristic curve,ROC曲线)描述。有效的异常检测方法需要保持较高的查全率和查准率,这两者之间的均衡可以用ROC曲线来描述。在算法评估时,通常需要一个量化的指标来衡量异常检测的性能,可以用ROC曲线下的面积(area under curve,AUC)来量化。AUC越接近于1,表示异常检测算法在查全率和查准率综合性能上表现越好。选取500组数据中30%(150组正常数据)作为训练数据,70%(350组其余数据)作为验证数据。
表1集成规模和样本点数对AUC值的影响
Figure BDA0002583444090000051
由结果可知,对于此数据集,选取集成规模为50,样本点数为128时算法的AUC值较高,性能较好,在该点下,孤立森林的查全率和查准率分别为:
表2性能指标
Figure BDA0002583444090000052
故以此两个参数进行后续的动态权值优化,改进后的模型准确率如表3所示。
表3动态权值优化前后性能对比
Figure BDA0002583444090000061
以上所述仅是本发明的优选实施方式,应当指出:对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也落入本发明的保护范围。

Claims (5)

1.一种基于信息物理双侧数据的电力运行状态白名单生成方法,其特征在于,获取系统运行在随机状态下发生各种事件后物理侧数据和信息侧数据,将每一次事件下采集的物理侧数据和信息侧数据作为一组数据,将正常事件下采集的各组数据送入基于动态权值孤立森林算法的学习机训练,将剩余的各组数据作为验证样本送入学习机,得到微调参数后的白名单模型,将新发生事件下采集ID数据输入白名单模型得到异常事件判别结果,
其中,所述动态权值孤立森立算法从输入的数据中均匀抽样后构建隔离树,在隔离树中系统抽样构建包含至少一个子森林的主森林检测器,以系统工作特征曲线面积最大为目标,根据主森林检测器识别输入数据的错误类型调整各子森林权值参数的搜索空间。
2.根据权利要求1所述一种基于信息物理双侧数据的电力运行状态白名单生成方法,其特征在于,根据主森林检测器识别输入数据的错误类型调整各子森林权值参数的搜索空间的方法为:若主森林检测器将异常事件判断为正常事件,则减小路径偏短的隔离树在总期望值中的权值,并增加路径较长的隔离树在总期望值中的权值;反之,增加路径偏短的隔离树在总期望值中的权值,并减小路径较长的隔离树在总期望值中的权值。
3.根据权利要求1所述一种基于信息物理双侧数据的电力运行状态白名单生成方法,其特征在于,以系统工作特征曲线面积最大为目标,根据主森林检测器识别输入数据的错误类型调整各子森林权值参数的搜索空间的表达式为:
Figure RE-FDA0002654937100000011
AUC代表系统工作特征曲线面积;hi(x)代表样本x在第i个子森林中的平均路径长度,c(n)代表第n次迭代过程中L棵孤立树的平均路径长度,F(i)、F'(i)为优化前后第i个子森林的权值,U、V分别代表优化前后子森林权值的变化量集合,ui、vi为优化前后第i个子森林权值的变化量。
4.根据权利要求1所述一种基于信息物理双侧数据的电力运行状态白名单生成方法,所述动态权值孤立森立算法从输入的数据中进行有放回的均匀抽样构建隔离树。
5.根据权利要求1所述一种基于信息物理双侧数据的电力运行状态白名单生成方法,其特征在于,在隔离树中进行无放回的系统抽样构建包含至少一个子森林的主森林检测器。
CN202010674120.5A 2020-07-14 一种基于信息物理双侧数据的电力运行状态白名单生成方法 Active CN111950853B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010674120.5A CN111950853B (zh) 2020-07-14 一种基于信息物理双侧数据的电力运行状态白名单生成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010674120.5A CN111950853B (zh) 2020-07-14 一种基于信息物理双侧数据的电力运行状态白名单生成方法

Publications (2)

Publication Number Publication Date
CN111950853A true CN111950853A (zh) 2020-11-17
CN111950853B CN111950853B (zh) 2024-05-31

Family

ID=

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114282855A (zh) * 2022-03-07 2022-04-05 四川大学 负荷重分配攻击下电-气耦合系统的综合防护方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108776683A (zh) * 2018-06-01 2018-11-09 广东电网有限责任公司 一种基于孤立森林算法和神经网络的电力运维数据清洗方法
CN110149258A (zh) * 2019-04-12 2019-08-20 北京航空航天大学 一种基于孤立森林的汽车can总线网络数据异常检测方法
WO2020010701A1 (zh) * 2018-07-11 2020-01-16 平安科技(深圳)有限公司 污染物异常监测方法、系统、计算机设备和存储介质
CN111382842A (zh) * 2020-03-06 2020-07-07 佳源科技有限公司 一种高速载波通信动态路由方法及系统
WO2020140678A1 (zh) * 2019-01-04 2020-07-09 深圳壹账通智能科技有限公司 异常申请检测方法、装置、计算机设备和存储介质
CN111401749A (zh) * 2020-03-17 2020-07-10 三峡大学 一种基于随机森林与极限学习回归的动态安全评估方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108776683A (zh) * 2018-06-01 2018-11-09 广东电网有限责任公司 一种基于孤立森林算法和神经网络的电力运维数据清洗方法
WO2020010701A1 (zh) * 2018-07-11 2020-01-16 平安科技(深圳)有限公司 污染物异常监测方法、系统、计算机设备和存储介质
WO2020140678A1 (zh) * 2019-01-04 2020-07-09 深圳壹账通智能科技有限公司 异常申请检测方法、装置、计算机设备和存储介质
CN110149258A (zh) * 2019-04-12 2019-08-20 北京航空航天大学 一种基于孤立森林的汽车can总线网络数据异常检测方法
CN111382842A (zh) * 2020-03-06 2020-07-07 佳源科技有限公司 一种高速载波通信动态路由方法及系统
CN111401749A (zh) * 2020-03-17 2020-07-10 三峡大学 一种基于随机森林与极限学习回归的动态安全评估方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
李星南;施展;亢中苗;苏卓;: "基于孤立森林算法和BP神经网络算法的电力运维数据清洗方法", 电气应用, no. 16, 20 August 2018 (2018-08-20) *
王耀坤;赵煜;梁英;刘科研;叶学顺;白牧可;: "基于信息物理系统的配电网故障处理仿真研究", 智慧电力, no. 12, 20 December 2019 (2019-12-20) *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114282855A (zh) * 2022-03-07 2022-04-05 四川大学 负荷重分配攻击下电-气耦合系统的综合防护方法

Similar Documents

Publication Publication Date Title
CN110348615B (zh) 基于蚁群优化支持向量机的电缆线路故障概率预测方法
CN105406476B (zh) 基于历史数据的电力系统稳定性快速判断方法
CN109217296B (zh) 一种基于加权潮流熵和电压稳定的电网关键节点辨识方法
CN109446635A (zh) 一种基于机器学习的电力工控攻击分类方法和系统
CN107872457B (zh) 一种基于网络流量预测进行网络操作的方法及系统
CN110971677B (zh) 一种基于对抗强化学习的电力物联网终端设备边信道安全监测方法
CN110417011A (zh) 一种基于互信息与迭代随机森林的在线动态安全评估方法
CN113422695B (zh) 一种提高物联网拓扑结构鲁棒性能的优化方法
CN112215722B (zh) 主导失稳模式判别模型构建方法、主导失稳模式判别方法
CN104598968A (zh) 变压器故障诊断方法
CN112821424B (zh) 一种基于数据-模型融合驱动的电力系统频率响应分析方法
CN112637006A (zh) 一种电力通信网关键节点及影响域分析方法
CN105954650A (zh) 配电网故障定位方法和系统
Zhang et al. A diameter-constrained approximation algorithm of multistate two-terminal reliability
CN105245362A (zh) 一种sdn环境中重要节点信息采集方法
CN115545479A (zh) 一种配电网重要节点或重要线路的确定方法及装置
CN109376939B (zh) 一种基于自适应神经网络的电网稳定性实时预测方法
CN111062569A (zh) 一种基于bp神经网络的小电流故障判别方法
CN116581890B (zh) 一种电网运行稳定性的智能监测方法及系统
CN111950853B (zh) 一种基于信息物理双侧数据的电力运行状态白名单生成方法
CN111950853A (zh) 一种基于信息物理双侧数据的电力运行状态白名单生成方法
CN106603294A (zh) 一种基于电力通信网结构和状态的综合脆弱性评估方法
CN113987852B (zh) 一种电力信息物理系统的高风险线路组合分析方法
CN116127447A (zh) 虚拟电厂虚假数据注入攻击检测方法、装置、终端及介质
Barreto et al. Competitive neural networks for fault detection and diagnosis in 3G cellular systems

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant