CN114386330A - 一种基于q学习网络攻击的电网连锁故障预测方法 - Google Patents

一种基于q学习网络攻击的电网连锁故障预测方法 Download PDF

Info

Publication number
CN114386330A
CN114386330A CN202210041989.5A CN202210041989A CN114386330A CN 114386330 A CN114386330 A CN 114386330A CN 202210041989 A CN202210041989 A CN 202210041989A CN 114386330 A CN114386330 A CN 114386330A
Authority
CN
China
Prior art keywords
line
attack
probability
cascading failure
network attack
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210041989.5A
Other languages
English (en)
Other versions
CN114386330B (zh
Inventor
张晶晶
赵沛东
齐先军
杨熙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hefei University of Technology
Original Assignee
Hefei University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hefei University of Technology filed Critical Hefei University of Technology
Priority to CN202210041989.5A priority Critical patent/CN114386330B/zh
Publication of CN114386330A publication Critical patent/CN114386330A/zh
Application granted granted Critical
Publication of CN114386330B publication Critical patent/CN114386330B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2111/00Details relating to CAD techniques
    • G06F2111/08Probabilistic or stochastic CAD

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Economics (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Health & Medical Sciences (AREA)
  • Marketing (AREA)
  • Evolutionary Computation (AREA)
  • Tourism & Hospitality (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Water Supply & Treatment (AREA)
  • General Health & Medical Sciences (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Artificial Intelligence (AREA)
  • Public Health (AREA)
  • Primary Health Care (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种基于Q学习网络攻击的电网连锁故障预测方法,包括:1构建网络攻击模型,确定断路器无故障跳闸攻击的各攻击路径成功概率,2构建基于Q学习的连锁故障演化模型,并使用Q学习算法进行训练,生成Q值表以选取最优网络攻击方案,可筛选出产生较大风险的攻击路径。本发明在考虑网络攻击成功概率的基础上,利用Q学习算法选取网络攻击路径,既能避免类似遍历算法的大范围计算,极大缩短计算时间,在工作量与完备性之间有较好的平衡,为网络攻击场景下的电网连锁故障防控提供理论指导。

Description

一种基于Q学习网络攻击的电网连锁故障预测方法
技术领域
本发明属于电力系统领域,具体的说是一种基于Q学习网络攻击的电网连锁故障预测方法。
背景技术
随着电力系统与信息系统深度耦合,信息系统在提高电网性能的同时也引入新的故障形式,改变连锁故障传播路径,因此传统的连锁故障预测方式需要相应改进。当前大多数学者在研究网络攻击的时候,主要针对由单一网络攻击或信息网自身故障引起的连锁故障,并未考虑多次网络攻击的场景,且传统的连锁故障分析模型难以发现普遍规律或计算量过于庞大。
发明内容
本发明是为了解决上述现有技术存在的不足之处,提出一种基于Q学习网络攻击的电网连锁故障预测方法,以期能更精准地预测网络攻击情形下的事故链,并对连锁故障进行风险评估,进一步提高风险预测的准确率,并在工作量与完备性之间取得平衡,从而能为电网连锁故障防控提供理论指导。
本发明为达到上述发明目的,采用如下技术方案:
本发明一种基于Q学习网络攻击的电网连锁故障预测方法的特点是按如下步骤进行:
步骤1、以断路器无故障跳闸为目标,构建基于模糊层次分析法的攻击树模型,并得到断路器无故障跳闸攻击的各攻击路径成功概率,其中,第i条攻击路径Mi的成功概率记为P(Mi);
步骤2、构建基于Q学习的连锁故障演化模型,并使用Q学习算法进行训练:
步骤2.1、初始化迭代次数x=1,初始化事故链所处环节数y=1,定义最大迭代次数为N,随机网络攻击的迭代次数阈值为m;
步骤2.2、若迭代次数x小于等于m,则采用随机攻击;
若迭代次数x大于m次,则按照概率ε采用随机攻击,按照概率1-ε采用最大Q值的对应线路作为攻击目标;
步骤2.3、判断第x次连锁故障过程的事故链所处环节的环节数y是否为1,若是,则将网络攻击线路直接作为初始故障线路,令初始故障概率PC=P(Mi)并转步骤2.6,否则执行步骤2.4;
步骤2.4、判断电网是否解列为两部分或者事故链是否达到预定的演化深度,若是,则表示结束第x次连锁故障过程,并转至步骤2.7,否则执行步骤2.5;
步骤2.5、后续故障线路的选取:
若第x次连锁故障过程中事故链的第y环节有线路严重过负荷,则将严重过负荷线路直接作为下级停运线路;
若第x次连锁故障过程中事故链的第y环节无严重过负荷线路,判断是否有线路一般过负荷,若是,则采用基于灵敏度的过负荷控制方法消除一般过负荷线路,再计算所有线路停运概率,选取停运概率最高的线路作为下级停运线路,若否,则直接计算所有线路停运概率,选取停运概率最高的线路作为下级停运线路;其中,所述线路停运概率包括:潮流转移因素、隐性故障因素、网络攻击因素;
步骤2.6、跳开所选的初始故障线路或下级停运线路,计算第x次连锁故障过程中的环节风险值,并用于更新Q值表后,将y+1赋值给y,并转至步骤2.2;
步骤2.7、判断x是否达到N,若是,则表示训练结束,得到最终的连锁故障演化模型并执行步骤3,否则,将x+1赋值给x后,初始化事故链所处的环节数y=1,并转至步骤2.2顺序执行;
步骤3、输出相应数据包括:事故链路径、事故链各环节采取控制量,事故发生概率,各环节风险值、Q值表,从而得到最优攻击方案,即产生较大风险的攻击路径。
本发明所述的基于Q学习网络攻击的电网连锁故障预测方法的特点也在于,所述步骤2.5的线路停运概率是按如下步骤计算:
步骤2.5.1、利用式(1)得到线路k的潮流转移因素的随机停运概率
Figure BDA0003470661330000021
Figure BDA0003470661330000022
式(1)中,Cori表示线路i的关联性指标;Cork表示线路k的关联性指标;NP为电力系统中的线路集合;
步骤2.5.2、利用式(2)得到保护误动和断路器误动所引起的线路k的隐性故障因素的停运概率
Figure BDA0003470661330000023
Figure BDA0003470661330000024
式(2)中,Pmis_b,Pmis_d分别表示保护装置、断路器的误动概率,Pinact_d为断路器拒动的概率;
步骤2.5.3、利用式(3)得到网络攻击引起的线路k的网络攻击因素的停运概率
Figure BDA0003470661330000025
Figure BDA0003470661330000026
步骤2.5.4、利用式(4)得到无线路过负荷的后续线路k的停运概率
Figure BDA0003470661330000031
Figure BDA0003470661330000032
所述步骤2.6包括:
步骤2.6.1、令st为第t阶段下电网线路的状态,即st={st(1),…st(w)…,st(W)},其中,st(w)表示第t阶段下线路w的状态,W为电网的线路总数,1<w<W;并有:
Figure BDA0003470661330000033
式(5)中,当st(w)=1时,表示线路w正常运行,当st(w)=0时,表示线路w停运;
步骤2.6.2、利用式(6)得到单次网络攻击造成的风险值并作为奖罚值rt+1
Figure BDA0003470661330000034
式(6)中,Sev为事故链环节的控制量,
Figure BDA0003470661330000035
为第x次连锁故障过程中严重过负荷后线路k的停运概率;
步骤2.6.3、利用式(7)更新Q值表:
Q′(st,at)=Q(st,at)+α[rt+1+γmaxQ(st+1,at)-Q(st,at)] (7)
式(7)中,α表示学习因子,at表示Agent在t阶段采取的动作方案;rt+1表示Agent处于状态st,采取某一动作at后的奖罚值;γ为折扣因子;maxQ(st+1,at)表示Agent目前状态st到达下一状态所取的最大Q值。
与现有技术相比,本发明的有益效果在于:
1、本发明将Q学习算法与多次网络攻击结合,在考虑网络攻击的基础上预测高风险事故链路径;并使用强化学习解决了类似遍历算法的大范围计算问题,有效缩短了计算时间,同时也兼顾完备性,提高预测效率。通过调整折扣因子参数,可以综合考虑每一环节风险和总风险的影响,解决了传统连锁故障风险计算中事故链长度和总风险值间的矛盾。
2、本发明在连锁故障分析中考虑网络攻击成功概率,将网络攻击作为下级线路停运的因素之一,完善多次网络攻击场景,克服了现有后续故障线路选取的局限性,考虑了多次攻击对连锁故障的影响,同时兼顾了潮流转移因素和隐性故障因素的影响,提高了事故链预测的精准性。
附图说明
图1为本发明断路器无故障跳闸攻击树模型;
图2为现有技术中IEEE39节点系统结构图;
图3为本发明各断路器被攻击的成功概率。
具体实施方式
本实施例中,一种基于Q学习网络攻击的电网连锁故障预测方法是按如下步骤进行:
步骤1、以断路器无故障跳闸为目标,构建基于模糊层次分析法的攻击树模型,并得到断路器无故障跳闸攻击的各攻击路径成功概率,其中,第i条攻击路径Mi的成功概率记为P(Mi);
实现断路器无故障跳闸目标G的方案有:攻击控制中心、攻击控制中心与变电站之间的通信网络、访问变电站HMI、访问RTU和访问保护继电器,分别用V1~V5表示,构建攻击树模型如图1所示,F1-F11为叶节点,F1、F2分别表示通过端口扫描方式和访问交换机并入侵控制中心服务器;F3表示截获测量值以及状态包;V6表示虚假信息注入;F4、F5表示实现V6的两种方法,即安装窃听设备和用恰当解码方法破解信息;F6、F7表示通过端口扫描访问系统端口和访问并入侵变电站用户接口;F8、F9表示拨号连接到达变电站应答调制解调器和破解密码访问RTU;F10、F11表示端口扫描变电站网络和破解密码访问保护继电器。
叶节点F的攻击成功概率由三个属性表示,即叶节点F的攻击成本costF、叶节点F的攻击难度diffF和叶节点F的攻击被发现可能性detF,评分标准有5级,利用式(1)可得叶节点F的攻击成功概率P(F):
P(F)=Wcost×U(costF)+Wdiff×U(diffF)+Wdet×U(detF) (1)
式(1)中,Wcost、Wdiff、Wdet分别为叶节点F攻击成本costF、叶节点F攻击难度diffF、叶节点F攻击被发现可能性detF三个属性对应的权重;U(costF)、U(diffF)、U(detF)分别为叶节点F攻击成本costF、叶节点F攻击难度diffF、叶节点F攻击被发现可能性detF三个属性对应的效用值。权重可由模糊层次分析法得出,各叶节点属性评分由计算分析人员给出,效用值则由各属性评分得到。
综上所述,利用式(2)可得各路径攻击成功概率:
Figure BDA0003470661330000051
式(2)中,P(Mi)表示第i条攻击路径被攻击的成功概率,f表示攻击路径总数。
本实施例中,以IEEE39节点电力系统模拟网络攻击情形下的电网连锁故障传播过程,IEEE39节点系统结构如图2所示,计算可得6个攻击路径实现断路器无故障开断的成功概率,其中由于V2有两种实现方法,故共有6个攻击路径,结果如图3所示。
步骤2、构建基于Q学习的连锁故障演化模型,并使用Q学习算法进行训练:
步骤2.1、初始化迭代次数x=1,初始化事故链所处环节数y=1,定义最大迭代次数为N,随机网络攻击的迭代次数阈值为m;
步骤2.2、若迭代次数x小于等于m,则采用随机攻击;
若迭代次数x大于m次,则按照概率ε采用随机攻击,按照概率1-ε采用最大Q值的对应线路作为攻击目标;
训练初期Agent经验较少,难以采用最优攻击。攻击方案通常先采取随机攻击,获取尽可能多的方案,实现对环境的初步探索。随着训练的增多,一定程度可根据学习经验选取局部最优攻击方案,主要采用ε-greed算法选择攻击方案,利用式(3)可得选择局部最优攻击方案概率:
Figure BDA0003470661330000052
式(3)中,at表示Agent在t阶段采取的动作方案,
Figure BDA0003470661330000053
表示Agent处于状态st,采取局部最优攻击方案
Figure BDA0003470661330000054
的概率值。ε为探索参数,为1表示Agent完全随机选取攻击方案,为0表示按照Q值选取。训练后期,ε会随着训练的深入不断减小。
步骤2.3、判断第x次连锁故障过程的事故链所处环节数y是否为1,若是,则将网络攻击线路直接作为初始故障线路,令初始故障概率PC=P(Mi)并转步骤2.6,否则执行步骤2.4;
步骤2.4、判断电网是否解列为两部分或者事故链是否达到预定的演化深度,若是,则表示结束第x次连锁故障过程,并转至步骤2.7,否则执行步骤2.5;
步骤2.5、后续故障线路的选取:
若第x次连锁故障过程中事故链第y环节有线路严重过负荷,则将严重过负荷线路直接作为下级停运线路;
若第x次连锁故障过程中事故链的第y环节无严重过负荷线路,判断是否有线路一般过负荷,若是,则采用基于灵敏度的过负荷控制方法消除一般过负荷线路,再计算所有线路停运概率,选取停运概率最高的线路作为下级停运线路,若否,则直接计算所有线路停运概率,选取停运概率最高的线路作为下级停运线路;其中,所述线路停运概率包括:潮流转移因素、隐性故障因素、网络攻击因素;
本实施例中,线路停运概率是按如下步骤计算:
步骤2.5.1、利用式(4)得到线路k的潮流转移因素的随机停运概率
Figure BDA0003470661330000061
Figure BDA0003470661330000062
式(4)中,Cori表示线路i的关联性指标;Cork表示线路k的关联性指标;NP为电力系统中的线路集合,Cork按如下计算:
利用式(5)~式(8)定义线路k的潮流负载情况指标Dk、线路k的潮流耦合关系指标Sk、线路k的潮流波动指标Bk来描述线路k断开后对其他线路的影响,以此评估线路k因潮流转移因素引起的随机停运,得到下级线路k的关联性指标Cork
Cork=Dk×Sk×Bk (5)
Dk=(Fk,j-Fk,j-1)/Fkmax (6)
Sk=|(Fk,j-Fk,j-1)/Fi,j-1 (7)
Bk=|(FLk,j-FLk,j-1)/Fk,j-1 (8)
式(5)~式(8)中,Fk,j、Fk,j-1分别表示线路k在事故链第j和j-1阶段的潮流值;Fkmax表示线路k的热稳定极限值。
步骤2.5.2、利用式(9)得到保护误动和断路器误动所引起的线路k的隐性故障因素的停运概率
Figure BDA0003470661330000063
Figure BDA0003470661330000064
式(9)中,Pmis_b,Pmis_d分别表示保护装置、断路器的误动概率,Pinact_d为断路器拒动的概率;
步骤2.5.3、利用式(10)得到网络攻击引起的线路k的网络攻击因素的停运概率
Figure BDA0003470661330000065
Figure BDA0003470661330000066
步骤2.5.4、利用式(11)得到无线路过负荷的后续线路k的停运概率
Figure BDA0003470661330000071
Figure BDA0003470661330000072
步骤2.6、跳开所选的初始故障线路或下级停运线路,计算第x次连锁故障过程中的环节风险值,并用于更新Q值表后将y+1赋值给y并转至步骤2.2;
步骤2.6包括:
步骤2.6.1、令st为第t阶段下电网线路的状态,即st={st(1),…st(w)…,st(W)},其中,st(w)表示第t阶段下线路w的状态,W为电网的线路总数,1<w<W;并有:
Figure BDA0003470661330000073
式(12)中,当st(w)=1时,表示线路w正常运行,当st(w)=0时,表示线路w停运;
步骤2.6.2、利用式(13)得到单次网络攻击造成的风险值并作为奖罚值rt+1
Figure BDA0003470661330000074
式(13)中,Sev为事故链环节的控制量,
Figure BDA0003470661330000075
为第x次连锁故障过程中严重过负荷后线路k的停运概率;
本实施例中,严重过负荷线路k的停运概率
Figure BDA0003470661330000076
按如下方式计算:
当线路k严重过负荷时,其故障概率应为过负荷保护不拒动且断路器不拒动的概率,利用式(14)可得严重过负荷线路k的停运概率
Figure BDA0003470661330000077
Pjk1=(1-Pinact_b)(1-Pinact_d) (14)
式(14)中,Pinact_b、Pinact_d分别为保护拒动和断路器拒动的概率。
步骤2.6.3、利用式(15)更新Q值表:
Q′(st,at)=Q(st,at)+α[rt+1+γmaxQ(st+1,at)-Q(st,at)] (15)
式(15)中,α表示学习因子,α=1表示Agent完全接收实时奖罚值,易导致学习过程中波动性较大;α=0表示Agent完全保守,不接受更新。at表示Agent在t阶段采取的动作方案。rt+1表示Agent处于状态st,采取某一动作at后的奖罚值。γ为折扣因子,表示接下来的决策对目前Q值更新的影响程度。maxQ(st+1,at)表示Agent目前状态st到达下一状态所取的最大Q值。
步骤2.7、判断x是否达到N,若是,则表示训练结束,得到最终的连锁故障演化模型并执行步骤3,否则,将x+1赋值给x后,初始化事故链所处环节数y=1,并转至步骤2.2顺序执行。
步骤3、输出相应数据包括:事故链路径、事故链各环节采取控制量,事故发生概率,各环节风险值、Q值表,从而得到最优攻击方案,即产生较大风险的攻击路径。

Claims (3)

1.一种基于Q学习网络攻击的电网连锁故障预测方法,其特征是按如下步骤进行:
步骤1、以断路器无故障跳闸为目标,构建基于模糊层次分析法的攻击树模型,并得到断路器无故障跳闸攻击的各攻击路径成功概率,其中,第i条攻击路径Mi的成功概率记为P(Mi);
步骤2、构建基于Q学习的连锁故障演化模型,并使用Q学习算法进行训练:
步骤2.1、初始化迭代次数x=1,初始化事故链所处环节数y=1,定义最大迭代次数为N,随机网络攻击的迭代次数阈值为m;
步骤2.2、若迭代次数x小于等于m,则采用随机攻击;
若迭代次数x大于m次,则按照概率ε采用随机攻击,按照概率1-ε采用最大Q值的对应线路作为攻击目标;
步骤2.3、判断第x次连锁故障过程的事故链所处环节的环节数y是否为1,若是,则将网络攻击线路直接作为初始故障线路,令初始故障概率PC=P(Mi)并转步骤2.6,否则执行步骤2.4;
步骤2.4、判断电网是否解列为两部分或者事故链是否达到预定的演化深度,若是,则表示结束第x次连锁故障过程,并转至步骤2.7,否则执行步骤2.5;
步骤2.5、后续故障线路的选取:
若第x次连锁故障过程中事故链的第y环节有线路严重过负荷,则将严重过负荷线路直接作为下级停运线路;
若第x次连锁故障过程中事故链的第y环节无严重过负荷线路,判断是否有线路一般过负荷,若是,则采用基于灵敏度的过负荷控制方法消除一般过负荷线路,再计算所有线路停运概率,选取停运概率最高的线路作为下级停运线路,若否,则直接计算所有线路停运概率,选取停运概率最高的线路作为下级停运线路;其中,所述线路停运概率包括:潮流转移因素、隐性故障因素、网络攻击因素;
步骤2.6、跳开所选的初始故障线路或下级停运线路,计算第x次连锁故障过程中的环节风险值,并用于更新Q值表后,将y+1赋值给y,并转至步骤2.2;
步骤2.7、判断x是否达到N,若是,则表示训练结束,得到最终的连锁故障演化模型并执行步骤3,否则,将x+1赋值给x后,初始化事故链所处的环节数y=1,并转至步骤2.2顺序执行;
步骤3、输出相应数据包括:事故链路径、事故链各环节采取控制量,事故发生概率,各环节风险值、Q值表,从而得到最优攻击方案,即产生较大风险的攻击路径。
2.根据权利要求1所述的基于Q学习网络攻击的电网连锁故障预测方法,其特征是,所述步骤2.5的线路停运概率是按如下步骤计算:
步骤2.5.1、利用式(1)得到线路k的潮流转移因素的随机停运概率
Figure FDA0003470661320000021
Figure FDA0003470661320000022
式(1)中,Cori表示线路i的关联性指标;Cork表示线路k的关联性指标;NP为电力系统中的线路集合;
步骤2.5.2、利用式(2)得到保护误动和断路器误动所引起的线路k的隐性故障因素的停运概率
Figure FDA0003470661320000023
Figure FDA0003470661320000024
式(2)中,Pmis_b,Pmis_d分别表示保护装置、断路器的误动概率,Pinact_d为断路器拒动的概率;
步骤2.5.3、利用式(3)得到网络攻击引起的线路k的网络攻击因素的停运概率
Figure FDA0003470661320000025
Figure FDA0003470661320000026
步骤2.5.4、利用式(4)得到无线路过负荷的后续线路k的停运概率
Figure FDA0003470661320000027
Figure FDA0003470661320000028
3.根据权利要求2所述的基于Q学习网络攻击的电网连锁故障预测方法,其特征是,所述步骤2.6包括:
步骤2.6.1、令st为第t阶段下电网线路的状态,即st={st(1),…st(w)…,st(W)},其中,st(w)表示第t阶段下线路w的状态,W为电网的线路总数,1<w<W;并有:
Figure FDA0003470661320000029
式(5)中,当st(w)=1时,表示线路w正常运行,当st(w)=0时,表示线路w停运;
步骤2.6.2、利用式(6)得到单次网络攻击造成的风险值并作为奖罚值rt+1
Figure FDA00034706613200000210
式(6)中,Sev为事故链环节的控制量,
Figure FDA0003470661320000031
为第x次连锁故障过程中严重过负荷后线路k的停运概率;
步骤2.6.3、利用式(7)更新Q值表:
Q′(st,at)=Q(st,at)+α[rt+1+γmaxQ(st+1,at)-Q(st,at)] (7)
式(7)中,α表示学习因子,at表示Agent在t阶段采取的动作方案;rt+1表示Agent处于状态st,采取某一动作at后的奖罚值;γ为折扣因子;maxQ(st+1,at)表示Agent目前状态st到达下一状态所取的最大Q值。
CN202210041989.5A 2022-01-14 2022-01-14 一种基于q学习网络攻击的电网连锁故障预测方法 Active CN114386330B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210041989.5A CN114386330B (zh) 2022-01-14 2022-01-14 一种基于q学习网络攻击的电网连锁故障预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210041989.5A CN114386330B (zh) 2022-01-14 2022-01-14 一种基于q学习网络攻击的电网连锁故障预测方法

Publications (2)

Publication Number Publication Date
CN114386330A true CN114386330A (zh) 2022-04-22
CN114386330B CN114386330B (zh) 2024-02-20

Family

ID=81200987

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210041989.5A Active CN114386330B (zh) 2022-01-14 2022-01-14 一种基于q学习网络攻击的电网连锁故障预测方法

Country Status (1)

Country Link
CN (1) CN114386330B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106529181A (zh) * 2016-11-17 2017-03-22 国网四川省电力公司电力科学研究院 一种电力系统连锁故障脆弱线路的辨识方法及系统
CN109118098A (zh) * 2018-08-21 2019-01-01 山东大学 高比例风电并网的连锁故障风险评估方法及系统
CN112347716A (zh) * 2020-10-29 2021-02-09 武汉市工程科学技术研究院 基于q学习的电网脆弱点检测方法、系统、设备及介质
US20210126943A1 (en) * 2019-10-29 2021-04-29 General Electric Company Virtual sensor supervised learning for cyber-attack neutralization
CN113408921A (zh) * 2021-06-29 2021-09-17 合肥工业大学 一种基于网络依存关系的连锁故障风险评估方法
CN113452026A (zh) * 2021-06-29 2021-09-28 华中科技大学 一种电力系统薄弱评估智能体训练方法、评估方法和系统
US20210334441A1 (en) * 2020-04-28 2021-10-28 The Texas A&M University System Apparatus and systems for power system protective relay control using reinforcement learning

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106529181A (zh) * 2016-11-17 2017-03-22 国网四川省电力公司电力科学研究院 一种电力系统连锁故障脆弱线路的辨识方法及系统
CN109118098A (zh) * 2018-08-21 2019-01-01 山东大学 高比例风电并网的连锁故障风险评估方法及系统
US20210126943A1 (en) * 2019-10-29 2021-04-29 General Electric Company Virtual sensor supervised learning for cyber-attack neutralization
US20210334441A1 (en) * 2020-04-28 2021-10-28 The Texas A&M University System Apparatus and systems for power system protective relay control using reinforcement learning
CN112347716A (zh) * 2020-10-29 2021-02-09 武汉市工程科学技术研究院 基于q学习的电网脆弱点检测方法、系统、设备及介质
CN113408921A (zh) * 2021-06-29 2021-09-17 合肥工业大学 一种基于网络依存关系的连锁故障风险评估方法
CN113452026A (zh) * 2021-06-29 2021-09-28 华中科技大学 一种电力系统薄弱评估智能体训练方法、评估方法和系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
丁明;李晓静;张晶晶;: "面向SCADA的网络攻击对电力系统可靠性的影响", 电力系统保护与控制, no. 11, 1 June 2018 (2018-06-01) *

Also Published As

Publication number Publication date
CN114386330B (zh) 2024-02-20

Similar Documents

Publication Publication Date Title
CN108769062A (zh) 一种面向电力信息物理系统多阶段网络攻击的防御方法
US20210334441A1 (en) Apparatus and systems for power system protective relay control using reinforcement learning
Wu et al. Nested reinforcement learning based control for protective relays in power distribution systems
CN106789190A (zh) 一种电力通信网脆弱性评估及路由优化方法
Bernstein et al. Sensitivity analysis of the power grid vulnerability to large-scale cascading failures
CN109145428A (zh) 一种连锁故障模式下信息物理融合系统脆弱性评估方法
CN106253270A (zh) 电力系统脆弱线路辨识方法和系统
Sampaio et al. Adaptive fuzzy directional bat algorithm for the optimal coordination of protection systems based on directional overcurrent relays
CN107368966B (zh) 一种电力网络脆弱性的评估方法
CN113301010B (zh) 拒绝服务攻击下电力信息网络数据传输通道重要程度的判定方法
Papaspiliotopoulos et al. Optimal coordination of directional overcurrent relays in distribution systems with distributed generation based on a hybrid PSO-LP algorithm
CN113516357A (zh) 考虑网络攻击风险的电力系统脆弱线路评估方法及系统
Semertzis et al. Quantitative risk assessment of cyber attacks on cyber-physical systems using attack graphs
CN110350522A (zh) 一种基于加权h指数的电力系统脆弱线路辨识方法
CN110209515A (zh) 一种可靠性评估方法、装置、设备及存储介质
Draz et al. Soft computing methods for attaining the protective device coordination including renewable energies: review and prospective
Guo et al. Risk‐based many‐objective configuration of power system fault current limiters utilising NSGA‐III
CN109800453B (zh) 一种快速开关型限流器与断路器的参数优化方法
CN114386330A (zh) 一种基于q学习网络攻击的电网连锁故障预测方法
CN112865085B (zh) 一种用于电力信息物理系统的攻击模拟方法及系统
Wang et al. A genetic-algorithm-based two-stage learning scheme for neural networks
Wang et al. Cyber-physical risk assessment for smart grid system protection scheme
CN111864690A (zh) 一种基于差分-花粉算法的反时限过流定值优化方法
CN104269846A (zh) 电网故障分区方法
Qi et al. Optimal-probabilistic coordination of directional overcurrent relays considering network topological uncertainties

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant