CN114243799B - 基于分布式电源的深度强化学习配电网故障恢复方法 - Google Patents

基于分布式电源的深度强化学习配电网故障恢复方法 Download PDF

Info

Publication number
CN114243799B
CN114243799B CN202210005264.0A CN202210005264A CN114243799B CN 114243799 B CN114243799 B CN 114243799B CN 202210005264 A CN202210005264 A CN 202210005264A CN 114243799 B CN114243799 B CN 114243799B
Authority
CN
China
Prior art keywords
fault recovery
node
agent
power supply
nodes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210005264.0A
Other languages
English (en)
Other versions
CN114243799A (zh
Inventor
陈东海
王波
张志雄
邬航杰
蔡振华
王静怡
吴凯
虞殷树
张威
严勇
罗轶
何小坚
胡勤
王京锋
张洪磊
黄蕾
朱航
袁士超
柯珂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ningbo Power Supply Co of State Grid Zhejiang Electric Power Co Ltd
Original Assignee
Ningbo Power Supply Co of State Grid Zhejiang Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ningbo Power Supply Co of State Grid Zhejiang Electric Power Co Ltd filed Critical Ningbo Power Supply Co of State Grid Zhejiang Electric Power Co Ltd
Priority to CN202210005264.0A priority Critical patent/CN114243799B/zh
Publication of CN114243799A publication Critical patent/CN114243799A/zh
Application granted granted Critical
Publication of CN114243799B publication Critical patent/CN114243799B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J3/00Circuit arrangements for ac mains or ac distribution networks
    • H02J3/38Arrangements for parallely feeding a single network by two or more generators, converters or transformers
    • H02J3/46Controlling of the sharing of output between the generators, converters, or transformers
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02HEMERGENCY PROTECTIVE CIRCUIT ARRANGEMENTS
    • H02H7/00Emergency protective circuit arrangements specially adapted for specific types of electric machines or apparatus or for sectionalised protection of cable or line systems, and effecting automatic switching in the event of an undesired change from normal working conditions
    • H02H7/26Sectionalised protection of cable or line systems, e.g. for disconnecting a section on which a short-circuit, earth fault, or arc discharge has occured
    • H02H7/28Sectionalised protection of cable or line systems, e.g. for disconnecting a section on which a short-circuit, earth fault, or arc discharge has occured for meshed systems
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J3/00Circuit arrangements for ac mains or ac distribution networks
    • H02J3/38Arrangements for parallely feeding a single network by two or more generators, converters or transformers
    • H02J3/381Dispersed generators
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J2203/00Indexing scheme relating to details of circuit arrangements for AC mains or AC distribution networks
    • H02J2203/20Simulating, e g planning, reliability check, modelling or computer assisted design [CAD]
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J2300/00Systems for supplying or distributing electric power characterised by decentralized, dispersed, or local generation
    • H02J2300/20The dispersed energy generation being of renewable origin
    • H02J2300/22The renewable source being solar energy
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A30/00Adapting or protecting infrastructure or their operation
    • Y02A30/60Planning or developing urban green infrastructure

Landscapes

  • Engineering & Computer Science (AREA)
  • Power Engineering (AREA)
  • Supply And Distribution Of Alternating Current (AREA)

Abstract

本申请实施例提出了基于分布式电源的深度强化学习配电网故障恢复方法,包括根据配电网电气节点间的连接关系,建立配电网的电气拓扑图,合并节点形成故障恢复节点,并以联络开关为边,建立故障恢复拓扑图;以每个分布式电源为智能体,建立故障恢复的多智能体马尔科夫决策过程模型,通过在配电网故障恢复中引入分布式电源,有利于进一步提高恢复供电手段的灵活性和恢复供电的负荷量。同时,本发明引入深度强化学习,智能体通过在不同的问题实例下,基于可观测的部分信息搜索分布式电源的供电范围,得到恢复供电的配电网孤岛划分方案,并根据回报函数调整搜索策略训练模型,对不同的问题实例具有较好的适应性。

Description

基于分布式电源的深度强化学习配电网故障恢复方法
技术领域
本发明涉及配电网故障恢复领域,尤其涉及基于分布式电源的深度强化学习配电网故障恢复方法。
背景技术
配电网发生故障时,利用传统火电、水电机组,通过负荷转供的方式恢复供电,受配电网的运行方式约束影响较大,且大容量机组的爬坡速率有限,因此通常需切除的负荷较多,故障恢复的灵活性不足。同时,配电网故障恢复是一类组合优化问题,当前的方法集中于启发式搜索和混合整数规划。传统的启发式搜索在面对不同的问题实例时,解的质量差异性较大,不具备自适应能力。而混合整数规划的建模需要完整的配电网信息,且计算时间随着配电网规模的增大而急剧增加。
发明内容
本发明的目的在于提高配电网故障恢复手段的灵活性、恢复供电的能力和恢复方案计算速度。分布式光伏、储能、电动汽车等分布式电源在配电网中的大量接入,为配电网的故障恢复提供了新的灵活可用资源。因此,本发明在配电网故障恢复中引入分布式电源,有利于进一步提高恢复供电手段的灵活性和恢复供电的负荷量。同时,本发明引入深度强化学习,智能体通过在不同的问题实例下,基于可观测的部分信息搜索分布式电源的供电范围,得到恢复供电的配电网孤岛划分方案,并根据回报函数调整搜索策略训练模型,对不同的问题实例具有较好的适应性。
本发明的目的是通过以下技术方案来实现:基于分布式电源的深度强化学习配电网故障恢复方法,包括步骤:
1)根据配电网电气节点间的连接关系,建立配电网的电气拓扑图。合并节点形成故障恢复节点,并以联络开关为边,建立故障恢复拓扑图。
2)以每个分布式电源为智能体,建立故障恢复的多智能体马尔科夫决策过程模型。
3)在训练阶段,首先使用DeepWalk获取故障恢复拓扑图的节点表示向量。
4)各智能体分别拼接观察到的状态向量及其所在故障恢复节点的表示向量,输入到由全连接神经网络构建的Q函数神经网络,得到各个动作的Q值,并使用∈-greedy方法采样动作并执行。收集由当前状态、当前动作、当前回报、下一状态组成的四元组并放入经验池。
5)当经验池中的四元组数量足够多时,从经验池中批量采样四元组计算Q值损失函数,并使用Adam优化算法更新神经网络参数。若存在故障恢复节点未被访问且分布式电源仍有剩余功率,返回第三步,否则结束一轮回合的训练。6)训练足够多回合数后结束训练,使用训练好的Q函数神经网络确定各状态下的动作并执行,不断重复直到所有故障恢复节点均被访问或分布式电源无剩余功率。
进一步地,所述步骤1)中合并节点形成故障恢复节点,建立故障恢复拓扑的具体步骤包括:
1.1)断开所有联络开关,选择未被访问的电气节点,在电气拓扑图中进行深度优先或广度优先搜索,同时在搜索的过程中标记访问过的电气节点。
1.2)每次搜索完成后,合并本次搜索过程中访问的电气节点作为故障恢复节点v,记故障恢复节点构成的集合为若仍有电气节点未被访问,返回1.1),否则结束搜索。
1.3)以联络开关作为各故障恢复节点间的边e,记边构成的集合为ε。建立故障恢复拓扑图
进一步地,步骤2)中故障恢复的多智能体马尔科夫决策过程模型为:
2.1)环境:故障恢复过程中的配电网。
2.2)智能体:为每个分布式电源分配一个智能体,决定每个分布式电源恢复供电的节点。记共有N个智能体。
2.3)状态:记第i个智能体在t时刻所观察的状态si,t,构成的集合为各智能体在t时刻观察的状态组成的向量为st。si,t由三部分组成:
2.3.1)第i个智能体在t时刻前访问经过的故障恢复节点。
2.3.2)第i个智能体在t时刻所处的故障恢复节点。
2.3.3)第i个智能体在t时刻剩余的功率。
2.4)动作:记第i个智能体在t时刻的动作ai,t,构成的集合为各智能体在t时刻动作组成的向量为at。ai,t表示第i个智能体在t时刻处于状态si,t时,t+1时刻访问的故障恢复节点。由于两个故障恢复节点间由联络开关连接,因此执行动作ai,t等价于合上第i个智能体在t时刻和t+1时刻所处的故障恢复节点之间的联络开关。
2.5)状态转移概率:t时刻在状态st=[s1,t,s2,t,…,sN,t]下,各智能体选择的动作为at=[a1,t,a2,t,…,aN,t]时,t+1时刻状态为st+1=[s1,t+1,s2,t+1,…,sN,t+1]的概率
2.6)回报:记t时刻在状态st下,各智能体选择的动作为at时,第i个智能体获得的回报为Ri,t(st,at),各智能体回报组成的向量为Rt=[R1,t,R2,t,…,RN,t]。该回报由以下4部分求和得到:
2.6.1)恢复供电的负荷功率
式中:为第i个智能体执行动作ai,t,到达未访问过的故障恢复节点v后,所恢复供电的负荷功率,Δt为状态转移前后的时间差,本发明取1。
2.6.2)执行动作后,到达已访问过的故障恢复节点的惩罚
式中:为第i个智能体执行动作ai,t,到达已访问过的故障恢复节点v后,该节点已被恢复供电的负荷功率。
2.6.3)潮流越限程度惩罚
式中:Pf、Qf为支路f的有功、无功潮流,为支路f的有功、无功潮流的最大值,支路构成的集合为/>Vb和/>为电气节点b的电压幅值及最大值,电气节点构成的集合为/>wp、wq、wv为有功、无功、电压越限的惩罚系数,本发明均取1。
进一步地,步骤3)中使用DeepWalk训练故障恢复节点表示模型的具体步骤包括:
3.1)随机初始化故障恢复节点表示矩阵其中/>表示故障恢复节点的个数,d为故障恢复节点表示的维数。矩阵第v行表示故障恢复节点v的d维表示向量,记作Φ(v)。
3.2)在第p次遍历时(p=1,2,…,Np,共遍历Np次),乱序遍历中的顶点vp,以vp作为起始节点,在图/>中随机游走τ步,记录每次随机游走经过的故障恢复节点序列
3.3)使用SkipGram训练节点表示模型。顺序遍历序列中的节点vq 在vq前后分别截取大小为w的窗,对任意的/> 计算损失函数
J(Φ)=-logPr(vo|vq)
式中:Pr(vo|vq)表示以vq为中心节点时,前后大小为w的窗内包含节点vo的概率,可采用分层Softmax方法近似计算。
3.4)使用梯度下降法,更新矩阵Φ中的元素
式中:α为学习率。
进一步地,步骤4)中各智能体拼接状态向量和故障恢复节点表示向量,使用全连接网络计算动作Q值,并使用∈-greedy方法采样动作的具体步骤为:
4.1)设第i个智能体在t时刻所在的故障恢复节点为vi,t,拼接观察的状态向量和节点表示向量得到向量s′i,t
s′i,t=concat(si,t,Φ(vi,t))
4.2)设第i个智能体的Q函数使用全连接神经网络计算,共有Li层,第l层神经网络的参数为偏置为/>其中第Li层神经网络输出的维数和第i个智能体的动作空间相等。则t时刻第l层神经网络的输出/>与输入/>的关系为
式中:ReLU(·)为ReLU激活函数。
第1层神经网络的输入为向量s′i,t,第Li层神经网络输出/>为在状态si,t下各动作的Q函数值。
4.3)设选取随机动作的概率为∈,按均匀分布采样p∈[0,1],则第i个智能体在t时刻的动作ai,t满足
式中:rand(·)表示在集合中按均匀分布随机采样,表示第i个智能体的动作空间,Q(si,t,a)表示状态si,t下动作a的Q函数值。
进一步地,步骤5)中批量采样四元组,计算Q值损失函数的具体步骤为:
5.1)存储四元组<st,at,Rt,st+1>到经验池至本回合终止,返回步骤4)开始下一回合,直到经验池有足够多的四元组。
5.2)从经验池中随机采样S个四元组<s(s),a(s),R(s),s′(s)>(s=1,2,…,S),计算Q值损失函数
式中:γ为折扣率。
本发明的有益效果是:在故障恢复中考虑使用分布式电源作为紧急供电支撑,提高了故障恢复的灵活性。使用深度强化学习求解故障恢复模型,兼顾了模型的求解精度和求解效率。
附图说明
图1是本申请实施例提出的基于分布式电源的深度强化学习配电网故障恢复方法的流程示意图。
具体实施方式
下面通过具体实施例,并结合附图,对本发明的具体实施方式作进一步具体说明。
本发明基于分布式电源的深度强化学习配电网故障恢复方法,如图1所示,包括以下步骤:
S1,根据配电网电气节点间的连接关系,建立配电网的电气拓扑图,合并节点形成故障恢复节点,并以联络开关为边,建立故障恢复拓扑图,具体步骤包括:
1.1)断开所有联络开关,选择未被访问的电气节点,在电气拓扑图中进行深度优先或广度优先搜索,同时在搜索的过程中标记访问过的电气节点。
1.2)每次搜索完成后,合并本次搜索过程中访问的电气节点作为故障恢复节点v,记故障恢复节点构成的集合为若仍有电气节点未被访问,返回1.1),否则结束搜索。
1.3)以联络开关作为各故障恢复节点间的边e,记边构成的集合为ε。建立故障恢复拓扑图
S2,以每个分布式电源为智能体,建立故障恢复的多智能体马尔科夫决策过程模型,具体为:
2.1)环境:故障恢复过程中的配电网。
2.2)智能体:为每个分布式电源分配一个智能体,决定每个分布式电源恢复供电的节点。记共有N个智能体。
2.3)状态:记第i个智能体在t时刻所观察的状态si,t,构成的集合为各智能体在t时刻观察的状态组成的向量为st。si,t由三部分组成:
2.3.1)第i个智能体在t时刻前访问经过的故障恢复节点。
2.3.2)第i个智能体在t时刻所处的故障恢复节点。
2.3.3)第i个智能体在t时刻剩余的功率。
2.4)动作:记第i个智能体在t时刻的动作ai,t,构成的集合为各智能体在t时刻动作组成的向量为at。ai,t表示第i个智能体在t时刻处于状态si,t时,t+1时刻访问的故障恢复节点。由于两个故障恢复节点间由联络开关连接,因此执行动作ai,t等价于合上第i个智能体在t时刻和t+1时刻所处的故障恢复节点之间的联络开关。
2.5)状态转移概率:t时刻在状态st=[s1,t,s2,t,…,sN,t]下,各智能体选择的动作为at=[a1,t,a2,t,…,aN,t]时,t+1时刻状态为st+1=[s1,t+1,s2,t+1,…,sN,t+1]的概率
2.6)回报:记t时刻在状态st下,各智能体选择的动作为at时,第i个智能体获得的回报为Ri,t(st,at),各智能体回报组成的向量为Rt=[R1,t,R2,t,…,RN,t]。该回报由以下4部分求和得到:
2.6.1)恢复供电的负荷功率
式中:为第i个智能体执行动作ai,t,到达未访问过的故障恢复节点v后,所恢复供电的负荷功率,Δt为状态转移前后的时间差,本发明取1。
2.6.2)执行动作后,到达已访问过的故障恢复节点的惩罚
式中:为第i个智能体执行动作ai,t,到达已访问过的故障恢复节点v后,该节点已被恢复供电的负荷功率。
2.6.3)潮流越限程度惩罚
式中:Pf、Qf为支路f的有功、无功潮流,为支路f的有功、无功潮流的最大值,支路构成的集合为/>Vb和/>为电气节点b的电压幅值及最大值,电气节点构成的集合为/>wp、wq、wv为有功、无功、电压越限的惩罚系数,本发明均取1。
S3,在训练阶段,首先使用DeepWalk获取故障恢复拓扑图的节点表示向量,具体的步骤包括:
3.1)随机初始化故障恢复节点表示矩阵其中/>表示故障恢复节点的个数,d为故障恢复节点表示的维数。矩阵第v行表示故障恢复节点v的d维表示向量,记作Φ(v)。
3.2)在第p次遍历时(p=1,2,…,Np,共遍历Np次),乱序遍历中的顶点vp,以vp作为起始节点,在图/>中随机游走τ步,记录每次随机游走经过的故障恢复节点序列
3.3)使用SkipGram训练节点表示模型。顺序遍历序列中的节点vq 在vq前后分别截取大小为w的窗,对任意的/> 计算损失函数
J(Φ)=-logPr(vo|vq)
式中:Pr(vo|vq)表示以vq为中心节点时,前后大小为w的窗内包含节点vo的概率,可采用分层Softmax方法近似计算。
3.4)使用梯度下降法,更新矩阵Φ中的元素
式中:α为学习率。
S4,各智能体分别拼接观察到的状态向量及其所在故障恢复节点的表示向量,输入到由全连接神经网络构建的Q函数神经网络,得到各个动作的Q值,并使用∈-"greedy"方法采样动作并执行。收集由当前状态、当前动作、当前回报、下一状态组成的四元组并放入经验池。具体的步骤包括:
4.1)设第i个智能体在t时刻所在的故障恢复节点为vi,t,拼接观察的状态向量和节点表示向量得到向量s′i,t
s′i,t=concat(si,t,Φ(vi,t))
4.2)设第i个智能体的Q函数使用全连接神经网络计算,共有Li层,第l层神经网络的参数为偏置为/>其中第Li层神经网络输出的维数和第i个智能体的动作空间相等。则t时刻第l层神经网络的输出/>与输入/>的关系为
式中:ReLU(·)为ReLU激活函数。
第1层神经网络的输入为向量s′i,t,第Li层神经网络输出/>为在状态si,t下各动作的Q函数值。
4.3)设选取随机动作的概率为∈,按均匀分布采样p∈[0,1],则第i个智能体在t时刻的动作ai,t满足
式中:rand(·)表示在集合中按均匀分布随机采样,表示第i个智能体的动作空间,Q(si,t,a)表示状态si,t下动作a的Q函数值。
S5,当经验池中的四元组数量足够多时,从经验池中批量采样四元组计算Q值损失函数,并使用Adam优化算法更新神经网络参数。若存在故障恢复节点未被访问且分布式电源仍有剩余功率,返回步骤第三步,否则结束一轮回合的训练,具体的步骤包括:
5.1)存储四元组<st,at,Rt,st+1>到经验池至本回合终止,返回步骤4)开始下一回合,直到经验池有足够多的四元组。
5.2)从经验池中随机采样S个四元组<s(s),a(s),R(s),s′(s)>(s=1,2,…,S),计算Q值损失函数
式中:γ为折扣率。
S6,训练足够多回合数后结束训练,使用训练好的Q函数神经网络确定各状态下的动作并执行,不断重复直到所有故障恢复节点均被访问或分布式电源无剩余功率。

Claims (4)

1.基于分布式电源的深度强化学习配电网故障恢复方法,其特征在于,包括:
根据配电网电气节点间的连接关系,建立配电网的电气拓扑图,合并节点形成故障恢复节点,并以联络开关为边,建立故障恢复拓扑图;
以每个分布式电源为智能体,建立故障恢复的多智能体马尔科夫决策过程模型;
在训练阶段使用DeepWalk获取故障恢复拓扑图的节点表示向量;
各智能体分别拼接观察到的状态向量及其所在故障恢复节点的表示向量,输入到由全连接神经网络构建的Q函数神经网络,得到各个动作的Q值,并使用∈-greedy方法采样动作并执行;收集由当前状态、当前动作、当前回报、下一状态组成的四元组并放入经验池;
当经验池中的四元组数量足够多时,从经验池中批量采样四元组计算Q值损失函数,并使用Adam优化算法更新神经网络参数;若存在故障恢复节点未被访问且分布式电源仍有剩余功率,返回第三步,否则结束一轮回合的训练;
训练足够多回合数后结束训练,使用训练好的Q函数神经网络确定各状态下的动作并执行,不断重复直到所有故障恢复节点均被访问或分布式电源无剩余功率;
所述在训练阶段使用DeepWalk获取故障恢复拓扑图的节点表示向量,包括:
随机初始化故障恢复节点表示矩阵其中/>表示故障恢复节点的个数,d为故障恢复节点表示的维数;矩阵第v行表示故障恢复节点v的d维表示向量,记作Φ(v);
在第p次遍历时(p=1,2,…,Np,共遍历Np次),乱序遍历中的顶点vp,以vp作为起始节点,在图/>中随机游走τ步,记录每次随机游走经过的故障恢复节点序列/>
使用SkipGram训练节点表示模型;顺序遍历序列中的节点/> 在vq前后分别截取大小为w的窗,对任意的/> 计算损失函数J(Φ)=-logPr(vo|vq),
式中:Pr(vo|vq)表示以vq为中心节点时,前后大小为w的窗内包含节点vo的概率,可采用分层Softmax方法近似计算;
使用梯度下降法,更新矩阵Φ中的元素
式中:α为学习率;
所述各智能体分别拼接观察到的状态向量及其所在故障恢复节点的表示向量,输入到由全连接神经网络构建的Q函数神经网络,得到各个动作的Q值,并使用∈-greedy方法采样动作并执行;收集由当前状态、当前动作、当前回报、下一状态组成的四元组并放入经验池,包括:
设第i个智能体在t时刻所在的故障恢复节点为vi,t,拼接观察的状态向量和节点表示向量得到向量s′i,t
设第i个智能体的Q函数使用全连接神经网络计算,共有Li层,第l层神经网络的参数为Wi l,偏置为其中第Li层神经网络输出的维数和第i个智能体的动作空间相等;则t时刻第l层神经网络的输出/>与输入/>的关系为
式中:ReLU(·)为ReLU激活函数;
第1层神经网络的输入为向量s′i,t,第Li层神经网络输出/>为在状态si,t下各动作的Q函数值;
设选取随机动作的概率为∈,按均匀分布采样p∈[0,1],则第i个智能体在t时刻的动作ai,t满足
式中:rand(·)表示在集合中按均匀分布随机采样,表示第i个智能体的动作空间,Q(si,t,a)表示状态si,t下动作a的Q函数值。
2.根据权利要求1所述的基于分布式电源的深度强化学习配电网故障恢复方法,其特征在于,所述根据配电网电气节点间的连接关系,建立配电网的电气拓扑图,合并节点形成故障恢复节点,并以联络开关为边,建立故障恢复拓扑图,包括:
断开所有联络开关,选择未被访问的电气节点,在电气拓扑图中进行深度优先或广度优先搜索,同时在搜索的过程中标记访问过的电气节点;
每次搜索完成后,合并本次搜索过程中访问的电气节点作为故障恢复节点v,记故障恢复节点构成的集合为若仍有电气节点未被访问则返回,否则结束搜索;
以联络开关作为各故障恢复节点间的边e,记边构成的集合为ε;建立故障恢复拓扑图
3.根据权利要求1所述的基于分布式电源的深度强化学习配电网故障恢复方法,其特征在于,所述以每个分布式电源为智能体,建立故障恢复的多智能体马尔科夫决策过程模型,包括:
环境:故障恢复过程中的配电网;
智能体:为每个分布式电源分配一个智能体,决定每个分布式电源恢复供电的节点;记共有N个智能体;
状态:记第i个智能体在t时刻所观察的状态si,t,构成的集合为各智能体在t时刻观察的状态组成的向量为st;si,t由三部分组成:第i个智能体在t时刻前访问经过的故障恢复节点,第i个智能体在t时刻所处的故障恢复节点,第i个智能体在t时刻剩余的功率;
动作:记第i个智能体在t时刻的动作ai,t,构成的集合为各智能体在t时刻动作组成的向量为at;ai,t表示第i个智能体在t时刻处于状态si,t时,t+1时刻访问的故障恢复节点;由于两个故障恢复节点间由联络开关连接,因此执行动作ai,t等价于合上第i个智能体在t时刻和t+1时刻所处的故障恢复节点之间的联络开关;
状态转移概率:t时刻在状态st=[s1,t,s2,t,…,sN,t]下,各智能体选择的动作为at=[a1,t,a2,t,…,aN,t]时,t+1时刻状态为st+1=[s1,t+1,s2,t+1,…,sN,t+1]的概率
回报:记t时刻在状态st下,各智能体选择的动作为at时,第i个智能体获得的回报为Ri,t(st,at),各智能体回报组成的向量为Rt=[R1,t,R2,t,…,RN,t];该回报由以下4部分求和得到:
1)恢复供电的负荷功率
式中:为第i个智能体执行动作ai,t,到达未访问过的故障恢复节点v后,所恢复供电的负荷功率,Δt为状态转移前后的时间差,本发明取1;
2)执行动作后,到达已访问过的故障恢复节点的惩罚
式中:为第i个智能体执行动作ai,t,到达已访问过的故障恢复节点v后,该节点已被恢复供电的负荷功率;
3)潮流越限程度惩罚
式中:Pf、Qf为支路f的有功、无功潮流,为支路f的有功、无功潮流的最大值,支路构成的集合为/>Vb和/>为电气节点b的电压幅值及最大值,电气节点构成的集合为/>wp、wq、wv为有功、无功、电压越限的惩罚系数,本发明均取1。
4.根据权利要求1所述的基于分布式电源的深度强化学习配电网故障恢复方法,其特征在于,所述当经验池中的四元组数量足够多时,从经验池中批量采样四元组计算Q值损失函数,并使用Adam优化算法更新神经网络参数;若存在故障恢复节点未被访问且分布式电源仍有剩余功率,返回步骤3),否则结束一轮回合的训练,包括:
存储四元组<st,at,Rt,st+1>到经验池至本回合终止,返回步骤4)开始下一回合,直到经验池有足够多的四元组;
从经验池中随机采样S个四元组<s(s),a(s),R(s),s′(s)>(s=1,2,…,S),计算Q值损失函数
式中:γ为折扣率。
CN202210005264.0A 2022-01-05 2022-01-05 基于分布式电源的深度强化学习配电网故障恢复方法 Active CN114243799B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210005264.0A CN114243799B (zh) 2022-01-05 2022-01-05 基于分布式电源的深度强化学习配电网故障恢复方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210005264.0A CN114243799B (zh) 2022-01-05 2022-01-05 基于分布式电源的深度强化学习配电网故障恢复方法

Publications (2)

Publication Number Publication Date
CN114243799A CN114243799A (zh) 2022-03-25
CN114243799B true CN114243799B (zh) 2023-11-07

Family

ID=80745734

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210005264.0A Active CN114243799B (zh) 2022-01-05 2022-01-05 基于分布式电源的深度强化学习配电网故障恢复方法

Country Status (1)

Country Link
CN (1) CN114243799B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115086149B (zh) * 2022-05-26 2023-03-24 北京理工大学 一种通信故障下多智能体拓扑恢复的方法
CN115118477B (zh) * 2022-06-22 2024-05-24 四川数字经济产业发展研究院 一种基于深度强化学习的智能电网状态恢复方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015078172A1 (zh) * 2013-11-28 2015-06-04 国家电网公司 一种配电网多重故障供电恢复方法
CN110263846A (zh) * 2019-06-18 2019-09-20 华北电力大学 基于故障数据深度挖掘及学习的故障诊断方法
WO2020247949A1 (en) * 2019-06-07 2020-12-10 The Regents Of The University Of California General form of the tree alternating optimization (tao) for learning decision trees
CN112671029A (zh) * 2020-11-30 2021-04-16 国网浙江宁波市鄞州区供电有限公司 一种含分布式电源的配网多阶段故障恢复方法
CN113872198A (zh) * 2021-09-29 2021-12-31 电子科技大学 一种基于强化学习方法的主动配电网故障恢复方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11218498B2 (en) * 2018-09-05 2022-01-04 Oracle International Corporation Context-aware feature embedding and anomaly detection of sequential log data using deep recurrent neural networks
CN109635917B (zh) * 2018-10-17 2020-08-25 北京大学 一种多智能体合作决策及训练方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015078172A1 (zh) * 2013-11-28 2015-06-04 国家电网公司 一种配电网多重故障供电恢复方法
WO2020247949A1 (en) * 2019-06-07 2020-12-10 The Regents Of The University Of California General form of the tree alternating optimization (tao) for learning decision trees
CN110263846A (zh) * 2019-06-18 2019-09-20 华北电力大学 基于故障数据深度挖掘及学习的故障诊断方法
CN112671029A (zh) * 2020-11-30 2021-04-16 国网浙江宁波市鄞州区供电有限公司 一种含分布式电源的配网多阶段故障恢复方法
CN113872198A (zh) * 2021-09-29 2021-12-31 电子科技大学 一种基于强化学习方法的主动配电网故障恢复方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
含DGs的配网多阶段故障恢复;丁阳;陈春;宾峰;吕建红;;湖南大学学报(自然科学版)(第04期);全文 *
基于ICQPSO的配电网故障恢复重构;陈新岗;罗浩;金雅珍;陈姝婷;杨平;朱莹月;谭悦;;重庆理工大学学报(自然科学)(第09期);全文 *

Also Published As

Publication number Publication date
CN114243799A (zh) 2022-03-25

Similar Documents

Publication Publication Date Title
CN114243799B (zh) 基于分布式电源的深度强化学习配电网故障恢复方法
CN113511082B (zh) 基于规则和双深度q网络的混合动力汽车能量管理方法
CN115632179B (zh) 一种锂离子电池智能快速充电方法及系统
CN112671029A (zh) 一种含分布式电源的配网多阶段故障恢复方法
CN115099606B (zh) 一种电网调度模型的训练方法及终端
CN114726045B (zh) 一种基于ipea-lstm模型的锂电池soh估计方法
CN111812519A (zh) 一种电池参数辨识方法及系统
CN113570039A (zh) 一种基于强化学习的优化共识的区块链系统
CN112526354A (zh) 一种锂电池健康状态估计方法
CN113313265A (zh) 基于带噪声专家示范的强化学习方法
CN111401515A (zh) 利用训练过程压缩和记忆巩固构建增量式lstm的方法
CN116345578A (zh) 基于深度确定性策略梯度的微电网运行优化调度方法
CN111260015A (zh) 一种基于混沌猫群算法的锂离子电池模型参数辨识方法
Head Circular suggestions for DNA computing
CN106779094A (zh) 一种基于随机反馈的限制玻尔兹曼机学习方法与装置
CN115577647B (zh) 电网故障类型识别方法与智能体构建方法
CN115712987A (zh) 一种基于神经网络的锂电池复合电极锂离子传输模型的求解方法
CN114048576B (zh) 一种稳定电网输电断面潮流的储能系统智能化控制方法
CN115829258A (zh) 基于多项式混沌近似动态规划的电力系统经济调度方法
Huang Application of genetic based fuzzy systems to hydroelectric generation scheduling
El-Sharkawi et al. Development of genetic algorithm embedded Kohonen neural network for dynamic security assessment
CN113239622A (zh) 一种直流配网的故障恢复重构方法
Phiromlap et al. A frequency-based updating strategy in compact genetic algorithm
CN114330649B (zh) 一种基于进化学习和深度强化学习的电压调节方法及系统
CN117856336A (zh) 一种多时间尺度协同的日内有功备用快速配置方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant