CN114970351A - 基于注意力机制和深度强化学习的电网潮流调整方法 - Google Patents

基于注意力机制和深度强化学习的电网潮流调整方法 Download PDF

Info

Publication number
CN114970351A
CN114970351A CN202210601241.6A CN202210601241A CN114970351A CN 114970351 A CN114970351 A CN 114970351A CN 202210601241 A CN202210601241 A CN 202210601241A CN 114970351 A CN114970351 A CN 114970351A
Authority
CN
China
Prior art keywords
power
power flow
adjustment
target
attention mechanism
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210601241.6A
Other languages
English (en)
Inventor
王灿
徐震宇
叶德仕
史麒豪
冯雁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN202210601241.6A priority Critical patent/CN114970351A/zh
Publication of CN114970351A publication Critical patent/CN114970351A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2113/00Details relating to the application field
    • G06F2113/04Power grid distribution networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2119/00Details relating to the type or aim of the analysis or the optimisation
    • G06F2119/02Reliability analysis or reliability optimisation; Failure analysis, e.g. worst case scenario performance, failure mode and effects analysis [FMEA]
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Supply And Distribution Of Alternating Current (AREA)

Abstract

基于注意力机制和深度强化学习的电网潮流调整方法。本发明基于注意力机制构建深度强化学习模型,能够自动学习并解决电网潮流调整任务。首先基于马尔可夫决策过程和潮流仿真程序构建强化学习交互环境,基于注意力机制构建神经网络模型作为智能体;之后随机初始化电网潮流状态,随机选择需要进行潮流调整的电网线路或断面并随机设定合理范围内的目标功率;随后智能体与环境交互采集数据存入经验池,使用双竞争深度Q网络算法训练更新智能体参数。本发明的优点在于,通过智能体自主与环境交互来学习发电机调度策略,实现了断面功率控制的自动化,相比基于专家知识的人工调整方法具有更强的自适应性;引入注意力机制,建模捕获调整目标和全局电气特征的关系,提高了算法的准确度。

Description

基于注意力机制和深度强化学习的电网潮流调整方法
技术领域
本发明涉及智能电网潮流调整的技术领域,特别是基于人工智能技术的智能电网潮流调整技术领域。
背景技术
为满足社会和工业日益增长的电力负荷需求,我国电力系统的建设规模不断扩大。随着我国工业信息化进程的推进,电力系统对自动化、智能化的要求逐步提高。而传统的电力分析和控制技术在当代大规模电网中效率低、成本高,亟需向智能电网进行转变。人工智能是建设新型电力系统的关键支撑技术,是助力电网向高质量发展的关键通路。
电网潮流调整是电网日常运行控制中的关键任务,通过对全网发电机功率的调度来控制电网中电力潮流状态分布,从而使得电力输送在不断变化的电力负荷情况下达到预期状态。电网潮流状态的典型体现是电网断面功率,断面是电力系统中某些线路的集合,其通常代表了不同区域间的电力交换。该任务的自动化程度体现了电网的智能化水平,也决定了电网运行的安全性和稳定性。
尽管能够借助一些潮流仿真和分析技术来帮助电网调度人员进行电网潮流调整,但现实中该任务的高效完成通常比较依赖于调度专家的长期经验,在当前包含新能源结构的复杂大规模电网中难以满足实时性的调度需求和随机性强的电力潮流分布变化调整。以深度强化学习为代表的人工智能技术能够在自动学习和求解序列决策问题,是实现电网潮流调整的新型技术。
发明内容
为了克服现有电网潮流方法依赖专家经验、效率低、泛化能力有限等不足,本发明提出了一种无需人工干预的、智能的、泛化能力强的基于注意力机制和深度强化学习的电网潮流调整方法。
本发明方法通过与电力系统仿真环境交互,训练智能体学习在不同潮流环境和调整目标下的最优发电机调度策略,同时引入注意力机制建模待调整目标和其他电气特征的隐式关系,提高智能体性能。
基于注意力机制和深度强化学习的电网潮流调整方法,包括以下步骤:
1)基于马尔可夫决策过程和潮流仿真程序构建强化学习交互环境,基于注意力机制构建神经网络模型作为智能体;
2)随机初始化电网潮流状态,随机选择需要进行潮流调整的电网线路或断面并随机设定合理范围内的目标功率;
3)智能体与环境交互采集数据存入经验池,使用双竞争深度Q网络(D3QN)算法训练更新智能体参数;
4)使用训练完成的智能体在给定潮流和目标下输出调度序列进行潮流调整。
所述步骤1)中的强化学习交互环境构建过程如下:基于潮流调整问题定义强化学习基本要素,包括观测状态、奖励函数、动作值等。观测状态包括全网支路、母线节点的电气特征(有功功率、无功功率数值)和位置特征(离散编号)以及待调整支路或断面的目标电气特征和位置特征;奖励函数定义为当前潮流调整目标值和当前值的距离函数;动作值定义为发电机的离散调整量,对于G台可调发电机,当每台发电机具有C种调整措施时,动作空间大小为C×G。
进一步,步骤1)中的基于注意力机制构建神经网络模型作为智能体的过程如下:
(1.1)为每个观测状态设置W个可学习的参数,与原始数值相乘后每个观测状态可得到长度为W的嵌入向量。将同一电气对象(支路或母线节点)的有功功率、无功功率、位置特征对应的嵌入向量进行拼接,得到长度为3W的嵌入向量,将不同嵌入向量叠加,得到维度大小为(M+N,3W)的观测特征输入矩阵,行数M代表不同电气对象的数量,N代表预设待调整对象的数量,待调整对象数量少于N时,不足的行全部置0;
(1.2)构建注意力机制模块,输入分别经过维度三个大小为(3W,W)的线性变换矩阵得到查询向量矩阵Q,键向量矩阵K,值向量矩阵V。然后经过注意力运算,输出值向量矩阵的加权表示,运算公式如下:
Figure BDA0003669320720000021
其中softmax(t)函数公式为
Figure BDA0003669320720000022
t代表向量。
(1.3)设置T组并排的注意力机制模块,将观测特征矩阵分别输入每组注意力机制模块,学习不同隐式空间下的嵌入向量表达,分别得到维度大小为(M+N,W)的输出矩阵
(1.4)将T个输出矩阵拼接得到维度大小为(M+N,T·W)的矩阵,经过一个维度大小为(T·W,O)的信息提取矩阵后,展平为一维向量后再经过若干层全连接网络层及ReLU激活函数得到动作价值预估向量。
步骤3)所述的智能体训练过程具体为:
(3.1)智能体从交互环境获取观测变量,输入模型得到预估的动作价值,选择预估价值最大的动作,执行对应的发电机调度策略,由交互环境中的电力仿真程序进行潮流计算,进行状态状态转移得到新的观测变量,根据潮流调整的结果带入奖励函数得到奖励值;
(3.2)将每次交互过程中的观测变量、动作、奖励值、更新后的观测变量等信息以元组的形式存入经验池中;
(3.3)若经验池中的元组数量超过1024,则从中随机抽取1024条数据,基于批随机梯度下降的方式计算D3QN中的预估网络和目标网络的梯度并更新参数。其中目标网络采用软更新的方式进行参数的延迟更新,公式为:
θ′i+1=(1-ε)θ′i+εθi (2)
其中θi代表当前时刻预估网络的参数,θ′i表示当前时刻目标网络的参数,θ′i+1代表下一时刻(即更新后)目标网络的参数,ε为更新系数,要求0<ε<<1,使得目标网络的更新比较平缓
(3.4)重复步骤(3.1)至(3.4)直到最大预设次数。
其中步骤(3.1)中的状态转移过程为:修改调整策略中对应发电机的有功出力参数,执行潮流计算仿真,输出新的潮流分布结果文件,交互环境从结果文件中读取相关参数,更新观测状态中的支路有功功率、支路无功功率、母线有功功率、母线无功功率。
步骤4)中使用训练完成的智能体在给定潮流和目标下输出调度序列进行潮流调整的具体过程为:仅使用D3QN中的预估网络加载训练好的模型权重,将当前潮流状态以观测变量的形式输入模型,得到各个发电机调整动作的价值评估,选取预估价值最大的策略执行,重新运行潮流计算,验证潮流调整是否达到目标,若未达到,再次输入更新后的潮流状态重复上述行为,直到达到潮流调整目标,调整成功,或达到最大尝试次数,得到最接近的调整方案。
本发明基于注意力机制构建深度强化学习模型,能够自动学习并解决电网潮流调整任务。首先基于马尔可夫决策过程和潮流仿真程序构建强化学习交互环境,基于注意力机制构建神经网络模型作为智能体;之后随机初始化电网潮流状态,随机选择需要进行潮流调整的电网线路或断面并随机设定合理范围内的目标功率;随后智能体与环境交互采集数据存入经验池,使用双竞争深度Q网络算法训练更新智能体参数。
本发明的优点在于,通过智能体自主与环境交互来学习发电机调度策略,实现了断面功率控制的自动化,相比基于专家知识的人工调整方法具有更强的自适应性;引入注意力机制,建模捕获调整目标和全局电气特征的关系,提高了算法的准确度。
附图说明
图1是本发明的总体流程图。
图2是本发明的模型训练的框架图。
具体实施方式
参照附图,进一步说明本发明:
基于注意力机制和深度强化学习的电网潮流调整方法,其总体流程图参照图1,该方法包括以下步骤:
1)基于马尔可夫决策过程和潮流仿真程序构建强化学习交互环境,基于注意力机制构建神经网络模型作为智能体;
2)随机初始化电网潮流状态,随机选择需要进行潮流调整的电网线路或断面并随机设定合理范围内的目标功率;
3)智能体与环境交互采集数据存入经验池,使用双竞争深度Q网络(D3QN)算法训练更新智能体参数;
4)使用训练完成的智能体在给定潮流和目标下输出调度序列进行潮流调整。
所述步骤1)中的强化学习交互环境构建过程如下:基于潮流调整问题定义强化学习基本要素,包括观测状态、奖励函数、动作值等。观测状态包括全网支路、母线节点的电气特征(有功功率、无功功率数值)和位置特征(离散编号)以及待调整支路或断面的目标电气特征和位置特征;奖励函数定义为当前潮流调整目标值和当前值的距离函数;动作值定义为发电机的离散调整量,对于NG台可调发电机,当每台发电机具有C种调整措施时,动作空间大小为C·NG
进一步,奖励函数R根据为目标线路/断面的目标功率和的差距给予负奖励:
R=-|Pc-Pgoal| (1)
其中,Pc代表目标线路/断面当前功率值,Pgoal代表其目标功率值。
潮流调整任务中通过修改发电机有效标志或有功出力来调整断面功率,构成离散动作空间,具体地,对于电网中的NG台可调发电机,对某发电机共可以有4种调整行为,分别代表关闭发电机、调至1/4出力、调至1/2出力、调回原始出力,则动作空间大小为:4·NG,动作A表示为从动作空间中选择的一个具体动作:
A=ai,i∈[0,4·NG] (2)
更进一步,步骤1)中的基于注意力机制构建神经网络模型作为智能体的过程如下:
(1.1)为每个观测状态设置W个可学习的参数,与原始数值相乘后每个观测状态可得到长度为W的嵌入向量。其中W可根据电网参数量规模大小和算力资源进行灵活设置,如W=8。将同一电气对象(支路或母线节点)的有功功率、无功功率、位置特征对应的嵌入向量进行拼接,得到长度为3W的嵌入向量,将不同嵌入向量叠加,得到维度大小为(M+N,3W)的观测特征输入矩阵,行数M代表不同电气对象的数量,N代表预设待调整对象的数量,待调整对象数量少于N时,不足的行全部置0;
(1.2)构建注意力机制模块,输入分别经过三个维度大小为(3W,W)的线性变换矩阵得到查询向量矩阵Q,键向量矩阵K,值向量矩阵V。然后经过注意力运算,输出值向量矩阵的加权表示,运算公式如下:
Figure BDA0003669320720000041
其中softmax(t)函数公式为
Figure BDA0003669320720000042
t代表向量。
(1.3)设置T组并排的注意力机制模块,将观测特征矩阵分别输入每组注意力机制模块,学习不同隐式空间下的嵌入向量表达,分别得到维度大小为(M+N,W)的输出矩阵
(1.4)将T个输出矩阵拼接得到维度大小为(M+N,T·W)的矩阵,经过一个维度大小为(T·W,O)的信息提取矩阵后,展平为一维向量后再经过若干层全连接网络层及ReLU激活函数得到动作价值预估向量。
步骤3)的智能体训练过程可参照图2,具体为:
(3.1)智能体从交互环境获取观测变量,输入模型得到预估的动作价值,选择预估价值最大的动作,执行对应的发电机调度策略,由交互环境中的电力仿真程序进行潮流计算,得到更新后的观测变量,根据潮流调整的结果带入奖励函数得到奖励值;
(3.2)将每次交互过程中的观测变量、动作、奖励值、更新后的观测变量等信息以元组的形式存入经验池中;
(3.3)若经验池中的元组数量超过1024,则从中随机抽取1024条数据,基于批随机梯度下降的方式计算D3QN中的预估网络和目标网络的梯度并更新参数。其中目标网络采用软更新的方式进行参数的延迟更新,公式为:
θ′i+1=(1-ε)θ′i+εθi (4)
其中θi代表当前时刻预估网络的参数,θ′i表示当前时刻目标网络的参数,θ′i+1代表下一时刻(即更新后)目标网络的参数,ε为更新系数,要求0<ε<<1,使得目标网络的更新比较平缓
(3.4)重复步骤(3.1)至(3.4)直到最大预设次数。
其中步骤(3.1)中的状态转移过程为:修改调整策略中对应发电机的有功出力参数,执行潮流计算仿真,输出新的潮流分布结果文件,交互环境从结果文件中读取相关参数,更新观测状态中的支路有功功率、支路无功功率、母线有功功率、母线无功功率。
步骤4)中使用训练完成的智能体在给定潮流和目标下输出调度序列进行潮流调整的具体过程为:仅使用D3QN中的预估网络加载训练好的模型权重,将当前潮流状态以观测变量的形式输入模型,得到各个发电机调整动作的价值评估,选取预估价值最大的策略执行,重新运行潮流计算,验证潮流调整是否达到目标,若未达到,再次输入更新后的潮流状态重复上述行为,直到达到潮流调整目标,调整成功,或达到最大尝试次数,得到最接近的调整方案。
本发明提出了基于注意力机制和深度强化学习的电网潮流调整方法,其优点在于:采用深度强化方法解决复杂的电网潮流调整问题,无需对复杂的电力系统建模,通过智能体自主与环境交互来学习发电机调度策略,实现了断面功率控制的自动化,相比基于专家知识的人工调整方法具有更强的自适应性;引入注意力机制,建模捕获调整目标和全局电气特征的关系,提高算法的准确度。
本说明书实施例所述的内容仅仅是对发明构思的实现形式的列举,本发明的保护范围不应当被视为仅限于实施例所陈述的具体形式,本发明的保护范围也及于本领域技术人员根据本发明构思所能够想到的等同技术手段。

Claims (5)

1.基于注意力机制和深度强化学习的电网潮流调整方法,其特征在于基本步骤如下:
1)基于马尔可夫决策过程和潮流仿真程序构建强化学习交互环境,基于注意力机制构建神经网络模型作为智能体;
2)随机初始化电网潮流状态,随机选择需要进行潮流调整的电网线路或断面并随机设定合理范围内的目标功率;
3)智能体与环境交互采集数据存入经验池,使用双竞争深度Q网络(D3QN)算法训练更新智能体参数;
4)使用训练完成的智能体在给定潮流和目标下输出调度序列进行潮流调整。
2.如权利要求1所述的电网潮流调整方法,其特征在于步骤1)的强化学习交互环境构建过程如下:基于潮流调整问题定义强化学习基本要素,包括观测状态、奖励函数、动作值等。观测状态包括全网支路、母线节点的电气特征(有功功率、无功功率数值)和位置特征(离散编号)以及待调整支路或断面的目标电气特征和位置特征;奖励函数定义为当前潮流调整目标值和当前值的距离函数;动作值定义为发电机的离散调整量,对于G台可调发电机,当每台发电机具有C种调整措施时,动作空间大小为C×G。
3.如权利要求1所述的电网潮流调整方法,其特征在于步骤1)中的基于注意力机制构建神经网络模型作为智能体的过程如下:
(1.1)为每个观测状态设置W个可学习的参数,与原始数值相乘后每个观测状态可得到长度为W的嵌入向量。将同一电气对象(支路或母线节点)的有功功率、无功功率、位置特征对应的嵌入向量进行拼接,得到长度为3W的嵌入向量,将不同嵌入向量叠加,得到维度大小为(M+N,3W)的观测特征输入矩阵,行数M代表不同电气对象的数量,N代表预设待调整对象的数量,待调整对象数量少于N时,不足的行全部置0;
(1.2)构建注意力机制模块,输入分别经过维度三个大小为(3W,W)的线性变换矩阵得到查询向量矩阵Q,键向量矩阵K,值向量矩阵V。然后经过注意力运算,输出值向量矩阵的加权表示,运算公式如下:
Figure FDA0003669320710000011
其中softmax(t)函数公式为
Figure FDA0003669320710000012
t代表向量。
(1.3)设置T组并排的注意力机制模块,将观测特征矩阵分别输入每组注意力机制模块,学习不同隐式空间下的嵌入向量表达,分别得到维度大小为(M+N,W)的输出矩阵
(1.4)将T个输出矩阵拼接得到维度大小为(M+N,T·W)的矩阵,经过一个维度大小为(T·W,O)的信息提取矩阵后,展平为一维向量后再经过若干层全连接网络层及ReLU激活函数得到动作价值预估向量。
4.如权利要求1所述的电网潮流调整方法,其特征在于步骤3)的智能体训练过程具体为:
(3.1)智能体从交互环境获取观测变量,输入模型得到预估的动作价值,选择预估价值最大的动作,执行对应的发电机调度策略,由交互环境中的电力仿真程序进行潮流计算,进行状态状态转移得到新的观测变量,根据潮流调整的结果带入奖励函数得到奖励值;
(3.2)将每次交互过程中的观测变量、动作、奖励值、更新后的观测变量等信息以元组的形式存入经验池中;
(3.3)若经验池中的元组数量超过1024,则从中随机抽取1024条数据,基于批随机梯度下降的方式计算D3QN中的预估网络和目标网络的梯度并更新参数。其中目标网络采用软更新的方式进行参数的延迟更新,公式为:
θ′i+1=(1-ε)θ′i+εθi (2)
其中θi代表当前时刻预估网络的参数,θ′i表示当前时刻目标网络的参数,θ′i+1代表下一时刻(即更新后)目标网络的参数,ε为更新系数,要求0<ε<<1,使得目标网络的更新比较平缓
(3.4)重复步骤(3.1)至(3.4)直到最大预设次数。
其中步骤(3.1)中的状态转移过程为:修改调整策略中对应发电机的有功出力参数,执行潮流计算仿真,输出新的潮流分布结果文件,交互环境从结果文件中读取相关参数,更新观测状态中的支路有功功率、支路无功功率、母线有功功率、母线无功功率。
5.如权利要求1所述的电网潮流调整方法,其特征在于步骤4)中使用训练完成的智能体在给定潮流和目标下输出调度序列进行潮流调整的具体过程为:仅使用D3QN中的预估网络加载训练好的模型权重,将当前潮流状态以观测变量的形式输入模型,得到各个发电机调整动作的价值评估,选取预估价值最大的策略执行,重新运行潮流计算,验证潮流调整是否达到目标,若未达到,再次输入更新后的潮流状态重复上述行为,直到达到潮流调整目标,调整成功,或达到最大尝试次数,得到最接近的调整方案。
CN202210601241.6A 2022-05-30 2022-05-30 基于注意力机制和深度强化学习的电网潮流调整方法 Pending CN114970351A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210601241.6A CN114970351A (zh) 2022-05-30 2022-05-30 基于注意力机制和深度强化学习的电网潮流调整方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210601241.6A CN114970351A (zh) 2022-05-30 2022-05-30 基于注意力机制和深度强化学习的电网潮流调整方法

Publications (1)

Publication Number Publication Date
CN114970351A true CN114970351A (zh) 2022-08-30

Family

ID=82957289

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210601241.6A Pending CN114970351A (zh) 2022-05-30 2022-05-30 基于注意力机制和深度强化学习的电网潮流调整方法

Country Status (1)

Country Link
CN (1) CN114970351A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115577647A (zh) * 2022-12-09 2023-01-06 南方电网数字电网研究院有限公司 电网故障类型识别方法与智能体构建方法
CN115660324A (zh) * 2022-10-09 2023-01-31 浙江大学 基于图强化学习的电网多断面越限调控方法和系统
CN115940294A (zh) * 2023-01-17 2023-04-07 中国电力科学研究院有限公司 多级电网实时调度策略调整方法、系统、设备及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112615379A (zh) * 2020-12-10 2021-04-06 浙江大学 基于分布式多智能体强化学习的电网多断面功率自动控制方法
CN114123178A (zh) * 2021-11-17 2022-03-01 哈尔滨工程大学 一种基于多智能体强化学习的智能电网分区网络重构方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112615379A (zh) * 2020-12-10 2021-04-06 浙江大学 基于分布式多智能体强化学习的电网多断面功率自动控制方法
CN114123178A (zh) * 2021-11-17 2022-03-01 哈尔滨工程大学 一种基于多智能体强化学习的智能电网分区网络重构方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CAO, D等: "Attention Enabled Multi-Agent DRL for Decentralized Volt-VAR Control of Active Distribution System Using PV Inverters and SVCs", 《 IEEE TRANSACTIONS ON SUSTAINABLE ENERGY》, vol. 12, no. 3, 31 July 2021 (2021-07-31), pages 1582 - 1592, XP011862135, DOI: 10.1109/TSTE.2021.3057090 *
徐劭翔: "互联电网输电能力计算及紧急控制策略研究", 《中国博士学位论文全文数据库 (工程科技Ⅱ辑)》, no. 5, 15 May 2019 (2019-05-15), pages 042 - 91 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115660324A (zh) * 2022-10-09 2023-01-31 浙江大学 基于图强化学习的电网多断面越限调控方法和系统
CN115660324B (zh) * 2022-10-09 2023-06-13 浙江大学 基于图强化学习的电网多断面越限调控方法和系统
CN115577647A (zh) * 2022-12-09 2023-01-06 南方电网数字电网研究院有限公司 电网故障类型识别方法与智能体构建方法
CN115940294A (zh) * 2023-01-17 2023-04-07 中国电力科学研究院有限公司 多级电网实时调度策略调整方法、系统、设备及存储介质
CN115940294B (zh) * 2023-01-17 2023-09-22 中国电力科学研究院有限公司 多级电网实时调度策略调整方法、系统、设备及存储介质

Similar Documents

Publication Publication Date Title
CN114970351A (zh) 基于注意力机制和深度强化学习的电网潮流调整方法
CN112615379B (zh) 基于分布式多智能体强化学习的电网多断面功率控制方法
CN108448610B (zh) 一种基于深度学习的短期风功率预测方法
CN114217524B (zh) 一种基于深度强化学习的电网实时自适应决策方法
CN110427006A (zh) 一种用于流程工业的多智能体协同控制系统及方法
CN113988449B (zh) 基于Transformer模型的风电功率预测方法
CN114119273A (zh) 一种园区综合能源系统非侵入式负荷分解方法及系统
CN116345469A (zh) 一种基于图神经网络的电网潮流调整方法
CN116151581A (zh) 一种柔性车间调度方法、系统及电子设备
CN114384931B (zh) 一种基于策略梯度的无人机多目标最优控制方法和设备
Carrillo-Santos et al. Wavenet identification of dynamical systems by a modified PSO algorithm
CN113743784A (zh) 一种基于深度强化学习的生产时序表智能生成方法
CN114154688A (zh) 光伏电站的短期功率预测方法
CN112488543A (zh) 基于机器学习的智慧工地智能排班方法及系统
CN116722541A (zh) 一种基于卷积神经网络的电力系统负荷预测方法及装置
CN116339942A (zh) 一种基于强化学习的分布式训练任务的自适应调度方法
CN115907000A (zh) 一种用于电力系统最优潮流预测的小样本学习方法
CN112752290B (zh) 一种无线基站数据流量预测方法和设备
CN114265674A (zh) 时序逻辑约束下基于强化学习的任务规划方法及相关装置
CN114545776A (zh) 多智能体控制方法及装置
CN114444763A (zh) 基于afsa-gnn的风电功率预测方法
CN113095642A (zh) 梯级水电计划编制方法、系统、设备及存储介质
CN115660324B (zh) 基于图强化学习的电网多断面越限调控方法和系统
CN111950691A (zh) 一种基于潜在动作表示空间的强化学习策略学习方法
CN114169493B (zh) 基于尺度感知神经架构搜索的多变量时间序列预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination