CN115660324B - 基于图强化学习的电网多断面越限调控方法和系统 - Google Patents
基于图强化学习的电网多断面越限调控方法和系统 Download PDFInfo
- Publication number
- CN115660324B CN115660324B CN202211227530.0A CN202211227530A CN115660324B CN 115660324 B CN115660324 B CN 115660324B CN 202211227530 A CN202211227530 A CN 202211227530A CN 115660324 B CN115660324 B CN 115660324B
- Authority
- CN
- China
- Prior art keywords
- power grid
- graph
- section
- matrix
- reinforcement learning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Abstract
基于图强化学习的电网多断面越限调控方法,首先,基于典型日构建一系列电网多断面越限数据集,并利用图卷积神经网络计算电网节点的嵌入矩阵,利用多层感知机计算断面任务的嵌入表示;根据节点嵌入和任务嵌入生成多断面任务归因图,用以指导智能体对发电机的调度行为;利用加权池化的方法提取电网图表示特征。然后,在基于竞争架构的深度Q网络基础上构建发电机调度强化学习框架,该框架根据电网图表示特征估计各动作的期望奖励值。最后,智能体通过该框架选择最合理的发电机调度动作,实现对电网多断面越限情景的调控。本发明还包括基于图强化学习的电网多断面越限调控系统。
Description
技术领域
本发明属于电网断面调控和强化学习学习领域,涉及一种电网多断面越限调控方法和系统。
背景技术
电网是一个复杂的非线性物理系统,具有特征维度大、不确定性高的特点。随着电力系统规模的迅速扩大和电力需求与发电的日益不平衡,其安全性、经济性与脆弱性等问题变得尤为重要。如今,电网调度人员更关注关键输电断面而不是单个机组。关键输电断面由专家经验确定,通常由一组有功潮流方向相同、电气距离相近的输电线路组成,调度员可以通过监控不同输电断面的功率来监测电网的运行状态。
关键断面潮流调控是电网运行的重要防御手段,然而,传统的调度方法对系统模型依赖程度较高,随着电力系统规模的不断扩大,这些传统方法的计算时间成本过高。此外,当电网中存在多个关键断面需要同时考量时,由于这些断面之间存在复杂的相互作用关系,甚至会产生冲突:对一个关键断面的潮流调整可能导致另一个关键断面因潮流转移而发生过载。因此,由于非线性、非凸的搜索空间存在组合爆炸、约束复杂等问题,传统的强化学习方法很难收敛,其探索时间不可接受。
作为高维控制问题的解决方案,深度强化学习侧重于从输入状态中提取特征并以端到端的方式提供响应动作。目前这种学习模式已经在许多基于游戏的任务和基于机器人的任务中取得了显著的成就,在电网领域中也有许多研究验证强化学习在处理一些控制问题上的能力,然而基于强化学习的断面控制方法需要针对不同的关键断面单独训练一个特定的策略,这需要大量的电网交互数据,也忽略了各个断面调控任务之间的耦合关系,限制了该方法在多断面协同调整中的应用。
发明内容
为解决上述问题,本发明提供一种基于图强化学习的电网多断面越限调控方法和系统。
本发明考虑电网数据的图网络结构特点,将电网数据建模为同构图数据,并在现有强化学习的基于竞争架构的深度Q网络基础上,提出了一种用于电网多断面越限调控的强化学习方法和系统。本发明的技术方案是:
基于图强化学习的电网多断面越限调控方法,包含如下步骤:
1.构建电网多断面越限数据;
为了验证本发明的有效性,需要构建图结构的电网多断面越限数据集,包含不同电网体系的电气特性参数、电网相关的拓扑结构、不同状态下各个节点的出力负载等信息。其中,电气特性参数为电网固有的一系列特征,用于潮流计算过程;电网拓扑结构中的母线对应于图结构中的节点,与母线相连的负载、机组的电压等信息视为节点的伴随属性,电网拓扑结构中联接两个母线的输电线或变压器对应于图结构中的边;由于真实电网运行中断面越限数据较少,这样会导致数据集的样本类比不平衡,因此利用电网仿真软件pandapower来构建数据集:首先根据电网的电气特性参数和拓扑结构建立电网仿真模型,然后基于典型日的数据随机修改该电网中不同发电机的有功出力,修改负载有功以维持发电-用电平衡,最后通过潮流计算筛选数据:将潮流计算收敛但断面越限的样本加入数据集;如此迭代多次,直到数据集中包含T个关键断面越限的电网样本,该数据集便可用于训练和验证电网多断面越限调控的强化学习智能体。
2.一个电网图状态可以被定义为s=(A,F),其中A是包含n个节点的邻接矩阵,F是节点特征矩阵,然后采用图卷积神经网络在电网图网络节点之间进行信息传递:
其中I是单位矩阵,/>是对角度数矩阵,矩阵/>的第i个对角元素为 表示矩阵/>的第i行第j列元素,/>是具有参数ψ的可训练权重矩阵,H(k)是经过k步计算之后的节点嵌入矩阵;使用节点特征矩阵F作为初始化输入节点嵌入矩阵H(0),在经过K次迭代计算之后可以生成最终的节点嵌入矩阵X=H(K);采用两个独立的图卷积网络f(·)分别计算两个节点嵌入矩阵:
其中N为电网节点的数量,dx为每个节点上的特征向量长度,Xρ用于生成多断面归因图;Xυ基于归因图进行加权池化,用以生成电网图的表示特征。
3.计算任务嵌入表示;
为了在强化学习中反映不同断面调控任务的特征,构建一个基于多层感知机的任务编码器,该编码器根据断面的独热编码计算出不同任务在神经网络中的嵌入表示:
4.生成多断面归因图;
5.提取电网图表示特征;
6.构建发电机调度强化学习模型;
采取基于竞争架构的深度Q网络来构建发电机调度强化学习模型,并利用步骤5中生成的电网图表示特征作为模型输入,在该架构中智能体采用一个具有参数θ的深度神经网络/>来估计特定状态/>下动作a的价值,动作的价值定义为在当前电网状态下执行动作后所得到的期望奖励值,而奖励值具体由电网环境中所使用的奖赏函数决定;智能体每次选择奖励值最高的动作对电网进行调控。
实现如本发明的基于图强化学习的电网多断面越限调控方法的系统,其特征在于,包括:电网多断面越限数据构建模块、电网节点嵌入矩阵计算模块、任务嵌入表示计算模块、多断面归因图生成模块、电网图表示特征提取模块、发电机调度强化学习模型构建模块。
基于图强化学习的电网多断面越限调控方法,首先,根据典型日构建一系列电网多断面越限数据集,并利用图卷积神经网络计算电网节点的嵌入矩阵,利用多层感知机计算断面任务的嵌入表示;根据节点嵌入和任务嵌入生成多断面任务归因图,用以指导智能体对发电机的调度行为;利用加权池化的方法提取电网图表示特征。然后,在基于竞争架构的深度Q网络基础上构建发电机调度强化学习框架,该框架根据电网图表示特征拟合各动作的价值。最后,智能体通过该框架选择价值最高的发电机调度动作,实现对电网多断面越限情景的调控。本发明还包括基于图强化学习的电网多断面越限调控系统。
本发明的优点是:考虑了电网数据的图网络结构特性,采用图卷积神经网络聚合提取电网数据的图表示特征。然后,引入基于注意力机制的多断面任务归因图,能够在高维非线性的电网断面调控问题中,找到独立于专家知识之外的关键发电机。最后,利用强化学习的基于竞争架构的深度Q网络进行决策学习,智能体学习到的策略能有效地针对多个断面进行协同调控。
附图说明
图1是本发明的电网多断面越限数据生成示意图。
图2是本发明的方法总示意图。
具体实施方式
下面结合附图,对本发明的技术方案进行清晰、完整的解释和描述。
一种基于图强化学习的电网多断面越限调控方法,包含如下步骤:
1.构建电网多断面越限数据;
为了验证本发明的有效性,需要构建图结构的电网多断面越限数据集,包含不同电网体系的电气特性参数、电网相关的拓扑结构、不同状态下各个节点的出力负载等信息。其中,电气特性参数为电网固有的一系列特征,用于潮流计算过程;电网拓扑结构中的母线对应于图结构中的节点,与母线相连的负载、机组的电压等信息视为节点的伴随属性,电网拓扑结构中联接两个母线的输电线或变压器对应于图结构中的边;由于真实电网运行中断面越限数据较少,这样会导致数据集的样本类比不平衡,因此利用电网仿真软件pandapower来构建数据集:首先根据电网的电气特性参数和拓扑结构建立电网仿真模型,然后基于典型日的数据随机修改该电网中不同发电机的有功出力,修改负载有功以维持发电-用电平衡,最后通过潮流计算筛选数据:将潮流计算收敛但断面越限的样本加入数据集;如此迭代多次,直到数据集中包含T个关键断面越限的电网样本,该数据集便可用于训练和验证电网多断面越限调控的强化学习智能体,在本发明中设置T=2000;(图1)
2.计算电网节点嵌入矩阵;
一个电网图状态可以被定义为s=(A,F),其中A是包含n个节点的邻接矩阵,F是节点特征矩阵,然后采用图卷积神经网络在电网图网络节点之间进行信息传递:
其中I是单位矩阵,/>是对角度数矩阵,矩阵/>的第i个对角元素为 表示矩阵/>的第i行第j列元素,/>是具有参数ψ的可训练权重矩阵,H(k)是经过k步计算之后的节点嵌入矩阵;使用节点特征矩阵F作为初始化输入节点嵌入矩阵H(0),在经过K次迭代计算之后可以生成最终的节点嵌入矩阵X=H(K);采用两个独立的图卷积网络f(·)分别计算两个节点嵌入矩阵:
其中N为电网节点的数量,dx为每个节点上的特征向量长度,Xρ用于生成多断面归因图;Xυ基于归因图进行加权池化,用以生成电网图的表示特征,在本发明中设置K=2;(图2)
3.计算任务嵌入表示;
为了在强化学习中反映不同断面调控任务的特征,构建一个基于多层感知机的任务编码器,该编码器根据断面的独热编码计算出不同任务在神经网络中的嵌入表示:
在本发明中设置M=5;(图2)
4.生成多断面归因图;
5.提取电网图表示特征;
6.构建发电机调度强化学习模型;
采取基于竞争架构的深度Q网络来构建发电机调度强化学习模型,并利用步骤5中生成的电网图表示特征作为模型输入,在该架构中智能体采用一个具有参数θ的深度神经网络/>来估计特定状态/>下动作a的价值,动作的价值定义为在当前电网状态下执行动作后所得到的期望奖励值,而奖励值具体由电网环境中所使用的奖赏函数决定;智能体每次选择奖励值最高的动作对电网进行调控。(图2)
实现本发明的基于图强化学习的电网多断面越限调控方法的系统,其特征在于,包括:电网多断面越限数据构建模块、电网节点嵌入矩阵计算模块、任务嵌入表示计算模块、多断面归因图生成模块、电网图表示特征提取模块、发电机调度强化学习模型构建模块,上述各模块依顺序分别包含本发明方法的步骤1~6的内容。
本说明书实施例所述的内容仅仅是对发明构思的实现形式的列举,本发明的保护范围的不应当被视为仅限于实施例所陈述的具体形式,本发明的保护范围也及于本领域技术人员根据本发明构思所能够想到的等同技术手段。
Claims (2)
1.基于图强化学习的电网多断面越限调控方法,包含如下步骤:
步骤1.构建电网多断面越限数据;
首先根据电网的电气特性参数和拓扑结构建立电网仿真模型,然后基于典型日的数据随机修改该电网中不同发电机的有功出力,修改负载有功以维持发电-用电平衡,最后通过潮流计算筛选数据:将潮流计算收敛但断面越限的样本加入数据集;如此迭代多次,直到数据集中包含T个关键断面越限的电网样本,该数据集便能用于训练和验证电网多断面越限调控的强化学习智能体;
步骤2.计算电网节点嵌入矩阵;
一个电网图状态可以被定义为s=(A,F),其中A是包含n个节点的邻接矩阵,F是节点特征矩阵,然后采用图卷积神经网络在电网图网络节点之间进行信息传递:
其中I是单位矩阵,/>是对角度数矩阵,矩阵/>的第i个对角元素为表示矩阵/>的第i行第j列元素,/>是具有参数ψ的可训练权重矩阵,H(k)是经过k步计算之后的节点嵌入矩阵;使用节点特征矩阵F作为初始化输入节点嵌入矩阵H(0),在经过K次迭代计算之后能生成最终的节点嵌入矩阵X=H(K);采用两个独立的图卷积网络f(·)分别计算两个节点嵌入矩阵:
其中N为电网节点的数量,dx为每个节点上的特征向量长度,Xρ用于生成多断面归因图;Xv基于归因图进行加权池化,用以生成电网图的表示特征;
步骤3.计算任务嵌入表示;
为了在强化学习中反映不同断面调控任务的特征,构建一个基于多层感知机的任务编码器,该编码器根据断面的独热编码计算出不同任务在神经网络中的嵌入表示:
步骤4.生成多断面归因图;
步骤5.提取电网图表示特征;
步骤6.构建发电机调度强化学习模型;
2.实现如权利要求1所述的基于图强化学习的电网多断面越限调控方法的系统,其特征在于,包括:电网多断面越限数据构建模块、电网节点嵌入矩阵计算模块、任务嵌入表示计算模块、多断面归因图生成模块、电网图表示特征提取模块、发电机调度强化学习模型构建模块。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211227530.0A CN115660324B (zh) | 2022-10-09 | 2022-10-09 | 基于图强化学习的电网多断面越限调控方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211227530.0A CN115660324B (zh) | 2022-10-09 | 2022-10-09 | 基于图强化学习的电网多断面越限调控方法和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115660324A CN115660324A (zh) | 2023-01-31 |
CN115660324B true CN115660324B (zh) | 2023-06-13 |
Family
ID=84988438
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211227530.0A Active CN115660324B (zh) | 2022-10-09 | 2022-10-09 | 基于图强化学习的电网多断面越限调控方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115660324B (zh) |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112512070A (zh) * | 2021-02-05 | 2021-03-16 | 之江实验室 | 一种基于图注意力机制强化学习的多基站协同无线网络资源分配方法 |
CN112615379A (zh) * | 2020-12-10 | 2021-04-06 | 浙江大学 | 基于分布式多智能体强化学习的电网多断面功率自动控制方法 |
CN113036772A (zh) * | 2021-05-11 | 2021-06-25 | 国网江苏省电力有限公司南京供电分公司 | 一种基于深度强化学习的配电网拓扑电压调节方法 |
CN113240105A (zh) * | 2021-03-30 | 2021-08-10 | 浙江大学 | 一种基于图神经网络池化的电网稳态判别方法 |
CN113496347A (zh) * | 2020-04-03 | 2021-10-12 | 罗伯特·博世有限公司 | 用于为多个机器调度作业集合的设备和方法 |
CN114362151A (zh) * | 2021-12-23 | 2022-04-15 | 浙江大学 | 一种基于深度强化学习和级联图神经网络的潮流收敛性调整方法 |
CN114757362A (zh) * | 2022-04-11 | 2022-07-15 | 西安交通大学 | 一种基于边缘增强的多智能体系统通信方法及相关装置 |
CN114865638A (zh) * | 2022-03-22 | 2022-08-05 | 武汉大学 | 一种基于图深度强化学习的电网低压减载紧急控制方法 |
CN114861747A (zh) * | 2022-02-25 | 2022-08-05 | 中国人民解放军国防科技大学 | 多层网络关键节点的识别方法、装置、设备和存储介质 |
CN114970351A (zh) * | 2022-05-30 | 2022-08-30 | 浙江大学 | 基于注意力机制和深度强化学习的电网潮流调整方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11310119B2 (en) * | 2020-03-19 | 2022-04-19 | Indian Institute Of Technology, Bombay | Using graph neural networks to create table-less routers |
US20210398439A1 (en) * | 2020-06-18 | 2021-12-23 | The Hong Kong University Of Science And Technology | Peer-inspired student performance prediction in interactive online question pools with graph neural network |
-
2022
- 2022-10-09 CN CN202211227530.0A patent/CN115660324B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113496347A (zh) * | 2020-04-03 | 2021-10-12 | 罗伯特·博世有限公司 | 用于为多个机器调度作业集合的设备和方法 |
CN112615379A (zh) * | 2020-12-10 | 2021-04-06 | 浙江大学 | 基于分布式多智能体强化学习的电网多断面功率自动控制方法 |
CN112512070A (zh) * | 2021-02-05 | 2021-03-16 | 之江实验室 | 一种基于图注意力机制强化学习的多基站协同无线网络资源分配方法 |
CN113240105A (zh) * | 2021-03-30 | 2021-08-10 | 浙江大学 | 一种基于图神经网络池化的电网稳态判别方法 |
CN113036772A (zh) * | 2021-05-11 | 2021-06-25 | 国网江苏省电力有限公司南京供电分公司 | 一种基于深度强化学习的配电网拓扑电压调节方法 |
CN114362151A (zh) * | 2021-12-23 | 2022-04-15 | 浙江大学 | 一种基于深度强化学习和级联图神经网络的潮流收敛性调整方法 |
CN114861747A (zh) * | 2022-02-25 | 2022-08-05 | 中国人民解放军国防科技大学 | 多层网络关键节点的识别方法、装置、设备和存储介质 |
CN114865638A (zh) * | 2022-03-22 | 2022-08-05 | 武汉大学 | 一种基于图深度强化学习的电网低压减载紧急控制方法 |
CN114757362A (zh) * | 2022-04-11 | 2022-07-15 | 西安交通大学 | 一种基于边缘增强的多智能体系统通信方法及相关装置 |
CN114970351A (zh) * | 2022-05-30 | 2022-08-30 | 浙江大学 | 基于注意力机制和深度强化学习的电网潮流调整方法 |
Non-Patent Citations (3)
Title |
---|
"A Dual-Attention Heterogeneous Graph Neural Network for Expert Recommendation in Online Agricultural Question and Answering Communities";Mingxia Zhao et al;《2022 IEEE 25th International Conference on Computer Supported Cooperative Work in Design (CSCWD)》;926-931 * |
"基于新一代人工智能技术的电力系统稳定评估与决策综述";杨博 等;《电力系统自动化》;46(22);202-223 * |
"基于深度强化学习的电动汽车充电调度算法研究进展";张延宇 等;《电力系统保护与控制》;第50卷(第16期);179-187 * |
Also Published As
Publication number | Publication date |
---|---|
CN115660324A (zh) | 2023-01-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105226643B (zh) | 安全约束下电力系统运行模拟模型快速生成与求解方法 | |
Miranda et al. | Evolutionary computation in power systems | |
Narimani et al. | A novel approach to multi-objective optimal power flow by a new hybrid optimization algorithm considering generator constraints and multi-fuel type | |
Capizzi et al. | Advanced and adaptive dispatch for smart grids by means of predictive models | |
Islam et al. | Development of chaotically improved meta-heuristics and modified BP neural network-based model for electrical energy demand prediction in smart grid | |
Hardiansyah et al. | Solving economic load dispatch problem using particle swarm optimization technique | |
Yang et al. | DISTRIBUTED OPTIMAL DISPATCH OF VIRTUAL POWER PLANT BASED ON ELM TRANSFORMATION. | |
CN111353910A (zh) | 有向拓扑下基于有限时间一致性的分布式智能电网经济调度方法 | |
Duan et al. | A deep reinforcement learning based approach for optimal active power dispatch | |
CN114142530A (zh) | 一种基于近端策略优化算法的考虑n-1安全约束的风险调度方法 | |
CN114970351A (zh) | 基于注意力机制和深度强化学习的电网潮流调整方法 | |
CN112330021A (zh) | 一种分布式光储系统的网络协调控制方法 | |
Zhang et al. | Deep reinforcement learning for load shedding against short-term voltage instability in large power systems | |
Abarghooee et al. | Stochastic dynamic economic emission dispatch considering wind power | |
CN113344283B (zh) | 基于边缘智能的能源互联网新能源消纳能力评估方法 | |
Li et al. | Distributed deep reinforcement learning for integrated generation‐control and power‐dispatch of interconnected power grid with various renewable units | |
CN115660324B (zh) | 基于图强化学习的电网多断面越限调控方法和系统 | |
CN116865358A (zh) | 多时长尺度电力系统风电弃风及负荷波动跟踪方法及设备 | |
Matavalam et al. | Curriculum based reinforcement learning of grid topology controllers to prevent thermal cascading | |
CN112949909B (zh) | 一种考虑多种不确定性并存的机组组合优化方法 | |
Salhi et al. | Fuzzy multi-objective optimal power flow using genetic algorithms applied to algerian electrical network | |
Sato et al. | Total optimization of a smart community by multi-population differential evolutionary particle swarm optimization | |
Moorthy et al. | Investigation on the effectiveness of ABC algorithm for hydrothermal energy management considering emission aspects | |
CN111105025A (zh) | 基于数据驱动启发式优化的城市高压配电网阻塞管理方法 | |
Abdelaziz et al. | A hybrid Hopfield neural network-quadratic programming approach for dynamic economic dispatch problem |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |