CN114172840A - 一种基于图论和深度强化学习的多微网系统能量路由方法 - Google Patents

一种基于图论和深度强化学习的多微网系统能量路由方法 Download PDF

Info

Publication number
CN114172840A
CN114172840A CN202210047981.XA CN202210047981A CN114172840A CN 114172840 A CN114172840 A CN 114172840A CN 202210047981 A CN202210047981 A CN 202210047981A CN 114172840 A CN114172840 A CN 114172840A
Authority
CN
China
Prior art keywords
energy
power
microgrid
router
cost
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210047981.XA
Other languages
English (en)
Other versions
CN114172840B (zh
Inventor
华昊辰
陈星莺
刘金坤
余昆
甘磊
梅飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hohai University HHU
Original Assignee
Hohai University HHU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hohai University HHU filed Critical Hohai University HHU
Priority to CN202210047981.XA priority Critical patent/CN114172840B/zh
Publication of CN114172840A publication Critical patent/CN114172840A/zh
Application granted granted Critical
Publication of CN114172840B publication Critical patent/CN114172840B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/12Shortest path evaluation
    • H04L45/124Shortest path evaluation using a combination of metrics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/11Complex mathematical operations for solving equations, e.g. nonlinear equations, general mathematical optimization problems
    • G06F17/12Simultaneous equations, e.g. systems of linear equations
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Operations Research (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Algebra (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Supply And Distribution Of Alternating Current (AREA)

Abstract

本发明公开了一种基于图论和深度强化学习的多微网系统能量路由方法,步骤如下:(1)风机、光伏、负荷、储能以及能量路由器功率模型构建;(2)建立单一微网功率平衡方程;(3)建立储能系统的成本损耗模型和使用寿命惩罚函数;(4)能量路由器及网络传输成本损耗模型;(5)利用图论的方法构建多微网系统环境状态空间;(6)建立能量路由器动作空间和来自拓扑结构改变的反馈奖励函数;(7)利用强化学习方法训练路由轨迹;(8)建立多微网间能量传输最小成本函数。本发明在使用图论的方法提取多微网拓扑结构的基础上用深度强化学习算法对电网数据加以分析和利用,综合考虑了储能系统的折损成本以及能量路由器和网络的损耗,有利于提高多微网系统能量管理的经济性。

Description

一种基于图论和深度强化学习的多微网系统能量路由方法
技术领域
本发明涉及电力系统理论和人工智能的交叉技术应用领域,特别是一种基于图论和深度强化学习的多微网系统能量路由方法。
背景技术
如今,人类社会的飞速发展加剧了化石能源的消耗,迫使人类面临能源危机,再加上国家“双碳”目标以及经济因素的影响,人们更加的重视利用可再生能源,如:风力发电、光伏发电等。构建含高比例可再生能源的能源互联网有助于促进能源系统绿色转型、实现“双碳”目标。而多微网系统作为区域能源互联网的一种典型场景,近年来备受关注。得益于传感技术与电力电子技术的发展,多微网系统中大量的分布式发电设备、分布式储能、可调节负荷等设备通过能量路由器相连接,促使能量从单向传输变为双向传输,保证可调节负荷的快速响应,以满足多微网系统中可再生能源消纳的要求。但是在进行多微网系统能量管理时,如果过度使用储能就会极大地增加储能寿命折损成本,而如果在微网间进行能量交换又会增加能量路由器和网络的损耗。因此,在多微网场景下,如何制定能量路由策略,实现就地消纳量和外部消纳量的合理分配,以实现多微网运行整体经济性最优成为了亟需解决的问题。
面对大量可控设备,传统的多微网能量管理方法通常需要本地基础结构来访问每个设备,这不仅导致成本增加,而且限制了处理数据的大小。此外电网中的大量数据掩盖了许多有价值的信息,传统方法很难对这些数据加以分析和利用。而随着储能装置及其应用的快速发展,传统方法很少考虑微网内储能设备充放电或进行微网间能量交互哪一个更符合能量管理经济性的要求。
发明内容
发明目的:本发明的目的是提供一种基于图论和深度强化学习的多微网系统能量路由方法,从而确保整个多微网系统运行成本最小。
技术方案:本发明所述的一种基于图论和深度强化学习的多微网系统能量路由方法,包括以下步骤:
(1)用随机微分方程模拟光伏、风机以及负荷的功率变化,建立光伏、风机、负荷的功率模型,利用常微分方程模拟储能系统充电状态,建立储能系统的功率模型,分析能量路由器能量传输方式,建立能量路由器的功率模型;
(1.1)用常微分线性方程模拟光伏、风机以及负荷的功率变化得到这些设备的初步功率模型,然后用维纳过程来模拟其随机性,在一系列反馈逼近后得到光伏、风机、负荷的功率模型;所述的光伏、风机、负荷的功率模型如下:
Figure BDA0003473183520000021
Figure BDA0003473183520000022
Figure BDA0003473183520000023
其中,PPV(t),PW(t),PL(t)分别表示光伏、风机以及负荷的输出功率,t为系统所处的时刻;
Figure BDA0003473183520000024
则是用线性常微分方程来建立光伏、风机发电时以及负荷用电时的功率初步模型,其中aPV,aW,aL为风机、光伏以及负荷时间常数的倒数的负值;
Figure BDA0003473183520000025
是利用维纳过程模拟的光伏、风机和负荷功率的随机项,其中ωPV(t),ωW(t),ωL(t)表示维纳过程,KPV,μPV,σPV,KW,μW,σW,K,Lμ,LσL为常数;
(1.2)将储能系统在t时刻的充电状态描述为SOC(t),利用常微分方程建立储能系统的功率模型;所述的储能系统的功率模型如下:
Figure BDA0003473183520000026
其中
Figure BDA0003473183520000031
为储能系统的输入/输出功率,QS为一常数,η(PBES(t))为控制储能系统的状态参数,ηi,ηo是储能系统输入/输出功率时的状态参数;
(1.3)建立能量路由器的功率模型,能量路由器是能源互联网领域的核心设备,它使得能量可以像网络中的信息交换那样进行能量传输;所述的能量路由器的功率模型如下:
PER(t)=KERUER(t),UER(t)∈[-1,1]
其中PER(t)是能量路由器的输入/输出功率,KER是通过能量路由器的预设值;UER(t)为能量路由器的控制器,当UER(t)=0时,能量路由器停止工作;UER(t)<0时,能量路由器从其他微网向该微网传输能量;UER(t)>0时,能量路由器从该微网向其他微网传输能量。
(2)根据输电线路上的功率偏差可以由储能系统吸收或者由能量路由器传输到其他微网这一假设及自下而上的能量管理原则建立单个微网的功率平衡方程;
步骤(2)所述的单个微网的功率平衡方程如下:
Figure BDA0003473183520000032
其中Pi_j(t)是微网的输出功率。
步骤(3)所述的储能系统的成本损耗模型如下:
Figure BDA0003473183520000033
其中CBES(t)为储能系统的成本损耗模型,T为终端设备运行时间,E为期望函数;
(3)建立储能系统的成本损耗模型和使用寿命惩罚函数;所述的惩罚函数如下:
Figure BDA0003473183520000034
Figure BDA0003473183520000041
为惩罚函数,将PBES(t)限制在储能设备的最大功率
Figure BDA0003473183520000042
之内从而实现储能设备的合理利用,减少储能设备的折损成本,提高储能设备使用寿命。
(4)建立能量路由器以及网络传输的成本损耗模型,计算能量路由器的最终传输成本和网络的功率损耗,得到网络的最终传输成本;
(4.1)建立能量路由器以及网络传输的成本损耗模型;所述的能量路由器以及网络传输的成本损耗模型如下:
Figure BDA0003473183520000043
其中CER(t),CLINE(t)为能量路由器及网络传输的成本损耗模型,KER,KLINE是价格系数,为了优先考虑那些能量损耗较小的能量路由器以及网络连接线间的损耗,能量路由器以及网络的传输成本应与功率损耗ΔpER,Δpi_j成正比;
(4.2)计算能量路由器的最终传输成本;所述的能量路由器的最终传输成本如下:
Figure BDA0003473183520000044
其中ηX,ηY分别为能量路由器输入端口和输出端口与公共输电线路之间的转换器的效率;
(4.3)计算网络的功率损耗;所述的网络的功率损耗为:
Figure BDA0003473183520000045
其中RI-J为线路的电阻,VI-J为线路电压,而由于线路的功率传输,功率损耗不是线性叠加的,传输成本会随着线路中功率的增加而增加,因此网络的最终传输成本为:
Figure BDA0003473183520000046
其中,
Figure BDA0003473183520000047
为网络最终传输成本,ΔPI-J为线路功率损耗。
(5)利用图论的方法描述能量路由器及网络传输的选择进而提取多微网系统的拓扑结构,其中所有能量路由器构成节点集合ER={ER1,ER2,...,ERN},所有输电线路构成线路集合L={Li_j,...},则两目标点A,B之间的路径可以看作:
path(A→B):=A≡RI,RJ,...,RK≡B
利用多微网系统的拓扑结构、在线监测数据以及模型计算数据构建环境状态空间st
(6)建立能量路由器的动作空间和来自拓扑结构改变的反馈奖励函数;
(6.1)建立能量路由器的动作空间;所述的能量路由器的动作空间为:
at∈{-1,0,1}
当at为-1时,微网向其他微网传输能量;当at为0时,微网间能量双向传输;当at为1时,由其他微网向该微网传输能量;系统跟据拓扑结构执行at,得到at∈A,其中A是多微网系统可能动作的集合;
(6.2)构建来自拓扑结构改变的反馈奖励函数;所述的来自拓扑结构改变的反馈奖励函数如下:
rt=-αBESΔCBES(t)-αERΔCER(t)-αLINEΔCLINE(t)
其中αBES是储能系统的折损权重,αER,αLINE是能量路由器以及网络损耗的权重,ΔCBES(t),ΔCER(t),ΔCLINE(t)是单次控制后各部分的损失。
(7)多微网系统通过执行at,使环境状态空间st转移到st+1,重复执行直到完成任务目标或者达到上限T,得到可应用于强化学习训练的路由轨迹;所述的路由轨迹为:
τ={(st,at,rt)|t=1...T}
其中,τ为路由轨迹。
(8)建立综合考虑微网内可再生能源自我消纳、微网内储能系统折损成本最小以及微网间能量传递损失最小的成本函数,用于评估出各状态及执行相应动作时未来可能获得的奖励期望。所述的成本函数为:
Figure BDA0003473183520000061
其中,
Figure BDA0003473183520000062
为训练后的储能设备、能量路由器、线路传输的成本。
一种计算机存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述的一种基于图论和深度强化学习的多微网系统能量路由方法。
一种计算机设备,包括储存器、处理器及存储在存储器上并可再处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述的一种基于图论和深度强化学习的多微网系统能量路由方法。
有益效果:与现有技术相比,本发明具有如下优点:
1、实现了自下而上的能量管理原则,使得每个微网的供需平衡都得到了优先维护,有利于为消费者提供更可靠的电源系统;
2、考虑了储能设备的合理使用以及合理地微网间能量交互,利用加权路由的方法有效提高了多微网系统能量路由的经济性;
3、将给定的多微网系统转化为图论中图的形式,对图中节点进行简化,更有利于体现和提取多微网系统的拓扑结构,提高计算效率;
4、利用深度强化学习算法进行反馈训练,提高了数据处理量上限有利于充分挖掘电网历史数据,降低计算成本。
附图说明
图1为本发明的步骤流程图;
图2为多微网系统场景图;
图3为多微网系统拓扑结构图。
具体实施方式
下面结合附图对本发明的技术方案作进一步说明。
如图1、2所示,一种基于图论和深度强化学习的多微网系统能量路由方法,包括以下步骤:
(1)用随机微分方程模拟光伏、风机以及负荷的功率变化,建立光伏、风机、负荷的功率模型,利用常微分方程模拟储能系统充电状态,建立储能系统的功率模型,分析能量路由器能量传输方式,建立能量路由器的功率模型;
(1.1)用常微分线性方程模拟光伏、风机以及负荷的功率变化得到这些设备的初步功率模型,然后用维纳过程来模拟其随机性,在一系列反馈逼近后得到光伏、风机、负荷的功率模型;所述的光伏、风机、负荷的功率模型如下:
Figure BDA0003473183520000071
Figure BDA0003473183520000072
Figure BDA0003473183520000073
其中,PPV(t),PW(t),PL(t)分别表示光伏、风机以及负荷的输出功率,t为系统所处的时刻;
Figure BDA0003473183520000074
则是用线性常微分方程来建立光伏、风机发电时以及负荷用电时的功率初步模型,其中aPV,aW,aL为风机、光伏以及负荷时间常数的倒数的负值;
Figure BDA0003473183520000075
是利用维纳过程模拟的光伏、风机和负荷功率的随机项,其中ωPV(t),ωW(t),ωL(t)表示维纳过程,KPV,μPV,σPV,KW,μW,σW
Figure BDA0003473183520000078
为常数;
(1.2)将储能系统在t时刻的充电状态描述为SOC(t),利用常微分方程建立储能系统的功率模型;所述的储能系统的功率模型如下:
Figure BDA0003473183520000076
其中
Figure BDA0003473183520000077
为储能系统的输入/输出功率,QS为一常数,η(PBES(t))为控制储能系统的状态参数,ηi,ηo是储能系统输入/输出功率时的状态参数;
(1.3)建立能量路由器的功率模型,能量路由器是能源互联网领域的核心设备,它使得能量可以像网络中的信息交换那样进行能量传输;所述的能量路由器的功率模型如下:
PER(t)=KERUER(t),UER(t)∈[-1,1]
其中PER(t)是能量路由器的输入/输出功率,KER是通过能量路由器的预设值;UER(t)为能量路由器的控制器,当UER(t)=0时,能量路由器停止工作;UER(t)<0时,能量路由器从其他微网向该微网传输能量;UER(t)>0时,能量路由器从该微网向其他微网传输能量。
(2)根据输电线路上的功率偏差可以由储能系统吸收或者由能量路由器传输到其他微网这一假设及自下而上的能量管理原则建立单个微网的功率平衡方程;
步骤(2)所述的单个微网的功率平衡方程如下:
Figure BDA0003473183520000081
其中Pi_j(t)是微网的输出功率。
步骤(3)所述的储能系统的成本损耗模型如下:
Figure BDA0003473183520000082
其中CBES(t)为储能系统的成本损耗模型,T为终端设备运行时间,E为期望函数;
(3)建立储能系统的成本损耗模型和使用寿命惩罚函数;所述的惩罚函数如下:
Figure BDA0003473183520000083
Figure BDA0003473183520000084
为惩罚函数,将PBES(t)限制在储能设备的最大功率
Figure BDA0003473183520000085
之内从而实现储能设备的合理利用,减少储能设备的折损成本,提高储能设备使用寿命。
(4)建立能量路由器以及网络传输的成本损耗模型,计算能量路由器的最终传输成本和网络的功率损耗,得到网络的最终传输成本;
(4.1)建立能量路由器以及网络传输的成本损耗模型;所述的能量路由器以及网络传输的成本损耗模型如下:
Figure BDA0003473183520000091
其中CER(t),CLINE(t)为能量路由器及网络传输的成本损耗模型,KER,KLINE是价格系数,为了优先考虑那些能量损耗较小的能量路由器以及网络连接线间的损耗,能量路由器以及网络的传输成本应与功率损耗ΔpER,Δpi_j成正比;
(4.2)计算能量路由器的最终传输成本;所述的能量路由器的最终传输成本如下:
Figure BDA0003473183520000092
其中ηX,ηY分别为能量路由器输入端口和输出端口与公共输电线路之间的转换器的效率;
(4.3)计算网络的功率损耗;所述的网络的功率损耗为:
Figure BDA0003473183520000093
其中RI-J为线路的电阻,VI-J为线路电压,而由于线路的功率传输,功率损耗不是线性叠加的,传输成本会随着线路中功率的增加而增加,因此网络的最终传输成本为:
Figure BDA0003473183520000094
其中,
Figure BDA0003473183520000095
为网络最终传输成本,ΔPI-J为线路功率损耗。
(5)如图3所示,利用图论的方法描述能量路由器及网络传输的选择进而提取多微网系统的拓扑结构,其中所有能量路由器构成节点集合ER={ER1,ER2,...,ERN},所有输电线路构成线路集合L={Li_j,...},则两目标点A,B之间的路径可以看作:
path(A→B):=A≡RI,RJ,...,RK≡B
利用多微网系统的拓扑结构、在线监测数据以及模型计算数据构建环境状态空间st
(6)建立能量路由器的动作空间和来自拓扑结构改变的反馈奖励函数;
(6.1)建立能量路由器的动作空间;所述的能量路由器的动作空间为:
at∈{-1,0,1}
当at为-1时,微网向其他微网传输能量;当at为0时,微网间能量双向传输;当at为1时,由其他微网向该微网传输能量;系统跟据拓扑结构执行at,得到at∈A,其中A是多微网系统可能动作的集合;
(6.2)构建来自拓扑结构改变的反馈奖励函数;所述的来自拓扑结构改变的反馈奖励函数如下:
rt=-αBESΔCBES(t)-αERΔCER(t)-αLINEΔCLINE(t)
其中αBES是储能系统的折损权重,αER,αLINE是能量路由器以及网络损耗的权重,ΔCBES(t),ΔCER(t),ΔCLINE(t)是单次控制后各部分的损失。
(7)多微网系统通过执行at,使环境状态空间st转移到st+1,重复执行直到完成任务目标或者达到上限T,得到可应用于强化学习训练的路由轨迹;所述的路由轨迹为:
τ={(st,at,rt)|t=1...T}
其中,τ为路由轨迹。
(8)建立综合考虑微网内可再生能源自我消纳、微网内储能系统折损成本最小以及微网间能量传递损失最小的成本函数,用于评估出各状态及执行相应动作时未来可能获得的奖励期望。所述的成本函数为:
Figure BDA0003473183520000101
其中,
Figure BDA0003473183520000102
为训练后的储能设备、能量路由器、线路传输的成本。
一种计算机存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述的一种基于图论和深度强化学习的多微网系统能量路由方法。
一种计算机设备,包括储存器、处理器及存储在存储器上并可再处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述的一种基于图论和深度强化学习的多微网系统能量路由方法。

Claims (11)

1.一种基于图论和深度强化学习的多微网系统能量路由方法,其特征在于,包括以下步骤:
(1)用随机微分方程模拟光伏、风机以及负荷的功率变化,建立光伏、风机、负荷的功率模型,利用常微分方程模拟储能系统充电状态,建立储能系统的功率模型,分析能量路由器能量传输方式,建立能量路由器的功率模型;
(2)根据输电线路上的功率偏差可以由储能系统吸收或者由能量路由器传输到其他微网这一假设及自下而上的能量管理原则建立单个微网的功率平衡方程;
(3)建立储能系统的成本损耗模型和使用寿命惩罚函数;
(4)建立能量路由器以及网络传输的成本损耗模型,计算能量路由器的最终传输成本和网络的功率损耗,得到网络的最终传输成本;
(5)利用图论的方法提取多微网系统的拓扑结构、在线监测数据以及模型计算数据构建环境状态空间;
(6)建立能量路由器的动作空间和来自拓扑结构改变的反馈奖励函数;
(7)多微网系统通过执行at,使环境状态空间st转移到st+1,重复执行直到完成任务目标或者达到上限T,得到可应用于强化学习训练的路由轨迹;
(8)建立综合考虑微网内可再生能源自我消纳、微网内储能系统折损成本最小以及微网间能量传递损失最小的成本函数,用于评估出各状态及执行相应动作时未来可能获得的奖励期望。
2.根据权利要求1所述的一种基于图论和深度强化学习的多微网系统能量路由方法,其特征在于,所述步骤(1)具体为:
(1.1)用常微分线性方程模拟光伏、风机以及负荷的功率变化得到这些设备的初步功率模型,然后用维纳过程来模拟其随机性,在一系列反馈逼近后得到光伏、风机、负荷的功率模型;所述的光伏、风机、负荷的功率模型如下:
Figure FDA0003473183510000021
Figure FDA0003473183510000022
Figure FDA0003473183510000023
其中,PPV(t),PW(t),PL(t)分别表示光伏、风机以及负荷的输出功率,t为系统所处的时刻;
Figure FDA0003473183510000024
则是用线性常微分方程来建立光伏、风机发电时以及负荷用电时的功率初步模型,其中aPV,aW,aL为风机、光伏以及负荷时间常数的倒数的负值;
Figure FDA0003473183510000025
是利用维纳过程模拟的光伏、风机和负荷功率的随机项,其中ωPV(t),ωW(t),ωL(t)表示维纳过程,KPV,μPV,σPV,KW,μW,σW,K,Lμ,LσL为常数;
(1.2)将储能系统在t时刻的充电状态描述为SOC(t),利用常微分方程建立储能系统的功率模型;所述的储能系统的功率模型如下:
Figure FDA0003473183510000026
其中
Figure FDA0003473183510000027
为储能系统的输入/输出功率,QS为一常数,η(PBES(t))为控制储能系统的状态参数,ηi,ηo是储能系统输入/输出功率时的状态参数;
(1.3)建立能量路由器的功率模型;所述的能量路由器的功率模型如下:
PER(t)=KERUER(t),UER(t)∈[-1,1]
其中PER(t)是能量路由器的输入/输出功率,KER是通过能量路由器的预设值;UER(t)为能量路由器的控制器,当UER(t)=0时,能量路由器停止工作;UER(t)<0时,能量路由器从其他微网向该微网传输能量;UER(t)>0时,能量路由器从该微网向其他微网传输能量。
3.根据权利要求1所述的一种基于图论和深度强化学习的多微网系统能量路由方法,其特征在于,步骤(2)所述的单个微网的功率平衡方程如下:
Figure FDA0003473183510000031
其中Pi_j(t)是微网的输出功率。
4.根据权利要求1所述的一种基于图论和深度强化学习的多微网系统能量路由方法,其特征在于,步骤(3)所述的储能系统的成本损耗模型如下:
Figure FDA0003473183510000032
其中CBES(t)为储能系统的成本损耗模型,T为终端设备运行时间,E为期望函数;
步骤(3)所述的惩罚函数如下:
Figure FDA0003473183510000033
Figure FDA0003473183510000034
为惩罚函数,将PBES(t)限制在储能设备的最大功率
Figure FDA0003473183510000035
之内从而实现储能设备的合理利用,减少储能设备的折损成本,提高储能设备使用寿命。
5.根据权利要求1所述的一种基于图论和深度强化学习的多微网系统能量路由方法,其特征在于,所述步骤(4)具体为:
(4.1)建立能量路由器以及网络传输的成本损耗模型;所述的能量路由器以及网络传输的成本损耗模型如下:
Figure FDA0003473183510000041
其中CER(t),CLINE(t)为能量路由器及网络传输的成本损耗模型,KER,KLINE是价格系数,为了优先考虑那些能量损耗较小的能量路由器以及网络连接线间的损耗,能量路由器以及网络的传输成本应与功率损耗ΔpER,Δpi_j成正比;
(4.2)计算能量路由器的最终传输成本;所述的能量路由器的最终传输成本如下:
Figure FDA0003473183510000042
其中ηX,ηY分别为能量路由器输入端口和输出端口与公共输电线路之间的转换器的效率;
(4.3)计算网络的功率损耗;所述的网络的功率损耗为:
Figure FDA0003473183510000043
其中RI-J为线路的电阻,VI-J为线路电压,而由于线路的功率传输,功率损耗不是线性叠加的,传输成本会随着线路中功率的增加而增加,因此网络的最终传输成本为:
Figure FDA0003473183510000044
其中,
Figure FDA0003473183510000045
为网络最终传输成本,ΔPI-J为线路功率损耗。
6.根据权利要求1所述的一种基于图论和深度强化学习的多微网系统能量路由方法,其特征在于,所述步骤(5)具体为:利用图论的方法描述能量路由器及网络传输的选择进而提取多微网系统的拓扑结构,其中所有能量路由器构成节点集合ER={ER1,ER2,...,ERN},所有输电线路构成线路集合L={Li_j,...},则两目标点A,B之间的路径可以看作:
path(A→B):=A≡RI,RJ,...,RK≡B
利用多微网系统的拓扑结构、在线监测数据以及模型计算数据构建环境状态空间st
7.根据权利要求1所述的一种基于图论和深度强化学习的多微网系统能量路由方法,其特征在于,所述步骤(6)具体为:
(6.1)建立能量路由器的动作空间;所述的能量路由器的动作空间为:
at∈{-1,0,1}
当at为-1时,微网向其他微网传输能量;当at为0时,微网间能量双向传输;当at为1时,由其他微网向该微网传输能量;系统跟据拓扑结构执行at,得到at∈A,其中A是多微网系统可能动作的集合;
(6.2)构建来自拓扑结构改变的反馈奖励函数;所述的来自拓扑结构改变的反馈奖励函数如下:
rt=-αBESΔCBES(t)-αERΔCER(t)-αLINEΔCLINE(t)
其中αBES是储能系统的折损权重,αER,αLINE是能量路由器以及网络损耗的权重,ΔCBES(t),ΔCER(t),ΔCLINE(t)是单次控制后各部分的损失。
8.根据权利要求1所述的一种基于图论和深度强化学习的多微网系统能量路由方法,其特征在于,步骤(7)所述的路由轨迹为:
τ={(st,at,rt)|t=1...T}
其中,τ为路由轨迹。
9.根据权利要求1所述的一种基于图论和深度强化学习的多微网系统能量路由方法,其特征在于,步骤(8)所述的成本函数为:
Figure FDA0003473183510000051
其中,
Figure FDA0003473183510000052
为训练后的储能设备、能量路由器、线路传输的成本。
10.一种计算机存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1-9中任一项所述的一种基于图论和深度强化学习的多微网系统能量路由方法。
11.一种计算机设备,包括储存器、处理器及存储在存储器上并可再处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-9中任一项所述的一种基于图论和深度强化学习的多微网系统能量路由方法。
CN202210047981.XA 2022-01-17 2022-01-17 一种基于图论和深度强化学习的多微网系统能量路由方法 Active CN114172840B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210047981.XA CN114172840B (zh) 2022-01-17 2022-01-17 一种基于图论和深度强化学习的多微网系统能量路由方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210047981.XA CN114172840B (zh) 2022-01-17 2022-01-17 一种基于图论和深度强化学习的多微网系统能量路由方法

Publications (2)

Publication Number Publication Date
CN114172840A true CN114172840A (zh) 2022-03-11
CN114172840B CN114172840B (zh) 2022-09-30

Family

ID=80489307

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210047981.XA Active CN114172840B (zh) 2022-01-17 2022-01-17 一种基于图论和深度强化学习的多微网系统能量路由方法

Country Status (1)

Country Link
CN (1) CN114172840B (zh)

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103488864A (zh) * 2013-07-04 2014-01-01 清华大学 一种风光储联合发电系统风险的评估方法
CN107294123A (zh) * 2017-06-27 2017-10-24 清华大学 能量路由器控制模型获取方法及系统、控制器及控制方法
WO2018131174A1 (en) * 2017-01-13 2018-07-19 Nec Corporation Microgrid power management system and method of managing
CN109274092A (zh) * 2018-10-16 2019-01-25 清华大学 基于能源互联网的能量管理方法及装置
CN110929948A (zh) * 2019-11-29 2020-03-27 上海电力大学 基于深度强化学习的完全分布式智能电网经济调度方法
CN112186799A (zh) * 2020-09-22 2021-01-05 中国电力科学研究院有限公司 基于深度强化学习的分布式能源系统自治控制方法及系统
CN112614009A (zh) * 2020-12-07 2021-04-06 国网四川省电力公司电力科学研究院 一种基于深度期望q-学习的电网能量管理方法及系统
CN113132232A (zh) * 2021-03-10 2021-07-16 清华大学 一种能量路由优化方法
CN113139682A (zh) * 2021-04-15 2021-07-20 北京工业大学 一种基于深度强化学习的微电网能量管理方法
EP3876378A1 (en) * 2020-03-03 2021-09-08 Caterpillar Inc. Micro-grid site predictive control for multi-power resource management with machine learning
CN113435793A (zh) * 2021-08-09 2021-09-24 贵州大学 一种基于强化学习的微电网优化调度方法
CN113689024A (zh) * 2021-06-03 2021-11-23 上海交通大学 一种基于Boosting感知的深度学习多微网弹性组合决策方法
CN113837430A (zh) * 2021-07-28 2021-12-24 合肥工业大学 基于云网边端一体化的综合能源负荷优化调度方法及系统

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103488864A (zh) * 2013-07-04 2014-01-01 清华大学 一种风光储联合发电系统风险的评估方法
WO2018131174A1 (en) * 2017-01-13 2018-07-19 Nec Corporation Microgrid power management system and method of managing
CN107294123A (zh) * 2017-06-27 2017-10-24 清华大学 能量路由器控制模型获取方法及系统、控制器及控制方法
CN109274092A (zh) * 2018-10-16 2019-01-25 清华大学 基于能源互联网的能量管理方法及装置
CN110929948A (zh) * 2019-11-29 2020-03-27 上海电力大学 基于深度强化学习的完全分布式智能电网经济调度方法
EP3876378A1 (en) * 2020-03-03 2021-09-08 Caterpillar Inc. Micro-grid site predictive control for multi-power resource management with machine learning
CN112186799A (zh) * 2020-09-22 2021-01-05 中国电力科学研究院有限公司 基于深度强化学习的分布式能源系统自治控制方法及系统
CN112614009A (zh) * 2020-12-07 2021-04-06 国网四川省电力公司电力科学研究院 一种基于深度期望q-学习的电网能量管理方法及系统
CN113132232A (zh) * 2021-03-10 2021-07-16 清华大学 一种能量路由优化方法
CN113139682A (zh) * 2021-04-15 2021-07-20 北京工业大学 一种基于深度强化学习的微电网能量管理方法
CN113689024A (zh) * 2021-06-03 2021-11-23 上海交通大学 一种基于Boosting感知的深度学习多微网弹性组合决策方法
CN113837430A (zh) * 2021-07-28 2021-12-24 合肥工业大学 基于云网边端一体化的综合能源负荷优化调度方法及系统
CN113435793A (zh) * 2021-08-09 2021-09-24 贵州大学 一种基于强化学习的微电网优化调度方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
HAIXIA YOU,等: ""A Smart Contract-based Energy Trading Strategy in Energy Internet"", 《2019 IEEE INTERNATIONAL CONFERENCE ON ENERGY INTERNET (ICEI)》 *
JIAN GUO,等: ""Improved approximate minimum degree ordering method and its application for electrical power network analysis and computation"", 《TSINGHUA SCIENCE AND TECHNOLOGY》 *
张军等: "分布式新能源配网网架多目标规划模型研究", 《山西电力》 *
桑博,等: ""多微电网能量管理系统研究综述"", 《中国电机工程学报》 *

Also Published As

Publication number Publication date
CN114172840B (zh) 2022-09-30

Similar Documents

Publication Publication Date Title
JP7261507B2 (ja) 電気ヒートポンプ-熱電併給システムを最適化する調整方法及びシステム
CN105071389B (zh) 计及源网荷互动的交直流混合微电网优化运行方法及装置
Xu et al. Power system transient stability-constrained optimal power flow: A comprehensive review
CN109636056A (zh) 一种基于多智能体技术的多能源微网去中心化优化调度方法
Ameur et al. Intelligent optimization and management system for renewable energy systems using multi-agent
Yang et al. Deep learning-based distributed optimal control for wide area energy Internet
CN105354628A (zh) 一种输电系统鲁棒可用输电能力评估方法
Zhu et al. Dynamic multi-objective dispatch considering wind power and electric vehicles with probabilistic characteristics
CN114172840B (zh) 一种基于图论和深度强化学习的多微网系统能量路由方法
CN105207255B (zh) 一种适用于风电出力的电力系统调峰计算方法
CN106655266A (zh) 一种接入新能源的地区电网可灵活调节电源配置方法
CN113673141B (zh) 一种基于数据驱动的能量路由器建模及优化控制方法
CN115600406A (zh) 基于混合储能的多综合能源运行优化方法及装置
Mohammadian et al. Learning solutions for intertemporal power systems optimization with recurrent neural networks
CN113872183A (zh) 一种综合能源优化协调系统
Guo et al. Voltage Stability Control Method Based on Comprehensive Principal Component Analysis and Improved Neural Network
CN109861304A (zh) 一种考虑通信时变时滞的微电网经济调度方法
Iqbal et al. Reinforcement Learning Based Optimal Energy Management of A Microgrid
Gamez et al. Optimal operation of an electrical microgrid via recurrent neural network
CN112134304B (zh) 一种基于深度学习的微电网全自动导航方法、系统与装置
He et al. Towards smarter cities: A self-healing resilient Microgrid Social Network
Kang et al. Power flow coordination optimization control method for power system with DG based on DRL
Shadaei et al. Probabilistic Microgrid Economic Dispatch via Economic Model Predictive Control Considering Weather and Load Data Uncertainty
CN113283105B (zh) 一种考虑电压安全约束的能源互联网分布式优化调度方法
CN112132350B (zh) 一种实时需求响应方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant