CN113902040A - 电-热综合能源系统协调优化方法、系统、设备及存储介质 - Google Patents
电-热综合能源系统协调优化方法、系统、设备及存储介质 Download PDFInfo
- Publication number
- CN113902040A CN113902040A CN202111349881.4A CN202111349881A CN113902040A CN 113902040 A CN113902040 A CN 113902040A CN 202111349881 A CN202111349881 A CN 202111349881A CN 113902040 A CN113902040 A CN 113902040A
- Authority
- CN
- China
- Prior art keywords
- power
- electric
- energy system
- cogeneration
- heat
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 80
- 238000003860 storage Methods 0.000 title claims abstract description 11
- 230000009471 action Effects 0.000 claims abstract description 62
- 238000010248 power generation Methods 0.000 claims abstract description 55
- 230000008878 coupling Effects 0.000 claims abstract description 34
- 238000010168 coupling process Methods 0.000 claims abstract description 34
- 238000005859 coupling reaction Methods 0.000 claims abstract description 34
- 238000004364 calculation method Methods 0.000 claims abstract description 17
- 238000005457 optimization Methods 0.000 claims description 79
- 150000001875 compounds Chemical class 0.000 claims description 54
- 238000004422 calculation algorithm Methods 0.000 claims description 38
- 230000006870 function Effects 0.000 claims description 38
- 238000012549 training Methods 0.000 claims description 37
- 230000009194 climbing Effects 0.000 claims description 31
- 230000002787 reinforcement Effects 0.000 claims description 31
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 25
- 238000004590 computer program Methods 0.000 claims description 16
- 238000005265 energy consumption Methods 0.000 claims description 13
- 230000020169 heat generation Effects 0.000 claims description 11
- 238000004519 manufacturing process Methods 0.000 claims description 8
- 230000007246 mechanism Effects 0.000 claims description 8
- 238000005070 sampling Methods 0.000 claims description 8
- 230000007704 transition Effects 0.000 claims description 8
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 6
- 238000011156 evaluation Methods 0.000 claims description 6
- 230000007774 longterm Effects 0.000 claims description 6
- 239000011159 matrix material Substances 0.000 claims description 6
- 230000005611 electricity Effects 0.000 claims description 4
- 238000004458 analytical method Methods 0.000 claims description 3
- 238000013016 damping Methods 0.000 claims description 3
- 238000000605 extraction Methods 0.000 claims description 3
- 238000002347 injection Methods 0.000 claims description 3
- 239000007924 injection Substances 0.000 claims description 3
- 239000002245 particle Substances 0.000 description 16
- 230000006872 improvement Effects 0.000 description 15
- 238000010586 diagram Methods 0.000 description 14
- 239000000243 solution Substances 0.000 description 13
- 238000005485 electric heating Methods 0.000 description 12
- 239000003795 chemical substances by application Substances 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 238000010438 heat treatment Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 4
- 238000011217 control strategy Methods 0.000 description 4
- 238000013135 deep learning Methods 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000004888 barrier function Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000013209 evaluation strategy Methods 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000005086 pumping Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Evolutionary Computation (AREA)
- General Business, Economics & Management (AREA)
- General Engineering & Computer Science (AREA)
- Tourism & Hospitality (AREA)
- Health & Medical Sciences (AREA)
- Marketing (AREA)
- Data Mining & Analysis (AREA)
- Operations Research (AREA)
- Primary Health Care (AREA)
- Quality & Reliability (AREA)
- Game Theory and Decision Science (AREA)
- Development Economics (AREA)
- Geometry (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Entrepreneurship & Innovation (AREA)
- Computer Hardware Design (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Supply And Distribution Of Alternating Current (AREA)
- Feedback Control In General (AREA)
Abstract
本发明提供一种电‑热综合能源系统协调优化方法、系统、设备及存储介质,方法包括:获取实时电‑热综合能源系统参数;基于所述电‑热综合能源系统参数,分别计算电‑热综合能源系统的电力系统、热力系统和耦合装置的发电功率;将所述发电功率输入预先训练的基于SAC框架优化调度模型中,输出调度动作,形成电‑热综合能源系统协调策略。可以直接通过已经训练好的策略网络给出调度动作,无需再进行传统非线性整体迭代求解,计算速度得到了显著的提升,计算效率更高。
Description
技术领域
本发明涉及综合能源系统优化调度领域,特别是涉及一种电-热综合能源系统协调优化方法、系统、设备及存储介质。
背景技术
在能源互联网的背景下,为了进一步提高能源利用率,缓解能源危机,突破传统能源体系结构和行业壁垒,研究电热综合能源系统协调优化问题成为一种有效的途径。
电-热综合能源系统通过利用热力与电力的互补特性,有利于促进可再生能源的消纳,提高能源利用率。现今对电-热综合能源系统优化问题的求解,主要包括传统非线性方法求解如粒子群算法,智能算法如“Q学习”、“DQN”算法等求解思路。粒子群算法与“Q学习”算法均存在精确度不足、计算速度慢、适用范围局限等问题,“DQN”算法存在探索能力不足,易陷入局部最优解等问题。
总体来说,耦合愈加密切的综合能源系统优化调度问题存在高度的非线性特征,目前缺少一种经济、准确、可靠的求解方法。因此需要一种收敛可靠、探索最优策略能力强、满足高精度要求的智能算法。
现有技术一“粒子群优化算法”的技术方案:粒子群算法是一种进化计算机技术,该算法通过粒子的简单行为、粒子群体与环境的信息交互,从系统随机初始值开始,经过迭代寻求最优值。在IEHS优化调度模型中,首先需要建立目标函数以及约束条件,如电网、热网潮流约束、设备出力约束、安全运行约束等,然后利用粒子群算法对IEHS优化问题进行求解。
粒子群算法求解步骤为:1)设置参数:迭代次数、自变量个数、粒子最大速度、粒子群初始速度和位置。2)定义适应度函数:根据IEHS优化调度模型优化目标确定。在每次迭代过程中,粒子的最优解即为粒子的极值,全局最优解取所有粒子的最小值,与上一次全局最优比较,按照下式进行更新:
3)停止迭代条件:达到最大迭代次数或迭代差值满足精度要求。
其缺点为:(1)粒子群算法收敛性不足,甚至会出现难以收敛的情况。并且易陷入局部最优解,无法得到电热综合能源系统经济调度的最优解,计算精度欠缺,从而失去了多能源协同优化的意义。(2)耦合愈来愈密切的电热综合能源系统呈现出高度非线性特征,粒子群算法在求解时存在计算速度显著降低,计算效率无法满足电热综合能源系统经济调度的问题。
现有技术二“Q学习”的技术方案:
Q学习算法以马尔科夫决策过程为基础,是一种与模型无关的强化学习算法。采用Q学习算法的进行电-热综合能源系统优化的一般步骤为,设计动作状态空间,对连续动作空间以及状态空间进行离散化,根据系统优化目标和运行约束建立Q学习奖惩机制,智能体通过不断试错探索,与环境进行交互并更新Q值表,最终达到自主选择最优动作的目标。
在Q值表的每次训练内,针对某时刻T,根据该时刻状态st从Q值表中选取动作at。
将该动作作用于环境得到即时奖励,并完成状态转移进入下一个状态。根据贝尔曼最优
准则,得到最优策略所对应的最优指标为该时刻下电-热综合能源系统智能体动作at所得
到的即时奖励为rt与后续状态转移所得到的最大Q值之和。因此可根据贝尔
曼最优准则进行Q值表的更新:
经过多次训练后,智能体可根据输入的状态信息和Q值表,做出电-热综合能源系统最优控制动作。
其缺点为:
(1)电-热综合能源系统动作状态空间多为连续区间,为应用Q学习算法需要对连续空间进行离散化处理。以离散后的动作空间、状态空间为基础进行计算会导致计算准确度大幅下降;
(2)Q学习算法不适用于大规模电-热综合能源系统优化问题求解。问题规模增大导致动作空间维度以及网络复杂度增大。动作空间增大导致Q指标维度大幅度增大,提高训练难度;Q指标拟合能力差,难以对高复杂度电热综合能源系统网络进行建模。
现有技术三“DQN”的技术方案:
DQN是深度学习和具有决策能力的强化学习相结合的产物。DQN构建深度学习网络,直接从高维原始数据中学习控制策略,扩展了强化学习实用性。应用DQN进行电-热综合能源系统优化,首先应设计动作、状态空间,构建深度学习网络拟合Q值,构建经验回放单元存储历史样本。每次训练对经验回放单元进行随机采样,根据采样样本进行Q网络训练。
DQN算法首先从环境中获取观测值,智能体根据值函数神经网络得到的关于该观
测值的所有。然后智能体利用策略算法做出决策,得到动作,并从环境中得到反馈的
奖励值r。利用得到的奖励r去更新值函数网络的参数,从而进入下一次迭代。迭代过程将循
环进行下去,直到完成网络训练。
DQN需要定义相应的损失函数,并利用梯度下降算法来更新参数。通过不断更新神经网络权重参数,使得Q网络的输出值能够逐渐逼近最优的Q值。损失函数的定义基于残差模型,即真实值和网络输出的差的平方:
为了减少相关性提高算法稳定性,DQN在原来的Q网络的基础之上又引入了一个target Q网络,该网络和Q网络的结构一样,初始的权重也是一样的,只是Q网络在每次迭代过程中都会更新参数,而target Q网络的参数则是每隔一段时间才会更新。
其缺点为:(1)相较于Q学习方法更适用于连续控制动作场景,但是连续动作空间探索难度更为复杂,探索难度大,DQN采用特定的策略算法难以保证对状态空间的有效探索,可能会出现局部最优解问题。
发明内容
本发明的目的在于提供一种电-热综合能源系统协调优化方法、系统、设备及存储介质,本发明的电-热综合能源系统协调优化方法可以直接通过已经训练好的策略网络给出调度动作,无需再进行传统非线性整体迭代求解,计算速度得到了显著的提升,计算效率更高。
为达到上述目的,本发明采用了以下技术方案:
一种电-热综合能源系统协调优化方法,包括以下步骤:
获取实时电-热综合能源系统参数;
基于所述电-热综合能源系统参数,分别计算电-热综合能源系统的电力系统、热力系统和耦合装置的发电功率;
将所述发电功率输入预先训练的基于SAC框架优化调度模型中,输出调度动作,形成电-热综合能源系统协调策略。
作为本发明的进一步改进,所述预先训练的基于SAC框架优化调度模型的训练优化方法包括:
获取历史电-热综合能源系统参数;
基于所述电-热综合能源系统参数,分别计算电-热综合能源系统的电力系统、热力系统和耦合装置的发电功率,并以电力系统、热力系统和耦合装置的发电功率为基础建立电-热综合能源系统模型;
以强化学习环境、状态、动作及奖励作为基本要素,结合电-热综合能源系统调度模型建立基于SAC框架优化调度模型;
对基于SAC框架优化调度模型进行训练,得到预先训练的基于SAC框架优化调度模型。
作为本发明的进一步改进,所述电-热综合能源系统参数包括电热综合能源系统网络参数和电热负荷出力及风电出力。
作为本发明的进一步改进,所述基于所述电-热综合能源系统参数,分别计算电-热综合能源系统的电力系统、热力系统和耦合装置的发电功率,具体包括:
1)电力系统
以交流潮流作为电力系统的分析方法,电力系统的功率平衡方程具体为:
式中Pi,Qi分别为节点i的注入有功、无功功率,Vi为节点i的电压幅值,Gij、Bij分别为支路ij的电导和电纳,θij为支路ij的相角差;
2)热力系统
热力系统分为水力模型和热力模型两部分:
热力系统的水力模型由流量连续性方程、回路压力方程和压头损失方程构成,具体为:
热力模型由节点功率方程、管道温度下降方程和节点介质混合方程构成,具体为:
3) 耦合装置
耦合装置产电产热功率具体为:
作为本发明的进一步改进,所述以电力系统、热力系统和耦合装置的发电功率为基础建立电-热综合能源系统模型,具体包括:
以实现电-热综合能源系统的总运行成本最小为目标,同时为实现可在生能源的最大消纳,将可在生能源未消纳的部分作为惩罚项,建立目标函数;
建立电-热综合能源系统模型的约束条件,约束条件包括:节点功率平衡等式约束、网络安全约束、热电联产装置约束、可再生能源约束和常规机组出力约束。
作为本发明的进一步改进,所述目标函数为:
式中,f1为常规机组运行成本,f2为热电联产装置运行成本,f3为弃风惩罚;
其中,常规机组运行成本具体为:
其中,热电联产机组运行成本具体为:
其中,弃风惩罚具体为:
作为本发明的进一步改进,所述节点功率平衡等式约束条件基于网络节点有功功率平衡方程,具体为:
所述网络安全约束具体为:
所述热电联产装置约束具体为:
所述可再生能源约束具体为:
所述常规机组出力约束具体为:
同时满足爬坡约束:
作为本发明的进一步改进,所述以强化学习环境、状态、动作及奖励作为基本要素,结合电-热综合能源系统调度模型建立基于SAC框架优化调度模型,具体包括:
将常规机组发电功率、热电联产发电功率以及热电联产热功率作为动作变量,具体如下:
选取为电负荷、风力发电功率、热电联产装置发电功率、常规机组出力、热负荷、热电联产装置产热功率以及环境温度作为状态空间变量,具体为:
式中,
搭建强化学习环境,通过策略网络得到当前动作作用于环境,得到即时奖励和下一时段的状态,并为策略评估提供奖励;
强化学习目标为实现长期奖励最大化,将优化目标的相反数设计为即时奖励,同时根据约束条件设置惩罚机制加入到即时奖励中得到最终的奖励函数,惩罚项统一表达形式为:
奖励函数包括常规机组运行成本,弃风惩罚,热电联产装置运行成本以及变量越限惩罚,具体为:
式中分别为电力系统、热力系统运行成本以及弃风惩罚,,
分别为常规机组出力越限及爬坡越限惩罚项,为系统节点电压越限惩罚,为热电联产机组出力及爬坡越限惩罚项,为系统节点温度越限惩
罚,为系统管道质量流量速率越限惩罚。
作为本发明的进一步改进,所述对基于SAC框架优化调度模型进行训练,得到预先训练的基于SAC框架优化调度模型,具体包括:
给评判器目标网络赋值,设置智能记忆库容量D;
当连续轮训练的奖励平均值变化幅度时,对于每一时段,都从行动器策
略网络中采样控制动作,并将所述控制动作施加在电-热综合能源系统上,
并针对风电不确定性进行采样,得到系统下一个时刻运行状态,再将状态转移及奖励
置入经验库D;
作为本发明的进一步改进,更新评判器Q网络、行动器策略网络、温度系数、目标网络采用的方法为SGD算法或Adam算法。
一种电-热综合能源系统协调优化系统,包括:
第一参数获取模块,用于获取实时电-热综合能源系统参数;
功率计算模块,用于基于所述电-热综合能源系统参数,分别计算电-热综合能源系统的电力系统、热力系统和耦合装置的发电功率;
调度输出模块,用于将所述发电功率输入预先训练的基于SAC框架优化调度模型中,输出调度动作,形成电-热综合能源系统协调策略。
作为本发明的进一步改进,所述调度输出模块中预先训练的基于SAC框架优化调度模型包括:
第二参数获取模块,用于获取历史电-热综合能源系统参数;
模型建立模块,用于基于所述电-热综合能源系统参数,分别计算电-热综合能源系统的电力系统、热力系统和耦合装置的发电功率,并以电力系统、热力系统和耦合装置的发电功率为基础建立电-热综合能源系统模型;
模型优化模块,用于以强化学习环境、状态、动作及奖励作为基本要素,结合电-热综合能源系统调度模型建立基于SAC框架优化调度模型;
模型训练模块,用于对基于SAC框架优化调度模型进行训练,得到预先训练的基于SAC框架优化调度模型。
作为本发明的进一步改进,所述模型建立模块具体用于:
以实现电-热综合能源系统的总运行成本最小为目标,同时为实现可在生能源的最大消纳,将可在生能源未消纳的部分作为惩罚项,建立目标函数;
建立电-热综合能源系统模型的约束条件,约束条件包括:节点功率平衡等式约束、网络安全约束、热电联产装置约束、可再生能源约束和常规机组出力约束。
作为本发明的进一步改进,所述目标函数为:
式中,f1为常规机组运行成本,f2为热电联产装置运行成本,f3为弃风惩罚;
其中,常规机组运行成本具体为:
其中,热电联产机组运行成本具体为:
其中,弃风惩罚具体为:
作为本发明的进一步改进,所述节点功率平衡等式约束条件基于网络节点有功功率平衡方程,具体为:
所述网络安全约束具体为:
所述热电联产装置约束具体为:
所述可再生能源约束具体为:
所述常规机组出力约束具体为:
同时满足爬坡约束:
作为本发明的进一步改进,所述模型优化模块具体用于:
将常规机组发电功率、热电联产发电功率以及热电联产热功率作为动作变量,具体如下:
选取为电负荷、风力发电功率、热电联产装置发电功率、常规机组出力、热负荷、热电联产装置产热功率以及环境温度作为状态空间变量,具体为:
式中,
搭建强化学习环境,通过策略网络得到当前动作作用于环境,得到即时奖励和下一时段的状态,并为策略评估提供奖励;
强化学习目标为实现长期奖励最大化,将优化目标的相反数设计为即时奖励,同时根据约束条件设置惩罚机制加入到即时奖励中得到最终的奖励函数,惩罚项统一表达形式为:
奖励函数包括常规机组运行成本,弃风惩罚,热电联产装置运行成本以及变量越限惩罚,具体为:
式中分别为电力系统、热力系统运行成本以及弃风惩罚,,
分别为常规机组出力越限及爬坡越限惩罚项,为系统节点电压越限惩罚,为热电联产机组出力及爬坡越限惩罚项,为系统节点温度越限惩
罚,为系统管道质量流量速率越限惩罚。
作为本发明的进一步改进,所述模型训练模块具体用于:
给评判器目标网络赋值,设置智能记忆库容量D;
当连续轮训练的奖励平均值变化幅度时,对于每一时段,都从行动器策
略网络中采样控制动作,并将所述控制动作施加在电-热综合能源系统
上,并针对风电不确定性进行采样,得到系统下一个时刻运行状态,再将状态转移及
奖励置入经验库D;
一种电子设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现所述电-热综合能源系统协调优化方法的步骤。
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现所述电-热综合能源系统协调优化方法的步骤。
与现有技术相比,本发明的有益效果体现在:
本发明采用基于优化的SAC框架的优化调度模型在给定负荷等系统状态时给出调度动作,进而生成策略;当系统给出确定的负荷等系统状态时,该算法可以直接通过已经训练好的策略网络给出调度动作,无需再进行传统非线性整体迭代求解,计算速度得到了显著的提升,计算效率更高。
本发明建立电-热综合能源系统模型后建立基于SAC框架的优化调度模型,SAC算法属于随机离线策略算法,其自趋优的特性对综合能源优化调度问题进行自主学习,通过和环境交互观测得到奖励值评价策略优劣,学习探索所有的最优策略途径,从而在无监督下实现调度周期内成本最优。经过学习训练之后的网络模型,解决了离散处理状态和动作所带来维数灾难的问题。并且能够可靠收敛,适用范围广,例如可以适用于考虑风电等可再生能源及负荷的出力随机性变化的场景,更加具有普适性。
附图说明
图1为本发明的电-热综合能源系统协调优化方法流程示意图;
图2为本发明的预先训练的基于SAC框架优化调度模型的训练优化方法流程示意图;
图3为本发明的电-热综合能源系统图;
图4为本发明的供热网示意图;
图5为本发明基于SAC框架的优化调度模型进行训练具体算法流程图;
图6为本发明一种电-热综合能源系统协调优化系统结构示意图;
图7为本发明预先训练的基于SAC框架优化调度模型结构示意图;
图8为本发明一种电子设备结构示意图。
具体实施方式
下面将参考附图并结合实施例来详细说明本发明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
以下详细说明均是示例性的说明,旨在对本发明提供进一步的详细说明。除非另有指明,本发明所采用的所有技术术语与本申请所属领域的一般技术人员的通常理解的含义相同。本发明所使用的术语仅是为了描述具体实施方式,而并非意图限制根据本发明的示例性实施方式。
缩略语和关键术语定义
IEHS Integrated electricity-heat energy system 电热综合能源系统
SAC Soft Actor-Critic 柔性行动器-评判器
DQN Deep Q Network 深度Q学习
Adam Adaptive Moment Estimation 自适应矩估计
本发明即采用SAC算法主要是解决电-热综合能源系统经济调度求解问题。提出了一种电-热综合能源系统协调优化方法,如图1所示,包括以下步骤:
获取实时电-热综合能源系统参数;
基于所述电-热综合能源系统参数,分别计算电-热综合能源系统的电力系统、热力系统和耦合装置的发电功率;
将所述发电功率输入预先训练的基于SAC框架优化调度模型中,输出调度动作,形成电-热综合能源系统协调策略。
其中,如图2所示,所述预先训练的基于SAC框架优化调度模型的训练优化方法包括:
获取历史电-热综合能源系统参数;
基于所述电-热综合能源系统参数,分别计算电-热综合能源系统的电力系统、热力系统和耦合装置的发电功率,并以电力系统、热力系统和耦合装置的发电功率为基础建立电-热综合能源系统模型;
以强化学习环境、状态、动作及奖励作为基本要素,结合电-热综合能源系统调度模型建立基于SAC框架优化调度模型;
对基于SAC框架优化调度模型进行训练,得到预先训练的基于SAC框架优化调度模型。
本发明基于SAC算法的电-热综合能源系统经济调度方法,采用连续控制策略,同时将最大熵添加到优化目标中,能够与电热综合能源系统交互、学习并生成最优控制策略,很好地解决了电-热综合能源系统协同优化求解过程中高维求解、收敛困难、难以精准寻优的问题。因此,本发明为综合能源系统协同优化思路提供了有力的技术支持,为综合能源调度决策人员提供决策依据,对实现系统的多能互补、可再生能源消纳、提高系统运行经济性具有重要意义。
本发明采用深度强化学习方法求解电热综合能源系统经济调度问题,主要用于解决传统方法存在以下几点技术问题:
1)深度强化学习方法利用神经网络拟合电热综合能源系统不同状态下的最优策略,网络训练完成后可实时得出调度策略,而传统的非线性传统算法需要全局寻优,深度强化学习方法提升了计算效率。
2)深度强化学习在电-热综合能源系统的优化调度问题中探索能力更强,收敛稳定性更好,相较于智能体算法粒子群算法,调度成本更低。
3)本发明提出的基于柔性行动器-评判器(Soft Actor-Critic,SAC)算法的电-热综合能源系统深度强化学习经济调度方法,采用连续控制策略,避免了基于值函数强化学习方法离散化变量带来的高维求解困难问题,同时将最大熵添加到优化目标中,探索各种最优可能性。
以下结合具体实施和附图对发明的电-热综合能源系统协调优化方法进行详细说明。
本发明的方法包括以下步骤:
步骤1 导入电-热综合能源系统参数。
如图3所示为电-热综合能源系统图,首先收集如图3所示电热综合能源系统网络参数和电热负荷出力及风电出力。采集的数据如表1所示。
表1 电-热综合能源参数表
步骤2 建立电-热综合能源系统模型。
采用本发明将电-热综合能源系统分电力、热力系统和耦合装置这三部分进行建模。
(1)电力系统
本发明以交流潮流作为电力系统的分析方法,电力系统的功率平衡方程表示为:
式中Pi,Qi分别为节点i的注入有功、无功功率,Vi为节点i的电压幅值,Gij、Bij分别为支路ij的电导和电纳,θij为支路ij的相角差;
(2)热力系统
区域热力系统采用集中供热方式进行供暖,如图4表示热力系统简易示意图。
热力系统在热源处产生热能,通过送水管道输送到热负荷,经热负荷降温后通过回水管道回流,形成闭合回路。热力系统分为水力模型和热力模型两部分:
1)水力模型。热力系统的水力模型表示介质流动,由流量连续性方程,回路压力方程和压头损失方程构成。
2)热力模型。热力模型表示能量传输过程,由节点功率方程,管道温度下降方程和节点介质混合方程构成。
(3) 耦合装置
本发明热电联产机组采用抽凝式机组,运行点在多边形区域内,其产电产热功率可用式(7)表示:
步骤201 建立目标函数。本发明以实现电-热综合能源系统的总运行成本最小为目标,同时为实现可在生能源的最大消纳,将可在生能源未消纳的部分作为惩罚项:
式中,f1为常规机组运行成本,f2为热电联产装置运行成本,f3为弃风惩罚。
1)常规机组运行成本
2)热电联产机组运行成本
3)弃风惩罚
步骤202 建立优化模型的约束条件。
1)节点功率平衡等式约束条件,式(12)、(13)表示网络节点有功功率平衡方程。
2)网络安全约束
为实现电-热综合能源系统安全可靠运行,系统应满足式(14)-式(16)的网络约束。
3)热电联产装置约束
热电联产机组应满足爬坡约束:
4)可再生能源约束
5)常规机组出力约束
同时满足爬坡约束:
步骤3 建立基于SAC的电-热耦合综合能源系统优化调度模型。根据强化学习环境,状态,动作,奖励这4个基本要素,结合电-热综合能源系统调度模型建立基于SAC框架的优化调度模型。
1)动作空间。动作空间变量与所研究系统的控制变量相对应,将常规机组发电功率,热电联产发电功率以及热电联产热功率作为动作变量,如下所示。
2)状态空间。状态空间变量与所研究系统的状态变量对应,状态空间选取为电负荷,风力发电功率,热电联产装置发电功率,常规机组出力,热负荷,热电联产装置产热功率以及环境温度:
式中,
3)环境。本发明搭建强化学习环境,通过策略网络得到当前动作作用于环境,得到即时奖励和下一时段的状态,起到状态转移的作用,并为策略评估提供奖励。
4)奖励函数。强化学习目标为实现长期奖励最大化,则将优化目标的相反数设计为即时奖励,同时根据约束条件设置惩罚机制加入到即时奖励中得到最终的奖励函数。惩罚项统一表达形式为式(23)
奖励函数包括常规机组运行成本,弃风惩罚,热电联产装置运行成本以及变量越限惩罚。
式中分别为电力系统、热力系统运行成本以及弃风惩罚,,
分别为常规机组出力越限及爬坡越限惩罚项,为系统节点电压越限惩罚,为热电联产机组出力及爬坡越限惩罚项,为系统节点温度越限惩
罚,为系统管道质量流量速率越限惩罚。
初始化,并给评判器目标网络赋值,即,设置智能
记忆库D容量。当连续轮训练的奖励平均值变化幅度时,对于每一时段,都需要从
行动器策略网络中采样控制动作,并将动作施加在电-热综合能源系统
上,针对风电不确定性进行采样,得到系统下一个时刻运行状态,再将状态转移及奖
励置入经验库D,即;对于每一次梯度更新,采用Adam策
略更新评判器Q网络、行动器策略网络、温度系数、目标网络。
并且训练好的策略网络在给定负荷等系统状态时可以直接给出调度动作,生成策略。
另外,作为优选实施例,发电机以及热电联产机组成本的计算可采用线性模型替代,但会影响计算结果精度;CHP机组惩罚项可采用定电热比形式进行建模,但其控制灵活性和计算准确度不如多边形区域模型;奖惩机制中的惩罚函数可以采用阶跃函数的形式建立,但阶跃函数或噪声神经网络拟合困难,降低求解精度。训练方法可采用随机梯度下降法SGD替代Adam,但实践表明Adam算法更好。
如图6所示,本发明还提供一种电-热综合能源系统协调优化系统,包括:
第一参数获取模块,用于获取实时电-热综合能源系统参数;
功率计算模块,用于基于所述电-热综合能源系统参数,分别计算电-热综合能源系统的电力系统、热力系统和耦合装置的发电功率;
调度输出模块,用于将所述发电功率输入预先训练的基于SAC框架优化调度模型中,输出调度动作,形成电-热综合能源系统协调策略。
其中,如图7所示,所述调度输出模块中预先训练的基于SAC框架优化调度模型包括:
第二参数获取模块,用于获取历史电-热综合能源系统参数;
模型建立模块,用于基于所述电-热综合能源系统参数,分别计算电-热综合能源系统的电力系统、热力系统和耦合装置的发电功率,并以电力系统、热力系统和耦合装置的发电功率为基础建立电-热综合能源系统模型;
模型优化模块,用于以强化学习环境、状态、动作及奖励作为基本要素,结合电-热综合能源系统调度模型建立基于SAC框架优化调度模型;
模型训练模块,用于对基于SAC框架优化调度模型进行训练,得到预先训练的基于SAC框架优化调度模型。
优选的,所述模型建立模块具体用于:
以实现电-热综合能源系统的总运行成本最小为目标,同时为实现可在生能源的最大消纳,将可在生能源未消纳的部分作为惩罚项,建立目标函数;
建立电-热综合能源系统模型的约束条件,约束条件包括:节点功率平衡等式约束、网络安全约束、热电联产装置约束、可再生能源约束和常规机组出力约束。
优选的,所述目标函数为:
式中,f1为常规机组运行成本,f2为热电联产装置运行成本,f3为弃风惩罚;
其中,常规机组运行成本具体为:
其中,热电联产机组运行成本具体为:
其中,弃风惩罚具体为:
优选的,所述节点功率平衡等式约束条件基于网络节点有功功率平衡方程,具体为:
所述网络安全约束具体为:
所述热电联产装置约束具体为:
所述可再生能源约束具体为:
所述常规机组出力约束具体为:
同时满足爬坡约束:
优选的,所述模型优化模块具体用于:
所述模型优化模块具体用于:
将常规机组发电功率、热电联产发电功率以及热电联产热功率作为动作变量,具体如下:
选取为电负荷、风力发电功率、热电联产装置发电功率、常规机组出力、热负荷、热电联产装置产热功率以及环境温度作为状态空间变量,具体为:
搭建强化学习环境,通过策略网络得到当前动作作用于环境,得到即时奖励和下一时段的状态,并为策略评估提供奖励;
强化学习目标为实现长期奖励最大化,将优化目标的相反数设计为即时奖励,同时根据约束条件设置惩罚机制加入到即时奖励中得到最终的奖励函数,惩罚项统一表达形式为:
奖励函数包括常规机组运行成本,弃风惩罚,热电联产装置运行成本以及变量越限惩罚,具体为:
式中分别为电力系统、热力系统运行成本以及弃风惩罚,,分
别为常规机组出力越限及爬坡越限惩罚项,为系统节点电压越限惩罚,为热电联产机组出力及爬坡越限惩罚项,为系统节点温度越限惩罚,为系统管道质量流量速率越限惩罚。
优选的,所述模型训练模块具体用于:
给评判器目标网络赋值,设置智能记忆库容量D;
当连续轮训练的奖励平均值变化幅度时,对于每一时段,都从行动器策
略网络中采样控制动作,并将所述控制动作施加在电-热综合能源系统
上,并针对风电不确定性进行采样,得到系统下一个时刻运行状态,再将状态转移及
奖励置入经验库D;
如图8所示,本发明第三个目的是提供一种电子设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现所述电-热综合能源系统协调优化方法的步骤。
所述电-热综合能源系统协调优化方法包括以下步骤:
获取电-热综合能源系统参数;
基于所述电-热综合能源系统参数,计算电-热综合能源系统的电力系统、热力系统和耦合装置,并以电力系统、热力系统和耦合装置为基础建立电-热综合能源系统模型;
以强化学习环境、状态、动作及奖励作为基本要素,结合电-热综合能源系统调度模型建立基于SAC框架的优化调度模型;
对基于SAC框架的优化调度模型进行训练,得到优化的SAC框架的优化调度模型;通过优化的SAC框架的优化调度模型在给定负荷等系统状态时给出调度动作,进而生成策略。
本发明第四个目的是提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现所述电-热综合能源系统协调优化方法的步骤。
所述电-热综合能源系统协调优化方法包括以下步骤:
获取电-热综合能源系统参数;
基于所述电-热综合能源系统参数,计算电-热综合能源系统的电力系统、热力系统和耦合装置,并以电力系统、热力系统和耦合装置为基础建立电-热综合能源系统模型;
以强化学习环境、状态、动作及奖励作为基本要素,结合电-热综合能源系统调度模型建立基于SAC框架的优化调度模型;
对基于SAC框架的优化调度模型进行训练,得到优化的SAC框架的优化调度模型;通过优化的SAC框架的优化调度模型在给定负荷等系统状态时给出调度动作,进而生成策略。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。
Claims (19)
1.一种电-热综合能源系统协调优化方法,其特征在于,包括以下步骤:
获取实时电-热综合能源系统参数;
基于所述电-热综合能源系统参数,分别计算电-热综合能源系统的电力系统、热力系统和耦合装置的发电功率;
将所述发电功率输入预先训练的基于SAC框架优化调度模型中,输出调度动作,形成电-热综合能源系统协调策略。
2.根据权利要求1所述的电-热综合能源系统协调优化方法,其特征在于,
所述预先训练的基于SAC框架优化调度模型的训练优化方法包括:
获取历史电-热综合能源系统参数;
基于所述电-热综合能源系统参数,分别计算电-热综合能源系统的电力系统、热力系统和耦合装置的发电功率,并以电力系统、热力系统和耦合装置的发电功率为基础建立电-热综合能源系统模型;
以强化学习环境、状态、动作及奖励作为基本要素,结合电-热综合能源系统调度模型建立基于SAC框架优化调度模型;
对基于SAC框架优化调度模型进行训练,得到预先训练的基于SAC框架优化调度模型。
3.根据权利要求1或2所述的电-热综合能源系统协调优化方法,其特征在于,
所述电-热综合能源系统参数包括电热综合能源系统网络参数和电热负荷出力及风电出力。
4.根据权利要求1或2所述的电-热综合能源系统协调优化方法,其特征在于,
所述基于所述电-热综合能源系统参数,分别计算电-热综合能源系统的电力系统、热力系统和耦合装置的发电功率,具体包括:
1)电力系统
以交流潮流作为电力系统的分析方法,电力系统的功率平衡方程具体为:
式中Pi,Qi分别为节点i的注入有功、无功功率,Vi为节点i的电压幅值,Gij、Bij分别为支路ij的电导和电纳,θij为支路ij的相角差;
2)热力系统
热力系统分为水力模型和热力模型两部分:
热力系统的水力模型由流量连续性方程、回路压力方程和压头损失方程构成,具体为:
热力模型由节点功率方程、管道温度下降方程和节点介质混合方程构成,具体为:
3) 耦合装置
耦合装置产电产热功率具体为:
5.根据权利要求2所述的电-热综合能源系统协调优化方法,其特征在于,
所述以电力系统、热力系统和耦合装置的发电功率为基础建立电-热综合能源系统模型,具体包括:
以实现电-热综合能源系统的总运行成本最小为目标,同时为实现可在生能源的最大消纳,将可在生能源未消纳的部分作为惩罚项,建立目标函数;
建立电-热综合能源系统模型的约束条件,约束条件包括:节点功率平衡等式约束、网络安全约束、热电联产装置约束、可再生能源约束和常规机组出力约束。
7.根据权利要求5所述的电-热综合能源系统协调优化方法,其特征在于,
所述节点功率平衡等式约束条件基于网络节点有功功率平衡方程,具体为:
所述网络安全约束具体为:
所述热电联产装置约束具体为:
所述可再生能源约束具体为:
所述常规机组出力约束具体为:
同时满足爬坡约束:
8.根据权利要求2所述的电-热综合能源系统协调优化方法,其特征在于,
所述以强化学习环境、状态、动作及奖励作为基本要素,结合电-热综合能源系统调度模型建立基于SAC框架优化调度模型,具体包括:
将常规机组发电功率、热电联产发电功率以及热电联产热功率作为动作变量,具体如下:
选取为电负荷、风力发电功率、热电联产装置发电功率、常规机组出力、热负荷、热电联产装置产热功率以及环境温度作为状态空间变量,具体为:
式中,
搭建强化学习环境,通过策略网络得到当前动作作用于环境,得到即时奖励和下一时段的状态,并为策略评估提供奖励;
强化学习目标为实现长期奖励最大化,将优化目标的相反数设计为即时奖励,同时根据约束条件设置惩罚机制加入到即时奖励中得到最终的奖励函数,惩罚项统一表达形式为:
奖励函数包括常规机组运行成本,弃风惩罚,热电联产装置运行成本以及变量越限惩罚,具体为:
10.根据权利要求2所述的电-热综合能源系统协调优化方法,其特征在于,
更新评判器Q网络、行动器策略网络、温度系数、目标网络采用的方法为SGD算法或Adam算法。
11.一种电-热综合能源系统协调优化系统,其特征在于,包括:
第一参数获取模块,用于获取实时电-热综合能源系统参数;
功率计算模块,用于基于所述电-热综合能源系统参数,分别计算电-热综合能源系统的电力系统、热力系统和耦合装置的发电功率;
调度输出模块,用于将所述发电功率输入预先训练的基于SAC框架优化调度模型中,输出调度动作,形成电-热综合能源系统协调策略。
12.根据权利要求11所述的一种电-热综合能源系统协调优化系统,其特征在于,所述调度输出模块中预先训练的基于SAC框架优化调度模型包括:
第二参数获取模块,用于获取历史电-热综合能源系统参数;
模型建立模块,用于基于所述电-热综合能源系统参数,分别计算电-热综合能源系统的电力系统、热力系统和耦合装置的发电功率,并以电力系统、热力系统和耦合装置的发电功率为基础建立电-热综合能源系统模型;
模型优化模块,用于以强化学习环境、状态、动作及奖励作为基本要素,结合电-热综合能源系统调度模型建立基于SAC框架优化调度模型;
模型训练模块,用于对基于SAC框架优化调度模型进行训练,得到预先训练的基于SAC框架优化调度模型。
13.根据权利要求12所述的一种电-热综合能源系统协调优化系统,其特征在于,所述模型建立模块具体用于:
以实现电-热综合能源系统的总运行成本最小为目标,同时为实现可在生能源的最大消纳,将可在生能源未消纳的部分作为惩罚项,建立目标函数;
建立电-热综合能源系统模型的约束条件,约束条件包括:节点功率平衡等式约束、网络安全约束、热电联产装置约束、可再生能源约束和常规机组出力约束。
15.根据权利要求13所述的一种电-热综合能源系统协调优化系统,其特征在于,所述节点功率平衡等式约束条件基于网络节点有功功率平衡方程,具体为:
所述网络安全约束具体为:
所述热电联产装置约束具体为:
所述可再生能源约束具体为:
所述常规机组出力约束具体为:
同时满足爬坡约束:
16.根据权利要求12所述的一种电-热综合能源系统协调优化系统,其特征在于,所述模型优化模块具体用于:
将常规机组发电功率、热电联产发电功率以及热电联产热功率作为动作变量,具体如下:
选取为电负荷、风力发电功率、热电联产装置发电功率、常规机组出力、热负荷、热电联产装置产热功率以及环境温度作为状态空间变量,具体为:
式中,
搭建强化学习环境,通过策略网络得到当前动作作用于环境,得到即时奖励和下一时段的状态,并为策略评估提供奖励;
强化学习目标为实现长期奖励最大化,将优化目标的相反数设计为即时奖励,同时根据约束条件设置惩罚机制加入到即时奖励中得到最终的奖励函数,惩罚项统一表达形式为:
奖励函数包括常规机组运行成本,弃风惩罚,热电联产装置运行成本以及变量越限惩罚,具体为:
18.一种电子设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现权利要求1-10任一项所述电-热综合能源系统协调优化方法的步骤。
19.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-10任一项所述电-热综合能源系统协调优化方法的步骤。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111349881.4A CN113902040B (zh) | 2021-11-15 | 2021-11-15 | 电-热综合能源系统协调优化方法、系统、设备及存储介质 |
PCT/CN2022/107149 WO2023082697A1 (zh) | 2021-11-15 | 2022-07-21 | 电-热综合能源系统协调优化方法、系统、设备、介质及程序 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111349881.4A CN113902040B (zh) | 2021-11-15 | 2021-11-15 | 电-热综合能源系统协调优化方法、系统、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113902040A true CN113902040A (zh) | 2022-01-07 |
CN113902040B CN113902040B (zh) | 2022-03-08 |
Family
ID=79194394
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111349881.4A Active CN113902040B (zh) | 2021-11-15 | 2021-11-15 | 电-热综合能源系统协调优化方法、系统、设备及存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN113902040B (zh) |
WO (1) | WO2023082697A1 (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114372645A (zh) * | 2022-03-22 | 2022-04-19 | 山东大学 | 基于多智能体强化学习的供能系统优化方法及系统 |
CN115117888A (zh) * | 2022-06-28 | 2022-09-27 | 国网江苏省电力有限公司电力科学研究院 | 一种园区综合能源调压方法、装置、存储器及计算设备 |
WO2023082697A1 (zh) * | 2021-11-15 | 2023-05-19 | 中国电力科学研究院有限公司 | 电-热综合能源系统协调优化方法、系统、设备、介质及程序 |
CN116307136A (zh) * | 2023-02-24 | 2023-06-23 | 国网安徽省电力有限公司营销服务中心 | 一种基于深度强化学习的能源系统参数优化方法、系统、装置及存储介质 |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113706094B (zh) * | 2021-07-29 | 2024-02-20 | 国电南瑞科技股份有限公司 | 一种基于消息总线的综合能源实时协同仿真系统及方法 |
CN116629029B (zh) * | 2023-07-19 | 2023-09-29 | 天津大学 | 基于数据驱动的流程工业用户灵活性评估方法及相关设备 |
CN116629587A (zh) * | 2023-07-24 | 2023-08-22 | 长江三峡集团实业发展(北京)有限公司 | 一种综合能源系统多目标扩容规划方法、装置及电子设备 |
CN117411036A (zh) * | 2023-08-31 | 2024-01-16 | 国家电网有限公司华东分部 | 一种考虑综合需求响应的电转氢综合能源运行方法及装置 |
CN116911577B (zh) * | 2023-09-13 | 2024-02-09 | 国网信息通信产业集团有限公司 | 综合能源调度方法、装置、电子设备和计算机可读介质 |
CN117371219B (zh) * | 2023-10-20 | 2024-03-12 | 华北电力大学 | 一种应用于综合能源系统的拓展能源枢纽建模方法 |
CN117151701B (zh) * | 2023-10-31 | 2024-02-09 | 山东欣历能源有限公司 | 一种热电联产的工业余热回收利用系统 |
CN117273810B (zh) * | 2023-11-03 | 2024-04-05 | 连云港智源电力设计有限公司 | 一种含激励相容性质的综合能源共享调度方法及系统 |
CN117455183A (zh) * | 2023-11-09 | 2024-01-26 | 国能江苏新能源科技开发有限公司 | 一种基于深度强化学习的综合能源系统优化调度方法 |
CN117252043B (zh) * | 2023-11-17 | 2024-04-09 | 山东大学 | 针对区域多能互补能源系统的多目标优化调度方法及装置 |
CN117272842B (zh) * | 2023-11-21 | 2024-02-27 | 中国电建集团西北勘测设计研究院有限公司 | 多工业园区综合能源系统的协同控制系统及方法 |
CN117291315B (zh) * | 2023-11-24 | 2024-02-20 | 湖南大学 | 一种碳循环利用的电-气-热多能联供网络协同运行方法 |
CN117291445B (zh) * | 2023-11-27 | 2024-02-13 | 国网安徽省电力有限公司电力科学研究院 | 一种综合能源系统下基于状态转移的多目标预测方法 |
CN117374975B (zh) * | 2023-12-06 | 2024-02-27 | 国网湖北省电力有限公司电力科学研究院 | 一种基于近似动态规划的配电网实时协同调压方法 |
CN117436672B (zh) * | 2023-12-20 | 2024-03-12 | 国网湖北省电力有限公司经济技术研究院 | 考虑等效循环寿命和温控负荷的综合能源运行方法及系统 |
CN117494910B (zh) * | 2024-01-02 | 2024-03-22 | 国网山东省电力公司电力科学研究院 | 一种基于碳减排的多能源协调优化控制系统及方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109190271A (zh) * | 2018-09-13 | 2019-01-11 | 东北大学 | 一种考虑传输损耗的电热综合能源系统经济优化调度方法 |
CN109241655A (zh) * | 2018-09-27 | 2019-01-18 | 河海大学 | 一种电-热互联综合能源系统机会约束协调优化方法 |
CN109345045A (zh) * | 2018-11-29 | 2019-02-15 | 东北大学 | 基于双乘子迭代算法的电热综合能源系统经济调度方法 |
US20200327411A1 (en) * | 2019-04-14 | 2020-10-15 | Di Shi | Systems and Method on Deriving Real-time Coordinated Voltage Control Strategies Using Deep Reinforcement Learning |
CN112668791A (zh) * | 2020-12-30 | 2021-04-16 | 华北电力大学(保定) | 热电联供系统的优化方法 |
CN112734591A (zh) * | 2020-11-26 | 2021-04-30 | 清华大学 | 电热综合协调调度方法及装置、设备及介质 |
CN112862281A (zh) * | 2021-01-26 | 2021-05-28 | 中国电力科学研究院有限公司 | 综合能源系统调度模型构建方法、装置、介质及电子设备 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113902040B (zh) * | 2021-11-15 | 2022-03-08 | 中国电力科学研究院有限公司 | 电-热综合能源系统协调优化方法、系统、设备及存储介质 |
-
2021
- 2021-11-15 CN CN202111349881.4A patent/CN113902040B/zh active Active
-
2022
- 2022-07-21 WO PCT/CN2022/107149 patent/WO2023082697A1/zh unknown
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109190271A (zh) * | 2018-09-13 | 2019-01-11 | 东北大学 | 一种考虑传输损耗的电热综合能源系统经济优化调度方法 |
CN109241655A (zh) * | 2018-09-27 | 2019-01-18 | 河海大学 | 一种电-热互联综合能源系统机会约束协调优化方法 |
CN109345045A (zh) * | 2018-11-29 | 2019-02-15 | 东北大学 | 基于双乘子迭代算法的电热综合能源系统经济调度方法 |
US20200327411A1 (en) * | 2019-04-14 | 2020-10-15 | Di Shi | Systems and Method on Deriving Real-time Coordinated Voltage Control Strategies Using Deep Reinforcement Learning |
CN112734591A (zh) * | 2020-11-26 | 2021-04-30 | 清华大学 | 电热综合协调调度方法及装置、设备及介质 |
CN112668791A (zh) * | 2020-12-30 | 2021-04-16 | 华北电力大学(保定) | 热电联供系统的优化方法 |
CN112862281A (zh) * | 2021-01-26 | 2021-05-28 | 中国电力科学研究院有限公司 | 综合能源系统调度模型构建方法、装置、介质及电子设备 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023082697A1 (zh) * | 2021-11-15 | 2023-05-19 | 中国电力科学研究院有限公司 | 电-热综合能源系统协调优化方法、系统、设备、介质及程序 |
CN114372645A (zh) * | 2022-03-22 | 2022-04-19 | 山东大学 | 基于多智能体强化学习的供能系统优化方法及系统 |
CN115117888A (zh) * | 2022-06-28 | 2022-09-27 | 国网江苏省电力有限公司电力科学研究院 | 一种园区综合能源调压方法、装置、存储器及计算设备 |
CN116307136A (zh) * | 2023-02-24 | 2023-06-23 | 国网安徽省电力有限公司营销服务中心 | 一种基于深度强化学习的能源系统参数优化方法、系统、装置及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
WO2023082697A1 (zh) | 2023-05-19 |
CN113902040B (zh) | 2022-03-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113902040B (zh) | 电-热综合能源系统协调优化方法、系统、设备及存储介质 | |
Li et al. | Coordinated load frequency control of multi-area integrated energy system using multi-agent deep reinforcement learning | |
Zhang et al. | Soft actor-critic–based multi-objective optimized energy conversion and management strategy for integrated energy systems with renewable energy | |
Mirinejad et al. | A review of intelligent control techniques in HVAC systems | |
Lu et al. | The PID Controller Based on the Artificial Neural Network and the Differential Evolution Algorithm. | |
Shakibjoo et al. | Load frequency control for multi-area power systems: A new type-2 fuzzy approach based on Levenberg–Marquardt algorithm | |
CN113935463A (zh) | 一种基于人工智能控制方法的微电网控制器 | |
CN111917134B (zh) | 一种基于数据驱动的配电网动态自主重构方法及系统 | |
CN113780688A (zh) | 一种电热联合系统的优化运行方法、系统、设备及介质 | |
CN117039981A (zh) | 一种面向含新能源的大规模电网优化调度方法、装置、存储介质 | |
Liu et al. | Digital twin-driven robotic disassembly sequence dynamic planning under uncertain missing condition | |
CN113346543B (zh) | 一种分布式微网电压多层协同控制方法 | |
Dounis et al. | Intelligent coordinator of fuzzy controller-agents for indoor environment control in buildings using 3-D fuzzy comfort set | |
Costa et al. | D-ADMM based distributed MPC with input-output models | |
Guan et al. | Robust adaptive recurrent cerebellar model neural network for non-linear system based on GPSO | |
Wai et al. | Intelligent daily load forecasting with fuzzy neural network and particle swarm optimization | |
Mollaiy Berneti | A hybrid approach based on the combination of adaptive neuro-fuzzy inference system and imperialist competitive algorithm: oil flow rate of the wells prediction case study | |
Dey et al. | Reinforcement Learning Building Control: An Online Approach with Guided Exploration using Surrogate Models | |
Guolian et al. | Multiple-model predictive control based on fuzzy adaptive weights and its application to main-steam temperature in power plant | |
Liu et al. | Model-free load frequency control based on multi-agent deep reinforcement learning | |
Shahriari-Kahkeshi et al. | Nonlinear continuous stirred tank reactor (CSTR) identification and control using recurrent neural network trained shuffled frog leaping algorithm | |
Lu et al. | Optimal Design of Energy Storage System Assisted AGC Frequency Regulation Based on DDPG Algorithm | |
Cheng et al. | Reinforcement learning-based scheduling of multi-battery energy storage system | |
Zhao et al. | Combination Optimization Method of Grid Section Based on Deep Reinforcement Learning with Accelerated Convergence Speed | |
Wai et al. | Design of intelligent long-term load forecasting with fuzzy neural network and particle swarm optimization |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |