CN114597916A - 一种基于知识-数据混合驱动算法的电网频率协同控制方法 - Google Patents
一种基于知识-数据混合驱动算法的电网频率协同控制方法 Download PDFInfo
- Publication number
- CN114597916A CN114597916A CN202210272873.2A CN202210272873A CN114597916A CN 114597916 A CN114597916 A CN 114597916A CN 202210272873 A CN202210272873 A CN 202210272873A CN 114597916 A CN114597916 A CN 114597916A
- Authority
- CN
- China
- Prior art keywords
- energy storage
- frequency
- storage system
- formula
- frequency modulation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004422 calculation algorithm Methods 0.000 title claims abstract description 77
- 238000000034 method Methods 0.000 title claims abstract description 30
- 238000004146 energy storage Methods 0.000 claims abstract description 75
- 230000009471 action Effects 0.000 claims abstract description 50
- 230000006870 function Effects 0.000 claims abstract description 30
- 238000012549 training Methods 0.000 claims abstract description 21
- 238000004364 calculation method Methods 0.000 claims abstract description 6
- 238000012546 transfer Methods 0.000 claims abstract description 5
- 238000013507 mapping Methods 0.000 claims abstract description 3
- 230000004044 response Effects 0.000 claims description 19
- 238000009795 derivation Methods 0.000 claims description 15
- 238000013528 artificial neural network Methods 0.000 claims description 10
- 230000008569 process Effects 0.000 claims description 10
- 230000008859 change Effects 0.000 claims description 8
- 239000003795 chemical substances by application Substances 0.000 claims description 8
- 238000005070 sampling Methods 0.000 claims description 4
- 230000004913 activation Effects 0.000 claims description 3
- 238000013016 damping Methods 0.000 claims description 3
- RVRCFVVLDHTFFA-UHFFFAOYSA-N heptasodium;tungsten;nonatriacontahydrate Chemical compound O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.O.[Na+].[Na+].[Na+].[Na+].[Na+].[Na+].[Na+].[W].[W].[W].[W].[W].[W].[W].[W].[W].[W].[W] RVRCFVVLDHTFFA-UHFFFAOYSA-N 0.000 claims description 3
- 210000002569 neuron Anatomy 0.000 claims description 3
- 230000001174 ascending effect Effects 0.000 claims description 2
- 238000011156 evaluation Methods 0.000 claims description 2
- 239000012467 final product Substances 0.000 claims description 2
- 230000003993 interaction Effects 0.000 claims description 2
- 238000010606 normalization Methods 0.000 claims description 2
- 230000001105 regulatory effect Effects 0.000 claims description 2
- 230000002028 premature Effects 0.000 claims 1
- 230000000694 effects Effects 0.000 description 15
- 230000002787 reinforcement Effects 0.000 description 8
- 230000035699 permeability Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 4
- 238000005457 optimization Methods 0.000 description 3
- 238000010248 power generation Methods 0.000 description 3
- 230000001360 synchronised effect Effects 0.000 description 3
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 229910052799 carbon Inorganic materials 0.000 description 2
- 230000009194 climbing Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000002485 combustion reaction Methods 0.000 description 1
- 238000005094 computer simulation Methods 0.000 description 1
- 238000011217 control strategy Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 238000006386 neutralization reaction Methods 0.000 description 1
- 230000010355 oscillation Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J3/00—Circuit arrangements for ac mains or ac distribution networks
- H02J3/24—Arrangements for preventing or reducing oscillations of power in networks
- H02J3/241—The oscillation concerning frequency
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J3/00—Circuit arrangements for ac mains or ac distribution networks
- H02J3/28—Arrangements for balancing of the load in a network by storage of energy
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J3/00—Circuit arrangements for ac mains or ac distribution networks
- H02J3/38—Arrangements for parallely feeding a single network by two or more generators, converters or transformers
- H02J3/46—Controlling of the sharing of output between the generators, converters, or transformers
- H02J3/466—Scheduling the operation of the generators, e.g. connecting or disconnecting generators to meet a given demand
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2113/00—Details relating to the application field
- G06F2113/04—Power grid distribution networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2119/00—Details relating to the type or aim of the analysis or the optimisation
- G06F2119/06—Power analysis or power optimisation
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J2203/00—Indexing scheme relating to details of circuit arrangements for AC mains or AC distribution networks
- H02J2203/20—Simulating, e g planning, reliability check, modelling or computer assisted design [CAD]
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02E—REDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
- Y02E70/00—Other energy conversion or management systems reducing GHG emissions
- Y02E70/30—Systems combining energy storage with energy generation of non-fossil origin
Landscapes
- Engineering & Computer Science (AREA)
- Power Engineering (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Hardware Design (AREA)
- Evolutionary Computation (AREA)
- Geometry (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Feedback Control In General (AREA)
Abstract
一种基于知识‑数据混合驱动算法的电网频率协同控制方法,根据新型电力系统各调频单元在控制系统中的传递函数,建立含储能设备的多机系统频率控制模型;采用演员‑评论家机制,以深度策略网络作为演员,构建起本地信息与控制器动作的映射关系,以系统频率偏差和调频控制器出力关于控制器输出动作的策略梯度解析表达式构建评论家,辅助深度策略网络参数的离线训练。本发明针对含储能设备的新型电力系统调频控制系统,建立知识‑数据混合驱动算法,显著降低了算法训练所需的迭代步数以及计算开销,并考虑了新型电力系统调频经济性因素,可实现新型电力系统各调频控制器在分布式执行中可仅依赖自身的本地状态信息就能实现全网调频单元间的协同控制。
Description
技术领域
本发明涉及一种电网频率协同控制方法。
背景技术
在“碳达峰”与“碳中和”的国家能源战略大背景下,以化石能源燃烧为驱动力的常规同步发电机组正加速被风电、光伏等清洁可再生能源驱动的发电机组所替代。然而,不断提高的可再生能源渗透率容易造成电源侧功率波动的问题,这给电能的供需平衡带来了挑战,进而显著削弱了电力系统对其频率的控制能力。与此同时,以电力电子变流器为接口与电网连接的新能源发电机组对常规同步机组的逐步替换,还会大幅度降低整个系统的转动惯量水平,从而大大加剧了由功率扰动引起的系统频率波动。
日益脆弱的电力系统频率稳定性正逐渐成为制约持续推进可再生能源发电替代的瓶颈问题。较低的惯量水平以及持续波动的电源侧功率将是未来可再生能源高渗透率电网运行与控制的新常态。可再生能源发电系统具有辅助调频的潜力,对于配备了储能的可再生能源发电系统,则可通过合理调节储能出力来使整个系统模拟传统同步机组的频率响应特性。
近年来兴起的深度强化学习算法为低惯量电力系统实时频率控制问题提供了新的解决思路。利用其强大的搜索学习能力,深度强化学习算法在面对复杂非线性频率控制问题时具有在线优化决策的潜力。谷歌DeepMind团队将深度强化学习拓展到了连续动作域,提出了基于深度确定策略梯度(Deep Deterministic Policy Gradient,DDPG)的演员-评论家(Actor-Critic)算法框架,从而极大地拓展了强化学习的应用范围。
发明内容
为了在可再生能源渗透率下实现电网频率实时控制,本发明提供一种基于知识-数据混合驱动算法的电网频率协同控制方法。
本发明在传统深度强化学习的基础上建立了一种知识-数据混合驱动的实时决策算法,用以在线协同各发电机和储能系统的频率响应控制。
为了实现上述目的,本发明的技术方案是:
一种基于知识-数据混合驱动算法的电网频率协同控制方法,该方法包括以下步骤:
S1:建立电网频率响应控制模型。确定模型的参数设置(如图1所示):确定下垂控制系数Rj(j∈[1,m+n]);分别确定调频机组调速器和汽轮机组的时间常数Ta、Tb;分别确定储能系统的时间常数与调频参与因子TB、kB,j(j∈[m+1,m+n]);分别确定系统的扰动功率、系统惯性时间常数和负荷阻尼系数ΔPL、H和D;确定调频发电机和储能系统在参与频率动态响应的最大/最小输出功率的约束限制。
S2:建立知识-数据混合驱动的实时决策算法,采用演员-评论家架构。其中,演员负责在每步动作中提供最优动作策略π,其实质为一个将状态s映射到动作A上的确定性函数,并通过策略网络u(s;θu)对其进行近似逼近。此外,为了避免算法过早地陷入局部最优,本算法在训练过程中对策略网络u(s;θu)的输出值叠加了随机自相关系数ξ。因此,训练过程中控制器j在状态s下的输出动作Aj可表示为:
分布式安装于不同调频机组与储能系统的控制器(演员网络)可通过与环境交互得到大量的经验样本数据。这些样本数据在对演员网络的参数训练过程中,会首先注入评论家模型。承载着原始经验样本信息的“数据”流与频率响应模型知识相结合后,最终以策略梯度的形式对演员网络参数进行集中式更新。建立的评论家为基于模型知识推导的可用于辅助演员神经网络参数训练更新的策略梯度。
S3:建立的训练流程,训练知识-数据混合驱动算法。
优选地,步骤S3所述的练知识-数据混合驱动算法的流程如下所示;
进一步,所述步骤S2中,知识-数据混合驱动的实时决策算法的构建包括以下过程:
S2-1:建立控制目标与奖励函数,系统频率偏差与系统调频总成本加权和的最小值作为算法控制目标,建立了状态动作值函数Qu(s,A)来量化未来T时间内系统在所有智能体协同控制下的整体性能:
式中,A代表当前时刻所有智能体输出动作的集合,即A=[A1,A2,···Am,···,Am+n];G与B分别为调频发电机组与储能系统的集合;m、n分别表示调频机组与储能系统的数量;Qu(s,A)的上标u表示,在当前状态s下决定状态动作值函数Qu(s,A)大小的动作集合A是由m+n个策略网络的输出u=[u1,u2,...,um,...,um+n]共同得到的;Δt、T分别代表时间步长大小及经验轨迹长度;s为t时刻系统的状态信息;为发电机组的单位出力成本;为储能系统的单位功率调度成本,其中储能在充电状态下储能在放电状态下λ为平衡电网频率偏差以及系统调频总成本的加权系数;f0、P0、C0分别表示用于统一量纲时归一化的基准值。为尽快消除系统频率偏差,式(4)右边的第一项加入了折扣因子γ∈(0,1),从而使当前时刻的Δf较未来的Δf有更大的权重。
S2-2:建立演员网络参数更新方法,通过最大化状态动作值函数的期望Es~ρ[Qu(s,A)]即可获得以其为评价指标的最优控制动作。因此,本发明基于梯度上升算法的思想,通过链式求导法则依次计算Es~ρ[Qu(s,A)]对参数的梯度,从而通过迭代更新参数θu实现沿梯度方向最大化Es~ρ[Qu(s,A)],也即获得了能使各个策略网络输出最优动作的网络参数
式中,η∈(0,1)为策略网络参数的学习率;N为小批量采样样本数,并通过求取N个状态动作值函数Qu(s,A)对的梯度的平均值来近似表示Es~ρ[Qu(s,A)]对的梯度。为实现如式(6)中的参数更新,必须首先求得式(5)中的与由于为含多隐含层的策略网络,其对应的函数表达式为因此,
S2-3:建立状态动作值函数的策略梯度,在网络参数Es~ρ[Qu(s,A)]的迭代更新过程中,为求得状态动作值函数的期望Es~ρ[Qu(s,A)]对的梯度,其关键在于获知状态动作值函数对控制器动作Aj的梯度根据链式求导法则,对于第i∈G台调频机组可得:
对于第j∈B个储能系统可得:
根据频率响应控制模型,系统频率偏差Δf(t)与调频机组/储能系统控制器输出指令Ai∈G/B之间的传递函数可以表达为如下形式:
相较于发电机组,储能系统的时间常数TB几乎可以忽略不计。为了方便计算,在后续推导过程中将TB近似为0。此外,各调频机组与储能系统的总出力与系统频率之间的传递函数可表示为:
对式(11)做拉普拉斯反变换并对控制动作Ai∈G求梯度,整理可得:
将式(12)代入(14),并整理得:
同理,对式(10)两端求Aj∈B的梯度:
(16)表征了第j个储能系统控制器在当前时刻输出的单位动作量,在之后的时刻t所引起的系统频率变化。因此,以零状态求解式(16)的一阶微分方程,可得:
式(17)中右边第一项代表单位控制指令Aj∈B所引起的频率变化最终稳态值。
对式(11)做拉普拉斯反变换并对控制动作Aj∈B求梯度,整理可得:
将式(16)代入(18),并整理得:
S2-4:建立调频机组与储能系统输出功率约束
调频机组与储能系统的实际有功出力不仅受到各自下垂控制系数与控制器输出的调控,同时还需时刻满足其最大和最小输出功率约束。调频机组/储能系统在频率响应中的功率变化量可表示为:
式中ΔPG/B,j代表第j台调频机组或储能系统的功率变化量。因此,发电机与储能系统最大/最小输出功率约束表示为:
式(24)表示,若沿方向更新参数将导致发电机/储能系统输出功率违反其最大/最小限制,则在下一步迭代中,将沿向量在以向量为法线的平面上的投影方向继续更新,从而使的更新轨迹始终处于频率控制模型所刻画的可行域内。
本发明的工作原理是:
本发明的效果是根据步骤S1建立实际新型电力系统的控制模型,通过步骤S2建立本算法Python程序,结合实际光伏出力波动数据,通过步骤S3训练本算法以达到控制效果
本发明有益效果是:
1、经过全局信息充分训练后的深度策略网络可习得各发电机和储能系统在频率响应过程中的不同特性,从而使得训练完备的各智能体在分布式执行中可仅依赖自身的本地状态信息就能实现全网发电机/储能系统间的协同控制。
2、相较于现有深度强化学习方法(如DQN、DDPG),本发明所提算法在系统频率控制、调频总成本以及算法训练时间等性能指标上均具有较为明显的优势。
附图说明
图1是本发明的含储能的多机系统频率协同控制模型图。
图2是本发明的基于知识-数据混合驱动算法的含储能多机系统频率协同控制原理图。
图3(a)是本发明的高光伏渗透率电力系统光伏功率变化情况图,图3(b)是本发明的的高光伏渗透率电力系统的负荷功率变化情况图。
图4是本发明的扰动功率的变化情况图。
图5是本发明所提算法与PID控制器的频率控制效果对比图。
图6是本发明所提算法与DQN、DDPG的频率控制效果对比图。
图7(a)~图7(c)是本发明所提算法与不同强化算法累积奖励值的迭代收敛过程对比图,其中图7(a)是DDPG算法迭代周期,图7(b)是DQN算法迭代周期,图7(c)是本发明所提算法迭代周期。
图8是加入经济性控制目标前后的算法频率控制效果对比图。
图9是加入经济性控制目标后不同发电机组和储能对电网频率偏差的协同响应功率变化图。
图10是本发明的流程图。
具体实施方式
下面结合附图对本发明做进一步说明。
参照图1、图2,一种基于知识-数据混合驱动算法的电网频率协同控制方法,该方法包括以下步骤:
S1:建立电网频率响应控制模型,确定实际单区域电力系统参与调频发电机组与储能设备的数量m,n;确定各台调频发电机组下垂控制系数Rj(j∈[1,m+n]);确定调频机组调速器和汽轮机组的时间常数分别Ta、Tb;确定储能系统的时间常数与调频参与因子TB、kB,j(j∈[m+1,m+n]);确定系统惯性时间常数和负荷阻尼系数H、D;确定各参与调频的发电机组与储能设备的功率约束上下限ΔPG,i、ΔPB,j。
S2:根据电网频率响应控制模型建立知识-数据混合驱动算法,在考虑经济指标的情况下确定控制目标与奖励函数;确定演员网络参数更新;确定动作值函数的策略梯度。
S3:建立知识-数据混合驱动算法训练流程,根据S2所建立的知识-数据混合驱动算法确定算法参数后根据表1确定知识-数据混合驱动算法训练流程;
S4:将训练完备的知识-数据混合驱动应用于实际单区域电力系统调频任务。
所述步骤S2中,知识-数据混合驱动算法的构建包括以下过程:
S2-1:根据参与调频的发电机组和储能设备数确定动作集合A,即A=[A1,A2,···Am,···,Am+n];G与B分别为调频发电机组与储能系统的集合;m、n分别表示调频机组与储能系统的数量。确定发电机组的单位出力成本储能系统的单位功率调度成本储能在充电状态下的成本储能在放电状态下的成本平衡电网频率偏差以及系统调频总成本的加权系数λ;
S2-2:建立演员网络参数更新方法,采用的函数拟合器为深度神经网络:
S2-3:根据状态动作值函数的策略梯度,建立评论家模型参数更新方式;
为使本领域技术人员更好地理解本发明,算例分析包括以下构成:
一、算例描述
本算例以图3所示的某典型高光伏渗透率电力系统为研究对象,并选取其某日正午时段的净负荷波动功率(负荷有功功率与光伏出力的差值)作为系统的扰动功率ΔPL进行算例仿真。由于受光伏功率剧烈波动影响(如图4所示),正午时段10分钟内扰动功率ΔPL的峰谷值分别为1800MW和1215MW,变化幅度高达48%。如果不采取有效的控制策略,系统频率稳定乃至电网运行安全都将受到严峻的挑战。
二、实际控制行为分析
算例采用含8台发电机组(编号为G1-G8)和1个储能系统组成的多机电力系统以验证所提实时决策算法在系统频率控制与系统调频总成本优化方面的有效性。在Python环境中建立了含储能的多机电力系统频率响应动态仿真模型,并将其作为本发明所提算法中演员网络的训练环境。此外,各发电机组的输出功率基准值最大输出功率最小输出功率以及单位发电成本如表1所示;储能系统的输出功率基准值最大充/放电功率以及单位功率调度成本如表2所示。本发明所提算法中的经验轨迹(episode)数M、经验回放池容量D、小批量采样样本数N、学习率η、折扣因子γ、智能体个数g等参数设置如表3所示。
表1
表2
表3
三、案例对比分析
算例首先对传统PID控制器、经PSO算法参数优化后的PID控制器以及本发明所建立算法在系统频率实时控制性能方面进行对比。由图5可知,在传统PID控制器的实时调节下,扰动功率剧烈波动的正午时段有大约±0.042Hz的系统频率偏差。相较于传统PID控制器,经PSO算法参数优化后,PID控制器的频率效果虽然有所改善,但效果仍然不够理想,系统频率偏差在(-0.030Hz,0.032Hz)的范围内波动。而在同一时段内,本发明所提实时决策算法能够使系统频率偏差范围明显收窄至(-0.015Hz,0.018Hz),因而可大大提高电网在大规模新能源并网场景下的系统频率稳定性。
本发明所提算法与DDPG算法均为基于连续动作空间的深度强化学习算法。如图6所示,该两者的实时频率控制效果都明显优于基于离散动作空间设计的DQN算法。而本发明所提算法在整合了知识驱动与数据驱动的各自优势之后,在连续动作域的实时频率控制效果上,相较于经充分训练的DDPG算法有进一步的提升。图7对比了DQN算法、DDPG算法与本发明所提算法累积奖励值的迭代收敛过程。其中,DQN算法与DDPG算法在分别经历了约400与650个迭代周期后,其累积奖励值的变化趋于平稳,不再继续增加。本算例的每个迭代周期均为包含200次迭代的一条经验轨迹。即两种算法分别需要8万和13万次迭代更新才趋于收敛。而采用了知识-数据混合驱动的算法只需经历大约150个迭代周期(3万次迭代更新)就能完成深度神经网络的参数训练,且该算法的收敛曲线振荡幅度最小。
本发明所提算法通过在目标函数中引入加权系数λ来平衡电网的频率偏差控制效果以及系统调频总成本。不同加权系数下算法的频率与经济性指标如表4所示。
表4
其中,分别为仿真时段内频率偏差绝对值以及系统调频总成本的平均值。由表4可知,较大的加权系数λ在使得本发明所提算法有较好频率控制效果的同时增加了系统调频总成本;反之,较小的加权系数λ则以增大系统频率波动幅度为代价,进一步提高了系统运行的经济性。调度运行人员可依据当前系统运行状态下频率偏差和系统调频总成本的相对重要程度来相应设置加权系数。
图8比较了本发明所提算法在加权系数λ取1和0.6时的频率控制效果。由于在控制目标中加入了经济性指标,算法对频率偏差惩罚权重相对降低,从而导致系统最大频率偏差相较于加入经济性指标前略有增大。因此,在所提算法的控制下,系统整体运行成本的下降不以显著牺牲系统频率控制效果为代价,因而能较好地平衡系统频率偏差控制与系统调频总成本。
本算例比较了11:15:00至11:15:30时间段内各在线发电机组和储能系统在电网净负荷(扰动功率)陡然上升场景下的输出功率变化量,以展示在本发明所提算法控制下不同主体对系统频率偏差的协同响应情况。系统净负荷(如图4所示)自11:15:00起,由于受到光伏功率剧烈波动的影响,首先经历了一个迅猛上升的过程;紧接着在11:15:10至11:15:20这一时间段内进入了一个相对稳定的阶段;最后在11:15:20至11:15:30段内系统净负荷开始略有下降。为了迅速补偿由净负荷突增而导致的系统频率跌落,如图9所示,发电机组和储能系统的输出功率在净负荷突增后的第一阶段都会快速增加。在此阶段内,系统频率的偏移量较大,控制目标式(4)中的第一项(频率偏差)起主导作用。储能系统由于几乎不受爬坡速率的约束,其放电功率瞬间达到最大,并在第一阶段维持其最大放电功率用于辅助爬坡较慢的发电机组进行调频。然而,随着系统频率偏差逐步被补偿,约在11:15:10之后的第二阶段,控制目标(4)中的第二项(经济指标)的作用开始凸显。从图9可以看到,到了第二阶段(系统净负荷相对稳定),由于受调频成本的影响,单位出力成本较高的发电机组G7、G8在此阶段内逐步减少功率输出,同时储能系统降低放电功率至零附近,从而提升系统的整体调频经济性;而单位出力成本较低的发电机组G1、G2在此阶段内将继续增加各自的输出功率以继续补偿系统频率偏差以及储能与高成本机组逐步退出带来的功率缺额。值得注意的是,由于受到输出功率上限的约束,如图9所示,G1在第二阶段达到出力饱和。进入第三阶段,受净负荷功率缓慢下降的影响,出力较高的发电机组(如G7)和出力成本中等的发电机组(如G4)的输出功率都出现了不同程度的降低。由此可见,本发明所提算法在加入经济性控制指标后,可以根据当前系统的实时频率偏差与各调频主体的单位出力成本以及出力上下限,合理地分配功率输出,从而实现了对系统频率偏差的经济性协同响应。
本说明书实施例所述的内容仅仅是对发明构思的实现形式的列举,本发明的保护范围不应当被视为仅限于实施例所陈述的具体形式,本发明的保护范围也包括本领域技术人员根据本发明构思所能够想到的等同技术手段。
Claims (3)
1.一种基于知识-数据混合驱动算法的电网频率协同控制方法,其特征在于,包括以下步骤:
S1:建立电网频率响应控制模型,确定模型的参数设置,包括:确定下垂控制系数Rj(j∈[1,m+n]);分别确定调频机组调速器和汽轮机组的时间常数Ta、Tb;分别确定储能系统的时间常数与调频参与因子TB、kB,j(j∈[m+1,m+n]);分别确定系统的扰动功率、系统惯性时间常数和负荷阻尼系数ΔPL、H和D;确定调频发电机和储能系统在参与频率动态响应的最大/最小输出功率的约束限制;
S2:建立知识-数据混合驱动的实时决策算法,包括:采用演员-评论家架构;演员在每步动作中提供最优动作策略π,其实质为一个将状态s映射到动作A上的确定性函数,并通过策略网络u(s;θu)对其进行近似;为了避免过早地陷入局部最优,在训练过程中对策略网络u(s;θu)的输出值叠加了随机自相关系数ξ;因此,训练过程中控制器j在状态s下的输出动作Aj可表示为:
分布式调频机组与储能系统的控制器(演员网络)可通过与环境交互得到大量的经验样本数据;这些样本数据在对演员网络的参数训练过程中,会首先注入评论家模型;承载着原始经验样本信息的“数据”流与频率响应模型知识相结合后,最终以策略梯度的形式对演员网络参数进行集中式更新;建立的评论家为基于模型知识推导的可用于辅助演员神经网络参数训练更新的策略梯度;
S3:建立的训练流程,训练知识-数据混合驱动算法。
2.如权利要求1所述的一种基于知识-数据混合驱动算法的电网频率协同控制方法,其特征在于,步骤S4所述的训练知识-数据混合驱动算法,具体包括:
4:for episode=1 to M,do
5:利用自相关系数ξ初始化随机过程进行动作探索。
6:获得初始状态值si。
7:for t=1 to T,do
8:for智能体j=1 to m+n,do
10:end for
12:end for
13:往复循环步骤7-12,获得A1→AT下的所有状态,即:
s1→sT
14:根据步骤13可获得此经验轨迹下所有步长下的状态分量Δf:Δf(1)→Δf(T)
16:从经验回放池中随机采样N个经验样本,作为演员网络j的小批量训练样本数据。
20:计算发电机/储能系统j的输出功率:
21:if发电机/储能系统j的输出功率未越界,即
24:end if
25:end for。
3.如权利要求1所述的一种基于知识-数据混合驱动算法的电网频率协同控制方法,其特征在于,步骤S2所述的知识-数据混合驱动的实时决策算法的构建包括:
S2-1:建立控制目标与奖励函数,系统频率偏差与系统调频总成本加权和的最小值作为算法控制目标,建立了状态动作值函数Qu(s,A)来量化未来T时间内系统在所有智能体协同控制下的整体性能:
式中,A代表当前时刻所有智能体输出动作的集合,即A=[A1,A2,…Am,…,Am+n];G与B分别为调频发电机组与储能系统的集合;m、n分别表示调频机组与储能系统的数量;Qu(s,A)的上标u表示,在当前状态s下决定状态动作值函数Qu(s,A)大小的动作集合A是由m+n个策略网络的输出u=[u1,u2,...,um,...,um+n]共同得到的;Δt、T分别代表时间步长大小及经验轨迹长度;s为t时刻系统的状态信息;为发电机组的单位出力成本;为储能系统的单位功率调度成本,其中储能在充电状态下储能在放电状态下λ为平衡电网频率偏差以及系统调频总成本的加权系数;f0、P0、C0分别表示用于统一量纲时归一化的基准值;为尽快消除系统频率偏差,式(4)右边的第一项加入了折扣因子γ∈(0,1),从而使当前时刻的Δf较未来的Δf有更大的权重;
S2-2:建立演员网络参数更新方法,通过最大化状态动作值函数的期望Es~ρ[Qu(s,A)]即可获得以其为评价指标的最优控制动作;因此,本发明基于梯度上升算法的思想,通过链式求导法则依次计算Es~ρ[Qu(s,A)]对参数的梯度,从而通过迭代更新参数θu实现沿梯度方向最大化Es~ρ[Qu(s,A)],也即获得了能使各个策略网络输出最优动作的网络参数
式中,η∈(0,1)为策略网络参数的学习率;N为小批量采样样本数,并通过求取N个状态动作值函数Qu(s,A)对的梯度的平均值来近似表示Es~ρ[Qu(s,A)]对的梯度;为实现如式(6)中的参数更新,必须首先求得式(5)中的与由于为含多隐含层的策略网络,其对应的函数表达式为因此,
S2-3:建立状态动作值函数的策略梯度,在网络参数Es~ρ[Qu(s,A)]的迭代更新过程中,为求得状态动作值函数的期望Es~ρ[Qu(s,A)]对的梯度,其关键在于获知状态动作值函数对控制器动作Aj的梯度根据链式求导法则,对于第i∈G台调频机组可得:
对于第j∈B个储能系统可得:
根据频率响应控制模型,系统频率偏差Δf(t)与调频机组/储能系统控制器输出指令Ai∈G/B之间的传递函数可以表达为如下形式:
相较于发电机组,储能系统的时间常数TB几乎可以忽略不计;为了方便计算,在后续推导过程中将TB近似为0;此外,各调频机组与储能系统的总出力与系统频率之间的传递函数可表示为:
对式(11)做拉普拉斯反变换并对控制动作Ai∈G求梯度,整理可得:
将式(12)代入(14),并整理得:
同理,对式(10)两端求Aj∈B的梯度:
(16)表征了第j个储能系统控制器在当前时刻输出的单位动作量,在之后的时刻t所引起的系统频率变化;因此,以零状态求解式(16)的一阶微分方程,可得:
式(17)中右边第一项代表单位控制指令Aj∈B所引起的频率变化最终稳态值;
对式(11)做拉普拉斯反变换并对控制动作Aj∈B求梯度,整理可得:
将式(16)代入(18),并整理得:
S2-4:建立调频机组与储能系统输出功率约束
调频机组与储能系统的实际有功出力不仅受到各自下垂控制系数与控制器输出的调控,同时还需时刻满足其最大和最小输出功率约束;调频机组/储能系统在频率响应中的功率变化量可表示为:
式中ΔPG/B,j代表第j台调频机组或储能系统的功率变化量;因此,发电机与储能系统最大/最小输出功率约束表示为:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210272873.2A CN114597916A (zh) | 2022-03-18 | 2022-03-18 | 一种基于知识-数据混合驱动算法的电网频率协同控制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210272873.2A CN114597916A (zh) | 2022-03-18 | 2022-03-18 | 一种基于知识-数据混合驱动算法的电网频率协同控制方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114597916A true CN114597916A (zh) | 2022-06-07 |
Family
ID=81811371
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210272873.2A Pending CN114597916A (zh) | 2022-03-18 | 2022-03-18 | 一种基于知识-数据混合驱动算法的电网频率协同控制方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114597916A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115473287A (zh) * | 2022-08-25 | 2022-12-13 | 电子科技大学 | 风力发电系统的非脆弱离散pid控制方法、系统及终端 |
CN116526515A (zh) * | 2023-07-03 | 2023-08-01 | 南方电网科学研究院有限责任公司 | 电网频率调控方法及控制器 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111179121A (zh) * | 2020-01-17 | 2020-05-19 | 华南理工大学 | 基于专家系统与深度逆向强化学习的电网紧急控制方法 |
US20200327411A1 (en) * | 2019-04-14 | 2020-10-15 | Di Shi | Systems and Method on Deriving Real-time Coordinated Voltage Control Strategies Using Deep Reinforcement Learning |
CN111817317A (zh) * | 2020-07-30 | 2020-10-23 | 四川大学 | 具有串补线路的风力发电系统次同步振荡定量分析方法 |
CN113141016A (zh) * | 2021-04-27 | 2021-07-20 | 南京工程学院 | 基于区域控制偏差的储能系统辅助传统机组调频的控制方法 |
CN113837432A (zh) * | 2021-08-12 | 2021-12-24 | 华北电力大学 | 一种物理-数据联合驱动的电力系统频率预测方法 |
-
2022
- 2022-03-18 CN CN202210272873.2A patent/CN114597916A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200327411A1 (en) * | 2019-04-14 | 2020-10-15 | Di Shi | Systems and Method on Deriving Real-time Coordinated Voltage Control Strategies Using Deep Reinforcement Learning |
CN111179121A (zh) * | 2020-01-17 | 2020-05-19 | 华南理工大学 | 基于专家系统与深度逆向强化学习的电网紧急控制方法 |
CN111817317A (zh) * | 2020-07-30 | 2020-10-23 | 四川大学 | 具有串补线路的风力发电系统次同步振荡定量分析方法 |
CN113141016A (zh) * | 2021-04-27 | 2021-07-20 | 南京工程学院 | 基于区域控制偏差的储能系统辅助传统机组调频的控制方法 |
CN113837432A (zh) * | 2021-08-12 | 2021-12-24 | 华北电力大学 | 一种物理-数据联合驱动的电力系统频率预测方法 |
Non-Patent Citations (1)
Title |
---|
黄天恩 等: "模型—数据混合驱动的电网安全特征选择和知识发现", 电力系统自动化, vol. 43, no. 1, 10 January 2019 (2019-01-10), pages 95 - 101 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115473287A (zh) * | 2022-08-25 | 2022-12-13 | 电子科技大学 | 风力发电系统的非脆弱离散pid控制方法、系统及终端 |
CN116526515A (zh) * | 2023-07-03 | 2023-08-01 | 南方电网科学研究院有限责任公司 | 电网频率调控方法及控制器 |
CN116526515B (zh) * | 2023-07-03 | 2023-09-19 | 南方电网科学研究院有限责任公司 | 电网频率调控方法及控制器 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114597916A (zh) | 一种基于知识-数据混合驱动算法的电网频率协同控制方法 | |
Zand et al. | Using adaptive fuzzy logic for intelligent energy management in hybrid vehicles | |
CN110429652B (zh) | 一种可拓展深宽度自适应动态规划的智能发电控制方法 | |
CN108167802B (zh) | 低负荷下锅炉负荷的多模型智能寻优预测控制方法 | |
CN113469332A (zh) | 基于模糊神经的虚拟同步发电机惯量阻尼自适应控制方法 | |
CN114692965A (zh) | 基于数模混合驱动的电动汽车集群可调度潜力预测方法及装置 | |
CN112015084A (zh) | 一种基于虚拟总轴的总量协同一致抗饱和控制方法 | |
Darvill et al. | An ANFIS-PI based boost converter control scheme | |
Yin et al. | Expandable deep width learning for voltage control of three-state energy model based smart grids containing flexible energy sources | |
Wang et al. | A novel adaptive model predictive frequency control using unscented Kalman filter | |
Dilshad et al. | NeuroFuzzy wavelet based auxiliary damping controls for STATCOM | |
CN103606939A (zh) | 基于滑模控制的风柴混合电力系统负荷频率控制方法 | |
CN111478344A (zh) | 一种能源微网负荷频率控制方法、系统及相关产品 | |
CN116995645A (zh) | 基于保护机制强化学习的电力系统安全约束经济调度方法 | |
CN116581764A (zh) | 一种用于可控负荷最优互动过程中的动态稳控方法 | |
Sanusi et al. | Power management optimisation for hybrid electric systems using reinforcement learning and adaptive dynamic programming | |
CN105353614A (zh) | 一种变速恒频率双馈式双向潮汐发电机系统的控制方法 | |
CN113690950A (zh) | 一种基于稳定经济模型预测控制的电动汽车辅助传统机组联合调频控制方法 | |
Maslekar et al. | Electric Vehicle Impact Analysis in a Microgrid Using Optimized Bio-Inspired Non-Integer Controller | |
Sabahi et al. | Dynamic neural network for AGC in restructure power system | |
CN112134304B (zh) | 一种基于深度学习的微电网全自动导航方法、系统与装置 | |
CN115360732B (zh) | 模型和数据驱动的光伏储能系统控制方法 | |
TW201941079A (zh) | 一種基於模型預測控制之電池充電演算法 | |
Liu et al. | An instant inertia estimated and operation burden considered frequency regulation method for low inertia power systems | |
Campos-Peña et al. | Performance Comparison between LQR, GPC and ANFIS controllers for Load Frequency Control in a Small Hydro Power Plant |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |