CN105870942A - 一种基于近似动态规划算法的一次调频附加学习控制方法 - Google Patents

一种基于近似动态规划算法的一次调频附加学习控制方法 Download PDF

Info

Publication number
CN105870942A
CN105870942A CN201610331091.6A CN201610331091A CN105870942A CN 105870942 A CN105870942 A CN 105870942A CN 201610331091 A CN201610331091 A CN 201610331091A CN 105870942 A CN105870942 A CN 105870942A
Authority
CN
China
Prior art keywords
controller
soc
energy storage
delta
upper limit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610331091.6A
Other languages
English (en)
Other versions
CN105870942B (zh
Inventor
杨水丽
高凯
葛延峰
金鹏
李建林
侯朝勇
胡娟
闫涛
许守平
张明霞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Corp of China SGCC
China Electric Power Research Institute Co Ltd CEPRI
Shenyang Power Supply Co of State Grid Liaoning Electric Power Co Ltd
Original Assignee
State Grid Corp of China SGCC
China Electric Power Research Institute Co Ltd CEPRI
Shenyang Power Supply Co of State Grid Liaoning Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Corp of China SGCC, China Electric Power Research Institute Co Ltd CEPRI, Shenyang Power Supply Co of State Grid Liaoning Electric Power Co Ltd filed Critical State Grid Corp of China SGCC
Priority to CN201610331091.6A priority Critical patent/CN105870942B/zh
Publication of CN105870942A publication Critical patent/CN105870942A/zh
Application granted granted Critical
Publication of CN105870942B publication Critical patent/CN105870942B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J3/00Circuit arrangements for ac mains or ac distribution networks
    • H02J3/24Arrangements for preventing or reducing oscillations of power in networks
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J2203/00Indexing scheme relating to details of circuit arrangements for AC mains or AC distribution networks
    • H02J2203/20Simulating, e g planning, reliability check, modelling or computer assisted design [CAD]

Landscapes

  • Engineering & Computer Science (AREA)
  • Power Engineering (AREA)
  • Supply And Distribution Of Alternating Current (AREA)

Abstract

本发明提供一种基于近似动态规划算法的一次调频附加学习控制方法,所述方法包括如下步骤:I、训练样本数据的收集;II、附加学习控制器的近似计算;III、附加学习控制器的优化迭代。本发明的优点在于给出了一种近似动态规划的一次调频在线学习附加学习控制方法,该方法可以检测控制器的输入和输出,包含强化学习的值函数迭代策略,能在系统运行过程中,根据系统的反馈在线对机组功率输出进行进一步的优化调整。该控制器作为附加学习控制,不需要替代原有的机组控制器,还可以利用系统原有控制器先验知识进行强化学习,提高收敛速度,并在此基础上考虑到了储能的优化运行区间。

Description

一种基于近似动态规划算法的一次调频附加学习控制方法
技术领域
本发明涉及一种电力系统的一次调频,具体讲涉及一种基于近似动态规划算法的一次调频附加学习控制方法。
背景技术
电力系统的一次调频过程指的是当各机组并网运行,在外界负荷变动影响下,电网频率发生变化时,各机组的调节系统参与调节作用,自动地增加(电网频率下降时)或减小(电网频率升高时)自身的功率,使之与外界负荷相平衡,同时尽量减少电网频率的变化的过程即为一次调频。
火电机组传统意义上的一次调频是静态时汽轮机按照与其转速之间的关系曲线出力,该关系曲线称为汽轮机控制系统的静态特性。目前,风电机组的装机容量日益增加,在局部地区渗透率很高,在北方地区电网中,作为主要调频电源的火电机组受蓄热、调节方向不宜改变等制约,影响一次调频性能。储能的响应时间能达到毫秒级,在风电功率波动情况下可以协助火电机组进行一次调频。
关于储能协调火电机组参与一次调频控制已有不少报道,申请号为201310188516.9、名为“一种超级电容储能系统参与电力一次调频的协调控制方法”的中国专利文件提出了一种超级电容储能与传统机组的协调控制策略,但并没涉及附加优化控制器。本发明采取近似动态规划算法附加学习控制的方式,一直用来解决非线性系统的最优控制问题,基本思想是通过计算近似代价函数,从而避免动态规划中的“维数灾”问题。该算法的初值选取具有随机性,实际应用过程中要经过多次学习才能收敛,因此,设计一种附加学习控制器的方式,并不替代原有控制器,而是利用原有控制器指导初值的选取,加快收敛速度,减少工程应用的难度。
发明内容
针对上述问题,本发明提出了一种基于近似动态规划算法的一次调频附加学习控制方法。
一种基于近似动态规划算法的一次调频附加学习控制方法,其特征在于,所述方法包括如下步骤:
I、训练样本数据的收集;
II、附加学习控制器的近似计算;
III、附加学习控制器的优化迭代。
进一步的,所述步骤I包括对附加学习控制器的训练,得到样本状态变量x:
x=[Δf,ΔPg,ΔPe,ΔPtie]
其中Δf是区域频率偏差;ΔPg是火电机组出力变化量;ΔPe是储能出力变化量;ΔPtie是联络线功率偏差量。
进一步的,所述步骤I的对附加学习控制器的训练包括:
(1)对含储能的一次调频控制系统进行离散化建模,得到一次调频控制系统状态xk+1如下式所示:
xk+1=F(xk,us,k),k=0,1,2,3...... (1)
含储能的一次调频控制系统的控制变量x和控制器us如下式所示:
x=[Δf,ΔPg,ΔPe,ΔPtie]T (2)
us=a1Δf+a2ΔPg+a3ΔPe+a4ΔPtie (3)
(2)含储能系统的一次调频控制系统代价函数U(xk,us,k)如下式所示:
U ( x k , u s , k ) = R f Δf k 2 + R u u s , k 2 , k = 0 , 1 , 2 ... , - - - ( 6 )
(3)采集样本数据
采样周期为1ms,收集2000个x、us和Q的数据作为学习样本;
其中,xk为状态向量;us,k为控制向量;Q为代价函数;a1,a2,a3,a4为控制器优化权值;Rf、Ru为不同代价的权重,大于零;k代表时刻,k=0,1,2,3......。
进一步的,步骤II包括:
(1)代价函数的逼近结构如下式所示:
含储能的一次调频系统逼近结构基函数φ(xk,us,k)如下式所示:
φ(xk,us,k)=[Δfk 2,2ΔfkΔPg,k,2ΔfkΔPe,k,2ΔfkΔPtie,2Δfkus,k,ΔPg,k 2,2ΔPg,kΔPe,k,2ΔPg,kΔPtie,2ΔPg,kus,k,ΔPe,k 2,2ΔPe,kΔPtie,2ΔPe,kus,k,ΔPtie 2,2ΔPtieus,k,us,k 2]T (8)
公式(7)采用批量最小二乘法进行批量计算;
(2)获得最优控制器:
最小代价函数Q*(xk,us,k)如下式所示:
Q * ( x k , u s , k ) = U ( x k , u s , k ) + m i n u s , k + 1 Q * ( x k + 1 , u s , k + 1 ) - - - ( 9 )
使得最小代价函数最小的最优控制器us,k如下式所示:
u s * ( x k ) = argmin u s , k Q * ( x k , u s , k ) - - - ( 10 )
其中,wi是第i个权重向量,是基函数,L是向量的维度W是逼近结构的权值;φ(xk,us,k)是基函数;Q(xk,us,k)是代价函数。
进一步的,所述步骤III包括:以2s为一个周期,完成一次策略评价和策略改善的迭代,每一步迭代过程产生一个相比前一个输出的优化值,动作体向系统控制器输出控制器优化权值a1,a2,a3,a4,并给控制系统修改不同机组的状态变化量Δf,ΔPg,ΔPe,ΔPtie
进一步的,所述步骤III将系统频率偏差调节区域与储能优化运行区间SOC结合,设计了一种附加优化控制器进行一次调频优化控制,
其中,SOC是储能电池荷电状态,SOC=QS/QR,QS为电池储能系统的剩余容量,QR为电池储能系统的标称容量。
进一步的,所述优化控制包括:
若fsq下限<Δfi<fsq上限时,所有控制器不进行额外调节;
若fq下限<Δfi<fsq下限或fsq上限<Δfi<fq上限时,采取附加优化控制器,且SOCmin<SOCi<SOCmax,则执行体的控制器优化权值a1,a2,a3,a4直接输出给系统控制器;
若fq下限<Δfi<fsq下限或fsq上限<Δfi<fq上限时,采取附加优化控制器,且SOCi≤SOCmin,若当前的控制器的储能指令ΔPe为正,则执行体的控制器优化权值中储能功率偏差量权重值a3强制为0;
若fq下限<Δfi<fsq下限或fsq上限<Δfi<fq上限时,采取附加优化控制器,且SOCi≤SOCmin,若当前的控制器的储能指令ΔPe为负,则执行体的控制器优化权值中储能功率偏差量权重值a3强制为2a3
若fq下限<Δfi<fsq下限或fsq上限<Δfi<fq上限时,采取附加优化控制器,且SOCi≥SOCmax,当前的控制器的储能指令ΔPe为正,则执行体的控制器优化权值中将储能功率偏差量权重值a3强制为2a3
若fq下限<Δfi<fsq下限或fsq上限<Δfi<fq上限时,采取附加优化控制器,且SOCi≥SOCmax,前的控制器的储能指令ΔPe为负,则执行体的控制器优化权值中将储能功率偏差量权重值a3强制为0;
当-0.5Hz<Δfi≤fq下限,关闭附加优化控制器,且SOCi>SOCmin,则系统的控制器优先储能进行最大出力,直到储能SOC达到0%,接替的火电机组也采取最大出力;Δfi恢复到fq下限以上后,储能开始恢复到SOC运行优化区间内;
当-0.5Hz<Δfi≤fq下限,关闭附加优化控制器,且SOCi<SOCmin,则系统的控制器优先火电机组也采取最大出力,直到储能SOC达到0%;若Δfi恢复到fq下限以上后,储能开始恢复到SOC运行优化区间内;
当0.5Hz>Δfi≥fq上限时,关闭附加优化控制器,且SOCi<SOCmax,则系统的控制器控制储能吸收功率,直到储能SOC达到100%,接替的火电机组也采取减出力;若Δfi恢复到fq上限以下后,储能开始恢复到SOC运行优化区间内;
当0.5Hz>Δfi≥fq上限时,关闭附加优化控制器,且SOCi>SOCmax,则系统的控制器控制优先火电机组减出力,直到储能SOC达到100%;若Δfi恢复到fq上限以下后,储能开始恢复到SOC运行优化区间内;
当Δfi<-0.5Hz或Δfi>0.5Hz时,关闭附加优化控制器,不论储能SOC状态,系统设定所有机组都以最大出力运行,极端情况下可以减负荷,只到频率恢复到±0.5Hz以内;
其中,
Δfi:电网第i时刻的频率数据;
fsq上限:频率死区的上限值;
fsq下限:频率死区的下限值;
fq上限:附加优化控制器调节区的上限值;
fq下限:附加优化控制器调节区的上限值;
SOCi:在第i个采样点采样的SOC值;
SOCmin:电池储能系统优化运行区间的SOC下限;
SOCmax:电池储能系统优化运行区间的SOC上限。
进一步的,所述控制目标为:
频率偏差最大波动量在±0.5Hz以内,偏差波动范围维持在fq下限和fq上限之间,频率偏差波动比原有控制平缓。
与最接近的现有技术比,本发明提供的技术方案具有以下优异效果:
本发明的优点在于给出了一种近似动态规划的一次调频在线学习附加学习控制方法,该方法可以检测控制器的输入和输出,包含强化学习的值函数迭代策略,能在系统运行过程中,根据系统的反馈在线对机组功率输出进行进一步的优化调整。该控制器作为附加学习控制,不需要替代原有的机组控制器,还可以利用系统原有控制器先验知识进行强化学习,提高收敛速度,并在此基础上考虑到了储能的优化运行区间。
附图说明
图1为含储能的一次调频附加学习控制器结构图;
图2为含储能的电力系统一次调频示意图;
图3为附加学习控制器结构示意图;
图4为含附加学习控制器的电力系统一次调频结构图。
具体实施方式
下面将结合本发明技术流程图以及实施案例示意图,对本发明实施例中的技术方案进行清楚、完整地描述。
本实施例提供的含储能的一次调频系统控制示意图如图1所示,本实施例通过数据采集模块,以频率偏差Δf为控制目标。在电池储能系统功率与SOC上下限及火电机组经济运行区间约束为前提下,判断实时的电网频率偏差是否越过频率死区,若越过频率死后,将频率偏差值转换成对应的功率偏差值,得到的电网在时刻的功率差额,判断电池储能系统及火电机组分别参与电网一次频率调节的程度,给出不同的控制指令,校正电网供需平衡,阻止频率波动的加剧,维持电网频率稳定。
具体的,本实施例提供的一种基于近似动态规划算法的储能/火电机组一次调频附加学习控制方法,该控制系统作为原有控制器的一种附加学习控制器,与原有的控制器并联于系统控制中,其主要过程是,在含储能的一次调频控制系统中,若fsq下限<Δfi<fsq上限,则系统的附加学习控制器与原有控制器均不动作;当fq下限<Δfi<fsq下限或fsq上限<Δfi<fq上限时开始启用附加学习控制器进行优化控制,当Δfi≤fq下限或Δfi≥fq上限时,系统进入次紧急控制区,不使用附加学习控制,在频率偏差超过±0.5Hz情况下,系统进入紧急控制区,储能系统与机组均为最大出力模式,极端情况下可以减负荷。
对应的,本实施例提出的附加学习控制器算法结构如图3所示,这种控制器结构分为评价体和执行体两个部分,评价体包含对一次调频控制器及控制目标的评价,执行体是控制器的实际动作环节,通过执行体给出附加学习控制器的控制信号反馈给原有控制器中的一次调频系统。
具体的,含附加学习控制器的电力系统一次调频结构图如图4所示,所述方法包括如下步骤:
(1)为了能使附加学习控制器可以适应当前控制系统,首先对附加学习控制器进行训练,训练样本如下:
1)对含储能的一次调频控制系统进行离散化建模,得到一次调频控制系统状态方程如下:
xk+1=F(xk,uk),k=0,1,2,...,(1)
对本一次调频控制系统定义其控制变量x和控制器us如下:
x=[Δf,ΔPg,ΔPe,ΔPtie]T(2)
us=a1Δf+a2ΔPg+a3ΔPe+a4ΔPtie(3)
2)确定系统的在k时刻的瞬时代价函数,即调节的目标函数。
近似动态规划算法定义代价函数U(xk,us,k)的基本形式如下:
U(xk,us,k)=W(xk)+uT s,kRus,k,k=0,1,2...,(4)
其中,R是正定矩阵;
总的代价函数为:
Q u s ( x k , u s , k ) = U ( x k , u s , k ) + Σ i = k + 1 ∞ U ( x k , u s ( x i ) ) - - - ( 5 )
相应的将含储能系统的一次调频控制系统代价函数U(xk,us,k)定义如下:
U ( x k , u s , k ) = R f Δf k 2 + R u u s , k 2 , k = 0 , 1 , 2 ... , - - - ( 6 )
3)采集样本数据
在含储能一次调频系统的调节过程中,把风电功率波动当作一次调频扰动量进行输入时,一直实时收集产生频率差和不同机组的功率分配数据,选取采样周期选为1ms,以此作为学习的样本,收集2000个x、us、Q的数据样本。
(2)在步骤(1)的学习下,附加学习控制器已经适应了系统的现有控制,结合步骤(1)的样本数据,进行控制器的近似计算,所述方法包括如下步骤:
1)附加学习控制器评价体对系统现有的控制器和控制目标进行评价,计算系统的代价函数。为了使算法迭代速度更快,能够在线进行数据的处理,所提算法对策略评价采取一定的函数逼近结构来近似代价函数,该逼近结构基本形式如下:
其中,wi是第i个权重向量,是基函数,L是向量的维度;
对含储能的一次调频系统逼近结构基函数φ(xk,us,k)表达式如下:
φ(xk,us,k)=[Δfk 2,2ΔfkΔPg,k,2ΔfkΔPe,k,2ΔfkΔPtie,2Δfkus,k,ΔPg,k 2,2ΔPg,kΔPe,k,2ΔPg,kΔPtie,2ΔPg,kus,k,ΔPe,k 2,2ΔPe,kΔPtie,2ΔPe,kus,k,ΔPtie 2,2ΔPtieus,k,us,k 2]T (8)
为了加速计算过程,对于公式7采用批量最小二乘法进行批量计算处理。
2)附加学习控制器的执行体对于评价体中得到的最小代价函数进行求解,得到最优控制器,具体步骤如下:
根据Bellman最优化准则求解代价函数方程得到最小代价函数Q*(xk,us,k)如下:
Q * ( x k , u s , k ) = U ( x k , u s , k ) + m i n u s , k + 1 Q * ( x k + 1 , u s , k + 1 ) - - - ( 9 )
求使得最小代价函数最小的us,k,得出最优控制器us,k
u s * ( x k ) = argmin u s , k Q * ( x k , u s , k ) - - - ( 10 )
(3)结合步骤(2)中附加学习控制器的评价体中得到的代价函数对系统控制器进行评价,在步骤(2)的执行体中对最优控制器进行改善,控制器算法每2s完成一次策略评价和策略改善的迭代。每一步的迭代过程都会产生一个相比前一个输出的优化值,动作体把控制器优化权值a1,a2,a3,a4输出给系统控制器,反馈修改不同机组的状态变化量Δf,ΔPg,ΔPe,ΔPtie,以此作为一次调频的附加学习控制器。
以上是附加学习控制器的优化迭代过程,其中附加学习控制器实施过程中具体的有如下步骤:
若fsq下限<Δfi<fsq上限时,频率处于死区内,所有控制器不进行额外调节。
若fq下限<Δfi<fsq下限或fsq上限<Δfi<fq上限时,采取附加优化控制器,且SOCmin<SOCi<SOCmax,则执行体的控制器优化权值a1,a2,a3,a4直接输出给系统控制器。
若fq下限<Δfi<fsq下限或fsq上限<Δfi<fq上限时,采取附加优化控制器,且SOCi≤SOCmin,若当前的控制器的储能指令ΔPe为正,则执行体的控制器优化权值中储能功率偏差量权重值a3强制为0。
若fq下限<Δfi<fsq下限或fsq上限<Δfi<fq上限时,采取附加优化控制器,且SOCi≤SOCmin,若当前的控制器的储能指令ΔPe为负,则执行体的控制器优化权值中储能功率偏差量权重值a3强制为2a3
若fq下限<Δfi<fsq下限或fsq上限<Δfi<fq上限时,采取附加优化控制器,且SOCi≥SOCmax,当前的控制器的储能指令ΔPe为正,则执行体的控制器优化权值中将储能功率偏差量权重值a3强制为2a3
若fq下限<Δfi<fsq下限或fsq上限<Δfi<fq上限时,采取附加优化控制器,且SOCi≥SOCmax,前的控制器的储能指令ΔPe为负,则执行体的控制器优化权值中将储能功率偏差量权重值a3强制为0。
当-0.5Hz<Δfi≤fq下限,关闭附加优化控制器,且SOCi>SOCmin,则系统的控制器优先储能进行最大出力,直到储能SOC达到0%,接替的火电机组也采取最大出力。Δfi恢复到fq下限以上后,储能开始恢复到SOC运行优化区间内。
当-0.5Hz<Δfi≤fq下限,关闭附加优化控制器,且SOCi<SOCmin,则系统的控制器优先火电机组也采取最大出力,直到储能SOC达到0%。若Δfi恢复到fq下限以上后,储能开始恢复到SOC运行优化区间内。
当0.5Hz>Δfi≥fq上限时,关闭附加优化控制器,且SOCi<SOCmax,则系统的控制器控制储能吸收功率,直到储能SOC达到100%,接替的火电机组也采取减出力。若Δfi恢复到fq上限以下后,储能开始恢复到SOC运行优化区间内。
当0.5Hz>Δfi≥fq上限时,关闭附加优化控制器,且SOCi>SOCmax,则系统的控制器控制优先火电机组减出力,直到储能SOC达到100%。若Δfi恢复到fq上限以下后,储能开始恢复到SOC运行优化区间内。
当Δfi<-0.5Hz或Δfi>0.5Hz时,关闭附加优化控制器,不论储能SOC状态,系统设定所有机组都以最大出力运行,极端情况下可以减负荷,只到频率恢复到±0.5Hz以内。
本实施例所用术语定义:
Δfi:电网第i时刻的频率数据;
fsq上限:频率死区的上限值;
fsq下限:频率死区的下限值;
fq上限:附加优化控制器调节区的上限值;
fq下限:附加优化控制器调节区的上限值;
xk是状态向量;
us,k是控制向量;
Δf是区域频率偏差;
ΔPg是火电机组出力变化量;
ΔPe是储能出力变化量;
ΔPtie是联络线功率偏差量;
W是逼近结构的权值;
Rf、Ru是不同代价的权重,都大于零;
φ(xk,us,k)是基函数;
Q(xk,us,k)是代价函数;
k代表时刻,k=0,1,2,...;
SOC:储能电池荷电状态,SOC=QS/QR,QS为电池储能系统的剩余容量,QR为电池储能系统的标称容量;
SOCi:在第i个采样点采样的SOC值;
SOCmin:电池储能系统优化运行区间的SOC下限;
SOCmax:电池储能系统优化运行区间的SOC上限
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求范围当中。

Claims (8)

1.一种基于近似动态规划算法的一次调频附加学习控制方法,其特征在于,所述方法包括如下步骤:
I、训练样本数据的收集;
II、附加学习控制器的近似计算;
III、附加学习控制器的优化迭代。
2.如权利要求1所述一种基于近似动态规划算法的一次调频附加学习控制方法,其特征在于,
所述步骤I包括对附加学习控制器的训练,得到样本状态变量x:
x=[Δf,ΔPg,ΔPe,ΔPtie]
其中Δf是区域频率偏差;ΔPg是火电机组出力变化量;ΔPe是储能出力变化量;ΔPtie是联络线功率偏差量。
3.如权利要求2所述一种基于近似动态规划算法的一次调频附加学习控制方法,其特征在于,
所述步骤I的对附加学习控制器的训练包括:
(1)对含储能的一次调频控制系统进行离散化建模,得到一次调频控制系统状态xk+1如下式所示:
xk+1=F(xk,us,k),k=0,1,2,3...... (1)
含储能的一次调频控制系统的控制变量x和控制器us如下式所示:
x=[Δf,ΔPg,ΔPe,ΔPtie]T (2)
us=a1Δf+a2ΔPg+a3ΔPe+a4ΔPtie (3)
(2)含储能系统的一次调频控制系统代价函数U(xk,us,k)如下式所示:
U ( x k , u s , k ) = R f Δf k 2 + R u u s , k 2 , k = 0 , 1 , 2 ... , - - - ( 6 )
(3)采集样本数据
采样周期为1ms,收集2000个x、us和Q的数据作为学习样本;
其中,xk为状态向量;us,k为控制向量;Q为代价函数;a1,a2,a3,a4为控制器优化权值;Rf、Ru为不同代价的权重,大于零;k代表时刻,k=0,1,2,3……。
4.如权利要求1所述一种基于近似动态规划算法的一次调频附加学习控制方法,其特征在于,
步骤II包括:
(1)代价函数的逼近结构如下式所示:
含储能的一次调频系统逼近结构基函数φ(xk,us,k)如下式所示:
φ ( x k , u s , k ) = [ Δf k 2 , 2 Δf k ΔP g , k , 2 Δf k ΔP e , k , 2 Δf k ΔP t i e , 2 Δf k u s , k , ΔP g , k 2 , 2 ΔP g , k ΔP e , k , 2 ΔP g , k ΔP t i e , 2 ΔP g , k u s , k , ΔP e , k 2 , 2 ΔP e , k ΔP t i e , 2 ΔP e , k u s , k , ΔP t i e 2 , 2 ΔP t i e u s , k , u s , k 2 ] T - - - ( 8 )
公式(7)采用批量最小二乘法进行批量计算;
(2)获得最优控制器:
最小代价函数Q*(xk,us,k)如下式所示:
Q * ( x k , u s , k ) = U ( x k , u s , k ) + m i n u s , k + 1 Q * ( x k + 1 , u s , k + 1 ) - - - ( 9 )
使得最小代价函数最小的最优控制器us,k如下式所示:
u s * ( x k ) = argmin u s , k Q * ( x k , u s , k ) - - - ( 10 )
其中,wi是第i个权重向量,是基函数,L是向量的维度W是逼近结构的权值;φ(xk,us,k)是基函数;Q(xk,us,k)是代价函数。
5.如权利要求1所述一种基于近似动态规划算法的一次调频附加学习控制方法,其特征在于,
所述步骤III包括:以2s为一个周期,完成一次策略评价和策略改善的迭代,每一步迭代过程产生一个相比前一个输出的优化值,动作体向系统控制器输出控制器优化权值a1,a2,a3,a4,并给控制系统修改不同机组的状态变化量Δf,ΔPg,ΔPe,ΔPtie
6.如权利要求5所述一种基于近似动态规划算法的一次调频附加学习控制方法,其特征在于,所述步骤III将系统频率偏差调节区域与储能优化运行区间SOC结合,设计了一种附加优化控制器进行一次调频优化控制,
其中,SOC是储能电池荷电状态,SOC=QS/QR,QS为电池储能系统的剩余容量,QR为电池储能系统的标称容量。
7.如权利要求6所述一种基于近似动态规划算法的一次调频附加学习控制方法,其特征在于,
所述优化控制包括:
若fsq下限<Δfi<fsq上限时,所有控制器不进行额外调节;
若fq下限<Δfi<fsq下限或fsq上限<Δfi<fq上限时,采取附加优化控制器,且SOCmin<SOCi<SOCmax,则执行体的控制器优化权值a1,a2,a3,a4直接输出给系统控制器;
若fq下限<Δfi<fsq下限或fsq上限<Δfi<fq上限时,采取附加优化控制器,且SOCi≤SOCmin,若当前的控制器的储能指令ΔPe为正,则执行体的控制器优化权值中储能功率偏差量权重值a3强制为0;
若fq下限<Δfi<fsq下限或fsq上限<Δfi<fq上限时,采取附加优化控制器,且SOCi≤SOCmin,若当前的控制器的储能指令ΔPe为负,则执行体的控制器优化权值中储能功率偏差量权重值a3强制为2a3
若fq下限<Δfi<fsq下限或fsq上限<Δfi<fq上限时,采取附加优化控制器,且SOCi≥SOCmax,当前的控制器的储能指令ΔPe为正,则执行体的控制器优化权值中将储能功率偏差量权重值a3强制为2a3
若fq下限<Δfi<fsq下限或fsq上限<Δfi<fq上限时,采取附加优化控制器,且SOCi≥SOCmax,前的控制器的储能指令ΔPe为负,则执行体的控制器优化权值中将储能功率偏差量权重值a3强制为0;
当-0.5Hz<Δfi≤fq下限,关闭附加优化控制器,且SOCi>SOCmin,则系统的控制器优先储能进行最大出力,直到储能SOC达到0%,接替的火电机组也采取最大出力;Δfi恢复到fq下限以上后,储能开始恢复到SOC运行优化区间内;
当-0.5Hz<Δfi≤fq下限,关闭附加优化控制器,且SOCi<SOCmin,则系统的控制器优先火电机组也采取最大出力,直到储能SOC达到0%;若Δfi恢复到fq下限以上后,储能开始恢复到SOC运行优化区间内;
当0.5Hz>Δfi≥fq上限时,关闭附加优化控制器,且SOCi<SOCmax,则系统的控制器控制储能吸收功率,直到储能SOC达到100%,接替的火电机组也采取减出力;若Δfi恢复到fq上限以下后,储能开始恢复到SOC运行优化区间内;
当0.5Hz>Δfi≥fq上限时,关闭附加优化控制器,且SOCi>SOCmax,则系统的控制器控制优先火电机组减出力,直到储能SOC达到100%;若Δfi恢复到fq上限以下后,储能开始恢复到SOC运行优化区间内;
当Δfi<-0.5Hz或Δfi>0.5Hz时,关闭附加优化控制器,不论储能SOC状态,系统设定所有机组都以最大出力运行,极端情况下可以减负荷,只到频率恢复到±0.5Hz以内;
其中,
Δfi:电网第i时刻的频率数据;
fsq上限:频率死区的上限值;
fsq下限:频率死区的下限值;
fq上限:附加优化控制器调节区的上限值;
fq下限:附加优化控制器调节区的上限值;
SOCi:在第i个采样点采样的SOC值;
SOCmin:电池储能系统优化运行区间的SOC下限;
SOCmax:电池储能系统优化运行区间的SOC上限。
8.如权利要求7所述一种基于近似动态规划算法的一次调频附加学习控制方法,其特征在于,所述控制目标为:
频率偏差最大波动量在±0.5Hz以内,偏差波动范围维持在fq下限和fq上限之间,频率偏差波动比原有控制平缓。
CN201610331091.6A 2016-05-18 2016-05-18 一种基于近似动态规划算法的一次调频附加学习控制方法 Active CN105870942B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610331091.6A CN105870942B (zh) 2016-05-18 2016-05-18 一种基于近似动态规划算法的一次调频附加学习控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610331091.6A CN105870942B (zh) 2016-05-18 2016-05-18 一种基于近似动态规划算法的一次调频附加学习控制方法

Publications (2)

Publication Number Publication Date
CN105870942A true CN105870942A (zh) 2016-08-17
CN105870942B CN105870942B (zh) 2022-04-29

Family

ID=56635253

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610331091.6A Active CN105870942B (zh) 2016-05-18 2016-05-18 一种基于近似动态规划算法的一次调频附加学习控制方法

Country Status (1)

Country Link
CN (1) CN105870942B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108258706A (zh) * 2016-12-29 2018-07-06 中国电力科学研究院 一种火/储agc调频优化控制方法及系统
CN108767905A (zh) * 2018-05-31 2018-11-06 西安热工研究院有限公司 基于同步向量测量装置数据进行一次调频调试分析方法
CN110165714A (zh) * 2019-05-30 2019-08-23 广州水沐青华科技有限公司 基于极限动态规划算法的微电网一体化调度与控制方法、计算机可读存储介质
CN111224433A (zh) * 2020-03-06 2020-06-02 中国电力科学研究院有限公司 一种分布式储能系统二次调频控制方法及系统
CN111555371A (zh) * 2020-04-13 2020-08-18 清华大学 一种控制火电-储能联合系统参与电网频率调节的方法
CN113888526A (zh) * 2021-10-21 2022-01-04 北京实力伟业环保科技有限公司 基于微生物的废气处理方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102645894A (zh) * 2012-04-20 2012-08-22 中国科学院自动化研究所 模糊自适应动态规划方法
CN103217899A (zh) * 2013-01-30 2013-07-24 中国科学院自动化研究所 基于数据的q函数自适应动态规划方法
CN103809440A (zh) * 2014-01-25 2014-05-21 清华大学 一种用于自动控制的附加控制器设计方法
US20140156031A1 (en) * 2011-08-11 2014-06-05 The Trustees Of Columbia University In The City Of New York Adaptive Stochastic Controller for Dynamic Treatment of Cyber-Physical Systems

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140156031A1 (en) * 2011-08-11 2014-06-05 The Trustees Of Columbia University In The City Of New York Adaptive Stochastic Controller for Dynamic Treatment of Cyber-Physical Systems
CN102645894A (zh) * 2012-04-20 2012-08-22 中国科学院自动化研究所 模糊自适应动态规划方法
CN103217899A (zh) * 2013-01-30 2013-07-24 中国科学院自动化研究所 基于数据的q函数自适应动态规划方法
CN103809440A (zh) * 2014-01-25 2014-05-21 清华大学 一种用于自动控制的附加控制器设计方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
WENTAO GUO ET AL: "Online Supplementary ADP Learning Controller Design and Application to Power System Frequency Control With Large-Scale Wind Energy Integration", 《IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS》 *
郭文涛等: "一种新型附加学习控制器及电力系统应用实例", 《控制理论与应用》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108258706A (zh) * 2016-12-29 2018-07-06 中国电力科学研究院 一种火/储agc调频优化控制方法及系统
CN108258706B (zh) * 2016-12-29 2023-01-24 中国电力科学研究院 一种火/储agc调频优化控制方法及系统
CN108767905A (zh) * 2018-05-31 2018-11-06 西安热工研究院有限公司 基于同步向量测量装置数据进行一次调频调试分析方法
CN110165714A (zh) * 2019-05-30 2019-08-23 广州水沐青华科技有限公司 基于极限动态规划算法的微电网一体化调度与控制方法、计算机可读存储介质
CN110165714B (zh) * 2019-05-30 2021-01-26 广州水沐青华科技有限公司 基于极限动态规划算法的微电网一体化调度与控制方法、计算机可读存储介质
CN111224433A (zh) * 2020-03-06 2020-06-02 中国电力科学研究院有限公司 一种分布式储能系统二次调频控制方法及系统
CN111555371A (zh) * 2020-04-13 2020-08-18 清华大学 一种控制火电-储能联合系统参与电网频率调节的方法
CN111555371B (zh) * 2020-04-13 2021-08-27 清华大学 一种控制火电-储能联合系统参与电网频率调节的方法
CN113888526A (zh) * 2021-10-21 2022-01-04 北京实力伟业环保科技有限公司 基于微生物的废气处理方法及系统

Also Published As

Publication number Publication date
CN105870942B (zh) 2022-04-29

Similar Documents

Publication Publication Date Title
CN105870942B (zh) 一种基于近似动态规划算法的一次调频附加学习控制方法
US11326579B2 (en) Adaptive dynamic planning control method and system for energy storage station, and storage medium
CN108708775B (zh) 基于热电负荷转换模型的热电联产机组快速变负荷控制方法
CN101162841B (zh) 静止无功补偿器的非线性pi电压控制方法
CN103324828B (zh) 基于运行方式灵敏度的电力系统低频振荡辅助决策方法
CN110148956A (zh) 一种基于mpc的电池储能系统辅助agc控制方法
CN103576553B (zh) 一种燃煤锅炉蒸汽温度的分数阶自整定控制方法
CN111637444B (zh) 一种基于q学习的核电蒸汽发生器水位控制方法
CN105262145B (zh) 一种新能源混合系统控制参数的优选方法
CN103595046B (zh) 以柴油机侧为主的风柴混合电力系统负荷频率控制方法
CN111244968B (zh) 计及电网电压支撑能力影响的风电场电压控制方法及系统
CN109659961B (zh) 一种基于分频控制的动态电力系统负荷频率协调方法
CN105186511B (zh) 电池储能系统参与电网二次调频控制方法
CN104485670B (zh) 孤立电网中电压敏感性工业负荷时变阻尼特性的控制方法
CN108023367A (zh) 一种含光热发电的混合电力系统负荷频率控制方法
Ding et al. Sliding mode/H∞ control of a hydro-power plant
CN109802446A (zh) 基于云模型的风柴储混合电力系统电压频率滑模控制方法
CN105610200A (zh) 一种基于同步协调控制的火电厂全功率控制方法
CN108131238A (zh) 一种抑制水锤压力波动的新型pid控制方法
CN107402515A (zh) 一种优化同步发电机励磁系统pid参数的方法
CN102410138A (zh) 一种获取风力发电机组最优控制输入的方法
CN111682593B (zh) 基于神经网络模型状态观测器的火电机组协调优化方法
Swarup Intelligent load frequency control of two-area interconnected power system and comparative analysis
CN114944659B (zh) 一种风光储联合电站自动控制方法及系统
CN116345490A (zh) 基于优化功率曲线的风电机组改进步进惯性控制调频策略

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant