CN108448594B - 微电网频率自适应学习控制方法 - Google Patents
微电网频率自适应学习控制方法 Download PDFInfo
- Publication number
- CN108448594B CN108448594B CN201810179648.8A CN201810179648A CN108448594B CN 108448594 B CN108448594 B CN 108448594B CN 201810179648 A CN201810179648 A CN 201810179648A CN 108448594 B CN108448594 B CN 108448594B
- Authority
- CN
- China
- Prior art keywords
- neural network
- matrix
- micro
- network model
- calculating
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 68
- 239000011159 matrix material Substances 0.000 claims abstract description 118
- 230000006870 function Effects 0.000 claims abstract description 100
- 238000003062 neural network model Methods 0.000 claims abstract description 52
- 239000013598 vector Substances 0.000 claims description 29
- 210000002569 neuron Anatomy 0.000 claims description 28
- 238000013528 artificial neural network Methods 0.000 claims description 27
- 230000003044 adaptive effect Effects 0.000 claims description 17
- 230000005284 excitation Effects 0.000 claims description 14
- 238000012549 training Methods 0.000 claims description 7
- 230000033228 biological regulation Effects 0.000 claims description 6
- 238000004422 calculation algorithm Methods 0.000 claims description 6
- 238000004088 simulation Methods 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims description 2
- 238000011156 evaluation Methods 0.000 description 11
- 230000014509 gene expression Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 230000006978 adaptation Effects 0.000 description 3
- 230000004913 activation Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 230000001276 controlling effect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 230000002787 reinforcement Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000011217 control strategy Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000004146 energy storage Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000002688 persistence Effects 0.000 description 1
- 238000010248 power generation Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000008054 signal transmission Effects 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J3/00—Circuit arrangements for ac mains or ac distribution networks
- H02J3/24—Arrangements for preventing or reducing oscillations of power in networks
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J2203/00—Indexing scheme relating to details of circuit arrangements for AC mains or AC distribution networks
- H02J2203/20—Simulating, e g planning, reliability check, modelling or computer assisted design [CAD]
Landscapes
- Engineering & Computer Science (AREA)
- Power Engineering (AREA)
- Feedback Control In General (AREA)
Abstract
本发明属于微电网频率控制技术领域,具体涉及一种微电网频率自适应学习控制方法。旨在解决现有技术无法有效地调节微电网的频率和提高微电网频率的稳定性的问题。本发明提供一种微电网频率自适应学习控制方法,包括基于预先获取的微电网系统的第一状态参数,计算微电网系统的第二状态参数;根据第二状态参数和预先构建的第一神经网络模型计算微电网系统的控制矩阵、扰动矩阵;根据第二状态参数计算微电网系统的效用函数;根据效用函数计算微电网系统的代价函数;基于第二状态参数、控制矩阵、扰动矩阵、效用函数以及代价函数,采用自适应动态规划方法计算微电网系统频率的最优控制律。本发明的方法能够有效地提高微电网系统的频率稳定性。
Description
技术领域
本发明属于微电网频率控制技术领域,具体涉及一种微电网频率自适应学习控制方法。
背景技术
在现代电力系统中,微电网已经成为不可或缺的一部分,微电网是指由分布式电源、储能装置、能量转换装置、负荷、监控和保护装置等组成的小型发配电系统。开发和延伸微电网能够充分促进分布式电源与可再生能源的大规模接入,实现对负荷多种能源形式的高可靠供给,是实现主动式配电网的一种有效方式,使传统电网向智能电网过渡。但是分布式和可再生能源融入微电网将不可避免地会影响微电网的稳定性,特别是负载消耗和发电的不平衡,将导致微电网的频率出现偏差甚至危及微电网的稳定性。由于微电网相对于传统大电网规模较小,系统惯性和冗余度较低,因此,如何提高微电网频率的稳定性已经成为现代电力系统发展的重要问题。
在控制理论与工程中,当被控对象的参数不确定或被控对象受到扰动时,鲁棒性是评估控制器性能的重要标准。由于微电网中一般含有多种分布式电源,这些分布式电源的随机性会给系统造成一定的干扰,且微电网系统的非线性会对系统鲁棒性造成影响。为了提高微电网的稳定性,一些鲁棒控制方法应运而生,例如,模糊控制方法和滑模控制方法等,但是现有技术的方法针对微电网系统在受到扰动情况下的控制问题,获取一般非线性系统的解析解是很困难的,无法有效地调节微电网的频率和提高微电网频率的稳定性。
因此,如何提出一种解决上述问题的方案是本领域技术人员目前需要解决的问题。
发明内容
为了解决现有技术中的上述问题,即为了解决现有技术难以获取非线性系统的解析解导致无法有效地调节微电网的频率和提高微电网频率的稳定性的问题,本发明提供了一种微电网频率自适应学习控制方法,所述方法包括:
基于预先获取的微电网系统的第一状态参数,计算所述微电网系统的第二状态参数;
根据所述第二状态参数和预先构建的第一神经网络模型计算所述微电网系统的控制矩阵、扰动矩阵;根据所述第二状态参数计算所述微电网系统的效用函数;根据所述效用函数计算所述微电网系统的代价函数;
基于所述第二状态参数、控制矩阵、扰动矩阵、效用函数以及代价函数,采用自适应动态规划方法计算所述微电网系统频率的最优控制律。
在上述方法的优选技术方案中,“根据所述第二状态参数和预先构建的第一神经网络模型计算所述微电网系统的控制矩阵、扰动矩阵”,其方法包括:
步骤S21:根据所述第二状态参数和预先构建的第一神经网络模型计算所述微电网系统的第一状态方程,所述第一状态方程为:
其中,A为神经网络模型的预先稳定矩阵,x(t)=[x1(t),x2(t),x3(t)]T,x1(t)=Δξf(t),x2(t)=Δξt(t),x3(t)=Δξp(t),ωm表示所述第一神经网络模型的隐层-输出层的理想权值矩阵,表示所述第一神经网络模型的激励函数,表示所述第一神经网络模型的输入量,υ(t)表示由负载变化引起的微电网系统干扰,u(t)表示微电网系统的控制信号,表示第一重构误差;
步骤S22:随机初始化所述第一神经网络模型的输入层-隐层的理想权值矩阵,计算所述微电网系统的第二状态方程,所述第二状态方程为:
步骤S23:根据所述第一状态方程和所述第二状态方程,计算所述第一神经网络模型的状态估计误差的动态方程,所述状态估计误差的动态方程为:
步骤S24:根据逼近理论,在所述第一重构误差任意小时,计算所述微电网系统的第三状态方程,分别对所述第三状态方程的微电网系统的控制信号u(t)和微电网系统干扰υ(t)求偏导,得到所述微电网系统的控制矩阵、扰动矩阵;其中,所述微电网系统的第三状态方程为:
所述控制矩阵为:
所述扰动矩阵为:
在上述方法的优选技术方案中,所述预先构建的第一神经网络模型包括(n+m+q)个输入层神经元,lm个隐层神经元,n个输出层神经元,学习率为αm(αm>0),激励函数为输入层-隐层的理想权值矩阵为隐层-输出层的理想权值矩阵为n、m、q分别表示状态、控制、干扰向量的维数。
在上述方法的优选技术方案中,计算所述效用函数其方法如下公式所示:
U(x,t)=xT(t)Qx(t)+uT(t)u(t)-ρ2υT(t)υ(t)
其中,U(x,t)表示所述微电网系统的效用函数,Q是n×n实矩阵空间的正定矩阵,ρ是微电网系统干扰的性能系数。
在上述方法的优选技术方案中,“根据所述效用函数计算所述微电网系统的代价函数”,其方法如下公式所示:
其中,J(x,t)表示所述微电网系统的代价函数。
在上述方法的优选技术方案中,所述第一状态参数包括所述微电网系统的水轮机时间常数Tt、调速器时间常数Tg、电力系统常数Tp、电力系统增益kp、调速系数sp;所述第二状态参数包括所述微电网系统的频率偏差Δξf(t)、水轮机功率偏差Δξt(t)以及调速器位置偏差Δξp(t)。
在上述方法的优选技术方案中,“计算所述微电网系统的第二状态参数”之后,该方法还包括构建所述微电网系统的仿真模型,构建方法如下公式所示:
在上述方法的优选技术方案中,“计算所述微电网系统频率的最优控制律”,其方法包括:
步骤S31:通过预先构建的第二神经网络模型重新计算所述代价函数,得到第一代价函数,所述第一代价函数为:
步骤S32:基于所述第二神经网络模型的训练隐层-输出层的权值矩阵更新所述第一代价函数,得到第二代价函数,并计算所述第二代价函数的梯度向量,所述第二代价函数为:
所述第二代价函数的梯度向量为:
步骤S33:根据所述第一代价函数和所述第二代价函数的梯度向量计算所述微电网系统频率的最优控制律,计算方法如下公式所示:
在上述方法的优选技术方案中,所述预先构建的第二神经网络模型包括n个输入层神经元,lc个隐层神经元,1个输出层神经元,学习率为αc(αc>0),激励函数为输入层-隐层的权值均为1,隐层-输出层的理想权值矩阵为
在上述方法的优选技术方案中,“计算所述微电网系统频率的最优控制律”之前,该方法还包括基于梯度下降算法调整所述预先构建的第二神经网络模型的权值,所述梯度下降算法具体如下公式所示:
与最接近的现有技术相比,本发明提供一种微电网频率自适应学习控制方法,包括基于预先获取的微电网系统的第一状态参数,计算微电网系统的第二状态参数;根据第二状态参数和预先构建的第一神经网络模型计算微电网系统的控制矩阵、扰动矩阵;根据第二状态参数计算微电网系统的效用函数;根据效用函数计算微电网系统的代价函数;基于第二状态参数、控制矩阵、扰动矩阵、效用函数以及代价函数,采用自适应动态规划方法计算微电网系统频率的最优控制律。
上述技术方案至少具有如下有益效果:
1、本发明的技术方案通过重构微电网系统的控制矩阵和扰动矩阵,可以将微电网系统的状态误差收敛至期望值,存在干扰和不确定项的情况下,改善了微电网频率调节克服干扰和不确定性的性能;
2、采用自适应动态规划方法设计微电网系统的频率控制器可以对微电网系统的频率进行自适应调节,消除微电网系统的频率偏差,有效地提高了微电网系统的频率稳定性。
附图说明
图1为本发明一种实施例中微电网系统的结构示意图;
图2为本发明一种实施例中微电网频率自适应学习控制方法的流程示意图;
图3为本发明一种实施例中微电网频率自适应学习控制方法的结构示意图;
图4为本发明一种实施例中预先构建的第二神经网络模型的权值向量的收敛图;
图5为本发明一种实施例中第二状态参数的响应图线图;
图6为本发明一种实施例中微电网频率自适应学习控制方法的控制输入和比率函数图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围
下面参照附图来描述本发明的优选实施方式。本领域技术人员应当理解的是,这些实施方式仅仅用于解释本发明的技术原理,并非旨在限制本发明的保护范围。
本发明采用一种微电网频率自适应控制方法,该方法建立在贝尔曼方程之上,以动态规划为基础,利用函数近似结构(例如神经网络)来近似哈密顿-雅可比-贝尔曼方程的解,采用离线迭代或者在线更新的方法,来获得系统的近似最优控制策略,从而能够有效地解决非线性系统的优化控制问题。自适应动态规划融合了强化学习思想和自适应评估机制,一方面,在学习原理上,它通过强化学习的试错法则模拟人类思考、学习方式,即通过与外界环境交互,在成功和失败的过程中积累决策经验;另一方面,在最优决策求解问题上,它利用自适应评估机制,通过一个函数近似结构,例如神经网络来评估代价函数、求解最优解。自适应动态规划是传统优化控制设计的智能实现,特别是对于具有非线性和不确定性的复杂系统更加有效。
参阅附图1,图1示例性的给出了本实施例中微电网系统的结构示意图,为了说明的简洁方便,本发明的技术方案实施例中微电网系统包括常规发电机(微型涡轮机)、智能家居和负载,但是本发明的微电网系统并不只局限于包括上述内容。如图1所示,微电网系统的所有信号都可以通过分布式传感器进行测量,然后通过通信介质传输到微电网系统的智能电网管理中心,其中,图1中虚线表示通过通信信道组件的信号传输,智能电网管理中心进行数据处理后生成控制信号,并将控制信号发送回微电网系统中的每个参与单元,如智能家居、负载和微型燃气轮机等,以保证每个参与单元频率的稳定性。
参阅附图2,图2示例性地给出了本实施例中微电网频率自适应学习控制方法的流程示意图,本发明实施例包括下述步骤:
步骤S1:基于预先获取的微电网系统的第一状态参数,计算所述微电网系统的第二状态参数;
在本发明实施例中,第一状态参数包括所述微电网系统的水轮机时间常数Tt、调速器时间常数Tg、电力系统常数Tp、电力系统增益kp、调速系数sp;所述第二状态参数包括所述微电网系统的频率偏差Δξf(t)、水轮机功率偏差Δξt(t)以及调速器位置偏差Δξp(t);在实际应用中,微电网频率偏差Δξf(t),水轮机功率偏差Δξt(t),调速器位置偏差Δξp(t)均满足动力学方程,计算出第二状态参数之后,本发明实施例的技术方案还包括构建所述微电网系统的仿真模型,构建方法具体如公式(1)-(3)所示:
其中,Δξf(t)还受到微电网系统干扰υ(t)的影响,这里表示由负载变化引起的微电网系统干扰,代表所有的实数集,微电网系统的控制信号u(t)作用到调速器的位置调节阀上,调速器位置偏差Δξp(t)还与微电网系统的控制信号u(t)有关,
其中,g(x)为控制矩阵,h(x)为干扰矩阵,状态向量x(t)是n维的,本发明实施例中n=3;控制信号u(t)是m维的,本发明实施例中m=1;干扰信号υ(t)是q维的,本发明实施例中q=1,本发明实施例中,上述参数的值除了给出的值外,还可以有其他取值,本发明在此不做限定。将上述微电网系统的状态空间方程调整为如公式(5)所示:
设定t=0时的初始状态为x(0)=x0,在实施控制方法后,在某个t≠0的时刻x=0,微电网系统的频率偏差Δξf=0,水轮机功率偏差Δξt=0,调速器位置偏差Δξp=0,此时达到微电网系统的频率调节目标。
步骤S2:根据所述第二状态参数和预先构建的第一神经网络模型计算所述微电网系统的控制矩阵、扰动矩阵;根据所述第二状态参数计算所述微电网系统的效用函数;根据所述效用函数计算所述微电网系统的代价函数;
参阅附图3,图3示例性地给出了微电网频率自适应学习控制方法的结构示意图,步骤S2具体包括以下步骤:
步骤S21:根据所述第二状态参数和预先构建的第一神经网络模型计算所述微电网系统的第一状态方程,所述第一状态方程如公式(6)所示:
σm(a)-σm(b)≤λ0(a-b) (7)
||σm(ξa)-σm(ξb)||≤λ0||ξa-ξb|| (8)
步骤S22:随机初始化所述第一神经网络模型的输入层-隐层的理想权值矩阵,计算所述微电网系统的第二状态方程,所述第二状态方程如公式(9)所示:
步骤S23:根据所述第一状态方程和所述第二状态方程,计算所述第一神经网络模型的状态估计误差的动态方程,所述状态估计误差的动态方程如公式(10)所示:
步骤S24:根据逼近理论,在所述第一重构误差任意小时,说明神经网络学习到的微电网系统模型能够较好地体现微电网系统的实际状态,计算所述微电网系统的第三状态方程,分别对所述第三状态方程的微电网系统的控制信号u(t)和微电网系统干扰υ(t)求偏导,得到所述微电网系统的控制矩阵、扰动矩阵;其中,所述微电网系统的第三状态方程如公式(11)所示:
公式(11)表示微电网系统的状态导数信息,分别对u(t)和υ(t)的求偏导,结果分别如公式(12)和公式(13)所示:
式中是一个lm维的方阵,Im为与控制维数相同的单位矩阵,Iq为与干扰维数相同的单位矩阵;上式中的两个公式重构了微电网系统的控制矩阵和扰动矩阵的信息,这里的控制矩阵和扰动矩阵均为近似值,为了方便起见使用上式中的符号;根据神经网络万能逼近定理,只要隐藏层节点lm的数量足够大,重构误差εm(t)可以是任意小的;通常认为理想权值矩阵是有界的,也就是和其中和是||ωm||和||νm||的上确界,且都是正数;重构误差εm满足 其中是正数,由此可知,使用公式(9)来估计状态并且由调整权值矩阵,则状态估计误差能收敛到期望值,表明此时神经网络较好地学习到微电网系统的模型,状态误差动态渐近稳定。最优代价函数在实际中很难求得,因此采用近似方法进行求解。基于神经网络学习到的微电网系统的模型,能够更好地体现微电网系统的实际状态,并减少控制算法对于系统模型的依赖,后期通过自适应动态规划方法能够更为准确地计算出最优控制律。
在本发明实施例中,预先构建的第一神经网络模型包含(n+m+q)个输入层神经元,lm个隐层神经元,n个输出层神经元,学习率αm(αm>0),激励函数给出输入层-隐层的理想权值矩阵隐层-输出层的理想权值矩阵预先构建的第二神经网络模型包括n个输入层神经元,lc个隐层神经元,1个输出层神经元,学习率为αc(αc>0),激励函数为输入层-隐层的权值均为1,隐层-输出层的理想权值矩阵为
在本发明实施例的一种优选的实施方式中,由调节状态和控制量定义的微电网系统的效用函数如公式(14)所示:
U(x,t)=xT(t)Qx(t)+uT(t)u(t)-ρ2υT(t)υ(t) (14)
其中,式中Q是n×n实矩阵空间的正定矩阵,ρ是自适应H∞性能系数;
在本发明实施例的一种优选的实施方式中,用微电网系统的效用函数进一步构成其代价函数,如公式(15)所示:
式中J(x,t)表示微电网系统在时刻t的代价函数。
步骤S3:基于所述第二状态参数、控制矩阵、扰动矩阵、效用函数以及代价函数,采用自适应动态规划方法计算所述微电网系统频率的最优控制律。
具体地,由于代价函数是连续可微的,如公式(16)所示进行定义:
解出最优控制律u*(t)如公式(18)所示:
结合公式(18)和公式(19)可得如公式(20)所示结果:
由于最优代价函数J*(x,t)在实际中很难求得,这里采用自适应动态规划方法,近似求解微电网频率H∞控制问题中的最优控制律u*(t)。
设计自适应动态规划方法的评价神经网络,其中,评价神经网络即为预先构建第二神经网络模型,估计微电网系统的最优代价函数J*(x,t);评价网络包含n个输入层神经元,lc个隐层神经元,1个输出层神经元,学习率αc(αc>0),激励函数输入层-隐层的权值均为1,隐层-输出层之间的理想权值矩阵记为通过评价神经网络来重构代价函数J*(x,t)如公式(21)所示:
使用理想的隐层-输出层之间的权值矩阵ωc,基于式(18)和(22),H∞控制器的最优控制律u*(t)可写为:
相应的,可推导出下述表达式:
相应的,基于式(19)和(24),可推导出下述表达式:
评价神经网络误差ec能够用来衡量近似的最优代价函数与实际要求值的近似程度,当评价神经网络误差值越小时,在一定程度上说明近似值与实际值的接近程度越高,所得到的结果也就更准确;基于权值误差向量可推导出公式(31):
为了使本领域人员更好地理解本发明,下面结合具体实施例,对本发明的微电网频率自适应H∞控制方法进行详细说明。
在实际应用中,测量得到水轮机时间常数Tt=5,调速器时间常数Tg=0.2,电力系统时间常数Tp=2,电力系统增益kp=0.5,调速系数sp=0.5;
对这样的一个微电网系统建立模型神经网络,其中,微电网系统的仿真模型如下:
微电网频率偏差Δξf(t)满足动力学方程水轮机功率偏差Δξt(t)满足动力学方程调速器位置偏差Δξp(t)满足动力学方程,且Δξf(t)还受到微电网系统的干扰υ(t)的影响,这里表示由负载变化引起的微电网系统干扰,代表所有的实数集,微电网系统的控制信号u(t)作用到调速器的位置调节阀上,调速器位置偏差Δξp(t)还与微电网系统的控制信号u(t)有关,
微电网系统动力学的状态空间描述如下:
其中,控制矩阵g(x)和扰动矩阵h(x)都是有界的。上述微电网系统的状态空间方程可以写成:
其中为系统矩阵。设计t=0时的初始状态为x(0)=x0,实施自适应控制后,在x=0时,微电网系统的频率偏差Δξf=0,水轮机功率偏差Δξt=0,调速器位置偏差Δξp=0,此时达到微电网系统的频率调节目标。
根据微电网频率偏差Δξf(t),水轮机功率偏差Δξt(t),调速器位置偏差Δξp(t)和微电网系统的干扰υ(t),结合给定控制律u(t),建立反向传播三层神经网络,用以重构微电网系统的控制矩阵g(x)和干扰矩阵h(x),这样可以减少对于系统真实模型的依赖。
这里,模型神经网络输入层神经元n+m+q=5,也就是状态、控制、干扰三个向量的维数之和为5,模型神经网络隐层神经元数目lm=6,输出层神经元数目n=3,学习率αm=0.3,激励函数σm(·)=tanh(·),给出输入层-隐层的理想权重矩阵得到隐层-输出层的权重矩阵
微电网系统状态表达式为:
微电网系统的模型神经网络公式代表了微电网系统的状态导数信息,完成模型网络的建立之后,求解微电网系统的模型神经网络公式分别对于控制u和扰动υ的偏导,可得重构的微电网系统的控制矩阵和扰动矩阵如下:
根据步骤(3),给出微电网系统的初始状态为x0=[0.1 -0.2 0.2]T,选择正定矩阵Q=I3和H∞性能系数ρ=5,I3代表3×3的单位矩阵。对于微电网系统,由状态和控制量定义的微电网系统的效用函数为:
用微电网系统的效用函数进一步构成其代价函数,表示为:
代价函数在t=0表示为J(x(0))=J(x0)
根据步骤(4),设计基于自适应动态规划方法的微电网系统频率自适应H∞控制器,图3是微电网系统自适应H∞控制的结构图。
为了进行有效的学习和近似,本发明增加了探测噪声,以保证激发条件在前550秒内的持续性,图4是神经网络学习阶段评价网络权重向量的收敛结果。经过训练,评价神经网络的隐层到输出层之间的权值矩阵最终收敛到[0.1600 0.2775 0.0771 0.2218 -0.1657 0.1221]T,反映了基于自适应动态规划方法的鲁棒控制器良好的学习能力。
获得基于自适应动态规划方法的H∞控制器;
引入外部扰动υ(t)=e-0.2tcos(-0.6t),t>0,并将所获的基于自适应动态规划方法的H∞控制器应用于微电网系统60秒来评估其控制性能。图5是自适应鲁棒控制器下三个状态Δξf(t),Δξt(t),Δξp(t)的响应曲线图,能够看出微电网系统的三个状态最终均收敛到0。随着时间的推移,近似控制律也收敛到0,结果可由图6看出。图6是自适应H∞控制器下输入信号的响应曲线和比率函数图。这里,比率函数定义为:
如图6所示,图6示例性地给出了微电网频率自适应学习控制方法的控制输入和比率函数图,比率函数的值最终稳定在0.6635,证明了微电网频率自适应H∞控制方法的有效性。
结合本文中所公开的实施例描述的方法或算法的步骤可以用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
本领域技术人员应该能够意识到,结合本文中所公开的实施例描述的各示例的方法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明电子硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以电子硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。本领域技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
至此,已经结合附图所示的优选实施方式描述了本发明的技术方案,但是,本领域技术人员容易理解的是,本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下,本领域技术人员可以对相关技术特征做出等同的更改或替换,这些更改或替换之后的技术方案都将落入本发明的保护范围之内。
Claims (9)
1.一种微电网频率自适应学习控制方法,其特征在于,所述方法包括:
基于预先获取的微电网系统的第一状态参数,计算所述微电网系统的第二状态参数;
根据所述第二状态参数和预先构建的第一神经网络模型计算所述微电网系统的控制矩阵、扰动矩阵;
根据所述第二状态参数计算所述微电网系统的效用函数;
根据所述效用函数计算所述微电网系统的代价函数;
基于所述第二状态参数、控制矩阵、扰动矩阵、效用函数以及代价函数,采用自适应动态规划方法计算所述微电网系统频率的最优控制律;其中,“根据所述第二状态参数和预先构建的第一神经网络模型计算所述微电网系统的控制矩阵、扰动矩阵”具体包括:
步骤S21:根据所述第二状态参数和预先构建的第一神经网络模型计算所述微电网系统的第一状态方程,所述第一状态方程为:
其中,A是神经网络模型中预先设定的稳定矩阵,x(t)=[x1(t),x2(t),x3(t)]T,x1(t)=Δξf(t),x2(t)=Δξt(t),x3(t)=Δξp(t),ωm表示所述第一神经网络模型的隐层-输出层的理想权值矩阵,表示所述第一神经网络模型的激励函数,表示所述第一神经网络模型的输入量,υ(t)表示由负载变化引起的微电网系统干扰,u(t)表示微电网系统的控制信号,表示第一重构误差,lm为第一神经网络的隐藏层神经元的个数,n、m、q分别表示状态、控制、干扰向量的维数;
步骤S22:随机初始化所述第一神经网络模型的输入层-隐层的理想权值矩阵,计算所述微电网系统的第二状态方程,所述第二状态方程为:
步骤S23:根据所述第一状态方程和所述第二状态方程,计算基于神经网络的状态估计误差动态方程,所述状态估计误差的动态方程为:
步骤S24:根据逼近理论,在所述第一重构误差任意小时,计算所述微电网系统的第三状态方程,分别对所述第三状态方程的微电网系统的控制信号u0(t)和微电网系统干扰υ(t)求偏导,得到所述微电网系统的控制矩阵、扰动矩阵;其中,所述微电网系统的第三状态方程为:
所述控制矩阵为:
所述扰动矩阵为:
3.根据权利要求2所述的方法,其特征在于,所述效用函数为:
U(x,t)=xT(t)Qx(t)+uT(t)u(t)-ρ2υT(t)υ(t)
其中,U(x,t)表示所述微电网系统的效用函数,Q是n×n实矩阵空间的正定矩阵,ρ是微电网系统干扰的性能系数。
5.根据权利要求1所述的方法,其特征在于,所述第一状态参数包括所述微电网系统的水轮机时间常数Tt、调速器时间常数Tg、电力系统常数Tp、电力系统增益kp、调速系数sp;所述第二状态参数包括所述微电网系统的频率偏差Δξf(t)、水轮机功率偏差Δξt(t)以及调速器位置偏差Δξp(t)。
7.根据权利要求1-6任一项所述的方法,其特征在于,“计算所述微电网系统频率的最优控制律”,其方法包括:
步骤S31:通过预先构建的第二神经网络模型重新计算所述代价函数,得到第一代价函数,所述第一代价函数为:
步骤S32:基于所述第二神经网络模型的训练隐层-输出层的权值矩阵更新所述第一代价函数,得到第二代价函数,并计算所述第二代价函数的梯度向量,所述第二代价函数为:
所述第二代价函数的梯度向量为:
步骤S33:根据所述第一代价函数和所述第二代价函数的梯度向量计算所述微电网系统频率的最优控制律,计算方法如下公式所示:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810179648.8A CN108448594B (zh) | 2018-03-05 | 2018-03-05 | 微电网频率自适应学习控制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810179648.8A CN108448594B (zh) | 2018-03-05 | 2018-03-05 | 微电网频率自适应学习控制方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108448594A CN108448594A (zh) | 2018-08-24 |
CN108448594B true CN108448594B (zh) | 2020-04-07 |
Family
ID=63193470
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810179648.8A Active CN108448594B (zh) | 2018-03-05 | 2018-03-05 | 微电网频率自适应学习控制方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108448594B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110783935B (zh) * | 2019-11-13 | 2021-04-16 | 国网江苏省电力有限公司扬州供电分公司 | 一种限定荷电状态下电池储能响应调频信号的方法 |
CN111682563A (zh) * | 2020-05-12 | 2020-09-18 | 天津大学 | 一种基于电储能系统的微电网智能频率控制方法 |
CN114188955B (zh) * | 2021-12-01 | 2023-08-01 | 天津大学 | 基于自适应学习的互联微电网复合频率控制方法及装置 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102352812B (zh) * | 2011-07-18 | 2014-04-16 | 华北电力大学 | 一种基于滑模的水轮机调速系统死区非线性补偿方法 |
CN103595046B (zh) * | 2013-11-28 | 2015-09-09 | 上海电力学院 | 以柴油机侧为主的风柴混合电力系统负荷频率控制方法 |
CN106532691B (zh) * | 2016-12-05 | 2019-05-10 | 中国科学院自动化研究所 | 基于自适应动态规划的单区域电力系统频率复合控制方法 |
CN107544261B (zh) * | 2017-10-26 | 2020-07-24 | 长春工业大学 | 不确定环境接触下的可重构机器人分散学习最优控制方法 |
-
2018
- 2018-03-05 CN CN201810179648.8A patent/CN108448594B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN108448594A (zh) | 2018-08-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhong et al. | An event-triggered ADP control approach for continuous-time system with unknown internal states | |
Ni et al. | Model-free dual heuristic dynamic programming | |
Xu et al. | Reinforcement learning output feedback NN control using deterministic learning technique | |
CN108448594B (zh) | 微电网频率自适应学习控制方法 | |
Yi et al. | An improved two-stage deep reinforcement learning approach for regulation service disaggregation in a virtual power plant | |
Shou et al. | Virtual guidance-based coordinated tracking control of multi-autonomous underwater vehicles using composite neural learning | |
Mehraeen et al. | Decentralized optimal control of a class of interconnected nonlinear discrete-time systems by using online Hamilton-Jacobi-Bellman formulation | |
Milovanović et al. | Adaptive PID control based on orthogonal endocrine neural networks | |
Ming et al. | Mixed H 2/H∞ control with dynamic event-triggered mechanism for partially unknown nonlinear stochastic systems | |
CN106532691B (zh) | 基于自适应动态规划的单区域电力系统频率复合控制方法 | |
CN110374804A (zh) | 一种基于深度确定性策略梯度补偿的变桨距控制方法 | |
CN112405542B (zh) | 基于脑启发多任务学习的肌肉骨骼机器人控制方法及系统 | |
Zhang et al. | Neural network-based fuzzy vibration controller for offshore platform with random time delay | |
Milovanović et al. | Adaptive control of nonlinear MIMO system with orthogonal endocrine intelligent controller | |
Hager et al. | Adaptive Neural network control of a helicopter system with optimal observer and actor-critic design | |
Chairez | Adaptive neural network nonparametric identifier with normalized learning laws | |
Peng et al. | Neuro-adaptive cooperative control for high-order nonlinear multi-agent systems with uncertainties | |
Saraf et al. | ℋ 2 optimal sensing architecture with model uncertainty | |
Wang et al. | Repetitive tracking control of nonlinear systems using reinforcement fuzzy-neural adaptive iterative learning controller | |
Al-Dabooni et al. | Convergence of recurrent neuro-fuzzy value-gradient learning with and without an actor | |
Sharma et al. | Wavelet reduced order observer based adaptive tracking control for a class of uncertain nonlinear systems using reinforcement learning | |
Perrusquía et al. | Cost inference of discrete-time linear quadratic control policies using human-behaviour learning | |
Moorthy et al. | Artificial intelligence techniques for wind power prediction: a case study | |
Sharma et al. | Wavelet neural network observer based adaptive tracking control for a class of uncertain nonlinear delayed systems using reinforcement learning | |
Tiistola et al. | Quantized measurements in Q-learning based model-free optimal control |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |