CN108448594B

CN108448594B - 微电网频率自适应学习控制方法

Info

Publication number: CN108448594B
Application number: CN201810179648.8A
Authority: CN
Inventors: 王鼎; 张启超; 赵博
Original assignee: Institute of Automation of Chinese Academy of Science
Current assignee: Institute of Automation of Chinese Academy of Science
Priority date: 2018-03-05
Filing date: 2018-03-05
Publication date: 2020-04-07
Anticipated expiration: 2038-03-05
Also published as: CN108448594A

Abstract

本发明属于微电网频率控制技术领域，具体涉及一种微电网频率自适应学习控制方法。旨在解决现有技术无法有效地调节微电网的频率和提高微电网频率的稳定性的问题。本发明提供一种微电网频率自适应学习控制方法，包括基于预先获取的微电网系统的第一状态参数，计算微电网系统的第二状态参数；根据第二状态参数和预先构建的第一神经网络模型计算微电网系统的控制矩阵、扰动矩阵；根据第二状态参数计算微电网系统的效用函数；根据效用函数计算微电网系统的代价函数；基于第二状态参数、控制矩阵、扰动矩阵、效用函数以及代价函数，采用自适应动态规划方法计算微电网系统频率的最优控制律。本发明的方法能够有效地提高微电网系统的频率稳定性。

Description

微电网频率自适应学习控制方法

技术领域

本发明属于微电网频率控制技术领域，具体涉及一种微电网频率自适应学习控制方法。

背景技术

在现代电力系统中，微电网已经成为不可或缺的一部分，微电网是指由分布式电源、储能装置、能量转换装置、负荷、监控和保护装置等组成的小型发配电系统。开发和延伸微电网能够充分促进分布式电源与可再生能源的大规模接入，实现对负荷多种能源形式的高可靠供给，是实现主动式配电网的一种有效方式，使传统电网向智能电网过渡。但是分布式和可再生能源融入微电网将不可避免地会影响微电网的稳定性，特别是负载消耗和发电的不平衡，将导致微电网的频率出现偏差甚至危及微电网的稳定性。由于微电网相对于传统大电网规模较小，系统惯性和冗余度较低，因此，如何提高微电网频率的稳定性已经成为现代电力系统发展的重要问题。

在控制理论与工程中，当被控对象的参数不确定或被控对象受到扰动时，鲁棒性是评估控制器性能的重要标准。由于微电网中一般含有多种分布式电源，这些分布式电源的随机性会给系统造成一定的干扰，且微电网系统的非线性会对系统鲁棒性造成影响。为了提高微电网的稳定性，一些鲁棒控制方法应运而生，例如，模糊控制方法和滑模控制方法等，但是现有技术的方法针对微电网系统在受到扰动情况下的控制问题，获取一般非线性系统的解析解是很困难的，无法有效地调节微电网的频率和提高微电网频率的稳定性。

因此，如何提出一种解决上述问题的方案是本领域技术人员目前需要解决的问题。

发明内容

为了解决现有技术中的上述问题，即为了解决现有技术难以获取非线性系统的解析解导致无法有效地调节微电网的频率和提高微电网频率的稳定性的问题，本发明提供了一种微电网频率自适应学习控制方法，所述方法包括：

基于预先获取的微电网系统的第一状态参数，计算所述微电网系统的第二状态参数；

根据所述第二状态参数和预先构建的第一神经网络模型计算所述微电网系统的控制矩阵、扰动矩阵；根据所述第二状态参数计算所述微电网系统的效用函数；根据所述效用函数计算所述微电网系统的代价函数；

基于所述第二状态参数、控制矩阵、扰动矩阵、效用函数以及代价函数，采用自适应动态规划方法计算所述微电网系统频率的最优控制律。

在上述方法的优选技术方案中，“根据所述第二状态参数和预先构建的第一神经网络模型计算所述微电网系统的控制矩阵、扰动矩阵”，其方法包括：

步骤S21：根据所述第二状态参数和预先构建的第一神经网络模型计算所述微电网系统的第一状态方程，所述第一状态方程为：

其中，A为神经网络模型的预先稳定矩阵，x(t)＝[x₁(t),x₂(t),x₃(t)]^T，x₁(t)＝Δξ_f(t)，x₂(t)＝Δξ_t(t)，x₃(t)＝Δξ_p(t)，ω_m表示所述第一神经网络模型的隐层-输出层的理想权值矩阵，

表示所述第一神经网络模型的激励函数，

表示所述第一神经网络模型的输入量，υ(t)表示由负载变化引起的微电网系统干扰，u(t)表示微电网系统的控制信号，

表示第一重构误差；

步骤S22：随机初始化所述第一神经网络模型的输入层-隐层的理想权值矩阵，计算所述微电网系统的第二状态方程，所述第二状态方程为：

其中，

是所述第一神经网络模型的隐层-输出层的理想权值矩阵ω_m在t时刻的估计值，

表示对微电网系统状态的估计，

v_m表示输入层-隐层的理想权值矩阵；

步骤S23：根据所述第一状态方程和所述第二状态方程，计算所述第一神经网络模型的状态估计误差的动态方程，所述状态估计误差的动态方程为：

表示所述第一神经网络模型的权重估计误差，

表示所述第一神经网络模型的状态估计误差；

步骤S24：根据逼近理论，在所述第一重构误差任意小时，计算所述微电网系统的第三状态方程，分别对所述第三状态方程的微电网系统的控制信号u(t)和微电网系统干扰υ(t)求偏导，得到所述微电网系统的控制矩阵、扰动矩阵；其中，所述微电网系统的第三状态方程为：

所述控制矩阵为：

所述扰动矩阵为：

其中，

表示l_m维的方阵，I_m为与控制维数相同的单位矩阵，I_q为与干扰维数相同的单位矩阵。

在上述方法的优选技术方案中，所述预先构建的第一神经网络模型包括(n+m+q)个输入层神经元，l_m个隐层神经元，n个输出层神经元，学习率为α_m(α_m＞0)，激励函数为

输入层-隐层的理想权值矩阵为

隐层-输出层的理想权值矩阵为

n、m、q分别表示状态、控制、干扰向量的维数。

在上述方法的优选技术方案中，计算所述效用函数其方法如下公式所示：

U(x,t)＝x^T(t)Qx(t)+u^T(t)u(t)-ρ²υ^T(t)υ(t)

其中，U(x,t)表示所述微电网系统的效用函数，Q是n×n实矩阵空间的正定矩阵，ρ是微电网系统干扰的性能系数。

在上述方法的优选技术方案中，“根据所述效用函数计算所述微电网系统的代价函数”，其方法如下公式所示：

其中，J(x,t)表示所述微电网系统的代价函数。

在上述方法的优选技术方案中，所述第一状态参数包括所述微电网系统的水轮机时间常数T_t、调速器时间常数T_g、电力系统常数T_p、电力系统增益k_p、调速系数s_p；所述第二状态参数包括所述微电网系统的频率偏差Δξ_f(t)、水轮机功率偏差Δξ_t(t)以及调速器位置偏差Δξ_p(t)。

在上述方法的优选技术方案中，“计算所述微电网系统的第二状态参数”之后，该方法还包括构建所述微电网系统的仿真模型，构建方法如下公式所示：

其中，

分别表示所述微电网系统的频率偏差Δξ_f(t)、水轮机功率偏差Δξ_t(t)以及调速器位置偏差Δξ_p(t)的导数。

在上述方法的优选技术方案中，“计算所述微电网系统频率的最优控制律”，其方法包括：

步骤S31：通过预先构建的第二神经网络模型重新计算所述代价函数，得到第一代价函数，所述第一代价函数为：

其中，

表示所述预先构建的第二神经网络模型的隐层-输出层的理想权值矩阵，

表示所述预先构建的第二神经网络模型的激励函数，

表示第二重构误差；

步骤S32：基于所述第二神经网络模型的训练隐层-输出层的权值矩阵更新所述第一代价函数，得到第二代价函数，并计算所述第二代价函数的梯度向量，所述第二代价函数为：

所述第二代价函数的梯度向量为：

其中，

表示所述第二神经网络模型的训练隐层-输出层的权值矩阵，

表示所述第二神经网络模型的激励函数的梯度向量；

步骤S33：根据所述第一代价函数和所述第二代价函数的梯度向量计算所述微电网系统频率的最优控制律，计算方法如下公式所示：

在上述方法的优选技术方案中，所述预先构建的第二神经网络模型包括n个输入层神经元，l_c个隐层神经元，1个输出层神经元，学习率为α_c(α_c＞0)，激励函数为

输入层-隐层的权值均为1，隐层-输出层的理想权值矩阵为

在上述方法的优选技术方案中，“计算所述微电网系统频率的最优控制律”之前，该方法还包括基于梯度下降算法调整所述预先构建的第二神经网络模型的权值，所述梯度下降算法具体如下公式所示：

其中，

表示l_c维的列向量，

表示最小化目标函数，

表示控制信号的近似值，

表示微电网系统干扰的近似值，

表示隐层-输出层的理想权值矩阵的近似值。

与最接近的现有技术相比，本发明提供一种微电网频率自适应学习控制方法，包括基于预先获取的微电网系统的第一状态参数，计算微电网系统的第二状态参数；根据第二状态参数和预先构建的第一神经网络模型计算微电网系统的控制矩阵、扰动矩阵；根据第二状态参数计算微电网系统的效用函数；根据效用函数计算微电网系统的代价函数；基于第二状态参数、控制矩阵、扰动矩阵、效用函数以及代价函数，采用自适应动态规划方法计算微电网系统频率的最优控制律。

上述技术方案至少具有如下有益效果：

1、本发明的技术方案通过重构微电网系统的控制矩阵和扰动矩阵，可以将微电网系统的状态误差收敛至期望值，存在干扰和不确定项的情况下，改善了微电网频率调节克服干扰和不确定性的性能；

2、采用自适应动态规划方法设计微电网系统的频率控制器可以对微电网系统的频率进行自适应调节，消除微电网系统的频率偏差，有效地提高了微电网系统的频率稳定性。

附图说明

图1为本发明一种实施例中微电网系统的结构示意图；

图2为本发明一种实施例中微电网频率自适应学习控制方法的流程示意图；

图3为本发明一种实施例中微电网频率自适应学习控制方法的结构示意图；

图4为本发明一种实施例中预先构建的第二神经网络模型的权值向量的收敛图；

图5为本发明一种实施例中第二状态参数的响应图线图；

图6为本发明一种实施例中微电网频率自适应学习控制方法的控制输入和比率函数图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围

下面参照附图来描述本发明的优选实施方式。本领域技术人员应当理解的是，这些实施方式仅仅用于解释本发明的技术原理，并非旨在限制本发明的保护范围。

本发明采用一种微电网频率自适应控制方法，该方法建立在贝尔曼方程之上，以动态规划为基础，利用函数近似结构(例如神经网络)来近似哈密顿-雅可比-贝尔曼方程的解，采用离线迭代或者在线更新的方法，来获得系统的近似最优控制策略，从而能够有效地解决非线性系统的优化控制问题。自适应动态规划融合了强化学习思想和自适应评估机制，一方面，在学习原理上，它通过强化学习的试错法则模拟人类思考、学习方式，即通过与外界环境交互，在成功和失败的过程中积累决策经验；另一方面，在最优决策求解问题上，它利用自适应评估机制，通过一个函数近似结构，例如神经网络来评估代价函数、求解最优解。自适应动态规划是传统优化控制设计的智能实现，特别是对于具有非线性和不确定性的复杂系统更加有效。

参阅附图1，图1示例性的给出了本实施例中微电网系统的结构示意图，为了说明的简洁方便，本发明的技术方案实施例中微电网系统包括常规发电机(微型涡轮机)、智能家居和负载，但是本发明的微电网系统并不只局限于包括上述内容。如图1所示，微电网系统的所有信号都可以通过分布式传感器进行测量，然后通过通信介质传输到微电网系统的智能电网管理中心，其中，图1中虚线表示通过通信信道组件的信号传输，智能电网管理中心进行数据处理后生成控制信号，并将控制信号发送回微电网系统中的每个参与单元，如智能家居、负载和微型燃气轮机等，以保证每个参与单元频率的稳定性。

参阅附图2，图2示例性地给出了本实施例中微电网频率自适应学习控制方法的流程示意图，本发明实施例包括下述步骤：

步骤S1：基于预先获取的微电网系统的第一状态参数，计算所述微电网系统的第二状态参数；

在本发明实施例中，第一状态参数包括所述微电网系统的水轮机时间常数T_t、调速器时间常数T_g、电力系统常数T_p、电力系统增益k_p、调速系数s_p；所述第二状态参数包括所述微电网系统的频率偏差Δξ_f(t)、水轮机功率偏差Δξ_t(t)以及调速器位置偏差Δξ_p(t)；在实际应用中，微电网频率偏差Δξ_f(t)，水轮机功率偏差Δξ_t(t)，调速器位置偏差Δξ_p(t)均满足动力学方程，计算出第二状态参数之后，本发明实施例的技术方案还包括构建所述微电网系统的仿真模型，构建方法具体如公式(1)-(3)所示：

其中，Δξ_f(t)还受到微电网系统干扰υ(t)的影响，这里

表示由负载变化引起的微电网系统干扰，

代表所有的实数集，微电网系统的控制信号u(t)作用到调速器的位置调节阀上，调速器位置偏差Δξ_p(t)还与微电网系统的控制信号u(t)有关，

定义

为状态向量，

是欧几里得空间上所有的三维实向量，“T”表示转置运算。微电网系统频率调节的状态方程如公式(4)所示：

其中，g(x)为控制矩阵，h(x)为干扰矩阵，状态向量x(t)是n维的，本发明实施例中n＝3；控制信号u(t)是m维的，本发明实施例中m＝1；干扰信号υ(t)是q维的，本发明实施例中q＝1，本发明实施例中，上述参数的值除了给出的值外，还可以有其他取值，本发明在此不做限定。将上述微电网系统的状态空间方程调整为如公式(5)所示：

其中，

A_sg为系统矩阵。

设定t＝0时的初始状态为x(0)＝x₀，在实施控制方法后，在某个t≠0的时刻x＝0，微电网系统的频率偏差Δξ_f＝0，水轮机功率偏差Δξ_t＝0，调速器位置偏差Δξ_p＝0，此时达到微电网系统的频率调节目标。

步骤S2：根据所述第二状态参数和预先构建的第一神经网络模型计算所述微电网系统的控制矩阵、扰动矩阵；根据所述第二状态参数计算所述微电网系统的效用函数；根据所述效用函数计算所述微电网系统的代价函数；

参阅附图3，图3示例性地给出了微电网频率自适应学习控制方法的结构示意图，步骤S2具体包括以下步骤：

步骤S21：根据所述第二状态参数和预先构建的第一神经网络模型计算所述微电网系统的第一状态方程，所述第一状态方程如公式(6)所示：

其中，

表示第一神经网络模型的输入向量，

是第一重构误差；

基于所述激活函数σ_m(·)，对任何

或者相同维度的向量ξ_a和ξ_b，存在一个常数λ₀(λ₀＞0),使得：

σ_m(a)-σ_m(b)≤λ₀(a-b) (7)

||σ_m(ξ_a)-σ_m(ξ_b)||≤λ₀||ξ_a-ξ_b|| (8)

式中||·||代表在

上的向量范数或者是在

上的矩阵范数。

步骤S22：随机初始化所述第一神经网络模型的输入层-隐层的理想权值矩阵，计算所述微电网系统的第二状态方程，所述第二状态方程如公式(9)所示：

其中，

是理想权值ω_m在t时刻的估计值，

是对微电网系统状态的估计，

步骤S23：根据所述第一状态方程和所述第二状态方程，计算所述第一神经网络模型的状态估计误差的动态方程，所述状态估计误差的动态方程如公式(10)所示：

步骤S24：根据逼近理论，在所述第一重构误差任意小时，说明神经网络学习到的微电网系统模型能够较好地体现微电网系统的实际状态，计算所述微电网系统的第三状态方程，分别对所述第三状态方程的微电网系统的控制信号u(t)和微电网系统干扰υ(t)求偏导，得到所述微电网系统的控制矩阵、扰动矩阵；其中，所述微电网系统的第三状态方程如公式(11)所示：

公式(11)表示微电网系统的状态导数信息，分别对u(t)和υ(t)的求偏导，结果分别如公式(12)和公式(13)所示：

式中

是一个lm维的方阵，I_m为与控制维数相同的单位矩阵，I_q为与干扰维数相同的单位矩阵；上式中的两个公式重构了微电网系统的控制矩阵和扰动矩阵的信息，这里的控制矩阵和扰动矩阵均为近似值，为了方便起见使用上式中的符号；根据神经网络万能逼近定理，只要隐藏层节点l_m的数量足够大，重构误差ε_m(t)可以是任意小的；通常认为理想权值矩阵是有界的，也就是

和

其中

和

是||ω_m||和||ν_m||的上确界，且都是正数；重构误差ε_m满足

其中

是正数，由此可知，使用公式(9)来估计状态

并且由

调整权值矩阵，则状态估计误差

能收敛到期望值，表明此时神经网络较好地学习到微电网系统的模型，状态误差动态

渐近稳定。最优代价函数在实际中很难求得，因此采用近似方法进行求解。基于神经网络学习到的微电网系统的模型，能够更好地体现微电网系统的实际状态，并减少控制算法对于系统模型的依赖，后期通过自适应动态规划方法能够更为准确地计算出最优控制律。

在本发明实施例中，预先构建的第一神经网络模型包含(n+m+q)个输入层神经元，l_m个隐层神经元，n个输出层神经元，学习率α_m(α_m＞0)，激励函数

给出输入层-隐层的理想权值矩阵

隐层-输出层的理想权值矩阵

预先构建的第二神经网络模型包括n个输入层神经元，l_c个隐层神经元，1个输出层神经元，学习率为α_c(α_c＞0)，激励函数为

输入层-隐层的权值均为1，隐层-输出层的理想权值矩阵为

在本发明实施例的一种优选的实施方式中，由调节状态和控制量定义的微电网系统的效用函数如公式(14)所示：

U(x,t)＝x^T(t)Qx(t)+u^T(t)u(t)-ρ²υ^T(t)υ(t) (14)

其中，式中Q是n×n实矩阵空间的正定矩阵，ρ是自适应H_∞性能系数；

在本发明实施例的一种优选的实施方式中，用微电网系统的效用函数进一步构成其代价函数，如公式(15)所示：

式中J(x,t)表示微电网系统在时刻t的代价函数。

步骤S3：基于所述第二状态参数、控制矩阵、扰动矩阵、效用函数以及代价函数，采用自适应动态规划方法计算所述微电网系统频率的最优控制律。

具体地，由于代价函数是连续可微的，如公式(16)所示进行定义：

其中

表示梯度；

为保证微电网系统的频率稳定，应用贝尔曼最优性原理，最优控制律可以通过

得到，具体地如公式(17)所示：

解出最优控制律u^*(t)如公式(18)所示：

其中，

表示最优代价J^*(x,t)的梯度。相应的，可以求得最坏情形的干扰如公式(19)所示：

结合公式(18)和公式(19)可得如公式(20)所示结果：

由于最优代价函数J^*(x,t)在实际中很难求得，这里采用自适应动态规划方法，近似求解微电网频率H_∞控制问题中的最优控制律u^*(t)。

设计自适应动态规划方法的评价神经网络，其中，评价神经网络即为预先构建第二神经网络模型，估计微电网系统的最优代价函数J^*(x,t)；评价网络包含n个输入层神经元，l_c个隐层神经元，1个输出层神经元，学习率α_c(α_c＞0)，激励函数

输入层-隐层的权值均为1，隐层-输出层之间的理想权值矩阵记为

通过评价神经网络来重构代价函数J*(x,t)如公式(21)所示：

式中J^*(x,t)是最优代价函数，

是第二重构误差，根据公式(21)，基于神经网络，最优代价函数的J^*(x,t)梯度向量表示如公式(22)所示：

由于理想权值未知，使用训练的隐层-输出层之间的权值矩阵

来近似代价函数，如公式(23)所示：

其中，

表示训练的隐层-输出层之间的权值矩阵。根据式(23)，近似最优代价函数

梯度向量表示如公式(24)所示：

使用理想的隐层-输出层之间的权值矩阵ω_c，基于式(18)和(22)，H_∞控制器的最优控制律u^*(t)可写为：

相应的，可推导出下述表达式：

使用训练的隐层-输出层之间的权值矩阵

将

代入式(18)得到的是近似最优控制律

因此，基于式(18)和(24)，近似最优控制律

可写为：

相应的，基于式(19)和(24)，可推导出下述表达式：

根据近似最优控制

和近似扰动

定义理想权值矩阵下的评价神经网络的误差为e_cH，表达式为：

其中，

是激励函数σ_c(x)的梯度。定义训练的权值矩阵下的评价神经网络误差为e_c，表达式如公式(30)所示：

评价神经网络误差e_c能够用来衡量近似的最优代价函数与实际要求值的近似程度，当评价神经网络误差值越小时，在一定程度上说明近似值与实际值的接近程度越高，所得到的结果也就更准确；基于权值误差向量

可推导出公式(31)：

训练评价神经网络，通过最小化目标函数

来训练并更新权重向量

采用梯度下降算法来调整权值，如公式(32)所示：

其中φ是一个l_c维的列向量，

如图4所示，图4示例性地给出了预先构建的第二神经网络模型的权值向量的收敛图。

为了使本领域人员更好地理解本发明，下面结合具体实施例，对本发明的微电网频率自适应H_∞控制方法进行详细说明。

在实际应用中，测量得到水轮机时间常数T_t＝5，调速器时间常数T_g＝0.2，电力系统时间常数T_p＝2，电力系统增益k_p＝0.5，调速系数s_p＝0.5；

对这样的一个微电网系统建立模型神经网络，其中，微电网系统的仿真模型如下：

微电网频率偏差Δξ_f(t)满足动力学方程

水轮机功率偏差Δξ_t(t)满足动力学方程

调速器位置偏差Δξ_p(t)满足动力学方程，

且Δξ_f(t)还受到微电网系统的干扰υ(t)的影响，这里

表示由负载变化引起的微电网系统干扰，

微电网系统动力学的状态空间描述如下：

其中，控制矩阵g(x)和扰动矩阵h(x)都是有界的。上述微电网系统的状态空间方程可以写成：

其中

为系统矩阵。设计t＝0时的初始状态为x(0)＝x₀，实施自适应控制后，在x＝0时，微电网系统的频率偏差Δξ_f＝0，水轮机功率偏差Δξ_t＝0，调速器位置偏差Δξ_p＝0，此时达到微电网系统的频率调节目标。

根据微电网频率偏差Δξ_f(t)，水轮机功率偏差Δξ_t(t)，调速器位置偏差Δξ_p(t)和微电网系统的干扰υ(t)，结合给定控制律u(t)，建立反向传播三层神经网络，用以重构微电网系统的控制矩阵g(x)和干扰矩阵h(x)，这样可以减少对于系统真实模型的依赖。

这里，模型神经网络输入层神经元n+m+q＝5，也就是状态、控制、干扰三个向量的维数之和为5，模型神经网络隐层神经元数目l_m＝6，输出层神经元数目n＝3，学习率α_m＝0.3，激励函数σ_m(·)＝tanh(·)，给出输入层-隐层的理想权重矩阵

得到隐层-输出层的权重矩阵

微电网系统状态表达式为：

选取输入层-隐层的权重矩阵

如下：

得到隐层-输出层的收敛权重矩阵

如下：

根据上述分析，在收敛权值

下的微电网系统的模型神经网络公式为：

微电网系统的模型神经网络公式代表了微电网系统的状态导数信息，完成模型网络的建立之后，求解微电网系统的模型神经网络公式分别对于控制u和扰动υ的偏导，可得重构的微电网系统的控制矩阵和扰动矩阵如下：

式中

是一个6维的方阵，上式的控制矩阵和扰动矩阵均为近似值，为了方便则使用上式中的符号。

根据步骤(3)，给出微电网系统的初始状态为x₀＝[0.1 -0.2 0.2]^T，选择正定矩阵Q＝I₃和H_∞性能系数ρ＝5，I₃代表3×3的单位矩阵。对于微电网系统，由状态和控制量定义的微电网系统的效用函数为：

用微电网系统的效用函数进一步构成其代价函数，表示为：

代价函数在t＝0表示为J(x(0))＝J(x₀)

根据步骤(4)，设计基于自适应动态规划方法的微电网系统频率自适应H_∞控制器，图3是微电网系统自适应H_∞控制的结构图。

给定评价神经网络输入层神经元数目为n＝3，隐藏层神经元数目l_c＝6，输出层神经元数目为1，学习率α_c＝2，激活函数

输入层到隐层的权值矩阵的分量均取为1，隐层到输出层的权值矩阵为

使用

来近似代价函数，则用以构建自适应H_∞控制器的代价函数如下：

为了进行有效的学习和近似，本发明增加了探测噪声，以保证激发条件在前550秒内的持续性，图4是神经网络学习阶段评价网络权重向量的收敛结果。经过训练，评价神经网络的隐层到输出层之间的权值矩阵

最终收敛到[0.1600 0.2775 0.0771 0.2218 -0.1657 0.1221]^T，反映了基于自适应动态规划方法的鲁棒控制器良好的学习能力。

根据收敛的

值，得到H_∞控制器的近似最优控制律

获得基于自适应动态规划方法的H_∞控制器；

引入外部扰动υ(t)＝e^-0.2tcos(-0.6t)，t＞0，并将所获的基于自适应动态规划方法的H_∞控制器应用于微电网系统60秒来评估其控制性能。图5是自适应鲁棒控制器下三个状态Δξ_f(t)，Δξ_t(t)，Δξ_p(t)的响应曲线图，能够看出微电网系统的三个状态最终均收敛到0。随着时间的推移，近似控制律

也收敛到0，结果可由图6看出。图6是自适应H_∞控制器下输入信号

的响应曲线和比率函数图。这里，比率函数定义为：

如图6所示，图6示例性地给出了微电网频率自适应学习控制方法的控制输入和比率函数图，比率函数的值最终稳定在0.6635，证明了微电网频率自适应H_∞控制方法的有效性。

结合本文中所公开的实施例描述的方法或算法的步骤可以用硬件、处理器执行的软件模块，或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。

本领域技术人员应该能够意识到，结合本文中所公开的实施例描述的各示例的方法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明电子硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以电子硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。本领域技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

至此，已经结合附图所示的优选实施方式描述了本发明的技术方案，但是，本领域技术人员容易理解的是，本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下，本领域技术人员可以对相关技术特征做出等同的更改或替换，这些更改或替换之后的技术方案都将落入本发明的保护范围之内。

Claims

1.一种微电网频率自适应学习控制方法，其特征在于，所述方法包括：

根据所述第二状态参数和预先构建的第一神经网络模型计算所述微电网系统的控制矩阵、扰动矩阵；

根据所述第二状态参数计算所述微电网系统的效用函数；

根据所述效用函数计算所述微电网系统的代价函数；

基于所述第二状态参数、控制矩阵、扰动矩阵、效用函数以及代价函数，采用自适应动态规划方法计算所述微电网系统频率的最优控制律；其中，“根据所述第二状态参数和预先构建的第一神经网络模型计算所述微电网系统的控制矩阵、扰动矩阵”具体包括：

其中，A是神经网络模型中预先设定的稳定矩阵，x(t)＝[x₁(t),x₂(t),x₃(t)]^T，x₁(t)＝Δξ_f(t)，x₂(t)＝Δξ_t(t)，x₃(t)＝Δξ_p(t)，ω_m表示所述第一神经网络模型的隐层-输出层的理想权值矩阵，

表示所述第一神经网络模型的激励函数，

表示第一重构误差，l_m为第一神经网络的隐藏层神经元的个数，n、m、q分别表示状态、控制、干扰向量的维数；

其中，

表示对微电网系统状态的估计，

v_m表示输入层-隐层的理想权值矩阵；

步骤S23：根据所述第一状态方程和所述第二状态方程，计算基于神经网络的状态估计误差动态方程，所述状态估计误差的动态方程为：

表示所述第一神经网络模型的权重估计误差，

表示所述第一神经网络模型的状态估计误差；

步骤S24：根据逼近理论，在所述第一重构误差任意小时，计算所述微电网系统的第三状态方程，分别对所述第三状态方程的微电网系统的控制信号u₀(t)和微电网系统干扰υ(t)求偏导，得到所述微电网系统的控制矩阵、扰动矩阵；其中，所述微电网系统的第三状态方程为：

所述控制矩阵为：

所述扰动矩阵为：

其中，

2.根据权利要求1所述的方法，其特征在于，所述预先构建的第一神经网络模型包括n+m+q个输入层神经元，l_m个隐层神经元，n个输出层神经元，学习率为α_m，其中，α_m＞0，激励函数为

输入层-隐层的理想权值矩阵为

隐层-输出层的理想权值矩阵为

n、m、q分别表示状态、控制、干扰向量的维数。

3.根据权利要求2所述的方法，其特征在于，所述效用函数为：

U(x,t)＝x^T(t)Qx(t)+u^T(t)u(t)-ρ²υ^T(t)υ(t)

4.根据权利要求3所述的方法，其特征在于，“根据所述效用函数计算所述微电网系统的代价函数”，其方法如下公式所示：

其中，J(x,t)表示所述微电网系统的代价函数。

5.根据权利要求1所述的方法，其特征在于，所述第一状态参数包括所述微电网系统的水轮机时间常数T_t、调速器时间常数T_g、电力系统常数T_p、电力系统增益k_p、调速系数s_p；所述第二状态参数包括所述微电网系统的频率偏差Δξ_f(t)、水轮机功率偏差Δξ_t(t)以及调速器位置偏差Δξ_p(t)。

6.根据权利要求5所述的方法，其特征在于，“计算所述微电网系统的第二状态参数”之后，该方法还包括构建所述微电网系统的仿真模型，其构建方法如下公式所示：