CN109932900A

CN109932900A - 一种非线性连续系统的权重更新方法

Info

Publication number: CN109932900A
Application number: CN201910349572.3A
Authority: CN
Inventors: 刘凡; 周武能
Original assignee: Donghua University
Current assignee: Donghua University; National Dong Hwa University
Priority date: 2019-04-28
Filing date: 2019-04-28
Publication date: 2019-06-25

Abstract

本发明提出了一种新颖的基于神经网络的使用事件触发状态反馈控制的非线性连续系统的权重更新方法，并保证了系统的稳定性和避免了Zeno效应。反馈控制器是在事件触发机制下，采用神经网络来逼近的。由于控制输入为非线性控制输入，因此比传统线性控制输入应用范围更广。触发机制为利用系统输出值与控制器输出值之差来判断是否满足触发条件。由于采用了事件触发机制，所以与传统控制方法相比，降低了系统的能耗，也节约了资源。

Description

一种非线性连续系统的权重更新方法

技术领域

本发明涉及一种新颖的基于神经网络的使用事件触发状态反馈控制的非线性连续系统的权重更新方法，主要涉及领域为非线性控制，事件触发机制和神经网络。

背景技术

近几年来，事件触发机制已经广泛运用于众多非线性控制的问题，它主要的优点在于能够降低系统的能耗和运算复杂度。采用事件触发机制的反馈控制器与传统采用周期采用的反馈控制器相比，最大的不同点在于触发机制允许系统误差一直增加直到下一个触发时刻，而不影响系统稳定性能，这也意味着触发时间间隔是不同的。已经有很多种事件触发机制被提出了，也有众多分析系统稳定性的方法被提出，但总体来说，在使用时间触发机制的前提下，Lyapunov直接法是最常用的分析系统稳定性的方法。

非线性系统的控制一直是一个难题，然而线性系统人们已经提出很多成熟而有效的控制方法，因此人们开始尝试利用具有神经网络的反馈控制器去控制非线性系统，让它逐渐逼近线性系统。人们已经证明具有一个输入层，一个隐层和一个输出层的神经网络能够逼近任意连续函数，这使得，在一定情况下，任意给定一个闭环系统矩阵，都可以采用连续的控制使原有的非线性系统趋向于线性系统，而非线性系统的控制输入即是神经网络的输出。

在工业生产中存在大量的非线性控制问题，如电机转速控制，工业机器人控制，自动驾驶汽车控制等。这些问题不仅要求控制速度快，还要求精准，这使得一般的线性反馈控制很难达到控制要求，因此促使了人们研究非线性控制输入。神经网络已经被证明具有良好的逼近性能，因此在非线性控制输入中，常引入神经网络来产生非线性控制输入。

发明内容

本发明的目的是：在非线性控制输入中将事件触发机制与神经网络结合。

为了达到上述目的，本发明的技术方案是提供了一种非线性连续系统的权重更新方法，通过修改反馈控制器中神经网络的权重来实现控制，反馈控制器至少包含输入系统状态向量采样器、零阶保持器、神经网络控制器、神经网络权矩阵更新律和时间触发机制，其特征在于，包括以下步骤

(1)利用反馈控制器的系统状态向量采样器将非线性连续系统的状态向量进行采样，输入反馈控制器的是采样后的状态向量，即分段连续的；

(2)在触发时刻τ_k，利用反馈控制器的零阶保持器将系统状态向量采样器最后采样的系统状态向量进行保存，并记为即为输入到所述反馈控制器的所述神经网络控制器系统状态向量；

(3)将反馈控制器的神经网络控制器构建为一个输入层、一个隐层和一个输出层，表示为：

式中，W表示输出层权矩阵；V表示输入层常值权矩阵；g(·)表示控制增益函数；表示隐藏层激活函数，并有u(x)表示表示反馈控制输入；

(4)计算所述非线性连续系统的状态向量x与所述状态向量采样值的差，即事件触发误差e，

(5)将步骤(3)中神经网络控制器的输入权矩阵V设置为常矩阵；

(6)将反馈控制器的神经网络权矩阵更新律设置为如下形式：

式中，W为触发时刻之前步骤(3)中神经网络控制器的输出权矩阵的值；W⁺为触发时刻之后步骤(3)中神经网络控制器的输出权矩阵的值；表示步骤(2)中保存在零阶保持器中的系统状态向量，并且α＞0为神经网络学习率；c＞0、κ＞0是均为常数；L是一个维数匹配矩阵；表示输出权矩阵的变化率；

(7)设置所述非线性连续系统的期望闭环系统矩阵，记为A；

(8)将反馈控制器的时间触发机制设置为如下形式：

||e||≥σ_s||x||

式中，是阈值系数，0＜Γ＜1，是步骤(3)中神经网络权矩阵更新律中的激活函数的Lipschitz常数，q_min是正定对称矩阵Q的最小特征值，P是一个正定对称矩阵，P和Q满足Lyapunov方程：A^TP+PA＝-Q，g_max是步骤(3)中神经网络控制器的控制增益函数的最大值。

优选地，在步骤(3)中，输出层权矩阵W定义在一个有界紧集上，以使||W||≤W_max，W_max为一正数；所述隐藏层激活函数定义在一个有界紧集上，以使为一正数，同时满足Lipschitz条件，即为一正常数；所述控制增益函数g(·)定义在一个有界紧集上，以使||g(·)||≤g_max，g_max为一正数。

优选地，在步骤(6)中，在触发时刻τ_k时，输出权矩阵W更新为W⁺，然后保持恒定，直至下一触发时刻τ_k+1。

优选地，在步骤(7)中，设置非线性连续系统的期望闭环系统矩阵A，并且当输出权矩阵W稳定趋于稳定值W_f时，非线性连续系统与反馈控制器共同构成的闭环系统表示为

式中，表示渐进误差函数，并有

优选地，在所述步骤(8)之后还包括如下步骤：

(9)若步骤(8)中条件满足，则按步骤(6)中权矩阵更新公式更新权矩阵W；

(10)若步骤(8)中条件满足，则将步骤(4)中时间触发误差e置为零；

(11)若步骤(8)中条件满足，则利用步骤(9)中得到的更新后的权矩阵W来更新σ_s；

(12)若步骤(8)中条件满足，则将系统状态采样器最后一次采样的状态送入所述零阶保持器；

(13)当触发误差||e||小于给定值后，则视为权矩阵已经接近目标权矩阵W_f。

本发明保证了系统的稳定性和避免了Zeno效应。反馈控制器是在事件触发机制下，采用神经网络来逼近的。由于控制输入为非线性控制输入，因此比传统线性控制输入应用范围更广。触发机制为利用系统输出值与控制器输出值之差来判断是否满足触发条件。由于采用了事件触发机制，所以与传统控制方法相比，降低了系统的能耗，也节约了资源。

本发明的有效性在于能够在保证系统稳定的前提下，让非线性系统逐渐趋于线性系统，而且神经网络控制器的权矩阵也趋于稳定值，还能够避免Zeno效应的发生。

附图说明

图1是神经网络结构图，其中，W表示输出层权矩阵，V表示输入层常值权矩阵，g(·)表示控制增益函数，表示隐藏层激活函数。

图2是状态反馈事件触发系统结构图，系统状态在事件触发时刻τ_k被送到零阶保持器，同时，神经网络控制器在权重更新律下，更新权重，计算新的控制输出，并送到零阶保持器。

具体实施方式

下面结合具体实施例，进一步阐述本发明。应理解，这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解，在阅读了本发明讲授的内容之后，本领域技术人员可以对本发明作各种改动或修改，这些等价形式同样落于本申请所附权利要求书所限定的范围。

本实施例以单输入二阶非线性系统来进一步说明本发明。

对于如上的单输入二阶非线性系统，本发明提供的一种基于神经网络的使用事件触发状态反馈控制的非线性连续系统的权重更新方法，包括以下步骤：

(1)利用系统状态向量采样器对上述系统状态x进行采样。

(2)在触发时刻τ_k，利用零阶保持器将系统状态向量采样器最后一次采样后的系统状态向量进行保存，并记为

(3)初始化期望闭环系统矩阵A，以及正定矩阵Q，并计算||A||，q_min，||P||。

(4)初始化神经网络输入常矩阵V和输出权矩阵W，并计算||W||。

(5)令系统控制输入为

(6)计算g_max，和

(7)计算非线性连续系统的状态向量x与状态向量采样值的差，即时间触发误差

(8)初始化Γ，α，c和κ并计算σ_s。

(9)判断小数反馈控制器的事件触发条件是否满足

||e||≥σ_s||x||

若触发条件满足，则按下述权矩阵更新公式更新权矩阵Q。

若触发条件满足，事件触发误差e置为零。

若触发条件满足，利用更新后的权矩阵W和下述公式来更新σ_s。

若触发条件满足，则将系统状态采样器最后一次采样的状态送入所述零阶保持器。

(10)当触发误差||e||小于给定值后，则可视为权矩阵已经接近目标权矩阵W_f。

Claims

1.一种非线性连续系统的权重更新方法，通过修改反馈控制器中神经网络的权重来实现控制，反馈控制器至少包含输入系统状态向量采样器、零阶保持器、神经网络控制器、神经网络权矩阵更新律和时间触发机制，其特征在于，包括以下步骤

式中，W表示输出层权矩阵；V表示输入层常值权矩阵；g(·)表示控制增益函数；表示隐藏层激活函数，并有u(x)表示反馈控制输入；

(5)将步骤(3)中神经网络控制器的输入权矩阵V设置为常矩阵；

(6)将反馈控制器的神经网络权矩阵更新律设置为如下形式：

式中，W为触发时刻之前步骤(3)中神经网络控制器的输出权矩阵的值；W⁺为触发时刻之后步骤(3)中神经网络控制器的输出权矩阵的值；表示步骤(2)中保存在零阶保持器中的系统状态向量，并且α＞0为神经网络学习率；c＞0、κ＞0是一个常数；L是一个维数匹配矩阵；表示输出权矩阵的变化率；

(7)设置所述非线性连续系统的期望闭环系统矩阵，记为A；

(8)将反馈控制器的时间触发机制设置为如下形式：

||e||≥σ_s||x||

2.根据权利要求1中所述的一种非线性连续系统的权重更新方法，其特征在于，在步骤(3)中，输出层权矩阵W定义在一个有界紧集上，以使||W||≤W_max，W_max为一正数；所述隐藏层激活函数定义在一个有界紧集上，以使为一正数，同时满足Lipschitz条件，即表示一个正常数；所述控制增益函数g(·)定义在一个有界紧集上，以使||g(·)||≤g_max，g_max为一正数。

3.根据权利要求1中所述的一种非线性连续系统的权重更新方法，其特征在于，在步骤(6)中，在触发时刻τ_k时，输出权矩阵W更新为W+，然后保持恒定，直至下一触发时刻τ_k+1。

4.根据权利要求1中所述的一种非线性连续系统的权重更新方法，其特征在于，在步骤(7)中，设置非线性连续系统的期望闭环系统矩阵A，并且当输出权矩阵W稳定趋于稳定值W_f时，非线性连续系统与反馈控制器共同构成的闭环系统表示为

式中，表示渐进误差函数，并有

5.根据权利要求1中所述的一种非线性连续系统的权重更新方法，其特征在于，在所述步骤(8)之后还包括如下步骤：