CN114815618A

CN114815618A - 一种基于动态增益的自适应神经网络跟踪控制方法

Info

Publication number: CN114815618A
Application number: CN202210467223.3A
Authority: CN
Inventors: 于兴虎; 郑晓龙; 杨佳兴; 杨学博; 李湛; 高会军
Original assignee: Harbin Institute of Technology
Current assignee: Harbin Institute of Technology
Priority date: 2022-04-29
Filing date: 2022-04-29
Publication date: 2022-07-29
Anticipated expiration: 2042-04-29
Also published as: CN114815618B

Abstract

一种基于动态增益的自适应神经网络跟踪控制方法，本发明涉及基于动态增益的自适应神经网络跟踪控制方法。本发明是为了解决目前自适应神经网络控制的反馈增益参数以未知函数的上界设计，使得系统的控制器设计不灵活，导致设计的控制器能量消耗过大的问题。过程为：一、建立具有未知非线性控制方向函数的不确定非线性严格反馈系统的二维状态空间模型，使系统输出跟踪目标信号；二、建立具有扩展状态变量的三维非线性系统状态空间模型；三、设计李雅普诺夫函数；四、利用李雅普诺夫函数对时间求一阶导数；五、改写李雅普诺夫函数的一阶导数；六、设计神经网络权值更新律、虚拟控制函数及控制输入。本发明用于非线性控制技术领域。

Description

一种基于动态增益的自适应神经网络跟踪控制方法

技术领域

本发明属于非线性控制技术领域，具体涉及一种基于动态增益的自适应神经网络跟踪控制。

背景技术

在工程实践中有许多非线性系统的跟踪控制问题，如机械臂轨迹跟踪控制、航天器姿态跟踪控制、电机伺服控制等，实际上不可能获得与真实系统相对应的准确数学模型。在进行非线性系统跟踪控制设计时必须要考虑非线性系统的不确定性，一种常用的控制方法是自适应神经网络跟踪控制，该方法是基于反步控制思想设计控制器，结合神经网络逼近系统中的未知项函数和虚拟控制函数的导数，克服了反步控制法设计过程中虚拟控制函数求导带来的计算爆炸问题，极大降低了不确定非线性系统控制器的设计难度。自适应神经网络跟踪控制技术可以参考中国发明专利CN114019804A、中国发明专利CN112192573A及中国发明专利CN107577146B。在处理具有未知控制方向函数的不确定非线性系统控制问题时，传统的自适应神经网络控制方法只能以未知控制方向函数的上界设计反馈增益，不等式的过度放大，得到的结果很大程度具有保守性。由于反馈增益参数是一个固定值，使得系统的控制器设计不灵活，导致设计的控制器能量消耗过大。

发明内容

本发明是为了解决目前自适应神经网络控制的反馈增益参数以未知函数的上界设计，使得系统的控制器设计不灵活，导致设计的控制器能量消耗过大的问题，提出了一种基于动态增益的自适应神经网络跟踪控制方法。

本方法为了解决上述技术问题采取的技术方案是：一种基于动态增益的自适应神经网络跟踪控制方法，该方法包括以下步骤：

步骤一、根据系统的状态变量x₁和x₂，输出信号y和控制信号u，建立具有未知非线性控制方向函数的不确定非线性严格反馈系统的二维状态空间模型，使系统输出y(t)跟踪目标信号y_d(t)；

步骤二、定义扩展状态变量x₃＝u，建立具有扩展状态变量的三维非线性系统状态空间模型，定义误差变量z₁，z₂，z₃；

步骤三、利用步骤二中的误差变量z₁，z₂，z₃设计李雅普诺夫函数V；

步骤四、利用步骤三中的李雅普诺夫函数V对时间求一阶导数得到

步骤五、引入等价控制方向函数，定义需要依靠神经网络逼近的未知项F₁和F₂，改写步骤四中李雅普诺夫函数的一阶导数

步骤六、引入动态增益，根据步骤五中李雅普诺夫函数的一阶导数

利用反步法和自适应神经网络，设计神经网络权值更新律、虚拟控制函数α₁和α₂及控制输入u。

本发明的有益效果：

引入动态增益，让控制器的设计更灵活，降低控制器u的能量消耗；引入等价控制增益，使自适应神经网络控制的反馈增益不再需要根据未知控制方向函数的上界设计，避免了控制器过于保守的问题；实现设计反馈控制器u(t)，使系统输出y(t)能够在小误差范围内跟踪给定目标信号y_d(t)。

附图说明

图1为本发明系统(公式1)输出曲线图；

图2为本发明系统(公式1)跟踪误差曲线图；

图3为本发明神经网络逼近F₁曲线图；

图4为本发明神经网络逼近F₂曲线图；

图5为本发明动态增益曲线图；

图6为本发明控制信号u曲线图。

具体实施方式

具体实施方式一：本实施方式一种基于动态增益的自适应神经网络跟踪控制方法具体过程为：

步骤一、根据实际非线性控制系统(如机械臂轨迹跟踪控制、航天器姿态跟踪控制、电机伺服控制等)的状态变量x₁和x₂，输出信号y和控制信号u，建立具有未知非线性控制方向函数的不确定非线性严格反馈系统的二维状态空间模型，使系统输出y(t)能够在小误差范围内跟踪给定系统目标信号y_d(t)；

具体实施方式二：本实施方式与具体实施方式一不同的是，所述步骤一中根据实际非线性控制系统(如机械臂轨迹跟踪控制、航天器姿态跟踪控制、电机伺服控制等)的状态变量x₁和x₂，输出信号y和控制信号u，建立具有未知非线性控制方向函数的不确定非线性严格反馈系统的二维状态空间模型，使系统输出y(t)能够在小误差范围内跟踪给定系统目标信号y_d(t)；具体过程为：

建立具有未知非线性控制方向函数的不确定非线性严格反馈系统的二维状态空间模型为：

其中x₁(t)和x₂(t)表示系统(1)的状态变量，f₁(x₁(t)，t)和f₂(x₁(t)，x₂(t)，t)为系统未知非线性函数，ψ₁(x₁(t))和ψ₂(x₁(t)，x₂(t))为系统未知控制方向函数，

为x₁(t)的一阶导数，

为x₂(t)的一阶导数，t为时间，u(t)为反馈控制器，y(t)为系统输出；

不确定指ψ₁(x₁(t))、f₁(x₁(t)，t)、ψ₂(x₁(t)，x₂(t))、f₂(x₁(t)，x₂(t)，t)具有不确定性；非线性指ψ₁(x₁(t))、f₁(x₁(t)，t)、ψ₂(x₁(t)，x₂(t))、f₂(x₁(t)，x₂(t)，t)是非线性的；严格反馈是ψ₁(x₁(t))只和x₁(t)有关不涉及x₂(t)和u(t)，f₁(x₁(t)，t)只和x₁(t)，t有关不涉及x₂(t)和u(t)，ψ₂(x₁(t)，x₂(t))只和x₁(t)，x₂(t)有关不涉及u(t)，f₂(x₁(t)，x₂(t)，t)只和x₁(t)，x₂(t)，t有关不涉及u(t)。

“具有未知控制方向函数”是指ψ₁(x₁(t))、ψ₂(x₁(t)，x₂(t))未知的，这样的系统更难设计。

控制目标是设计一个反馈控制器u(t)，使系统输出y(t)能够在小误差范围内跟踪给定系统目标信号y_d(t)。

其它步骤及参数与具体实施方式一相同。

具体实施方式三：本实施方式与具体实施方式一或二不同的是，所述状态变量x₁和x₂有界时，f₁，f₂，ψ₁，ψ₂是有界的，f₁，f₂，ψ₁，ψ₂各自对时间求的一阶导数是有界的，且ψ₁≠0，ψ₂≠0；

所述f₁，f₂，ψ₁，ψ₂分别代表f₁(x₁(t)，t)、f₂(x₁(t)，x₂(t)，t)、ψ₁(x₁(t))和ψ₂(x₁(t)，x₂(t))。

其它步骤及参数与具体实施方式一或二相同。

具体实施方式四：本实施方式与具体实施方式一至三之一不同的是，所述目标信号y_d是连续有界的，目标信号y_d对时间求的一阶导数是连续有界的，目标信号y_d对时间求的二阶导数是连续有界的，目标信号y_d对时间求的三阶导数是连续有界的。

其它步骤及参数与具体实施方式一至三之一相同。

具体实施方式五：本实施方式与具体实施方式一至四之一不同的是，所述步骤二中定义扩展状态变量x₃＝u，建立具有扩展状态变量的三维非线性系统状态空间模型，定义误差变量z₁，z₂，z₃；具体过程为：

1)定义扩展状态变量x₃(t)＝u(t)，

2)建立具有扩展状态变量的三维非线性系统状态空间模型：

其中

为x₃(t)的一阶导数，

为u(t)的一阶导数；

3)定义误差变量z₁＝x₁-y_d，z₂＝x₂-α₁，z₃＝x₃-α₂；

其中α₁和α₂代表虚拟控制函数。

其它步骤及参数与具体实施方式一至四之一相同。

具体实施方式六：本实施方式与具体实施方式一至五之一不同的是，所述步骤三中利用步骤二中的误差变量z₁，z₂，z₃设计李雅普诺夫函数V；具体过程为：

利用步骤二中的误差变量z₁，z₂，z₃设计李雅普诺夫函数V

其它步骤及参数与具体实施方式一至五之一相同。

具体实施方式七：本实施方式与具体实施方式一至六之一不同的是，所述步骤四中利用步骤三中的李雅普诺夫函数V对时间求一阶导数得到

利用步骤三中的李雅普诺夫函数V对时间求一阶导数

其中

为目标信号yd的一阶导数，

和

分别代表虚拟控制函数α₁和α₂的一阶导数。

其它步骤及参数与具体实施方式一至六之一相同。

具体实施方式八：本实施方式与具体实施方式一至七之一不同的是，所述步骤五中引入等价控制方向函数，定义需要依靠神经网络逼近的未知项F₁和F₂，改写步骤四中李雅普诺夫函数的一阶导数

具体过程为：

1)利用等价控制方向函数改写步骤四中李雅普诺夫函数的一阶导数

其中，b₁和b₂是等价控制方向函数，在本发明中优先b₁和b₂为正常数；

2)定义需要依靠神经网络逼近的未知项

和

即：

其它步骤及参数与具体实施方式一至七之一相同。

具体实施方式九：本实施方式与具体实施方式一至八之一不同的是，所述步骤六中引入动态增益，根据步骤五中李雅普诺夫函数的一阶导数

利用反步法和自适应神经网络，设计神经网络权值更新律、虚拟控制函数α₁和α₂及控制输入u；具体过程为：

1)设计动态增益：

其中，

为动态增益，在本发明中简记为D_i，i＝1，2，3；k_i为控制器参数，i＝1，2，3；I_i为控制器参数，i＝1，2，3；

为控制器参数，i＝1，2，3；

k_i＞I_i/4；

2)利用神经网络

和

分别逼近未知项F₁和F₂，W₁、W₂表示神经网络的权值向量，

表示实数，

表示神经网络的权值向量W₁的元素，

表示表示神经网络的权值向量W₂的元素，T表示转置，

为神经网络权值的更新律，S₁(X₁)、S₂(X₂)表示径向基函数向量，

表示向量S₁(X₁)的元素，

表示向量S₂(X₂)的元素，N₁和N₂表示神经网络的节点数，X₁、X₂为神经网络的输入，

为目标信号y_d的二阶导数，径向基函数定义为：

其中，C_j和η_j分别是径向基函数的中心向量和宽度，在本发明中，C_i和η_i为给定的固定值；

3)设计神经网络权值更新律：

所述S₁、S₂分别为S₁(X₁)和S₂(X₂)；

其中，μ₁，μ₂∈(0，1)是学习律，

和

分别是指令滤波器的输出：

其中，

和

分别为指令滤波器的状态变量，ρ₁，ρ₂＞0是设计的滤波器参数；

公式(14)是一个指令滤波器，输入是已知的z₁，状态变量是

输出是

公式(15)是一个指令滤波器，输入是已知的z₂，状态变量是

输出是

式(14)中给定

初值，计算

对

积分得到

再将

带入式(14)，得到新的

式(15)同理；

4)根据步骤五中李雅普诺夫函数的一阶导数

利用反步法和自适应神经网络，设计虚拟控制函数α₁和α₂：

其中，

为期望的虚拟控制函数，ρα＞0为设计的滤波器参数；

式(17)中给定α₂初值，计算

对

积分得到α₂，再将α₂带入式(17)，得到新的

5)设计控制信号u：

其中，τ为积分变量。

式(18)为基于动态增益的自适应神经网络跟踪控制器。

其它步骤及参数与具体实施方式一至八之一相同。

具体实施方式十：本实施方式与具体实施方式一至九之一不同的是，所述期望的虚拟控制函数

其它步骤及参数与具体实施方式一至九之一相同。

下面将证明基于动态增益的自适应神经网络跟踪控制器(18)能使系统跟踪误差收敛到原点附近较小的邻域内。证明过程如下：

由指令滤波器技术，可得

其中，σ₁和σ₂为指令滤波器的估计误差，

和

为指令滤波器估计误差的上界，ξ_α为α₂对

的跟踪误差，

为跟踪误差的上界。

由神经网络权值更新律，可得

其中δ₁和δ₂分别是神经网络的逼近误差，

和

分别是神经网络逼近误差的上界。

将式(22)带入式(16)、将式(23)带入式(21)，可得

将式(18)(24)(25)带入李雅普诺夫函数的一阶导数(5)，有

其中，

由式(26)可得

令b/a＜r＜V(0)≤M，可得

而且

式(29)表明当时间趋于无穷，系统跟踪误差收敛到原点附近较小的邻域内，证毕。

采用以下实施例验证本发明的有益效果：

实施例一：

对于系统(公式1)，未知控制方向函数

ψ₂(x₁(t)，x₂(t))＝2+cos(x₁)，未知非线性函数f₁(x₁(t)，t)＝0.5x₁，f₂(x₁(t)，x₂(t)，t)＝x₁x₂，取初值为x₁(0)＝0.2，x₂(0)＝-0.1，系统目标信号y_d(t)＝sin(t)。神经网络参数μ₁＝0.4，μ₂＝0.2，N₁＝20，N₂＝80，

η_1j＝2，j＝1，2，…，N₁，

j＝1，2，…，N₂。控制器参数b₁＝1，b₂＝2，ρ₁＝40，ρ₂＝40，ρ_α＝100，

α₂(0)＝0，k₁＝10，k₂＝30，k₃＝20，I₁＝10，I₂＝30，I₃＝20，

图1为本发明系统输出曲线图；图2为本发明系统跟踪误差曲线图；图3为本发明神经网络逼近F₁曲线图；图4为本发明下神经网络逼近F₂曲线图；图5为本发明下动态增益曲线图；图6为本发明下控制信号u曲线图。

结论：由图1可知基于动态增益的自适应神经网络跟踪控制方法设计的控制信号u能使系统的跟踪误差收敛到原点附近的小领域内。

本发明还可有其它多种实施例，在不背离本发明精神及其实质的情况下，本领域技术人员当可根据本发明作出各种相应的改变和变形，但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。

Claims

1.一种基于动态增益的自适应神经网络跟踪控制方法，其特征在于：所述方法具体过程为：

2.根据权利要求1所述一种基于动态增益的自适应神经网络跟踪控制方法，其特征在于：所述步骤一中根据系统的状态变量x₁和x₂，输出信号y和控制信号u，建立具有未知非线性控制方向函数的不确定非线性严格反馈系统的二维状态空间模型，使系统输出y(t)跟踪目标信号y_d(t)；具体过程为：

其中x₁(t)和x₂(t)表示系统的状态变量，f₁(x₁(t),t)和f₂(x₁(t),x₂(t),t)为系统未知非线性函数，ψ₁(x₁(t))和ψ₂(x₁(t),x₂(t))为系统未知控制方向函数，

为x₁(t)的一阶导数，

为x₂(t)的一阶导数，t为时间，u(t)为反馈控制器，y(t)为系统输出。

3.根据权利要求2所述一种基于动态增益的自适应神经网络跟踪控制方法，其特征在于：所述状态变量x₁和x₂有界时，f₁,f₂,ψ₁,ψ₂是有界的，f₁,f₂,ψ₁,ψ₂各自对时间求的一阶导数是有界的，且ψ₁≠0,ψ₂≠0。

4.根据权利要求3所述一种基于动态增益的自适应神经网络跟踪控制方法，其特征在于：所述目标信号y_d是连续有界的，目标信号y_d对时间求的一阶导数是连续有界的，目标信号y_d对时间求的二阶导数是连续有界的，目标信号y_d对时间求的三阶导数是连续有界的。

5.根据权利要求4所述一种基于动态增益的自适应神经网络跟踪控制方法，其特征在于：所述步骤二中定义扩展状态变量x₃＝u，建立具有扩展状态变量的三维非线性系统状态空间模型，定义误差变量z₁，z₂，z₃；具体过程为：

1)定义扩展状态变量x₃(t)＝u(t),

2)建立具有扩展状态变量的三维非线性系统状态空间模型：

其中

为x₃(t)的一阶导数，

为u(t)的一阶导数；

3)定义误差变量z₁＝x₁-y_d，z₂＝x₂-α₁，z₃＝x₃-α₂；

其中α₁和α₂代表虚拟控制函数。

6.根据权利要求5所述一种基于动态增益的自适应神经网络跟踪控制方法，其特征在于：所述步骤三中利用步骤二中的误差变量z₁，z₂，z₃设计李雅普诺夫函数V；具体过程为：

利用步骤二中的误差变量z₁，z₂，z₃设计李雅普诺夫函数V

7.根据权利要求6所述一种基于动态增益的自适应神经网络跟踪控制方法，其特征在于：所述步骤四中利用步骤三中的李雅普诺夫函数V对时间求一阶导数得到

利用步骤三中的李雅普诺夫函数V对时间求一阶导数

其中

为目标信号y_d的一阶导数，

和

分别代表虚拟控制函数α₁和α₂的一阶导数。

8.根据权利要求7所述一种基于动态增益的自适应神经网络跟踪控制方法，其特征在于：所述步骤五中引入等价控制方向函数，定义需要依靠神经网络逼近的未知项F₁和F₂，改写步骤四中李雅普诺夫函数的一阶导数

具体过程为：

其中，b₁和b₂是等价控制方向函数；

2)定义需要依靠神经网络逼近的未知项

和

即：

9.根据权利要求8所述一种基于动态增益的自适应神经网络跟踪控制方法，其特征在于：所述步骤六中引入动态增益，根据步骤五中李雅普诺夫函数的一阶导数

1)设计动态增益:

其中，

为动态增益，i＝1,2,3；k_i为控制器参数，i＝1,2,3；l_i为控制器参数，i＝1,2,3；

为控制器参数，i＝1,2,3；

k_i>I_i/4；

2)利用神经网络

和

表示实数，

表示神经网络的权值向量W₁的元素，

表示表示神经网络的权值向量W₂的元素，T表示转置，

为神经网络权值的更新律，S₁(X₁)、S₂(X₂)表示径向基函数向量,

表示向量S₁(X₁)的元素，

为目标信号y_d的二阶导数，径向基函数定义为：

其中，C_j和η_j分别是径向基函数的中心向量和宽度；

3)设计神经网络权值更新律：

其中，μ₁,μ₂∈(0,1)是学习律，

和

分别是指令滤波器的输出：

其中，

和

分别为指令滤波器的状态变量，ρ₁,ρ₂>0是滤波器参数；

4)根据步骤五中李雅普诺夫函数的一阶导数

其中，

为期望的虚拟控制函数，ρ_α>0为滤波器参数；

5)设计控制信号u:

其中，τ为积分变量。

式(18)为基于动态增益的自适应神经网络跟踪控制器。

10.根据权利要求9所述一种基于动态增益的自适应神经网络跟踪控制方法，其特征在于：所述期望的虚拟控制函数