CN108196446B

CN108196446B - 模型未知的双电机负载的动态规划最优控制方法

Info

Publication number: CN108196446B
Application number: CN201711337500.4A
Authority: CN
Inventors: 任雪梅; 吕永峰; 李林伟; 王敏林
Original assignee: Beijing Institute of Technology BIT
Current assignee: Beijing Institute of Technology BIT
Priority date: 2017-12-14
Filing date: 2017-12-14
Publication date: 2020-04-17
Anticipated expiration: 2037-12-14
Also published as: CN108196446A

Abstract

本发明公开了模型未知的双电机负载的动态规划最优控制方法，能够应用神经网络逼近方法和自适应算法，计算得到对模型未知双电机伺服系统的最优控制。该方法包括如下步骤：建立针对双电机负载系统的神经网络模型，估计所述双电机负载系统的神经网络模型的权重参数。建立针对性能指标函数的神经网络模型，结合哈密尔顿‑雅克比‑贝尔曼HJB方程，估计所述性能指标函数的神经网络模型的权重参数。结合所述双电机负载系统的神经网络模型以及所述性能指标函数的神经网络模型采用HJB方程求解最优控制，获得每个电机的最优输入力矩。根据所述最优输入力矩对相应电机的参数进行调节。

Description

模型未知的双电机负载的动态规划最优控制方法

技术领域

本发明涉及自动控制技术领域。

背景技术

针对多电机伺服系统的控制方式，最优控制理论应用不甚成熟。对于线性系统，可以用黎卡提方程离线求解其最优控制。对于非线性系统求解最优控制，要建立系统的哈密尔顿函数。然而非线性系统的哈密尔顿-雅克比-贝尔曼(HJB,Hamilton-Jacobi-Bellman)方程因为“维数灾难”问题，求解比较困难，对非线性系统最优控制的求解造成巨大困难。因此目前通常用深度学习方法来求解HJB方程，形成基于自适应动态规划(ADP，AdaptiveDynamic Programming)方法的最优控制求解方法。

尤其近几年，针对自适应动态规划方法的研究取得巨大进步，但是应用该理论解决实际系统模型的研究成果仍然不多。

发明内容

有鉴于此，本发明提供了模型未知的双电机负载的动态规划最优控制方法，能够应用神经网络逼近方法和自适应算法，计算得到对模型未知双电机伺服系统的最优控制。

模型未知的双电机负载的动态规划最优控制方法，该方法包括如下步骤：

建立针对双电机负载系统的神经网络模型，估计所述双电机负载系统的神经网络模型的权重参数。

建立针对性能指标函数的神经网络模型，结合哈密尔顿-雅克比-贝尔曼HJB方程，估计所述性能指标函数的神经网络模型的权重参数。

结合所述双电机负载系统的神经网络模型以及所述性能指标函数的神经网络模型采用HJB方程求解最优控制，获得每个电机的最优输入力矩。

根据所述最优输入力矩对相应电机的参数进行调节。

进一步地，双电机负载系统包括第1电机和第2电机，共2个电机。

所述方法还包括：

针对所述双电机负载系统，建立数学模型，为：

其中x₁表示负载的转角，x₂表示负载的转速，

分别为x₁,x₂的导数，T_i为负载控制输入，r为负载的摩擦系数，J是负载的转动惯量，g_i为第i电机的动态参数。

所述双电机负载系统的动态函数为：

所述双电机负载系统为：

其中x为所述双电机负载系统状态x＝[x₁,x₂]^T。

进一步地，估计所述双电机负载系统的神经网络模型的权重参数，具体为：

采用基于参数误差信息的自适应算法估计所述双电机负载系统的神经网络模型的权重参数。

进一步地，建立所述双电机负载系统的神经网络模型，估计所述双电机负载系统的神经网络模型的权重参数，具体为：

S101、所述双电机负载系统包括第1电机和第2电机，共2个电机。

建立针对所述双电机负载系统的神经网络模型：

其中x为所述双电机负载系统状态；

为x的导数。

W₁为所述双电机负载系统的神经网络模型的权重参数，W₁采用如下步骤S102～S105获取的估计值

代替；其中

即W₁为n行b列的矩阵，b为预设的神经网络节点数，n双电机负载系统的阶数；W_f为系统动态的神经网络权重矩阵，W_g1,W_g2均为系统电机输入动态神经网络的权重矩阵。

为所述双电机负载系统的神经网络激励函数，由系统状态x和第1电机和第2电机的输入力矩u₁和u₂决定。

S102、建立所述双电机负载系统状态x和激励函数φ₁；其中x的滤波变量为x_f，φ₁的滤波变量为φ_1f。

为φ_1f的导数，

为x_f的导数；k为预设的滤波参数。

S103、建立第一辅助矩阵P₁和第二辅助矩阵Q₁：

为设定的辅助参数经验值。

S104、建立第三辅助矩阵M₁为：

S105、建立权重参数W₁估计的自适应律为

Γ₁为设置的自适应参数经验值；当所述φ₁为持续激励时，应用所述W₁估计的自适应律估计获得

和

为预设的系统动态和输入动态的神经网络激励函数。

进一步地，建立所述性能指标函数的神经网络模型，结合哈密尔顿-雅克比-贝尔曼HJB方程，估计所述性能指标函数的神经网络模型的权重参数，具体包括：

S201、建立性能指标函数：

其中，

为第i电机对应的性能指标；

为代价函数；

O_i为与所述双电机负载系统状态x维数匹配的对称正定矩阵；

R_ij为与第j电机的输入力矩u_j维数匹配的对称正定矩阵；

S202、建立针对所述性能指标函数

的神经网络模型为：

其中V_i(x)为

的神经网络输出函数；

为

的神经网络模型的激励函数，由系统状态x决定；W_ci为权重参数，采用如下步骤S205～S207获取的估计值

代替。

S203、构建哈密尔顿-雅克比-贝尔曼HJB方程

其中

为代价函数；

为

的梯度。

为神经网络逼近误差。

S204、根据

解得第i电机的最优输入力矩为：

为根据估计值

得到的W_gi的估计值。

S205、建立第四辅助矩阵P₂和第五辅助矩阵Q₂。

每个电机对应一个性能指标；则对应第i个性能指标的第四辅助矩阵P_2i为

P_2i(0)＝0；对应第i个性能指标的第五辅助矩阵Q_2i为

Q_2i(0)＝0。

其中Θ_i＝r_i(x,u₁,u₂)和

S206、建立第六辅助矩阵M₂，对应第i个性能指标的第六辅助矩阵M₂为

建立参数W_ci估计的自适应律为

Γ_2i为设置的自适应参数经验值。

当所述

为持续激励时，应用所述W_ci估计的自适应律估计获得

有益效果：

本发明首先应用神经网络精确逼近；利用辨识神经网络逼近双电机负载未知系统模型；利用评价神经网络近似性能指标函数；基于参数误差信息设计自适应律，用来估计神经网络权重参数；为使性能指标最小，构建哈密尔顿函数求解近似最优控制，解得伺服系统近似最优控制输入，使电机转角和转速快速镇定到给定信号的同时，能耗最小。本发明求解双电机负载系统各电机的最优输出，使负载按既定的轨迹运行，同时使各电机状态最优。

附图说明

图1为本发明实施例所针对的多电机负载系统结构图；

图2为本发明实施例所提供的模型未知的双电机负载的动态规划最优控制方法流程示意图；

图3为本发明一个实施例中负载模型未知动态参数；

图4为本发明一个实施例中电机一最优指标估计参数；

图5为本发明一个实施例中电机二最优指标估计参数；

图6为本发明一个实施例中负载速度轨迹；

图7为本发明一个实施例中电机一控制输入；

图8为本发明一个实施例中电机二控制输入。

具体实施方式

下面结合附图并举实施例，对本发明进行详细描述。

请参考图1和图2，图1示出了本发明实施例所针对的双电机负载系统结构框图。图2示出了本发明实施例所提供的模型未知的双电机负载的动态规划最优控制方法，包括如下步骤：

S1、建立针对双电机负载系统的神经网络模型，估计所述双电机负载系统的神经网络模型的权重参数。

S2、建立针对性能指标函数的神经网络模型，结合哈密尔顿-雅克比-贝尔曼HJB方程，估计所述性能指标函数的神经网络模型的权重参数；

S3、结合所述双电机负载系统的神经网络模型以及所述性能指标函数的神经网络模型采用HJB方程求解最优控制，获得每个电机的最优输入力矩；

S4、根据所述最优输入力矩对相应电机的参数进行调节。

本发明首先应用神经网络精确逼近；利用神经网络逼近双电机负载未知系统模型；利用评价神经网络近似性能指标函数；基于参数误差信息设计自适应律，用来估计神经网络权重参数；为使性能指标最小，构建哈密尔顿函数求解近似最优控制，解得伺服系统近似最优控制输入，使电机转角和转速快速镇定到给定信号的同时，能耗最小。

本发明实施例中，双电机负载系统包括第1电机和第2电机，共2个电机。在步骤S1之间，还需建立双电机负载系统的系统状态表达式。

因此本步骤S1之前还包括：

针对所述双电机负载系统，建立数学模型，为：

其中x₁表示负载的转角，x₂表示负载的转速，

所述双电机负载系统的动态函数为：

所述双电机负载系统为：

其中x为所述双电机负载系统状态x＝[x₁,x₂]^T。

本发明实施例中，在步骤S1中，估计所述双电机负载系统的神经网络模型的权重参数，具体为：

在本发明实施例中，S1具体包括如下步骤：

建立针对双电机负载系统的神经网络模型，估计所述双电机负载系统的神经网络模型的权重参数，具体为：

S101、所述双电机负载系统包括第1电机和第2电机，共2个电机；

建立针对所述双电机负载系统的神经网络模型：

其中x为所述双电机负载系统状态；

为x的导数；

代替；其中

即W₁为n行b列的矩阵，b为预设的神经网络节点数，n双电机负载系统的阶数；W_f为系统动态的神经网络权重矩阵，W_g1,W_g2均为系统电机输入动态神经网络的权重矩阵；

为所述双电机负载系统的激励，由系统状态x和第1电机和第2电机的输入力矩u₁和u₂决定；

S102、建立所述双电机负载系统状态x和激励φ₁；其中x的滤波变量为x_f，φ₁的滤波变量为φ_1f；

为φ_1f的导数，

为x_f的导数；k为预设的滤波参数；

S103、建立第一辅助矩阵P₁和第二辅助矩阵Q₁：

为设定的辅助参数经验值；

S104、建立第三辅助矩阵M₁为：

S105、建立参数W₁估计的自适应律为

和

为预设的系统动态和输入动态的神经网络激励函数，。

在本发明实施例中，S2具体包括如下步骤：

S201、建立性能指标函数：

其中，

为第i电机对应的性能指标；

为代价函数

O_i为与所述双电机负载系统状态x维数匹配的对称正定矩阵；

R_ij为与第j电机的输入力矩u_j维数匹配的对称正定矩阵；

S202、建立针对所述性能指标函数

的神经网络模型为：

其中V_i(x)为

的神经网络输出函数；

为

代替；

S203、构建哈密尔顿-雅克比-贝尔曼HJB方程

其中

为代价函数；

为

的梯度，

为神经网络逼近误差；

S204、根据

解得第i电机的最优输入力矩为：

为根据估计值

得到的W_gi的估计值；

S205、建立第四辅助矩阵P₂和第五辅助矩阵Q₂；

P_2i(0)＝0；对应第i个性能指标的第五辅助矩阵Q_2i为

Q_2i(0)＝0；

其中Θ_i＝r_i(x,u₁,u₂)和

建立参数W_ci估计的自适应律为

i＝1,2；Γ₂为设置的自适应参数经验值；

当所述

为持续激励时，应用所述W_ci估计的自适应律估计获得

本发明实施例对上述处理结果进行仿真。假设双电机负载系统动力学模型为：

在仿真分析中，假设系统模型未知。首先应用神经网络逼近未知双电机负载模型，然后用S105中构建的自适应律估计未知系统特性参数

神经网络输入向量设置为φ₁＝[x₁,x₂,u₁,u₂]^T，系统状态初值设置为x₁(0)＝1,x₂(0)＝-1。其它参数适当调整，可估计得近似神经网络权重

如图3所示，各被估参数都收敛到其真值。用评价神经网络逼近性能指标函数，评价神经网络近似权重参数收敛效果如图4所示和图5所示，两个电机的性能指标权重参数都快速收敛到最优值。图6为负载转角速度效果图。图7和图8分别为所求两个电机的最优输出，可以使系统稳定运行。

本发明针对模型未知双电机负载系统，根据发明中提出的基于辨识-评价神经网络结构的ADP方法，应用一种基于参数误差信息的自适应估计算法，能够对未知双电机模型实现精确辨识，对最优性能指标精确逼近，进而求得电机的最优控制输出。这种ADP方法可以加快被估参数收敛速度和最优控制求解速度，通过仿真可以看出，本发明具有良好的控制性能和一定的实用价值。

综上所述，以上仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。