CN116149262B

CN116149262B - 一种伺服系统的跟踪控制方法及系统

Info

Publication number: CN116149262B
Application number: CN202310436394.4A
Authority: CN
Inventors: 赵军; 赵子亮; 朱庆林; 郭斌
Original assignee: Shandong University of Science and Technology
Current assignee: Shandong University of Science and Technology
Priority date: 2023-04-23
Filing date: 2023-04-23
Publication date: 2023-07-04
Anticipated expiration: 2043-04-23
Also published as: CN116149262A

Abstract

本说明书实施例公开了一种伺服系统的跟踪控制方法及系统，涉及自动化控制技术领域，用于解决当前伺服系统的跟踪控制对于系统动态信息要求过高的问题，方法包括：建立伺服系统的数学模型；对伺服系统的输入力矩和输出轨迹进行采集，基于理想输出轨迹与伺服系统实际输出轨迹确定伺服系统的跟踪误差及跟踪目标函数；采用预置单层评价神经网络重构获得最优贝尔曼方程；根据最优贝尔曼方程确定神经网络权值；根据预置权值的估计误差设计自适应律实现神经网络权值在线更新，最终得到伺服系统的最优跟踪控制。

Description

一种伺服系统的跟踪控制方法及系统

技术领域

本说明书涉及自动化控制技术领域，尤其涉及一种伺服系统的跟踪控制方法及系统。

背景技术

伺服系统又称随动系统，是用来精确地跟随或复现某个过程的反馈控制系统。伺服系统使物体的位置、方位、状态等输出被控量能够跟随输入目标的任意变化的自动控制系统。它的主要任务是按控制命令的要求、对功率进行放大、变换与调控等处理，使驱动装置输出的力矩、速度和位置控制非常灵活方便。在很多情况下，伺服系统专指被控制量是机械位移或位移速度、加速度的反馈控制系统，其作用是使输出的机械位移准确地跟踪输入的位移，基于上述伺服系统功能可知，伺服系统的跟踪控制非常重要。

现有技术中伺服系统的控制器例如：PID控制、自适应控制滑模控制等，均可以使得伺服系统跟踪已经给定的轨迹，实现伺服系统的跟踪控制。但是现有技术中的跟踪控制方法没有考虑到跟踪过程中例如最小能耗、跟踪误差等最优特性，使得跟踪控制无法实现最优轨迹的跟踪，且现有的伺服系统跟踪控制算法中多需要完整的系统动态信息，导致对于伺服系统的要求较高。此外，现有的跟踪控制方法需要通过采用自适应技术来解决评价和执行策略的持续更新，在此过程需要持续激励条件来保证设计算法的收敛。而现有的自适应神经网络或模糊逻辑控制方案可以解决伺服系统非线性的影响，但会产生的近似误差和增加硬件计算量，并且只能表现出半全局稳定性。

因此现需要一种能够实现最优跟踪控制策略的伺服系统的跟踪控制方法。

发明内容

为了解决上述技术问题，本说明书一个或多个实施例提供了一种伺服系统的跟踪控制方法及系统。

本说明书一个或多个实施例采用下述技术方案：

本说明书一个或多个实施例提供一种伺服系统的跟踪控制方法，方法包括：

建立伺服系统的数学模型；

对所述伺服系统的输入力矩和输出轨迹进行采集，基于所述输出轨迹与所述理想输出轨迹确定所述伺服系统的跟踪误差；

根据所述跟踪误差与所述伺服系统的瞬态控制建立所述伺服系统的跟踪目标函数，并基于预置单层评价神经网络重构所述跟踪目标函数，以生成与所述跟踪目标函数相对应的最优贝尔曼方程；

根据所述最优贝尔曼方程，确定单层评价神经网络模型权值以及所述伺服系统的最优瞬态控制；

根据预置所述权值的估计误差设计所述单层评价神经网络的自适应律以实现所述单层评价神经网络权值的在线更新，并根据更新后的单层评价神经网络权值更新所述最优瞬态控制，得到所述伺服系统的最优跟踪控制。

可选地，在本说明书一个或多个实施例中，所述建立伺服系统的数学模型，具体包括：

定义所述伺服系统的状态变量为：

；

其中，

为所述伺服系统的转角，/>

为所述伺服系统的角速度；

根据所述伺服系统的状态变量确定所述伺服系统的状态空间方程，以将所述状态空间方程作为所述伺服系统的数学模型；其中，所述状态空间方程为：

；

其中，

为所述伺服系统的转动惯量，/>

为所述伺服系统的系统控制，

为伺服系统的自定义系数，/>

表示伺服系统状态变量的自定义调整系数，/>

表示伺服系统外部干扰，/>

为所述伺服系统的力矩常数，/>

为所述伺服系统的定子电阻，/>

，/>

为极点数，/>

转子磁链值。

可选地，在本说明书一个或多个实施例中，所述建立伺服系统的数学模型之后，所述方法还包括：

根据所述伺服系统的动态相关函数对所述状态空间方程进行处理，以获得与所述状态空间方程相对应的简化状态空间方程；

其中，所述根据所述伺服系统的动态相关函数对所述状态空间方程进行处理，以获得与所述状态空间方程相对应的简化状态空间方程，具体包括：

根据所述状态空间方程确定所述伺服系统的非线性动态；

基于所述伺服系统的非线性动态对所述状态空间方程进行简化处理，以获得与所述状态空间方程相对应的简化状态空间方程；其中，所述简化状态空间方程为：

；其中，/>

与/>

表示系统非线性动态。

可选地，在本说明书一个或多个实施例中，基于所述输出轨迹与所述理想输出轨迹确定所述伺服系统的跟踪误差，具体包括：

基于所述理想输出轨迹与所述实际输出轨迹的差值，确定所述伺服系统的跟踪误差；其中，所述跟踪误差为：

；其中，/>

为所述跟踪误差，/>

为所述理想输出轨迹，/>

为所述实际输出轨迹；

其中，确定所述伺服系统的跟踪误差之后，所述方法还包括：

将所述伺服系统的系统控制分解为稳态控制与瞬态控制，其中，所述稳态控制为：

；

表示反馈控制增益，/>

为/>

的伪逆；

根据所述伺服系统的系统控制与所述跟踪误差，建立所述伺服系统的误差动态为：

，/>

为所述伺服系统的瞬态控制。

可选地，在本说明书一个或多个实施例中，根据所述跟踪误差与所述伺服系统的瞬态控制建立伺服系统的跟踪目标函数，具体包括：

建立所述伺服系统的性能指标函数；其中，所述性能指标函数为：

，其中，/>

表示所述伺服系统的效用函数，R为性能指标函数的权值矩阵；

对所述性能指标函数求极小值以获得所述伺服系统的最优性能指标函数并将其作为所述伺服系统的跟踪目标函数；其中，所述最优性能指标函数为：

；

其中，根据所述跟踪误差与所述伺服系统的瞬态控制建立伺服系统的跟踪目标函数之后，所述方法还包括：

基于所述跟踪目标函数与预设最优准则确定所述伺服系统的最优瞬态控制公式为：

。

可选地，在本说明书一个或多个实施例中，基于预置单层评价神经网络重构所述跟踪目标函数，以生成与所述跟踪目标函数相对应的最优贝尔曼方程，具体包括：

根据预置激励函数、所述预置单层评价神经网络的权值与所述神经网络估计误差，重构所述跟踪目标函数生成单层评价神经网络；其中，所述单层评价神经网络为：

；/>

为激励函数，/>

为神经网络权值，/>

为神经网络估计误差；

定义所述伺服系统所对应的贝尔曼方程；其中，所述贝尔曼方程为：

；其中，/>

表示效用函数；

将所述单层评价神经网络重构所述贝尔曼方程，以获得所述跟踪目标函数相对应的最优贝尔曼方程；其中，所述最优贝尔曼方程为：

，/>

是积分强化学习项，/>

，误差/>

。

可选地，在本说明书一个或多个实施例中，根据所述最优贝尔曼方程，确定单层评价神经网络模型权值以及所述伺服系统的最优瞬态控制，具体包括：

根据所述最优贝尔曼方程与所述单层评价神经网络的对应关系，确定所述单层评价神经网络模型权值；

根据所述最优贝尔曼方程对所述性能指标函数进行更新优化，以获得更新后的最优性能指标函数，从而将所述更新后的最优性能指标函数代入所述跟踪目标函数，以获得所述伺服系统的最优瞬态控制。

可选地，在本说明书一个或多个实施例中，根据预置所述权值的估计误差确定所述单层评价神经网络的自适应律，具体包括：

构造辅助变量；其中，所述辅助变量包括：第一辅助变量与第二辅助变量；

基于所述辅助变量的预设参数获得所述辅助变量的解；

根据单层神经网络获得所述权值的估计，并根据所述第一辅助变量的解与所述第二辅助变量的解构造第三辅助变量；其中，所述第三辅助变量为：

，/>

为第一辅助变量的解，/>

为第二辅助变量的解，/>

为所述权值的估计；

根据单层神经网络获得所述权值的估计，以基于所述权值的估计、所述第一辅助变量与第二辅助变量获得所述权值的估计误差，以将所述权值的估计误差作为所述单层评价神经网络的自适应律；其中，所述自适应律为：

，/>

为自适应律，/>

为学习增益。

可选地，在本说明书一个或多个实施例中，根据单层神经网络获得所述权值的估计，并根据所述第一辅助变量的解与所述第二辅助变量的解构造第三辅助变量之后，所述方法还包括：

计算所述第三辅助变量的最小特征值；其中，所述第三辅助变量为变量矩阵；

若确定所述最小特征值小于预设特征值，则在所述伺服系统的输入力矩中加入干扰，以更新所述跟踪目标函数；其中，所述预设特征值为零；

若确定所述最小特征值大于预设特征值，则基于所述第三辅助变量构建所述自适应律。

本说明书一个或多个实施例提供一种伺服系统的跟踪控制系统，系统包括：

建立单元，用于建立伺服系统的数学模型；

数据采集单元，用于对所述伺服系统的输入力矩和实际输出轨迹进行采集，基于所述实际输出轨迹与理想输出轨迹确定所述伺服系统的跟踪误差；其中，所述理想输出轨迹基于所述伺服系统的数学模型获得；

方程建立单元，用于根据所述跟踪误差与所述伺服系统的瞬态控制建立所述伺服系统的跟踪目标函数，并基于预置单层评价神经网络重构所述跟踪目标函数，以生成与所述跟踪目标函数相对应的最优贝尔曼方程；

确定单元，用于根据所述最优贝尔曼方程，确定单层评价神经网络模型权值以及所述伺服系统的最优瞬态控制；

更新单元，用于根据预置所述权值的估计误差设计所述单层评价神经网络的自适应律以实现所述单层评价神经网络权值的在线更新，并根据更新后的单层评价神经网络权值更新所述最优瞬态控制，得到所述伺服系统的最优跟踪控制。

本说明书实施例采用的上述至少一个技术方案能够达到以下有益效果：

通过伺服系统原始控制系统的模型与跟踪误差，建立伺服系统的跟踪误差动态，使得跟踪误差与后续的跟踪控制不在基于完整的系统动态信息进行获取，解决了现有的伺服系统跟踪控制算法中多需要完整的系统动态信息，导致对于伺服系统的要求较高的问题。通过单层评价神经网络重构目标函数后构造贝尔曼方程，使得基于单层评价神经网络近似逼近贝尔曼方程，使得跟踪轨迹控制融合了最优特性。此外，在最优控制算法设计过程中避免了执行神经网络的使用，有效提高了参数辨识速率。根据自适应滑模技术设计了新的自适应律，从而使自适应评价神经网络和控制律在没有任何迭代步骤的情况下连续且同时地相互更新，在保证控制精度的情况下提高了计算速率，实现伺服系统最优跟踪控制。

附图说明

为了更清楚地说明本说明书实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本说明书中记载的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。在附图中：

图1为本说明书实施例提供的一种伺服系统的跟踪控制方法流程示意图；

图2为本说明书实施例提供的一种伺服系统的跟踪控制逻辑示意图；

图3为本说明书实施例提供的一种神经网络权值对比示意图；

图4为本说明书实施例提供的一种跟踪性能的对比示意图；

图5为本说明书实施例提供的一种跟踪误差的对比示意图；

图6为本说明书实施例提供的一种伺服系统的跟踪控制系统的内部结构示意图。

具体实施方式

本说明书实施例提供一种伺服系统的跟踪控制方法及系统。

为了使本技术领域的人员更好地理解本说明书中的技术方案，下面将结合本说明书实施例中的附图，对本说明书实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本说明书一部分实施例，而不是全部的实施例。基于本说明书实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都应当属于本说明书保护的范围。

如图1所示，本说明书实施例提供了一种伺服系统的跟踪控制方法的流程示意图。由图1可知，一种伺服系统的跟踪控制方法，方法包括以下步骤：

S101：建立伺服系统的数学模型。

伺服系统又称随动系统，是用来精确地跟随或复现某个过程的反馈控制系统。伺服系统使物体的位置、方位、状态等输出被控量能够跟随输入目标的任意变化的自动控制系统。伺服系统的跟踪控制非常重要，因为它是评价伺服控制器的重要指标。跟踪控制的主要目的是给定跟踪控制动作，使系统状态跟踪期望的轨迹。本说明书实施例中为了实现伺服系统能够在最优特性下实现跟踪控制，首先建立出伺服系统的数学模型。具体地，在本说明书一个或多个实施例中，建立伺服系统的数学模型，具体包括以下过程：

本说明书实施例中以一台3自由度机器人作为一个简单的伺服系统，通过使用传感器和上位机采集伺服系统的转矩和转角。然后为了建立出伺服系统的数学模型，首先定义该伺服系统的状态变量为：

；其中需要说明的是：/>

为该伺服系统的转角，/>

为该伺服系统的角速度。然后根据伺服系统状态变量建立该伺服系统的状态空间方程，并将获取的状态空间方程作为伺服系统的数学模型；其中，需要说明的是状态空间方程也就是伺服系统的数学模型为：

(1)

其中，需要说明的是：

为数学计算中/>

形式的简写，/>

为数学计算中

形式的简写，本说明书实施例中对于在后续同类型计算表达形式不再加以阐述。/>

为伺服系统的转动惯量，u为伺服系统的系统控制，/>

为伺服系统的自定义系数，/>

表示伺服系统状态变量的自定义调整系数，/>

表示伺服系统外部干扰，/>

为伺服系统的力矩常数，/>

为伺服系统的定子电阻，/>

，/>

为极点数，

转子磁链值。

进一步地，在本说明书一个或多个实施例中，建立伺服系统的数学模型之后，为了明确该伺服系统的系统动态，方法还包括以下步骤：

首先，根据伺服系统的动态相关函数对状态空间方程进行处理，以获得与状态空间方程相对应的简化状态空间方程。其中，根据伺服系统的动态相关函数对所述状态空间方程进行处理，以获得与状态空间方程相对应的简化状态空间方程，包括以下过程：

根据状态空间方程确定出伺服系统的非线性动态，然后再根据伺服系统的非线性动态对状态空间方程进行简化处理，从而获得和状态空间方程相对应的简化状态空间方程；其中，需要说明的是简化状态空间方程为：

(2)

其中，

与/>

表示系统非线性动态。

S102：对所述伺服系统的输入力矩和实际输出轨迹进行采集，基于所述实际输出轨迹与理想输出轨迹确定所述伺服系统的跟踪误差；其中，所述理想输出轨迹基于所述伺服系统的数学模型获得。

为了便于对原系统控制进行拆分后针对于瞬态控制进行跟踪控制的优化，从而减少对于系统动态完整性的要求，本说明书实施例中首先需要基于跟踪误差对原系统进行拆分，即可以通过伺服系统中的数据采集模块对伺服系统的输入力矩和实际输出轨迹进行实时数据采集，以便于基于上述步骤S101中构建的数学模型计算输入力矩所对应的伺服系统的理想输出轨迹，根据实时采集获得的输出轨迹也就是实际输出轨迹与计算获得的理想输出估计，对比获得伺服系统的跟踪误差。

具体地，在本说明书一个或多个实施例中，根据上述实际输出轨迹与理想输出轨迹确定出伺服系统的跟踪误差，具体包括以下步骤：

首先，根据理想输出轨迹与实际输出轨迹的差值，确定出伺服系统的跟踪误差为：

(3)

其中，需要说明的是：

为跟踪误差，/>

为所述理想输出轨迹，/>

为连续可导的跟踪信号即实时采集获得的伺服系统实际输出轨迹。

因此，将伺服系统的系统控制分解为稳态控制与瞬态控制：

(4)

其中，

为稳态控制，/>

为瞬态控制，进而设计获取稳态控制为：

(5)

其中，

表示反馈增益，/>

为/>

的伪逆；然后根据上述步骤中获得的所述伺服系统的系统控制模型与跟踪误差，建立伺服系统的误差动态，即将上述公式(4)代入到公式(3)中，获得跟踪误差动态为：

(6)

为伺服系统的瞬态控制，基于该过程可见跟踪误差动态不再基于完整的系统动态进行获取，从而解决了现有的伺服系统跟踪控制算法中多需要完整的系统动态信息，导致对于伺服系统的要求较高的问题。

S103：根据所述跟踪误差与所述伺服系统的瞬态控制建立所述伺服系统的跟踪目标函数，并基于预置单层评价神经网络重构所述跟踪目标函数，以生成与所述跟踪目标函数相对应的最优贝尔曼方程。

为了将最优控制思想融合到跟踪控制中，使得跟踪控制能够实现最优轨迹的跟踪，解决现有跟踪控制方法没有考虑到跟踪过程中例如最小能耗、跟踪误差等最优特征的问题。本说明书实施例中首先根据上述步骤S102中获取的跟踪误差建立伺服系统的跟踪目标函数，并且根据预先设置的单层评价神经网络重新构建跟踪目标函数，获得和跟踪目标函数相对应的最优贝尔曼方程。其中，需要说明的是贝尔曼方程是动态规划这些数学最佳化方法能够达到最佳化的必要条件。此方程把"决策问题在特定时间怎么的值"以"来自初始选择的报酬比从初始选择衍生的决策问题的值"的形式表示。借此这个方式把动态最佳化问题变成简单的子问题，而这些子问题遵守从贝尔曼所提出来的"最佳化还原理"。本说明书实施例中通过单层评价神经网络重构目标函数后构造贝尔曼方程，使得基于单层评价神经网络近似逼近贝尔曼方程，使得跟踪轨迹控制融合了最优特性。此外，在最优控制算法设计过程中避免了执行神经网络的使用，有效提高了参数辨识速率。

具体地，在本说明书一个或多个实施例中，根据跟踪误差与伺服系统的瞬态控制建立伺服系统的跟踪目标函数，具体包括以下过程：

首先建立伺服系统的性能指标函数；其中，性能指标函数为：

(7)

其中，需要说明的是

表示该伺服系统的效用函数,/>

表示瞬态控制的转置，R为瞬态控制的权值矩阵，此处可以理解的是/>

与u是指效用函数，后续通过对其进行优化实现最优的跟踪轨迹控制。在建立了性能指标函数之后，对上述性能指标函数求极小值以获得伺服系统的最优性能指标函数，即最优性能指标函数为：

(8)

其中，可以理解的是

为/>

的简写形式，通过对上述性能指标函数求极小值以获得伺服系统的最优性能指标函数可以看出，本说明书实施例中，通过将最优控制思想应用于伺服系统跟踪控制算法中，使得参数估计误差达到最优，即误差最小。然后根据获得的最优性能指标函数和预先设计的最优准则可以确定出伺服系统的瞬态控制公式为：

(9)

其中，

表示对所述为瞬态控制的权值矩阵的逆运算。

进一步地，在本说明书一个或多个实施例中，基于预置单层评价神经网络重构跟踪目标函数，以生成与跟踪目标函数相对应的最优贝尔曼方程，具体包括以下过程：

首先根据预置激励函数、预置单层评价神经网络的权值与神经网络估计误差，重构跟踪目标函数以生成单层评价神经网络；其中，单层评价神经网络为：

(10)

其中，

为激励函数，/>

为神经网络权值，/>

为神经网络估计误差。为实现使用贝尔曼Bellman方程的在线更新，本说明书实施例中定义伺服系统所对应的初始贝尔曼方程为：

(11)

其中，

表示效用函数，/>

。然后，将单层评价神经网络重构初始贝尔曼方程，从而获得跟踪目标函数相对应的最优贝尔曼方程；其中，还需要说明的是最优贝尔曼方程为：

(12)

是积分强化学习项，/>

，误差

。

S104：根据所述最优贝尔曼方程，确定单层评价神经网络模型权值以及所述伺服系统的最优瞬态控制。

为了使得瞬态控制的输出控制能实现最优性能下的最优轨迹，本说明书实施例中根据上述过程中获取的最优贝尔曼方程确定出单层评价神经网络模型的权值以及所述伺服系统的最优瞬态控制。通过对单层评价神经网络模型的权值估计确定，有效提高了伺服系统最优跟踪控制精度。

具体地，在本说明书一个或多个实施例中，根据最优贝尔曼方程确定所述单层评价神经网络模型的权值以及伺服系统的瞬态控制，具体包括以下过程：

首先，根据最优贝尔曼方程与单层评价神经网络模型的对应关系，确定出单层神经网络模型的权值。根据最优贝尔曼方程对所述最优性能指标函数进行更新优化，以获得优化后的最优性能指标函数，从而将优化后的最优性能指标函数代入跟踪目标函数，以获得伺服系统的瞬态控制为：

，/>

为单层神经网络模型的权值估计，/>

表示对所述为瞬态控制的权值矩阵的逆运算，/>

。

S105：根据预置所述权值的估计误差设计所述单层评价神经网络的自适应律以实现所述单层评价神经网络权值的在线更新，并根据更新后的单层评价神经网络权值更新所述最优瞬态控制，得到所述伺服系统的最优跟踪控制。

为了解决现有技术中通过采用自适应技术来解决评价和执行策略的持续更新，在此过程需要持续激励条件来保证设计算法的收敛，使得更新成本大。且现有的自适应神经网络或模糊逻辑控制方案，虽然解决伺服系统非线性的影响，但会产生的近似误差和增加硬件计算量，并且只能表现出半全局稳定性的问题，本说明书实施例中根据自适应滑模技术设计了新的自适应律，从而使自适应评价神经网络和控制律在没有任何迭代步骤的情况下连续且同时地相互更新，在保证控制精度的情况下提高了计算速率，实现伺服系统最优跟踪控制。即在本说明书实施例中，根据预置权值的估计误差设计单层评价神经网络的自适应律，并根据自适应律对输入输出关系进行更新赋值，以实现伺服系统的最优跟踪控制。

具体地，在本说明书一个或多个实施例中，根据预置权值的估计误差确定单层评价神经网络的自适应律，具体包括以下过程：

如图2所示，通过对输出轨迹进行滤波，获得伺服系统的系统控制的辅助变量；其中，需要说明的是辅助变量包括：第一辅助变量

与第二辅助变量/>

。如下所示：

(13)

其中，需要说明的是

为数学领域中G(t)的简写形式，/>

为数学领域中F(t)的简写形式/>

为预设参数。因此，根据预设参数的值可得公式(13)的解即可以获得辅助变量由时域转换到S域获得第一辅助变量G与第二辅助变量的解如下所示：

(14)

定义单层神经网络的估计即定义上述公式(10)的估计为：

(15)

从而根据单层神经网络的估计获得权值的估计

，并根据上述第一辅助变量的解与第二辅助变量的解构造获得第三辅助变量/>

。其中，需要说明的是：第三辅助变量为：

，/>

为第一辅助变量的解，/>

为第二辅助变量的解，且由上述可知/>

为权值的估计。根据单层神经网络的估计获得权值的估计之后，基于权值的估计、第一辅助变量与第二辅助变量获得权值的估计误差，以将权值的估计误差作为单层评价神经网络的自适应律，其中，自适应律如下所示为：

(16)

为自适应律，/>

为学习增益。在获得自适应律的值后将该自适应律进行回代，从而获得伺服系统的最优跟踪控制为：

(17)

可见，根据预置权值的估计误差设计单层评价神经网络的自适应律，已实现单层评价神经网络权值的在线更新，并根据更新后的单层评价神经网络权值对最优瞬态控制进行更新赋值，最终得到伺服系统的最优跟踪控制，避免了现有技术中使用的执行神经网络，同时需要持续激励条件来保证设计算法的收敛的问题。基于本说明书实施例提供的图3中神经网络权值

与其他方法的神经网络权值/>

和/>

进行对比的示意图，图4中跟踪性能的示意图，图4中/>

伺服系统的第一实际状态变量，/>

为第一理想状态变量，/>

为伺服系统的第二实际状态变量，/>

为第二理想状态变量，因此基于图4对比可知本说明书实施例中的跟踪控制方法使得实际跟踪性能的状态变量接近于理想跟踪性能的状态变量，即接近参考值。以及图5中基于最优控制下跟踪误差与标称控制下跟踪误差进行对比的示意图，可知，最优控制下具有更精确的跟踪精度。

进一步地，由图2所示本说明书实施例提供了一种伺服系统的跟踪控制逻辑示意图，本说明书一个或多个实施例中伺服系统的跟踪控制逻辑，在开始执行跟踪控制逻辑之后，具体包括以下步骤：

S1：建立伺服系统数学模型。

S2：建立最优跟踪目标函数。

S3：滤波得到辅助变量

、/>

并提取参数估计误差信息。

S4：计算矩阵

最小特征值。若该最小特征值大于0则执行步骤S5，若该最小特征值小于0，则在输入力矩中加入干扰后，重新执行步骤S2建立最优跟踪目标函数及后续步骤。

S5：构建自适应律。

S6：应用最优跟踪控制。

也就是说在上述步骤S1-S6中，本说明书实施例首先建立伺服系统的数学模型，然后建立最优跟踪目标函数，进一步滤波获得辅助变量

与/>

并提取参数估计误差信息，然后第一辅助变量/>

的解与第二辅助变量/>

的解构造获得第三辅助变量/>

。然后如图2所示为了实现自适应律的更新，在本说明书一个或多个实施例中，根据单层神经网络的估计获得权值的估计，并根据第一辅助变量的解与第二辅助变量的解构造第三辅助变量之后，方法还包括以下步骤：先计算第三辅助变量的最小特征值；其中，需要说明的是第三辅助变量为变量矩阵。如果能够确定最小特征值小于预设特征值，那么就在伺服系统的输入力矩中输入干扰，重新更新计算跟踪目标函数。其中，需要说明的是预设特征值为零。而如果确定最小特征值大于预设特征值即矩阵/>

，则基于第三辅助变量构建自适应律。

如图6所示，本说明书一个或多个实施例提供了一种伺服系统的跟踪控制系统的内部结构示意图，由图6可知，本说明书一个或多个实施例中，一种伺服系统的跟踪控制系统，系统包括：

建立单元601，用于建立伺服系统的数学模型；

数据采集单元602，用于对所述伺服系统的输入力矩和输出轨迹进行采集，基于所述输出轨迹与所述理想输出轨迹确定所述伺服系统的跟踪误差；

方程建立单元603，用于根据所述跟踪误差与所述伺服系统的瞬态控制建立所述伺服系统的跟踪目标函数，并基于预置单层评价神经网络重构所述跟踪目标函数，以生成与所述跟踪目标函数相对应的最优贝尔曼方程；

确定单元604，用于根据所述最优贝尔曼方程，确定所述单层评价神经网络模型的权值以及所述伺服系统的最优瞬态控制；

更新单元705，用于根据预置所述权值的估计误差设计所述单层评价神经网络的自适应律以实现所述单层评价神经网络权值的在线更新，并根据更新后的单层评价神经网络权值更新所述最优瞬态控制，得到所述伺服系统的最优跟踪控制。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置、设备、非易失性计算机存储介质实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

最后，应当理解的是，本说明书以上实施例仅用以说明本发明的技术方案，而非对其限制。尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。