CN116149262B - 一种伺服系统的跟踪控制方法及系统 - Google Patents
一种伺服系统的跟踪控制方法及系统 Download PDFInfo
- Publication number
- CN116149262B CN116149262B CN202310436394.4A CN202310436394A CN116149262B CN 116149262 B CN116149262 B CN 116149262B CN 202310436394 A CN202310436394 A CN 202310436394A CN 116149262 B CN116149262 B CN 116149262B
- Authority
- CN
- China
- Prior art keywords
- servo system
- optimal
- tracking
- neural network
- equation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B19/00—Programme-control systems
- G05B19/02—Programme-control systems electric
- G05B19/18—Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form
- G05B19/414—Structure of the control system, e.g. common controller or multiprocessor systems, interface to servo, programmable interface controller
- G05B19/4142—Structure of the control system, e.g. common controller or multiprocessor systems, interface to servo, programmable interface controller characterised by the use of a microprocessor
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B2219/00—Program-control systems
- G05B2219/30—Nc systems
- G05B2219/34—Director, elements to supervisory
- G05B2219/34013—Servocontroller
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/02—Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]
Abstract
本说明书实施例公开了一种伺服系统的跟踪控制方法及系统,涉及自动化控制技术领域,用于解决当前伺服系统的跟踪控制对于系统动态信息要求过高的问题,方法包括:建立伺服系统的数学模型;对伺服系统的输入力矩和输出轨迹进行采集,基于理想输出轨迹与伺服系统实际输出轨迹确定伺服系统的跟踪误差及跟踪目标函数;采用预置单层评价神经网络重构获得最优贝尔曼方程;根据最优贝尔曼方程确定神经网络权值;根据预置权值的估计误差设计自适应律实现神经网络权值在线更新,最终得到伺服系统的最优跟踪控制。
Description
技术领域
本说明书涉及自动化控制技术领域,尤其涉及一种伺服系统的跟踪控制方法及系统。
背景技术
伺服系统又称随动系统,是用来精确地跟随或复现某个过程的反馈控制系统。伺服系统使物体的位置、方位、状态等输出被控量能够跟随输入目标的任意变化的自动控制系统。它的主要任务是按控制命令的要求、对功率进行放大、变换与调控等处理,使驱动装置输出的力矩、速度和位置控制非常灵活方便。在很多情况下,伺服系统专指被控制量是机械位移或位移速度、加速度的反馈控制系统,其作用是使输出的机械位移准确地跟踪输入的位移,基于上述伺服系统功能可知,伺服系统的跟踪控制非常重要。
现有技术中伺服系统的控制器例如:PID控制、自适应控制滑模控制等,均可以使得伺服系统跟踪已经给定的轨迹,实现伺服系统的跟踪控制。但是现有技术中的跟踪控制方法没有考虑到跟踪过程中例如最小能耗、跟踪误差等最优特性,使得跟踪控制无法实现最优轨迹的跟踪,且现有的伺服系统跟踪控制算法中多需要完整的系统动态信息,导致对于伺服系统的要求较高。此外,现有的跟踪控制方法需要通过采用自适应技术来解决评价和执行策略的持续更新,在此过程需要持续激励条件来保证设计算法的收敛。而现有的自适应神经网络或模糊逻辑控制方案可以解决伺服系统非线性的影响,但会产生的近似误差和增加硬件计算量,并且只能表现出半全局稳定性。
因此现需要一种能够实现最优跟踪控制策略的伺服系统的跟踪控制方法。
发明内容
为了解决上述技术问题,本说明书一个或多个实施例提供了一种伺服系统的跟踪控制方法及系统。
本说明书一个或多个实施例采用下述技术方案:
本说明书一个或多个实施例提供一种伺服系统的跟踪控制方法,方法包括:
建立伺服系统的数学模型;
对所述伺服系统的输入力矩和输出轨迹进行采集,基于所述输出轨迹与所述理想输出轨迹确定所述伺服系统的跟踪误差;
根据所述跟踪误差与所述伺服系统的瞬态控制建立所述伺服系统的跟踪目标函数,并基于预置单层评价神经网络重构所述跟踪目标函数,以生成与所述跟踪目标函数相对应的最优贝尔曼方程;
根据所述最优贝尔曼方程,确定单层评价神经网络模型权值以及所述伺服系统的最优瞬态控制;
根据预置所述权值的估计误差设计所述单层评价神经网络的自适应律以实现所述单层评价神经网络权值的在线更新,并根据更新后的单层评价神经网络权值更新所述最优瞬态控制,得到所述伺服系统的最优跟踪控制。
可选地,在本说明书一个或多个实施例中,所述建立伺服系统的数学模型,具体包括:
定义所述伺服系统的状态变量为:
根据所述伺服系统的状态变量确定所述伺服系统的状态空间方程,以将所述状态空间方程作为所述伺服系统的数学模型;其中,所述状态空间方程为:
其中,为所述伺服系统的转动惯量,/>为所述伺服系统的系统控制,为伺服系统的自定义系数,/>表示伺服系统状态变量的自定义调整系数,/>表示伺服系统外部干扰,/>为所述伺服系统的力矩常数,/>为所述伺服系统的定子电阻,/>,/>为极点数,/>转子磁链值。
可选地,在本说明书一个或多个实施例中,所述建立伺服系统的数学模型之后,所述方法还包括:
根据所述伺服系统的动态相关函数对所述状态空间方程进行处理,以获得与所述状态空间方程相对应的简化状态空间方程;
其中,所述根据所述伺服系统的动态相关函数对所述状态空间方程进行处理,以获得与所述状态空间方程相对应的简化状态空间方程,具体包括:
根据所述状态空间方程确定所述伺服系统的非线性动态;
基于所述伺服系统的非线性动态对所述状态空间方程进行简化处理,以获得与所述状态空间方程相对应的简化状态空间方程;其中,所述简化状态空间方程为:
可选地,在本说明书一个或多个实施例中,基于所述输出轨迹与所述理想输出轨迹确定所述伺服系统的跟踪误差,具体包括:
基于所述理想输出轨迹与所述实际输出轨迹的差值,确定所述伺服系统的跟踪误差;其中,所述跟踪误差为:
其中,确定所述伺服系统的跟踪误差之后,所述方法还包括:
将所述伺服系统的系统控制分解为稳态控制与瞬态控制,其中,所述稳态控制为:
根据所述伺服系统的系统控制与所述跟踪误差,建立所述伺服系统的误差动态为:
可选地,在本说明书一个或多个实施例中,根据所述跟踪误差与所述伺服系统的瞬态控制建立伺服系统的跟踪目标函数,具体包括:
建立所述伺服系统的性能指标函数;其中,所述性能指标函数为:
对所述性能指标函数求极小值以获得所述伺服系统的最优性能指标函数并将其作为所述伺服系统的跟踪目标函数;其中,所述最优性能指标函数为:
其中,根据所述跟踪误差与所述伺服系统的瞬态控制建立伺服系统的跟踪目标函数之后,所述方法还包括:
基于所述跟踪目标函数与预设最优准则确定所述伺服系统的最优瞬态控制公式为:
可选地,在本说明书一个或多个实施例中,基于预置单层评价神经网络重构所述跟踪目标函数,以生成与所述跟踪目标函数相对应的最优贝尔曼方程,具体包括:
根据预置激励函数、所述预置单层评价神经网络的权值与所述神经网络估计误差,重构所述跟踪目标函数生成单层评价神经网络;其中,所述单层评价神经网络为:
定义所述伺服系统所对应的贝尔曼方程;其中,所述贝尔曼方程为:
将所述单层评价神经网络重构所述贝尔曼方程,以获得所述跟踪目标函数相对应的最优贝尔曼方程;其中,所述最优贝尔曼方程为:
可选地,在本说明书一个或多个实施例中,根据所述最优贝尔曼方程,确定单层评价神经网络模型权值以及所述伺服系统的最优瞬态控制,具体包括:
根据所述最优贝尔曼方程与所述单层评价神经网络的对应关系,确定所述单层评价神经网络模型权值;
根据所述最优贝尔曼方程对所述性能指标函数进行更新优化,以获得更新后的最优性能指标函数,从而将所述更新后的最优性能指标函数代入所述跟踪目标函数,以获得所述伺服系统的最优瞬态控制。
可选地,在本说明书一个或多个实施例中,根据预置所述权值的估计误差确定所述单层评价神经网络的自适应律,具体包括:
构造辅助变量;其中,所述辅助变量包括:第一辅助变量与第二辅助变量;
基于所述辅助变量的预设参数获得所述辅助变量的解;
根据单层神经网络获得所述权值的估计,并根据所述第一辅助变量的解与所述第二辅助变量的解构造第三辅助变量;其中,所述第三辅助变量为:
根据单层神经网络获得所述权值的估计,以基于所述权值的估计、所述第一辅助变量与第二辅助变量获得所述权值的估计误差,以将所述权值的估计误差作为所述单层评价神经网络的自适应律;其中,所述自适应律为:
可选地,在本说明书一个或多个实施例中,根据单层神经网络获得所述权值的估计,并根据所述第一辅助变量的解与所述第二辅助变量的解构造第三辅助变量之后,所述方法还包括:
计算所述第三辅助变量的最小特征值;其中,所述第三辅助变量为变量矩阵;
若确定所述最小特征值小于预设特征值,则在所述伺服系统的输入力矩中加入干扰,以更新所述跟踪目标函数;其中,所述预设特征值为零;
若确定所述最小特征值大于预设特征值,则基于所述第三辅助变量构建所述自适应律。
本说明书一个或多个实施例提供一种伺服系统的跟踪控制系统,系统包括:
建立单元,用于建立伺服系统的数学模型;
数据采集单元,用于对所述伺服系统的输入力矩和实际输出轨迹进行采集,基于所述实际输出轨迹与理想输出轨迹确定所述伺服系统的跟踪误差;其中,所述理想输出轨迹基于所述伺服系统的数学模型获得;
方程建立单元,用于根据所述跟踪误差与所述伺服系统的瞬态控制建立所述伺服系统的跟踪目标函数,并基于预置单层评价神经网络重构所述跟踪目标函数,以生成与所述跟踪目标函数相对应的最优贝尔曼方程;
确定单元,用于根据所述最优贝尔曼方程,确定单层评价神经网络模型权值以及所述伺服系统的最优瞬态控制;
更新单元,用于根据预置所述权值的估计误差设计所述单层评价神经网络的自适应律以实现所述单层评价神经网络权值的在线更新,并根据更新后的单层评价神经网络权值更新所述最优瞬态控制,得到所述伺服系统的最优跟踪控制。
本说明书实施例采用的上述至少一个技术方案能够达到以下有益效果:
通过伺服系统原始控制系统的模型与跟踪误差,建立伺服系统的跟踪误差动态,使得跟踪误差与后续的跟踪控制不在基于完整的系统动态信息进行获取,解决了现有的伺服系统跟踪控制算法中多需要完整的系统动态信息,导致对于伺服系统的要求较高的问题。通过单层评价神经网络重构目标函数后构造贝尔曼方程,使得基于单层评价神经网络近似逼近贝尔曼方程,使得跟踪轨迹控制融合了最优特性。此外,在最优控制算法设计过程中避免了执行神经网络的使用,有效提高了参数辨识速率。根据自适应滑模技术设计了新的自适应律,从而使自适应评价神经网络和控制律在没有任何迭代步骤的情况下连续且同时地相互更新,在保证控制精度的情况下提高了计算速率,实现伺服系统最优跟踪控制。
附图说明
为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1为本说明书实施例提供的一种伺服系统的跟踪控制方法流程示意图;
图2为本说明书实施例提供的一种伺服系统的跟踪控制逻辑示意图;
图3为本说明书实施例提供的一种神经网络权值对比示意图;
图4为本说明书实施例提供的一种跟踪性能的对比示意图;
图5为本说明书实施例提供的一种跟踪误差的对比示意图;
图6为本说明书实施例提供的一种伺服系统的跟踪控制系统的内部结构示意图。
具体实施方式
本说明书实施例提供一种伺服系统的跟踪控制方法及系统。
为了使本技术领域的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书保护的范围。
如图1所示,本说明书实施例提供了一种伺服系统的跟踪控制方法的流程示意图。由图1可知,一种伺服系统的跟踪控制方法,方法包括以下步骤:
S101:建立伺服系统的数学模型。
伺服系统又称随动系统,是用来精确地跟随或复现某个过程的反馈控制系统。伺服系统使物体的位置、方位、状态等输出被控量能够跟随输入目标的任意变化的自动控制系统。伺服系统的跟踪控制非常重要,因为它是评价伺服控制器的重要指标。跟踪控制的主要目的是给定跟踪控制动作,使系统状态跟踪期望的轨迹。本说明书实施例中为了实现伺服系统能够在最优特性下实现跟踪控制,首先建立出伺服系统的数学模型。具体地,在本说明书一个或多个实施例中,建立伺服系统的数学模型,具体包括以下过程:
本说明书实施例中以一台3自由度机器人作为一个简单的伺服系统,通过使用传感器和上位机采集伺服系统的转矩和转角。然后为了建立出伺服系统的数学模型,首先定义该伺服系统的状态变量为:;其中需要说明的是:/>为该伺服系统的转角,/>为该伺服系统的角速度。然后根据伺服系统状态变量建立该伺服系统的状态空间方程,并将获取的状态空间方程作为伺服系统的数学模型;其中,需要说明的是状态空间方程也就是伺服系统的数学模型为:
其中,需要说明的是:为数学计算中/>形式的简写,/>为数学计算中形式的简写,本说明书实施例中对于在后续同类型计算表达形式不再加以阐述。/>为伺服系统的转动惯量,u为伺服系统的系统控制,/>为伺服系统的自定义系数,/>表示伺服系统状态变量的自定义调整系数,/>表示伺服系统外部干扰,/>为伺服系统的力矩常数,/>为伺服系统的定子电阻,/>,/>为极点数,转子磁链值。
进一步地,在本说明书一个或多个实施例中,建立伺服系统的数学模型之后,为了明确该伺服系统的系统动态,方法还包括以下步骤:
首先,根据伺服系统的动态相关函数对状态空间方程进行处理,以获得与状态空间方程相对应的简化状态空间方程。其中,根据伺服系统的动态相关函数对所述状态空间方程进行处理,以获得与状态空间方程相对应的简化状态空间方程,包括以下过程:
根据状态空间方程确定出伺服系统的非线性动态,然后再根据伺服系统的非线性动态对状态空间方程进行简化处理,从而获得和状态空间方程相对应的简化状态空间方程;其中,需要说明的是简化状态空间方程为:
S102:对所述伺服系统的输入力矩和实际输出轨迹进行采集,基于所述实际输出轨迹与理想输出轨迹确定所述伺服系统的跟踪误差;其中,所述理想输出轨迹基于所述伺服系统的数学模型获得。
为了便于对原系统控制进行拆分后针对于瞬态控制进行跟踪控制的优化,从而减少对于系统动态完整性的要求,本说明书实施例中首先需要基于跟踪误差对原系统进行拆分,即可以通过伺服系统中的数据采集模块对伺服系统的输入力矩和实际输出轨迹进行实时数据采集,以便于基于上述步骤S101中构建的数学模型计算输入力矩所对应的伺服系统的理想输出轨迹,根据实时采集获得的输出轨迹也就是实际输出轨迹与计算获得的理想输出估计,对比获得伺服系统的跟踪误差。
具体地,在本说明书一个或多个实施例中,根据上述实际输出轨迹与理想输出轨迹确定出伺服系统的跟踪误差,具体包括以下步骤:
首先,根据理想输出轨迹与实际输出轨迹的差值,确定出伺服系统的跟踪误差为:
因此,将伺服系统的系统控制分解为稳态控制与瞬态控制:
S103:根据所述跟踪误差与所述伺服系统的瞬态控制建立所述伺服系统的跟踪目标函数,并基于预置单层评价神经网络重构所述跟踪目标函数,以生成与所述跟踪目标函数相对应的最优贝尔曼方程。
为了将最优控制思想融合到跟踪控制中,使得跟踪控制能够实现最优轨迹的跟踪,解决现有跟踪控制方法没有考虑到跟踪过程中例如最小能耗、跟踪误差等最优特征的问题。本说明书实施例中首先根据上述步骤S102中获取的跟踪误差建立伺服系统的跟踪目标函数,并且根据预先设置的单层评价神经网络重新构建跟踪目标函数,获得和跟踪目标函数相对应的最优贝尔曼方程。其中,需要说明的是贝尔曼方程是动态规划这些数学最佳化方法能够达到最佳化的必要条件。此方程把"决策问题在特定时间怎么的值"以"来自初始选择的报酬比从初始选择衍生的决策问题的值"的形式表示。借此这个方式把动态最佳化问题变成简单的子问题,而这些子问题遵守从贝尔曼所提出来的"最佳化还原理"。本说明书实施例中通过单层评价神经网络重构目标函数后构造贝尔曼方程,使得基于单层评价神经网络近似逼近贝尔曼方程,使得跟踪轨迹控制融合了最优特性。此外,在最优控制算法设计过程中避免了执行神经网络的使用,有效提高了参数辨识速率。
具体地,在本说明书一个或多个实施例中,根据跟踪误差与伺服系统的瞬态控制建立伺服系统的跟踪目标函数,具体包括以下过程:
首先建立伺服系统的性能指标函数;其中,性能指标函数为:
其中,需要说明的是表示该伺服系统的效用函数,/>表示瞬态控制的转置,R为瞬态控制的权值矩阵,此处可以理解的是/>与u是指效用函数,后续通过对其进行优化实现最优的跟踪轨迹控制。在建立了性能指标函数之后,对上述性能指标函数求极小值以获得伺服系统的最优性能指标函数,即最优性能指标函数为:
其中,可以理解的是为/>的简写形式,通过对上述性能指标函数求极小值以获得伺服系统的最优性能指标函数可以看出,本说明书实施例中,通过将最优控制思想应用于伺服系统跟踪控制算法中,使得参数估计误差达到最优,即误差最小。然后根据获得的最优性能指标函数和预先设计的最优准则可以确定出伺服系统的瞬态控制公式为:
进一步地,在本说明书一个或多个实施例中,基于预置单层评价神经网络重构跟踪目标函数,以生成与跟踪目标函数相对应的最优贝尔曼方程,具体包括以下过程:
首先根据预置激励函数、预置单层评价神经网络的权值与神经网络估计误差,重构跟踪目标函数以生成单层评价神经网络;其中,单层评价神经网络为:
S104:根据所述最优贝尔曼方程,确定单层评价神经网络模型权值以及所述伺服系统的最优瞬态控制。
为了使得瞬态控制的输出控制能实现最优性能下的最优轨迹,本说明书实施例中根据上述过程中获取的最优贝尔曼方程确定出单层评价神经网络模型的权值以及所述伺服系统的最优瞬态控制。通过对单层评价神经网络模型的权值估计确定,有效提高了伺服系统最优跟踪控制精度。
具体地,在本说明书一个或多个实施例中,根据最优贝尔曼方程确定所述单层评价神经网络模型的权值以及伺服系统的瞬态控制,具体包括以下过程:
首先,根据最优贝尔曼方程与单层评价神经网络模型的对应关系,确定出单层神经网络模型的权值。根据最优贝尔曼方程对所述最优性能指标函数进行更新优化,以获得优化后的最优性能指标函数,从而将优化后的最优性能指标函数代入跟踪目标函数,以获得伺服系统的瞬态控制为:,/>为单层神经网络模型的权值估计,/>表示对所述为瞬态控制的权值矩阵的逆运算,/>。
S105:根据预置所述权值的估计误差设计所述单层评价神经网络的自适应律以实现所述单层评价神经网络权值的在线更新,并根据更新后的单层评价神经网络权值更新所述最优瞬态控制,得到所述伺服系统的最优跟踪控制。
为了解决现有技术中通过采用自适应技术来解决评价和执行策略的持续更新,在此过程需要持续激励条件来保证设计算法的收敛,使得更新成本大。且现有的自适应神经网络或模糊逻辑控制方案,虽然解决伺服系统非线性的影响,但会产生的近似误差和增加硬件计算量,并且只能表现出半全局稳定性的问题,本说明书实施例中根据自适应滑模技术设计了新的自适应律,从而使自适应评价神经网络和控制律在没有任何迭代步骤的情况下连续且同时地相互更新,在保证控制精度的情况下提高了计算速率,实现伺服系统最优跟踪控制。即在本说明书实施例中,根据预置权值的估计误差设计单层评价神经网络的自适应律,并根据自适应律对输入输出关系进行更新赋值,以实现伺服系统的最优跟踪控制。
具体地,在本说明书一个或多个实施例中,根据预置权值的估计误差确定单层评价神经网络的自适应律,具体包括以下过程:
其中,需要说明的是为数学领域中G(t)的简写形式,/>为数学领域中F(t)的简写形式/>为预设参数。因此,根据预设参数的值可得公式(13)的解即可以获得辅助变量由时域转换到S域获得第一辅助变量G与第二辅助变量的解如下所示:
定义单层神经网络的估计即定义上述公式(10)的估计为:
从而根据单层神经网络的估计获得权值的估计,并根据上述第一辅助变量的解与第二辅助变量的解构造获得第三辅助变量/>。其中,需要说明的是:第三辅助变量为:,/>为第一辅助变量的解,/>为第二辅助变量的解,且由上述可知/>为权值的估计。根据单层神经网络的估计获得权值的估计之后,基于权值的估计、第一辅助变量与第二辅助变量获得权值的估计误差,以将权值的估计误差作为单层评价神经网络的自适应律,其中,自适应律如下所示为:
可见,根据预置权值的估计误差设计单层评价神经网络的自适应律,已实现单层评价神经网络权值的在线更新,并根据更新后的单层评价神经网络权值对最优瞬态控制进行更新赋值,最终得到伺服系统的最优跟踪控制,避免了现有技术中使用的执行神经网络,同时需要持续激励条件来保证设计算法的收敛的问题。基于本说明书实施例提供的图3中神经网络权值与其他方法的神经网络权值/>和/>进行对比的示意图,图4中跟踪性能的示意图,图4中/>伺服系统的第一实际状态变量,/>为第一理想状态变量,/>为伺服系统的第二实际状态变量,/>为第二理想状态变量,因此基于图4对比可知本说明书实施例中的跟踪控制方法使得实际跟踪性能的状态变量接近于理想跟踪性能的状态变量,即接近参考值。以及图5中基于最优控制下跟踪误差与标称控制下跟踪误差进行对比的示意图,可知,最优控制下具有更精确的跟踪精度。
进一步地,由图2所示本说明书实施例提供了一种伺服系统的跟踪控制逻辑示意图,本说明书一个或多个实施例中伺服系统的跟踪控制逻辑,在开始执行跟踪控制逻辑之后,具体包括以下步骤:
S1:建立伺服系统数学模型。
S2:建立最优跟踪目标函数。
S5:构建自适应律。
S6:应用最优跟踪控制。
也就是说在上述步骤S1-S6中,本说明书实施例首先建立伺服系统的数学模型,然后建立最优跟踪目标函数,进一步滤波获得辅助变量与/>并提取参数估计误差信息,然后第一辅助变量/>的解与第二辅助变量/>的解构造获得第三辅助变量/>。然后如图2所示为了实现自适应律的更新,在本说明书一个或多个实施例中,根据单层神经网络的估计获得权值的估计,并根据第一辅助变量的解与第二辅助变量的解构造第三辅助变量之后,方法还包括以下步骤:先计算第三辅助变量的最小特征值;其中,需要说明的是第三辅助变量为变量矩阵。如果能够确定最小特征值小于预设特征值,那么就在伺服系统的输入力矩中输入干扰,重新更新计算跟踪目标函数。其中,需要说明的是预设特征值为零。而如果确定最小特征值大于预设特征值即矩阵/>,则基于第三辅助变量构建自适应律。
如图6所示,本说明书一个或多个实施例提供了一种伺服系统的跟踪控制系统的内部结构示意图,由图6可知,本说明书一个或多个实施例中,一种伺服系统的跟踪控制系统,系统包括:
建立单元601,用于建立伺服系统的数学模型;
数据采集单元602,用于对所述伺服系统的输入力矩和输出轨迹进行采集,基于所述输出轨迹与所述理想输出轨迹确定所述伺服系统的跟踪误差;
方程建立单元603,用于根据所述跟踪误差与所述伺服系统的瞬态控制建立所述伺服系统的跟踪目标函数,并基于预置单层评价神经网络重构所述跟踪目标函数,以生成与所述跟踪目标函数相对应的最优贝尔曼方程;
确定单元604,用于根据所述最优贝尔曼方程,确定所述单层评价神经网络模型的权值以及所述伺服系统的最优瞬态控制;
更新单元705,用于根据预置所述权值的估计误差设计所述单层评价神经网络的自适应律以实现所述单层评价神经网络权值的在线更新,并根据更新后的单层评价神经网络权值更新所述最优瞬态控制,得到所述伺服系统的最优跟踪控制。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、设备、非易失性计算机存储介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
最后,应当理解的是,本说明书以上实施例仅用以说明本发明的技术方案,而非对其限制。尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (7)
1.一种伺服系统的跟踪控制方法,其特征在于,所述方法包括:
建立伺服系统的数学模型;
对所述伺服系统的输入力矩和实际输出轨迹进行采集,基于所述实际输出轨迹与理想输出轨迹确定所述伺服系统的跟踪误差;其中,所述理想输出轨迹基于所述伺服系统的数学模型获得;
根据所述跟踪误差与所述伺服系统的瞬态控制建立所述伺服系统的跟踪目标函数,并基于预置单层评价神经网络重构所述跟踪目标函数,以生成与所述跟踪目标函数相对应的最优贝尔曼方程;
根据所述最优贝尔曼方程,确定单层评价神经网络模型权值以及所述伺服系统的最优瞬态控制;
根据预置所述权值的估计误差设计所述单层评价神经网络的自适应律以实现所述单层评价神经网络权值的在线更新,并根据更新后的单层评价神经网络权值更新所述最优瞬态控制,得到所述伺服系统的最优跟踪控制;
其中,根据所述跟踪误差与所述伺服系统的瞬态控制建立伺服系统的跟踪目标函数,具体包括:
建立所述伺服系统的性能指标函数;其中,所述性能指标函数为:
对所述性能指标函数求极小值以获得所述伺服系统的最优性能指标函数并将其作为所述伺服系统的跟踪目标函数;其中,所述最优性能指标函数为:
其中,根据所述跟踪误差与所述伺服系统的瞬态控制建立伺服系统的跟踪目标函数之后,所述方法还包括:
基于所述跟踪目标函数与预设最优准则确定所述伺服系统的最优瞬态控制公式为:
所述基于预置单层评价神经网络重构所述跟踪目标函数,以生成与所述跟踪目标函数相对应的最优贝尔曼方程,具体包括:
根据预置激励函数、所述预置单层评价神经网络的权值与所述神经网络估计误差,重构所述跟踪目标函数生成单层评价神经网络;其中,所述单层评价神经网络为:
定义所述伺服系统所对应的贝尔曼方程;其中,所述贝尔曼方程为:
将所述单层评价神经网络重构所述贝尔曼方程,以获得所述跟踪目标函数相对应的最优贝尔曼方程;其中,所述最优贝尔曼方程为:
根据所述最优贝尔曼方程,确定单层评价神经网络模型权值以及所述伺服系统的最优瞬态控制,具体包括:
根据所述最优贝尔曼方程与所述单层评价神经网络的对应关系,确定所述单层评价神经模型网络权值;
根据所述最优贝尔曼方程对所述性能指标函数进行更新优化,以获得更新后的最优性能指标函数,从而将所述更新后的最优性能指标函数代入所述跟踪目标函数,以获得所述伺服系统的最优瞬态控制。
4.根据权利要求3所述的一种伺服系统的跟踪控制方法,其特征在于,所述基于所述实际输出轨迹与所述理想输出轨迹确定所述伺服系统的跟踪误差,具体包括:
基于所述理想输出轨迹与所述实际输出轨迹的差值,确定所述伺服系统的跟踪误差;其中,所述跟踪误差为:
其中,确定所述伺服系统的跟踪误差之后,所述方法还包括:
将所述伺服系统的系统控制分解为稳态控制与瞬态控制,其中,所述稳态控制为:
根据所述伺服系统的系统控制与所述跟踪误差,建立所述伺服系统的误差动态为:
5.根据权利要求1所述的一种伺服系统的跟踪控制方法,其特征在于,所述根据预置所述权值的估计误差确定所述单层评价神经网络的自适应律,具体包括:
构造辅助变量;其中,所述辅助变量包括:第一辅助变量与第二辅助变量;
基于所述辅助变量的预设参数获得所述辅助变量的解;
根据单层神经网络获得所述权值的估计,并根据所述第一辅助变量的解与所述第二辅助变量的解构造第三辅助变量;其中,所述第三辅助变量为:
根据单层神经网络获得所述权值的估计,以基于所述权值的估计、所述第一辅助变量与第二辅助变量获得所述权值的估计误差,以将所述权值的估计误差作为所述单层评价神经网络的自适应律;其中,所述自适应律为:
6.根据权利要求5所述的一种伺服系统的跟踪控制方法,其特征在于,所述根据单层神经网络获得所述权值的估计,并根据所述第一辅助变量的解与所述第二辅助变量的解构造第三辅助变量之后,所述方法还包括:
计算所述第三辅助变量的最小特征值;其中,所述第三辅助变量为变量矩阵;
若确定所述最小特征值小于预设特征值,则在所述伺服系统的输入力矩中加入干扰,以更新所述跟踪目标函数;其中,所述预设特征值为零;
若确定所述最小特征值大于预设特征值,则基于所述第三辅助变量构建所述自适应律。
7.一种伺服系统的跟踪控制系统,其特征在于,所述系统包括:
建立单元,用于建立伺服系统的数学模型;
数据采集单元,用于对所述伺服系统的输入力矩和实际输出轨迹进行采集,基于所述实际输出轨迹与理想输出轨迹确定所述伺服系统的跟踪误差;其中,所述理想输出轨迹基于所述伺服系统的数学模型获得;
方程建立单元,用于根据所述跟踪误差与所述伺服系统的瞬态控制建立所述伺服系统的跟踪目标函数,并基于预置单层评价神经网络重构所述跟踪目标函数,以生成与所述跟踪目标函数相对应的最优贝尔曼方程;
确定单元,用于根据所述最优贝尔曼方程,确定单层评价神经网络模型权值以及所述伺服系统的最优瞬态控制;
更新单元,用于根据预置所述权值的估计误差设计所述单层评价神经网络的自适应律以实现所述单层评价神经网络权值的在线更新,并根据更新后的单层评价神经网络权值更新所述最优瞬态控制,得到所述伺服系统的最优跟踪控制;
其中,根据所述跟踪误差与所述伺服系统的瞬态控制建立伺服系统的跟踪目标函数,具体包括:
建立所述伺服系统的性能指标函数;其中,所述性能指标函数为:
对所述性能指标函数求极小值以获得所述伺服系统的最优性能指标函数并将其作为所述伺服系统的跟踪目标函数;其中,所述最优性能指标函数为:
其中,根据所述跟踪误差与所述伺服系统的瞬态控制建立伺服系统的跟踪目标函数之后,还包括:
基于所述跟踪目标函数与预设最优准则确定所述伺服系统的最优瞬态控制公式为:
所述基于预置单层评价神经网络重构所述跟踪目标函数,以生成与所述跟踪目标函数相对应的最优贝尔曼方程,具体包括:
根据预置激励函数、所述预置单层评价神经网络的权值与所述神经网络估计误差,重构所述跟踪目标函数生成单层评价神经网络;其中,所述单层评价神经网络为:
定义所述伺服系统所对应的贝尔曼方程;其中,所述贝尔曼方程为:
将所述单层评价神经网络重构所述贝尔曼方程,以获得所述跟踪目标函数相对应的最优贝尔曼方程;其中,所述最优贝尔曼方程为:
根据所述最优贝尔曼方程,确定单层评价神经网络模型权值以及所述伺服系统的最优瞬态控制,具体包括:
根据所述最优贝尔曼方程与所述单层评价神经网络的对应关系,确定所述单层评价神经模型网络权值;
根据所述最优贝尔曼方程对所述性能指标函数进行更新优化,以获得更新后的最优性能指标函数,从而将所述更新后的最优性能指标函数代入所述跟踪目标函数,以获得所述伺服系统的最优瞬态控制。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310436394.4A CN116149262B (zh) | 2023-04-23 | 2023-04-23 | 一种伺服系统的跟踪控制方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310436394.4A CN116149262B (zh) | 2023-04-23 | 2023-04-23 | 一种伺服系统的跟踪控制方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116149262A CN116149262A (zh) | 2023-05-23 |
CN116149262B true CN116149262B (zh) | 2023-07-04 |
Family
ID=86374003
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310436394.4A Active CN116149262B (zh) | 2023-04-23 | 2023-04-23 | 一种伺服系统的跟踪控制方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116149262B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105867136A (zh) * | 2016-05-16 | 2016-08-17 | 北京理工大学 | 基于参数辨识的多电机伺服系统同步与跟踪控制方法 |
CN108762088A (zh) * | 2018-06-20 | 2018-11-06 | 山东科技大学 | 一种迟滞非线性伺服电机系统滑模控制方法 |
CN110750050A (zh) * | 2019-10-11 | 2020-02-04 | 浙江工业大学 | 一种基于神经网络的机械臂系统预设性能控制方法 |
CN110802589A (zh) * | 2019-10-23 | 2020-02-18 | 山东科技大学 | 一种工业机器人单关节伺服控制的迟滞补偿方法 |
CN113103237A (zh) * | 2021-04-25 | 2021-07-13 | 长春工业大学 | 一种面向未知环境约束的可重构机械臂控制方法及系统 |
CN114434441A (zh) * | 2021-12-31 | 2022-05-06 | 中南大学 | 基于自适应动态规划的移动机器人视觉伺服跟踪控制方法 |
CN114859847A (zh) * | 2022-03-11 | 2022-08-05 | 四川大学 | 一种适用于互联非线性系统的可靠优化控制系统及方法 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9134707B2 (en) * | 2012-03-30 | 2015-09-15 | Board Of Regents, The University Of Texas System | Optimal online adaptive controller |
US10896383B2 (en) * | 2014-08-07 | 2021-01-19 | Okinawa Institute Of Science And Technology School Corporation | Direct inverse reinforcement learning with density ratio estimation |
US10065654B2 (en) * | 2016-07-08 | 2018-09-04 | Toyota Motor Engineering & Manufacturing North America, Inc. | Online learning and vehicle control method based on reinforcement learning without active exploration |
CN109946975B (zh) * | 2019-04-12 | 2020-04-24 | 北京理工大学 | 一种未知伺服系统的强化学习最优跟踪控制方法 |
CN109976161B (zh) * | 2019-04-23 | 2022-04-08 | 哈尔滨工业大学 | 一种不确定非线性系统的有限时间优化跟踪控制方法 |
CN115079569A (zh) * | 2022-06-17 | 2022-09-20 | 山东科技大学 | 一种基于天牛须搜索算法的agv非线性自抗扰控制方法 |
-
2023
- 2023-04-23 CN CN202310436394.4A patent/CN116149262B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105867136A (zh) * | 2016-05-16 | 2016-08-17 | 北京理工大学 | 基于参数辨识的多电机伺服系统同步与跟踪控制方法 |
CN108762088A (zh) * | 2018-06-20 | 2018-11-06 | 山东科技大学 | 一种迟滞非线性伺服电机系统滑模控制方法 |
CN110750050A (zh) * | 2019-10-11 | 2020-02-04 | 浙江工业大学 | 一种基于神经网络的机械臂系统预设性能控制方法 |
CN110802589A (zh) * | 2019-10-23 | 2020-02-18 | 山东科技大学 | 一种工业机器人单关节伺服控制的迟滞补偿方法 |
CN113103237A (zh) * | 2021-04-25 | 2021-07-13 | 长春工业大学 | 一种面向未知环境约束的可重构机械臂控制方法及系统 |
CN114434441A (zh) * | 2021-12-31 | 2022-05-06 | 中南大学 | 基于自适应动态规划的移动机器人视觉伺服跟踪控制方法 |
CN114859847A (zh) * | 2022-03-11 | 2022-08-05 | 四川大学 | 一种适用于互联非线性系统的可靠优化控制系统及方法 |
Non-Patent Citations (2)
Title |
---|
一种新型的焊接机器人控制器;张超;王琦;姚永刚;王鑫;雷晶;;电焊机(06);全文 * |
基于ADP的一类时滞离散系统跟踪控制;林小峰;杨晓娜;黄清宝;宋春宁;;广西大学学报(自然科学版)(06);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN116149262A (zh) | 2023-05-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Na et al. | Adaptive control for nonlinear pure-feedback systems with high-order sliding mode observer | |
Hosseini-Suny et al. | Model reference adaptive control design for a teleoperation system with output prediction | |
CN105867138B (zh) | 一种基于pid控制器的稳定平台控制方法及装置 | |
CN111290263B (zh) | 一种改进的基于rbfnn及bas的pid最优化控制算法 | |
CN111273544B (zh) | 基于预测rbf前馈补偿型模糊pid的雷达俯仰运动控制方法 | |
CN104270055A (zh) | 一种交流伺服系统位置环ip控制器的参数自校正方法 | |
CN114839880B (zh) | 一种基于柔性关节机械臂的自适应控制方法 | |
CN116991068A (zh) | 基于分布式预设时间梯度下降法的电机控制方法及系统 | |
CN107065559B (zh) | 一种工业机器人增量自适应控制方法 | |
CN111930010A (zh) | 一种基于lstm网络的通用mfa控制器设计方法 | |
CN116149262B (zh) | 一种伺服系统的跟踪控制方法及系统 | |
Zhang et al. | Identifier-based adaptive robust control for servomechanisms with improved transient performance | |
CN111531543B (zh) | 基于生物启发式神经网络的机器人自适应阻抗控制方法 | |
CN106033189A (zh) | 飞行机器人位姿神经网络预测控制器 | |
CN116512256A (zh) | 基于联合学习的机器人最优人机交互阻抗控制方法、存储介质及机器人 | |
CN115180461B (zh) | 新能源汽车压缩机电机生产装备的张力数据驱动控制方法 | |
CN115981159A (zh) | 基于模型辅助和类史密斯预估的广义改进自抗扰控制方法 | |
JP7469476B2 (ja) | 制御支援装置、制御システム及び制御支援方法 | |
Ruusu et al. | Sliding mode SISO control of model parameters for implicit dynamic feedback estimation of industrial tracking simulation systems | |
CN109039166B (zh) | 一种永磁同步直线伺服系统速度环pi-ip控制参数自校正方法 | |
CN113359452B (zh) | 基于Barzilai Borwein智能学习算法的控制器设计方法、系统 | |
AYDOĞDU et al. | Adaptive control of a time-varying rotary servo system using a fuzzy model reference learning controller with variable adaptation gain | |
JP7409343B2 (ja) | コントローラ、制御方法及び制御プログラム | |
CN111781821B (zh) | SISO紧格式无模型控制器基于Attention机制循环神经网络的参数自整定方法 | |
CN112015081B (zh) | Siso紧格式无模型控制器基于pso-lstm协同算法的参数自整定方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |