CN116149262B - 一种伺服系统的跟踪控制方法及系统 - Google Patents

一种伺服系统的跟踪控制方法及系统 Download PDF

Info

Publication number
CN116149262B
CN116149262B CN202310436394.4A CN202310436394A CN116149262B CN 116149262 B CN116149262 B CN 116149262B CN 202310436394 A CN202310436394 A CN 202310436394A CN 116149262 B CN116149262 B CN 116149262B
Authority
CN
China
Prior art keywords
servo system
optimal
tracking
neural network
equation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310436394.4A
Other languages
English (en)
Other versions
CN116149262A (zh
Inventor
赵军
赵子亮
朱庆林
郭斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong University of Science and Technology
Original Assignee
Shandong University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong University of Science and Technology filed Critical Shandong University of Science and Technology
Priority to CN202310436394.4A priority Critical patent/CN116149262B/zh
Publication of CN116149262A publication Critical patent/CN116149262A/zh
Application granted granted Critical
Publication of CN116149262B publication Critical patent/CN116149262B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B19/00Programme-control systems
    • G05B19/02Programme-control systems electric
    • G05B19/18Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form
    • G05B19/414Structure of the control system, e.g. common controller or multiprocessor systems, interface to servo, programmable interface controller
    • G05B19/4142Structure of the control system, e.g. common controller or multiprocessor systems, interface to servo, programmable interface controller characterised by the use of a microprocessor
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/34Director, elements to supervisory
    • G05B2219/34013Servocontroller
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Abstract

本说明书实施例公开了一种伺服系统的跟踪控制方法及系统,涉及自动化控制技术领域,用于解决当前伺服系统的跟踪控制对于系统动态信息要求过高的问题,方法包括:建立伺服系统的数学模型;对伺服系统的输入力矩和输出轨迹进行采集,基于理想输出轨迹与伺服系统实际输出轨迹确定伺服系统的跟踪误差及跟踪目标函数;采用预置单层评价神经网络重构获得最优贝尔曼方程;根据最优贝尔曼方程确定神经网络权值;根据预置权值的估计误差设计自适应律实现神经网络权值在线更新,最终得到伺服系统的最优跟踪控制。

Description

一种伺服系统的跟踪控制方法及系统
技术领域
本说明书涉及自动化控制技术领域,尤其涉及一种伺服系统的跟踪控制方法及系统。
背景技术
伺服系统又称随动系统,是用来精确地跟随或复现某个过程的反馈控制系统。伺服系统使物体的位置、方位、状态等输出被控量能够跟随输入目标的任意变化的自动控制系统。它的主要任务是按控制命令的要求、对功率进行放大、变换与调控等处理,使驱动装置输出的力矩、速度和位置控制非常灵活方便。在很多情况下,伺服系统专指被控制量是机械位移或位移速度、加速度的反馈控制系统,其作用是使输出的机械位移准确地跟踪输入的位移,基于上述伺服系统功能可知,伺服系统的跟踪控制非常重要。
现有技术中伺服系统的控制器例如:PID控制、自适应控制滑模控制等,均可以使得伺服系统跟踪已经给定的轨迹,实现伺服系统的跟踪控制。但是现有技术中的跟踪控制方法没有考虑到跟踪过程中例如最小能耗、跟踪误差等最优特性,使得跟踪控制无法实现最优轨迹的跟踪,且现有的伺服系统跟踪控制算法中多需要完整的系统动态信息,导致对于伺服系统的要求较高。此外,现有的跟踪控制方法需要通过采用自适应技术来解决评价和执行策略的持续更新,在此过程需要持续激励条件来保证设计算法的收敛。而现有的自适应神经网络或模糊逻辑控制方案可以解决伺服系统非线性的影响,但会产生的近似误差和增加硬件计算量,并且只能表现出半全局稳定性。
因此现需要一种能够实现最优跟踪控制策略的伺服系统的跟踪控制方法。
发明内容
为了解决上述技术问题,本说明书一个或多个实施例提供了一种伺服系统的跟踪控制方法及系统。
本说明书一个或多个实施例采用下述技术方案:
本说明书一个或多个实施例提供一种伺服系统的跟踪控制方法,方法包括:
建立伺服系统的数学模型;
对所述伺服系统的输入力矩和输出轨迹进行采集,基于所述输出轨迹与所述理想输出轨迹确定所述伺服系统的跟踪误差;
根据所述跟踪误差与所述伺服系统的瞬态控制建立所述伺服系统的跟踪目标函数,并基于预置单层评价神经网络重构所述跟踪目标函数,以生成与所述跟踪目标函数相对应的最优贝尔曼方程;
根据所述最优贝尔曼方程,确定单层评价神经网络模型权值以及所述伺服系统的最优瞬态控制;
根据预置所述权值的估计误差设计所述单层评价神经网络的自适应律以实现所述单层评价神经网络权值的在线更新,并根据更新后的单层评价神经网络权值更新所述最优瞬态控制,得到所述伺服系统的最优跟踪控制。
可选地,在本说明书一个或多个实施例中,所述建立伺服系统的数学模型,具体包括:
定义所述伺服系统的状态变量为:
Figure SMS_1
其中,
Figure SMS_2
为所述伺服系统的转角,/>
Figure SMS_3
为所述伺服系统的角速度;
根据所述伺服系统的状态变量确定所述伺服系统的状态空间方程,以将所述状态空间方程作为所述伺服系统的数学模型;其中,所述状态空间方程为:
Figure SMS_4
其中,
Figure SMS_7
为所述伺服系统的转动惯量,/>
Figure SMS_9
为所述伺服系统的系统控制,
Figure SMS_11
为伺服系统的自定义系数,/>
Figure SMS_6
表示伺服系统状态变量的自定义调整系数,/>
Figure SMS_8
表示伺服系统外部干扰,/>
Figure SMS_12
为所述伺服系统的力矩常数,/>
Figure SMS_14
为所述伺服系统的定子电阻,/>
Figure SMS_5
,/>
Figure SMS_10
为极点数,/>
Figure SMS_13
转子磁链值。
可选地,在本说明书一个或多个实施例中,所述建立伺服系统的数学模型之后,所述方法还包括:
根据所述伺服系统的动态相关函数对所述状态空间方程进行处理,以获得与所述状态空间方程相对应的简化状态空间方程;
其中,所述根据所述伺服系统的动态相关函数对所述状态空间方程进行处理,以获得与所述状态空间方程相对应的简化状态空间方程,具体包括:
根据所述状态空间方程确定所述伺服系统的非线性动态;
基于所述伺服系统的非线性动态对所述状态空间方程进行简化处理,以获得与所述状态空间方程相对应的简化状态空间方程;其中,所述简化状态空间方程为:
Figure SMS_15
;其中,/>
Figure SMS_16
与/>
Figure SMS_17
表示系统非线性动态。
可选地,在本说明书一个或多个实施例中,基于所述输出轨迹与所述理想输出轨迹确定所述伺服系统的跟踪误差,具体包括:
基于所述理想输出轨迹与所述实际输出轨迹的差值,确定所述伺服系统的跟踪误差;其中,所述跟踪误差为:
Figure SMS_18
;其中,/>
Figure SMS_19
为所述跟踪误差,/>
Figure SMS_20
为所述理想输出轨迹,/>
Figure SMS_21
为所述实际输出轨迹;
其中,确定所述伺服系统的跟踪误差之后,所述方法还包括:
将所述伺服系统的系统控制分解为稳态控制与瞬态控制,其中,所述稳态控制为:
Figure SMS_22
Figure SMS_23
表示反馈控制增益,/>
Figure SMS_24
为/>
Figure SMS_25
的伪逆;
根据所述伺服系统的系统控制与所述跟踪误差,建立所述伺服系统的误差动态为:
Figure SMS_26
,/>
Figure SMS_27
为所述伺服系统的瞬态控制。
可选地,在本说明书一个或多个实施例中,根据所述跟踪误差与所述伺服系统的瞬态控制建立伺服系统的跟踪目标函数,具体包括:
建立所述伺服系统的性能指标函数;其中,所述性能指标函数为:
Figure SMS_28
,其中,/>
Figure SMS_29
表示所述伺服系统的效用函数,R为性能指标函数的权值矩阵;
对所述性能指标函数求极小值以获得所述伺服系统的最优性能指标函数并将其作为所述伺服系统的跟踪目标函数;其中,所述最优性能指标函数为:
Figure SMS_30
其中,根据所述跟踪误差与所述伺服系统的瞬态控制建立伺服系统的跟踪目标函数之后,所述方法还包括:
基于所述跟踪目标函数与预设最优准则确定所述伺服系统的最优瞬态控制公式为:
Figure SMS_31
可选地,在本说明书一个或多个实施例中,基于预置单层评价神经网络重构所述跟踪目标函数,以生成与所述跟踪目标函数相对应的最优贝尔曼方程,具体包括:
根据预置激励函数、所述预置单层评价神经网络的权值与所述神经网络估计误差,重构所述跟踪目标函数生成单层评价神经网络;其中,所述单层评价神经网络为:
Figure SMS_32
;/>
Figure SMS_33
为激励函数,/>
Figure SMS_34
为神经网络权值,/>
Figure SMS_35
为神经网络估计误差;
定义所述伺服系统所对应的贝尔曼方程;其中,所述贝尔曼方程为:
Figure SMS_36
;其中,/>
Figure SMS_37
表示效用函数;
将所述单层评价神经网络重构所述贝尔曼方程,以获得所述跟踪目标函数相对应的最优贝尔曼方程;其中,所述最优贝尔曼方程为:
Figure SMS_38
,/>
Figure SMS_39
是积分强化学习项,/>
Figure SMS_40
,误差/>
Figure SMS_41
可选地,在本说明书一个或多个实施例中,根据所述最优贝尔曼方程,确定单层评价神经网络模型权值以及所述伺服系统的最优瞬态控制,具体包括:
根据所述最优贝尔曼方程与所述单层评价神经网络的对应关系,确定所述单层评价神经网络模型权值;
根据所述最优贝尔曼方程对所述性能指标函数进行更新优化,以获得更新后的最优性能指标函数,从而将所述更新后的最优性能指标函数代入所述跟踪目标函数,以获得所述伺服系统的最优瞬态控制。
可选地,在本说明书一个或多个实施例中,根据预置所述权值的估计误差确定所述单层评价神经网络的自适应律,具体包括:
构造辅助变量;其中,所述辅助变量包括:第一辅助变量与第二辅助变量;
基于所述辅助变量的预设参数获得所述辅助变量的解;
根据单层神经网络获得所述权值的估计,并根据所述第一辅助变量的解与所述第二辅助变量的解构造第三辅助变量;其中,所述第三辅助变量为:
Figure SMS_42
,/>
Figure SMS_43
为第一辅助变量的解,/>
Figure SMS_44
为第二辅助变量的解,/>
Figure SMS_45
为所述权值的估计;
根据单层神经网络获得所述权值的估计,以基于所述权值的估计、所述第一辅助变量与第二辅助变量获得所述权值的估计误差,以将所述权值的估计误差作为所述单层评价神经网络的自适应律;其中,所述自适应律为:
Figure SMS_46
,/>
Figure SMS_47
为自适应律,/>
Figure SMS_48
为学习增益。
可选地,在本说明书一个或多个实施例中,根据单层神经网络获得所述权值的估计,并根据所述第一辅助变量的解与所述第二辅助变量的解构造第三辅助变量之后,所述方法还包括:
计算所述第三辅助变量的最小特征值;其中,所述第三辅助变量为变量矩阵;
若确定所述最小特征值小于预设特征值,则在所述伺服系统的输入力矩中加入干扰,以更新所述跟踪目标函数;其中,所述预设特征值为零;
若确定所述最小特征值大于预设特征值,则基于所述第三辅助变量构建所述自适应律。
本说明书一个或多个实施例提供一种伺服系统的跟踪控制系统,系统包括:
建立单元,用于建立伺服系统的数学模型;
数据采集单元,用于对所述伺服系统的输入力矩和实际输出轨迹进行采集,基于所述实际输出轨迹与理想输出轨迹确定所述伺服系统的跟踪误差;其中,所述理想输出轨迹基于所述伺服系统的数学模型获得;
方程建立单元,用于根据所述跟踪误差与所述伺服系统的瞬态控制建立所述伺服系统的跟踪目标函数,并基于预置单层评价神经网络重构所述跟踪目标函数,以生成与所述跟踪目标函数相对应的最优贝尔曼方程;
确定单元,用于根据所述最优贝尔曼方程,确定单层评价神经网络模型权值以及所述伺服系统的最优瞬态控制;
更新单元,用于根据预置所述权值的估计误差设计所述单层评价神经网络的自适应律以实现所述单层评价神经网络权值的在线更新,并根据更新后的单层评价神经网络权值更新所述最优瞬态控制,得到所述伺服系统的最优跟踪控制。
本说明书实施例采用的上述至少一个技术方案能够达到以下有益效果:
通过伺服系统原始控制系统的模型与跟踪误差,建立伺服系统的跟踪误差动态,使得跟踪误差与后续的跟踪控制不在基于完整的系统动态信息进行获取,解决了现有的伺服系统跟踪控制算法中多需要完整的系统动态信息,导致对于伺服系统的要求较高的问题。通过单层评价神经网络重构目标函数后构造贝尔曼方程,使得基于单层评价神经网络近似逼近贝尔曼方程,使得跟踪轨迹控制融合了最优特性。此外,在最优控制算法设计过程中避免了执行神经网络的使用,有效提高了参数辨识速率。根据自适应滑模技术设计了新的自适应律,从而使自适应评价神经网络和控制律在没有任何迭代步骤的情况下连续且同时地相互更新,在保证控制精度的情况下提高了计算速率,实现伺服系统最优跟踪控制。
附图说明
为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1为本说明书实施例提供的一种伺服系统的跟踪控制方法流程示意图;
图2为本说明书实施例提供的一种伺服系统的跟踪控制逻辑示意图;
图3为本说明书实施例提供的一种神经网络权值对比示意图;
图4为本说明书实施例提供的一种跟踪性能的对比示意图;
图5为本说明书实施例提供的一种跟踪误差的对比示意图;
图6为本说明书实施例提供的一种伺服系统的跟踪控制系统的内部结构示意图。
具体实施方式
本说明书实施例提供一种伺服系统的跟踪控制方法及系统。
为了使本技术领域的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书保护的范围。
如图1所示,本说明书实施例提供了一种伺服系统的跟踪控制方法的流程示意图。由图1可知,一种伺服系统的跟踪控制方法,方法包括以下步骤:
S101:建立伺服系统的数学模型。
伺服系统又称随动系统,是用来精确地跟随或复现某个过程的反馈控制系统。伺服系统使物体的位置、方位、状态等输出被控量能够跟随输入目标的任意变化的自动控制系统。伺服系统的跟踪控制非常重要,因为它是评价伺服控制器的重要指标。跟踪控制的主要目的是给定跟踪控制动作,使系统状态跟踪期望的轨迹。本说明书实施例中为了实现伺服系统能够在最优特性下实现跟踪控制,首先建立出伺服系统的数学模型。具体地,在本说明书一个或多个实施例中,建立伺服系统的数学模型,具体包括以下过程:
本说明书实施例中以一台3自由度机器人作为一个简单的伺服系统,通过使用传感器和上位机采集伺服系统的转矩和转角。然后为了建立出伺服系统的数学模型,首先定义该伺服系统的状态变量为:
Figure SMS_49
;其中需要说明的是:/>
Figure SMS_50
为该伺服系统的转角,/>
Figure SMS_51
为该伺服系统的角速度。然后根据伺服系统状态变量建立该伺服系统的状态空间方程,并将获取的状态空间方程作为伺服系统的数学模型;其中,需要说明的是状态空间方程也就是伺服系统的数学模型为:
Figure SMS_52
(1)
其中,需要说明的是:
Figure SMS_55
为数学计算中/>
Figure SMS_57
形式的简写,/>
Figure SMS_60
为数学计算中
Figure SMS_54
形式的简写,本说明书实施例中对于在后续同类型计算表达形式不再加以阐述。/>
Figure SMS_58
为伺服系统的转动惯量,u为伺服系统的系统控制,/>
Figure SMS_61
为伺服系统的自定义系数,/>
Figure SMS_65
表示伺服系统状态变量的自定义调整系数,/>
Figure SMS_53
表示伺服系统外部干扰,/>
Figure SMS_59
为伺服系统的力矩常数,/>
Figure SMS_63
为伺服系统的定子电阻,/>
Figure SMS_64
,/>
Figure SMS_56
为极点数,
Figure SMS_62
转子磁链值。
进一步地,在本说明书一个或多个实施例中,建立伺服系统的数学模型之后,为了明确该伺服系统的系统动态,方法还包括以下步骤:
首先,根据伺服系统的动态相关函数对状态空间方程进行处理,以获得与状态空间方程相对应的简化状态空间方程。其中,根据伺服系统的动态相关函数对所述状态空间方程进行处理,以获得与状态空间方程相对应的简化状态空间方程,包括以下过程:
根据状态空间方程确定出伺服系统的非线性动态,然后再根据伺服系统的非线性动态对状态空间方程进行简化处理,从而获得和状态空间方程相对应的简化状态空间方程;其中,需要说明的是简化状态空间方程为:
Figure SMS_66
(2)
其中,
Figure SMS_67
与/>
Figure SMS_68
表示系统非线性动态。
S102:对所述伺服系统的输入力矩和实际输出轨迹进行采集,基于所述实际输出轨迹与理想输出轨迹确定所述伺服系统的跟踪误差;其中,所述理想输出轨迹基于所述伺服系统的数学模型获得。
为了便于对原系统控制进行拆分后针对于瞬态控制进行跟踪控制的优化,从而减少对于系统动态完整性的要求,本说明书实施例中首先需要基于跟踪误差对原系统进行拆分,即可以通过伺服系统中的数据采集模块对伺服系统的输入力矩和实际输出轨迹进行实时数据采集,以便于基于上述步骤S101中构建的数学模型计算输入力矩所对应的伺服系统的理想输出轨迹,根据实时采集获得的输出轨迹也就是实际输出轨迹与计算获得的理想输出估计,对比获得伺服系统的跟踪误差。
具体地,在本说明书一个或多个实施例中,根据上述实际输出轨迹与理想输出轨迹确定出伺服系统的跟踪误差,具体包括以下步骤:
首先,根据理想输出轨迹与实际输出轨迹的差值,确定出伺服系统的跟踪误差为:
Figure SMS_69
(3)
其中,需要说明的是:
Figure SMS_70
为跟踪误差,/>
Figure SMS_71
为所述理想输出轨迹,/>
Figure SMS_72
为连续可导的跟踪信号即实时采集获得的伺服系统实际输出轨迹。
因此,将伺服系统的系统控制分解为稳态控制与瞬态控制:
Figure SMS_73
(4)
其中,
Figure SMS_74
为稳态控制,/>
Figure SMS_75
为瞬态控制,进而设计获取稳态控制为:
Figure SMS_76
(5)
其中,
Figure SMS_77
表示反馈增益,/>
Figure SMS_78
为/>
Figure SMS_79
的伪逆;然后根据上述步骤中获得的所述伺服系统的系统控制模型与跟踪误差,建立伺服系统的误差动态,即将上述公式(4)代入到公式(3)中,获得跟踪误差动态为:
Figure SMS_80
(6)
Figure SMS_81
为伺服系统的瞬态控制,基于该过程可见跟踪误差动态不再基于完整的系统动态进行获取,从而解决了现有的伺服系统跟踪控制算法中多需要完整的系统动态信息,导致对于伺服系统的要求较高的问题。
S103:根据所述跟踪误差与所述伺服系统的瞬态控制建立所述伺服系统的跟踪目标函数,并基于预置单层评价神经网络重构所述跟踪目标函数,以生成与所述跟踪目标函数相对应的最优贝尔曼方程。
为了将最优控制思想融合到跟踪控制中,使得跟踪控制能够实现最优轨迹的跟踪,解决现有跟踪控制方法没有考虑到跟踪过程中例如最小能耗、跟踪误差等最优特征的问题。本说明书实施例中首先根据上述步骤S102中获取的跟踪误差建立伺服系统的跟踪目标函数,并且根据预先设置的单层评价神经网络重新构建跟踪目标函数,获得和跟踪目标函数相对应的最优贝尔曼方程。其中,需要说明的是贝尔曼方程是动态规划这些数学最佳化方法能够达到最佳化的必要条件。此方程把"决策问题在特定时间怎么的值"以"来自初始选择的报酬比从初始选择衍生的决策问题的值"的形式表示。借此这个方式把动态最佳化问题变成简单的子问题,而这些子问题遵守从贝尔曼所提出来的"最佳化还原理"。本说明书实施例中通过单层评价神经网络重构目标函数后构造贝尔曼方程,使得基于单层评价神经网络近似逼近贝尔曼方程,使得跟踪轨迹控制融合了最优特性。此外,在最优控制算法设计过程中避免了执行神经网络的使用,有效提高了参数辨识速率。
具体地,在本说明书一个或多个实施例中,根据跟踪误差与伺服系统的瞬态控制建立伺服系统的跟踪目标函数,具体包括以下过程:
首先建立伺服系统的性能指标函数;其中,性能指标函数为:
Figure SMS_82
(7)
其中,需要说明的是
Figure SMS_83
表示该伺服系统的效用函数,/>
Figure SMS_84
表示瞬态控制的转置,R为瞬态控制的权值矩阵,此处可以理解的是/>
Figure SMS_85
u是指效用函数,后续通过对其进行优化实现最优的跟踪轨迹控制。在建立了性能指标函数之后,对上述性能指标函数求极小值以获得伺服系统的最优性能指标函数,即最优性能指标函数为:
Figure SMS_86
(8)
其中,可以理解的是
Figure SMS_87
为/>
Figure SMS_88
的简写形式,通过对上述性能指标函数求极小值以获得伺服系统的最优性能指标函数可以看出,本说明书实施例中,通过将最优控制思想应用于伺服系统跟踪控制算法中,使得参数估计误差达到最优,即误差最小。然后根据获得的最优性能指标函数和预先设计的最优准则可以确定出伺服系统的瞬态控制公式为:
Figure SMS_89
(9)
其中,
Figure SMS_90
表示对所述为瞬态控制的权值矩阵的逆运算。
进一步地,在本说明书一个或多个实施例中,基于预置单层评价神经网络重构跟踪目标函数,以生成与跟踪目标函数相对应的最优贝尔曼方程,具体包括以下过程:
首先根据预置激励函数、预置单层评价神经网络的权值与神经网络估计误差,重构跟踪目标函数以生成单层评价神经网络;其中,单层评价神经网络为:
Figure SMS_91
(10)
其中,
Figure SMS_92
为激励函数,/>
Figure SMS_93
为神经网络权值,/>
Figure SMS_94
为神经网络估计误差。为实现使用贝尔曼Bellman方程的在线更新,本说明书实施例中定义伺服系统所对应的初始贝尔曼方程为:
Figure SMS_95
(11)
其中,
Figure SMS_96
表示效用函数,/>
Figure SMS_97
。然后,将单层评价神经网络重构初始贝尔曼方程,从而获得跟踪目标函数相对应的最优贝尔曼方程;其中,还需要说明的是最优贝尔曼方程为:
Figure SMS_98
(12)
Figure SMS_99
是积分强化学习项,/>
Figure SMS_100
,误差
Figure SMS_101
S104:根据所述最优贝尔曼方程,确定单层评价神经网络模型权值以及所述伺服系统的最优瞬态控制。
为了使得瞬态控制的输出控制能实现最优性能下的最优轨迹,本说明书实施例中根据上述过程中获取的最优贝尔曼方程确定出单层评价神经网络模型的权值以及所述伺服系统的最优瞬态控制。通过对单层评价神经网络模型的权值估计确定,有效提高了伺服系统最优跟踪控制精度。
具体地,在本说明书一个或多个实施例中,根据最优贝尔曼方程确定所述单层评价神经网络模型的权值以及伺服系统的瞬态控制,具体包括以下过程:
首先,根据最优贝尔曼方程与单层评价神经网络模型的对应关系,确定出单层神经网络模型的权值。根据最优贝尔曼方程对所述最优性能指标函数进行更新优化,以获得优化后的最优性能指标函数,从而将优化后的最优性能指标函数代入跟踪目标函数,以获得伺服系统的瞬态控制为:
Figure SMS_102
,/>
Figure SMS_103
为单层神经网络模型的权值估计,/>
Figure SMS_104
表示对所述为瞬态控制的权值矩阵的逆运算,/>
Figure SMS_105
S105:根据预置所述权值的估计误差设计所述单层评价神经网络的自适应律以实现所述单层评价神经网络权值的在线更新,并根据更新后的单层评价神经网络权值更新所述最优瞬态控制,得到所述伺服系统的最优跟踪控制。
为了解决现有技术中通过采用自适应技术来解决评价和执行策略的持续更新,在此过程需要持续激励条件来保证设计算法的收敛,使得更新成本大。且现有的自适应神经网络或模糊逻辑控制方案,虽然解决伺服系统非线性的影响,但会产生的近似误差和增加硬件计算量,并且只能表现出半全局稳定性的问题,本说明书实施例中根据自适应滑模技术设计了新的自适应律,从而使自适应评价神经网络和控制律在没有任何迭代步骤的情况下连续且同时地相互更新,在保证控制精度的情况下提高了计算速率,实现伺服系统最优跟踪控制。即在本说明书实施例中,根据预置权值的估计误差设计单层评价神经网络的自适应律,并根据自适应律对输入输出关系进行更新赋值,以实现伺服系统的最优跟踪控制。
具体地,在本说明书一个或多个实施例中,根据预置权值的估计误差确定单层评价神经网络的自适应律,具体包括以下过程:
如图2所示,通过对输出轨迹进行滤波,获得伺服系统的系统控制的辅助变量;其中,需要说明的是辅助变量包括:第一辅助变量
Figure SMS_106
与第二辅助变量/>
Figure SMS_107
。如下所示:
Figure SMS_108
(13)
其中,需要说明的是
Figure SMS_109
为数学领域中G(t)的简写形式,/>
Figure SMS_110
为数学领域中F(t)的简写形式/>
Figure SMS_111
为预设参数。因此,根据预设参数的值可得公式(13)的解即可以获得辅助变量由时域转换到S域获得第一辅助变量G与第二辅助变量的解如下所示:
Figure SMS_112
(14)
定义单层神经网络的估计即定义上述公式(10)的估计为:
Figure SMS_113
(15)
从而根据单层神经网络的估计获得权值的估计
Figure SMS_114
,并根据上述第一辅助变量的解与第二辅助变量的解构造获得第三辅助变量/>
Figure SMS_115
。其中,需要说明的是:第三辅助变量为:
Figure SMS_116
,/>
Figure SMS_117
为第一辅助变量的解,/>
Figure SMS_118
为第二辅助变量的解,且由上述可知/>
Figure SMS_119
为权值的估计。根据单层神经网络的估计获得权值的估计之后,基于权值的估计、第一辅助变量与第二辅助变量获得权值的估计误差,以将权值的估计误差作为单层评价神经网络的自适应律,其中,自适应律如下所示为:
Figure SMS_120
(16)
Figure SMS_121
为自适应律,/>
Figure SMS_122
为学习增益。在获得自适应律的值后将该自适应律进行回代,从而获得伺服系统的最优跟踪控制为:
Figure SMS_123
(17)
可见,根据预置权值的估计误差设计单层评价神经网络的自适应律,已实现单层评价神经网络权值的在线更新,并根据更新后的单层评价神经网络权值对最优瞬态控制进行更新赋值,最终得到伺服系统的最优跟踪控制,避免了现有技术中使用的执行神经网络,同时需要持续激励条件来保证设计算法的收敛的问题。基于本说明书实施例提供的图3中神经网络权值
Figure SMS_124
与其他方法的神经网络权值/>
Figure SMS_125
和/>
Figure SMS_126
进行对比的示意图,图4中跟踪性能的示意图,图4中/>
Figure SMS_127
伺服系统的第一实际状态变量,/>
Figure SMS_128
为第一理想状态变量,/>
Figure SMS_129
为伺服系统的第二实际状态变量,/>
Figure SMS_130
为第二理想状态变量,因此基于图4对比可知本说明书实施例中的跟踪控制方法使得实际跟踪性能的状态变量接近于理想跟踪性能的状态变量,即接近参考值。以及图5中基于最优控制下跟踪误差与标称控制下跟踪误差进行对比的示意图,可知,最优控制下具有更精确的跟踪精度。
进一步地,由图2所示本说明书实施例提供了一种伺服系统的跟踪控制逻辑示意图,本说明书一个或多个实施例中伺服系统的跟踪控制逻辑,在开始执行跟踪控制逻辑之后,具体包括以下步骤:
S1:建立伺服系统数学模型。
S2:建立最优跟踪目标函数。
S3:滤波得到辅助变量
Figure SMS_131
、/>
Figure SMS_132
并提取参数估计误差信息。
S4:计算矩阵
Figure SMS_133
最小特征值。若该最小特征值大于0则执行步骤S5,若该最小特征值小于0,则在输入力矩中加入干扰后,重新执行步骤S2建立最优跟踪目标函数及后续步骤。
S5:构建自适应律。
S6:应用最优跟踪控制。
也就是说在上述步骤S1-S6中,本说明书实施例首先建立伺服系统的数学模型,然后建立最优跟踪目标函数,进一步滤波获得辅助变量
Figure SMS_134
与/>
Figure SMS_135
并提取参数估计误差信息,然后第一辅助变量/>
Figure SMS_136
的解与第二辅助变量/>
Figure SMS_137
的解构造获得第三辅助变量/>
Figure SMS_138
。然后如图2所示为了实现自适应律的更新,在本说明书一个或多个实施例中,根据单层神经网络的估计获得权值的估计,并根据第一辅助变量的解与第二辅助变量的解构造第三辅助变量之后,方法还包括以下步骤:先计算第三辅助变量的最小特征值;其中,需要说明的是第三辅助变量为变量矩阵。如果能够确定最小特征值小于预设特征值,那么就在伺服系统的输入力矩中输入干扰,重新更新计算跟踪目标函数。其中,需要说明的是预设特征值为零。而如果确定最小特征值大于预设特征值即矩阵/>
Figure SMS_139
,则基于第三辅助变量构建自适应律。
如图6所示,本说明书一个或多个实施例提供了一种伺服系统的跟踪控制系统的内部结构示意图,由图6可知,本说明书一个或多个实施例中,一种伺服系统的跟踪控制系统,系统包括:
建立单元601,用于建立伺服系统的数学模型;
数据采集单元602,用于对所述伺服系统的输入力矩和输出轨迹进行采集,基于所述输出轨迹与所述理想输出轨迹确定所述伺服系统的跟踪误差;
方程建立单元603,用于根据所述跟踪误差与所述伺服系统的瞬态控制建立所述伺服系统的跟踪目标函数,并基于预置单层评价神经网络重构所述跟踪目标函数,以生成与所述跟踪目标函数相对应的最优贝尔曼方程;
确定单元604,用于根据所述最优贝尔曼方程,确定所述单层评价神经网络模型的权值以及所述伺服系统的最优瞬态控制;
更新单元705,用于根据预置所述权值的估计误差设计所述单层评价神经网络的自适应律以实现所述单层评价神经网络权值的在线更新,并根据更新后的单层评价神经网络权值更新所述最优瞬态控制,得到所述伺服系统的最优跟踪控制。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、设备、非易失性计算机存储介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
最后,应当理解的是,本说明书以上实施例仅用以说明本发明的技术方案,而非对其限制。尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (7)

1.一种伺服系统的跟踪控制方法,其特征在于,所述方法包括:
建立伺服系统的数学模型;
对所述伺服系统的输入力矩和实际输出轨迹进行采集,基于所述实际输出轨迹与理想输出轨迹确定所述伺服系统的跟踪误差;其中,所述理想输出轨迹基于所述伺服系统的数学模型获得;
根据所述跟踪误差与所述伺服系统的瞬态控制建立所述伺服系统的跟踪目标函数,并基于预置单层评价神经网络重构所述跟踪目标函数,以生成与所述跟踪目标函数相对应的最优贝尔曼方程;
根据所述最优贝尔曼方程,确定单层评价神经网络模型权值以及所述伺服系统的最优瞬态控制;
根据预置所述权值的估计误差设计所述单层评价神经网络的自适应律以实现所述单层评价神经网络权值的在线更新,并根据更新后的单层评价神经网络权值更新所述最优瞬态控制,得到所述伺服系统的最优跟踪控制;
其中,根据所述跟踪误差与所述伺服系统的瞬态控制建立伺服系统的跟踪目标函数,具体包括:
建立所述伺服系统的性能指标函数;其中,所述性能指标函数为:
Figure QLYQS_1
,其中,/>
Figure QLYQS_2
表示所述伺服系统的效用函数,R为性能指标函数的权值矩阵,/>
Figure QLYQS_3
为所述跟踪误差,/>
Figure QLYQS_4
为所述伺服系统的瞬态控制;
对所述性能指标函数求极小值以获得所述伺服系统的最优性能指标函数并将其作为所述伺服系统的跟踪目标函数;其中,所述最优性能指标函数为:
Figure QLYQS_5
其中,根据所述跟踪误差与所述伺服系统的瞬态控制建立伺服系统的跟踪目标函数之后,所述方法还包括:
基于所述跟踪目标函数与预设最优准则确定所述伺服系统的最优瞬态控制公式为:
Figure QLYQS_6
;其中,/>
Figure QLYQS_7
表示系统非线性动态,/>
Figure QLYQS_8
为所述伺服系统的转动惯量,/>
Figure QLYQS_9
为伺服系统的自定义系数,/>
Figure QLYQS_10
为所述伺服系统的力矩常数,/>
Figure QLYQS_11
为所述伺服系统的定子电阻;
所述基于预置单层评价神经网络重构所述跟踪目标函数,以生成与所述跟踪目标函数相对应的最优贝尔曼方程,具体包括:
根据预置激励函数、所述预置单层评价神经网络的权值与所述神经网络估计误差,重构所述跟踪目标函数生成单层评价神经网络;其中,所述单层评价神经网络为:
Figure QLYQS_12
;/>
Figure QLYQS_13
为激励函数,/>
Figure QLYQS_14
为神经网络权值,/>
Figure QLYQS_15
为神经网络估计误差;
定义所述伺服系统所对应的贝尔曼方程;其中,所述贝尔曼方程为:
Figure QLYQS_16
;其中,/>
Figure QLYQS_17
表示效用函数;
将所述单层评价神经网络重构所述贝尔曼方程,以获得所述跟踪目标函数相对应的最优贝尔曼方程;其中,所述最优贝尔曼方程为:
Figure QLYQS_18
,/>
Figure QLYQS_19
是积分强化学习项,/>
Figure QLYQS_20
,误差/>
Figure QLYQS_21
根据所述最优贝尔曼方程,确定单层评价神经网络模型权值以及所述伺服系统的最优瞬态控制,具体包括:
根据所述最优贝尔曼方程与所述单层评价神经网络的对应关系,确定所述单层评价神经模型网络权值;
根据所述最优贝尔曼方程对所述性能指标函数进行更新优化,以获得更新后的最优性能指标函数,从而将所述更新后的最优性能指标函数代入所述跟踪目标函数,以获得所述伺服系统的最优瞬态控制。
2.根据权利要求1所述的一种伺服系统的跟踪控制方法,其特征在于,所述建立伺服系统的数学模型,具体包括:
定义所述伺服系统的状态变量为:
Figure QLYQS_22
其中,
Figure QLYQS_23
为所述伺服系统的转角,/>
Figure QLYQS_24
为所述伺服系统的角速度;
根据所述伺服系统的状态变量确定所述伺服系统的状态空间方程,以将所述状态空间方程作为所述伺服系统的数学模型;其中,所述状态空间方程为:
Figure QLYQS_25
其中,
Figure QLYQS_27
为所述伺服系统的转动惯量,/>
Figure QLYQS_30
为所述伺服系统的系统控制,/>
Figure QLYQS_33
为伺服系统的自定义系数,/>
Figure QLYQS_28
表示伺服系统状态变量的自定义调整系数,/>
Figure QLYQS_29
表示伺服系统外部干扰,/>
Figure QLYQS_32
为所述伺服系统的力矩常数,/>
Figure QLYQS_35
为所述伺服系统的定子电阻,
Figure QLYQS_26
,/>
Figure QLYQS_31
为极点数,/>
Figure QLYQS_34
转子磁链值。
3.根据权利要求2所述的一种伺服系统的跟踪控制方法,其特征在于,所述建立伺服系统的数学模型之后,所述方法还包括:
根据所述伺服系统的动态相关函数对所述状态空间方程进行处理,以获得与所述状态空间方程相对应的简化状态空间方程;
其中,所述根据所述伺服系统的动态相关函数对所述状态空间方程进行处理,以获得与所述状态空间方程相对应的简化状态空间方程,具体包括:
根据所述状态空间方程确定所述伺服系统的非线性动态;
基于所述伺服系统的非线性动态对所述状态空间方程进行简化处理,以获得与所述状态空间方程相对应的简化状态空间方程;其中,所述简化状态空间方程为:
Figure QLYQS_36
;其中,/>
Figure QLYQS_37
与/>
Figure QLYQS_38
表示系统非线性动态。
4.根据权利要求3所述的一种伺服系统的跟踪控制方法,其特征在于,所述基于所述实际输出轨迹与所述理想输出轨迹确定所述伺服系统的跟踪误差,具体包括:
基于所述理想输出轨迹与所述实际输出轨迹的差值,确定所述伺服系统的跟踪误差;其中,所述跟踪误差为:
Figure QLYQS_39
;其中,/>
Figure QLYQS_40
为所述跟踪误差,/>
Figure QLYQS_41
为所述理想输出轨迹,/>
Figure QLYQS_42
为所述实际输出轨迹;
其中,确定所述伺服系统的跟踪误差之后,所述方法还包括:
将所述伺服系统的系统控制分解为稳态控制与瞬态控制,其中,所述稳态控制为:
Figure QLYQS_43
Figure QLYQS_44
表示反馈控制增益,/>
Figure QLYQS_45
为/>
Figure QLYQS_46
的伪逆;
根据所述伺服系统的系统控制与所述跟踪误差,建立所述伺服系统的误差动态为:
Figure QLYQS_47
,/>
Figure QLYQS_48
为所述伺服系统的瞬态控制。
5.根据权利要求1所述的一种伺服系统的跟踪控制方法,其特征在于,所述根据预置所述权值的估计误差确定所述单层评价神经网络的自适应律,具体包括:
构造辅助变量;其中,所述辅助变量包括:第一辅助变量与第二辅助变量;
基于所述辅助变量的预设参数获得所述辅助变量的解;
根据单层神经网络获得所述权值的估计,并根据所述第一辅助变量的解与所述第二辅助变量的解构造第三辅助变量;其中,所述第三辅助变量为:
Figure QLYQS_49
,/>
Figure QLYQS_50
为第一辅助变量的解,/>
Figure QLYQS_51
为第二辅助变量的解,/>
Figure QLYQS_52
为所述权值的估计;
根据单层神经网络获得所述权值的估计,以基于所述权值的估计、所述第一辅助变量与第二辅助变量获得所述权值的估计误差,以将所述权值的估计误差作为所述单层评价神经网络的自适应律;其中,所述自适应律为:
Figure QLYQS_53
,/>
Figure QLYQS_54
为自适应律,/>
Figure QLYQS_55
为学习增益。
6.根据权利要求5所述的一种伺服系统的跟踪控制方法,其特征在于,所述根据单层神经网络获得所述权值的估计,并根据所述第一辅助变量的解与所述第二辅助变量的解构造第三辅助变量之后,所述方法还包括:
计算所述第三辅助变量的最小特征值;其中,所述第三辅助变量为变量矩阵;
若确定所述最小特征值小于预设特征值,则在所述伺服系统的输入力矩中加入干扰,以更新所述跟踪目标函数;其中,所述预设特征值为零;
若确定所述最小特征值大于预设特征值,则基于所述第三辅助变量构建所述自适应律。
7.一种伺服系统的跟踪控制系统,其特征在于,所述系统包括:
建立单元,用于建立伺服系统的数学模型;
数据采集单元,用于对所述伺服系统的输入力矩和实际输出轨迹进行采集,基于所述实际输出轨迹与理想输出轨迹确定所述伺服系统的跟踪误差;其中,所述理想输出轨迹基于所述伺服系统的数学模型获得;
方程建立单元,用于根据所述跟踪误差与所述伺服系统的瞬态控制建立所述伺服系统的跟踪目标函数,并基于预置单层评价神经网络重构所述跟踪目标函数,以生成与所述跟踪目标函数相对应的最优贝尔曼方程;
确定单元,用于根据所述最优贝尔曼方程,确定单层评价神经网络模型权值以及所述伺服系统的最优瞬态控制;
更新单元,用于根据预置所述权值的估计误差设计所述单层评价神经网络的自适应律以实现所述单层评价神经网络权值的在线更新,并根据更新后的单层评价神经网络权值更新所述最优瞬态控制,得到所述伺服系统的最优跟踪控制;
其中,根据所述跟踪误差与所述伺服系统的瞬态控制建立伺服系统的跟踪目标函数,具体包括:
建立所述伺服系统的性能指标函数;其中,所述性能指标函数为:
Figure QLYQS_56
,其中,/>
Figure QLYQS_57
表示所述伺服系统的效用函数,R为性能指标函数的权值矩阵,/>
Figure QLYQS_58
为所述跟踪误差,/>
Figure QLYQS_59
为所述伺服系统的瞬态控制;
对所述性能指标函数求极小值以获得所述伺服系统的最优性能指标函数并将其作为所述伺服系统的跟踪目标函数;其中,所述最优性能指标函数为:
Figure QLYQS_60
其中,根据所述跟踪误差与所述伺服系统的瞬态控制建立伺服系统的跟踪目标函数之后,还包括:
基于所述跟踪目标函数与预设最优准则确定所述伺服系统的最优瞬态控制公式为:
Figure QLYQS_61
;其中,/>
Figure QLYQS_62
表示系统非线性动态,/>
Figure QLYQS_63
为所述伺服系统的转动惯量,/>
Figure QLYQS_64
为伺服系统的自定义系数,/>
Figure QLYQS_65
为所述伺服系统的力矩常数,/>
Figure QLYQS_66
为所述伺服系统的定子电阻;
所述基于预置单层评价神经网络重构所述跟踪目标函数,以生成与所述跟踪目标函数相对应的最优贝尔曼方程,具体包括:
根据预置激励函数、所述预置单层评价神经网络的权值与所述神经网络估计误差,重构所述跟踪目标函数生成单层评价神经网络;其中,所述单层评价神经网络为:
Figure QLYQS_67
;/>
Figure QLYQS_68
为激励函数,/>
Figure QLYQS_69
为神经网络权值,/>
Figure QLYQS_70
为神经网络估计误差;
定义所述伺服系统所对应的贝尔曼方程;其中,所述贝尔曼方程为:
Figure QLYQS_71
;其中,/>
Figure QLYQS_72
表示效用函数;
将所述单层评价神经网络重构所述贝尔曼方程,以获得所述跟踪目标函数相对应的最优贝尔曼方程;其中,所述最优贝尔曼方程为:
Figure QLYQS_73
,/>
Figure QLYQS_74
是积分强化学习项,/>
Figure QLYQS_75
,误差/>
Figure QLYQS_76
根据所述最优贝尔曼方程,确定单层评价神经网络模型权值以及所述伺服系统的最优瞬态控制,具体包括:
根据所述最优贝尔曼方程与所述单层评价神经网络的对应关系,确定所述单层评价神经模型网络权值;
根据所述最优贝尔曼方程对所述性能指标函数进行更新优化,以获得更新后的最优性能指标函数,从而将所述更新后的最优性能指标函数代入所述跟踪目标函数,以获得所述伺服系统的最优瞬态控制。
CN202310436394.4A 2023-04-23 2023-04-23 一种伺服系统的跟踪控制方法及系统 Active CN116149262B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310436394.4A CN116149262B (zh) 2023-04-23 2023-04-23 一种伺服系统的跟踪控制方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310436394.4A CN116149262B (zh) 2023-04-23 2023-04-23 一种伺服系统的跟踪控制方法及系统

Publications (2)

Publication Number Publication Date
CN116149262A CN116149262A (zh) 2023-05-23
CN116149262B true CN116149262B (zh) 2023-07-04

Family

ID=86374003

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310436394.4A Active CN116149262B (zh) 2023-04-23 2023-04-23 一种伺服系统的跟踪控制方法及系统

Country Status (1)

Country Link
CN (1) CN116149262B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105867136A (zh) * 2016-05-16 2016-08-17 北京理工大学 基于参数辨识的多电机伺服系统同步与跟踪控制方法
CN108762088A (zh) * 2018-06-20 2018-11-06 山东科技大学 一种迟滞非线性伺服电机系统滑模控制方法
CN110750050A (zh) * 2019-10-11 2020-02-04 浙江工业大学 一种基于神经网络的机械臂系统预设性能控制方法
CN110802589A (zh) * 2019-10-23 2020-02-18 山东科技大学 一种工业机器人单关节伺服控制的迟滞补偿方法
CN113103237A (zh) * 2021-04-25 2021-07-13 长春工业大学 一种面向未知环境约束的可重构机械臂控制方法及系统
CN114434441A (zh) * 2021-12-31 2022-05-06 中南大学 基于自适应动态规划的移动机器人视觉伺服跟踪控制方法
CN114859847A (zh) * 2022-03-11 2022-08-05 四川大学 一种适用于互联非线性系统的可靠优化控制系统及方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9134707B2 (en) * 2012-03-30 2015-09-15 Board Of Regents, The University Of Texas System Optimal online adaptive controller
US10896383B2 (en) * 2014-08-07 2021-01-19 Okinawa Institute Of Science And Technology School Corporation Direct inverse reinforcement learning with density ratio estimation
US10065654B2 (en) * 2016-07-08 2018-09-04 Toyota Motor Engineering & Manufacturing North America, Inc. Online learning and vehicle control method based on reinforcement learning without active exploration
CN109946975B (zh) * 2019-04-12 2020-04-24 北京理工大学 一种未知伺服系统的强化学习最优跟踪控制方法
CN109976161B (zh) * 2019-04-23 2022-04-08 哈尔滨工业大学 一种不确定非线性系统的有限时间优化跟踪控制方法
CN115079569A (zh) * 2022-06-17 2022-09-20 山东科技大学 一种基于天牛须搜索算法的agv非线性自抗扰控制方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105867136A (zh) * 2016-05-16 2016-08-17 北京理工大学 基于参数辨识的多电机伺服系统同步与跟踪控制方法
CN108762088A (zh) * 2018-06-20 2018-11-06 山东科技大学 一种迟滞非线性伺服电机系统滑模控制方法
CN110750050A (zh) * 2019-10-11 2020-02-04 浙江工业大学 一种基于神经网络的机械臂系统预设性能控制方法
CN110802589A (zh) * 2019-10-23 2020-02-18 山东科技大学 一种工业机器人单关节伺服控制的迟滞补偿方法
CN113103237A (zh) * 2021-04-25 2021-07-13 长春工业大学 一种面向未知环境约束的可重构机械臂控制方法及系统
CN114434441A (zh) * 2021-12-31 2022-05-06 中南大学 基于自适应动态规划的移动机器人视觉伺服跟踪控制方法
CN114859847A (zh) * 2022-03-11 2022-08-05 四川大学 一种适用于互联非线性系统的可靠优化控制系统及方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
一种新型的焊接机器人控制器;张超;王琦;姚永刚;王鑫;雷晶;;电焊机(06);全文 *
基于ADP的一类时滞离散系统跟踪控制;林小峰;杨晓娜;黄清宝;宋春宁;;广西大学学报(自然科学版)(06);全文 *

Also Published As

Publication number Publication date
CN116149262A (zh) 2023-05-23

Similar Documents

Publication Publication Date Title
Na et al. Adaptive control for nonlinear pure-feedback systems with high-order sliding mode observer
Hosseini-Suny et al. Model reference adaptive control design for a teleoperation system with output prediction
CN105867138B (zh) 一种基于pid控制器的稳定平台控制方法及装置
CN111290263B (zh) 一种改进的基于rbfnn及bas的pid最优化控制算法
CN111273544B (zh) 基于预测rbf前馈补偿型模糊pid的雷达俯仰运动控制方法
CN104270055A (zh) 一种交流伺服系统位置环ip控制器的参数自校正方法
CN114839880B (zh) 一种基于柔性关节机械臂的自适应控制方法
CN116991068A (zh) 基于分布式预设时间梯度下降法的电机控制方法及系统
CN107065559B (zh) 一种工业机器人增量自适应控制方法
CN111930010A (zh) 一种基于lstm网络的通用mfa控制器设计方法
CN116149262B (zh) 一种伺服系统的跟踪控制方法及系统
Zhang et al. Identifier-based adaptive robust control for servomechanisms with improved transient performance
CN111531543B (zh) 基于生物启发式神经网络的机器人自适应阻抗控制方法
CN106033189A (zh) 飞行机器人位姿神经网络预测控制器
CN116512256A (zh) 基于联合学习的机器人最优人机交互阻抗控制方法、存储介质及机器人
CN115180461B (zh) 新能源汽车压缩机电机生产装备的张力数据驱动控制方法
CN115981159A (zh) 基于模型辅助和类史密斯预估的广义改进自抗扰控制方法
JP7469476B2 (ja) 制御支援装置、制御システム及び制御支援方法
Ruusu et al. Sliding mode SISO control of model parameters for implicit dynamic feedback estimation of industrial tracking simulation systems
CN109039166B (zh) 一种永磁同步直线伺服系统速度环pi-ip控制参数自校正方法
CN113359452B (zh) 基于Barzilai Borwein智能学习算法的控制器设计方法、系统
AYDOĞDU et al. Adaptive control of a time-varying rotary servo system using a fuzzy model reference learning controller with variable adaptation gain
JP7409343B2 (ja) コントローラ、制御方法及び制御プログラム
CN111781821B (zh) SISO紧格式无模型控制器基于Attention机制循环神经网络的参数自整定方法
CN112015081B (zh) Siso紧格式无模型控制器基于pso-lstm协同算法的参数自整定方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant