CN112987564A - 一种基于策略迭代的伺服电机自适应智能控制方法 - Google Patents

一种基于策略迭代的伺服电机自适应智能控制方法 Download PDF

Info

Publication number
CN112987564A
CN112987564A CN202110142255.1A CN202110142255A CN112987564A CN 112987564 A CN112987564 A CN 112987564A CN 202110142255 A CN202110142255 A CN 202110142255A CN 112987564 A CN112987564 A CN 112987564A
Authority
CN
China
Prior art keywords
servo motor
function
strategy
equation
matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110142255.1A
Other languages
English (en)
Inventor
朱俊威
夏振浩
王波
顾曹源
吴麒
张文安
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University of Technology ZJUT
Original Assignee
Zhejiang University of Technology ZJUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University of Technology ZJUT filed Critical Zhejiang University of Technology ZJUT
Priority to CN202110142255.1A priority Critical patent/CN112987564A/zh
Publication of CN112987564A publication Critical patent/CN112987564A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Feedback Control In General (AREA)

Abstract

一种基于策略迭代的伺服电机自适应智能控制方法,首先对伺服电机系统进行系统辨识,确定其传递函数,该步骤仅用于在仿真时获取伺服电机下一时刻的位置和速度信息;然后根据系统的传递函数建立伺服电机的状态空间方程并离散化。给定伺服电机一个初始速度,并从伺服电机的单一轨迹中采集系统的位置和速度信息,对采集到的位置和速度信息处理之后进行最小二乘,得到使系统损失函数最小的参数向量p,从而推导出系统的权值矩阵P,最后根据权值矩阵P计算出当前时刻下的最优反馈控制。本发明基于策略迭代的半无模型的算法来解决线性、连续、时不变系统系统的最优控问题。在不需要知道系统内部动态模型的情况下在线解决LQR问题。

Description

一种基于策略迭代的伺服电机自适应智能控制方法
技术领域
本发明属于自适应控制领域,具体提供一种基于策略迭代的伺服电机自适应智能控制方法,这种方法能够在没有系统模型的情况下获得伺服电机系统的最优反馈控制并且最小化伺服电机的损失函数。
背景技术
从强化学习概念的提出至今已有非常多的理论成果,但是由于强化学习方法计算量大,计算复杂度较高,并且缺乏需高速运算设备的支持,所以很难将强化学习的方法引入到实际的运动控制系统当时中。但是,随着计算机科学技术的高速发展,计算机和单片机的运算速度大幅度提高,提高了在实际运动控制系统运用强化学习算法解决最优反馈控制问题的可行性。
针对解决最优反馈控制问题,传统的技术方法是首先对系统进行模型辨识,得到系统的模型,进而设计最优反馈控制器,传统的控制器有H无穷控制器,或者通过解线性矩阵不等式来获得系统的可行解。但是,传统的技术存在着局限性,这种局限性是由于实际系统存在不确定性导致的,包括系统模型的不确定性以及系统外部的扰动。使用传统的方法时,系统的模型是必需的,并且模型的精度直接影响控制的准确性,即使模型可用,基于该模型获得的状态反馈控制器也仅适用于真实系统动力学的近似模型。除此之外,时变系统最优控制运用到实际系统中操作困难,成本代价高,性能一般,实际的使用价值底,因而通过数据驱动的方法,使用系统的输入输出数据来计算系统的最优控制显的很有必要。因此,为了在不需要系统模型的情况下获得系统的最优控制器,最小化系统的损失函数,本发明使用了强化学习中策略迭代的方法,在线学习伺服电机的最佳反馈控制策略。
发明内容
本发明专利所考虑的具有物理特征的实体对象如图1所示,其主要由上位机、ARM微处理器、AC伺服系统、伺服电机、电源及开关和CAN总线组成。其中,上位机主要的工作是通过TCP/IP协议接收来自ARM微处理器的数据,并运行内嵌的控制算法,随后发送控制指令至ARM微处理器。ARM微处理器作为数据的中转站,通过CAN总线从伺服系统中获得伺服电机的速度、位置、力矩等信息,并将这些信息传输给上位机,同时接收上位机的控制指令并将其下发至伺服系统,伺服控制系统中数据信号的传递过程如图2所示。AC伺服系统具体型号为台达ASDA-A2系列的高性能通讯型伺服驱动器,其作用是实时响应PC机的控制指令,驱动伺服电机执行相应的动作。电源及开关则负责系统的上电断电。
为了获取伺服电机的最佳控制策略,本发明提供了一种基于策略迭代的伺服电机自适应智能控制方法,具体地说,本发明提供的方法基于策略迭代的半无模型的算法来解决线性、连续、时不变系统系统的最优控问题。在不需要知道系统内部动态模型的情况下在线解决LQR问题。
本发明为解决上述技术问题提供了如下技术方案:
一种基于策略迭代的伺服电机自适应智能控制方法,包括以下步骤:
步骤1),对伺服电机进行模型辨识,确定系统传递函数,伺服电机的系统模型仅用于在仿真时获取伺服电机下一时刻的位置和速度信息:
通过辨识系统,得到了伺服电机的传递函数如式(1)所示:
Figure BDA0002929200640000021
其中G(s)为伺服电机的传递函数,Ks、Ts为辨识出来的参数,其具体数值为Ks=0.08373,Ts=0.02433;
步骤2),建立运动控制系统状态空间方程并离散化,过程如下:
在步骤1)的基础上将其转化为状态空间方程,如式(2):
Figure BDA0002929200640000022
其中
Figure BDA0002929200640000023
将上述的状态空间方程离散化,如式(3):
Figure BDA0002929200640000024
其中A为系统的状态矩阵,B为输入矩阵,x表示系统状态量,u为系统输入。
步骤3),从伺服电机中采集当前电机的位置和速度,并计算当前时刻电机位置和速度相比上一时刻的增量以及系统在当前时刻的损失函数,最后通过最小二乘法计算当前状态下的最优的权值矩阵P,过程如下:
设计新的策略迭代方法:在(A,B)稳定的假设下,令K是(2)式的一个稳定性反馈增益,因此
Figure BDA0002929200640000031
是一个稳定的闭环系统,那么对应的无边界系统的二次损失函数表示为
Figure BDA0002929200640000032
其中P是李雅普诺夫方程的一个实对称正定解,Q和是R是正定参数,
Figure BDA0002929200640000033
(A-BK)TP+P(A-BK)=-(KTRK+Q)
V(x(t))作为(1)式系统状态方程带有反馈控制K的李雅普诺夫函数,因此损失函数表示为
Figure BDA0002929200640000034
基于上式(6),用xt来表示x(t)对价值函数进行参数化V(xt)=xt TPxt,并考虑初始的稳定控制增益是K0,在线实施以下策略迭代方案:
Figure BDA0002929200640000035
Ki+1=R-1BTPi (8)
上式(7)、(8)制定了新的迭代策略,并且在迭代过程中不需要涉及系统矩阵A。
步骤4),寻找损失函数最小的参数P矩阵以及相关联的控制策略Ki
步骤5),判断状态的增量是否小于ε,若不满足条件则继续更新策略K进行状态反馈,过程如下:
系统中存在一个评价函数用来计算伺服电机当前位置和速度与上一时刻位置和速度之间的差值,当差值小于设定的阈值时,系统的控制策略将不再更新,反之则继续更新策略K。
进一步,所述步骤4)的过程为:
4.1)将系统价值函数表示为向量乘积的形式,过程如下:
将系统的价值函数xT(t)Pix(t)表示为
Figure BDA0002929200640000041
的形式,其中
Figure BDA0002929200640000042
表示Kronecker积二次多项式的基向量,向量中元素为{xi(t)xj(t)}i=1,n;j=i,n
Figure BDA0002929200640000043
其中v(.)是作用于对称矩阵的向量值矩阵函数,通过堆叠对称矩阵对角线和上三角部分的元素返回列向量,其中非对角线元素取为2Pij
4.2)计算系统的价值函数在时间[t,t+T]上的积分:
式(7)表示为
Figure BDA0002929200640000044
在这个方程中,
Figure BDA0002929200640000045
是一个未知参数的向量,
Figure BDA0002929200640000046
作为回归向量,将右侧的目标函数记作
Figure BDA0002929200640000047
也就是系统的价值函数在[t,t+T]上的积分;
Figure BDA0002929200640000048
是通过系统状态在时间[t,t+T]上的积分得到的;
4.3)通过最小二乘法来计算最优的Pi的矩阵使得系统的值函数最小:
首先沿着系统的单一状态轨迹采集到足够的位置和速度信息,对这些位置和速度信息进行处理后得到系统的值函数
Figure BDA0002929200640000049
以及回归向量
Figure BDA00029292006400000410
则可使用最小二乘法计算出使当前时刻值函数最小的参数向量
Figure BDA00029292006400000411
然后可以从参数向量
Figure BDA00029292006400000412
计算出的参数矩阵P,从而根据式(8)计算出新的控制策略Ki+1。使系统值函数最小的参数向量可以通过最小二乘法获得,计算过程如下:
Figure BDA00029292006400000413
其中,
Figure BDA00029292006400000414
本发明的有益效果为:基于策略迭代的半无模型的算法来解决线性、连续、时不变系统系统的智能控问题。在不需要知道系统内部动态模型的情况下在线解决LQR问题。
附图说明
图1是伺服控制系统数据信号传递过程框图;
图2是系统的权值矩阵参数变化仿真图;
图3是系统的状态变化仿真图;
图4是系统的反馈输入仿真图;
图5是自适应控制下系统损失函数变化图;
图6是实际运动系统的权值参数变化图;
图7是实际运动系统的状态变化图;
图8是实际运动系统的输入变化图;
图9是固定反馈增益下的系统状态图;
图10是固定反馈增益下系统损失函数变化图。
具体实施方式
为使本发明的目的、技术方案和优点更加清晰,下面结合附图和实际实验对本发明的技术方案作进一步描述。
参照图1~图10,一种基于策略迭代的伺服电机自适应智能控制方法,首先对伺服电机系统进行系统辨识,确定其传递函数,该步骤仅用于在仿真时获取伺服电机下一时刻的位置和速度信息;然后根据系统的传递函数建立伺服电机的状态空间方程并离散化。给定伺服电机一个初始速度,并从伺服电机的单一轨迹中采集系统的位置和速度信息,对采集到的位置和速度信息处理之后进行最小二乘,得到使系统损失函数最小的参数向量
Figure BDA0002929200640000051
从而推导出系统的权值矩阵P,最后根据权值矩阵P计算出当前时刻下的最优反馈控制。
本实施例的基于策略迭代的伺服电机自适应智能控制方法,包括以下步骤:
1)确定伺服电机的传递函数;
2)建立伺服电机系统的状态空间方程并离散化;
3)通过最小二乘法计算当前状态下的最优的权值矩阵P;
4)寻找损失函数最小的权值矩阵P以及相关联的控制策略Ki
5)计算电机位置和速度的增量并判断是否继续更新策略。
进一步,所述步骤1)中,确定伺服电机系统的传递函数,过程如下:
伺服电机的系统模型仅用于在仿真时获取伺服电机下一时刻的位置和速度信息。通过系统辨识,确定伺服电机的传递函数如式(1)所示:
Figure BDA0002929200640000061
其中G(s)为伺服电机的传递函数,Ks=0.08373,Ts=0.02433为辨识出来的参数;
进一步,所述步骤2)中,建立伺服电机的状态空间方程并离散化,过程如下:
将上述传递函数转换为状态空间方程
Figure BDA0002929200640000062
其中状态矩阵
Figure BDA0002929200640000063
输入矩阵
Figure BDA0002929200640000064
并对其离散化,如式(2)所示:
Figure BDA0002929200640000065
伺服电机系统的采样时间T设置为0.05s,则离散化后的系统状态矩阵
Figure BDA0002929200640000066
输入矩阵
Figure BDA0002929200640000067
x表示系统状态量,设定系统的初始位置为2,初始速度为10,则系统的状态为x=[2 10]T,u为系统输入,并令u=-Kx(t),设定系统的初始策略为K0=[0 0.1];
进一步,所述步骤3)中,从运动控制系统中采集伺服电机当前的位置和速度信息,并计算位置和速度的增量以及系统在当前时刻的价值函数,最后通过最小二乘法计算当前状态下的最优的权值矩阵P,具体过程如下:
3.1)设计新的策略迭代方法:
在(A,B)稳定的假设下,令K0是(2)式的一个稳定性增益,因此是一个稳定的闭环系统,那么对应的无边界系统的二次损失函数可以表示为
Figure BDA0002929200640000071
其中P是李雅普诺夫方程的一个实对称正定解,Q和是R是正定参数,
Figure BDA0002929200640000072
(A-BK)TP+P(A-BK)=-(KTRK+Q) (5)
V(x(t))作为(1)式系统状态方程带有反馈控制K的李雅普诺夫函数,因此损失函数可以表示为
Figure BDA0002929200640000073
基于上式,用xt来表示x(t)对价值函数进行参数化V(xt)=xt TPxt,并考虑初始的稳定控制增益是K0,可以在线实施以下策略迭代方案:
Figure BDA0002929200640000074
Ki+1=R-1BTPi (8)
上式(8)制定了新的迭代策略,并且在迭代过程中不需要涉及系统矩阵A。
步骤4),寻找损失函数最小的参数P矩阵以及相关联的控制策略Ki
4.1)根据电机的位置速度信息计算出基向量
Figure BDA0002929200640000075
过程如下:
将系统的价值函数xT(t)Pix(t)表示为
Figure BDA0002929200640000076
的形式,其中
Figure BDA0002929200640000077
表示Kronecker积二次多项式的基向量,向量中元素为
Figure BDA0002929200640000078
其中v(.)是作用于对称矩阵的向量值矩阵函数,通过堆叠对称矩阵对角线和上三角部分的元素返回列向量,其中非对角线元素取为2Pij
Figure BDA0002929200640000079
首先,上位机给伺服电机下发一个初始速度,并使电机保持初始速度运行10s,从第10s开始加入反馈控制,加入反馈控制之后,伺服系统需要沿着电机的单一状态轨迹每隔0.05s采集一次的伺服电机位置和速度信息,并将位置和速度信息上传给上位机。上位机得到3组电机位置和速度信息之后需要更新一次电机的反馈控制增益。所以,每次采集伺服电机的位置和速度信息之后,需要进行数据的处理,变成二次多项式的基向量
Figure BDA0002929200640000081
的形式,并依次存放在一个3×3维的矩阵X之中,X是最小二乘法计算
Figure BDA00029292006400000816
向量的一个矩阵。
4.2)计算系统的损失函数在时间[t,t+T]上的积分:
式(7)可以表示为
Figure BDA0002929200640000082
在这个方程中,
Figure BDA0002929200640000083
是一个未知参数的向量,
Figure BDA0002929200640000084
作为回归向量,将右侧的目标函数记作
Figure BDA0002929200640000085
也就是系统的损失函数在[t,t+T]上的积分。
Figure BDA0002929200640000086
伺服电机系统将电机的位置和速度信息发给上位机,上位机每隔0.05s需要计算一次
Figure BDA0002929200640000087
并依次存放在一个3×1维的向量Y之中,Y是最小二乘法计算
Figure BDA0002929200640000088
向量的一个矩阵。
4.3)通过最小二乘法来计算最优的Pi的矩阵使得系统的损失函数最小:
当上位机得到伺服系统传来的3组数据之后,对上述步骤中得到的X和Y矩阵进行最小二乘,计算出使伺服电机系统损失函数最小化的参数向量
Figure BDA0002929200640000089
因此可以从参数向量
Figure BDA00029292006400000810
计算权值矩阵P,从而根据式(8)计算出新的控制策略Ki+1。使系统损失函数最小的参数向量可以通过以下最小二乘法获得:
Figure BDA00029292006400000811
其中,
Figure BDA00029292006400000812
Figure BDA00029292006400000813
Figure BDA00029292006400000814
当系统收敛时的参数矩阵
Figure BDA00029292006400000815
最优反馈控制K*=[5.4460.177]。
步骤5),在伺服电机的上位机控制程序之中设定一个判断阈值ε=10-4,并判断伺服电机位置和速度的增量是否小于ε,若系统位置和速度增量大于ε则继续更新策略K进行状态反馈,反之系统状态变量的增量小于ε则停止更新策略。
从实验结果可以看出,本发明能够在没有给定伺服电机初始反馈控制增益的情况下,系统能够自动更新到最佳的反馈控制增益,并得到最小的损失函数。相比与固定反馈增益下的系统有更好的动态性能,调节时间更快,系统损失函数减小更加迅速,从实际的能量损耗方面看,自适应反馈控制下的系统相比固定反馈增益的系统而言,能够使用更少的能量来到达很好的系统性能。自适应反馈控制的这种优势对实际的电机伺服系统具有重要的意义。
本说明书的实施例所述的内容仅仅是对发明构思的实现形式的列举,仅作说明用途。本发明的保护范围不应当被视为仅限于本实施例所陈述的具体形式,本发明的保护范围也及于本领域的普通技术人员根据本发明构思所能想到的等同技术手段。

Claims (2)

1.一种基于策略迭代的伺服电机自适应智能控制方法,其特征在于,所述方法包括以下步骤:
步骤1),对伺服电机进行模型辨识,确定系统传递函数,伺服电机的系统模型仅用于在仿真时获取伺服电机下一时刻的位置和速度信息:
通过辨识系统,得到了伺服电机的传递函数如式(1)所示:
Figure FDA0002929200630000011
其中G(s)为伺服电机的传递函数,Ks、Ts为辨识出来的参数;
步骤2),建立运动控制系统状态空间方程并离散化,过程如下:
在步骤1)的基础上将其转化为状态空间方程,如式(2):
Figure FDA0002929200630000012
其中
Figure FDA0002929200630000013
将上述的状态空间方程离散化,如式(3):
Figure FDA0002929200630000014
其中A为系统的状态矩阵,B为输入矩阵,x表示系统状态量,u为系统输入;
步骤3),从伺服电机中采集当前电机的位置和速度,并计算当前时刻电机位置和速度相比上一时刻的增量以及系统在当前时刻的损失函数,最后通过最小二乘法计算当前状态下的最优的权值矩阵P,过程如下:
设计新的策略迭代方法:在(A,B)稳定的假设下,令K是(2)式的一个稳定性反馈增益,因此
Figure FDA0002929200630000015
是一个稳定的闭环系统,那么对应的无界系统的二次损失函数表示为
Figure FDA0002929200630000021
其中P是李雅普诺夫方程的一个实对称正定解,Q和是R是正定参数,
Figure FDA0002929200630000022
(A-BK)TP+P(A-BK)=-(KTRK+Q)
V(x(t))作为(1)式系统状态方程带有反馈控制K的李雅普诺夫函数,因此损失函数表示为
Figure FDA0002929200630000023
基于上式(6),用xt来表示x(t)对价值函数进行参数化
Figure FDA0002929200630000024
并考虑初始的稳定控制增益是K0,在线实施以下策略迭代方案:
Figure FDA0002929200630000025
Ki+1=R-1BTPi (8)
上式(7)、(8)制定了新的迭代策略,并且在迭代过程中不需要涉及系统矩阵A;
步骤4),寻找损失函数最小的参数P矩阵以及相关联的控制策略Ki
步骤5),判断状态的增量是否小于ε,若不满足条件则继续更新策略K进行状态反馈,过程如下:
系统中存在一个评价函数用来计算伺服电机当前位置和速度与上一时刻位置和速度之间的差值,当差值小于设定的阈值时,系统的控制策略将不再更新,反之则继续更新策略K。
2.如权利要求1所述的一种基于策略迭代的伺服电机自适应智能控制方法,其特征在于,所述步骤4)的过程为:
4.1)将系统价值函数表示为向量乘积的形式,过程如下:
将系统的价值函数xT(t)Pix(t)表示为
Figure FDA0002929200630000026
的形式,其中
Figure FDA0002929200630000027
表示Kronecker积二次多项式的基向量,向量中元素为{xi(t)xj(t)}i=1,n;j=i,n
Figure FDA0002929200630000028
其中v(.)是作用于对称矩阵的向量值矩阵函数,通过堆叠对称矩阵对角线和上三角部分的元素返回列向量,其中非对角线元素取为2Pij
4.2)计算系统的价值函数在时间[t,t+T]上的积分:
式(7)表示为
Figure FDA0002929200630000029
在这个方程中,
Figure FDA0002929200630000031
是一个未知参数的向量,
Figure FDA0002929200630000032
作为回归向量,将右侧的目标函数记作
Figure FDA0002929200630000033
也就是系统的价值函数在[t,t+T]上的积分;
Figure FDA0002929200630000034
是通过系统状态在时间[t,t+T]上的积分得到的;
4.3)通过最小二乘法来计算最优的Pi的矩阵使得系统的值函数最小:
首先沿着系统的单一状态轨迹采集到足够的位置和速度信息,对这些位置和速度信息进行处理后得到系统的值函数
Figure FDA0002929200630000035
以及回归向量
Figure FDA0002929200630000036
则可使用最小二乘法计算出使当前时刻值函数最小的参数向量
Figure FDA0002929200630000037
然后从参数向量
Figure FDA0002929200630000038
计算出的参数矩阵P,从而根据式(8)计算出新的控制策略Ki+1,使系统值函数最小的参数向量可以通过最小二乘法获得,计算过程如下:
Figure FDA0002929200630000039
其中,
Figure FDA00029292006300000310
CN202110142255.1A 2021-02-02 2021-02-02 一种基于策略迭代的伺服电机自适应智能控制方法 Pending CN112987564A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110142255.1A CN112987564A (zh) 2021-02-02 2021-02-02 一种基于策略迭代的伺服电机自适应智能控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110142255.1A CN112987564A (zh) 2021-02-02 2021-02-02 一种基于策略迭代的伺服电机自适应智能控制方法

Publications (1)

Publication Number Publication Date
CN112987564A true CN112987564A (zh) 2021-06-18

Family

ID=76346117

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110142255.1A Pending CN112987564A (zh) 2021-02-02 2021-02-02 一种基于策略迭代的伺服电机自适应智能控制方法

Country Status (1)

Country Link
CN (1) CN112987564A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107490962A (zh) * 2017-08-08 2017-12-19 北京理工大学 一种数据驱动的伺服系统最优控制方法
CN107561929A (zh) * 2017-07-25 2018-01-09 北京理工大学 一种伺服系统的无模型鲁棒自适应优化方法
CN109946975A (zh) * 2019-04-12 2019-06-28 北京理工大学 一种未知伺服系统的强化学习最优跟踪控制方法
CN111722531A (zh) * 2020-05-12 2020-09-29 天津大学 一种切换线性系统在线无模型最优控制方法
CN111740658A (zh) * 2020-04-29 2020-10-02 南京理工大学 基于策略迭代的电机系统最优调节控制方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107561929A (zh) * 2017-07-25 2018-01-09 北京理工大学 一种伺服系统的无模型鲁棒自适应优化方法
CN107490962A (zh) * 2017-08-08 2017-12-19 北京理工大学 一种数据驱动的伺服系统最优控制方法
CN109946975A (zh) * 2019-04-12 2019-06-28 北京理工大学 一种未知伺服系统的强化学习最优跟踪控制方法
CN111740658A (zh) * 2020-04-29 2020-10-02 南京理工大学 基于策略迭代的电机系统最优调节控制方法
CN111722531A (zh) * 2020-05-12 2020-09-29 天津大学 一种切换线性系统在线无模型最优控制方法

Similar Documents

Publication Publication Date Title
JP6774637B2 (ja) 制御装置及び制御方法
JP3556956B2 (ja) システム識別装置および方法
CN110238839A (zh) 一种利用环境预测优化非模型机器人多轴孔装配控制方法
CN106877746A (zh) 速度控制方法和速度控制装置
CN105522578B (zh) 面向零力控制的模拟转矩控制方法以及系统
CN102509152A (zh) 一种基于rbf神经网络的开关磁阻电机在线建模方法
CN111965976B (zh) 基于神经网络观测器的机器人关节滑模控制方法及系统
CN112936286B (zh) 一种多柔性机械臂系统自适应一致性追踪控制方法及系统
CN113110340A (zh) 非连续多智能体系统的分布式非平滑饱和一致性控制方法
KR102382047B1 (ko) Pso를 이용한 모터 제어기의 자동 학습 튜닝 시스템
CN108972546A (zh) 一种基于强化学习的机器人恒力曲面跟踪方法
Chen et al. Neuroadaptive tracking control of affine nonlinear systems using echo state networks embedded with multiclustered structure and intrinsic plasticity
CN112987564A (zh) 一种基于策略迭代的伺服电机自适应智能控制方法
CN112564557A (zh) 一种永磁同步电机的控制方法、装置、设备及存储介质
CN116755323A (zh) 一种基于深度强化学习的多旋翼无人机pid自整定方法
CN110888323A (zh) 一种用于切换系统智能优化的控制方法
CN116604532A (zh) 一种上肢康复机器人智能控制方法
Hsu Adaptive growing-and-pruning neural network control for a linear piezoelectric ceramic motor
CN115469548A (zh) 具有输入饱和的未知非线性多智能体有限时间分群一致性控制方法
CN114012733A (zh) 一种用于pc构件模具划线的机械臂控制方法
CN114114929B (zh) 一种基于lssvm的无人驾驶车辆路径跟踪方法
CN112947078A (zh) 一种基于值迭代的伺服电机智能优化控制方法
Tan et al. A genetic approach for real-time identification and control of a helicopter system
CN117539153B (zh) 基于确定学习的上肢康复机器人自适应控制方法及系统
Tervo et al. Recursive tuning algorithm for assist controller of a trolley crane system

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210618