CN108196446B - 模型未知的双电机负载的动态规划最优控制方法 - Google Patents

模型未知的双电机负载的动态规划最优控制方法 Download PDF

Info

Publication number
CN108196446B
CN108196446B CN201711337500.4A CN201711337500A CN108196446B CN 108196446 B CN108196446 B CN 108196446B CN 201711337500 A CN201711337500 A CN 201711337500A CN 108196446 B CN108196446 B CN 108196446B
Authority
CN
China
Prior art keywords
motor
neural network
dual
motor load
establishing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201711337500.4A
Other languages
English (en)
Other versions
CN108196446A (zh
Inventor
任雪梅
吕永峰
李林伟
王敏林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Institute of Technology BIT
Original Assignee
Beijing Institute of Technology BIT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Institute of Technology BIT filed Critical Beijing Institute of Technology BIT
Priority to CN201711337500.4A priority Critical patent/CN108196446B/zh
Publication of CN108196446A publication Critical patent/CN108196446A/zh
Application granted granted Critical
Publication of CN108196446B publication Critical patent/CN108196446B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Feedback Control In General (AREA)
  • Control Of Electric Motors In General (AREA)

Abstract

本发明公开了模型未知的双电机负载的动态规划最优控制方法,能够应用神经网络逼近方法和自适应算法,计算得到对模型未知双电机伺服系统的最优控制。该方法包括如下步骤:建立针对双电机负载系统的神经网络模型,估计所述双电机负载系统的神经网络模型的权重参数。建立针对性能指标函数的神经网络模型,结合哈密尔顿‑雅克比‑贝尔曼HJB方程,估计所述性能指标函数的神经网络模型的权重参数。结合所述双电机负载系统的神经网络模型以及所述性能指标函数的神经网络模型采用HJB方程求解最优控制,获得每个电机的最优输入力矩。根据所述最优输入力矩对相应电机的参数进行调节。

Description

模型未知的双电机负载的动态规划最优控制方法
技术领域
本发明涉及自动控制技术领域。
背景技术
针对多电机伺服系统的控制方式,最优控制理论应用不甚成熟。对于线性系统,可以用黎卡提方程离线求解其最优控制。对于非线性系统求解最优控制,要建立系统的哈密尔顿函数。然而非线性系统的哈密尔顿-雅克比-贝尔曼(HJB,Hamilton-Jacobi-Bellman)方程因为“维数灾难”问题,求解比较困难,对非线性系统最优控制的求解造成巨大困难。因此目前通常用深度学习方法来求解HJB方程,形成基于自适应动态规划(ADP,AdaptiveDynamic Programming)方法的最优控制求解方法。
尤其近几年,针对自适应动态规划方法的研究取得巨大进步,但是应用该理论解决实际系统模型的研究成果仍然不多。
发明内容
有鉴于此,本发明提供了模型未知的双电机负载的动态规划最优控制方法,能够应用神经网络逼近方法和自适应算法,计算得到对模型未知双电机伺服系统的最优控制。
模型未知的双电机负载的动态规划最优控制方法,该方法包括如下步骤:
建立针对双电机负载系统的神经网络模型,估计所述双电机负载系统的神经网络模型的权重参数。
建立针对性能指标函数的神经网络模型,结合哈密尔顿-雅克比-贝尔曼HJB方程,估计所述性能指标函数的神经网络模型的权重参数。
结合所述双电机负载系统的神经网络模型以及所述性能指标函数的神经网络模型采用HJB方程求解最优控制,获得每个电机的最优输入力矩。
根据所述最优输入力矩对相应电机的参数进行调节。
进一步地,双电机负载系统包括第1电机和第2电机,共2个电机。
所述方法还包括:
针对所述双电机负载系统,建立数学模型,为:
Figure BDA0001507672190000021
其中x1表示负载的转角,x2表示负载的转速,
Figure BDA0001507672190000022
分别为x1,x2的导数,Ti为负载控制输入,r为负载的摩擦系数,J是负载的转动惯量,gi为第i电机的动态参数。
所述双电机负载系统的动态函数为:
Figure BDA0001507672190000023
所述双电机负载系统为:
Figure BDA0001507672190000024
其中x为所述双电机负载系统状态x=[x1,x2]T
进一步地,估计所述双电机负载系统的神经网络模型的权重参数,具体为:
采用基于参数误差信息的自适应算法估计所述双电机负载系统的神经网络模型的权重参数。
进一步地,建立所述双电机负载系统的神经网络模型,估计所述双电机负载系统的神经网络模型的权重参数,具体为:
S101、所述双电机负载系统包括第1电机和第2电机,共2个电机。
建立针对所述双电机负载系统的神经网络模型:
Figure BDA0001507672190000025
其中x为所述双电机负载系统状态;
Figure BDA0001507672190000031
为x的导数。
W1为所述双电机负载系统的神经网络模型的权重参数,W1采用如下步骤S102~S105获取的估计值
Figure BDA0001507672190000032
代替;其中
Figure BDA0001507672190000033
即W1为n行b列的矩阵,b为预设的神经网络节点数,n双电机负载系统的阶数;Wf为系统动态的神经网络权重矩阵,Wg1,Wg2均为系统电机输入动态神经网络的权重矩阵。
Figure BDA0001507672190000034
为所述双电机负载系统的神经网络激励函数,由系统状态x和第1电机和第2电机的输入力矩u1和u2决定。
S102、建立所述双电机负载系统状态x和激励函数φ1;其中x的滤波变量为xf,φ1的滤波变量为φ1f
Figure BDA0001507672190000035
Figure BDA0001507672190000036
为φ1f的导数,
Figure BDA0001507672190000037
为xf的导数;k为预设的滤波参数。
S103、建立第一辅助矩阵P1和第二辅助矩阵Q1
Figure BDA0001507672190000038
为设定的辅助参数经验值。
S104、建立第三辅助矩阵M1为:
Figure BDA0001507672190000039
S105、建立权重参数W1估计的自适应律为
Figure BDA00015076721900000310
Γ1为设置的自适应参数经验值;当所述φ1为持续激励时,应用所述W1估计的自适应律估计获得
Figure BDA00015076721900000311
Figure BDA00015076721900000312
Figure BDA00015076721900000313
Figure BDA00015076721900000314
为预设的系统动态和输入动态的神经网络激励函数。
进一步地,建立所述性能指标函数的神经网络模型,结合哈密尔顿-雅克比-贝尔曼HJB方程,估计所述性能指标函数的神经网络模型的权重参数,具体包括:
S201、建立性能指标函数:
Figure BDA0001507672190000041
其中,
Figure BDA0001507672190000042
为第i电机对应的性能指标;
Figure BDA0001507672190000043
为代价函数;
Oi为与所述双电机负载系统状态x维数匹配的对称正定矩阵;
Rij为与第j电机的输入力矩uj维数匹配的对称正定矩阵;
S202、建立针对所述性能指标函数
Figure BDA00015076721900000421
的神经网络模型为:
Figure BDA0001507672190000044
其中Vi(x)为
Figure BDA0001507672190000045
的神经网络输出函数;
Figure BDA0001507672190000046
Figure BDA0001507672190000047
的神经网络模型的激励函数,由系统状态x决定;Wci为权重参数,采用如下步骤S205~S207获取的估计值
Figure BDA0001507672190000048
代替。
S203、构建哈密尔顿-雅克比-贝尔曼HJB方程
Figure BDA0001507672190000049
其中
Figure BDA00015076721900000410
为代价函数;
Figure BDA00015076721900000411
Figure BDA00015076721900000412
的梯度。
Figure BDA00015076721900000413
Figure BDA00015076721900000414
为神经网络逼近误差。
S204、根据
Figure BDA00015076721900000415
解得第i电机的最优输入力矩为:
Figure BDA00015076721900000416
Figure BDA00015076721900000417
为根据估计值
Figure BDA00015076721900000418
得到的Wgi的估计值。
S205、建立第四辅助矩阵P2和第五辅助矩阵Q2
每个电机对应一个性能指标;则对应第i个性能指标的第四辅助矩阵P2i
Figure BDA00015076721900000419
P2i(0)=0;对应第i个性能指标的第五辅助矩阵Q2i
Figure BDA00015076721900000420
Q2i(0)=0。
其中Θi=ri(x,u1,u2)和
Figure BDA0001507672190000051
S206、建立第六辅助矩阵M2,对应第i个性能指标的第六辅助矩阵M2
Figure BDA0001507672190000052
建立参数Wci估计的自适应律为
Figure BDA0001507672190000053
Γ2i为设置的自适应参数经验值。
当所述
Figure BDA0001507672190000054
为持续激励时,应用所述Wci估计的自适应律估计获得
Figure BDA0001507672190000055
有益效果:
本发明首先应用神经网络精确逼近;利用辨识神经网络逼近双电机负载未知系统模型;利用评价神经网络近似性能指标函数;基于参数误差信息设计自适应律,用来估计神经网络权重参数;为使性能指标最小,构建哈密尔顿函数求解近似最优控制,解得伺服系统近似最优控制输入,使电机转角和转速快速镇定到给定信号的同时,能耗最小。本发明求解双电机负载系统各电机的最优输出,使负载按既定的轨迹运行,同时使各电机状态最优。
附图说明
图1为本发明实施例所针对的多电机负载系统结构图;
图2为本发明实施例所提供的模型未知的双电机负载的动态规划最优控制方法流程示意图;
图3为本发明一个实施例中负载模型未知动态参数;
图4为本发明一个实施例中电机一最优指标估计参数;
图5为本发明一个实施例中电机二最优指标估计参数;
图6为本发明一个实施例中负载速度轨迹;
图7为本发明一个实施例中电机一控制输入;
图8为本发明一个实施例中电机二控制输入。
具体实施方式
下面结合附图并举实施例,对本发明进行详细描述。
请参考图1和图2,图1示出了本发明实施例所针对的双电机负载系统结构框图。图2示出了本发明实施例所提供的模型未知的双电机负载的动态规划最优控制方法,包括如下步骤:
S1、建立针对双电机负载系统的神经网络模型,估计所述双电机负载系统的神经网络模型的权重参数。
S2、建立针对性能指标函数的神经网络模型,结合哈密尔顿-雅克比-贝尔曼HJB方程,估计所述性能指标函数的神经网络模型的权重参数;
S3、结合所述双电机负载系统的神经网络模型以及所述性能指标函数的神经网络模型采用HJB方程求解最优控制,获得每个电机的最优输入力矩;
S4、根据所述最优输入力矩对相应电机的参数进行调节。
本发明首先应用神经网络精确逼近;利用神经网络逼近双电机负载未知系统模型;利用评价神经网络近似性能指标函数;基于参数误差信息设计自适应律,用来估计神经网络权重参数;为使性能指标最小,构建哈密尔顿函数求解近似最优控制,解得伺服系统近似最优控制输入,使电机转角和转速快速镇定到给定信号的同时,能耗最小。
本发明实施例中,双电机负载系统包括第1电机和第2电机,共2个电机。在步骤S1之间,还需建立双电机负载系统的系统状态表达式。
因此本步骤S1之前还包括:
针对所述双电机负载系统,建立数学模型,为:
Figure BDA0001507672190000071
其中x1表示负载的转角,x2表示负载的转速,
Figure BDA0001507672190000072
分别为x1,x2的导数,Ti为负载控制输入,r为负载的摩擦系数,J是负载的转动惯量,gi为第i电机的动态参数。
所述双电机负载系统的动态函数为:
Figure BDA0001507672190000073
所述双电机负载系统为:
Figure BDA0001507672190000074
其中x为所述双电机负载系统状态x=[x1,x2]T
本发明实施例中,在步骤S1中,估计所述双电机负载系统的神经网络模型的权重参数,具体为:
采用基于参数误差信息的自适应算法估计所述双电机负载系统的神经网络模型的权重参数。
在本发明实施例中,S1具体包括如下步骤:
建立针对双电机负载系统的神经网络模型,估计所述双电机负载系统的神经网络模型的权重参数,具体为:
S101、所述双电机负载系统包括第1电机和第2电机,共2个电机;
建立针对所述双电机负载系统的神经网络模型:
Figure BDA0001507672190000075
其中x为所述双电机负载系统状态;
Figure BDA0001507672190000076
为x的导数;
W1为所述双电机负载系统的神经网络模型的权重参数,W1采用如下步骤S102~S105获取的估计值
Figure BDA0001507672190000077
代替;其中
Figure BDA0001507672190000078
即W1为n行b列的矩阵,b为预设的神经网络节点数,n双电机负载系统的阶数;Wf为系统动态的神经网络权重矩阵,Wg1,Wg2均为系统电机输入动态神经网络的权重矩阵;
Figure BDA0001507672190000081
为所述双电机负载系统的激励,由系统状态x和第1电机和第2电机的输入力矩u1和u2决定;
S102、建立所述双电机负载系统状态x和激励φ1;其中x的滤波变量为xf,φ1的滤波变量为φ1f
Figure BDA0001507672190000082
Figure BDA0001507672190000083
为φ1f的导数,
Figure BDA0001507672190000084
为xf的导数;k为预设的滤波参数;
S103、建立第一辅助矩阵P1和第二辅助矩阵Q1
Figure BDA0001507672190000085
为设定的辅助参数经验值;
S104、建立第三辅助矩阵M1为:
Figure BDA0001507672190000086
S105、建立参数W1估计的自适应律为
Figure BDA0001507672190000087
Γ1为设置的自适应参数经验值;当所述φ1为持续激励时,应用所述W1估计的自适应律估计获得
Figure BDA0001507672190000088
Figure BDA0001507672190000089
Figure BDA00015076721900000810
Figure BDA00015076721900000811
为预设的系统动态和输入动态的神经网络激励函数,。
在本发明实施例中,S2具体包括如下步骤:
S201、建立性能指标函数:
Figure BDA00015076721900000812
其中,
Figure BDA00015076721900000813
为第i电机对应的性能指标;
Figure BDA00015076721900000814
为代价函数
Oi为与所述双电机负载系统状态x维数匹配的对称正定矩阵;
Rij为与第j电机的输入力矩uj维数匹配的对称正定矩阵;
S202、建立针对所述性能指标函数
Figure BDA00015076721900000815
的神经网络模型为:
Figure BDA0001507672190000091
其中Vi(x)为
Figure BDA0001507672190000092
的神经网络输出函数;
Figure BDA0001507672190000093
Figure BDA0001507672190000094
的神经网络模型的激励函数,由系统状态x决定;Wci为权重参数,采用如下步骤S205~S207获取的估计值
Figure BDA0001507672190000095
代替;
S203、构建哈密尔顿-雅克比-贝尔曼HJB方程
Figure BDA0001507672190000096
其中
Figure BDA0001507672190000097
为代价函数;
Figure BDA0001507672190000098
Figure BDA0001507672190000099
的梯度,
Figure BDA00015076721900000910
Figure BDA00015076721900000911
为神经网络逼近误差;
S204、根据
Figure BDA00015076721900000912
解得第i电机的最优输入力矩为:
Figure BDA00015076721900000913
Figure BDA00015076721900000914
为根据估计值
Figure BDA00015076721900000915
得到的Wgi的估计值;
S205、建立第四辅助矩阵P2和第五辅助矩阵Q2
每个电机对应一个性能指标;则对应第i个性能指标的第四辅助矩阵P2i
Figure BDA00015076721900000916
P2i(0)=0;对应第i个性能指标的第五辅助矩阵Q2i
Figure BDA00015076721900000917
Q2i(0)=0;
其中Θi=ri(x,u1,u2)和
Figure BDA00015076721900000918
S206、建立第六辅助矩阵M2,对应第i个性能指标的第六辅助矩阵M2
Figure BDA00015076721900000919
建立参数Wci估计的自适应律为
Figure BDA00015076721900000920
i=1,2;Γ2为设置的自适应参数经验值;
当所述
Figure BDA00015076721900000921
为持续激励时,应用所述Wci估计的自适应律估计获得
Figure BDA00015076721900000922
本发明实施例对上述处理结果进行仿真。假设双电机负载系统动力学模型为:
Figure BDA0001507672190000101
在仿真分析中,假设系统模型未知。首先应用神经网络逼近未知双电机负载模型,然后用S105中构建的自适应律估计未知系统特性参数
Figure BDA0001507672190000102
神经网络输入向量设置为φ1=[x1,x2,u1,u2]T,系统状态初值设置为x1(0)=1,x2(0)=-1。其它参数适当调整,可估计得近似神经网络权重
Figure BDA0001507672190000103
如图3所示,各被估参数都收敛到其真值。用评价神经网络逼近性能指标函数,评价神经网络近似权重参数收敛效果如图4所示和图5所示,两个电机的性能指标权重参数都快速收敛到最优值。图6为负载转角速度效果图。图7和图8分别为所求两个电机的最优输出,可以使系统稳定运行。
本发明针对模型未知双电机负载系统,根据发明中提出的基于辨识-评价神经网络结构的ADP方法,应用一种基于参数误差信息的自适应估计算法,能够对未知双电机模型实现精确辨识,对最优性能指标精确逼近,进而求得电机的最优控制输出。这种ADP方法可以加快被估参数收敛速度和最优控制求解速度,通过仿真可以看出,本发明具有良好的控制性能和一定的实用价值。
综上所述,以上仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (1)

1.模型未知的双电机负载的动态规划最优控制方法,其特征在于,该方法包括如下步骤:
建立针对双电机负载系统的神经网络模型,估计所述双电机负载系统的神经网络模型的权重参数;
所述双电机负载系统包括第1电机和第2电机,共2个电机;
所述方法还包括:
针对所述双电机负载系统,建立数学模型,为:
Figure FDA0002251740090000011
其中x1表示负载的转角,x2表示负载的转速,
Figure FDA0002251740090000012
分别为x1,x2的导数,Ti为负载控制输入,r为负载的摩擦系数,J是负载的转动惯量,gi为第i电机的动态参数;
所述双电机负载系统的动态函数为:
Figure FDA0002251740090000013
所述双电机负载系统为:
Figure FDA0002251740090000014
其中x为所述双电机负载系统状态x=[x1,x2]T;b0为指代参数,用于指代
Figure FDA0002251740090000015
gj为第j个电机的动态参数;
采用基于参数误差信息的自适应算法估计所述双电机负载系统的神经网络模型的权重参数;uj为第j电机的输入力矩;
具体为:
S101、所述双电机负载系统包括第1电机和第2电机,共2个电机;
建立针对所述双电机负载系统的神经网络模型:
Figure FDA0002251740090000016
其中x为所述双电机负载系统状态;
Figure FDA0002251740090000021
为x的导数;
W1为所述双电机负载系统的神经网络模型的权重参数,W1采用如下步骤S102~S105获取的估计值
Figure FDA0002251740090000022
代替;其中
Figure FDA0002251740090000023
即W1为n行b列的矩阵,b为预设的神经网络节点数,n双电机负载系统的阶数;Wf为系统动态的神经网络权重矩阵,Wg1,Wg2均为系统电机输入动态神经网络的权重矩阵;
Figure FDA00022517400900000214
为所述双电机负载系统的神经网络激励函数,由系统状态x和第1电机和第2电机的输入力矩u1和u2决定;
S102、建立所述双电机负载系统状态x和激励函数φ1;其中x的滤波变量为xf,φ1的滤波变量为φ1f
Figure FDA0002251740090000024
Figure FDA0002251740090000025
为φ1f的导数,
Figure FDA0002251740090000026
为xf的导数;k为预设的滤波参数;
S103、建立第一辅助矩阵P1和第二辅助矩阵Q1
Figure FDA0002251740090000027
l为设定的辅助参数经验值;
S104、建立第三辅助矩阵M1为:
Figure FDA0002251740090000028
S105、建立权重参数W1估计的自适应律为
Figure FDA0002251740090000029
Γ1为设置的自适应参数经验值;当所述φ1为持续激励时,应用所述W1估计的自适应律估计获得
Figure FDA00022517400900000210
Figure FDA00022517400900000211
Figure FDA00022517400900000212
Figure FDA00022517400900000213
为预设的系统动态和输入动态的神经网络激励函数;
建立针对性能指标函数的神经网络模型,结合哈密尔顿-雅克比-贝尔曼HJB方程,估计所述性能指标函数的神经网络模型的权重参数;
具体包括:
S201、建立性能指标函数:
Figure FDA0002251740090000031
其中,
Figure FDA0002251740090000032
为第i电机对应的性能指标;
Figure FDA0002251740090000033
为代价函数;
Oi为与所述双电机负载系统状态x维数匹配的对称正定矩阵;
Rij为与第j电机的输入力矩uj维数匹配的对称正定矩阵;
S202、建立针对所述性能指标函数Vi *(x)的神经网络模型为:
Figure FDA0002251740090000034
其中Vi(x)为Vi *(x)的神经网络输出函数;
Figure FDA0002251740090000035
为Vi *(x)的神经网络模型的激励函数,由系统状态x决定;Wci为权重参数,采用如下步骤S205~S207获取的估计值
Figure FDA0002251740090000036
代替;
S203、构建哈密尔顿-雅克比-贝尔曼HJB方程
Figure FDA0002251740090000037
其中
Figure FDA0002251740090000038
为代价函数;
Figure FDA0002251740090000039
Figure FDA00022517400900000310
的梯度;
Figure FDA00022517400900000311
Figure FDA00022517400900000312
为神经网络逼近误差;
S204、根据
Figure FDA00022517400900000313
解得第i电机的最优输入力矩为:
Figure FDA00022517400900000314
Figure FDA00022517400900000315
为根据估计值
Figure FDA00022517400900000316
得到的Wgi的估计值;Rii为与第i电机的输入力矩ui维数匹配的对称正定矩阵;
S205、建立第四辅助矩阵P2和第五辅助矩阵Q2
每个电机对应一个性能指标;则对应第i个性能指标的第四辅助矩阵P2i
Figure FDA00022517400900000317
P2i(0)=0;对应第i个性能指标的第五辅助矩阵Q2i
Figure FDA0002251740090000041
Q2i(0)=0;
其中Θi=ri(x,u1,u2)和
Figure FDA0002251740090000042
S206、建立第六辅助矩阵M2,对应第i个性能指标的第六辅助矩阵M2
Figure FDA0002251740090000043
建立参数Wci估计的自适应律为
Figure FDA0002251740090000044
Γ2i为设置的自适应参数经验值;
当所述
Figure FDA0002251740090000045
为持续激励时,应用所述Wci估计的自适应律估计获得
Figure FDA0002251740090000046
结合所述双电机负载系统的神经网络模型以及所述性能指标函数的神经网络模型采用HJB方程求解最优控制,获得每个电机的最优输入力矩;
根据所述最优输入力矩对相应电机的参数进行调节。
CN201711337500.4A 2017-12-14 2017-12-14 模型未知的双电机负载的动态规划最优控制方法 Expired - Fee Related CN108196446B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711337500.4A CN108196446B (zh) 2017-12-14 2017-12-14 模型未知的双电机负载的动态规划最优控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711337500.4A CN108196446B (zh) 2017-12-14 2017-12-14 模型未知的双电机负载的动态规划最优控制方法

Publications (2)

Publication Number Publication Date
CN108196446A CN108196446A (zh) 2018-06-22
CN108196446B true CN108196446B (zh) 2020-04-17

Family

ID=62574098

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711337500.4A Expired - Fee Related CN108196446B (zh) 2017-12-14 2017-12-14 模型未知的双电机负载的动态规划最优控制方法

Country Status (1)

Country Link
CN (1) CN108196446B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109031949B (zh) * 2018-07-06 2020-07-28 广东工业大学 一种智能制造系统协同控制方法
CN109946975B (zh) * 2019-04-12 2020-04-24 北京理工大学 一种未知伺服系统的强化学习最优跟踪控制方法
CN112455460B (zh) * 2020-12-07 2022-05-03 安徽江淮汽车集团股份有限公司 车辆控制方法、装置、设备及存储介质
CN117335689B (zh) * 2023-11-24 2024-02-20 太原理工大学 多伺服驱动采煤机截割部的力矩最优控制方法
CN117762022B (zh) * 2024-02-22 2024-05-14 南京航空航天大学 一种基于离散时间强化学习的卫星智能鲁棒近似最优轨道控制方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6532454B1 (en) * 1998-09-24 2003-03-11 Paul J. Werbos Stable adaptive control using critic designs
CN104834221A (zh) * 2015-05-25 2015-08-12 中国科学院自动化研究所 一种基于可变误差的非线性系统自适应最优控制方法
CN105790314A (zh) * 2016-03-08 2016-07-20 南京邮电大学 一种基于自适应动态规划的分布式发电机协调控制方法
CN105867136A (zh) * 2016-05-16 2016-08-17 北京理工大学 基于参数辨识的多电机伺服系统同步与跟踪控制方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6532454B1 (en) * 1998-09-24 2003-03-11 Paul J. Werbos Stable adaptive control using critic designs
CN104834221A (zh) * 2015-05-25 2015-08-12 中国科学院自动化研究所 一种基于可变误差的非线性系统自适应最优控制方法
CN105790314A (zh) * 2016-03-08 2016-07-20 南京邮电大学 一种基于自适应动态规划的分布式发电机协调控制方法
CN105867136A (zh) * 2016-05-16 2016-08-17 北京理工大学 基于参数辨识的多电机伺服系统同步与跟踪控制方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
Adaptive Optimal Tracking Control for Continuous-Time Systems Using Identifier-Critic Based Dynamic Programming;Dawei Hou 等;《Proceedings of the 36th Chinese Control Conference》;20170728;第2583-2588页 *
Approximate Optimal Tracking Control for Continuous-Time Unknown Nonlinear Systems;Jing Na 等;《Proceedings of the 33rd Chinese Control Conference》;20140730;第8990-8995页 *
Online optimal solutions for multi-player nonzero-sum game with completely unknown dynamics;Yongfeng Lv 等;《Neurocomputing》;20171227;第87-97页 *
动态规划最优控制在非线性系统中的应用;陈瑶 等;《计算技术与自动化》;20160111;第15-18页 *
基于近似动态规划方法的未知系统的最优跟踪控制;崔小红 等;《数学的实践与认识》;20150608;第266-274页 *

Also Published As

Publication number Publication date
CN108196446A (zh) 2018-06-22

Similar Documents

Publication Publication Date Title
CN108196446B (zh) 模型未知的双电机负载的动态规划最优控制方法
CN109946975B (zh) 一种未知伺服系统的强化学习最优跟踪控制方法
Song et al. A novel integrated chassis controller for full drive-by-wire vehicles
CN107561935B (zh) 基于多层神经网络的电机位置伺服系统摩擦补偿控制方法
Huang et al. Development and application of a novel radial basis function sliding mode controller
Gao et al. Adaptive motion control of wheeled mobile robot with unknown slippage
Siampis et al. Rear wheel torque vectoring model predictive control with velocity regulation for electric vehicles
CN109581868B (zh) 基于评判辨识结构的可重构机器人分散神经最优控制方法
CN104950677A (zh) 基于反演滑模控制的机械臂系统饱和补偿控制方法
CN111338209A (zh) 一种基于扩张干扰观测器的电液伺服系统自适应控制方法
CN111880412B (zh) 基于单评判网络的可重构机器人零和神经最优控制方法
CN109062240B (zh) 一种基于神经网络估计的刚性飞行器固定时间自适应姿态跟踪控制方法
CN107193210B (zh) 一种非线性系统的自适应学习预设性能控制方法
CN112558468B (zh) 基于双观测器的发射平台自适应鲁棒输出反馈控制方法
Zaare et al. Adaptive sliding mode control of n flexible-joint robot manipulators in the presence of structured and unstructured uncertainties
Jeon et al. Simultaneous state estimation and tire model learning for autonomous vehicle applications
Pedro et al. Hybrid NNMPC/PID control of a two-link flexible manipulator with actuator dynamics
Wu Online learning human behavior for a class of human-in-the-loop systems via adaptive inverse optimal control
Gao et al. Adaptive integral backstepping control for a 3-DOF helicopter
CN113110048A (zh) 采用hosm观测器的非线性系统输出反馈自适应控制系统和方法
Huang et al. Position/force control of uncertain constrained flexible joint robots
CN114625007A (zh) 一种固定时间内收敛的终端滑模控制方法及装置
Kumar et al. A direct adaptive neural command controller design for an unstable helicopter
CN113733117B (zh) 一种可重构机器人人类意图辨识控制方法及装置
Hager et al. Adaptive Neural network control of a helicopter system with optimal observer and actor-critic design

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20200417