CN108196446B - 模型未知的双电机负载的动态规划最优控制方法 - Google Patents
模型未知的双电机负载的动态规划最优控制方法 Download PDFInfo
- Publication number
- CN108196446B CN108196446B CN201711337500.4A CN201711337500A CN108196446B CN 108196446 B CN108196446 B CN 108196446B CN 201711337500 A CN201711337500 A CN 201711337500A CN 108196446 B CN108196446 B CN 108196446B
- Authority
- CN
- China
- Prior art keywords
- motor
- neural network
- dual
- motor load
- establishing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 23
- 238000003062 neural network model Methods 0.000 claims abstract description 47
- 238000013528 artificial neural network Methods 0.000 claims abstract description 36
- 239000011159 matrix material Substances 0.000 claims description 43
- 230000005284 excitation Effects 0.000 claims description 18
- 230000009977 dual effect Effects 0.000 claims description 7
- 230000006978 adaptation Effects 0.000 claims description 6
- 238000009795 derivation Methods 0.000 claims description 6
- 238000001914 filtration Methods 0.000 claims description 3
- 238000013178 mathematical model Methods 0.000 claims description 3
- 239000000126 substance Substances 0.000 claims description 3
- 230000006870 function Effects 0.000 description 29
- 230000003044 adaptive effect Effects 0.000 description 5
- 238000011156 evaluation Methods 0.000 description 5
- 238000013459 approach Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 238000005265 energy consumption Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/04—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
- G05B13/042—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Feedback Control In General (AREA)
- Control Of Electric Motors In General (AREA)
Abstract
本发明公开了模型未知的双电机负载的动态规划最优控制方法,能够应用神经网络逼近方法和自适应算法,计算得到对模型未知双电机伺服系统的最优控制。该方法包括如下步骤:建立针对双电机负载系统的神经网络模型,估计所述双电机负载系统的神经网络模型的权重参数。建立针对性能指标函数的神经网络模型,结合哈密尔顿‑雅克比‑贝尔曼HJB方程,估计所述性能指标函数的神经网络模型的权重参数。结合所述双电机负载系统的神经网络模型以及所述性能指标函数的神经网络模型采用HJB方程求解最优控制,获得每个电机的最优输入力矩。根据所述最优输入力矩对相应电机的参数进行调节。
Description
技术领域
本发明涉及自动控制技术领域。
背景技术
针对多电机伺服系统的控制方式,最优控制理论应用不甚成熟。对于线性系统,可以用黎卡提方程离线求解其最优控制。对于非线性系统求解最优控制,要建立系统的哈密尔顿函数。然而非线性系统的哈密尔顿-雅克比-贝尔曼(HJB,Hamilton-Jacobi-Bellman)方程因为“维数灾难”问题,求解比较困难,对非线性系统最优控制的求解造成巨大困难。因此目前通常用深度学习方法来求解HJB方程,形成基于自适应动态规划(ADP,AdaptiveDynamic Programming)方法的最优控制求解方法。
尤其近几年,针对自适应动态规划方法的研究取得巨大进步,但是应用该理论解决实际系统模型的研究成果仍然不多。
发明内容
有鉴于此,本发明提供了模型未知的双电机负载的动态规划最优控制方法,能够应用神经网络逼近方法和自适应算法,计算得到对模型未知双电机伺服系统的最优控制。
模型未知的双电机负载的动态规划最优控制方法,该方法包括如下步骤:
建立针对双电机负载系统的神经网络模型,估计所述双电机负载系统的神经网络模型的权重参数。
建立针对性能指标函数的神经网络模型,结合哈密尔顿-雅克比-贝尔曼HJB方程,估计所述性能指标函数的神经网络模型的权重参数。
结合所述双电机负载系统的神经网络模型以及所述性能指标函数的神经网络模型采用HJB方程求解最优控制,获得每个电机的最优输入力矩。
根据所述最优输入力矩对相应电机的参数进行调节。
进一步地,双电机负载系统包括第1电机和第2电机,共2个电机。
所述方法还包括:
所述双电机负载系统的动态函数为:
其中x为所述双电机负载系统状态x=[x1,x2]T。
进一步地,估计所述双电机负载系统的神经网络模型的权重参数,具体为:
采用基于参数误差信息的自适应算法估计所述双电机负载系统的神经网络模型的权重参数。
进一步地,建立所述双电机负载系统的神经网络模型,估计所述双电机负载系统的神经网络模型的权重参数,具体为:
S101、所述双电机负载系统包括第1电机和第2电机,共2个电机。
建立针对所述双电机负载系统的神经网络模型:
W1为所述双电机负载系统的神经网络模型的权重参数,W1采用如下步骤S102~S105获取的估计值代替;其中即W1为n行b列的矩阵,b为预设的神经网络节点数,n双电机负载系统的阶数;Wf为系统动态的神经网络权重矩阵,Wg1,Wg2均为系统电机输入动态神经网络的权重矩阵。
S102、建立所述双电机负载系统状态x和激励函数φ1;其中x的滤波变量为xf,φ1的滤波变量为φ1f。
进一步地,建立所述性能指标函数的神经网络模型,结合哈密尔顿-雅克比-贝尔曼HJB方程,估计所述性能指标函数的神经网络模型的权重参数,具体包括:
Oi为与所述双电机负载系统状态x维数匹配的对称正定矩阵;
Rij为与第j电机的输入力矩uj维数匹配的对称正定矩阵;
S203、构建哈密尔顿-雅克比-贝尔曼HJB方程
S205、建立第四辅助矩阵P2和第五辅助矩阵Q2。
有益效果:
本发明首先应用神经网络精确逼近;利用辨识神经网络逼近双电机负载未知系统模型;利用评价神经网络近似性能指标函数;基于参数误差信息设计自适应律,用来估计神经网络权重参数;为使性能指标最小,构建哈密尔顿函数求解近似最优控制,解得伺服系统近似最优控制输入,使电机转角和转速快速镇定到给定信号的同时,能耗最小。本发明求解双电机负载系统各电机的最优输出,使负载按既定的轨迹运行,同时使各电机状态最优。
附图说明
图1为本发明实施例所针对的多电机负载系统结构图;
图2为本发明实施例所提供的模型未知的双电机负载的动态规划最优控制方法流程示意图;
图3为本发明一个实施例中负载模型未知动态参数;
图4为本发明一个实施例中电机一最优指标估计参数;
图5为本发明一个实施例中电机二最优指标估计参数;
图6为本发明一个实施例中负载速度轨迹;
图7为本发明一个实施例中电机一控制输入;
图8为本发明一个实施例中电机二控制输入。
具体实施方式
下面结合附图并举实施例,对本发明进行详细描述。
请参考图1和图2,图1示出了本发明实施例所针对的双电机负载系统结构框图。图2示出了本发明实施例所提供的模型未知的双电机负载的动态规划最优控制方法,包括如下步骤:
S1、建立针对双电机负载系统的神经网络模型,估计所述双电机负载系统的神经网络模型的权重参数。
S2、建立针对性能指标函数的神经网络模型,结合哈密尔顿-雅克比-贝尔曼HJB方程,估计所述性能指标函数的神经网络模型的权重参数;
S3、结合所述双电机负载系统的神经网络模型以及所述性能指标函数的神经网络模型采用HJB方程求解最优控制,获得每个电机的最优输入力矩;
S4、根据所述最优输入力矩对相应电机的参数进行调节。
本发明首先应用神经网络精确逼近;利用神经网络逼近双电机负载未知系统模型;利用评价神经网络近似性能指标函数;基于参数误差信息设计自适应律,用来估计神经网络权重参数;为使性能指标最小,构建哈密尔顿函数求解近似最优控制,解得伺服系统近似最优控制输入,使电机转角和转速快速镇定到给定信号的同时,能耗最小。
本发明实施例中,双电机负载系统包括第1电机和第2电机,共2个电机。在步骤S1之间,还需建立双电机负载系统的系统状态表达式。
因此本步骤S1之前还包括:
所述双电机负载系统的动态函数为:
其中x为所述双电机负载系统状态x=[x1,x2]T。
本发明实施例中,在步骤S1中,估计所述双电机负载系统的神经网络模型的权重参数,具体为:
采用基于参数误差信息的自适应算法估计所述双电机负载系统的神经网络模型的权重参数。
在本发明实施例中,S1具体包括如下步骤:
建立针对双电机负载系统的神经网络模型,估计所述双电机负载系统的神经网络模型的权重参数,具体为:
S101、所述双电机负载系统包括第1电机和第2电机,共2个电机;
建立针对所述双电机负载系统的神经网络模型:
W1为所述双电机负载系统的神经网络模型的权重参数,W1采用如下步骤S102~S105获取的估计值代替;其中即W1为n行b列的矩阵,b为预设的神经网络节点数,n双电机负载系统的阶数;Wf为系统动态的神经网络权重矩阵,Wg1,Wg2均为系统电机输入动态神经网络的权重矩阵;
S102、建立所述双电机负载系统状态x和激励φ1;其中x的滤波变量为xf,φ1的滤波变量为φ1f;
在本发明实施例中,S2具体包括如下步骤:
Oi为与所述双电机负载系统状态x维数匹配的对称正定矩阵;
Rij为与第j电机的输入力矩uj维数匹配的对称正定矩阵;
S203、构建哈密尔顿-雅克比-贝尔曼HJB方程
S205、建立第四辅助矩阵P2和第五辅助矩阵Q2;
本发明实施例对上述处理结果进行仿真。假设双电机负载系统动力学模型为:
在仿真分析中,假设系统模型未知。首先应用神经网络逼近未知双电机负载模型,然后用S105中构建的自适应律估计未知系统特性参数神经网络输入向量设置为φ1=[x1,x2,u1,u2]T,系统状态初值设置为x1(0)=1,x2(0)=-1。其它参数适当调整,可估计得近似神经网络权重如图3所示,各被估参数都收敛到其真值。用评价神经网络逼近性能指标函数,评价神经网络近似权重参数收敛效果如图4所示和图5所示,两个电机的性能指标权重参数都快速收敛到最优值。图6为负载转角速度效果图。图7和图8分别为所求两个电机的最优输出,可以使系统稳定运行。
本发明针对模型未知双电机负载系统,根据发明中提出的基于辨识-评价神经网络结构的ADP方法,应用一种基于参数误差信息的自适应估计算法,能够对未知双电机模型实现精确辨识,对最优性能指标精确逼近,进而求得电机的最优控制输出。这种ADP方法可以加快被估参数收敛速度和最优控制求解速度,通过仿真可以看出,本发明具有良好的控制性能和一定的实用价值。
综上所述,以上仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (1)
1.模型未知的双电机负载的动态规划最优控制方法,其特征在于,该方法包括如下步骤:
建立针对双电机负载系统的神经网络模型,估计所述双电机负载系统的神经网络模型的权重参数;
所述双电机负载系统包括第1电机和第2电机,共2个电机;
所述方法还包括:
所述双电机负载系统的动态函数为:
采用基于参数误差信息的自适应算法估计所述双电机负载系统的神经网络模型的权重参数;uj为第j电机的输入力矩;
具体为:
S101、所述双电机负载系统包括第1电机和第2电机,共2个电机;
建立针对所述双电机负载系统的神经网络模型:
W1为所述双电机负载系统的神经网络模型的权重参数,W1采用如下步骤S102~S105获取的估计值代替;其中即W1为n行b列的矩阵,b为预设的神经网络节点数,n双电机负载系统的阶数;Wf为系统动态的神经网络权重矩阵,Wg1,Wg2均为系统电机输入动态神经网络的权重矩阵;
S102、建立所述双电机负载系统状态x和激励函数φ1;其中x的滤波变量为xf,φ1的滤波变量为φ1f;
建立针对性能指标函数的神经网络模型,结合哈密尔顿-雅克比-贝尔曼HJB方程,估计所述性能指标函数的神经网络模型的权重参数;
具体包括:
Oi为与所述双电机负载系统状态x维数匹配的对称正定矩阵;
Rij为与第j电机的输入力矩uj维数匹配的对称正定矩阵;
S202、建立针对所述性能指标函数Vi *(x)的神经网络模型为:
S203、构建哈密尔顿-雅克比-贝尔曼HJB方程
S205、建立第四辅助矩阵P2和第五辅助矩阵Q2;
结合所述双电机负载系统的神经网络模型以及所述性能指标函数的神经网络模型采用HJB方程求解最优控制,获得每个电机的最优输入力矩;
根据所述最优输入力矩对相应电机的参数进行调节。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711337500.4A CN108196446B (zh) | 2017-12-14 | 2017-12-14 | 模型未知的双电机负载的动态规划最优控制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711337500.4A CN108196446B (zh) | 2017-12-14 | 2017-12-14 | 模型未知的双电机负载的动态规划最优控制方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108196446A CN108196446A (zh) | 2018-06-22 |
CN108196446B true CN108196446B (zh) | 2020-04-17 |
Family
ID=62574098
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711337500.4A Expired - Fee Related CN108196446B (zh) | 2017-12-14 | 2017-12-14 | 模型未知的双电机负载的动态规划最优控制方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108196446B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109031949B (zh) * | 2018-07-06 | 2020-07-28 | 广东工业大学 | 一种智能制造系统协同控制方法 |
CN109946975B (zh) * | 2019-04-12 | 2020-04-24 | 北京理工大学 | 一种未知伺服系统的强化学习最优跟踪控制方法 |
CN112455460B (zh) * | 2020-12-07 | 2022-05-03 | 安徽江淮汽车集团股份有限公司 | 车辆控制方法、装置、设备及存储介质 |
CN117335689B (zh) * | 2023-11-24 | 2024-02-20 | 太原理工大学 | 多伺服驱动采煤机截割部的力矩最优控制方法 |
CN117762022B (zh) * | 2024-02-22 | 2024-05-14 | 南京航空航天大学 | 一种基于离散时间强化学习的卫星智能鲁棒近似最优轨道控制方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6532454B1 (en) * | 1998-09-24 | 2003-03-11 | Paul J. Werbos | Stable adaptive control using critic designs |
CN104834221A (zh) * | 2015-05-25 | 2015-08-12 | 中国科学院自动化研究所 | 一种基于可变误差的非线性系统自适应最优控制方法 |
CN105790314A (zh) * | 2016-03-08 | 2016-07-20 | 南京邮电大学 | 一种基于自适应动态规划的分布式发电机协调控制方法 |
CN105867136A (zh) * | 2016-05-16 | 2016-08-17 | 北京理工大学 | 基于参数辨识的多电机伺服系统同步与跟踪控制方法 |
-
2017
- 2017-12-14 CN CN201711337500.4A patent/CN108196446B/zh not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6532454B1 (en) * | 1998-09-24 | 2003-03-11 | Paul J. Werbos | Stable adaptive control using critic designs |
CN104834221A (zh) * | 2015-05-25 | 2015-08-12 | 中国科学院自动化研究所 | 一种基于可变误差的非线性系统自适应最优控制方法 |
CN105790314A (zh) * | 2016-03-08 | 2016-07-20 | 南京邮电大学 | 一种基于自适应动态规划的分布式发电机协调控制方法 |
CN105867136A (zh) * | 2016-05-16 | 2016-08-17 | 北京理工大学 | 基于参数辨识的多电机伺服系统同步与跟踪控制方法 |
Non-Patent Citations (5)
Title |
---|
Adaptive Optimal Tracking Control for Continuous-Time Systems Using Identifier-Critic Based Dynamic Programming;Dawei Hou 等;《Proceedings of the 36th Chinese Control Conference》;20170728;第2583-2588页 * |
Approximate Optimal Tracking Control for Continuous-Time Unknown Nonlinear Systems;Jing Na 等;《Proceedings of the 33rd Chinese Control Conference》;20140730;第8990-8995页 * |
Online optimal solutions for multi-player nonzero-sum game with completely unknown dynamics;Yongfeng Lv 等;《Neurocomputing》;20171227;第87-97页 * |
动态规划最优控制在非线性系统中的应用;陈瑶 等;《计算技术与自动化》;20160111;第15-18页 * |
基于近似动态规划方法的未知系统的最优跟踪控制;崔小红 等;《数学的实践与认识》;20150608;第266-274页 * |
Also Published As
Publication number | Publication date |
---|---|
CN108196446A (zh) | 2018-06-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108196446B (zh) | 模型未知的双电机负载的动态规划最优控制方法 | |
CN109946975B (zh) | 一种未知伺服系统的强化学习最优跟踪控制方法 | |
Song et al. | A novel integrated chassis controller for full drive-by-wire vehicles | |
CN107561935B (zh) | 基于多层神经网络的电机位置伺服系统摩擦补偿控制方法 | |
Huang et al. | Development and application of a novel radial basis function sliding mode controller | |
Gao et al. | Adaptive motion control of wheeled mobile robot with unknown slippage | |
Siampis et al. | Rear wheel torque vectoring model predictive control with velocity regulation for electric vehicles | |
CN109581868B (zh) | 基于评判辨识结构的可重构机器人分散神经最优控制方法 | |
CN104950677A (zh) | 基于反演滑模控制的机械臂系统饱和补偿控制方法 | |
CN111338209A (zh) | 一种基于扩张干扰观测器的电液伺服系统自适应控制方法 | |
CN111880412B (zh) | 基于单评判网络的可重构机器人零和神经最优控制方法 | |
CN109062240B (zh) | 一种基于神经网络估计的刚性飞行器固定时间自适应姿态跟踪控制方法 | |
CN107193210B (zh) | 一种非线性系统的自适应学习预设性能控制方法 | |
CN112558468B (zh) | 基于双观测器的发射平台自适应鲁棒输出反馈控制方法 | |
Zaare et al. | Adaptive sliding mode control of n flexible-joint robot manipulators in the presence of structured and unstructured uncertainties | |
Jeon et al. | Simultaneous state estimation and tire model learning for autonomous vehicle applications | |
Pedro et al. | Hybrid NNMPC/PID control of a two-link flexible manipulator with actuator dynamics | |
Wu | Online learning human behavior for a class of human-in-the-loop systems via adaptive inverse optimal control | |
Gao et al. | Adaptive integral backstepping control for a 3-DOF helicopter | |
CN113110048A (zh) | 采用hosm观测器的非线性系统输出反馈自适应控制系统和方法 | |
Huang et al. | Position/force control of uncertain constrained flexible joint robots | |
CN114625007A (zh) | 一种固定时间内收敛的终端滑模控制方法及装置 | |
Kumar et al. | A direct adaptive neural command controller design for an unstable helicopter | |
CN113733117B (zh) | 一种可重构机器人人类意图辨识控制方法及装置 | |
Hager et al. | Adaptive Neural network control of a helicopter system with optimal observer and actor-critic design |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20200417 |