CN112255920A - 一种基于数据驱动的自适应最优迭代学习控制方法 - Google Patents
一种基于数据驱动的自适应最优迭代学习控制方法 Download PDFInfo
- Publication number
- CN112255920A CN112255920A CN202011215090.8A CN202011215090A CN112255920A CN 112255920 A CN112255920 A CN 112255920A CN 202011215090 A CN202011215090 A CN 202011215090A CN 112255920 A CN112255920 A CN 112255920A
- Authority
- CN
- China
- Prior art keywords
- iterative learning
- optimal iterative
- controller
- optimal
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 97
- 230000008569 process Effects 0.000 claims abstract description 12
- 230000003044 adaptive effect Effects 0.000 claims abstract description 11
- 238000012804 iterative process Methods 0.000 claims abstract description 3
- 239000011159 matrix material Substances 0.000 claims description 26
- 230000006870 function Effects 0.000 claims description 9
- 238000005457 optimization Methods 0.000 claims description 9
- 230000008859 change Effects 0.000 claims description 8
- 238000009795 derivation Methods 0.000 claims description 6
- 230000004044 response Effects 0.000 claims description 6
- 230000014509 gene expression Effects 0.000 claims description 5
- 238000005070 sampling Methods 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 3
- 239000013598 vector Substances 0.000 claims description 3
- 238000002474 experimental method Methods 0.000 claims description 2
- 238000012545 processing Methods 0.000 claims description 2
- 230000007547 defect Effects 0.000 abstract description 4
- 230000007812 deficiency Effects 0.000 description 3
- 238000004590 computer program Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/04—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
- G05B13/042—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Feedback Control In General (AREA)
Abstract
本发明公开了一种基于数据驱动的自适应最优迭代学习控制方法,属于机械设备控制技术领域。本发明的一种基于数据驱动的自适应最优迭代学习控制方法,将非参数模型辨识方法与最优迭代学习方法相结合构成一种基于数据驱动的自适应最优迭代学习控制方法,在迭代过程中进行名义模型的辨识并不断更新迭代学习控制器;利用基于数据驱动的自适应最优迭代学习方法对控制信号进行迭代更新,将更新后的驱动力重新下发至运动控制卡,反复此迭代学习过程提高伺服系统跟踪精度。本发明不需要精确的系统模型信息,并且能够有效应对系统参数摄动,弥补了最优迭代学习方法的不足,提高了系统跟踪精度。
Description
技术领域
本发明涉及一种基于数据驱动的自适应最优迭代学习控制方法,属于机械设备控制技术领域。
背景技术
目前伺服系统的控制器设计需要事先通过辨识方法获取系统的托普利兹矩阵,并且系统的跟踪性能依赖于系统托普利兹矩阵的精确程度,但伺服系统在长时间运行过程中可能存在系统参数的缓慢变化,使最优迭代学习控制无法满足收敛性条件,从而导致伺服系统的跟踪性能严重恶化。
发明内容
针对现有技术的缺陷,本发明的目的在于提供一种将非参数模型辨识方法与最优迭代学习方法相结合构成基于数据驱动的自适应最优迭代学习方法,不需要事先得到精确的系统模型就能使伺服系统得到很好的跟踪性能;同时能够有效应对系统参数摄动的情况,弥补了传统最优迭代学习控制的不足;灵活性、适应性更强,提高了控制精度,控制效果好的基于数据驱动的自适应最优迭代学习方法。
为实现上述目的,本发明的技术方案为:
一种基于数据驱动的自适应最优迭代学习控制方法,
包括以下步骤:
步骤一:连接伺服系统,设置除迭代学习控制器外的其它相关控制器参数,并将参数下载到运动控制卡中,并使能伺服系统,使伺服电机闭环;
步骤二:在伺服系统输入端输入理想轨迹信号r(t),采样周期为Ts,输出轨迹信号为y(t),采集输入输出信号,输入信号r(t)减去输出信号y(t)为误差信号e(t),规定轨迹运行时间,根据线性系统理论知识,对伺服系统进行离散化处理;
步骤三:利用最优迭代学习方法计算驱动力,用于减小跟踪误差e(t),分析该方法的收敛性条件,并指出该方法的不足;
步骤四:基于最优化理论设计一种非参数模型辨识方法,根据输入输出信号对伺服系统的名义模型进行辨识;
步骤五:将非参数模型辨识方法与最优迭代学习方法相结合构成一种基于数据驱动的自适应最优迭代学习控制方法,在迭代过程中进行名义模型的辨识并不断更新迭代学习控制器;
步骤六:利用基于数据驱动的自适应最优迭代学习方法对控制信号进行迭代更新,将更新后的驱动力重新下发至运动控制卡,反复此迭代学习过程提高伺服系统跟踪精度。
本发明在最优迭代学习方法中加入非参数模型辨识方法,提出一种基于数据驱动的自适应最优迭代学习控制方法,该方法不需要精确的系统模型信息,并且能够有效应对系统参数摄动,弥补了最优迭代学习方法的不足,提高了系统跟踪精度。
进一步,本发明采用最优迭代学习控制,迭代学习控制通常被用于控制执行重复任务的系统中,用来消除系统的重复误差,迭代学习控制由于良好的性能而被广泛应用于机械臂等控制场合,最初迭代学习控制并没有精确的系统模型,但随着研究的深入发现,系统模型的精确与否对迭代学习控制的性能有一定影响。因此,H∞迭代学习控制、最优迭代学习控制等结合系统模型信息的迭代学习控制方法被广泛研究。
最优迭代学习控制由于具有良好的瞬态行为,并且沿迭代方向具有单调收敛性,因此得到了深入研究与广泛应用。
作为优选技术措施:
所述步骤二,对伺服系统进行离散化处理,第k次输入输出的关系为:
yk=Trr+Tuuk
式中:
其中:Tu表示系统托普利兹矩阵,由系统单位脉冲响应生成,Tr同样也是如此表示,yk=[yk(0),yk(1),yk(2)…yk(N-1)]T为系统输出信号,分别采用向量r、ek、uk代表离散化的参考轨迹、误差信号、前馈信号,其表达式与yk相同;k为迭代次数,采样周期为TS,重复运动时间跨度为t∈[0,T];h为托普利兹矩阵的参数,y为系统输出信号。
作为优选技术措施:
所述步骤三,所述最优迭代学习方法如下:
uk+1=uk+Lek
则迭代学习控制系统的误差为:
ek=r-Trr-Tuuk
其中,L∈RN×N,Tu∈RN×N,uk∈RN,ek∈RN,r∈RN。
基于最优化理论选取目标函数为:
对比最优迭代学习方法可得最优迭代学习控制器L:
ρ·I为权重矩阵,其中I为单位矩阵,ρ为系数。
作为优选技术措施:
所述伺服系统收敛性条件为,相应矩阵最大奇异值需满足以下条件:
结合控制器L,经推导可得表达式:
作为优选技术措施:
所述步骤四,所述伺服系统名义模型为:
作为优选技术措施:
基于最优化理论设计一种非参数模型辨识方法,选取目标函数为:
作为优选技术措施:
所述步骤五,基于数据驱动的自适应最优迭代学习方法:
(1)选取合适的权重矩阵We、Wdu和μ;
(5)不断重复(3)、(4)过程,使系统满足跟踪性能要求。
作为优选技术措施:
并根据更新后的最优迭代学习方法计算控制信号uk+1;不断此过程,使系统满足跟踪性能要求。
作为优选技术措施:
所述步骤六:在运动控制卡内部设计一个参数摄动控制器P(s)用于模拟系统参数的变化,在第5次迭代时改变P(s)的参数,采用三阶轨迹,分别采用传统最优迭代学习控制和基于数据驱动的自适应最优迭代学习控制控制对误差进行迭代,将经过迭代学习产生的驱动力uk+1重新下发至运动控制卡,反复此过程以提高系统跟踪性能。
本发明能有效应对系统参数的变化,弥补传统最优迭代学习控制的不足。
作为优选技术措施:
所述步骤六:伺服系统为伺服电机,上位机为电脑或工控机。
通常选取电脑作为上位机,因为电脑应用广泛,通用性强,不需要增加额外成本。
与现有技术相比,本发明具有以下有益效果:
本发明将非参数模型辨识方法与最优迭代学习方法相结合构成基于数据驱动的自适应最优迭代学习方法,不需要事先得到精确的系统模型就能使伺服系统得到很好的跟踪性能。
本发明能够有效应对系统参数摄动的情况,弥补了传统最优迭代学习控制的不足,另外控制方案简单、灵活性强、易于实现、控制精度高,能够满足伺服系统的控制要求。
附图说明
图1为本发明最优迭代学习的控制框图;
图2为本发明控制方案结构框图;
图3为本发明三阶点对点轨迹规划曲线图;
图4为本发明目标函数曲线图;
图5为本发明迭代前后误差曲线图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
相反,本发明涵盖任何由权利要求定义的在本发明的精髓和范围上做的替代、修改、等效方法以及方案。进一步,为了使公众对本发明有更好的了解,在下文对本发明的细节描述中,详尽描述了一些特定的细节部分。对本领域技术人员来说没有这些细节部分的描述也可以完全理解本发明。
一种基于数据驱动的自适应最优迭代学习控制方法,包括以下步骤:
步骤一:连接好伺服系统与运动控制卡,打开上位机软件,设置好控制器和传感器等相关参数,将参数下载到运动控制卡上的ARM芯片中,参数下载完成后,使能伺服系统,使伺服电机闭环。
步骤二:在伺服系统输入端输入理想轨迹信号r(t),输出轨迹信号为y(t),采集输入输出信号,输入信号r(t)减去输出信号y(t)为误差信号e(t),规定轨迹运行时间,根据线性系统理论知识,对伺服系统进行离散化处理;离散化处理后,第k次输入输出的关系为:
yk=Trr+Tuuk
式中:
Tu表示系统托普利兹矩阵,由系统单位脉冲响应生成,Tr同样也是如此表示,yk=[yk(0),yk(1),yk(2)…yk(N-1)]T为系统输出信号,分别采用向量r,ek,uk代表离散化的参考轨迹,误差信号,前馈信号,其表达式与yk相同;k为迭代次数,规定采样周期为TS为0.0005s,重复运动时间跨度为t∈[0,T],采集时间为1.024s。
步骤三:如图1所示,最优迭代学习方法如下:
uk+1=uk+Lek
则迭代学习控制系统的误差为:
ek=r-Trr-Tuuk
其中,L∈RN×N,Tu∈RN×N,uk∈RN,ek∈RN,r∈RN。
基于最优化理论选取目标函数为:
对比最优迭代学习方法可得最优迭代学习控制器为L:
步骤四:基于最优化理论设计一种非参数模型辨识方法,根据输入输出信号对系统的名义模型进行辨识,所述系统名义模型为:
基于最优化理论设计一种非参数模型辨识方法,选取目标函数为:
步骤五:如图2所示,基于数据驱动的自适应最优迭代学习方法的控制方案为:
(1)选取合适的权重矩阵We、Wdu和μ。
(5)不断重复(3)、(4)过程,使系统满足跟踪性能要求。
步骤六:如图2所示,在运动控制卡内部设计一个参数摄动控制器P(s)用于模拟系统参数的变化,在第5次迭代时改变P(s)的参数,采用如图3所示的三阶轨迹,分别采用传统最优迭代学习控制和基于数据驱动的自适应最优迭代学习控制控制对误差进行迭代,将经过迭代学习产生的驱动力uk+1重新下发至运动控制卡,反复此过程以提高系统跟踪性能。如图4和图5所示,本发明能有效应对系统参数的变化,弥补传统最优迭代学习控制的不足。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。
Claims (10)
1.一种基于数据驱动的自适应最优迭代学习控制方法,其特征在于,
包括以下步骤:
步骤一:连接伺服系统,设置除迭代学习控制器外的其它相关控制器参数,并将参数下载到运动控制卡中,并使能伺服系统,使伺服电机闭环;
步骤二:在伺服系统输入端输入理想轨迹信号r(t),采样周期为Ts,输出轨迹信号为y(t),采集输入输出信号,输入信号r(t)减去输出信号y(t)为误差信号e(t),规定轨迹运行时间,进而对伺服系统进行离散化处理;
步骤三:利用最优迭代学习方法计算驱动力,用于减小跟踪误差e(t),分析该方法的收敛性条件;
步骤四:基于最优化理论设计一种非参数模型辨识方法,根据输入输出信号对伺服系统的名义模型进行辨识;
步骤五:将非参数模型辨识方法与最优迭代学习方法相结合构成一种基于数据驱动的自适应最优迭代学习方法,在迭代过程中进行名义模型的辨识并不断更新迭代学习控制器;
步骤六:利用基于数据驱动的自适应最优迭代学习方法对控制信号进行迭代更新,将更新后的驱动力重新下发至运动控制卡,反复此迭代学习过程提高伺服系统跟踪精度。
9.如权利要求1-8任一所述的一种基于数据驱动的自适应最优迭代学习控制方法,其特征在于,
所述步骤六:在运动控制卡内部设计一个参数摄动控制器P(s)用于模拟系统参数的变化,在第5次迭代时改变P(s)的参数,采用三阶轨迹,分别采用传统最优迭代学习控制和基于数据驱动的自适应最优迭代学习控制控制对误差进行迭代,将经过迭代学习产生的驱动力uk+1重新下发至运动控制卡,反复此过程以提高系统跟踪性能。
10.如权利要求9所述的一种基于数据驱动的自适应最优迭代学习控制方法,其特征在于,
所述伺服系统为伺服电机;所述上位机为电脑或工控机。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011215090.8A CN112255920A (zh) | 2020-11-04 | 2020-11-04 | 一种基于数据驱动的自适应最优迭代学习控制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011215090.8A CN112255920A (zh) | 2020-11-04 | 2020-11-04 | 一种基于数据驱动的自适应最优迭代学习控制方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112255920A true CN112255920A (zh) | 2021-01-22 |
Family
ID=74268344
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011215090.8A Pending CN112255920A (zh) | 2020-11-04 | 2020-11-04 | 一种基于数据驱动的自适应最优迭代学习控制方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112255920A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113219832A (zh) * | 2021-05-10 | 2021-08-06 | 西安理工大学 | 一种自适应迭代学习非一致目标跟踪控制器设计方法 |
CN114879500A (zh) * | 2022-05-17 | 2022-08-09 | 广东技术师范大学 | 一种批次反应器的迭代学习控制方法、装置、设备和介质 |
CN117590766A (zh) * | 2024-01-19 | 2024-02-23 | 青岛理工大学 | 通道入口导流栏杆角度调整的控制方法和装置 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109491251A (zh) * | 2018-12-18 | 2019-03-19 | 华中科技大学 | 考虑数据扰动补偿的交流伺服系统模型辨识方法及设备 |
-
2020
- 2020-11-04 CN CN202011215090.8A patent/CN112255920A/zh active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109491251A (zh) * | 2018-12-18 | 2019-03-19 | 华中科技大学 | 考虑数据扰动补偿的交流伺服系统模型辨识方法及设备 |
Non-Patent Citations (7)
Title |
---|
史伟民等: "基于滤波器的迭代学习最小二乘辨识方法", 《机电工程》 * |
曹荣敏 等: "直线电机的非参数模型直接自适应预测控制", 《控制理论与应用》 * |
杨亮亮 等: "基于最优控制迭代学习的直线伺服系统振动抑制研究", 《机械工程学报》 * |
池荣虎等: "快速路入口匝道的的非参数自适应迭代学习控制", 《控制理论与应用》 * |
池荣虎等: "高阶无模型自适应迭代学习控制", 《控制与决策》 * |
王卫红等: "基于数据驱动方法的控制器设计及其参数整定", 《系统科学与数学》 * |
高冬垒等: "一种基于参数辨识的迭代学习控制算法及应用", 《计算机系统应用》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113219832A (zh) * | 2021-05-10 | 2021-08-06 | 西安理工大学 | 一种自适应迭代学习非一致目标跟踪控制器设计方法 |
CN114879500A (zh) * | 2022-05-17 | 2022-08-09 | 广东技术师范大学 | 一种批次反应器的迭代学习控制方法、装置、设备和介质 |
CN117590766A (zh) * | 2024-01-19 | 2024-02-23 | 青岛理工大学 | 通道入口导流栏杆角度调整的控制方法和装置 |
CN117590766B (zh) * | 2024-01-19 | 2024-05-28 | 青岛理工大学 | 通道入口导流栏杆角度调整的控制方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110750050B (zh) | 一种基于神经网络的机械臂系统预设性能控制方法 | |
WO2020207219A1 (zh) | 一种利用环境预测优化非模型机器人多轴孔装配控制方法 | |
CN110962124B (zh) | 切削加工机器人静态误差补偿与动刚度模型的修正方法 | |
CN112255920A (zh) | 一种基于数据驱动的自适应最优迭代学习控制方法 | |
CN107272409B (zh) | 一种基于迭代学习的直线伺服系统振动抑制方法 | |
CN114131611B (zh) | 机器人重力位姿分解的关节误差离线补偿方法、系统及终端 | |
CN111506996B (zh) | 一种基于辨识误差受限的转台伺服系统自适应辨识方法 | |
Li et al. | Adaptive robust control of servo mechanisms with compensation for nonlinearly parameterized dynamic friction | |
CN114169230A (zh) | 一种机器人动力学参数的辨识方法 | |
Tan et al. | New varying-parameter recursive neural networks for model-free kinematic control of redundant manipulators with limited measurements | |
CN115157250A (zh) | 一种七自由度机械臂动力学参数辨识方法 | |
CN115470691A (zh) | 一种滚珠丝杠元动作单元进给系统参数辨识方法 | |
CN117681186A (zh) | 一种基于不等式约束的高精度协作机械臂鲁棒控制方法 | |
CN113485123A (zh) | 一种小行程纳米级运动台的频域自适应迭代学习控制方法 | |
CN107065559B (zh) | 一种工业机器人增量自适应控制方法 | |
Chen et al. | Accelerated convergence interleaving iterative learning control and inverse dynamics identification | |
CN114952858A (zh) | 一种基于摩擦补偿控制的工业机器人轨迹跟踪方法和系统 | |
Chu et al. | Classifier-based approximator for friction compensation in high accelerated positioning system | |
CN111531543B (zh) | 基于生物启发式神经网络的机器人自适应阻抗控制方法 | |
CN116690559A (zh) | 基于时空图卷积网络的工业机器人关节力矩补偿方法 | |
Wu et al. | Desired compensation adaptive robust control of electrical-optical gyro-stabilized platform with continuous friction compensation using modified LuGre model | |
CN112462606A (zh) | 一种基于自适应控制的挠性关节动力学参数辨识方法 | |
CN115284276B (zh) | 基于长短期记忆网络的机器人关节力矩控制方法 | |
CN116313036A (zh) | 基于运动测量和机器学习的手部动作预测算法 | |
CN116512256A (zh) | 基于联合学习的机器人最优人机交互阻抗控制方法、存储介质及机器人 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210122 |