CN111736471B - 一种旋转倒立摆的迭代反馈整定控制及其鲁棒优化方法 - Google Patents
一种旋转倒立摆的迭代反馈整定控制及其鲁棒优化方法 Download PDFInfo
- Publication number
- CN111736471B CN111736471B CN202010674033.XA CN202010674033A CN111736471B CN 111736471 B CN111736471 B CN 111736471B CN 202010674033 A CN202010674033 A CN 202010674033A CN 111736471 B CN111736471 B CN 111736471B
- Authority
- CN
- China
- Prior art keywords
- rotary
- pendulum
- inverted pendulum
- swing rod
- controller
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000005457 optimization Methods 0.000 title claims abstract description 33
- 238000000034 method Methods 0.000 title claims abstract description 25
- 238000002474 experimental method Methods 0.000 claims description 40
- 238000005070 sampling Methods 0.000 claims description 14
- 230000005540 biological transmission Effects 0.000 claims description 13
- 238000005381 potential energy Methods 0.000 claims description 12
- 230000008569 process Effects 0.000 claims description 9
- 230000000694 effects Effects 0.000 claims description 8
- 239000011159 matrix material Substances 0.000 claims description 7
- 230000009471 action Effects 0.000 claims description 6
- 238000012546 transfer Methods 0.000 claims description 6
- 238000012986 modification Methods 0.000 claims description 4
- 230000004048 modification Effects 0.000 claims description 4
- 238000010276 construction Methods 0.000 claims description 3
- 238000005259 measurement Methods 0.000 claims description 3
- 230000004044 response Effects 0.000 claims description 3
- 230000008859 change Effects 0.000 abstract description 4
- 238000013178 mathematical model Methods 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 9
- 238000013461 design Methods 0.000 description 4
- 230000033228 biological regulation Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000011217 control strategy Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 230000000087 stabilizing effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/04—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
- G05B13/042—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Feedback Control In General (AREA)
Abstract
本发明公开了一种旋转倒立摆的迭代反馈整定控制及其鲁棒优化方法,涉及机器人优化控制领域,该方法包括:基于倒立摆机械和硬件结构建立旋转倒立摆的拉格朗日和状态空间数学模型;设计旋转倒立摆迭代反馈整定双闭环控制器;针对迭代反馈整定PD控制器进行算法的收敛性分析;引入辅助因子对鲁棒迭代反馈整定角度PD控制器进一步优化,实现旋转倒立摆系统能够快速、高精度跟踪上期望运动轨迹;本申请的方法控制算法简单高效,不需要获取模型本身的参数,通过I/O数据驱动计算指标函数对控制器参数的无偏梯度;算法引入辅助因子,使得控制系统能够更好地响应输入信号的变化从而具有较好的鲁棒性。
Description
技术领域
本发明涉及机器人优化控制领域,尤其是一种旋转倒立摆的迭代反馈整定控制及其鲁棒优化方法。
背景技术
旋转倒立摆作为一个典型的欠驱动非线性系统,具有不稳定、多变量、强耦合等特点,并很好的将数学、电学和力学这三门基础学科融合起来。因此,对于倒立摆系统的控制不仅意义重大,而且极具挑战,深受世界各地控制学科的专家学者的重视。除此之外,旋转倒立摆作为机器人、火箭飞行姿态等许多控制对象的最简单模型,是验证各种控制理论策略正确性的理想实验平台,并为控制理论和工程实际应用搭建了一个桥梁。同时作为一种实验装置,结构简单并且控制效果直观,是验证各种控制方法的理想实验平台。其中枢轴为旋转移动的类型又被称为旋转倒立摆,相比于直线型倒立摆通过小车运动控制摆杆,其通过旋臂带动摆杆旋转来保持直立状态,非线性更强。将旋转倒立摆作为被控对象,能够检验迭代反馈整定算法是否具有针对多状态、非线性和绝对不稳定控制系统的优化能力。
作为一种典型的被控模型,对旋转倒立摆系统的控制研究几乎涉及到了绝大部分的控制方法,其中在传统控制领域主要有状态反馈控制、滑膜控制和PID控制等。但这些方法都存在一些局限性,例如状态反馈控制必须要有被控系统的精确模型,在模型精确度不足的情况下难以实现对倒立摆尤其是高阶倒立摆的稳定控制;而滑膜控制在旋转倒立摆切换状态时引起的抖振制约了其应用;PID控制依然是最为普遍的控制方式,其中多闭环PID对阶次较低的旋转倒立摆的控制效果良好,但多闭环PID相比于基础的PID,其参数整定较为复杂。
发明内容
本发明人针对上述问题及技术需求,提出了一种旋转倒立摆的迭代反馈整定控制及其鲁棒优化方法,首先建立起基于双闭环控制的旋转倒立摆实验平台,并再此基础上使用迭代反馈整定算法优化旋转倒立摆系统的角度PD控制器,在PD控制策略框架下,基于IFT算法的基本原理、参数最优化理论和实验整定方法,根据闭环系统的性能准则函数和输入、输出信号自动整定PID控制器参数,运用Gauss-Newton算法得到PID控制器参数的最优值,引入辅助因子不断迭代性能准则函数的权重因子达到改善系统鲁棒性的目的,最终实现对旋转倒立摆的稳定控制。
本发明的技术方案如下:
一种旋转倒立摆的迭代反馈整定控制及其鲁棒优化方法,包括如下步骤:
第一步:建立旋转倒立摆的拉格朗日和状态空间模型;
旋转倒立摆系统包括底座、传动装置、摆杆及旋臂,底座用于保证摆杆摆动时机械结构的稳定;旋臂末端连接摆杆,直流电机的旋转通过传动装置带动摆杆的运动;旋臂的角度及角速度则通过直流电机自带的增量式旋转编码器获取;通过联轴器连接增量式旋转编码器与摆杆,带动增量式旋转编码器旋转从而获取摆杆的角度及角速度;在构建旋转倒立摆的动力学模型中,忽略空气阻力、摩擦力及微小项以简化建模过程,把旋臂及摆杆视为均匀的长杆,设摆杆处于稳定竖立时旋转倒立摆系统的势能为零;
摆杆偏离直立位置角度α时,旋臂通过旋转β带动摆杆趋于直立位置,因此旋臂末端速度vm为:
由于摆杆为均匀长杆,视摆杆为一质点则得到摆杆转动速度为vz为:
将摆杆转动速度vz在旋臂末端速度vm垂直方向进行分解,并以摆杆旋转平面与地面水平方向速度vr所指方向为正方向,得到:
在旋臂末端速度vm和地面水平方向速度vr的共同作用下,摆杆在水平方向上的速度vb为:
摆杆的动能包含有旋转产生的转动动能以及在水平方向上移动产生的动能,另外旋转倒立摆系统整体动能还包含有直流电机带动的旋臂的动能,因此得到旋转倒立摆系统的整体动能V,令J1为摆杆的转动惯量,J2为旋臂的转动惯量,m为摆杆质量,并将式(4)及(5)带入得到:
摆杆直立时设为零势能点,H为旋转倒立摆系统整体势能,E为拉格朗日函数,则偏转α角度后势能降为:
拉格朗日函数E为:
可知旋臂旋转带动摆杆运动,无外界能力输入,令Toutput为电机输出转矩,Beq为等效粘性摩擦,得到拉格朗日方程为:
式(8)带入式(9)及(10)得到旋转倒立摆的非线性模型:
从在式(11)得到的旋转倒立摆的非线性模型中,其输入为直流电机转矩,但通常情况下以直流电机电压为控制输入,因此接下来对直流电机进行建模,最终建立以直流电机电压为输入的倒立摆非线性模型;
令Id为直流电机电流,Ed为反电动势,并考虑传动装置的效率和齿轮比值,KT为电机转矩系数,KE为电机转速系数,Kg为旋臂与直流电机的齿轮比,ηg为齿轮传动效率,ηd为电机效率,U为直流电机电压,R为电枢电阻,得到:
Toutput=ηdηgKgKTId (13)
将式(12)、(13)带入式(11)中,得到以直流电机电压为输入的倒立摆非线性模型为:
为了进一步建立旋转倒立摆的状态空间模型,需要将倒立摆非线性模型进行线性化,注意到摆杆在稳摆控制中处于直立状态,因此摆杆角度较小,此时存在sinα≈α,cosα≈1,则得到旋转倒立摆线性模型为:
接下来以旋转倒立摆线性模型为基础来建立旋转倒立摆的状态空间模型,为了简化书写设置如下定义:
b=J2+mr1 2 (17)
其中由于摆杆及旋臂视为均匀长杆,则其转动惯量J1、J2可以得出:
其中,r2为旋臂长度,M旋臂质量,ρ为旋臂和摆杆的密度;
第二步:设计旋转倒立摆迭代反馈整定双闭环控制器;
针对旋转倒立摆的状态空间模型设计双闭环控制器,使用迭代反馈整定算法优化角度PD控制器参数,若C(ρ)=[Cr(ρ)Cy(ρ)],Cr(ρ)、Cy(ρ)是线性时不变传递函数,G是被控对象的传递函数,u(t)是控制器输出,r(t)是参考输入,y(t)是旋转倒立摆系统输出,v(t)是均值为零的外部随机扰动,PID控制器参数为ρ=[KpKd],在此基础上反馈控制系统作用下的响应输出为:
为了简化书写,将T0(ρ)、S0(ρ)简写为T0、S0,定义yd是给定的期望输入信号,则期望输出与实际输出之间的跟踪误差为:
其中Ly、Lu表示基于时间序列的滤波器,通常Ly=Lu=1,采样点个数为N,性能度量的权重因子为λ;IFT算法是通过最小化性能优化指标函数J(ρ)直接求得系统的PID控制器参数ρ,然后通过i次迭代逐步获取PID控制器参数ρ的最优值,ρi为ρ在第i次迭代中的值,在每个迭代批次中,变量y(ρi)和u(ρi)关于控制器参数ρi的偏导数为:
IFT算法通过在自由度控制系统中进行三次实验,以获得T0r,T0(r-y)的估计值,在三次实验中,前两次用来估计信号T0,首先在第i次迭代中,第一次实验以ri (1)=r为输入的参考信号,y(1)(ρi)为采样得到的控制系统的输出值;其次,以该两信号差值r-y(1)(ρi)为第二次实验输入的参考信号ri (2),采样得到y(2)(ρi):
第三次实验用来估计信号T0r,以ri (3)=r作为输入的参考信号:
基于实验数据的第i次迭代的性能优化指标函数J(ρi)的估计梯度为:
根据性能优化指标函数J(ρi)的估计梯度以及上一次迭代的PID控制器参数ρi使用Gauss–Newton算法计算下一次迭代更新的ρi+1:
其中γi>0表示步长,Ri为正定Hessian矩阵表示优化搜索方向:
第三步:迭代反馈整定角度PD控制器的收敛性分析;
基于IFT算法的实验中设定三次实验的vi (m),m=1,2,3是同一系统相互独立的零均值有界随机噪声,即|vi (m)|<C,其中假设三次实验中界限值C和随机噪声的均方值保持不变,则得到式(21)和(22)的无偏估计;
条件2需要保证算法收敛的条件通常要求步长序列γi的所有元素满足:
第四步:鲁棒迭代反馈整定角度PD控制器的进一步优化;
IFT算法依靠经验选择如λ一类的权重值,但由于各个性能度量之间的物理意义并不相同,运行环境也不尽一致,它们之间的取值范围相差巨大,因此若同时控制多个相同系统,依靠经验选择的性能度量的权重因子λ并不具有普适性,考虑各个性能度量之间的取值范围,构建了一个辅助因子Li,辅助因子Li为性能度量之间的取值范围之比:
在此基础上准则函数J(θ)修改为:
式中yd,max和yd,min为期望输出的最大值与最小值,umax和umin表示第i次迭代过程中控制信号在所有N个采样点中的最大值与最小值;由于这些值都是在每次迭代结束时给出,所有的采样点都会被考虑在内,因而引入辅助因子Li使得权重因子λ在不同系统中都代表了当前迭代优化后与u(θi)权重比的最佳范围。
本发明的有益技术效果是:
针对旋转倒立摆实验平台角度PD控制器参数进行优化,迭代反馈整定算法通过三次闭环实验求取Gauss–Newton梯度进行参数更新,能够使得控制系统能够快速响应输入信号的变化从而具有较好的鲁棒性。本发明将迭代设计与数值优化的的思想相结合,将性能指标函数与I/O数据联系了起来,不需要获取模型本身的参数,避免了优化过程中对被控对象以及扰动特性模型的精确估计的要求。同时贡献出了一种计算指标函数对控制器参数的无偏梯度(也即系统输出微分的无偏信号)的无模型方法,提高了算法在复杂系统控制上的适用性。
附图说明
图1为旋转倒立摆摆动模型示意图。
图2为旋转倒立摆迭代反馈整定双闭环控制结构框图。
图3为旋转倒立摆实验平台机械结构图。
图4为旋转倒立摆实验平台硬件结构图。
图5为DSPACE总体程序设计图。
图6为迭代过程中旋转倒立摆摆杆轨迹、准则函数及控制器参数变化示意图。
图7为引入辅助因子Li前后旋转倒立摆跟踪误差示意图。
具体实施方式
下面结合附图对本发明的具体实施方式做进一步说明。
本申请公开了一种旋转倒立摆的迭代反馈整定控制及其鲁棒优化方法,
第一步:基于倒立摆机械和硬件结构建立旋转倒立摆的拉格朗日和状态空间模型;
图1为旋转倒立摆摆动模型示意图,在此基础上进行旋转倒立摆数学模型的构建,旋转倒立摆系统包括底座、传动装置、摆杆及旋臂,底座用于保证摆杆摆动时机械结构的稳定;旋臂末端连接摆杆,直流电机的旋转通过传动装置带动摆杆的运动;旋臂的角度及角速度则通过直流电机自带的增量式旋转编码器获取;通过联轴器连接增量式旋转编码器与摆杆,带动增量式旋转编码器旋转从而获取摆杆的角度及角速度;在构建旋转倒立摆的动力学模型中,忽略空气阻力、摩擦力及微小项以简化建模过程,把旋臂及摆杆视为均匀的长杆,设摆杆处于稳定竖立时旋转倒立摆系统的势能为零。结合表1所示,旋转倒立摆各物理量的含义为:
表1旋转倒立摆各物理量意义
摆杆偏离直立位置角度α时,旋臂通过旋转β带动摆杆趋于直立位置,因此旋臂末端速度vm为:
由于摆杆为均匀长杆,视摆杆为一质点则得到摆杆转动速度为vz为:
将摆杆转动速度vz在旋臂末端速度vm垂直方向进行分解,并以摆杆旋转平面与地面水平方向速度vr所指方向为正方向,得到:
在旋臂末端速度vm和地面水平方向速度vr的共同作用下,摆杆在水平方向上的速度vb为:
摆杆的动能包含有旋转产生的转动动能以及在水平方向上移动产生的动能,另外旋转倒立摆系统整体动能还包含有直流电机带动的旋臂的动能,因此得到旋转倒立摆系统的整体动能V,令J1为摆杆的转动惯量,J2为旋臂的转动惯量,m为摆杆质量,并将式(4)及(5)带入得到:
摆杆直立时设为零势能点,H为旋转倒立摆系统整体势能,E为拉格朗日函数,则偏转α角度后势能降为:
拉格朗日函数E为:
可知旋臂旋转带动摆杆运动,无外界能力输入,令Toutput为电机输出转矩,Beq为等效粘性摩擦,得到拉格朗日方程为:
式(8)带入式(9)及(10)得到旋转倒立摆的非线性模型:
从在式(11)得到的旋转倒立摆的非线性模型中,其输入为直流电机转矩,但通常情况下以直流电机电压为控制输入,因此接下来对直流电机进行建模,最终建立以直流电机电压为输入的倒立摆非线性模型;
令Id为直流电机电流,Ed为反电动势,并考虑传动装置的效率和齿轮比值,KT为电机转矩系数,KE为电机转速系数,Kg为旋臂与直流电机的齿轮比,ηg为齿轮传动效率,ηd为电机效率,U为直流电机电压,R为电枢电阻,得到:
Toutput=ηdηgKgKTId (13)
将式(12)、(13)带入式(11)中,得到以直流电机电压为输入的倒立摆非线性模型为:
为了进一步建立旋转倒立摆的状态空间模型,需要将倒立摆非线性模型进行线性化,注意到摆杆在稳摆控制中处于直立状态,因此摆杆角度较小,此时存在sinα≈α,cosα≈1,则得到旋转倒立摆线性模型为:
接下来以旋转倒立摆线性模型为基础来建立旋转倒立摆的状态空间模型,为了简化书写设置如下定义:
b=J2+mr1 2 (17)
其中由于摆杆及旋臂视为均匀长杆,则其转动惯量J1、J2可以得出:
其中,r2为旋臂长度,M旋臂质量,ρ为旋臂和摆杆的密度。
将如表2所示的倒立摆实际参数值带入式(16)至(25),得到旋转倒立摆的具体状态空间模型如下所示:
根据该状态空间模型,由李雅普诺夫判据及秩判据可以得到旋转倒立摆是一个不稳定的但完全能控能观的系统,因此能够通过控制直流电动机电压对旋臂的角度、角速度和摆杆的角度、角速度进行控制,并且这些参数是完全可以观测的。
表2:旋转倒立摆各实际参数
第二步:设计旋转倒立摆迭代反馈整定双闭环控制器;
结合图2所示,针对旋转倒立摆的状态空间模型设计双闭环控制器,使用迭代反馈整定算法优化角度PD控制器参数,若C(ρ)=[Cr(ρ)Cy(ρ)],Cr(ρ)、Cy(ρ)是线性时不变传递函数,G是被控对象的传递函数,u(t)是控制器输出,r(t)是参考输入,y(t)是旋转倒立摆系统输出,v(t)是均值为零的外部随机扰动,PID控制器参数为ρ=[KpKd],在此基础上反馈控制系统作用下的响应输出为:
为了简化书写,将T0(ρ)、S0(ρ)简写为T0、S0,定义yd是给定的期望输入信号,则期望输出与实际输出之间的跟踪误差为:
其中Ly、Lu表示基于时间序列的滤波器,通常Ly=Lu=1,采样点个数为N,性能度量的权重因子为λ;IFT算法是通过最小化性能优化指标函数J(ρ)直接求得系统的PID控制器参数ρ,然后通过i次迭代逐步获取PID控制器参数ρ的最优值,ρi为ρ在第i次迭代中的值,在每个迭代批次中,变量y(ρi)和u(ρi)关于控制器参数ρi的偏导数为:
IFT算法通过在自由度控制系统中进行三次实验,以获得T0r,T0(r-y)的估计值,在三次实验中,前两次用来估计信号T0,首先在第i次迭代中,第一次实验以ri (1)=r为输入的参考信号,y(1)(ρi)为采样得到的控制系统的输出值;其次,以该两信号差值r-y(1)(ρi)为第二次实验输入的参考信号ri (2),采样得到y(2)(ρi):
第三次实验用来估计信号T0r,以ri (3)=r作为输入的参考信号:
基于实验数据的第i次迭代的性能优化指标函数J(ρi)的估计梯度为:
根据性能优化指标函数J(ρi)的估计梯度以及上一次迭代的PID控制器参数ρi使用Gauss–Newton算法计算下一次迭代更新的ρi+1:
其中γi>0表示步长,Ri为正定Hessian矩阵表示优化搜索方向:
为了设计稳摆控制器以维持摆杆稳定直立,首先对摆杆角度设计一个闭环,直立状态作为动态平衡,不需要积分控制,但加入微分控制提高角度变化率大时的调控速度,最终对摆杆角度采用PD控制器;摆杆稳定直立时旋臂应该保持静止,因此再次添加一个闭环对旋臂位置进行控制,基于位置是速度的积分,因此旋臂速度采用PI控制器;由于速度的闭环是角度控制的一个干扰量,PI控制器对角度控制的影响需要降低,因此迭代反馈整定算法被用于稳摆过程中旋转倒立摆角度PD控制器参数的整定优化。
将推导出来的式(26)旋转倒立摆具体状态空间模型作为控制系统未知的不确定被控对象,通过获得增量式旋转编码器采集到的摆杆实际角度与给定角度的跟踪误差,设计角度IFT-PD控制器用以输出直流电机电压。
本申请中,旋转倒立摆的起摆控制采用旋臂位置反馈以及摆杆的速度反馈实现,旋臂的位置反馈限制摆杆在期望位置周边进行摆动,而摆杆的速度反馈则使摆杆的摆角幅度逐渐变大。
第三步:迭代反馈整定角度PD控制器的收敛性分析;
基于IFT算法的实验中设定三次实验的vi (m),m=1,2,3是同一系统相互独立的零均值有界随机噪声,即|vi (m)|<C,其中假设三次实验中界限值C和随机噪声的均方值保持不变,则得到式(21)和(22)的无偏估计;
条件2需要保证算法收敛的条件通常要求步长序列γi的所有元素满足:
这些收敛条件的基本要求是在整个优化迭代过程中参考输入信号r(t)始终保持有界。虽然确定更新方向的矩阵Ri不会影响IFT的收敛能力,但理想选择是通过Gauss–Newton方向来加速收敛速度。因此使用Gauss–Newton优化算法可以保证算法的收敛性,使得设计的IFT算法能够很快覆盖到一个固定的优化点。该结论除了时不变性条件外,对系统的性质没有任何假设,因此结论适用于简单的PID控制器或者更复杂的控制器。
第四步:引入辅助因子对鲁棒迭代反馈整定角度PD控制器的进一步优化;
IFT算法依靠经验选择如λ一类的权重值,但由于各个性能度量之间的物理意义并不相同,运行环境也不尽一致,它们之间的取值范围相差巨大,因此若同时控制多个相同系统,依靠经验选择的性能度量的权重因子λ并不具有普适性,考虑各个性能度量之间的取值范围,构建了一个辅助因子Li,辅助因子Li为性能度量之间的取值范围之比:
在此基础上准则函数J(θ)修改为:
式中yd,max和yd,min为期望输出的最大值与最小值,umax和umin表示第i次迭代过程中控制信号在所有N个采样点中的最大值与最小值;由于这些值都是在每次迭代结束时给出,所有的采样点都会被考虑在内,因而引入辅助因子Li使得权重因子λ在不同系统中都代表了当前迭代优化后与u(θi)权重比的最佳范围。
图3是旋转倒立摆实验平台的机械结构,包含底座、传动装置、直流电机、摆杆及旋臂等部分,图4为旋转倒立摆实验平台硬件结构图,旋转倒立摆的硬件结构由DSPACE可编程控制器、IR2104直流电机驱动板、ETS25绝对式旋转编码器、50V/4.9A的直流电机及与ETS25进行SPI通信的STM32板组成。DSPACE发出PWM信号给IR2104直流电机驱动板,而IR2104直流电机驱动板根据PWM控制直流电机的电压及转向,进一步DSPACE读取电机的位置及转速且电机通过传动带带动旋臂进行旋转,摆杆通过联轴器带动旋转编码器旋转,最后摆杆的位置及速度通过SPI由STM32最小系统读取,并通过串口发送至DSPACE。
DSPACE实时仿真系统是由德国DSPACE公司开发的一套基于MATLAB/Simulink的控制系统在实时环境下的开发及测试工作平台,它可以和MATLAB/Simulink进行无缝衔接。在本申请中,所采用的DSPACE的型号为DS1104,它是一个基于PowerPC603浮点处理器的实时控制系统,运行频率可达250MHz。为了满足对于一些高级I/O口的需求,该型号包括了一个基于TMS320F204DSP微控制器的从DSP子系统。为了快速控制原型(RCP),特定的接口连接器和连接器面板可以方便地访问DSPACE的所有输入和输出信号。
本申请还提供了基于DSPACE旋转倒立摆软件和硬件的具体设计:
基于迭代反馈整定的旋转倒立摆双闭环控制具体的鲁棒优化方案如下:
1)针对旋转倒立摆线性模型(15),设定该摆杆初始角度θ0,初始控制信号Δu0,期望轨迹yd,采样周期ΔT。
2)选择角度PD控制器最初的参数ρ1并根据式(17)设计性能优化指标J(ρi),给定一个阈值Jmax。
3)进行三次旋转倒立摆摆动实验,实验的三次输入分别为:ri (1)=yd、ri (2)=y(1)(ρi)、ri (3)=yd,第一次实验所得y(1)(ρi)作为第二次实验的参考输入,第二次和第三次实验获取控制器输入值u(2)(ρi)、u(3)(ρi)和系统输出值y(2)(ρi)、y(3)(ρi)来计算控制器参数的梯度。
5)判断系统性能优化指标J(ρi)是否小于Jmax,若小于则转6)结束,否则重新执行步骤3)。
6)结束;
为了实现直流电机的调速及正反转,本专利采用了直流电机的典型控制电路——H桥式驱动电路。通过控制MOS管的导通及关断,改变电机电压的大小及电流的方向,实现对于直流电机的控制。
旋转倒立摆系统中的摆杆角度及速度的采集通过一款SPI信号发送数据的旋转编码器ETS25。在本次设计中,采用一块STM32最小系统作为中介,即通过STM32板与ETS25通信,再通过RS232串口通信将编码器信号发送给DSPACE。旋转编码器ETS25所使用的SPI信号数据线仅有一根,并需要5V进行上拉以提供高电平,而对于传感器来说属于从设备,因此与STM32单片机的MOSI相连。旋臂角度及速度的获取通过直流电机自带的霍尔传感器进行检测。由于DSPACE上集成了此类传感器的读取程序,因此,对于旋臂角度及速度的读取相对简单。
图5为DSPACE总体程序设计图,本申请中倒立摆的摆杆初始角度θ0为0.1rad,PD控制器增益为θ=[150 45],将其作为θ1,导入基于DSPACE的旋转倒立摆双闭环控制系统中以获取摆杆的轨迹采样数据,并将这些数据在MATLAB中进行离线运算进而更新PD控制器。随着迭代次数逐步增加,在此基础上来检验IFT算法的优化效果。其中迭代数i=1、i=3及i=20的旋转倒立摆摆杆的轨迹如图6(a)所示,并在这些迭代次数下准则函数J(θi)、kP以及kD的变化情况如图6(b)、(c)、(d)所示,看出随着IFT算法的不断迭代,摆杆角度的控制效果得到了明显的改善,对应的准则函数J(θi)的变化趋势表明输入输出误差随着迭代进行逐渐减小,PD控制器参数θi也最终收敛至θ20=[325 45.7]。进一步为此分别选取λ1=10-4和λ2=10-5,然后引入随批次变化的辅助因子Li,引入辅助因子Li前后旋转倒立摆跟踪误差为图7所示,旋转倒立摆跟踪误差随着迭代过程的进行稳步下降,并且在引入辅助因子Li后,跟踪误差进一步减小,表明系统的整体控制性能进一步提升。
以上所述的仅是本申请的优选实施方式,本发明不限于以上实施例。可以理解,本领域技术人员在不脱离本发明的精神和构思的前提下直接导出或联想到的其他改进和变化,均应认为包含在本发明的保护范围之内。
Claims (1)
1.一种旋转倒立摆的迭代反馈整定控制及其鲁棒优化方法,其特征在于,所述方法包括:
第一步:建立旋转倒立摆的拉格朗日和状态空间模型;
旋转倒立摆系统包括底座、传动装置、摆杆及旋臂,所述底座用于保证所述摆杆摆动时机械结构的稳定;旋臂末端连接所述摆杆,直流电机的旋转通过所述传动装置带动所述摆杆的运动;所述旋臂的角度及角速度则通过所述直流电机自带的增量式旋转编码器获取;通过联轴器连接所述增量式旋转编码器与所述摆杆,带动所述增量式旋转编码器旋转从而获取所述摆杆的角度及角速度;在构建所述旋转倒立摆的动力学模型中,忽略空气阻力、摩擦力及微小项以简化建模过程,把所述旋臂及摆杆视为均匀的长杆,设所述摆杆处于稳定竖立时所述旋转倒立摆系统的势能为零;
所述摆杆偏离直立位置角度α时,所述旋臂通过旋转β带动所述摆杆趋于直立位置,因此旋臂末端速度vm为:
由于所述摆杆为均匀长杆,视所述摆杆为一质点则得到摆杆转动速度为vz为:
将所述摆杆转动速度vz在所述旋臂末端速度vm垂直方向进行分解,并以摆杆旋转平面与地面水平方向速度vr所指方向为正方向,得到:
在所述旋臂末端速度vm和地面水平方向速度vr的共同作用下,所述摆杆在水平方向上的速度vb为:
所述摆杆的动能包含有旋转产生的转动动能以及在水平方向上移动产生的动能,另外所述旋转倒立摆系统整体动能还包含有所述直流电机带动的所述旋臂的动能,因此得到所述旋转倒立摆系统的整体动能V,令J1为摆杆的转动惯量,J2为旋臂的转动惯量,m为摆杆质量,并将式(4)及(5)带入得到:
所述摆杆直立时设为零势能点,H为所述旋转倒立摆系统整体势能,E为拉格朗日函数,则偏转α角度后势能降为:
拉格朗日函数E为:
可知旋臂旋转带动所述摆杆运动,无外界能力输入,令Toutput为电机输出转矩,Beq为等效粘性摩擦,得到拉格朗日方程为:
式(8)带入式(9)及(10)得到旋转倒立摆的非线性模型:
从在式(11)得到的所述旋转倒立摆的非线性模型中,其输入为直流电机转矩,但通常情况下以直流电机电压为控制输入,因此接下来对所述直流电机进行建模,最终建立以所述直流电机电压为输入的倒立摆非线性模型;
令Id为直流电机电流,Ed为反电动势,并考虑所述传动装置的效率和齿轮比值,KT为电机转矩系数,KE为电机转速系数,Kg为旋臂与直流电机的齿轮比,ηg为齿轮传动效率,ηd为电机效率,U为所述直流电机电压,R为电枢电阻,得到:
Toutput=ηdηgKgKTId (13)
将式(12)、(13)带入式(11)中,得到以所述直流电机电压为输入的所述倒立摆非线性模型为:
为了进一步建立旋转倒立摆的状态空间模型,需要将所述倒立摆非线性模型进行线性化,注意到所述摆杆在稳摆控制中处于直立状态,因此摆杆角度较小,此时存在sinα≈α,cosα≈1,则得到旋转倒立摆线性模型为:
接下来以所述旋转倒立摆线性模型为基础来建立所述旋转倒立摆的状态空间模型,为了简化书写设置如下定义:
b=J2+mr1 2 (17)
其中由于所述摆杆及旋臂视为均匀长杆,则其转动惯量J1、J2可以得出:
其中,r2为旋臂长度,M旋臂质量,ρ为旋臂和摆杆的密度;
第二步:设计旋转倒立摆迭代反馈整定双闭环控制器;
针对所述旋转倒立摆的状态空间模型设计所述双闭环控制器,使用迭代反馈整定算法优化角度PD控制器参数,若C(ρ)=[Cr(ρ) Cy(ρ)],Cr(ρ)、Cy(ρ)是线性时不变传递函数,G是被控对象的传递函数,u(t)是控制器输出,r(t)是参考输入,y(t)是所述旋转倒立摆系统输出,v(t)是均值为零的外部随机扰动,PID控制器参数为ρ=[Kp Kd],在此基础上反馈控制系统作用下的响应输出为:
为了简化书写,将T0(ρ)、S0(ρ)简写为T0、S0,定义yd是给定的期望输入信号,则期望输出与实际输出之间的跟踪误差为:
其中Ly、Lu表示基于时间序列的滤波器,通常Ly=Lu=1,采样点个数为N,性能度量的权重因子为λ;IFT算法是通过最小化所述性能优化指标函数J(ρ)直接求得系统的所述PID控制器参数ρ,然后通过i次迭代逐步获取所述PID控制器参数ρ的最优值,ρi为ρ在第i次迭代中的值,在每个迭代批次中,变量y(ρi)和u(ρi)关于控制器参数ρi的偏导数为:
所述IFT算法通过在自由度控制系统中进行三次实验,以获得T0r,T0(r-y)的估计值,在三次实验中,前两次用来估计信号T0,首先在第i次迭代中,第一次实验以ri (1)=r为输入的参考信号,y(1)(ρi)为采样得到的控制系统的输出值;其次,以两信号差值r-y(1)(ρi)为第二次实验输入的参考信号ri (2),采样得到y(2)(ρi):
第三次实验用来估计信号T0r,以ri (3)=r作为输入的参考信号:
基于实验数据的第i次迭代的所述性能优化指标函数J(ρi)的估计梯度为:
根据所述性能优化指标函数J(ρi)的估计梯度以及上一次迭代的所述PID控制器参数ρi使用Gauss–Newton算法计算下一次迭代更新的ρi+1:
其中γi>0表示步长,Ri为正定Hessian矩阵表示优化搜索方向:
第三步:迭代反馈整定角度PD控制器的收敛性分析;
基于所述IFT算法的实验中设定三次实验的vi (m),m=1,2,3是同一系统相互独立的零均值有界随机噪声,即|vi (m)|<C,其中假设三次实验中界限值C和随机噪声的均方值保持不变,则得到式(21)和(22)的无偏估计;
条件2需要保证算法收敛的条件通常要求所述步长序列γi的所有元素满足:
第四步:鲁棒迭代反馈整定角度PD控制器的进一步优化;
所述IFT算法依靠经验选择如λ一类的权重值,但由于各个所述性能度量之间的物理意义并不相同,运行环境也不尽一致,它们之间的取值范围相差巨大,因此若同时控制多个相同系统,依靠经验选择的所述性能度量的权重因子λ并不具有普适性,考虑各个所述性能度量之间的取值范围,构建了一个辅助因子Li,所述辅助因子Li为所述性能度量之间的取值范围之比:
在此基础上准则函数J(θ)修改为:
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010674033.XA CN111736471B (zh) | 2020-07-14 | 2020-07-14 | 一种旋转倒立摆的迭代反馈整定控制及其鲁棒优化方法 |
PCT/CN2021/094746 WO2022012156A1 (zh) | 2020-07-14 | 2021-05-20 | 一种旋转倒立摆的迭代反馈整定控制及其鲁棒优化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010674033.XA CN111736471B (zh) | 2020-07-14 | 2020-07-14 | 一种旋转倒立摆的迭代反馈整定控制及其鲁棒优化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111736471A CN111736471A (zh) | 2020-10-02 |
CN111736471B true CN111736471B (zh) | 2021-06-15 |
Family
ID=72654521
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010674033.XA Active CN111736471B (zh) | 2020-07-14 | 2020-07-14 | 一种旋转倒立摆的迭代反馈整定控制及其鲁棒优化方法 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN111736471B (zh) |
WO (1) | WO2022012156A1 (zh) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111736471B (zh) * | 2020-07-14 | 2021-06-15 | 江南大学 | 一种旋转倒立摆的迭代反馈整定控制及其鲁棒优化方法 |
CN111580392B (zh) * | 2020-07-14 | 2021-06-15 | 江南大学 | 一种串联倒立摆的有限频率范围鲁棒迭代学习控制方法 |
CN113625568A (zh) * | 2021-08-11 | 2021-11-09 | 上海交通大学 | 基于广义系统模型的倒立摆无源自适应滑模控制方法 |
CN114625011B (zh) * | 2022-03-23 | 2024-04-02 | 合肥工业大学 | 一种配电网无线通信可靠性的鲁棒控制方法 |
CN115016282B (zh) * | 2022-06-28 | 2024-09-13 | 西安工业大学 | 一种分数阶三步法控制器及其鲁棒参数整定方法 |
CN115236982B (zh) * | 2022-07-15 | 2024-06-18 | 合肥中科深谷科技发展有限公司 | 面向非同长二级倒立摆自起摆及其平衡控制方法 |
CN115320405B (zh) * | 2022-08-17 | 2024-09-27 | 北京航空航天大学 | 一种输入和状态饱和的电动车速度控制方法 |
CN115356932B (zh) * | 2022-08-26 | 2024-08-30 | 中国地质大学(武汉) | 伺服控制系统及前馈控制器参数整定方法 |
CN115598967B (zh) * | 2022-11-01 | 2023-12-08 | 南栖仙策(南京)高新技术有限公司 | 参数整定模型训练、参数确定方法、装置、设备及介质 |
CN117369246B (zh) * | 2023-12-07 | 2024-02-13 | 济南大学 | 一种基于电子阻力高位下拉器的最优鲁棒控制方法 |
CN118170003B (zh) * | 2024-05-14 | 2024-07-19 | 济南大学 | 一种基于改进角蜥蜴优化算法的pid参数优化方法 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7949430B2 (en) * | 2006-11-29 | 2011-05-24 | Honda Motor Co., Ltd. | Determination of foot placement for humanoid push recovery |
CN101673354A (zh) * | 2009-06-12 | 2010-03-17 | 北京工业大学 | 操作条件反射自动机及其在仿生自主学习控制中的应用 |
JP5336955B2 (ja) * | 2009-07-06 | 2013-11-06 | 株式会社豊田中央研究所 | 倒立振子型移動体及びその制御方法 |
CN101866144A (zh) * | 2010-06-29 | 2010-10-20 | 北京航空航天大学 | 一种基于ITAE的Furuta摆智能控制方法 |
CN103823379B (zh) * | 2014-02-28 | 2017-06-13 | 北京理工大学 | 基于迭代学习的高频率角振动转台滑模控制方法 |
ES2906411T3 (es) * | 2015-06-29 | 2022-04-18 | Suez Groupe | Procedimiento de detección de anomalías en un sistema de distribución de agua |
CN105334739B (zh) * | 2015-12-04 | 2017-12-19 | 东北大学 | 基于迭代学习p型学习律的fast整网控制方法 |
CN107561929B (zh) * | 2017-07-25 | 2020-01-14 | 北京理工大学 | 一种伺服系统的无模型鲁棒自适应优化方法 |
CN108107720B (zh) * | 2017-11-23 | 2021-03-16 | 中国南方电网有限责任公司 | 基于状态空间分析的水轮机调速器参数整定方法及系统 |
US10522036B2 (en) * | 2018-03-05 | 2019-12-31 | Nec Corporation | Method for robust control of a machine learning system and robust control system |
CN109856968B (zh) * | 2018-09-19 | 2022-11-08 | 湘潭大学 | 一种基于相平面模糊自调整的倒立摆系统改进型自抗扰控制方法 |
US11007642B2 (en) * | 2018-10-23 | 2021-05-18 | X Development Llc | Machine learning methods and apparatus for automated robotic placement of secured object in appropriate location |
CN109709802B (zh) * | 2018-12-14 | 2020-06-16 | 江南大学 | 基于迭代学习控制的有源电子梯形电路的控制方法 |
CN109407513B (zh) * | 2018-12-14 | 2020-06-16 | 江南大学 | 气动人工肌肉关节的基于迭代反馈整定的跟踪控制方法 |
CN110134011B (zh) * | 2019-04-23 | 2022-01-11 | 浙江工业大学 | 一种倒立摆自适应迭代学习反演控制方法 |
CN111736471B (zh) * | 2020-07-14 | 2021-06-15 | 江南大学 | 一种旋转倒立摆的迭代反馈整定控制及其鲁棒优化方法 |
-
2020
- 2020-07-14 CN CN202010674033.XA patent/CN111736471B/zh active Active
-
2021
- 2021-05-20 WO PCT/CN2021/094746 patent/WO2022012156A1/zh active Application Filing
Also Published As
Publication number | Publication date |
---|---|
WO2022012156A1 (zh) | 2022-01-20 |
CN111736471A (zh) | 2020-10-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111736471B (zh) | 一种旋转倒立摆的迭代反馈整定控制及其鲁棒优化方法 | |
JP6774637B2 (ja) | 制御装置及び制御方法 | |
CN106325073B (zh) | 基于分数阶的伺服系统位置环ip控制器无模型自校正方法 | |
Akhtaruzzaman et al. | Modeling and control of a rotary inverted pendulum using various methods, comparative assessment and result analysis | |
CN109927032A (zh) | 一种基于高阶滑模观测器的机械臂轨迹跟踪控制方法 | |
CN107505841B (zh) | 一种基于干扰估计器的机械臂姿态鲁棒控制方法 | |
CN106026822B (zh) | 伺服电机驱动系统的惯量在线辨识方法及系统 | |
CN105888971B (zh) | 一种大型风力机叶片主动降载控制系统及方法 | |
CN111106772A (zh) | 一种包含参数跟踪的感应电机状态强跟踪滤波估计方法 | |
CN111872933B (zh) | 一种基于改进二次型迭代学习控制的scara机器人轨迹跟踪控制方法 | |
CN111152213B (zh) | 一种基于混合控制的机械臂振动补偿方法及装置 | |
US20230305563A1 (en) | Method for building controller for robot, method, device for controlling motion of robot, and robot | |
WO2023165192A1 (zh) | 机器人控制方法、装置、机器人以及计算机可读存储介质 | |
CN116736748B (zh) | 构建机器人的控制器的方法和机器人 | |
CN114029954A (zh) | 一种异构伺服的力反馈估计方法 | |
CN115248554A (zh) | 一种运动控制系统的最优迭代前馈调参方法及系统 | |
Zhao et al. | Design of MRAC and Modified MRAC for the Turntable | |
CN107728470B (zh) | 一种无速率测量的机械臂姿态控制方法 | |
CN113126538A (zh) | 电子设备及其控制方法 | |
CN111637008B (zh) | 共享机制下风电场风力发电机变桨系统的控制方法及系统 | |
JP3835641B2 (ja) | ロボットの負荷パラメータ推定方法 | |
CN117590754B (zh) | 一种机器人系统的智能学习输出调控方法 | |
CN117406624A (zh) | 一种基于比例谐振控制的转动惯量电模拟方法 | |
CN113325711B (zh) | 一种用于柔性机械臂预定精度定位的智能控制方法 | |
Drapikowski et al. | Control and Model Parameters Identification of Inertia Wheel Pendulum. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |