CN111273543B - 一种基于策略迭代的pid优化控制方法 - Google Patents
一种基于策略迭代的pid优化控制方法 Download PDFInfo
- Publication number
- CN111273543B CN111273543B CN202010094391.3A CN202010094391A CN111273543B CN 111273543 B CN111273543 B CN 111273543B CN 202010094391 A CN202010094391 A CN 202010094391A CN 111273543 B CN111273543 B CN 111273543B
- Authority
- CN
- China
- Prior art keywords
- pid
- control
- strategy
- wheels
- following
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 27
- 238000011217 control strategy Methods 0.000 claims abstract description 23
- 239000000725 suspension Substances 0.000 claims abstract description 15
- 238000005457 optimization Methods 0.000 claims abstract description 7
- 230000006870 function Effects 0.000 claims description 29
- 230000003190 augmentative effect Effects 0.000 claims description 8
- 239000011159 matrix material Substances 0.000 claims description 8
- 238000006073 displacement reaction Methods 0.000 claims description 6
- 230000007246 mechanism Effects 0.000 claims description 4
- 238000013016 damping Methods 0.000 claims description 3
- 230000000694 effects Effects 0.000 claims description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000012938 design process Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000003534 oscillatory effect Effects 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B11/00—Automatic controllers
- G05B11/01—Automatic controllers electric
- G05B11/36—Automatic controllers electric with provision for obtaining particular characteristics, e.g. proportional, integral, differential
- G05B11/42—Automatic controllers electric with provision for obtaining particular characteristics, e.g. proportional, integral, differential for obtaining a characteristic which is both proportional and time-dependent, e.g. P. I., P. I. D.
Landscapes
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Automation & Control Theory (AREA)
- Vehicle Body Suspensions (AREA)
Abstract
本发明涉及一种基于策略迭代的PID优化控制方法,首先建立主动悬架系统动力学模型,然后将上述微分方程描述成状态空间模型,设计包含PID控制策略和近似最优补充控制策略的组合控制方案,基于平方和规划技术的改进策略迭代算法,对PID参数进行整定,使系统达到更好的性能。
Description
技术领域
本发明涉及一种主动悬架系统的控制方法,主要是基于强化学习思想优化非线性系统原有的PID控制参数,属于智能控制领域。
背景技术
由于实现的简单性,鲁棒性和可靠性,PID控制在工业过程中被广泛使用。通常,设计PID控制器是一个多目标问题,一般会导致非凸问题。在过去的几十年中,研究人员已经提出了许多调节PID控制参数技术方法。作为传统的调节方法,试错法是调节PID控制参数的简便方法,但不能有效保证所需的控制性能。尽管Ziegler-Nichols方法很流行,并且在非线性系统中表现良好,但是对于高阶系统,此方法可能会导致较大的超调,较长的调节时间和振荡响应。此外,还存在许多其他调整PID参数方法,例如简化Ziegler-Nichols方法,极点配置方法以及增益和相位裕度方法。然而,大多数方法不适用于多输入多输出非线性系统。
《基于SOS和策略迭代的多项式非线性系统H∞最优控制》(朱圆恒,赵冬彬,杨雄,张启超,《IEEE TRANSACTIONS ON CYBERNETICS》,2018年第2期第48卷)一文中提出了一种基于SOS的策略迭代方法来处理多项式非线性系统的近似H∞控制。尽管SOS多项式的成功吸引了ADP界的研究者的兴趣,但很少考虑基于SOS的PID参数调整和逼近最佳补偿控制的问题。
发明内容
要解决的技术问题
面向主动悬架系统优化控制,本发明设计了一种基于策略迭代的PID参数优化控制方法,该方法能够确保主动悬架系统的稳定性,并且提升控制性能,从而为乘客提供更舒适的体验。
技术方案
一种基于策略迭代的PID优化控制方法,其特征在于步骤如下:
步骤1:考虑到主动悬架系统动力学模型:
其中,Me和Mf是车身和车轮的质量,xs和xw是车身和车轮的位移,Kd和Kf是弹性系数,Cd是悬架阻尼系数,r是道路干扰,u是液压执行器的控制力,fb(xs,xw)和fus(xs,xw)是高阶非线性函数;
其中
x1和x3分别是车身和车轮的位置,x2和x4是车身和车轮的速度,a1和a2为比例系数,这里考虑与车身和车轮位移相关的高阶非线性函数的影响;
步骤3:为了使系统运行更平稳,给乘客提供更舒适的体验,提出如下组合控制方法;针对一类连续时间非线性系统,其描述如下:
其中,是可测系统状态,是控制输入,是多项式向量,且有f(0)=0,是多项式矩阵;此非线性系统模型可以用来描述上述主动悬架系统;考虑系统总体控制策略为u(t)=uPID(t)+ua(t),其中uPID(t)为PID控制量,其初始策略可保持系统原有PID控制机制,ua(t)为附加的近似最优控制,在通过算法学习ua(t)的同时,优化原有的PID参数;
PID控制器通常设计为
控制器的时域解为uPID(x)=KPx+μI+μD (6)
其中
为了提高设计自由度,可以添加一些控制参数,设计以下实际运用的PID控制器。
uPID(x)=KPx+KI1μI+KD1μD (7)
步骤4:定义xa=[μI,μD,x]T,得到一个增广系统
其中
步骤5:针对以上增广系统,选择下面的性能指标函数:
其中,Q(xa)是正定多项式函数,R(xa)是对称正定多项式矩阵,与ua(t)相关的成本函数为:
然后,定义哈密顿函数为
最优成本函数V*(xa,θ)为
满足以下等式
步骤6:算法:1:选择一个初始系统参数向量θ0,容许控制策略u0(xa)和一个标量∈>0,让i=0和V0=0;
2:使用控制策略ua,i(xa),求解以下SOS问题以获得Vi(xa)
3:控制策略更新为
5:控制策略更新为
有益效果
本发明提出的一种基于策略迭代的PID优化控制方法,有益效果如下:
(1)针对一类仿射多项式非线性系统,提出了一种包含PID控制策略和近似最优补充控制策略的组合控制方案,基于平方和规划技术的改进策略迭代算法,对PID参数进行整定,使系统达到更好的性能;
(2)待优化的PID参数的优化方向未知,现有的策略迭代方法很难直接用于求解本发明中考虑的主要问题,本发明给出一种新的扩展型平方和条件,便于解决变量耦合问题。
附图说明
图1本发明实施流程图
具体实施方式
现结合实施例、附图对本发明作进一步描述:
基于策略迭代的PID参数优化控制方法,通过以下步骤实现:
(a)考虑到主动悬架系统动力学模型:
其中Me和Mf是车身和车轮的质量,xs和xw是车身和车轮的位移,Kd和Kf是弹性系数,Cd是悬架阻尼系数,r是道路干扰,u是液压执行器的控制力,fb(xs,xw)和fus(xs,xw)是高阶非线性函数。
其中
x1和x3分别是车身和车轮的位置。x2和x4是车身和车轮的速度。a1和a2为比例系数。这里考虑与车身和车轮位移相关的高阶非线性函数的影响。
(c)为了使系统运行更平稳,给乘客提供更舒适的体验,提出如下组合控制方法。针对一类连续时间非线性系统,其描述如下:
其中是可测系统状态,是控制输入。是多项式向量,且有f(0)=0,是多项式矩阵。此非线性系统模型可以用来描述上述主动悬架系统。考虑系统总体控制策略为u(t)=uPID(t)+ua(t),其中uPID(t)为PID控制量,其初始策略可保持系统原有PID控制机制,ua(t)为附加的近似最优控制,在通过算法学习ua(t)的同时,优化原有的PID参数。
PID控制器通常设计为
控制器的时域解为uPID(x)=KPx+μI+μD (6)
其中
为了提高设计自由度,可以添加一些控制参数KI1、KD1,设计以下实际运用的PID控制器。
uPID(x)=KPx+KI1μI+KD1μD (7)
(d)定义xa=[μI,μD,x]T,得到一个增广系统
其中
(e)针对以上增广系统,选择下面的性能指标函数:
其中Q(xa)是正定多项式函数,R(xa)是对称正定多项式矩阵。与ua(t)相关的成本函数为
然后,定义哈密顿函数为
最优成本函数V*(xa,θ)为
满足以下等式
(f)算法:1:选择一个初始系统参数向量θ0,容许控制策略u0(xa)和一个标量∈>0,让i=0和V0=0。
2:使用控制策略ua,i(xa),求解以下SOS问题以获得Vi(xa)
3:控制策略更新为
5:控制策略更新为
实施例1:
(a)考虑主动悬架模型如(3)所示,其中,a1=1,a2=1,Me=300Kg,Mf=60Kg,Kd=16000N/m,Kf=190000N/m,Km=0.1Kd,Cd=1000N/(m/sec)。
(b)为了使系统运行更为平稳,给乘客提供更舒适的体验,提出的组合控制方法。为了更清晰的描述算法设计过程,这里考虑一类连续时间非线性系统,其状态空间表达式如下:
其中是可测系统状态,是控制输入。是多项式向量,且有f(0)=0,是多项式矩阵。此非线性系统模型可以用来描述上述主动悬架系统。考虑系统总体控制策略为u(t)=uPID(t)+ua(t),其中uPID(t)为PID控制量,其初始策略可保持系统原有PID控制机制,ua(t)为附加的近似最优控制,在通过算法学习ua(t)的同时,优化原有的PID参数。
PID控制器通常设计为
控制器的时域解为uPID(x)=KPx+μI+μD (6)
其中
为了提高设计自由度,可以添加一些控制参数,设计以下实际运用的PID控制器。
uPID(x)=KPx+KI1μI+KD1μD (7)
(c)定义xa=[μI,μD,x]T,得到一个增广系统
其中
(d)针对以上增广系统,选择下面的性能指标函数:
其中Q(xa)是正定多项式函数,R(xa)是对称正定多项式矩阵。与ua(t)相关的成本函数为
然后,定义哈密顿函数为
最优成本函数V*(xa,θ)为
满足以下等式
(e)算法:
1:选择一个初始系统参数向量θ0,容许控制策略u0(xa)和一个标量∈>0,让i=0和V0=0。
2:使用控制策略ua,i(xa),求解以下SOS问题以获得Vi(xa)
3:控制策略更新为
5:控制策略更新为
Claims (1)
1.一种基于策略迭代的PID优化控制方法,其特征在于步骤如下:
步骤1:考虑到主动悬架系统动力学模型:
其中,Me和Mf是车身和车轮的质量,xs和xw是车身和车轮的位移,Kd和Kf是弹性系数,Cd是悬架阻尼系数,r是道路干扰,u是液压执行器的控制力,fb(xs,xw)和fus(xs,xw)是高阶非线性函数;
其中
x1和x3分别是车身和车轮的位置,x2和x4是车身和车轮的速度,a1和a2为比例系数,这里考虑与车身和车轮位移相关的高阶非线性函数的影响;
步骤3:为了使系统运行更平稳,给乘客提供更舒适的体验,提出如下组合控制方法;针对一类连续时间非线性系统,其描述如下:
其中,是可测系统状态,是控制输入,是多项式向量,且有f(0)=0,是多项式矩阵;此非线性系统模型可以用来描述上述主动悬架系统;考虑系统总体控制策略为u(t)=uPID(t)+ua(t),其中uPID(t)为PID控制量,其初始策略可保持系统原有PID控制机制,ua(t)为附加的近似最优控制,在通过算法学习ua(t)的同时,优化原有的PID参数;
PID控制器通常设计为
控制器的时域解为
uPID(x)=KPx+μI+μD (6)
其中
为了提高设计自由度,可以添加一些控制参数,设计以下实际运用的PID控制器;
uPID(x)=KPx+KI1μI+KD1μD (7)
步骤4:定义xa=[μI,μD,x]T,得到一个增广系统
其中
步骤5:针对以上增广系统,选择下面的性能指标函数:
其中,Q(xa)是正定多项式函数,R(xa)是对称正定多项式矩阵,与ua(t)相关的成本函数为:
然后,定义哈密顿函数为
最优成本函数V*(xa,θ)为
满足以下等式
步骤6:算法:1:选择一个初始系统参数向量θ0,容许控制策略u0(xa)和一个标量∈>0,让i=0和V0=0;
2:使用控制策略ua,i(xa),求解以下SOS问题以获得Vi(xa)
3:控制策略更新为
5:控制策略更新为
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010094391.3A CN111273543B (zh) | 2020-02-15 | 2020-02-15 | 一种基于策略迭代的pid优化控制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010094391.3A CN111273543B (zh) | 2020-02-15 | 2020-02-15 | 一种基于策略迭代的pid优化控制方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111273543A CN111273543A (zh) | 2020-06-12 |
CN111273543B true CN111273543B (zh) | 2022-10-04 |
Family
ID=70997142
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010094391.3A Active CN111273543B (zh) | 2020-02-15 | 2020-02-15 | 一种基于策略迭代的pid优化控制方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111273543B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114036628B (zh) * | 2021-02-14 | 2023-07-14 | 西北工业大学 | 变体飞行器翼展与控制策略协同设计方法 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107300925A (zh) * | 2017-07-12 | 2017-10-27 | 西北工业大学 | 基于改进鱼群算法的四旋翼无人机姿控参数整定方法 |
CN108121208A (zh) * | 2017-12-25 | 2018-06-05 | 国网江西省电力有限公司电力科学研究 | 基于pso-abfo再热汽温pid控制器参数优化方法 |
CN108345218A (zh) * | 2018-02-27 | 2018-07-31 | 江苏大学 | 基于教学优化算法的汽车主动悬架pid控制器设计方法 |
CN109375514A (zh) * | 2018-11-30 | 2019-02-22 | 沈阳航空航天大学 | 一种存在假数据注入攻击时的最优跟踪控制器设计方法 |
CN109515097A (zh) * | 2018-10-18 | 2019-03-26 | 江苏科技大学 | 一种半主动车辆悬架控制系统 |
CN109932905A (zh) * | 2019-03-08 | 2019-06-25 | 辽宁石油化工大学 | 一种基于非策略的观测器状态反馈的优化控制方法 |
CN110018687A (zh) * | 2019-04-09 | 2019-07-16 | 大连海事大学 | 基于强化学习方法的无人水面船最优轨迹跟踪控制方法 |
CN110435377A (zh) * | 2019-04-28 | 2019-11-12 | 西安理工大学 | 基于比例积分观测器的非线性主动悬架容错追踪控制方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108181816A (zh) * | 2018-01-05 | 2018-06-19 | 南京航空航天大学 | 一种基于在线数据的同步策略更新最优控制方法 |
-
2020
- 2020-02-15 CN CN202010094391.3A patent/CN111273543B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107300925A (zh) * | 2017-07-12 | 2017-10-27 | 西北工业大学 | 基于改进鱼群算法的四旋翼无人机姿控参数整定方法 |
CN108121208A (zh) * | 2017-12-25 | 2018-06-05 | 国网江西省电力有限公司电力科学研究 | 基于pso-abfo再热汽温pid控制器参数优化方法 |
CN108345218A (zh) * | 2018-02-27 | 2018-07-31 | 江苏大学 | 基于教学优化算法的汽车主动悬架pid控制器设计方法 |
CN109515097A (zh) * | 2018-10-18 | 2019-03-26 | 江苏科技大学 | 一种半主动车辆悬架控制系统 |
CN109375514A (zh) * | 2018-11-30 | 2019-02-22 | 沈阳航空航天大学 | 一种存在假数据注入攻击时的最优跟踪控制器设计方法 |
CN109932905A (zh) * | 2019-03-08 | 2019-06-25 | 辽宁石油化工大学 | 一种基于非策略的观测器状态反馈的优化控制方法 |
CN110018687A (zh) * | 2019-04-09 | 2019-07-16 | 大连海事大学 | 基于强化学习方法的无人水面船最优轨迹跟踪控制方法 |
CN110435377A (zh) * | 2019-04-28 | 2019-11-12 | 西安理工大学 | 基于比例积分观测器的非线性主动悬架容错追踪控制方法 |
Non-Patent Citations (2)
Title |
---|
Self-Learning Cruise Control Using Kernel-Based Least Squares Policy Iteration;Jian Wang et al.;《IEEE TRANSACTIONS ON CONTROL SYSTEMS TECHNOLOGY》;20140530;第22卷(第3期);第1078-1087页 * |
基于强化学习的微小型弹药两回路驾驶仪设计;范军芳等;《战术导弹技术》;20191231;第48-54页 * |
Also Published As
Publication number | Publication date |
---|---|
CN111273543A (zh) | 2020-06-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Huang et al. | Approximation-free control for vehicle active suspensions with hydraulic actuator | |
CN109976368B (zh) | 一种基于直接分配法和零空间的飞行器控制分配方法 | |
CN107966902B (zh) | 一种不确定性间歇过程的约束2d跟踪控制方法 | |
Huang et al. | Unknown system dynamics estimator for active vehicle suspension control systems with time-varying delay | |
CN105549395B (zh) | 保证瞬态性能的机械臂伺服系统死区补偿控制方法 | |
CN109976150A (zh) | 一类欠驱动多输入多输出系统集中式自抗扰控制方法 | |
CN111273543B (zh) | 一种基于策略迭代的pid优化控制方法 | |
CN109839823A (zh) | 压电变形镜的异步迟滞补偿-线性二次型h∞控制方法及系统 | |
Wu et al. | Learning dynamics of gradient descent optimization in deep neural networks | |
Liu et al. | Intelligent motion tracking control of vehicle suspension systems with constraints via neural performance analysis | |
CN115421499A (zh) | 具有转向补偿功能的智能车辆路径跟踪方法 | |
Kang et al. | Fixed-time adaptive fuzzy command filtering control for a class of uncertain nonlinear systems with input saturation and dead zone | |
CN110901326B (zh) | 一种具有状态约束与死区输入的主动悬架系统的控制方法 | |
Labbadi et al. | Fractional‐order integral terminal sliding‐mode control for perturbed nonlinear systems with application to quadrotors | |
CN110362110A (zh) | 一种固定时自适应神经网络无人机航迹角控制方法 | |
CN116430724A (zh) | 一种改善机器人运动平衡性的自适应控制策略 | |
CN114153144B (zh) | 一种输入受限和输入扰动的弹性高超声速飞行器控制方法 | |
CN110119085B (zh) | 一种Manutec R3型工业机器人动态优化系统 | |
CN118131602A (zh) | 考虑扰动抑制的先导式电液比例伺服阀输出反馈控制方法 | |
CN114185276B (zh) | 一种基于多维泰勒网的非线性严格系统输出反馈控制方法 | |
Nguyen et al. | Design a new algorithm (iL-GA) to optimize controller parameters for an automotive suspension system | |
CN111221250B (zh) | 一种具有参数不确定性和多个外部扰动的非线性系统及其设计方法 | |
CN112764347B (zh) | 一种基于最大相关熵准则的智能车辆路径跟踪方法 | |
Chen et al. | Reinforcement learning‐based adaptive predefined‐time optimal tracking control for strict‐feedback nonlinear systems | |
CN114571451A (zh) | 一种可调漏斗边界的自适应滑模控制方法及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |