CN111273543B - 一种基于策略迭代的pid优化控制方法 - Google Patents
一种基于策略迭代的pid优化控制方法 Download PDFInfo
- Publication number
- CN111273543B CN111273543B CN202010094391.3A CN202010094391A CN111273543B CN 111273543 B CN111273543 B CN 111273543B CN 202010094391 A CN202010094391 A CN 202010094391A CN 111273543 B CN111273543 B CN 111273543B
- Authority
- CN
- China
- Prior art keywords
- pid
- control
- strategy
- following
- control strategy
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 26
- 238000005457 optimization Methods 0.000 title claims abstract description 10
- 238000011217 control strategy Methods 0.000 claims abstract description 24
- 239000000725 suspension Substances 0.000 claims abstract description 15
- 230000006870 function Effects 0.000 claims description 20
- 230000003416 augmentation Effects 0.000 claims description 8
- 239000011159 matrix material Substances 0.000 claims description 8
- 238000006073 displacement reaction Methods 0.000 claims description 6
- 230000000694 effects Effects 0.000 claims description 4
- 238000012886 linear function Methods 0.000 claims description 4
- 230000007246 mechanism Effects 0.000 claims description 4
- 238000013016 damping Methods 0.000 claims description 3
- 230000004083 survival effect Effects 0.000 claims 1
- 238000005516 engineering process Methods 0.000 abstract description 2
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000012938 design process Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000010355 oscillation Effects 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B11/00—Automatic controllers
- G05B11/01—Automatic controllers electric
- G05B11/36—Automatic controllers electric with provision for obtaining particular characteristics, e.g. proportional, integral, differential
- G05B11/42—Automatic controllers electric with provision for obtaining particular characteristics, e.g. proportional, integral, differential for obtaining a characteristic which is both proportional and time-dependent, e.g. P. I., P. I. D.
Landscapes
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Automation & Control Theory (AREA)
- Vehicle Body Suspensions (AREA)
Abstract
本发明涉及一种基于策略迭代的PID优化控制方法,首先建立主动悬架系统动力学模型,然后将上述微分方程描述成状态空间模型,设计包含PID控制策略和近似最优补充控制策略的组合控制方案,基于平方和规划技术的改进策略迭代算法,对PID参数进行整定,使系统达到更好的性能。
Description
技术领域
本发明涉及一种主动悬架系统的控制方法,主要是基于强化学习思想优化非线性系统原有的PID控制参数,属于智能控制领域。
背景技术
由于实现的简单性,鲁棒性和可靠性,PID控制在工业过程中被广泛使用。通常,设计PID控制器是一个多目标问题,一般会导致非凸问题。在过去的几十年中,研究人员已经提出了许多调节PID控制参数技术方法。作为传统的调节方法,试错法是调节PID控制参数的简便方法,但不能有效保证所需的控制性能。尽管Ziegler-Nichols方法很流行,并且在非线性系统中表现良好,但是对于高阶系统,此方法可能会导致较大的超调,较长的调节时间和振荡响应。此外,还存在许多其他调整PID参数方法,例如简化Ziegler-Nichols方法,极点配置方法以及增益和相位裕度方法。然而,大多数方法不适用于多输入多输出非线性系统。
《基于SOS和策略迭代的多项式非线性系统H∞最优控制》(朱圆恒,赵冬彬,杨雄,张启超,《IEEE TRANSACTIONS ON CYBERNETICS》,2018年第2期第48卷)一文中提出了一种基于SOS的策略迭代方法来处理多项式非线性系统的近似H∞控制。尽管SOS多项式的成功吸引了ADP界的研究者的兴趣,但很少考虑基于SOS的PID参数调整和逼近最佳补偿控制的问题。
发明内容
要解决的技术问题
面向主动悬架系统优化控制,本发明设计了一种基于策略迭代的PID参数优化控制方法,该方法能够确保主动悬架系统的稳定性,并且提升控制性能,从而为乘客提供更舒适的体验。
技术方案
一种基于策略迭代的PID优化控制方法,其特征在于步骤如下:
步骤1:考虑到主动悬架系统动力学模型:
其中,Me和Mf是车身和车轮的质量,xs和xw是车身和车轮的位移,Kd和Kf是弹性系数,Cd是悬架阻尼系数,r是道路干扰,u是液压执行器的控制力,fb(xs,xw)和fus(xs,xw)是高阶非线性函数;
其中
x1和x3分别是车身和车轮的位置,x2和x4是车身和车轮的速度,a1和a2为比例系数,这里考虑与车身和车轮位移相关的高阶非线性函数的影响;
步骤3:为了使系统运行更平稳,给乘客提供更舒适的体验,提出如下组合控制方法;针对一类连续时间非线性系统,其描述如下:
其中,是可测系统状态,是控制输入,是多项式向量,且有f(0)=0,是多项式矩阵;此非线性系统模型可以用来描述上述主动悬架系统;考虑系统总体控制策略为u(t)=uPID(t)+ua(t),其中uPID(t)为PID控制量,其初始策略可保持系统原有PID控制机制,ua(t)为附加的近似最优控制,在通过算法学习ua(t)的同时,优化原有的PID参数;
PID控制器通常设计为
控制器的时域解为uPID(x)=KPx+μI+μD (6)
其中
为了提高设计自由度,可以添加一些控制参数,设计以下实际运用的PID控制器。
uPID(x)=KPx+KI1μI+KD1μD (7)
步骤4:定义xa=[μI,μD,x]T,得到一个增广系统
其中
步骤5:针对以上增广系统,选择下面的性能指标函数:
其中,Q(xa)是正定多项式函数,R(xa)是对称正定多项式矩阵,与ua(t)相关的成本函数为:
然后,定义哈密顿函数为
最优成本函数V*(xa,θ)为
满足以下等式
步骤6:算法:1:选择一个初始系统参数向量θ0,容许控制策略u0(xa)和一个标量∈>0,让i=0和V0=0;
2:使用控制策略ua,i(xa),求解以下SOS问题以获得Vi(xa)
3:控制策略更新为
5:控制策略更新为
有益效果
本发明提出的一种基于策略迭代的PID优化控制方法,有益效果如下:
(1)针对一类仿射多项式非线性系统,提出了一种包含PID控制策略和近似最优补充控制策略的组合控制方案,基于平方和规划技术的改进策略迭代算法,对PID参数进行整定,使系统达到更好的性能;
(2)待优化的PID参数的优化方向未知,现有的策略迭代方法很难直接用于求解本发明中考虑的主要问题,本发明给出一种新的扩展型平方和条件,便于解决变量耦合问题。
附图说明
图1本发明实施流程图
具体实施方式
现结合实施例、附图对本发明作进一步描述:
基于策略迭代的PID参数优化控制方法,通过以下步骤实现:
(a)考虑到主动悬架系统动力学模型:
其中Me和Mf是车身和车轮的质量,xs和xw是车身和车轮的位移,Kd和Kf是弹性系数,Cd是悬架阻尼系数,r是道路干扰,u是液压执行器的控制力,fb(xs,xw)和fus(xs,xw)是高阶非线性函数。
其中
x1和x3分别是车身和车轮的位置。x2和x4是车身和车轮的速度。a1和a2为比例系数。这里考虑与车身和车轮位移相关的高阶非线性函数的影响。
(c)为了使系统运行更平稳,给乘客提供更舒适的体验,提出如下组合控制方法。针对一类连续时间非线性系统,其描述如下:
其中是可测系统状态,是控制输入。是多项式向量,且有f(0)=0,是多项式矩阵。此非线性系统模型可以用来描述上述主动悬架系统。考虑系统总体控制策略为u(t)=uPID(t)+ua(t),其中uPID(t)为PID控制量,其初始策略可保持系统原有PID控制机制,ua(t)为附加的近似最优控制,在通过算法学习ua(t)的同时,优化原有的PID参数。
PID控制器通常设计为
控制器的时域解为uPID(x)=KPx+μI+μD (6)
其中
为了提高设计自由度,可以添加一些控制参数KI1、KD1,设计以下实际运用的PID控制器。
uPID(x)=KPx+KI1μI+KD1μD (7)
(d)定义xa=[μI,μD,x]T,得到一个增广系统
其中
(e)针对以上增广系统,选择下面的性能指标函数:
其中Q(xa)是正定多项式函数,R(xa)是对称正定多项式矩阵。与ua(t)相关的成本函数为
然后,定义哈密顿函数为
最优成本函数V*(xa,θ)为
满足以下等式
(f)算法:1:选择一个初始系统参数向量θ0,容许控制策略u0(xa)和一个标量∈>0,让i=0和V0=0。
2:使用控制策略ua,i(xa),求解以下SOS问题以获得Vi(xa)
3:控制策略更新为
5:控制策略更新为
实施例1:
(a)考虑主动悬架模型如(3)所示,其中,a1=1,a2=1,Me=300Kg,Mf=60Kg,Kd=16000N/m,Kf=190000N/m,Km=0.1Kd,Cd=1000N/(m/sec)。
(b)为了使系统运行更为平稳,给乘客提供更舒适的体验,提出的组合控制方法。为了更清晰的描述算法设计过程,这里考虑一类连续时间非线性系统,其状态空间表达式如下:
其中是可测系统状态,是控制输入。是多项式向量,且有f(0)=0,是多项式矩阵。此非线性系统模型可以用来描述上述主动悬架系统。考虑系统总体控制策略为u(t)=uPID(t)+ua(t),其中uPID(t)为PID控制量,其初始策略可保持系统原有PID控制机制,ua(t)为附加的近似最优控制,在通过算法学习ua(t)的同时,优化原有的PID参数。
PID控制器通常设计为
控制器的时域解为uPID(x)=KPx+μI+μD (6)
其中
为了提高设计自由度,可以添加一些控制参数,设计以下实际运用的PID控制器。
uPID(x)=KPx+KI1μI+KD1μD (7)
(c)定义xa=[μI,μD,x]T,得到一个增广系统
其中
(d)针对以上增广系统,选择下面的性能指标函数:
其中Q(xa)是正定多项式函数,R(xa)是对称正定多项式矩阵。与ua(t)相关的成本函数为
然后,定义哈密顿函数为
最优成本函数V*(xa,θ)为
满足以下等式
(e)算法:
1:选择一个初始系统参数向量θ0,容许控制策略u0(xa)和一个标量∈>0,让i=0和V0=0。
2:使用控制策略ua,i(xa),求解以下SOS问题以获得Vi(xa)
3:控制策略更新为
5:控制策略更新为
Claims (1)
1.一种基于策略迭代的PID优化控制方法,其特征在于步骤如下:
步骤1:考虑到主动悬架系统动力学模型:
其中,Me和Mf是车身和车轮的质量,xs和xw是车身和车轮的位移,Kd和Kf是弹性系数,Cd是悬架阻尼系数,r是道路干扰,u是液压执行器的控制力,fb(xs,xw)和fus(xs,xw)是高阶非线性函数;
其中
x1和x3分别是车身和车轮的位置,x2和x4是车身和车轮的速度,a1和a2为比例系数,这里考虑与车身和车轮位移相关的高阶非线性函数的影响;
步骤3:为了使系统运行更平稳,给乘客提供更舒适的体验,提出如下组合控制方法;针对一类连续时间非线性系统,其描述如下:
其中,是可测系统状态,是控制输入,是多项式向量,且有f(0)=0,是多项式矩阵;此非线性系统模型可以用来描述上述主动悬架系统;考虑系统总体控制策略为u(t)=uPID(t)+ua(t),其中uPID(t)为PID控制量,其初始策略可保持系统原有PID控制机制,ua(t)为附加的近似最优控制,在通过算法学习ua(t)的同时,优化原有的PID参数;
PID控制器通常设计为
控制器的时域解为
uPID(x)=KPx+μI+μD (6)
其中
为了提高设计自由度,可以添加一些控制参数,设计以下实际运用的PID控制器;
uPID(x)=KPx+KI1μI+KD1μD (7)
步骤4:定义xa=[μI,μD,x]T,得到一个增广系统
其中
步骤5:针对以上增广系统,选择下面的性能指标函数:
其中,Q(xa)是正定多项式函数,R(xa)是对称正定多项式矩阵,与ua(t)相关的成本函数为:
然后,定义哈密顿函数为
最优成本函数V*(xa,θ)为
满足以下等式
步骤6:算法:1:选择一个初始系统参数向量θ0,容许控制策略u0(xa)和一个标量∈>0,让i=0和V0=0;
2:使用控制策略ua,i(xa),求解以下SOS问题以获得Vi(xa)
3:控制策略更新为
5:控制策略更新为
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010094391.3A CN111273543B (zh) | 2020-02-15 | 2020-02-15 | 一种基于策略迭代的pid优化控制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010094391.3A CN111273543B (zh) | 2020-02-15 | 2020-02-15 | 一种基于策略迭代的pid优化控制方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111273543A CN111273543A (zh) | 2020-06-12 |
CN111273543B true CN111273543B (zh) | 2022-10-04 |
Family
ID=70997142
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010094391.3A Active CN111273543B (zh) | 2020-02-15 | 2020-02-15 | 一种基于策略迭代的pid优化控制方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111273543B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114036628B (zh) * | 2021-02-14 | 2023-07-14 | 西北工业大学 | 变体飞行器翼展与控制策略协同设计方法 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107300925A (zh) * | 2017-07-12 | 2017-10-27 | 西北工业大学 | 基于改进鱼群算法的四旋翼无人机姿控参数整定方法 |
CN108121208A (zh) * | 2017-12-25 | 2018-06-05 | 国网江西省电力有限公司电力科学研究 | 基于pso-abfo再热汽温pid控制器参数优化方法 |
CN108345218A (zh) * | 2018-02-27 | 2018-07-31 | 江苏大学 | 基于教学优化算法的汽车主动悬架pid控制器设计方法 |
CN109375514A (zh) * | 2018-11-30 | 2019-02-22 | 沈阳航空航天大学 | 一种存在假数据注入攻击时的最优跟踪控制器设计方法 |
CN109515097A (zh) * | 2018-10-18 | 2019-03-26 | 江苏科技大学 | 一种半主动车辆悬架控制系统 |
CN109932905A (zh) * | 2019-03-08 | 2019-06-25 | 辽宁石油化工大学 | 一种基于非策略的观测器状态反馈的优化控制方法 |
CN110018687A (zh) * | 2019-04-09 | 2019-07-16 | 大连海事大学 | 基于强化学习方法的无人水面船最优轨迹跟踪控制方法 |
CN110435377A (zh) * | 2019-04-28 | 2019-11-12 | 西安理工大学 | 基于比例积分观测器的非线性主动悬架容错追踪控制方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108181816A (zh) * | 2018-01-05 | 2018-06-19 | 南京航空航天大学 | 一种基于在线数据的同步策略更新最优控制方法 |
-
2020
- 2020-02-15 CN CN202010094391.3A patent/CN111273543B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107300925A (zh) * | 2017-07-12 | 2017-10-27 | 西北工业大学 | 基于改进鱼群算法的四旋翼无人机姿控参数整定方法 |
CN108121208A (zh) * | 2017-12-25 | 2018-06-05 | 国网江西省电力有限公司电力科学研究 | 基于pso-abfo再热汽温pid控制器参数优化方法 |
CN108345218A (zh) * | 2018-02-27 | 2018-07-31 | 江苏大学 | 基于教学优化算法的汽车主动悬架pid控制器设计方法 |
CN109515097A (zh) * | 2018-10-18 | 2019-03-26 | 江苏科技大学 | 一种半主动车辆悬架控制系统 |
CN109375514A (zh) * | 2018-11-30 | 2019-02-22 | 沈阳航空航天大学 | 一种存在假数据注入攻击时的最优跟踪控制器设计方法 |
CN109932905A (zh) * | 2019-03-08 | 2019-06-25 | 辽宁石油化工大学 | 一种基于非策略的观测器状态反馈的优化控制方法 |
CN110018687A (zh) * | 2019-04-09 | 2019-07-16 | 大连海事大学 | 基于强化学习方法的无人水面船最优轨迹跟踪控制方法 |
CN110435377A (zh) * | 2019-04-28 | 2019-11-12 | 西安理工大学 | 基于比例积分观测器的非线性主动悬架容错追踪控制方法 |
Non-Patent Citations (2)
Title |
---|
Self-Learning Cruise Control Using Kernel-Based Least Squares Policy Iteration;Jian Wang et al.;《IEEE TRANSACTIONS ON CONTROL SYSTEMS TECHNOLOGY》;20140530;第22卷(第3期);第1078-1087页 * |
基于强化学习的微小型弹药两回路驾驶仪设计;范军芳等;《战术导弹技术》;20191231;第48-54页 * |
Also Published As
Publication number | Publication date |
---|---|
CN111273543A (zh) | 2020-06-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wen et al. | Fuzzy control for uncertain vehicle active suspension systems via dynamic sliding-mode approach | |
Yu et al. | Neuroadaptive finite-time control for nonlinear MIMO systems with input constraint | |
Huo et al. | Adaptive-critic design for decentralized event-triggered control of constrained nonlinear interconnected systems within an identifier-critic framework | |
Wang et al. | Model-free fractional-order sliding mode control for an active vehicle suspension system | |
Boulkroune et al. | Design of a fuzzy adaptive controller for MIMO nonlinear time-delay systems with unknown actuator nonlinearities and unknown control direction | |
US6496761B1 (en) | Optimization control method for shock absorber | |
CN105539052B (zh) | 一种以车辆平稳状态为参考的可控悬架滑模追踪控制器 | |
Chen et al. | Anti-saturation-based adaptive sliding-mode control for active suspension systems with time-varying vertical displacement and speed constraints | |
Li et al. | Static-output-feedback based robust fuzzy wheelbase preview control for uncertain active suspensions with time delay and finite frequency constraint | |
Zhao et al. | Neural network-based fixed-time sliding mode control for a class of nonlinear Euler-Lagrange systems | |
CN111273543B (zh) | 一种基于策略迭代的pid优化控制方法 | |
Liu et al. | Intelligent motion tracking control of vehicle suspension systems with constraints via neural performance analysis | |
CN110826143A (zh) | 一种基于切换控制的汽车主动悬架系统的容错控制方法 | |
Zhu et al. | An adaptive path tracking method for autonomous land vehicle based on neural dynamic programming | |
CN109976150A (zh) | 一类欠驱动多输入多输出系统集中式自抗扰控制方法 | |
Liao et al. | Sparse and decoupling control strategies based on Takagi–Sugeno fuzzy models | |
Guo et al. | Novel auxiliary saturation compensation design for neuroadaptive NTSM tracking control of high speed trains with actuator saturation | |
Li et al. | Performance-constrained fault-tolerant DSC based on reinforcement learning for nonlinear systems with uncertain parameters | |
Li et al. | Adaptive optimal trajectory tracking control of AUVs based on reinforcement learning | |
Zhao et al. | Observer-based discrete-time cascaded control for lateral stabilization of steer-by-wire vehicles with uncertainties and disturbances | |
Hua et al. | Event-triggered adaptive neural command-filter-based dynamic surface control for state constrained nonlinear systems | |
Cai et al. | Robust adaptive dynamic surface control of high-order strict feedback systems based on fully actuated system approach | |
CN112925203A (zh) | 一种基于加强学习的最优跟踪控制算法 | |
Kaleemullah et al. | Comparative analysis of LQR and robust controller for active suspension | |
CN114839882B (zh) | 一种输入约束下的非线性系统复合自适应控制方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |