CN111273543B

CN111273543B - 一种基于策略迭代的pid优化控制方法

Info

Publication number: CN111273543B
Application number: CN202010094391.3A
Authority: CN
Inventors: 范泉涌; 王冬生; 许斌
Original assignee: Northwestern Polytechnical University
Current assignee: Northwestern Polytechnical University
Priority date: 2020-02-15
Filing date: 2020-02-15
Publication date: 2022-10-04
Anticipated expiration: 2040-02-15
Also published as: CN111273543A

Abstract

本发明涉及一种基于策略迭代的PID优化控制方法，首先建立主动悬架系统动力学模型，然后将上述微分方程描述成状态空间模型，设计包含PID控制策略和近似最优补充控制策略的组合控制方案，基于平方和规划技术的改进策略迭代算法，对PID参数进行整定，使系统达到更好的性能。

Description

一种基于策略迭代的PID优化控制方法

技术领域

本发明涉及一种主动悬架系统的控制方法，主要是基于强化学习思想优化非线性系统原有的PID控制参数，属于智能控制领域。

背景技术

由于实现的简单性，鲁棒性和可靠性，PID控制在工业过程中被广泛使用。通常，设计PID控制器是一个多目标问题，一般会导致非凸问题。在过去的几十年中，研究人员已经提出了许多调节PID控制参数技术方法。作为传统的调节方法，试错法是调节PID控制参数的简便方法，但不能有效保证所需的控制性能。尽管Ziegler-Nichols方法很流行，并且在非线性系统中表现良好，但是对于高阶系统，此方法可能会导致较大的超调，较长的调节时间和振荡响应。此外，还存在许多其他调整PID参数方法，例如简化Ziegler-Nichols方法，极点配置方法以及增益和相位裕度方法。然而，大多数方法不适用于多输入多输出非线性系统。

《基于SOS和策略迭代的多项式非线性系统H∞最优控制》(朱圆恒，赵冬彬，杨雄，张启超，《IEEE TRANSACTIONS ON CYBERNETICS》，2018年第2期第48卷)一文中提出了一种基于SOS的策略迭代方法来处理多项式非线性系统的近似H∞控制。尽管SOS多项式的成功吸引了ADP界的研究者的兴趣，但很少考虑基于SOS的PID参数调整和逼近最佳补偿控制的问题。

发明内容

要解决的技术问题

面向主动悬架系统优化控制，本发明设计了一种基于策略迭代的PID参数优化控制方法，该方法能够确保主动悬架系统的稳定性，并且提升控制性能，从而为乘客提供更舒适的体验。

技术方案

一种基于策略迭代的PID优化控制方法，其特征在于步骤如下：

步骤1：考虑到主动悬架系统动力学模型：

其中，M_e和M_f是车身和车轮的质量，x_s和x_w是车身和车轮的位移，K_d和K_f是弹性系数，C_d是悬架阻尼系数，r是道路干扰，u是液压执行器的控制力，f_b(x_s,x_w)和f_us(x_s,x_w)是高阶非线性函数；

步骤2：考虑实际非线性函数影响，定义状态变量x₁＝x_s，

x₃＝x_w，

在不考虑道路扰动的情况下，将步骤1的微分方程描述成状态空间模型：

其中

x＝[x₁,x₂,x₃,x₄]^T,

x₁和x₃分别是车身和车轮的位置，x₂和x₄是车身和车轮的速度，a₁和a₂为比例系数，这里考虑与车身和车轮位移相关的高阶非线性函数的影响；

步骤3：为了使系统运行更平稳，给乘客提供更舒适的体验，提出如下组合控制方法；针对一类连续时间非线性系统，其描述如下：

其中，

是可测系统状态，

是控制输入，

是多项式向量，且有f(0)＝0，

是多项式矩阵；此非线性系统模型可以用来描述上述主动悬架系统；考虑系统总体控制策略为u(t)＝u_PID(t)+u_a(t)，其中u_PID(t)为PID控制量，其初始策略可保持系统原有PID控制机制，u_a(t)为附加的近似最优控制，在通过算法学习u_a(t)的同时，优化原有的PID参数；

PID控制器通常设计为

控制器的时域解为u_PID(x)＝K_Px+μ_I+μ_D (6)

其中

为了提高设计自由度，可以添加一些控制参数，设计以下实际运用的PID控制器。

u_PID(x)＝K_Px+K_I1μ_I+K_D1μ_D (7)

步骤4：定义x_a＝[μ_I,μ_D,x]^T，得到一个增广系统

其中

步骤5：针对以上增广系统，选择下面的性能指标函数：

其中，Q(x_a)是正定多项式函数，R(x_a)是对称正定多项式矩阵，与u_a(t)相关的成本函数为：

然后，定义哈密顿函数为

最优成本函数V^*(x_a,θ)为

满足以下等式

可得最优控制

为

其中，

使得

存在并且是唯一的；

将

代入(10)，得到HJB方程为

步骤6：算法：1：选择一个初始系统参数向量θ⁰，容许控制策略u₀(x_a)和一个标量∈＞0，让i＝0和V₀＝0；

2：使用控制策略u_a,i(x_a)，求解以下SOS问题以获得V_i(x_a)

3：控制策略更新为

4：根据获得的V_i(x_a)，求解以下SOS问题以获取θⁱ⁺¹和

5：控制策略更新为

6：设置i＝i+1并执行第2步，直到

有益效果

本发明提出的一种基于策略迭代的PID优化控制方法，有益效果如下：

(1)针对一类仿射多项式非线性系统，提出了一种包含PID控制策略和近似最优补充控制策略的组合控制方案，基于平方和规划技术的改进策略迭代算法，对PID参数进行整定，使系统达到更好的性能；

(2)待优化的PID参数的优化方向未知，现有的策略迭代方法很难直接用于求解本发明中考虑的主要问题，本发明给出一种新的扩展型平方和条件，便于解决变量耦合问题。

附图说明

图1本发明实施流程图

具体实施方式

现结合实施例、附图对本发明作进一步描述：

基于策略迭代的PID参数优化控制方法，通过以下步骤实现：

(a)考虑到主动悬架系统动力学模型：

其中M_e和M_f是车身和车轮的质量，x_s和x_w是车身和车轮的位移，K_d和K_f是弹性系数，C_d是悬架阻尼系数，r是道路干扰，u是液压执行器的控制力，f_b(x_s,x_w)和f_us(x_s,x_w)是高阶非线性函数。

(b)考虑实际非线性函数影响，定义状态变量x₁＝x_s，

x₃＝x_w，

在不考虑道路扰动的情况下，将上述微分方程描述成状态空间模型：

其中

x＝[x₁,x₂,x₃,x₄]^T,

x₁和x₃分别是车身和车轮的位置。x₂和x₄是车身和车轮的速度。a₁和a₂为比例系数。这里考虑与车身和车轮位移相关的高阶非线性函数的影响。

(c)为了使系统运行更平稳，给乘客提供更舒适的体验，提出如下组合控制方法。针对一类连续时间非线性系统，其描述如下：

其中

是可测系统状态，

是控制输入。

是多项式向量，且有f(0)＝0，

是多项式矩阵。此非线性系统模型可以用来描述上述主动悬架系统。考虑系统总体控制策略为u(t)＝u_PID(t)+u_a(t)，其中u_PID(t)为PID控制量，其初始策略可保持系统原有PID控制机制，u_a(t)为附加的近似最优控制，在通过算法学习u_a(t)的同时，优化原有的PID参数。

PID控制器通常设计为

控制器的时域解为u_PID(x)＝K_Px+μ_I+μ_D (6)

其中

为了提高设计自由度，可以添加一些控制参数K_I1、K_D1，设计以下实际运用的PID控制器。

u_PID(x)＝K_Px+K_I1μ_I+K_D1μ_D (7)

(d)定义x_a＝[μ_I,μ_D,x]^T，得到一个增广系统

其中

(e)针对以上增广系统，选择下面的性能指标函数：

其中Q(x_a)是正定多项式函数，R(x_a)是对称正定多项式矩阵。与u_a(t)相关的成本函数为

然后，定义哈密顿函数为

其中

最优成本函数V^*(x_a,θ)为

满足以下等式

可得最优控制

为

其中

使得

存在并且是唯一的。

将

代入(10)，得到HJB方程为

(f)算法:1：选择一个初始系统参数向量θ⁰，容许控制策略u₀(x_a)和一个标量∈＞0，让i＝0和V₀＝0。

2：使用控制策略u_a,i(x_a)，求解以下SOS问题以获得V_i(x_a)

3：控制策略更新为

4：根据获得的V_i(x_a)，求解以下SOS问题以获取θⁱ⁺¹和

5：控制策略更新为

6：设置i＝i+1并执行第2步，直到

实施例1：

(a)考虑主动悬架模型如(3)所示，其中，a₁＝1，a₂＝1，M_e＝300Kg，M_f＝60Kg，K_d＝16000N/m，K_f＝190000N/m，K_m＝0.1K_d，C_d＝1000N/(m/sec)。

(b)为了使系统运行更为平稳，给乘客提供更舒适的体验，提出的组合控制方法。为了更清晰的描述算法设计过程，这里考虑一类连续时间非线性系统，其状态空间表达式如下：

其中

是可测系统状态，

是控制输入。

是多项式向量，且有f(0)＝0，

PID控制器通常设计为

控制器的时域解为u_PID(x)＝K_Px+μ_I+μ_D (6)

其中

u_PID(x)＝K_Px+K_I1μ_I+K_D1μ_D (7)

(c)定义x_a＝[μ_I,μ_D,x]^T，得到一个增广系统

其中

(d)针对以上增广系统，选择下面的性能指标函数：

然后，定义哈密顿函数为

其中

最优成本函数V^*(x_a,θ)为

满足以下等式

可得最优控制

为

其中

使得

存在并且是唯一的。

将

代入(10)，得到HJB方程为

(e)算法:

1：选择一个初始系统参数向量θ0，容许控制策略u₀(x_a)和一个标量∈＞0，让i＝0和V₀＝0。

2：使用控制策略u_a,i(x_a)，求解以下SOS问题以获得V_i(x_a)

3：控制策略更新为

4：根据获得的V_i(x_a)，求解以下SOS问题以获取θⁱ⁺¹和

5：控制策略更新为

6：设置i＝i+1并执行第2步，直到

本发明未详细说明部分属于领域技术人员公知常识。

Claims

1.一种基于策略迭代的PID优化控制方法，其特征在于步骤如下：

步骤1：考虑到主动悬架系统动力学模型：

步骤2：考虑实际非线性函数影响，定义状态变量x₁＝x_s，

x₃＝x_w，

其中

其中，

是可测系统状态，

是控制输入，

是多项式向量，且有f(0)＝0，

PID控制器通常设计为

控制器的时域解为

u_PID(x)＝K_Px+μ_I+μ_D (6)

其中

为了提高设计自由度，可以添加一些控制参数，设计以下实际运用的PID控制器；

u_PID(x)＝K_Px+K_I1μ_I+K_D1μ_D (7)

步骤4：定义x_a＝[μ_I,μ_D,x]^T，得到一个增广系统

其中

步骤5：针对以上增广系统，选择下面的性能指标函数：

然后，定义哈密顿函数为

最优成本函数V^*(x_a,θ)为

满足以下等式

可得最优控制

为

其中，

使得

存在并且是唯一的；

将

代入(10)，得到HJB方程为

2：使用控制策略u_a,i(x_a)，求解以下SOS问题以获得V_i(x_a)

3：控制策略更新为

4：根据获得的V_i(x_a)，求解以下SOS问题以获取θⁱ⁺¹和

5：控制策略更新为

6：设置i＝i+1并执行第2步，直到||