CN104991444B

CN104991444B - 基于跟踪微分器的非线性pid自适应控制方法

Info

Publication number: CN104991444B
Application number: CN201510454824.0A
Authority: CN
Inventors: 于惠钧; 柳云山
Original assignee: Hunan University of Technology
Current assignee: Hunan University of Technology
Priority date: 2015-07-30
Filing date: 2015-07-30
Publication date: 2018-02-09
Anticipated expiration: 2035-07-30
Also published as: CN104991444A

Abstract

本发明公开了一种基于跟踪微分器的非线性PID自适应控制方法，步骤包括：建立跟踪微分器TD；建立非线性PID(NLPID)控制律；建立NLPID权值系数的自适应学习算法。使用本发明提供的基于跟踪微分器的非线性PID自适应控制方法，具有良好的稳定性和收敛性。不仅能够精确跟踪参考信号，无超调无振荡，而且具有很强的鲁棒稳定性。此外，控制器结构简单、理论模型清晰、不依赖于被控对象模型，而且计算量小，因此特别适合于未知对象或难以建模对象的实时控制。

Description

基于跟踪微分器的非线性PID自适应控制方法

技术领域

本发明具体涉及一种基于跟踪微分器的非线性PID自适应控制方法。

背景技术

针对非线性系统不确定性的控制问题，采用神经网络与多模型相结合的自适应控制方法，实现了一类渐近稳定的非线性控制；提出了基于广义预测自适应控制方法来实现零动态不稳定的非线性控制方法。上述方法的共同特点是：将这类非线性系统表示为高阶非线性项未建模动态和一个线性系统，并假定未建模动态是已知全局有界的；尽管不需要未建模动态全局有界，但未建模动态的变化率需要已知全局有界的情况下，提出了基于多模型与神经网络的多变量非线性的自适应控制方法；针对一类不确定性未建模非线性系统，提出了一种鲁棒自适应控制方法，该方法使用模糊逻辑系统来逼近未建模动态。综上所述，针对非线性不确定系统的自适应控制问题，为了进一步放宽未建模动态的全局有界条件，其控制原理研究一直是一个挑战性的课题。

由于BP神经网络存在收敛速度慢、易陷入局部极小点的缺点，而且还需要凭经验确定神经网络结构，因此，基于BP神经网络去逼近系统的未建模动态，会影响未建模动态的估计效果，从而影响其控制效果。此外，针对未建模动态全局有界的局限性，要求系统的未建模动态在线性增长情况下，根据自适应模糊神经推理系统提出的单调、连续并且可逆的一一映射相结合的方式来估计未建模动态，提出了基于未建模动态补偿的一类SISO零动态不稳定非线性系统的自适应切换控制方法。该方法淡化了未建模动态全局有界条件的局限性，但其要求的条件仅局限于线性增长的未建模动态，而且使用模糊神经网络推论系统和一一映射相结合的方法来估计未建模动态，其计算量大。

发明内容

本发明的目的之一是为了有效淡化上述未建模动态全局有界和线性增长的局限性，提出了一种不依赖于对象模型的基于跟踪微分器的非线性PID自适应控制方法。

一种基于跟踪微分器的非线性PID自适应控制方法，所述非线性PID控制包括两个跟踪微分器TD及NLPID控制器，步骤包括：

S1、参考信号有界|v(k)|≤r；则有

S2、对参考信号和状态输出分别实现过渡过程，TD产生两个输出信号，其中一个输出是跟踪输入信号TD₁，另一个输出是输入信号的导数TD₂，TD₁的模型如下：

其中，r为决定跟踪快慢的参数，h则为计算步长，误差信号为ek＝v₁(k)-v(k),且最优跟踪函数fhan定义如下：

fh＝fhan(ek,v₂(k),r,h)

TD₂的模型只要在TD₁模型的基础上分别将其它参数完全相同；

S3、基于TD的PID控制律写为：

u(k)＝K_pe₁(k)+K_ie₀(k)+K_de₂(k)

其中，e₀(k)＝e₀(k-1)+e₁(k)，

构造了一组非线性的PID增益参数：

设

其中，a_p≥0.2，a_i≥1.2，a_d≥1.2；得到非线性PID控制律为：

u(k)＝w_pu_p(k)+w_iu_i(k)+w_du_d(k)

其中，w_p、w_i和w_d分别是NLPID的比例、积分和微分的权值系数；

S4、NLPID权值系数的自适应学习算法：

定义性能指标为：其中，

根据梯度下降法调整权值系数：w_j(k+1)＝w_j(k)+Δw_j(k)，(j＝p,i,d)；

调整量Δw_j(k)为：Δw_j(k)＝μe₁(k)u_j(k)y_u(k)；

并将Δw_j(k)带入w_j(k+1)＝w_j(k)+Δw_j(k)可得NLPID权值系数的自适应镇定算法：

设absw＝|w_p(k+1)|+|w_i(k+1)|+|w_d(k+1)|，对神经网络权值系数做归一化处理，即

进一步的，所述跟踪函数fhan定义式中的参数变量关系如下：

d＝rh²；a₀＝hv₂(k)；y＝v₁(k)+a₀；

a₂＝a₀+sign(y)(a₁-d)/2；a＝(a₀+y)fsg(y,d)+a₂[1-fsg(y,d)]；

且，fsg(x,d)＝[sign(x+d)-sign(x-d)]/2。

进一步的，所述调整量Δw_j(k)具体得出方法为：

调整量Δw_j(k)如下：

由于且上式简化为：

式中，μ是神经网络学习步长，且0＜μ＜1；

对式做如下近似计算：

算法是收敛的，则必有|e₁(k+1)|≤|e₁(k)|，得出：e₁(k+1)＝αe₁(k)，且0＜α≤1，将α融入到学习率μ中，并用e₁(k)近似替代e₁(k+1)；

用符号函数替代并设

式简化为：Δw_j(k)＝μe₁(k)u_j(k)y_u(k)。

本发明的有益效果在于，使用本发明提供的基于跟踪微分器的非线性PID自适应控制方法，具有良好的稳定性和收敛性。不仅能够精确跟踪参考信号，无超调无振荡，而且具有很强的鲁棒稳定性。此外，控制器结构简单、理论模型清晰、不依赖于被控对象模型，而且计算量小，因此特别适合于未知对象或难以建模对象的实时控制。

附图说明

图1所示为本发明基于跟踪微分器的非线性PID自适应控制方法原理图。

图2所示为PID增益参数变化曲线。

图3所示为不确定高阶非线性项v[X(k)]有界时，基于TD的NLPID控制性能图(图3a是非线性系统跟踪控制结果图、图3b是控制信号输入图)。

图4所示为不确定高阶非线性项v[X(k)]有界时，使用基于自适应神经模糊推理系统(ANFIS)与多模型切换系统的控制结果图(图4a是系统跟踪控制性能、图4b是控制信号输入)。

图5所示为不确定高阶非线性项v[X(k)]满足线性增长条件时，基于TD的NLPID控制性能图(图5a是系统跟踪控制性能图、图5b是控制输入图)。

图6所示为不确定高阶非线性项v[X(k)]满足线性增长条件时，使用基于自适应神经模糊推理系统(ANFIS)与多模型切换系统的控制结果图(图6a是系统跟踪控制性能、图6b是控制信号输入)。

具体实施方式

下文将结合具体附图详细描述本发明具体实施例。应当注意的是，下述实施例中描述的技术特征或者技术特征的组合不应当被认为是孤立的，它们可以被相互组合从而达到更好的技术效果。

由图1可知，NLPID自适应控制原理主要由两个跟踪微分器TD和NLPID控制器组成。图中的限幅器主要根据参考信号v(k)的上界对受控对象的状态输出进行限幅处理。设参考信号有界：|v(k)|≤r，则有：

1、跟踪微分器TD

TD是一个动态环节,对参考信号和状态输出分别实现过渡过程,它产生两个输出信号,其中一个输出是跟踪输入信号,另一个输出是输入信号的导数,TD₁的模型如下:

其中,r为决定跟踪快慢的参数，h则为计算步长,误差信号为ek＝v₁(k)-v(k),且最优跟踪函数fhan定义如下:

fh＝fhan(ek,v₂(k),r,h) (2)

式中的参数变量关系如下:

d＝rh²；a₀＝hv₂(k)；y＝v₁(k)+a₀；

a₂＝a₀+sign(y)(a₁-d)/2；a＝(a₀+y)fsg(y,d)+a₂[1-fsg(y,d)]；

这里,fsg(x,d)＝[sign(x+d)-sign(x-d)]/2.

TD₂的模型只要在TD₁模型的基础上分别将(y(k)限幅处理)、即可，其它参数完全相同。

2、非线性PID(NLPID)控制律

众所周知,传统数字PID控制律为

u(k)＝K_pe(k)+K_is(k)+K_dΔe(k) (3)

其中，e(k)＝v(k)-y(k)，Δe(k)＝e(k)-e(k-1)，K_p、K_i和K_d分别是比例、积分和微分系数。

根据图1可知,基于TD的PID控制律可改写为：

u(k)＝K_pe₁(k)+K_ie₀(k)+K_de₂(k) (4)

其中，e₀(k)＝e₀(k-1)+e₁(k)，

由现有可知，PID的增益系数随误差信号e₁(k)变化的曲线大致如图2所示。

根据图2所示的大致曲线形状，本发明构造了一组非线性的PID增益参数，即

设

其中，a_p≥0.2，a_i≥1.2，a_d≥1.2。将式(5)和式(6)代入式(4)，即可得到非线性PID控制律为：

u(k)＝w_pu_p(k)+w_iu_i(k)+w_du_d(k) (7)

其中，w_p、w_i和w_d分别是NLPID的比例、积分和微分的权值系数。

3、NLPID权值系数的自适应学习算法

由式(7)可知，NLPID三个权值系数w_p、w_i和w_d的镇定具有重要意义。为了自适应镇定权值系数，下面给出权值系数的自适应学习算法。

由于因此定义性能指标为

其中，

根据梯度下降法调整权值系数数：

w_j(k+1)＝w_j(k)+Δw_j(k)，(j＝p,i,d) (9)

其中，调整量Δw_j(k)如下：

由于并考虑到因此，式(10)简化为

式中，μ是神经网络学习步长，且0＜μ＜1。

由于e₁(k+1)和都与对象的未来状态有关，因此，计算式(11)会出现困难。为了有效解决上述计算的问题，本发明做如下近似计算。

如果算法是收敛的，则必有|e₁(k+1)|≤|e₁(k)|，因此可设：e₁(k+1)＝αe₁(k)，且0＜α≤1，如果将α融入到学习率μ中，则可用e₁(k)近似替代e₁(k+1)。

此外，用符号函数：来替代是完全可行的。由于符号函数的正负性质只决定神经网络权值变化的方向，而其数值的大小只影响权值的变化速率，但是权值变化速率是可以通过学习步长μ来加以调节的。如果设

则式(11)可简化为

Δw_j(k)＝μe₁(k)u_j(k)y_u(k) (13)

将式(13)代入式(9)，即可得到NLPID权值系数的自适应镇定算法：

设absw＝|w_p(k+1)|+|w_i(k+1)|+|w_d(k+1)|，为了避免训练过程中的振荡现象，本发明对神经网络权值系数做归一化处理，即

很显然，使用式(14)对NLPID的三个增益参数进行迭代学习，与被控对象无关，完全由系统输出的观测值即可实现增益参数的自适应镇定，不会受到不确定高阶非线性项全局有界的限制或者线性增长的限制。

4、算法收敛性分析

为了保证式(14)所示算法的收敛性，有效确定学习步长μ的大小是十分要的，如果学习步长偏小，虽然跟踪性能好，但是其响应速度慢；如果学习步长偏大，虽然响应速度快，但是其跟踪控制的性能差。为此，本发明提出并证明了学习步长μ的取值定理，为学习步长大小的确定提供了有效的理论依据。

定理1.当且仅当学习步长μ为：0＜μ＜2/p(k)时，本发明提出的神经网络权值自适应学习算法是收敛的，其中，

证明：设Lyapnov函数为

则有

因为：e₁(k+1)＝e₁(k)+Δe₁(k)，代入式(17)，整理得

ΔV(k)＝Δe₁(k)[e₁(k)+0.5Δe₁(k)] (18)

又因为

而

考虑到：因此有

将式(13)和式(20)代入式(19)，整理可得

设则式(21)简化为

将式(22)代入式(18)，整理得

很显然，为了使神经网络训练算法收敛，必须要求式(23)中的ΔV(k)≤0，则必有下列条件成立：

因为因此有：0＜μ＜2/p(k)，证毕。

5、学习率的进一步讨论

由定理1可知，学习步长为：0＜μ＜2/p(k)，通常取μ＝1.2/p(k)。在控制过程中，如果将会导致学习率μ≥1，为此，根据模拟退火法则，采用时变学习率，即：μ＝1.2/[p(k)+10k]。

6、算法步骤

Step1.随机产生初始增益参数w_p、w_i和w_d；

Step2.计算误差e₁(k)和u_p(k)、u_i(k)和u_d(k)；由式(12)计算y_u(k)；计算学习率：

Step3.由式(14)更新增益参数：w_p(k+1)、w_i(k+1)、w_d(k+1)；由式(15)对权值系数做归一化处理；

Step4.由式(7)计算NLPID控制律：u(k)；

Step5.返回Step2.重复上述的训练过程，以便实现非线性系统的在线实时控制过程。

仿真实例

为了验证本发明控制方法的有效性，以现有技术给出的两个非线性对象作为实例进行比较分析。在仿真实验中，设两个跟踪微分器的相关参数如下：

取h＝0.1，快速因子r＝5，滤波因子h₀＝5h，则有：

随机产生初始增益参数w_p、w_i和w_d；系统初始状态为y_-1＝0、u_-1＝0、u_-2＝0、e_0-1＝0；系数a_p＝0.2、a_i＝1.2、a_d＝1.2；仿真时间250秒；参考输入信号与现有技术相同，即为：v(k)＝3sign[sin(πk/50)]。

实施例1.如果不确定高阶非线性项v[X(k)]有界时，使用如下所示的离散零动态不稳定非线性系统进行仿真实验：

本发明方法的仿真实验结果如图3所示。图4是现有技术使用基于自适应神经模糊推理系统(ANFIS)与多模型切换系统的控制结果。从仿真结果可以看出，采用本发明所提的控制方法有效提高了控制精度，与现有技术使用基于ANFIS与多模型切换系统的控制方法相比，本发明的控制方法不仅输出无超调，而且输入幅值显著减小。

实施例2.当不确定高阶非线性项v[X(k)]满足线性增长条件时，为了验证本发明控制方法的有效性，考虑如下的离散零动态不稳定非线性系统为：

y(k+1)＝2.6y(k)-1.2y(k-1)+u(k)+1.2u(k-1)+ (25)

0.5y(k)sin[u(k)+u(k-1)+y(k)+y(k-1)]

采用本发明控制方法的仿真结果如图5所示，图6是现有技术使用基ANFIS与多模型切换系统的控制性能。从仿真结果可以看出，与现有技术的控制方法相比，本发明的控制方法能精确跟踪参考信号，不仅不存在超调和振荡现象，而且输入幅值显著减小。

使用本发明提供的基于跟踪微分器的非线性PID自适应控制方法，具有良好的稳定性和收敛性。不仅能够精确跟踪参考信号，无超调无振荡，而且具有很强的鲁棒稳定性。此外，控制器结构简单、理论模型清晰、不依赖于被控对象模型，而且计算量小，因此特别适合于未知对象或难以建模对象的实时控制。

本发明虽然已经给出了本发明的一些实施例，但是本领域的技术人员应当理解，在不脱离本发明精神的情况下，可以对本发明的实施例进行改变。上述实施例只是示例性的，不应以本发明的实施例作为本发明权利范围的限定。

Claims

1.一种基于跟踪微分器的非线性PID自适应控制方法，所述非线性PID控制包括两个跟踪微分器TD及NLPID控制器，其特征在于，步骤包括：

S1、参考信号有界|v(k)|≤r；则有

<mrow> <mover> <mi>y</mi> <mo>^</mo> </mover> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mrow> <mi>r</mi> <mi>s</mi> <mi>i</mi> <mi>g</mi> <mi>n</mi> <mo>&lsqb;</mo> <mi>y</mi> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> <mo>&rsqb;</mo> <mo>,</mo> </mrow> </mtd> <mtd> <mrow> <mo>|</mo> <mi>y</mi> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> <mo>|</mo> <mo>&GreaterEqual;</mo> <mi>r</mi> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mi>y</mi> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> <mo>,</mo> </mrow> </mtd> <mtd> <mrow> <mo>|</mo> <mi>y</mi> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> <mo>|</mo> <mo><</mo> <mi>r</mi> </mrow> </mtd> </mtr> </mtable> </mfenced> <mo>;</mo> </mrow>

S2、对参考信号和状态输出分别实现过渡过程，TD产生两个输出信号，其中一个输出是跟踪输入信号TD1，另一个输出是输入信号的导数TD2，TD1的模型如下：

其中，r为决定跟踪快慢的参数，h则为计算步长，误差信号为ek＝v1(k)-v(k),且最优跟踪函数fhan定义如下：

fh＝fhan(ek,v2(k),r,h)

TD₂的模型只要在TD₁模型的基础上分别将

其它参数完全相同；

S3、基于TD的PID控制律写为：

u(k)＝K_pe₁(k)+K_ie₀(k)+K_de₂(k)

其中，

e₀(k)＝e₀(k-1)+e₁(k)，

构造了一组非线性的PID增益参数：

设

其中，a_p≥0.2，a_i≥1.2，a_d≥1.2；得到非线性PID控制律为：

u(k)＝w_pu_p(k)+w_iu_i(k)+w_du_d(k)

S4、NLPID权值系数的自适应学习算法：

定义性能指标为：

其中，

调整量Δw_j(k)为：Δw_j(k)＝μe₁(k)u_j(k)y_u(k)；

所述跟踪函数fhan定义式中的参数变量关系如下：

d＝rh²；a₀＝hv₂(k)；y＝v₁(k)+a₀；

a₂＝a₀+sign(y)(a₁-d)/2；a＝(a₀+y)fsg(y,d)+a₂[1-fsg(y,d)]；

且，fsg(x,d)＝[sign(x+d)-sign(x-d)]/2；

2.如权利要求1所述的一种基于跟踪微分器的非线性PID自适应控制方法，其特征在于，所述调整量Δw_j(k)具体得出方法为：

调整量Δw_j(k)如下：

<mrow> <msub> <mi>&Delta;w</mi> <mi>j</mi> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> <mo>=</mo> <mo>-</mo> <mi>&mu;</mi> <mfrac> <mrow> <mo>&part;</mo> <mi>J</mi> </mrow> <mrow> <mo>&part;</mo> <msub> <mi>w</mi> <mi>j</mi> </msub> </mrow> </mfrac> <mo>=</mo> <mo>-</mo> <mi>&mu;</mi> <mfrac> <mrow> <mo>&part;</mo> <mi>J</mi> </mrow> <mrow> <mo>&part;</mo> <msub> <mi>e</mi> <mn>1</mn> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>+</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow> </mfrac> <mfrac> <mrow> <mo>&part;</mo> <msub> <mi>e</mi> <mn>1</mn> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>+</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow> <mrow> <mo>&part;</mo> <msub> <mover> <mi>y</mi> <mo>^</mo> </mover> <mn>1</mn> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>+</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow> </mfrac> <mfrac> <mrow> <mo>&part;</mo> <msub> <mover> <mi>y</mi> <mo>^</mo> </mover> <mn>1</mn> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>+</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow> <mrow> <mo>&part;</mo> <mover> <mi>y</mi> <mo>^</mo> </mover> <mrow> <mo>(</mo> <mi>k</mi> <mo>+</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow> </mfrac> <mfrac> <mrow> <mo>&part;</mo> <mover> <mi>y</mi> <mo>^</mo> </mover> <mrow> <mo>(</mo> <mi>k</mi> <mo>+</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow> <mrow> <mo>&part;</mo> <mi>y</mi> <mrow> <mo>(</mo> <mi>k</mi> <mo>+</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow> </mfrac> <mfrac> <mrow> <mo>&part;</mo> <mi>y</mi> <mrow> <mo>(</mo> <mi>k</mi> <mo>+</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow> <mrow> <mo>&part;</mo> <mi>u</mi> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> </mrow> </mfrac> <mfrac> <mrow> <mo>&part;</mo> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> </mrow> <mrow> <mo>&part;</mo> <msub> <mi>w</mi> <mi>j</mi> </msub> </mrow> </mfrac> <mo>;</mo> </mrow>

由于

上式简化为：

<mrow> <msub> <mi>&Delta;w</mi> <mi>j</mi> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> <mo>=</mo> <msub> <mi>&mu;e</mi> <mn>1</mn> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>+</mo> <mn>1</mn> <mo>)</mo> </mrow> <mfrac> <mrow> <mo>&part;</mo> <mi>y</mi> <mrow> <mo>(</mo> <mi>k</mi> <mo>+</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow> <mrow> <mo>&part;</mo> <mi>u</mi> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> </mrow> </mfrac> <msub> <mi>u</mi> <mi>j</mi> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> <mo>;</mo> </mrow>

式中，μ是神经网络学习步长，且0＜μ＜1；

对式

<mrow> <msub> <mi>&Delta;w</mi> <mi>j</mi> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> <mo>=</mo> <msub> <mi>&mu;e</mi> <mn>1</mn> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>+</mo> <mn>1</mn> <mo>)</mo> </mrow> <mfrac> <mrow> <mo>&part;</mo> <mi>y</mi> <mrow> <mo>(</mo> <mi>k</mi> <mo>+</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow> <mrow> <mo>&part;</mo> <mi>u</mi> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> </mrow> </mfrac> <msub> <mi>u</mi> <mi>j</mi> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> </mrow>

做如下近似计算：

用符号函数替代并设

替代并设

式

简化为：

Δw_j(k)＝μe₁(k)u_j(k)y_u(k)。