CN104991444B - 基于跟踪微分器的非线性pid自适应控制方法 - Google Patents

基于跟踪微分器的非线性pid自适应控制方法 Download PDF

Info

Publication number
CN104991444B
CN104991444B CN201510454824.0A CN201510454824A CN104991444B CN 104991444 B CN104991444 B CN 104991444B CN 201510454824 A CN201510454824 A CN 201510454824A CN 104991444 B CN104991444 B CN 104991444B
Authority
CN
China
Prior art keywords
mrow
msub
mtd
mtr
mfrac
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510454824.0A
Other languages
English (en)
Other versions
CN104991444A (zh
Inventor
于惠钧
柳云山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hunan University of Technology
Original Assignee
Hunan University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hunan University of Technology filed Critical Hunan University of Technology
Priority to CN201510454824.0A priority Critical patent/CN104991444B/zh
Publication of CN104991444A publication Critical patent/CN104991444A/zh
Application granted granted Critical
Publication of CN104991444B publication Critical patent/CN104991444B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明公开了一种基于跟踪微分器的非线性PID自适应控制方法,步骤包括:建立跟踪微分器TD;建立非线性PID(NLPID)控制律;建立NLPID权值系数的自适应学习算法。使用本发明提供的基于跟踪微分器的非线性PID自适应控制方法,具有良好的稳定性和收敛性。不仅能够精确跟踪参考信号,无超调无振荡,而且具有很强的鲁棒稳定性。此外,控制器结构简单、理论模型清晰、不依赖于被控对象模型,而且计算量小,因此特别适合于未知对象或难以建模对象的实时控制。

Description

基于跟踪微分器的非线性PID自适应控制方法
技术领域
本发明具体涉及一种基于跟踪微分器的非线性PID自适应控制方法。
背景技术
针对非线性系统不确定性的控制问题,采用神经网络与多模型相结合的自适应控制方法,实现了一类渐近稳定的非线性控制;提出了基于广义预测自适应控制方法来实现零动态不稳定的非线性控制方法。上述方法的共同特点是:将这类非线性系统表示为高阶非线性项未建模动态和一个线性系统,并假定未建模动态是已知全局有界的;尽管不需要未建模动态全局有界,但未建模动态的变化率需要已知全局有界的情况下,提出了基于多模型与神经网络的多变量非线性的自适应控制方法;针对一类不确定性未建模非线性系统,提出了一种鲁棒自适应控制方法,该方法使用模糊逻辑系统来逼近未建模动态。综上所述,针对非线性不确定系统的自适应控制问题,为了进一步放宽未建模动态的全局有界条件,其控制原理研究一直是一个挑战性的课题。
由于BP神经网络存在收敛速度慢、易陷入局部极小点的缺点,而且还需要凭经验确定神经网络结构,因此,基于BP神经网络去逼近系统的未建模动态,会影响未建模动态的估计效果,从而影响其控制效果。此外,针对未建模动态全局有界的局限性,要求系统的未建模动态在线性增长情况下,根据自适应模糊神经推理系统提出的单调、连续并且可逆的一一映射相结合的方式来估计未建模动态,提出了基于未建模动态补偿的一类SISO零动态不稳定非线性系统的自适应切换控制方法。该方法淡化了未建模动态全局有界条件的局限性,但其要求的条件仅局限于线性增长的未建模动态,而且使用模糊神经网络推论系统和一一映射相结合的方法来估计未建模动态,其计算量大。
发明内容
本发明的目的之一是为了有效淡化上述未建模动态全局有界和线性增长的局限性,提出了一种不依赖于对象模型的基于跟踪微分器的非线性PID自适应控制方法。
一种基于跟踪微分器的非线性PID自适应控制方法,所述非线性PID控制包括两个跟踪微分器TD及NLPID控制器,步骤包括:
S1、参考信号有界|v(k)|≤r;则有
S2、对参考信号和状态输出分别实现过渡过程,TD产生两个输出信号,其中一个输出是跟踪输入信号TD1,另一个输出是输入信号的导数TD2,TD1的模型如下:
其中,r为决定跟踪快慢的参数,h则为计算步长,误差信号为ek=v1(k)-v(k),且最优跟踪函数fhan定义如下:
fh=fhan(ek,v2(k),r,h)
TD2的模型只要在TD1模型的基础上分别将其它参数完全相同;
S3、基于TD的PID控制律写为:
u(k)=Kpe1(k)+Kie0(k)+Kde2(k)
其中,e0(k)=e0(k-1)+e1(k),
构造了一组非线性的PID增益参数:
其中,ap≥0.2,ai≥1.2,ad≥1.2;得到非线性PID控制律为:
u(k)=wpup(k)+wiui(k)+wdud(k)
其中,wp、wi和wd分别是NLPID的比例、积分和微分的权值系数;
S4、NLPID权值系数的自适应学习算法:
定义性能指标为:其中,
根据梯度下降法调整权值系数:wj(k+1)=wj(k)+Δwj(k),(j=p,i,d);
调整量Δwj(k)为:Δwj(k)=μe1(k)uj(k)yu(k);
并将Δwj(k)带入wj(k+1)=wj(k)+Δwj(k)可得NLPID权值系数的自适应镇定算法:
设absw=|wp(k+1)|+|wi(k+1)|+|wd(k+1)|,对神经网络权值系数做归一化处理,即
进一步的,所述跟踪函数fhan定义式中的参数变量关系如下:
d=rh2;a0=hv2(k);y=v1(k)+a0
a2=a0+sign(y)(a1-d)/2;a=(a0+y)fsg(y,d)+a2[1-fsg(y,d)];
且,fsg(x,d)=[sign(x+d)-sign(x-d)]/2。
进一步的,所述调整量Δwj(k)具体得出方法为:
调整量Δwj(k)如下:
由于上式简化为:
式中,μ是神经网络学习步长,且0<μ<1;
对式做如下近似计算:
算法是收敛的,则必有|e1(k+1)|≤|e1(k)|,得出:e1(k+1)=αe1(k),且0<α≤1,将α融入到学习率μ中,并用e1(k)近似替代e1(k+1);
用符号函数替代并设
简化为:Δwj(k)=μe1(k)uj(k)yu(k)。
本发明的有益效果在于,使用本发明提供的基于跟踪微分器的非线性PID自适应控制方法,具有良好的稳定性和收敛性。不仅能够精确跟踪参考信号,无超调无振荡,而且具有很强的鲁棒稳定性。此外,控制器结构简单、理论模型清晰、不依赖于被控对象模型,而且计算量小,因此特别适合于未知对象或难以建模对象的实时控制。
附图说明
图1所示为本发明基于跟踪微分器的非线性PID自适应控制方法原理图。
图2所示为PID增益参数变化曲线。
图3所示为不确定高阶非线性项v[X(k)]有界时,基于TD的NLPID控制性能图(图3a是非线性系统跟踪控制结果图、图3b是控制信号输入图)。
图4所示为不确定高阶非线性项v[X(k)]有界时,使用基于自适应神经模糊推理系统(ANFIS)与多模型切换系统的控制结果图(图4a是系统跟踪控制性能、图4b是控制信号输入)。
图5所示为不确定高阶非线性项v[X(k)]满足线性增长条件时,基于TD的NLPID控制性能图(图5a是系统跟踪控制性能图、图5b是控制输入图)。
图6所示为不确定高阶非线性项v[X(k)]满足线性增长条件时,使用基于自适应神经模糊推理系统(ANFIS)与多模型切换系统的控制结果图(图6a是系统跟踪控制性能、图6b是控制信号输入)。
具体实施方式
下文将结合具体附图详细描述本发明具体实施例。应当注意的是,下述实施例中描述的技术特征或者技术特征的组合不应当被认为是孤立的,它们可以被相互组合从而达到更好的技术效果。
由图1可知,NLPID自适应控制原理主要由两个跟踪微分器TD和NLPID控制器组成。图中的限幅器主要根据参考信号v(k)的上界对受控对象的状态输出进行限幅处理。设参考信号有界:|v(k)|≤r,则有:
1、跟踪微分器TD
TD是一个动态环节,对参考信号和状态输出分别实现过渡过程,它产生两个输出信号,其中一个输出是跟踪输入信号,另一个输出是输入信号的导数,TD1的模型如下:
其中,r为决定跟踪快慢的参数,h则为计算步长,误差信号为ek=v1(k)-v(k),且最优跟踪函数fhan定义如下:
fh=fhan(ek,v2(k),r,h) (2)
式中的参数变量关系如下:
d=rh2;a0=hv2(k);y=v1(k)+a0
a2=a0+sign(y)(a1-d)/2;a=(a0+y)fsg(y,d)+a2[1-fsg(y,d)];
这里,fsg(x,d)=[sign(x+d)-sign(x-d)]/2.
TD2的模型只要在TD1模型的基础上分别将(y(k)限幅处理)、 即可,其它参数完全相同。
2、非线性PID(NLPID)控制律
众所周知,传统数字PID控制律为
u(k)=Kpe(k)+Kis(k)+KdΔe(k) (3)
其中,e(k)=v(k)-y(k),Δe(k)=e(k)-e(k-1),Kp、Ki和Kd分别是比例、积分和微分系数。
根据图1可知,基于TD的PID控制律可改写为:
u(k)=Kpe1(k)+Kie0(k)+Kde2(k) (4)
其中,e0(k)=e0(k-1)+e1(k),
由现有可知,PID的增益系数随误差信号e1(k)变化的曲线大致如图2所示。
根据图2所示的大致曲线形状,本发明构造了一组非线性的PID增益参数,即
其中,ap≥0.2,ai≥1.2,ad≥1.2。将式(5)和式(6)代入式(4),即可得到非线性PID控制律为:
u(k)=wpup(k)+wiui(k)+wdud(k) (7)
其中,wp、wi和wd分别是NLPID的比例、积分和微分的权值系数。
3、NLPID权值系数的自适应学习算法
由式(7)可知,NLPID三个权值系数wp、wi和wd的镇定具有重要意义。为了自适应镇定权值系数,下面给出权值系数的自适应学习算法。
由于因此定义性能指标为
其中,
根据梯度下降法调整权值系数数:
wj(k+1)=wj(k)+Δwj(k),(j=p,i,d) (9)
其中,调整量Δwj(k)如下:
由于并考虑到 因此,式(10)简化为
式中,μ是神经网络学习步长,且0<μ<1。
由于e1(k+1)和都与对象的未来状态有关,因此,计算式(11)会出现困难。为了有效解决上述计算的问题,本发明做如下近似计算。
如果算法是收敛的,则必有|e1(k+1)|≤|e1(k)|,因此可设:e1(k+1)=αe1(k),且0<α≤1,如果将α融入到学习率μ中,则可用e1(k)近似替代e1(k+1)。
此外,用符号函数:来替代是完全可行的。由于符号函数的正负性质只决定神经网络权值变化的方向,而其数值的大小只影响权值的变化速率,但是权值变化速率是可以通过学习步长μ来加以调节的。如果设
则式(11)可简化为
Δwj(k)=μe1(k)uj(k)yu(k) (13)
将式(13)代入式(9),即可得到NLPID权值系数的自适应镇定算法:
设absw=|wp(k+1)|+|wi(k+1)|+|wd(k+1)|,为了避免训练过程中的振荡现象,本发明对神经网络权值系数做归一化处理,即
很显然,使用式(14)对NLPID的三个增益参数进行迭代学习,与被控对象无关,完全由系统输出的观测值即可实现增益参数的自适应镇定,不会受到不确定高阶非线性项全局有界的限制或者线性增长的限制。
4、算法收敛性分析
为了保证式(14)所示算法的收敛性,有效确定学习步长μ的大小是十分要的,如果学习步长偏小,虽然跟踪性能好,但是其响应速度慢;如果学习步长偏大,虽然响应速度快,但是其跟踪控制的性能差。为此,本发明提出并证明了学习步长μ的取值定理,为学习步长大小的确定提供了有效的理论依据。
定理1.当且仅当学习步长μ为:0<μ<2/p(k)时,本发明提出的神经网络权值自适应学习算法是收敛的,其中,
证明:设Lyapnov函数为
则有
因为:e1(k+1)=e1(k)+Δe1(k),代入式(17),整理得
ΔV(k)=Δe1(k)[e1(k)+0.5Δe1(k)] (18)
又因为
考虑到:因此有
将式(13)和式(20)代入式(19),整理可得
则式(21)简化为
将式(22)代入式(18),整理得
很显然,为了使神经网络训练算法收敛,必须要求式(23)中的ΔV(k)≤0,则必有下列条件成立:
因为因此有:0<μ<2/p(k),证毕。
5、学习率的进一步讨论
由定理1可知,学习步长为:0<μ<2/p(k),通常取μ=1.2/p(k)。在控制过程中,如果将会导致学习率μ≥1,为此,根据模拟退火法则,采用时变学习率,即:μ=1.2/[p(k)+10k]。
6、算法步骤
Step1.随机产生初始增益参数wp、wi和wd
Step2.计算误差e1(k)和up(k)、ui(k)和ud(k);由式(12)计算yu(k);计算学习率:
Step3.由式(14)更新增益参数:wp(k+1)、wi(k+1)、wd(k+1);由式(15)对权值系数做归一化处理;
Step4.由式(7)计算NLPID控制律:u(k);
Step5.返回Step2.重复上述的训练过程,以便实现非线性系统的在线实时控制过程。
仿真实例
为了验证本发明控制方法的有效性,以现有技术给出的两个非线性对象作为实例进行比较分析。在仿真实验中,设两个跟踪微分器的相关参数如下:
取h=0.1,快速因子r=5,滤波因子h0=5h,则有:
随机产生初始增益参数wp、wi和wd;系统初始状态为y-1=0、u-1=0、u-2=0、e0-1=0;系数ap=0.2、ai=1.2、ad=1.2;仿真时间250秒;参考输入信号与现有技术相同,即为:v(k)=3sign[sin(πk/50)]。
实施例1.如果不确定高阶非线性项v[X(k)]有界时,使用如下所示的离散零动态不稳定非线性系统进行仿真实验:
本发明方法的仿真实验结果如图3所示。图4是现有技术使用基于自适应神经模糊推理系统(ANFIS)与多模型切换系统的控制结果。从仿真结果可以看出,采用本发明所提的控制方法有效提高了控制精度,与现有技术使用基于ANFIS与多模型切换系统的控制方法相比,本发明的控制方法不仅输出无超调,而且输入幅值显著减小。
实施例2.当不确定高阶非线性项v[X(k)]满足线性增长条件时,为了验证本发明控制方法的有效性,考虑如下的离散零动态不稳定非线性系统为:
y(k+1)=2.6y(k)-1.2y(k-1)+u(k)+1.2u(k-1)+ (25)
0.5y(k)sin[u(k)+u(k-1)+y(k)+y(k-1)]
采用本发明控制方法的仿真结果如图5所示,图6是现有技术使用基ANFIS与多模型切换系统的控制性能。从仿真结果可以看出,与现有技术的控制方法相比,本发明的控制方法能精确跟踪参考信号,不仅不存在超调和振荡现象,而且输入幅值显著减小。
使用本发明提供的基于跟踪微分器的非线性PID自适应控制方法,具有良好的稳定性和收敛性。不仅能够精确跟踪参考信号,无超调无振荡,而且具有很强的鲁棒稳定性。此外,控制器结构简单、理论模型清晰、不依赖于被控对象模型,而且计算量小,因此特别适合于未知对象或难以建模对象的实时控制。
本发明虽然已经给出了本发明的一些实施例,但是本领域的技术人员应当理解,在不脱离本发明精神的情况下,可以对本发明的实施例进行改变。上述实施例只是示例性的,不应以本发明的实施例作为本发明权利范围的限定。

Claims (2)

1.一种基于跟踪微分器的非线性PID自适应控制方法,所述非线性PID控制包括两个跟踪微分器TD及NLPID控制器,其特征在于,步骤包括:
S1、参考信号有界|v(k)|≤r;则有
<mrow> <mover> <mi>y</mi> <mo>^</mo> </mover> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mrow> <mi>r</mi> <mi>s</mi> <mi>i</mi> <mi>g</mi> <mi>n</mi> <mo>&amp;lsqb;</mo> <mi>y</mi> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> <mo>&amp;rsqb;</mo> <mo>,</mo> </mrow> </mtd> <mtd> <mrow> <mo>|</mo> <mi>y</mi> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> <mo>|</mo> <mo>&amp;GreaterEqual;</mo> <mi>r</mi> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mi>y</mi> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> <mo>,</mo> </mrow> </mtd> <mtd> <mrow> <mo>|</mo> <mi>y</mi> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> <mo>|</mo> <mo>&lt;</mo> <mi>r</mi> </mrow> </mtd> </mtr> </mtable> </mfenced> <mo>;</mo> </mrow>
S2、对参考信号和状态输出分别实现过渡过程,TD产生两个输出信号,其中一个输出是跟踪输入信号TD1,另一个输出是输入信号的导数TD2,TD1的模型如下:
<mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mrow> <msub> <mi>v</mi> <mn>1</mn> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>+</mo> <mn>1</mn> <mo>)</mo> </mrow> <mo>=</mo> <msub> <mi>v</mi> <mn>1</mn> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> <mo>+</mo> <msub> <mi>hv</mi> <mn>2</mn> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <msub> <mi>v</mi> <mn>2</mn> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>+</mo> <mn>1</mn> <mo>)</mo> </mrow> <mo>=</mo> <msub> <mi>v</mi> <mn>2</mn> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> <mo>+</mo> <mi>h</mi> <mi>f</mi> <mi>h</mi> <mi>a</mi> <mi>n</mi> <mrow> <mo>(</mo> <mi>e</mi> <mi>k</mi> <mo>,</mo> <msub> <mi>v</mi> <mn>2</mn> </msub> <mo>(</mo> <mi>k</mi> <mo>)</mo> <mo>,</mo> <mi>r</mi> <mo>,</mo> <mi>h</mi> <mo>)</mo> </mrow> </mrow> </mtd> </mtr> </mtable> </mfenced>
其中,r为决定跟踪快慢的参数,h则为计算步长,误差信号为ek=v1(k)-v(k),且最优跟踪函数fhan定义如下:
fh=fhan(ek,v2(k),r,h)
TD2的模型只要在TD1模型的基础上分别将
其它参数完全相同;
S3、基于TD的PID控制律写为:
u(k)=Kpe1(k)+Kie0(k)+Kde2(k)
其中,
e0(k)=e0(k-1)+e1(k),
构造了一组非线性的PID增益参数:
<mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mrow> <msub> <mi>K</mi> <mi>p</mi> </msub> <mo>=</mo> <msub> <mi>w</mi> <mi>p</mi> </msub> <mo>&amp;lsqb;</mo> <msub> <mi>a</mi> <mi>p</mi> </msub> <mo>+</mo> <msubsup> <mi>e</mi> <mn>1</mn> <mn>2</mn> </msubsup> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> <mo>&amp;rsqb;</mo> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <msub> <mi>K</mi> <mi>i</mi> </msub> <mo>=</mo> <msub> <mi>w</mi> <mi>i</mi> </msub> <mo>&amp;lsqb;</mo> <msub> <mi>a</mi> <mi>i</mi> </msub> <mo>-</mo> <msubsup> <mi>e</mi> <mn>1</mn> <mn>2</mn> </msubsup> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> <mo>&amp;rsqb;</mo> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <msub> <mi>K</mi> <mi>d</mi> </msub> <mo>=</mo> <msub> <mi>w</mi> <mi>d</mi> </msub> <mo>&amp;lsqb;</mo> <msub> <mi>a</mi> <mi>d</mi> </msub> <mo>-</mo> <msub> <mi>e</mi> <mn>1</mn> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> <mo>&amp;rsqb;</mo> </mrow> </mtd> </mtr> </mtable> </mfenced>
<mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mrow> <msub> <mi>u</mi> <mi>p</mi> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> <mo>=</mo> <mo>&amp;lsqb;</mo> <msub> <mi>a</mi> <mi>p</mi> </msub> <mo>+</mo> <msubsup> <mi>e</mi> <mn>1</mn> <mn>2</mn> </msubsup> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> <mo>&amp;rsqb;</mo> <msub> <mi>e</mi> <mn>1</mn> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <msub> <mi>u</mi> <mi>i</mi> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> <mo>=</mo> <mo>&amp;lsqb;</mo> <msub> <mi>a</mi> <mi>i</mi> </msub> <mo>-</mo> <msubsup> <mi>e</mi> <mn>1</mn> <mn>2</mn> </msubsup> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> <mo>&amp;rsqb;</mo> <msub> <mi>e</mi> <mn>0</mn> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <msub> <mi>u</mi> <mi>d</mi> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> <mo>=</mo> <mo>&amp;lsqb;</mo> <msub> <mi>a</mi> <mi>d</mi> </msub> <mo>-</mo> <msub> <mi>e</mi> <mn>1</mn> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> <mo>&amp;rsqb;</mo> <msub> <mi>e</mi> <mn>2</mn> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> </mrow> </mtd> </mtr> </mtable> </mfenced>
其中,ap≥0.2,ai≥1.2,ad≥1.2;得到非线性PID控制律为:
u(k)=wpup(k)+wiui(k)+wdud(k)
其中,wp、wi和wd分别是NLPID的比例、积分和微分的权值系数;
S4、NLPID权值系数的自适应学习算法:
定义性能指标为:
其中,
根据梯度下降法调整权值系数:wj(k+1)=wj(k)+Δwj(k),(j=p,i,d);
调整量Δwj(k)为:Δwj(k)=μe1(k)uj(k)yu(k);
并将Δwj(k)带入wj(k+1)=wj(k)+Δwj(k)可得NLPID权值系数的自适应镇定算法:
<mrow> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mrow> <msub> <mi>w</mi> <mi>p</mi> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>+</mo> <mn>1</mn> <mo>)</mo> </mrow> <mo>=</mo> <msub> <mi>w</mi> <mi>p</mi> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> <mo>+</mo> <msub> <mi>&amp;mu;e</mi> <mn>1</mn> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> <msub> <mi>u</mi> <mi>p</mi> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> <msub> <mi>y</mi> <mi>u</mi> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <msub> <mi>w</mi> <mi>i</mi> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>+</mo> <mn>1</mn> <mo>)</mo> </mrow> <mo>=</mo> <msub> <mi>w</mi> <mi>i</mi> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> <mo>+</mo> <msub> <mi>&amp;mu;e</mi> <mn>1</mn> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> <msub> <mi>u</mi> <mi>i</mi> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> <msub> <mi>y</mi> <mi>u</mi> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <msub> <mi>w</mi> <mi>d</mi> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>+</mo> <mn>1</mn> <mo>)</mo> </mrow> <mo>=</mo> <msub> <mi>w</mi> <mi>d</mi> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> <mo>+</mo> <msub> <mi>&amp;mu;e</mi> <mn>1</mn> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> <msub> <mi>u</mi> <mi>d</mi> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> <msub> <mi>y</mi> <mi>u</mi> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> </mrow> </mtd> </mtr> </mtable> </mfenced> <mo>;</mo> </mrow>
设absw=|wp(k+1)|+|wi(k+1)|+|wd(k+1)|,对神经网络权值系数做归一化处理,即
<mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mrow> <msub> <mi>w</mi> <mi>p</mi> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>+</mo> <mn>1</mn> <mo>)</mo> </mrow> <mo>=</mo> <msub> <mi>w</mi> <mi>p</mi> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>+</mo> <mn>1</mn> <mo>)</mo> </mrow> <mo>/</mo> <mi>a</mi> <mi>b</mi> <mi>s</mi> <mi>w</mi> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <msub> <mi>w</mi> <mi>i</mi> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>+</mo> <mn>1</mn> <mo>)</mo> </mrow> <mo>=</mo> <msub> <mi>w</mi> <mi>i</mi> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>+</mo> <mn>1</mn> <mo>)</mo> </mrow> <mo>/</mo> <mi>a</mi> <mi>b</mi> <mi>s</mi> <mi>w</mi> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <msub> <mi>w</mi> <mi>d</mi> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>+</mo> <mn>1</mn> <mo>)</mo> </mrow> <mo>=</mo> <msub> <mi>w</mi> <mi>d</mi> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>+</mo> <mn>1</mn> <mo>)</mo> </mrow> <mo>/</mo> <mi>a</mi> <mi>b</mi> <mi>s</mi> <mi>w</mi> </mrow> </mtd> </mtr> </mtable> </mfenced>
所述跟踪函数fhan定义式中的参数变量关系如下:
d=rh2;a0=hv2(k);y=v1(k)+a0
a2=a0+sign(y)(a1-d)/2;a=(a0+y)fsg(y,d)+a2[1-fsg(y,d)];
<mrow> <mi>f</mi> <mi>h</mi> <mo>=</mo> <mo>-</mo> <mi>r</mi> <mrow> <mo>(</mo> <mfrac> <mi>a</mi> <mi>d</mi> </mfrac> <mo>)</mo> </mrow> <mi>f</mi> <mi>s</mi> <mi>g</mi> <mrow> <mo>(</mo> <mi>a</mi> <mo>,</mo> <mi>d</mi> <mo>)</mo> </mrow> <mo>-</mo> <mi>r</mi> <mi>s</mi> <mi>i</mi> <mi>g</mi> <mi>n</mi> <mrow> <mo>(</mo> <mi>a</mi> <mo>)</mo> </mrow> <mo>&amp;lsqb;</mo> <mn>1</mn> <mo>-</mo> <mi>f</mi> <mi>s</mi> <mi>g</mi> <mrow> <mo>(</mo> <mi>a</mi> <mo>,</mo> <mi>d</mi> <mo>)</mo> </mrow> <mo>&amp;rsqb;</mo> <mo>;</mo> </mrow>
且,fsg(x,d)=[sign(x+d)-sign(x-d)]/2;
2.如权利要求1所述的一种基于跟踪微分器的非线性PID自适应控制方法,其特征在于,所述调整量Δwj(k)具体得出方法为:
调整量Δwj(k)如下:
<mrow> <msub> <mi>&amp;Delta;w</mi> <mi>j</mi> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> <mo>=</mo> <mo>-</mo> <mi>&amp;mu;</mi> <mfrac> <mrow> <mo>&amp;part;</mo> <mi>J</mi> </mrow> <mrow> <mo>&amp;part;</mo> <msub> <mi>w</mi> <mi>j</mi> </msub> </mrow> </mfrac> <mo>=</mo> <mo>-</mo> <mi>&amp;mu;</mi> <mfrac> <mrow> <mo>&amp;part;</mo> <mi>J</mi> </mrow> <mrow> <mo>&amp;part;</mo> <msub> <mi>e</mi> <mn>1</mn> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>+</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow> </mfrac> <mfrac> <mrow> <mo>&amp;part;</mo> <msub> <mi>e</mi> <mn>1</mn> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>+</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow> <mrow> <mo>&amp;part;</mo> <msub> <mover> <mi>y</mi> <mo>^</mo> </mover> <mn>1</mn> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>+</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow> </mfrac> <mfrac> <mrow> <mo>&amp;part;</mo> <msub> <mover> <mi>y</mi> <mo>^</mo> </mover> <mn>1</mn> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>+</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow> <mrow> <mo>&amp;part;</mo> <mover> <mi>y</mi> <mo>^</mo> </mover> <mrow> <mo>(</mo> <mi>k</mi> <mo>+</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow> </mfrac> <mfrac> <mrow> <mo>&amp;part;</mo> <mover> <mi>y</mi> <mo>^</mo> </mover> <mrow> <mo>(</mo> <mi>k</mi> <mo>+</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow> <mrow> <mo>&amp;part;</mo> <mi>y</mi> <mrow> <mo>(</mo> <mi>k</mi> <mo>+</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow> </mfrac> <mfrac> <mrow> <mo>&amp;part;</mo> <mi>y</mi> <mrow> <mo>(</mo> <mi>k</mi> <mo>+</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow> <mrow> <mo>&amp;part;</mo> <mi>u</mi> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> </mrow> </mfrac> <mfrac> <mrow> <mo>&amp;part;</mo> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> </mrow> <mrow> <mo>&amp;part;</mo> <msub> <mi>w</mi> <mi>j</mi> </msub> </mrow> </mfrac> <mo>;</mo> </mrow>
由于
上式简化为:
<mrow> <msub> <mi>&amp;Delta;w</mi> <mi>j</mi> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> <mo>=</mo> <msub> <mi>&amp;mu;e</mi> <mn>1</mn> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>+</mo> <mn>1</mn> <mo>)</mo> </mrow> <mfrac> <mrow> <mo>&amp;part;</mo> <mi>y</mi> <mrow> <mo>(</mo> <mi>k</mi> <mo>+</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow> <mrow> <mo>&amp;part;</mo> <mi>u</mi> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> </mrow> </mfrac> <msub> <mi>u</mi> <mi>j</mi> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> <mo>;</mo> </mrow>
式中,μ是神经网络学习步长,且0<μ<1;
对式
<mrow> <msub> <mi>&amp;Delta;w</mi> <mi>j</mi> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> <mo>=</mo> <msub> <mi>&amp;mu;e</mi> <mn>1</mn> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>+</mo> <mn>1</mn> <mo>)</mo> </mrow> <mfrac> <mrow> <mo>&amp;part;</mo> <mi>y</mi> <mrow> <mo>(</mo> <mi>k</mi> <mo>+</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow> <mrow> <mo>&amp;part;</mo> <mi>u</mi> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> </mrow> </mfrac> <msub> <mi>u</mi> <mi>j</mi> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> </mrow>
做如下近似计算:
算法是收敛的,则必有|e1(k+1)|≤|e1(k)|,得出:e1(k+1)=αe1(k),且0<α≤1,将α融入到学习率μ中,并用e1(k)近似替代e1(k+1);
用符号函数替代并设
替代并设
<mrow> <mfrac> <mrow> <mo>&amp;part;</mo> <mi>y</mi> <mrow> <mo>(</mo> <mi>k</mi> <mo>+</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow> <mrow> <mo>&amp;part;</mo> <mi>u</mi> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> </mrow> </mfrac> <mo>&amp;ap;</mo> <mi>s</mi> <mi>i</mi> <mi>g</mi> <mi>n</mi> <mo>&amp;lsqb;</mo> <mfrac> <mrow> <mi>y</mi> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> <mo>-</mo> <mi>y</mi> <mrow> <mo>(</mo> <mi>k</mi> <mo>-</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow> <mrow> <mi>u</mi> <mrow> <mo>(</mo> <mi>k</mi> <mo>-</mo> <mn>1</mn> <mo>)</mo> </mrow> <mo>-</mo> <mi>u</mi> <mrow> <mo>(</mo> <mi>k</mi> <mo>-</mo> <mn>2</mn> <mo>)</mo> </mrow> </mrow> </mfrac> <mo>&amp;rsqb;</mo> <mo>=</mo> <msub> <mi>y</mi> <mi>u</mi> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> <mo>;</mo> </mrow>
<mrow> <msub> <mi>&amp;Delta;w</mi> <mi>j</mi> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> <mo>=</mo> <msub> <mi>&amp;mu;e</mi> <mn>1</mn> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>+</mo> <mn>1</mn> <mo>)</mo> </mrow> <mfrac> <mrow> <mo>&amp;part;</mo> <mi>y</mi> <mrow> <mo>(</mo> <mi>k</mi> <mo>+</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow> <mrow> <mo>&amp;part;</mo> <mi>u</mi> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> </mrow> </mfrac> <msub> <mi>u</mi> <mi>j</mi> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> </mrow>
简化为:
Δwj(k)=μe1(k)uj(k)yu(k)。
CN201510454824.0A 2015-07-30 2015-07-30 基于跟踪微分器的非线性pid自适应控制方法 Active CN104991444B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510454824.0A CN104991444B (zh) 2015-07-30 2015-07-30 基于跟踪微分器的非线性pid自适应控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510454824.0A CN104991444B (zh) 2015-07-30 2015-07-30 基于跟踪微分器的非线性pid自适应控制方法

Publications (2)

Publication Number Publication Date
CN104991444A CN104991444A (zh) 2015-10-21
CN104991444B true CN104991444B (zh) 2018-02-09

Family

ID=54303266

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510454824.0A Active CN104991444B (zh) 2015-07-30 2015-07-30 基于跟踪微分器的非线性pid自适应控制方法

Country Status (1)

Country Link
CN (1) CN104991444B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3324254A1 (de) * 2016-11-17 2018-05-23 Siemens Aktiengesellschaft Einrichtung und verfahren zur bestimmung der parameter einer regeleinrichtung
CN106647241B (zh) * 2016-12-05 2020-02-04 南昌航空大学 一种新型的非线性pid控制器
CN106708069B (zh) * 2017-01-19 2020-01-10 中国科学院自动化研究所 水下移动作业机器人的协调规划与控制方法
CN107991862B (zh) * 2017-12-08 2021-07-06 无锡隆盛科技股份有限公司 一种可控临界速度的无超调pid控制方法
CN110069012A (zh) * 2018-01-23 2019-07-30 北京京东尚科信息技术有限公司 用于抑制噪声的控制量确定方法和装置、姿态控制系统
CN109412410A (zh) * 2018-10-29 2019-03-01 嘉兴市恒创电力设备有限公司 一种用于Buck-Boost变换器输出电压PID控制的微分信号的提取方法
CN110690705A (zh) * 2019-08-28 2020-01-14 济南大学 基于跟踪微分器的apf电流检测和电容电压控制方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103296957B (zh) * 2013-06-20 2016-03-02 北京经纬恒润科技有限公司 一种永磁同步电机位置扫描控制方法及系统
CN103731058B (zh) * 2013-12-20 2015-12-02 浙江大学 一种基于lcl滤波器的光伏并网逆变器的控制方法
CN104281055A (zh) * 2014-03-18 2015-01-14 江南大学 一种连续搅拌聚丙烯反应釜温度的自抗扰控制方法

Also Published As

Publication number Publication date
CN104991444A (zh) 2015-10-21

Similar Documents

Publication Publication Date Title
CN104991444B (zh) 基于跟踪微分器的非线性pid自适应控制方法
CN104950678B (zh) 一种柔性机械臂系统的神经网络反演控制方法
Zhang et al. A novel infinite-time optimal tracking control scheme for a class of discrete-time nonlinear systems via the greedy HDP iteration algorithm
CN105549381B (zh) 一种基于吸引律的离散重复控制方法
CN104267596B (zh) 一种小车倒立摆系统的有限时间解耦控制方法
CN111459051A (zh) 一种带扰动观测器的离散终端滑模无模型控制方法
CN105137999A (zh) 一种具有输入饱和的飞行器跟踪控制直接法
CN104730920B (zh) 一种神经网络自适应动态面控制器结构与设计方法
CN106647271A (zh) 基于神经网络理论的非线性系统自适应比例积分控制方法
CN107506938A (zh) 一种基于机器学习的物料质量评估方法
CN110333657A (zh) 用于死区非线性不确定系统的自适应动态面跟踪控制方法
CN107102634A (zh) 一种基于转台伺服系统的参数估计与跟踪控制方法
CN105306010A (zh) 一种基于最小误差熵的凸组合自适应滤波器设计方法
CN107247411A (zh) 基于扰动观测器的非奇异终端滑模航迹跟踪控制方法
CN106325075A (zh) 一类时滞线性参数变化离散系统的h∞控制方法
CN106774379A (zh) 一种智能超螺旋强鲁棒姿态控制方法
CN110377034A (zh) 一种基于蜻蜓算法优化的水面船轨迹跟踪全局鲁棒滑模控制方法
King et al. Koopman-based differentiable predictive control for the dynamics-aware economic dispatch problem
CN106842953A (zh) 一种无人直升机自适应低阶控制器
CN105843078A (zh) 滑模控制方法及装置
Oliveira et al. A describing function approach to the design of robust limit-cycle controllers
CN107145690A (zh) 一种舰载直升机自动跟踪舰船运动的控制方法
Hu et al. Application of fuzzy neural network in ship course control
CN110262222A (zh) 一种区间系统最优区间pid控制器参数优化方法
Zhang et al. Application of memetic algorithm in control of linear inverted pendulum

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant