CN110376879B - 一种基于神经网络的pid型迭代学习控制方法 - Google Patents

一种基于神经网络的pid型迭代学习控制方法 Download PDF

Info

Publication number
CN110376879B
CN110376879B CN201910757702.7A CN201910757702A CN110376879B CN 110376879 B CN110376879 B CN 110376879B CN 201910757702 A CN201910757702 A CN 201910757702A CN 110376879 B CN110376879 B CN 110376879B
Authority
CN
China
Prior art keywords
neural network
iterative learning
pid
learning control
controller
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910757702.7A
Other languages
English (en)
Other versions
CN110376879A (zh
Inventor
常明方
吴爱国
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Graduate School Harbin Institute of Technology
Original Assignee
Shenzhen Graduate School Harbin Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Graduate School Harbin Institute of Technology filed Critical Shenzhen Graduate School Harbin Institute of Technology
Priority to CN201910757702.7A priority Critical patent/CN110376879B/zh
Publication of CN110376879A publication Critical patent/CN110376879A/zh
Application granted granted Critical
Publication of CN110376879B publication Critical patent/CN110376879B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B11/00Automatic controllers
    • G05B11/01Automatic controllers electric
    • G05B11/36Automatic controllers electric with provision for obtaining particular characteristics, e.g. proportional, integral, differential
    • G05B11/42Automatic controllers electric with provision for obtaining particular characteristics, e.g. proportional, integral, differential for obtaining a characteristic which is both proportional and time-dependent, e.g. P. I., P. I. D.

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Automation & Control Theory (AREA)
  • Feedback Control In General (AREA)

Abstract

本发明提出了一种基于神经网络的PID型迭代学习控制方法,属于控制科学与工程领域。对于一般的非线性差分系统,作者首先给出了一种迭代学习PID控制器,然后利用三个RBF神经网络对PID控制器中的动态参数
Figure 251705DEST_PATH_IMAGE001
进行拟合。根据梯度下降法对神经网络的权值进行估计并得出神经网络权值更新表达式。由于受控系统的精确模型比较复杂或者是未知的,我们无法求得神经网络权值估计表达式中系统伪偏导数(PPD)的真值,我们用其估计值来进行数值代替。这样就生了一个可以运行的非线性迭代学习控制算法。最后,举例说明了本算法在非线性系统和抓放机器人系统当中的数值仿真是有效的。因此这个算法可应用到一般的(未知的)非线性差分系统当中去。

Description

一种基于神经网络的PID型迭代学习控制方法
技术领域
本发明涉及控制科学与工程领域,尤其涉及一种基于神经网络的PID型迭代学习控制方法。
背景技术
迭代学习是被控系统在有限时间区间不断吸取先前经验进行重复学习的一种控制方法。可以理解为:在被控系统进行第i次操作的时候,控制器把第(i-1)次及其之前的输入(输出)数据和误差利用起来,使被控系统在第i次操作当中获得比较好的执行效果。按照这样的方法不断地进行控制器修正,从而使被控系统走向期望的轨迹。
过去三十年来,迭代学习控制无论是在理论还是在应用方面,都取得了丰富的成果。然而,这些成果主要集中在解决已知模型的线性或者仿射非线性系统的迭代学习控制问题。例如:线性系统作为最基本的系统模型,其迭代学习理论自提出伊始就得到发展和丰富。对于简单的可以重复的连续(或离散)线性时变系统。已经形成了成熟的诸如P型,D型,PI型,PD型,PID型等类型的PID型迭代学习控制律,此外还有比较普遍的高阶学习律,反馈-前馈学习律等。同样,仿射非线性系统也有着成熟的PID型,高阶控制器等类型的迭代学习控制律。此外由于仿射非系统含有了非线性成分,一些文献会采用神经网络,小波逼近等方法来处理迭代学习问题。
而对于一般的非仿射非线性系统或者未知精确模型的非线性系统的迭代学习问题的研究成果,并不是很多。对于已知模型的非仿射非线性系统,主要有简单的P型,反馈-前馈型等迭代学习算法。对于未知模型的,有一些基本的数据驱动方法。因此如何将传统的有良好性能的控制器和数据驱动方法结合起来来完成非线性系统特别是未知的非线性系统的迭代学习控制是我们要解决问题。
发明内容
本发明提供了一种基于神经网络的PID型迭代学习控制方法,包括依次执行如下步骤:
步骤1:建立非线性差分系统的动态线性化模型,并给出其伪偏导数PPD的估计值表达式;
步骤2:建立基于神经网络的PID迭代学习控制器,具体给出神经网络拟合控制器参数kP,i(t),kI,i(t),kD,i(t)的方法以及神经网络权值更新法则;
步骤3:用伪偏导数PPD的估计值来代替神经网络权值更新法则中真实值,设计迭代学习控制方案。
上述一种基于神经网络的PID型迭代学习控制方法的步骤1中,系统的动态线性化和PPD的估计如下:
第一步骤,受控系统的数学模型:
假设所要进行迭代学习控制的受控系统具有如下非线性差分方程模型:
yi(t+1)=f(yi(t),yi(t-1),…,yi(t-ny),ui(t),ui(t-1),…,ui(t-nu)) (1)
其中,ui(t)和yi(t)分别是第i次迭代和第t个采样时刻的输入和输出信号;i∈I[1,+∞),t∈I[1,T];nu,ny是两个未知的正整数;f(…)是未知非线性标量函数;
对于公式(1)的SISO非线性系统,在提出其紧格式动态线性化模型之前,以下两个假设是必需的:
假设1 f(…)关于(它所包含的输入输出)各个变量的偏导数是连续的;
假设2系统沿着迭代轴方向满足Lipschitz条件,即对于t∈I[1,T],i∈I[1,+∞),若|Δui(t)|≠0,则下式成立:
|Δyi(t+1)|≤b|Δui(t)| (2)
其中,Δyi(t+1)=yi(t+1)-yi-1(t+1),Δui(t)=ui(t)-ui-1(t),b>0是个常数;
第二步骤,对受控系统的数学模型进行动态线性化;
对于受控系统(1),如果假设1和假设2成立,则系统可以转化为如下动态线性化形式:
Figure BDA0002169273890000031
其中,
Figure BDA0002169273890000032
是一个时变参数向量且满足
Figure BDA0002169273890000033
第三步骤,对
Figure BDA0002169273890000034
的估计:
为了能够估计系统的
Figure BDA0002169273890000035
提出以下准则函数:
Figure BDA0002169273890000036
根据梯度下降法,能够得到
Figure BDA0002169273890000041
的如下估计表达式
Figure BDA0002169273890000042
其中,μ是步长因子,并且对于t∈I[1,T],初值
Figure BDA0002169273890000043
有界并且给定。
上述一种基于神经网络的PID型迭代学习控制方法的步骤2中,RBF神经网络拟合PID控制器参数和神经网络的权值更新的过程如下:
第一步骤,动态PID控制器的形式:
不失一般性,我们定义在系统运行的过程当中第i次迭代第t时刻的跟踪误差为
ei(t)=yd(t)-yi(t)
其中yd(t)是t时刻的期望轨迹;
对于如下一般形式的PID型控制器:
Figure BDA0002169273890000044
其中,kP,i(t),kI,i(t),kD,i(t)分别是控制器的比例单元,积分单元,微分单元的动态参数;在实际应用当中选用参数kP,i(t),kI,i(t)和kD,i(t)的估计值
Figure BDA0002169273890000045
Figure BDA0002169273890000046
Figure BDA0002169273890000047
来进行控制器设计,即选用如下形式控制器:
Figure BDA0002169273890000048
第二步骤,用神经网络来拟合控制器的动态增益
Figure BDA0002169273890000049
Figure BDA00021692738900000410
选用3个RBF神经网络来分别对动态参数
Figure BDA00021692738900000411
Figure BDA00021692738900000412
进行拟合,每个神经网络都是一个多输入单输出的三层结构,并且中间层均含有m个结点,能够得到如下参数拟合表达式:
Figure BDA0002169273890000051
Figure BDA0002169273890000052
Figure BDA0002169273890000053
其中
wP,i(t)=[wP1,i(t) wP2,i(t) … wPm,i(t)]T
wI,i(t)=[wI1,i(t) wI2,i(t) … wIm,i(t)]T
wD,i(t)=[wD1,i(t) wD2,i(t) … wDm,i(t)]T
是神经网络的权值向量;
hP1,i(ZS,i(t))=[hP1,i(zS,i(t)) hP2,i(zS,i(t)) … hPm,i(zS,i(t))]T
hI1,i(ZS,i(t))=[hI1,i(zS,i(t)) hI2,i(zS,i(t)) … hIm,i(zS,i(t))]T
hD,i(ZS,i(t))=[hD1,i(zS,i(t)) hD2,i(zS,i(t)) … hDm,i(zS,i(t))]T
是隐藏层径向基函数组成的向量,其中向量
Figure BDA0002169273890000054
是神经网络的输入;
第三步骤,求取神经网络权值wP,i(t),wI,i(t)和wD,i(t)的更新法则:
引入能量函数
Figure BDA0002169273890000055
根据梯度下降法求得神经网络wP,i(t),wI,i(t)和wD,i(t)的更新法则公式为:
Figure BDA0002169273890000056
Figure BDA0002169273890000061
Figure BDA0002169273890000062
其中,ηP,ηI,ηD>0为设定的学习因子。
上述一种基于神经网络的PID型迭代学习控制方法的步骤3中,实际运行的神经网络更新法则和迭代学习控制方案如下:
第一步骤:为保证神经网络权值更新程序能够运行,用步骤2第三步骤中PPD的估计值
Figure BDA0002169273890000063
来代替神经网络权值更新法则(11),(12)和(13)中的真实值
Figure BDA0002169273890000064
能得神经网络权重更新法则公式如下:
Figure BDA0002169273890000065
Figure BDA0002169273890000066
Figure BDA0002169273890000067
第二步骤,迭代学习控制方案包括:
步骤s1:首先设定神经网络的结构,给出隐藏层节点m的值,给出神经网络的中心和宽度以及第1次迭代时t∈I[1,T]的初始输入;给出其中的动态参数wP,1(t),wI,1(t),wD,1(t),t∈I[1,T]的初始值;给定系统的初始输入u1(t),t∈I[1,T]的值;给出其中的动态参数
Figure BDA0002169273890000068
t∈I[1,T]的初始值;选择步长因子和学习因子μ,ηP,ηI,ηD的值;设置受控系统的初始值即对于i∈I[1,+∞),每次运行时在t=1时刻均有yi(1)=yd(1);
步骤s2:为了使系统能够接近期望轨迹,需要对运动过程当中的参数
Figure BDA0002169273890000072
wP,i(t),wI,i(t),wD,i(t),i∈I[1,+∞),t∈I[1,T]值进行数值限制;
步骤s3:根据初值和参数值的设置使受控系统按照如下顺序运行:
Figure BDA0002169273890000071
步骤s4:重复执行步骤s1-s3的操作,直到本发明的PID型迭代学习控制方法取得良好的控制效果。
作为本发明的进一步实施,该PID型迭代学习控制方法还包括执行以下步骤:
步骤4:将步骤3所得到迭代学习控制方案应用到非线性系统数学模型和抓放机器人系统模型的控制中。
本发明的有益效果是:本发明提出的基于神经网络的PID型迭代学习控制方法,有效的把神经网络、PID控制器、系统的动态线性化技术结合起来解决非线性系统的迭代学习控制问题。其中,神经网络的强大的逼近能力使得迭代学习跟踪效果达到了良好的精度;PID控制器由此也被推广到一般的(未知的)非线性系统的迭代学习控制当中;系统的动态化模型的应用达到了从数据模型分析控制系统的效果。仿真研究验证了这种方案的有效性,并且实现了高效的迭代学习跟踪。
附图说明
图1是本发明实施例1对于非仿射非线性系统的最大跟踪误差曲线图;
图2是本发明实施例2的抓放机器人模型图;
图3是本发明实施例2对于抓放机器人模型的速度实行迭代学习控制时的最大跟踪误差曲线图。
具体实施方式
下面结合两个实施用例对本发明做进一步说明:
实施例1:
考虑如下系统:
Figure BDA0002169273890000081
显然,这是一个非仿射非线性系统。迭代学习任务当中期望的输出轨迹为:
yd(t)=0.5×(-1)round(t/10) t∈I[1,100]
我们采用本发明中所提出的迭代学习方案公式(17)对该系统进行控制,现在我们对神经网络的结构和参数的初值进行预先的设置。用来估计PID控制器增益的3个神经网络均采用带有3个节点的隐藏层,并且这3个神经网络的输入均为:
Figure BDA0002169273890000082
对于所有的i∈I[1,+∞),t∈I[1,T],我们设定神经网络的径向基函数中心均为[0 0 0]T,宽度均为100;对于所有的t∈I[1,T],第1次迭代神经网络的输入设定为zS,1(t)=[0 0 0]T。第1次迭代的权值为wP,1(t)=[0.2 0 0]T,wI,1(t)=[0 0 0]T,wD,1(t)=[0 00]T;对于所有的t∈I[1,T],第1次迭代系统的初始输入为u1(t)=0;对于所有的t∈I[1,T],第1次迭代系统的伪偏导数的初始值为
Figure BDA0002169273890000091
对于所有的i∈I[1,+∞),系统在时刻t=1的输出yi(1)=yd(1);伪偏导数PPD的估计值
Figure BDA0002169273890000092
表达式中步长因子选择为μ=0.05,神经网络权值学习因子选择为ηP=ηI=ηD=0.0001。
以每次迭代的最大误差
Figure BDA0002169273890000093
作为考量标准,图1给出100次迭代过程当中ei,max的仿真曲线,可以看出被控系统每次迭代的最大误差呈现出逐渐减小趋势,迭代学习控制取得了良好的效果。
实施例2:
如图2是一个抓放机器人模型(参考非专利文献2:Liu N.Learningidentification and control for repetitive linear time-varying systems[D].University of Illinois at Urbana-Champaign,2014.),对于机械臂的转角θ,我们取状态变量x1=θ和
Figure BDA0002169273890000094
并且以角速度为系统输出,可以得到如下二阶线性数学模型:
Figure BDA0002169273890000095
其中β=2Nm/rad是粘性摩擦系数,Kt=100是执行器增益,M(t)是时变的机械臂底端的质量,L=0.1m是机械臂的长度。在机械臂抓放过程当中,重物在第5秒被抓取,第10秒被放下。M(t)的质量也从1kg变到了10kg,然后又变回1kg。
取采样时间Ts=0.01s,在时间区间[1,10]内离散化模型(19)可以得到如下切换系统:
Figure BDA0002169273890000101
设定迭代学习任务当中期望的输出轨迹为:
yd(t)=2sin(πt/1000) t∈I[1,1000]
我们采用本章所提出的迭代学习方案(17)对该系统进行控制。现在我们对神经网络的结构和参数的初值进行预先的设置。用来估计PID控制器增益的3个神经网络均采用带有3个节点的隐藏层,并且这3个神经网络的输入均为:
Figure BDA0002169273890000102
对于所有的i∈I[1,+∞),t∈I[1,T],我们设定神经网络的径向基函数中心均为[0 0 0]T,宽度均为20000;对于所有的t∈I[1,T],第1次迭代神经网络的输入设定为zS,1(t)=[0 0 0]T,第1次迭代的权值为wP,1(t)=[0.01 0 0]T,wI,1(t)=[0 0 0]T,wD,1(t)=[00 0]T;对于所有的t∈I[1,T],第1次迭代系统的初始输入为u1(t)=0;对于所有的t∈I[1,T],第1次迭代系统的伪偏导数的初始值为
Figure BDA0002169273890000103
对于所有的i∈I[1,+∞),系统在时刻t=1的输出yi(1)=yd(1);伪偏导数PPD的估计值
Figure BDA0002169273890000104
表达式中步长因子选择为μ=0.01,神经网络权值学习因子选择为ηP=ηI=ηD=0.00001。
同样以每次迭代的最大误差
Figure BDA0002169273890000105
作为考量标准,图3给出50次迭代过程当中ei,max的仿真曲线,可以看出被控系统每次迭代的最大误差呈现出逐渐减小趋势,迭代学习控制取得了良好的效果。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。

Claims (3)

1.一种基于神经网络的PID型迭代学习控制方法,其特征在于,包括依次执行如下步骤:
步骤1:建立非线性差分系统的动态线性化模型,并给出其伪偏导数PPD的估计值表达式;
步骤2:建立基于神经网络的PID迭代学习控制器,具体给出神经网络拟合控制器参数kP,i(t),kI,i(t),kD,i(t)的方法以及神经网络权值更新法则;
步骤3:用伪偏导数PPD的估计值来代替神经网络权值更新法则中真实值,设计迭代学习控制方案;
所述步骤2中,RBF神经网络拟合PID控制器参数和神经网络的权值更新的过程如下:
第一步骤,动态PID控制器的形式:
不失一般性,我们定义在系统运行的过程当中第i次迭代第t时刻的跟踪误差为
ei(t)=yd(t)-yi(t)
其中yd(t)是t时刻的期望轨迹;
对于如下一般形式的PID型控制器:
Figure FDA0003522788130000011
其中,kP,i(t),kI,i(t),kD,i(t)分别是控制器的比例单元,积分单元,微分单元的动态参数;在实际应用当中选用参数kP,i(t),kI,i(t)和kD,i(t)的估计值
Figure FDA0003522788130000014
Figure FDA0003522788130000012
Figure FDA0003522788130000013
来进行控制器设计,即选用如下形式控制器:
Figure FDA0003522788130000021
第二步骤,用神经网络来拟合控制器的动态增益
Figure FDA0003522788130000022
Figure FDA0003522788130000023
选用3个RBF神经网络来分别对动态参数
Figure FDA0003522788130000024
Figure FDA0003522788130000025
进行拟合,每个神经网络都是一个多输入单输出的三层结构,并且中间层均含有m个结点,能够得到如下参数拟合表达式:
Figure FDA0003522788130000026
Figure FDA0003522788130000027
Figure FDA0003522788130000028
其中
wP,i(t)=[wP1,i(t) wP2,i(t)…wPm,i(t)]T
wI,i(t)=[wI1,i(t) wI2,i(t)…wIm,i(t)]T
wD,i(t)=[wD1,i(t) wD2,i(t)…wDm,i(t)]T
是神经网络的权值向量;
hP1,i(ZS,i(t))=[hP1,i(zS,i(t)) hP2,i(zS,i(t))…hPm,i(zS,i(t))]T
hI1,i(ZS,i(t))=[hI1,i(zS,i(t)) hI2,i(zS,i(t))…hIm,i(zS,i(t))]T
hD,i(ZS,i(t))=[hD1,i(zS,i(t)) hD2,i(zS,i(t))…hDm,i(zS,i(t))]T
是隐藏层径向基函数组成的向量,其中向量
Figure FDA0003522788130000029
是神经网络的输入;
第三步骤,求取神经网络权值wP,i(t),wI,i(t)和wD,i(t)的更新法则:
引入能量函数
Figure FDA0003522788130000031
根据梯度下降法求得神经网络wP,i(t),wI,i(t)和wD,i(t)的更新法则公式为:
Figure FDA0003522788130000032
Figure FDA0003522788130000033
Figure FDA0003522788130000034
其中,ηP,ηI,ηD>0为设定的学习因子;
所述步骤3中,实际运行的神经网络更新法则和迭代学习控制方案如下:
第一步骤:为保证神经网络权值更新程序能够运行,用步骤2第三步骤中PPD的估计值
Figure FDA0003522788130000035
来代替神经网络权值更新法则(11),(12)和(13)中的真实值
Figure FDA0003522788130000036
能得神经网络权重更新法则公式如下:
Figure FDA0003522788130000037
Figure FDA0003522788130000038
Figure FDA0003522788130000039
第二步骤,迭代学习控制方案包括:
步骤s1:首先设定神经网络的结构,给出隐藏层节点m的值,给出神经网络的中心和宽度以及第1次迭代时t∈I[1,T]的初始输入;给出其中的动态参数wP,1(t),wI,1(t),wD,1(t),t∈I[1,T]的初始值;给定系统的初始输入u1(t),t∈I[1,T]的值;给出其中的动态参数
Figure FDA0003522788130000041
t∈I[1,T]的初始值;选择步长因子和学习因子μ,ηP,ηI,ηD的值;设置受控系统的初始值即对于i∈I[1,+∞),每次运行时在t=1时刻均有yi(1)=yd(1);
步骤s2:为了使系统能够接近期望轨迹,需要对运动过程当中的参数
Figure FDA0003522788130000042
wP,i(t),wI,i(t),wD,i(t),i∈I[1,+∞),t∈I[1,T]值进行数值限制;
步骤s3:根据初值和参数值的设置使受控系统按照如下顺序运行:
Figure FDA0003522788130000043
步骤s4:重复执行步骤s1-s3的操作,直到所述PID型迭代学习控制方法取得良好的控制效果。
2.根据权利要求1所述的PID型迭代学习控制方法,其特征在于,所述步骤1中,系统的动态线性化和PPD的估计如下:
第一步骤,受控系统的数学模型:
假设所要进行迭代学习控制的受控系统具有如下非线性差分方程模型:
yi(t+1)=f(yi(t),yi(t-1),…,yi(t-ny),ui(t),ui(t-1),…,ui(t-nu)) (1)
其中,ui(t)和yi(t)分别是第i次迭代和第t个采样时刻的输入和输出信号;i∈I[1,+∞),t∈I[1,T];nu,ny是两个未知的正整数;f(…)是未知非线性标量函数;
对于公式(1)的SISO非线性系统,在提出其紧格式动态线性化模型之前,以下两个假设是必需的:
假设1f(…)关于它所包含的输入输出各个变量的偏导数是连续的;
假设2系统沿着迭代轴方向满足Lipschitz条件,即对于t∈I[1,T],i∈I[1,+∞),若|Δui(t)|≠0,则下式成立:
|Δyi(t+1)|≤b|Δui(t)| (2)
其中,Δyi(t+1)=yi(t+1)-yi-1(t+1),Δui(t)=ui(t)-ui-1(t),b>0是个常数;
第二步骤,对受控系统的数学模型进行动态线性化;
对于受控系统(1),如果假设1和假设2成立,则系统可以转化为如下动态线性化形式:
Figure FDA0003522788130000051
其中,
Figure FDA0003522788130000052
是一个时变参数向量且满足
Figure FDA0003522788130000053
第三步骤,对
Figure FDA0003522788130000054
的估计:
为了能够估计系统的
Figure FDA0003522788130000055
提出以下准则函数:
Figure FDA0003522788130000056
根据梯度下降法,能够得到
Figure FDA0003522788130000057
的如下估计表达式
Figure FDA0003522788130000058
其中,μ是步长因子,并且对于t∈I[1,T],初值
Figure FDA0003522788130000061
有界并且给定。
3.根据权利要求1至2任一项所述的PID型迭代学习控制方法,其特征在于,该PID型迭代学习控制方法还包括执行以下步骤:
步骤4:将步骤3所得到迭代学习控制方案应用到非线性系统数学模型中。
CN201910757702.7A 2019-08-16 2019-08-16 一种基于神经网络的pid型迭代学习控制方法 Active CN110376879B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910757702.7A CN110376879B (zh) 2019-08-16 2019-08-16 一种基于神经网络的pid型迭代学习控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910757702.7A CN110376879B (zh) 2019-08-16 2019-08-16 一种基于神经网络的pid型迭代学习控制方法

Publications (2)

Publication Number Publication Date
CN110376879A CN110376879A (zh) 2019-10-25
CN110376879B true CN110376879B (zh) 2022-05-10

Family

ID=68259586

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910757702.7A Active CN110376879B (zh) 2019-08-16 2019-08-16 一种基于神经网络的pid型迭代学习控制方法

Country Status (1)

Country Link
CN (1) CN110376879B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110716499B (zh) * 2019-10-30 2022-03-08 南京航空航天大学 基于单神经元pid和迭代学习前馈的数控折弯机运动复合控制方法
CN111200378B (zh) * 2020-02-13 2021-04-20 广州大学 一种基于迭代学习的压电电机节能控制方法
CN111399374B (zh) * 2020-02-27 2021-01-19 哈尔滨工业大学 基于rbf神经网络的线性输出调节跟踪控制方法及系统
CN113093521A (zh) * 2021-03-19 2021-07-09 江苏固德威电源科技股份有限公司 一种动态pid控制方法和一种动态pid控制器
CN113296393A (zh) * 2021-05-27 2021-08-24 安徽工业大学 基于自调整模糊迭代学习的二连杆机械臂控制方法、装置及介质
CN114063438B (zh) * 2021-11-12 2023-09-22 辽宁石油化工大学 一种数据驱动的多智能体系统pid控制协议自学习方法
CN114488818B (zh) * 2022-01-28 2023-09-29 青岛科技大学 一种pid控制系统的设定点迭代学习优化方法
CN114815618B (zh) * 2022-04-29 2023-05-16 哈尔滨工业大学 一种基于动态增益的自适应神经网络跟踪控制方法
CN116619383B (zh) * 2023-06-21 2024-02-20 山东大学 基于确定学习的机械臂pid控制方法及系统

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101968629A (zh) * 2010-10-19 2011-02-09 天津理工大学 基于rbf辨识的弹性积分bp神经网络的pid控制方法
CN102662322B (zh) * 2012-04-10 2014-06-04 西华大学 一种fpga处理器及pid膜优化神经网络控制器
CN106959613A (zh) * 2017-04-12 2017-07-18 哈尔滨工业大学深圳研究生院 Siso系统基于最近更新信息的动态线性化自适应控制律算法
CN107490963A (zh) * 2017-08-16 2017-12-19 哈尔滨工业大学深圳研究生院 基于最新估计的动态线性化自适应滑模控制方法
CN107579689A (zh) * 2017-08-28 2018-01-12 南京理工大学 一种基于pid神经网络控制器的超高速永磁同步电机转速控制方法
CN108008627B (zh) * 2017-12-13 2022-10-28 中国石油大学(华东) 一种并行优化的强化学习自适应pid控制方法
CN108873705A (zh) * 2018-07-19 2018-11-23 杭州电子科技大学 一种基于非线性pid的hh神经元同步控制方法
CN109162813B (zh) * 2018-10-09 2019-10-11 南京航空航天大学 一种基于迭代学习修正的航空发动机智能转速控制方法
CN109255498A (zh) * 2018-10-22 2019-01-22 新智数字科技有限公司 基于神经网络的负荷预测方法及装置
CN109640024B (zh) * 2018-12-21 2023-06-23 哈尔滨工业大学(深圳) 基于伪随机数的三维抖动显示装置与方法
CN109839824A (zh) * 2019-01-24 2019-06-04 青岛理工大学 一种基于预测控制的网络控制系统时延补偿方法
CN109597449A (zh) * 2019-01-30 2019-04-09 杭州庆睿科技有限公司 一种基于神经网络的超声波分散仪温度控制方法

Also Published As

Publication number Publication date
CN110376879A (zh) 2019-10-25

Similar Documents

Publication Publication Date Title
CN110376879B (zh) 一种基于神经网络的pid型迭代学习控制方法
Huang et al. Event-triggered adaptive finite-time tracking control for full state constraints nonlinear systems with parameter uncertainties and given transient performance
CN110376901B (zh) 一种基于动态控制器的迭代学习控制方法
Lee et al. Precise tracking control of shape memory alloy actuator systems using hyperbolic tangential sliding mode control with time delay estimation
CN113110059B (zh) 基于事件触发的单连杆机械臂系统实际跟踪的控制方法
Lee et al. Experimental implementation of nonlinear TORA system and adaptive backstepping controller design
Lin et al. A robust self-learning PID control system design for nonlinear systems using a particle swarm optimization algorithm
Hsu A self-evolving functional-linked wavelet neural network for control applications
Van Kien et al. Adaptive fuzzy sliding mode control for nonlinear uncertain SISO system optimized by differential evolution algorithm
Hsu et al. Intelligent nonsingular terminal sliding-mode control via perturbed fuzzy neural network
Kumar et al. Lyapunov stability-based control and identification of nonlinear dynamical systems using adaptive dynamic programming
Fujinaka et al. Stabilization of double inverted pendulum with self-tuning neuro-PID
Choi et al. Filter-driven-approximation-based control for a class of pure-feedback systems with unknown nonlinearities by state and output feedback
Xing et al. State-estimator-based robust vibration control of crane bridge system with trolley via PDE model
Yoo Low-complexity robust tracking of high-order nonlinear systems with application to underactuated mechanical dynamics
Chen et al. Recurrent wavelet neural backstepping controller design with a smooth compensator
Yu et al. Fault tolerant control for near space vehicles with input saturation using disturbance observer and neural networks
CN113459083B (zh) 一种事件触发下的机械臂自适应固定时间控制方法及系统
Kim et al. Reinforcement adaptive learning neural network based friction compensation for high speed and precision
Nath et al. Design of neural network based sliding mode controller for a class of nonlinear system: an event-triggered framework
Deb et al. NN-based high-order adaptive compensation framework for signal dependencies
Szulc et al. A framework for reinforcement learning with autocorrelated actions
Emami et al. Systematic design and analysis of fuzzy-logic control and application to robotics: Part II. Control
Chen et al. Neural network compensator-based robust iterative learning control scheme for mobile robots nonlinear systems with disturbances and uncertain parameters
Moghaddam et al. Constrained sliding mode control of nonlinear fractional order input affine systems

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant