CN111399375A - 一种基于非线性系统的神经网络预测控制器 - Google Patents
一种基于非线性系统的神经网络预测控制器 Download PDFInfo
- Publication number
- CN111399375A CN111399375A CN202010143312.3A CN202010143312A CN111399375A CN 111399375 A CN111399375 A CN 111399375A CN 202010143312 A CN202010143312 A CN 202010143312A CN 111399375 A CN111399375 A CN 111399375A
- Authority
- CN
- China
- Prior art keywords
- neural network
- output
- input
- prediction
- nonlinear system
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 85
- 238000005457 optimization Methods 0.000 claims abstract description 23
- 238000012937 correction Methods 0.000 claims abstract description 15
- 238000005096 rolling process Methods 0.000 claims abstract description 14
- 239000013598 vector Substances 0.000 claims description 38
- 238000000034 method Methods 0.000 claims description 34
- 230000006870 function Effects 0.000 claims description 31
- 238000004422 calculation algorithm Methods 0.000 claims description 19
- 210000002569 neuron Anatomy 0.000 claims description 19
- 230000008569 process Effects 0.000 claims description 17
- 239000011159 matrix material Substances 0.000 claims description 13
- 238000003062 neural network model Methods 0.000 claims description 12
- 238000005070 sampling Methods 0.000 claims description 11
- 230000004913 activation Effects 0.000 claims description 7
- 238000013507 mapping Methods 0.000 claims description 4
- 238000005259 measurement Methods 0.000 claims description 3
- URWAJWIAIPFPJE-YFMIWBNJSA-N sisomycin Chemical compound O1C[C@@](O)(C)[C@H](NC)[C@@H](O)[C@H]1O[C@@H]1[C@@H](O)[C@H](O[C@@H]2[C@@H](CC=C(CN)O2)N)[C@@H](N)C[C@H]1N URWAJWIAIPFPJE-YFMIWBNJSA-N 0.000 description 11
- 230000014509 gene expression Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 5
- 238000002474 experimental method Methods 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 238000011160 research Methods 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 210000004205 output neuron Anatomy 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000005094 computer simulation Methods 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 238000005312 nonlinear dynamic Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/04—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
- G05B13/042—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Feedback Control In General (AREA)
Abstract
本发明涉及一种基于非线性系统的神经网络预测控制器,属于非线性系统控制技术领域。该控制器包括预测模型、滚动优化以及反馈校正三部分,其实现方法:首先,选用神经网络对非线性系统的动态过程进行建模,通过调节神经网络的权值阈值来逼近该非线性系统的动态过程;然后,通过智能控制中的预测控制方法,基于建立的神经网络预测模型来实现预测控制,采用Levenberg‑Marquardt算法来滚动优化,以提高算法的实时性,由逆神经网络完成算法的初始值选取;根据实际测量输出与预测输出的比较实现反馈校正。本发明提高了控制精度,且极大地减少了计算复杂度,能在保证控制性能的前提下有效提高控制器的实时性。
Description
技术领域
本发明属于非线性系统控制技术领域,涉及一种基于非线性系统的神经网络预测控制器。
背景技术
在工业控制领域中,控制系统一般都是非线性系统,为了实现对系统的精确控制,必须拥有精准的系统模型。对于非线性程度较弱的系统,以往的研究常采用泰勒展开式、雅克比、最小二乘法以及傅里叶级数等方法将非线性系统近似线性化处理,具有较好的线性预测控制效果。但对于强非线性系统,线性模型往往难以描述其复杂的动态过程,进而造成线性预测控制难以应用。为了克服这些困难,越来越多的研究开始转向非线性模型预测控制。
非线性预测模型的优点是对非线性系统建模精度较高,能够充分逼近非线性动态过程,但是也带来了非线性优化的问题,非线性优化一般都是复杂而耗时的,所以目前非线性预测控制仍是算法领域研究的热点。
与其他控制算法相比,模型预测控制(MPC)对模型的精度要求不高,建模过程可通过简单的实验来完成;采用滚动优化策略,而非全局一次优化,能及时弥补由于模型失配、畸变、干扰等因素引起的不确定性,动态性能较好;正是以上的优点使得MPC被广泛应用于工业控制领域中,但从应用的对象来看,主要还限于线性系统动态过程,非线性系统建模仍存在建模不精确的问题。这使得其成为对非线性系统建立预测模型和优化控制的关键技术之一。
发明内容
有鉴于此,本发明的目的在于提供一种适用于非线性系统的神经网络预测控制器,解决非线性系统的精确建模问题,以及在保证控制器控制性能的前提下提高控制器的实时性,实现非线性系统对参考轨迹的跟踪控制任务。
为达到上述目的,本发明提供如下技术方案:
一种基于非线性系统的神经网络预测控制器,选用神经网络(神经网络能够充分逼近复杂的非线性映射关系,能够学习与适应不确定系统的动态特性,具有较强的鲁棒性、容错性特点)对非线性系统的动态过程进行建模,通过调节神经网络的权值阈值来逼近该非线性过程;通过智能控制中的预测控制方法,基于建立的神经网络模型来实现预测控制,滚动优化采用Levenberg-Marquardt算法以提高算法的实时性,算法的初始值选取由逆神经网络完成;根据实际测量输出与预测输出的比较实现反馈校正。
该控制器包括预测模型、滚动优化以及反馈校正三部分,其实现方法:首先,选用神经网络对非线性系统的动态过程进行建模,通过调节神经网络的权值阈值来逼近该非线性系统的动态过程;然后,通过智能控制中的预测控制方法,基于建立的神经网络预测模型来实现预测控制,采用Levenberg-Marquardt算法来滚动优化,以提高算法的实时性,由逆神经网络完成算法的初始值选取;根据实际测量输出与预测输出的比较实现反馈校正;具体步骤包括:
S1:初始化系统参数;
S2:得到反馈校正参考输入值;
S3:运用逆神经网络求解初始值;
S4:根据Levenberg-Marquardt迭代公式求解最优控制量;
S5:将得到的最优控制量用于非线性系统进行控制。
进一步,所述预测模型包含神经网络预测模型及逆神经网络模型两个神经网络结构,由输入层、隐含层及输出层组成;
输入层包括:输入向量、输入权值矩阵和输入层偏置向量;
隐含层包括:神经元激活函数,均采用sigmoid函数:h1(t)=1/1+e-t;
输出层包括:输出向量、输出权值矩阵和输出层偏置向量;输出层的神经元激活函数采用purelin函数:h2(t)=at+b2。
进一步,非线性系统的动态过程用离散非线性方程可表示为:
y(k+1)=f[y(k),y(k-1),…,y(k-ny+1),u(k),u(k-1),…,u(k-nu+1)] (1)
其中,[u(k),y(k)]表示在时刻k和nu≤ny上单输入单输出系统的输入输出样本数据对;y(k+1),y(k),…,y(k-ny+1)分别表示非线性系统的在第k+1,k,…,k-ny+1时刻的输出值;ny,nu分别表示输入输出的延迟阶数,根据系统设定或者实验方法测得;函数f表示一个未知的非线性映射关系。
首先,将ρ=[u(k),u(k-1),…,u(k-nu+1),y(k),y(k-1),…,y(k-ny+1)]作为神经网络的输入,将y(k+1)作为神经网络的输出,只需根据以上测量的数值训练神经网络,就可以确定神经网络的权值阈值,从而确定一个神经网络能够无限逼近非线性系统的动态特性。在第k时刻,u(k),u(k-1),…,u(k-nu+1),y(k),y(k-1),…,y(k-ny+1)都是已知数据。因此,给定一个控制量u(k),利用神经网络即可算出下一时刻的系统输出值。如此反复,训练好的神经网络即可得到非线性系统未来任意时刻的预测输出值。
其次,在保证控制性能前提下,为减少计算复杂度提高控制器实时性,技术上可以采用MPC中滚动优化的方法,优化的目标函数确定为:
其中,yp(k+i)表示由神经网络模型预测的k+1时刻的输出值,yr`(k+i)表示经校正后外部输入的参考输出值;yr`(k+i)-yp(k+i)的值越小,控制性能就越好;u(k+i)-u(k+i-1)能提高系统的稳定性,有效克服系统的稳态偏差。
在求解最优控制量时,为保证控制系统的实时性,这里采用Levenberg-Marquardt优化算法,其迭代公式为:
u(k)l+1=u(k)l-(Ja Τ(k)Ja(k)+δI)-1Ja Τ(k)e(k) (3)
考虑预测步数d=3,可知(3)式的雅可比矩阵Ja为:
在迭代过程中,需要设定一个初始值。最为理想的方案是选取具有最优控制性能的控制量为初始值,可以有效的避免算法落入其它极小值,从而保证系统的控制性能;为此,可以采用一个逆神经网络来实现,非线性系统的逆动态方程可表示为:
ur(k)=g[u(k-1),…,u(k-nu+1),y(k),y(k-1),…,y(k-ny+1)] (4)
最后,利用预测输出值与实际输出值的误差来实现系统的反馈校正,设k时刻的误差ξ=y(k)-yp(k),k时刻的外部参考输入为yr(k+1),则校正后的参考输入为:
yr`(k+1)=yr(k+1)+σ(y(k)-yp(k)) (5)
本发明的有益效果在于:1)与非线性系统近似线性化处理相比较,本发明利用神经网络建模具有更高的精度,对非线性系统的动态过程逼近效果好,也使得基于此模型的预测控制具有更好的控制性能;2)与Newton算法相比,本发明采用的Levenberg-Marquardt优化算法不需要计算目标函数的Hessian矩阵,极大地减少了计算复杂度,能在保证控制性能的前提下有效提高控制器的实时性;3)本发明不局限于SISO系统,也同样适用于MIMO系统,并实现非线性系统对参考轨迹的实时跟踪控制任务。
本发明的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述,并且在某种程度上,基于对下文的考察研究对本领域技术人员而言将是显而易见的,或者可以从本发明的实践中得到教导。本发明的目标和其他优点可以通过下面的说明书来实现和获得。
附图说明
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作优选的详细描述,其中:
图1为实施例一中采用的SISO系统神经网络结构图;
图2为实施例一中SISO系统的控制器结构图;
图3为实施例一中SISO系统的控制器工作流程图;
图4为实施例二中Khepera IV移动机器人实验平台;
图5为简化的Khepera IV移动机器人系统图;
图6为基于移动机器人系统的神经网络结构图;
图7为移动机器人轨迹跟踪控制器原理图。
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需要说明的是,以下实施例中所提供的图示仅以示意方式说明本发明的基本构想,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
请参阅图1~图7,为了验证本发明所述神经网络预测控制器的控制性能,下面将利用SISO非线性系统和MIMO非线性系统的两个控制案例作详细说明。
实施例一:选择典型的SISO非线性系统为例,用神经网络去逼近SISO非线性系统,利用本发明所述的控制器去跟踪一个预先给定的参考曲线,通过仿真验证了该控制器的实用效果。以下是对整个控制器控制过程的详细说明:
1)神经网络建模部分
SISO非线性系统为:
y(k)=u(k-1)3+y(k-1)/[1+y(k-1)]2 (6)
参照图1神经网络结构图,输入量为非线性系统历史时刻的输出值及输入值,为了训练神经网络,本发明在控制量的允许值范围内随机产生1000个数据,代入非线性系统可得1000个输出数据。选取前900个样本数据对[y(1),y(2),…,y(900),u(1),u(2),…,u(900)]作为神经网络的样本去训练神经网络,可以得到神经网络对应的权值阈值以及系统辨识延迟阶数ny,nu。相对应的剩下的100个样本数据对作为测试样本去测试神经网络的逼近效果。本实施例采用matlab的newff函数来训练神经网络,隐含层神经元选取为20,训练次数设置为10000,训练目标设置为1e∧(-7),学习率设置为0.1,动量因子为函数默认值。
在训练好的神经网络结构中,第k采样时刻的输入向量为:
ρ(k)=[u(k),u(k-1),…,u(k-nu+1),y(k),y(k-1),…,y(k-ny+1)] (7)
由图1可知,IW是输入层连接隐含层神经元的权值,b1则是输入阈值;LW是隐含层神经元连接输出层的权值,b2则是输出阈值;L1(k)和L2(k)分别为隐含层神经元的输入向量与输出神经元的输入向量。
隐含层神经元的输入向量为:
L1(k)=IW×ρ(k)+b1 (8)
神经元激活函数使用的是sigmoid函数:h1(t)=1/(1+e-t)。因此,隐含层神经元的输出可表示为:
根据(7)-(9)式,可以得到k+1时刻的预测输出表达式为:
yp(k+1)=LW×h1(IW×ρ(k)+b1)+b2 (10)
在第k+1采样时刻,要求解k+2时刻的预测输出,只需更新(7)式输入向量为:
ρ(k+1)=[u(k+1),u(k),…,u(k-nu+2),yp(k+1),y(k),…,y(k-ny+2)] (11)
对比更新前后的输入向量,不难发现输入向量中u(k-nu+1)→u(k-nu+2),…,u(k)→u(k+1)与y(k-ny+1)→y(k-ny+2),…,y(k)→yp(k+1)分别丢弃了u(k-nu+1)与y(k-ny+1)最早时刻的输入输出值;以此类推,每次预测的输入向量维数不变,d=3表示预测步数,理论上可以得到未来任何时刻的预测输出值。
与神经网络模型结构相对应,逆神经网络模型结构参照图1,在第k时刻,只需要将网络输入向量替换为:
逆神经网络采用的神经元激活函数也是sigmoid函数:h1(t)=1/(1+e-t);通过逆神经网络可得到预测模型的输出表达式为:
其中,IW1表示输入层连接隐含层神经元的权值,则表示输入阈值;LW1表示隐含层神经元连接输出层的权值,则表示输出阈值;如果要求解第k+1时刻的逆神经网络输出值ur(k+1),只需要更新逆神经网络的输入向量,更新方式与神经网络(11)式类似,每次的输入向量维数不变,同时丢弃较早时刻的输入值和期望输出值即可。
2)模型预测控制求解最优控制量
参照图2控制器结构,在第k采样时刻,非线性系统实际输出为y(k),预测输出yp(k),根据(5)式校正参考输入值;控制器调用逆神经网络模型,根据公式(13)可求解迭代初始值,然后利用Levenberg-Marquardt优化算法,根据(3)式中的迭代公式可以求解得到最优控制量u*(k);考虑是单输入单输出系统,可以将(2)式转化为以下形式:
这时候,(2)式中的Q和R的值都为1。在(14)式中的雅可比矩阵,根据(3)、(10)与(14)式可得:
根据(10)式可衍生出k+2时刻和k+3时刻的预测输出值的表达式分别为yp(k+2),yp(k+3)。
yp(k+2)=LW×h12(IW×ρ(k+1)+b1)+b2 (18)
yp(k+3)=LW×h13(IW×ρ(k+2)+b1)+b2 (19)
其中,h12与h13分别为k+2时刻和k+3时刻的神经元输出函数。
根据(10)式与(14-19)式,可以求得(15)-(17)式中每一步预测输出相对于u(k)、u(k+1)与u(k+2)的偏导。
由(3)式u(k)l+1=u(k)l-(Ja Τ(k)Ja(k)+δΙ)-1Ja Τ(k)e(k)可知,滚动优化部分与Newton算法相比较,不需要求解目标函数J的Hessian矩阵(即不需要求解目标函数J对控制量u(k)的二阶偏导),从一定程度上减小了理论推导难度和计算复杂度,增强了控制器的实时性。
根据(14)-(25)式,可以求出(3)式中k时刻的最优控制量u*(k),该控制量会被用于控制非线性系统。最后,更新样本输入量,调用神经网络预测模型可以得到k+1时刻的系统预测输出值yp(k+1),进行k+1时刻的反馈校正。重复上面的步骤,即可完成整个非线性系统的控制过程,使系统沿着预先给定的参考轨迹运行。
3)控制器的工作流程
参照图3,该控制器的详细工作步骤如下:
Step1:系统参数初始化,设置目标函数的权重矩阵Q与R、反馈校正系数σ、目标函数权重因子λ、迭代终止参数ε、最大迭代次数lmax、输入输出延迟环节的阶数ny与nu、迭代次数l=1、迭代公式中的δΙ为3阶矩阵。
Step2:在k时刻,神经网络预测控制器已经得到实际输出值y(k)与预测输出值yp(k),根据(5)式对参考输入信号yr(k+1)进行校正,得到校正后的参考输入值yr`(k+1)。
Step3:运用逆神经网络求解初始值,根据(13)式求解迭代初始值,迭代初始值将被用于滚动优化求解中。
Step4:根据(3)式中的迭代公式求解最优控制量,若满足e(k)Τe(k)≤ε或者l>lmax,则转至Step5;否则,设置l=l+1,u(k)l=u(k)l+1代入(3)式继续求解。
Step5:将Step4得到的最优控制量用于非线性系统进行控制,调用神经网络并更新其输入向量,可以得到下一个时刻的预测输出值yp(k+1)。
实施例一是本发明提出来的神经网络预测控制器针对SISO系统的详细控制步骤,该控制器不仅适用于SISO系统,同样也适用于MIMO系统。为了说明本发明在MIMO系统的实施例,验证非线性系统神经网络预测控制器的有效性,实施例二以Khepera IV移动机器人系统为例,阐述说明。
实施例二:用神经网络去逼近移动机器人系统,利用本发明所述的神经网络预测控制器去跟踪一个预先给定的参考轨迹,实现移动机器人的轨迹跟踪控制任务。以下是对整个控制器控制过程的详细说明:
1)神经网络建模和逆神经网络求初始值
参考图4Khepera IV移动机器人实验平台,可以将其简化为图5这样直观简洁的移动机器人系统。参考图5,考虑移动机器人系统:
从上式可以看出,移动机器人系统是一个两输入三输出的非线性系统,为了能实现移动机器人的轨迹跟踪控制,需要对其进行精准建模。参照图6,这时候的神经网络输入为移动机器人的线速度ν和角速度ω,神经网络的输出是移动机器人的位姿参数包括位置(x,y)和航向角度θ。
因此,移动机器人系统可以简化为:Y(k+1)=Y(k)+B(k)U(k)。
在第k时刻,移动机器人的控制信号为U(k)=[ν(k),ω(k)]Τ,其输出位姿信号为Y(k)=[x(k) y(k) θ(k)]Τ。根据移动机器人模型,随机产生2000个二维输入控制量,将其代入移动机器人系统中,可产生2000个位姿输出。随后将这1800个样本数据对[U(k) Y(k)]作为样本用来训练神经网络,剩下的200个样本数据对作为测试样本用来测试神经网络对移动机器人系统的逼近效果。
在训练好了的神经网络结构中,可以得到神经网络的权值、阈值以及系统辨识延迟阶数ny,nu。
参考图6神经网络预测模型,神经网络输入向量为:
ρ1(k)=[U(k),U(k-1),…,U(k-nu+1),Y(k),Y(k-1),…,Y(k-ny+1)]
在移动机器人系统中,输入向量可进一步表示为:
输入向量的的维数为2nu+3ny。由此可得神经网络的输出向量为:
Y1p(k+1)=[xp(k+1) yp(k+1) θp(k+1)]Τ
神经元激活函数同样使用sigmoid函数:IW是输入层连接隐含层神经元的权值,b1则是输入阈值;LW是隐含层神经元连接输出层的权值,b2则是输出阈值;L1(k)和L2(k)分别为隐含层神经元的输入向量与输出神经元的输入向量。因此,神经网络的输出表达式为:Y1p(k+1)=LW×h1(IW×ρ1(k)+b1)+b2。
在第k+1时刻,为了求解k+2时刻的位姿输出参数,只需要更新k时刻的输入向量ρ1(k),的形式如下: 从以上的形式不难看出,输入向量的控制信号和位姿参数信号分别丢弃了最早的k-nu+1时刻和k-ny+1时刻的值,并且控制信号和位姿参数信号的维数分别保持维为nu,ny不变。以此类推,若要求解k+d时刻的位姿参数,只需要按照以上的更新方式便可以求得。
参考图6,逆神经网络模型结构与神经网络模型结构一样,在第k采样时刻,神经网络的输入向量为:其中,Yr(k)=[x(k) y(k) θ(k)]Τ表示给定的位姿参考信号。根据逆神经网络模型,网络可以求得k采样时刻的控制量为:在第k+1采样时刻,输入向量根据以上的形式保持维度不变,继续更新输入向量便可以求得k+1时刻的控制量Ur(k+1)。如此反复,便可以求解迭代优化中任何一个迭代时刻的初始值。
2)轨迹跟踪控制器求解最优控制量
参考图7控制器结构,在第k采样时刻,移动机器人系统实际位姿输出为Y(k),预测输出为Yp(k),其中Yp(k)=[xp(k)yp(k)θp(k)]。首先,根据(5)式校正参考输入值Yr`(k+1)=Yr(k+1)+σ(Y(k)-Yp(k));随后,控制器调用逆神经网络模型,根据公式可求解迭代初始值;其次,考虑移动机器人系统是多输入多输出系统,根据(2)式可将目标函数写成如下形式:
其中,Q是3×3维矩阵,R是2×2维矩阵,λ为权重系数。最后,利用Levenberg-Marquardt优化算法,根据(3)式中的迭代公式U(k)l+1=U(k)l-(Ja Τ(k)Ja(k)+δΙ)-1Ja Τ(k)E(k)可以求解得到最优控制量U*(k);在迭代公式中,U(k)l+1,U(k)l分别表示第l+1和第l次的迭代控制量,Ja(k)表示目标函数J相对于U(k)=Ul(k)的一阶偏导,由预测输出和实际输出的差值决定E(k)=Yp(k)-Yr(k)。上面已经介绍了迭代初始值的计算由逆神经网络求解,那么迭代的终止条件是:EΤ(k)E(k)≤ε或者l>lmax,迭代完成后将最优控制量U*(k)代入移动机器人系统完成轨迹跟踪控制任务。
3)轨迹跟踪控制器的控制原理
因此,整个控制器的控制原理可以总结为:第k采样时刻时,参照图7轨迹跟踪控制器结构图,首先调用轨迹跟踪控制器计算k时刻的位姿信号为Y(k),同时调用k-1时刻已经计算好的预测位姿信号Yp(k),利用Yr`(k+1)=Yr(k+1)+σ(Y(k)-Yp(k))对期望参考位姿信号进行反馈校正。随后,轨迹跟踪控制器调用逆神经网络,根据公式可以求得参与滚动优化的初始值Ur(k)。然后,调用轨迹跟踪控制器中的基于Levenberg
–Marquardt算法的滚动优化控制器,根据公式U(k)l+1=U(k)l-(Ja Τ(k)Ja(k)+δΙ)- 1Ja Τ(k)E(k)和初始值U(k)l=Ur(k)就可以求得最优控制量U*(k),将U*(k)用于移动机器人系统。
第k+1采样时刻,更新k时刻的输入向量轨迹跟踪控制器调用神经网络得到第k+1时刻的预测位姿信号Yp(k+1),利用Yr`(k+2)=Yr(k+2)+σ(Y(k)-Yp(k))可完成k+1采样时刻对参考位姿信号的反馈校正,往后的步骤同上。按照这样的控制方式,移动机器人可以实现对任何参考轨迹的跟踪任务。
针对于以上两个案例,不难发现本发明提出的控制器不仅适用于SISO系统,也同样适用于MIMO系统,可以用来完成非线性系统对参考轨迹的跟踪控制任务。
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。
Claims (6)
1.一种基于非线性系统的神经网络预测控制器,其特征在于,该控制器包括预测模型、滚动优化以及反馈校正三部分,其实现方法:首先,选用神经网络对非线性系统的动态过程进行建模,通过调节神经网络的权值阈值来逼近该非线性系统的动态过程;然后,通过智能控制中的预测控制方法,基于建立的神经网络预测模型来实现预测控制,采用Levenberg-Marquardt算法来滚动优化,由逆神经网络完成算法的初始值选取;根据实际测量输出与预测输出的比较实现反馈校正;具体步骤包括:
S1:初始化系统参数;
S2:得到反馈校正参考输入值;
S3:运用逆神经网络求解初始值;
S4:根据Levenberg-Marquardt迭代公式求解最优控制量;
S5:将得到的最优控制量用于非线性系统进行控制。
2.根据权利要求1所述的一种基于非线性系统的神经网络预测控制器,其特征在于,所述预测模型包含神经网络预测模型及逆神经网络模型两个神经网络结构,由输入层、隐含层及输出层组成;
输入层包括:输入向量、输入权值矩阵和输入层偏置向量;
隐含层包括:神经元激活函数,均采用sigmoid函数;
输出层包括:输出向量、输出权值矩阵和输出层偏置向量;输出层的神经元激活函数采用purelin函数。
3.根据权利要求2所述的一种基于非线性系统的神经网络预测控制器,其特征在于,所述神经网络预测模型的输入向量为:
ρ=[y(k),y(k-1),…,y(k-ny+1),u(k),u(k-1),…,u(k-nu+1)],
输出向量为:
y(k+1)=f[y(k),y(k-1),…,y(k-ny+1),u(k),u(k-1),…,u(k-nu+1)];
所述逆神经网络模型的输入向量为:
输出向量为:
ur(k)=g[u(k-1),…,u(k-nu+1),y(k),y(k-1),…,y(k-ny+1)],
其中,函数g表示函数f的逆非线性映射关系;[u(k),y(k)]表示在时刻k和nu≤ny上单输入单输出系统的输入输出样本数据对,y(k),…,y(k-ny+1)分别表示非线性系统的在第k,…,k-ny+1时刻的输出值;nu,ny分别为模型的延迟阶数,输入向量的个数为ny+nu。
5.根据权利要求4所述的一种基于非线性系统的神经网络预测控制器,其特征在于,采用Levenberg-Marquardt进行迭代优化,迭代公式为:
u(k)l+1=u(k)l-(Ja Τ(k)Ja(k)+δI)-1Ja Τ(k)e(k)
其中,u(k)l+1、u(k)l分别表示第l+1和第l次迭代的控制量,Ja(k)为目标函数的雅可比矩阵,δI单位矩阵保证Ja Τ(k)Ja(k)是非奇异的,e(k)为参考输出与预测输出的差值;迭代终止条件为e(k)Τe(k)≤ε,ε为一个小的正常数;为保证算法的实时性,设置最大迭代次数lmax,若迭代次数高于该值,则迭代过程终止;在滚动优化过程结束后,得到最优控制量u*。
6.根据权利要求5所述的一种基于非线性系统的神经网络预测控制器,其特征在于,在第k个采样周期内,系统的预测误差为ξ=y(k)-yp(k),其中,y(k)为系统的实际输出值,yp(k)为上一周期时预测的本次系统输出;反馈校正量为σξ,σ∈[0,1],σ是反馈校正系数;经过反馈校正后的参考输入为yr、(k+1)=yr(k+1)+σ(y(k)-yp(k))。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010143312.3A CN111399375A (zh) | 2020-03-04 | 2020-03-04 | 一种基于非线性系统的神经网络预测控制器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010143312.3A CN111399375A (zh) | 2020-03-04 | 2020-03-04 | 一种基于非线性系统的神经网络预测控制器 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111399375A true CN111399375A (zh) | 2020-07-10 |
Family
ID=71432192
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010143312.3A Pending CN111399375A (zh) | 2020-03-04 | 2020-03-04 | 一种基于非线性系统的神经网络预测控制器 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111399375A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111872937A (zh) * | 2020-07-23 | 2020-11-03 | 西华大学 | 一种任务空间中不确定机械臂的控制方法 |
CN112429044A (zh) * | 2020-11-27 | 2021-03-02 | 株洲中车时代软件技术有限公司 | 一种基于非线性补偿的运行列车位置定位方法及其系统 |
CN112518753A (zh) * | 2020-12-04 | 2021-03-19 | 浙江理工大学 | 一种神经网络迭代补偿的工业机器人轨迹跟踪系统和方法 |
CN113641100A (zh) * | 2021-07-14 | 2021-11-12 | 苏州国科医工科技发展(集团)有限公司 | 针对未知非线性系统的通用辩识方法 |
CN115236988A (zh) * | 2022-08-17 | 2022-10-25 | 广东工业大学 | 基于在线数据的压电微驱动器无模型预测控制方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106033189A (zh) * | 2015-03-16 | 2016-10-19 | 徐州工程学院 | 飞行机器人位姿神经网络预测控制器 |
-
2020
- 2020-03-04 CN CN202010143312.3A patent/CN111399375A/zh active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106033189A (zh) * | 2015-03-16 | 2016-10-19 | 徐州工程学院 | 飞行机器人位姿神经网络预测控制器 |
Non-Patent Citations (3)
Title |
---|
李艳等: "基于神经网络的3自由度移动机器人跟踪方法研究", 《西安交通大学学报》 * |
樊兆峰: "一种下肢康复机器人的神经网络预测控制", 《扬州大学学报(自然科学版)》 * |
薛美盛等: "神经网络预测控制在加热炉炉温控制中的仿真研究", 《化工自动化及仪表》 * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111872937A (zh) * | 2020-07-23 | 2020-11-03 | 西华大学 | 一种任务空间中不确定机械臂的控制方法 |
CN111872937B (zh) * | 2020-07-23 | 2022-04-19 | 西华大学 | 一种任务空间中不确定机械臂的控制方法 |
CN112429044A (zh) * | 2020-11-27 | 2021-03-02 | 株洲中车时代软件技术有限公司 | 一种基于非线性补偿的运行列车位置定位方法及其系统 |
CN112429044B (zh) * | 2020-11-27 | 2023-02-28 | 株洲中车时代软件技术有限公司 | 一种基于非线性补偿的运行列车位置定位方法及其系统 |
CN112518753A (zh) * | 2020-12-04 | 2021-03-19 | 浙江理工大学 | 一种神经网络迭代补偿的工业机器人轨迹跟踪系统和方法 |
CN112518753B (zh) * | 2020-12-04 | 2022-02-01 | 浙江理工大学 | 一种神经网络迭代补偿的工业机器人轨迹跟踪系统和方法 |
CN113641100A (zh) * | 2021-07-14 | 2021-11-12 | 苏州国科医工科技发展(集团)有限公司 | 针对未知非线性系统的通用辩识方法 |
CN113641100B (zh) * | 2021-07-14 | 2023-11-28 | 苏州国科医工科技发展(集团)有限公司 | 针对未知非线性系统的通用辩识方法 |
CN115236988A (zh) * | 2022-08-17 | 2022-10-25 | 广东工业大学 | 基于在线数据的压电微驱动器无模型预测控制方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111399375A (zh) | 一种基于非线性系统的神经网络预测控制器 | |
CN108153153B (zh) | 一种学习变阻抗控制系统及控制方法 | |
CN110238839B (zh) | 一种利用环境预测优化非模型机器人多轴孔装配控制方法 | |
CN106774379B (zh) | 一种智能超螺旋强鲁棒姿态控制方法 | |
CN112904728A (zh) | 一种基于改进型趋近律的机械臂滑模控制轨迹跟踪方法 | |
CN111037550B (zh) | 一种冗余度机械臂运动控制的解决方法 | |
CN107272409B (zh) | 一种基于迭代学习的直线伺服系统振动抑制方法 | |
CN112571420B (zh) | 一种未知参数下的双功能模型预测控制方法 | |
JPH05127706A (ja) | ニユーラルネツト型シミユレータ | |
CN114740710A (zh) | 一种随机非线性多智能体的强化学习优化编队控制方法 | |
CN115139301A (zh) | 基于拓扑结构自适应神经网络的机械臂运动规划方法 | |
CN104898426A (zh) | 基于梯度下降法和广义预测控制的室温回路控制方法 | |
CN116991068A (zh) | 基于分布式预设时间梯度下降法的电机控制方法及系统 | |
Li et al. | Adaptive iterative learning control for high-order nonlinear systems with random initial state shifts | |
CN115179295A (zh) | 一种多欧拉-拉格朗日系统鲁棒二分一致性跟踪控制方法 | |
CN109108964B (zh) | 一种基于自适应动态规划Nash博弈的空间机械臂协调控制方法 | |
Kostadinov et al. | Online weight-adaptive nonlinear model predictive control | |
CN114012733B (zh) | 一种用于pc构件模具划线的机械臂控制方法 | |
CN113219840B (zh) | 三轴运动平台自适应滑模交叉耦合轮廓控制方法 | |
CN114186477A (zh) | 一种基于Elman神经网络的轨道预测算法 | |
CN115042172A (zh) | 基于融合模型的机器人逆动力学前馈控制方法及系统 | |
CN115344047A (zh) | 基于神经网络模型的机器人切换式预测控制轨迹跟踪方法 | |
CN111736460B (zh) | 机器人自适应迭代学习控制方法及系统 | |
CN113985887A (zh) | 差速移动机器人运动轨迹生成方法和运动控制装置 | |
CN113052297B (zh) | 基于卷积神经网络融合ekf的拖缆姿态解算方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200710 |
|
RJ01 | Rejection of invention patent application after publication |