CN111624992B - 一种基于神经网络的搬运机器人的路径跟踪控制方法 - Google Patents

一种基于神经网络的搬运机器人的路径跟踪控制方法 Download PDF

Info

Publication number
CN111624992B
CN111624992B CN202010350095.5A CN202010350095A CN111624992B CN 111624992 B CN111624992 B CN 111624992B CN 202010350095 A CN202010350095 A CN 202010350095A CN 111624992 B CN111624992 B CN 111624992B
Authority
CN
China
Prior art keywords
transfer robot
neural network
control
layer
hidden layer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010350095.5A
Other languages
English (en)
Other versions
CN111624992A (zh
Inventor
孟宇
白国星
武俊雪
刘丽
冯立勇
甘鑫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Science and Technology Beijing USTB
Original Assignee
University of Science and Technology Beijing USTB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Science and Technology Beijing USTB filed Critical University of Science and Technology Beijing USTB
Priority to CN202010350095.5A priority Critical patent/CN111624992B/zh
Publication of CN111624992A publication Critical patent/CN111624992A/zh
Application granted granted Critical
Publication of CN111624992B publication Critical patent/CN111624992B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course or altitude of land, water, air, or space vehicles, e.g. automatic pilot
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0212Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Abstract

本发明提供一种基于神经网络的搬运机器人的路径跟踪控制方法,能够提高非线性模型预测控制的实时性。所述方法包括:利用非线性模型预测控制产生训练样本集,其中,训练样本包括:搬运机器人的状态变量和控制变量;构建神经网络模型;利用获取的训练样本集对构建的神经网络模型进行训练,得到训练好的神经网络模型;其中,在路径跟踪控制过程中,训练好的神经网络模型输出控制变量,以便所述搬运机器人根据神经网络模型输出的控制变量进行路径跟踪。本发明涉及移动机器人自主行驶控制领域。

Description

一种基于神经网络的搬运机器人的路径跟踪控制方法
技术领域
本发明涉及移动机器人自主行驶控制领域,特别是指一种基于神经网络的搬运机器人的路径跟踪控制方法。
背景技术
搬运机器人的无人自主导航是通过安装的环境采集设备,如全球定位系统(Global Positioning System,GPS)、超宽带(Ultra Wide Band,UWB)等设备采集车辆实时的位置和位姿信息,然后将采集的信息输入给路径规划模块,进而规划出一条最优路径,并传给路径跟踪控制模块,计算得到最优控制量并下发给执行机构,完成自动驾驶。搬运机器人能够从其所在位置沿着一条已经规划好的可行路径进行跟踪操作,快速地到达指定地点,这便是搬运机器人的路径跟踪问题。路径跟踪控制是搬运机器人自动驾驶系统中最基本也是最核心的功能,是实现自动驾驶的最终手段。
关于搬运机器人路径跟踪控制问题,目前已有多种控制方法,但是传统控制方法未考虑系统的约束条件,其中执行器饱和等系统约束会影响路径跟踪控制精度,而非线性模型预测控制(Nonlinear Model Predictive Control,NMPC)能够显式地考虑系统约束,有效避免机器人侧滑等危险,但NMPC实时性较差,存在一定的局限性。
发明内容
本发明要解决的技术问题是提供一种基于神经网络的搬运机器人的路径跟踪控制方法,以解决现有技术所存在的非线性模型预测控制实时性差的问题。
为解决上述技术问题,本发明实施例提供一种基于神经网络的搬运机器人的路径跟踪控制方法,包括:
利用非线性模型预测控制产生训练样本集,其中,训练样本包括:搬运机器人的状态变量和控制变量;
构建神经网络模型;
利用获取的训练样本集对构建的神经网络模型进行训练,得到训练好的神经网络模型;其中,在路径跟踪控制过程中,训练好的神经网络模型输出控制变量,以便所述搬运机器人根据神经网络模型输出的控制变量进行路径跟踪。
进一步地,所述利用非线性模型预测控制产生训练样本集包括:
建立搬运机器人的运动学模型;
确定搬运机器人的运动学模型的状态量x与控制量u;其中,状态量x=[x y θ]Τ,控制量u=[v ω]Τ,x、y分别表示搬运机器人在全局坐标系XOY下沿X轴、Y轴方向上的距离,v为搬运机器人的纵向速度,ω表示搬运机器人的横摆角速度;
将状态量x与控制量u之间的关系描述为
Figure BDA0002471644910000025
其中,
Figure BDA0002471644910000026
表示状态量x的微分,
Figure BDA0002471644910000027
表示x、u与
Figure BDA0002471644910000028
的函数关系;
对建立的运动学模型进行离散化,得到非线性的预测模型,根据搬运机器人当前的位姿信息、质心速度信息,通过预测模型预测未来的位姿信息,所述预测模型表示为:
x(t+i|t)=x(t+i-1|t)+Tf(x(t+i-1|t),u(t+i-1|t))
其中,T表示采样周期,x(t+i-1|t)表示在第t时刻第i-1个位姿预测点;u(t+i-1|t)表示在第t时刻第i-1个控制量预测点;
对得到的状态量和控制量进行滚动优化,建立搬运机器人非线性模型预测控制的目标函数,确定搬运机器人的最优控制增量;
基于预测得到的位姿信息以及最优控制增量,确定训练样本集。
进一步地,搬运机器人的运动学模型表示为:
Figure BDA0002471644910000021
其中,
Figure BDA0002471644910000022
为搬运机器人在全局坐标系XOY下沿X轴方向的速度;
Figure BDA0002471644910000023
为搬运机器人在全局坐标系XOY下沿Y轴方向的速度;v为搬运机器人的纵向速度;θ为航向角;
Figure BDA0002471644910000024
ω均表示搬运机器人的横摆角速度;
其中,在全局坐标系XOY中,搬运机器人的运动学模型满足以下非完整约束方程:
Figure BDA0002471644910000031
进一步地,建立的搬运机器人非线性模型预测控制的目标函数J表示为:
Figure BDA0002471644910000032
s.t.v∈(vmin,vmax)
△v∈(△vmin,△vmax)
△ω∈(△ωmin,△ωmax)
Figure BDA0002471644910000033
其中,s.t.表示约束条件,vmin、vmax分别为纵向速度v的最小值、最大值;△vmin、△vmax分别为纵向速度增量△v的最小值、最大值;△ωmin、△ωmax分别为横摆角速度增量△ω的最小值、最大值;
Figure BDA0002471644910000034
表示纵向加速度,
Figure BDA0002471644910000035
表示横摆角加速度;
Figure BDA0002471644910000036
分别为相应控制变量的最小值、最大值;ξ为预测到的搬运机器人的位姿信息与参考路径之间的位姿偏差;Q和R都表示权重矩阵;Np为预测时域;Nc为控制时域;△U为控制时域内的控制增量序列,△U=[△u(t|t),△u(t+1|t),…Δu(t+Nc|t)]T,△u为控制增量,△U中的第一个元素为搬运机器人的最优控制增量,即输出到搬运机器人的实际控制输入增量。
进一步地,训练样本中的状态变量为集合X=[ω d △x △y △θ]T中的多种变量,其中,ω为搬运机器人的横摆角速度、d为位姿状态到最近的跟踪目标点切线的距离偏差、△x为横向偏差、△y为纵向偏差、△θ为航向角偏差;
训练样本中的控制变量U=[U1 U2]Τ,其中,U1=△v(t+1)是搬运机器人下一时刻纵向速度增量,U2=△ω(t+1)是下一时刻横摆角速度增量。
进一步地,构建的神经网络模型是q–m–2结构的控制器,q为输入层节点数,m为隐含层节点数,2为输出层节点数,–表示连接;
其中,
Figure BDA0002471644910000037
s为输入层节点数,即s=q,e为输出层节点数,e=2,a为常数系数。
进一步地,所述利用获取的训练样本集对构建的神经网络模型进行训练,得到训练好的神经网络模型包括:
A1,网络初始化:由状态变量X组成神经网络模型的输入序列,控制变量U组成神经网络模型的输出序列,根据输入输出序列(X,U),确定神经网络模型输入层节点数、隐含层节点数、输出层节点数,并初始化输入层、隐含层和输出层神经元之间的连接权,其中,输入层第h个神经元与隐含层第i个神经元之间的连接权重为Whi,若隐含层为多层,则第一个隐含层第i个神经元到第二个隐含层第j个神经元之间的连接权重为Gij,隐含层第i个神经元到输出层第k个神经元之间的连接权重为Fik,h=1,2…q,i=1,2…m,j=1,2…n,k=1,2;
A2,各隐含层输出计算:将状态变量X作为神经网络模型输入层的输入序列Xh输入,其中,第一个隐含层第i个神经元接收到的输入αi为:
Figure BDA0002471644910000041
其中,f为神经元的传递函数;
若隐含层为多层,则第二个隐含层第j个神经元接收到的输入βj为:
Figure BDA0002471644910000042
其中,bi为第一个隐含层第i个神经元的输出,也是第二个隐含层中神经元的输入;
A3,输出层输出计算:若隐含层是一层,则输出层第k个神经元接收到的输入Uk为:
Figure BDA0002471644910000043
其中,hi表示在隐含层是一层的情况下,隐含层第i个神经元的输出;
若隐含层是多层,则输出层第k个神经元接收到的输入Uk为:
Figure BDA0002471644910000044
其中,hj表示在隐含层是多层的情况下,隐含层第j个神经元的输出;
A4,确定神经网络模型输出层的输出
Figure BDA0002471644910000051
与训练样本集中相应的控制变量
Figure BDA0002471644910000052
之间的均方误差Ep,其中,p为训练样本的数目;
A5,判定是否满足:Ep>ε,若满足,则执行权值更新过程,其中,ε为训练要求精度;否则,结束训练;
A6,判断是否达到最大的训练次数,若达到最大的训练次数,结束训练。
进一步地,均方误差Ep表示为:
Figure BDA0002471644910000053
进一步地,所述执行权值更新过程包括:
根据梯度下降法,当隐含层为一层时,根据第一方程组更新节点的权值,其中,第一方程组表示为:
Figure BDA0002471644910000054
其中,h为学习率,z为当前迭代次数,Ek表示第k个输出层节点对应的误差。
进一步地,所述执行权值调整过程包括:
当隐含层为多层时,根据第二方程组更新节点的权值,其中,第二方程组表示为:
Figure BDA0002471644910000055
其中,h为学习率,z为当前迭代次数,Ek表示第k个输出层节点对应的误差。
本发明的上述技术方案的有益效果如下:
上述方案中,利用非线性模型预测控制产生训练样本集,其中,训练样本包括:搬运机器人的状态变量和控制变量;构建神经网络模型;利用获取的训练样本集对构建的神经网络模型进行训练,得到训练好的神经网络模型;其中,在路径跟踪控制过程中,训练好的神经网络模型输出控制变量,以便所述搬运机器人根据神经网络模型输出的控制变量进行路径跟踪。这样,通过将非线性模型预测控制和神经网络相结合,得到基于非线性模型预测控制和神经网络的控制方法,该方法结合了非线性模型预测控制跟踪精度高和神经网络控制实时性好的优势,在保持了较高跟踪精度的基础上,克服了非线性模型预测控制实时性较差的问题。
附图说明
图1为本发明实施例提供的基于神经网络的搬运机器人的路径跟踪控制方法的流程示意图;
图2为本发明实施例提供的搬运机器人的运动学模型示意图;
图3为本发明实施例提供的搬运机器人的位姿状态与目标跟踪点示意图;
图4为本发明实施例提供的搬运机器人的路径跟踪控制原理图示意图;
图5为本发明实施例提供的搬运机器人的NMPC-NN控制监督训练过程示意图;
图6为本发明实施例提供的BP算法训练神经网络模型的流程示意图。
具体实施方式
为使本发明要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。
本发明针对现有的非线性模型预测控制实时性差的问题,提供一种基于神经网络的搬运机器人的路径跟踪控制方法。
如图1所示,本发明实施例提供的基于神经网络的搬运机器人的路径跟踪控制方法,包括:
S101,利用非线性模型预测控制产生训练样本集,其中,训练样本包括:搬运机器人的状态变量和控制变量;
S102,构建神经网络模型;
S103,利用获取的训练样本集对构建的神经网络模型进行训练,得到训练好的神经网络模型;其中,在路径跟踪控制过程中,训练好的神经网络模型输出控制变量,以便所述搬运机器人根据神经网络模型输出的控制变量进行路径跟踪。
本发明实施例所述的基于神经网络的搬运机器人的路径跟踪控制方法,利用非线性模型预测控制产生训练样本集,其中,训练样本包括:搬运机器人的状态变量和控制变量;构建神经网络模型;利用获取的训练样本集对构建的神经网络模型进行训练,得到训练好的神经网络模型;其中,在路径跟踪控制过程中,训练好的神经网络模型输出控制变量,以便所述搬运机器人根据神经网络模型输出的控制变量进行路径跟踪。这样,通过将非线性模型预测控制和神经网络相结合,得到基于非线性模型预测控制和神经网络的(Nonlinear Model Predictive Control-Neural Network,NMPC-NN)控制方法,该方法结合了非线性模型预测控制跟踪精度高和神经网络控制实时性好的优势,在保持了较高跟踪精度的基础上,克服了非线性模型预测控制实时性较差的问题。
在前述基于神经网络的搬运机器人的路径跟踪控制方法的具体实施方式中,进一步地,所述利用非线性模型预测控制产生训练样本集包括:
建立搬运机器人的运动学模型;
确定搬运机器人的运动学模型的状态量x与控制量u;其中,状态量x=[x y θ]Τ,控制量u=[v ω]Τ,x、y分别表示搬运机器人在全局坐标系XOY下沿X轴、Y轴方向上的距离,v为搬运机器人的纵向速度,ω表示搬运机器人的横摆角速度;
将状态量x与控制量u之间的关系描述为
Figure BDA0002471644910000071
其中,
Figure BDA0002471644910000072
表示状态量x的微分,
Figure BDA0002471644910000073
表示x、u与
Figure BDA0002471644910000074
的函数关系;
对建立的运动学模型进行离散化,得到非线性的预测模型,根据搬运机器人当前的位姿信息、质心速度信息,通过预测模型预测未来的位姿信息,所述预测模型表示为:
x(t+i|t)=x(t+i-1|t)+Tf(x(t+i-1|t),u(t+i-1|t))
其中,T表示采样周期,x(t+i-1|t)表示在第t时刻第i-1个位姿预测点;u(t+i-1|t)表示在第t时刻第i-1个控制量预测点;
对得到的状态量和控制量进行滚动优化,建立搬运机器人非线性模型预测控制的目标函数,确定搬运机器人的最优控制增量;
基于预测得到的位姿信息以及最优控制增量,确定训练样本集。
在前述基于神经网络的搬运机器人的路径跟踪控制方法的具体实施方式中,进一步地,搬运机器人的运动学模型表示为:
Figure BDA0002471644910000081
其中,
Figure BDA0002471644910000082
为搬运机器人在全局坐标系XOY下沿X轴方向的速度,m/s;
Figure BDA0002471644910000083
为搬运机器人在全局坐标系XOY下沿Y轴方向的速度,m/s;v为搬运机器人的纵向速度,m/s;θ为航向角,rad;
Figure BDA0002471644910000084
ω均表示搬运机器人的横摆角速度,rad/s。
本实施例中,如图2所示,图2中L为搬运机器人车身宽度。假设该搬运机器人为刚性结构,并且不产生横向运动,则在全局坐标系XOY中,搬运机器人满足以下非完整约束方程:
Figure BDA0002471644910000085
这样,可以保证搬运机器人不产生横向移动。
本实施例中,可以将搬运机器人的运动学模型转换成状态空间方程,得到:
Figure BDA0002471644910000086
将上式进行改写,可以得到状态量x与控制量u之间的关系描述为
Figure BDA0002471644910000087
在前述基于神经网络的搬运机器人的路径跟踪控制方法的具体实施方式中,进一步地,建立的搬运机器人非线性模型预测控制的目标函数J表示为:
Figure BDA0002471644910000091
s.t.v∈(vmin,vmax)
△v∈(Δvmin,Δvmax)
△ω∈(△ωmin,△ωmax)
Figure BDA0002471644910000092
其中,s.t.表示约束条件,vmin、vmax分别为纵向速度v的最小值、最大值;△vmin、△vmax分别为纵向速度增量△v的最小值、最大值;△ωmin、△ωmax分别为横摆角速度增量△ω的最小值、最大值;
Figure BDA0002471644910000093
表示纵向加速度,
Figure BDA0002471644910000094
表示横摆角加速度;
Figure BDA0002471644910000095
分别为相应控制变量的最小值、最大值;ξ为预测到的搬运机器人的位姿信息与参考路径之间的位姿偏差;Q和R都表示权重矩阵;Np为预测时域;Nc为控制时域;△U为控制时域内的控制增量序列,△U=[△u(t|t),△u(t+1|t),…△u(t+Nc|t)]T,△u为控制增量,△U中的第一个元素为搬运机器人的最优控制增量,即输出到搬运机器人的实际控制输入增量。
本实施例中,ξ(t+i|t)可以表示为:
Figure BDA0002471644910000096
其中,r(t+1|t)表示第t时刻第1个预测点对应的跟踪目标点/参考路径。
为便于试验中看出跟踪结果与跟踪目标点之间的偏差以及机器人当前位置与跟踪目标点的相对位置,给出搬运机器人路径跟踪控制的距离偏差定义,若目标点跟踪为:
r(t)=[x(t) y(t) θ(t)]T
由于搬运机器人纵向速度小且采样间隔小,如图3所示,搬运机器人在t时刻的位姿状态x(t)=(x(t),y(t))到最近的跟踪目标点r1(t)切线的距离偏差d(t)可近似的认为x(t)到r1(t)=(x1(t),y1(t))和第二个较近的跟踪目标点r2(t)=(x2(t),y2(t))(一般为r1(t)的前一个跟踪目标点或者后一个跟踪目标点)线段的垂直距离,即:
Figure BDA0002471644910000101
当d(t)<0时,x(t)在r1(t)切线的左侧;当d(t)>0时,x(t)在r1(t)切线的右侧;当d(t)=0时,x(t)在r1(t)切线上。
本实施例中,△u可以表示为:
Figure BDA0002471644910000102
本实施例中,为了防止搬运机器人轮胎发生侧滑,考虑侧向动力学约束,因此搬运机器人的约束条件包括纵向速度约束和执行器约束;其中,纵向速度约束可以设置为:
vmin<v<vmax
本实施例中,执行器约束中纵向速度增量
Figure BDA0002471644910000103
横摆角速度增量
Figure BDA0002471644910000104
假设搬运机器人纵向加速度的极限值为
Figure BDA0002471644910000108
横摆角加速度的极限值为
Figure BDA0002471644910000105
为了减少轮胎侧滑和急刹车导致机器人运行不稳定状况,最大纵向加速度设置为
Figure BDA0002471644910000106
最大横摆角加速度取
Figure BDA0002471644910000107
根据控制周期T,可得执行器约束为:
△vmin<△v<△vmax
△ωmin<△ω<△ωmax
综上所述,搬运机器人的约束条件为:
Figure BDA0002471644910000111
如图4所示,NMPC-NN控制根据参考路径r与搬运机器人的状态变量X,输出变量U对搬运机器人进行控制,其中,NMPC-NN控制主要包括三部分:训练样本集的选取和产生,神经网络结构的设计,基于训练样本集的神经网络模型的监督训练,其中,采用误差反向传播(BackPropagation,BP)算法训练神经网络模型。
如图5所示,神经网络模型以NMPC控制结果作为神经网络模型监督训练的样本,学习状态变量和控制变量之间的复杂非线性映射关系,实现NMPC-NN控制的离线训练和在线控制。
在前述基于神经网络的搬运机器人的路径跟踪控制方法的具体实施方式中,进一步地,训练样本中的状态变量为集合X=[ω d △x △y △θ]T中的多种变量,其中,ω为搬运机器人的横摆角速度、d为位姿状态到最近的跟踪目标点切线的距离偏差、△x为横向偏差、△y为纵向偏差、△θ为航向角偏差;
训练样本中的控制变量U=[U1 U2]Τ,其中,U1=△v(t+1)是搬运机器人下一时刻纵向速度增量,U2=△ω(t+1)是下一时刻横摆角速度增量。
在前述基于神经网络的搬运机器人的路径跟踪控制方法的具体实施方式中,进一步地,构建的神经网络模型是q–m–2结构的控制器,q为输入层节点数,m为隐含层节点数,2为输出层节点数,–表示连接;
其中,
Figure BDA0002471644910000112
s为输入层节点数,即s=q,e为输出层节点数,e=2,a为常数系数,a取值范围是1-10。
本实施例中,输出层的节点数与非线性模型预测控制的控制增量数目相同。
在前述基于神经网络的搬运机器人的路径跟踪控制方法的具体实施方式中,进一步地,如图6所示,所述利用获取的训练样本集对构建的神经网络模型进行训练,得到训练好的神经网络模型包括:
A1,网络初始化:由状态变量X组成神经网络模型的输入序列,控制变量U组成神经网络模型的输出序列,根据输入输出序列(X,U),确定神经网络模型输入层节点数、隐含层节点数、输出层节点数,并初始化输入层、隐含层和输出层神经元之间的连接权,其中,输入层第h个神经元与隐含层第i个神经元之间的连接权重为Whi,若隐含层为多层,则第一个隐含层第i个神经元到第二个隐含层第j个神经元之间的连接权重为Gij,隐含层第i个神经元到输出层第k个神经元之间的连接权重为Fik,h=1,2…q,i=1,2…m,j=1,2…n,k=1,2;
A2,各隐含层输出计算:将状态变量X作为神经网络模型输入层的输入序列Xh输入,其中,第一个隐含层第i个神经元接收到的输入αi为:
Figure BDA0002471644910000121
其中,f为神经元的传递函数,具体可以是双曲正切函数(tansig),tansig传递函数表示为:
Figure BDA0002471644910000122
若隐含层为多层,则第二个隐含层第j个神经元接收到的输入βj为:
Figure BDA0002471644910000123
其中,bi为第一个隐含层第i个神经元的输出,也是第二个隐含层中神经元的输入;
A3,输出层输出计算:若隐含层是一层,则输出层第k个神经元接收到的输入Uk为:
Figure BDA0002471644910000124
其中,hi表示在隐含层是一层的情况下,隐含层第i个神经元的输出;
若隐含层是多层,则输出层第k个神经元接收到的输入Uk为:
Figure BDA0002471644910000125
其中,hj表示在隐含层是多层的情况下,隐含层第j个神经元的输出;
A4,确定神经网络模型输出层的输出
Figure BDA0002471644910000126
与训练样本集中相应的控制变量
Figure BDA0002471644910000131
之间的均方误差Ep,其中,p为训练样本的数目;
A5,判定是否满足:Ep>ε,若满足,则执行权值更新过程,其中,ε为训练要求精度;否则,结束训练;
A6,判断是否达到最大的训练次数,若达到最大的训练次数,结束训练。
在前述基于神经网络的搬运机器人的路径跟踪控制方法的具体实施方式中,进一步地,均方误差Ep表示为:
Figure BDA0002471644910000132
在前述基于神经网络的搬运机器人的路径跟踪控制方法的具体实施方式中,进一步地,所述执行权值更新过程包括:
根据梯度下降法,当隐含层为一层时,根据第一方程组更新节点的权值,其中,第一方程组表示为:
Figure BDA0002471644910000133
其中,h为学习率,z为当前迭代次数,Ek表示第k个输出层节点对应的误差。
在前述基于神经网络的搬运机器人的路径跟踪控制方法的具体实施方式中,进一步地,所述执行权值调整过程包括:
当隐含层为多层时,根据第二方程组更新节点的权值,其中,第二方程组表示为:
Figure BDA0002471644910000134
其中,h为学习率,z为当前迭代次数,Ek表示第k个输出层节点对应的误差。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (9)

1.一种基于神经网络的搬运机器人的路径跟踪控制方法,其特征在于,包括:
利用非线性模型预测控制产生训练样本集,其中,训练样本包括:搬运机器人的状态变量和控制变量;
构建神经网络模型;
利用获取的训练样本集对构建的神经网络模型进行训练,得到训练好的神经网络模型;其中,在路径跟踪控制过程中,训练好的神经网络模型输出控制变量,以便所述搬运机器人根据神经网络模型输出的控制变量进行路径跟踪;
其中,所述利用非线性模型预测控制产生训练样本集包括:
建立搬运机器人的运动学模型;
确定搬运机器人的运动学模型的状态量x与控制量u;其中,状态量x=[x y θ]T,控制量u=[v ω]T,x、y分别表示搬运机器人在全局坐标系XOY下沿X轴、Y轴方向上的距离,θ为航向角,v为搬运机器人的纵向速度,ω表示搬运机器人的横摆角速度;
将状态量x与控制量u之间的关系描述为
Figure FDA0003080020360000011
其中,
Figure FDA0003080020360000012
表示状态量x的微分,
Figure FDA0003080020360000013
表示x、u与
Figure FDA0003080020360000014
的函数关系;
对建立的运动学模型进行离散化,得到非线性的预测模型,根据搬运机器人当前的位姿信息、质心速度信息,通过预测模型预测未来的位姿信息,所述预测模型表示为:
x(t+i|t)=x(t+i-1|t)+Tf(x(t+i-1|t),u(t+i-1|t))
其中,T表示采样周期,x(t+i-1|t)表示在第t时刻第i-1个位姿预测点;u(t+i-1|t)表示在第t时刻第i-1个控制量预测点;
对得到的状态量和控制量进行滚动优化,建立搬运机器人非线性模型预测控制的目标函数,确定搬运机器人的最优控制增量;
基于预测得到的位姿信息以及最优控制增量,确定训练样本集。
2.根据权利要求1所述的基于神经网络的搬运机器人的路径跟踪控制方法,其特征在于,搬运机器人的运动学模型表示为:
Figure FDA0003080020360000021
其中,
Figure FDA0003080020360000022
为搬运机器人在全局坐标系XOY下沿X轴方向的速度;
Figure FDA0003080020360000023
为搬运机器人在全局坐标系XOY下沿Y轴方向的速度;v为搬运机器人的纵向速度;θ为航向角;
Figure FDA0003080020360000024
ω均表示搬运机器人的横摆角速度;
其中,在全局坐标系XOY中,搬运机器人的运动学模型满足以下非完整约束方程:
Figure FDA0003080020360000025
3.根据权利要求1所述的基于神经网络的搬运机器人的路径跟踪控制方法,其特征在于,建立的搬运机器人非线性模型预测控制的目标函数J表示为:
Figure FDA0003080020360000026
s.t.v∈(vmin,vmax)
Δv∈(Δvmin,Δvmax)
Δω∈(Δωmin,Δωmax)
Figure FDA0003080020360000027
其中,s.t.表示约束条件,vmin、vmax分别为纵向速度v的最小值、最大值;Δvmin、Δvmax分别为纵向速度增量Δv的最小值、最大值;Δωmin、Δωmax分别为横摆角速度增量Δω的最小值、最大值;
Figure FDA0003080020360000028
表示纵向加速度,
Figure FDA0003080020360000029
表示横摆角加速度;
Figure FDA00030800203600000210
分别为相应控制变量的最小值、最大值;ξ为预测到的搬运机器人的位姿信息与参考路径之间的位姿偏差;Q和R都表示权重矩阵;Np为预测时域;Nc为控制时域;ΔU(t)为控制时域内的控制增量序列,ΔU=[Δu(t|t),Δu(t+1|t),…Δu(t+Nc|t)]T,Δu为控制增量,ΔU中的第一个元素为搬运机器人的最优控制增量,即输出到搬运机器人的实际控制输入增量。
4.根据权利要求1所述的基于神经网络的搬运机器人的路径跟踪控制方法,其特征在于,训练样本中的状态变量为集合X=[ω d Δx Δy Δθ]T中的多种变量,其中,ω为搬运机器人的横摆角速度、d为位姿状态到最近的跟踪目标点切线的距离偏差、Δx为横向偏差、Δy为纵向偏差、Δθ为航向角偏差;
训练样本中的控制变量U=[U1 U2]T,其中,U1=Δv(t+1)是搬运机器人下一时刻纵向速度增量,U2=Δω(t+1)是下一时刻横摆角速度增量。
5.根据权利要求1所述的基于神经网络的搬运机器人的路径跟踪控制方法,其特征在于,构建的神经网络模型是q–m–2结构的控制器,q为输入层节点数,m为隐含层节点数,2为输出层节点数,–表示连接;
其中,
Figure FDA0003080020360000031
s为输入层节点数,即s=q,e为输出层节点数,e=2,a为常数系数。
6.根据权利要求4所述的基于神经网络的搬运机器人的路径跟踪控制方法,其特征在于,所述利用获取的训练样本集对构建的神经网络模型进行训练,得到训练好的神经网络模型包括:
A1,网络初始化:由状态变量X组成神经网络模型的输入序列,控制变量U组成神经网络模型的输出序列,根据输入输出序列(X,U),确定神经网络模型输入层节点数、隐含层节点数、输出层节点数,并初始化输入层、隐含层和输出层神经元之间的连接权,其中,输入层第h个神经元与隐含层第i个神经元之间的连接权重为Whi,若隐含层为多层,则第一个隐含层第i个神经元到第二个隐含层第j个神经元之间的连接权重为Gij,隐含层第i个神经元到输出层第k个神经元之间的连接权重为Fik,h=1,2…q,i=1,2…m,j=1,2…n,k=1,2;
A2,各隐含层输出计算:将状态变量X作为神经网络模型输入层的输入序列Xh输入,其中,第一个隐含层第i个神经元接收到的输入αi为:
Figure FDA0003080020360000032
其中,f为神经元的传递函数;
若隐含层为多层,则第二个隐含层第j个神经元接收到的输入βj为:
Figure FDA0003080020360000033
其中,bi为第一个隐含层第i个神经元的输出,也是第二个隐含层中神经元的输入;
A3,输出层输出计算:若隐含层是一层,则输出层第k个神经元接收到的输入Uk为:
Figure FDA0003080020360000041
其中,hi表示在隐含层是一层的情况下,隐含层第i个神经元的输出;
若隐含层是多层,则输出层第k个神经元接收到的输入Uk为:
Figure FDA0003080020360000042
其中,hj表示在隐含层是多层的情况下,隐含层第j个神经元的输出;
A4,确定神经网络模型输出层的输出
Figure FDA0003080020360000045
与训练样本集中相应的控制变量
Figure FDA0003080020360000043
之间的均方误差Ep,其中,p为训练样本的数目;
A5,判定是否满足:Ep>ε,若满足,则执行权值更新过程,其中,ε为训练要求精度;否则,结束训练;
A6,判断是否达到最大的训练次数,若达到最大的训练次数,结束训练。
7.根据权利要求6所述的基于神经网络的搬运机器人的路径跟踪控制方法,其特征在于,均方误差Ep表示为:
Figure FDA0003080020360000044
8.根据权利要求6所述的基于神经网络的搬运机器人的路径跟踪控制方法,其特征在于,所述执行权值更新过程包括:
根据梯度下降法,当隐含层为一层时,根据第一方程组更新节点的权值,其中,第一方程组表示为:
Figure FDA0003080020360000051
其中,η为学习率,z为当前迭代次数,Ek表示第k个输出层节点对应的误差。
9.根据权利要求6所述的基于神经网络的搬运机器人的路径跟踪控制方法,其特征在于,所述执行权值调整过程包括:
当隐含层为多层时,根据第二方程组更新节点的权值,其中,第二方程组表示为:
Figure FDA0003080020360000052
其中,η为学习率,z为当前迭代次数,Ek表示第k个输出层节点对应的误差。
CN202010350095.5A 2020-04-28 2020-04-28 一种基于神经网络的搬运机器人的路径跟踪控制方法 Active CN111624992B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010350095.5A CN111624992B (zh) 2020-04-28 2020-04-28 一种基于神经网络的搬运机器人的路径跟踪控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010350095.5A CN111624992B (zh) 2020-04-28 2020-04-28 一种基于神经网络的搬运机器人的路径跟踪控制方法

Publications (2)

Publication Number Publication Date
CN111624992A CN111624992A (zh) 2020-09-04
CN111624992B true CN111624992B (zh) 2021-07-09

Family

ID=72260662

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010350095.5A Active CN111624992B (zh) 2020-04-28 2020-04-28 一种基于神经网络的搬运机器人的路径跟踪控制方法

Country Status (1)

Country Link
CN (1) CN111624992B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112965488B (zh) * 2021-02-05 2022-06-03 重庆大学 基于迁移学习神经网络的婴儿监控移动机器小车
CN112612289B (zh) * 2021-03-08 2021-09-14 浙江大华技术股份有限公司 轨迹跟踪控制方法、移动机器人、控制设备及存储介质
CN113203419B (zh) * 2021-04-25 2023-11-10 重庆大学 基于神经网络的室内巡检机器人校正定位方法
CN113325694B (zh) * 2021-05-26 2022-12-09 西安交通大学 一种基于机器学习的模型预测控制参数的整定方法
CN114115302B (zh) * 2021-06-08 2022-08-16 中国人民解放军国防科技大学 基于深度神经网络逼近mpc的航天器姿态控制方法
CN113568422B (zh) * 2021-07-02 2024-01-23 厦门大学 基于模型预测控制优化强化学习的四足机器人控制方法
CN113842086B (zh) * 2021-09-28 2022-12-06 深圳市云鼠科技开发有限公司 一种清洁方法、拖地机器人及清洁系统
CN113985868B (zh) * 2021-10-09 2023-08-08 北京科技大学 一种轮式移动机器人分层路径跟踪控制实现方法
CN114003030B (zh) * 2021-10-09 2023-08-08 北京科技大学 考虑质心变化的两轮差动移动机器人路径跟踪控制方法
CN115344047A (zh) * 2022-08-22 2022-11-15 吉林大学 基于神经网络模型的机器人切换式预测控制轨迹跟踪方法
CN115562296B (zh) * 2022-10-26 2023-05-26 宝开(上海)智能物流科技有限公司 一种基于混合控制策略的机器人调度方法、系统及装置

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016010601A2 (en) * 2014-04-23 2016-01-21 The Florida State University Research Foundation, Inc. Adaptive nonlinear model predictive control using a neural network and input sampling
US10386796B2 (en) * 2014-12-11 2019-08-20 University Of New Brunswick Model predictive controller and method with correction parameter to compensate for time lag
CN106873585B (zh) * 2017-01-18 2019-12-03 上海器魂智能科技有限公司 一种导航寻路方法、机器人及系统
CN107561942B (zh) * 2017-09-12 2021-02-09 重庆邮电大学 基于模型补偿的智能车辆轨迹跟踪模型预测控制方法
CN109866752B (zh) * 2019-03-29 2020-06-05 合肥工业大学 基于预测控制的双模式并行车辆轨迹跟踪行驶系统的方法
CN110135314B (zh) * 2019-05-07 2020-08-11 电子科技大学 一种基于深度轨迹预测的多目标跟踪方法
CN110286683B (zh) * 2019-07-15 2020-07-24 北京科技大学 一种履带式移动机器人的自主行驶路径跟踪控制方法
CN110609560A (zh) * 2019-10-29 2019-12-24 广州高新兴机器人有限公司 移动机器人避障规划方法及计算机存储介质

Also Published As

Publication number Publication date
CN111624992A (zh) 2020-09-04

Similar Documents

Publication Publication Date Title
CN111624992B (zh) 一种基于神经网络的搬运机器人的路径跟踪控制方法
CN111845774B (zh) 一种基于横纵向协调的自动驾驶汽车动态轨迹规划及跟踪方法
CN109866752B (zh) 基于预测控制的双模式并行车辆轨迹跟踪行驶系统的方法
Zhao et al. A novel direct trajectory planning approach based on generative adversarial networks and rapidly-exploring random tree
Gao et al. Robust lateral trajectory following control of unmanned vehicle based on model predictive control
Grigorescu et al. Neurotrajectory: A neuroevolutionary approach to local state trajectory learning for autonomous vehicles
CN111538328B (zh) 一种用于自主驾驶车辆避障轨迹规划与跟踪控制的优先级分层预测控制方法
CN112857385B (zh) 一种基于非均匀栅格模型的快速无人车局部路径规划方法
CN111752274B (zh) 一种基于强化学习的激光agv的路径跟踪控制方法
CN114460936B (zh) 基于离线增量学习的自动驾驶汽车路径规划方法及系统
CN114510063B (zh) 一种无人履带车辆及其轨迹跟踪控制方法和系统
Wu et al. Route planning and tracking control of an intelligent automatic unmanned transportation system based on dynamic nonlinear model predictive control
Li et al. A behavior-based mobile robot navigation method with deep reinforcement learning
Yue et al. Path tracking control of skid-steered mobile robot on the slope based on fuzzy system and model predictive control
Khalifa et al. Vehicles platooning in urban environment: Consensus-based longitudinal control with limited communications capabilities
Liu et al. The robustly-safe automated driving system for enhanced active safety
CN115598983A (zh) 一种考虑时变时延的无人车横纵向协同控制方法及装置
Wang et al. Decentralized MPC-based trajectory generation for multiple quadrotors in cluttered environments
Tian et al. Personalized lane change planning and control by imitation learning from drivers
Kanchwala et al. Development of an intelligent transport system for EV
Huang et al. Vehicle Platoon Tracking Control Based on Adaptive Neural Network Algorithm
Kanjanawanishkul Coordinated path following for mobile robots using a virtual structure strategy with model predictive control
CN115284276A (zh) 基于长短期记忆网络的机器人关节力矩控制方法
Cai et al. Trajectory tracking control for autonomous parking based on adaptive reduced-horizon model predictive control
Chen et al. Automated vehicle path planning and trajectory tracking control based on unscented kalman filter vehicle state observer

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20210203

Address after: 100083 No. 30, Haidian District, Beijing, Xueyuan Road

Applicant after: University OF SCIENCE AND TECHNOLOGY BEIJING

Address before: 100083 No. 30, Haidian District, Beijing, Xueyuan Road

Applicant before: University OF SCIENCE AND TECHNOLOGY BEIJING

Applicant before: Nanjing Beike Diyue Technology Co.,Ltd.

GR01 Patent grant
GR01 Patent grant