CN111624992B

CN111624992B - 一种基于神经网络的搬运机器人的路径跟踪控制方法

Info

Publication number: CN111624992B
Application number: CN202010350095.5A
Authority: CN
Inventors: 孟宇; 白国星; 武俊雪; 刘丽; 冯立勇; 甘鑫
Original assignee: University of Science and Technology Beijing USTB
Current assignee: University of Science and Technology Beijing USTB
Priority date: 2020-04-28
Filing date: 2020-04-28
Publication date: 2021-07-09
Anticipated expiration: 2040-04-28
Also published as: CN111624992A

Abstract

本发明提供一种基于神经网络的搬运机器人的路径跟踪控制方法，能够提高非线性模型预测控制的实时性。所述方法包括：利用非线性模型预测控制产生训练样本集，其中，训练样本包括：搬运机器人的状态变量和控制变量；构建神经网络模型；利用获取的训练样本集对构建的神经网络模型进行训练，得到训练好的神经网络模型；其中，在路径跟踪控制过程中，训练好的神经网络模型输出控制变量，以便所述搬运机器人根据神经网络模型输出的控制变量进行路径跟踪。本发明涉及移动机器人自主行驶控制领域。

Description

一种基于神经网络的搬运机器人的路径跟踪控制方法

技术领域

本发明涉及移动机器人自主行驶控制领域，特别是指一种基于神经网络的搬运机器人的路径跟踪控制方法。

背景技术

搬运机器人的无人自主导航是通过安装的环境采集设备，如全球定位系统(Global Positioning System，GPS)、超宽带(Ultra Wide Band，UWB)等设备采集车辆实时的位置和位姿信息，然后将采集的信息输入给路径规划模块，进而规划出一条最优路径，并传给路径跟踪控制模块，计算得到最优控制量并下发给执行机构，完成自动驾驶。搬运机器人能够从其所在位置沿着一条已经规划好的可行路径进行跟踪操作，快速地到达指定地点，这便是搬运机器人的路径跟踪问题。路径跟踪控制是搬运机器人自动驾驶系统中最基本也是最核心的功能，是实现自动驾驶的最终手段。

关于搬运机器人路径跟踪控制问题，目前已有多种控制方法，但是传统控制方法未考虑系统的约束条件，其中执行器饱和等系统约束会影响路径跟踪控制精度，而非线性模型预测控制(Nonlinear Model Predictive Control，NMPC)能够显式地考虑系统约束，有效避免机器人侧滑等危险，但NMPC实时性较差，存在一定的局限性。

发明内容

本发明要解决的技术问题是提供一种基于神经网络的搬运机器人的路径跟踪控制方法，以解决现有技术所存在的非线性模型预测控制实时性差的问题。

为解决上述技术问题，本发明实施例提供一种基于神经网络的搬运机器人的路径跟踪控制方法，包括：

利用非线性模型预测控制产生训练样本集，其中，训练样本包括：搬运机器人的状态变量和控制变量；

构建神经网络模型；

利用获取的训练样本集对构建的神经网络模型进行训练，得到训练好的神经网络模型；其中，在路径跟踪控制过程中，训练好的神经网络模型输出控制变量，以便所述搬运机器人根据神经网络模型输出的控制变量进行路径跟踪。

进一步地，所述利用非线性模型预测控制产生训练样本集包括：

建立搬运机器人的运动学模型；

确定搬运机器人的运动学模型的状态量x与控制量u；其中，状态量x＝[x y θ]^Τ，控制量u＝[v ω]^Τ，x、y分别表示搬运机器人在全局坐标系XOY下沿X轴、Y轴方向上的距离，v为搬运机器人的纵向速度，ω表示搬运机器人的横摆角速度；

将状态量x与控制量u之间的关系描述为

其中，

表示状态量x的微分，

表示x、u与

的函数关系；

对建立的运动学模型进行离散化，得到非线性的预测模型，根据搬运机器人当前的位姿信息、质心速度信息，通过预测模型预测未来的位姿信息，所述预测模型表示为：

x(t+i|t)＝x(t+i-1|t)+Tf(x(t+i-1|t),u(t+i-1|t))

其中，T表示采样周期，x(t+i-1|t)表示在第t时刻第i-1个位姿预测点；u(t+i-1|t)表示在第t时刻第i-1个控制量预测点；

对得到的状态量和控制量进行滚动优化，建立搬运机器人非线性模型预测控制的目标函数，确定搬运机器人的最优控制增量；

基于预测得到的位姿信息以及最优控制增量，确定训练样本集。

进一步地，搬运机器人的运动学模型表示为：

其中，

为搬运机器人在全局坐标系XOY下沿X轴方向的速度；

为搬运机器人在全局坐标系XOY下沿Y轴方向的速度；v为搬运机器人的纵向速度；θ为航向角；

ω均表示搬运机器人的横摆角速度；

其中，在全局坐标系XOY中，搬运机器人的运动学模型满足以下非完整约束方程：

进一步地，建立的搬运机器人非线性模型预测控制的目标函数J表示为：

s.t.v∈(v_min,v_max)

△v∈(△v_min,△v_max)

△ω∈(△ω_min,△ω_max)

其中，s.t.表示约束条件，v_min、v_max分别为纵向速度v的最小值、最大值；△v_min、△v_max分别为纵向速度增量△v的最小值、最大值；△ω_min、△ω_max分别为横摆角速度增量△ω的最小值、最大值；

表示纵向加速度，

表示横摆角加速度；

分别为相应控制变量的最小值、最大值；ξ为预测到的搬运机器人的位姿信息与参考路径之间的位姿偏差；Q和R都表示权重矩阵；N_p为预测时域；N_c为控制时域；△U为控制时域内的控制增量序列，△U＝[△u(t|t),△u(t+1|t),…Δu(t+N_c|t)]^T，△u为控制增量，△U中的第一个元素为搬运机器人的最优控制增量，即输出到搬运机器人的实际控制输入增量。

进一步地，训练样本中的状态变量为集合X＝[ω d △x △y △θ]^T中的多种变量，其中，ω为搬运机器人的横摆角速度、d为位姿状态到最近的跟踪目标点切线的距离偏差、△x为横向偏差、△y为纵向偏差、△θ为航向角偏差；

训练样本中的控制变量U＝[U₁ U₂]^Τ，其中，U₁＝△v(t+1)是搬运机器人下一时刻纵向速度增量，U₂＝△ω(t+1)是下一时刻横摆角速度增量。

进一步地，构建的神经网络模型是q–m–2结构的控制器，q为输入层节点数，m为隐含层节点数，2为输出层节点数，–表示连接；

其中，

s为输入层节点数，即s＝q，e为输出层节点数，e＝2，a为常数系数。

进一步地，所述利用获取的训练样本集对构建的神经网络模型进行训练，得到训练好的神经网络模型包括：

A1，网络初始化：由状态变量X组成神经网络模型的输入序列，控制变量U组成神经网络模型的输出序列，根据输入输出序列(X,U)，确定神经网络模型输入层节点数、隐含层节点数、输出层节点数，并初始化输入层、隐含层和输出层神经元之间的连接权，其中，输入层第h个神经元与隐含层第i个神经元之间的连接权重为W_hi，若隐含层为多层，则第一个隐含层第i个神经元到第二个隐含层第j个神经元之间的连接权重为G_ij，隐含层第i个神经元到输出层第k个神经元之间的连接权重为F_ik，h＝1,2…q，i＝1,2…m，j＝1,2…n，k＝1,2；

A2，各隐含层输出计算：将状态变量X作为神经网络模型输入层的输入序列X_h输入，其中，第一个隐含层第i个神经元接收到的输入α_i为：

其中，f为神经元的传递函数；

若隐含层为多层，则第二个隐含层第j个神经元接收到的输入β_j为：

其中，b_i为第一个隐含层第i个神经元的输出，也是第二个隐含层中神经元的输入；

A3，输出层输出计算：若隐含层是一层，则输出层第k个神经元接收到的输入U_k为：

其中，h_i表示在隐含层是一层的情况下，隐含层第i个神经元的输出；

若隐含层是多层，则输出层第k个神经元接收到的输入U_k为：

其中，h_j表示在隐含层是多层的情况下，隐含层第j个神经元的输出；

A4，确定神经网络模型输出层的输出

与训练样本集中相应的控制变量

之间的均方误差E_p，其中，p为训练样本的数目；

A5，判定是否满足：E_p>ε，若满足，则执行权值更新过程，其中，ε为训练要求精度；否则，结束训练；

A6，判断是否达到最大的训练次数，若达到最大的训练次数，结束训练。

进一步地，均方误差E_p表示为：

进一步地，所述执行权值更新过程包括：

根据梯度下降法，当隐含层为一层时，根据第一方程组更新节点的权值，其中，第一方程组表示为：

其中，h为学习率，z为当前迭代次数，E_k表示第k个输出层节点对应的误差。

进一步地，所述执行权值调整过程包括：

当隐含层为多层时，根据第二方程组更新节点的权值，其中，第二方程组表示为：

本发明的上述技术方案的有益效果如下：

上述方案中，利用非线性模型预测控制产生训练样本集，其中，训练样本包括：搬运机器人的状态变量和控制变量；构建神经网络模型；利用获取的训练样本集对构建的神经网络模型进行训练，得到训练好的神经网络模型；其中，在路径跟踪控制过程中，训练好的神经网络模型输出控制变量，以便所述搬运机器人根据神经网络模型输出的控制变量进行路径跟踪。这样，通过将非线性模型预测控制和神经网络相结合，得到基于非线性模型预测控制和神经网络的控制方法，该方法结合了非线性模型预测控制跟踪精度高和神经网络控制实时性好的优势，在保持了较高跟踪精度的基础上，克服了非线性模型预测控制实时性较差的问题。

附图说明

图1为本发明实施例提供的基于神经网络的搬运机器人的路径跟踪控制方法的流程示意图；

图2为本发明实施例提供的搬运机器人的运动学模型示意图；

图3为本发明实施例提供的搬运机器人的位姿状态与目标跟踪点示意图；

图4为本发明实施例提供的搬运机器人的路径跟踪控制原理图示意图；

图5为本发明实施例提供的搬运机器人的NMPC-NN控制监督训练过程示意图；

图6为本发明实施例提供的BP算法训练神经网络模型的流程示意图。

具体实施方式

为使本发明要解决的技术问题、技术方案和优点更加清楚，下面将结合附图及具体实施例进行详细描述。

本发明针对现有的非线性模型预测控制实时性差的问题，提供一种基于神经网络的搬运机器人的路径跟踪控制方法。

如图1所示，本发明实施例提供的基于神经网络的搬运机器人的路径跟踪控制方法，包括：

S101，利用非线性模型预测控制产生训练样本集，其中，训练样本包括：搬运机器人的状态变量和控制变量；

S102，构建神经网络模型；

S103，利用获取的训练样本集对构建的神经网络模型进行训练，得到训练好的神经网络模型；其中，在路径跟踪控制过程中，训练好的神经网络模型输出控制变量，以便所述搬运机器人根据神经网络模型输出的控制变量进行路径跟踪。

本发明实施例所述的基于神经网络的搬运机器人的路径跟踪控制方法，利用非线性模型预测控制产生训练样本集，其中，训练样本包括：搬运机器人的状态变量和控制变量；构建神经网络模型；利用获取的训练样本集对构建的神经网络模型进行训练，得到训练好的神经网络模型；其中，在路径跟踪控制过程中，训练好的神经网络模型输出控制变量，以便所述搬运机器人根据神经网络模型输出的控制变量进行路径跟踪。这样，通过将非线性模型预测控制和神经网络相结合，得到基于非线性模型预测控制和神经网络的(Nonlinear Model Predictive Control-Neural Network，NMPC-NN)控制方法，该方法结合了非线性模型预测控制跟踪精度高和神经网络控制实时性好的优势，在保持了较高跟踪精度的基础上，克服了非线性模型预测控制实时性较差的问题。

在前述基于神经网络的搬运机器人的路径跟踪控制方法的具体实施方式中，进一步地，所述利用非线性模型预测控制产生训练样本集包括：

建立搬运机器人的运动学模型；

将状态量x与控制量u之间的关系描述为

其中，

表示状态量x的微分，

表示x、u与

的函数关系；

x(t+i|t)＝x(t+i-1|t)+Tf(x(t+i-1|t),u(t+i-1|t))

在前述基于神经网络的搬运机器人的路径跟踪控制方法的具体实施方式中，进一步地，搬运机器人的运动学模型表示为：

其中，

为搬运机器人在全局坐标系XOY下沿X轴方向的速度，m/s；

为搬运机器人在全局坐标系XOY下沿Y轴方向的速度，m/s；v为搬运机器人的纵向速度，m/s；θ为航向角，rad；

ω均表示搬运机器人的横摆角速度，rad/s。

本实施例中，如图2所示，图2中L为搬运机器人车身宽度。假设该搬运机器人为刚性结构，并且不产生横向运动，则在全局坐标系XOY中，搬运机器人满足以下非完整约束方程：

这样，可以保证搬运机器人不产生横向移动。

本实施例中，可以将搬运机器人的运动学模型转换成状态空间方程，得到：

将上式进行改写，可以得到状态量x与控制量u之间的关系描述为

在前述基于神经网络的搬运机器人的路径跟踪控制方法的具体实施方式中，进一步地，建立的搬运机器人非线性模型预测控制的目标函数J表示为：

s.t.v∈(v_min,v_max)

△v∈(Δv_min,Δv_max)

△ω∈(△ω_min,△ω_max)

表示纵向加速度，

表示横摆角加速度；

分别为相应控制变量的最小值、最大值；ξ为预测到的搬运机器人的位姿信息与参考路径之间的位姿偏差；Q和R都表示权重矩阵；N_p为预测时域；N_c为控制时域；△U为控制时域内的控制增量序列，△U＝[△u(t|t),△u(t+1|t),…△u(t+N_c|t)]^T，△u为控制增量，△U中的第一个元素为搬运机器人的最优控制增量，即输出到搬运机器人的实际控制输入增量。

本实施例中，ξ(t+i|t)可以表示为：

其中，r(t+1|t)表示第t时刻第1个预测点对应的跟踪目标点/参考路径。

为便于试验中看出跟踪结果与跟踪目标点之间的偏差以及机器人当前位置与跟踪目标点的相对位置，给出搬运机器人路径跟踪控制的距离偏差定义，若目标点跟踪为：

r(t)＝[x(t) y(t) θ(t)]^T

由于搬运机器人纵向速度小且采样间隔小，如图3所示，搬运机器人在t时刻的位姿状态x(t)＝(x(t)，y(t))到最近的跟踪目标点r₁(t)切线的距离偏差d(t)可近似的认为x(t)到r₁(t)＝(x₁(t)，y₁(t))和第二个较近的跟踪目标点r₂(t)＝(x₂(t)，y₂(t))(一般为r₁(t)的前一个跟踪目标点或者后一个跟踪目标点)线段的垂直距离，即：

当d(t)<0时，x(t)在r₁(t)切线的左侧；当d(t)>0时，x(t)在r₁(t)切线的右侧；当d(t)＝0时，x(t)在r₁(t)切线上。

本实施例中，△u可以表示为：

本实施例中，为了防止搬运机器人轮胎发生侧滑，考虑侧向动力学约束，因此搬运机器人的约束条件包括纵向速度约束和执行器约束；其中，纵向速度约束可以设置为：

v_min<v<v_max

本实施例中，执行器约束中纵向速度增量

横摆角速度增量

假设搬运机器人纵向加速度的极限值为

横摆角加速度的极限值为

为了减少轮胎侧滑和急刹车导致机器人运行不稳定状况，最大纵向加速度设置为

最大横摆角加速度取

根据控制周期T，可得执行器约束为：

△v_min<△v<△v_max

△ω_min<△ω<△ω_max

综上所述，搬运机器人的约束条件为：

如图4所示，NMPC-NN控制根据参考路径r与搬运机器人的状态变量X，输出变量U对搬运机器人进行控制，其中，NMPC-NN控制主要包括三部分：训练样本集的选取和产生，神经网络结构的设计，基于训练样本集的神经网络模型的监督训练，其中，采用误差反向传播(BackPropagation，BP)算法训练神经网络模型。

如图5所示，神经网络模型以NMPC控制结果作为神经网络模型监督训练的样本，学习状态变量和控制变量之间的复杂非线性映射关系，实现NMPC-NN控制的离线训练和在线控制。

在前述基于神经网络的搬运机器人的路径跟踪控制方法的具体实施方式中，进一步地，训练样本中的状态变量为集合X＝[ω d △x △y △θ]^T中的多种变量，其中，ω为搬运机器人的横摆角速度、d为位姿状态到最近的跟踪目标点切线的距离偏差、△x为横向偏差、△y为纵向偏差、△θ为航向角偏差；

在前述基于神经网络的搬运机器人的路径跟踪控制方法的具体实施方式中，进一步地，构建的神经网络模型是q–m–2结构的控制器，q为输入层节点数，m为隐含层节点数，2为输出层节点数，–表示连接；

其中，

s为输入层节点数，即s＝q，e为输出层节点数，e＝2，a为常数系数，a取值范围是1-10。

本实施例中，输出层的节点数与非线性模型预测控制的控制增量数目相同。

在前述基于神经网络的搬运机器人的路径跟踪控制方法的具体实施方式中，进一步地，如图6所示，所述利用获取的训练样本集对构建的神经网络模型进行训练，得到训练好的神经网络模型包括：

其中，f为神经元的传递函数，具体可以是双曲正切函数(tansig)，tansig传递函数表示为：

若隐含层是多层，则输出层第k个神经元接收到的输入U_k为：

A4，确定神经网络模型输出层的输出

与训练样本集中相应的控制变量

之间的均方误差E_p，其中，p为训练样本的数目；

在前述基于神经网络的搬运机器人的路径跟踪控制方法的具体实施方式中，进一步地，均方误差E_p表示为：

在前述基于神经网络的搬运机器人的路径跟踪控制方法的具体实施方式中，进一步地，所述执行权值更新过程包括：

在前述基于神经网络的搬运机器人的路径跟踪控制方法的具体实施方式中，进一步地，所述执行权值调整过程包括：

以上所述是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明所述原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种基于神经网络的搬运机器人的路径跟踪控制方法，其特征在于，包括：

构建神经网络模型；

利用获取的训练样本集对构建的神经网络模型进行训练，得到训练好的神经网络模型；其中，在路径跟踪控制过程中，训练好的神经网络模型输出控制变量，以便所述搬运机器人根据神经网络模型输出的控制变量进行路径跟踪；

其中，所述利用非线性模型预测控制产生训练样本集包括：

建立搬运机器人的运动学模型；

确定搬运机器人的运动学模型的状态量x与控制量u；其中，状态量x＝[x y θ]^T，控制量u＝[v ω]^T，x、y分别表示搬运机器人在全局坐标系XOY下沿X轴、Y轴方向上的距离，θ为航向角，v为搬运机器人的纵向速度，ω表示搬运机器人的横摆角速度；

将状态量x与控制量u之间的关系描述为

其中，

表示状态量x的微分，

表示x、u与

的函数关系；

x(t+i|t)＝x(t+i-1|t)+Tf(x(t+i-1|t),u(t+i-1|t))

2.根据权利要求1所述的基于神经网络的搬运机器人的路径跟踪控制方法，其特征在于，搬运机器人的运动学模型表示为：

其中，

为搬运机器人在全局坐标系XOY下沿X轴方向的速度；

ω均表示搬运机器人的横摆角速度；

3.根据权利要求1所述的基于神经网络的搬运机器人的路径跟踪控制方法，其特征在于，建立的搬运机器人非线性模型预测控制的目标函数J表示为：

s.t.v∈(v_min,v_max)

Δv∈(Δv_min,Δv_max)

Δω∈(Δω_min,Δω_max)

其中，s.t.表示约束条件，v_min、v_max分别为纵向速度v的最小值、最大值；Δv_min、Δv_max分别为纵向速度增量Δv的最小值、最大值；Δω_min、Δω_max分别为横摆角速度增量Δω的最小值、最大值；

表示纵向加速度，

表示横摆角加速度；

分别为相应控制变量的最小值、最大值；ξ为预测到的搬运机器人的位姿信息与参考路径之间的位姿偏差；Q和R都表示权重矩阵；N_p为预测时域；N_c为控制时域；ΔU(t)为控制时域内的控制增量序列，ΔU＝[Δu(t|t),Δu(t+1|t),…Δu(t+N_c|t)]^T，Δu为控制增量，ΔU中的第一个元素为搬运机器人的最优控制增量，即输出到搬运机器人的实际控制输入增量。

4.根据权利要求1所述的基于神经网络的搬运机器人的路径跟踪控制方法，其特征在于，训练样本中的状态变量为集合X＝[ω d Δx Δy Δθ]^T中的多种变量，其中，ω为搬运机器人的横摆角速度、d为位姿状态到最近的跟踪目标点切线的距离偏差、Δx为横向偏差、Δy为纵向偏差、Δθ为航向角偏差；

训练样本中的控制变量U＝[U₁ U₂]^T，其中，U₁＝Δv(t+1)是搬运机器人下一时刻纵向速度增量，U₂＝Δω(t+1)是下一时刻横摆角速度增量。

5.根据权利要求1所述的基于神经网络的搬运机器人的路径跟踪控制方法，其特征在于，构建的神经网络模型是q–m–2结构的控制器，q为输入层节点数，m为隐含层节点数，2为输出层节点数，–表示连接；

其中，