CN106647272A

CN106647272A - 基于k均值改进卷积神经网络的机器人路径规划方法

Info

Publication number: CN106647272A
Application number: CN201611213390.6A
Authority: CN
Inventors: 李文齐; 吴国文
Original assignee: Donghua University
Current assignee: Donghua University; National Dong Hwa University
Priority date: 2016-12-23
Filing date: 2016-12-23
Publication date: 2017-05-10

Abstract

本发明提供了一种基于K均值改进卷积神经网络的机器人路径规划方法，该方法由以下3个步骤组成：步骤1：建立K均值聚类算法模型和BP网络；步骤2：将机器人的初始巡逻点位置输入K均值聚类模型；步骤3：将K均值聚类模型的输出结果作为BP网络的输入值，再进行训练，BP网络的输出值即为最优的机器人巡逻路径。本发明提供的方法，网络第一层采用K均值无监督学习，第二层采用BP算法有监督学习，既可以使训练所得到的特征与实际任务相关度增加，提高准确性；又可以减少需训练的参数，解决了梯度弥散问题。将改进后的算法应用于机器人路径规划，与其他主流算法对比实验结果表明，改进算法具有更高的准确率和更快的训练运行速度。

Description

基于K均值改进卷积神经网络的机器人路径规划方法

技术领域

本发明属于自动控制技术领域，特别是涉及一种基于K均值改进卷积神经网络的机器人路径规划方法。

背景技术

近年来，深度学习受到越来越多的关注，它被人们视为通向人工智能的关键环节。作为一种深度学习的典范，卷积神经网络得到了极大的促进和发展。2012年，克里泽夫斯基带领的团队运用深度卷积神经网络，在世界顶级赛事图像网络大规模视觉识别挑战赛中异军突起，打破了记录，最终成绩远远超过了其他算法的成绩。在目前的许多识别任务当中，卷积神经网络与人类其他同等识别水平的算法相比，具有不可替代的优越性。所以，对于解决深度学习问题以及其他各个相关领域的发展来说，卷积神经网络都具有划时代的意义。

对于一个输入输出型网络来说，学习算法对于它的性能好坏影响重大。大多数卷积神经网络中，有监督的学习方法占绝大多数，它往往存在这样的问题：需要训练的参数数量过多，对于参数来说不容易学习到一个最优值，而且还存在着过拟合的问题；有监督的学习方法相比于单层模型，往往还存在着梯度弥散等问题。这个问题一直困扰着研究人员，直到出现了逐层无监督的学习方式，这种学习方式虽然可以克服掉上述的梯度弥散或者是训练样本较少的问题，但是随之而来的也出现了许许多多新的问题，其中最主要的一个就是这种逐层无监督的学习所学习到的特征与实际所做的任务是独立的，对于所做的某些具体的问题，存在较差的鲁棒性，并不能够很好的解决，而且这种学习方式需要在上一层神经网络的参数完全得到确定之后，才可以学习下一层，训练较为繁琐。

在目前的主要方法中，区别在于有着不同方式的学习滤波器，完全的有监督的学习方式需要训练很多的参数，有的时候甚至会超过可以用的训练样本数，在目前最新的研究进展中，采用了权值共享以及局部连接的卷积神经网络，但是仍然无法解决参数数量较多的问题，参数也依然不能学习到最优值，这种完全有监督的学习与单层的模型相比，还存在着梯度弥散的问题。

发明内容

本发明要解决的技术问题是现有的卷积神经网络参数数量较多，参数不能学习到最优值，以及梯度弥散的问题。

为了解决上述技术问题，本发明的技术方案是提供一种基于K均值改进卷积神经网络的机器人路径规划方法，其特征在于：该方法由以下3个步骤组成：

步骤1：建立K均值聚类算法模型和BP网络；

步骤2：将机器人的初始巡逻点位置输入K均值聚类模型；

步骤3：将K均值聚类模型的输出结果作为BP网络的输入值，再进行训练，BP网络的输出值即为最优的机器人巡逻路径。

优选地，首先，K均值聚类算法的聚类中心与输入值进行卷积，得到输入值的特征；然后，通过池化减少特征维数，并获得平移不变性；由此得到基于K均值卷积层的输出结果，该输出结果作为BP网络的输入值。

优选地，假设数据样本集合(x₁，x₂，x₃...x_m)中，每一个数据样本x_q都作为p维实向量，1≤q≤m，q、m、p均为正整数；K均值聚类算法就是要把共计m个数据样本划分到j个集合当中去，其中，j≤m，j为正整数；j个集合分别为Y＝{Y₁，Y₂，Y₃...Y_j}；这样做的目的是使得结果中各簇的平方和相加的和最小；K均值聚类算法的目的就是为了找到：

式中，u_n是第n簇Y_n中数据的均值，1≤n≤j，n为正整数；arg_Ymin()表示使目标函数取最小值时的变量值。

更优选地，假设开始的j个均值点均为已知，上标1表示初始值，K均值聚类算法在进行学习训练时，是按照如下的步骤交替进行：

1)分配

采用欧几里得度量，将当前的数据点分配至距离最近的观测点。按照下式进行数据点分配：

式中，代表第n个集合，x_q为数据样本，代表第n个均值点，r_i ^(s)代表第i个均值点，均值点均为已知，s代表迭代次数，s、n、q、i、j均为正整数；尽管在理论上x_q可以分配到两个及以上的类别中，但是在实际操作的过程中，x_q都会只被分配到一个确定的聚簇当中去；

2)更新

通过计算第1)步中得到的新的聚类中心，来作为每一个聚类中心的均值点，按照如下公式进行计算：

式中，x_i表示集合中的一个数据样本，s代表迭代次数，i为正整数，代表将集合中的数据样本x_i进行求和；当各个聚类中心不再变化时，这一算法收敛于一个局部最优解。

本发明提供的方法克服了现有技术的不足，网络第一层采用K均值无监督学习，第二层采用BP算法有监督学习，既可以使训练所得到的特征与实际任务相关度增加，提高准确性；又可以减少需训练的参数，解决了梯度弥散问题。将改进后的算法应用于机器人路径规划，与其他主流算法对比实验结果表明，改进算法具有更高的准确率和更快的训练运行速度。

附图说明

图1为局部连接示意图；

图2为权值共享示意图；

图3为基于K均值改进的卷积神经网络示意图；

图4为改进算法的MATLAB仿真实验结果；(a)为机器人初始路径；(b)为算法优化后路径。

具体实施方式

下面结合具体实施例，进一步阐述本发明。应理解，这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解，在阅读了本发明讲授的内容之后，本领域技术人员可以对本发明作各种改动或修改，这些等价形式同样落于本申请所附权利要求书所限定的范围。

本发明提供了一种基于K均值改进卷积神经网络的机器人路径规划方法，采用权值共享和局部连接来减少需学习的参数个数，提高效率。

如图1所示，每一层与其前一层采用的是局部连接而不是全连接，第1层的神经细胞与第1-1层的三个神经细胞相连接，采用局部连接的方式，第1层可以感受到的野的宽度为3。第1+1层的神经细胞与第1层的神经细胞也为局部连接。由于每个神经元对其所能感受到的野之外的神经元不会产生任何反应，这种结构可以大大减少神经元之间的连接数目，经过层层的堆叠，所学习到的过滤器会扩展到全局，不断覆盖到越来越大的区域。

采用权值共享的方法，将共享同一权值的神经元组织起来，形成二维平面，就可以得到关于他们的结构特征图。如图2中所示，连接权值的数目应该为15，在进行权值共享后，连接权值下降为三个，与之前相比降低了百分之八十。由此观之，运用权值共享策略可以在很大程度上减少需训练的参数个数。通过权值共享机制，可以模拟动物大脑皮层中的神经细胞，快速提取出输入信号的特征。

本发明的基于K均值改进卷积神经网络的机器人路径规划方法采用子采样操作，在两个方向来对特征图进行特征映射。以S为步长，以W×W为子区域范围，S、W均为正整数；一般情况下，1≤S≤W，通常取S＝W，映射值通常为区域中的最大值或者是平均值。例如，在大小为6×6的特征图中，若对特征图中所有大小为2×2的连续子区域按照步长为6进行子采样，进行采样完成后特征图的大小可以变为3×3。通过子采样，可以大大减少神经细胞的个数，并对后续的神经网络总体复杂程度进行深度简化，模拟灵长类动物的神经元细胞，使得在输入发生变化时具有较好的鲁棒性。

学习算法对于输入输出型网络的性能有着重要影响。本实施例中，基于K均值改进卷积神经网络的机器人路径规划方法可以将有监督的学习方法与无监督的学习方法进行结合。第一层采用无监督学习，即K均值聚类算法；第二层采用有监督进行学习，BP算法。此种改进的卷积神经网络既可以使得训练所得到的特征与实际将要完成的任务相关度增加，极大地提高了分类准确性；又可以大大减少需要训练的参数，解决了梯度弥散问题。

K-means均值算法是一种进行向量量化的方法，这种算法的目的是把数据的样本点划分到K个聚类中，使每个点都与均值(即离它最近的聚类中心)有着相同的类别，并将这个法则作为聚类的标准。

假设所观测的数据样本集合(x₁，x₂，x₃...x_m)中，每一个数据样本x_q都作为p维实向量，1≤q≤m，q、m、p均为正整数。K均值算法就是要把共计m个数据样本划分到j个集合当中去，其中，j≤m，j为正整数。j个集合分别为Y＝{Y₁，Y₂，Y₃...Y_j}。这样做的目的是使得结果中各簇的平方和相加的和最小。总而言之，K均值聚类算法的目的就是为了找到：

假设开始的j个均值点均为已知，上标1表示初始值，K均值聚类算法在进行学习训练时，是按照如下的步骤交替进行：

1)分配

式中，代表第n个集合，x_q为数据样本，代表第n个均值点，r_i ^(s)代表第i个均值点，均值点均为已知，s代表迭代次数，s、n、q、i、j均为正整数；其中，尽管在理论上x_q可以分配到两个及以上的类别中，但是在实际操作的过程中，x_q都会只被分配到一个确定的聚簇当中去；

2)更新

式中，x_i表示集合中的一个数据样本，s代表迭代次数，i为正整数，代表将集合中的数据样本x_i进行求和；当各个聚类中心不再变化时，这一算法收敛，但是，由于实际上分配方案是有限的，这一算法一般都会收敛于一个局部最优解。

在没有监督的训练过程中，通过K均值算法对没有数据标签的训练得到一个K均值聚类，这样就可以将输入的值映射到新的特征空间。

在通过K均值算法进行聚类以后，就可以运用得到的聚类中心进行特征值的提取，分为以下几个步骤：

1)将聚类结果与输入值进行卷积，就可以得到输入值的特征。

2)可以通过池化来减少特征维数，以加快收敛速度，并获得一定的平移不变性。

经过上述两个步骤，便可以得到基于K均值卷积层的输出结果。然后进入有监督的学习阶段，采用BP算法有监督学习，将上述结果作为BP网络输入，再进行训练。基于K均值改进的卷积神经网络示意图如图3所示。

采用MNIST数据集进行训练测试，并与其他主流算法进行对比。来验证基于K均值改进卷积神经网络的性能。卷积神经网络结构如下表1：

表1卷积神经网络结构

第二层为特征提取阶段，首先经过有监督的方式进行训练，然后在测试集上测试，并与其他主流算法进行对比，对比结果如表2：

表2在MNIST中改进算法与其他算法对比

对比结果表明，算法在MNIST数据集上有较好的正确率，且算法在试验时，采用的网络规模较小，因此，算法具有较高的准确率和较快的训练和运行速度。

将基于K均值改进卷积神经网络用于机器人最优路径规划中，为每个机器人的8个巡逻点设计一条最短巡逻路径，MATLAB仿真实验结果如图4所示。

在图4中，(a)是优化前的初始路径，它是由输入的巡逻点的次序决定的，(b)是优化后的路径，它是由寻优路径矩阵得出。可以得出，基于K均值改进的卷积神经网络可以将巡逻路径长度由4.02优化为2.83，效果明显。

Claims

1.一种基于K均值改进卷积神经网络的机器人路径规划方法，其特征在于：该方法由以下3个步骤组成：

步骤1：建立K均值聚类算法模型和BP网络；

步骤2：将机器人的初始巡逻点位置输入K均值聚类模型；

2.如权利要求1所述的一种基于K均值改进卷积神经网络的机器人路径规划方法，其特征在于：首先，K均值聚类算法的聚类中心与输入值进行卷积，得到输入值的特征；然后，通过池化减少特征维数，并获得平移不变性；由此得到基于K均值卷积层的输出结果，该输出结果作为BP网络的输入值。

3.如权利要求1或2所述的一种基于K均值改进卷积神经网络的机器人路径规划方法，其特征在于：假设数据样本集合(x₁，x₂，x₃...x_m)中，每一个数据样本x_q都作为p维实向量，1≤q≤m，q、m、p均为正整数；K均值聚类算法就是要把共计m个数据样本划分到j个集合当中去，其中，j≤m，j为正整数；j个集合分别为Y＝{Y₁，Y₂，Y₃...Y_j}；这样做的目的是使得结果中各簇的平方和相加的和最小；K均值聚类算法的目的就是为了找到：

\arg_{s} {minΣ}_{n = 1}^{j} Σ_{x &Element; Y_{n}} | | x - u_{n} | |^{2}

4.如权利要求3所述的一种基于K均值改进卷积神经网络的机器人路径规划方法，其特征在于：假设开始的j个均值点均为已知，上标1表示初始值，K均值聚类算法在进行学习训练时，是按照如下的步骤交替进行：

1)分配

Y_{n}^{(s)} = {x_{q} : | | x_{q} - r_{n}^{(s)} | |^{2} \leq | | x_{q} - r_{i}^{(s)} | |^{2} &ForAll; i, 1 \leq i \leq j}

式中，代表第n个集合，x_q为数据样本，代表第n个均值点，代表第i个均值点，均值点均为已知，s代表迭代次数，s、n、q、i、j均为正整数；其中，尽管在理论上x_q可以分配到两个及以上的类别中，但是在实际操作的过程中，x_q都会只被分配到一个确定的聚簇当中去；

2)更新

r_{n}^{s + 1} = \frac{1}{| Y_{n}^{(s)} |} Σ_{x_{i} &Element; Y_{n}^{(s)}} x_{i}