CN106647272A - 基于k均值改进卷积神经网络的机器人路径规划方法 - Google Patents

基于k均值改进卷积神经网络的机器人路径规划方法 Download PDF

Info

Publication number
CN106647272A
CN106647272A CN201611213390.6A CN201611213390A CN106647272A CN 106647272 A CN106647272 A CN 106647272A CN 201611213390 A CN201611213390 A CN 201611213390A CN 106647272 A CN106647272 A CN 106647272A
Authority
CN
China
Prior art keywords
robot
convolutional neural
mean value
cluster
algorithm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201611213390.6A
Other languages
English (en)
Inventor
李文齐
吴国文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Donghua University
National Dong Hwa University
Original Assignee
Donghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Donghua University filed Critical Donghua University
Priority to CN201611213390.6A priority Critical patent/CN106647272A/zh
Publication of CN106647272A publication Critical patent/CN106647272A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance

Abstract

本发明提供了一种基于K均值改进卷积神经网络的机器人路径规划方法,该方法由以下3个步骤组成:步骤1:建立K均值聚类算法模型和BP网络;步骤2:将机器人的初始巡逻点位置输入K均值聚类模型;步骤3:将K均值聚类模型的输出结果作为BP网络的输入值,再进行训练,BP网络的输出值即为最优的机器人巡逻路径。本发明提供的方法,网络第一层采用K均值无监督学习,第二层采用BP算法有监督学习,既可以使训练所得到的特征与实际任务相关度增加,提高准确性;又可以减少需训练的参数,解决了梯度弥散问题。将改进后的算法应用于机器人路径规划,与其他主流算法对比实验结果表明,改进算法具有更高的准确率和更快的训练运行速度。

Description

基于K均值改进卷积神经网络的机器人路径规划方法
技术领域
本发明属于自动控制技术领域,特别是涉及一种基于K均值改进卷积神经网络的机器人路径规划方法。
背景技术
近年来,深度学习受到越来越多的关注,它被人们视为通向人工智能的关键环节。作为一种深度学习的典范,卷积神经网络得到了极大的促进和发展。2012年,克里泽夫斯基带领的团队运用深度卷积神经网络,在世界顶级赛事图像网络大规模视觉识别挑战赛中异军突起,打破了记录,最终成绩远远超过了其他算法的成绩。在目前的许多识别任务当中,卷积神经网络与人类其他同等识别水平的算法相比,具有不可替代的优越性。所以,对于解决深度学习问题以及其他各个相关领域的发展来说,卷积神经网络都具有划时代的意义。
对于一个输入输出型网络来说,学习算法对于它的性能好坏影响重大。大多数卷积神经网络中,有监督的学习方法占绝大多数,它往往存在这样的问题:需要训练的参数数量过多,对于参数来说不容易学习到一个最优值,而且还存在着过拟合的问题;有监督的学习方法相比于单层模型,往往还存在着梯度弥散等问题。这个问题一直困扰着研究人员,直到出现了逐层无监督的学习方式,这种学习方式虽然可以克服掉上述的梯度弥散或者是训练样本较少的问题,但是随之而来的也出现了许许多多新的问题,其中最主要的一个就是这种逐层无监督的学习所学习到的特征与实际所做的任务是独立的,对于所做的某些具体的问题,存在较差的鲁棒性,并不能够很好的解决,而且这种学习方式需要在上一层神经网络的参数完全得到确定之后,才可以学习下一层,训练较为繁琐。
在目前的主要方法中,区别在于有着不同方式的学习滤波器,完全的有监督的学习方式需要训练很多的参数,有的时候甚至会超过可以用的训练样本数,在目前最新的研究进展中,采用了权值共享以及局部连接的卷积神经网络,但是仍然无法解决参数数量较多的问题,参数也依然不能学习到最优值,这种完全有监督的学习与单层的模型相比,还存在着梯度弥散的问题。
发明内容
本发明要解决的技术问题是现有的卷积神经网络参数数量较多,参数不能学习到最优值,以及梯度弥散的问题。
为了解决上述技术问题,本发明的技术方案是提供一种基于K均值改进卷积神经网络的机器人路径规划方法,其特征在于:该方法由以下3个步骤组成:
步骤1:建立K均值聚类算法模型和BP网络;
步骤2:将机器人的初始巡逻点位置输入K均值聚类模型;
步骤3:将K均值聚类模型的输出结果作为BP网络的输入值,再进行训练,BP网络的输出值即为最优的机器人巡逻路径。
优选地,首先,K均值聚类算法的聚类中心与输入值进行卷积,得到输入值的特征;然后,通过池化减少特征维数,并获得平移不变性;由此得到基于K均值卷积层的输出结果,该输出结果作为BP网络的输入值。
优选地,假设数据样本集合(x1,x2,x3...xm)中,每一个数据样本xq都作为p维实向量,1≤q≤m,q、m、p均为正整数;K均值聚类算法就是要把共计m个数据样本划分到j个集合当中去,其中,j≤m,j为正整数;j个集合分别为Y={Y1,Y2,Y3...Yj};这样做的目的是使得结果中各簇的平方和相加的和最小;K均值聚类算法的目的就是为了找到:
式中,un是第n簇Yn中数据的均值,1≤n≤j,n为正整数;argYmin()表示使目标函数取最小值时的变量值。
更优选地,假设开始的j个均值点均为已知,上标1表示初始值,K均值聚类算法在进行学习训练时,是按照如下的步骤交替进行:
1)分配
采用欧几里得度量,将当前的数据点分配至距离最近的观测点。按照下式进行数据点分配:
式中,代表第n个集合,xq为数据样本,代表第n个均值点,ri (s)代表第i个均值点,均值点均为已知,s代表迭代次数,s、n、q、i、j均为正整数;尽管在理论上xq可以分配到两个及以上的类别中,但是在实际操作的过程中,xq都会只被分配到一个确定的聚簇当中去;
2)更新
通过计算第1)步中得到的新的聚类中心,来作为每一个聚类中心的均值点,按照如下公式进行计算:
式中,xi表示集合中的一个数据样本,s代表迭代次数,i为正整数,代表将集合中的数据样本xi进行求和;当各个聚类中心不再变化时,这一算法收敛于一个局部最优解。
本发明提供的方法克服了现有技术的不足,网络第一层采用K均值无监督学习,第二层采用BP算法有监督学习,既可以使训练所得到的特征与实际任务相关度增加,提高准确性;又可以减少需训练的参数,解决了梯度弥散问题。将改进后的算法应用于机器人路径规划,与其他主流算法对比实验结果表明,改进算法具有更高的准确率和更快的训练运行速度。
附图说明
图1为局部连接示意图;
图2为权值共享示意图;
图3为基于K均值改进的卷积神经网络示意图;
图4为改进算法的MATLAB仿真实验结果;(a)为机器人初始路径;(b)为算法优化后路径。
具体实施方式
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解,在阅读了本发明讲授的内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
本发明提供了一种基于K均值改进卷积神经网络的机器人路径规划方法,采用权值共享和局部连接来减少需学习的参数个数,提高效率。
如图1所示,每一层与其前一层采用的是局部连接而不是全连接,第1层的神经细胞与第1-1层的三个神经细胞相连接,采用局部连接的方式,第1层可以感受到的野的宽度为3。第1+1层的神经细胞与第1层的神经细胞也为局部连接。由于每个神经元对其所能感受到的野之外的神经元不会产生任何反应,这种结构可以大大减少神经元之间的连接数目,经过层层的堆叠,所学习到的过滤器会扩展到全局,不断覆盖到越来越大的区域。
采用权值共享的方法,将共享同一权值的神经元组织起来,形成二维平面,就可以得到关于他们的结构特征图。如图2中所示,连接权值的数目应该为15,在进行权值共享后,连接权值下降为三个,与之前相比降低了百分之八十。由此观之,运用权值共享策略可以在很大程度上减少需训练的参数个数。通过权值共享机制,可以模拟动物大脑皮层中的神经细胞,快速提取出输入信号的特征。
本发明的基于K均值改进卷积神经网络的机器人路径规划方法采用子采样操作,在两个方向来对特征图进行特征映射。以S为步长,以W×W为子区域范围,S、W均为正整数;一般情况下,1≤S≤W,通常取S=W,映射值通常为区域中的最大值或者是平均值。例如,在大小为6×6的特征图中,若对特征图中所有大小为2×2的连续子区域按照步长为6进行子采样,进行采样完成后特征图的大小可以变为3×3。通过子采样,可以大大减少神经细胞的个数,并对后续的神经网络总体复杂程度进行深度简化,模拟灵长类动物的神经元细胞,使得在输入发生变化时具有较好的鲁棒性。
学习算法对于输入输出型网络的性能有着重要影响。本实施例中,基于K均值改进卷积神经网络的机器人路径规划方法可以将有监督的学习方法与无监督的学习方法进行结合。第一层采用无监督学习,即K均值聚类算法;第二层采用有监督进行学习,BP算法。此种改进的卷积神经网络既可以使得训练所得到的特征与实际将要完成的任务相关度增加,极大地提高了分类准确性;又可以大大减少需要训练的参数,解决了梯度弥散问题。
K-means均值算法是一种进行向量量化的方法,这种算法的目的是把数据的样本点划分到K个聚类中,使每个点都与均值(即离它最近的聚类中心)有着相同的类别,并将这个法则作为聚类的标准。
假设所观测的数据样本集合(x1,x2,x3...xm)中,每一个数据样本xq都作为p维实向量,1≤q≤m,q、m、p均为正整数。K均值算法就是要把共计m个数据样本划分到j个集合当中去,其中,j≤m,j为正整数。j个集合分别为Y={Y1,Y2,Y3...Yj}。这样做的目的是使得结果中各簇的平方和相加的和最小。总而言之,K均值聚类算法的目的就是为了找到:
式中,un是第n簇Yn中数据的均值,1≤n≤j,n为正整数;argYmin()表示使目标函数取最小值时的变量值。
假设开始的j个均值点均为已知,上标1表示初始值,K均值聚类算法在进行学习训练时,是按照如下的步骤交替进行:
1)分配
采用欧几里得度量,将当前的数据点分配至距离最近的观测点。按照下式进行数据点分配:
式中,代表第n个集合,xq为数据样本,代表第n个均值点,ri (s)代表第i个均值点,均值点均为已知,s代表迭代次数,s、n、q、i、j均为正整数;其中,尽管在理论上xq可以分配到两个及以上的类别中,但是在实际操作的过程中,xq都会只被分配到一个确定的聚簇当中去;
2)更新
通过计算第1)步中得到的新的聚类中心,来作为每一个聚类中心的均值点,按照如下公式进行计算:
式中,xi表示集合中的一个数据样本,s代表迭代次数,i为正整数,代表将集合中的数据样本xi进行求和;当各个聚类中心不再变化时,这一算法收敛,但是,由于实际上分配方案是有限的,这一算法一般都会收敛于一个局部最优解。
在没有监督的训练过程中,通过K均值算法对没有数据标签的训练得到一个K均值聚类,这样就可以将输入的值映射到新的特征空间。
在通过K均值算法进行聚类以后,就可以运用得到的聚类中心进行特征值的提取,分为以下几个步骤:
1)将聚类结果与输入值进行卷积,就可以得到输入值的特征。
2)可以通过池化来减少特征维数,以加快收敛速度,并获得一定的平移不变性。
经过上述两个步骤,便可以得到基于K均值卷积层的输出结果。然后进入有监督的学习阶段,采用BP算法有监督学习,将上述结果作为BP网络输入,再进行训练。基于K均值改进的卷积神经网络示意图如图3所示。
采用MNIST数据集进行训练测试,并与其他主流算法进行对比。来验证基于K均值改进卷积神经网络的性能。卷积神经网络结构如下表1:
表1卷积神经网络结构
第二层为特征提取阶段,首先经过有监督的方式进行训练,然后在测试集上测试,并与其他主流算法进行对比,对比结果如表2:
表2在MNIST中改进算法与其他算法对比
对比结果表明,算法在MNIST数据集上有较好的正确率,且算法在试验时,采用的网络规模较小,因此,算法具有较高的准确率和较快的训练和运行速度。
将基于K均值改进卷积神经网络用于机器人最优路径规划中,为每个机器人的8个巡逻点设计一条最短巡逻路径,MATLAB仿真实验结果如图4所示。
在图4中,(a)是优化前的初始路径,它是由输入的巡逻点的次序决定的,(b)是优化后的路径,它是由寻优路径矩阵得出。可以得出,基于K均值改进的卷积神经网络可以将巡逻路径长度由4.02优化为2.83,效果明显。

Claims (4)

1.一种基于K均值改进卷积神经网络的机器人路径规划方法,其特征在于:该方法由以下3个步骤组成:
步骤1:建立K均值聚类算法模型和BP网络;
步骤2:将机器人的初始巡逻点位置输入K均值聚类模型;
步骤3:将K均值聚类模型的输出结果作为BP网络的输入值,再进行训练,BP网络的输出值即为最优的机器人巡逻路径。
2.如权利要求1所述的一种基于K均值改进卷积神经网络的机器人路径规划方法,其特征在于:首先,K均值聚类算法的聚类中心与输入值进行卷积,得到输入值的特征;然后,通过池化减少特征维数,并获得平移不变性;由此得到基于K均值卷积层的输出结果,该输出结果作为BP网络的输入值。
3.如权利要求1或2所述的一种基于K均值改进卷积神经网络的机器人路径规划方法,其特征在于:假设数据样本集合(x1,x2,x3...xm)中,每一个数据样本xq都作为p维实向量,1≤q≤m,q、m、p均为正整数;K均值聚类算法就是要把共计m个数据样本划分到j个集合当中去,其中,j≤m,j为正整数;j个集合分别为Y={Y1,Y2,Y3...Yj};这样做的目的是使得结果中各簇的平方和相加的和最小;K均值聚类算法的目的就是为了找到:
arg s minΣ n = 1 j Σ x ∈ Y n | | x - u n | | 2
式中,un是第n簇Yn中数据的均值,1≤n≤j,n为正整数;argYmin()表示使目标函数取最小值时的变量值。
4.如权利要求3所述的一种基于K均值改进卷积神经网络的机器人路径规划方法,其特征在于:假设开始的j个均值点均为已知,上标1表示初始值,K均值聚类算法在进行学习训练时,是按照如下的步骤交替进行:
1)分配
采用欧几里得度量,将当前的数据点分配至距离最近的观测点。按照下式进行数据点分配:
Y n ( s ) = { x q : | | x q - r n ( s ) | | 2 ≤ | | x q - r i ( s ) | | 2 ∀ i , 1 ≤ i ≤ j }
式中,代表第n个集合,xq为数据样本,代表第n个均值点,代表第i个均值点,均值点均为已知,s代表迭代次数,s、n、q、i、j均为正整数;其中,尽管在理论上xq可以分配到两个及以上的类别中,但是在实际操作的过程中,xq都会只被分配到一个确定的聚簇当中去;
2)更新
通过计算第1)步中得到的新的聚类中心,来作为每一个聚类中心的均值点,按照如下公式进行计算:
r n s + 1 = 1 | Y n ( s ) | Σ x i ∈ Y n ( s ) x i
式中,xi表示集合中的一个数据样本,s代表迭代次数,i为正整数,代表将集合中的数据样本xi进行求和;当各个聚类中心不再变化时,这一算法收敛于一个局部最优解。
CN201611213390.6A 2016-12-23 2016-12-23 基于k均值改进卷积神经网络的机器人路径规划方法 Pending CN106647272A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611213390.6A CN106647272A (zh) 2016-12-23 2016-12-23 基于k均值改进卷积神经网络的机器人路径规划方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611213390.6A CN106647272A (zh) 2016-12-23 2016-12-23 基于k均值改进卷积神经网络的机器人路径规划方法

Publications (1)

Publication Number Publication Date
CN106647272A true CN106647272A (zh) 2017-05-10

Family

ID=58827702

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611213390.6A Pending CN106647272A (zh) 2016-12-23 2016-12-23 基于k均值改进卷积神经网络的机器人路径规划方法

Country Status (1)

Country Link
CN (1) CN106647272A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108053067A (zh) * 2017-12-12 2018-05-18 深圳市易成自动驾驶技术有限公司 最优路径的规划方法、装置及计算机可读存储介质
CN109241603A (zh) * 2018-08-28 2019-01-18 浙江工业大学 一种固定式智能骑行台档位划分和功率拟合方法
CN109272021A (zh) * 2018-08-22 2019-01-25 广东工业大学 一种基于宽度学习的智能移动机器人导航方法
CN110705525A (zh) * 2019-10-24 2020-01-17 北京建筑大学 一种诊断滚动轴承故障的方法及装置
CN111399541A (zh) * 2020-03-30 2020-07-10 西北工业大学 无监督学习型神经网络的无人机全区域侦察路径规划方法
CN113281993A (zh) * 2021-05-11 2021-08-20 北京理工大学 一种贪心k-均值自组织神经网络多机器人路径规划方法
CN114683287A (zh) * 2022-04-25 2022-07-01 浙江工业大学 一种基于元动作分层泛化的机械臂模仿学习方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105550744A (zh) * 2015-12-06 2016-05-04 北京工业大学 一种基于迭代的神经网络聚类方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105550744A (zh) * 2015-12-06 2016-05-04 北京工业大学 一种基于迭代的神经网络聚类方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
JICHAO ZHANG,ET AL.: "BP Neural Network Model Based on the K-Means Clustering to Predict the Share Price", 《2012 FIFTH INTERNATIONAL JOINT CONFERENCE ON COMPUTATIONAL SCIENCES AND OPTIMIZATION》 *
XIN GUANG LI,ET AL.: "Speech Recognition Based on K-means Clustering and Neural Network Ensembles", 《2011 SEVENTH INTERNATIONAL CONFERENCE ON NATURAL COMPUTATION》 *
何迎生等: "基于改进Kmeans聚类方法的RBF神经网络设计", 《邵阳学院学报(自然科学版)》 *
何鹏程: "改进的卷积神经网络模型及其应用研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108053067A (zh) * 2017-12-12 2018-05-18 深圳市易成自动驾驶技术有限公司 最优路径的规划方法、装置及计算机可读存储介质
CN109272021A (zh) * 2018-08-22 2019-01-25 广东工业大学 一种基于宽度学习的智能移动机器人导航方法
CN109272021B (zh) * 2018-08-22 2022-03-04 广东工业大学 一种基于宽度学习的智能移动机器人导航方法
CN109241603A (zh) * 2018-08-28 2019-01-18 浙江工业大学 一种固定式智能骑行台档位划分和功率拟合方法
CN109241603B (zh) * 2018-08-28 2023-05-26 浙江工业大学 一种固定式智能骑行台档位划分和功率拟合方法
CN110705525A (zh) * 2019-10-24 2020-01-17 北京建筑大学 一种诊断滚动轴承故障的方法及装置
CN111399541A (zh) * 2020-03-30 2020-07-10 西北工业大学 无监督学习型神经网络的无人机全区域侦察路径规划方法
CN111399541B (zh) * 2020-03-30 2022-07-15 西北工业大学 无监督学习型神经网络的无人机全区域侦察路径规划方法
CN113281993A (zh) * 2021-05-11 2021-08-20 北京理工大学 一种贪心k-均值自组织神经网络多机器人路径规划方法
CN113281993B (zh) * 2021-05-11 2022-05-27 北京理工大学 一种贪心k-均值自组织神经网络多机器人路径规划方法
CN114683287A (zh) * 2022-04-25 2022-07-01 浙江工业大学 一种基于元动作分层泛化的机械臂模仿学习方法
CN114683287B (zh) * 2022-04-25 2023-10-20 浙江工业大学 一种基于元动作分层泛化的机械臂模仿学习方法

Similar Documents

Publication Publication Date Title
CN106647272A (zh) 基于k均值改进卷积神经网络的机器人路径规划方法
CN107563422B (zh) 一种基于半监督卷积神经网络的极化sar分类方法
CN108062572A (zh) 一种基于DdAE深度学习模型的水电机组故障诊断方法与系统
CN105320961A (zh) 基于卷积神经网络和支持向量机的手写数字识别方法
WO2021007801A1 (zh) 基于多尺度深度卷积网络的氧化铝综合生产指标决策方法
CN107256393A (zh) 基于深度学习的一维生理信号的特征提取与状态识别
CN110473592B (zh) 一种多视角人类协同致死基因预测方法
CN108573303A (zh) 一种基于改进强化学习的复杂网络局部破坏的自改进恢复策略
Zhang et al. A cable fault recognition method based on a deep belief network
CN106021990B (zh) 一种将生物基因以特定的性状进行分类与自我识别的方法
CN110852365B (zh) 一种zpw-2000a型无绝缘轨道电路故障诊断方法
CN103971160A (zh) 基于复杂网络的粒子群优化方法
CN115907001B (zh) 基于知识蒸馏的联邦图学习方法及自动驾驶方法
CN108845974A (zh) 采用最小最大概率机的分离概率的有监督线性降维方法
CN107153837A (zh) 深度结合K‑means和PSO的聚类方法
CN104200096A (zh) 基于微分进化算法和bp神经网络的避雷器均压环优化法
CN107092987A (zh) 一种中小型无人机自主着舰风速预测方法
CN111988329A (zh) 一种基于深度学习的网络入侵检测方法
CN114419376B (zh) 一种多模态渐进式联邦学习的图像识别方法
CN113222035B (zh) 基于强化学习和知识蒸馏的多类别不平衡故障分类方法
CN108876144B (zh) 一种基于深度学习算法的变电站预选址方法
CN105334730A (zh) 加热炉氧含量的iga优化t-s模糊arx建模方法
Wang et al. Classification of histopathologic images of breast cancer by multi-teacher small-sample knowledge distillation
CN114861792A (zh) 一种基于深度强化学习的复杂电网关键节点识别方法
Altundogan et al. Genetic algorithm based fuzzy cognitive map concept relationship determination and sigmoid configuration

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20170510

WD01 Invention patent application deemed withdrawn after publication