CN106339715A

CN106339715A - 一种适应于采摘机器人的数据分类优化算法

Info

Publication number: CN106339715A
Application number: CN201610663886.7A
Authority: CN
Inventors: 段云涛; 潘力; 白光远; 陈长法; 薛磊; 刘美丽; 段晨阳
Original assignee: Nanyang Institute of Technology
Current assignee: Nanyang Institute of Technology
Priority date: 2016-08-03
Filing date: 2016-08-03
Publication date: 2017-01-18
Anticipated expiration: 2036-08-03
Also published as: CN106339715B

Abstract

本发明公开了一种适应于采摘机器人的数据分类优化算法，其特征在于，包括：S1.定义环境中m个监测节点一个中心节点N，对象集合用U表示，个数为n；S2.输入训练集d＝{(X_i，Y_i)，1≤i≤N)，X_i为第i个样本的条件属性，Y_i为类别，d为距离函数；S3.定义O_i为某监测对象，Δ_i，j为监测点N_i接受的O_i的评价分数增量，V_i，j为本地评分；S4.监测点N_i接收到二元组＜O_i，Δ_i，j＞后，若则将O_i加入到U中，若O_i∈U，则改变对象的评分V_i，j＝Δ_i，j+V_i，j；S5.把评分符合要求的输出；不符合要求的丢弃；S6.把S5输出的数据，转化成新样本X表示；S7.循环计算向量X和每个样本X_i之间的距离d(X_i，X)；S8.对得到的距离数据进行排序；S9.选择排序后样本中的前K个数据，S＝{(X_i1，Y_i1)...(X_ik，Y_ik)}；S10.依据S中类别出线的次数，确定X所属类别。

Description

一种适应于采摘机器人的数据分类优化算法

技术领域

本发明涉及一种适应于采摘机器人的数据分类优化算法。

背景技术

采摘机器人在采摘作业过程中，为了提高其机动性，需要实时监测采摘环境的信息，因此会产生大量的实时通信数据，而采用数据分类器的方法是常用方法。自动分类器主要又分两种，一种是将特征的数据空间划分为决策域，这需要确定分界面方程和判别函数，另一种方法是模式匹配，将待分类的样本数据和已归类的标准模板进行对比，利用匹配度来决定待测样本数据的分类。模式识别系统主要由两部分组成，其中包括提取器和分类器，其中最常用的是K邻近分类器和一种局部平均向量分类器(LMC)。

一个完整的分类过程主要包括模型的构造、模型测试和模型应用，具体如下：

(1)模型构造

模型的构造主要是特征的提取，从以往的样本数据中找到一些具备特征间的依赖关系，然后用特地的关系模型表达出来，比如利用病历样本和诊断结果来构建诊断模型。构建模型的数据被称作训练样本。

(2)模型测试

模型测试主要是对构建模型的准确度进行评价，从而确定类别模型，而用来评价的数据被称作测试样本。测试过程需要对测试样本中的数据逐一进行监测，根据模型来确定测试数据的类别，然后将测试结果和实际情况进行比较，测试结果和实际情况相吻合，则说明预测结果是正确的，否则是错误的，需要重新调整构造模型。

(3)模型应用

模型的应用是使用已经确认的分类模型来预测未知的模型，从而确定待测模型的类型。

采摘机器人的模式识别就是将特征数据提取出来，然后根据数据的特征进行分类识别，在采摘作业过程中，其特征数据可以根据成熟果实的颜色进行分类，而较为有效的方法是最邻近算法。最邻近算法是将所有的训练样本都作为分类数据，进行识别时需要统计所有样本点的特征邻近程度，从而可以得到与训练样本最邻近所属的类别。假设有c个分类，其模式分别为w₁，w₂，...，w_c，每个分类有N_i(i＝1，2，...，c)个训练样本，其中类的判别函数为

g_i(x)＝min||x-x_i ^k||，k＝1，2，...，N

其中x_i ^k的角标i表示w_i类，k表示w_i类N_i个样本中的第k个，分类器的决策可以定义为g_j(x)＝ming_i(x)，i＝1，2，...，c，则决策x∈w_j。

使用这种方法是根据果实的颜色之间具有近邻的相似特性，然后在多维空间Rⁿ中寻找与样本比较接近的k个点，最后根据k个点来判断待识别模式的类，这些点表示待识别样本的k-最近邻。这种算法是在一定的空间内，假设所有的待采摘果实都对应在n维空间中，一个果实特征向量为<a₁(x)，a₂(x)，...，a_n(x)>，其中，a_r(x)表示果实x的第r个属性值，将两个果实x_i，x_j之间的距离定义d(x_i，x_j)，其中：

d (x_{i}, x_{j}) = \sqrt{Σ_{r = 1}^{n} {(a_{r} (x_{i}) - a_{r} (x_{j}))}^{2}}

在最邻近算法中，目标分类函数可以定义为f：Rⁿ-＞V，其中V表示有限的集合{v₁，v₂，...，v_s}，其中k值的选择是根据样本数目和样本的离散程度来定的。如果在待采摘果实样本s_i周围的样本点的数据较少，那么对于k个点所覆盖的范围就会较大，反之则会较小。这种模式识别方法没有具体的学习过程，而是基于已知样本数据特征，对未知样本的预测，属于实例推测，如果k等于1，则成为NN算法。理论上，只要果实样本的数据足够多，该算法就可以进行很好的分类。

传统的基于模式识别的采摘机器人面对大量的实时监测数据，存在内存利用率底和通信效率不高，机动性不高等缺点。

发明内容

本发明要解决的问题是：提供一种适应于采摘机器人的数据分类优化算法，该算法能使采摘机器人采用实时监测数据分类器可以有效的对大量的数据进行筛选，从而降低了通信负担，提高了内存的利用率和采摘作业的效率。

本发明解决上述技术问题的技术方案如下：一种适应于采摘机器人的数据分类优化算法，主要整合K邻近和top-k的数据分类优化算法，其包括：top-k算法，用来把监测数据进行数据的调度；K邻近算法，用来将特征数据提取出来，然后根据数据的特征进行分类识别。

具体的优化算法步骤：

S1.定义采摘环境中有m个监测节点，其编号为N₁、N₂...N_m和一个中心节点N，在实时监测系统中某一时刻对象的集合用U表示，U中元素个数用n表示；

S2.输入果实样本的训练数据集d＝{(X_i，Y_i)，1≤i≤N}，其中X_i表示第i个样本的条件属性，Y_i表示类别，X表示新样本，d表示距离函数；

S3.定义O_i为某一个监测对象，Δ_i，j表示N_i接受到的O_i的评价分数增量，V_i，j表示本地评分；

S4.当某个监测点N_i接收到二元组<O_i，Δ_i，j>后，若则将O_i加入到U中，如果O_i∈U，则需要改变对象的评分V_i，j＝Δ_i，j+V_i，j；

S5.把评分符合要求的输出；不符合要求的丢弃；

S6.把S5输出的数据，转化成新样本数据X表示；

S7.循环计算，求解向量X和每个样本X_i之间的距离d(X_i，X)；

S8.根据得到的距离数据，对距离进行排序，从而得到d(X，X_i1)≤d(X，X_i2)≤...≤d(X，X_iN)；

S9.根据距离选择数据样本中的前K个数据，S＝{(X_i1，Y_i1)...(X_ik，Y_ik)}；

S10.通过对S中类别出线的次数，从而确定X所属类别。

本发明的有益效果是：

通过本发明一种适应于采摘机器人的数据分类优化算法，可以有效的对监测数据进行筛选，在数据传输之前完成操作，有效的提高通信的效率，同时，采用数据分类器的方法可以对大量的数据进行分类，只将有效信息进行通信，提高内存的利用率和通信效率，提高了采摘机器人的作业效率。

附图说明

通过结合以下附图所作的详细描述，本发明的上述和/或其他方面和优点将变得更清楚和更容易理解，这些附图只是示意性的，并不限制本发明，其中：

图1为本发明提供的采摘环境监测数据top-k架构；

图2为本发明提供的监测数据点分布；

图3为本发明算法的流程；

图4为本发明K＝1和K＝3的分类结果对比图；

图5为本发明K＝5和K＝7的分类结果对比图；

图6为本发明的算法与单独采用K邻近的通信量对比；

图7为本发明的算法与单独采用K邻近的内存利用率对比；

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整的描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他的实施例，都属于本发明保护的范围。

以果实采摘监测点为研究对象，根据果实的成熟度，可以利用top-k的监测结果来实现数据的调度，从而缓解通信压力，其中top-k算法的架构如图1所示，图2设计的采摘机器人的作业实验，实验为一个范围是50×50的二维平面，平面内设置了130个传感器节点。

图3是本发明一种适应于采摘机器人的数据分类优化算法，具体的优化算法步骤：

S3.定义O_i为某一个监测对象，Δ_i，j.表示N_i接受到的O_i的评价分数增量，V_i，j表示本地评分；

S5.把评分符合要求的输出；不符合要求的丢弃；

S6.把S5输出的数据，转化成新样本数据X表示；

S7.循环计算，求解向量X和每个样本X_i之间的距离d(X_i，X)；

S10.通过对S中类别出线的次数，从而确定X所属类别。

在本发明进行实验时，首先将K临近值设置为1和3，通过实验测试，得到的分类结果，如图4所示。由分类结果可以看出，利用k邻近分类器可以有效的对成熟果实区域进行划分，并且可以改变k值来得到不同的划分效果，再次改变K临近值，将其值设置为5和7，通过实验得到了如图5所示的分类结果。综合图4、图5可以看出，K邻近算法可以有效的对数据样本点进行分类，并且随着K值得增大，可以得到较好的分类结果，从而为采摘机器人对成熟果实的识别奠定了数据基础，也可以有效的减少通信次数。

为了验证本发明中的K邻近分类器的可靠性，将K邻近算法和LMC算法的准确率进行了对比，如表1所示

表1

从测试数据结果可以看出，K邻近算法分类器得道的准确率要比LMC的准确率高，从而验证了算法的可靠性。

为了验证通信量性能，将本发明的K邻近和top-k联合算法与传统的单独使用K邻近算法进行对比，如图6所示，由图可以明显的看出，使用本发明的K邻近和top-k联合算法在完成相同任务时可以明显降低通信量，提高通信效率。

为了验证内存利用率性能，将本发明的K邻近和top-k联合算法与传统的单独使用K邻近算法进行对比，如图7所示，由图可以明显的看出，使用K邻近和top-k联合算法的内存利用率要明显比单独使用K邻近算法高，从而有效的节约了内存的耗费，降低了采摘机器人的设计成本，提高了作业效率。

上述披露的各技术特征并不限于已披露的与其它特征的组合，本领域技术人员还可根据发明之目的进行各技术特征之间的其它组合，以实现本发明之目的为准。

Claims

1.一种适应于采摘机器人的数据分类优化算法，其特征在于，包括：

S1.定义采摘环境中有m个监测节点，其编号为N₁、N₂…N_m和一个中心节点N，在实时监测系统中某一时刻对象的集合用U表示，U中元素个数用n表示；

S5.把评分符合要求的输出；不符合要求的丢弃。

S6.把S5输出的数据，转化成新样本数据X表示；

S7.循环计算，求解向量X和每个样本X_i之间的距离d(X_i，X)；

S10.通过对S中类别出线的次数，从而确定X所属类别。