CN106339715A - 一种适应于采摘机器人的数据分类优化算法 - Google Patents
一种适应于采摘机器人的数据分类优化算法 Download PDFInfo
- Publication number
- CN106339715A CN106339715A CN201610663886.7A CN201610663886A CN106339715A CN 106339715 A CN106339715 A CN 106339715A CN 201610663886 A CN201610663886 A CN 201610663886A CN 106339715 A CN106339715 A CN 106339715A
- Authority
- CN
- China
- Prior art keywords
- data
- sample
- monitoring
- distance
- represent
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Feedback Control In General (AREA)
- Manipulator (AREA)
Abstract
本发明公开了一种适应于采摘机器人的数据分类优化算法,其特征在于,包括:S1.定义环境中m个监测节点一个中心节点N,对象集合用U表示,个数为n;S2.输入训练集d={(Xi,Yi),1≤i≤N),Xi为第i个样本的条件属性,Yi为类别,d为距离函数;S3.定义Oi为某监测对象,Δi,j为监测点Ni接受的Oi的评价分数增量,Vi,j为本地评分;S4.监测点Ni接收到二元组<Oi,Δi,j>后,若则将Oi加入到U中,若Oi∈U,则改变对象的评分Vi,j=Δi,j+Vi,j;S5.把评分符合要求的输出;不符合要求的丢弃;S6.把S5输出的数据,转化成新样本X表示;S7.循环计算向量X和每个样本Xi之间的距离d(Xi,X);S8.对得到的距离数据进行排序;S9.选择排序后样本中的前K个数据,S={(Xi1,Yi1)...(Xik,Yik)};S10.依据S中类别出线的次数,确定X所属类别。
Description
技术领域
本发明涉及一种适应于采摘机器人的数据分类优化算法。
背景技术
采摘机器人在采摘作业过程中,为了提高其机动性,需要实时监测采摘环境的信息,因此会产生大量的实时通信数据,而采用数据分类器的方法是常用方法。自动分类器主要又分两种,一种是将特征的数据空间划分为决策域,这需要确定分界面方程和判别函数,另一种方法是模式匹配,将待分类的样本数据和已归类的标准模板进行对比,利用匹配度来决定待测样本数据的分类。模式识别系统主要由两部分组成,其中包括提取器和分类器,其中最常用的是K邻近分类器和一种局部平均向量分类器(LMC)。
一个完整的分类过程主要包括模型的构造、模型测试和模型应用,具体如下:
(1)模型构造
模型的构造主要是特征的提取,从以往的样本数据中找到一些具备特征间的依赖关系,然后用特地的关系模型表达出来,比如利用病历样本和诊断结果来构建诊断模型。构建模型的数据被称作训练样本。
(2)模型测试
模型测试主要是对构建模型的准确度进行评价,从而确定类别模型,而用来评价的数据被称作测试样本。测试过程需要对测试样本中的数据逐一进行监测,根据模型来确定测试数据的类别,然后将测试结果和实际情况进行比较,测试结果和实际情况相吻合,则说明预测结果是正确的,否则是错误的,需要重新调整构造模型。
(3)模型应用
模型的应用是使用已经确认的分类模型来预测未知的模型,从而确定待测模型的类型。
采摘机器人的模式识别就是将特征数据提取出来,然后根据数据的特征进行分类识别,在采摘作业过程中,其特征数据可以根据成熟果实的颜色进行分类,而较为有效的方法是最邻近算法。最邻近算法是将所有的训练样本都作为分类数据,进行识别时需要统计所有样本点的特征邻近程度,从而可以得到与训练样本最邻近所属的类别。假设有c个分类,其模式分别为w1,w2,...,wc,每个分类有Ni(i=1,2,...,c)个训练样本,其中类的判别函数为
gi(x)=min||x-xi k||,k=1,2,...,N
其中xi k的角标i表示wi类,k表示wi类Ni个样本中的第k个,分类器的决策可以定义为gj(x)=mingi(x),i=1,2,...,c,则决策x∈wj。
使用这种方法是根据果实的颜色之间具有近邻的相似特性,然后在多维空间Rn中寻找与样本比较接近的k个点,最后根据k个点来判断待识别模式的类,这些点表示待识别样本的k-最近邻。这种算法是在一定的空间内,假设所有的待采摘果实都对应在n维空间中,一个果实特征向量为<a1(x),a2(x),...,an(x)>,其中,ar(x)表示果实x的第r个属性值,将两个果实xi,xj之间的距离定义d(xi,xj),其中:
在最邻近算法中,目标分类函数可以定义为f:Rn->V,其中V表示有限的集合{v1,v2,...,vs},其中k值的选择是根据样本数目和样本的离散程度来定的。如果在待采摘果实样本si周围的样本点的数据较少,那么对于k个点所覆盖的范围就会较大,反之则会较小。这种模式识别方法没有具体的学习过程,而是基于已知样本数据特征,对未知样本的预测,属于实例推测,如果k等于1,则成为NN算法。理论上,只要果实样本的数据足够多,该算法就可以进行很好的分类。
传统的基于模式识别的采摘机器人面对大量的实时监测数据,存在内存利用率底和通信效率不高,机动性不高等缺点。
发明内容
本发明要解决的问题是:提供一种适应于采摘机器人的数据分类优化算法,该算法能使采摘机器人采用实时监测数据分类器可以有效的对大量的数据进行筛选,从而降低了通信负担,提高了内存的利用率和采摘作业的效率。
本发明解决上述技术问题的技术方案如下:一种适应于采摘机器人的数据分类优化算法,主要整合K邻近和top-k的数据分类优化算法,其包括:top-k算法,用来把监测数据进行数据的调度;K邻近算法,用来将特征数据提取出来,然后根据数据的特征进行分类识别。
具体的优化算法步骤:
S1.定义采摘环境中有m个监测节点,其编号为N1、N2...Nm和一个中心节点N,在实时监测系统中某一时刻对象的集合用U表示,U中元素个数用n表示;
S2.输入果实样本的训练数据集d={(Xi,Yi),1≤i≤N},其中Xi表示第i个样本的条件属性,Yi表示类别,X表示新样本,d表示距离函数;
S3.定义Oi为某一个监测对象,Δi,j表示Ni接受到的Oi的评价分数增量,Vi,j表示本地评分;
S4.当某个监测点Ni接收到二元组<Oi,Δi,j>后,若则将Oi加入到U中,如果Oi∈U,则需要改变对象的评分Vi,j=Δi,j+Vi,j;
S5.把评分符合要求的输出;不符合要求的丢弃;
S6.把S5输出的数据,转化成新样本数据X表示;
S7.循环计算,求解向量X和每个样本Xi之间的距离d(Xi,X);
S8.根据得到的距离数据,对距离进行排序,从而得到d(X,Xi1)≤d(X,Xi2)≤...≤d(X,XiN);
S9.根据距离选择数据样本中的前K个数据,S={(Xi1,Yi1)...(Xik,Yik)};
S10.通过对S中类别出线的次数,从而确定X所属类别。
本发明的有益效果是:
通过本发明一种适应于采摘机器人的数据分类优化算法,可以有效的对监测数据进行筛选,在数据传输之前完成操作,有效的提高通信的效率,同时,采用数据分类器的方法可以对大量的数据进行分类,只将有效信息进行通信,提高内存的利用率和通信效率,提高了采摘机器人的作业效率。
附图说明
通过结合以下附图所作的详细描述,本发明的上述和/或其他方面和优点将变得更清楚和更容易理解,这些附图只是示意性的,并不限制本发明,其中:
图1为本发明提供的采摘环境监测数据top-k架构;
图2为本发明提供的监测数据点分布;
图3为本发明算法的流程;
图4为本发明K=1和K=3的分类结果对比图;
图5为本发明K=5和K=7的分类结果对比图;
图6为本发明的算法与单独采用K邻近的通信量对比;
图7为本发明的算法与单独采用K邻近的内存利用率对比;
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他的实施例,都属于本发明保护的范围。
以果实采摘监测点为研究对象,根据果实的成熟度,可以利用top-k的监测结果来实现数据的调度,从而缓解通信压力,其中top-k算法的架构如图1所示,图2设计的采摘机器人的作业实验,实验为一个范围是50×50的二维平面,平面内设置了130个传感器节点。
图3是本发明一种适应于采摘机器人的数据分类优化算法,具体的优化算法步骤:
S1.定义采摘环境中有m个监测节点,其编号为N1、N2...Nm和一个中心节点N,在实时监测系统中某一时刻对象的集合用U表示,U中元素个数用n表示;
S2.输入果实样本的训练数据集d={(Xi,Yi),1≤i≤N},其中Xi表示第i个样本的条件属性,Yi表示类别,X表示新样本,d表示距离函数;
S3.定义Oi为某一个监测对象,Δi,j.表示Ni接受到的Oi的评价分数增量,Vi,j表示本地评分;
S4.当某个监测点Ni接收到二元组<Oi,Δi,j>后,若则将Oi加入到U中,如果Oi∈U,则需要改变对象的评分Vi,j=Δi,j+Vi,j;
S5.把评分符合要求的输出;不符合要求的丢弃;
S6.把S5输出的数据,转化成新样本数据X表示;
S7.循环计算,求解向量X和每个样本Xi之间的距离d(Xi,X);
S8.根据得到的距离数据,对距离进行排序,从而得到d(X,Xi1)≤d(X,Xi2)≤...≤d(X,XiN);
S9.根据距离选择数据样本中的前K个数据,S={(Xi1,Yi1)...(Xik,Yik)};
S10.通过对S中类别出线的次数,从而确定X所属类别。
在本发明进行实验时,首先将K临近值设置为1和3,通过实验测试,得到的分类结果,如图4所示。由分类结果可以看出,利用k邻近分类器可以有效的对成熟果实区域进行划分,并且可以改变k值来得到不同的划分效果,再次改变K临近值,将其值设置为5和7,通过实验得到了如图5所示的分类结果。综合图4、图5可以看出,K邻近算法可以有效的对数据样本点进行分类,并且随着K值得增大,可以得到较好的分类结果,从而为采摘机器人对成熟果实的识别奠定了数据基础,也可以有效的减少通信次数。
为了验证本发明中的K邻近分类器的可靠性,将K邻近算法和LMC算法的准确率进行了对比,如表1所示
表1
从测试数据结果可以看出,K邻近算法分类器得道的准确率要比LMC的准确率高,从而验证了算法的可靠性。
为了验证通信量性能,将本发明的K邻近和top-k联合算法与传统的单独使用K邻近算法进行对比,如图6所示,由图可以明显的看出,使用本发明的K邻近和top-k联合算法在完成相同任务时可以明显降低通信量,提高通信效率。
为了验证内存利用率性能,将本发明的K邻近和top-k联合算法与传统的单独使用K邻近算法进行对比,如图7所示,由图可以明显的看出,使用K邻近和top-k联合算法的内存利用率要明显比单独使用K邻近算法高,从而有效的节约了内存的耗费,降低了采摘机器人的设计成本,提高了作业效率。
上述披露的各技术特征并不限于已披露的与其它特征的组合,本领域技术人员还可根据发明之目的进行各技术特征之间的其它组合,以实现本发明之目的为准。
Claims (1)
1.一种适应于采摘机器人的数据分类优化算法,其特征在于,包括:
S1.定义采摘环境中有m个监测节点,其编号为N1、N2…Nm和一个中心节点N,在实时监测系统中某一时刻对象的集合用U表示,U中元素个数用n表示;
S2.输入果实样本的训练数据集d={(Xi,Yi),1≤i≤N},其中Xi表示第i个样本的条件属性,Yi表示类别,X表示新样本,d表示距离函数;
S3.定义Oi为某一个监测对象,Δi,j表示Ni接受到的Oi的评价分数增量,Vi,j表示本地评分;
S4.当某个监测点Ni接收到二元组<Oi,Δi,j>后,若则将Oi加入到U中,如果Oi∈U,则需要改变对象的评分Vi,j=Δi,j+Vi,j;
S5.把评分符合要求的输出;不符合要求的丢弃。
S6.把S5输出的数据,转化成新样本数据X表示;
S7.循环计算,求解向量X和每个样本Xi之间的距离d(Xi,X);
S8.根据得到的距离数据,对距离进行排序,从而得到d(X,Xi1)≤d(X,Xi2)≤...≤d(X,XiN);
S9.根据距离选择数据样本中的前K个数据,S={(Xi1,Yi1)...(Xik,Yik)};
S10.通过对S中类别出线的次数,从而确定X所属类别。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610663886.7A CN106339715B (zh) | 2016-08-03 | 2016-08-03 | 一种适应于采摘机器人的数据分类优化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610663886.7A CN106339715B (zh) | 2016-08-03 | 2016-08-03 | 一种适应于采摘机器人的数据分类优化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106339715A true CN106339715A (zh) | 2017-01-18 |
CN106339715B CN106339715B (zh) | 2021-09-10 |
Family
ID=57825573
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610663886.7A Active CN106339715B (zh) | 2016-08-03 | 2016-08-03 | 一种适应于采摘机器人的数据分类优化方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106339715B (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101726251A (zh) * | 2009-11-13 | 2010-06-09 | 江苏大学 | 基于支持向量机的苹果采摘机器人果实自动识别方法 |
JP4961555B2 (ja) * | 2005-12-28 | 2012-06-27 | 国立大学法人宇都宮大学 | 植物の対象部分の位置特定方法とその方法による対象部分の位置特定装置及びその装置を用いた作業用ロボット |
-
2016
- 2016-08-03 CN CN201610663886.7A patent/CN106339715B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4961555B2 (ja) * | 2005-12-28 | 2012-06-27 | 国立大学法人宇都宮大学 | 植物の対象部分の位置特定方法とその方法による対象部分の位置特定装置及びその装置を用いた作業用ロボット |
CN101726251A (zh) * | 2009-11-13 | 2010-06-09 | 江苏大学 | 基于支持向量机的苹果采摘机器人果实自动识别方法 |
Also Published As
Publication number | Publication date |
---|---|
CN106339715B (zh) | 2021-09-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109670528B (zh) | 面向行人重识别任务的基于成对样本随机遮挡策略的数据扩充方法 | |
CN106371610B (zh) | 一种基于脑电信号的驾驶疲劳的检测方法 | |
CN106845717B (zh) | 一种基于多模型融合策略的能源效率评价方法 | |
CN108038700A (zh) | 一种反欺诈数据分析方法与系统 | |
CN106355192A (zh) | 一种基于混沌灰狼优化的支持向量机方法 | |
CN103632168A (zh) | 一种机器学习中的分类器集成方法 | |
CN101751666A (zh) | 基于谱聚类的半监督多光谱遥感图像分割方法 | |
CN109657610A (zh) | 一种高分辨率多源遥感影像的土地利用变化检测方法 | |
CN101178703B (zh) | 基于网络分割的故障诊断谱聚类方法 | |
CN106503731A (zh) | 一种基于条件互信息和K‑means的无监督特征选择方法 | |
CN104820724B (zh) | 文本类教育资源知识点预测模型获得方法及模型应用方法 | |
CN109871892A (zh) | 一种基于小样本度量学习的机器人视觉认知系统 | |
CN106250925B (zh) | 一种基于改进的典型相关分析的零样本视频分类方法 | |
CN106482967A (zh) | 一种代价敏感支持向量机机车车轮检测系统及方法 | |
CN103886334A (zh) | 一种多指标融合的高光谱遥感影像降维方法 | |
CN103839078A (zh) | 一种基于主动学习的高光谱图像分类方法 | |
CN107590427A (zh) | 基于时空兴趣点降噪的监控视频异常事件检测方法 | |
CN103399852A (zh) | 基于局部密度估计和近邻关系传播的多路谱聚类方法 | |
CN105205816A (zh) | 多特征加权融合的高分辨率sar影像建筑区提取方法 | |
CN110070106A (zh) | 烟雾检测方法、装置及电子设备 | |
CN105893956B (zh) | 一种基于多特征自适应测度学习的在线目标匹配方法 | |
CN110502989A (zh) | 一种小样本高光谱人脸识别方法及系统 | |
CN106570537A (zh) | 一种基于混淆矩阵的随机森林模型选择方法 | |
CN103177264B (zh) | 基于视觉词典全局拓扑表达的图像分类方法 | |
CN102930291A (zh) | 用于图形图像的k近邻局部搜索遗传自动聚类方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |