CN109784294B - 一种基于粗糙集理论候选框选择技术的枸杞图像识别定位方法 - Google Patents
一种基于粗糙集理论候选框选择技术的枸杞图像识别定位方法 Download PDFInfo
- Publication number
- CN109784294B CN109784294B CN201910071932.8A CN201910071932A CN109784294B CN 109784294 B CN109784294 B CN 109784294B CN 201910071932 A CN201910071932 A CN 201910071932A CN 109784294 B CN109784294 B CN 109784294B
- Authority
- CN
- China
- Prior art keywords
- layer
- candidate frame
- iou
- neural network
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Abstract
本发明涉及一种基于粗糙集理论候选框选择技术的枸杞图像识别定位方法,与现有技术相比解决了复杂环境下枸杞图像识别定位精准度低的缺陷。本发明包括以下步骤:训练样本的获取;设定卷积神经网络;卷积神经网络的训练;待识别图像的获取;枸杞的识别定位。本发明改进了传统Faster‑RCNN中候选框选择的方法,降低候选框被误删或者漏删的情况,增强了数据的可靠性,从而保证了对枸杞图像识别和定位的精准度。
Description
技术领域
本发明涉及图像处理技术领域,具体来说是一种基于粗糙集理论候选框选择技术的枸杞图像识别定位方法。
背景技术
枸杞等季节性水果收割周期较短,目前主要依赖于人工完成该项工作。为了进一步降低劳动成本,提出了诸多机械化采摘方案。在方案实施过程中,针对机器人采摘成熟后的枸杞容易破损的特殊性,精准定位显得尤为重要,以此来提高采摘的效率和品质。
现有技术中,虽有部分技术提出了枸杞的识别定位方法,但枸杞作为小颗粒作物而且存在遮挡和重叠的情况,在目标识别算法中候选框容易被误删或漏删,从而导致其定位精度较差。波兰科学家Z.Pawlak提出的基于粗糙集的性质,其广泛应用在数据挖掘领域,可以处理不精确、不确定和不完全数据的数学方法,依据该性质大多处理的是点到集合的不确定性问题。针对图像识别而言,对候选框的选择尤为重要,目前只是简单应用IoU和阈值的控制来筛选候选框,这样的方法简单粗暴,以致于无法更好地满足实际应用。
因此,如何利用改进粗糙集理论的技术优点来提高枸杞识别定位的准确率已经成为亟需解决的技术问题。
发明内容
本发明的目的是为了解决现有技术中复杂环境下枸杞图像识别定位精准度低的缺陷,提供一种基于粗糙集理论候选框选择技术的枸杞图像识别定位方法来解决上述问题。
为了实现上述目的,本发明的技术方案如下:
一种基于粗糙集理论候选框选择技术的枸杞图像识别定位方法,包括以下步骤:
训练样本的获取:获取训练样本数据,训练样本数据为400张双目视觉获取的图像;
设定卷积神经网络:设定卷积神经网络的层次、层数和各层属性;
卷积神经网络的训练:将训练样本输入卷积神经网络进行训练;
待识别图像的获取:获取待识别图像,待识别图像为双目视觉获取的图像;
枸杞的识别定位:将待识别图像输入卷积神经网络,通过卷积神经网络识别定位枸杞。
所述的设定卷积神经网络包括以下步骤:
设定卷积神经网络包括N个卷积层、N1个ROI池化层和N2个全连接层;
设定N个卷积层依次对训练样本进行特征提取,生成N层特征映射图;
设定第N层特征映射图导入RPN网络并利用粗糙集理论候选框选择方法,对第N层特征映射图进行枸杞目标和背景的初步分类,并通过回归生成候选框,确定枸杞目标位置;
设定ROI池化层操作:通过ROI池化层对每个候选框提取固定尺寸的特征图,将候选框在输入图像中的坐标映射到第N层特征图中,对特征图中对应区域进行池化操作,得到固定大小输出的池化结果;
设定全连接层操作:将固定大小的池化结果与全连接层相连,全连接层包括两个子连接层,两个子连接层分别为分类层和回归层,分类层用于判断候选框的类别,回归层用于预测候选框的准确位置。
所述卷积神经网络的训练包括以下步骤:
利用迁移学习方法,将数据集ImageNet上训练的参数对卷积神经网络的基础网络VGG16进行初始化;
将训练样本输入已经初始化后的卷积神经网络中对权重微调;
通过N个网络层依次对训练样本进行特征提取,生成N层特征映射图;
将第N层特征映射图导入RPN网络并利用粗糙集理论候选框选择方法对第N层特征映射图进行枸杞目标和背景的初步分类,并通过回归生成候选框,确定枸杞目标位置;
通过ROI池化层对每个候选框提取固定尺寸的特征图,将候选框在输入图像中的坐标映射到第N层特征图中,对特征图中对应区域进行池化操作,得到固定大小输出的池化结果;
将固定大小的池化结果与全连接层相连,分类层判断出候选框的类别,回归层预测出候选框的准确位置。
所述的粗糙集理论候选框选择方法包括以下步骤:
利用3×3卷积核在第N层特征图上滑动,将3×3卷积核中心对应位置映射到原图的感受野的中心点作为基准点,每个基准点对应三种不同尺度{1282、2562、5122}和三种长宽比{1:1、1:2、2:1}的所有尺寸和比例组合,即每个基准点对应9个Anchors,若特征图的大小为L×W,则共有L×W×9个Anchors;
通过RPN网络前向计算得到Anchors的前景得分和回归参数;
将Anchors坐标中超出图像边界的,以及小于给定阈值的删除,对余下的Anchors按照得分高低排序,提取前S个Anchors;
选出IoU中最大的Anchor Mi=argmax{IoUdi|1≤i≤s且i≠d}和次大的Anchor Mj=argmax{IoUdj|1≤j≤s,j≠d且j≠i},记N为选取的候选框集合,D为被删除的Anchor集合;
若被研究对象Md和次大Anchor Mj的IoUdj>Nt且|IoUdi-IoUdj|<ε
若IoUdi>Nt且IoUdj<Nt,
则D={Md},N={Mi,Mj},M={M1,M2,...,Ms}\{Mi,Mj,Md};
若IoUdi<Nt,则N={Mi,Mj,Md},M={M1,M2,...,Ms}\{Mi,Mj,Md};
有益效果
本发明的一种基于粗糙集理论候选框选择技术的枸杞图像识别定位方法,与现有技术相比改进了传统Faster-RCNN中候选框选择的方法,降低候选框被误删或者漏删的情况,增强了数据的可靠性,从而保证了对枸杞图像识别和定位的精准度。
本发明利用粗糙集理论对Faster-RCNN中的NMS(non maximum suppression)算法进行改进,将Anchors之间的关系通过模糊集理论的包含度度量。在度量基础上,对目标Anchor进行判断,若包含于某个Anchor的下近似,则被删掉,否则,属于至少两个Anchors的上近似,属于不确定区域,则目标Anchor被保留作为下一步的模型训练。该方法有效解决了在自然复杂场景中存在遮挡而部分枸杞检测不到,从而达不到精准定位的问题。
附图说明
图1为本发明的方法顺序图;
图2为本发明中粗糙集理论候选框选择方法的顺序流程图;
图3为现有技术中利用传统NMS算法的识别效果图。
具体实施方式
为使对本发明的结构特征及所达成的功效有更进一步的了解与认识,用以较佳的实施例及附图配合详细的说明,说明如下:
如图1所示,本发明所述的一种基于粗糙集理论候选框选择技术的枸杞图像识别定位方法,包括以下步骤:
第一步,训练样本的获取。获取训练样本数据,训练样本数据为400张双目视觉获取的图像。训练样本数据为{x1,x2,…x400},其中,每个样本中的目标进行了人工标定,即记录了坐标位置(左下角和右上角的坐标)和类别。
第二步,设定卷积神经网络。设定卷积神经网络的层次、层数和各层属性。在此,针对枸杞作为小颗粒作物,存在遮挡、重叠等难以准确识别的特性,利用基于粗糙集理论的方法进行候选框的筛选避免候选框漏选和误选的不足。
其具体步骤如下:
(1)设定卷积神经网络包括N个卷积层、N1个ROI池化层和N2个全连接层。
(2)设定N个卷积层依次对训练样本进行特征提取,生成N层特征映射图。
(3)设定第N层特征映射图导入RPN网络并利用粗糙集理论候选框选择方法,对第N层特征映射图进行枸杞目标和背景的初步分类,并通过回归生成候选框,确定枸杞目标位置。
传统的粗糙集性质描述的是一个点对集合的不确定关系,而在此是度量候选框与候选框之间的不确定性问题,即集合与集合之间的关系,由此将其性质点属于一个类的上近似集合,则必属于至少两个类的上近似集合,拓展为目标候选框若包含在一个候选框的上近似集合中,则必定包含在至少两个目标候选框的上近似集合中,这种不确定性可以处理目标候选框同时处于两个或者更多候选框的边界上,避免对目标候选框进行误删,从而改进候选框选择的精准度,提高算法的可靠性。
如图2所示,粗糙集理论候选框选择方法包括以下步骤:
A1)利用3×3卷积核在第N层特征图上滑动,将3×3卷积核中心对应位置映射到原图的感受野的中心点作为基准点,每个基准点对应三种不同尺度{1282、2562、5122}和三种长宽比{1:1、1:2、2:1}的所有尺寸和比例组合,即每个基准点对应9个Anchors,若特征图的大小为L×W,则共有L×W×9个Anchors。
A2)通过RPN网络按传统方法前向计算得到候选框的得分和回归参数。
A3)将Anchors坐标中超出图像边界的,以及小于给定阈值的Anchors删除,对余下的Anchors按照得分高低排序,提取前S个Anchors,S的数量在实际应用中根据情况设定即可。
A5)选出IoU中最大的Anchor Mi=argmax{IoUdi|1≤i≤s且i≠d}和次大的AnchorMj=argmax{IoUdj|1≤j≤s,j≠d且j≠i},记N为选取的候选框集合,D为被删除的Anchor集合。
A6)若被研究对象Md和次大Anchor Mj的IoUdj>Nt且|IoUdi-IoUdj|<ε
若IoUdi>Nt且IoUdj<Nt,
则D={Md},N={Mi,Mj},M={M1,M2,...,Ms}\{Mi,Mj,Md};
若IoUdi<Nt,则N={Mi,Mj,Md},M={M1,M2,...,Ms}\{Mi,Mj,Md}。
粗糙集理论候选框选择方法主要针对当两个或者多个目标比较接近时,依据粗糙集理论的不确定性解决误删的情况。其主要思想是若研究对象与最大Anchor和次大Anchor的包含度很接近时,那么研究对象必定存在于最大和次大Anchor的边界,此时,该研究对象需要保留为候选框;若研究对象与最大Anchor和次大Anchor的包含度大于某阈值,则研究对象必定包含于最大Anchor的下近似,该研究对象作为冗余被删除。
如图3所示,若使用传统的NMS算法,那么由于IoU阈值的设定一般都会将后面那匹马删除,而实际上两匹马是两个不同的目标应该同时存在,究其原因,主要是两个目标太近,包含度太高以致于将后面那匹马误认为是前面那匹马的一部分误删了。本发明经过基于粗糙集理论的候选框选择方法计算,可以将后面那匹马中的候选框作为前面那匹马候选框的上近似,从而保留,避免误删。
(4)设定ROI池化层操作。通过ROI池化层对每个候选框提取固定尺寸的特征图,将候选框在输入图像中的坐标映射到第N层特征图中,对特征图中对应区域进行池化操作,得到固定大小(7×7)输出的池化结果。
(5)设定全连接层操作:将固定大小的池化结果与全连接层相连,全连接层包括两个子连接层,两个子连接层分别为分类层和回归层,分类层用于判断候选框的类别,回归层用于预测候选框的准确位置。
第三步,卷积神经网络的训练。将训练样本输入卷积神经网络进行训练。
其具体步骤如下:
(1)利用迁移学习方法,将数据集ImageNet上训练的参数对卷积神经网络的基础网络VGG16进行初始化。
(2)将训练样本输入已经初始化后的卷积神经网络中对权重微调。
(3)通过N个网络层依次对训练样本进行特征提取,生成N层特征映射图。
(4)将第N层特征映射图导入RPN网络并利用粗糙集理论候选框选择方法对第N层特征映射图进行枸杞目标和背景的初步分类,并通过回归生成候选框,确定枸杞目标位置。
(5)通过ROI池化层对每个候选框提取固定尺寸的特征图,将候选框在输入图像中的坐标映射到第N层特征图中,对特征图中对应区域进行池化操作,得到固定大小输出的池化结果。
(6)将固定大小的池化结果与全连接层相连,分类层判断出候选框的类别,回归层预测出候选框的准确位置。
第四步,待识别图像的获取。获取待识别图像,待识别图像为双目视觉采集的图像。
第五步,枸杞的识别定位。将待识别枸杞图像输入卷积神经网络,通过卷积神经网络识别定位枸杞。实际应用中,为了方便使用,还可以使用传统方法将枸杞目标计算机像素坐标转换为相应的世界坐标系中的坐标。
以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是本发明的原理,在不脱离本发明精神和范围的前提下本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明的范围内。本发明要求的保护范围由所附的权利要求书及其等同物界定。
Claims (2)
1.一种基于粗糙集理论候选框选择技术的枸杞图像识别定位方法,其特征在于,包括以下步骤:
11)训练样本的获取:获取训练样本数据,训练样本数据为400张双目视觉获取的图像;
12)设定卷积神经网络:设定卷积神经网络的层次、层数和各层属性;所述的设定卷积神经网络包括以下步骤:
121)设定卷积神经网络包括N个卷积层、N1个ROI池化层和N2个全连接层;
122)设定N个卷积层依次对训练样本进行特征提取,生成N层特征映射图;
123)设定第N层特征映射图导入RPN网络并利用粗糙集理论候选框选择方法,对第N层特征映射图进行枸杞目标和背景的初步分类,并通过回归生成候选框,确定枸杞目标位置;所述的粗糙集理论候选框选择方法包括以下步骤:
1231)利用3×3卷积核在第N层特征图上滑动,将3×3卷积核中心对应位置映射到原图的感受野的中心点作为基准点,每个基准点对应三种不同尺度{1282、2562、5122}和三种长宽比{1:1、1:2、2:1}的所有尺寸和比例组合,即每个基准点对应9个Anchors,若特征图的大小为L×W,则共有L×W×9个Anchors;
1232)通过RPN网络前向计算得到Anchors的前景得分和回归参数;
1233)将Anchors坐标中超出图像边界的,以及小于给定阈值的删除,对余下的Anchors按照得分高低排序,提取前S个Anchors;
1235)选出IoU中最大的Anchor Mi=arg max{IoUdi|1≤i≤s且i≠d}和次大的AnchorMj=arg max{IoUdj|1≤j≤s,j≠d且j≠i},记N为选取的候选框集合,D为被删除的Anchor集合;
1236)若被研究对象Md和次大Anchor Mj的IoUdj>Nt且|IoUdi-IoUdj|<ε,
若IoUdj>Nt且|IoUdi-IoUdj|≥ε,研究对象Md属于最大AnchorMi的下近似,即被删除,因此D={Md},N={Mi,Mj},M={M1,M2,...,Ms}\{Mi,Mj,Md};
若IoUdi>Nt且IoUdj<Nt,
则D={Md},N={Mi,Mj},M={M1,M2,...,Ms}\{Mi,Mj,Md};
若IoUdi<Nt,则N={Mi,Mj,Md},M={M1,M2,...,Ms}\{Mi,Mj,Md};
124)设定ROI池化层操作:通过ROI池化层对每个候选框提取固定尺寸的特征图,将候选框在输入图像中的坐标映射到第N层特征图中,对特征图中对应区域进行池化操作,得到固定大小输出的池化结果;
125)设定全连接层操作:将固定大小的池化结果与全连接层相连,全连接层包括两个子连接层,两个子连接层分别为分类层和回归层,分类层用于判断候选框的类别,回归层用于预测候选框的准确位置;
13)卷积神经网络的训练:将训练样本输入卷积神经网络进行训练;
14)待识别图像的获取:获取待识别图像,待识别图像为双目视觉获取的图像;
15)枸杞的识别定位:将待识别图像输入卷积神经网络,通过卷积神经网络识别定位枸杞。
2.根据权利要求1所述的一种基于粗糙集理论候选框选择技术的枸杞图像识别定位方法,其特征在于,所述卷积神经网络的训练包括以下步骤:
21)利用迁移学习方法,将数据集ImageNet上训练的参数对卷积神经网络的基础网络VGG16进行初始化;
22)将训练样本输入已经初始化后的卷积神经网络中对权重微调;
23)通过N个网络层依次对训练样本进行特征提取,生成N层特征映射图;
24)将第N层特征映射图导入RPN网络并利用粗糙集理论候选框选择方法对第N层特征映射图进行枸杞目标和背景的初步分类,并通过回归生成候选框,确定枸杞目标位置;
25)通过ROI池化层对每个候选框提取固定尺寸的特征图,将候选框在输入图像中的坐标映射到第N层特征图中,对特征图中对应区域进行池化操作,得到固定大小输出的池化结果;
26)将固定大小的池化结果与全连接层相连,分类层判断出候选框的类别,回归层预测出候选框的准确位置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910071932.8A CN109784294B (zh) | 2019-01-25 | 2019-01-25 | 一种基于粗糙集理论候选框选择技术的枸杞图像识别定位方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910071932.8A CN109784294B (zh) | 2019-01-25 | 2019-01-25 | 一种基于粗糙集理论候选框选择技术的枸杞图像识别定位方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109784294A CN109784294A (zh) | 2019-05-21 |
CN109784294B true CN109784294B (zh) | 2020-07-28 |
Family
ID=66502417
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910071932.8A Active CN109784294B (zh) | 2019-01-25 | 2019-01-25 | 一种基于粗糙集理论候选框选择技术的枸杞图像识别定位方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109784294B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111476843B (zh) * | 2020-05-08 | 2023-03-24 | 中国科学院合肥物质科学研究院 | 基于注意力机制和改进pv-rcnn网络的枸杞枝条识别定位方法 |
CN111523511B (zh) * | 2020-05-08 | 2023-03-24 | 中国科学院合肥物质科学研究院 | 一种用于枸杞采收夹持装置的视频图像枸杞枝条检测方法 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102254224A (zh) * | 2011-07-06 | 2011-11-23 | 无锡泛太科技有限公司 | 一种基于粗糙集神经网络的图像识别的物联网电动汽车充电桩系统 |
CN103176185B (zh) * | 2011-12-26 | 2015-01-21 | 上海汽车集团股份有限公司 | 用于检测道路障碍物的方法及系统 |
CN105741258A (zh) * | 2014-12-09 | 2016-07-06 | 北京中船信息科技有限公司 | 基于粗糙集和神经元网络的船体零部件图像分割方法 |
CN106156744B (zh) * | 2016-07-11 | 2019-01-29 | 西安电子科技大学 | 基于cfar检测与深度学习的sar目标检测方法 |
CN108830285B (zh) * | 2018-03-14 | 2021-09-21 | 江南大学 | 一种基于Faster-RCNN的加强学习的目标检测方法 |
CN108960143B (zh) * | 2018-07-04 | 2021-02-23 | 北京航空航天大学 | 一种高分辨率可见光遥感图像中的舰船检测深度学习方法 |
-
2019
- 2019-01-25 CN CN201910071932.8A patent/CN109784294B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN109784294A (zh) | 2019-05-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109934115B (zh) | 人脸识别模型的构建方法、人脸识别方法及电子设备 | |
CN107808143B (zh) | 基于计算机视觉的动态手势识别方法 | |
Yang et al. | Real-time face detection based on YOLO | |
CN110084292B (zh) | 基于DenseNet和多尺度特征融合的目标检测方法 | |
CN107610087B (zh) | 一种基于深度学习的舌苔自动分割方法 | |
CN113065558A (zh) | 一种结合注意力机制的轻量级小目标检测方法 | |
CN110060233B (zh) | 一种玉米果穗破损检测方法 | |
CN107833213B (zh) | 一种基于伪真值自适应法的弱监督物体检测方法 | |
CN106897673B (zh) | 一种基于retinex算法和卷积神经网络的行人再识别方法 | |
CN109684922B (zh) | 一种基于卷积神经网络的多模型对成品菜的识别方法 | |
WO2022028031A1 (zh) | 一种轮廓形状识别方法 | |
CN104063711B (zh) | 一种基于K‑means方法的走廊消失点快速检测算法 | |
CN111401293B (zh) | 一种基于Head轻量化Mask Scoring R-CNN的手势识别方法 | |
CN112733614B (zh) | 一种带有相似尺寸强化识别的害虫图像检测方法 | |
CN109784294B (zh) | 一种基于粗糙集理论候选框选择技术的枸杞图像识别定位方法 | |
CN111738114B (zh) | 基于无锚点精确采样遥感图像车辆目标检测方法 | |
CN113011253B (zh) | 基于ResNeXt网络的人脸表情识别方法、装置、设备及存储介质 | |
CN115816460B (zh) | 一种基于深度学习目标检测与图像分割的机械手抓取方法 | |
CN111126278A (zh) | 针对少类别场景的目标检测模型优化与加速的方法 | |
CN114677323A (zh) | 一种室内动态场景下基于目标检测的语义视觉slam定位方法 | |
CN112396619A (zh) | 一种基于语义分割的内部复杂组成的小型颗粒分割方法 | |
CN111860587A (zh) | 一种用于图片小目标的检测方法 | |
CN111340019A (zh) | 基于Faster R-CNN的粮仓害虫检测方法 | |
CN113116377A (zh) | 超声成像导航方法、超声设备及存储介质 | |
CN109145770B (zh) | 一种基于多尺度特征融合网络与定位模型相结合的麦蜘蛛自动计数方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |