CN108197636A

CN108197636A - 一种基于深度多视点特征的稻谷检测和分类方法

Info

Publication number: CN108197636A
Application number: CN201711274887.3A
Authority: CN
Inventors: 陶大鹏; 武艺强; 和毓鑫; 王汝欣; 刘庆
Original assignee: Yunnan University YNU
Current assignee: Yunnan University YNU
Priority date: 2017-12-06
Filing date: 2017-12-06
Publication date: 2018-06-22

Abstract

本发明涉及一种基于深度多视点特征的稻谷检测和分类方法，该方法包括以下步骤：1)数据集的划分：利用交叉验证法对稻谷下落图像数据集进行划分，得到训练集和测试集；2)网络模型的构建：利用深度学习的方法对输入的图像进行特征的提取，同时利用随机梯度下降来不断更新模型参数；3)模型分析和性能评估：将测试数据输入训练好的稻谷分类器中，通过将概率预测值与分类阈值的比较，得到稻谷的检测分类结果。本发明较现有技术相比，准确率有很大方面的提升，并且改善了传统方式对于稻谷特征提取的不足，同时根据分类的结果完成对稻谷出糙率的计算等优点。

Description

一种基于深度多视点特征的稻谷检测和分类方法

技术领域

本发明属于稻谷检测、分类方法技术领域，尤其是属于一种基于深度多视点特征检测和应用深度学习方法、多层卷积神经网络于其中的方法技术领域。

背景技术

稻谷是我国产量最大的粮食作物，稻谷播种面积约近3000万公顷，总产量约1.8亿吨，占全国粮食产量的40％以上。云南省稻谷的播种面积约达1.2万亩、产量1.8万吨，稻谷产量占粮食产量的36％，亦是稻谷播种、生产的大省。稻谷是关系国计民生的重要基础性、战略性物质，因此在稻谷收购、储存、运输活动和政策性用粮购销活动中，需要对稻谷质量指标、卫生指标及储存指标等进行现场快速检测，其中稻谷定等是最为关注的环节，涉及到农户和企业之间的经济利益。在稻谷检测定等活动中，农民、商户、企业比较集中，需要检验的样品数多。2009年7月1日起开始执行的新标准(GB1350-2009《稻谷》)中稻谷以出糙率定等，通过出糙率的测定来反映出稻谷质量优劣。目前稻谷定等领域存在如下问题：

1)稻谷定等结果决定价格

稻谷等级与价格紧密相关，等级越高价格越高，定等结果对稻谷的购销和储运决策起到决定性作用。目前的定等工作完全靠具有检验经验的检验员进行人工目测、筛选的手段定等。

2)人工检测定等误差大

目前出糙率的测定需要检验人员的感官进行辨识不完善粒，然而由于标准理解不同，主观性强导致出糙率误差加大。

3)人工检测定效率差

稻谷定等出糙率检测时间长、费时费力，不利于稻谷在收购、储存、运输活动和政策性用粮购销活动中的快速检测，低效、滞后的定等结果导致管理成本高、综合效益低。

为解决上述关于稻谷定等的问题。目前市场上可用于稻谷定等的设备有选筛，国产碎米分离器，整精米选拔机以及进口的自动碎米分离机。其中国产仪器需要事先对稻谷进行砻谷，碾米处理且设备加工粗糙，对不同粒型的稻谷分类效果不一样，甚至有些粒型的大米不能分离；而进口的仪器价格太高不易推广使用。

传统的图像检测作为计算机视觉的重要研究内容，具体过程如下：将待检测目标转化为图像信息，将其传输到图像处理系统，通过分析像素、亮度等信息提取图像特征，并经过相似性比对，实现目标的检测功能。现有的图像检测方法种类繁多，几种经典方法在具体的问题中发挥着各自的作用。如基于神经网络的图像检测方法，基于支持向量机的图像检测方法，以及基于自适应增强算法和子空间学习方法的图像检测算法等。

纵观近10年对稻谷定等方面的研究，大部分的成果都围绕在如何改善传统工业控制或者采用传统的图像处理方法来对稻米进行定等和分类，但成效不明显。

针对稻谷检测这一特殊问题，有关学者进一步从特征改进的层面提出了许多新颖而有效的算法，如尺度不变特征变换算法被广泛应用，该算法通过计算不变特征向量的距离来确定候选匹配点对，从而对图形进行匹配，但它的每个特征点用128维向量表示，要处理的数据量很大，如此就会出现无法精确控制、运算速度慢、配准点精度不高等问题。然而，这些经典方法很容易出现特征点数量少而匹配失败的情况。

发明内容

为了解决以上问题，本发明提出一种新的稻谷检测和分类的方法。

本发明采用如下技术方案实现。

一种稻谷检测和分类所使用的方法，本发明的方法为深度学习方法。

一种稻谷检测和分类所使用的模型框架，本发明的模型框架为多层卷积神经网络。

一种基于深度多视点特征的稻谷检测和分类方法，该方法包括以下步骤：1)数据集的划分：利用交叉验证法对稻谷下落图像数据集进行划分，得到训练集和测试集；2)网络模型的构建：利用深度学习的方法对输入的图像进行特征的提取，同时利用随机梯度下降来不断更新模型参数；3)模型分析和性能评估：将测试数据输入训练好的稻谷分类器中，通过将概率预测值与分类阈值的比较，得到稻谷的检测分类结果。

进一步为，本发明步骤一具体为，设置不少于3个的摄像头，分别从不同角度同时对下落的稻米进行抓拍；当一粒稻米划过相机视野监控区域后，每个相机捕获到2～3张稻米的下落图片，至少捕获到6～9张图片；为了降低噪声对相机成像的影响，采用了长焦镜头和高分辨率的相机；同时为了减少训练时间增加分类的正确性，将每张图片的尺寸进行等比例缩小；在获得样本数据后，采用交叉验证法来对数据集进行划分。

进一步为，本发明所述的采用交叉验证法来对数据集进行划分具体为，先将所有样本k个大小相似的互斥子集，每个子集都尽可能保持数据分布的一致性，然后每次用k-1个子集的并集作为训练集，余下的子集作为测试集；如此就获得k组训练-测试集，进行k次训练和测试，最终返回的是这k个测试结果的平均值。

进一步为，本发明所述的设置不少于3个的摄像头，其位置关系要求采用非均匀的方式来排列。

进一步为，本发明通过交叉验证将收集到的数据集进行划分时为防止模型的过拟合，对训练数据做二次划分，二次划分得到验证集；在训练的过程中，不断的验证模型是否出现了过拟合，一旦出现过拟合，立刻停止训练；将整个数据划分为三部分：训练集，测试集、验证集。

进一步为，本发明步骤二操作方法为，利用了多层卷积神经网络来作为模型的框架，不断地将图片中边缘、纹理的低级特征融合成识别的高级特征，将前面获取到的高级特征映射成一维向量，最后通过Softmax激活函数来输出每个类别的概率。

进一步为，本发明步骤二具体为，做二分类操作，稻谷分完善粒和不完善粒两类；用数字1表示完善粒，即正例；数字0表示不完善粒，即反例；如此输出分布属于伯努利分布，对应选取的激活函数就是Sigmoid函数；用D_t表示训练集；其中每一个样本用{(x¹,y¹),(x²,y²),...,(x^k,y^k),...,(x^m,y^m)}表示，一共m个样本；其中每个xⁱ有d个属性，即

用v_ih表示输入层到隐含层的权值，w_hj表示隐含层到输出层的权值，θ_j标志输出神经元的阈值，γ_h表示隐含层神经元的阈值。α_h表示隐含层中第h个神经元的输入，β_j表示输出层第j个神经元的输入；{x₁,x₂,...,x_d}表示输入样本的各个属性值，{b₁,b₂,...b_q}表示隐含层神经元的输出，{y₁,y₂,...,y_l}表示输出神经元的输出，其中

对某一个训练样本(x^k,y^k)，将这个样本输入上述网络中，假定神经网络的输出为则网络在样本(x^k,y^k)上的均方误差为

根据梯度下降的策略，通过让均方误差分别对神经网络中的每个参数求偏微分；得到每个参数的更新策略；具体方式如下：

其中

通过上述方法步骤，输入的稻谷图片通过卷积层和池化层完成对特征的提取，实现对目标的分类。

进一步为，本发明步骤三具体为，选择查准率和查全率来衡量，一般的，用P表示查准率，R表示查全率。同时定义TP为真正例，FP为假正例，TN为真反例，FN为假反例；根据定义

和

根据学习器的预测结果对样例进行排序，排在前面的是学习器为“最可能”是正例样本，排在最后的则是学习器为“最不可能”是正例的样本；按此顺序逐个把样本作为正例进行预测，则每次计算出当前的查全率，查准率；以查准率为纵轴，查全率为横轴，得到一条曲线，确定一个查准率和查全率都高的平衡点。

本发明的有益效果为，1)与传统人工检测方法相比，本发明的稻谷定等技术使定等的准确率和效率有很大的提高；2)与传统图像处理技术相比，利用深度学习的方式和多层卷积神经网络作为模型框架完成了稻谷的分类，其准确率有很大方面的提升，并且改善了传统方式对于稻谷特征提取的不足，同时根据分类的结果完成了对稻谷出糙率的计算；3)本发明在采用了一种多视点的技术，来提高样本的采集效率和样本判别的准确性；4)本发明采用基于深度多视点特征检测的方法来解决稻谷检测和分类的问题，描述了该方法的原理和实现步骤，并用实验验证了该方法用于解决稻谷检测和分类问题的可行性。

下面结合附图和具体实施方式本发明做进一步解释。

附图说明

图1为本发明数据采集系统的俯视结构示意图(其中包含三个摄像头)。

图2为本发明多层卷积神经网络的模型框架示意图。

图3为本发明单隐层前馈网络模型示意图。

图4为本发明查准率-查全率曲线图。

图5为本发明系统整体流程示意图。

具体实施方式

进一步为，本发明步骤二具体为，做二分类操作，稻谷分完善粒和不完善粒两类；用数字1表示完善粒，即正例；数字0表示不完善粒，即反例；如此输出分布属于伯努利分布，对应选取的激活函数就是Sigmoid函数；用D_t表示训练集。其中每一个样本用{(x¹,y¹),(x²,y²),...,(x^k,y^k),...,(x^m,y^m)}表示，一共m个样本。其中每个xⁱ有d个属性，即

其中

和

以下为具体详细说明。

为了详细的说明本发明的技术要点，对整个技术方案进行分模块介绍。

在本发明中主要分为三个模块：数据集的划分，网络模型的构建，模型分析和性能评估。

1)数据集的划分

对于机器学习，特别是深度学习，数据集的优劣会对最终模型的性能产生很大的影响。虽然深度学习理论中，并未对数据集的有太多的约束。但在训练之前对收集到的样本数据进行适当的预处理，在很大程度上减少模型的训练时间并且增加模型的泛化能力。在说明数据集预处理之前，先来介绍一下样本数据的来源。本发明的目的是解决稻谷定等的问题，为了获得足够的样本数据，设计了一款稻米下落捕获的系统。系统示意图如图1所示。

从图1中看出，采用了三个摄像头，分别从不同角度同时对下落的稻米进行抓拍。当一粒稻米划过相机视野监控区域后，每个相机捕获到2～3张稻米的下落图片，三个相机就捕获到6～9张图片，这不仅增加了样本的收集效率，还增加模型分类的准确性。为了降低噪声对相机成像的影响，采用了长焦镜头和高分辨率的相机，对每个相机的位置进行了精确的计算。同时为了减少训练时间增加分类的正确性，将每张图片的尺寸进行等比例缩小。在获得样本数据后，采用交叉验证法来对数据集进行划分。交叉验证是数据集划分的一种方法，它先将所有样本k个大小相似的互斥子集，每个子集都尽可能保持数据分布的一致性，然后每次用k-1个子集的并集作为训练集，余下的子集作为测试集。如此就获得k组训练-测试集，进行k次训练和测试，最终返回的是这k个测试结果的平均值。因此通过交叉验证将收集到的数据集进行合理的划分。一般情况下，为了防止模型的过拟合，会对训练数据再做一次划分，将其划分为训练集和验证集，在训练的过程中，不断的验证模型是否出现了过拟合，一旦过拟合，就立刻停止训练。通过以上分析，将整个数据划分为三部分：训练集，验证集，测试集。

为了更好地提取稻谷下落的特征，这里采用非均匀的方式来排列相机。对于下方两个相机采用更长的焦距，用来捕捉稻谷的纹理特征。对于上方的相机捕捉稻谷的下落姿态特征。通过这种非均匀的方式，获取更多的稻谷下落的细节信息，从而增加判决的可靠性。

2)网络模型的构建

本发明采用基于深度多视点特征检测的方法来解决稻谷检测和分类的问题，在这一小节中，将详细介绍整个分类模型的框架。

在模型中，主要利用了多层卷积神经网络来作为了模型的框架，多层卷积神将网络利用局部感知，权值共享的思想克服了传统神经网络因为权值太多无法训练的弊端。同时通过多层卷积技术，不断地将图片中边缘、纹理等低级特征融合成识别的高级特征。并且采用Dropout技术来防止模型的过拟合。在稻米分类任务中，先根据稻米的大小，纹理，光泽等属性，来区分完善粒和不完善粒。进而计算出稻谷的出糙率。对于如此的任务，采用如下深度学习网络结构，具体的模型框架如图2所示。

从图2中看出，在输入层中，图片大小是39×31×1，一共1209个像素。在第一个卷积层中，采用了20个不同的卷积核，每个卷积核的大小是4×4的。通过卷积运算得到36×28×20的特征图。然后通过2×2的卷积核进行特征融合，采取最大池化策略就可得到第一个池化层，大小是18×14×20。通过池化，将一些不显著的特征滤除掉，保留显著特征。同样道理，通过不断的卷积池化，就将低级特征转变为高级特征。但是在倒数第二隐含层中，鉴于卷积神经网络层数越高视野区域越大的特性，如此的连接既考虑全局特征，又考虑局部特征。最后一层是全连接层，它将前面获取到的高级特征映射成一维向量，最后通过Softmax激活函数来输出每个类别的概率。通过BP算法，就不断的更新模型中的参数，来让模型的最小均方误差最小。

卷积层和池化层的作用是为了提取中高级特征。最重要的部分还是在于最后的全连接层，它的作用将拿到的特征转化为相应的类别概率。

下面做二分类说明，也就是稻谷只有完善粒和不完善粒两类。这里用数字1表示完善粒，即正例；数字0表示不完善粒，即反例。如此输出分布就属于伯努利分布，对应选取的激活函数就是Sigmoid函数。这里用D_t表示训练集。其中每一个样本用{(x¹,y¹),(x²,y²),...,(x^k,y^k),...,(x^m,y^m)}表示，一共m个样本。其中每个xⁱ有d个属性，即具体的网络如图3所示。

在图3中，用v_ih表示输入层到隐含层的权值，w_hj表示隐含层到输出层的权值，θ_j标志输出神经元的阈值，γ_h表示隐含层神经元的阈值。α_h表示隐含层中第h个神经元的输入，β_j表示输出层第j个神经元的输入。{x₁,x₂,...,x_d}表示输入样本的各个属性值，{b₁,b₂,...b_q}表示隐含层神经元的输出，{y₁,y₂,...,y_l}表示输出神经元的输出，其中

根据梯度下降的策略，通过让均方误差分别对神经网络中的每个参数求偏微分。就得到每个参数的更新策略。具体方式如下：

其中

通过上述分析，看出，输入的稻谷图片通过卷积层和池化层完成对特征的提取，之后通过全连接层实现对目标的分类。为了解决过拟合的问题，在卷基层和池化层后面进行Dropout处理。

3)模型分析和性能评估

对于学习器的泛化性能进行评估，不仅需要有效可行的实验方法，还需要有衡量模型泛化能力的评价指标。虽然利用均方误差在一定程度上反映模型的泛化能力，但是却不能满足所有的任务需求。比如当进行稻谷分类时，均方误差仅显示了有多少完善粒被判错。但任务的重点是“挑出来的稻谷中有多少是完善粒”或“所有完善粒中有多少被挑出来”。这时错误率显然就不够用了，就需要其他的指标来衡量。

这里选择查准率和查全率来衡量，一般的，用P表示查准率，R表示查全率。同时定义TP为真正例，FP为假正例，TN为真反例，FN为假反例。那么根据定义

查准率和查全率是一对矛盾的度量。一般来说，查准率高时，查全率往往偏低；反之，查全率高时，查准率往往偏低。在很多情况下，根据学习器的预测结果对样例进行排序，排在前面的是学习器为“最可能”是正例样本，排在最后的则是学习器为“最不可能”是正例的样本。按此顺序逐个把样本作为正例进行预测，则每次计算出当前的查全率，查准率。以查准率为纵轴，查全率为横轴，就得到一条曲线，如图4所示。

从图4中看出，如果要让查准率和查全率都高，那就需要找到一个平衡点。具体的位置从图中看出来。

从图5中看出整个稻谷分类的执行流程。首先通过图像采集系统来收集足够的样本数据，送入左边的稻谷图像池中进行存储。然后通过图像处理技术对样本数据集进行划分。接着通过梯度下降算法进行模型训练。最后利用训练好的模型实现实时的稻谷分类任务。

以上所述的仅是本发明的具体实施例，方案中公知的具体结构及特性等常识在此未作过多描述。应当指出，对于本领域的技术人员来说，在不脱离本发明结构的前提下，还作出若干变形和改进，这些也应该视为本发明的保护范围，这些都不会影响本发明实施的效果和专利的实用性。本申请要求的保护范围应当以其权利要求的内容为准，说明书中的具体实施方式等记载用于解释权利要求的内容。

Claims

1.一种稻谷检测和分类所使用的方法，其特征在于，该方法为深度学习方法。

2.一种稻谷检测和分类所使用的模型框架，其特征在于，该模型框架为多层卷积神经网络。

3.一种基于深度多视点特征的稻谷检测和分类方法，其特征在于，该方法包括以下步骤：1)数据集的划分：利用交叉验证法对稻谷下落图像数据集进行划分，得到训练集和测试集；2)网络模型的构建：利用深度学习的方法对输入的图像进行特征的提取，同时利用随机梯度下降来不断更新模型参数；3)模型分析和性能评估：将测试数据输入训练好的稻谷分类器中，通过将概率预测值与分类阈值的比较，得到稻谷的检测分类结果。

4.根据权利要求3所述的一种基于深度多视点特征的稻谷检测和分类方法，其特征在于，步骤一具体为，设置不少于3个的摄像头，分别从不同角度同时对下落的稻米进行抓拍；当一粒稻米划过相机视野监控区域后，每个相机捕获到2～3张稻米的下落图片，至少捕获到6～9张图片；为了降低噪声对相机成像的影响，采用了长焦镜头和高分辨率的相机；同时为了减少训练时间增加分类的正确性，将每张图片的尺寸进行等比例缩小；在获得样本数据后，采用交叉验证法来对数据集进行划分。

5.根据权利要求3所述的一种基于深度多视点特征的稻谷检测和分类方法，其特征在于，所述的采用交叉验证法来对数据集进行划分具体为，先将所有样本k个大小相似的互斥子集，每个子集都尽可能保持数据分布的一致性，然后每次用k-1个子集的并集作为训练集，余下的子集作为测试集；如此就获得k组训练-测试集，进行k次训练和测试，最终返回的是这k个测试结果的平均值。

6.根据权利要求3所述的一种基于深度多视点特征的稻谷检测和分类方法，其特征在于，所述的设置不少于3个的摄像头，其位置关系要求采用非均匀的方式来排列。

7.根据权利要求5所述的一种基于深度多视点特征的稻谷检测和分类方法，其特征在于，通过交叉验证将收集到的数据集进行划分时为防止模型的过拟合，对训练数据做二次划分，二次划分得到验证集；在训练的过程中，不断的验证模型是否出现了过拟合，一旦出现过拟合，立刻停止训练；将整个数据划分为三部分：训练集，测试集、验证集。

8.根据权利要求3所述的一种基于深度多视点特征的稻谷检测和分类方法，其特征在于，步骤二操作方法为，利用了多层卷积神经网络来作为模型的框架，不断地将图片中边缘、纹理的低级特征融合成识别的高级特征，将前面获取到的高级特征映射成一维向量，最后通过Softmax激活函数来输出每个类别的概率。

9.根据权利要求8所述的一种基于深度多视点特征的稻谷检测和分类方法，其特征在于，步骤二具体为，做二分类操作，稻谷分完善粒和不完善粒两类；用数字1表示完善粒，即正例；数字0表示不完善粒，即反例；如此输出分布属于伯努利分布，对应选取的激活函数就是Sigmoid函数；用D_t表示训练集；其中每一个样本用{(x¹,y¹),(x²,y²),...,(x^k,y^k),...,(x^m,y^m)}表示，一共m个样本；其中每个xⁱ有d个属性，即

用v_ih表示输入层到隐含层的权值，w_hj表示隐含层到输出层的权值，θ_j标志输出神经元的阈值，γ_h表示隐含层神经元的阈值；α_h表示隐含层中第h个神经元的输入，β_j表示输出层第j个神经元的输入；{x₁,x₂,...,x_d}表示输入样本的各个属性值，{b₁,b₂,...b_q}表示隐含层神经元的输出，{y₁,y₂,...,y_l}表示输出神经元的输出，其中

其中

10.根据权利要求3所述的一种基于深度多视点特征的稻谷检测和分类方法，其特征在于，步骤三具体为，选择查准率和查全率来衡量，一般的，用P表示查准率，R表示查全率；同时定义TP为真正例，FP为假正例，TN为真反例，FN为假反例；根据定义

和