CN107451602A - 一种基于深度学习的果蔬检测方法 - Google Patents

一种基于深度学习的果蔬检测方法 Download PDF

Info

Publication number
CN107451602A
CN107451602A CN201710544590.8A CN201710544590A CN107451602A CN 107451602 A CN107451602 A CN 107451602A CN 201710544590 A CN201710544590 A CN 201710544590A CN 107451602 A CN107451602 A CN 107451602A
Authority
CN
China
Prior art keywords
mrow
fruits
vegetables
represent
candidate region
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710544590.8A
Other languages
English (en)
Inventor
胡海根
周莉莉
黄玉娇
肖杰
管秋
陈胜勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University of Technology ZJUT
Original Assignee
Zhejiang University of Technology ZJUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University of Technology ZJUT filed Critical Zhejiang University of Technology ZJUT
Priority to CN201710544590.8A priority Critical patent/CN107451602A/zh
Publication of CN107451602A publication Critical patent/CN107451602A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting

Abstract

一种基于深度学习的果蔬检测方法,包括:步骤1,首先对数据进行预处理;对原始图片事先进行手工标定,获得分割标签。标定是指原始图片中目标框的左上角点与右下角点的坐标,标签是指判定每个标定框中目标是否为果蔬及确定果蔬的类别;步骤2,其次对数据进行训练;将所述原始图片和图片标签作为深度学习神经网络的训练集,结合区域建议网络RPN及Fast R‑CNN卷积神经网络对数据进行训练,得到最终果蔬检测模型;步骤3,最后对测试数据进行测试;调用最终果蔬检测模型及测试程序,对测试图片进行果蔬的检测,通过观察测试结果,分析最终果蔬检测模型效果的好坏。

Description

一种基于深度学习的果蔬检测方法
技术领域
本发明涉及一种新型的果蔬检测方法,具体通过深度学习中Faster R-CNN网络来实现果蔬的检测。
背景技术
果蔬采摘是农业生产链中最耗时耗力的一个环节,约占整个作业量的40%。采摘作业质量的好坏直接影响到果蔬的储存、加工和销售,从而最终影响市场价格和经济效益。因此,果蔬采摘机器人作为农业机器人的一种形式,将成为我国农业现代化发展到一定阶段的必然产物。视觉系统作为采摘机器人的重要组成部分,从复杂的背景中将果蔬识别出来并进行定位其在空间坐标的位置是果实采摘机器人的首要任务和设计难点,识别和定位的准确性关系到采摘机器人的采摘效率和采摘质量,它能为机械手提供准确的空间位置参数,是成功实现自动化采摘的关键。
传统上,基于视觉系统的果蔬的识别和果蔬位置的确定主要有灰度、阈值和几何形状特征等方法。其中,前两者主要基于果实的光谱反射特征,但在自然光照情况下,由于图像中存在噪声和各种干扰信息,效果并不是很好。采用形状定位方式,要求目标具有完整的边界条件,由于果蔬和叶子往往容易重叠在一起,很难真正区别出果实的具体形状。也有的果实需要通过测量果实的直径和长度,决定是否采摘。然而,由于传统的机器视觉方法无论在从复杂的背景中进行果蔬识别还是果蔬空间位置的确定等方面还有诸多问题尚未得到有效解决,目前所研制的果蔬采摘机器人效果不尽理想,已成为制约果蔬采摘机器人研究与应用的瓶颈问题。
近年来,随着人工智能技术的不断发展,深度学习技术已经在计算机视觉领域的分类、识别、检测、分割、跟踪等任务都取得了突破性的进展。相较于传统的机器视觉方法,深度卷积神经网络在大数据的训练下,从大量数据中学习出有用的特征,具有速度快、精度高、成本低等优势。基于深度学习的检测方法,更多的是采用深度学习技术,通过大量样本的训练,再利用一个分类器去检测目标,其优势在于不会受到目标背景变化的影响。它不仅可以将果蔬从复杂的背景中识别出来,还能够预测目标果蔬所在位置,从而提高采摘机器人的采摘效率和采摘质量,最终解决传统的机器视觉方法在目标识别和目标定位上的难以克服的难题。
发明内容
本发明要克服现有技术的上述缺点,提出一种基于深度学习的果蔬检测方法,提高目标识别和目标定位的精度,实现果蔬检测系统结果的精确性、快速性及可靠性。
一种基于深度学习的果蔬检测方法,通过对图片进行事先人工标注产生具有标签的图片作为网络的训练集,采用Faster R-CNN算法,训练一个负责寻找图片中区域建议框的RPN(Region Proposal Network)卷积神经网络和一个负责目标检测的Fast R-CNN卷积神经网络,其中RPN和Fast R-CNN卷积神经网络通过交替训练阶段实现卷积层共享特征图,实现了一个端到端的目标检测框架。
一种基于深度学习的果蔬检测方法,包括:
Step 1:用训练好的ImageNet预训练模型RPN,使用反向传播(Back Propagation)算法调整RPN卷积神经网络参数,得到RPN卷积神经网络新模型M1,在训练集上调用训练好的RPN卷积神经网络模型M1,产生果蔬的候选区域P1。反向传播算法是指是使Faster R-CNN的多任务损失函数值最小化,损失函数表达式为:
Pi*Lreg就表示只有为正标签的锚anchor才有回归损失函数。
Lcls(pi,pi*)分类损失函数表达式为:
Lcls(pi,pi*)=-log[pi *pi+(1-pi *)(1-pi)]
Lreg(ti,ti*)回归损失函数表达式为:
Lreg(ti,ti*)=R(ti-ti *)
其中R表示平滑smooth的损失函数1,即L1-loss,该损失函数表达式为:
Pi表示第i个anchor是目标的预测概率值,i即表示每个批量训练中第i个anchor;
pi*表示真值Ground Truth的标签,及图片是目标的概率值:
ti={tx,ty,tw,th}表示预测的bounding box包围框的四个参数化坐标,(tx,ty)表示边界框左上角坐标,tw表示边界框长,th表示边界框高;
ti *表示每个正标签对应的GT包围框的四个参数化坐标;
Ncls、Nreg分别表示分类层和回归层的归一化;λ表示平衡权重,通常λ=10,Ncls=256表示批量操作数的大小,Nreg近似为2400,这样就可以实现分类及回归的等权重化;
Step2:用产生的候选区域P1及训练好的ImageNet模型训练Fast R-CNN,具体为输入训练集及果蔬的候选区域P1,结合样本集的标注及标签进行训练,得到新的Fast R-CNN卷积神经网络模型M2;
Step3:调用M2模型重新训练RPN网络,这次卷积层参数不变,只做前向计算,对RPN卷积神经网络进行微调,训练得新的RPN卷积神经网络模型M3;
Step4:调用M3模型重新产生候选区域P2,用M3和P2训练Fast R-CNN卷积神经网络,微调Fast R-CNN卷积神经网络的全连接层,主要是对bounding box的位置进行精修,最终Faster R-CNN模型M4;
位置精修法:
先做边界框的位置平移(Δx,Δy),Δx=pw dx(p),Δy=ph dy(p);
P表示候选区域Region Proposal;x,y,w,h分别表示该候选区域的左上角坐标、长和高;Δx表示边界框左上角坐标在x轴上的平移量、pw表示候选区域框的宽、dx(p)表示对候选区域x求导、Δy表示边界框左上角坐标在y轴上的平移量、ph表示候选区域框的高、dy(p)表示对候选区域y求导。
再经过尺寸缩放(sw,sh),sw=pwdw(p),sh=phdh(p);
其中sw表示边界框宽度的缩放量、pw表示候选区域框的宽、dw(p)表示对候选区域w求导、sh表示边界框高度的缩放量、ph表示候选区域框的高、dh(p)表示对候选区域h求导。
进一步,RPN卷积神经网络的前五层卷积层为特征提取层,第六层卷积层将特征图中果蔬的位置编码为一组向量,为特征映射层,第七层卷积层对每个果蔬位置进行输出为一个目标置信度,目标置信度即根据IoU计算bounding box边界框的准确度,IoU即Intersection over Union的值定义:Region Proposal与Ground Truth的窗口的交集比并集的比值;因为得到的候选区域有些高度重合,为了降低冗余性,在分类值cls score基础上对候选区域应用NMS(non-maximum suppression)方法,将IoU阈值设为0.7,即候选区域与任意真实数据GT的IoU重叠超过0.7的框为正标签。最后一层为输出层,采用Softmax分类法,得到每个目标框的cls score。
4.同时,对数据进行训练的Fast R-CNN卷积神经网络,包括五个卷积层,一个池化层ROI,该ROI池化层本质上相当于一个SPP的简化,因为全连接层的输入必须是统一固定大,所以先将每个ROI池化到一个固定大小的特征图,再通过全连接层将特征图映射到一个特征向量,将特征向量分别输入到一个分类全连接层cls-layer,输出k+1位数组p,k+1表示样本类别为k类,加1表示还有一类为背景,共k+1类,用于判定该proposal是前景还是背景,每个ROI的输出离散型概率分布表达式为:p=(p0,p1,…pk,)其中pi表示第i个ROI是前景的概率;一个回归全连接层reg-layer,用于预测proposal的中心锚点对应的proposal的左上角坐标x、y和宽高w、h,对候选区域的位置进行精修,位移平移或缩放为4*k维数组参数,4*k表示每一个候选区域左上角坐标、长和高4个参数,表达式为:tt={tx,ty,tw,th},其中tx,ty,tw,th分别表示候选区域尺度不变的左上角坐标平移和对数空间相对于候选区域的宽和高。Fast R-CNN将特征向量输出为两个输出向量,直接一次性输出分类的结果和回归后的bounding-box。
本发明的有益效果在于:
事先对训练集进行数据的标定得到标签样本集,将样本集输入到RPN卷积神经网络进行训练,RPN卷积神经网络相当于一个能够确定果蔬位置的回归器。RPN的主要功能之一为:利用anchor和边框回归得到多尺度多长宽比的Region Proposal,在特征图上利用滑动小网络与特征图上3*3的窗口全连接,再映射到一个低维向量,最后将该向量送入两个全连接层,实现多尺度目标的框定,适应自然场景,再利用IoU这个定位精度评价指标,得到最佳bounding box。再训练Fast R-CNN卷积神经网络,将RPN卷积神经网络获得的建议区域作为输入,对建议区域进行检测并识别出Proposal中的目标。与现有技术相比,这种方法对果蔬形状大小、变异遮挡不敏感,能够提升果蔬的检测精度,而且只要正确得到最终模型,之后的测试相对简易,同时通过RPN及Fast R-CNN卷积神经网络的共享卷积层参数,使计算量大大降低,若投入到采摘机器人的视觉系统,对于解放劳动力、提高生产效率、降低生产成本、保证新鲜果蔬品质,以及满足作物生长的实时性要求等方面都有着很重要的意义。
附图说明
图1为本发明所述果蔬检测方法的流程图;
图2为RPN网络结构图;
图3为本发明所述Faster R-CNN统一的网络结构示意图;
图4是本发明IoU定义同一候选区域的两个bounding box的重叠度示意图;
图5-10为本发明所述果蔬检测方法的结果效果图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步的详细描述,其中:
Faster R-CNN网络由一个RPN卷积神经网络和一个Fast R-CNN卷积神经网络组成,其中RPN卷积神经网络处理的是回归问题,在本发明中主要负责获得图片中各类果蔬的候选区域;Fast R-CNN卷积神经网络处理的是分类问题,在发明中负责对RPN获取的候选区域进行进一步的筛选,判别候选区域属于前景还是背景。
以下将参照附图,对本发明进行详细的描述。
如图1所示,本发明采用的是Faster R-CNN算法,将事先人工做好标注和标签的任意大小的图片作为网络的输入训练集,再训练RPN卷积神经网络来获取处理的训练集图片中各类果蔬的候选区域,然后将各类果蔬候选区域送入训练好的Fast R-CNN卷积神经网络中做分类工作,根据Fast R-CNN卷积神经网络的输出向量判别果蔬的候选区域是否属于最佳果蔬区域,若为最佳候选区域,则得到果蔬最终区域。因为果蔬检测不仅需要定位出目标边界框,还需要识别出边界框里面的物体是否为果蔬,这里采用IoU这个定位精度评价指标来对多个边界框进行回归,得到最佳的候选区域。
在本发明中,RPN卷积神经网络前五层借用ZF网络(具体实现步骤为RPN卷积神经网络具体实现前7个步骤),后接两个全连接层进行分类和回归的输出Fast R-CNN卷积神经网络由五个卷积层、一个ROI池化层,两个全连接进行分类和回归的输出。
如图2所示,RPN卷积神经网络具体实现步骤:
1、首先,假设输入图片大小是224*224*3(3指RGB三种通道);
2、然后第一层的卷积核维度是7*7*3*96(所有的卷积核维度为4维);
3、第一层卷积层conv1得到图片大小是110*110*96(110由公式(224-7+pad)/2+1所得,pad指图片的周围补充像素,为了得到整数像素值,除以2中2为步幅);
4、然后就是做一次池化,得到pool1,池化核的大小是3*3,所以池化后图片的大小是55*55*96((110-3+pad)/2+1=55);
5、接着就是再一次卷积,这次的卷积核的维度是5*5*96*256,得到conv2:图片大小为26*26*256;
6、后面就是类似的过程了,如果有些地方除法除不尽,可以做pad填充;
7、最后取的是第五层卷积之后conv5的输出,也就是13*13*256的特征图送给RPN网络;
8、在得到的特征图上用3*3的滑动窗口,用一个3*3*256*256的一个4维的卷积核,就可以将每一个3*3的滑动窗口卷积成一个256维的向量;
9、然后就是k=9,即9个不同尺寸的anchor,在256维的向量和分类层(cls layer)之间使用一个1*1*256*18的卷积核,就可以得到分类层的输出,所以分类层就是18(2*9)个输出节点,对每个anchor做一个二分类工作,判定每个anchor属于前景还是背景的概率值;
回归层(reg layer)也是一样了,同上,在256维的向量和回归层之间使用一个1*1*256*36的卷积核,就得到回归层的输出,所以回归层就是36(4*9)个输出节点,得到每个anchor的坐标需要平移/缩放的参数值。
如图3所示,Fast R-CNN卷积神经网络具体实现步骤:
1、对于一张任意给定大小的图片,通过SS(selective search)方法提取2000个候选框;
2、将任意大小的图片输入到Fast R-CNN网络,经过五层卷积池化操作之后,得到一张特征图;
3、将该特征图和提取的候选框输入到ROI池化层,因为输入全连接层的特征图必须是固定统一大小,所以用ROI池化层对特征图统一到相同大小;
4、将ROI池化层输出的每个ROI输入一个全连接层,求对应的映射关系,得到特征向量;
5、将特征向量同时作为两个全连接层的输入,得到两个优化之后的结果。第一个优化结果使用softmax方法进行分类,第二个优化目标是bounding box边界框回归,使用了一个smooth的L1-loss,是为了提高网络对离群点即异常点的鲁棒性。
在生成的最终Faster R-CNN模型中,遵循多任务损失函数来最小化目标函数,具体将分类和回归的Loss函数值进行叠加,模型好坏的指标为Loss函数值的大小,用Loss函数来评价模型的预测值与真实值之间的差异程度。
多任务损失函数表达式:
在发明内容里已详细介绍过多任务损失函数的相关定义,这里不重复介绍。
其中正标签的判定方法为当anchor与任意Ground Truth包围框的IoU值大于设定阈值(如0.7)即判定为正标签;负标签的判定方法为当anchor与所有Ground Truth包围框的IoU值小于设定阈值(如0.3)即判定为负标签。
如图4所示,IoU定义同一候选区域的两个bounding box的重叠度,:
矩形框A、B的一个重合度IoU计算公式为:
IoU=(A∩B)/(A∪B)
就是矩形框A、B的重叠面积占A、B并集的面积比例:
IoU=Si/(SA+SB-Si)
其中SA表示A边界框的面积、SB表示B边界框的面积、Si表示A边界框与B边界框的交集面积。
同时为了降低冗余性,在分类值cls score基础上对候选区域应用NMS(non-maximum suppression)方法,来判别图片中找到n多个可能是物体的矩形框中(一个真实目标对应n个可能是物体的矩形框),哪些矩形框是无用的。假设一张图中有6个矩形框都判定为有目标的目标框,根据分类器类别分类概率做排序,从小到大分别属于果蔬的概率分别为A、B、C、D、E、F。
1、从最大概率矩形框F开始,分别判断A~E与F的重叠率IoU是否大于某个设定的阈值,假设阈值为0.7;
2、假设A、D与F的重叠率大于设定阈值,那么扔掉A、D,并标记第一个矩形框F,是我们保留下来的;
3、从剩下的B、C、E中选取概率值最大的E,然后判断E与B、C的重叠率,重叠率大于0.7,那么就扔掉;并且标记E为我们保留下来的第二个矩形框;
这样一直重复下去,直到找到最后被保留下来的矩形框。
最后Fast R-CNN的回归输出会对每个bounding box进行位移的调整,回归的目标是寻找一种关系使得输入的原始窗口P(Proposal)经过映射达到一个跟真实标定窗口G(Ground Truth)更接近的回归预测窗口
Faster R-CNN中的bounding box回归调整公式为:
tw=log(w/wa)th=log(h/ha)
tx *=(x*-xa)/wa ty *=(y*-ya)/ha
tw *=log(w*/wa)th *=log(h*/ha)
tx,ty,tw,th表示候选区域尺度不变的左上角坐标平移和对数空间相对于候选区域的宽和高;tx *,ty *,tw *,th *表示回归预测窗口经过平移缩放之后的左上角坐标、宽和高。
Faster R-CNN模型具体测试过程:
通过上述训练之后得到果蔬检测的最终Faster R-CNN模型,在测试阶段只需要把需要测试的图片放入测试函数调用对应的文件下,修改测试函数中对应的参数值(如类别数目)就可以调用上述训练得到的最终果蔬检测模型进行果蔬的检测,调用训练迭代次数2万次的最终模型,进行测试,得到检测结果mAP值为0.751。图5至图10分别为草莓、橘子与芒果的测试结果效果图。红色边框表示每个果蔬目标的bbox,左上角的标注表示该边界框表示的果蔬种类,其中s表示strawberry草莓、o表示orange橘子、m表示mango芒果,种类后面的数字表示在Faster R-CNN模型下简称该边界框为对应类果蔬的检测精度,可以看出,即使在有障碍物遮挡的情况下,系统也可以正确的识别出目标。

Claims (4)

1.一种基于深度学习的果蔬检测方法,包括:
步骤1,首先对数据进行预处理;对原始图片事先进行手工标定,获得分割标签。标定是指原始图片中目标框的左上角点与右下角点的坐标,标签是指判定每个标定框中目标是否为果蔬及确定果蔬的类别。
步骤2,其次对数据进行训练;将所述原始图片和图片标签作为深度学习神经网络的训练集,结合区域建议网络RPN及Fast R-CNN卷积神经网络对数据进行训练,得到最终果蔬检测模型。
步骤3,最后对测试数据进行测试;调用最终果蔬检测模型及测试程序,对测试图片进行果蔬的检测,通过观察测试结果,分析最终果蔬检测模型效果的好坏。
2.如权利要求1所述的一种基于深度学习的果蔬检测方法,其特征在于:权利要求书1中步骤2对数据进行训练,RPN和Fast R-CNN卷积神经网络通过交替训练阶段实现卷积层共享特征图,训练具体步骤如下:
Step 1:用训练好的ImageNet预训练模型RPN,使用反向传播算法调整RPN卷积神经网络参数,得到RPN卷积神经网络新模型M1,在训练集上调用训练好的RPN卷积神经网络模型M1,产生果蔬的候选区域P1;反向传播算法是指是使Faster R-CNN的多任务损失函数值最小化,损失函数表达式为:
<mrow> <mi>L</mi> <mrow> <mo>(</mo> <mo>{</mo> <mi>p</mi> <mi>i</mi> <mo>}</mo> <mo>,</mo> <mo>{</mo> <mi>t</mi> <mi>i</mi> <mo>}</mo> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mn>1</mn> <mrow> <mi>N</mi> <mi>c</mi> <mi>l</mi> <mi>s</mi> </mrow> </mfrac> <munder> <mo>&amp;Sigma;</mo> <mi>i</mi> </munder> <mi>L</mi> <mi>c</mi> <mi>l</mi> <mi>s</mi> <mrow> <mo>(</mo> <mi>p</mi> <mi>i</mi> <mo>,</mo> <msup> <mi>pi</mi> <mo>*</mo> </msup> <mo>)</mo> </mrow> <mo>+</mo> <mi>&amp;lambda;</mi> <mfrac> <mn>1</mn> <mrow> <mi>N</mi> <mi>r</mi> <mi>e</mi> <mi>g</mi> </mrow> </mfrac> <munder> <mo>&amp;Sigma;</mo> <mi>i</mi> </munder> <mi>p</mi> <mi>i</mi> <mo>*</mo> <mi>L</mi> <mi>r</mi> <mi>e</mi> <mi>g</mi> <mrow> <mo>(</mo> <mi>t</mi> <mi>i</mi> <mo>,</mo> <msup> <mi>ti</mi> <mo>*</mo> </msup> <mo>)</mo> </mrow> </mrow>
Pi*Lreg就表示只有为正标签的锚anchor才有回归损失函数;
Lcls(pi,pi*)分类损失函数表达式为:
Lcls(pi,pi*)=-log[pi *pi+(1-pi *)(1-pi)]
Lreg(ti,ti*)回归损失函数表达式为:
Lreg(ti,ti*)=R(ti-ti *)
其中R表示平滑smooth的损失函数1即L1-loss,该损失函数表达式为:
<mrow> <msub> <mi>smooth</mi> <msub> <mi>L</mi> <msup> <mn>1</mn> <mrow> <mo>(</mo> <mi>x</mi> <mo>)</mo> </mrow> </msup> </msub> </msub> <mo>=</mo> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mrow> <mn>0.5</mn> <msup> <mi>x</mi> <mn>2</mn> </msup> </mrow> </mtd> <mtd> <mrow> <mi>i</mi> <mi>f</mi> <mrow> <mo>|</mo> <mi>x</mi> <mo>|</mo> </mrow> <mo>&lt;</mo> <mn>1</mn> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mrow> <mo>|</mo> <mi>x</mi> <mo>|</mo> </mrow> <mo>-</mo> <mn>0.5</mn> </mrow> </mtd> <mtd> <mrow> <mi>o</mi> <mi>t</mi> <mi>h</mi> <mi>e</mi> <mi>r</mi> <mi>w</mi> <mi>i</mi> <mi>s</mi> <mi>e</mi> </mrow> </mtd> </mtr> </mtable> </mfenced> </mrow>
Pi表示第i个anchor是目标的预测概率值,i即表示每个批量训练中第i个anchor;
pi*表示真值Ground Truth的标签,及图片是目标的概率值:
<mrow> <msup> <mi>pi</mi> <mo>*</mo> </msup> <mo>=</mo> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mn>0</mn> </mtd> <mtd> <mrow> <mi>n</mi> <mi>e</mi> <mi>g</mi> <mi>a</mi> <mi>t</mi> <mi>i</mi> <mi>v</mi> <mi>e</mi> <mi> </mi> <mi>l</mi> <mi>a</mi> <mi>b</mi> <mi>e</mi> <mi>l</mi> </mrow> </mtd> </mtr> <mtr> <mtd> <mn>1</mn> </mtd> <mtd> <mrow> <mi>p</mi> <mi>o</mi> <mi>s</mi> <mi>i</mi> <mi>t</mi> <mi>i</mi> <mi>v</mi> <mi>e</mi> <mi> </mi> <mi>l</mi> <mi>a</mi> <mi>b</mi> <mi>e</mi> <mi>l</mi> </mrow> </mtd> </mtr> </mtable> </mfenced> </mrow>
ti={tx,ty,tw,th}表示预测的bounding box包围框的四个参数化坐标,(tx,ty)表示边界框左上角坐标,tw表示边界框长,th表示边界框高;
ti *表示每个正标签对应的GT包围框的四个参数化坐标;
Ncls、Nreg分别表示分类层和回归层的归一化;λ表示平衡权重,通常λ=10,Ncls=256表示批量操作数的大小,Nreg近似为2400,这样就可以实现分类及回归的等权重化;
Step2:用产生的候选区域P1及训练好的ImageNet模型训练Fast R-CNN,具体为输入训练集及果蔬的候选区域P1,结合样本集的标注及标签进行训练,得到新的Fast R-CNN卷积神经网络模型M2;
Step3:调用M2模型重新训练RPN网络,这次卷积层参数不变,只做前向计算,对RPN卷积神经网络进行微调,训练得新的RPN卷积神经网络模型M3;
Step4:调用M3模型重新产生候选区域P2,用M3和P2训练Fast R-CNN卷积神经网络,微调Fast R-CNN卷积神经网络的全连接层,主要是对bounding box的位置进行精修,最终Faster R-CNN模型M4;
位置精修法:
先做边界框的位置平移(Δx,Δy),Δx=pwdx(p),Δy=phdy(p);
P表示候选区域Region Proposal;x,y,w,h分别表示该候选区域的左上角坐标、长和高;Δx表示边界框左上角坐标在x轴上的平移量、pw表示候选区域框的宽、dx(p)表示对候选区域x求导、Δy表示边界框左上角坐标在y轴上的平移量、ph表示候选区域框的高、dy(p)表示对候选区域y求导。
再经过尺寸缩放(sw,sh),sw=pwdw(p),sh=phdh(p);
其中sw表示边界框宽度的缩放量、pw表示候选区域框的宽、dw(p)表示对候选区域w求导、sh表示边界框高度的缩放量、ph表示候选区域框的高、dh(p)表示对候选区域h求导。
3.如权利要求1所述的一种基于深度学习的果蔬检测方法,其特征在于:权利要求书1中步骤2对数据进行训练,RPN卷积神经网络的前五层卷积层为特征提取层,第六层卷积层将特征图中果蔬的位置编码为一组向量,为特征映射层,第七层卷积层对每个果蔬位置进行输出为一个目标置信度,目标置信度即根据IoU计算bounding box边界框的准确度,IoU即Intersection over Union的值定义:Region Proposal与Ground Truth的窗口的交集比并集的比值;因为得到的候选区域有些高度重合,为了降低冗余性,在分类值cls score基础上对候选区域应用NMS方法,将IoU阈值设为0.7,即候选区域与任意真实数据GT的IoU重叠超过0.7的框为正标签。最后一层为输出层,采用Softmax分类法,得到每个目标框的clsscore。
4.如权利要求1所述的一种基于深度学习的果蔬检测方法,其特征在于:权利要求书1中步骤2对数据进行训练,Fast R-CNN卷积神经网络,包括五个卷积层,一个池化层ROI,该ROI池化层本质上相当于一个SPP的简化,因为全连接层的输入必须是统一固定大,所以先将每个ROI池化到一个固定大小的特征图,再通过全连接层将特征图映射到一个特征向量,将特征向量分别输入到一个分类全连接层cls-layer,输出k+1位数组p,k+1表示样本类别为k类,加1表示还有一类为背景,共k+1类,用于判定该proposal是前景还是背景,每个ROI的输出离散型概率分布表达式为:p=(p0,p1,…pk,)其中pi表示第i个ROI是前景的概率;一个回归全连接层reg-layer,用于预测proposal的中心锚点对应的proposal的左上角坐标x、y和宽高w、h,对候选区域的位置进行精修,位移平移或缩放为4*k维数组参数,4*k表示每一个候选区域左上角坐标、长和高4个参数,表达式为:tt={tx,ty,tw,th},其中tx,ty,tw,th分别表示候选区域尺度不变的左上角坐标平移和对数空间相对于候选区域的宽和高。FastR-CNN将特征向量输出为两个输出向量,直接一次性输出分类的结果和回归后的bounding-box。
CN201710544590.8A 2017-07-06 2017-07-06 一种基于深度学习的果蔬检测方法 Pending CN107451602A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710544590.8A CN107451602A (zh) 2017-07-06 2017-07-06 一种基于深度学习的果蔬检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710544590.8A CN107451602A (zh) 2017-07-06 2017-07-06 一种基于深度学习的果蔬检测方法

Publications (1)

Publication Number Publication Date
CN107451602A true CN107451602A (zh) 2017-12-08

Family

ID=60488318

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710544590.8A Pending CN107451602A (zh) 2017-07-06 2017-07-06 一种基于深度学习的果蔬检测方法

Country Status (1)

Country Link
CN (1) CN107451602A (zh)

Cited By (94)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108010025A (zh) * 2017-12-14 2018-05-08 浙江大学 基于rcnn的屏柜的开关与指示灯定位和状态识别方法
CN108009515A (zh) * 2017-12-14 2018-05-08 杭州远鉴信息科技有限公司 一种基于fcn的无人机航拍图像的输电线定位识别方法
CN108154199A (zh) * 2017-12-22 2018-06-12 任俊芬 一种基于深度学习的高精度快速单类目标检测方法
CN108197637A (zh) * 2017-12-11 2018-06-22 国网上海市电力公司 一种基于深度学习的高压机柜开关检测方法
CN108229946A (zh) * 2018-02-08 2018-06-29 中山简单点网络技术有限公司 一种无人销售结算系统及系统识别商品的方法
CN108235733A (zh) * 2017-12-29 2018-06-29 深圳达闼科技控股有限公司 基于拉曼光谱的物质识别方法及云端系统
CN108229397A (zh) * 2018-01-04 2018-06-29 华南理工大学 基于Faster R-CNN的图像中文本检测方法
CN108256428A (zh) * 2017-12-19 2018-07-06 歌尔股份有限公司 实物翻译方法及移动终端、服务器
CN108256476A (zh) * 2018-01-17 2018-07-06 百度在线网络技术(北京)有限公司 用于识别果蔬的方法和装置
CN108280453A (zh) * 2018-01-08 2018-07-13 西安电子科技大学 基于深度学习的低功耗快速检测图像目标方法
CN108509839A (zh) * 2018-02-02 2018-09-07 东华大学 一种基于区域卷积神经网络高效的手势检测识别方法
CN108520273A (zh) * 2018-03-26 2018-09-11 天津大学 一种基于目标检测的稠密小商品快速检测识别方法
CN108537775A (zh) * 2018-03-02 2018-09-14 浙江工业大学 一种基于深度学习检测的癌细胞跟踪方法
CN108596883A (zh) * 2018-04-12 2018-09-28 福州大学 一种基于深度学习和距离约束的航拍图像防震锤滑移故障诊断方法
CN108682003A (zh) * 2018-04-04 2018-10-19 睿视智觉(厦门)科技有限公司 一种产品质量检测方法
CN108694829A (zh) * 2018-03-27 2018-10-23 西安科技大学 基于无人机群移动平台的交通流量识别监测网络和方法
CN108686978A (zh) * 2018-05-02 2018-10-23 广州慧睿思通信息科技有限公司 基于arm的水果类别和色泽的分拣方法及系统
CN108765392A (zh) * 2018-05-20 2018-11-06 复旦大学 一种基于滑动窗口的消化道内镜病变检测和识别方法
CN108764313A (zh) * 2018-05-17 2018-11-06 西安电子科技大学 基于深度学习的超市商品识别方法
CN108805064A (zh) * 2018-05-31 2018-11-13 中国农业大学 一种基于深度学习的鱼类定位检测和识别方法及系统
CN108805070A (zh) * 2018-06-05 2018-11-13 合肥湛达智能科技有限公司 一种基于嵌入式终端的深度学习行人检测方法
CN108830188A (zh) * 2018-05-30 2018-11-16 西安理工大学 基于深度学习的车辆检测方法
CN108875903A (zh) * 2018-01-02 2018-11-23 北京迈格威科技有限公司 图像检测的方法、装置、系统及计算机存储介质
CN108875577A (zh) * 2018-05-11 2018-11-23 深圳市易成自动驾驶技术有限公司 目标检测方法、装置及计算机可读存储介质
CN108960343A (zh) * 2018-08-02 2018-12-07 霍金阁 一种固废识别方法、系统、装置及可读存储介质
CN109086781A (zh) * 2018-08-15 2018-12-25 北京航空航天大学 一种基于深度学习的机柜灯状态识别方法
CN109101897A (zh) * 2018-07-20 2018-12-28 中国科学院自动化研究所 水下机器人的目标检测方法、系统及相关设备
CN109117876A (zh) * 2018-07-26 2019-01-01 成都快眼科技有限公司 一种稠密小目标检测模型构建方法、模型及检测方法
CN109131843A (zh) * 2018-08-22 2019-01-04 王桥生 长时视觉追踪主动分离式起落架
CN109145906A (zh) * 2018-08-31 2019-01-04 北京字节跳动网络技术有限公司 目标对象的图像确定方法、装置、设备及存储介质
CN109145931A (zh) * 2018-09-03 2019-01-04 百度在线网络技术(北京)有限公司 物体检测方法、装置及存储介质
CN109214353A (zh) * 2018-09-27 2019-01-15 云南大学 一种基于剪枝模型的人脸图像快速检测训练方法和装置
CN109241962A (zh) * 2018-08-30 2019-01-18 云南电网有限责任公司普洱供电局 一种字符识别方法及装置
CN109255382A (zh) * 2018-09-07 2019-01-22 阿里巴巴集团控股有限公司 用于图片匹配定位的神经网络系统,方法及装置
CN109285139A (zh) * 2018-07-23 2019-01-29 同济大学 一种基于深度学习的x射线成像焊缝检测方法
CN109377508A (zh) * 2018-09-26 2019-02-22 北京字节跳动网络技术有限公司 图像处理方法和装置
CN109377441A (zh) * 2018-08-20 2019-02-22 清华大学 具有隐私保护功能的舌像采集方法和系统
CN109376736A (zh) * 2018-09-03 2019-02-22 浙江工商大学 一种基于深度卷积神经网络的视频小目标检测方法
CN109409365A (zh) * 2018-10-25 2019-03-01 江苏德劭信息科技有限公司 一种基于深度目标检测的待采摘水果识别和定位方法
CN109448854A (zh) * 2018-09-14 2019-03-08 慧影医疗科技(北京)有限公司 一种肺结核检测模型的构建方法及应用
CN109509223A (zh) * 2018-11-08 2019-03-22 西安电子科技大学 基于深度学习的前方车辆测距方法
CN109522938A (zh) * 2018-10-26 2019-03-26 华南理工大学 一种基于深度学习的图像中目标的识别方法
CN109543601A (zh) * 2018-11-21 2019-03-29 电子科技大学 一种基于多模态深度学习的无人车目标检测方法
CN109657541A (zh) * 2018-11-09 2019-04-19 南京航空航天大学 一种基于深度学习的无人机航拍图像中的船舶检测方法
CN109711474A (zh) * 2018-12-24 2019-05-03 中山大学 一种基于深度学习的铝材表面缺陷检测算法
CN109740721A (zh) * 2018-12-19 2019-05-10 中国农业大学 麦穗计数方法及装置
CN109766752A (zh) * 2018-11-28 2019-05-17 西安电子科技大学 一种基于深度学习的目标匹配和定位方法及系统、计算机
CN109782771A (zh) * 2019-02-26 2019-05-21 西安交通大学 一种果园移动机器人及地头转向方法
CN109784315A (zh) * 2019-02-20 2019-05-21 苏州风图智能科技有限公司 3d障碍物的跟踪检测方法、装置、系统及计算机存储介质
CN109919239A (zh) * 2019-03-15 2019-06-21 尹显东 一种基于深度学习的农作物病虫害智能检测方法
CN109948444A (zh) * 2019-02-19 2019-06-28 重庆理工大学 基于cnn的果实与障碍物的同步识别方法、系统与机器人
CN109978863A (zh) * 2019-03-27 2019-07-05 北京青燕祥云科技有限公司 基于x射线图像的目标检测方法及计算机设备
CN109977780A (zh) * 2019-02-26 2019-07-05 广东工业大学 一种基于深度学习算法的硅藻的检测与识别方法
CN110000785A (zh) * 2019-04-11 2019-07-12 上海交通大学 农业场景无标定机器人运动视觉协同伺服控制方法与设备
CN110059672A (zh) * 2019-04-30 2019-07-26 福州大学 一种利用增量学习对显微镜细胞图像检测模型进行增类学习的方法
CN110287998A (zh) * 2019-05-28 2019-09-27 浙江工业大学 一种基于Faster-RCNN的科技文献图片提取方法
CN110348503A (zh) * 2019-07-02 2019-10-18 西京学院 一种基于卷积神经网络的苹果品质检测方法
CN110363162A (zh) * 2019-07-18 2019-10-22 北京工业大学 一种聚焦关键区域的深度学习目标检测方法
CN110363478A (zh) * 2019-07-11 2019-10-22 江苏安方电力科技有限公司 一种室外堆场数字化系统
CN110378422A (zh) * 2019-07-22 2019-10-25 福州大学 一种基于Faster R-CNN的武器识别方法
CN110490167A (zh) * 2019-08-26 2019-11-22 珠海格力电器股份有限公司 基于Faster-RCNN神经网络的榨汁机控制方法、存储器和榨汁机
CN110751155A (zh) * 2019-10-14 2020-02-04 西北工业大学 一种新的基于Faster R-CNN的目标检测方法
CN110766058A (zh) * 2019-10-11 2020-02-07 西安工业大学 一种基于优化rpn网络的战场目标检测方法
CN110781889A (zh) * 2019-10-26 2020-02-11 苏州大学 一种基于深度学习的蓝莓果实中总糖含量的无损检测方法
CN110852317A (zh) * 2019-09-16 2020-02-28 浙江工业大学 一种基于弱边缘的小尺度目标检测方法
CN110889367A (zh) * 2019-11-22 2020-03-17 贵州科学院(贵州省应用技术研究院) 一种基于深度学习的厨房工作人员穿着规范识别方法
CN110909660A (zh) * 2019-11-19 2020-03-24 佛山市南海区广工大数控装备协同创新研究院 一种基于目标检测的塑料瓶检测与定位方法
CN110910450A (zh) * 2019-09-26 2020-03-24 西安交通大学 一种基于混合特征感知神经网络进行3d目标检测的方法
CN110942000A (zh) * 2019-11-13 2020-03-31 南京理工大学 一种基于深度学习的无人驾驶车辆目标检测方法
CN110992578A (zh) * 2019-12-04 2020-04-10 华南理工大学 一种面向多光源票据综合鉴别的深度学习目标检测方法
CN111008626A (zh) * 2018-10-04 2020-04-14 斯特拉德视觉公司 基于r-cnn检测客体的方法和装置
CN111027605A (zh) * 2019-11-28 2020-04-17 北京影谱科技股份有限公司 基于深度学习的细粒度图像识别方法和装置
CN111160479A (zh) * 2019-12-31 2020-05-15 华南理工大学 一种焊点识别方法
CN111191768A (zh) * 2019-12-18 2020-05-22 山东众阳健康科技集团有限公司 一种深度神经网络的微调方法
CN111382787A (zh) * 2020-03-06 2020-07-07 芯薇(上海)智能科技有限公司 一种基于深度学习的目标检测方法
CN111414910A (zh) * 2020-03-18 2020-07-14 上海嘉沃光电科技有限公司 基于双重卷积神经网络的小目标增强检测方法和装置
CN111462193A (zh) * 2019-01-22 2020-07-28 斯特拉德视觉公司 用于多摄像机或环绕视图监控的对象检测方法及装置
CN111488871A (zh) * 2019-01-25 2020-08-04 斯特拉德视觉公司 可转换模式的基于r-cnn的用于监视的方法和装置
CN111626314A (zh) * 2019-02-28 2020-09-04 深圳市速腾聚创科技有限公司 点云数据的分类方法、装置、计算机设备和存储介质
WO2020199593A1 (zh) * 2019-04-04 2020-10-08 平安科技(深圳)有限公司 图像分割模型训练方法、图像分割方法、装置、设备及介质
CN111814862A (zh) * 2020-06-30 2020-10-23 平安国际智慧城市科技股份有限公司 果蔬识别方法及装置
CN112070761A (zh) * 2020-09-18 2020-12-11 福州大学 一种基于深度学习的明虾新鲜度无损检测方法
CN112115824A (zh) * 2020-09-07 2020-12-22 北京豆牛网络科技有限公司 果蔬检测方法、装置、电子设备以及计算机可读介质
CN112183527A (zh) * 2020-09-21 2021-01-05 海南师范大学 基于FastR-CNN的热带水果果皮图像识别方法
CN112232334A (zh) * 2020-12-21 2021-01-15 德明通讯(上海)股份有限公司 一种智能售货商品识别检测方法
CN112364687A (zh) * 2020-09-29 2021-02-12 上善智城(苏州)信息科技有限公司 一种基于改进的Faster R-CNN加油站静电标志识别方法及系统
CN112580540A (zh) * 2020-12-23 2021-03-30 安徽高哲信息技术有限公司 一种人工智能农作物处理系统和方法
CN112580646A (zh) * 2020-12-08 2021-03-30 北京农业智能装备技术研究中心 番茄果实成熟度分割方法及采摘机器人
CN112668445A (zh) * 2020-12-24 2021-04-16 南京泓图人工智能技术研究院有限公司 一种基于yolov5的蔬菜种类检测与识别方法
WO2021093756A1 (zh) * 2019-11-11 2021-05-20 中科智云科技有限公司 基于神经网络的目标背景噪声抑制方法及设备
CN113591680A (zh) * 2021-07-28 2021-11-02 上海交通大学 对地质图片钻井经纬度进行识别的方法和系统
WO2021233041A1 (zh) * 2020-05-18 2021-11-25 华为技术有限公司 数据标注方法和装置、精细粒度识别方法和装置
EP3770830A4 (en) * 2018-03-23 2021-12-08 Guangzhou Xaircraft Technology Co., Ltd METHOD OF MEASURING PLANTING DATA, METHOD OF PLANNING WORK ROUTE, DEVICE AND SYSTEM
CN114494441A (zh) * 2022-04-01 2022-05-13 广东机电职业技术学院 基于深度学习的葡萄及其采摘点同步识别定位方法、装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106250812A (zh) * 2016-07-15 2016-12-21 汤平 一种基于快速r‑cnn深度神经网络的车型识别方法
CN106599939A (zh) * 2016-12-30 2017-04-26 深圳市唯特视科技有限公司 一种基于区域卷积神经网络的实时目标检测方法
CN106778852A (zh) * 2016-12-07 2017-05-31 中国科学院信息工程研究所 一种修正误判的图像内容识别方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106250812A (zh) * 2016-07-15 2016-12-21 汤平 一种基于快速r‑cnn深度神经网络的车型识别方法
CN106778852A (zh) * 2016-12-07 2017-05-31 中国科学院信息工程研究所 一种修正误判的图像内容识别方法
CN106599939A (zh) * 2016-12-30 2017-04-26 深圳市唯特视科技有限公司 一种基于区域卷积神经网络的实时目标检测方法

Cited By (127)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108197637A (zh) * 2017-12-11 2018-06-22 国网上海市电力公司 一种基于深度学习的高压机柜开关检测方法
CN108009515A (zh) * 2017-12-14 2018-05-08 杭州远鉴信息科技有限公司 一种基于fcn的无人机航拍图像的输电线定位识别方法
CN108009515B (zh) * 2017-12-14 2022-04-22 杭州远鉴信息科技有限公司 一种基于fcn的无人机航拍图像的输电线定位识别方法
CN108010025A (zh) * 2017-12-14 2018-05-08 浙江大学 基于rcnn的屏柜的开关与指示灯定位和状态识别方法
CN108256428A (zh) * 2017-12-19 2018-07-06 歌尔股份有限公司 实物翻译方法及移动终端、服务器
CN108154199A (zh) * 2017-12-22 2018-06-12 任俊芬 一种基于深度学习的高精度快速单类目标检测方法
CN108235733B (zh) * 2017-12-29 2022-01-25 深圳达闼科技控股有限公司 基于拉曼光谱的物质识别方法及云端系统
CN108235733A (zh) * 2017-12-29 2018-06-29 深圳达闼科技控股有限公司 基于拉曼光谱的物质识别方法及云端系统
CN108875903A (zh) * 2018-01-02 2018-11-23 北京迈格威科技有限公司 图像检测的方法、装置、系统及计算机存储介质
CN108875903B (zh) * 2018-01-02 2022-04-12 北京迈格威科技有限公司 图像检测的方法、装置、系统及计算机存储介质
CN108229397A (zh) * 2018-01-04 2018-06-29 华南理工大学 基于Faster R-CNN的图像中文本检测方法
CN108280453A (zh) * 2018-01-08 2018-07-13 西安电子科技大学 基于深度学习的低功耗快速检测图像目标方法
CN108280453B (zh) * 2018-01-08 2020-06-16 西安电子科技大学 基于深度学习的低功耗快速检测图像目标方法
CN108256476A (zh) * 2018-01-17 2018-07-06 百度在线网络技术(北京)有限公司 用于识别果蔬的方法和装置
CN108509839A (zh) * 2018-02-02 2018-09-07 东华大学 一种基于区域卷积神经网络高效的手势检测识别方法
CN108229946A (zh) * 2018-02-08 2018-06-29 中山简单点网络技术有限公司 一种无人销售结算系统及系统识别商品的方法
CN108537775A (zh) * 2018-03-02 2018-09-14 浙江工业大学 一种基于深度学习检测的癌细胞跟踪方法
EP3770830A4 (en) * 2018-03-23 2021-12-08 Guangzhou Xaircraft Technology Co., Ltd METHOD OF MEASURING PLANTING DATA, METHOD OF PLANNING WORK ROUTE, DEVICE AND SYSTEM
US11321942B2 (en) 2018-03-23 2022-05-03 Guangzhou Xaircraft Technology Co., Ltd. Method for measuring plant planting data, device and system
CN108520273A (zh) * 2018-03-26 2018-09-11 天津大学 一种基于目标检测的稠密小商品快速检测识别方法
CN108694829A (zh) * 2018-03-27 2018-10-23 西安科技大学 基于无人机群移动平台的交通流量识别监测网络和方法
CN108694829B (zh) * 2018-03-27 2021-08-13 西安科技大学 基于无人机群移动平台的交通流量识别监测网络和方法
CN108682003B (zh) * 2018-04-04 2021-10-08 睿视智觉(厦门)科技有限公司 一种产品质量检测方法
CN108682003A (zh) * 2018-04-04 2018-10-19 睿视智觉(厦门)科技有限公司 一种产品质量检测方法
CN108596883B (zh) * 2018-04-12 2021-07-13 福州大学 一种基于深度学习和距离约束的航拍图像防震锤滑移故障诊断方法
CN108596883A (zh) * 2018-04-12 2018-09-28 福州大学 一种基于深度学习和距离约束的航拍图像防震锤滑移故障诊断方法
CN108686978A (zh) * 2018-05-02 2018-10-23 广州慧睿思通信息科技有限公司 基于arm的水果类别和色泽的分拣方法及系统
CN108875577A (zh) * 2018-05-11 2018-11-23 深圳市易成自动驾驶技术有限公司 目标检测方法、装置及计算机可读存储介质
CN108764313A (zh) * 2018-05-17 2018-11-06 西安电子科技大学 基于深度学习的超市商品识别方法
CN108764313B (zh) * 2018-05-17 2022-03-04 西安电子科技大学 基于深度学习的超市商品识别方法
CN108765392A (zh) * 2018-05-20 2018-11-06 复旦大学 一种基于滑动窗口的消化道内镜病变检测和识别方法
CN108765392B (zh) * 2018-05-20 2022-03-18 复旦大学 一种基于滑动窗口的消化道内镜病变检测和识别方法
CN108830188A (zh) * 2018-05-30 2018-11-16 西安理工大学 基于深度学习的车辆检测方法
CN108805064A (zh) * 2018-05-31 2018-11-13 中国农业大学 一种基于深度学习的鱼类定位检测和识别方法及系统
CN108805070A (zh) * 2018-06-05 2018-11-13 合肥湛达智能科技有限公司 一种基于嵌入式终端的深度学习行人检测方法
CN109101897A (zh) * 2018-07-20 2018-12-28 中国科学院自动化研究所 水下机器人的目标检测方法、系统及相关设备
CN109285139A (zh) * 2018-07-23 2019-01-29 同济大学 一种基于深度学习的x射线成像焊缝检测方法
CN109117876B (zh) * 2018-07-26 2022-11-04 成都快眼科技有限公司 一种稠密小目标检测模型构建方法、模型及检测方法
CN109117876A (zh) * 2018-07-26 2019-01-01 成都快眼科技有限公司 一种稠密小目标检测模型构建方法、模型及检测方法
CN108960343A (zh) * 2018-08-02 2018-12-07 霍金阁 一种固废识别方法、系统、装置及可读存储介质
CN109086781A (zh) * 2018-08-15 2018-12-25 北京航空航天大学 一种基于深度学习的机柜灯状态识别方法
CN109377441B (zh) * 2018-08-20 2023-02-03 清华大学 具有隐私保护功能的舌像采集方法和系统
CN109377441A (zh) * 2018-08-20 2019-02-22 清华大学 具有隐私保护功能的舌像采集方法和系统
CN109131843B (zh) * 2018-08-22 2022-04-26 王桥生 长时视觉追踪主动分离式起落架
CN109131843A (zh) * 2018-08-22 2019-01-04 王桥生 长时视觉追踪主动分离式起落架
CN109241962A (zh) * 2018-08-30 2019-01-18 云南电网有限责任公司普洱供电局 一种字符识别方法及装置
CN109145906A (zh) * 2018-08-31 2019-01-04 北京字节跳动网络技术有限公司 目标对象的图像确定方法、装置、设备及存储介质
CN109145931A (zh) * 2018-09-03 2019-01-04 百度在线网络技术(北京)有限公司 物体检测方法、装置及存储介质
US11113836B2 (en) 2018-09-03 2021-09-07 Baidu Online Network Technology (Beijing) Co., Ltd. Object detection method, device, apparatus and computer-readable storage medium
CN109376736A (zh) * 2018-09-03 2019-02-22 浙江工商大学 一种基于深度卷积神经网络的视频小目标检测方法
CN109255382B (zh) * 2018-09-07 2020-07-17 阿里巴巴集团控股有限公司 用于图片匹配定位的神经网络系统,方法及装置
CN109255382A (zh) * 2018-09-07 2019-01-22 阿里巴巴集团控股有限公司 用于图片匹配定位的神经网络系统,方法及装置
CN109448854A (zh) * 2018-09-14 2019-03-08 慧影医疗科技(北京)有限公司 一种肺结核检测模型的构建方法及应用
CN109377508A (zh) * 2018-09-26 2019-02-22 北京字节跳动网络技术有限公司 图像处理方法和装置
CN109214353A (zh) * 2018-09-27 2019-01-15 云南大学 一种基于剪枝模型的人脸图像快速检测训练方法和装置
CN109214353B (zh) * 2018-09-27 2021-11-23 云南大学 一种基于剪枝模型的人脸图像快速检测训练方法和装置
CN111008626B (zh) * 2018-10-04 2023-10-13 斯特拉德视觉公司 基于r-cnn检测客体的方法和装置
CN111008626A (zh) * 2018-10-04 2020-04-14 斯特拉德视觉公司 基于r-cnn检测客体的方法和装置
CN109409365A (zh) * 2018-10-25 2019-03-01 江苏德劭信息科技有限公司 一种基于深度目标检测的待采摘水果识别和定位方法
CN109522938A (zh) * 2018-10-26 2019-03-26 华南理工大学 一种基于深度学习的图像中目标的识别方法
CN109509223A (zh) * 2018-11-08 2019-03-22 西安电子科技大学 基于深度学习的前方车辆测距方法
CN109657541A (zh) * 2018-11-09 2019-04-19 南京航空航天大学 一种基于深度学习的无人机航拍图像中的船舶检测方法
CN109543601A (zh) * 2018-11-21 2019-03-29 电子科技大学 一种基于多模态深度学习的无人车目标检测方法
CN109766752A (zh) * 2018-11-28 2019-05-17 西安电子科技大学 一种基于深度学习的目标匹配和定位方法及系统、计算机
CN109766752B (zh) * 2018-11-28 2023-01-03 西安电子科技大学 一种基于深度学习的目标匹配和定位方法及系统、计算机
CN109740721B (zh) * 2018-12-19 2021-06-29 中国农业大学 麦穗计数方法及装置
CN109740721A (zh) * 2018-12-19 2019-05-10 中国农业大学 麦穗计数方法及装置
CN109711474A (zh) * 2018-12-24 2019-05-03 中山大学 一种基于深度学习的铝材表面缺陷检测算法
CN109711474B (zh) * 2018-12-24 2023-01-17 中山大学 一种基于深度学习的铝材表面缺陷检测算法
CN111462193A (zh) * 2019-01-22 2020-07-28 斯特拉德视觉公司 用于多摄像机或环绕视图监控的对象检测方法及装置
CN111462193B (zh) * 2019-01-22 2023-09-12 斯特拉德视觉公司 用于多摄像机或环绕视图监控的对象检测方法及装置
CN111488871B (zh) * 2019-01-25 2023-08-04 斯特拉德视觉公司 可转换模式的基于r-cnn的用于监视的方法和装置
CN111488871A (zh) * 2019-01-25 2020-08-04 斯特拉德视觉公司 可转换模式的基于r-cnn的用于监视的方法和装置
CN109948444A (zh) * 2019-02-19 2019-06-28 重庆理工大学 基于cnn的果实与障碍物的同步识别方法、系统与机器人
CN109784315A (zh) * 2019-02-20 2019-05-21 苏州风图智能科技有限公司 3d障碍物的跟踪检测方法、装置、系统及计算机存储介质
CN109784315B (zh) * 2019-02-20 2021-11-09 苏州风图智能科技有限公司 3d障碍物的跟踪检测方法、装置、系统及计算机存储介质
CN109782771B (zh) * 2019-02-26 2021-01-19 西安交通大学 一种果园移动机器人及地头转向方法
CN109782771A (zh) * 2019-02-26 2019-05-21 西安交通大学 一种果园移动机器人及地头转向方法
CN109977780A (zh) * 2019-02-26 2019-07-05 广东工业大学 一种基于深度学习算法的硅藻的检测与识别方法
CN111626314B (zh) * 2019-02-28 2023-11-07 深圳市速腾聚创科技有限公司 点云数据的分类方法、装置、计算机设备和存储介质
CN111626314A (zh) * 2019-02-28 2020-09-04 深圳市速腾聚创科技有限公司 点云数据的分类方法、装置、计算机设备和存储介质
CN109919239A (zh) * 2019-03-15 2019-06-21 尹显东 一种基于深度学习的农作物病虫害智能检测方法
CN109978863A (zh) * 2019-03-27 2019-07-05 北京青燕祥云科技有限公司 基于x射线图像的目标检测方法及计算机设备
WO2020199593A1 (zh) * 2019-04-04 2020-10-08 平安科技(深圳)有限公司 图像分割模型训练方法、图像分割方法、装置、设备及介质
CN110000785A (zh) * 2019-04-11 2019-07-12 上海交通大学 农业场景无标定机器人运动视觉协同伺服控制方法与设备
CN110059672B (zh) * 2019-04-30 2022-06-14 福州大学 一种对显微镜细胞图像检测模型进行增类学习的方法
CN110059672A (zh) * 2019-04-30 2019-07-26 福州大学 一种利用增量学习对显微镜细胞图像检测模型进行增类学习的方法
CN110287998A (zh) * 2019-05-28 2019-09-27 浙江工业大学 一种基于Faster-RCNN的科技文献图片提取方法
CN110348503A (zh) * 2019-07-02 2019-10-18 西京学院 一种基于卷积神经网络的苹果品质检测方法
CN110363478B (zh) * 2019-07-11 2022-12-23 江苏安方电力科技有限公司 一种室外堆场数字化系统
CN110363478A (zh) * 2019-07-11 2019-10-22 江苏安方电力科技有限公司 一种室外堆场数字化系统
CN110363162A (zh) * 2019-07-18 2019-10-22 北京工业大学 一种聚焦关键区域的深度学习目标检测方法
CN110363162B (zh) * 2019-07-18 2022-03-08 北京工业大学 一种聚焦关键区域的深度学习目标检测方法
CN110378422A (zh) * 2019-07-22 2019-10-25 福州大学 一种基于Faster R-CNN的武器识别方法
CN110490167A (zh) * 2019-08-26 2019-11-22 珠海格力电器股份有限公司 基于Faster-RCNN神经网络的榨汁机控制方法、存储器和榨汁机
CN110852317A (zh) * 2019-09-16 2020-02-28 浙江工业大学 一种基于弱边缘的小尺度目标检测方法
CN110910450A (zh) * 2019-09-26 2020-03-24 西安交通大学 一种基于混合特征感知神经网络进行3d目标检测的方法
CN110766058A (zh) * 2019-10-11 2020-02-07 西安工业大学 一种基于优化rpn网络的战场目标检测方法
CN110751155A (zh) * 2019-10-14 2020-02-04 西北工业大学 一种新的基于Faster R-CNN的目标检测方法
CN110781889B (zh) * 2019-10-26 2022-02-08 苏州大学 一种基于深度学习的蓝莓果实中总糖含量的无损检测方法
CN110781889A (zh) * 2019-10-26 2020-02-11 苏州大学 一种基于深度学习的蓝莓果实中总糖含量的无损检测方法
WO2021093756A1 (zh) * 2019-11-11 2021-05-20 中科智云科技有限公司 基于神经网络的目标背景噪声抑制方法及设备
CN110942000A (zh) * 2019-11-13 2020-03-31 南京理工大学 一种基于深度学习的无人驾驶车辆目标检测方法
CN110942000B (zh) * 2019-11-13 2022-09-06 南京理工大学 一种基于深度学习的无人驾驶车辆目标检测方法
CN110909660A (zh) * 2019-11-19 2020-03-24 佛山市南海区广工大数控装备协同创新研究院 一种基于目标检测的塑料瓶检测与定位方法
CN110889367A (zh) * 2019-11-22 2020-03-17 贵州科学院(贵州省应用技术研究院) 一种基于深度学习的厨房工作人员穿着规范识别方法
CN111027605A (zh) * 2019-11-28 2020-04-17 北京影谱科技股份有限公司 基于深度学习的细粒度图像识别方法和装置
CN110992578A (zh) * 2019-12-04 2020-04-10 华南理工大学 一种面向多光源票据综合鉴别的深度学习目标检测方法
CN111191768A (zh) * 2019-12-18 2020-05-22 山东众阳健康科技集团有限公司 一种深度神经网络的微调方法
CN111160479A (zh) * 2019-12-31 2020-05-15 华南理工大学 一种焊点识别方法
CN111382787A (zh) * 2020-03-06 2020-07-07 芯薇(上海)智能科技有限公司 一种基于深度学习的目标检测方法
CN111414910B (zh) * 2020-03-18 2023-05-02 上海嘉沃光电科技有限公司 基于双重卷积神经网络的小目标增强检测方法和装置
CN111414910A (zh) * 2020-03-18 2020-07-14 上海嘉沃光电科技有限公司 基于双重卷积神经网络的小目标增强检测方法和装置
WO2021233041A1 (zh) * 2020-05-18 2021-11-25 华为技术有限公司 数据标注方法和装置、精细粒度识别方法和装置
CN111814862A (zh) * 2020-06-30 2020-10-23 平安国际智慧城市科技股份有限公司 果蔬识别方法及装置
CN112115824A (zh) * 2020-09-07 2020-12-22 北京豆牛网络科技有限公司 果蔬检测方法、装置、电子设备以及计算机可读介质
CN112070761A (zh) * 2020-09-18 2020-12-11 福州大学 一种基于深度学习的明虾新鲜度无损检测方法
CN112183527A (zh) * 2020-09-21 2021-01-05 海南师范大学 基于FastR-CNN的热带水果果皮图像识别方法
CN112364687A (zh) * 2020-09-29 2021-02-12 上善智城(苏州)信息科技有限公司 一种基于改进的Faster R-CNN加油站静电标志识别方法及系统
CN112580646A (zh) * 2020-12-08 2021-03-30 北京农业智能装备技术研究中心 番茄果实成熟度分割方法及采摘机器人
CN112232334A (zh) * 2020-12-21 2021-01-15 德明通讯(上海)股份有限公司 一种智能售货商品识别检测方法
CN112580540A (zh) * 2020-12-23 2021-03-30 安徽高哲信息技术有限公司 一种人工智能农作物处理系统和方法
CN112668445A (zh) * 2020-12-24 2021-04-16 南京泓图人工智能技术研究院有限公司 一种基于yolov5的蔬菜种类检测与识别方法
CN113591680A (zh) * 2021-07-28 2021-11-02 上海交通大学 对地质图片钻井经纬度进行识别的方法和系统
CN113591680B (zh) * 2021-07-28 2023-11-21 上海交通大学 对地质图片钻井经纬度进行识别的方法和系统
CN114494441B (zh) * 2022-04-01 2022-06-17 广东机电职业技术学院 基于深度学习的葡萄及其采摘点同步识别定位方法、装置
CN114494441A (zh) * 2022-04-01 2022-05-13 广东机电职业技术学院 基于深度学习的葡萄及其采摘点同步识别定位方法、装置

Similar Documents

Publication Publication Date Title
CN107451602A (zh) 一种基于深度学习的果蔬检测方法
Wan et al. Faster R-CNN for multi-class fruit detection using a robotic vision system
CN109614985B (zh) 一种基于密集连接特征金字塔网络的目标检测方法
CN108830188A (zh) 基于深度学习的车辆检测方法
Srivastava et al. Comparative analysis of deep learning image detection algorithms
CN107818302A (zh) 基于卷积神经网络的非刚性多尺度物体检测方法
CN109829893A (zh) 一种基于注意力机制的缺陷目标检测方法
CN109919177B (zh) 基于层次化深度网络的特征选择方法
CN109523552A (zh) 基于视锥点云的三维物体检测方法
CN106778835A (zh) 融合场景信息和深度特征的遥感图像机场目标识别方法
CN109583425A (zh) 一种基于深度学习的遥感图像船只集成识别方法
CN108805070A (zh) 一种基于嵌入式终端的深度学习行人检测方法
CN108009509A (zh) 车辆目标检测方法
CN108182454A (zh) 安检识别系统及其控制方法
CN105678278A (zh) 一种基于单隐层神经网络的场景识别方法
CN109784204A (zh) 一种用于并联机器人的堆叠串类水果主果梗识别和提取方法
CN106446933A (zh) 基于上下文信息的多目标检测方法
CN109886295A (zh) 一种基于神经网络的蝴蝶识别方法及相关设备
CN110334594A (zh) 一种基于批再规范化处理的yolo算法的目标检测方法
CN110472572A (zh) 一种复杂环境下海上目标的快速识别和分类方法
Chen et al. Monocular positioning of sweet peppers: An instance segmentation approach for harvest robots
CN110334656A (zh) 基于信源概率加权的多源遥感图像水体提取方法及装置
Wang et al. Tea picking point detection and location based on Mask-RCNN
CN114359245A (zh) 一种工业场景下产品表面缺陷检测方法
Hussain et al. A simple and efficient deep learning-based framework for automatic fruit recognition

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20171208

RJ01 Rejection of invention patent application after publication