CN110263819A - 一种用于贝类图像的目标检测方法及装置 - Google Patents
一种用于贝类图像的目标检测方法及装置 Download PDFInfo
- Publication number
- CN110263819A CN110263819A CN201910450044.7A CN201910450044A CN110263819A CN 110263819 A CN110263819 A CN 110263819A CN 201910450044 A CN201910450044 A CN 201910450044A CN 110263819 A CN110263819 A CN 110263819A
- Authority
- CN
- China
- Prior art keywords
- shellfish
- image
- sample
- shellfish image
- trained
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Image Analysis (AREA)
Abstract
本发明实施例提供一种用于贝类图像的目标检测方法及装置,包括:获取待检测的目标贝类图像;基于训练好的贝类图像检测模型,对所述目标贝类图像进行检测,获取到所述目标贝类图像的目标检测结果;所述训练好的贝类图像检测模型是将SSD框架中的VGG16网络替换成MobileNet网络构建的,并由标注有贝类种类的样本贝类图像训练得到的,此外,在MobileNet网络与预测网络之间设置残差注意力机制,提高局部特征的获取能力。本发明实施例采用SSD目标检测基本框架,结合MobileNet轻量级网络构建贝类图像检测模型,从而对贝类图像进行检测,能够快速的识别贝类图像中的贝类种类,相比现有贝类检测方法,具有更高的检测效率和准确度,并为移动端部署贝类图像检测提供技术可行性。
Description
技术领域
本发明涉及深度学习技术领域,尤其涉及一种用于贝类图像的目标检测方法及装置。
背景技术
以海洋贝类为代表的水产品中蕴含着丰富的蛋白质和维生素、并具有低脂肪、营养平衡性好等特点,成为人们摄取优质动物性蛋白质的主要来源。广阔的消费市场促进了我国贝类养殖业健康、稳定和持续的发展,在优化居民饮食结构、促进经济发展和提高从业者收入水平等方面发挥了重要作用。
海洋贝类作为农业经济领域的重要组成部分,具有种类繁多和特征繁杂等特点,传统的以人为主对贝类的检测识别操作,大多是基于手动提取轮廓特性,使用图形学原理进行识别。目前,以深度学习方法为主的目标检测算法在学术界和工业界已经取得了一定的成果,而在农业领域的研究还很少,在现有的目标检测方法中,由于网络结构复杂,对硬件计算能力要求高,无法在移动端进行部署,存在检测效率低下,精度不高等问题,难以满足市场需求。
因此,现在亟需一种用于贝类图像的目标检测方法及装置来解决上述问题。
发明内容
针对现有技术存在的问题,本发明实施例提供一种用于贝类图像的目标检测方法及装置。
第一方面,本发明实施例提供了一种用于贝类图像的目标检测方法,包括:
获取待检测的目标贝类图像;
基于训练好的贝类图像检测模型,对所述目标贝类图像进行检测,获取到所述目标贝类图像的目标检测结果;所述训练好的贝类图像检测模型是将SSD框架中的VGG16网络替换成MobileNet网络构建的,并由标注有贝类种类的样本贝类图像训练得到的。
第二方面,本发明实施例提供了一种用于贝类图像的目标检测装置,包括:
获取模块,用于获取待检测的目标贝类图像;
贝类图像识别模块,用于基于训练好的贝类图像检测模型,对所述目标贝类图像进行检测,获取到所述目标贝类图像的目标检测结果;所述训练好的贝类图像检测模型是将SSD框架中的VGG16网络替换成MobileNet网络构建的,并由标注有贝类种类的样本贝类图像训练得到的。
第三方面,本发明实施例提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如第一方面所提供的方法的步骤。
第四方面,本发明实施例提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面所提供的方法的步骤。
本发明实施例提供的一种用于贝类图像的目标检测方法及装置,采用SSD目标检测基本框架,结合MobileNet轻量级网络构建贝类图像检测模型,从而对贝类图像进行检测,能够快速的识别贝类图像中的贝类种类,相比现有贝类检测方法,具有更高的检测效率和准确度,并为移动端部署贝类图像检测提供技术可行性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的用于贝类图像的目标检测方法的流程示意图;
图2为本发明实施例提供的用于贝类图像的目标检测装置的结构示意图;
图3为本发明实施例提供的电子设备结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在现有基于深度学习方法为主的目标检测算法中,常用到Faster R-CNN、YOLO v3和SSD三种目标检测模型。其中,Faster R-CNN针对目标检测中候选框提取耗时的问题,在提取候选框步骤中加入一个提取边缘的神经网络,既保证的精度,又提高了速度,在PASCALVOC 2007和PASCAL VOC 2012数据集上使用VGG16网络对Faster R-CNN进行测试,分别达到了73.2%和70.4%的准确率,但是Faster R-CNN与工业化要求的实时检测还有一定的差距;YOLO v3增加了自顶向下的多级预测,解决了YOLO模型的颗粒度粗,以及对小目标无力的问题,同时引入多尺度预测和更好的基础分类网络及分类器,其分类器可以采用多个独立的Logistic分类器,虽然,YOLO v3在速度和精度上达到了一个新的高度,并具有更高的通用性,但是其网络结构复杂,无法在现有的大多数硬件设备上运行;SSD将Faster R-CNN中的Anchor机制与YOLO中的回归思想相结合,通过多尺度的方法对全图各个位置的区域特征进行回归,其核心是在特征图上采用卷积核来预测一系列默认检测框,并可以通过多尺度特征图进行预测,实现了端到端的训练,在图像分辨率低的情况下也取得了很好的精度,因此,通过SSD的目标检测方法在速度上比YOLO还要快,精度上也可以和Faster R-CNN一样具有较高的准确率,但是,SSD框架对小目标物体检测的准确性还有待提高。
在本发明实施例中,以海产贝类为研究对象,提出了一种融合注意力机制的端到端网络的贝类目标检测方法,采用SSD目标检测基本框架,结合MobileNet轻量级网络,通过引入残差注意力机制,对构建的贝类图像检测模型不断进行参数调优,使得在贝类数据集上的检测精度和速度都取得了较好的效果,为移动端和硬件的部署提供技术可行性。
图1为本发明实施例提供的用于贝类图像的目标检测方法的流程示意图,如图1所示,本发明实施例提供了一种用于贝类图像的目标检测方法,包括:
步骤101,获取待检测的目标贝类图像。
在本发明实施例中,通过移动终端或者目标检测设备上的图像扫描设备对贝类图像进行采集,从而获取到待检测的目标贝类图像。需要说明的是,本发明各实施例中描述的贝类图像泛指包含有贝类的图像,图像中的贝类即使不完整或只包含部分,也可以作为本发明实施例中的贝类图像。
步骤102,基于训练好的贝类图像检测模型,对所述目标贝类图像进行检测,获取到所述目标贝类图像的目标检测结果;所述训练好的贝类图像检测模型是将SSD框架中的VGG16网络替换成MobileNet网络构建的,并由标注有贝类种类的样本贝类图像训练得到的。
在本发明实施例中,MobileNet网络的作为一种轻量级的高效模型,可以用于移动和嵌入式视觉应用,该网络是基于流线型的架构,使用深度可分离的卷积来构建轻量级的深层神经网络。由于VGG16网络在某些实际的应用场景如移动或者嵌入式设备难以被应用,在本发明实施例中,采用MobileNet-v2网络结构替换VGG16网络应用在SSD框架上,可以达到更好的效果。MobileNet-v2网络的主要操作步骤包括:深度可分离卷积网络操作、线性瓶颈操作和倒置残差操作。具体地,对深度可分离卷积神经网络操作进行说明,首先对每一个通道进行各自的卷积操作,有多少个通道就有多少个过滤器,在得到新的通道特征图之后,这时再对这批新的通道特征图进行标准的1×1跨通道卷积操作。假定输入特征图大小是DF×DF×M,输出特征图大小是DF×DF×N,其中DF×DF是表示特征图的大小,在本发明实施例中,假设计算特征图的宽度与长度相等,输入与输出特征图大小也是相同的,因此,特征图的宽度和高度均为DF,则标准卷积操作计算复杂度为:
DK×DK×M×N×DF×DF;
而深度可分离卷积神经网络的计算复杂度为:
DK×DK×M×DF×DF+M×N×DF×DF;
可以比较深度可分离卷积神经网络和标准卷积如下:
其中,DK×DK表示卷积核大小,通过对比可知,深度可分离卷积神经网络的计算复杂度较小,通常情况下N的值较大,其倒数趋于0,所以二者复杂度差值近似为
进一步地,在本发明实施例中,对线性瓶颈操作进行说明,一方面对于ReLU层输出的非零值而言,ReLU层起到线性变换的作用;另一方面ReLU层能够保持输入信息的完整性,但仅限于输入特征位于输入空间的低维子空间中。
进一步地,在本发明实施例中,对倒置残差操作进行说明,倒置残差操作可以认为是网络剩余块的拓展。在0<t<1时,为标准的残差模块,t表示扩张系数,在本发明实施例中,t大部分为6,呈现梭子的外形,而传统残差设计是沙漏形状。
通过上述实施例构建得到贝类图像检测模型之后,将待检测的目标贝类图像输入到训练好的贝类图像检测模型中,得到该目标贝类图像的检测结果,从而得到该目标贝类图像中的贝类种类。
本发明实施例提供一种用于贝类图像的目标检测方法,采用SSD目标检测基本框架,结合MobileNet轻量级网络构建贝类图像检测模型,从而对贝类图像进行检测,能够快速的识别贝类图像中的贝类种类,相比现有贝类检测方法,具有更高的检测效率和准确度,并为移动端部署贝类图像检测提供技术可行性。
在上述实施例的基础上,所述训练好的贝类图像检测模型通过以下步骤训练得到:
根据贝类种类,对样本图像上的贝类图像进行标注,得到样本贝类图像;
对所述样本贝类图像进行图像处理,得到样本贝类图像数据集;
根据所述样本贝类图像数据集,对贝类图像检测模型进行训练,得到训练好的贝类图像检测模型。
在本发明实施例中,根据贝类种类,按照Pascal VOC格式对样本图像上的贝类图像进行标注和校正,然后对进行标注后的样本贝类图像进行图像处理,其中,图像处理包括对样本贝类图像进行旋转、平移或翻转等处理,从而扩大样本图像数量,得到样本贝类图像数据集。在本发明实施例中,通过对样本贝类图像进行图像处理,构建了一个包含7类贝类类型,共3772张图片的样本贝类数据集,将样本贝类数据集划分为样本贝类训练集、样本贝类验证集和样本贝类测试集,输入到待训练的贝类图像检测模型中,在样本贝类训练集经过贝类图像检测模型的一系列卷积和池化运算之后,提取出样本贝类的图像特征,并通过样本贝类验证集和样本贝类测试集对贝类图像检测模型进行验证和测试,若满足预设条件,则得到训练好的贝类图像检测模型。
在上述实施例的基础上,在所述根据样本贝类图像数据集,对贝类图像检测模型进行训练,得到训练好的贝类图像检测模型之前,所述方法还包括:
在所述MobileNet网络和预测网络之间设置残差注意力机制,以用于对样本贝类图像的局部特征进行处理。
在本发明实施例中,在MobileNet网络与预测网络之间引入残差注意力机制,具体地,在MobileNet网络架构之后添加残差注意力机制,可以聚集贝类图像中目标的局部特征,提高检测精度。在本发明实施例中,根据特征通道之间的关系,显式地构建特征通道之间的相互依赖关系,采用了一种全新的“特征重标定”策略,自动获取到每个特征通道的重要程度,然后依照这个重要程度去增强有用的特征,并抑制对当前任务用处不大的特征,从而能实现特征通道自适应校准,使得整个网络结构不仅关注整体信息,还关注局部信息。在本发明一实施例中,假设原来的特征图是W×H×C,先通过W×H的池化窗口进行全局池化得到1×1×C的特征图,再使用两个全连接层和一个sigmoid层,得到输出结果。其中为了更好地拟合通道间复杂的相关性,极大地减少了参数量和计算量,增加更多的非线性,在使用第一个全连接层时对神经元个数C除以r进行降维,在第二个全连接层再增加维度回到C个特征。需要说明的是,在本发明实施例中,由于通道之间具有相关性,最后的输出为1×1×C,因此,采用sigmoid而不用softmax。
在上述实施例的基础上,所述根据所述样本贝类图像数据集,对贝类图像检测模型进行训练,得到训练好的贝类图像检测模型,包括:
对所述样本贝类图像数据集进行多尺度预测处理,以用于为每个样本贝类图像的真实值标签框匹配多个默认框;
根据多尺度预测处理之后的样本贝类图像数据集,对贝类图像检测模型进行训练;
根据损失函数公式对贝类图像检测模型的训练结果进行判断,若训练结果满足预设条件,则得到训练好的贝类图像检测模型。
在本发明实施例中,对样本贝类图像数据集中的样本贝类训练集进行多尺度预测处理,将每个样本贝类图像的真实值标签框和具有最大交并比的默认框进行匹配,从而保证每个真实值标签框都有对应的默认框;并且,将每个默认框和任意真实值标签框进行匹配时,若两者的交并比大一预设阈值,在本发明实施例中,选取0.5作为预设阈值进行说明,即当真实值标签框和默认框的交并比大于0.5时,真实值标签框可能对应多个默认框。在对样本贝类图像进行多尺度预测处理之后,对贝类图像检测模型进行训练,在训练过程中,根据训练曲线的收敛情况,判断训练是否完成。具体地,在本发明实施例中,损失函数是局部损失(loc)和置信度损失(conf)加权和,损失函数公式为:
其中,N表示与真实值标签框匹配的默认框的数量,x={0,1}表示一个指示参数,当x=1时,表示第i个先验框与第j个真实值标签框匹配,并且真实值标签框的类别为p,c表示类别置信度预测值,l表示先验框对应的边界框的预测值,g表示真实值标签框的位置参数,a表示权重系数,通过交叉验证将设权重系数a置为1,Lconf表示置信度损失,Lloc表示局部损失。对于置信度损失,采用的是softmax的思想,公式如下:
其中,表示第i个默认框和类别为p的第j个标定后的真实数据是否匹配的标识,取值为{0,1},表示第i个默认框的类别置信度的softmax的输出,表示第i个默认框的背景类的置信度,Pos表示正样本集,Neg表示负样本集。
进一步地,在本发明实施例中,对于局部损失,采用Smooth L1 loss机制,局部损失公式为:
其中,gcx,gcy,gw,gh表示真实值标签框,dcx,dcy,dw,dh表示默认框,lcx,lcy,lw,lh表示预测的框相对于默认框的偏移量。根据上述置信度损失公式的定义,由于则位置误差仅针对正样本进行计算。需要说明的是,在本发明实施例中,由于预测值l是编码值,因此,需要先对真实值标签框的g进行编码,得到
在上述实施例的基础上,所述对所述样本贝类图像数据集进行多尺度预测处理,以用于为每个样本贝类图像的真实值标签框匹配多个默认框,包括:
根据交并比公式,获取样本贝类图像的真实值标签框和默认框的交并比,以用于为所述真实值标签框匹配对应的默认框,所述交并比公式为:
其中,A表示真实值标签框,B表示默认框。
在上述实施例的基础上,在所述根据多尺度预测处理之后的样本贝类图像数据集,对贝类图像检测模型进行训练之后,所述方法还包括:
获取训练得到的样本贝类特征图;
对所述样本贝类特征图进行非极大抑制处理,得到所述样本贝类特征图上的先验框,以用于获取训练好的贝类图像检测模型。
在本发明实施例中,为了处理不同图像中所对应的不同大小、不同形状的目标,对于贝类图像检测网络中产生的样本贝类特征图,需要设置不同尺度与不同比例的先验框。具体地,先验框的设置主要包括尺度,长宽比和默认框三个要素,其中,在尺度计算上,每一个特征图中默认框的尺寸大小公式为:
其中,Smin表示最底层的尺度,取值为0.2,Smax表示最高层的尺度,取值为0.95,m表示特征图的个数,k表示在1至m范围内的第k个特征图。
进一步地,默认框高度的公式为:
默认框宽度的公式为:
其中,ar表示不同的长宽比值,取值分别为1,2,3,1/2和1/3。另外,在本发明实施例中,对应长宽比为1的情况,增加了一个默认框,该默认框的尺寸为即共有六种不同的默认框。将每个默认框的中心位置设置为其中,|fk|表示第k个特征图的大小,i,j∈[0,|fk|)。
进一步地,根据样本贝类测试集对贝类图像检测模型进行测试。需要说明的是,在本发明实施例中,采用SSD目标检测基本框架,结合MobileNet轻量级网络,通过引入残差注意力机制构建用于贝类图像的目标检测方法,作为最优的目标检测模型和其他网络结构的目标检测模型进行对比说明,可参考表1和表2所示:
表1不同模型的精度和速度
表2不同模型下每种贝类的检测精度
根据表1和表2的实验结果,表明本发明实施例提供贝类图像检测模型的检测方法优于其他的目标检测模型,提高了网络的渗透能力。具体地,本发明实施例提供的贝类图像检测模型在贝类目标检测中,平均mAP高于其他检测方法,虽然在部分种类的检测上的mAP不及其他的模型,比如,conch和Razor clam的检测精度不如Faster R-CNN Resnet-50,oyster和scallop的检测精度不及Faster R-CNN Inception-v2,但这不影响其总体mAP。
另外,在本发明实施例中,采用测试单张图片所需ms值的计算方式来评估速度,即ms值越小,表明检测速度越快,从表2中可以看出本发明实施例提供的用于贝类图像的目标检测方法,在速度上仅仅比SSD MobileNet慢1-2ms,这个差别不仅不影响检测速度,而且换来的精度的快速提升。基于SSD框架的目标检测可以忽略图片的输入尺寸,即在实际应用中,用户可以使用不同的相机型号进行拍摄样本。由于采用MobileNet轻量级网络替代原始的Vgg16网络,使得整个模型更加轻便化,为移动终端,如单片机或手机的应用奠定基础,而引入注意力机制则更能的表现目标的局部特征,提高检测精度。
图2为本发明实施例提供的用于贝类图像的目标检测装置的结构示意图,如图2所示,本发明实施例提供了一种用于贝类图像的目标检测装置,包括:获取模块201和贝类图像识别模块202,其中,获取模块201用于获取待检测的目标贝类图像;贝类图像识别模块202用于基于训练好的贝类图像检测模型,对所述目标贝类图像进行检测,获取到所述目标贝类图像的目标检测结果;所述训练好的贝类图像检测模型是将SSD框架中的VGG16网络替换成MobileNet网络构建的,并由标注有贝类种类的样本贝类图像训练得到的。
在本发明实施例中,通过获取模块201对贝类图像进行采集,从而获取到待检测的目标贝类图像。然后,贝类图像识别模块202通过训练好的贝类图像检测模型,对待检测的目标贝类图像进行识别检测,得到该目标贝类图像的检测结果,从而得到该目标贝类图像中的贝类种类。
本发明实施例提供一种用于贝类图像的目标检测装置,采用SSD目标检测基本框架,结合MobileNet轻量级网络构建贝类图像检测模型,从而对贝类图像进行检测,能够快速的识别贝类图像中的贝类种类,相比现有贝类检测方法,具有更高的检测效率和准确度,并为移动端部署贝类图像检测提供技术可行性。
本发明实施例提供的装置是用于执行上述各方法实施例的,具体流程和详细内容请参照上述实施例,此处不再赘述。
图3为本发明实施例提供的电子设备结构示意图,如图3所示,该服务器可以包括:处理器(processor)301、通信接口(Communications Interface)302、存储器(memory)303和通信总线304,其中,处理器301,通信接口302,存储器303通过通信总线304完成相互间的通信。处理器301可以调用存储器303中的逻辑指令,以执行如下方法:获取待检测的目标贝类图像;基于训练好的贝类图像检测模型,对所述目标贝类图像进行检测,获取到所述目标贝类图像的目标检测结果;所述训练好的贝类图像检测模型是将SSD框架中的VGG16网络替换成MobileNet网络构建的,并由标注有贝类种类的样本贝类图像训练得到的。
此外,上述的存储器303中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明实施例还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各实施例提供的用于贝类图像的目标检测方法,例如包括:获取待检测的目标贝类图像;基于训练好的贝类图像检测模型,对所述目标贝类图像进行检测,获取到所述目标贝类图像的目标检测结果;所述训练好的贝类图像检测模型是将SSD框架中的VGG16网络替换成MobileNet网络构建的,并由标注有贝类种类的样本贝类图像训练得到的。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (9)
1.一种用于贝类图像的目标检测方法,其特征在于,包括:
获取待检测的目标贝类图像;
基于训练好的贝类图像检测模型,对所述目标贝类图像进行检测,获取到所述目标贝类图像的目标检测结果;所述训练好的贝类图像检测模型是将SSD框架中的VGG16网络替换成MobileNet网络构建的,并由标注有贝类种类的样本贝类图像训练得到的。
2.根据权利要求1所述的用于贝类图像的目标检测方法,其特征在于,所述训练好的贝类图像检测模型通过以下步骤训练得到:
根据贝类种类,对样本图像上的贝类图像进行标注,得到样本贝类图像;
对所述样本贝类图像进行图像处理,得到样本贝类图像数据集;
根据所述样本贝类图像数据集,对贝类图像检测模型进行训练,得到训练好的贝类图像检测模型。
3.根据权利要求2所述的用于贝类图像的目标检测方法,其特征在于,在所述根据样本贝类图像数据集,对贝类图像检测模型进行训练,得到训练好的贝类图像检测模型之前,所述方法还包括:
在所述MobileNet网络和预测网络之间设置残差注意力机制,以用于对样本贝类图像的局部特征进行处理。
4.根据权利要求3所述的用于贝类图像的目标检测方法,其特征在于,所述根据所述样本贝类图像数据集,对贝类图像检测模型进行训练,得到训练好的贝类图像检测模型,包括:
对所述样本贝类图像数据集进行多尺度预测处理,以用于为每个样本贝类图像的真实值标签框匹配多个默认框;
根据多尺度预测处理之后的样本贝类图像数据集,对贝类图像检测模型进行训练;
根据损失函数公式对贝类图像检测模型的训练结果进行判断,若训练结果满足预设条件,则得到训练好的贝类图像检测模型。
5.根据权利要求4所述的用于贝类图像的目标检测方法,其特征在于,所述对所述样本贝类图像数据集进行多尺度预测处理,以用于为每个样本贝类图像的真实值标签框匹配多个默认框,包括:
根据交并比公式,获取样本贝类图像的真实值标签框和默认框的交并比,以用于为所述真实值标签框匹配对应的默认框,所述交并比公式为:
其中,A表示真实值标签框,B表示默认框。
6.根据权利要求4所述的用于贝类图像的目标检测方法,其特征在于,在所述根据多尺度预测处理之后的样本贝类图像数据集,对贝类图像检测模型进行训练之后,所述方法还包括:
获取训练得到的样本贝类特征图;
对所述样本贝类特征图进行非极大抑制处理,得到所述样本贝类特征图上的先验框,以用于获取训练好的贝类图像检测模型。
7.一种用于贝类图像的目标检测装置,其特征在于,包括:
获取模块,用于获取待检测的目标贝类图像;
贝类图像识别模块,用于基于训练好的贝类图像检测模型,对所述目标贝类图像进行检测,获取到所述目标贝类图像的目标检测结果;所述训练好的贝类图像检测模型是将SSD框架中的VGG16网络替换成MobileNet网络构建的,并由标注有贝类种类的样本贝类图像训练得到的。
8.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至6任一项所述用于贝类图像的目标检测方法的步骤。
9.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1至6任一项所述用于贝类图像的目标检测方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910450044.7A CN110263819A (zh) | 2019-05-28 | 2019-05-28 | 一种用于贝类图像的目标检测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910450044.7A CN110263819A (zh) | 2019-05-28 | 2019-05-28 | 一种用于贝类图像的目标检测方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110263819A true CN110263819A (zh) | 2019-09-20 |
Family
ID=67915632
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910450044.7A Pending CN110263819A (zh) | 2019-05-28 | 2019-05-28 | 一种用于贝类图像的目标检测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110263819A (zh) |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110826469A (zh) * | 2019-11-01 | 2020-02-21 | Oppo广东移动通信有限公司 | 一种人物检测方法、装置及计算机可读存储介质 |
CN111008555A (zh) * | 2019-10-21 | 2020-04-14 | 武汉大学 | 一种无人机图像弱小目标增强提取方法 |
CN111079739A (zh) * | 2019-11-28 | 2020-04-28 | 长沙理工大学 | 一种多尺度注意力特征检测方法 |
CN111104961A (zh) * | 2019-10-31 | 2020-05-05 | 太原理工大学 | 基于改进的MobileNet网络对乳腺癌进行分类的方法 |
CN111339858A (zh) * | 2020-02-17 | 2020-06-26 | 电子科技大学 | 一种基于神经网络的油气管道标志物识别方法 |
CN111415338A (zh) * | 2020-03-16 | 2020-07-14 | 城云科技(中国)有限公司 | 目标检测模型的构建方法及系统 |
CN111553950A (zh) * | 2020-04-30 | 2020-08-18 | 中冶赛迪重庆信息技术有限公司 | 一种钢卷对中判断方法、系统、介质及电子终端 |
CN111798417A (zh) * | 2020-06-19 | 2020-10-20 | 中国资源卫星应用中心 | 一种基于ssd遥感图像目标检测的方法及装置 |
CN112270347A (zh) * | 2020-10-20 | 2021-01-26 | 西安工程大学 | 一种基于改进ssd的医疗废弃物分类检测方法 |
CN112365476A (zh) * | 2020-11-13 | 2021-02-12 | 南京信息工程大学 | 一种基于双通路深度网络的雾天能见度检测方法 |
CN112633400A (zh) * | 2020-12-29 | 2021-04-09 | 山东省海洋生物研究院 | 基于计算机视觉的贝类分类识别方法及装置 |
CN113591901A (zh) * | 2021-06-10 | 2021-11-02 | 中国航天时代电子有限公司 | 一种基于锚框的目标检测方法 |
CN117523428A (zh) * | 2023-11-08 | 2024-02-06 | 中国人民解放军军事科学院系统工程研究院 | 基于飞行器平台的地面目标检测方法和装置 |
CN113496139B (zh) * | 2020-03-18 | 2024-02-13 | 北京京东乾石科技有限公司 | 从图像中检测目标和训练目标检测模型的方法和设备 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180165728A1 (en) * | 2016-12-09 | 2018-06-14 | Bodega AI, Inc. | Distributed and automated transaction systems |
CN109655815A (zh) * | 2018-11-23 | 2019-04-19 | 杭州电子科技大学 | 基于ssd的声呐目标检测方法 |
-
2019
- 2019-05-28 CN CN201910450044.7A patent/CN110263819A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180165728A1 (en) * | 2016-12-09 | 2018-06-14 | Bodega AI, Inc. | Distributed and automated transaction systems |
CN109655815A (zh) * | 2018-11-23 | 2019-04-19 | 杭州电子科技大学 | 基于ssd的声呐目标检测方法 |
Non-Patent Citations (6)
Title |
---|
AI之路: "SENet(Squeeze-and-Excitation Networks)算法笔记", 《CSDN博客》 * |
YANGHEDADA: "目标检测中的注意力机制", 《简书》 * |
YUAN YUAN等: "VSSA-NET: Vertical Spatial Sequence Attention Network for Traffic Sign Detection", 《ARXIV》 * |
刘慧 等: "基于改进SSD 的果园行人实时检测方法", 《农业机械学报》 * |
加油可好: "Residual attention network 论文笔记", 《知乎》 * |
吴广伟: "基于移动终端的轻量级卷积神经网络研究与实现", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111008555A (zh) * | 2019-10-21 | 2020-04-14 | 武汉大学 | 一种无人机图像弱小目标增强提取方法 |
CN111104961A (zh) * | 2019-10-31 | 2020-05-05 | 太原理工大学 | 基于改进的MobileNet网络对乳腺癌进行分类的方法 |
CN110826469A (zh) * | 2019-11-01 | 2020-02-21 | Oppo广东移动通信有限公司 | 一种人物检测方法、装置及计算机可读存储介质 |
CN111079739A (zh) * | 2019-11-28 | 2020-04-28 | 长沙理工大学 | 一种多尺度注意力特征检测方法 |
CN111079739B (zh) * | 2019-11-28 | 2023-04-18 | 长沙理工大学 | 一种多尺度注意力特征检测方法 |
CN111339858B (zh) * | 2020-02-17 | 2022-07-29 | 电子科技大学 | 一种基于神经网络的油气管道标志物识别方法 |
CN111339858A (zh) * | 2020-02-17 | 2020-06-26 | 电子科技大学 | 一种基于神经网络的油气管道标志物识别方法 |
CN111415338A (zh) * | 2020-03-16 | 2020-07-14 | 城云科技(中国)有限公司 | 目标检测模型的构建方法及系统 |
CN113496139B (zh) * | 2020-03-18 | 2024-02-13 | 北京京东乾石科技有限公司 | 从图像中检测目标和训练目标检测模型的方法和设备 |
CN111553950B (zh) * | 2020-04-30 | 2023-04-18 | 中冶赛迪信息技术(重庆)有限公司 | 一种钢卷对中判断方法、系统、介质及电子终端 |
CN111553950A (zh) * | 2020-04-30 | 2020-08-18 | 中冶赛迪重庆信息技术有限公司 | 一种钢卷对中判断方法、系统、介质及电子终端 |
CN111798417A (zh) * | 2020-06-19 | 2020-10-20 | 中国资源卫星应用中心 | 一种基于ssd遥感图像目标检测的方法及装置 |
CN112270347A (zh) * | 2020-10-20 | 2021-01-26 | 西安工程大学 | 一种基于改进ssd的医疗废弃物分类检测方法 |
CN112365476A (zh) * | 2020-11-13 | 2021-02-12 | 南京信息工程大学 | 一种基于双通路深度网络的雾天能见度检测方法 |
CN112365476B (zh) * | 2020-11-13 | 2023-12-08 | 南京信息工程大学 | 一种基于双通路深度网络的雾天能见度检测方法 |
CN112633400A (zh) * | 2020-12-29 | 2021-04-09 | 山东省海洋生物研究院 | 基于计算机视觉的贝类分类识别方法及装置 |
CN113591901A (zh) * | 2021-06-10 | 2021-11-02 | 中国航天时代电子有限公司 | 一种基于锚框的目标检测方法 |
CN117523428A (zh) * | 2023-11-08 | 2024-02-06 | 中国人民解放军军事科学院系统工程研究院 | 基于飞行器平台的地面目标检测方法和装置 |
CN117523428B (zh) * | 2023-11-08 | 2024-03-29 | 中国人民解放军军事科学院系统工程研究院 | 基于飞行器平台的地面目标检测方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110263819A (zh) | 一种用于贝类图像的目标检测方法及装置 | |
CN108416266B (zh) | 一种利用光流提取运动目标的视频行为快速识别方法 | |
CN109902798A (zh) | 深度神经网络的训练方法和装置 | |
CN109271895A (zh) | 基于多尺度特征学习和特征分割的行人重识别方法 | |
CN108280455B (zh) | 人体关键点检测方法和装置、电子设备、程序和介质 | |
CN111401516A (zh) | 一种神经网络通道参数的搜索方法及相关设备 | |
CN110046574A (zh) | 基于深度学习的安全帽佩戴识别方法及设备 | |
CN110930297A (zh) | 人脸图像的风格迁移方法、装置、电子设备及存储介质 | |
CN109409210B (zh) | 一种基于ssd框架的人脸检测方法及系统 | |
CN109657582A (zh) | 人脸情绪的识别方法、装置、计算机设备及存储介质 | |
CN113052006B (zh) | 一种基于卷积神经网络的图像目标检测方法,系统及可读存储介质 | |
CN111028216A (zh) | 图像评分方法、装置、存储介质及电子设备 | |
CN104063686A (zh) | 作物叶部病害图像交互式诊断系统与方法 | |
CN110059677A (zh) | 基于深度学习的数字表识别方法及设备 | |
CN111062328A (zh) | 一种图像处理方法、装置及智能机器人 | |
CN113128478A (zh) | 模型训练方法、行人分析方法、装置、设备及存储介质 | |
Li et al. | Gated auxiliary edge detection task for road extraction with weight-balanced loss | |
CN109583367A (zh) | 图像文本行检测方法及装置、存储介质和电子设备 | |
CN111126254A (zh) | 图像识别方法、装置、设备及存储介质 | |
CN112651333A (zh) | 静默活体检测方法、装置、终端设备和存储介质 | |
CN109583289A (zh) | 蟹的性别识别方法和装置 | |
WO2022100607A1 (zh) | 一种神经网络结构确定方法及其装置 | |
CN108520261A (zh) | 一种花生果仁数量的识别方法和装置 | |
CN117765373A (zh) | 一种自适应裂缝尺寸的轻量化道路裂缝检测方法及系统 | |
CN117635418A (zh) | 生成对抗网络的训练方法、双向图像风格转换方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190920 |