CN114299366A - 一种图像检测方法、装置、电子设备及存储介质 - Google Patents
一种图像检测方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN114299366A CN114299366A CN202210228310.3A CN202210228310A CN114299366A CN 114299366 A CN114299366 A CN 114299366A CN 202210228310 A CN202210228310 A CN 202210228310A CN 114299366 A CN114299366 A CN 114299366A
- Authority
- CN
- China
- Prior art keywords
- image detection
- detection model
- target
- training
- network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Image Analysis (AREA)
Abstract
本申请实施例公开了一种图像检测方法、装置、电子设备及存储介质,涉及图像识别技术领域。其中,该方法包括:对图像数据集进行预处理得到样本集;获取中间图像检测模型,中间图像检测模型包括目标主干网络和预测头训练网络,目标主干网络是通过对初始图像检测模型中初始主干网络的参数和学习率进行改进得到的,预测头训练网络是拼接在目标主干网络之后;根据样本集对中间图像检测模型进行训练得到目标图像检测模型;将待测图像输入至目标图像检测模型,根据目标图像检测模型的输出确定待测图像的图像检测结果。本申请实施例提供的技术方案,可以提高图像检测模型的检测识别能力,且能够提高检测效率以及检测速度。
Description
技术领域
本申请实施例涉及图像识别技术领域,尤其涉及一种图像检测方法、装置、电子设备及存储介质。
背景技术
在工业生产中,火焰气枪的使用存在潜在的安全问题,通过图像检测方法正确识别火枪的火焰才能够提前预防危险。现有技术中,应用于火焰气枪的图像检测大部分是采用基于anchor based的YOLOv4和YOLOv5方法,这种方法依赖于人为的先验,冗余框会非常地多。因此,现有技术的方法对于检测气枪火焰会导致识别能力不足、检测效率低下以及检测速度慢。
发明内容
本申请实施例提供了一种图像检测方法、装置、电子设备及存储介质,可以提高图像检测模型的检测识别能力,且能够提高检测效率以及检测速度。
第一方面,本申请实施例提供了一种图像检测方法,该方法包括:
对图像数据集进行预处理得到样本集;
获取中间图像检测模型,所述中间图像检测模型包括目标主干网络和预测头训练网络,所述目标主干网络是通过对初始图像检测模型中初始主干网络的参数和学习率进行改进得到的,所述预测头训练网络是拼接在所述目标主干网络之后;
根据所述样本集对所述中间图像检测模型进行训练得到目标图像检测模型;
将待测图像输入至所述目标图像检测模型,根据所述目标图像检测模型的输出确定所述待测图像的图像检测结果。
第二方面,本申请实施例提供了一种图像检测装置,该装置包括:
样本集确定模块,用于对图像数据集进行预处理得到样本集;
第一模型确定模块,用于获取中间图像检测模型,所述中间图像检测模型包括目标主干网络和预测头训练网络,所述目标主干网络是通过对初始图像检测模型中初始主干网络的参数和学习率进行改进得到的,所述预测头训练网络是拼接在所述目标主干网络之后;
第二模型确定模块,用于根据所述样本集对所述中间图像检测模型进行训练得到目标图像检测模型;
待测图像检测模块,用于将待测图像输入至所述目标图像检测模型,根据所述目标图像检测模型的输出确定所述待测图像的图像检测结果。
第三方面,本申请实施例提供了一种电子设备,该电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本申请任意实施例所述的图像检测方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现本申请任意实施例所述的图像检测方法。
本申请实施例提供了一种图像检测方法、装置、电子设备及存储介质,该方法包括:对图像数据集进行预处理得到样本集;获取中间图像检测模型,中间图像检测模型包括目标主干网络和预测头训练网络,目标主干网络是通过对初始图像检测模型中初始主干网络的参数和学习率进行改进得到的,预测头训练网络是拼接在目标主干网络之后;根据样本集对中间图像检测模型进行训练得到目标图像检测模型;将待测图像输入至目标图像检测模型,根据目标图像检测模型的输出确定待测图像的图像检测结果。本申请通过对初始图像检测模型中初始主干网络的参数和学习率进行改进得到中间图像检测模型,进而对中间图像检测模型进行训练得到目标图像检测模型。针于气枪火焰的检测,本申请的目标图像检测模型能够提高检测识别能力,且能够提高检测效率以及检测速度。
应当理解,本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特征,也不用于限制本申请的范围。本申请的其他特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1为本申请实施例提供的一种图像检测方法的第一流程示意图;
图2为本申请实施例提供的一种图像检测方法的第二流程示意图;
图3为本申请实施例提供的一种图像检测装置的结构示意图;
图4是用来实现本申请实施例的一种图像检测方法的电子设备的框图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
实施例一
图1为本申请实施例提供的一种图像检测方法的第一流程示意图,本实施例可适用于通过图像检测模型对待测图像进行检测识别的情况。本实施例提供的一种图像检测方法可以由本申请实施例提供的图像检测装置来执行,该装置可以通过软件和/或硬件的方式实现,并集成在执行本方法的电子设备中。
参见图1,本实施例的方法包括但不限于如下步骤:
S110、对图像数据集进行预处理得到样本集。
在本申请实施例中,图像数据集可以是现有的包含有气枪火焰的大量图像构成的数据集,在工业生产场景下,该图像可以是利用工业生产现场的摄像头采集到的气枪火焰图像。样本集是指对图像数据集中的图像进行预处理之后的用于训练图像检测模型的图像。
在本申请实施例中,预处理方式可以是对图像数据集中的图像进行数据增强处理,可以是对图像数据集中的图像进行信息标注,还可以是其他的预处理方式。
S120、获取中间图像检测模型。
在本申请实施例中,中间图像检测模型包括目标主干网络和预测头训练网络,目标主干网络是通过对初始图像检测模型中初始主干网络的参数和学习率进行改进得到的,预测头训练网络是拼接在目标主干网络之后。
可选的,由于本申请的目的是追求在更快的运行速度下获得较高的准确率,所以可以采用选择YOLOX-tiny网络模型作为初始图像检测模型。可以将Darknet-53作为YOLOX-tiny网络模型的初始主干网络。
进一步的,通过如下方式对初始图像检测模型中初始主干网络的参数和学习率进行改进得到目标主干网络:根据类别检测数据集的参数对初始主干网络中每一层卷积神经网络的参数进行改进,得到中间主干网络;为中间主干网络设置第一学习率和第二学习率而得到目标主干网络。
在本申请实施例中采用Darknet-53作为初始主干网络,由于Darknet-53的参数量较大会造成中间图像检测模型的运算时间急剧上升,所以需要对根据类别检测数据集的参数对初始主干网络中每一层卷积神经网络的参数进行改进。通过调整初始主干网络的参数的宽度和深度,可以优化模型的精确度和速度,以满足实际应用的需求。为了实现中间图像检测模型在训练过程中模型稳定且模型收敛速度更快,需要设置第一学习率和第二学习率得到目标主干网络,其中,第一学习率小于第二学习率。
可选的,类别检测数据集可以是常见对象识别(Microsoft Common Objects inContext,MSCOCO)检测数据集。MSCOCO数据集是一个大型的、丰富的检测分割数据集。这个数据集以场景理解为目标,主要从复杂的日常场景中截取,图像中的目标通过精确的分割进行位置的标定。图像包括91类目标,328000个影像和2500000个标签。目前为止是语义分割的最大数据集,提供的类别有80 类,有超过33 万张图片,其中20 万张有标注,整个数据集中个体的数目超过150 万个。
进一步的,根据类别检测数据集的参数对初始主干网络中每一层卷积神经网络的参数进行改进,得到中间主干网络,包括:将类别检测数据集的参数宽度的第一预设倍数作为中间主干网络中每一层卷积神经网络参数的宽度;将类别检测数据集的参数深度的第二预设倍数作为中间主干网络中每一层卷积神经网络参数的深度。
可选的,第一预设倍数可以是0.375倍;第二预设倍数可以是0.33倍。
S130、根据样本集对中间图像检测模型进行训练得到目标图像检测模型。
在本申请实施例中,可以将样本集中的图像按照比例(例如,7:3)划分为训练集和测试集,其中,训练集用于在模型训练阶段进行模型训练,测试集用于在模型训练阶段进行模型测试,以优化模型的性能。基于训练集对中间图像检测模型进行训练,将训练后得到的网络模型确定为目标图像检测模型。
进一步的,在根据样本集对中间图像检测模型进行训练得到目标图像检测模型之前,还包括:将样本集缩放至预设分辨率,例如416*416,得到缩放之后的样本集;相应的,根据样本集对中间图像检测模型进行训练得到目标图像检测模型,包括:根据缩放之后的样本集对中间图像检测模型进行训练得到目标图像检测模型。
S140、将待测图像输入至目标图像检测模型,根据目标图像检测模型的输出确定待测图像的图像检测结果。
在本申请实施例中,待测图像为工业生产现场中实时获取到的气枪火焰图像。目标图像检测模型对生产现场采集到的待测图像进行检测,根据目标图像检测模型的输出确定待测图像中是否有火焰,即图像检测结果。
本实施例提供的技术方案,通过对图像数据集进行预处理得到样本集;获取中间图像检测模型,中间图像检测模型包括目标主干网络和预测头训练网络,目标主干网络是通过对初始图像检测模型中初始主干网络的参数和学习率进行改进得到的,预测头训练网络是拼接在目标主干网络之后;根据样本集对中间图像检测模型进行训练得到目标图像检测模型;将待测图像输入至目标图像检测模型,根据目标图像检测模型的输出确定待测图像的图像检测结果。本申请通过对初始图像检测模型中初始主干网络的参数和学习率进行改进得到中间图像检测模型,进而对中间图像检测模型进行训练得到目标图像检测模型。针于气枪火焰的检测,本申请的目标图像检测模型能够提高检测识别能力,且能够提高检测效率以及检测速度。
实施例二
图2为本申请实施例提供的一种图像检测方法的第二流程示意图。本申请实施例是在上述实施例的基础上进行优化,具体优化为:本实施例对样本集的预处理过程和目标图像检测模型的训练过程进行详细的解释说明。
参见图2,本实施例的方法包括但不限于如下步骤:
S210、从图像数据集中任选多张图像,采用数据增强Mosaic算法对多张图像进行随机拼接得到预处理之后的图像,从而得到样本集。
在本申请实施例中,通过随机采样图像数据集中的图像并对其进行图像预处理得到样本集。现有技术中,在原始的YOLOX模型中通常采用Mosaic算法加mixup算法的形式对图像进行数据增强处理。具体过程为:首先,从图像数据集中任意选取四张图像,并通过Mosaic算法对四张图像分别采用随机缩放、随机裁剪、随机排布的方式进行拼接在一起;然后,再通过Mixup算法对图像设置一个融合系数,根据系数将图像加权求合在一起。但是,本申请中在YOLOX-tiny模型中,关闭Mixup算法这个过于困难的任务,使得网络模型更加容易收敛。也就是,从图像数据集中任意选取多张图像,采用Mosaic算法对多张图像进行随机拼接得到预处理之后的图像,从而得到样本集。
S220、获取中间图像检测模型。
在本申请实施例中,中间图像检测模型包括目标主干网络和预测头训练网络,目标主干网络是通过对初始图像检测模型中初始主干网络的参数和学习率进行改进得到的,预测头训练网络是拼接在目标主干网络之后。
在本申请实施例中,预测头训练网络通常由卷积层Conv、批量归一化(BatchNormalization,BN)和激活函数Leaky relu组成,简称CBL模块。之前的YOLO系列只是CBL模块再加卷积层Conv的操作。而YOLOX将CBL模块分为三个不同的分支,第一个分支是对预测目标框的类别,第二个是判断预测目标框是前景还是背景。第三个分支对目标框的坐标信息进行预测。通过三个分支组成网络的解耦头。在YOLOv3、YOLOv4和YOLOv5中都采用的Anchor Based的方式。由于没有解耦头的存在,网络通常会产生3个不同大小的三维特征图,这带来了大量冗余的参数量,通产会产生3*(20*20+40*40+80*80)*(类别数+5)个预测结果,以COCO数据集为例,会产生2,142,000个预测结果。而YOLOX由于解耦头的存在只会产生744,000个预测结果,减少了2/3参数量。
S230、基于样本集,采用第一学习率和第二学习率对中间图像检测模型进行训练预设训练次数,得到目标图像检测模型。
其中,第一学习率小于第二学习率。
具体的,采用第一学习率和第二学习率对中间图像检测模型进行训练预设训练次数,得到目标图像检测模型,包括:采用第一学习率对中间图像检测模型进行训练,直至达到训练暂停条件时,再采用第二学习率继续对中间图像检测模型进行训练,直至训练次数达到预设训练次数时停止训练,从而得到目标图像检测模型。
在本申请实施例中,由于中间图像检测模型在刚开始训练时,模型的权重是随机初始化的,此时若选择一个较大的学习率,可能带来中间图像检测模型的不稳定(如振荡),所以需要设置一个较小的第一学习率,可以使得开始训练的几个epoch或者一些steps内学习率较小,直至中间图像检测模型可以慢慢趋于稳定之后,再选择第二学习率进行训练,使得中间图像检测模型收敛速度变得更快,模型效果更佳。
S240、将待测图像输入至目标图像检测模型,根据目标图像检测模型的输出确定待测图像的图像检测结果。
本实施例提供的技术方案,通过从图像数据集中任选多张图像,采用数据增强Mosaic算法对多张图像进行随机拼接得到预处理之后的图像,从而得到样本集;获取中间图像检测模型;中间图像检测模型包括目标主干网络和预测头训练网络,目标主干网络是通过对初始图像检测模型中初始主干网络的参数和学习率进行改进得到的,预测头训练网络是拼接在目标主干网络之后;基于样本集,采用第一学习率和第二学习率对中间图像检测模型进行训练预设训练次数,得到目标图像检测模型;将待测图像输入至目标图像检测模型,根据目标图像检测模型的输出确定待测图像的图像检测结果。本申请通过对初始图像检测模型中初始主干网络的参数和学习率进行改进得到中间图像检测模型,进而对中间图像检测模型进行训练得到目标图像检测模型。针于气枪火焰的检测,本申请的目标图像检测模型能够提高检测识别能力,且能够提高检测效率以及检测速度。
实施例三
图3为本申请实施例提供的一种图像检测装置的结构示意图,如图3所示,该装置300可以包括:
样本集确定模块310,用于对图像数据集进行预处理得到样本集;
第一模型确定模块320,用于获取中间图像检测模型,所述中间图像检测模型包括目标主干网络和预测头训练网络,所述目标主干网络是通过对初始图像检测模型中初始主干网络的参数和学习率进行改进得到的,所述预测头训练网络是拼接在所述目标主干网络之后;
第二模型确定模块330,用于根据所述样本集对所述中间图像检测模型进行训练得到目标图像检测模型;
待测图像检测模块340,用于将待测图像输入至所述目标图像检测模型,根据所述目标图像检测模型的输出确定所述待测图像的图像检测结果。
进一步的,上述第一模型确定模块320,可以具体用于通过如下方式对所述初始图像检测模型中所述初始主干网络的参数和学习率进行改进得到所述目标主干网络:根据类别检测数据集的参数对所述初始主干网络中每一层卷积神经网络的参数进行改进,得到中间主干网络;为所述中间主干网络设置第一学习率和第二学习率而得到所述目标主干网络。
进一步的,上述第一模型确定模块320,还可以具体用于将所述类别检测数据集的参数宽度的第一预设倍数作为所述中间主干网络中每一层卷积神经网络参数的宽度;将所述类别检测数据集的参数深度的第二预设倍数作为所述中间主干网络中每一层卷积神经网络参数的深度。
进一步的,上述第二模型确定模块330,可以具体用于:基于所述样本集,采用所述第一学习率和所述第二学习率对所述中间图像检测模型进行训练预设训练次数,得到目标图像检测模型;其中,所述第一学习率小于所述第二学习率。
进一步的,上述第二模型确定模块330,还可以具体用于:采用所述第一学习率对所述中间图像检测模型进行训练,直至达到训练暂停条件时,再采用所述第二学习率继续对所述中间图像检测模型进行训练,直至训练次数达到所述预设训练次数时停止训练,从而得到目标图像检测模型。
进一步的,上述样本集确定模块310,可以具体用于:从所述图像数据集中任选多张图像,采用数据增强Mosaic算法对所述多张图像进行随机拼接得到预处理之后的图像,从而得到所述样本集。
进一步的,上述图像检测装置,还可以包括:图像缩放模块;
所述图像缩放模块,用于在根据所述样本集对所述中间图像检测模型进行训练得到目标图像检测模型之前,还包括:将所述样本集缩放至预设分辨率,得到缩放之后的样本集;
相应的,上述第二模型确定模块330,可以具体用于根据所述缩放之后的样本集对所述中间图像检测模型进行训练得到目标图像检测模型。
本实施例提供的图像检测装置可适用于上述任意实施例提供的图像检测方法,具备相应的功能和有益效果。
实施例四
图4是用来实现本申请实施例的一种图像检测方法的电子设备的框图,图4示出了适于用来实现本申请实施例实施方式的示例性电子设备的框图。图4显示的电子设备仅仅是一个示例,不应对本申请实施例的功能和适用范围带来任何限制。该电子设备典型可以是智能手机、平板电脑、笔记本电脑、车载终端以及可穿戴设备等。
如图4所示,电子设备400以通用计算设备的形式表现。电子设备400的组件可以包括但不限于:一个或者多个处理器或者处理单元416,存储器428,连接不同系统组件(包括存储器428和处理单元416)的总线418。
总线418表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
电子设备400典型地包括多种计算机系统可读介质。这些介质可以是任何能够被电子设备400访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
存储器428可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)430和/或高速缓存存储器432。电子设备400可以进一步包括其他可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统434可以用于读写不可移动的、非易失性磁介质(图4未显示,通常称为“硬盘驱动器”)。尽管图4中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM, DVD-ROM或者其他光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线418相连。存储器428可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本申请各实施例的功能。
具有一组(至少一个)程序模块442的程序/实用工具440,可以存储在例如存储器428中,这样的程序模块442包括但不限于操作系统、一个或者多个应用程序、其他程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块442通常执行本申请实施例所描述的功能和/或方法。
电子设备400也可以与一个或多个外部设备414(例如键盘、指向设备、显示器424等)通信,还可与一个或者多个使得用户能与该电子设备400交互的设备通信,和/或与使得该电子设备400能与一个或多个其他计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口422进行。并且,电子设备400还可以通过网络适配器420与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图4所示,网络适配器420通过总线418与电子设备400的其他模块通信。应当明白,尽管图4中未示出,可以结合电子设备400使用其他硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理单元416通过运行存储在存储器428中的程序,从而执行各种功能应用以及数据处理,例如实现本申请任一实施例所提供的图像检测方法。
实施例五
本申请实施例还提供一种计算机可读存储介质,其上存储有计算机程序(或称为计算机可执行指令),该程序被处理器执行时可以用于执行本申请上述任一实施例所提供的图像检测方法。
本申请实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是但不限于电、磁、光、电磁、红外线或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦拭可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本申请实施例操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
Claims (10)
1.一种图像检测方法,其特征在于,所述方法包括:
对图像数据集进行预处理得到样本集;
获取中间图像检测模型,所述中间图像检测模型包括目标主干网络和预测头训练网络,所述目标主干网络是通过对初始图像检测模型中初始主干网络的参数和学习率进行改进得到的,所述预测头训练网络是拼接在所述目标主干网络之后;
根据所述样本集对所述中间图像检测模型进行训练得到目标图像检测模型;
将待测图像输入至所述目标图像检测模型,根据所述目标图像检测模型的输出确定所述待测图像的图像检测结果。
2.根据权利要求1所述的图像检测方法,其特征在于,通过如下方式对所述初始图像检测模型中所述初始主干网络的参数和学习率进行改进得到所述目标主干网络:
根据类别检测数据集的参数对所述初始主干网络中每一层卷积神经网络的参数进行改进,得到中间主干网络;
为所述中间主干网络设置第一学习率和第二学习率而得到所述目标主干网络。
3.根据权利要求2所述的图像检测方法,其特征在于,所述根据类别检测数据集的参数对所述初始主干网络中每一层卷积神经网络的参数进行改进,得到中间主干网络,包括:
将所述类别检测数据集的参数宽度的第一预设倍数作为所述中间主干网络中每一层卷积神经网络参数的宽度;
将所述类别检测数据集的参数深度的第二预设倍数作为所述中间主干网络中每一层卷积神经网络参数的深度。
4.根据权利要求2所述的图像检测方法,其特征在于,所述根据所述样本集对所述中间图像检测模型进行训练得到目标图像检测模型,包括:
基于所述样本集,采用所述第一学习率和所述第二学习率对所述中间图像检测模型进行训练预设训练次数,得到目标图像检测模型;其中,所述第一学习率小于所述第二学习率。
5.根据权利要求4所述的图像检测方法,其特征在于,所述采用所述第一学习率和所述第二学习率对所述中间图像检测模型进行训练预设训练次数,得到目标图像检测模型,包括:
采用所述第一学习率对所述中间图像检测模型进行训练,直至达到训练暂停条件时,再采用所述第二学习率继续对所述中间图像检测模型进行训练,直至训练次数达到所述预设训练次数时停止训练,从而得到目标图像检测模型。
6.根据权利要求1所述的图像检测方法,其特征在于,所述对图像数据集进行预处理得到样本集,包括:
从所述图像数据集中任选多张图像,采用数据增强Mosaic算法对所述多张图像进行随机拼接得到预处理之后的图像,从而得到所述样本集。
7.根据权利要求1所述的图像检测方法,其特征在于,在根据所述样本集对所述中间图像检测模型进行训练得到目标图像检测模型之前,还包括:
将所述样本集缩放至预设分辨率,得到缩放之后的样本集;
相应的,所述根据所述样本集对所述中间图像检测模型进行训练得到目标图像检测模型,包括:
根据所述缩放之后的样本集对所述中间图像检测模型进行训练得到目标图像检测模型。
8.一种图像检测装置,其特征在于,所述装置包括:
样本集确定模块,用于对图像数据集进行预处理得到样本集;
第一模型确定模块,用于获取中间图像检测模型,所述中间图像检测模型包括目标主干网络和预测头训练网络,所述目标主干网络是通过对初始图像检测模型中初始主干网络的参数和学习率进行改进得到的,所述预测头训练网络是拼接在所述目标主干网络之后;
第二模型确定模块,用于根据所述样本集对所述中间图像检测模型进行训练得到目标图像检测模型;
待测图像检测模块,用于将待测图像输入至所述目标图像检测模型,根据所述目标图像检测模型的输出确定所述待测图像的图像检测结果。
9.一种电子设备,其特征在于,所述电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1至7中任一所述的图像检测方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1至7中任一所述的图像检测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210228310.3A CN114299366A (zh) | 2022-03-10 | 2022-03-10 | 一种图像检测方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210228310.3A CN114299366A (zh) | 2022-03-10 | 2022-03-10 | 一种图像检测方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114299366A true CN114299366A (zh) | 2022-04-08 |
Family
ID=80978560
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210228310.3A Pending CN114299366A (zh) | 2022-03-10 | 2022-03-10 | 一种图像检测方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114299366A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114882449A (zh) * | 2022-04-11 | 2022-08-09 | 淮阴工学院 | 一种基于Car-Det网络模型的车辆检测方法及装置 |
CN115049965A (zh) * | 2022-06-29 | 2022-09-13 | 深圳市城市公共安全技术研究院有限公司 | 一种检测模型的训练方法、装置、电子设备及存储介质 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107909118A (zh) * | 2017-12-11 | 2018-04-13 | 北京映翰通网络技术股份有限公司 | 一种基于深度神经网络的配电网工况录波分类方法 |
CN110163151A (zh) * | 2019-05-23 | 2019-08-23 | 北京迈格威科技有限公司 | 人脸模型的训练方法、装置、计算机设备和存储介质 |
AU2019101142A4 (en) * | 2019-09-30 | 2019-10-31 | Dong, Qirui MR | A pedestrian detection method with lightweight backbone based on yolov3 network |
CN110826520A (zh) * | 2019-11-14 | 2020-02-21 | 燕山大学 | 一种基于改进YOLOv3-tiny算法的港口抓斗检测方法 |
CN111178206A (zh) * | 2019-12-20 | 2020-05-19 | 山东大学 | 一种基于改进yolo的建筑预埋件检测方法及系统 |
CN111553414A (zh) * | 2020-04-27 | 2020-08-18 | 东华大学 | 一种基于改进Faster R-CNN的车内遗失物体检测方法 |
CN111783819A (zh) * | 2020-05-08 | 2020-10-16 | 国家电网有限公司 | 小规模数据集上基于感兴趣区域训练改进的目标检测方法 |
CN111950702A (zh) * | 2020-07-16 | 2020-11-17 | 华为技术有限公司 | 一种神经网络结构确定方法及其装置 |
CN112836788A (zh) * | 2020-12-21 | 2021-05-25 | 中国电子科技集团公司第二十七研究所 | 一种用于干扰类型识别的低功耗深度学习网络方法 |
CN112906289A (zh) * | 2021-01-15 | 2021-06-04 | 广西大学 | 一种协调电力系统稳定器与二级电压控制器参数优化方法 |
CN112926685A (zh) * | 2021-03-30 | 2021-06-08 | 济南大学 | 一种工业中钢材氧化带目标检测方法、系统及设备 |
-
2022
- 2022-03-10 CN CN202210228310.3A patent/CN114299366A/zh active Pending
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107909118A (zh) * | 2017-12-11 | 2018-04-13 | 北京映翰通网络技术股份有限公司 | 一种基于深度神经网络的配电网工况录波分类方法 |
CN110163151A (zh) * | 2019-05-23 | 2019-08-23 | 北京迈格威科技有限公司 | 人脸模型的训练方法、装置、计算机设备和存储介质 |
AU2019101142A4 (en) * | 2019-09-30 | 2019-10-31 | Dong, Qirui MR | A pedestrian detection method with lightweight backbone based on yolov3 network |
CN110826520A (zh) * | 2019-11-14 | 2020-02-21 | 燕山大学 | 一种基于改进YOLOv3-tiny算法的港口抓斗检测方法 |
CN111178206A (zh) * | 2019-12-20 | 2020-05-19 | 山东大学 | 一种基于改进yolo的建筑预埋件检测方法及系统 |
CN111553414A (zh) * | 2020-04-27 | 2020-08-18 | 东华大学 | 一种基于改进Faster R-CNN的车内遗失物体检测方法 |
CN111783819A (zh) * | 2020-05-08 | 2020-10-16 | 国家电网有限公司 | 小规模数据集上基于感兴趣区域训练改进的目标检测方法 |
CN111950702A (zh) * | 2020-07-16 | 2020-11-17 | 华为技术有限公司 | 一种神经网络结构确定方法及其装置 |
CN112836788A (zh) * | 2020-12-21 | 2021-05-25 | 中国电子科技集团公司第二十七研究所 | 一种用于干扰类型识别的低功耗深度学习网络方法 |
CN112906289A (zh) * | 2021-01-15 | 2021-06-04 | 广西大学 | 一种协调电力系统稳定器与二级电压控制器参数优化方法 |
CN112926685A (zh) * | 2021-03-30 | 2021-06-08 | 济南大学 | 一种工业中钢材氧化带目标检测方法、系统及设备 |
Non-Patent Citations (2)
Title |
---|
张泽旭等: "《神经网络控制与MATLAB仿真》", 31 July 2011, 哈尔滨:哈尔滨工业大学出版社 * |
邱锡鹏等: "《 神经网络与深度学习》", 30 April 2020, 北京:机械工业出版社 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114882449A (zh) * | 2022-04-11 | 2022-08-09 | 淮阴工学院 | 一种基于Car-Det网络模型的车辆检测方法及装置 |
CN114882449B (zh) * | 2022-04-11 | 2023-08-22 | 淮阴工学院 | 一种基于Car-Det网络模型的车辆检测方法及装置 |
CN115049965A (zh) * | 2022-06-29 | 2022-09-13 | 深圳市城市公共安全技术研究院有限公司 | 一种检测模型的训练方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109117831B (zh) | 物体检测网络的训练方法和装置 | |
CN109858555B (zh) | 基于图像的数据处理方法、装置、设备及可读存储介质 | |
CN112380981B (zh) | 人脸关键点的检测方法、装置、存储介质及电子设备 | |
JP7425147B2 (ja) | 画像処理方法、テキスト認識方法及び装置 | |
CN114612759B (zh) | 视频处理方法、查询视频的方法和模型训练方法、装置 | |
US20210042504A1 (en) | Method and apparatus for outputting data | |
KR20220122566A (ko) | 텍스트 인식 모델의 트레이닝 방법, 텍스트 인식 방법 및 장치 | |
EP3872652A2 (en) | Method and apparatus for processing video, electronic device, medium and product | |
US11164004B2 (en) | Keyframe scheduling method and apparatus, electronic device, program and medium | |
CN112016638A (zh) | 一种钢筋簇的识别方法、装置、设备及存储介质 | |
CN114299366A (zh) | 一种图像检测方法、装置、电子设备及存储介质 | |
CN115861462B (zh) | 图像生成模型的训练方法、装置、电子设备及存储介质 | |
WO2022161302A1 (zh) | 动作识别方法、装置、设备、存储介质及计算机程序产品 | |
CN112364821A (zh) | 一种继电保护设备电力模式数据自识别方法和自识别设备 | |
JP2022185143A (ja) | テキスト検出方法、テキスト認識方法及び装置 | |
CN110363193B (zh) | 车辆重识别方法、装置、设备和计算机存储介质 | |
CN114170575A (zh) | 一种火焰识别方法、装置、电子设备及存储介质 | |
CN117011581A (zh) | 图像识别方法、介质、装置和计算设备 | |
CN110909889A (zh) | 一种基于特征分布的训练集生成、模型训练方法及装置 | |
JP2023531759A (ja) | 車線境界線検出モデルの訓練方法、車線境界線検出モデルの訓練装置、電子機器、記憶媒体及びコンピュータプログラム | |
CN114282258A (zh) | 截屏数据脱敏方法、装置、计算机设备及存储介质 | |
CN113762303B (zh) | 图像分类方法、装置、电子设备及存储介质 | |
US11967125B2 (en) | Image processing method and system | |
CN114241411B (zh) | 基于目标检测的计数模型处理方法、装置及计算机设备 | |
KR20230133808A (ko) | Roi 검출 모델 훈련 방법, 검출 방법, 장치, 설비 및 매체 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20220408 |