CN114170421B - 图像检测方法、装置、设备及存储介质 - Google Patents

图像检测方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN114170421B
CN114170421B CN202210123174.1A CN202210123174A CN114170421B CN 114170421 B CN114170421 B CN 114170421B CN 202210123174 A CN202210123174 A CN 202210123174A CN 114170421 B CN114170421 B CN 114170421B
Authority
CN
China
Prior art keywords
image
model
output
feature
generate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210123174.1A
Other languages
English (en)
Other versions
CN114170421A (zh
Inventor
陈录城
贾冬冬
王暖来
姚星星
孟海秀
赵书玲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kaos Digital Technology Qingdao Co ltd
Karos Iot Technology Co ltd
Cosmoplat Industrial Intelligent Research Institute Qingdao Co Ltd
Original Assignee
Haier Digital Technology Qingdao Co Ltd
Haier Caos IoT Ecological Technology Co Ltd
Cosmoplat Industrial Intelligent Research Institute Qingdao Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Haier Digital Technology Qingdao Co Ltd, Haier Caos IoT Ecological Technology Co Ltd, Cosmoplat Industrial Intelligent Research Institute Qingdao Co Ltd filed Critical Haier Digital Technology Qingdao Co Ltd
Priority to CN202210123174.1A priority Critical patent/CN114170421B/zh
Publication of CN114170421A publication Critical patent/CN114170421A/zh
Application granted granted Critical
Publication of CN114170421B publication Critical patent/CN114170421B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Image Analysis (AREA)

Abstract

本申请公开了一种图像检测方法、装置、设备及存储介质,涉及图像识别领域,该方法包括:获取待检测图像和模型训练数据集;获取改进YOLO网络模型,其中,改进YOLO网络模型包含有空间金字塔池化SPP网络层和融合因子α,融合因子α用于对SPP网络层处理后的特征图进行融合处理;根据模型训练数据集训练改进YOLO网络模型,生成检测模型;根据检测模型检测待检测图像,生成检测结果。通过本方案可以设计出高性能的网络模型,该模型可以应用于各类场景下,对采集到的图像中的小目标对象进行检测,并具有较高的检测精度。

Description

图像检测方法、装置、设备及存储介质
技术领域
本申请实施例涉及图像识别领域,尤其涉及一种图像检测方法、装置、设备及存储介质。
背景技术
目前,人工智能技术应用于工业生产环境中,进行安全生产的检测管理,例如,对工业场景下的违规吸烟行为进行检测。常见的检测方式有两种,一种是基于行为检测,即以视频为输入,分析连续视频帧中的人体姿态;另一种是基于检测目标(例如,烟支),以高清图片作为输入,采用图像处理技术,判断是否有检测目标。但这两种方式都无法检测到小目标,而且对于特定的检测目标,例如,小的烟支目标,现有的数据集数量较少,无法训练出高性能的模型。
发明内容
本申请实施例提供了一种图像检测方法、装置、设备及存储介质,旨在设计出可以应用于各类场景下的高性能的网络模型,该模型可以对采集到的图像中的小目标对象进行检测,具有较高的检测精度。
第一方面,本申请实施例提供了一种图像检测方法,该方法包括:
获取待检测图像和模型训练数据集;
获取改进YOLO网络模型,其中,改进YOLO网络模型包含有空间金字塔池化SPP网络层和融合因子α,融合因子α用于对SPP网络层处理后的特征图进行融合处理;
根据模型训练数据集训练改进YOLO网络模型,生成检测模型;
根据检测模型检测所述待检测图像,生成检测结果。
第二方面,本申请实施例还提供了一种图像检测装置,该装置包括:
获取模块,用于获取待检测图像和模型训练数据集;
获取模块,还用于获取改进YOLO网络模型,其中,改进YOLO网络模型包含有空间金字塔池化SPP网络层和融合因子α,融合因子α用于对SPP网络层处理后的特征图进行融合处理;
训练模块,用于根据模型训练数据集训练改进YOLO网络模型,生成检测模型;
检测模块,用于根据检测模型检测待检测图像,生成检测结果。
第三方面,本申请实施例还提供了一种计算机设备,包括:存储器、控制器及存储在存储器上并可在控制器上运行的计算机程序,当控制器执行计算机程序时,实现如本申请任意实施例提供的图像检测方法。
第四方面,本申请实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被控制器执行时,实现如本申请任意实施例提供的图像检测方法。
本申请实施例提供了一种图像检测方法、装置、设备及存储介质,该方法包括:获取待检测图像和模型训练数据集;获取改进YOLO网络模型,其中,改进YOLO网络模型包含有空间金字塔池化SPP网络层和融合因子α,融合因子α用于对SPP网络层处理后的特征图进行融合处理;根据模型训练数据集训练改进YOLO网络模型,生成检测模型;根据检测模型检测待检测图像,生成检测结果。通过本方案可以设计出高性能的网络模型,该模型可以应用于各类场景下,对采集到的图像中的小目标对象进行检测,并具有较高的检测精度。
附图说明
图1为本申请实施例中的一种图像检测方法的流程图;
图2是本申请实施例中的一种训练改进YOLO网络模型,生成检测模型的方法流程图;
图3是本申请实施例中的一种图像检测装置的结构示意图;
图4是本申请实施例中的另一种图像检测装置的结构示意图;
图5是本申请实施例中的计算机设备的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本申请,而非对本申请的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本申请相关的部分而非全部结构。
另外,在本申请实施例中,“可选地”或者“示例性地”等词用于表示作例子、例证或说明。本申请实施例中被描述为“可选地”或者“示例性地”的任何实施例或设计方案不应被解释为比其它实施例或设计方案更优选或更具优势。确切而言,使用“可选地”或者“示例性地”等词旨在以具体方式呈现相关概念。
图1为本申请实施例提供的一种图像检测方法的流程图,该方法可以应用于各类场景下(例如,工业生产场景),以高性能的网络模型对采集到的图像中的小目标对象(例如,图像中的烟头等)进行检测,不仅具有较高的检测精度,还可以以可视化的形式呈现检测结果。该方法可以由本申请实施例提供的图像检测装置来执行,该装置可采用软件和/或硬件的方式实现。在一个具体的实施例中,该装置可以集成在计算机设备中,计算机设备比如可以是服务器。以下实施例将以该装置集成在计算机设备中为例进行说明,如图1所示,该方法可以包括但不限于以下步骤:
S101、获取待检测图像和模型训练数据集。
本申请实施例中的待检测图像可以为以各类设备采集或获取到的图像,例如,在工业生产场景下,利用工业生产现场的摄像头采集到的各类图像。模型训练数据集可以是现有的包含有各类烟支的大量图像构成的数据集。
进一步地,可以采用标注工具Label Image对现有的各类图像进行标注,并框选出各图像中的烟支目标,标注及框选完成后,生成对应图像的xml格式文件。可选地,该xml格式文件中可以包含有目标框的坐标信息。
S102、获取改进YOLO网络模型。
在本申请实施例中,上述改进YOLO网络模型中包含有空间金字塔池化(SpatialPyramid Pooling,SPP)网络层和融合因子α,该融合因子α可以用于对SPP网络层处理后的不同层次之间的特征图进行融合处理。
进一步地,本申请实施例中的改进YOLO网络模型中还可以包括自适应空间特征融合(Adaptively Spatial Feature Fusion,ASFF)网络层,用于改善特征的比例不变性,并降低推理开销,充分利用不同尺度的特征。即相比于现有的YOLO网络模型,在本申请实施例中,对YOLO网络模型的网络结构进行了更新设计,并针对设计后的新的网络模型,提出了基于融合因子α对SPP网络层处理后的特征图进行融合处理的处理方式。
可选地,上述改进YOLO网络模型具体可以为针对YOLOv3网络模型的改进模型,或者,也可以为针对YOLO系列的其他网络模型的改进模型,例如,YOLOv4网络模型或者YOLOv5网络模型等。
S103、根据模型训练数据集训练改进YOLO网络模型,生成检测模型。
可选地,可以将模型训练数据集中的数据按照比例(例如,1:9)划分为训练集和测试集,以防止过拟合。其中,训练集用于在模型训练阶段进行模型训练,测试集用于在模型训练阶段进行模型测试,以优化模型的性能。基于模型训练数据集对改进的YOLO网络模型进行训练,将训练后得到的网络模型确定为检测模型。
进一步地,在模型训练过程中,可以先冻结部分网络参数进行训练,例如,在前10个训练周期内冻结用于预测待检测图像的网络参数,在剩余的训练周期内,解冻之前冻结的参数,并对所有的网络参数进行训练,从而生成检测模型。另外,还可以结合余弦退火学习率调整训练过程中的学习率,加快网络模型的收敛速度。
S104、根据检测模型对待检测图像进行检测,生成检测结果。
基于上述过程得到检测模型后,可以将待检测图像输入至训练好的检测模型中,经过检测模型的检测处理后,生成关于该待检测图像的检测结果。示例性地,该检测结果中可以包含有目标检测对象在待检测图像中的坐标信息、类别信息以及置信度等。进一步地,该检测结果还可以以可视化的形式呈现。
可以理解的是,在待检测图像中不存在目标检测对象的情况下,例如,在工业生产场景下检测违规吸烟行为,若生产现场采集到的待检测图像中不存在烟支,那么检测结果中不存在坐标信息。
本申请实施例提供了一种图像检测方法,该方法包括:获取待检测图像和模型训练数据集;获取改进YOLO网络模型,其中,改进YOLO网络模型包含有空间金字塔池化SPP网络层和融合因子α,融合因子α用于对SPP网络层处理后的特征图进行融合处理;根据模型训练数据集训练改进YOLO网络模型,生成检测模型;根据检测模型检测待检测图像,生成检测结果。通过本方案可以设计出高性能的网络模型,该模型可以应用于各类场景下,对采集到的图像中的小目标对象进行检测,并具有较高的检测精度。
在一种示例中,可以基于现有的小样本公共数据集对改进YOLO网络模型进行训练,将训练后得到的改进YOLO网络模型确定为预训练模型,再基于上述模型训练数据集对得到的预训练模型进行训练,生成检测模型。
如图2所示,在一种示例中,上述步骤S103中,训练改进YOLO网络模型,生成检测模型的实现方式可以包括但不限于以下步骤:
S201、基于YOLO网络模型包含的Darknet53网络层对模型训练数据集进行特征提取,生成三个层次的特征图。
示例性地,假设本申请实施例中,Darknet53网络层对模型训练数据集进行特征提取后,生成的三个层次的特征图分别为C3、C4、C5。本领域技术人员可以理解的是,相比于C0、C1、C2这三个层次的特征图,C3、C4、C5这三个层次的特征图的卷积次数更多。
S202、基于SPP网络层分别对三个层次的特征图进行处理,生成三个输出特征图。
在本申请实施例中,为例增加网络模型的感受野,提高图像局部特征与全局特征之间的融合,可以将Darknet53网络层输出的三个层次的特征图C3、C4、C5输入至SPP网络层,经过SPP网络层的处理,得到三个输出特征图。
S203、基于融合因子α和三个输出特征图,生成三个卷积特征图。
示例性地,假设三个输出特征图分别为第一输出特征图、第二输出特征图和第三输出特征图,且这三个输出特征图的优先级依次从高到低,即认为相比第一特征图,第二特征图为低层次特征图,相比第二特征图,第三特征图为低层次特征图。那么本步骤的处理方式可以为对第一输出特征图进行卷积处理,生成第一图像;再基于融合因子α对第一输出特征图和第二输出特征图进行融合处理,以及基于融合因子α第二输出特征图和第三输出特征图进行融合处理,对应生成第二图像和第三图像,即将当前输出特征图与相邻的低层次特征图进行融合处理。进而,分别对得到的第一图像、第二图像和第三图像进行卷积处理,例如,进行3*3卷积操作,对应生成三个卷积特征图。
S204、基于改进YOLO网络模型中的ASFF网络层对三个卷积特征图进行处理。
在本申请实施例中,可以在ASFF网络层中,通过第二公式对得到的三个卷积特征图进行特征融合处理。其中,该第二公式可以包括三个卷积特征图中每个卷积特征图上的特征点至第L个卷积特征图上对应特征点的特征向量,以及特征向量对应的权重参数,上述L的取值为1~3中的任意一个整数。
例如,假设
Figure 13960DEST_PATH_IMAGE001
表示第n个卷积特征图上的特征点(i,j)调整到第l个卷积特征图上 对应特征点(i,j)的特征向量,那么对于第l个卷积特征图,上述第二公式可以如下所示:
Figure 300585DEST_PATH_IMAGE002
其中,
Figure 689978DEST_PATH_IMAGE003
表示融合处理后第l个卷积特征图的通道中输出特征映射
Figure 239908DEST_PATH_IMAGE004
的第(i,j) 个向量,
Figure 183593DEST_PATH_IMAGE005
Figure 992018DEST_PATH_IMAGE006
Figure 704759DEST_PATH_IMAGE007
分别为各向量对应的权重参数,表示三个不同层次的卷积特征图到 第l个卷积特征图的空间重要性权重,其具体可以通过网络自适应学习获得。
进一步地,
Figure 160011DEST_PATH_IMAGE008
,且
Figure 590993DEST_PATH_IMAGE006
Figure 422682DEST_PATH_IMAGE005
Figure 6242DEST_PATH_IMAGE007
的取值范围均为[0,1],具体地,
Figure 632395DEST_PATH_IMAGE006
Figure 550672DEST_PATH_IMAGE005
Figure 186053DEST_PATH_IMAGE007
可以由控制参数为
Figure 342228DEST_PATH_IMAGE009
Figure 404862DEST_PATH_IMAGE010
Figure 528544DEST_PATH_IMAGE011
的softmax函数确定。例如,
Figure 233195DEST_PATH_IMAGE012
其中,
Figure 509456DEST_PATH_IMAGE009
Figure 742991DEST_PATH_IMAGE010
Figure 370282DEST_PATH_IMAGE011
可以基于每个卷积特征图上的特征点至第L个卷积特征图上对 应特征点的特征向量,通过1×1的卷积层计算得出。
通过上述ASFF网络层中的处理过程,可以对不同层次上的特征点进行自适应融 合,进而得到不同层次上的向量
Figure 347465DEST_PATH_IMAGE013
,以进行关于目标对象的检测。
S205、将处理三个卷积特征图后得到的网络模型确定为检测模型。
如上述步骤S103所述,基于模型训练数据集进行模型训练时,可以利用改进YOLO网络模型先后对按照预设比例划分后得到的训练集和测试集进行处理,在对训练集和测试集处理完成后,将得到的网络模型确定为检测模型。
需要说明的是,在网络训练过程中,在前面若干个训练周期内冻结的网络参数并不影响上述的网络训练过程。
在一种示例中,上述步骤S203中,基于融合因子α和三个输出特征图,生成三个卷积特征图的实现方式可以包括:通过含有融合因子α的第一公式对第一输出特征图和第二输出特征图进行融合处理,生成第二图像;通过含有融合因子α的第一公式对第二输出特征图和第三输出特征图进行融合处理,生成第三图像。
进一步地,上述第一公式还可以包含有输出特征图的输入通道和各输入通道对应的卷积核。例如,
Figure 228964DEST_PATH_IMAGE014
其中,Xm和Ym分别表示两个相邻输出特征图的输入通道,具体地,Xm表示低层次输 出特征图的各输入通道,Ym表示高层次输出特征图的各输入通道,×表示卷积,Km表示第m个 卷积核,Km+c表示第m+c个卷积核,Zconcat表示第i个图像上的单个输出通道,其中,i的取值为 3或4,即假设SPP网络层对特征图C3、C4、C5处理后,得到的C3’、C4’、C5’,那么
Figure 898980DEST_PATH_IMAGE015
即表示对C3’ 和C4’进行融合处理,
Figure 747987DEST_PATH_IMAGE016
即表示对C4’和C5’进行融合处理。
示例性地,融合因子α的确定方式可以如下所示:
Figure 263282DEST_PATH_IMAGE017
其中,
Figure 514135DEST_PATH_IMAGE018
Figure 89473DEST_PATH_IMAGE019
分别表示第
Figure 964061DEST_PATH_IMAGE020
个特征图和第
Figure 283046DEST_PATH_IMAGE021
个特征图上的坐标信息数量。
图3为本申请实施例提供的一种图像检测装置的结构示意图,如图3所示,该装置可以包括:获取模块301、训练模块302、检测模块303;
其中,获取模块,用于获取待检测图像和模型训练数据集;获取模块,还用于获取改进YOLO网络模型,其中,改进YOLO网络模型包含有SPP网络层和融合因子α,融合因子α用于对SPP网络层处理后的特征图进行融合处理;
训练模块,用于根据模型训练数据集训练改进YOLO网络模型,生成检测模型;
检测模块,用于根据检测模型检测待检测图像,生成检测结果。
在一种示例中,上述改进YOLO网络模型还包含有ASFF网络层。
如图4所示,在一种示例中,上述训练模块具体还可以包括特征提取单元、处理单元和确定单元;
特征提取单元,用于基于YOLO网络模型包含的Darknet53网络层对模型训练数据集进行特征提取,生成三个层次的特征图;
处理单元,用于基于SPP网络层分别对三个层次的特征图进行处理,生成三个输出特征图;基于融合因子α和三个输出特征图,生成三个卷积特征图;以及,基于改进YOLO网络模型中的ASFF网络层对三个卷积特征图进行处理;
确定单元,用于将处理三个卷积特征图后得到的网络模型确定为检测模型。
进一步地,处理单元可以用于对第一输出特征图进行卷积处理,生成第一图像;基于融合因子α分别对第一输出特征图和第二输出特征图,以及第二输出特征图和第三输出特征图进行融合处理,对应生成第二图像和第三图像;以及,分别对第一图像、第二图像和第三图像进行卷积处理,生成三个卷积特征图。
其中,第一输出特征图、第二输出特征图和第三输出特征图为三个输出特征图中的图像,且第一输出特征图、第二输出特征图和第三输出特征图的优先级依次从高到低。
示例性地,处理单元,可以通过第一公式对第一输出特征图和第二输出特征图进行融合处理,生成第二图像;以及,通过第一公式对第二输出特征图和第三输出特征图进行融合处理,生成第三图像;
其中,第一公式含有融合因子α。
进一步地,第一公式还可以包括有输出特征图的输入通道和各输入通道对应的卷积核。
在一种示例中,处理单元,还可以用于在ASFF网络层中,通过第二公式对三个卷积特征图进行特征融合处理;其中,第二公式包括三个卷积特征图中每个卷积特征图上的特征点至第L个卷积特征图上对应特征点的特征向量,以及特征向量对应的权重参数,L的取值为1~3中的任意一个整数。
上述图像检测装置可以执行图1-图2所提供的图像检测方法,具备该方法中相应的器件和有益效果。
图5为本发明实施例5提供的一种计算机设备的结构示意图,如图5所示,该计算机设备包括控制器501、存储器502、输入装置503、输出装置504;计算机设备中控制器501的数量可以是一个或多个,图5中以一个控制器501为例;计算机设备中的控制器501、存储器502、输入装置503和输出装置504可以通过总线或其他方式连接,图5中以通过总线连接为例。
存储器502作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如图1实施例中的图像检测方法对应的程序指令/模块(例如,图像检测装置中的获取模块301、训练模块302、检测模块303)。控制器501通过运行存储在存储器502中的软件程序、指令以及模块,从而执行计算机设备的各种功能以及数据处理,即实现上述的图像检测方法。
存储器502可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端的使用所创建的数据等。此外,存储器502可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器502可进一步包括相对于控制器501远程设置的存储器,这些远程存储器可以通过网络连接至终端/服务器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置503可用于接收输入的数字或字符信息,以及产生与计算机设备的用户设置以及功能控制有关的键信号输入。输出装置504可包括显示屏等显示装置。
本申请实施例还提供一种包含计算机可执行指令的存储介质,该计算机可执行指令在由计算机控制器执行时用于执行一种图像检测方法,该方法包括图1所示的步骤。
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本申请可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory, ROM)、随机存取存储器(RandomAccess Memory, RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述的方法。
值得注意的是,上述图像检测装置中所包括的模块只是按照功能逻辑进行划分,但并不局限于上述的划分方式,只要能够实现相应的功能即可,不用于限制本申请的保护范围。
注意,上述仅为本申请的较佳实施例及所运用技术原理。本领域技术人员会理解,本申请不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本申请的保护范围。因此,虽然通过以上实施例对本申请进行了较为详细的说明,但是本申请不仅仅限于以上实施例,在不脱离本申请构思的情况下,还可以包括更多其他等效实施例,而本申请的范围由所附的权利要求范围决定。

Claims (7)

1.一种图像检测方法,其特征在于,包括:
获取待检测图像和模型训练数据集;
获取改进YOLO网络模型,其中,所述改进YOLO网络模型包含有自适应空间特征融合ASFF网络层、空间金字塔池化SPP网络层和融合因子α,所述融合因子α用于对所述SPP网络层处理后的特征图进行融合处理;
根据模型训练数据集训练所述改进YOLO网络模型,生成检测模型;
根据所述检测模型检测所述待检测图像,生成检测结果;
所述根据模型训练数据集训练所述改进YOLO网络模型,生成检测模型,包括:
基于所述YOLO网络模型包含的Darknet53网络层对所述模型训练数据集进行特征提取,生成三个层次的特征图;
基于所述SPP网络层分别对所述三个层次的特征图进行处理,生成三个输出特征图;
基于所述融合因子α和所述三个输出特征图,生成三个卷积特征图;
基于所述改进YOLO网络模型中的自适应空间特征融合ASFF网络层对所述三个卷积特征图进行处理;
将处理所述三个卷积特征图后得到的网络模型确定为检测模型;
所述基于所述融合因子α和所述三个输出特征图,生成三个卷积特征图,包括:
对第一输出特征图进行卷积处理,生成第一图像;
基于所述融合因子α分别对第一输出特征图和第二输出特征图,以及第二输出特征图和第三输出特征图进行融合处理,对应生成第二图像和第三图像;
分别对所述第一图像、所述第二图像和所述第三图像进行卷积处理,生成三个卷积特征图;
其中,所述第一输出特征图、所述第二输出特征图和所述第三输出特征图为所述三个输出特征图中的图像,且所述第一输出特征图、所述第二输出特征图和所述第三输出特征图的优先级依次从高到低。
2.根据权利要求1所述的方法,其特征在于,所述基于所述融合因子α分别对第一输出特征图和第二输出特征图,以及第二输出特征图和第三输出特征图进行融合处理,对应生成第二图像和第三图像,包括:
通过第一公式对第一输出特征图和第二输出特征图进行融合处理,生成第二图像;
通过所述第一公式对第二输出特征图和第三输出特征图进行融合处理,生成第三图像;
其中,所述第一公式含有所述融合因子α。
3.根据权利要求2所述的方法,其特征在于,所述第一公式还包括有输出特征图的输入通道和各输入通道对应的卷积核。
4.根据权利要求1所述的方法,其特征在于,所述基于所述改进YOLO网络模型中的自适应空间特征融合ASFF网络层对所述三个卷积特征图进行处理,包括:
在所述自适应空间特征融合ASFF网络层中,通过第二公式对所述三个卷积特征图进行特征融合处理;
其中,所述第二公式包括所述三个卷积特征图中每个卷积特征图上的特征点至第L个卷积特征图上对应特征点的特征向量,以及所述特征向量对应的权重参数,所述L的取值为1~3中的任意一个整数。
5.一种图像检测装置,其特征在于,包括:
获取模块,用于获取待检测图像和模型训练数据集;所述获取模块,还用于获取改进YOLO网络模型,其中,所述改进YOLO网络模型包含有自适应空间特征融合ASFF网络层、空间金字塔池化SPP网络层和融合因子α,所述融合因子α用于对所述SPP网络层处理后的特征图进行融合处理;
训练模块,用于根据模型训练数据集训练所述改进YOLO网络模型,生成检测模型;
检测模块,用于根据所述检测模型检测所述待检测图像,生成检测结果;
所述根据模型训练数据集训练所述改进YOLO网络模型,生成检测模型,包括:
基于所述YOLO网络模型包含的Darknet53网络层对所述模型训练数据集进行特征提取,生成三个层次的特征图;
基于所述SPP网络层分别对所述三个层次的特征图进行处理,生成三个输出特征图;
基于所述融合因子α和所述三个输出特征图,生成三个卷积特征图;
基于所述改进YOLO网络模型中的自适应空间特征融合ASFF网络层对所述三个卷积特征图进行处理;
将处理所述三个卷积特征图后得到的网络模型确定为检测模型;
所述基于所述融合因子α和所述三个输出特征图,生成三个卷积特征图,包括:
对第一输出特征图进行卷积处理,生成第一图像;
基于所述融合因子α分别对第一输出特征图和第二输出特征图,以及第二输出特征图和第三输出特征图进行融合处理,对应生成第二图像和第三图像;
分别对所述第一图像、所述第二图像和所述第三图像进行卷积处理,生成三个卷积特征图;
其中,所述第一输出特征图、所述第二输出特征图和所述第三输出特征图为所述三个输出特征图中的图像,且所述第一输出特征图、所述第二输出特征图和所述第三输出特征图的优先级依次从高到低。
6.一种计算机设备,其特征在于,包括:存储器、控制器及存储在存储器上并可在控制器上运行的计算机程序,所述控制器执行所述计算机程序时,实现如权利要求1-4任一项所述的图像检测方法。
7.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被控制器执行时,实现如权利要求1-4任一项所述的图像检测方法。
CN202210123174.1A 2022-02-10 2022-02-10 图像检测方法、装置、设备及存储介质 Active CN114170421B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210123174.1A CN114170421B (zh) 2022-02-10 2022-02-10 图像检测方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210123174.1A CN114170421B (zh) 2022-02-10 2022-02-10 图像检测方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN114170421A CN114170421A (zh) 2022-03-11
CN114170421B true CN114170421B (zh) 2022-06-17

Family

ID=80489559

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210123174.1A Active CN114170421B (zh) 2022-02-10 2022-02-10 图像检测方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN114170421B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019223582A1 (en) * 2018-05-24 2019-11-28 Beijing Didi Infinity Technology And Development Co., Ltd. Target detection method and system
CN111898699A (zh) * 2020-08-11 2020-11-06 海之韵(苏州)科技有限公司 一种船体目标自动检测识别方法
CN111950612A (zh) * 2020-07-30 2020-11-17 中国科学院大学 基于fpn的融合因子的弱小目标检测方法
CN113688709A (zh) * 2021-08-17 2021-11-23 长江大学 一种安全帽佩戴智能检测方法、系统、终端及介质
CN113723272A (zh) * 2021-08-26 2021-11-30 江苏范特科技有限公司 基于多画面实时拼接的物体检测方法、系统、设备和介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111553406B (zh) * 2020-04-24 2023-04-28 上海锘科智能科技有限公司 基于改进yolo-v3的目标检测系统、方法及终端
CN112132032A (zh) * 2020-09-23 2020-12-25 平安国际智慧城市科技股份有限公司 交通标志牌检测方法、装置、电子设备及存储介质
CN113240050B (zh) * 2021-06-08 2024-05-03 南京师范大学 一种特征融合权重可调的金属打印熔池检测方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019223582A1 (en) * 2018-05-24 2019-11-28 Beijing Didi Infinity Technology And Development Co., Ltd. Target detection method and system
CN111950612A (zh) * 2020-07-30 2020-11-17 中国科学院大学 基于fpn的融合因子的弱小目标检测方法
CN111898699A (zh) * 2020-08-11 2020-11-06 海之韵(苏州)科技有限公司 一种船体目标自动检测识别方法
CN113688709A (zh) * 2021-08-17 2021-11-23 长江大学 一种安全帽佩戴智能检测方法、系统、终端及介质
CN113723272A (zh) * 2021-08-26 2021-11-30 江苏范特科技有限公司 基于多画面实时拼接的物体检测方法、系统、设备和介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Insulator defect detection based on YOLO and SPP-Net;Xibo Zhang,and etc;《2020 International Conference on Big Data & Artificial Intelligence & Software Engineering (ICBASE)》;20210423;第403-407页 *
基于YOLOV5的药品表面缺陷实时检测方法;钱雪等;《信息技术与网络安全》;20211231;第40卷(第12期);第45-50页 *

Also Published As

Publication number Publication date
CN114170421A (zh) 2022-03-11

Similar Documents

Publication Publication Date Title
CN111178183B (zh) 人脸检测方法及相关装置
CN113128558B (zh) 基于浅层空间特征融合与自适应通道筛选的目标检测方法
CN107292886B (zh) 基于网格划分及神经网络的目标物入侵检测方法及装置
JP2022122984A (ja) 画像処理システム、画像処理方法及びプログラム
CN111914843B (zh) 文字检测方法、系统、设备及存储介质
CN112348828A (zh) 基于神经网络的实例分割方法和装置以及存储介质
CN111126278A (zh) 针对少类别场景的目标检测模型优化与加速的方法
CN109671055B (zh) 肺结节检测方法及装置
CN115797735A (zh) 目标检测方法、装置、设备和存储介质
CN111652181A (zh) 目标跟踪方法、装置及电子设备
CN113487610B (zh) 疱疹图像识别方法、装置、计算机设备和存储介质
CN114241314A (zh) 一种基于CenterNet的遥感影像建筑物变化检测模型及算法
CN113065379B (zh) 融合图像质量的图像检测方法、装置、电子设备
CN114170421B (zh) 图像检测方法、装置、设备及存储介质
CN116543333A (zh) 电力系统的目标识别方法、训练方法、装置、设备和介质
Ataş Performance Evaluation of Jaccard-Dice Coefficient on Building Segmentation from High Resolution Satellite Images
WO2019228654A1 (en) Method for training a prediction system and system for sequence prediction
CN112633065A (zh) 一种基于数据增强的人脸检测方法、系统、存储介质及终端
CN114373110A (zh) 对输入图像进行目标检测的检测方法、设备及其相关产品
CN112862002A (zh) 多尺度目标检测模型的训练方法、目标检测方法和装置
CN112396126A (zh) 一种基于检测主干与局部特征优化的目标检测方法及系统
CN114417946A (zh) 目标检测方法及装置
CN114625456B (zh) 目标图像显示方法、装置及设备
CN114596580B (zh) 一种多人体目标识别方法、系统、设备及介质
CN115705679A (zh) 目标检测方法、装置、电子设备和计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 266000 No. 1, Minshan Road, Qingdao area, China (Shandong) pilot Free Trade Zone, Qingdao, Shandong

Applicant after: CAOS industrial Intelligence Research Institute (Qingdao) Co.,Ltd.

Applicant after: Haier digital technology (Qingdao) Co.,Ltd.

Applicant after: Haier CAOS IOT Ecological Technology Co.,Ltd.

Address before: Room 257, management committee of Sino German ecological park, 2877 Tuanjie Road, Huangdao District, Qingdao City, Shandong Province, 266510

Applicant before: QINGDAO HAIER INDUSTRIAL INTELLIGENCE RESEARCH INSTITUTE Co.,Ltd.

Applicant before: Haier digital technology (Qingdao) Co.,Ltd.

Applicant before: Haier CAOS IOT Ecological Technology Co.,Ltd.

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder

Address after: 266000 No. 1, Minshan Road, Qingdao area, China (Shandong) pilot Free Trade Zone, Qingdao, Shandong

Patentee after: CAOS industrial Intelligence Research Institute (Qingdao) Co.,Ltd.

Patentee after: Haier digital technology (Qingdao) Co.,Ltd.

Patentee after: Haier Kaos IOT Technology Co.,Ltd.

Address before: 266000 No. 1, Minshan Road, Qingdao area, China (Shandong) pilot Free Trade Zone, Qingdao, Shandong

Patentee before: CAOS industrial Intelligence Research Institute (Qingdao) Co.,Ltd.

Patentee before: Haier digital technology (Qingdao) Co.,Ltd.

Patentee before: Haier CAOS IOT Ecological Technology Co.,Ltd.

CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: 266000 No. 1, Minshan Road, Qingdao area, China (Shandong) pilot Free Trade Zone, Qingdao, Shandong

Patentee after: CAOS industrial Intelligence Research Institute (Qingdao) Co.,Ltd.

Patentee after: Haier digital technology (Qingdao) Co.,Ltd.

Patentee after: Karos IoT Technology Co.,Ltd.

Address before: 266000 No. 1, Minshan Road, Qingdao area, China (Shandong) pilot Free Trade Zone, Qingdao, Shandong

Patentee before: CAOS industrial Intelligence Research Institute (Qingdao) Co.,Ltd.

Patentee before: Haier digital technology (Qingdao) Co.,Ltd.

Patentee before: Haier Kaos IOT Technology Co.,Ltd.

CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: 266000 No. 1, Minshan Road, Qingdao area, China (Shandong) pilot Free Trade Zone, Qingdao, Shandong

Patentee after: CAOS industrial Intelligence Research Institute (Qingdao) Co.,Ltd.

Patentee after: Kaos Digital Technology (Qingdao) Co.,Ltd.

Patentee after: Karos IoT Technology Co.,Ltd.

Address before: 266000 No. 1, Minshan Road, Qingdao area, China (Shandong) pilot Free Trade Zone, Qingdao, Shandong

Patentee before: CAOS industrial Intelligence Research Institute (Qingdao) Co.,Ltd.

Patentee before: Haier digital technology (Qingdao) Co.,Ltd.

Patentee before: Karos IoT Technology Co.,Ltd.

CP01 Change in the name or title of a patent holder