CN114494113A - 目标检测方法、电子设备和计算机可读存储介质 - Google Patents

目标检测方法、电子设备和计算机可读存储介质 Download PDF

Info

Publication number
CN114494113A
CN114494113A CN202111547905.7A CN202111547905A CN114494113A CN 114494113 A CN114494113 A CN 114494113A CN 202111547905 A CN202111547905 A CN 202111547905A CN 114494113 A CN114494113 A CN 114494113A
Authority
CN
China
Prior art keywords
image
sub
images
targets
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111547905.7A
Other languages
English (en)
Inventor
殷存军
陈波扬
王超
朱磊光
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Dahua Technology Co Ltd
Original Assignee
Zhejiang Dahua Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Dahua Technology Co Ltd filed Critical Zhejiang Dahua Technology Co Ltd
Priority to CN202111547905.7A priority Critical patent/CN114494113A/zh
Publication of CN114494113A publication Critical patent/CN114494113A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/4038Image mosaicing, e.g. composing plane images from plane sub-images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/136Segmentation; Edge detection involving thresholding

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Quality & Reliability (AREA)
  • Image Analysis (AREA)

Abstract

本申请公开了一种目标检测方法、电子设备和计算机可读存储介质,该方法包括:获得第一图像,对第一图像中分辨率低于第一阈值的第一子图像进行重建,以使第一子图像的分辨率超过第一阈值,从而将第一图像转换为第二图像;其中,第一图像中包含预设目标和其他目标;将第二图像分割成多个第二子图像,对至少部分第二子图像中的其他目标进行过滤,获得已过滤其他目标的第二子图像和保留有预设目标的第二子图像;将已过滤其他目标的第二子图像和保留有预设目标的第二子图像拼接成第三图像,在第三图像中确定预设目标的状态信息。上述方案,能够提高对目标的状态进行检测的准确率并提高检测效率。

Description

目标检测方法、电子设备和计算机可读存储介质
技术领域
本申请涉及计算机视觉技术领域,特别是涉及一种目标检测方法、电子设备和计算机可读存储介质。
背景技术
受制于环境因素,在一些领域难以采集到优质的图像数据,传统的分类器对图像数据中的目标进行检测时,即使能够确定目标的类别也很难确定目标的状态信息,并且传统分类器对大量图像数据进行逐个处理时的耗时也会特别长。有鉴于此,如何提高对目标的状态进行检测的准确率并提高检测效率成为亟待解决的问题。
发明内容
本申请主要解决的技术问题是提供一种目标检测方法、电子设备和计算机可读存储介质,能够提高对目标的状态进行检测的准确率并提高检测效率。
为解决上述技术问题,本申请第一方面提供一种目标检测方法,包括:获得第一图像,对所述第一图像中分辨率低于第一阈值的第一子图像进行重建,以使所述第一子图像的分辨率超过第一阈值,从而将所述第一图像转换为第二图像;其中,所述第一图像中包含预设目标和其他目标;将所述第二图像分割成多个第二子图像,对至少部分所述第二子图像中的所述其他目标进行过滤,获得已过滤其他目标的第二子图像和保留有预设目标的第二子图像;将所述已过滤其他目标的第二子图像和所述保留有预设目标的第二子图像拼接成第三图像,在所述第三图像中确定所述预设目标的状态信息。
为解决上述技术问题,本申请第二方面提供一种电子设备,该电子设备包括:相互耦接的存储器和处理器,其中,所述存储器存储有程序数据,所述处理器调用所述程序数据以执行上述第一方面所述的方法。
为解决上述技术问题,本申请第三方面提供一种计算机可读存储介质,其上存储有程序数据,所述程序数据被处理器执行时实现上述第一方面所述的方法。
上述方案,获得包括预设目标和其他目标的第一图像后,对第一图像中分辨率低于第一阈值的第一子图像进行重建,以提高第一图像中部分第一子图像的质量,从而将第一图像转换为第二图像,将第二图像分割成多个第二子图像,对第二子图像中的其他目标进行过滤,从而减少对预设目标进行干扰的信息,获得已过滤其他目标的第二子图像和保留有预设目标的第二子图像,并将两者拼接成第三图像,以使第三图像中已经过质量增强和目标过滤,从而第三图像中主要包括质量较高的预设目标,在第三图像中检测预设目标的状态时能够提高检测效率并提高检测的准确率。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。其中:
图1是本申请目标检测方法一实施方式的流程示意图;
图2是本申请目标检测方法另一实施方式的流程示意图;
图3是本申请电子设备一实施方式的结构示意图;
图4是本申请计算机存储介质一实施方式的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性的劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本文中术语“系统”和“网络”在本文中常被可互换使用。本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。此外,本文中的“多”表示两个或者多于两个。
请参阅图1,图1是本申请目标检测方法一实施方式的流程示意图,该方法包括:
S101:获得第一图像,对第一图像中分辨率低于第一阈值的第一子图像进行重建,以使第一子图像的分辨率超过第一阈值,从而将第一图像转换为第二图像,其中,第一图像中包含预设目标和其他目标。
具体地,获得包括预设目标和其他目标的第一图像,在第一图像中确定分辨率低于第一阈值的第一子图像,对分辨率低于第一阈值的第一子图像进行重建,以使第一子图像的分辨率超过第一阈值,从而提高分辨率低于第一阈值的第一子图像的质量,将重建后的第一子图像还原至第一图像上的对应位置,以使第一图像转换为第二图像。
在一应用方式中,获得包括预设目标和其他目标的第一图像,将第一图像分割为预设尺寸的多个第一子图像,利用预先训练过的第一模型对第一子图像进行解析,提取出分辨率低于第一阈值的第一子图像,并对提取出的第一子图像进行超分辨率重建,提高分辨率低于第一阈值的第一子图像的图像质量,将重建后的第一子图像还原至第一图像上的对应位置,从而将第一图像转换为第二图像。
在一应用场景中,获得由无人机上摄像装置采集的遥感图像数据,其中,遥感图像数据中的树木为预设目标,树木之外的目标为其他目标,受天气、光照、角度和距离等因素的影响,遥感图像数据上存在分辨率低于第一阈值的区域的概率也较高,将遥感图像数据分割成64x64个第一子图像,提取出分辨率低于第一阈值的第一子图像,对分辨率低于第一阈值的第一子图像进行超分辨率重建,获得重建后的第一子图像并还原至遥感图像上对应的位置,提高遥感图像的质量。其中,第一阈值为320×240分辨率。
S102:将第二图像分割成多个第二子图像,对至少部分第二子图像中的其他目标进行过滤,获得已过滤其他目标的第二子图像和保留有预设目标的第二子图像。
具体地,将第二图像分割成多个第二子图像,获得像素级的多个第二子图像,对其他目标占比超过第二阈值的第二子图像进行过滤,以消除其他目标占比超过第二阈值的第二子图像中的其他目标对应的像素,将第二子图像分成已过滤其他目标的第二子图像和保留有预设目标的第二子图像。
在一应用方式中,将第二图像分割为预设尺寸的多个第二子图像,利用预先训练过的第二模型对第二子图像进行解析,提取出其他目标占比超过第二阈值的第二子图像,并将其他目标占比超过第二阈值的第二子图像中的像素统一设置为区别于预设目标的颜色,从而过滤其中的其他目标,将所有分割后的第二子图像分成已过滤其他目标的第二子图像和保留有预设目标的第二子图像。
在一应用场景中,第二图像中的预设目标为树木,其他目标包括但不限于山石、田地和裸土,将第二图像分割成64x64个第二子图像,将第二图像分割成数千个第二子图像后,第二子图像中所包括的目标主要为单一类别的目标,将第二子图像输入第二模型,以使第二模型将第二图像中其他目标占比超过第二阈值的图像中的像素统一设置成黑色,获得已过滤预设目标的第二子图像,将未进行过滤的第二图像作为保留有预设目标的第二子图像。
S103:将已过滤其他目标的第二子图像和保留有预设目标的第二子图像拼接成第三图像,在第三图像中确定预设目标的状态信息。
具体地,将已过滤其他目标的第二子图像和保留有预设目标的第二子图像按分割之前的顺序拼接,从而获得第三图像,其中,第三图像中已经过质量增强和目标过滤,从而第三图像中主要包括质量较高的预设目标。
进一步地,利用第三模型对第三图像进行检测,获得第三图像中预设目标的状态信息,其中,第三模型经过预先训练用于区分预设目标的不同状态,当第三图像中主要包括的是质量较高的预设目标时,第三模型对第三图像进行检测时的数据量得到大幅降低,并且对于预设目标的状态的检测准确率也能得到大幅度提高。
在一应用场景中,第三图像中的预设目标为树木,第三模型经过预先训练用于区分无病害状态的树木和病害状态的树木,将第三图像输入第三模型以获得第三图像中树木的状态信息,将第三图像中病害状态的数目标定出来,从而便于对树木的病害进行治理,减少人工探索病害树木位置的成本。
上述方案,获得包括预设目标和其他目标的第一图像后,对第一图像中分辨率低于第一阈值的第一子图像进行重建,以提高第一图像中部分第一子图像的质量,从而将第一图像转换为第二图像,将第二图像分割成多个第二子图像,对第二子图像中的其他目标进行过滤,从而减少对预设目标进行干扰的信息,获得已过滤其他目标的第二子图像和保留有预设目标的第二子图像,并将两者拼接成第三图像,以使第三图像中已经过质量增强和目标过滤,从而第三图像中主要包括质量较高的预设目标,在第三图像中检测预设目标的状态时能够提高检测效率并提高检测的准确率。
请参阅图2,图2是本申请目标检测方法另一实施方式的流程示意图,该方法包括:
S201:获得第一图像,将第一图像中分辨率低于第一阈值的区域分割成多个第一子图像。
具体地,第一图像中包括预设目标和其他目标,对第一图像进行滤波亮化以及裁剪后获得更新后的第一图像。
进一步地,在获得第一图像后提取出第一图像中分辨率低于第一阈值的区域,将第一图像上分辨率低于第一阈值的区域分割成预设尺寸的多个第一子图像。
在一应用方式中,获得第一图像,对第一图像进行筛选以获得第一图像中分辨率低于第一阈值的区域,将第一图像中分辨率低于第一阈值的区域分割成64x64个第一子图像,从而获得第一子图像。
S202:将第一子图像输入第一模型中,利用第一模型对第一子图像进行重建,以使第一子图像的分辨率超过第一阈值。
具体地,将第一子图像输入第一模型中,藉由第一模型对第一子图像上的像素进行重建,以使第一子图像的分辨率超过第一阈值。
在一应用方式中,将第一子图像输入第一模型中,利用第一模型对第一子图像进行超分辨率重建,从而提高分辨率低于第一阈值的第一子图像的分辨率。
在一具体应用场景中,第一模型为生成式对抗网络(Generative AdversarialNetworks,GAN),将第一子图像输入第一模型中以使第一模型中的生成器对第一子图像进行重建。
具体地,第一模型由第一训练图像集预先训练后获得,第一训练图像集中的图像包括预设目标和其他目标。
进一步地,第一模型包括生成器和对抗器,第一模型的训练过程包括:在第一训练图像集中筛选出至少部分分辨率超过第一阈值的参考图像集;将第一训练图像集中的图像分割成多个第一训练子图像;利用第一训练子图像和参考图像集对生成器和对抗器进行训练,获得训练后的第一模型。
在一应用方式中,获取第一训练图像集,其中,第一训练图像集中至少50%的训练图像的分辨率低于第一阈值,从第一训练图像集中提取出部分分辨率超过第一阈值的训练图像组成参考图像集,将第一训练图像集中的图像按类别分类,并将第一训练图像集分成训练集和测试集,将训练集中的图像分割成多个第一训练子图像,将第一训练子图像输入第一模型中的生成器,以获得第一中间图像,利用对抗器比较第一中间图像和参考图像集的分辨率,并生成本次训练的损失,基于本次训练的损失对生成器和对抗器中的参数进行调整,直至满足收敛条件后获得训练后的第一模型。
进一步地,将测试集中的图像分割成多个第一训练子图像,并对训练后的第一模型进行测试,从而确定训练后的第一模型是否满足要求。其中,训练后的第一模型能够确定分辨率低于第一阈值的图像,并对分辨率低于第一阈值的图像进行重建,以使重建后的第一图像的分辨率与参考图像集中的图像一致,从而使第一模型具备对分辨率低于第一阈值的图像进行分辨和重建的能力。
S203:将重建后的第一子图像还原至第一图像上的对应区域,获得第二图像。
具体地,将重建后的第一子图像按照第一子图像在第一图像上的位置还原至第一图像上的对应区域,从而将第一图像转换为第二图像,提高第二图像整体的图像质量。
S204:将第二图像分割成多个第二子图像。
具体地,对第二图像进行分割,以获得多个第二子图像。
在一应用方式中,将第二图像分割成64x64个第二子图像。
S205:将第二子图像输入第二模型中,利用第二模型获取其他目标占比超过第二阈值的第二子图像,并将其他目标占比超过第二阈值的第二子图像中其他目标对应的像素消除,输出已过滤其他目标的第二子图像和保留有预设目标的第二子图像。
具体地,将第二子图像输入第二模型中,藉由第二模型确定第二子图像中其他目标占比超过第二阈值的第二子图像,从而在其他目标占比超过第二阈值的第二子图像中将其他目标对应的像素消除,以使第二模型输出已过滤其他目标的第二子图像和未进行过滤的第二子图像,其中,未进行过滤的第二子图像中其他目标的占比小于或等于第二阈值且必然包括预设目标,因此未进行过滤的第二子图像即为保留有预设目标的第二子图像,从而完成对第二子图像中其他目标的过滤,提高后续处理的效率。
在一应用方式中,第二模型由第二训练图像集预先训练后获得,第二训练图像集中的图像包括预设目标和其他目标,第二模型为残差神经网络模型,第二阈值为90%,将第二子图像输入至第二模型,以使第二模型对其他目标占比超过第二阈值的第二子图像中的像素进行消除操作,其中,消除操作包括将像素统一设置为明显区别于预设目标的颜色,并且第二图像被分割成数千个第二子图像时,第二子图像中包括的目标为一种目标的概率较高,当第二子图像中其他目标占比超过第二阈值,即可将第二子图像中的像素消除。
进一步地,第二模型的训练过程包括:将第二训练图像集分割成多个第二训练子图像;将第二训练子图像分成第一子集和第二子集;其中,第一子集对应的第二训练子图像中其他目标占比未超过第二阈值,第二子集对应的第二训练子图像中其他目标占比超过第二阈值;利用第一子集和第二子集训练第二模型,以获得训练后的第二模型。
具体地,输入至第二模型中的图像的分辨率已经过第一模型处理,因此,第二训练图像集中的训练图像分辨率超过第一阈值的图像占比超过80%,从而提高第二模型训练阶段与实际应用阶段的适配性,将第二训练图像集中的图像分割成多个第二训练子图像,基于其他目标在第二训练子图像中的占比将第二训练子图像分成两组,其中,第一子集对应的第二训练子图像中其他目标占比未超过第二阈值,第二子集对应的第二训练子图像中其他目标占比超过第二阈值,利用第一子集和第二子集对第二模型进行训练,从而获得能够区分其他目标和预设目标的第二模型。
在一应用场景中,利用第一子集和第二子集训练第二模型,以获得训练后的第二模型的步骤,包括:将第一子集和第二子集输入第二模型,获得第三子集;基于第三子集和第一子集的差异信息以及第三子集与第二子集的差异信息,确定第二模型对应的差异损失;其中,差异损失与第一子集在第三子集中的比例负相关,且差异损失与第二子集在第三子集中的比例正相关;基于差异损失对第二模型中参数进行调整,直至满足第一收敛条件,获得训练后的第二模型。
具体地,将第一子集和第二子集输入至第二模型中,获得第三子集,比较第三子集与第一子集的差异信息以及第三子集与第二子集的差异信息,获得第二模型的差异损失,其中,当第一子集在第三子集中的比例越高则差异损失越小,当第二子集在第三子集中的比例越高则差异损失越大,也就是说,第二模型用于区分出第一子集和第二子集,并尽可能保留第一子集并消除第二子集,基于差异损失对第二模型中的参数进行调整,当满足第一收敛条件时,获得训练后的第二模型,其中,第一收敛条件可以是差异损失为0,以使训练后的第二模型能够完全区分出第一子集和第二子集,并将第二子集对应的第二训练子图像中的像素消除。
进一步地,当第二子图像输入第二模型后,第二模型将第二子图像中其他目标占比超过第二阈值的图像对应的像素消除,从而将与预设目标无关的大部分背景信息清除,从而便于后续对预设目标的状态进行判断,提高判断的准确率。
S206:将已过滤其他目标的第二子图像和保留有预设目标的第二子图像按第二图像分割时的顺序拼接成第三图像。
具体地,将所有的第二子图像按照分割时的顺序拼接成第三图像,其中,所有的第二子图像包括已过滤其他目标的第二子图像和保留有预设目标的第二子图像。
S207:提取第三图像的特征信息,将第三图像的特征信息输入第三模型中,利用第三模型基于第三图像的特征信息进行状态识别,获得第三图像中预设目标的状态信息。
具体地,将第三图像中的特征信息提取出来,并将提取出的特征信息输入至第三模型中,藉由第三模型基于特征信息对第三图像中的预设目标进行状态识别,其中,状态信息包括预设目标的第一状态和第二状态,以使第三模型输出第三图像中不同区域内预设目标对应的状态信息。
在一应用场景中,预设目标为树木,预设目标的第一状态为树木无病害状态,预设目标的第二状态为树木病害状态,第三模型经过预先训练能够基于图像中的特征信息对预设目标的状态进行区分。获得第三图像后,提取第三图像中的特征信息输入至第三模型中,以使第三模型基于特征信息对第三图像中不同区域内的预设目标进行状态识别,从而获得第三图像上哪些区域的树木为无病害状态哪些区域的树木为病害状态,将病害状态的树木在第三图像上的位置映射到实际空间中,从而减少为确定病害树木所付出的人力物力。
进一步地,第三模型由第三训练图像集预先训练后获得,第三训练图像集中的图像包括预设目标和其他目标。
在一应用方式中,第三模型包括多个子分类器,第三模型的训练过程包括:提取第三训练图像集中的图像上第一状态的预设目标、第二状态的预设目标和其他目标分别对应的特征信息,并设置对应的标识以获得训练特征信息;利用包括标识的训练特征信息分别训练每个子分类器;响应于满足第二收敛条件,基于每个子分类器对应的预测损失确定每个子分类器对应的权重;将所有子分类器级联并对所有子分类器进行加权求和,获得训练后的第三模型。
具体地,提取第一状态的预设目标、第二状态的预设目标和其他目标对应的特征信息,为第一状态的预设目标、第二状态的预设目标和其他目标设置各自对应的标识,将第一状态的预设目标、第二状态的预设目标和其他目标设置各自对应的标识与各自对应的特征信息分别对应,获得训练特征信息,将包括标识的训练特征信息分别输入每个子分类器,比较每个子分类器输出的预测状态与输入的特征信息和标识,确定每个子分类器的预测损失,基于每个子分类器的损失对子分类器中的参数进行调整,直至满足第二收敛条件,利用测试图像获取每个子分类器对应的预测损失,基于每个子分类器对应的预测损失确定每个子分类器对应的权重。其中,第二收敛条件可以是迭代优化的次数,当迭代优化的次数超过第二收敛条件后,将第三模型对应的所有子分类器级联并对所有子分类器进行加权求和,获得训练后的第三模型。
进一步地,将第三图像中的特征信息输入至训练后的第三模型中,第三模型直接对特征信息进行分析,并且特征信息主要为预设目标的特征信息从而能够提高检测效率,其中,特征信息包括但不限于图像上的纹理和颜色,第三模型中的每个子分类器基于特征信息输出对应的状态解析结果,将每个子分类器对应的状态解析结果进行加权求和,确定第三图像中预设目标的状态信息,降低单一的识别方式带来的误差,提高对目标的状态进行检测的准确率。
在本实施例中,将预设目标分别通过第一模型提高第一图像中分辨率低于第一阈值的区域内的图像质量,获得第二图像,通过第二模型对第二图像分割成的第二子图像中其他目标占比超过第二阈值的像素进行过滤,从而过滤大部分预设目标之外的背景信息,获得第三图像,通过第三模型对第三图像中的特征信息进行解析,确定第三图像中预设目标的状态信息,提高对目标的状态进行检测的准确率并提高检测效率。
请参阅图3,图3是本申请电子设备一实施方式的结构示意图,该电子设备30包括相互耦接的存储器301和处理器302,其中,存储器301存储有程序数据(图未示),处理器302调用程序数据以实现上述任一实施例中的目标检测方法,相关内容的说明请参见上述方法实施例的详细描述,在此不再赘叙。
请参阅图4,图4是本申请计算机存储介质一实施方式的结构示意图,该计算机存储介质40存储有程序数据400,该程序数据400被处理器执行时实现上述任一实施例中的目标检测方法,相关内容的说明请参见上述方法实施例的详细描述,在此不再赘叙。
需要说明的是,作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施方式方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本申请各个实施方式方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本申请的实施方式,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。

Claims (10)

1.一种目标检测方法,其特征在于,所述方法包括:
获得第一图像,对所述第一图像中分辨率低于第一阈值的第一子图像进行重建,以使所述第一子图像的分辨率超过第一阈值,从而将所述第一图像转换为第二图像;其中,所述第一图像中包含预设目标和其他目标;
将所述第二图像分割成多个第二子图像,对至少部分所述第二子图像中的所述其他目标进行过滤,获得已过滤其他目标的第二子图像和保留有预设目标的第二子图像;
将所述已过滤其他目标的第二子图像和所述保留有预设目标的第二子图像拼接成第三图像,在所述第三图像中确定所述预设目标的状态信息。
2.根据权利要求1所述的目标检测方法,其特征在于,所述对所述第一图像中分辨率低于第一阈值的第一子图像进行重建,以使所述第一子图像的分辨率超过第一阈值,从而将所述第一图像转换为第二图像的步骤,包括:
将所述第一图像中分辨率低于第一阈值的区域分割成多个所述第一子图像;
将所述第一子图像输入第一模型中,利用所述第一模型对所述第一子图像进行重建,以使所述第一子图像的分辨率超过所述第一阈值;
将重建后的所述第一子图像还原至所述第一图像上的对应区域,获得第二图像;
其中,所述第一模型由第一训练图像集预先训练后获得,所述第一训练图像集中的图像包括所述预设目标和所述其他目标。
3.根据权利要求2所述的目标检测方法,其特征在于,所述第一模型包括生成器和对抗器,所述第一模型的训练过程包括:
在所述第一训练图像集中筛选出至少部分分辨率超过所述第一阈值的参考图像集;
将所述第一训练图像集中的图像分割成多个第一训练子图像;
利用所述第一训练子图像和所述参考图像集对所述生成器和所述对抗器进行训练,获得训练后的第一模型。
4.根据权利要求1所述的目标检测方法,其特征在于,所述将所述第二图像分割成多个第二子图像,对至少部分所述第二子图像中的所述其他目标进行过滤,获得已过滤其他目标的第二子图像和保留有预设目标的第二子图像的步骤,包括:
将所述第二图像分割成多个所述第二子图像;
将所述第二子图像输入第二模型中,利用所述第二模型获取所述其他目标占比超过第二阈值的第二子图像,并将所述其他目标占比超过第二阈值的第二子图像中所述其他目标对应的像素消除,输出所述已过滤其他目标的第二子图像和所述保留有预设目标的第二子图像;
其中,所述第二模型由第二训练图像集预先训练后获得,所述第二训练图像集中的图像包括所述预设目标和所述其他目标。
5.根据权利要求4所述的目标检测方法,其特征在于,所述第二模型的训练过程包括:
将所述第二训练图像集分割成多个第二训练子图像;
将所述第二训练子图像分成第一子集和第二子集;其中,所述第一子集对应的所述第二训练子图像中所述其他目标占比未超过所述第二阈值,所述第二子集对应的所述第二训练子图像中所述其他目标占比超过所述第二阈值;
利用所述第一子集和所述第二子集训练所述第二模型,以获得训练后的所述第二模型。
6.根据权利要求5所述的目标检测方法,其特征在于,所述利用所述第一子集和所述第二子集训练所述第二模型,以获得训练后的所述第二模型的步骤,包括:
将所述第一子集和所述第二子集输入所述第二模型,获得第三子集;
基于所述第三子集和所述第一子集的差异信息以及所述第三子集与所述第二子集的差异信息,确定所述第二模型对应的差异损失;其中,所述差异损失与所述第一子集在所述第三子集中的比例负相关,且所述差异损失与所述第二子集在所述第三子集中的比例正相关;
基于所述差异损失对所述第二模型中参数进行调整,直至满足第一收敛条件,获得训练后的所述第二模型。
7.根据权利要求1所述的目标检测方法,其特征在于,所述将所述已过滤其他目标的第二子图像和所述保留有预设目标的第二子图像拼接成第三图像,在所述第三图像中确定所述预设目标的状态信息的步骤,包括:
将所述已过滤其他目标的第二子图像和所述保留有预设目标的第二子图像按所述第二图像分割时的顺序拼接成所述第三图像;
提取所述第三图像的特征信息,将所述第三图像的特征信息输入第三模型中,利用所述第三模型基于所述第三图像的特征信息进行状态识别,获得所述第三图像中所述预设目标的状态信息;所述状态信息包括所述预设目标的第一状态和第二状态;
其中,所述第三模型由第三训练图像集预先训练后获得,所述第三训练图像集中的图像包括所述预设目标和所述其他目标。
8.根据权利要求7所述的目标检测方法,其特征在于,所述第三模型包括多个子分类器,所述第三模型的训练过程包括:
提取所述第三训练图像集中的图像上所述第一状态的预设目标、所述第二状态的预设目标和所述其他目标分别对应的特征信息,并设置对应的标识以获得训练特征信息;
利用包括所述标识的所述训练特征信息分别训练每个所述子分类器;
响应于满足第二收敛条件,基于每个所述子分类器对应的预测损失确定每个所述子分类器对应的权重;
将所有所述子分类器级联并对所有所述子分类器进行加权求和,获得训练后的所述第三模型。
9.一种电子设备,其特征在于,包括:相互耦接的存储器和处理器,其中,所述存储器存储有程序数据,所述处理器调用所述程序数据以执行如权利要求1-8中任一项所述的方法。
10.一种计算机可读存储介质,其上存储有程序数据,其特征在于,所述程序数据被处理器执行时实现如权利要求1-8中任一项所述的方法。
CN202111547905.7A 2021-12-16 2021-12-16 目标检测方法、电子设备和计算机可读存储介质 Pending CN114494113A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111547905.7A CN114494113A (zh) 2021-12-16 2021-12-16 目标检测方法、电子设备和计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111547905.7A CN114494113A (zh) 2021-12-16 2021-12-16 目标检测方法、电子设备和计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN114494113A true CN114494113A (zh) 2022-05-13

Family

ID=81494330

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111547905.7A Pending CN114494113A (zh) 2021-12-16 2021-12-16 目标检测方法、电子设备和计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN114494113A (zh)

Similar Documents

Publication Publication Date Title
EP1831823B1 (en) Segmenting digital image and producing compact representation
US7983486B2 (en) Method and apparatus for automatic image categorization using image texture
CN111428781A (zh) 遥感影像地物分类方法及系统
JP6192271B2 (ja) 画像処理装置、画像処理方法及びプログラム
CN111046880A (zh) 一种红外目标图像分割方法、系统、电子设备及存储介质
WO2020062360A1 (zh) 一种图像融合分类的方法及装置
CN108009554A (zh) 一种图像处理方法以及装置
CN110390643B (zh) 一种车牌增强方法、装置及电子设备
CN109934216B (zh) 图像处理的方法、装置、计算机可读存储介质
US20220215656A1 (en) Method, apparatus, device for image processing, and storage medium
CN114170418B (zh) 一种以图搜图的汽车线束连接器多特征融合图像检索方法
CN113435407B (zh) 一种输电系统的小目标识别方法及装置
CN112183212A (zh) 一种杂草识别方法、装置、终端设备及可读存储介质
CN113781510A (zh) 边缘检测方法、装置及电子设备
CN113901972A (zh) 遥感图像建筑物的检测方法、装置、设备及存储介质
CN111401387A (zh) 异常样本构建方法、装置、计算机设备和存储介质
CN113887472A (zh) 基于级联颜色及纹理特征注意力的遥感图像云检测方法
CN115239672A (zh) 缺陷检测方法及装置、设备、存储介质
CN108877030B (zh) 图像处理方法、装置、终端和计算机可读存储介质
CN112784854B (zh) 基于数理统计的服装颜色分割提取方法、装置和设备
CN112257730A (zh) 植物害虫图像识别方法、装置、设备及存储介质
CN116468958A (zh) 通信铁塔安全检测方法及系统
CN114494113A (zh) 目标检测方法、电子设备和计算机可读存储介质
Khan et al. Shadow removal from digital images using multi-channel binarization and shadow matting
WO2019229556A1 (en) Method for an automatic segmentation and classification of relevant objects in a digital tissue sample image

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination