CN110473216A - 一种图像中目标物的检测方法及装置 - Google Patents

一种图像中目标物的检测方法及装置 Download PDF

Info

Publication number
CN110473216A
CN110473216A CN201910778132.XA CN201910778132A CN110473216A CN 110473216 A CN110473216 A CN 110473216A CN 201910778132 A CN201910778132 A CN 201910778132A CN 110473216 A CN110473216 A CN 110473216A
Authority
CN
China
Prior art keywords
image
detected
image block
testing result
coordinate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910778132.XA
Other languages
English (en)
Inventor
尚砚娜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lenovo Beijing Ltd
Original Assignee
Lenovo Beijing Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lenovo Beijing Ltd filed Critical Lenovo Beijing Ltd
Priority to CN201910778132.XA priority Critical patent/CN110473216A/zh
Publication of CN110473216A publication Critical patent/CN110473216A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/70Denoising; Smoothing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Quality & Reliability (AREA)
  • Image Analysis (AREA)

Abstract

本申请提供一种图像中目标物的检测方法及装置,对待检测图像进行分割得到待检测图像对应的各个图像块;对各个图像块进行检测得到各个图像块对应的检测结果,基于各个图像块的检测结果获得待检测图像的检测结果。虽然目标物在待检测图像中所占比例很小或者目标物的绝对尺寸很小,但是目标物相对于图像块来说目标物所占比例增大或目标物相对于图像块的绝对尺寸变化,在检测的过程中,不会因为目标物在图像中所占的比例很小或者目标物的绝对尺寸很小而导致将目标物错判为图像噪声,进而通过整合每个图像块对应的检测结果的方式来获得待检测图像的检测结果,以识别出待检测图像中的目标物,从而能够准确识别出待检测图像中的目标物,提高检测准确度。

Description

一种图像中目标物的检测方法及装置
技术领域
本申请属于图像处理技术领域,尤其涉及一种图像中目标物的检测方法及装置。
背景技术
目前通过深度学习模型在检测图像中目标物(如物体表面缺陷)时,当目标物在图像中所占的比例很小或者目标物的绝对尺寸很小(比如一幅图的尺寸为2000*2000,而图像中的目标物只有几十甚至十几个像素),并且目标物与图像背景的对比度不高时,会因为目标物本身的特征不够明显导致目标物被视为是图像噪声,从而忽略掉图像中的目标物,降低检测准确度。
发明内容
有鉴于此,本申请的目的在于提供一种图像中目标物的检测方法及装置,用于提高识别待检测图像中目标物的准确度。
本申请提供一种图像中目标物的检测方法,所述方法包括:
对待检测图像进行分割,得到所述待检测图像对应的各个图像块;
对所述各个图像块进行检测,得到所述各个图像块的检测结果;
基于所述各个图像块的检测结果,获得所述待检测图像的检测结果,所述待检测图像的检测结果用于表示待检测图像中是否存在目标物。
优选的,所述对所述各个图像块进行检测,得到所述各个图像块的检测结果包括:
通过预设模型的调用,获得所述预设模型输出的各个图像块的检测结果,所述预设模型是基于已有图像块以及已有图像块的标注数据进行训练得到,所述已有图像块的标注数据用于指示已有图像块是否有目标物。
优选的,所述基于所述各个图像块的检测结果,获得所述待检测图像的检测结果包括:
如果至少一个图像块的检测结果表明所述图像块中存在目标物,获得表明存在目标物的检测结果对应的图像块中目标物的坐标;
基于各个表明存在目标物的检测结果对应的图像块中目标物的坐标,获得所述待检测图像中目标物的坐标,所述待检测图像中目标物的坐标为所述待检测图像的检测结果。
优选的,所述基于各个表明存在目标物的检测结果对应的图像块中目标物的坐标,获得所述待检测图像中目标物的坐标包括:
获得各个表明存在目标物的检测结果对应的图像块在所述待检测图像中的位置;
基于所述图像块在所述待检测图像中的位置以及各个表明存在目标物的检测结果对应的图像块中目标物的坐标,获得所述待检测图像中目标物的坐标。
优选的,所述基于所述图像块在所述待检测图像中的位置以及各个表明存在目标物的检测结果对应的图像块中目标物的坐标,获得所述待检测图像中目标物的坐标包括:
如果表明存在目标物的检测结果对应的图像块为至少两个图像块,基于所述至少两个图像块中每个图像块在所有图像块中的位置以及表明存在目标物的检测结果对应的图像块中目标物的坐标,获得所述至少两个图像块对应的目标物在待检测图像中的坐标;
对所述至少两个图像块对应的目标物在待检测图像中的坐标进行融合,得到所述待检测图像中目标物的坐标。
本申请还提供一种图像中目标物的检测装置,所述装置包括:
分割单元,用于对待检测图像进行分割,得到所述待检测图像对应的各个图像块;
检测单元,用于对所述各个图像块进行检测,得到所述各个图像块的检测结果;
获取单元,用于基于所述各个图像块的检测结果,获得所述待检测图像的检测结果,所述待检测图像的检测结果用于表示待检测图像中是否存在目标物。
优选的,所述检测单元具体用于:通过预设模型的调用,获得所述预设模型输出的各个图像块的检测结果,所述预设模型是基于已有图像块以及已有图像块的标注数据进行训练得到,所述已有图像块的标注数据用于指示已有图像块是否有目标物。
优选的,所述获取单元包括:
第一获取模块,用于如果至少一个图像块的检测结果表明所述图像块中存在目标物,获得表明存在目标物的检测结果对应的图像块中目标物的坐标;
第二获取模块,用于基于各个表明存在目标物的检测结果对应的图像块中目标物的坐标,获得所述待检测图像中目标物的坐标,所述待检测图像中目标物的坐标为所述待检测图像的检测结果。
优选的,所述第二获取模块包括:
第一获取子模块,用于获得各个表明存在目标物的检测结果对应的图像块在所述待检测图像中的位置;
第二获取子模块,用于基于所述图像块在所述待检测图像中的位置以及各个表明存在目标物的检测结果对应的图像块中目标物的坐标,获得所述待检测图像中目标物的坐标。
优选的,所述第二获取子模块具体用于:如果表明存在目标物的检测结果对应的图像块为至少两个图像块,基于所述至少两个图像块中每个图像块在所有图像块中的位置以及表明存在目标物的检测结果对应的图像块中目标物的坐标,获得所述至少两个图像块对应的目标物在待检测图像中的坐标,对所述至少两个图像块对应的目标物在待检测图像中的坐标进行融合,得到所述待检测图像中目标物的坐标。
本申请还提供一种存储介质,所述存储介质上存储有程序代码,所述程序代码用于实现上述图像中目标物的检测方法。
本申请还提供一种电子设备,包括处理器和存储器;
所述处理器,用于对待检测图像进行分割,得到所述待检测图像对应的各个图像块,对所述各个图像块进行检测,得到所述各个图像块的检测结果,基于所述各个图像块的检测结果,获得所述待检测图像的检测结果,所述待检测图像的检测结果用于表示待检测图像中是否存在目标物;
所述存储器,用于存储所述待检测图像的检测结果。
从上述技术方案可知,将待检测图像分割成多个图像块,对每一图像块都进行检测得到每个图像块对应的检测结果,基于各个图像块的检测结果,获得待检测图像的检测结果,由此通过将待检测图像分割成多个图像块的方式将目标物划分到至少一个图像块中,这样虽然目标物在待检测图像中所占比例很小或者目标物的绝对尺寸很小,但是目标物相对于图像块来说目标物所占比例增大或目标物相对于图像块的绝对尺寸变化,从而在检测的过程中不会因为目标物在图像中所占的比例很小或者目标物的绝对尺寸很小而导致将目标物错判为图像噪声,进而通过整合每个图像块对应的检测结果的方式来获得待检测图像的检测结果,以识别出待检测图像中的目标物,从而能够准确识别出待检测图像中的目标物,提高检测准确度。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例公开的一种图像中目标物的检测方法流程图;
图2为本申请实施例公开的待检测图像分割示意图;
图3为本申请实施例公开的另一待检测图像分割示意图;
图4为本申请实施例公开的获得检测图像的检测结果的流程图;
图5a为本申请实施例公开的待检测图像均匀分割示意图;
图5b为本申请实施例公开的待检测图像不均匀分割示意图;
图6为本申请实施例公开的获得检测图像中目标物的坐标的流程图;
图7为本申请实施例公开的一种图像中目标物的检测装置的结构示意图;
图8为本申请实施例公开的另一种图像中目标物的检测装置的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例中涉及的待检测图像中的目标物为待检测图像中具有特定信息的特征。例如:对于任一物体对应的待检测图像,需要识别该待检测图像中的物体表面缺陷,即目标物为物体表面缺陷。又例如:对于街道对应的待检测图像来说,需要识别待检测图像中的车辆,即目标物为车辆。在本申请实施例中对于待检测图像中的目标物的具体类型不做具体限定。
请参阅图1,其示出了本申请实施例提供的图像中目标物的检测方法流程图,用于提高检测图像中目标物的准确度,可以包括以下步骤:
101:对待检测图像进行分割,得到待检测图像对应的各个图像块。
在本实施例中,在获取待检测图像后,可以根据预设分割规则将待检测图像进行分割,得到待检测图像对应的多个图像块。预设分割规则包括但不仅限于以下两种方式:
方式一:将待检测图像均分或不均分为多个图像块,图像块之间不存在重叠区域。
方式二:将待检测图像分割成多个图像块,每两幅相邻的图像块之间存在预设像素的重叠区域。例如将一幅像素为2100*2100的待检测图像分割成11*11幅图像块,每幅图像块的像素为200*200,每两幅相邻的图像块之间存在10个像素的重叠区域,当然每两幅相邻的图像块之间存在的重叠区域也可以不同,对此本实施例不进行限定。
需要说明的是,对于目标物,该目标物的在待检测图像中的位置情况包括但不仅限于以下四种:
情况一:该目标物单独存在于一个图像块中。
情况二:该目标物同时存在于相邻两个图像块中。
情况三:该目标物存在于三个图像块中。
情况四:该目标物存在于四个图像块中。
对应前述情况二至情况四,采用上述预设分割规则中的方式二对待检测图像进行分割相对于方式一来说可以提高目标物的检测准确度,具体原因如下:
假设每两个相邻图像块的重叠区域为10个像素,目标物的尺寸为5*10个像素,目标物存在相邻的第一图像块和第二图像块的重叠区域中,即在第一图像块中存在5*5个像素的目标物,在第二图像块中存在5*5个像素的目标物,或者在第一图像块中存在5*10个像素的目标物,在第二图像块中存在5*10个像素的目标物。
由于该目标物的尺寸很小,在两个图像块中又分割成更小的两个目标物,若采用上述分割规则中的方式一对待检测图像进行分割,容易出现漏检测的情况,即检测不出该目标物。
而采用上述分割规则中的方式二对待检测图像进行分割,该目标物会完整出现在一个图像块,甚至目标物的部分或全部出现在两个相邻图像块中。
假设检测出一个完整目标物的概率为P1,检测出半个目标物的概率为P2,对于上述分割规则中的方式一,即相邻图像块不存在重叠区域,则检测出目标物的概率a2如公式(1)。
a2=1-(1-P2)*(1-P2)=2*P2-P2*P2 (1)
对于上述分割规则中的方式二,即相邻图像块存在重叠区域,则检测出目标物的概率a1如公式(2)。
a1=1-(1-P1)*(1-P1)=2*P1-P1*P1 (2)
将公式(1)与公式(2)进行相减,如公式(3)。
a1-a2=(P1-P2)(2-P1-P2) (3)
由前述内容可知,目标物的尺寸越小,检测出该目标物的概率越低,即P2<P1,并且P2和P1均小于等于1,因此,a1-a2>0,即a1>a2,所以采用上述预设分割规则中的方式二对待检测图像进行分割可以提高目标物的检测准确度。
本申请中对于待检测图像的预设分割规则不做具体限定,为更好解释说明上述对待检测图像进行分割的两种预设分割规则,通过图2和图3示出的分割示意图进行举例说明。需要说明的是,图2和图3示出的内容仅适用于举例说明。其中图2示出了本申请实施例提供的待检测图像的一种分割示意图,在图2中,将待检测图像均分为8个图像块,每两个图像块之间不存在重叠区域。图3示出了本申请实施例提供的待检测图像的另一分割示意图,在图3中,将待检测图像均分为8个图像块,每两个图像块之间存在预设大小的重叠区域,预设大小可以根据实际应用而定,对此本实施例不加以限定。
102:对各个图像块进行检测,得到各个图像块的检测结果。
在本实施例中,各个图像块的检测结果包括图像块中是否存在目标物,进一步还包括目标物在图像块中的位置,得到各个图像块的检测结果的一种方式是:通过预设模型的调用,获得预设模型输出的各个图像块的检测结果,预设模型是基于已有图像块以及已有图像块的标注数据进行训练得到,已有图像块的标注数据用于指示已有图像块是否有目标物,例如将各个图像块作为预设模型的输入,获得预设模型输出的各个图像块的检测结果。对于其他得到各个图像块的检测结果本实施例不再阐述。
在具体实现本实施例之前,获取已有的训练图像数据,按照前述任一预设分割规则,将训练图像分割成多个已有图像块,并对每个已有图像块进行标注。将标注后的已有图像块作为神经网络模型的训练数据,训练该神经网络模型直至收敛,得到本实施例中的预设模型。
需要说明的是,对已有图像的标注包括但不仅限于:仅标注已有图像块的类型,即标注已有图像块中是否存在目标物。或者,标注已有图像块的类型和目标物的位置,即标注已有图像块中是否存在目标物,当存在目标物时标注目标物在该图像块中的位置。具体的标注方式由技术人员根据实际需要进行选择,在此不再具体限定。相对应的若仅标注已有图像块中是否存在目标物,则预设模型输出的检测结果用于表示输入到预设模型的图像块中是否存在目标物,若标注已有图像块中是否存在目标物和标注目标物在已有图像块中的位置,则预设模型输出的检测结果用于表示输入到预设模型的图像块中是否存在目标物以及存在目标物时目标物在图像块中的位置,即预设模型输出的检测结果包括两部分:一部分是是否存在目标物;另一部分是目标物在图像块中的位置,如果不存在目标物,则该部分的内容为空。
进一步需要说明的是,步骤101中对待检测图像的分割处理,需与训练神经网络模型过程中对训练图像数据的分割处理方式一致。例如:在训练神经网络模型的过程中,将训练图像分割成多个已有图像块,每两幅相邻的已有图像块之间存在预设像素的重叠区域。则在步骤101中,将待检测图像分割成多个图像块,每两幅相邻的图像块之间存在预设像素的重叠区域。
在实际应用中,对于每一图像块,将该图像块作为预设模型的输入,预设模型输出该图像块的检测结果,直至获取所有图像块对应的检测结果。
103:基于各个图像块的检测结果,获得待检测图像的检测结果。例如整合各个图像块的检测结果得到待检测图像的检测结果。由前述内容可知,图像块的检测结果为:检测该图像块的类别(即是否存在目标物),或者,检测该图像块的类别和目标物的位置。因此,待检测图像的检测结果用于表示待检测图像中是否存在目标物,或者,表示待检测图像中是否存在目标物,当存在目标物时确定该目标物在待检测图像中的位置。
在本申请实施例中,通过将待检测图像分割成多个图像块的方式将目标物划分到至少一个图像块中,这样虽然目标物在待检测图像中所占比例很小或者目标物的绝对尺寸很小,但是目标物相对于图像块来说目标物所占比例增大或目标物相对于图像块的绝对尺寸变化,从而在检测的过程中不会因为目标物在图像中所占的比例很小或者目标物的绝对尺寸很小而导致将目标物错判为图像噪声,进而通过整合每个图像块对应的检测结果的方式来获得待检测图像的检测结果,以识别出待检测图像中的目标物,从而能够准确识别出待检测图像中的目标物,提高检测准确度。
上述本申请实施例图1步骤103中涉及获得检测图像的检测结果的过程,请参阅图4,其示出了本申请实施例提供的获得检测图像的检测结果的流程图,可以包括以下步骤:
401:如果至少一个图像块的检测结果表明图像块中存在目标物,获得表明存在目标物的检测结果对应的图像块中目标物的坐标。
在实际应用中,利用预设模型确定图像块中是否存在目标物,若存在,该预设模型还会输出目标物在图像块中的坐标。例如:利用预设模型确定一图像块中坐标(30,40)的位置存在大小为12*12像素的目标物。
402:基于各个表明存在目标物的检测结果对应的图像块中目标物的坐标,获得待检测图像中目标物的坐标。
由前述内容可知,预先将待检测图像分割成多个图像块,根据待检测图像的大小、分割的图像块数量以及预设分割方式可确定每个图像块在待检测图像中的位置,进而在获得各个表明存在目标物的检测结果对应的图像块在待检测图像中的位置后,可以基于图像块在待检测图像中的位置以及各个表明存在目标物的检测结果对应的图像块中目标物的坐标,获得待检测图像中目标物的坐标。
为更好解释说明如何计算目标物在待检测图像中的坐标,结合图5a示出的待检测图像的均匀分割示意图进行举例说明。
假设待检测图像的大小为H*W像素,将该待检测图像均分为8个大小为h*w像素的图像块,每两个相邻图像块的行重叠度为m1,列重叠度为m2,m1大于等于0小于等于h,m2大于等于0小于等于w。
对于该待检测图像中第i行第j列的图像块中,存在大小为a*b像素的目标物,该目标物在该图像块中的坐标为(x,y),则该目标物在待检测图像中的坐标(X,Y)如公式(4)和公式(5)。
X=(j-1)*(w-m2)+x (4)
Y=(i-2)*(h-m1)+y (5)
例如:假设将待检测图像均分为多个图像块,每两个相邻图像块之间存在10个像素的重叠区域。确定一图像块中坐标(30,40)的位置存在大小为12*12个像素的目标物,确定该图像块存在于待检测图像的第2行第2列。结合上述公式(4)和公式(5),确定该目标物在待检测图像中的坐标为(220,230),大小为12*12个像素。
需要说明的是,在图5a中,对于目标物在待检测图像和图像块中的坐标X和Y的设置仅适用于举例说明,目标物在待检测图像和图像块中坐标X和Y的具体设置由技术人员根据实际情况进行设置,在本申请实施例中不做具体限定。
需要说明的是,上述公式(4)和公式(5)针对的将待检测图像均匀划分为多个图像块的情况,对于将待检测图像不均匀划分为多个图像块的情况,结合图5b示出的待检测图像不均匀分割示意图进行举例说明。
在图5b中,假设将待检测图像不均匀划分为8个图像块,8个图像块的宽度为w1、w2…w8,相邻两个图像的横向重叠宽度为m1、m2…m6。第i行第j列的图像块存在大小为a*b像素的目标物,该目标物在该图像块中的坐标为(x,y),则该目标物在待检测图像中的X坐标如公式(6)。
X=(w1-m1)+(w2-m2)+…+(wi-1-mi-1)+x (6)
需要说明的是,该目标物在待检测图像中的Y坐标的计算原理可参见公式(6),在此不再赘述。
从上述图5a和图5b可知,在图像块中存在目标物的情况下,根据图像块在待检测图像中的位置和目标物在图像块中的坐标,可以确定目标物在待检测图像中的坐标,提高确定待检测图像中目标物的具体位置的准确度。
但是在实际应用中除图5a和图5b所示仅一个图像块中存在目标物的情况之外,还存在两个及两个以上图像块中存在目标物的情况,针对这种情况上述本申请实施例图4中涉及的获得检测图像中目标物的坐标的过程可参阅图6,其示出了本申请实施例提供的获得检测图像中目标物的坐标的流程图,可以包括以下步骤:
601:基于至少两个图像块中每个图像块在所有图像块中的位置以及表明存在目标物的检测结果对应的图像块中目标物的坐标,获得至少两个图像块对应的目标物在待检测图像中的坐标。
在实际应用中,由图1步骤101中示出的内容可知,目标物在待检测图像的位置存在4种情况,对于目标物同时存在于两个以上图像块的情况,分别获取该目标物在各个图像块中的坐标,再根据该目标物在每个图像块中的坐标,计算该目标物在待检测图像中的多个坐标。
例如:假设目标物同时存在待检测图像中的第i个图像块和第i+1个图像块中。根据该目标物在第i个图像块中的坐标(xi,yi),计算该目标物在待检测图像中的坐标(Xi,Yi),根据该目标物在第i+1个图像块中的坐标(xi+1,yi+1),计算该目标物在待检测图像中的坐标(Xi+1,Yi+1)。
需要说明的是,根据目标物在待检测图像中的多个坐标确定最终坐标的方式包括但不仅限于:将该目标物对于的中心点坐标作为目标物在待检测图像中的最终坐标,或者,将该目标物的最小外接矩形的四个角的坐标点作为目标物在待检测图像中的最终坐标。即目标物在待检测图像中的坐标可以是一个点,也可以是多个点,在本申请实施例中不做具体限定。
602:对至少两个图像块对应的目标物在待检测图像中的坐标进行融合,得到待检测图像中目标物的坐标。
由上述本申请实施例图1步骤101示出的内容可知,采用上述分割规则中的方式二对待检测图像进行分割,该目标物可能会完整出现在两个相邻图像块中。当目标物完整出现在两个以上的相邻图像块中时,根据该目标物在每个图像块中的坐标,计算该目标物在待检测图像中的多个坐标是一致的,若不一致,可对该目标物在待检测图像中的多个坐标取均值作为最终的坐标。
相应的,若目标物并不都完整存在多个图像块中,对于每一个图像块,根据目标物在该图像块中的坐标,计算该目标物在待检测图像中的一组顶点坐标,每一组顶点坐标包含该目标物的多个顶点坐标。根据目标物在待检测图像中的多组顶点坐标,最终确定目标物在待检测图像中的最终顶点坐标。
例如:假设目标物为矩形,且不完整存在于第i个图像块和第i+1个图像块中,目标物分为两个不相等的小矩形分别存在于第i个图像块和第i+1个图像块中。根据目标物在第i个图像块中的小矩形的坐标,计算该小矩形在待检测图像中的一组顶点坐标:(X1,Y1)、(X2,Y2)、(X3,Y3)和(X4,Y4)。根据目标物在第i+1个图像块中的小矩形的坐标,计算该小矩形在待检测图像中的一组顶点坐标:(X5,Y5)、(X6,Y6)、(X6,Y6)和(X6,Y6)。根据以上两组顶点坐标,确定目标物在待检测图像中的顶点坐标为:
[min(X),min(Y)]、[max(X),min(Y)]、[max(X),max(Y)]和[min(X),max(Y)]。
需要说明的是,上述涉及的计算目标物在待检测图像中的坐标仅适用于举例说明,在本申请实施例中,对于目标物在待检测图像中的坐标的计算方式不做具体限定。
在本申请实施例中,根据目标物在每个图像块中的坐标,计算得到目标物在待检测图像中的多个坐标,再对目标物在待检测图像中的多个坐标进行融合,最终确定待检测图像中目标物的坐标,提高确定待检测图像中目标物的具体位置的准确度。
对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
与上述方法实施例相对应,本申请实施例公开一种图像中目标物的检测装置,用于提高检测图像中目标物的准确度,其中图像中目标物的检测装置的结构如图7所示,可以包括:分割单元701、检测单元702和获取单元703。
分割单元701,用于对待检测图像进行分割,得到待检测图像对应的各个图像块。
在本实施例中,采用预设的分割规则对待检测图像进行分割,具体分割方式的介绍请参阅上述方法实施例中的说明,对此本实施例不再赘述。
检测单元702,用于对各个图像块进行检测,得到各个图像块的检测结果。
在本实施例中,检测单元702具体用于:通过预设模型的调用,获得预设模型输出的各个图像块的检测结果,预设模型是基于已有图像块以及已有图像块的标注数据进行训练得到,已有图像块的标注数据用于指示已有图像块是否有目标物。获取每个图像块对应的检测结果的介绍请参阅上述方法实施例中的说明,对此本实施例不再赘述。
获取单元703,用于基于各个图像块的检测结果,获得待检测图像的检测结果,待检测图像的检测结果用于表示待检测图像中是否存在目标物。
在本申请实施例中,通过将待检测图像分割成多个图像块的方式将目标物划分到至少一个图像块中,这样虽然目标物在待检测图像中所占比例很小或者目标物的绝对尺寸很小,但是目标物相对于图像块来说目标物所占比例增大或目标物相对于图像块的绝对尺寸变化,从而在检测的过程中不会因为目标物在图像中所占的比例很小或者目标物的绝对尺寸很小而导致将目标物错判为图像噪声,进而通过整合每个图像块对应的检测结果的方式来获得待检测图像的检测结果,以识别出待检测图像中的目标物,从而能够准确识别出待检测图像中的目标物,提高检测准确度。
在本实施例中,上述获取单元703获得待检测图像的检测的方式为:获取目标物在待检测图像中的坐标,相对应的获取单元703的结构如图8所示,其中图8示出了本申请实施例公开的一种图像中目标物的检测装置的结构示意图,在图8中获取单元703包括:第一获取模块7031和第二获取模块7032。
第一获取模块7031,用于如果至少一个图像块的检测结果表明图像块中存在目标物,获得表明存在目标物的检测结果对应的图像块中目标物的坐标。
在实际应用中,利用预设模型确定图像块中是否存在目标物,若存在,该预设模型会输出目标物在图像块中的坐标。具体介绍请参阅上述方法实施例中的说明,对此本实施例不再赘述。
第二获取模块7032,用于基于各个表明存在目标物的检测结果对应的图像块中目标物的坐标,获得待检测图像中目标物的坐标,待检测图像中目标物的坐标为所述待检测图像的检测结果。
在本申请实施例中,利用预设模型确定图像块是否存在目标物,若存在,获取目标物在图像块中的坐标。根据图像块在待检测图像中的位置和目标物在图像块中的坐标,确定目标物在待检测图像中的坐标,提高确定待检测图像中目标物的具体位置的准确度。
在本实施例中,第二获取模块7032获取待检测图像中目标物的坐标的方式为:根据目标物在各个图像块中的坐标,获得待检测图像中目标物的坐标,相应的第二获取模块7032包括:第一获取子模块和第二子模块。
第一获取子模块,用于获得各个表明存在目标物的检测结果对应的图像块在待检测图像中的位置。
第二获取子模块,用于基于图像块在所述待检测图像中的位置以及各个表明存在目标物的检测结果对应的图像块中目标物的坐标,获得待检测图像中目标物的坐标。
在具体实现中,第二获取子模块具体用于:如果表明存在目标物的检测结果对应的图像块为至少两个图像块,基于至少两个图像块中每个图像块在所有图像块中的位置以及表明存在目标物的检测结果对应的图像块中目标物的坐标,获得至少两个图像块对应的目标物在待检测图像中的坐标,对至少两个图像块对应的目标物在待检测图像中的坐标进行融合,得到待检测图像中目标物的坐标。具体介绍请参阅上述方法实施例中的说明,对此本实施例不再赘述。
在本申请实施例中,根据目标物在每个图像块中的坐标,计算得到目标物在待检测图像中的多个坐标,再对目标物在待检测图像中的多个坐标进行融合,最终确定待检测图像中目标物的坐标,提高确定待检测图像中目标物的具体位置的准确度。
本申请实施例还公开一种存储介质,存储介质上存储有计算机程序代码,计算机程序代码执行时实现上述图像中目标物的检测方法。
此外,本申请实施例还公开一种电子设备,包括处理器和存储器。
处理器,用于对待检测图像进行分割,得到待检测图像对应的各个图像块,对各个图像块进行检测,得到各个图像块的检测结果,基于各个图像块的检测结果,获得待检测图像的检测结果,待检测图像的检测结果用于表示待检测图像中是否存在目标物。
所述存储器,用于存储所述待检测图像的检测结果。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
对所公开的实施例的上述说明,使本领域技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。

Claims (10)

1.一种图像中目标物的检测方法,其特征在于,所述方法包括:
对待检测图像进行分割,得到所述待检测图像对应的各个图像块;
对所述各个图像块进行检测,得到所述各个图像块的检测结果;
基于所述各个图像块的检测结果,获得所述待检测图像的检测结果,所述待检测图像的检测结果用于表示待检测图像中是否存在目标物。
2.根据权利要求1所述的方法,其特征在于,所述对所述各个图像块进行检测,得到所述各个图像块的检测结果包括:
通过预设模型的调用,获得所述预设模型输出的各个图像块的检测结果,所述预设模型是基于已有图像块以及已有图像块的标注数据进行训练得到,所述已有图像块的标注数据用于指示已有图像块是否有目标物。
3.根据权利要求1所述的方法,其特征在于,所述基于所述各个图像块的检测结果,获得所述待检测图像的检测结果包括:
如果至少一个图像块的检测结果表明所述图像块中存在目标物,获得表明存在目标物的检测结果对应的图像块中目标物的坐标;
基于各个表明存在目标物的检测结果对应的图像块中目标物的坐标,获得所述待检测图像中目标物的坐标,所述待检测图像中目标物的坐标为所述待检测图像的检测结果。
4.根据权利要求3所述的方法,其特征在于,所述基于各个表明存在目标物的检测结果对应的图像块中目标物的坐标,获得所述待检测图像中目标物的坐标包括:
获得各个表明存在目标物的检测结果对应的图像块在所述待检测图像中的位置;
基于所述图像块在所述待检测图像中的位置以及各个表明存在目标物的检测结果对应的图像块中目标物的坐标,获得所述待检测图像中目标物的坐标。
5.根据权利要求4所述的方法,其特征在于,所述基于所述图像块在所述待检测图像中的位置以及各个表明存在目标物的检测结果对应的图像块中目标物的坐标,获得所述待检测图像中目标物的坐标包括:
如果表明存在目标物的检测结果对应的图像块为至少两个图像块,基于所述至少两个图像块中每个图像块在所有图像块中的位置以及表明存在目标物的检测结果对应的图像块中目标物的坐标,获得所述至少两个图像块对应的目标物在待检测图像中的坐标;
对所述至少两个图像块对应的目标物在待检测图像中的坐标进行融合,得到所述待检测图像中目标物的坐标。
6.一种图像中目标物的检测装置,其特征在于,所述装置包括:
分割单元,用于对待检测图像进行分割,得到所述待检测图像对应的各个图像块;
检测单元,用于对所述各个图像块进行检测,得到所述各个图像块的检测结果;
获取单元,用于基于所述各个图像块的检测结果,获得所述待检测图像的检测结果,所述待检测图像的检测结果用于表示待检测图像中是否存在目标物。
7.根据权利要求6所述的装置,其特征在于,所述检测单元具体用于:通过预设模型的调用,获得所述预设模型输出的各个图像块的检测结果,所述预设模型是基于已有图像块以及已有图像块的标注数据进行训练得到,所述已有图像块的标注数据用于指示已有图像块是否有目标物。
8.根据权利要求6所述的装置,其特征在于,所述获取单元包括:
第一获取模块,用于如果至少一个图像块的检测结果表明所述图像块中存在目标物,获得表明存在目标物的检测结果对应的图像块中目标物的坐标;
第二获取模块,用于基于各个表明存在目标物的检测结果对应的图像块中目标物的坐标,获得所述待检测图像中目标物的坐标,所述待检测图像中目标物的坐标为所述待检测图像的检测结果。
9.一种电子设备,包括处理器和存储器;
所述处理器,用于对待检测图像进行分割,得到所述待检测图像对应的各个图像块,对所述各个图像块进行检测,得到所述各个图像块的检测结果,基于所述各个图像块的检测结果,获得所述待检测图像的检测结果,所述待检测图像的检测结果用于表示待检测图像中是否存在目标物;
所述存储器,用于存储所述待检测图像的检测结果。
10.一种存储介质,其特征在于,所述存储介质上存储有程序代码,所述程序代码用于实现如权利要求1至5任意一项所述的图像中目标物的检测方法。
CN201910778132.XA 2019-08-22 2019-08-22 一种图像中目标物的检测方法及装置 Pending CN110473216A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910778132.XA CN110473216A (zh) 2019-08-22 2019-08-22 一种图像中目标物的检测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910778132.XA CN110473216A (zh) 2019-08-22 2019-08-22 一种图像中目标物的检测方法及装置

Publications (1)

Publication Number Publication Date
CN110473216A true CN110473216A (zh) 2019-11-19

Family

ID=68513354

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910778132.XA Pending CN110473216A (zh) 2019-08-22 2019-08-22 一种图像中目标物的检测方法及装置

Country Status (1)

Country Link
CN (1) CN110473216A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111539910A (zh) * 2020-03-13 2020-08-14 石家庄铁道大学 锈蚀区域检测方法及终端设备
CN111680750A (zh) * 2020-06-09 2020-09-18 创新奇智(合肥)科技有限公司 图像识别方法、装置和设备
CN111951328A (zh) * 2020-08-05 2020-11-17 清华大学苏州汽车研究院(吴江) 一种物体位置检测方法、装置、设备和存储介质
CN114444621A (zh) * 2022-04-11 2022-05-06 北京航空航天大学杭州创新研究院 一种基于模板匹配的棋类局面转化方法、装置及存储介质
CN114745327A (zh) * 2022-06-10 2022-07-12 鹏城实验室 业务数据转发方法、装置、设备及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109409288A (zh) * 2018-10-25 2019-03-01 北京市商汤科技开发有限公司 图像处理方法、装置、电子设备和存储介质
CN110135307A (zh) * 2019-04-30 2019-08-16 北京邮电大学 基于注意力机制的交通标志检测方法和装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109409288A (zh) * 2018-10-25 2019-03-01 北京市商汤科技开发有限公司 图像处理方法、装置、电子设备和存储介质
CN110135307A (zh) * 2019-04-30 2019-08-16 北京邮电大学 基于注意力机制的交通标志检测方法和装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
ADAM VAN ETTEN: ""You Only Look Twice:Rapid Multi-Scale Object Detection In Satellite Imagery"", 《ARXIV:1805.09512V1[CS.CV]》 *
JINHEE PARK ETC.: ""Small object segmentation with fully convolutional network based on overlapping domain decomposition"", 《MACHINE VISION AND APPLICATIONS》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111539910A (zh) * 2020-03-13 2020-08-14 石家庄铁道大学 锈蚀区域检测方法及终端设备
CN111539910B (zh) * 2020-03-13 2024-03-19 石家庄铁道大学 锈蚀区域检测方法及终端设备
CN111680750A (zh) * 2020-06-09 2020-09-18 创新奇智(合肥)科技有限公司 图像识别方法、装置和设备
CN111951328A (zh) * 2020-08-05 2020-11-17 清华大学苏州汽车研究院(吴江) 一种物体位置检测方法、装置、设备和存储介质
CN114444621A (zh) * 2022-04-11 2022-05-06 北京航空航天大学杭州创新研究院 一种基于模板匹配的棋类局面转化方法、装置及存储介质
CN114745327A (zh) * 2022-06-10 2022-07-12 鹏城实验室 业务数据转发方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
CN110473216A (zh) 一种图像中目标物的检测方法及装置
CN108898047B (zh) 基于分块遮挡感知的行人检测方法及系统
CN108009543A (zh) 一种车牌识别方法及装置
JP2019075122A (ja) プーリングタイプに対する情報を含むテーブルを作成するための方法、装置及びこれを利用したテスティング方法、テスティング装置
CN108074237B (zh) 图像清晰度检测方法、装置、存储介质及电子设备
US20090245638A1 (en) Method And Apparatus For Region-Based Segmentation Image Processing Using Region Mapping
JP2016115331A (ja) 識別器生成装置、識別器生成方法、良否判定装置、良否判定方法、プログラム
US10861187B2 (en) Method of processing object detection data
KR20090101356A (ko) 결함 검출 장치 및 결함 검출 방법
CN110992325A (zh) 基于深度学习的目标清点方法、装置和设备
CN110232387A (zh) 一种基于kaze-hog算法的异源图像匹配方法
CN108875504A (zh) 基于神经网络的图像检测方法和图像检测装置
CN111553914A (zh) 基于视觉的货物检测方法、装置、终端及可读存储介质
CN112308828A (zh) 一种密封设备气密性的人工智能检测方法和检测系统
JP3350822B2 (ja) 画像上のエッジ検出方法
KR20230127933A (ko) 결함 감지 방법 및 시스템
JP2019149119A (ja) 画像処理装置、画像処理方法及びプログラム
CN114674826A (zh) 基于布匹的视觉检测方法及检测系统
CN112036404B (zh) 一种海上船只目标检测方法及系统
US20080267506A1 (en) Interest point detection
WO2022188102A1 (zh) 深度图像的修复方法及装置、摄像头组件及电子设备
CN110349133A (zh) 物体表面缺陷检测方法、装置
CN112215240B (zh) 一种提高2d复杂边缘检测精度的优化方法
CN112598738B (zh) 一种基于深度学习的人物定位方法
CN110189319B (zh) 置物架分割方法、装置、设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20191119

RJ01 Rejection of invention patent application after publication