CN112257586B - 目标检测中的真值框选择方法、装置、存储介质及设备 - Google Patents

目标检测中的真值框选择方法、装置、存储介质及设备 Download PDF

Info

Publication number
CN112257586B
CN112257586B CN202011135858.0A CN202011135858A CN112257586B CN 112257586 B CN112257586 B CN 112257586B CN 202011135858 A CN202011135858 A CN 202011135858A CN 112257586 B CN112257586 B CN 112257586B
Authority
CN
China
Prior art keywords
result
preset point
detection
preset
detection frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011135858.0A
Other languages
English (en)
Other versions
CN112257586A (zh
Inventor
王堃
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuxi Yuspace Intelligent Technology Co ltd
Original Assignee
Wuxi Yuspace Intelligent Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuxi Yuspace Intelligent Technology Co ltd filed Critical Wuxi Yuspace Intelligent Technology Co ltd
Priority to CN202011135858.0A priority Critical patent/CN112257586B/zh
Publication of CN112257586A publication Critical patent/CN112257586A/zh
Application granted granted Critical
Publication of CN112257586B publication Critical patent/CN112257586B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Abstract

本申请实施例公开了一种目标检测中的真值框选择方法、装置、存储介质及设备,属于图像处理技术领域。所述方法包括:获取对图像进行特征提取后得到的目标特征图,目标特征图中包含多个预定大小的网格;在目标特征图中获取图像中的每个小目标对象对应的多个检测框;对于每个检测框,计算预定点位于检测框内的网格的中心度得分,预定点为网格的角点和/或中心点;对于每个小目标对象,从小目标对象对应的多个检测框中,将最大的中心度得分对应的检测框确定为小目标对象的真值框。本申请实施例可以提高真值框选择的准确性。

Description

目标检测中的真值框选择方法、装置、存储介质及设备
技术领域
本申请实施例涉及图像处理技术领域,特别涉及一种目标检测中的真值框选择方法、装置、存储介质及设备。
背景技术
FCOS(Fully Convolutional One-Stage Object Detection,一阶全卷积目标检测)算法实现了无锚点(anchor-free)的目标检测。在利用FCOS算法检测图像中的目标对象时,可以将图像划分成S×S的网格,预测包含目标对象的多个检测框,根据检测框和网格之间的位置关系从检测框中选择真值框,将真值框作为正样本进行保留,将其他检测框作为负样本进行丢弃,从而识别出目标对象。
在利用FCOS算法检测小目标对象时,如图1所示,检测框1中包含待回归的小目标对象,A、B、C、D这四个点分别为该小目标对象所在四个网格的中心点,且A、B、C、D这四个点中没有一个点落入检测框1中,那么,检测框1被定义为负样本。如图2所示,检测框2中包含待回归的小目标对象,虽然检测框2在九个网格中,但是,只有一个网格的中心点落入检测框2中,使得用于回归的网格中心点较少。
如图1和2中所示,即使检测框中包含小目标对象,可能会由于网格中心点未落在检测框中,或者,落在检测框中的网格中心点较少,从而影响了真值框选择的准确性。
发明内容
本申请实施例提供了一种目标检测中的真值框选择方法、装置、存储介质及设备,用于解决利用FCOS算法检测小目标对象时,由于网格中心点未落在检测框中,或者,落在检测框中的网格中心点较少,从而影响了真值框选择的准确性的问题。所述技术方案如下:
一方面,提供了一种目标检测中的真值框选择方法,所述方法包括:
获取对图像进行特征提取后得到的目标特征图,所述目标特征图中包含多个预定大小的网格;
在所述目标特征图中获取所述图像中的每个小目标对象对应的多个检测框,所述小目标对象是像素面积小于预定面积的目标对象;
对于每个检测框,计算预定点位于所述检测框内的网格的中心度得分,所述预定点为所述网格的角点和/或中心点;
对于每个小目标对象,从所述小目标对象对应的多个检测框中,将最大的中心度得分对应的检测框确定为所述小目标对象的真值框。
在一种可能的实现方式中,所述对于每个检测框,计算预定点位于所述检测框内的网格的中心度得分,包括:
对于每个检测框,获取位于所述检测框内的每个预定点的坐标信息;
对每个预定点的坐标信息进行回归运算,得到每个预定点的回归结果;
对每个预定点的回归结果进行中心度运算,得到每个预定点的中心度得分;
将所有预定点的中心度得分相加,得到所述检测框对应的中心度得分。
在一种可能的实现方式中,所述对每个预定点的坐标信息进行回归运算,得到每个预定点的回归结果,包括:
对于每个预定点,根据所述预定点的坐标信息,计算所述预定点到所述检测框的左边框的第一距离,计算所述预定点到所述检测框的上边框的第二距离,计算所述预定点到所述检测框的有边框的第三距离,计算所述预定点到所述检测框的下边框的第四距离;
将所述预定点的横坐标减去所述第一距离,得到第一结果;
将所述预定点的纵坐标减去所述第二距离,得到第二结果;
将所述预定点的横坐标加上所述第三距离,得到第三结果;
将所述预定点的纵坐标加上所述第四距离,得到第四结果;
将所述第一结果、所述第二结果、所述第三结果和所述第四结果确定为所述预定点的回归结果。
在一种可能的实现方式中,所述对每个预定点的回归结果进行中心度运算,得到每个预定点的中心度得分,包括:
对于每个预定点,将第一数值除以第二数值,得到第一比值,所述第一数值是所述预定点对应的所述第一结果和所述第三结果中的最小值,所述第二数值是所述第一结果和所述第三结果中的最大值;
将第三数值除以第四数值,得到第二比值,所述第三数值是所述预定点对应的所述第二结果和所述第四结果中的最小值,所述第四数值是所述第二结果和所述第四结果中的最大值;
对所述第一比值和所述第二比值的乘积进行开方运算,得到所述预定点的中心度得分。
在一种可能的实现方式中,所述获取位于所述检测框内的每个预定点的坐标信息,包括:
以所述检测框的中心为原点创建坐标系;
计算位于所述检测框内的每个预定点在所述坐标系中的坐标信息。
在一种可能的实现方式中,所述获取对图像进行特征提取后得到的目标特征图,包括:
对所述图像进行特征提取,得到多个特征图;
从所述多个特征图中选择用于检测所述小目标对象的目标特征图。
在一种可能的实现方式中,所述从所述多个特征图中选择用于检测所述小目标对象的目标特征图,包括:
利用特征金字塔网络FPN对所述多个特征图进行运算,得到多个预测层;
将所述多个预测层中的最顶层预测层确定为用于检测所述小目标对象的目标特征图。
一方面,提供了一种目标检测中的真值框选择装置,所述装置包括:
第一获取模块,用于获取对图像进行特征提取后得到的目标特征图,所述目标特征图中包含多个预定大小的网格;
第二获取模块,用于在所述目标特征图中获取所述图像中的每个小目标对象对应的多个检测框,所述小目标对象是像素面积小于预定面积的目标对象;
计算模块,用于对于每个检测框,计算预定点位于所述检测框内的网格的中心度得分,所述预定点为所述网格的角点和/或中心点;
确定模块,用于对于每个小目标对象,从所述小目标对象对应的多个检测框中,将最大的中心度得分对应的检测框确定为所述小目标对象的真值框。
一方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如上所述的目标检测中的真值框选择方法。
一方面,提供了一种电子设备,所述电子设备包括处理器和存储器,所述存储器中存储有至少一条指令,所述指令由所述处理器加载并执行以实现如上所述的目标检测中的真值框选择方法。
本申请实施例提供的技术方案的有益效果至少包括:
通过计算预定点位于检测框内的网格的中心度得分,该预定点为网格的角点和/或中心点,对于每个小目标对象,从小目标对象对应的多个检测框中,将最大的中心度得分对应的检测框确定为小目标对象的真值框。这样,可以根据网格中角点和/或中心点的中心度得分来选择真值框,而不是根据网格中角点和/或中心点的数量来选择真值框,可以避免目标对象较小时,中心点未落在检测框中或落在检测框中的中心点较少,将该检测框误认为是负样本而进行丢弃的问题,从而提高了真值框选择的准确性。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据相关技术示出的第一种特征图中网格和检测框的位置关系示意图;
图2是根据相关技术示出的第二种特征图中网格和检测框的位置关系示意图;
图3是本申请一个实施例提供的目标检测中的真值框选择方法的方法流程图;
图4是本申请额实施例提供的FCOS算法的结构示意图;
图5是本申请额实施例提供的中心度算法的示意图;
图6是本申请一个实施例提供的目标检测中的真值框选择装置的结构框图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
请参考图3,其示出了本申请一个实施例提供的目标检测中的真值框选择方法的方法流程图,该目标检测中的真值框选择方法可以应用于电子设备中。该目标检测中的真值框选择方法,可以包括:
步骤301,获取对图像进行特征提取后得到的目标特征图,该目标特征图中包含多个预定大小的网格。
本实施例中的图像中包含至少一个小目标对象。其中,小目标对象是像素面积小于预定面积的目标对象,该预定面积是预先设置的面积,本实施例不对预定面积的大小作限定。在一个可选的实例中,预定面积可以是32*32的像素面积。
在电子设备获取到图像后,可以对图像进行提取来得到目标特征图。在一种实现方式中,获取对图像进行特征提取后得到的目标特征图,可以包括:对图像进行特征提取,得到多个特征图;从多个特征图中选择用于检测小目标对象的目标特征图。
如图4所示,电子设备可以对图像进行特征提取后,得到特征图C3、C4和C5。以图像是800*1024维为例,则特征图C3是100*128维,C4是50*64维,C5是25*32维。
在得到多个特征图后,可以根据多个特征图得到目标特征图。在一种实现方式中,从多个特征图中选择用于检测小目标对象的目标特征图,可以包括:利用FPN(FeaturePyramid Networks,特征金字塔网络)对多个特征图进行运算,得到多个预测层;将多个预测层中的最顶层预测层确定为用于检测小目标对象的目标特征图。
如图4所示,电子设备可以对C3进行1*1卷积运算,得到预测层P3,且P3是100*128维;对C4进行1*1卷积运算,得到预测层P4,且P4是50*64维;对C5进行1*1卷积运算,得到预测层P5,且P5是50*64维。电子设备还可以对P5进行下采样,得到预测层P6和P7,且P6是13*16维,P7是7*8维。最终,电子设备可以得到五个不同维度的预测层P3-P7,且这五个预测层分别是输入的图像的尺寸的1/8、1/16、1/32、1/64、和1/128。
为了增强目标对象重叠时的检测召回率,电子设备可以在不同维度的预测层上进行不同尺寸的目标对象的回归。比如,较大的目标对象在最底层预测层上做回归,较小的目标对象在最顶层预测层上做回归。本实施例中需要检测小目标对象,所以,电子设备可以在最顶层预测层P7上做回归,即将最顶层预测层P7确定为目标特征图,并在P7上检测小目标对象。
步骤302,在目标特征图中获取图像中的每个小目标对象对应的多个检测框,该小目标对象是像素面积小于预定面积的目标对象。
在目标特征图上,电子设备可以针对每个小目标对象检测出多个不同尺度的检测框。即,每个小目标对象对应于多个检测框。
步骤303,对于每个检测框,计算预定点位于检测框内的网格的中心度得分,该预定点为网格的角点和/或中心点。
本实施例中,步骤303可以包括如下几个子步骤:
步骤3031,对于每个检测框,获取位于检测框内的每个预定点的坐标信息。
其中,获取位于检测框内的每个预定点的坐标信息,可以包括:以检测框的中心为原点创建坐标系;计算位于检测框内的每个预定点在坐标系中的坐标信息。
坐标系的原点为检测框的中心,横坐标与目标特征图的宽平行,纵坐标与目标特征图的高平行。
请参考图5,网格的左上角的角点A、左下角的角点B和中心点C都位于检测框内,假设计算得到的角点A的坐标信息为(x1,y1),角点B的坐标信息为(x2,y2),中心点C的坐标信息为(x,y)。
步骤3032,对每个预定点的坐标信息进行回归运算,得到每个预定点的回归结果。
其中,对每个预定点的坐标信息进行回归运算,得到每个预定点的回归结果,可以包括:对于每个预定点,根据预定点的坐标信息,计算预定点到检测框的左边框的第一距离,计算预定点到检测框的上边框的第二距离,计算预定点到检测框的有边框的第三距离,计算预定点到检测框的下边框的第四距离;将预定点的横坐标减去第一距离,得到第一结果;将预定点的纵坐标减去第二距离,得到第二结果;将预定点的横坐标加上第三距离,得到第三结果;将预定点的纵坐标加上第四距离,得到第四结果;将第一结果、第二结果、第三结果和第四结果确定为预定点的回归结果。
仍然以图5中的角点A、角点B和中心点C为例,则(l1,r1,t1,b1)为角点A到检测框的四个边框的距离,(l2,r2,t2,b2)为角点B到检测框的四个边框的距离,(l,r,t,b)为中心点C到检测框的四个边框的距离。
根据上述距离计算得到角点A的回归结果为角点B的回归结果为中心点C的回归结果为/>
步骤3033,对每个预定点的回归结果进行中心度运算,得到每个预定点的中心度得分。
其中,对每个预定点的回归结果进行中心度运算,得到每个预定点的中心度得分,可以包括:对于每个预定点,将第一数值除以第二数值,得到第一比值,第一数值是预定点对应的第一结果和第三结果中的最小值,第二数值是第一结果和第三结果中的最大值;将第三数值除以第四数值,得到第二比值,第三数值是预定点对应的第二结果和第四结果中的最小值,第四数值是第二结果和第四结果中的最大值;对第一比值和第二比值的乘积进行开方运算,得到预定点的中心度得分。
以图5中的角点A为例,则中心点C的中心度得分同理,角点A的中心度得分/>角点B的中心度得分
步骤3034,将所有预定点的中心度得分相加,得到检测框对应的中心度得分。
仍然以图5中的角点A、角点B和中心点C为例,则检测框对应的中心度得分为D+D1+D2
步骤304,对于每个小目标对象,从小目标对象对应的多个检测框中,将最大的中心度得分对应的检测框确定为小目标对象的真值框。
由于每个小目标对象对应于多个检测框,所以,对于每个小目标对象,电子设备可以分别计算该小目标对象对应的每个检测框的中心度得分,并从所有的中心度得分中选择分值最大的中心度得分,将该最大的中心度得分对应的检测框确定为该小目标对象的真值框,这样,电子设备可以为每个小目标对象选择一个真值框。
综上所述,本申请实施例提供的目标检测中的真值框选择方法,通过计算预定点位于检测框内的网格的中心度得分,该预定点为网格的角点和/或中心点,对于每个小目标对象,从小目标对象对应的多个检测框中,将最大的中心度得分对应的检测框确定为小目标对象的真值框。这样,可以根据网格中角点和/或中心点的中心度得分来选择真值框,而不是根据网格中角点和/或中心点的数量来选择真值框,可以避免目标对象较小时,中心点未落在检测框中或落在检测框中的中心点较少,将该检测框误认为是负样本而进行丢弃的问题,从而提高了真值框选择的准确性。
请参考图6,其示出了本申请一个实施例提供的目标检测中的真值框选择装置的结构框图,该目标检测中的真值框选择装置可以应用于电子设备中。该目标检测中的真值框选择装置,可以包括:
第一获取模块610,用于获取对图像进行特征提取后得到的目标特征图,目标特征图中包含多个预定大小的网格;
第二获取模块620,用于在目标特征图中获取图像中的每个小目标对象对应的多个检测框,小目标对象是像素面积小于预定面积的目标对象;
计算模块630,用于对于每个检测框,计算预定点位于检测框内的网格的中心度得分,预定点为网格的角点和/或中心点;
确定模块640,用于对于每个小目标对象,从小目标对象对应的多个检测框中,将最大的中心度得分对应的检测框确定为小目标对象的真值框。
在一个可选的实施例中,计算模块630,还用于:
对于每个检测框,获取位于检测框内的每个预定点的坐标信息;
对每个预定点的坐标信息进行回归运算,得到每个预定点的回归结果;
对每个预定点的回归结果进行中心度运算,得到每个预定点的中心度得分;
将所有预定点的中心度得分相加,得到检测框对应的中心度得分。
在一个可选的实施例中,计算模块630,还用于:
对于每个预定点,根据预定点的坐标信息,计算预定点到检测框的左边框的第一距离,计算预定点到检测框的上边框的第二距离,计算预定点到检测框的有边框的第三距离,计算预定点到检测框的下边框的第四距离;
将预定点的横坐标减去第一距离,得到第一结果;
将预定点的纵坐标减去第二距离,得到第二结果;
将预定点的横坐标加上第三距离,得到第三结果;
将预定点的纵坐标加上第四距离,得到第四结果;
将第一结果、第二结果、第三结果和第四结果确定为预定点的回归结果。
在一个可选的实施例中,计算模块630,还用于:
对于每个预定点,将第一数值除以第二数值,得到第一比值,第一数值是预定点对应的第一结果和第三结果中的最小值,第二数值是第一结果和第三结果中的最大值;
将第三数值除以第四数值,得到第二比值,第三数值是预定点对应的第二结果和第四结果中的最小值,第四数值是第二结果和第四结果中的最大值;
对第一比值和第二比值的乘积进行开方运算,得到预定点的中心度得分。
在一个可选的实施例中,计算模块630,还用于:
以检测框的中心为原点创建坐标系;
计算位于检测框内的每个预定点在坐标系中的坐标信息。
在一个可选的实施例中,第一获取模块610,还用于:
对图像进行特征提取,得到多个特征图;
从多个特征图中选择用于检测小目标对象的目标特征图。
在一个可选的实施例中,第一获取模块610,还用于:
利用特征金字塔网络FPN对多个特征图进行运算,得到多个预测层;
将多个预测层中的最顶层预测层确定为用于检测小目标对象的目标特征图。
综上所述,本申请实施例提供的目标检测中的真值框选择装置,通过计算预定点位于检测框内的网格的中心度得分,该预定点为网格的角点和/或中心点,对于每个小目标对象,从小目标对象对应的多个检测框中,将最大的中心度得分对应的检测框确定为小目标对象的真值框。这样,可以根据网格中角点和/或中心点的中心度得分来选择真值框,而不是根据网格中角点和/或中心点的数量来选择真值框,可以避免目标对象较小时,中心点未落在检测框中或落在检测框中的中心点较少,将该检测框误认为是负样本而进行丢弃的问题,从而提高了真值框选择的准确性。
本申请一个实施例提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如上所述的目标检测中的真值框选择方法。
本申请一个实施例提供了一种电子设备,所述电子设备包括处理器和存储器,所述存储器中存储有至少一条指令,所述指令由所述处理器加载并执行以实现如上所述的目标检测中的真值框选择方法。
需要说明的是:上述实施例提供的目标检测中的真值框选择装置在进行目标检测中的真值框选择时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将目标检测中的真值框选择装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的目标检测中的真值框选择装置与目标检测中的真值框选择方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述并不用以限制本申请实施例,凡在本申请实施例的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请实施例的保护范围之内。

Claims (7)

1.一种目标检测中的真值框选择方法,其特征在于,所述方法包括:
获取对图像进行特征提取后得到的目标特征图,所述目标特征图中包含多个预定大小的网格;
在所述目标特征图中获取所述图像中的每个小目标对象对应的多个检测框,所述小目标对象是像素面积小于预定面积的目标对象;
对于每个检测框,计算预定点位于所述检测框内的网格的中心度得分,所述预定点为所述网格的角点和/或中心点;
对于每个小目标对象,从所述小目标对象对应的多个检测框中,将最大的中心度得分对应的检测框确定为所述小目标对象的真值框;
所述对于每个检测框,计算预定点位于所述检测框内的网格的中心度得分,包括:对于每个检测框,获取位于所述检测框内的每个预定点的坐标信息;对每个预定点的坐标信息进行回归运算,得到每个预定点的回归结果;对每个预定点的回归结果进行中心度运算,得到每个预定点的中心度得分;将所有预定点的中心度得分相加,得到所述检测框对应的中心度得分;
所述对每个预定点的坐标信息进行回归运算,得到每个预定点的回归结果,包括:对于每个预定点,根据所述预定点的坐标信息,计算所述预定点到所述检测框的左边框的第一距离,计算所述预定点到所述检测框的上边框的第二距离,计算所述预定点到所述检测框的有边框的第三距离,计算所述预定点到所述检测框的下边框的第四距离;将所述预定点的横坐标减去所述第一距离,得到第一结果;将所述预定点的纵坐标减去所述第二距离,得到第二结果;将所述预定点的横坐标加上所述第三距离,得到第三结果;将所述预定点的纵坐标加上所述第四距离,得到第四结果;将所述第一结果、所述第二结果、所述第三结果和所述第四结果确定为所述预定点的回归结果;
所述对每个预定点的回归结果进行中心度运算,得到每个预定点的中心度得分,包括:对于每个预定点,将第一数值除以第二数值,得到第一比值,所述第一数值是所述预定点对应的所述第一结果和所述第三结果中的最小值,所述第二数值是所述第一结果和所述第三结果中的最大值;将第三数值除以第四数值,得到第二比值,所述第三数值是所述预定点对应的所述第二结果和所述第四结果中的最小值,所述第四数值是所述第二结果和所述第四结果中的最大值;对所述第一比值和所述第二比值的乘积进行开方运算,得到所述预定点的中心度得分。
2.根据权利要求1所述的方法,其特征在于,所述获取位于所述检测框内的每个预定点的坐标信息,包括:
以所述检测框的中心为原点创建坐标系;
计算位于所述检测框内的每个预定点在所述坐标系中的坐标信息。
3.根据权利要求1或2项所述的方法,其特征在于,所述获取对图像进行特征提取后得到的目标特征图,包括:
对所述图像进行特征提取,得到多个特征图;
从所述多个特征图中选择用于检测所述小目标对象的目标特征图。
4.根据权利要求3所述的方法,其特征在于,所述从所述多个特征图中选择用于检测所述小目标对象的目标特征图,包括:
利用特征金字塔网络FPN对所述多个特征图进行运算,得到多个预测层;
将所述多个预测层中的最顶层预测层确定为用于检测所述小目标对象的目标特征图。
5.一种目标检测中的真值框选择装置,其特征在于,所述装置包括:
第一获取模块,用于获取对图像进行特征提取后得到的目标特征图,所述目标特征图中包含多个预定大小的网格;
第二获取模块,用于在所述目标特征图中获取所述图像中的每个小目标对象对应的多个检测框,所述小目标对象是像素面积小于预定面积的目标对象;
计算模块,用于对于每个检测框,计算预定点位于所述检测框内的网格的中心度得分,所述预定点为所述网格的角点和/或中心点;
确定模块,用于对于每个小目标对象,从所述小目标对象对应的多个检测框中,将最大的中心度得分对应的检测框确定为所述小目标对象的真值框;
所述计算模块,还用于:对于每个检测框,获取位于所述检测框内的每个预定点的坐标信息;对每个预定点的坐标信息进行回归运算,得到每个预定点的回归结果;对每个预定点的回归结果进行中心度运算,得到每个预定点的中心度得分;将所有预定点的中心度得分相加,得到所述检测框对应的中心度得分;
所述计算模块,还用于:对于每个预定点,根据所述预定点的坐标信息,计算所述预定点到所述检测框的左边框的第一距离,计算所述预定点到所述检测框的上边框的第二距离,计算所述预定点到所述检测框的有边框的第三距离,计算所述预定点到所述检测框的下边框的第四距离;将所述预定点的横坐标减去所述第一距离,得到第一结果;将所述预定点的纵坐标减去所述第二距离,得到第二结果;将所述预定点的横坐标加上所述第三距离,得到第三结果;将所述预定点的纵坐标加上所述第四距离,得到第四结果;将所述第一结果、所述第二结果、所述第三结果和所述第四结果确定为所述预定点的回归结果;
所述计算模块,还用于:对于每个预定点,将第一数值除以第二数值,得到第一比值,所述第一数值是所述预定点对应的所述第一结果和所述第三结果中的最小值,所述第二数值是所述第一结果和所述第三结果中的最大值;将第三数值除以第四数值,得到第二比值,所述第三数值是所述预定点对应的所述第二结果和所述第四结果中的最小值,所述第四数值是所述第二结果和所述第四结果中的最大值;对所述第一比值和所述第二比值的乘积进行开方运算,得到所述预定点的中心度得分。
6.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如权利要求1至4任一所述的目标检测中的真值框选择方法。
7.一种电子设备,其特征在于,所述电子设备包括处理器和存储器,所述存储器中存储有至少一条指令,所述指令由所述处理器加载并执行以实现如权利要求1至4任一所述的目标检测中的真值框选择方法。
CN202011135858.0A 2020-10-22 2020-10-22 目标检测中的真值框选择方法、装置、存储介质及设备 Active CN112257586B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011135858.0A CN112257586B (zh) 2020-10-22 2020-10-22 目标检测中的真值框选择方法、装置、存储介质及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011135858.0A CN112257586B (zh) 2020-10-22 2020-10-22 目标检测中的真值框选择方法、装置、存储介质及设备

Publications (2)

Publication Number Publication Date
CN112257586A CN112257586A (zh) 2021-01-22
CN112257586B true CN112257586B (zh) 2024-01-23

Family

ID=74263891

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011135858.0A Active CN112257586B (zh) 2020-10-22 2020-10-22 目标检测中的真值框选择方法、装置、存储介质及设备

Country Status (1)

Country Link
CN (1) CN112257586B (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106991422A (zh) * 2017-05-02 2017-07-28 北京京东金融科技控股有限公司 字符切割方法、装置及计算机可读存储介质和电子设备
CN110321891A (zh) * 2019-03-21 2019-10-11 长沙理工大学 一种联合深度神经网络与聚类算法的大输液药液异物目标检测方法
CN110363104A (zh) * 2019-06-24 2019-10-22 中国科学技术大学 一种柴油黑烟车的检测方法
US10509987B1 (en) * 2019-01-22 2019-12-17 StradVision, Inc. Learning method and learning device for object detector based on reconfigurable network for optimizing customers' requirements such as key performance index using target object estimating network and target object merging network, and testing method and testing device using the same
CN110796135A (zh) * 2019-09-20 2020-02-14 平安科技(深圳)有限公司 目标的定位方法及装置、计算机设备、计算机存储介质
CN111126287A (zh) * 2019-12-25 2020-05-08 武汉大学 一种遥感影像密集目标深度学习检测方法
CN111444809A (zh) * 2020-03-23 2020-07-24 华南理工大学 一种基于改进YOLOv3的输电线路异常目标检测方法
CN111738114A (zh) * 2020-06-10 2020-10-02 杭州电子科技大学 基于无锚点精确采样遥感图像车辆目标检测方法
WO2022169622A1 (en) * 2021-02-04 2022-08-11 Carnegie Mellon University Soft anchor point object detection

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106991422A (zh) * 2017-05-02 2017-07-28 北京京东金融科技控股有限公司 字符切割方法、装置及计算机可读存储介质和电子设备
US10509987B1 (en) * 2019-01-22 2019-12-17 StradVision, Inc. Learning method and learning device for object detector based on reconfigurable network for optimizing customers' requirements such as key performance index using target object estimating network and target object merging network, and testing method and testing device using the same
CN110321891A (zh) * 2019-03-21 2019-10-11 长沙理工大学 一种联合深度神经网络与聚类算法的大输液药液异物目标检测方法
CN110363104A (zh) * 2019-06-24 2019-10-22 中国科学技术大学 一种柴油黑烟车的检测方法
CN110796135A (zh) * 2019-09-20 2020-02-14 平安科技(深圳)有限公司 目标的定位方法及装置、计算机设备、计算机存储介质
CN111126287A (zh) * 2019-12-25 2020-05-08 武汉大学 一种遥感影像密集目标深度学习检测方法
CN111444809A (zh) * 2020-03-23 2020-07-24 华南理工大学 一种基于改进YOLOv3的输电线路异常目标检测方法
CN111738114A (zh) * 2020-06-10 2020-10-02 杭州电子科技大学 基于无锚点精确采样遥感图像车辆目标检测方法
WO2022169622A1 (en) * 2021-02-04 2022-08-11 Carnegie Mellon University Soft anchor point object detection

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"Automatic Plant Counting and Location Based on a Few-Shot Learning Technique";Azam Karami;《IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing》;第13卷;第5872-5886页 *
"基于卷积神经网络的遥感图像目标检测及变化检测";叶乾坤;《中国优秀硕士学位论文全文数据库 工程科技II辑》(2020年第06期);第C028-78页 *

Also Published As

Publication number Publication date
CN112257586A (zh) 2021-01-22

Similar Documents

Publication Publication Date Title
CN113421263B (zh) 零件缺陷检测方法、设备、介质及计算机程序产品
CN112767357A (zh) 一种基于Yolov4的混凝土结构病害检测方法
CN111091101B (zh) 基于一步法的高精度行人检测方法、系统、装置
CN114897779A (zh) 基于融合注意力的宫颈细胞学图像异常区域定位方法及装置
CN109829371B (zh) 一种人脸检测方法及装置
CN111444807B (zh) 目标检测方法、装置、电子设备和计算机可读介质
CN112800955A (zh) 基于加权双向特征金字塔的遥感影像旋转目标检测方法及系统
CN114140683A (zh) 一种航拍图像目标检测的方法、设备与介质
CN111027343A (zh) 条形码区域定位方法和装置
CN111814905A (zh) 目标检测方法、装置、计算机设备和存储介质
CN109671055B (zh) 肺结节检测方法及装置
WO2023116632A1 (zh) 基于时空记忆信息的视频实例分割方法和分割装置
CN114639102B (zh) 基于关键点与尺寸回归的细胞分割方法和装置
CN117474918B (zh) 异常检测方法和装置、电子设备以及存储介质
CN111242066A (zh) 大尺寸图像目标检测方法、装置及计算机可读存储介质
CN113918744A (zh) 相似图像检索方法、装置、存储介质及计算机程序产品
CN112257586B (zh) 目标检测中的真值框选择方法、装置、存储介质及设备
CN113221855A (zh) 基于尺度敏感损失与特征融合的小目标检测方法和系统
CN116137061B (zh) 数量统计模型的训练方法、装置、电子设备及存储介质
CN115439700B (zh) 一种图像处理方法、装置和机器可读存储介质
CN110807286A (zh) 一种结构网格识别方法
CN113870262B (zh) 基于图像处理的印刷电路板分类方法、装置及储存介质
CN114140336B (zh) 一种基于红外图像的坏点处理方法及装置
CN114897797A (zh) 印刷电路板的缺陷检测方法、装置、设备及存储介质
CN114240924A (zh) 一种基于数字化技术的电网设备质量评估方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20220107

Address after: 2209-c1, No. 19, Erquan East Road, Huizhi enterprise center, Xishan District, Wuxi City, Jiangsu Province, 214000

Applicant after: Wuxi yuspace Intelligent Technology Co.,Ltd.

Address before: Room 1101, block C, Kangyuan smart port, No. 50, Jiangdong Street, Jialing, Jianye District, Nanjing City, Jiangsu Province, 210000

Applicant before: Jiangsu Yu Space Technology Co.,Ltd.

TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20220916

Address after: Room 1101, block C, Kangyuan smart port, No. 50, Jiangdong Street, Jialing, Jianye District, Nanjing City, Jiangsu Province, 210000

Applicant after: Jiangsu Yu Space Technology Co.,Ltd.

Address before: 2209-c1, No. 19, Erquan East Road, Huizhi enterprise center, Xishan District, Wuxi City, Jiangsu Province, 214000

Applicant before: Wuxi yuspace Intelligent Technology Co.,Ltd.

TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20230828

Address after: 2209-c1, No. 19, Erquan East Road, Huizhi enterprise center, Xishan District, Wuxi City, Jiangsu Province, 214000

Applicant after: Wuxi yuspace Intelligent Technology Co.,Ltd.

Address before: Room 1101, block C, Kangyuan smart port, No. 50, Jiangdong Street, Jialing, Jianye District, Nanjing City, Jiangsu Province, 210000

Applicant before: Jiangsu Yu Space Technology Co.,Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant