CN112597837A - 图像检测方法、装置、设备、存储介质和计算机程序产品 - Google Patents
图像检测方法、装置、设备、存储介质和计算机程序产品 Download PDFInfo
- Publication number
- CN112597837A CN112597837A CN202011461590.XA CN202011461590A CN112597837A CN 112597837 A CN112597837 A CN 112597837A CN 202011461590 A CN202011461590 A CN 202011461590A CN 112597837 A CN112597837 A CN 112597837A
- Authority
- CN
- China
- Prior art keywords
- target
- branch network
- anchor frame
- key point
- feature map
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 143
- 238000004590 computer program Methods 0.000 title claims abstract description 16
- 238000010586 diagram Methods 0.000 claims abstract description 107
- 238000000034 method Methods 0.000 claims description 19
- 238000013473 artificial intelligence Methods 0.000 abstract description 3
- 238000013135 deep learning Methods 0.000 abstract description 2
- 238000004891 communication Methods 0.000 description 8
- 238000000605 extraction Methods 0.000 description 7
- 238000012545 processing Methods 0.000 description 7
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000013136 deep learning model Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/20—Scenes; Scene-specific elements in augmented reality scenes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
- G06T7/73—Determining position or orientation of objects or cameras using feature-based methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/60—Analysis of geometric attributes
- G06T7/62—Analysis of geometric attributes of area, perimeter, diameter or volume
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/46—Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
- G06V10/462—Salient features, e.g. scale invariant feature transforms [SIFT]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/48—Extraction of image or video features by mapping characteristic values of the pattern into a parameter space, e.g. Hough transformation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/07—Target detection
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Geometry (AREA)
- Image Analysis (AREA)
Abstract
本申请公开了一种图像检测方法、装置、设备、存储介质和计算机程序产品,涉及人工智能领域,具体为计算机视觉和深度学习方面。具体实现方案为:对待检测图像进行特征提取得到特征图;通过目标分支网络对特征图进行目标检测,得到特征图像素位置上候选锚框的目标检测信息;通过关键点分支网络对特征图进行关键点检测,得到特征图像素位置上候选锚框的关键点位置,且根据所述关键点位置生成所述候选锚框的热力图组;根据所述候选锚框的目标检测信息和所述候选锚框的热力图组,得到所述待检测图像中的目标对象信息和目标对象的关键点位置。本申请能够提高图像检测效率。
Description
技术领域
本申请涉及人工智能领域,尤其涉及计算机视觉和深度学习方面,具体涉及一种图像检测方法、装置、设备、存储介质和计算机程序产品。
背景技术
目标检测用于确定图像的某个区域是否含有要识别的对象。关键点检测用于确定图像的某个对象中关键点位置,如人体关键点检测。
目标检测和关键点检测是计算机视觉任务的基础,在诸如动作分类、行为识别、智能交通以及无人驾驶等场景中广泛应用。如何进行目标、关键点检测是业内重要问题。
发明内容
本公开提供了一种用于图像检测方法、装置、设备、存储介质和计算机程序产品。
根据本公开的一方面,提供了一种图像检测方法,包括:
通过目标分支网络对待检测图像的特征图进行目标检测,得到特征图像素位置上候选锚框的目标检测信息;
通过关键点分支网络对待检测图像的特征图进行关键点检测,得到特征图像素位置上候选锚框的热力图组;
根据所述候选锚框的目标检测信息和所述候选锚框的热力图组,得到所述待检测图像中的目标对象信息和目标对象的关键点位置。
根据本公开的一方面,提供了一种图像检测装置,包括:
目标检测模块,用于通过目标分支网络对待检测图像的特征图进行目标检测,得到特征图像素位置上候选锚框的目标检测信息;
关键点检测模块,用于通过关键点分支网络对待检测图像的特征图进行关键点检测,得到特征图像素位置上候选锚框的热力图组;
结果确定模块,用于根据所述候选锚框的目标检测信息和所述候选锚框的热力图组,得到所述待检测图像中的目标对象信息和目标对象的关键点位置。
根据第三方面,提供了一种电子设备,该电子设备包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如本申请实施例中任一项所述的图像检测方法。
根据第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行如本申请实施例中任一项所述的图像检测方法。
根据第五方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现如本申请实施例中任一项所述的图像检测方法。
根据本申请的技术能够提高图像检测效率。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1是根据本申请实施例提供的一种图像检测方法的流程示意图;
图2是根据本申请实施例提供的另一种图像检测方法的流程示意图;
图3a是根据本申请实施例提供的又一种图像检测方法的流程示意图;
图3b是根据本申请实施例提供的一种图像检测模型的结构示意图;
图4a是根据本申请实施例提供的又一种图像检测方法的流程示意图;
图4b是根据本申请实施例提供的一种目标分支网络的输出与关键点分支网络的输出之间关系示意图;
图5是据本申请实施例提供的一种图像检测装置的结构示意图;
图6是用来实现本申请实施例的图像检测方法的电子设备的框图。
具体实施方式
以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
图1是根据本申请实施例提供的图像检测方法的流程示意图。本实施例可适用于对图像进行目标检测和关键点检测的情况。本实施例公开的图像检测方法可以由电子设备执行,具体可以由图像检测装置来执行,该装置可以由软件和/或硬件的方式实现,配置于电子设备中。参见图1,本实施例提供的图像检测方法包括:
S110、通过目标分支网络对待检测图像的特征图进行目标检测,得到特征图像素位置上候选锚框的目标检测信息。
S120、通过关键点分支网络对待检测图像的特征图进行关键点检测,得到特征图像素位置上候选锚框的热力图组。
S130、根据所述候选锚框的目标检测信息和所述候选锚框的热力图组,得到所述待检测图像中的目标对象信息和目标对象的关键点位置。
在本申请实施例中,可以通过特征提取网络对待检测图像进行特征提取得到特征图,例如特征提取网络可以包括主干网络和特征金字塔网络,相应地可以将待检测图像输入主干网络得到不同尺度和深度的特征图,将不同尺度和深度的特征图输入特征金字塔网络得到需要的特定尺度的特征图。本申请实施例对主干网络的结构不作具体限定,如可以为基于YOLO(You Only Look Once,你只需看一遍)框架的网络结构,如DarkNet(暗网络)、ResNet(残差网络)等网络结构。
在本申请实施例中,目标分支网络用于对待检测图像进行目标检测,关键点分支网络用于对待检测图像进行关键点检测。对目标分支网络和关键点分支网络的网络结构不作具体限定,如均可以采用卷积神经网络。
其中,候选锚框的目标检测信息可以为(conf,x,y,Target_w,Target_h,class),其中,conf表示该候选锚框内包含目标对象的置信度,x和y为归一化的真值边界框中心点位置,Target_w和Target_h为归一化的真值边界框尺度,class为长度为N的向量,是指目标对象属于某一类别的概率对应该类别索引所对应的向量内的值,即候选锚框的目标检测信息长度可以为5+N。
在目标检测阶段,可以将特征图输入目标分支网络,通过目标分支网络在特征图像素位置上产生多种不同大小比例的候选锚框,确定候选锚框区域中是否包含感兴趣的目标对象,并且调整候选锚框区域边缘从而预测目标对象的真实边界框(ground-truthbounding box)。以目标分支网络关联的特征图宽和高均为13,且每个像素位置上有A种不同锚框为例,目标分支网络的候选锚框数量为13×13×A。
在本申请实施例中,目标分支网络与关键点分支网络之间一一对应,也就是说每一目标分支网络具有关联的一个关键点分支网络,关键点分支网络用于对关联的目标分支网络所检测的目标对象进行关键点检测,关键点分支网络中的通道与目标分支网络中候选锚框存在关联关系。在关键点检测阶段,将特征图输入关键点分支网络,通过关键点分支网络为关联的目标分支网络中每个候选锚框生成热力图组。仍以目标分支网络具有13×13×A个候选锚框为例,关键点分支网络中的通道数量为13×13×A,即通过关键点分支网络对每个候选锚框进行关键点检测得到13×13×A个热力图组。在每个目标对象有K个关键点情况下,每一热力图组可以包括K个热力图。
其中,待检测图像中的目标对象信息可以包括目标对象的真值边界框位置和目标对象的类别,目标对象的关键点位置可以为目标对象中关键点的位置。具体的,可以根据候选锚框的目标检测信息得到待检测图像中的目标对象信息;根据目标对象关联的候选锚框信息,以及候选锚框与热力图组之间的关联关系,得到目标对象的关键点位置。
通过目标分支网络和关键点分支网络联合对待检测图像的特征图进行处理,并结合目标分支网络和关键点分支网络对特征图的检测结果能够确定待检测图像中的目标对象信息和目标对象的关键点位置,相比于通过二阶段模型分别对待检测图像进行目标检测和关键点检测,提高了检测效率。
本申请实施例的技术方案,基于关键点分支网络中的通道与目标分支网络中候选锚框之间的关联关系,通过目标分支网络和关键点分支网络分别对待检测图像的特征图进行检测得到特征图像素位置上候选锚框的目标检测信息和候选锚框的热力图组;根据候选锚框的目标检测信息和候选锚框的热力图组得到待检测图像中的目标对象信息和目标对象的关键点位置,实现了对待检测图像进行目标和关键点的联合检测,能够提高图像检测效率。
图2是根据本申请实施例提供的另一种图像检测方法的流程示意图。本实施例是在上述实施例的基础上提出的一种可选方案。参见图2,本实施例提供的图像检测方法包括:
S210、通过目标分支网络对待检测图像的特征图进行目标检测,得到特征图像素位置上候选锚框的目标检测信息。
S220、通过关键点分支网络对待检测图像的特征图进行关键点检测,得到特征图像素位置上候选锚框的热力图组。
S230、根据所述候选锚框的目标检测信息确定所述待检测图像中的目标对象信息,且将与目标对象关联的候选锚框作为目标锚框。
S240、从所述候选锚框的热力图组中选择所述目标锚框的热力图组。
S250、根据所述目标锚框的热力图组,确定所述目标对象的关键点位置。
具体的,可以基于极大值抑制算法(Non-Maximum Suppression,NMS),从候选锚框的目标检测信息中确定待检测图像中的目标对象信息,且将与目标对象关联的候选锚框作为目标锚框,即将与目标对象的真值边界框所关联的候选锚框作为目标锚框,目标锚框的热力图组即为目标对象中关键点的热力图组;根据目标锚框的热力图组确定目标对象的关键点位置。其中,在目标对象的中心点像素位置上不仅有目标锚框,还有其他候选锚框。由于目标锚框中关键点必然属于目标对象,能够避免关键点与目标对象之间的错误匹配,从而能够提高关键点的检测精度。
在一种可选实施方式中,从所述候选锚框的热力图组中选择所述目标锚框的热力图组包括:根据所述目标锚框的特征图像素位置、锚框号、特征图尺寸,得到目标索引号;从所述候选锚框的热力图组中选择与所述目标索引号关联的热力图组作为所述目标锚框的热力图组。
其中,目标锚框的特征图像素位置是指特征图上目标锚框的中心点像素位置,即目标对象的中心点像素位置。在目标锚框的特征图像素位置上不仅有目标锚框,还有其他候选锚框。锚框号是指目标锚框在其特征图像素位置处的各候选锚框中的序号。仍以每个像素位置处有A个候选锚框为例,目标锚框的锚框号为a是指在该像素位置处的A个候选锚框中,第a个锚框为目标锚框。特征图尺寸是指与关键点分支网络所关联的目标分支网络中特征图的宽度和高度。其中,目标索引号用于唯一性标识目标锚框和目标锚框的热力图组。在关键点分支网络中,每一候选锚框均具有自身唯一性候选索引号,且可以作为该候选锚框的热力图组的唯一性索引号。
具体的,根据目标锚框的特征图像素位置、锚框号、特征图尺寸确定目标锚框的唯一性索引号,即确定目标索引号;从各候选锚点框的热力图组(即候选热力图组)中将与目标索引号关联的候选热力图组作为目标热力图组。由于每个候选锚框的热力图组均具有唯一性索引号,因此通过目标索引号能够快速且准确地定位目标锚框的热力图组,从而能够进一步提高关键点检测效率。
在一种可选实施方式中,根据所述目标锚框的特征图像素位置、锚框号、特征图尺寸,得到目标索引号,包括:通过如下公式,得到所述目标索引号:c=a×w×h+j×w+i;其中,(i,j)为目标锚框的特征图像素位置,a为锚框号,(w,h)为特征图尺寸,c为目标索引号。
其中,c=a×w×h+j×w+i为关键点分支网络中候选锚框的索引号生成规则。具体的,在生成候选锚框的索引号过程中,序号为a的w×h个候选锚框的索引号排在序号为a+1的w×h个候选锚框的索引号之前;在序号为a的w×h个候选锚框中,第i行的w个候选锚框的索引号排在第i+1行w个候选锚框的索引号之前;在第i行的w个候选锚框中,第j列的候选锚框的索引号排在第j+1列的候选锚框的索引号之前。以与关键点分支网络关联的目标分支网络中特征图尺寸为(13,13)为例,关键点分支网络的索引号生成规则为c=a×13×13+j×13+i;以特征图尺寸为(26,26)为例,索引号生成规则为c=a×26×26+j×26+i;以特征图尺寸为(52,52)为例,索引号生成规则为c=a×52×52+j×52+i。通过上述索引号生成规则,便于构建候选锚框的索引号,并且还能够提高基于索引号定位目标锚框热力图组的效率。
在一种可选实施方式中,所述根据所述目标锚框的热力图组,确定所述目标对象的关键点位置,包括:确定所述目标锚框的热力图组中各热力图中最大值位置;根据各热力图中最大值位置、热力图尺寸和所述待检测图像的尺寸,确定所述目标对象中各关键点位置。
具体的,在目标锚框的热力图组(即目标热力图组)中,每一热力图的最大值点即为目标对象的关键点;根据各热力图中的关键点位置、热力图尺寸和待检测图像的尺寸,能够得到待检测图像中的关键点位置,即目标对象的关键点位置。通过根据目标锚框的各热力图中最大值位置、热力图尺寸和待检测图像的尺寸,能够快速且准确的得到目标对象中各关键点在待检测图像中的位置。
在一种可选实施方式中,通过如下公式,得到所述目标对象中各关键点位置:
U=(u/W)×image_width;
V=(v/H)×image_height;
其中,(u,v)为各热力图中最大值位置,(W,H)为热力图尺寸,(image_width,image_height)为待检测图像的尺寸,(U,V)为目标对象中各关键点位置。
本申请实施例提供的技术方案,通过根据目标锚框的热力图组确定目标对象的关键点位置,能够提高关键点的检测精度;并且,通过为候选锚框生成唯一性索引号,能够根据目标锚框的唯一性索引号快速定位目标热力图组,从而提高目标对象的关键点位置的确定效率。
图3a是根据本申请实施例提供的又一种图像检测方法的流程示意图。本实施例是在上述实施例的基础上提出的一种可选方案。参见图3a,本实施例提供的图像检测方法包括:
S310、通过目标分支网络对待检测图像的特征图进行目标检测,得到特征图像素位置上候选锚框的目标检测信息。
S320、通过关键点分支网络对特征图像素位置上候选锚框进行关键点检测,得到所述候选锚框的关键点位置。
S330、根据所述候选锚框的各关键点位置生成各关键点的热力图,作为所述候选锚框的热力图组。
S340、根据所述候选锚框的目标检测信息和所述候选锚框的热力图组,得到所述待检测图像中的目标对象信息和目标对象的关键点位置。
其中,每个热力图的尺寸可以相同。具体的,针对候选锚框的每一关键点,可以将以该关键点坐标为中心,σ为方差的高斯响应图作为该关键点的热力图,其中,热力图的高斯峰值为1,距离高斯中心3σ以外的像素值均为0。以对象有K个关键点为例,可以根据候选锚框的K个关键点坐标生成为候选锚框生成K个热力图,作为候选锚框的热力图组。通过关键点分支网络输出候选锚框的热力图组,将候选锚框作为目标分支网络输出的目标检测信息与关键点分支网络输出的热力图组之间桥梁中介,实现了目标对象和关键点的联合检测,能够提高目标对象和关键点的检测效率。
在一种可选实施方式中,所述特征图包括尺寸依次增加的第一特征图、第二特征图和第三特征图;所述目标分支网络包括尺寸依次增加的第一目标分支网络、第二目标分支网络、第三目标分支网络;所述关键点分支网络包括尺寸依次增加的第一关键点分支网络、第二关键点分支网络和第三关键点分支网络;所述第一特征图为所述第一目标分支网络的输入;所述第二特征图为所述第二目标分支网络的输入;所述第三特征图为所述第三目标分支网络的输入;所述第三特征图还为所述第一关键点分支网络、所述第二关键点分支网络和所述第三关键点分支网络的输入。其中,第一关键点分支网络与第一目标分支网络关联,第二关键点分支网络与第二目标分支网络关联,第三关键点分支网络与第三目标分支网络关联。
图3b是根据本申请实施例提供的一种图像检测模型的结构示意图。参考图3b,将待检测图像31输入图像检测模型中的特征提取网络32能够得到尺寸依次增加的第一特征图331、第二特征图332和第三特征图333;将第一特征图331输入第一目标分支网络341,第二特征图332输入第二目标分支网络342,第三特征图333输入第三目标分支网络343,且将第三特征图333分别输入第一关键点分支网络351、所述第二关键点分支网络352和所述第三关键点分支网络353。因此,第一目标分支网络341输出的边界框尺寸与第一特征图331尺寸相同,第二目标分支网络342输出的边界框尺寸与第二特征图332尺寸相同,第三目标分支网络343输出的边界框尺寸与第三特征图333尺寸相同。第一关键点分支网络351、所述第二关键点分支网络352和所述第三关键点分支网络353输出的热力图尺寸均与第三特征图333尺寸相同。
以第一特征图331的尺寸为13×13×255,第二特征图332的尺寸为26×26×255,第三特征图333的尺寸为52×52×255为例,第一目标分支网络341、第二目标分支网络342和第三目标分支网络343输出的边界框尺寸分别为13×13,26×26,52×52,三个关键点分支网络输出的热力图尺寸均为52×52。
具体的,根据任一目标分支网络的目标检测信息确定目标对象之后,确定与该目标分支网络关联的关键点分支网络,从该关键点分支网络的候选锚框中选择目标锚框,并根据目标锚框的热力图组确定目标对象的关键点位置。例如根据第一目标分支网络的目标检测信息得到目标对象之后,从第一关键点分支网络的候选锚框中选择目标锚框,并根据目标锚框的热力图组确定目标对象的关键点位置。通过支持多尺度特征图能够感知不同尺度的目标对象。
本申请实施例提供的技术方案,通过支持多尺度的目标检测,并支持各尺度的关键点检测,能够识别不同尺度的目标对象。
图4a是根据本申请实施例提供的又一种图像检测方法的流程示意图。本实施例是在上述实施例的基础上提出的一种可选方案。参见图4a,本实施例提供的图像检测方法包括:
S410、从实时视频流中抽取图片帧,将图片帧缩放成固定尺寸,并减去固定像素均值得到待检测图像。
其中,实时视频流可以为监控或其他场景的摄像头的实时视频流。固定尺寸可以预先设定,如可以为416×416,固定像素均值可以为通用数据集上的像素均值。通过上述处理能够增强联合检测模型的鲁棒性。
S420、通过联合检测模型中特征提取网络对待检测图像进行特征提取得到尺寸不同的第一特征图、第二特征图和第三特征图。
S430、通过联合检测模型中的第一目标分支网络、第二目标分支网络和第三目标分支网络依次对第一特征图、第二特征图和第三特征图进行目标检测。
S440、通过联合检测模型中的第一关键点分支网络、第二关键点分支网络和第三关键点分支网络分别对第三特征图进行关键点检测。
S450、根据各目标分支网络检测得到的候选锚框的目标检测信息和各关键点分支网络检测得到的候选锚框的热力图组,确定待检测图像中的目标对象信息和目标对象的关键点位置。
在联合检测模型的样本标注阶段,针对样本图像中每一目标对象,分别确定该目标对象的真值边界框;且根据该目标对象的关键点位置,为目标对象生成热力图组。
目标分支网络在每个特征图像素位置上产生A种不同大小比例的锚框。第一目标分支网络的检测预测结果宽和高均与第一特征图的尺寸相同如为13×13,第二目标分支网络的检测预测结果宽和高均与第二特征图的尺寸相同如为26×26,第三目标分支网络的检测预测结果宽和高均与第三特征图的尺寸相同如为52×52。
关键点分支网络的通道与目标分支网络中像素存在对应关系。关键点分支网络为关联的目标分支网络中特征图像素位置上的锚框生成热力图组。具体的,第一关键点分支网络为第一目标分支网络的特征图中每一像素位置上的锚框生成热力图组;第二关键点分支网络为第二目标分支网络的特征图中每一像素位置上的锚框生成热力图组;第三关键点分支网络为第三目标分支网络的特征图中每一像素位置上的锚框生成热力图组。
参考图4b,目标分支网络的输出41与关联的关键点分支网络的输出42具有关联关系。具体的,第一目标分支网络为每个像素点产生A个候选锚框,共计13×13×A个候选锚框,对应第一关键点分支网络的13×13×A个锚框的热力图组,每组热力图包含K个宽和高均为52的关键点热力图。因此,第一目标分支网络为第i行第j列第a类锚框生成的热力图组索引号为c=a×13×13+j×13+i。第二目标分支网络为每个像素点产生A个锚框,共计26×26×A个锚框,对应第二关键点分支网络的26×26×A个锚框的热力图组,每组热力图包含K个宽和高均为52的关键点热力图。因此,第二目标分支网络为第i行第j列第a类锚框生成的热力图组索引号为c=a×26×26+j×26+i。第三目标分支网络为每个像素点产生A个锚框,共计52×52×A个锚框,对应第三关键点分支网络的52×52×A个锚框的热力图组,每组热力图包含K个宽和高均为52的关键点热力图。因此,第三目标分支网络为第i行第j列第a类锚框生成的热力图组索引号为c=a×52×52+j×52+i。
在模型检测阶段,对各目标分支网络输出的目标检测信息进行处理,并根据任一目标分支网络输出的目标检测信息得到目标对象,则基于该目标分支网络得到目标对象的真值边界框、类别和目标锚框的特征图像素位置、锚框号、特征图尺寸。基于与该目标分支网络所关联的关键点分支网络的索引号关系,根据目标锚框的特征图像素位置、锚框号和特征图尺寸确定目标锚框的索引号,根据目标锚框的索引号从该关键点分支网络输出的热力图组中得到目标锚框的热力图组。具体的,以目标对象由第一目标分支网络确定为例,则基于c=a×13×13+j×13+i确定目标锚框的索引号;以目标对象由第二目标分支网络确定为例,则基于c=a×26×26+j×26+i确定目标锚框的索引号;以目标对象由第三目标分支网络确定为例,则基于c=a×52×52+j×52+i确定目标锚框的索引号。针对目标锚框的热力图组中第k个热力图,获取该热力图上最大值所在坐标(i,j),则目标对象的第k个关键点在待检测图像上的坐标为((i/52)×image_width,j/52×image_height),其中,(image_width,image_height)为待检测图像的宽和高。
本申请实施例的计算方案,可以只对图像进行一次深度学习模型提取,得到图像上所有目标的检测框,及其关键点坐标。与传统自上而下的方案相比,图像中目标数量的多少不影响本发明运行时的性能。与传统自下而上的方案相比,本发明输出的关键点与预测的检测框能够一一对应,无需进行复杂的聚类后处理算法,提升了关键点的精度。
图5是本申请实施例提供的一种图像检测装置的结构示意图。参见图5,本申请实施例提供的图像检测装置500可以包括:
目标检测模块501,用于通过目标分支网络对待检测图像的特征图进行目标检测,得到特征图像素位置上候选锚框的目标检测信息;
关键点检测模块502,用于通过关键点分支网络对待检测图像的特征图进行关键点检测,得到特征图像素位置上候选锚框的热力图组;
结果确定模块503,用于根据所述候选锚框的目标检测信息和所述候选锚框的热力图组,得到所述待检测图像中的目标对象信息和目标对象的关键点位置。
在一种可选实施方式中,关键点检测模块502包括:
关键点检测单元,用于通过关键点分支网络对特征图像素位置上候选锚框进行关键点检测,得到所述候选锚框的关键点位置;
热力图组生成单元,用于根据所述候选锚框的各关键点位置生成各关键点的热力图,作为所述候选锚框的热力图组。
在一种可选实施方式中,所述结果确定模块503包括:
目标结果单元,用于根据所述候选锚框的目标检测信息确定所述待检测图像中的目标对象信息,且将与目标对象关联的候选锚框作为目标锚框;
热力图组选择单元,用于从所述候选锚框的热力图组中选择所述目标锚框的热力图组;
关键点结果单元,用于根据所述目标锚框的热力图组,确定所述目标对象的关键点位置。
在一种可选实施方式中,所述热力图组选择单元包括:
索引号子单元,用于根据所述目标锚框的特征图像素位置、锚框号、特征图尺寸,得到目标索引号;
热力图组子单元,用于从所述候选锚框的热力图组中选择与所述目标索引号关联的热力图组作为所述目标锚框的热力图组。
在一种可选实施方式中,所述索引号子单元具体用于:
通过如下公式,得到所述目标索引号:
c=a×w×h+j×w+i;
其中,(i,j)为目标锚框的特征图像素位置、a为锚框号、(w,h)为特征图尺寸,c为目标索引号。
在一种可选实施方式中,所述关键点结果单元包括:
最大值子单元,用于确定所述目标锚框的热力图组中各热力图中最大值位置;
关键点位置子单元,用于根据各热力图中最大值位置、热力图尺寸和所述待检测图像的尺寸,确定所述目标对象中各关键点位置。
在一种可选实施方式中,所述特征图包括尺寸依次增加的第一特征图、第二特征图和第三特征图;所述目标分支网络包括尺寸依次增加的第一目标分支网络、第二目标分支网络、第三目标分支网络;所述关键点分支网络包括尺寸依次增加的第一关键点分支网络、第二关键点分支网络和第三关键点分支网络;
所述第一特征图为所述第一目标分支网络的输入;
所述第二特征图为所述第二目标分支网络的输入;
所述第三特征图为所述第三目标分支网络的输入;
所述第三特征图还为所述第一关键点分支网络、所述第二关键点分支网络和所述第三关键点分支网络的输入。
本申请实施例的技术方案,可以只对图像进行一次深度学习模型提取,得到图像上所有目标的检测框,及其关键点坐标。能够提高图像的目标和关键点检测效率,并且能够提升关键点的精度。
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
图6示出了可以用来实施本公开的实施例的示例电子设备600的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图6所示,设备600包括计算单元601,其可以根据存储在只读存储器(ROM)602中的计算机程序或者从存储单元608加载到随机访问存储器(RAM)603中的计算机程序,来执行各种适当的动作和处理。在RAM 603中,还可存储设备600操作所需的各种程序和数据。计算单元601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
设备600中的多个部件连接至I/O接口605,包括:输入单元606,例如键盘、鼠标等;输出单元607,例如各种类型的显示器、扬声器等;存储单元608,例如磁盘、光盘等;以及通信单元609,例如网卡、调制解调器、无线通信收发机等。通信单元609允许设备600通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元601可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元601的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元601执行上文所描述的各个方法和处理,例如图像检测方法。例如,在一些实施例中,图像检测方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元608。在一些实施例中,计算机程序的部分或者全部可以经由ROM 602和/或通信单元609而被载入和/或安装到设备600上。当计算机程序加载到RAM 603并由计算单元601执行时,可以执行上文描述的图像检测方法的一个或多个步骤。备选地,在其他实施例中,计算单元601可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行图像检测方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)、区块链网络和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务中,存在的管理难度大,业务扩展性弱的缺陷。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。
Claims (17)
1.一种图像检测方法,包括:
通过目标分支网络对待检测图像的特征图进行目标检测,得到特征图像素位置上候选锚框的目标检测信息;
通过关键点分支网络对待检测图像的特征图进行关键点检测,得到特征图像素位置上候选锚框的热力图组;
根据所述候选锚框的目标检测信息和所述候选锚框的热力图组,得到所述待检测图像中的目标对象信息和目标对象的关键点位置。
2.根据权利要求1所述的方法,其中,所述通过关键点分支网络对待检测图像的特征图进行关键点检测,得到特征图像素位置上候选锚框的热力图组,包括:
通过关键点分支网络对特征图像素位置上候选锚框进行关键点检测,得到所述候选锚框的关键点位置;
根据所述候选锚框的各关键点位置生成各关键点的热力图,作为所述候选锚框的热力图组。
3.根据权利要求1所述的方法,其中,所述根据所述候选锚框的目标检测信息和所述候选锚框的热力图组,得到所述待检测图像中的目标对象信息和目标对象的关键点位置,包括:
根据所述候选锚框的目标检测信息确定所述待检测图像中的目标对象信息,且将与目标对象关联的候选锚框作为目标锚框;
从所述候选锚框的热力图组中选择所述目标锚框的热力图组;
根据所述目标锚框的热力图组,确定所述目标对象的关键点位置。
4.根据权利要求3所述的方法,其中,所述从所述候选锚框的热力图组中选择所述目标锚框的热力图组包括:
根据所述目标锚框的特征图像素位置、锚框号、特征图尺寸,得到目标索引号;
从所述候选锚框的热力图组中选择与所述目标索引号关联的热力图组作为所述目标锚框的热力图组。
5.根据权利要求4所述的方法,其中,所述根据所述目标锚框的特征图像素位置、锚框号、特征图尺寸,得到目标索引号,包括:
通过如下公式,得到所述目标索引号:
c=a×w×h+j×w+i;
其中,(i,j)为目标锚框的特征图像素位置、a为锚框号、(w,h)为特征图尺寸,c为目标索引号。
6.根据权利要求3所述的方法,其中,所述根据所述目标锚框的热力图组,确定所述目标对象的关键点位置,包括:
确定所述目标锚框的热力图组中各热力图中最大值位置;
根据各热力图中最大值位置、热力图尺寸和所述待检测图像的尺寸,确定所述目标对象中各关键点位置。
7.根据权利要求1-6中任一项所述的方法,其中,所述特征图包括尺寸依次增加的第一特征图、第二特征图和第三特征图;所述目标分支网络包括尺寸依次增加的第一目标分支网络、第二目标分支网络、第三目标分支网络;所述关键点分支网络包括尺寸依次增加的第一关键点分支网络、第二关键点分支网络和第三关键点分支网络;
所述第一特征图为所述第一目标分支网络的输入;
所述第二特征图为所述第二目标分支网络的输入;
所述第三特征图为所述第三目标分支网络的输入;
所述第三特征图还为所述第一关键点分支网络、所述第二关键点分支网络和所述第三关键点分支网络的输入。
8.一种图像检测装置,包括:
目标检测模块,用于通过目标分支网络对待检测图像的特征图进行目标检测,得到特征图像素位置上候选锚框的目标检测信息;
关键点检测模块,用于通过关键点分支网络对待检测图像的特征图进行关键点检测,得到特征图像素位置上候选锚框的热力图组;
结果确定模块,用于根据所述候选锚框的目标检测信息和所述候选锚框的热力图组,得到所述待检测图像中的目标对象信息和目标对象的关键点位置。
9.根据权利要求8所述的装置,其中,所述关键点检测模块包括:
关键点检测单元,用于通过关键点分支网络对特征图像素位置上候选锚框进行关键点检测,得到所述候选锚框的关键点位置;
热力图组生成单元,用于根据所述候选锚框的各关键点位置生成各关键点的热力图,作为所述候选锚框的热力图组。
10.根据权利要求8所述的装置,其中,所述结果确定模块包括:
目标结果单元,用于根据所述候选锚框的目标检测信息确定所述待检测图像中的目标对象信息,且将与目标对象关联的候选锚框作为目标锚框;
热力图组选择单元,用于从所述候选锚框的热力图组中选择所述目标锚框的热力图组;
关键点结果单元,用于根据所述目标锚框的热力图组,确定所述目标对象的关键点位置。
11.根据权利要求10所述的装置,其中,所述热力图组选择单元包括:
索引号子单元,用于根据所述目标锚框的特征图像素位置、锚框号、特征图尺寸,得到目标索引号;
热力图组子单元,用于从所述候选锚框的热力图组中选择与所述目标索引号关联的热力图组作为所述目标锚框的热力图组。
12.根据权利要求11所述的装置,其中,所述索引号子单元具体用于:
通过如下公式,得到所述目标索引号:
c=a×w×h+j×w+i;
其中,(i,j)为目标锚框的特征图像素位置、a为锚框号、(w,h)为特征图尺寸,c为目标索引号。
13.根据权利要求10所述的装置,其中,所述关键点结果单元包括:
最大值子单元,用于确定所述目标锚框的热力图组中各热力图中最大值位置;
关键点位置子单元,用于根据各热力图中最大值位置、热力图尺寸和所述待检测图像的尺寸,确定所述目标对象中各关键点位置。
14.根据权利要求8-13中任一项所述的装置,其中,所述特征图包括尺寸依次增加的第一特征图、第二特征图和第三特征图;所述目标分支网络包括尺寸依次增加的第一目标分支网络、第二目标分支网络、第三目标分支网络;所述关键点分支网络包括尺寸依次增加的第一关键点分支网络、第二关键点分支网络和第三关键点分支网络;
所述第一特征图为所述第一目标分支网络的输入;
所述第二特征图为所述第二目标分支网络的输入;
所述第三特征图为所述第三目标分支网络的输入;
所述第三特征图还为所述第一关键点分支网络、所述第二关键点分支网络和所述第三关键点分支网络的输入。
15.一种电子设备,其中,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-7中任一项所述的方法。
16.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行权利要求1-7中任一项所述的方法。
17.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-7中任一项所述的方法。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011461590.XA CN112597837B (zh) | 2020-12-11 | 2020-12-11 | 图像检测方法、装置、设备、存储介质和计算机程序产品 |
EP21177497.1A EP3852008A3 (en) | 2020-12-11 | 2021-06-02 | Image detection method and apparatus, device, storage medium and computer program product |
US17/303,896 US11810319B2 (en) | 2020-12-11 | 2021-06-09 | Image detection method, device, storage medium and computer program product |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011461590.XA CN112597837B (zh) | 2020-12-11 | 2020-12-11 | 图像检测方法、装置、设备、存储介质和计算机程序产品 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112597837A true CN112597837A (zh) | 2021-04-02 |
CN112597837B CN112597837B (zh) | 2024-05-28 |
Family
ID=75192855
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011461590.XA Active CN112597837B (zh) | 2020-12-11 | 2020-12-11 | 图像检测方法、装置、设备、存储介质和计算机程序产品 |
Country Status (3)
Country | Link |
---|---|
US (1) | US11810319B2 (zh) |
EP (1) | EP3852008A3 (zh) |
CN (1) | CN112597837B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113326773A (zh) * | 2021-05-28 | 2021-08-31 | 北京百度网讯科技有限公司 | 识别模型训练方法、识别方法、装置、设备及存储介质 |
CN113781391A (zh) * | 2021-08-02 | 2021-12-10 | 南京中科创达软件科技有限公司 | 图像缺陷检测方法以及相关设备 |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113838134B (zh) * | 2021-09-26 | 2024-03-12 | 广州博冠信息科技有限公司 | 图像关键点检测方法、装置、终端和存储介质 |
CN113850210B (zh) * | 2021-09-29 | 2024-05-17 | 支付宝(杭州)信息技术有限公司 | 一种人脸图像处理方法、装置及电子设备 |
CN114596431A (zh) * | 2022-03-10 | 2022-06-07 | 北京百度网讯科技有限公司 | 信息确定方法、装置及电子设备 |
CN114724115B (zh) * | 2022-05-18 | 2022-09-27 | 禾多科技(北京)有限公司 | 障碍物定位信息生成方法、装置、设备和计算机可读介质 |
CN115228092B (zh) * | 2022-09-22 | 2022-12-23 | 腾讯科技(深圳)有限公司 | 游戏战力评估方法、装置以及计算机可读存储介质 |
CN115496911B (zh) * | 2022-11-14 | 2023-03-24 | 腾讯科技(深圳)有限公司 | 一种目标点检测方法、装置、设备及存储介质 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107665498A (zh) * | 2017-08-29 | 2018-02-06 | 北京航空航天大学 | 基于典型示例挖掘的全卷积网络飞机检测方法 |
CN108229488A (zh) * | 2016-12-27 | 2018-06-29 | 北京市商汤科技开发有限公司 | 用于检测物体关键点的方法、装置及电子设备 |
CN108520229A (zh) * | 2018-04-04 | 2018-09-11 | 北京旷视科技有限公司 | 图像检测方法、装置、电子设备和计算机可读介质 |
CN109858444A (zh) * | 2019-01-31 | 2019-06-07 | 北京字节跳动网络技术有限公司 | 人体关键点检测模型的训练方法和装置 |
US20190332889A1 (en) * | 2016-11-09 | 2019-10-31 | Konica Minolta Laboratory U.S.A., Inc. | System and method of using multi-frame image features for object detection |
CN111274977A (zh) * | 2020-01-22 | 2020-06-12 | 中能国际建筑投资集团有限公司 | 多任务卷积神经网络模型及使用方法、装置和存储介质 |
CN111325108A (zh) * | 2020-01-22 | 2020-06-23 | 中能国际建筑投资集团有限公司 | 一种多任务网络模型及使用方法、装置、和存储介质 |
CN111553200A (zh) * | 2020-04-07 | 2020-08-18 | 北京农业信息技术研究中心 | 一种图像检测识别方法及装置 |
CN111553348A (zh) * | 2020-04-26 | 2020-08-18 | 中南大学 | 一种基于centernet的anchor-based目标检测方法 |
WO2020173036A1 (zh) * | 2019-02-26 | 2020-09-03 | 博众精工科技股份有限公司 | 基于深度学习的定位方法和系统 |
CN112016475A (zh) * | 2020-08-31 | 2020-12-01 | 支付宝(杭州)信息技术有限公司 | 一种人体检测识别方法和装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110298298B (zh) * | 2019-06-26 | 2022-03-08 | 北京市商汤科技开发有限公司 | 目标检测及目标检测网络的训练方法、装置及设备 |
-
2020
- 2020-12-11 CN CN202011461590.XA patent/CN112597837B/zh active Active
-
2021
- 2021-06-02 EP EP21177497.1A patent/EP3852008A3/en not_active Withdrawn
- 2021-06-09 US US17/303,896 patent/US11810319B2/en active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190332889A1 (en) * | 2016-11-09 | 2019-10-31 | Konica Minolta Laboratory U.S.A., Inc. | System and method of using multi-frame image features for object detection |
CN108229488A (zh) * | 2016-12-27 | 2018-06-29 | 北京市商汤科技开发有限公司 | 用于检测物体关键点的方法、装置及电子设备 |
US20190279014A1 (en) * | 2016-12-27 | 2019-09-12 | Beijing Sensetime Technology Development Co., Ltd | Method and apparatus for detecting object keypoint, and electronic device |
CN107665498A (zh) * | 2017-08-29 | 2018-02-06 | 北京航空航天大学 | 基于典型示例挖掘的全卷积网络飞机检测方法 |
CN108520229A (zh) * | 2018-04-04 | 2018-09-11 | 北京旷视科技有限公司 | 图像检测方法、装置、电子设备和计算机可读介质 |
CN109858444A (zh) * | 2019-01-31 | 2019-06-07 | 北京字节跳动网络技术有限公司 | 人体关键点检测模型的训练方法和装置 |
WO2020173036A1 (zh) * | 2019-02-26 | 2020-09-03 | 博众精工科技股份有限公司 | 基于深度学习的定位方法和系统 |
CN111274977A (zh) * | 2020-01-22 | 2020-06-12 | 中能国际建筑投资集团有限公司 | 多任务卷积神经网络模型及使用方法、装置和存储介质 |
CN111325108A (zh) * | 2020-01-22 | 2020-06-23 | 中能国际建筑投资集团有限公司 | 一种多任务网络模型及使用方法、装置、和存储介质 |
CN111553200A (zh) * | 2020-04-07 | 2020-08-18 | 北京农业信息技术研究中心 | 一种图像检测识别方法及装置 |
CN111553348A (zh) * | 2020-04-26 | 2020-08-18 | 中南大学 | 一种基于centernet的anchor-based目标检测方法 |
CN112016475A (zh) * | 2020-08-31 | 2020-12-01 | 支付宝(杭州)信息技术有限公司 | 一种人体检测识别方法和装置 |
Non-Patent Citations (4)
Title |
---|
CHEN HUAI 等: "Target heat-map network: An end-to-end deep network for target detection in remote sensing images", NEUROCOMPUTING * |
CHEN HUAI 等: "Target heat-map network: An end-to-end deep network for target detection in remote sensing images", NEUROCOMPUTING, 28 February 2019 (2019-02-28) * |
罗杰;曾接贤;冷璐;符祥;: "基于改进的区域候选网络的行人检测", 南昌航空大学学报(自然科学版), no. 02 * |
赵斌;王春平;付强;: "显著性背景感知的多尺度红外行人检测方法", 电子与信息学报, no. 10 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113326773A (zh) * | 2021-05-28 | 2021-08-31 | 北京百度网讯科技有限公司 | 识别模型训练方法、识别方法、装置、设备及存储介质 |
CN113781391A (zh) * | 2021-08-02 | 2021-12-10 | 南京中科创达软件科技有限公司 | 图像缺陷检测方法以及相关设备 |
Also Published As
Publication number | Publication date |
---|---|
EP3852008A3 (en) | 2021-12-29 |
CN112597837B (zh) | 2024-05-28 |
US11810319B2 (en) | 2023-11-07 |
EP3852008A2 (en) | 2021-07-21 |
US20210295088A1 (en) | 2021-09-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112597837B (zh) | 图像检测方法、装置、设备、存储介质和计算机程序产品 | |
CN112785625B (zh) | 目标跟踪方法、装置、电子设备及存储介质 | |
CN112633276B (zh) | 训练方法、识别方法、装置、设备、介质 | |
CN111768381A (zh) | 零部件缺陷检测方法、装置及电子设备 | |
CN113971751A (zh) | 训练特征提取模型、检测相似图像的方法和装置 | |
CN112560862B (zh) | 文本识别方法、装置及电子设备 | |
CN113780098B (zh) | 文字识别方法、装置、电子设备以及存储介质 | |
CN113378969B (zh) | 一种目标检测结果的融合方法、装置、设备及介质 | |
CN113205041B (zh) | 结构化信息提取方法、装置、设备和存储介质 | |
CN112528858A (zh) | 人体姿态估计模型的训练方法、装置、设备、介质及产品 | |
CN113012200B (zh) | 一种运动物体的定位方法、装置、电子设备及存储介质 | |
US20220172376A1 (en) | Target Tracking Method and Device, and Electronic Apparatus | |
CN113392794B (zh) | 车辆跨线识别方法、装置、电子设备和存储介质 | |
CN113947188A (zh) | 目标检测网络的训练方法和车辆检测方法 | |
CN113378712A (zh) | 物体检测模型的训练方法、图像检测方法及其装置 | |
CN113378958A (zh) | 自动标注方法、装置、设备、存储介质及计算机程序产品 | |
CN113378857A (zh) | 目标检测方法、装置、电子设备及存储介质 | |
CN113643260A (zh) | 用于检测图像质量的方法、装置、设备、介质和产品 | |
CN114445825A (zh) | 文字检测方法、装置、电子设备和存储介质 | |
CN114022865A (zh) | 基于车道线识别模型的图像处理方法、装置、设备和介质 | |
CN114429631B (zh) | 三维对象检测方法、装置、设备以及存储介质 | |
CN113379592B (zh) | 图片中敏感区域的处理方法、装置和电子设备 | |
CN113936158A (zh) | 一种标签匹配方法及装置 | |
CN113570607B (zh) | 目标分割的方法、装置及电子设备 | |
CN117746069B (zh) | 以图搜图的模型训练方法、和以图搜图方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |