CN112926463A - 一种目标检测方法和装置 - Google Patents
一种目标检测方法和装置 Download PDFInfo
- Publication number
- CN112926463A CN112926463A CN202110228006.4A CN202110228006A CN112926463A CN 112926463 A CN112926463 A CN 112926463A CN 202110228006 A CN202110228006 A CN 202110228006A CN 112926463 A CN112926463 A CN 112926463A
- Authority
- CN
- China
- Prior art keywords
- target
- feature
- feature map
- rectangular frame
- sample image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 82
- 238000000605 extraction Methods 0.000 claims abstract description 71
- 238000004364 calculation method Methods 0.000 claims abstract description 12
- 238000010586 diagram Methods 0.000 claims description 43
- 238000000034 method Methods 0.000 claims description 31
- 238000012549 training Methods 0.000 claims description 24
- 230000009466 transformation Effects 0.000 claims description 12
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 claims description 10
- 239000011159 matrix material Substances 0.000 claims description 10
- 238000012545 processing Methods 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 7
- 238000012216 screening Methods 0.000 claims description 7
- 238000003672 processing method Methods 0.000 claims description 5
- 230000001131 transforming effect Effects 0.000 claims description 5
- 230000003321 amplification Effects 0.000 claims description 4
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 4
- 230000005764 inhibitory process Effects 0.000 claims description 2
- 230000006872 improvement Effects 0.000 description 11
- 230000008569 process Effects 0.000 description 9
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000001629 suppression Effects 0.000 description 2
- 230000003190 augmentative effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
- G06V20/13—Satellite images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/07—Target detection
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Multimedia (AREA)
- Life Sciences & Earth Sciences (AREA)
- Remote Sensing (AREA)
- Astronomy & Astrophysics (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种目标检测方法和装置,所述目标检测方法包括:对原始图像进行特征图计算,依次以不同倾斜方向对应的扫描框对待检测的特征图进行移动扫描,得到待进行目标特征提取的特征图;并对所述待进行目标特征提取的特征图进行特征向量的提取,再将所述特征向量输入预设的且与所述倾斜方向对应的目标分类器,以获取所述目标分类器输出的目标框的位置信息。采用本发明,通过对原始图像进行多方向的目标检测,以准确定位出目标的位置,从而提高对目标的检测精度和简便性。
Description
技术领域
本发明涉及图像处理技术领域,尤其涉及一种目标检测方法和装置。
背景技术
随着目标检测技术的需求不断增大,部分领域也出现了特定目标的检测需求,如俯拍的舰船目标等。相对于人脸检测、车牌检测等任务,在狭长倾斜目标的检测过程中,例如遥感图像中船舶类、行人类的旋转狭长目标,由于目标的姿态方向的不确定性,具有更高的难度。
在现有技术中,以舰船目标检测为例,传统检测方法大多是通过舰船目标的特征来获得舰船目标的大致姿态,然后将舰船目标提取后进行识别和定位。
然而,现有技术至少存在如下问题:在舰船目标的检测方法中,目标方向的确定会在较大程度上影响船舶姿态的获取结果,在分辨率较低的情况下,船舶方向的估计精度会变低,使得获取的船舶姿态效果不佳,影响目标检测结果的精度。并且,现有技术通常使用亮度特征提取目标方向时,该类特征难以对所有船舶目标有效,而更复杂的特征则会带来非常多的计算消耗。
发明内容
本发明实施例的目的是提供一种目标检测方法和装置,其能对原始图像进行多方向的目标检测,以准确定位出目标的位置,从而提高对目标的检测精度和简便性。
为实现上述目的,本发明实施例提供了一种目标检测方法,包括:
获取原始图像的待检测的特征图;
依次以不同的扫描框对所述待检测的特征图进行移动扫描,得到待进行目标特征提取的特征图;不同的所述扫描框内包括有对应倾斜方向的目标特征识别框,不同的扫描框内的目标特征识别框的倾斜方向不同;
对所述待进行目标特征提取的特征图进行目标特征提取,得到该特征图在对应倾斜方向上的特征向量;
将所述特征向量输入预设的且与所述倾斜方向对应的目标分类器,以判断所述待进行目标特征提取的特征图是否存在所述倾斜方向上的目标;
当判定所述待进行目标特征提取的特征图存在所述倾斜方向上的目标时,获取所述目标分类器输出的目标框的位置信息。
作为上述方案的改进,所述对所述待进行目标特征提取的特征图进行目标特征提取,得到该特征图在对应倾斜方向上的特征向量,具体包括:
利用预设的第一掩膜图像对所述待进行目标特征提取的特征图进行处理,以提取该特征图的特征值;
根据该特征图的特征值,形成所述该特征图在对应倾斜方向上的特征向量;
其中,所述预设的第一掩膜图像与所述待进行目标特征提取的特征图的大小相同,且所述预设的第一掩膜图像通过以下步骤生成:
在所述原始图像上,确定参与计算其对应的所述待检测的特征图上的每一像素点的像素集合;
判断所述像素集合中是否存在任一像素点位于对应的所述目标特征识别框内部,若是,则根据所述特征图上的该像素点的位置,将所述第一掩膜图像上的对应位置的像素值设为1,若否,则根据所述特征图上的该像素点的位置,将所述第一掩膜图像上的对应位置的像素值设为0。
作为上述方案的改进,任一倾斜方向对应的目标分类器通过以下方式训练得到:
获取若干张正样本图像;其中,每一所述正样本图像上包含处于第一倾斜方向上的目标;
对所述正样本图像进行缩放,以使所述正样本图像上的目标与预设的且与所述第一倾斜方向对应的第一矩形框相配合,并确定第二矩形框和第三矩形框内的正样本图像;其中,所述第二矩形框为根据所述第一矩形框按照预设的放大比例变换得到的,所述第三矩形框为所述第二矩形框的外接矩形框;
计算每一所述第三矩形框内的正样本图像的特征图,并对每一所述第三矩形框内的正样本图像的特征图进行目标特征提取,得到每一所述第三矩形框内的正样本图像的特征图在所述第一倾斜方向上的特征向量;
将每一所述第三矩形框内的正样本图像的特征图在所述第一倾斜方向上的特征向量输入分类器进行分类训练,以得到所述第一倾斜方向对应的目标分类器,用于检测所述第一倾斜方向上的目标。
作为上述方案的改进,所述对每一所述第三矩形框内的正样本图像的特征图进行目标特征提取,得到每一所述第三矩形框内的正样本图像的特征图在所述第一倾斜方向上的特征向量,具体包括:
利用预设的第二掩膜图像对每一所述第三矩形框内的正样本图像的特征图进行处理,以提取每一所述第三矩形框内的正样本图像的特征图的特征值;
根据每一所述第三矩形框内的正样本图像的特征图的特征值,形成每一所述第三矩形框内的正样本图像的特征图在所述第一倾斜方向上的特征向量;
其中,所述预设的第二掩膜图像与所述第三矩形框内的正样本图像的特征图的大小相同,且所述预设的第二掩膜图像通过以下步骤生成:
在所述第三矩形框内的正样本图像上,确定参与计算其对应的特征图上的每一像素点的像素集合;
判断所述像素集合中是否存在任一像素点位于对应的所述第二矩形框内部,若是,则根据所述特征图上的该像素点的位置,将所述第二掩膜图像上的对应位置的像素值设为1,若否,则根据所述特征图上的该像素点的位置,将所述第二掩膜图像上的对应位置的像素值设为0。
作为上述方案的改进,在所述将每一所述第三矩形框内的正样本图像的特征图在所述第一倾斜方向上的特征向量输入分类器进行分类训练,以得到所述第一倾斜方向对应的目标分类器之前,还包括:
获取若干张负样本图像;所述负样本图像上不包括所述第一倾斜方向上的目标,且所述负样本图像的大小与所述第一倾斜方向对应的所述第三矩形框的大小相同;
计算每一所述负样本图像的特征图,并对每一所述负样本图像的特征图进行特征提取,得到每一所述负样本图像的特征图在所述第一倾斜方向上的特征向量;
则,所述将每一所述第三矩形框内的正样本图像的特征图在所述第一倾斜方向上的特征向量输入分类器进行分类训练,以得到所述第一倾斜方向对应的目标分类器,具体包括:
将每一所述第三矩形框内的正样本图像的特征图在所述第一倾斜方向上的特征向量、及每一所述负样本图像的特征图在所述第一倾斜方向上的特征向量输入分类器进行分类训练,以得到所述第一倾斜方向对应的目标分类器。
作为上述方案的改进,在所述对获取若干张正样本图像之后,所述对所述正样本图像进行缩放之前,还包括步骤:
获取若干张扩充样本图像;其中,每一所述扩充样本图像上包含处于第二倾斜方向上的目标;其中,所述第二倾斜方向为不等于所述第一倾斜方向的其他倾斜方向;
将每一所述扩充样本图像变换为所述正样本图像,以扩充所述正样本图像的数量。
作为上述方案的改进,所述将每一所述扩充样本图像变换为所述正样本图像,以扩充所述正样本图像的数量,具体包括:
根据所述正样本图像上的第一矩形框的角点坐标信息,和扩充样本图像上的第一矩形框的角点坐标信息,得到仿射变换矩阵;所述扩充样本图像上的第一矩形框与所述扩充样本图像上的目标大小相配合;
根据所述正样本图像上的第三矩形框内的图像的点坐标信息,以及所述仿射变换矩阵,计算变换后的正样本图像的点坐标信息,从而得到变换后的正样本图像,以扩充原有的正样本图像的数量。
作为上述方案的改进,所述扫描框的大小与其对应倾斜方向所对应设置的第三矩形框的大小相同。
作为上述方案的改进,所述目标特征识别框与其对应倾斜方向所对应设置的第二矩形框的大小相同。
作为上述方案的改进,在所述当判定所述待进行目标特征提取的特征图存在所述倾斜方向上的目标时,获取所述目标分类器输出的目标框的位置信息之后,所述方法还包括:
对不同倾斜方向上检测到的所有所述目标框进行筛选,以得到满足预设条件的目标框的位置信息。
作为上述方案的改进,所述对不同倾斜方向上检测到的所有所述目标框进行筛选,以得到满足预设条件的目标框的位置信息,具体包括:
采用非极大值抑制处理方法,对不同倾斜方向上检测到的所有所述目标框进行筛选,以得到满足预设阈值条件的目标框的位置信息。
作为上述方案的改进,所述获取原始图像的待检测的特征图,具体为:
获取原始图像,对所述原始图像缩放至不同尺度大小,并计算不同尺度大小的原始图像的待检测的特征图;
则,依次对所述不同尺度大小的原始图像的待检测的特征图,执行:依次以不同的扫描框对所述待检测的特征图进行移动扫描,得到待进行目标特征提取的特征图。
本发明实施例还提供了一种目标检测装置,包括:
第一特征图获取模块,用于获取原始图像的待检测的特征图;
第二特征图获取模块,用于依次以不同的扫描框对所述待检测的特征图进行移动扫描,得到待进行目标特征提取的特征图;不同的所述扫描框内包括有对应倾斜方向的目标特征识别框,不同的扫描框内的目标特征识别框的倾斜方向不同;
特征向量提取模块,用于对所述待进行目标特征提取的特征图进行目标特征提取,得到该特征图在对应倾斜方向上的特征向量;
目标分类器计算模块,用于将所述特征向量输入预设的且与所述倾斜方向对应的目标分类器,以判断所述待进行目标特征提取的特征图是否存在所述倾斜方向上的目标;
目标框输出模块,用于当判定所述待进行目标特征提取的特征图存在所述倾斜方向上的目标时,获取所述目标分类器输出的目标框的位置信息。
本发明实施例还提供了一种目标检测装置,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现如上述任意一项所述的目标检测方法。
与现有技术相比,本发明公开的一种目标检测方法和装置,通过对原始图像进行特征图计算,依次以不同倾斜方向对应的扫描框对待检测的特征图进行移动扫描,得到待进行目标特征提取的特征图;并对所述待进行目标特征提取的特征图进行特征向量的提取,再将所述特征向量输入预设的且与所述倾斜方向对应的目标分类器,以获取所述目标分类器输出的目标框的位置信息。采用本发明实施例的技术手段,通过预先训练好的多个倾斜方向对应的目标分类器,对原始图像进行多个倾斜方向的目标检测。在确定的倾斜方向下进行目标检测,能够更准确地定位得到目标物体的位置信息,从而提高对目标的检测精度。
附图说明
图1是本发明实施例一提供的一种目标检测方法的步骤示意图;
图2是本发明实施例一中扫描框、目标特征识别框和目标框的示意图;
图3是本发明实施例二提供的第一倾斜方向对应的目标分类器的训练步骤示意图;
图4是本发明实施例二中第一矩形框、第二矩形框和第三矩形框的相对位置示意图;
图5是本发明实施例三提供的另一种目标检测方法的步骤示意图;
图6是本发明实施例四提供的一种目标检测装置的结构示意图;
图7是本发明实施例五提供的另一种目标检测装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参见图1,是本发明实施例一提供的第一种目标检测方法的步骤示意图。在本发明实施例中,所述目标检测方法,具体通过步骤S11至S15执行:
S11、获取原始图像的待检测的特征图。
需要说明的是,所述原始图像中包含有至少一目标物体,并且,每一目标物体在所述原始图像中均有对应确定的倾斜方向θ。记原始图像的水平向右方向为x轴正向,竖直向下方向为y轴正向,将目标物体的外接矩形框的长轴正方向与x轴正方向所形成的夹角,作为目标物体的倾斜方向θ。倾斜方向θ的取值范围为0到360°。
以行人作为目标物体为例,倾斜矩形框的长轴正方向可以选定为和头部一侧的长轴方向。例如在所述原始图像的水平地面方向为x轴方向情况下,直立的行人的倾斜方向θ=90°,平躺的行人的倾斜方向θ=0°或180°等。可以理解地,上述场景仅作为举例,并不构成对本发明的具体限定。
根据所述原始图像上的每一像素值,对所述原始图像进行特征图(featuremap)的计算,以获取到所述原始图像的待检测的特征图。
S12、依次以不同的扫描框对所述待检测的特征图进行移动扫描,得到待进行目标特征提取的特征图;不同的所述扫描框内包括有对应倾斜方向的目标特征识别框,不同的扫描框内的目标特征识别框的倾斜方向不同。
在获取到所述原始图像的待检测的特征图之后,需要对所述待检测的特征图进行多个倾斜方向的目标检测。
具体地,参见图2,是本发明实施例一中扫描框、目标特征识别框和目标框的示意图。针对每一倾斜方向θ均设置有对应的扫描框R3,不同的所述扫描框R3内包括有对应倾斜方向的目标特征识别框R2,不同的扫描框R3内的目标特征识别框R2的倾斜方向不同,并且,扫描框R3为目标特征识别框R2的外接矩形框。
按照预设的移动步长,以不同倾斜方向对应的扫描框R3对所述待检测的特征图进行移动扫描,得到待进行目标特征提取的特征图。每一个倾斜方向θ将会有若干个待进行目标特征提取的特征图。可以理解地,每一所述待进行目标特征提取的特征图的图像即为所述扫描框R3每次移动扫描后框内的图像。
S13、对所述待进行目标特征提取的特征图进行目标特征提取,得到该特征图在对应倾斜方向上的特征向量。
作为优选的实施方式,步骤S13具体包括步骤S131和S132:
S131、利用预设的第一掩膜图像对所述待进行目标特征提取的特征图进行处理,以提取该特征图的特征值;
S132、根据该特征图的特征值,形成所述该特征图在对应倾斜方向上的特征向量。
其中,所述预设的第一掩膜图像与所述待进行目标特征提取的特征图的大小相同,且所述预设的第一掩膜图像通过以下步骤生成:
S131’、在所述原始图像上,确定参与计算其对应的所述待检测的特征图上的每一像素点的像素集合;
S132’、判断所述像素集合中是否存在任一像素点位于对应的所述目标特征识别框内部,若是,则根据所述特征图上的该像素点的位置,将所述第一掩膜图像上的对应位置的像素值设为1,若否,则根据所述特征图上的该像素点的位置,将所述第一掩膜图像上的对应位置的像素值设为0。
在本发明实施例中,使用掩膜图像(Mask)去除非目标区域的特征值,以保留目标区域的特征值。以倾斜方向θ1为例,针对倾斜方向θ1设置对应的第一掩膜图像,第一掩膜图像与倾斜方向θ1对应的若干个待进行目标特征提取的特征图同大小,假定在计算特征图中像素p时需要用到原始图像上其他位置的像素点,则将参与计算的像素点记录为该像素p对应的像素集合R(p)。当判定像素集合R(p)中存在像素q,满足条件q在对应的所述目标特征识别框R2内部时,则第一掩膜图像在像素点p位置的取值Mask(p)=1,否则Mask(p)=0。即
进一步地,将满足Mask(p)=1的所有位置记录下来,按照一定顺序读取(如按行读取)相应位置的特征图的值,从而形成该特征图在倾斜方向θ1的特征向量。
S14、将所述特征向量输入预设的且与所述倾斜方向对应的目标分类器,以判断所述待进行目标特征提取的特征图是否存在所述倾斜方向上的目标。
S15、当判定所述待进行目标特征提取的特征图存在所述倾斜方向上的目标时,获取所述目标分类器输出的目标框的位置信息。
在本发明实施例中,每一倾斜方向θ均设置有对应的目标分类器M。并且,每一目标分类器已预先训练好,从而能够对输入的特征向量进行分析计算,判断计算得到的响应值是否满足阈值条件,从而判断是否存在该倾斜方向对应的目标框R1。若存在对应的目标框R1,则所述目标分类器M输出对应的目标框的位置信息,以此定位到在所述原始图像上的目标物体的位置。
采用本发明实施例的技术手段,通过预先训练好的多个倾斜方向对应的目标分类器,对原始图像进行多个倾斜方向的目标检测。在确定的倾斜方向下进行目标检测,能够更准确地定位得到目标物体的位置信息,从而提高对目标的检测精度。
作为优选的实施方式,为了提高目标物体的定位的准确性,在步骤S15之后,所述目标检测方法还包括步骤S16:
S16、对不同倾斜方向上检测到的所有所述目标框进行筛选,以得到满足预设条件的目标框的位置信息。
优选地,采用非极大值抑制处理方法,对不同倾斜方向上检测到的所有所述目标框进行筛选,以得到满足预设阈值条件的目标框的位置信息。
具体地,对不同倾斜方向对应的目标分类器输出的所有目标框rbox按照得分进行降序排序;依次遍历上述的降序排序后的目标框rbox.将当前遍历的rbox与比当前剩余的rbox进行交集运算得到相应的相交点集合,并根据判断相交点集合组成的凸边形的面积,计算每两个rbox的交并比IOU;对IOU大于预设阈值的rbox进行滤除,保留IOU小于设定阈值的rbox;从而得到最终的满足预设阈值条件的目标框。
由于目标分类器根据输入的特征向量进行分类计算,当响应值满足阈值条件时,判定存在对应倾斜方向的目标框并输出。在此情况下,可能存在目标分类器输出的目标框中的目标物不完整或代表性不高的情况,因此,在本发明实施例中,对目标分类器输出的所有目标框采用非极大值抑制的处理方法进行筛选,从而获得满足预设的阈值条件的目标框,作为最终能够准确定位目标物的目标框。
在其他实施方式下,还可以采用其他后处理方式,对目标分类器输出的目标框进行处理,例如,对相邻的两个互补的目标框进行拼接,以得到包括完整目标的目标框等,以进一步提高目标检测的精准性。在此不做具体限定。
本发明实施例提供了一种目标检测方法,通过对原始图像进行特征图计算,依次以不同倾斜方向对应的扫描框对待检测的特征图进行移动扫描,得到待进行目标特征提取的特征图;并对所述待进行目标特征提取的特征图进行特征向量的提取,再将所述特征向量输入预设的且与所述倾斜方向对应的目标分类器,以获取所述目标分类器输出的目标框的位置信息。采用本发明实施例的技术手段,通过预先训练好的多个倾斜方向对应的目标分类器,对原始图像进行多个倾斜方向的目标检测。在确定的倾斜方向下进行目标检测,能够更准确地定位得到目标物体的位置信息,从而提高对目标的检测精度。
参见图3,本发明实施例二提供的第一倾斜方向对应的目标分类器的训练步骤示意图。本发明实施例二在实施例一的基础上进一步实施。在本发明实施例二提供的目标倾斜方法中,任一倾斜方向对应的目标分类器通过以下步骤S21至S24训练得到:
S21、获取若干张正样本图像;其中,每一所述正样本图像上包含处于第一倾斜方向上的目标。
在本发明实施例中,以第一倾斜方向θ1为例,训练对应的目标分类器M1。获取若干张包含处于倾斜方向θ1上的目标物体的图像,作为训练目标分类器M1的正样本图像。
S22、对所述正样本图像进行缩放,以使所述正样本图像上的目标与预设的且与所述第一倾斜方向对应的第一矩形框相配合,并确定第二矩形框和第三矩形框内的正样本图像;其中,所述第二矩形框为根据所述第一矩形框按照预设的放大比例变换得到的,所述第三矩形框为所述第二矩形框的外接矩形框。
参见图4,是本发明实施例二中第一矩形框、第二矩形框和第三矩形框的相对位置示意图。通过对所述正样本图像进行缩放,使得所述正样本图像上的目标物体的大小刚好与所述第一矩形框RECT_1配合。也即,第一矩形框RECT_1即为目标框。
为了方便训练,在目标附近保留与目标长宽成比例的背景图像,按照预设的放大比例,得到保留背景的倾斜矩形框,作为第二矩形框RECT_2。进一步地,由于需要截取出图像,这里保证矩形框为非倾斜的,在第二矩形框RECT_2外接一个矩形框,得到第三矩形框RECT_3,第三矩形框的底边与x轴平行。
参见图4,矩形框RECT_1与RECT_2同中心且长宽比一致。假定RECT_2的长宽为(w2,h2),RECT_1的长宽为(w1,h1)。则有
w2=(1+2α)×w1
h2=(1+2α)×h1
α为预设的放大比例,且α>0。RECT_3为RECT_2的外接矩形框。
根据RECT_1和RECT_3的位置关系计算得到从RECT_1到RECT_3的变换方式H0。求解方式如下:
假定RECT_1的中心点为O,A1、B1为RECT_1上两个距离最近的角点,A2、B2为RECT_2上两个距离最近的角点,A3为RECT_3的角点,相对应坐标分别为(xO,yO)、(xA1,yA1)、(xB1,yB1)、(xA2,yA2)、(xB2,yB2)和(xA3,yA3)。其中(xA1,yA1)和(xA2,yA2)关系如下:
xA2=xA1+2α(xA1-xO)
yA2=yA1+2α(yA1-yO)
同样有
xB2=xB1+2α(xB1-xO)
yB2=yB1+2α(yB1-yO)
考虑A3和A2、B2的位置关系:
可以得到
xA3=xA2=xA1+2α(xA1-xO)
yA3=yB2=yB1+2α(yB1-yO)
S23、计算每一所述第三矩形框内的正样本图像的特征图,并对每一所述第三矩形框内的正样本图像的特征图进行目标特征提取,得到每一所述第三矩形框内的正样本图像的特征图在所述第一倾斜方向上的特征向量。
作为优选的实施方式,步骤S23具体通过步骤S231至S233执行:
S231、计算每一所述第三矩形框内的正样本图像的特征图;
S232、利用预设的第二掩膜图像对每一所述第三矩形框内的正样本图像的特征图进行处理,以提取每一所述第三矩形框内的正样本图像的特征图的特征值;
S233、根据每一所述第三矩形框内的正样本图像的特征图的特征值,形成每一所述第三矩形框内的正样本图像的特征图在所述第一倾斜方向上的特征向量;
其中,所述预设的第二掩膜图像与所述第三矩形框内的正样本图像的特征图的大小相同,且所述预设的第二掩膜图像通过以下步骤生成:
S231’、在所述第三矩形框内的正样本图像上,确定参与计算其对应的特征图上的每一像素点的像素集合;
S232’、判断所述像素集合中是否存在任一像素点位于对应的所述第二矩形框内部,若是,则根据所述特征图上的该像素点的位置,将所述第二掩膜图像上的对应位置的像素值设为1,若否,则根据所述特征图上的该像素点的位置,将所述第二掩膜图像上的对应位置的像素值设为0。
在本发明实施例中,使用掩膜图像Mask去除非目标区域的特征值,以保留目标区域的特征值。针对倾斜方向θ1设置对应的第二掩膜图像,第二掩膜图像与第三矩形框内的正样本图像的特征图同大小,假定在计算特征图中像素p时需要用到第三矩形框RECT_3上其他位置的像素点,则将参与计算的像素点记录为该像素p对应的像素集合R(p)。当判定像素集合R(p)中存在像素q,满足条件q在对应的所述第二矩形框RECT_2内部时,则第二掩膜图像Mask在像素点p位置的取值Mask(p)=1,否则Mask(p)=0。即
进一步地,将满足Mask(p)=1的所有位置记录下来,按照一定顺序读取(如按行读取)相应位置的特征图的值,从而形成所述第三矩形框内的正样本图像的特征图在第一倾斜方向θ1的特征向量。
S24、将每一所述第三矩形框内的正样本图像的特征图在所述第一倾斜方向上的特征向量输入分类器进行分类训练,以得到所述第一倾斜方向对应的目标分类器M1,用于检测所述第一倾斜方向θ1上的目标。
需要说明的是,在本发明实施例二提供的目标检测方法中,所述倾斜方向θ1对应设置的扫描框R3的大小与倾斜方向θ1对应设置的第三矩形框RECT_3的大小相同。也即,当采用所述第一倾斜方向θ1对应的目标分类器M1进行目标检测之前,应当采用与倾斜方向θ1对应设置的第三矩形框RECT_3同大小的扫描框R3,对所述原始图像的待检测的特征图进行移动扫描。
并且可以理解地,所述扫描框R3中的目标特征识别框R2也对应与倾斜方向θ1设置的所述第三矩形框中的第二矩形框的大小相同。
采用本发明实施例的技术手段,通过获取每一倾斜方向对应的正样本图像,分别训练得到每一倾斜方向对应的目标分类器,从而在目标检测过程中,通过预先训练好的多个倾斜方向对应的目标分类器,对原始图像进行多个倾斜方向的目标检测,更准确地定位得到目标物体的位置信息,从而提高对目标的检测精度。
作为优选的实施方式,为了进一步完善对目标分类器的训练过程,提高对所述第一倾斜方向对应的目标分类器的训练精度,在步骤S24之前,还包括步骤S25至S26:
S25、获取若干张负样本图像;所述负样本图像上不包括所述第一倾斜方向上的目标,且所述负样本图像的大小与所述第一倾斜方向对应的所述第三矩形框的大小相同;
S26、计算每一所述负样本图像的特征图,并对每一所述负样本图像的特征图进行特征提取,得到每一所述负样本图像的特征图在所述第一倾斜方向上的特征向量。
则,步骤S24,具体为:
S24’、将每一所述第三矩形框内的正样本图像的特征图在所述第一倾斜方向上的特征向量、及每一所述负样本图像的特征图在所述第一倾斜方向上的特征向量输入分类器进行分类训练,以得到所述第一倾斜方向对应的目标分类器。
在本发明实施例中,在对第一倾斜方向θ1对应的目标分类器M1进行训练的过程中,除了输入正样本图像对应的特征向量对目标分类器进行训练之外,还需要输入负样本图像对应的特征向量对目标分类器进行训练,从而增加目标分类器M1对样本分布的拟合度,进一步提高目标分类器的辨别能力。
作为优选的实施方式,由于在样本图像的获取过程中,除了第一倾斜方向θ1对应的正样本图像之外,还有许多其他倾斜方向对应的正样本图像,若只使用倾斜方向θ1的正样本图像做目标分类器M1的训练,容易因为正样本图像不足导致目标分类器训练精度不高的问题,因此需要将样本图像集中其他样本图像的倾斜方向变换到θ1上,用于对倾斜方向θ1对应的正样本图像进行扩充。
在本发明实施例中,在步骤S21之后,步骤S22之前,还包括步骤S21’:
S21’、获取若干张扩充样本图像;将每一所述扩充样本图像变换为所述正样本图像,以扩充所述正样本图像的数量。
其中,每一所述扩充样本图像上包含处于第二倾斜方向上的目标;其中,所述第二倾斜方向为不等于所述第一倾斜方向的其他倾斜方向。
具体包括以下步骤:
S211’、根据所述正样本图像上的第一矩形框的角点坐标信息,和扩充样本图像上的第一矩形框的角点坐标信息,得到仿射变换矩阵;所述扩充样本图像上的第一矩形框与所述扩充样本图像上的目标大小相配合;
S212’、根据所述正样本图像上的第三矩形框内的图像的点坐标信息,以及所述仿射变换矩阵,计算变换后的正样本图像的点坐标信息,从而得到变换后的正样本图像,以扩充原有的正样本图像的数量。
在本发明实施例中,所述扩充样本图像为获取的样本图像集里面,包含处于除第一倾斜方向之外的其他倾斜方向上的目标物体的正样本图像。因此,所述扩充样本图像包含第一矩形框rect_1的标注信息。
根据所述正样本图像上的第一矩形框RECT_1的角点坐标信息(x1,y1),和扩充样本图像上的第一矩形框rect_1的角点坐标信息(x1’,y1’),可以计算得到RECT_1到rect_1的仿射变换矩阵H1。
则,根据计算得到的仿射变换矩阵H1,可以获得所述正样本图像的第三矩形框RECT_3内的坐标点(x3,y3)对应的处于扩充样本图像上的坐标点信息(x3’,y3’)。
根据上述公式计算得到的点坐标(x3’,y3’)可能为小数,取最近位置的整数坐标点作为对应点,以此计算得到变换后的正样本图像的第三矩形框RECT_3内所有点的点坐标,通过获取对应点坐标位置的像素值信息,即可提取到倾向方向θ1对应的标准大小的正样本图像。
采用本发明实施例的技术手段,将样本图像集中其他样本图像的倾斜方向变换到θ1上,用于对倾斜方向θ1对应的正样本图像进行扩充,有效地增加了倾向方向θ1对应的正样本图像的数据量,从而解决因为正样本图像不足导致目标分类器训练精度不高的问题,提高了目标分类器的训练精度。
参见图5,是本发明实施例三提供的另一种目标检测方法的步骤示意图。本发明实施例三在实施例一或实施例二的基础上进一步实施,所述目标检测方法包括步骤S31至S36:
S31、获取原始图像,将所述原始图像缩放至不同尺度大小,并计算不同尺度大小的原始图像的待检测的特征图;
S32、依次对所述不同尺度大小的原始图像的待检测的特征图,执行:依次以不同的扫描框对所述待检测的特征图进行移动扫描,得到待进行目标特征提取的特征图;不同的所述扫描框内包括有对应倾斜方向的目标特征识别框,不同的扫描框内的目标特征识别框的倾斜方向不同;
S33、对所述待进行目标特征提取的特征图进行目标特征提取,得到该特征图在对应倾斜方向上的特征向量;
S34、将所述特征向量输入预设的且与所述倾斜方向对应的目标分类器,以判断所述待进行目标特征提取的特征图是否存在所述倾斜方向上的目标;
S35、当判定所述待进行目标特征提取的特征图存在所述倾斜方向上的目标时,获取所述目标分类器输出的目标框的位置信息。
在本发明实施例中,预先训练好的目标检测器适用于对某一倾斜方向上的一种尺度大小的目标的检测,例如,预先训练好的目标分类器M1适用于检测倾斜方向θ1,且尺度大小为16×32像素值的目标物体。基于此,为了能够全面地对所述原始图像上的不同尺度大小的目标物体进行检测,需要对所述原始图像进行多尺度检测。
在一种实施方式下,如本发明实施例三所述,预先设置多个不同尺度大小,对所述原始图像进行所述多个尺度大小的缩放,得到不同尺度大小的原始图,并计算不同尺度大小的原始图像的特征图。依次对每一尺度大小的原始图像的特征图,执行如实施例一所提供的目标检测方法,也即进行不同倾斜方向的目标检测。
作为举例,通过对原始图像进行缩小,从而使得原始图像上处于倾斜方向θ1、尺度大小为32×64像素值的目标物体,被缩放为尺度大小为16×32像素值的目标物体,从而,在使用上述目标分类器M1进行检测过程中,即可输出该目标物体对应的目标框。
在另一种实施方式下,为了减少计算量,可以直接获取所述原始图像的待检测的特征图,再对所述原始图像的待检测的特征图进行不同尺度大小的缩放和缩放后的细节处理操作,进而,依次对所述不同尺度大小的原始图像的待检测的特征图,执行:依次以不同的扫描框对所述待检测的特征图进行移动扫描,得到待进行目标特征提取的特征图。从而进行不同倾斜方向的目标检测,实现对原始图像的多尺度检测。
在又一种实施方式下,还可以预先训练不同尺度大小对应的不同倾斜方向的目标分类器。例如,针对不同的倾斜方向,均分别训练用于检测尺度大小为32×64像素值的目标物体和尺度大小为16×32像素值的目标物体的目标分类器。在目标检测过程中,直接获取所述原始图像的待检测的特征图,对所述原始图像的待检测的特征图,采用不同尺度大小的不同倾斜方向的目标分类器进行目标检测,从而实现对原始图像的多尺度检测。
可以理解地,上述实施方式仅作为举例,在实际应用中,可以根据实际情况采用上述方法对原始图像进行不同尺度大小的目标检测,也可以采用其他的处理方法对原始图像进行多尺度检测,均不影响本发明取得的有益效果。
本发明实施例三提供了一种目标检测方法,通过对原始图像进行特征图计算,依次以不同倾斜方向对应的扫描框对待检测的特征图进行移动扫描,得到待进行目标特征提取的特征图;并对所述待进行目标特征提取的特征图进行特征向量的提取,再将所述特征向量输入预设的且与所述倾斜方向对应的目标分类器,以获取所述目标分类器输出的目标框的位置信息。并对原始图像进行多尺度的目标检测,以得到所述原始图像上所有目标的目标框的位置信息。采用本发明实施例的技术手段,通过预先训练好的多个倾斜方向对应的目标分类器,对原始图像进行多尺度且多个倾斜方向的目标检测,从而更准确地定位得到目标物体的位置信息,提高对目标的检测精度。
参见图6,是本发明实施例四提供的一种目标检测装置的结构示意图。本发发明实施例四提供的一种目标检测装置40,包括:第一特征图获取模块41、第二特征图获取模块42、特征向量提取模块43、目标分类器计算模块44和目标框输出模块45;其中,
所述第一特征图获取模块41,用于获取原始图像的待检测的特征图。
所述第二特征图获取模块42,用于依次以不同的扫描框对所述待检测的特征图进行移动扫描,得到待进行目标特征提取的特征图;不同的所述扫描框内包括有对应倾斜方向的目标特征识别框,不同的扫描框内的目标特征识别框的倾斜方向不同。
所述特征向量提取模块43,用于对所述待进行目标特征提取的特征图进行目标特征提取,得到该特征图在对应倾斜方向上的特征向量。
所述目标分类器计算模块44,用于将所述特征向量输入预设的且与所述倾斜方向对应的目标分类器,以判断所述待进行目标特征提取的特征图是否存在所述倾斜方向上的目标。
所述目标框输出模块45,用于当判定所述待进行目标特征提取的特征图存在所述倾斜方向上的目标时,获取所述目标分类器输出的目标框的位置信息。
需要说明的是,本发明实施例提供的一种目标检测装置用于执行上述实施例一至三任意实施例的一种目标检测方法的所有流程步骤,两者的工作原理和有益效果一一对应,因而不再赘述。
参见图7,是本发明实施例五提供的另一种目标检测装置的结构示意图。本发发明实施例五提供的一种目标检测装置50,包括处理器51、存储器52以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现如实施例一至三任意一项所述的目标检测方法。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-OnlyMemory,ROM)或随机存储记忆体(RandomAccessMemory,RAM)等。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。
Claims (14)
1.一种目标检测方法,其特征在于,包括:
获取原始图像的待检测的特征图;
依次以不同的扫描框对所述待检测的特征图进行移动扫描,得到待进行目标特征提取的特征图;不同的所述扫描框内包括有对应倾斜方向的目标特征识别框,不同的扫描框内的目标特征识别框的倾斜方向不同;
对所述待进行目标特征提取的特征图进行目标特征提取,得到该特征图在对应倾斜方向上的特征向量;
将所述特征向量输入预设的且与所述倾斜方向对应的目标分类器,以判断所述待进行目标特征提取的特征图是否存在所述倾斜方向上的目标;
当判定所述待进行目标特征提取的特征图存在所述倾斜方向上的目标时,获取所述目标分类器输出的目标框的位置信息。
2.如权利要求1所述的目标检测方法,其特征在于,所述对所述待进行目标特征提取的特征图进行目标特征提取,得到该特征图在对应倾斜方向上的特征向量,具体包括:
利用预设的第一掩膜图像对所述待进行目标特征提取的特征图进行处理,以提取该特征图的特征值;
根据该特征图的特征值,形成所述该特征图在对应倾斜方向上的特征向量;
其中,所述预设的第一掩膜图像与所述待进行目标特征提取的特征图的大小相同,且所述预设的第一掩膜图像通过以下步骤生成:
在所述原始图像上,确定参与计算其对应的所述待检测的特征图上的每一像素点的像素集合;
判断所述像素集合中是否存在任一像素点位于对应的所述目标特征识别框内部,若是,则根据所述特征图上的该像素点的位置,将所述第一掩膜图像上的对应位置的像素值设为1,若否,则根据所述特征图上的该像素点的位置,将所述第一掩膜图像上的对应位置的像素值设为0。
3.如权利要求1所述的目标检测方法,其特征在于,任一倾斜方向对应的目标分类器通过以下方式训练得到:
获取若干张正样本图像;其中,每一所述正样本图像上包含处于第一倾斜方向上的目标;
对所述正样本图像进行缩放,以使所述正样本图像上的目标与预设的且与所述第一倾斜方向对应的第一矩形框相配合,并确定第二矩形框和第三矩形框内的正样本图像;其中,所述第二矩形框为根据所述第一矩形框按照预设的放大比例变换得到的,所述第三矩形框为所述第二矩形框的外接矩形框;
计算每一所述第三矩形框内的正样本图像的特征图,并对每一所述第三矩形框内的正样本图像的特征图进行目标特征提取,得到每一所述第三矩形框内的正样本图像的特征图在所述第一倾斜方向上的特征向量;
将每一所述第三矩形框内的正样本图像的特征图在所述第一倾斜方向上的特征向量输入分类器进行分类训练,以得到所述第一倾斜方向对应的目标分类器,用于检测所述第一倾斜方向上的目标。
4.如权利要求3所述的目标检测方法,其特征在于,所述对每一所述第三矩形框内的正样本图像的特征图进行目标特征提取,得到每一所述第三矩形框内的正样本图像的特征图在所述第一倾斜方向上的特征向量,具体包括:
利用预设的第二掩膜图像对每一所述第三矩形框内的正样本图像的特征图进行处理,以提取每一所述第三矩形框内的正样本图像的特征图的特征值;
根据每一所述第三矩形框内的正样本图像的特征图的特征值,形成每一所述第三矩形框内的正样本图像的特征图在所述第一倾斜方向上的特征向量;
其中,所述预设的第二掩膜图像与所述第三矩形框内的正样本图像的特征图的大小相同,且所述预设的第二掩膜图像通过以下步骤生成:
在所述第三矩形框内的正样本图像上,确定参与计算其对应的特征图上的每一像素点的像素集合;
判断所述像素集合中是否存在任一像素点位于对应的所述第二矩形框内部,若是,则根据所述特征图上的该像素点的位置,将所述第二掩膜图像上的对应位置的像素值设为1,若否,则根据所述特征图上的该像素点的位置,将所述第二掩膜图像上的对应位置的像素值设为0。
5.如权利要求3所述的目标检测方法,其特征在于,在所述将每一所述第三矩形框内的正样本图像的特征图在所述第一倾斜方向上的特征向量输入分类器进行分类训练,以得到所述第一倾斜方向对应的目标分类器之前,还包括:
获取若干张负样本图像;所述负样本图像上不包括所述第一倾斜方向上的目标,且所述负样本图像的大小与所述第一倾斜方向对应的所述第三矩形框的大小相同;
计算每一所述负样本图像的特征图,并对每一所述负样本图像的特征图进行特征提取,得到每一所述负样本图像的特征图在所述第一倾斜方向上的特征向量;
则,所述将每一所述第三矩形框内的正样本图像的特征图在所述第一倾斜方向上的特征向量输入分类器进行分类训练,以得到所述第一倾斜方向对应的目标分类器,具体包括:
将每一所述第三矩形框内的正样本图像的特征图在所述第一倾斜方向上的特征向量、及每一所述负样本图像的特征图在所述第一倾斜方向上的特征向量输入分类器进行分类训练,以得到所述第一倾斜方向对应的目标分类器。
6.如权利要求3所述的目标检测方法,其特征在于,在所述对获取若干张正样本图像之后,所述对所述正样本图像进行缩放之前,还包括步骤:
获取若干张扩充样本图像;其中,每一所述扩充样本图像上包含处于第二倾斜方向上的目标;其中,所述第二倾斜方向为不等于所述第一倾斜方向的其他倾斜方向;
将每一所述扩充样本图像变换为所述正样本图像,以扩充所述正样本图像的数量。
7.如权利要求6所述的目标检测方法,其特征在于,所述将每一所述扩充样本图像变换为所述正样本图像,以扩充所述正样本图像的数量,具体包括:
根据所述正样本图像上的第一矩形框的角点坐标信息,和扩充样本图像上的第一矩形框的角点坐标信息,得到仿射变换矩阵;所述扩充样本图像上的第一矩形框与所述扩充样本图像上的目标大小相配合;
根据所述正样本图像上的第三矩形框内的图像的点坐标信息,以及所述仿射变换矩阵,计算变换后的正样本图像的点坐标信息,从而得到变换后的正样本图像,以扩充原有的正样本图像的数量。
8.如权利要求3所述的目标检测方法,其特征在于,所述扫描框的大小与其对应倾斜方向所对应设置的第三矩形框的大小相同。
9.如权利要求3所述的目标检测方法,其特征在于,所述目标特征识别框与其对应倾斜方向所对应设置的第二矩形框的大小相同。
10.如权利要求1所述的目标检测方法,其特征在于,在所述当判定所述待进行目标特征提取的特征图存在所述倾斜方向上的目标时,获取所述目标分类器输出的目标框的位置信息之后,所述方法还包括:
对不同倾斜方向上检测到的所有所述目标框进行筛选,以得到满足预设条件的目标框的位置信息。
11.如权利要求10所述的目标检测方法,其特征在于,所述对不同倾斜方向上检测到的所有所述目标框进行筛选,以得到满足预设条件的目标框的位置信息,具体包括:
采用非极大值抑制处理方法,对不同倾斜方向上检测到的所有所述目标框进行筛选,以得到满足预设阈值条件的目标框的位置信息。
12.如权利要求1所述的目标检测方法,其特征在于,所述获取原始图像的待检测的特征图,具体为:
获取原始图像,对所述原始图像缩放至不同尺度大小,并计算不同尺度大小的原始图像的待检测的特征图;
则,依次对所述不同尺度大小的原始图像的待检测的特征图,执行:依次以不同的扫描框对所述待检测的特征图进行移动扫描,得到待进行目标特征提取的特征图。
13.一种目标检测装置,其特征在于,包括:
第一特征图获取模块,用于获取原始图像的待检测的特征图;
第二特征图获取模块,用于依次以不同的扫描框对所述待检测的特征图进行移动扫描,得到待进行目标特征提取的特征图;不同的所述扫描框内包括有对应倾斜方向的目标特征识别框,不同的扫描框内的目标特征识别框的倾斜方向不同;
特征向量提取模块,用于对所述待进行目标特征提取的特征图进行目标特征提取,得到该特征图在对应倾斜方向上的特征向量;
目标分类器计算模块,用于将所述特征向量输入预设的且与所述倾斜方向对应的目标分类器,以判断所述待进行目标特征提取的特征图是否存在所述倾斜方向上的目标;
目标框输出模块,用于当判定所述待进行目标特征提取的特征图存在所述倾斜方向上的目标时,获取所述目标分类器输出的目标框的位置信息。
14.一种目标检测装置,其特征在于,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至12中任意一项所述的目标检测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110228006.4A CN112926463B (zh) | 2021-03-02 | 2021-03-02 | 一种目标检测方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110228006.4A CN112926463B (zh) | 2021-03-02 | 2021-03-02 | 一种目标检测方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112926463A true CN112926463A (zh) | 2021-06-08 |
CN112926463B CN112926463B (zh) | 2024-06-07 |
Family
ID=76172973
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110228006.4A Active CN112926463B (zh) | 2021-03-02 | 2021-03-02 | 一种目标检测方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112926463B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115049734A (zh) * | 2022-08-12 | 2022-09-13 | 摩尔线程智能科技(北京)有限责任公司 | 在图像中定位目标物的方法和装置 |
CN115841571A (zh) * | 2023-02-23 | 2023-03-24 | 青岛创新奇智科技集团股份有限公司 | 物品陈列图像方向识别方法、装置、电子设备及存储介质 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102147851A (zh) * | 2010-02-08 | 2011-08-10 | 株式会社理光 | 多角度特定物体判断设备及多角度特定物体判断方法 |
CN108664970A (zh) * | 2018-05-17 | 2018-10-16 | 淘然视界(杭州)科技有限公司 | 一种快速目标检测方法、电子设备、存储介质及系统 |
CN108960230A (zh) * | 2018-05-31 | 2018-12-07 | 中国科学院自动化研究所 | 基于旋转矩形框的轻量化目标识别方法及装置 |
US20190130215A1 (en) * | 2016-04-21 | 2019-05-02 | Osram Gmbh | Training method and detection method for object recognition |
US20200151484A1 (en) * | 2018-02-13 | 2020-05-14 | Boe Technology Group Co., Ltd. | Sample acquisition method, target detection model generation method, target detection method, computing device and computer readable medium |
CN111563466A (zh) * | 2020-05-12 | 2020-08-21 | Oppo广东移动通信有限公司 | 人脸检测方法及相关产品 |
CN111611994A (zh) * | 2019-02-26 | 2020-09-01 | 北京嘀嘀无限科技发展有限公司 | 图像提取方法、装置、电子设备和存储介质 |
CN111914795A (zh) * | 2020-08-17 | 2020-11-10 | 四川大学 | 一种航拍图像中旋转目标检测方法 |
CN112037143A (zh) * | 2020-08-27 | 2020-12-04 | 腾讯音乐娱乐科技(深圳)有限公司 | 一种图像处理方法及装置 |
CN112329559A (zh) * | 2020-10-22 | 2021-02-05 | 空间信息产业发展股份有限公司 | 一种基于深度卷积神经网络的宅基地目标检测方法 |
-
2021
- 2021-03-02 CN CN202110228006.4A patent/CN112926463B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102147851A (zh) * | 2010-02-08 | 2011-08-10 | 株式会社理光 | 多角度特定物体判断设备及多角度特定物体判断方法 |
US20190130215A1 (en) * | 2016-04-21 | 2019-05-02 | Osram Gmbh | Training method and detection method for object recognition |
US20200151484A1 (en) * | 2018-02-13 | 2020-05-14 | Boe Technology Group Co., Ltd. | Sample acquisition method, target detection model generation method, target detection method, computing device and computer readable medium |
CN108664970A (zh) * | 2018-05-17 | 2018-10-16 | 淘然视界(杭州)科技有限公司 | 一种快速目标检测方法、电子设备、存储介质及系统 |
CN108960230A (zh) * | 2018-05-31 | 2018-12-07 | 中国科学院自动化研究所 | 基于旋转矩形框的轻量化目标识别方法及装置 |
CN111611994A (zh) * | 2019-02-26 | 2020-09-01 | 北京嘀嘀无限科技发展有限公司 | 图像提取方法、装置、电子设备和存储介质 |
CN111563466A (zh) * | 2020-05-12 | 2020-08-21 | Oppo广东移动通信有限公司 | 人脸检测方法及相关产品 |
CN111914795A (zh) * | 2020-08-17 | 2020-11-10 | 四川大学 | 一种航拍图像中旋转目标检测方法 |
CN112037143A (zh) * | 2020-08-27 | 2020-12-04 | 腾讯音乐娱乐科技(深圳)有限公司 | 一种图像处理方法及装置 |
CN112329559A (zh) * | 2020-10-22 | 2021-02-05 | 空间信息产业发展股份有限公司 | 一种基于深度卷积神经网络的宅基地目标检测方法 |
Non-Patent Citations (4)
Title |
---|
ZENGHUI ZHANG等: "Toward Arbitrary-Oriented Ship Detection With Rotated Region Proposal and Discrimination Networks", 《IEEE GEOSCIENCE AND REMOTE SENSING LETTERS》, vol. 15, no. 11, 30 November 2018 (2018-11-30), pages 1745 - 1749, XP011698971, DOI: 10.1109/LGRS.2018.2856921 * |
徐志京等: "自适应旋转区域生成网络的遥感图像舰船目标检测", 《激光与光电子学进展》, vol. 57, no. 24, 31 December 2020 (2020-12-31), pages 242805 - 1 * |
李英杰: "基于MSER的自然场景下多方向文本检测算法研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》, no. 2, 15 February 2021 (2021-02-15), pages 138 - 1374 * |
邢永生: "人脸识别系统的研究与开发", 《中国优秀硕士学位论文全文数据库 信息科技辑》, no. 9, 15 September 2016 (2016-09-15), pages 138 - 519 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115049734A (zh) * | 2022-08-12 | 2022-09-13 | 摩尔线程智能科技(北京)有限责任公司 | 在图像中定位目标物的方法和装置 |
CN115841571A (zh) * | 2023-02-23 | 2023-03-24 | 青岛创新奇智科技集团股份有限公司 | 物品陈列图像方向识别方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN112926463B (zh) | 2024-06-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4988408B2 (ja) | 画像認識装置 | |
CN107122737B (zh) | 一种道路交通标志自动检测识别方法 | |
US8447114B2 (en) | Method and apparatus for calculating pixel features of image data | |
US8792727B2 (en) | Image processing device, image processing method, and program | |
CN113508420B (zh) | 物体追踪装置、物体追踪方法以及存储介质 | |
JP5500024B2 (ja) | 画像認識方法及び装置並びにプログラム | |
US8526679B2 (en) | Image processing apparatus and image processing method | |
CN100561505C (zh) | 一种图像检测方法及装置 | |
KR101772438B1 (ko) | 도로 표지판 인식 시스템에서 막대형 신호를 검출하는 장치 및 방법 | |
JP4724638B2 (ja) | オブジェクト検出方法 | |
JP6095817B1 (ja) | 物体検出装置 | |
CN104036284A (zh) | 基于Adaboost算法的多尺度行人检测方法 | |
CN104574401A (zh) | 一种基于平行线匹配的图像配准方法 | |
CN112926463B (zh) | 一种目标检测方法和装置 | |
EP3093822A1 (en) | Displaying a target object imaged in a moving picture | |
US20120257822A1 (en) | Image processing apparatus, image processing method, and computer readable medium | |
CN114359591B (zh) | 一种融合边缘特征的自适应图像匹配算法 | |
Cicconet et al. | Mirror symmetry histograms for capturing geometric properties in images | |
CN110942473A (zh) | 一种基于特征点网格化匹配的运动目标跟踪检测方法 | |
Qin et al. | Traffic sign segmentation and recognition in scene images | |
JP5100688B2 (ja) | 対象物検出装置及びプログラム | |
CN112101139B (zh) | 人形检测方法、装置、设备及存储介质 | |
JP5335554B2 (ja) | 画像処理装置及び画像処理方法 | |
JP2014010633A (ja) | 画像認識装置、画像認識方法、及び画像認識プログラム | |
JP2012048326A (ja) | 画像処理装置及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |