CN112215032A - 图像中的目标识别方法、装置、电子设备及程序介质 - Google Patents

图像中的目标识别方法、装置、电子设备及程序介质 Download PDF

Info

Publication number
CN112215032A
CN112215032A CN201910616273.1A CN201910616273A CN112215032A CN 112215032 A CN112215032 A CN 112215032A CN 201910616273 A CN201910616273 A CN 201910616273A CN 112215032 A CN112215032 A CN 112215032A
Authority
CN
China
Prior art keywords
image
detected
point
template
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910616273.1A
Other languages
English (en)
Inventor
罗健彬
龚国基
凌彬智
万俊
成斯靖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KUKA Robotics Guangdong Co Ltd
Original Assignee
KUKA Robotics Guangdong Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KUKA Robotics Guangdong Co Ltd filed Critical KUKA Robotics Guangdong Co Ltd
Priority to CN201910616273.1A priority Critical patent/CN112215032A/zh
Publication of CN112215032A publication Critical patent/CN112215032A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • G06V10/443Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本公开提供了一种图像中的目标识别方法、装置、电子设备及程序介质,涉及机器视觉领域,所述方法包括:获取所述目标的图像模板,所述图像模板描述了所述目标具有的边缘点;基于待检测图像,确定与所述图像模板对应的待检测区域,确定所述待检测区域中与各所述边缘点一一对应的各待检测点;对所述图像模板中各边缘点,基于所述边缘点的方向向量、对应的待检测点的经过预设位移的各邻近点的方向向量,确定所述图像模板与所述待检测区域的相似度;基于所述图像模板与所述待检测区域的相似度,确定所述待检测区域中是否存在所述目标。本公开实施例能够提高对发生形变的图像的目标识别准确率。

Description

图像中的目标识别方法、装置、电子设备及程序介质
技术领域
本公开涉及机器视觉领域,具体涉及一种图像中的目标识别方法、装置、电子设备及程序介质。
背景技术
在机器视觉领域中,对图像中的目标进行识别时常常采用两种方法。一种方法是基于灰度值特征来进行检测,其缺点十分明显:极易受到光照影响;还有一种方法是基于几何特征来进行检测,该方法能一定程度抵抗光照影响,有效处理遮挡问题,但对于发生形变的目标进行识别时,效果不理想,识别准确率较低。
发明内容
本公开的一个目的在于提出一种图像中的目标识别方法、装置、电子设备及程序介质,能够提高对发生形变的目标的识别准确率。
根据本公开实施例的一方面,公开了一种图像中的目标识别方法,所述方法包括:获取所述目标的图像模板,所述图像模板描述了所述目标具有的边缘点;基于待检测图像,确定与所述图像模板对应的待检测区域,确定所述待检测区域中与各所述边缘点一一对应的各待检测点;对所述图像模板中各边缘点,基于所述边缘点的方向向量、对应的待检测点的经过预设位移的各邻近点的方向向量,确定所述图像模板与所述待检测区域的相似度;基于所述图像模板与所述待检测区域的相似度,确定所述待检测区域中是否存在所述目标。
根据本公开实施例的一方面,公开了一种图像中的目标识别终端,所述终端包括:获取模块,用于获取所述目标的图像模板,所述图像模板描述了所述目标具有的边缘点;第一确定模块,用于基于待检测图像,确定与所述图像模板对应的待检测区域,确定所述待检测区域中与各所述边缘点一一对应的各待检测点;第二确定模块,用于对所述图像模板中各边缘点,基于所述边缘点的方向向量、对应的待检测点的经过预设位移的各邻近点的方向向量,确定所述图像模板与所述待检测区域的相似度;第三确定模块,用于基于所述图像模板与所述待检测区域的相似度,确定所述待检测区域中是否存在所述目标。
根据本公开实施例的一方面,公开了一种图像中的目标识别终端,包括:存储器,存储有计算机可读指令;处理器,读取存储器存储的计算机可读指令,以执行如上所述的方法。
根据本公开实施例的一方面,公开了一种计算机程序介质,其上存储有计算机可读指令,当所述计算机可读指令被计算机的处理器执行时,使计算机执行如上所述的方法。
现有技术中通过几何特征进行图像中的目标识别时,无法有效对抗形变带来的影响。本公开实施例在进行目标识别,对于目标的边缘点与待检测图像中对应待检测点的相似度进行确定时,是根据该边缘点与对应待检测点的各邻近点进行对比来实现的。其中,在对比过程中,对应待检测点的各邻近点会进行一定的位移,从而模拟出目标的形变。在此基础上确定的边缘点与待检测点的相似度,能够有效适应目标发生形变这一情况,进而提高了在该情况下,对图像中目标的识别准确率。
本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本公开。
附图说明
通过参照附图详细描述其示例实施例,本公开的上述和其它目标、特征及优点将变得更加显而易见。
图1A-1B示出了根据本公开一个实施例的图像中的目标识别方法的一种实施方式。
图2A-2B示出了根据本公开一个实施例的图像中的目标识别方法的一种实施方式。
图3示出了根据本公开一个实施例的图像中的目标识别方法的流程图。
图4示出了根据本公开一个实施例的图像中的目标识别终端的模块图。
图5示出了根据本公开一个实施例的图像中的目标识别终端的硬件结构图。
图6示出了根据本公开一个实施例的图像中的目标识别的程序介质图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些示例实施方式使得本公开的描述将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。附图仅为本公开的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。
此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多示例实施方式中。在下面的描述中,提供许多具体细节从而给出对本公开的示例实施方式的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而省略所述特定细节中的一个或更多,或者可以采用其它的方法、组元、步骤等。在其它情况下,不详细示出或描述公知结构、方法、实现或者操作以避免喧宾夺主而使得本公开的各方面变得模糊。
附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
下面首先描述本公开实施例的两种实施方式。
图1A-1B示出本公开实施例的一种实施方式:图1A示出一在本公开实施例中被描述为目标的图像;图1B在本公开实施例中被描述为待检测图像。在该实施方式中,本公开实施例的目的在于识别出图1A所代表的目标是否在图1B中。
图2A-2B示出本公开实施例的另一种实施方式:图2A示出一分层图像,图2B示出一分层图像;图2A的底层图像为本公开实施例中所描述的目标,图2B的底层图像为本公开实施例中所描述的待检测图像。本公开实施例的目的在于识别出图2A的底层图像所代表的目标是否在图1B的底层图像中。
下面对本公开实施例的实施过程进行描述。
如图3所示,根据本公开一个实施例的一种图像中的目标识别方法,该方法包括:
步骤S310:获取所述目标的图像模板,所述图像模板描述了所述目标具有的边缘点;
步骤S320:基于待检测图像,确定与所述图像模板对应的待检测区域,确定所述待检测区域中与各所述边缘点一一对应的各待检测点;
步骤S330:对所述图像模板中各边缘点,基于所述边缘点的方向向量、对应的待检测点的经过预设位移的各邻近点的方向向量,确定所述图像模板与所述待检测区域的相似度;
步骤S340:基于所述图像模板与所述待检测区域的相似度,确定所述待检测区域中是否存在所述目标。
本公开实施例中,图像模板中存储着组成对应图像的各边缘点的信息,例如:每个边缘点的坐标、方向向量。其中,边缘点是指位于图像边缘的像素点;方向向量是指描述了对应像素点的梯度强度、方向的向量。
本公开实施例中,根据目标的图像模板中各边缘点与待检测图像中各对应待检测点的相似度,来确定目标是否在待检测图像中。其中,确定边缘点与对应待检测点的相似度时,本公开实施例并非是直接将边缘点与对应待检测点进行对比。而是通过对比边缘点与对应待检测点的经过预设位移的各邻近点,来评估该边缘点与该对应待检测点的相似度。
这样做的优点在于,能够很好地克服目标形变的影响。在通过几何特征相似程度来进行目标识别时,如果目标或者待检测图像中的任一图像发生了形变,就会导致形变区域的几何特征发生改变。这时,就会导致传统的基于几何特征的目标识别方法无法正确进行目标识别。
而本公开实施例通过对比边缘点与对应待检测点的各邻近点,来评估该边缘点与该对应待检测点的相似度,能够极大提高图像发生形变的情况时的目标识别准确率。这是因为,如果图像发生了形变,那么不仅形变区域中的待检测点会发生一定的位移,导致该待检测点的方向向量改变,而且该待检测点的一定范围内的各邻近点也会作出同样的位移,对应的方向向量也会作出改变。同时,由于形变是相对的:无论是目标发生了形变,还是待检测图像发生了形变,均可以看作是待检测图像相对于目标发生了形变。因此,通过将目标中的边缘点与待检测图像中对应待检测点的经过预设位移的各邻近点,进行方向向量上的对比,从而能够很好地对抗形变带来的影响,提高了目标识别的准确率。
下面参考图2A-2B所示的实施方式,对本公开实施例中各步骤的具体过程进行详细描述。
参考图2A-2B所示的实施方式进行描述的原因在于:图2A-2B所示的实施方式中,确定目标是否在待检测图像中时,是按照分层图像的层数,从上到下,依次在每层图像进行对比。由于分层图像的特点:层数越往上,图像包含的像素点就越少,进行对比时所要计算分析的数据也会相应减少。这样,如果待检测图像中并不包含目标,在对比分层目标图像的最上层图像、与分层待检测图像的最上层图像时,就能以较少的计算量确定出待检测图像中不包含目标这一结果;如果待检测图像中包含目标,在对比分层目标图像的最上层图像、与待检测分层图像的最上层图像时,就可以认为有较大的可能性待检测图像包含目标,从而作出初步判断。
因此,作为相比于图1A-1B更优的一种实施方式,以下对本公开实施例各步骤实施过程的具体描述,在无特别说明的情况下,均为参考图2A-2B进行的。
首先描述获取目标的图像模板这一步骤的实施过程。
在步骤S310中,获取所述目标的图像模板,所述图像模板描述了所述目标具体的边缘点。
本公开实施例中,是基于目标包含的各边缘点与待检测图像中对应待检测点的相似度,来确定目标是否所在待检测图像中的。因此,本公开实施例在确定目标的边缘点与待检测图像中对应待检测点的相似度之前,要确定目标具体包含哪些边缘点,即,获取目标的图像模板。
在一实施例中,所述获取所述目标的图像模板,包括:
获取所述目标的目标图像,作为分层目标图像的最底层图像;
构造分层目标图像中除最底层图像之外的其它层图像,其中每一层图像都是下一层图像的降采样图像;
基于对分层目标图像中每一层图像的边缘检测,获取每一层图像的图像模板。
该实施例中,获取目标的分层目标图像的原因在于:分层目标图像中,每一层图像都是下一层图像的降采样图像,而每次降采样都会降低下一层图像所包含的信息量,从而达到简化图像信息量的目的。
相应地,对每一层图像都要建立对应的图像模板,其中,图像模板描述了对应层的分层目标图像包含的各边缘点。
在一实施例中,分层目标图像中,每一层图像都是下一层图像的降采样图像,其中,对所述下一层图像进行降采样是通过以下方法进行的:用高斯核对下一层图像进行卷积,然后,删除所有偶数行和偶数列。这样,就得到了新一层图像。
通过这种方法得到的新一层图像的面积变为前一层图像的四分之一,同样,其包含的信息也变为前一层图像的四分之一。从而达到了简化图像所包含信息量的目的。
在一实施例中,在通过对下一层分层图像进行降采样以得到新一层图像时,会重复进行预定次数(例如:重复5次)的降采样后再将得到的图像作为新一层图像,以提高降采样的准确率。
下面描述获取分层目标图像中每一层图像的图像模板的过程。
在一实施例中,基于对分层目标图像中每一层图像的边缘检测,获取每一层图像的图像模板,包括:
对分层目标图像中每一层图像进行边缘检测,确定每一层图像包含的各边缘点;
按照预设的图像模板描述的边缘点信息项,将每一层图像包含的各边缘点信息按照所述边缘点信息项进行存储,分别得到每一层图像的图像模板。
在一实施例中,获取分层目标图像后,对每一层图像,进行边缘检测,提取出该层图像的各边缘点。按照预设的用于存储边缘点信息的模板,将有关各边缘点的信息进行存储,从而分别得到每一层图像的图像模板。
在一实施例中,图像模板描述的边缘点信息项包括:边缘点的坐标、边缘点的方向向量、边缘点K个邻近点的坐标,其中,K为事先确定的超参。例如:
Figure BDA0002124050930000071
Mrig为所述图像模板;i为边缘点的次序数;(ri,ci)为第i个边缘点的坐标;
Figure BDA0002124050930000072
表示第i个边缘点在图像模板Mrig中的方向向量;k为邻近点的个数;uik表示第i个边缘点的第k个邻近点;n为边缘点的个数。其中,边缘点的各邻近点,即,ui1,…,uik,是以坐标的形式存储在图像模板中的。
在一实施例中,边缘点的K个邻近点是指在该边缘点预定半径范围内的各边缘点。例如,该边缘点半径5个待检测点距离内的各边缘点。
在一实施例中,边缘点的K个邻近点是指沿该边缘点方向、距该边缘点最近的预定数目个的边缘点。例如:沿该边缘点正方向、距该边缘点最近的5个边缘点;沿该边缘点负方向、距该边缘点最近的5个边缘点。
通过建立描述了分层目标图像每一层图像包含的各边缘点的图像模板,使得后续过程中,能够从图像模板中快速调取出各边缘点的信息。
下面描述对分层目标图像中每一层图像进行边缘检测,以提取该层图像各边缘点的过程。
在一实施例中,所述对分层目标图像中每一层图像进行边缘检测,确定每一层图像包含的各边缘点,包括:
对每一层图像,使用高斯滤波器进行滤波;
确定所述滤波后的图像中每个像素点的方向向量;
基于每个像素点的方向向量,对每个像素点应用非极大值抑制,从而从所述经过非极大值抑制的像素点中确定出候选边缘点;
基于每个候选边缘点的方向向量,对每个候选边缘点应用双阈值检测,并进行相应的标记;
基于每个所述候选边缘点的标记,对每个候选边缘点进行筛选,确定所述图像包含的各边缘点。
候选边缘点是指用于从中确定边缘点的像素点。
在一实施例中,对分层目标图像中每一层图像进行边缘检测时,首先对该层图像进行滤波,滤除该层图像的噪声,从而使得后续过程中对该层图像进行各种处理时,能够减小噪声的影响,提高处理的准确率。
例如,可通过以下公式生成大小为(2k+1)x(2k+1)的高斯滤波器核:
Figure BDA0002124050930000081
进行滤波时,若图像中一个3x3的窗口为A,要滤波的像素点为e,则经过高斯滤波之后,像素点e的亮度值为:
Figure BDA0002124050930000082
对滤波后的该层图像,应用预设的边缘检测算子,计算其中每个像素点的方向向量。像素点的方向向量是指描述了该像素点的梯度强度、方向的向量,其中,梯度强度描述了对应像素点的灰度值的变化率,方向描述了对应像素点灰度值的变化走向。
例如,采用边缘检测的Sobel算子,返回水平Gx和垂直Gy方向的一阶导数值,由此便可以确定像素点的梯度强度G和方向θ:
Figure BDA0002124050930000083
其中,x和y方向的Sobel算子分别为:
Figure BDA0002124050930000084
对该层图像中的每个像素点,基于像素点的方向向量,应用非极大值抑制,确定候选边缘点:对每个像素点,将该像素点的梯度强度与分别在该像素点正负方向上的两个邻近点的梯度强度进行对比。如果该像素点的梯度强度最大,则将该像素点确定为候选边缘点;如果该像素点的梯度强度不是最大,则抑制该像素点,即,不将该像素点确定为候选边缘点。由此可见,候选边缘点是相比于相邻位置的像素点,更为接近边缘点的像素点。
从候选边缘点中确定边缘点时,首先对候选边缘点进行双阈值检测:预先设置有第一阈值、第二阈值,其中,第一阈值大于第二阈值。对每个候选边缘点,如果该候选边缘点的梯度强度大于/等于第一阈值,则将该候选边缘点确定为强边缘点;如果该候选边缘点的梯度强度小于第一阈值、且大于/等于第二阈值,则将该候选边缘点确定为弱边缘点;如果该候选边缘点的梯度强度小于第二阈值,则将该候选边缘点舍弃。
将各强边缘点确定为分层目标图像的边缘点;对于各弱边缘点,如果该弱边缘点邻近的8个像素点中有一个为强边缘点,则将该弱边缘点也确定为分层目标图像的边缘点,如果该弱边缘点邻近的8个像素点中没有任何一个为强边缘点,则将该弱边缘点舍弃。从而确定了该层图像包含的各边缘点,即,完成了对该层图像的边缘检测。
本公开实施例中,计算像素点的方向向量所应用的边缘检测算子包括但不限于Sobel算子、Laplace算子。
通过以上描述,完成了对本公开实施例中获取目标的图像模板这一步骤的具体过程的示例说明。
下面描述获取目标的图像模板后,确定与图像模板对应的待检测区域以及待检测区域中与各边缘点一一对应的各待检测点的过程。
在步骤S320中,基于待检测图像,确定与所述图像模板对应的待检测区域,确定所述待检测区域中与各所述边缘点一一对应的各待检测点。
为了确定待检测图像中是否存在所述目标,需要将目标的图像模板与待检测图像中的各待检测区域进行对比:如果一待检测区域中存在该目标,则说明待检测图像中存在该目标。
为此,需要确定待检测图像中与目标的图像模板对应的待检测区域、以及待检测区域中与目标包含的各边缘点一一对应的各待检测点,使得后续能够根据目标包含的各边缘点与各对应的待检测点的对比,确定图像模板与待检测区域的相似度,进而确定待检测区域中是否存在目标。
在一实施例中,所述基于待检测图像,确定与所述图像模板对应的待检测区域,包括:
获取待检测图像,作为分层待检测图像的最底层图像;
构造分层待检测图像中除最底层图像之外的其它层图像,所述分层待检测图像与分层目标图像具有相同的层数,其中,所述分层待检测图像中除最底层图像之外的其它层图像,每一层图像都是下一层图像的降采样图像;
将所述分层目标图像中最上层图像的图像模板作为当前被映射模板,将分层待检测图像的最上层图像作为当前映射目标图像,按不同映射规则,将当前被映射模板映射到当前映射目标图像上,分别所占据的区域分别作为多个当前待检测区域。
本公开实施例中,获取待检测图像的分层待检测图像的具体实施过程,与获取目标的分层目标图像的具体实施过程同理,故在此不再赘述。
在一实施例中,获取待检测图像的分层图像,即,分层待检测图像后,将分层目标图像中最上层图像的图像模板作为当前被映射模板,将分层待检测图像中最上层图像作为当前映射目标图像。按照不同映射规则,将当前被映射模板于当前映射目标图像上进行映射。每当当前被映射模板被映射到当前映射目标图像上,映射得到的区域即为当前待检测区域。
在一实施例中,所述按不同映射规则,将当前被映射模板映射到当前映射目标图像上,分别所占据的区域分别作为多个当前待检测区域,包括:
按照预设滑动规则,将当前被映射模板作为滑动窗口于当前映射目标图像上进行滑动,每滑动一次,将当前被映射模板映射到当前映射目标图像上所占据的区域作为一个当前待检测区域。
该实施例中,将当前被映射模板作为滑动窗口,按照预设滑动规则,于当前映射目标图像上进行滑动,以确定当前待检测区域。每滑动一次,滑动窗口都会在当前映射目标图像上映射得到一个新区域,将该新区域作为一个当前待检测区域。
在一实施例中,预设滑动规则为:滑动窗口的左边缘与当前映射目标图像的左边缘重合、滑动窗口的下边缘与当前映射目标图像的下边缘重合,按照从左往右、从下往上的顺序,依次滑动,直到滑动窗口的右边缘与当前映射目标图像的右边缘重合、滑动窗口的上边缘与当前映射目标图像的上边缘重合。其中,每次滑动,将滑动窗口滑动预定数目个像素点的距离,例如:5个像素点的距离。
在一实施例中,确定所述待检测区域中与各所述边缘点一一对应的各待检测点,包括:
确定所述多个当前待检测区域的每一个与各所述边缘点一一对应的各待检测点。
该实施例中,经过当前被映射模板于当前映射目标图像上的映射,得到了多个待检测区域,每次映射都得到一个待检测区域。所以,可以根据当前被映射模板在当前映射目标图像上进行映射的映射规则,在待检测区域(待检测区域位于当前映射目标图像)中找到与各边缘点(各边缘点位于当前被映射模板)一一对应的各待检测点。
通过以上描述,完成了对确定待检测区域、以及待检测区域中与各边缘点一一对应的各待检测点的示例说明。
在一实施例中,在所述对所述图像模板中各边缘点,基于所述边缘点的方向向量、对应的待检测点的经过预设位移的各邻近点的方向向量,确定所述图像模板与所述待检测区域的相似度之前,所述方法包括:
根据预设的旋转检索表,对图像模板中各边缘点的方向向量进行相应的旋转,以更新所述各边缘点的方向向量,所述旋转检索表描述了对边缘点的方向向量的旋转操作。
本公开实施例中,在确定图像模板与待检测区域的相似度之前,根据预设的旋转检索表,对图像模板中各边缘点的方向向量进行相应的旋转,以更新各边缘点的方向向量。具体到参照图2A-2B所示的实施方式,在确定当前被映射模板与待检测区域的相似度之前,根据预设的旋转检索表,对当前被映射模板中各边缘点的方向向量进行相应的旋转,以更新各边缘点的方向向量。
对图像模板进行旋转检索,是为了应对目标或者待检测图像中任一发生了旋转的情况,从而能够更加精准地进行图像中的目标识别。
下面描述基于边缘点的方向向量、对应的待检测点的经过预设位移的各邻近点的方向向量,确定图像模板与待检测区域的相似度的过程。
在步骤S320中,对所述图像模板中各边缘点,基于所述边缘点的方向向量、对应的待检测点的经过预设位移的各邻近点的方向向量,确定所述图像模板与所述待检测区域的相似度。
在一实施例中,步骤S320包括:
对所述当前被映射模板中各边缘点,基于所述边缘点的方向向量、对应的待检测点的经过预设位移的各邻近点的方向向量,确定所述当前被映射模板与所述多个当前待检测区域的每一个的相似度。
该实施例中,每当当前被映射模板在当前映射目标图像上进行一次映射,都会得到一个当前待检测区域。进行目标识别时,对每个当前待检测区域,都要确定当前被映射模板与该待检测区域的相似度。
在一实施例中,对所述当前被映射模板中各边缘点,基于所述边缘点的方向向量、对应的待检测点的经过预设位移的各邻近点的方向向量,确定所述当前被映射模板与所述多个当前待检测区域的每一个的相似度,包括:
对所述当前被映射模板中各边缘点,获取所述边缘点的方向向量;
对每一个当前待检测区域,按照预设位移表,不断对所述待检测区域中与所述边缘点对应的待检测点的各邻近点进行统一位移,直到穷尽所述位移表描述的位移;
每进行一次所述统一位移后,获取所述各邻近点的方向向量,计算所述边缘点的方向向量与所述各邻近点的方向向量的余弦距离的均值;
将最大的所述余弦距离的均值确定为所述边缘点与所述对应的待检测点的相似度;
将各边缘点与对应待检测点的相似度的均值,确定为所述当前被映射模板与所述当前待检测区域的相似度。
在一实施例中,确定当前被映射模板与待检测区域的相似度时,是通过确定当前被映射模板中各边缘点、与待检测区域中各对应待检测点的相似度进行衡量的。
对当前被映射模板中一边缘点,获取该边缘点的方向向量;并确定待检测区域中的对应待检测点。确定边缘点与对应待检测点的相似度时,按照预设位移表,对该对应待检测点的各邻近点进行一次统一位移,例如:统一沿X轴移动1个像素点的距离后,再沿Y轴移动2个像素点的距离。其中,预设位移表描述了各种位移的具体内容。
每当对各邻近点进行统一位移后,确定位移后的各邻近点的方向向量。计算各邻近点的方向向量与该边缘点的方向向量的余弦距离,并进行平均,得到余弦距离的均值。如下公式所示:
Figure BDA0002124050930000131
其中,sl(r,c,i)为坐标为(r,c)的第i个边缘点与对应待检测点的相似度;T1为第i个边缘点所进行的位移(由于位移是相对的,本公开实施例所示的:边缘点不动,边缘点的对应待检测点的各邻近点进行位移;与该公式所示的:边缘点进行位移,边缘点的对应待检测点的各邻近点不动,实质上是相同的),k为对应待检测点的各邻近点的个数,j为对应待检测点的各邻近点的次序数,
Figure BDA0002124050930000132
为第i个边缘点的对应待检测点的第j个邻近点的方向向量,
Figure BDA0002124050930000133
为第i个边缘点进行位移后的方向向量。
由此可见,每进行一次统一位移,都会计算得到一个余弦距离均值。穷尽了位移表中描述的所有位移后,将余弦距离均值中最大的确定为该边缘点与对应待检测点的相似度。
进而,将各边缘点与各对应待检测点的相似度的均值确定为当前被映射模板与所述当前待检测区域的相似度,如下公式所示:
Figure BDA0002124050930000134
sg为当前被映射模板与当前待检测区域的相似度;n为当前被映射模板中边缘点的个数;sl(r,c,i)为坐标为(r,c)的第i个边缘点与对应待检测点的相似度;i为当前被映射模板中边缘点的次序数。
该实施例的优点在于,通过对对应待检测点的邻近点进行统一位移,模拟了对应区域发生形变的情况,使得计算出的边缘点与对应待检测点的相似度能够对抗形变的影响,进而使得计算出的当前被映射模板与所述当前待检测区域的相似度能够对抗形变的影响,更加准确、可靠。
在一实施例中,对应待检测点的各邻近点是指在当前映射目标图像上,以所述对应的待检测点为中心,将预设半径内的各像素点作为所述各邻近点。例如,以该待检测点为中心,半径5个像素点距离内的各像素点,即为该待检测点的各邻近点。
在一实施例中,对应待检测点的各邻近点是指沿该待检测点方向的预定数目个的点。例如:沿该待检测点正方向最近的5个像素点、以及沿该待检测点负方向最近的5个像素点,即为该待检测点的各邻近点。
在一实施例中,每次对所述各邻近点进行一次统一位移的同时,对所述对应待检测点也进行相同的位移,在将最大的所述余弦距离的均值确定为所述边缘点与所述对应的待检测点的相似度之后,包括:
获取各所述对应待检测点的位移信息、以及进行位移后的坐标信息;
对所述各对应待检测点,基于所述位移信息、以及进行位移后的坐标信息,获取对应的位移点模板,所述位移点模板描述了该次当前被映射模板映射后,在一定位移范围内,待检测区域中与所述各边缘点最为相似的各对应待检测点。
该实施例中,每当确定当前被映射模板中一边缘点、与当前待检测区域中对应待检测点的相似度时,都会将该对应待检测点的各邻近点连同该对应待检测点,进行多次的统一位移,每次统一位移,都会得到一个上述余弦距离均值。将最大余弦距离均值对应的那次统一位移中,该对应待检测点的位移信息存储在位移点模板中。例如:Mdef={r,c,Mrig,dri,dci},Mdef为所述位移点模板;(r,c)为最大余弦距离均值对应的那次统一位移中,对应待检测点进行位移后的坐标信息;Mrig为对应待检测点在当前待检测区域的原坐标信息;(dri,dci)为最大余弦距离均值对应的那次统一位移中,对应待检测点作出的位移信息。
在一实施例中,位移点模板存储着各对应检测点在当前待检测区域的原坐标信息、位移信息、进行位移后的坐标信息。
通过以上描述,完成了对本公开实施中确定图像模板与待检测区域的相似度这一步骤的示例说明。
下面描述基于图像模板与待检测区域的相似度,确定待检测区域中是否存在目标的过程。
在一实施例中,基于所述当前被映射模板与所述多个当前待检测区域中每一个的相似度,确定所述多个当前待检测区域的每一个中是否存在所述目标,包括:
如果所述当前被映射模板与一所述当前待检测区域的相似度大于预定阈值,则确定该当前待检测区域中存在所述目标。
该实施例中,对一当前待检测区域,若所述相似度的均值大于预定阈值(例如:95%),则说明当前被映射模板在映射到当前映射目标图像上时,当前被映射模板中各边缘点与得到的待检测区域中各待检测点足够相似,从而能够认为:在最上层图像(最上层分层目标图像与最上层分层待检测图像)的基础上,可以被视为该当前待检测区域中存在于该目标。需要说明的是,这里提到的目标只是对应于最上层分层目标图像的,并不等同于本公开实施例最终要确定的目标(即,底层分层目标图像对应的目标)。
由于相比于未经过降采样的底层图像,即,分层目标图像的底层图像与分层待检测图像的底层图像,除了底层图像的每一层图像的信息都是缺失的。因此,在最上层图像中确定的当前待检测区域中存在目标这一结果,仅仅是在缺失了图像信息的最上层图像的基础上得到的,无法用来直接确定分层待检测图像的底层图像的待检测区域中、是否存在分层目标图像的底层图像中的目标。
通过以上描述,完成了对在最上层图像中,确定待检测区域中是否存在目标的这一步骤的示例说明。
下面描述在确定了最上层图像中,待检测区域中是否存在目标之后,确定最底层图像中,待检测区域中是否存在目标的过程。
在一实施例中,在基于所述图像模板与所述待检测区域的相似度,确定所述待检测区域中是否存在所述目标之后,所述方法还包括:
如果确定一个当前待检测区域存在所述目标,用所述分层目标图像中当前被映射模板的下一层图像更新所述当前被映射模板,用当前映射目标图像的下一层图像更新所述当前映射目标图像,按不同映射规则,将当前被映射模板映射到当前映射目标图像上,以分别所占据的区域分别更新所述多个当前待检测区域;
确定所述多个当前待检测区域中与当前被映射模板的目标边缘点一一对应的各待检测点;
对所述当前被映射模板中各边缘点,基于所述边缘点的方向向量、对应的待检测点的经过预设位移的各邻近点的方向向量,确定所述当前被映射模板与所述多个当前待检测区域的每一个的相似度;
如果所述当前被映射模板与一个待检测区域的相似度满足预定条件,确定所述待检测区域中存在所述目标,重复用从所述分层目标图像中当前被映射模板的下一层图像更新所述当前被映射模板开始的过程,直到到达分层待检测图像的最底层图像,在最底层图像中存在所述目标的待检测区域确定为目标定位区域。
在一实施例中,在最上层图像中,确定了一个当前待检测区域存在目标后,用下一层分层目标图像更新当前被映射模板,即,用下一层分层目标图像包含的边缘点更新当前被映射模板,使得当前被映射模板描述的是下一层分层目标图像包含的边缘点;用下一层分层待检测图像更新当前映射目标图像,即,将下一层分层待检测图像作为当前映射目标图像。按不同映射规则(例如:按照预设滑动规则,将当前被映射模板作为滑动窗口在当前映射目标图像上进行滑动),将分别所占据的区域更新为多个当前待检测区域。
确定各当前待检测区域与当前被映射模板的各边缘点一一对应的各待检测点。对当前被映射模板中各边缘点,基于该边缘点的方向向量、对应的待检测点的经过预设位移的各邻近点的方向向量,确定所述当前被映射模板与所述多个当前待检测区域的每一个的相似度。如果当前被映射模板与一个待检测区域的相似度满足预定条件(例如,大于预定阈值),确定该待检测区域中存在目标。
至此,完成了在最上层图像的下一层图像中,确定待检测区域中是否存在目标的过程。
在每一层分层图像中,若确定待检测区域中存在目标,则重复用当前被映射模板的下一层图像更新当前被映射模板、用当前映射目标图像的下一层图像更新当前映射目标图像、更新当前待检测区域、确定当前待检测区域是否存在目标的过程,直到到达分层待检测图像的最底层图像,将在最底层图像中存在所述目标的待检测区域确定为目标定位区域。
在一实施例中,若在其中一层的分层待检测图像中所确定的各个待检测区域中均不存在目标,则确定分层待检测图像的最底层图像中不存在目标,即,待检测图像中不存在目标。
通过以上描述,完成了在参考图2A-2B所示的实施方式下,确定待检测图像中是否存在目标、以及目标所在确切区域,即,目标定位区域的这一过程的示例说明。
对于参考图1A-1B所示的实施方式实施的本公开实施例,与图2A-2B所示的实施方式相比,参考图1A-1B所示的实施方式实施该图像中的目标识别的方法的过程,与参考图2A-2B所示的实施方式中、确定在分层目标图像的最上层图像中的目标是否存在于分层待检测图像的最上层图像的待检测区域中的过程同理。与参考图2A-2B所示的实施方法区别在于:参考图1A-1B所示的实施方式实施该图像中的目标识别方法的过程,不存在更新当前被映射模板、更新当前映射目标图像、更新待检测区域这些过程;图1A-1B所示的实施方式只对一层图像,即,未经过分层的目标以及未经过分层的待检测图像,进行图像中的目标识别。故参考图1A-1B所示的实施方式的该图像中的目标识别方法各步骤的具体实施过程,在此不再赘述。
根据本公开实施例,如图4所示,还提供了一种图像中的目标识别终端,所述终端包括:
获取模块,用于获取所述目标的图像模板,所述图像模板描述了所述目标具有的边缘点;
第一确定模块,用于基于待检测图像,确定与所述图像模板对应的待检测区域,确定所述待检测区域中与各所述边缘点一一对应的各待检测点;
第二确定模块,用于对所述图像模板中各边缘点,基于所述边缘点的方向向量、对应的待检测点的经过预设位移的各邻近点的方向向量,确定所述图像模板与所述待检测区域的相似度;
第三确定模块,用于基于所述图像模板与所述待检测区域的相似度,确定所述待检测区域中是否存在所述目标。
在一实施例中,所述获取所述目标的图像模板,包括:
获取所述目标的目标图像,作为分层目标图像的最底层图像;
构造分层目标图像中除最底层图像之外的其它层图像,其中每一层图像都是下一层图像的降采样图像;
基于对分层目标图像中每一层图像的边缘检测,获取每一层图像的图像模板;
所述基于待检测图像,确定与所述图像模板对应的待检测区域,包括:
获取待检测图像,作为分层待检测图像的最底层图像;
构造分层待检测图像中除最底层图像之外的其它层图像,所述分层待检测图像与分层目标图像具有相同的层数,其中,所述分层待检测图像中除最底层图像之外的其它层图像,每一层图像都是下一层图像的降采样图像;
将所述分层目标图像中最上层图像的图像模板作为当前被映射模板,将分层待检测图像的最上层图像作为当前映射目标图像,按不同映射规则,将当前被映射模板映射到当前映射目标图像上,分别所占据的区域分别作为多个当前待检测区域;
所述确定所述待检测区域中与各所述边缘点一一对应的各待检测点,包括:
确定所述多个当前待检测区域的每一个与各所述边缘点一一对应的各待检测点;
所述对所述图像模板中各边缘点,基于所述边缘点的方向向量、对应的待检测点的经过预设位移的各邻近点的方向向量,确定所述图像模板与所述待检测区域的相似度,包括:
对所述当前被映射模板中各边缘点,基于所述边缘点的方向向量、对应的待检测点的经过预设位移的各邻近点的方向向量,确定所述当前被映射模板与所述多个当前待检测区域的每一个的相似度;
所述基于所述图像模板与所述待检测区域的相似度,确定所述待检测区域中是否存在所述目标,包括:
基于所述当前被映射模板与所述多个当前待检测区域中每一个的相似度,确定所述多个当前待检测区域的每一个中是否存在所述目标;
在基于所述图像模板与所述待检测区域的相似度,确定所述待检测区域中是否存在所述目标之后,所述方法还包括:
如果确定一个当前待检测区域存在所述目标,用所述分层目标图像中当前被映射模板的下一层图像更新所述当前被映射模板,用当前映射目标图像的下一层图像更新所述当前映射目标图像,按不同映射规则,将当前被映射模板映射到当前映射目标图像上,以分别所占据的区域分别更新所述多个当前待检测区域;
确定所述多个当前待检测区域中与当前被映射模板的各边缘点一一对应的各待检测点;
对所述当前被映射模板中各边缘点,基于所述边缘点的方向向量、对应的待检测点的经过预设位移的各邻近点的方向向量,确定所述当前被映射模板与所述多个当前待检测区域的每一个的相似度;
如果所述当前被映射模板与一个待检测区域的相似度满足预定条件,确定所述待检测区域中存在所述目标,重复从用所述分层目标图像中当前被映射模板的下一层图像更新所述当前被映射模板开始的过程,直到到达分层待检测图像的最底层图像,将在最底层图像中存在所述目标的待检测区域确定为目标定位区域。
在一实施例中,所述基于对分层目标图像中每一层图像的边缘检测,获取每一层图像的图像模板,包括:
对分层目标图像中每一层图像进行边缘检测,确定每一层图像包含的各边缘点;
按照预设的图像模板描述的边缘点信息项,将每一层图像包含的各边缘点信息按照所述边缘点信息项进行存储,分别得到每一层图像的图像模板。
在一实施例中,所述对分层目标图像中每一层图像进行边缘检测,确定每一层图像包含的各边缘点,包括:
对每一层图像,使用高斯滤波器进行滤波;
确定所述滤波后的图像中每个像素点的方向向量;
基于每个像素点的方向向量,对每个像素点应用非极大值抑制,从而从所述经过非极大值抑制的像素点中确定出候选边缘点;
基于每个候选边缘点的方向向量,对每个候选边缘点应用双阈值检测,并进行相应的标记;
基于每个所述候选边缘点的标记,对每个候选边缘点进行筛选,确定所述图像包含的各边缘点。
在一实施例中,所述按不同映射规则,将当前被映射模板映射到当前映射目标图像上,分别所占据的区域分别作为多个当前待检测区域,包括:
按照预设滑动规则,将当前被映射模板作为滑动窗口于当前映射目标图像上进行滑动,每滑动一次,将当前被映射模板映射到当前映射目标图像上所占据的区域作为一个当前待检测区域。
在一实施例中,在所述对所述图像模板中各边缘点,基于所述边缘点的方向向量、对应的待检测点的经过预设位移的各邻近点的方向向量,确定所述图像模板与所述待检测区域的相似度之前,所述方法包括:
根据预设的旋转检索表,对图像模板中各边缘点的方向向量进行相应的旋转,以更新所述各边缘点的方向向量,所述旋转检索表描述了对边缘点的方向向量的旋转操作。
在一实施例中,所述对所述当前被映射模板中各边缘点,基于所述边缘点的方向向量、对应的待检测点的经过预设位移的各邻近点的方向向量,确定所述当前被映射模板与所述多个当前待检测区域的每一个的相似度,包括:
对所述当前被映射模板中各边缘点,获取所述边缘点的方向向量;
对每一个当前待检测区域,按照预设位移表,不断对所述待检测区域中与所述边缘点对应的待检测点的各邻近点进行统一位移,直到穷尽所述位移表描述的位移;
每进行一次所述统一位移后,获取所述各邻近点的方向向量,计算所述边缘点的方向向量与所述各邻近点的方向向量的余弦距离的均值;
将最大的所述余弦距离的均值确定为所述边缘点与所述对应的待检测点的相似度;
将各边缘点与对应待检测点的相似度的均值,确定为所述当前被映射模板与所述当前待检测区域的相似度。
在一实施例中,所述各邻近点包括:在当前映射目标图像上,以所述对应的待检测点为中心,将预设半径内的各像素点,作为所述各邻近点。
在一实施例中,所述基于所述当前被映射模板与所述多个当前待检测区域中每一个的相似度,确定所述多个当前待检测区域的每一个中是否存在所述目标,包括:
如果所述当前被映射模板与一所述当前待检测区域的相似度大于预定阈值,则确定该当前待检测区域中存在所述目标。
本公开实施例的图像中的目标识别方法可以由图5所示的图像中的目标识别终端400实现。下面参考图5来描述根据本公开实施例的图像中的目标识别终端400。图5显示的图像中的目标识别终端400仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图5所示,图像中的目标识别终端400以通用计算设备的形式表现。图像中的目标识别终端400的组件可以包括但不限于:上述至少一个处理单元510、上述至少一个存储单元520、连接不同系统组件(包括存储单元520和处理单元510)的总线530。
其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元510执行,使得所述处理单元510执行本说明书上述示例性方法的描述部分中描述的根据本发明各种示例性实施方式的步骤。例如,所述处理单元510可以执行如图4中所示的各个步骤。
存储单元520可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)5201和/或高速缓存存储单元5202,还可以进一步包括只读存储单元(ROM)5203。
存储单元520还可以包括具有一组(至少一个)程序模块5205的程序/实用工具5204,这样的程序模块5205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线530可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
图像中的目标识别终端400也可以与一个或多个外部设备600(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该图像中的目标识别终端400交互的设备通信,和/或与使得该图像中的目标识别终端400能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口550进行。并且,图像中的目标识别终端400还可以通过网络适配器560与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器560通过总线530与图像中的目标识别终端400的其它模块通信。应当明白,尽管图中未示出,可以结合图像中的目标识别终端400使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本公开实施方式的方法。
在本公开的示例性实施例中,还提供了一种计算机程序介质,其上存储有计算机可读指令,当所述计算机可读指令被计算机的处理器执行时,使计算机执行上述方法实施例部分描述的方法。
参考图6所示,描述了根据本公开实施例的用于实现上述方法的程序产品600,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
此外,尽管在附图中以特定顺序描述了本公开中方法的各个步骤,但是,这并非要求或者暗示必须按照该特定顺序来执行这些步骤,或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选的,可以省略某些步骤,将多个步骤合并为一个步骤执行,以及/或者将一个步骤分解为多个步骤执行等。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、移动终端、或者网络设备等)执行根据本公开实施方式的方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由所附的权利要求指出。

Claims (12)

1.一种图像中的目标识别方法,其特征在于,所述方法包括:
获取所述目标的图像模板,所述图像模板描述了所述目标具有的边缘点;
基于待检测图像,确定与所述图像模板对应的待检测区域,确定所述待检测区域中与各所述边缘点一一对应的各待检测点;
对所述图像模板中各边缘点,基于所述边缘点的方向向量、对应的待检测点的经过预设位移的各邻近点的方向向量,确定所述图像模板与所述待检测区域的相似度;
基于所述图像模板与所述待检测区域的相似度,确定所述待检测区域中是否存在所述目标。
2.根据权利要求1所述的方法,其特征在于,所述获取所述目标的图像模板,包括:
获取所述目标的目标图像,作为分层目标图像的最底层图像;
构造分层目标图像中除最底层图像之外的其它层图像,其中每一层图像都是下一层图像的降采样图像;
基于对分层目标图像中每一层图像的边缘检测,获取每一层图像的图像模板;
所述基于待检测图像,确定与所述图像模板对应的待检测区域,包括:
获取待检测图像,作为分层待检测图像的最底层图像;
构造分层待检测图像中除最底层图像之外的其它层图像,所述分层待检测图像与分层目标图像具有相同的层数,其中,所述分层待检测图像中除最底层图像之外的其它层图像,每一层图像都是下一层图像的降采样图像;
将所述分层目标图像中最上层图像的图像模板作为当前被映射模板,将分层待检测图像的最上层图像作为当前映射目标图像,按不同映射规则,将当前被映射模板映射到当前映射目标图像上,分别所占据的区域分别作为多个当前待检测区域;
所述确定所述待检测区域中与各所述边缘点一一对应的各待检测点,包括:
确定所述多个当前待检测区域的每一个与各所述边缘点一一对应的各待检测点;
所述对所述图像模板中各边缘点,基于所述边缘点的方向向量、对应的待检测点的经过预设位移的各邻近点的方向向量,确定所述图像模板与所述待检测区域的相似度,包括:
对所述当前被映射模板中各边缘点,基于所述边缘点的方向向量、对应的待检测点的经过预设位移的各邻近点的方向向量,确定所述当前被映射模板与所述多个当前待检测区域的每一个的相似度;
所述基于所述图像模板与所述待检测区域的相似度,确定所述待检测区域中是否存在所述目标,包括:
基于所述当前被映射模板与所述多个当前待检测区域中每一个的相似度,确定所述多个当前待检测区域的每一个中是否存在所述目标;
在基于所述图像模板与所述待检测区域的相似度,确定所述待检测区域中是否存在所述目标之后,所述方法还包括:
如果确定一个当前待检测区域存在所述目标,用所述分层目标图像中当前被映射模板的下一层图像更新所述当前被映射模板,用当前映射目标图像的下一层图像更新所述当前映射目标图像,按不同映射规则,将当前被映射模板映射到当前映射目标图像上,以分别所占据的区域分别更新所述多个当前待检测区域;
确定所述多个当前待检测区域中与当前被映射模板的各边缘点一一对应的各待检测点;
对所述当前被映射模板中各边缘点,基于所述边缘点的方向向量、对应的待检测点的经过预设位移的各邻近点的方向向量,确定所述当前被映射模板与所述多个当前待检测区域的每一个的相似度;
如果所述当前被映射模板与一个待检测区域的相似度满足预定条件,确定所述待检测区域中存在所述目标,重复从用所述分层目标图像中当前被映射模板的下一层图像更新所述当前被映射模板开始的过程,直到到达分层待检测图像的最底层图像,将在最底层图像中存在所述目标的待检测区域确定为目标定位区域。
3.根据权利要求2所述的方法,其特征在于,所述基于对分层目标图像中每一层图像的边缘检测,获取每一层图像的图像模板,包括:
对分层目标图像中每一层图像进行边缘检测,确定每一层图像包含的各边缘点;
按照预设的图像模板描述的边缘点信息项,将每一层图像包含的各边缘点信息按照所述边缘点信息项进行存储,分别得到每一层图像的图像模板。
4.根据权利要求3所述的方法,其特征在于,所述对分层目标图像中每一层图像进行边缘检测,确定每一层图像包含的各边缘点,包括:
对每一层图像,使用高斯滤波器进行滤波;
确定所述滤波后的图像中每个像素点的方向向量;
基于每个像素点的方向向量,对每个像素点应用非极大值抑制,从而从所述经过非极大值抑制的像素点中确定出候选边缘点;
基于每个候选边缘点的方向向量,对每个候选边缘点应用双阈值检测,并进行相应的标记;
基于每个所述候选边缘点的标记,对每个候选边缘点进行筛选,确定所述图像包含的各边缘点。
5.根据权利要求2所述的方法,其特征在于,所述按不同映射规则,将当前被映射模板映射到当前映射目标图像上,分别所占据的区域分别作为多个当前待检测区域,包括:
按照预设滑动规则,将当前被映射模板作为滑动窗口于当前映射目标图像上进行滑动,每滑动一次,将当前被映射模板映射到当前映射目标图像上所占据的区域作为一个当前待检测区域。
6.根据权利要求1所述的方法,其特征在于,在所述对所述图像模板中各边缘点,基于所述边缘点的方向向量、对应的待检测点的经过预设位移的各邻近点的方向向量,确定所述图像模板与所述待检测区域的相似度之前,所述方法包括:
根据预设的旋转检索表,对图像模板中各边缘点的方向向量进行相应的旋转,以更新所述各边缘点的方向向量,所述旋转检索表描述了对边缘点的方向向量的旋转操作。
7.根据权利要求2所述的方法,其特征在于,所述对所述当前被映射模板中各边缘点,基于所述边缘点的方向向量、对应的待检测点的经过预设位移的各邻近点的方向向量,确定所述当前被映射模板与所述多个当前待检测区域的每一个的相似度,包括:
对所述当前被映射模板中各边缘点,获取所述边缘点的方向向量;
对每一个当前待检测区域,按照预设位移表,不断对所述待检测区域中与所述边缘点对应的待检测点的各邻近点进行统一位移,直到穷尽所述位移表描述的位移;
每进行一次所述统一位移后,获取所述各邻近点的方向向量,计算所述边缘点的方向向量与所述各邻近点的方向向量的余弦距离的均值;
将最大的所述余弦距离的均值确定为所述边缘点与所述对应的待检测点的相似度;
将各边缘点与对应待检测点的相似度的均值,确定为所述当前被映射模板与所述当前待检测区域的相似度。
8.根据权利要求2所述的方法,其特征在于,所述各邻近点包括:在当前映射目标图像上,以所述对应的待检测点为中心,将预设半径内的各像素点,作为所述各邻近点。
9.根据权利要求2所述的方法,其特征在于,所述基于所述当前被映射模板与所述多个当前待检测区域中每一个的相似度,确定所述多个当前待检测区域的每一个中是否存在所述目标,包括:
如果所述当前被映射模板与一所述当前待检测区域的相似度大于预定阈值,则确定该当前待检测区域中存在所述目标。
10.一种图像中的目标识别终端,其特征在于,所述终端包括:
获取模块,用于获取所述目标的图像模板,所述图像模板描述了所述目标具有的边缘点;
第一确定模块,用于基于待检测图像,确定与所述图像模板对应的待检测区域,确定所述待检测区域中与各所述边缘点一一对应的各待检测点;
第二确定模块,用于对所述图像模板中各边缘点,基于所述边缘点的方向向量、对应的待检测点的经过预设位移的各邻近点的方向向量,确定所述图像模板与所述待检测区域的相似度;
第三确定模块,用于基于所述图像模板与所述待检测区域的相似度,确定所述待检测区域中是否存在所述目标。
11.一种图像中的目标识别终端,其特征在于,包括:
存储器,存储有计算机可读指令;
处理器,读取存储器存储的计算机可读指令,以执行权利要求1-9中的任一个所述的方法。
12.一种计算机程序介质,其特征在于,其上存储有计算机可读指令,当所述计算机可读指令被计算机的处理器执行时,使计算机执行权利要求1-9中的任一个所述的方法。
CN201910616273.1A 2019-07-09 2019-07-09 图像中的目标识别方法、装置、电子设备及程序介质 Pending CN112215032A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910616273.1A CN112215032A (zh) 2019-07-09 2019-07-09 图像中的目标识别方法、装置、电子设备及程序介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910616273.1A CN112215032A (zh) 2019-07-09 2019-07-09 图像中的目标识别方法、装置、电子设备及程序介质

Publications (1)

Publication Number Publication Date
CN112215032A true CN112215032A (zh) 2021-01-12

Family

ID=74047392

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910616273.1A Pending CN112215032A (zh) 2019-07-09 2019-07-09 图像中的目标识别方法、装置、电子设备及程序介质

Country Status (1)

Country Link
CN (1) CN112215032A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113111929A (zh) * 2021-04-01 2021-07-13 广东拓斯达科技股份有限公司 一种模板匹配方法、装置、计算机设备及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113111929A (zh) * 2021-04-01 2021-07-13 广东拓斯达科技股份有限公司 一种模板匹配方法、装置、计算机设备及存储介质
CN113111929B (zh) * 2021-04-01 2024-04-12 广东拓斯达科技股份有限公司 一种模板匹配方法、装置、计算机设备及存储介质

Similar Documents

Publication Publication Date Title
CN107103320B (zh) 嵌入式医疗数据图像识别及集成方法
US8805117B2 (en) Methods for improving image search in large-scale databases
US20150310617A1 (en) Display control device and display control method
CN108830780B (zh) 图像处理方法及装置、电子设备、存储介质
US20150279021A1 (en) Video object tracking in traffic monitoring
CN109740633B (zh) 一种图像相似度计算方法、装置、存储介质
WO2016018987A1 (en) Detecting specified image identifiers on objects
CN109343920B (zh) 一种图像处理方法及其装置、设备和存储介质
WO2008020068A1 (en) Method of image processing
US8867784B2 (en) Apparatus and method for detecting a vertex of an image
CN110910445B (zh) 一种物件尺寸检测方法、装置、检测设备及存储介质
JP7135473B2 (ja) 医用画像処理装置、医用画像処理方法、プログラム及び医用画像処理システム
CN108734161B (zh) 冠字号区域的识别方法、装置、设备及存储介质
CN115063618B (zh) 一种基于模板匹配的缺陷定位方法、系统、设备及介质
WO2014209746A1 (en) Depth camera system with machine learning for recognition of patches within a structured light pattern
CN112861983A (zh) 图像匹配方法、装置、电子设备以及存储介质
US10089764B2 (en) Variable patch shape synthesis
CN113159103B (zh) 图像匹配方法、装置、电子设备以及存储介质
CN113506288A (zh) 基于transform注意力机制的肺结节检测方法及装置
CN112215032A (zh) 图像中的目标识别方法、装置、电子设备及程序介质
CN111898408B (zh) 一种快速人脸识别方法及装置
CN103837135A (zh) 工件检测方法及其系统
CN109934185B (zh) 数据处理方法及装置、介质和计算设备
JP4693742B2 (ja) 画像処理方法、画像処理装置、画像処理プログラムおよび画像処理プログラムを記録する記録媒体
CN111599080B (zh) 拼接纸币的检测方法、装置、金融机具设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination