CN101425143A

CN101425143A - 一种图像定位的方法及装置

Info

Publication number: CN101425143A
Application number: CNA2008102171983A
Authority: CN
Inventors: 陈友斌; 郭晓威
Original assignee: DONGGUAN MICROPATTERN Corp
Current assignee: GUANGDONG MICROPATTERN SOFTWARE CO., LTD.
Priority date: 2008-11-07
Filing date: 2008-11-07
Publication date: 2009-05-06
Anticipated expiration: 2028-11-07
Also published as: CN101425143B

Abstract

本发明公开了一种图像定位的方法及装置，该方法包括：获得待处理图像；对所述待处理图像进行缩微处理，获得经过缩微处理后的图像；根据所述经过缩微处理后的图像对所述待处理图像进行定位。采用本发明实施例中所提供的方案，由于采用缩微后的图像信息来帮助定位，对于即使在原图中存在较大程度破损或者断裂的图像，也能够实现快速、准确的定位。

Description

一种图像定位的方法及装置

技术领域

本发明涉及图像处理领域，尤其涉及一种图像定位的方法及装置。

背景技术

在自动图像识别技术中，通常需要识别的是整个图像中的某一部分，因此，准确的定位待识别的部分，可以有效的提高整个识别的准确性和精度。比如人脸识别系统中就需要先定位到图像中出现人脸的区域，再将这部分区域单独提取出来进行识别。类似的，在银行票据的自动验印系统中，也需要通过定位技术，先准确、高效的提取出待验印章的区域，再对待验的印章区域进行识别。

在实现本发明过程中，发明人发现，在现有的图像定位技术中，如银行票据的自动验印系统中，现有的印鉴自动定位技术中的投影法、或连通域搜寻等算法都存在各自的缺陷，使得定位速度较慢、或是定位精度较低。如，采用横向与纵向投影相结合的迭代投影法思路，虽然易实现、速度快，但针对色彩背景较复杂(如存在红色书写线干扰)的票据图像，不能进行精准的定位；而连通域搜寻算法虽然对具有较完整轮廓的印鉴二值图能够精确定位，但速度较慢，且在提取的印鉴轮廓发生较大程度断裂破损时，只能定位印鉴残部。

发明内容

本发明所要解决的技术问题在于，提供一种图像定位的方法及装置。可以实现对图像快速、准确的定位。

为此，一方面，本发明的实施例提供了一种图像定位的方法，包括：获得待处理图像；对所述待处理图像进行缩微处理，获得经过缩微处理后的图像；根据所述经过缩微处理后的图像对所述待处理图像进行定位。

另一方面，本发明的实施例提供了一种图像定位的装置，包括：获取单元，用于获得待处理图像；缩微处理单元，用于对所述待处理图像进行缩微处理，获得经过缩微处理后的图像；定位单元，用于根据所述经过缩微处理后的图像对所述待处理图像进行定位。

在本发明实施例所提供的技术方案中，由于采用缩微后的图像信息来帮助定位，对于即使在原图中存在较大程度破损或者断裂的图像，也能够实现快速、准确的定位。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例中的图像定位的方法的一个具体流程示意图；

图2是本发明实施例中的图像定位的方法的另一个具体流程示意图；

图3是进行定位的一个原图的示例；

图4是进行二值化和去噪后获得的F0图的示例；

图5是进行缩微处理后得到的F1图的示例；

图6是根据图5进行定位后的定位图的示例；

图7是本发明实施例中的图像定位的装置的一个具体组成示意图；

图8是本发明实施例中的比例缩微处理模块的一个具体组成示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

下面参考附图对本发明的实施例进行描述。参见图1，为本发明实施例中的图像定位的方法的一个具体流程示意图。该流程包括：

101、获得待处理图像。如对于彩色图像，如果需要定位的目标区域为单色区域，则可以先提取所述彩色图像中的单色分量图像信息；对所述单色分量图像信息进行二值化处理，获得二值图；然后再对所述二值图进行去噪处理，以便获得待处理图像。

其中，待处理图像可以是具有印鉴图案的彩色印章图像，也可以是具有Logo、表格等的文本图像或视频图像，只要这些在图像中需要鉴别的的区域或对象在空间上具有一定的封闭性。

当然，对于单色分量图像也可以不进行二值化处理，直接将单色分量图、或是去噪后的单色分量图作为待处理图像。也可以仅将单色分量图像进行灰度处理，获得一个灰度图像，将其作为待处理图像。

102、对所述待处理图像进行缩微处理，获得经过缩微处理后的图像。其中，缩微处理具体可以是基于所述待处理图像中网格内的像素比例进行缩微处理；或，基于所述待处理图像中网格内的笔划像素平均宽度进行缩微处理。

如，对基于所述待处理图像中的像素比例进行缩微处理包括：对所述待处理图像进行网格化，获得网格化图像；根据所述网格化图像中各网格内的像素比，确定各网格的像素，如对于二值图，可将整个网格内的像素值都统一为该网格内像素值比例超过指定阈值条件的值；根据确定各网格的像素后的网格化图像获得经过缩微处理后的图像。

而基于所述待处理图像中网格内的笔划像素平均宽度进行缩微处理是指，根据游程宽度的缩微，对网格内的图像进行水平和垂直游程分析来获取网格内水平游程与垂直游程的平均宽度，取两者的较小值作为笔划平均宽度，若笔划平均宽度大于预先指定的宽度阈值，则缩微图中对应位置的像素为目标像素(置黑)，否则，不是目标像素，置白。这种方法主要是基于所定位对象的轮廓具有一定的笔划宽度的情况。

103、根据所述经过缩微处理后的图像对所述待处理图像进行定位。具体可以是对缩微处理后的图像进行连通分析后根据连通分析的结果进行定位；或是基于缩微处理后的图像进行水平和垂直方向的迭代投影法来进行定位。

如，对所述经过缩微处理后的图像进行连通分析，获得最大外包连通区域信息；根据所述最大外包连通区域信息对所述待处理图像进行定位。该过程具体可包括：

a、获得所述经过缩微处理后的图像中宽或高符合第一预设阈值条件的连通分量；

b、对所述符合第一预设阈值条件的连通分量进行合并处理，获得经过合并处理后的连通分量；

c、获得所述经过合并处理后的连通分量对应的连通区域信息，确定所述连同区域信息为所述最大外包连通区域；

d、获得所述最大外包连通区域的宽和高都符合第二预设阈值条件的最大外包连通区域；

e、将所述符合第二预设阈值条件的最大外包连通区域确定为定位区域。

而基于缩微处理后的图像进行水平和垂直方向的迭代投影法来进行定位。可包括：首先对所有的图像像素向横轴上作垂直方向的投影，目标像素在横轴上的投影值为一个计数单位，非目标像素的投影值为零。根据预先指定的阈值，将横轴划分为若干个垂直投影区间。然后对落在每个垂直投影区间内的图像像素向纵轴上作水平方向的投影，以相同的阈值设定获得若干个水平投影区间，然后再对每个水平投影区间内的图像像素作垂直投影。反复执行上述步骤，直到投影区间的个数不会增加为止。根据得到的投影区间信息来获得若干备选区域，通过设定对象的宽和高条件，挑选出若干个所定位的目标区域。

如图2所示，为结合彩色票据印鉴定位的进行图像定位的方法的一个具体实施例的流程示意，该流程包括：

201、从原始图像中提取单色分量，如提取红色分量(由于票据需要识别的印鉴通常为红色)。具体可以是，对输入的整个彩色票据图像，进行由RGB空间向HSV空间的色彩转换，其中，根据三原色获得色调、饱和度和明度的转换公式分别如下：

饱和度：S＝1-3Min(R，G，B)/(R+G+B)

明度：V＝Max(R，G，B)

其中，

也可以直接利用角度的余弦值设定阈值以节省运算量，如，分别在三个色彩通道上设定如下阈值条件：

\{\begin{matrix} 0.94 < \frac{[(R - G) + (R - B)] / 2}{\sqrt{{(R - G)}^{2} + (R - B) (G - B)}} < 1 \\ 0.15 < S < 1 \\ V > 80 \end{matrix}

遍历图像中的像素色彩数据，若满足阈值条件，则认为是目标像素，置零(变黑)；否则，认为是背景像素，置为255(变白)。这样便可得到一幅单通道二值图F0，黑色部分为包含印鉴的目标区域。然后对二值图F0进行窗口尺寸为3 x 3大小的中值滤波去噪处理，滤除图中游离的点噪声。设去噪后的图像F0的宽度与高度分别为Width，Height。

202、对二值图F0进行均匀或非均匀划分的网格化。如，将二值图F0划分为均匀的xCount*yCount个小网格，其中xCount＝Width/Size，yCount＝Height/Size，其中，Size在分辨率为200dpi的国内票据影像中可取值为11。

203、根据二值图F0获得大小为xCount*yCount的缩微图F1。如，对F0中的每个小网格，统计黑色像素个数占总像素面积的比例(如，

p = \frac{BlackPixelCount}{Size}

)，若p大于给定的阈值T，则F1中的相对应位置像素值置零(变黑)；否则，置为255(变白)。

204、在二值图F1上进行连通分量分析，获得最大外包连通区域，如可进行8邻域连通分量分析。具体包括：

A、去除F1中宽或高较小的连通分量(可视为噪声)。

B、对水平与垂直方向存在交叠的连通分量进行合并，获得一系列最大外包连通区域。合并的过程如下：设连通分量C1与连通分量C2的外接矩形的边界为left₁，right₁，top₁，bottom₁以及left₂，right₂，top₂，bottom₂，那么交叠(overlap)条件为：

当交叠条件为真(true)时，进行区域合并，合并后产生的外包区域C3，边界为：

left₃＝Min(left₁，left₂) right₃＝Max(right₁，right₂)

top₃＝Min(top₁，top₂) bottom₃＝Max(bottom₁，bottom₂)

注：由于图像处理中图像的坐标原点一般是在左上角，所以top的值总是小于或等于bottom值的。

合并后删除先前的子区域，新合并区域又可与其它区域不断合并，直到图F1中不存在相互交叠的区域，这样最后得到的区域即为最大外包连通区域。最大外包连通区域可能为一个，也有可能为多个。

205、将在F0图中的对应位置上宽度与高度均满足给定阈值条件的最大外包连通区域认定为印鉴区域。

从以上描述的本发明的实施例中，可以很容易的获知，本发明实施例中的图像定位的方法还可以用于其他图像中的定位，只要是类似本例中的需要定位的对象本身较为规则的情况即可采用本发明实施例中所提供的方法进行定位。例如，本发明实施例中提供的方案还适用于文本图像或视频图像中的Logo，表格等空间上具有一定封闭性的区域或对象的检测与定位。

在本发明的上述实施例中，由于采用了本发明中所示的缩微处理，将原图像中定位对象的不连通图像区域变为在缩微后的图像中的连通或更加趋于连通的区域，使得在诸如印鉴图像中印鉴较为残缺的情况下时，也不会将同一印鉴定位为不同印鉴导致定位不准确。同时，由于在缩微后的图像中进行连通分析，节省了连通分析时的大量运算。

如图3～6所示，为采用本发明实施例中的方案进行定位的一个效果示意图。图3为进行定位的原图，图中印鉴部分为红色；图4是进行二值化和去噪后获得的F0图，图5是进行缩微处理后得到的F1图，图6是根据图5进行定位后的定位图，图中印鉴附近的蓝色细线标明的矩形框为定位的结果。

另一方面，如图7所示，本发明实施例还提供了一种图像定位的装置，包括：获取单元2，用于获得待处理图像；缩微处理单元4，用于对所述待处理图像进行缩微处理，获得经过缩微处理后的图像；定位单元6，用于根据所述经过缩微处理后的图像对所述待处理图像进行定位。

其中，缩微处理单元4可包括下述模块中的一种或多种：比例缩微处理模块40，用于基于所述待处理图像中的像素比例进行缩微处理，获得经过缩微处理后的图像；笔划缩微处理模块，用于基于所述待处理图像中的笔划像素平均宽度进行缩微处理，获得经过缩微处理后的图像；投影缩微处理模块，用于基于所述待处理图像中的像素在水平或垂直方向上的投影分布进行缩微处理，获得经过缩微处理后的图像。

如图8所示，比例缩微处理模块40包括：网格化子模块400，用于对所述待处理图像进行网格化，获得网格化图像；像素确定子模块402，用于根据所述网格化图像中各网格内的像素比，确定各网格的像素；缩微处理子模块404，用于根据确定各网格的像素后的网格化图像获得经过缩微处理后的图像。

上述实施例中的相关模块和单元中的具体细节与前述图像定位的方法中的实施例中的相应细节一致，此处不做赘述。

通过以上的实施方式的描述，本领算机软件产品可以存储在计算机可读存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

以上所述的实施方式，并不构成对该技术方案保护范围的限定。任何在上述实施方式的精神和原则之内所作的修改、等同替换和改进等，均应包含在该技术方案的保护范围之内。

Claims

1、一种图像定位的方法，其特征在于，所述方法包括：

获得待处理图像；

对所述待处理图像进行缩微处理，获得经过缩微处理后的图像；

根据所述经过缩微处理后的图像对所述待处理图像进行定位。

2、如权利要求1所述的方法，其特征在于，所述对所述待处理图像进行缩微处理包括：

基于所述待处理图像的像素比例进行缩微处理；

或，基于所述待处理图像的笔划像素平均宽度进行缩微处理。

3、如权利要求2所述的方法，其特征在于，所述基于所述待处理图像中的像素比例进行缩微处理，获得经过缩微处理后的图像包括：

对所述待处理图像进行均匀或非均匀划分的网格化，获得网格化图像；

根据所述网格化图像中各网格内的像素比，确定各网格的像素；

根据确定各网格的像素后的网格化图像获得经过缩微处理后的图像。

4、如权利要求1至3中任一项所述的方法，其特征在于，所述根据所述经过缩微处理后的图像对所述待处理图像进行定位包括：

对所述经过缩微处理后的图像进行连通分析，获得最大外包连通区域信息，根据所述最大外包连通区域信息对所述待处理图像进行定位；

或，基于经过缩微处理后的图像进行水平和垂直方向的迭代投影法来进行定位。

5、如权利要求4所述的方法，其特征在于，所述对所述经过缩微处理后的图像进行连通分析，获得最大外包连通区域信息包括：

获得所述经过缩微处理后的图像中宽或高符合第一预设阈值条件的连通分量；

对所述符合第一预设阈值条件的连通分量进行合并处理，获得经过合并处理后的连通分量；

获得所述经过合并处理后的连通分量对应的连通区域信息，确定所述连同区域信息为所述最大外包连通区域。

6、如权利要求4所述的方法，其特征在于，所述根据所述最大外包连通区域信息对所述待处理图像进行定位包括：

获得所述最大外包连通区域的宽和高都符合第二预设阈值条件的最大外包连通区域；

将所述符合第二预设阈值条件的最大外包连通区域确定为定位区域。

7、如权利要求4所述的方法，其特征在于，所述图像定位的方法用于彩色图像的定位，所述获得待处理图像包括：

提取所述彩色图像中的单色分量图像信息；

对所述单色分量图像信息进行二值化处理，获得二值图；

对所述二值图进行去噪处理，获得待处理图像。

8、一种图像定位的装置，其特征在于，所述装置包括：

获取单元，用于获得待处理图像；

缩微处理单元，用于对所述待处理图像进行缩微处理，获得经过缩微处理后的图像；

定位单元，用于根据所述经过缩微处理后的图像对所述待处理图像进行定位。

9、如权利要求8所述的装置，其特征在于，所述缩微处理单元包括下述模块中的一种或多种：

比例缩微处理模块，用于基于所述待处理图像中的像素比例进行缩微处理，获得经过缩微处理后的图像；

笔划缩微处理模块，用于基于所述待处理图像中的笔划像素平均宽度进行缩微处理，获得经过缩微处理后的图像。

10、如权利要求9所述的装置，其特征在于，所述比例缩微处理模块包括：

网格化子模块，用于对所述待处理图像进行网格化，获得网格化图像；

像素确定子模块，用于根据所述网格化图像中各网格内的像素比，确定各网格的像素；

缩微处理子模块，用于根据确定各网格的像素后的网格化图像获得经过缩微处理后的图像。