CN103186784A

CN103186784A - 文本图像的桶形畸变校正方法

Info

Publication number: CN103186784A
Application number: CN 201110460648
Authority: CN
Inventors: 董经; 姜晓伟
Original assignee: BEIJING DATANG GOHIGH SOFTWARE TECHNOLOGY Co Ltd
Current assignee: BEIJING DATANG GOHIGH SOFTWARE TECHNOLOGY Co Ltd
Priority date: 2011-12-31
Filing date: 2011-12-31
Publication date: 2013-07-03

Abstract

本发明公开了一种文本图像的桶形畸变校正方法，该方法包括先将待处理的文本图像进行图像的预处理，然后对预处理后的文本图像进行膨胀处理，之后，将膨胀处理后的文本图像中的每行文本图像分别独立出来，并对独立出来的每行文本图像分别进行坐标调整，最后将调整后的每行文本图像合并成完整的文本图像。本发明的文本图像的桶形畸变校正方法无需考虑任何硬件参数的影响，可根据实际需要进行自适应校正，且校正效果良好，能够大大地降低图像的失真率，提高文本图像的质量，具有很高的实用性。

Description

文本图像的桶形畸变校正方法

技术领域

本发明涉及一种在文本图像的文件识别中对发生桶形畸变的文本图像进行校正的数字图像处理方法，属于图像处理技术领域。

背景技术

随着科学技术的迅猛发展，成像技术已经广泛应用于军事、医疗、媒体、安全管理等各个领域，这项技术的关键之处在于采集到的图像是否能够还原出实际图像以准确的反应客观信息。事实上，由于图像采集系统硬件的固有特征、软件算法的局限性以及各种系统外的因素都会对采集到的图像造成不同程度的失真。虽然硬件工艺和软件算法设计上都在不断的改进和完善，但这些客观因素对于成像的失真影响也仅能降低而无法从根本上消除。比如广角镜头的大视角会对成像带来不可避免的几何畸变，如图1A至1C所示，标准栅格可能会畸变成枕形栅格和桶形栅格等，而在这些几何畸变中，最主要的当属桶形畸变。

目前学术界普遍存在两大类方法对图像的桶形畸变进行抑制：一种是利用光学成像方法对图像的桶形畸变进行抑制，另一种是利用数字图像处理方法减小畸变。其中第一种方法是在成像前，对将要产生的畸变运用光学方法进行抑制，简单的说就是在成像过程中利用镜片通过光线折射等方法迫使拍摄的图像直接逼近实物，但实现此方法的光学成像系统设计既复杂难度又大，而且制造工艺较困难也会增加光学系统的制造成本，因此目前的畸变校正一般不采用此方法。第二种方法是在成像后，利用数字图像处理技术实现图像的畸变校正，使校正处理后的图像逼近实物。相对于光学处理方式，这种方法不需要严格的光学工艺，成本较低，而且可根据使用的环境和实际需要对算法进行改进，因此现在国内外多采用第二种方法进行校正图像桶形畸变的研究。

而当前运用数字图像处理技术进行畸变校正的一般方法是：先选定一个特定的参数，然后针对某一固定镜头在一固定的拍摄参数(如焦距)下拍摄到的产生桶形畸变的图像进行处理，处理后得到一个畸变像素点与其正确位置的映射关系模板，随后只要是在这些特定参数下同样产生桶形畸变的图像，即在该相同的特定参数、相同的镜头及相同的拍摄参数下所获得的图像，都可直接调用此映射关系模板进行校正，校正效果良好。但是，由于这种校正方法要求参数固定，因而具有较大的局限性，使用者一旦更换了镜头或是调整了焦距等相关硬件参数，校正结果便无法再达到预期的效果。

发明内容

鉴于上述原因，本发明的目的在于提供一种无需考虑硬件参数，即可大幅地降低桶形畸变文本图像的失真度的自适应文本图像校正方法。

为实现上述目的，本发明采用以下技术方案：

一种文本图像的桶形畸变校正方法，包括以下步骤：

1)首先将待处理的文本图像进行图像的预处理，得到预处理后的文本图像；

2)对该预处理后的文本图像进行膨胀处理，得到膨胀处理后的文本图像；

3)将该膨胀处理后的文本图像中的每行文本图像分别独立出来，且该每行文本图像均具有一连通域；

4)对该独立出来的每行文本图像分别进行坐标调整，得到校正后的每行文本图像；

5)将该校正后的每行文本图像重新合并成完整的文本图像。

所述步骤4)包括以下步骤：

41)对所述独立出来的每行文本图像分别进行水平投影，得到所述每行文本图像的最高点纵坐标和最低点纵坐标；

42)对所述每行文本图像中的连通域进行从上到下、从左到右的遍历以得到一坐标映射关系表；

43)根据该坐标映射关系表，对所述每行文本图像进行转换调整，得到所述校正后的每行文本图像。

所述步骤1)图像的预处理指按照图像的灰度化、二值化、去噪滤波的步骤对图像进行处理。

所述步骤2)对预处理后的文本图像进行膨胀处理的具体方法是：使用结构元素B来遍历原始二值化图像X图像区域中的每个像素点，设X图像中和结构元素B中心点重合的像素点坐标为(x，y)，如果结构元素B和X图像中目标区域的交集非空，就将坐标(x，y)设置成目标像素点，以此实现目标区域的向外扩张；

膨胀处理的公式为：

S = X &CirclePlus; B = {x, y | B_{xy} \cap X &NotEqual; ψ}

式中，S表示膨胀后的二值图像像素点集合，X表示原始二值化图像像素点集合，B表示用于膨胀的结构元素，ψ表示空集；其中，结构元素B中的每一个像素点可以是0或1，其可组成任意形状的图形，且该图形中需要有一中心点用于表示待判断的像素点。

针对文本图像的特征，将结构元素中的扩充元素点设计为水平方向较宽，竖直方向较窄的图形。

所述膨胀处理后的文本图像还需要进行孔洞填充处理，具体步骤为：先通过连通域标记方法搜索出背景像素并加以标示，然后以集合的膨胀、求补和交集运算为基础对孔洞进行填充，数学公式如下：

X_{k} = (X_{k - 1} &CirclePlus; B) \cap A^{c}

其中，k＝1，2，3，...

式中的X₀为搜索到的第一个目标像素点，B为十字对称结构元素，A^c为原始图像的补集；当X_k＝X_k-1时，算法在迭代的第K步结束。

所述将每行文本图像分别独立出来通过连通域算法实现，即遍历该文本图像中每个像素点，将该每个像素点周围一定区域内的像素点归为一个集合，通过连通域算法处理后的每行文本图像均具有一连通域。

本发明的优点在于：

本发明无需再考虑成像的相关硬件参数，如镜头种类、焦距等，即可对发生桶形畸变的文本图像进行自适应校正，降低了文本图像的失真度，提高了文本图像的质量；同时，该方法不仅可应用于电子书中以提高阅读文本的质量，也可嵌入到OCR识别设备的算法当中，以提高图像识别的正确率，具有很高的实用性。

附图说明

图1A为标准栅格示意图；

图1B为发生枕形畸变的栅格示意图；

图1C为发生桶形畸变的栅格示意图；

图2为一发生桶形畸变的文本图像示意图；

图3为本发明的处理流程图；

图4为经过图像预处理后的文本图像示意图；

图5A、5B、5C为图像膨胀处理的一实施例示意图；

图6为本发明所选结构元素的一较佳实施例示意图；

图7为利用图6中结构元素进行膨胀处理后的文本图像示意图；

图8为步骤3处理后的文本图像示意图；

图9为对单行文本图像进行校正的示意图；

图10为校正后的文本图像示意图。

具体实施方式

以下结合附图和实施例对本发明作进一步详细的描述。

图2为一发生桶形畸变的文本图像示意图，图3为本发明的处理流程图。如图所示，针对图2所示的文本图像，本发明的具体步骤为：

1)首先将待处理的文本图像，即图2所示的文本图像，进行图像的预处理，得到预处理后的文本图像；

这里的图像预处理包括图像的灰度化，即将待处理的图像转化成灰度图，然后将该灰度图进行二值化处理，得到二值化图像，再对该二值化图像进行去噪滤波处理，经过图像预处理后的文本图像如图4所示。

膨胀是指数学形态学中的一种算法，该算法主要是将二值化图像中的目标像素接触的所有背景点都合并到目标物体中，使目标像素的边界向外扩张的过程，简单的说，图像的膨胀处理实际上是将图像的外围扩充一圈，同时保留图像内部的部分。图像的膨胀效果由用于膨胀的结构元素决定。如下为膨胀的数学公式：

S = X &CirclePlus; B = {x, y | B_{xy} \cap X &NotEqual; ψ}

式中，S表示膨胀后的二值图像像素点集合，X表示原始二值化图像像素点集合，B表示用于膨胀的结构元素，ψ表示空集。其中，结构元素B中的每一个像素点可以是0或1，其可组成任意形状的图形，且该图形中需要有一中心点用于表示待判断的像素点。

上述数学公式的含义是：使用结构元素B来遍历原始二值化图像X图像区域中的每个像素点，设X图像中和结构元素B中心点重合的像素点坐标为(x，y)，如果结构元素B和X图像中目标区域的交集非空，就将坐标(x，y)设置成目标像素点，以此实现目标区域的向外扩张。

图5A至图5C为图像膨胀处理的一实施例示意图。其中，图5A为原始的二值图像，其中的灰色方格表示目标区域像素点，白色方格表示背景色；图5B为结构元素，其中的黑色方格表示结构元素的中心点，灰色方格表示扩充元素点；利用图5B所示的结构元素对图5A所示的原始二值图像中的目标区域像素点进行膨胀处理，具体为利用结构元素遍历目标区域的每个像素点，当结构元素中灰色部分与目标区域像素点重合时，将保留结构元素的中心点，图5C中的黑色方格即为经上述膨胀处理后所添加的边界像素点。

由此可见，要想达到预期的膨胀效果需要选择合适的结构元素。由于本发明的处理对象是文本图像，因此，针对文本图像的特征，可以将结构元素中的扩充元素点设计为水平方向较宽，竖直方向较窄的图形，而且要注意的是，扩充元素点水平方向的宽度应小于一个字符的宽度，而竖直方向应小于行距。图6所示为本发明所选结构元素的一较佳实施例示意图，此较佳实施例中，将水平方向设置10-50个像素点，竖直方向设置5-25个像素点。

将经过预处理后的二值化文本图像，利用图6所示结构元素进行膨胀处理后的文本图像如图7所示。

另外，由于经膨胀处理后的文本图像，其目标区域(图7中的黑色区域)中有可能存在孔洞现象而会影响下一步的处理，所以有必要对膨胀处理后的文本图像进行孔洞填充，填充方法可选用孔洞填充算法实现，该算法的具体步骤为：先通过连通域标记方法搜索出背景像素并加以标示，然后以集合的膨胀、求补和交集运算为基础对孔洞进行填充，数学公式如下：

X_{k} = (X_{k - 1} &CirclePlus; B) \cap A^{c}

其中，k＝1，2，3，...

3)将该膨胀处理后的文本图像中的每行文本图像分别独立出来，且每行文本图像均具有一连通域；

对于膨胀及孔洞填充处理后的文本图像，将其中的每行文本分别独立划分出来。实现这一步可以使用连通域算法，即遍历该文本图像中每个像素点，将该每个像素点周围一定区域内的像素点归为一个集合，通过连通域算法处理后的每行文本图像均具有一连通域。由于此算法属于公知算法，所以不再赘述，该步骤处理后的文本图像如图8所示。

结合图9，该步骤的具体方法为：

41)对独立划分出来的每行文本图像进行水平投影，得到每行文本图像的最高点纵坐标y1和最低点的纵坐标y2；

在从上到下遍历第一行文本图像时，将遇到的第一个像素点的纵坐标y减去最高点的纵坐标y1，可得到一搬移距离d(减法结果的正负可表示搬移的方向)，由此可获得该像素点的新纵坐标，即该像素点的原纵坐标y减去该搬移距离d可得到该像素点的新纵坐标。对于与该像素点同列上的其他各行文本图像中的第一像素点(从上至下遍历时遇到的第一个像素点)，新的纵坐标同样是(y-d)。以此类推，每行文本图像的其他像素点可通过同样的方法获得各自的新纵坐标，最终可获得各像素点的一坐标映射关系表。

5)将该校正后的每行文本图像重新合并成完整的文本图像。

至此，发生桶形畸变的文本图像的校正完成，校正后的图像如图10所示，可以明显地看出，使用本发明的校正方法校正的文本图像几乎已经无畸变无失真，其与实际的文本几乎完全一样。

本发明的文本图像的桶形畸变校正方法，首先对发生桶形畸变的文本图像进行预处理，然后进行膨胀处理，之后将文本图像中的每行文本图像分别独立出来并分别进行坐标调整以将每行文本图像分别校正，最后将分别校正后的每行文本图像合并成完整的文本图像。

本发明公开的文本图像的桶形畸变校正方法无需考虑任何硬件参数的影响，可根据实际需要进行自适应校正，且校正效果良好，能够大大地降低图像的失真率，提高文本图像的质量，具有较高的实用性。本发明可以应用到电子书中，提高阅读质量，还可以嵌入到OCR识别设备中，在OCR识别前，对畸变的图像进行校正，从而提高识别的正确率。

以上所述是本发明的较佳实施例及其所运用的技术原理，对于本领域的技术人员来说，在不背离本发明的精神和范围的情况下，任何基于本发明技术方案基础上的等效变换、简单替换等显而易见的改变，均属于本发明保护范围之内。

Claims

1.一种文本图像的桶形畸变校正方法，其特征在于：它包括以下步骤：

5)将该校正后的每行文本图像重新合并成完整的文本图像。

2.根据权利要求1所述的文本图像的桶形畸变校正方法，其特征在于：

所述步骤4)进一步包括以下步骤：

3.根据权利要求2所述的文本图像的桶形畸变校正方法，其特征在于：

4.根据权利要求3所述的文本图像的桶形畸变校正方法，其特征在于：

膨胀处理的公式为：

S = X &CirclePlus; B = {x, y | B_{xy} \cap X &NotEqual; ψ}

5.根据权利要求4所述的文本图像的桶形畸变校正方法，其特征在于：

6.根据权利要求4所述的文本图像的桶形畸变校正方法，其特征在于：

X_{k} = (X_{k - 1} &CirclePlus; B) \cap A^{c}

其中，k＝1，2，3，...

7.根据权利要求6所述的文本图像的桶形畸变校正方法，其特征在于：