CN103186784A - 文本图像的桶形畸变校正方法 - Google Patents

文本图像的桶形畸变校正方法 Download PDF

Info

Publication number
CN103186784A
CN103186784A CN 201110460648 CN201110460648A CN103186784A CN 103186784 A CN103186784 A CN 103186784A CN 201110460648 CN201110460648 CN 201110460648 CN 201110460648 A CN201110460648 A CN 201110460648A CN 103186784 A CN103186784 A CN 103186784A
Authority
CN
China
Prior art keywords
image
writing
style
pixel
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN 201110460648
Other languages
English (en)
Inventor
董经
姜晓伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BEIJING DATANG GOHIGH SOFTWARE TECHNOLOGY Co Ltd
Original Assignee
BEIJING DATANG GOHIGH SOFTWARE TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BEIJING DATANG GOHIGH SOFTWARE TECHNOLOGY Co Ltd filed Critical BEIJING DATANG GOHIGH SOFTWARE TECHNOLOGY Co Ltd
Priority to CN 201110460648 priority Critical patent/CN103186784A/zh
Publication of CN103186784A publication Critical patent/CN103186784A/zh
Pending legal-status Critical Current

Links

Images

Abstract

本发明公开了一种文本图像的桶形畸变校正方法,该方法包括先将待处理的文本图像进行图像的预处理,然后对预处理后的文本图像进行膨胀处理,之后,将膨胀处理后的文本图像中的每行文本图像分别独立出来,并对独立出来的每行文本图像分别进行坐标调整,最后将调整后的每行文本图像合并成完整的文本图像。本发明的文本图像的桶形畸变校正方法无需考虑任何硬件参数的影响,可根据实际需要进行自适应校正,且校正效果良好,能够大大地降低图像的失真率,提高文本图像的质量,具有很高的实用性。

Description

文本图像的桶形畸变校正方法
技术领域
本发明涉及一种在文本图像的文件识别中对发生桶形畸变的文本图像进行校正的数字图像处理方法,属于图像处理技术领域。
背景技术
随着科学技术的迅猛发展,成像技术已经广泛应用于军事、医疗、媒体、安全管理等各个领域,这项技术的关键之处在于采集到的图像是否能够还原出实际图像以准确的反应客观信息。事实上,由于图像采集系统硬件的固有特征、软件算法的局限性以及各种系统外的因素都会对采集到的图像造成不同程度的失真。虽然硬件工艺和软件算法设计上都在不断的改进和完善,但这些客观因素对于成像的失真影响也仅能降低而无法从根本上消除。比如广角镜头的大视角会对成像带来不可避免的几何畸变,如图1A至1C所示,标准栅格可能会畸变成枕形栅格和桶形栅格等,而在这些几何畸变中,最主要的当属桶形畸变。
目前学术界普遍存在两大类方法对图像的桶形畸变进行抑制:一种是利用光学成像方法对图像的桶形畸变进行抑制,另一种是利用数字图像处理方法减小畸变。其中第一种方法是在成像前,对将要产生的畸变运用光学方法进行抑制,简单的说就是在成像过程中利用镜片通过光线折射等方法迫使拍摄的图像直接逼近实物,但实现此方法的光学成像系统设计既复杂难度又大,而且制造工艺较困难也会增加光学系统的制造成本,因此目前的畸变校正一般不采用此方法。第二种方法是在成像后,利用数字图像处理技术实现图像的畸变校正,使校正处理后的图像逼近实物。相对于光学处理方式,这种方法不需要严格的光学工艺,成本较低,而且可根据使用的环境和实际需要对算法进行改进,因此现在国内外多采用第二种方法进行校正图像桶形畸变的研究。
而当前运用数字图像处理技术进行畸变校正的一般方法是:先选定一个特定的参数,然后针对某一固定镜头在一固定的拍摄参数(如焦距)下拍摄到的产生桶形畸变的图像进行处理,处理后得到一个畸变像素点与其正确位置的映射关系模板,随后只要是在这些特定参数下同样产生桶形畸变的图像,即在该相同的特定参数、相同的镜头及相同的拍摄参数下所获得的图像,都可直接调用此映射关系模板进行校正,校正效果良好。但是,由于这种校正方法要求参数固定,因而具有较大的局限性,使用者一旦更换了镜头或是调整了焦距等相关硬件参数,校正结果便无法再达到预期的效果。
发明内容
鉴于上述原因,本发明的目的在于提供一种无需考虑硬件参数,即可大幅地降低桶形畸变文本图像的失真度的自适应文本图像校正方法。
为实现上述目的,本发明采用以下技术方案:
一种文本图像的桶形畸变校正方法,包括以下步骤:
1)首先将待处理的文本图像进行图像的预处理,得到预处理后的文本图像;
2)对该预处理后的文本图像进行膨胀处理,得到膨胀处理后的文本图像;
3)将该膨胀处理后的文本图像中的每行文本图像分别独立出来,且该每行文本图像均具有一连通域;
4)对该独立出来的每行文本图像分别进行坐标调整,得到校正后的每行文本图像;
5)将该校正后的每行文本图像重新合并成完整的文本图像。
所述步骤4)包括以下步骤:
41)对所述独立出来的每行文本图像分别进行水平投影,得到所述每行文本图像的最高点纵坐标和最低点纵坐标;
42)对所述每行文本图像中的连通域进行从上到下、从左到右的遍历以得到一坐标映射关系表;
43)根据该坐标映射关系表,对所述每行文本图像进行转换调整,得到所述校正后的每行文本图像。
所述步骤1)图像的预处理指按照图像的灰度化、二值化、去噪滤波的步骤对图像进行处理。
所述步骤2)对预处理后的文本图像进行膨胀处理的具体方法是:使用结构元素B来遍历原始二值化图像X图像区域中的每个像素点,设X图像中和结构元素B中心点重合的像素点坐标为(x,y),如果结构元素B和X图像中目标区域的交集非空,就将坐标(x,y)设置成目标像素点,以此实现目标区域的向外扩张;
膨胀处理的公式为:
S = X ⊕ B = { x , y | B xy ∩ X ≠ ψ }
式中,S表示膨胀后的二值图像像素点集合,X表示原始二值化图像像素点集合,B表示用于膨胀的结构元素,ψ表示空集;其中,结构元素B中的每一个像素点可以是0或1,其可组成任意形状的图形,且该图形中需要有一中心点用于表示待判断的像素点。
针对文本图像的特征,将结构元素中的扩充元素点设计为水平方向较宽,竖直方向较窄的图形。
所述膨胀处理后的文本图像还需要进行孔洞填充处理,具体步骤为:先通过连通域标记方法搜索出背景像素并加以标示,然后以集合的膨胀、求补和交集运算为基础对孔洞进行填充,数学公式如下:
X k = ( X k - 1 ⊕ B ) ∩ A c
其中,k=1,2,3,...
式中的X0为搜索到的第一个目标像素点,B为十字对称结构元素,Ac为原始图像的补集;当Xk=Xk-1时,算法在迭代的第K步结束。
所述将每行文本图像分别独立出来通过连通域算法实现,即遍历该文本图像中每个像素点,将该每个像素点周围一定区域内的像素点归为一个集合,通过连通域算法处理后的每行文本图像均具有一连通域。
本发明的优点在于:
本发明无需再考虑成像的相关硬件参数,如镜头种类、焦距等,即可对发生桶形畸变的文本图像进行自适应校正,降低了文本图像的失真度,提高了文本图像的质量;同时,该方法不仅可应用于电子书中以提高阅读文本的质量,也可嵌入到OCR识别设备的算法当中,以提高图像识别的正确率,具有很高的实用性。
附图说明
图1A为标准栅格示意图;
图1B为发生枕形畸变的栅格示意图;
图1C为发生桶形畸变的栅格示意图;
图2为一发生桶形畸变的文本图像示意图;
图3为本发明的处理流程图;
图4为经过图像预处理后的文本图像示意图;
图5A、5B、5C为图像膨胀处理的一实施例示意图;
图6为本发明所选结构元素的一较佳实施例示意图;
图7为利用图6中结构元素进行膨胀处理后的文本图像示意图;
图8为步骤3处理后的文本图像示意图;
图9为对单行文本图像进行校正的示意图;
图10为校正后的文本图像示意图。
具体实施方式
以下结合附图和实施例对本发明作进一步详细的描述。
图2为一发生桶形畸变的文本图像示意图,图3为本发明的处理流程图。如图所示,针对图2所示的文本图像,本发明的具体步骤为:
1)首先将待处理的文本图像,即图2所示的文本图像,进行图像的预处理,得到预处理后的文本图像;
这里的图像预处理包括图像的灰度化,即将待处理的图像转化成灰度图,然后将该灰度图进行二值化处理,得到二值化图像,再对该二值化图像进行去噪滤波处理,经过图像预处理后的文本图像如图4所示。
2)对该预处理后的文本图像进行膨胀处理,得到膨胀处理后的文本图像;
膨胀是指数学形态学中的一种算法,该算法主要是将二值化图像中的目标像素接触的所有背景点都合并到目标物体中,使目标像素的边界向外扩张的过程,简单的说,图像的膨胀处理实际上是将图像的外围扩充一圈,同时保留图像内部的部分。图像的膨胀效果由用于膨胀的结构元素决定。如下为膨胀的数学公式:
S = X ⊕ B = { x , y | B xy ∩ X ≠ ψ }
式中,S表示膨胀后的二值图像像素点集合,X表示原始二值化图像像素点集合,B表示用于膨胀的结构元素,ψ表示空集。其中,结构元素B中的每一个像素点可以是0或1,其可组成任意形状的图形,且该图形中需要有一中心点用于表示待判断的像素点。
上述数学公式的含义是:使用结构元素B来遍历原始二值化图像X图像区域中的每个像素点,设X图像中和结构元素B中心点重合的像素点坐标为(x,y),如果结构元素B和X图像中目标区域的交集非空,就将坐标(x,y)设置成目标像素点,以此实现目标区域的向外扩张。
图5A至图5C为图像膨胀处理的一实施例示意图。其中,图5A为原始的二值图像,其中的灰色方格表示目标区域像素点,白色方格表示背景色;图5B为结构元素,其中的黑色方格表示结构元素的中心点,灰色方格表示扩充元素点;利用图5B所示的结构元素对图5A所示的原始二值图像中的目标区域像素点进行膨胀处理,具体为利用结构元素遍历目标区域的每个像素点,当结构元素中灰色部分与目标区域像素点重合时,将保留结构元素的中心点,图5C中的黑色方格即为经上述膨胀处理后所添加的边界像素点。
由此可见,要想达到预期的膨胀效果需要选择合适的结构元素。由于本发明的处理对象是文本图像,因此,针对文本图像的特征,可以将结构元素中的扩充元素点设计为水平方向较宽,竖直方向较窄的图形,而且要注意的是,扩充元素点水平方向的宽度应小于一个字符的宽度,而竖直方向应小于行距。图6所示为本发明所选结构元素的一较佳实施例示意图,此较佳实施例中,将水平方向设置10-50个像素点,竖直方向设置5-25个像素点。
将经过预处理后的二值化文本图像,利用图6所示结构元素进行膨胀处理后的文本图像如图7所示。
另外,由于经膨胀处理后的文本图像,其目标区域(图7中的黑色区域)中有可能存在孔洞现象而会影响下一步的处理,所以有必要对膨胀处理后的文本图像进行孔洞填充,填充方法可选用孔洞填充算法实现,该算法的具体步骤为:先通过连通域标记方法搜索出背景像素并加以标示,然后以集合的膨胀、求补和交集运算为基础对孔洞进行填充,数学公式如下:
X k = ( X k - 1 ⊕ B ) ∩ A c
其中,k=1,2,3,...
式中的X0为搜索到的第一个目标像素点,B为十字对称结构元素,Ac为原始图像的补集;当Xk=Xk-1时,算法在迭代的第K步结束。
3)将该膨胀处理后的文本图像中的每行文本图像分别独立出来,且每行文本图像均具有一连通域;
对于膨胀及孔洞填充处理后的文本图像,将其中的每行文本分别独立划分出来。实现这一步可以使用连通域算法,即遍历该文本图像中每个像素点,将该每个像素点周围一定区域内的像素点归为一个集合,通过连通域算法处理后的每行文本图像均具有一连通域。由于此算法属于公知算法,所以不再赘述,该步骤处理后的文本图像如图8所示。
4)对该独立出来的每行文本图像分别进行坐标调整,得到校正后的每行文本图像;
结合图9,该步骤的具体方法为:
41)对独立划分出来的每行文本图像进行水平投影,得到每行文本图像的最高点纵坐标y1和最低点的纵坐标y2;
42)对所述每行文本图像中的连通域进行从上到下、从左到右的遍历以得到一坐标映射关系表;
在从上到下遍历第一行文本图像时,将遇到的第一个像素点的纵坐标y减去最高点的纵坐标y1,可得到一搬移距离d(减法结果的正负可表示搬移的方向),由此可获得该像素点的新纵坐标,即该像素点的原纵坐标y减去该搬移距离d可得到该像素点的新纵坐标。对于与该像素点同列上的其他各行文本图像中的第一像素点(从上至下遍历时遇到的第一个像素点),新的纵坐标同样是(y-d)。以此类推,每行文本图像的其他像素点可通过同样的方法获得各自的新纵坐标,最终可获得各像素点的一坐标映射关系表。
43)根据该坐标映射关系表,对所述每行文本图像进行转换调整,得到所述校正后的每行文本图像。
5)将该校正后的每行文本图像重新合并成完整的文本图像。
至此,发生桶形畸变的文本图像的校正完成,校正后的图像如图10所示,可以明显地看出,使用本发明的校正方法校正的文本图像几乎已经无畸变无失真,其与实际的文本几乎完全一样。
本发明的文本图像的桶形畸变校正方法,首先对发生桶形畸变的文本图像进行预处理,然后进行膨胀处理,之后将文本图像中的每行文本图像分别独立出来并分别进行坐标调整以将每行文本图像分别校正,最后将分别校正后的每行文本图像合并成完整的文本图像。
本发明公开的文本图像的桶形畸变校正方法无需考虑任何硬件参数的影响,可根据实际需要进行自适应校正,且校正效果良好,能够大大地降低图像的失真率,提高文本图像的质量,具有较高的实用性。本发明可以应用到电子书中,提高阅读质量,还可以嵌入到OCR识别设备中,在OCR识别前,对畸变的图像进行校正,从而提高识别的正确率。
以上所述是本发明的较佳实施例及其所运用的技术原理,对于本领域的技术人员来说,在不背离本发明的精神和范围的情况下,任何基于本发明技术方案基础上的等效变换、简单替换等显而易见的改变,均属于本发明保护范围之内。

Claims (7)

1.一种文本图像的桶形畸变校正方法,其特征在于:它包括以下步骤:
1)首先将待处理的文本图像进行图像的预处理,得到预处理后的文本图像;
2)对该预处理后的文本图像进行膨胀处理,得到膨胀处理后的文本图像;
3)将该膨胀处理后的文本图像中的每行文本图像分别独立出来,且该每行文本图像均具有一连通域;
4)对该独立出来的每行文本图像分别进行坐标调整,得到校正后的每行文本图像;
5)将该校正后的每行文本图像重新合并成完整的文本图像。
2.根据权利要求1所述的文本图像的桶形畸变校正方法,其特征在于:
所述步骤4)进一步包括以下步骤:
41)对所述独立出来的每行文本图像分别进行水平投影,得到所述每行文本图像的最高点纵坐标和最低点纵坐标;
42)对所述每行文本图像中的连通域进行从上到下、从左到右的遍历以得到一坐标映射关系表;
43)根据该坐标映射关系表,对所述每行文本图像进行转换调整,得到所述校正后的每行文本图像。
3.根据权利要求2所述的文本图像的桶形畸变校正方法,其特征在于:
所述步骤1)图像的预处理指按照图像的灰度化、二值化、去噪滤波的步骤对图像进行处理。
4.根据权利要求3所述的文本图像的桶形畸变校正方法,其特征在于:
所述步骤2)对预处理后的文本图像进行膨胀处理的具体方法是:使用结构元素B来遍历原始二值化图像X图像区域中的每个像素点,设X图像中和结构元素B中心点重合的像素点坐标为(x,y),如果结构元素B和X图像中目标区域的交集非空,就将坐标(x,y)设置成目标像素点,以此实现目标区域的向外扩张;
膨胀处理的公式为:
S = X ⊕ B = { x , y | B xy ∩ X ≠ ψ }
式中,S表示膨胀后的二值图像像素点集合,X表示原始二值化图像像素点集合,B表示用于膨胀的结构元素,ψ表示空集;其中,结构元素B中的每一个像素点可以是0或1,其可组成任意形状的图形,且该图形中需要有一中心点用于表示待判断的像素点。
5.根据权利要求4所述的文本图像的桶形畸变校正方法,其特征在于:
针对文本图像的特征,将结构元素中的扩充元素点设计为水平方向较宽,竖直方向较窄的图形。
6.根据权利要求4所述的文本图像的桶形畸变校正方法,其特征在于:
所述膨胀处理后的文本图像还需要进行孔洞填充处理,具体步骤为:先通过连通域标记方法搜索出背景像素并加以标示,然后以集合的膨胀、求补和交集运算为基础对孔洞进行填充,数学公式如下:
X k = ( X k - 1 ⊕ B ) ∩ A c
其中,k=1,2,3,...
式中的X0为搜索到的第一个目标像素点,B为十字对称结构元素,Ac为原始图像的补集;当Xk=Xk-1时,算法在迭代的第K步结束。
7.根据权利要求6所述的文本图像的桶形畸变校正方法,其特征在于:
所述将每行文本图像分别独立出来通过连通域算法实现,即遍历该文本图像中每个像素点,将该每个像素点周围一定区域内的像素点归为一个集合,通过连通域算法处理后的每行文本图像均具有一连通域。
CN 201110460648 2011-12-31 2011-12-31 文本图像的桶形畸变校正方法 Pending CN103186784A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 201110460648 CN103186784A (zh) 2011-12-31 2011-12-31 文本图像的桶形畸变校正方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201110460648 CN103186784A (zh) 2011-12-31 2011-12-31 文本图像的桶形畸变校正方法

Publications (1)

Publication Number Publication Date
CN103186784A true CN103186784A (zh) 2013-07-03

Family

ID=48677944

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201110460648 Pending CN103186784A (zh) 2011-12-31 2011-12-31 文本图像的桶形畸变校正方法

Country Status (1)

Country Link
CN (1) CN103186784A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104883477A (zh) * 2015-04-30 2015-09-02 北京小鸟看看科技有限公司 一种视频数据预畸变处理方法、装置及头戴显示器
CN105023242A (zh) * 2014-04-18 2015-11-04 聚晶半导体股份有限公司 镜头失真校正方法
CN104966092B (zh) * 2015-06-16 2018-06-01 中国联合网络通信集团有限公司 一种图像处理方法和装置
JP2018182730A (ja) * 2017-04-18 2018-11-15 キヤノン株式会社 画像処理装置、画像処理方法、および撮像装置
GB2563140A (en) * 2017-04-18 2018-12-05 Canon Kk Image processing apparatus, image processing method, and image capturing apparatus
CN109441648A (zh) * 2018-12-27 2019-03-08 王雪芬 柴油机油路通断平台
CN113723400A (zh) * 2021-08-23 2021-11-30 中南大学 一种基于红外图像的电解槽极板故障识别方法、系统、终端及可读存储介质

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105023242A (zh) * 2014-04-18 2015-11-04 聚晶半导体股份有限公司 镜头失真校正方法
CN105023242B (zh) * 2014-04-18 2017-11-14 聚晶半导体股份有限公司 镜头失真校正方法
CN104883477A (zh) * 2015-04-30 2015-09-02 北京小鸟看看科技有限公司 一种视频数据预畸变处理方法、装置及头戴显示器
CN104883477B (zh) * 2015-04-30 2018-05-15 北京小鸟看看科技有限公司 一种视频数据预畸变处理方法、装置及头戴显示器
CN104966092B (zh) * 2015-06-16 2018-06-01 中国联合网络通信集团有限公司 一种图像处理方法和装置
JP2018182730A (ja) * 2017-04-18 2018-11-15 キヤノン株式会社 画像処理装置、画像処理方法、および撮像装置
GB2563140A (en) * 2017-04-18 2018-12-05 Canon Kk Image processing apparatus, image processing method, and image capturing apparatus
US10778896B2 (en) 2017-04-18 2020-09-15 Canon Kabushiki Kaisha Image processing apparatus and image processing method
GB2563140B (en) * 2017-04-18 2020-10-07 Canon Kk Image processing apparatus, image processing method, and image capturing apparatus
CN109441648A (zh) * 2018-12-27 2019-03-08 王雪芬 柴油机油路通断平台
CN109441648B (zh) * 2018-12-27 2020-11-24 台州市怡开包装有限公司 柴油机油路通断平台
CN113723400A (zh) * 2021-08-23 2021-11-30 中南大学 一种基于红外图像的电解槽极板故障识别方法、系统、终端及可读存储介质

Similar Documents

Publication Publication Date Title
CN103186784A (zh) 文本图像的桶形畸变校正方法
CN107527324B (zh) 一种hud的图像畸变矫正方法
CN106303477B (zh) 一种自适应的投影仪图像校正方法及系统
CN105118040B (zh) 基于结构激光线的文档图像畸变矫正方法
CN102622593B (zh) 一种文本识别方法及系统
CN107665483B (zh) 免定标便捷的单目镜头鱼眼图像畸变矫正方法
KR101207127B1 (ko) 문자 인식 전처리 방법 및 장치
CN111223053A (zh) 基于深度图像的数据增强方法
CN105957058B (zh) 一种星图的预处理方法
CN103413271B (zh) 基于局部信息的文档图像校正方法
US9626595B2 (en) Method and apparatus for tracking superpixels between related images
CN103839062A (zh) 一种图像文字定位方法及装置
CN106218409A (zh) 一种可人眼跟踪的裸眼3d汽车仪表显示方法及装置
CN105654515A (zh) 基于分片及多特征自适应融合的目标跟踪方法
CN107133929A (zh) 基于背景估计和能量最小化的低质量文档图像二值化方法
CN106709878A (zh) 一种快速图像融合方法
CN102905136B (zh) 一种视频编解码方法、系统
CN104966092A (zh) 一种图像处理方法和装置
CN104992417A (zh) 基于Kinect的人脸视频目光修正方法及系统
CN104732497A (zh) 一种图像去雾方法、fpga及包含该fpga的去雾系统
CN105139338A (zh) 多维查找表的生成方法及装置、图像缩放处理方法及装置
CN108062742B (zh) 一种利用数字图像处理和变形的眉毛更换方法
CN102074025B (zh) 一种图像风格化绘制方法及装置
CN107154027A (zh) 一种畸变图像复原的补偿方法及装置
CN105607272A (zh) 一种3d膜的校正方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20130703