CN102184396A - 基于ocr识别反馈的文档图像倾斜校正方法 - Google Patents

基于ocr识别反馈的文档图像倾斜校正方法 Download PDF

Info

Publication number
CN102184396A
CN102184396A CN 201110158059 CN201110158059A CN102184396A CN 102184396 A CN102184396 A CN 102184396A CN 201110158059 CN201110158059 CN 201110158059 CN 201110158059 A CN201110158059 A CN 201110158059A CN 102184396 A CN102184396 A CN 102184396A
Authority
CN
China
Prior art keywords
file
picture
inclination
selection area
document image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN 201110158059
Other languages
English (en)
Inventor
童立靖
宋丽华
曾凡锋
付晓玲
王景中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
North China University of Technology
Original Assignee
North China University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by North China University of Technology filed Critical North China University of Technology
Priority to CN 201110158059 priority Critical patent/CN102184396A/zh
Publication of CN102184396A publication Critical patent/CN102184396A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)

Abstract

本发明公开了图像识别技术领域中的一种基于OCR识别反馈的文档图像倾斜校正方法。包括:输入文档图像;选择文档图像中的一个矩形区域;分别利用文本线跟踪算法和非边界行的文本线跟踪算法对文档图像的选定区域进行OCR识别,并分别得到文档图像的倾斜角度ka和kb以及识别效果参数Ia和Ib;判断Ia和Ib的大小,当Ia≥Ib时,则使用倾斜角度ka对整个文档图像进行校正处理;当Ia<Ib时,则使用倾斜角度kb对整个文档图像进行校正处理。本发明使得校正结果更加准确有效,解决了现有图像处理方法的倾斜校正算法不具有良好通用性的问题。

Description

基于OCR识别反馈的文档图像倾斜校正方法
技术领域
本发明属于图像识别技术领域,尤其涉及一种基于OCR识别反馈的文档图像倾斜校正方法。
背景技术
目前,大多数图像识别技术中使用的倾斜校正算法的计算精度在很大程度上受图像纹理(如文本的字体、字型、脚本以及是否含有图片)的影响,不具有良好的通用性,有些算法只对某种或某几种语言的处理取得较好的结果,有些算法对文本中的大幅图片敏感。另外,目前还没有一种算法能够在处理多语言文本时,产生有效的结果。
针对上述图像识别技术中使用的倾斜校正算法存在的缺陷,本发明提供了一种基于OCR识别反馈的文档图像倾斜校正方法,利用既有的图像识别技术,具体是利用文本线跟踪算法和非边界行的文本线跟踪算法,对文档的一个小矩形区域进行倾角检测并校正得到结果,再利用OCR识别技术,根据该小矩形区域识别后得到的参数确定对该文档识别效果最好的算法,最后用这种反馈得到算法对整个文档进行校正。
发明内容
本发明的目的在于,提供一种基于OCR识别反馈的文档图像倾斜校正方法,用于解决现有图像处理方法的倾斜校正算法不具有良好通用性的问题。
技术方案是,一种基于OCR识别反馈的文档图像倾斜校正方法,其特征是所述方法包括:
步骤1:输入文档图像;
步骤2:选择文档图像中的一个矩形区域;
步骤3:分别利用文本线跟踪算法和非边界行的文本线跟踪算法对文档图像的选定区域进行OCR识别,并分别得到文档图像的倾斜角度ka和kb以及识别效果参数Ia和Ib
步骤4:判断Ia和Ib的大小,当Ia≥Ib时,则使用倾斜角度ka对整个文档图像进行校正处理;当Ia<Ib时,则使用倾斜角度kb对整个文档图像进行校正处理。
所述利用文本线跟踪算法对文档图像的选定区域进行OCR识别具体包括:
步骤101:利用文本线跟踪算法对文档图像的选定区域进行处理,得到文档图像的倾斜角度ka
步骤102:利用倾斜角度ka对文档图像的选定区域进行校正处理;
步骤103:对步骤102的校正处理结果进行OCR识别;
步骤104:得到文档图像的选定区域的识别结果,该识别结果包括可疑字符数和识别字符数;
步骤105:利用公式识别效果参数=可疑字符数/识别字符数,计算识别效果参数Ia
所述利用非边界行的文本线跟踪算法对文档图像的选定区域进行OCR识别具体包括步骤:
步骤201:利用非边界行的文本线跟踪算法对文档图像的选定区域进行处理,得到文档图像的倾斜角度kb
步骤202:利用倾斜角度kb对文档图像的选定区域进行校正处理;
步骤203:对步骤202的校正处理结果进行OCR识别;
步骤204:得到文档图像的选定区域的识别结果,该识别结果包括可疑字符数和识别字符数;
步骤205:利用公式识别效果参数=可疑字符数/识别字符数,计算识别效果参数Ib
本发明对文本图像中的一个小矩形区域分别利用文本线跟踪算法和非边界行的文本线跟踪算法进行OCR,使用识别效率高的算法计算出的倾斜角度对整个文档图像进行校正处理,使得校正结果更加准确有效,解决了现有图像处理方法的倾斜校正算法不具有良好通用性的问题。
附图说明
图1是基于OCR识别反馈的文档图像倾斜校正方法流程图;
图2是利用文本线跟踪算法对文档图像的选定区域进行OCR识别流程图;
图3是文本线跟踪算法示意图;
图4是利用非边界行的文本线跟踪算法对文档图像的选定区域进行OCR识别流程图。
具体实施方式
下面结合附图,对优选实施例作详细说明。应该强调的是,下述说明仅仅是示例性的,而不是为了限制本发明的范围及其应用。
图1是基于OCR识别反馈的文档图像倾斜校正方法流程图。图1中,基于OCR识别反馈的文档图像倾斜校正方法包括:
步骤1:输入文档图像。
步骤2:选择文档图像中的一个矩形区域。
步骤3:分别利用文本线跟踪算法和非边界行的文本线跟踪算法对文档图像的选定区域进行OCR识别,并分别得到文档图像的倾斜角度ka和kb以及识别效果参数Ia和Ib
图2是利用文本线跟踪算法对文档图像的选定区域进行OCR识别流程图。图2中,利用文本线跟踪算法对文档图像的选定区域进行OCR识别具体包括:
步骤101:利用文本线跟踪算法对文档图像的选定区域进行处理,得到文档图像的倾斜角度ka
图3是文本线跟踪算法示意图。图3中,利用文本线跟踪算法得到文档图像的倾斜角度的过程是,在对图像进行二值化、膨胀、提取中心线之后,首先定义三个点变量,即起始点、当前测试点和结束点。从最后一行文本线的1/2处开始找到第一个黑点,记录下其坐标,将当前测试点设置为起始点相邻的右上方的点,然后测试当前点相邻的右上方、右侧、右下方三个点是否为黑像素点,如果其中一个点为黑色点,就将该点设置为当前测试点,继续进行测试,直到当前点的右侧三个点(右上方、右侧、右下方)均不是黑点,就将这点设置为结束点。这样,由起始点和结束点这两点就可以确定一条直线,而这条直线的斜率就是倾斜角度ka
步骤102:利用倾斜角度ka对文档图像的选定区域进行校正处理。
步骤103:对步骤102的校正处理结果进行OCR识别。
步骤104:得到文档图像的选定区域的识别结果,该识别结果包括可疑字符数和识别字符数。
步骤105:利用公式识别效果参数=可疑字符数/识别字符数,计算识别效果参数Ia
图4是利用非边界行的文本线跟踪算法对文档图像的选定区域进行OCR识别流程图。图4中,利用非边界行的文本线跟踪算法对文档图像的选定区域进行OCR识别具体包括步骤:
步骤201:利用非边界行的文本线跟踪算法对文档图像的选定区域进行处理,得到文档图像的倾斜角度kb
利用非边界行的文本线跟踪算法对文档图像的选定区域进行处理,得到倾斜角度的过程与步骤101利用文本线跟踪算法得到倾斜角度大致相同,唯一不同之处在于,不选择最下边一条文本线(即边界线)作为起始点,而是选择一条非边界的行,比如我们可以选择倒数第三行,如果更精确可以选择倒数三,五,七,九等行,求出多个倾斜角度后做平均,用这个平均值来作为最终的倾斜角度kb
步骤202:利用倾斜角度kb对文档图像的选定区域进行校正处理。
步骤203:对步骤202的校正处理结果进行OCR识别。
步骤204:得到文档图像的选定区域的识别结果,该识别结果包括可疑字符数和识别字符数。
步骤205:利用公式识别效果参数=可疑字符数/识别字符数,计算识别效果参数Ib
步骤4:判断Ia和Ib的大小,当Ia≥Ib时,则使用倾斜角度ka对整个文档图像进行校正处理;当Ia<Ib时,则使用倾斜角度kb对整个文档图像进行校正处理。
最后,使用选定的倾斜角度对整个文档图像进行校正处理,然后对校正后的结果进行OCR识别,从而得到整个文档图像的识别结果。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

Claims (3)

1.一种基于OCR识别反馈的文档图像倾斜校正方法,其特征是所述方法包括:
步骤1:输入文档图像;
步骤2:选择文档图像中的一个矩形区域;
步骤3:分别利用文本线跟踪算法和非边界行的文本线跟踪算法对文档图像的选定区域进行OCR识别,并分别得到文档图像的倾斜角度ka和kb以及识别效果参数Ia和Ib
步骤4:判断Ia和Ib的大小,当Ia≥Ib时,则使用倾斜角度ka对整个文档图像进行校正处理;当Ia<Ib时,则使用倾斜角度kb对整个文档图像进行校正处理。
2.根据权利要求1所述的一种基于OCR识别反馈的文档图像倾斜校正方法,其特征是所述利用文本线跟踪算法对文档图像的选定区域进行OCR识别具体包括:
步骤101:利用文本线跟踪算法对文档图像的选定区域进行处理,得到文档图像的倾斜角度ka
步骤102:利用倾斜角度ka对文档图像的选定区域进行校正处理;
步骤103:对步骤102的校正处理结果进行OCR识别;
步骤104:得到文档图像的选定区域的识别结果,该识别结果包括可疑字符数和识别字符数;
步骤105:利用公式识别效果参数=可疑字符数/识别字符数,计算识别效果参数Ia
3.根据权利要求1所述的一种基于OCR识别反馈的文档图像倾斜校正方法,其特征是所述利用非边界行的文本线跟踪算法对文档图像的选定区域进行OCR识别具体包括步骤:
步骤201:利用非边界行的文本线跟踪算法对文档图像的选定区域进行处理,得到文档图像的倾斜角度kb
步骤202:利用倾斜角度kb对文档图像的选定区域进行校正处理;
步骤203:对步骤202的校正处理结果进行OCR识别;
步骤204:得到文档图像的选定区域的识别结果,该识别结果包括可疑字符数和识别字符数;
步骤205:利用公式识别效果参数=可疑字符数/识别字符数,计算识别效果参数Ib
CN 201110158059 2011-06-13 2011-06-13 基于ocr识别反馈的文档图像倾斜校正方法 Pending CN102184396A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 201110158059 CN102184396A (zh) 2011-06-13 2011-06-13 基于ocr识别反馈的文档图像倾斜校正方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201110158059 CN102184396A (zh) 2011-06-13 2011-06-13 基于ocr识别反馈的文档图像倾斜校正方法

Publications (1)

Publication Number Publication Date
CN102184396A true CN102184396A (zh) 2011-09-14

Family

ID=44570570

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201110158059 Pending CN102184396A (zh) 2011-06-13 2011-06-13 基于ocr识别反馈的文档图像倾斜校正方法

Country Status (1)

Country Link
CN (1) CN102184396A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102999752A (zh) * 2012-11-15 2013-03-27 广东欧珀移动通信有限公司 对图片中局部字符进行快速识别的方法、装置及终端
CN103593643A (zh) * 2012-08-16 2014-02-19 百度在线网络技术(北京)有限公司 一种图像识别的方法及系统
CN103793903A (zh) * 2012-10-29 2014-05-14 方正国际软件(北京)有限公司 一种利用条形码识别的图像分割方法及系统
CN104424472A (zh) * 2013-09-05 2015-03-18 华为终端有限公司 一种图像识别方法及用户终端
CN105260997A (zh) * 2015-09-22 2016-01-20 北京好运到信息科技有限公司 一种自动获取目标图像的方法
CN105512659A (zh) * 2015-12-10 2016-04-20 广东小天才科技有限公司 一种文字行弯曲的修正方法及系统
WO2019056346A1 (zh) * 2017-09-25 2019-03-28 深圳传音通讯有限公司 一种利用膨胀法校正文本图像倾斜的方法及装置
CN112085014A (zh) * 2020-09-10 2020-12-15 京东方科技集团股份有限公司 Ocr文字位置的校正方法、装置、存储介质及电子设备

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102024138A (zh) * 2009-09-15 2011-04-20 富士通株式会社 字符识别方法和字符识别装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102024138A (zh) * 2009-09-15 2011-04-20 富士通株式会社 字符识别方法和字符识别装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
《Communication Software and Networks (ICCSN) 2011 IEEE 3rd International Conference》 20110529 Xiaoling Fu,Yazhuo Xu and Lijing Tong Document image skew adjusting based on the feedback information recognized by OCR 376-378 1-3 , *

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103593643A (zh) * 2012-08-16 2014-02-19 百度在线网络技术(北京)有限公司 一种图像识别的方法及系统
CN103593643B (zh) * 2012-08-16 2019-02-12 百度在线网络技术(北京)有限公司 一种图像识别的方法及系统
CN103793903A (zh) * 2012-10-29 2014-05-14 方正国际软件(北京)有限公司 一种利用条形码识别的图像分割方法及系统
CN103793903B (zh) * 2012-10-29 2018-07-27 方正国际软件(北京)有限公司 一种利用条形码识别的图像分割方法及系统
CN102999752A (zh) * 2012-11-15 2013-03-27 广东欧珀移动通信有限公司 对图片中局部字符进行快速识别的方法、装置及终端
CN104424472A (zh) * 2013-09-05 2015-03-18 华为终端有限公司 一种图像识别方法及用户终端
CN104424472B (zh) * 2013-09-05 2019-02-19 华为终端(东莞)有限公司 一种图像识别方法及用户终端
CN105260997A (zh) * 2015-09-22 2016-01-20 北京好运到信息科技有限公司 一种自动获取目标图像的方法
CN105512659A (zh) * 2015-12-10 2016-04-20 广东小天才科技有限公司 一种文字行弯曲的修正方法及系统
CN105512659B (zh) * 2015-12-10 2019-05-21 广东小天才科技有限公司 一种文字行弯曲的修正方法及系统
WO2019056346A1 (zh) * 2017-09-25 2019-03-28 深圳传音通讯有限公司 一种利用膨胀法校正文本图像倾斜的方法及装置
CN112085014A (zh) * 2020-09-10 2020-12-15 京东方科技集团股份有限公司 Ocr文字位置的校正方法、装置、存储介质及电子设备

Similar Documents

Publication Publication Date Title
CN102184396A (zh) 基于ocr识别反馈的文档图像倾斜校正方法
CN106251341B (zh) 一种印刷品质量检测方法
CN111474184B (zh) 基于工业机器视觉的aoi字符缺陷检测方法和装置
CN104751559B (zh) 验钞装置及验钞方法
KR101207127B1 (ko) 문자 인식 전처리 방법 및 장치
US20080226171A1 (en) Correcting device and method for perspective transformed document images
RU2621601C1 (ru) Устранение искривлений изображения документа
WO2018086233A1 (zh) 一种字符分割方法和装置、及元件检测方法和装置
CN106920245B (zh) 一种边界检测的方法及装置
US20220172337A1 (en) Character defect detection method and device
CN108133216B (zh) 基于机器视觉的可实现小数点读取的数码管读数识别方法
CN104794421A (zh) 一种qr码定位及识别方法
CN106446894A (zh) 一种基于轮廓识别球型目标物位置的方法
CN112419298B (zh) 一种螺栓节点板锈蚀检测方法、装置、设备及存储介质
US20120106784A1 (en) Apparatus and method for tracking object in image processing system
CN105718931B (zh) 用于确定采集图像中的杂斑的系统和方法
CN102622593A (zh) 一种文本识别方法及系统
CN113554667B (zh) 一种基于图像识别的三维位移检测方法及装置
JP2012043433A (ja) 画像処理方法及び装置
CN109671109B (zh) 密集点云生成方法及系统
CN102063621A (zh) 文字行几何畸变校正方法和装置
CN113870174A (zh) 一种基于图像融合的紫外图像电晕识别定位方法及系统
JP5772675B2 (ja) 濃淡画像のエッジ抽出方法、エッジ抽出装置並びに濃淡画像のエッジ抽出プログラム
Mangla et al. An end detection algorithm for segmentation of broken and touching characters in handwritten Gurumukhi word
JP2007041832A (ja) 差分画像抽出装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20110914