CN102184396A - 基于ocr识别反馈的文档图像倾斜校正方法 - Google Patents
基于ocr识别反馈的文档图像倾斜校正方法 Download PDFInfo
- Publication number
- CN102184396A CN102184396A CN 201110158059 CN201110158059A CN102184396A CN 102184396 A CN102184396 A CN 102184396A CN 201110158059 CN201110158059 CN 201110158059 CN 201110158059 A CN201110158059 A CN 201110158059A CN 102184396 A CN102184396 A CN 102184396A
- Authority
- CN
- China
- Prior art keywords
- file
- picture
- inclination
- selection area
- document image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 13
- 230000000694 effects Effects 0.000 claims abstract description 17
- 238000003672 processing method Methods 0.000 abstract 1
- 238000005516 engineering process Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 230000002950 deficient Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000001915 proofreading effect Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
Images
Landscapes
- Character Input (AREA)
Abstract
本发明公开了图像识别技术领域中的一种基于OCR识别反馈的文档图像倾斜校正方法。包括:输入文档图像;选择文档图像中的一个矩形区域;分别利用文本线跟踪算法和非边界行的文本线跟踪算法对文档图像的选定区域进行OCR识别,并分别得到文档图像的倾斜角度ka和kb以及识别效果参数Ia和Ib;判断Ia和Ib的大小,当Ia≥Ib时,则使用倾斜角度ka对整个文档图像进行校正处理;当Ia<Ib时,则使用倾斜角度kb对整个文档图像进行校正处理。本发明使得校正结果更加准确有效,解决了现有图像处理方法的倾斜校正算法不具有良好通用性的问题。
Description
技术领域
本发明属于图像识别技术领域,尤其涉及一种基于OCR识别反馈的文档图像倾斜校正方法。
背景技术
目前,大多数图像识别技术中使用的倾斜校正算法的计算精度在很大程度上受图像纹理(如文本的字体、字型、脚本以及是否含有图片)的影响,不具有良好的通用性,有些算法只对某种或某几种语言的处理取得较好的结果,有些算法对文本中的大幅图片敏感。另外,目前还没有一种算法能够在处理多语言文本时,产生有效的结果。
针对上述图像识别技术中使用的倾斜校正算法存在的缺陷,本发明提供了一种基于OCR识别反馈的文档图像倾斜校正方法,利用既有的图像识别技术,具体是利用文本线跟踪算法和非边界行的文本线跟踪算法,对文档的一个小矩形区域进行倾角检测并校正得到结果,再利用OCR识别技术,根据该小矩形区域识别后得到的参数确定对该文档识别效果最好的算法,最后用这种反馈得到算法对整个文档进行校正。
发明内容
本发明的目的在于,提供一种基于OCR识别反馈的文档图像倾斜校正方法,用于解决现有图像处理方法的倾斜校正算法不具有良好通用性的问题。
技术方案是,一种基于OCR识别反馈的文档图像倾斜校正方法,其特征是所述方法包括:
步骤1:输入文档图像;
步骤2:选择文档图像中的一个矩形区域;
步骤3:分别利用文本线跟踪算法和非边界行的文本线跟踪算法对文档图像的选定区域进行OCR识别,并分别得到文档图像的倾斜角度ka和kb以及识别效果参数Ia和Ib;
步骤4:判断Ia和Ib的大小,当Ia≥Ib时,则使用倾斜角度ka对整个文档图像进行校正处理;当Ia<Ib时,则使用倾斜角度kb对整个文档图像进行校正处理。
所述利用文本线跟踪算法对文档图像的选定区域进行OCR识别具体包括:
步骤101:利用文本线跟踪算法对文档图像的选定区域进行处理,得到文档图像的倾斜角度ka;
步骤102:利用倾斜角度ka对文档图像的选定区域进行校正处理;
步骤103:对步骤102的校正处理结果进行OCR识别;
步骤104:得到文档图像的选定区域的识别结果,该识别结果包括可疑字符数和识别字符数;
步骤105:利用公式识别效果参数=可疑字符数/识别字符数,计算识别效果参数Ia。
所述利用非边界行的文本线跟踪算法对文档图像的选定区域进行OCR识别具体包括步骤:
步骤201:利用非边界行的文本线跟踪算法对文档图像的选定区域进行处理,得到文档图像的倾斜角度kb;
步骤202:利用倾斜角度kb对文档图像的选定区域进行校正处理;
步骤203:对步骤202的校正处理结果进行OCR识别;
步骤204:得到文档图像的选定区域的识别结果,该识别结果包括可疑字符数和识别字符数;
步骤205:利用公式识别效果参数=可疑字符数/识别字符数,计算识别效果参数Ib。
本发明对文本图像中的一个小矩形区域分别利用文本线跟踪算法和非边界行的文本线跟踪算法进行OCR,使用识别效率高的算法计算出的倾斜角度对整个文档图像进行校正处理,使得校正结果更加准确有效,解决了现有图像处理方法的倾斜校正算法不具有良好通用性的问题。
附图说明
图1是基于OCR识别反馈的文档图像倾斜校正方法流程图;
图2是利用文本线跟踪算法对文档图像的选定区域进行OCR识别流程图;
图3是文本线跟踪算法示意图;
图4是利用非边界行的文本线跟踪算法对文档图像的选定区域进行OCR识别流程图。
具体实施方式
下面结合附图,对优选实施例作详细说明。应该强调的是,下述说明仅仅是示例性的,而不是为了限制本发明的范围及其应用。
图1是基于OCR识别反馈的文档图像倾斜校正方法流程图。图1中,基于OCR识别反馈的文档图像倾斜校正方法包括:
步骤1:输入文档图像。
步骤2:选择文档图像中的一个矩形区域。
步骤3:分别利用文本线跟踪算法和非边界行的文本线跟踪算法对文档图像的选定区域进行OCR识别,并分别得到文档图像的倾斜角度ka和kb以及识别效果参数Ia和Ib。
图2是利用文本线跟踪算法对文档图像的选定区域进行OCR识别流程图。图2中,利用文本线跟踪算法对文档图像的选定区域进行OCR识别具体包括:
步骤101:利用文本线跟踪算法对文档图像的选定区域进行处理,得到文档图像的倾斜角度ka。
图3是文本线跟踪算法示意图。图3中,利用文本线跟踪算法得到文档图像的倾斜角度的过程是,在对图像进行二值化、膨胀、提取中心线之后,首先定义三个点变量,即起始点、当前测试点和结束点。从最后一行文本线的1/2处开始找到第一个黑点,记录下其坐标,将当前测试点设置为起始点相邻的右上方的点,然后测试当前点相邻的右上方、右侧、右下方三个点是否为黑像素点,如果其中一个点为黑色点,就将该点设置为当前测试点,继续进行测试,直到当前点的右侧三个点(右上方、右侧、右下方)均不是黑点,就将这点设置为结束点。这样,由起始点和结束点这两点就可以确定一条直线,而这条直线的斜率就是倾斜角度ka。
步骤102:利用倾斜角度ka对文档图像的选定区域进行校正处理。
步骤103:对步骤102的校正处理结果进行OCR识别。
步骤104:得到文档图像的选定区域的识别结果,该识别结果包括可疑字符数和识别字符数。
步骤105:利用公式识别效果参数=可疑字符数/识别字符数,计算识别效果参数Ia。
图4是利用非边界行的文本线跟踪算法对文档图像的选定区域进行OCR识别流程图。图4中,利用非边界行的文本线跟踪算法对文档图像的选定区域进行OCR识别具体包括步骤:
步骤201:利用非边界行的文本线跟踪算法对文档图像的选定区域进行处理,得到文档图像的倾斜角度kb。
利用非边界行的文本线跟踪算法对文档图像的选定区域进行处理,得到倾斜角度的过程与步骤101利用文本线跟踪算法得到倾斜角度大致相同,唯一不同之处在于,不选择最下边一条文本线(即边界线)作为起始点,而是选择一条非边界的行,比如我们可以选择倒数第三行,如果更精确可以选择倒数三,五,七,九等行,求出多个倾斜角度后做平均,用这个平均值来作为最终的倾斜角度kb。
步骤202:利用倾斜角度kb对文档图像的选定区域进行校正处理。
步骤203:对步骤202的校正处理结果进行OCR识别。
步骤204:得到文档图像的选定区域的识别结果,该识别结果包括可疑字符数和识别字符数。
步骤205:利用公式识别效果参数=可疑字符数/识别字符数,计算识别效果参数Ib。
步骤4:判断Ia和Ib的大小,当Ia≥Ib时,则使用倾斜角度ka对整个文档图像进行校正处理;当Ia<Ib时,则使用倾斜角度kb对整个文档图像进行校正处理。
最后,使用选定的倾斜角度对整个文档图像进行校正处理,然后对校正后的结果进行OCR识别,从而得到整个文档图像的识别结果。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。
Claims (3)
1.一种基于OCR识别反馈的文档图像倾斜校正方法,其特征是所述方法包括:
步骤1:输入文档图像;
步骤2:选择文档图像中的一个矩形区域;
步骤3:分别利用文本线跟踪算法和非边界行的文本线跟踪算法对文档图像的选定区域进行OCR识别,并分别得到文档图像的倾斜角度ka和kb以及识别效果参数Ia和Ib;
步骤4:判断Ia和Ib的大小,当Ia≥Ib时,则使用倾斜角度ka对整个文档图像进行校正处理;当Ia<Ib时,则使用倾斜角度kb对整个文档图像进行校正处理。
2.根据权利要求1所述的一种基于OCR识别反馈的文档图像倾斜校正方法,其特征是所述利用文本线跟踪算法对文档图像的选定区域进行OCR识别具体包括:
步骤101:利用文本线跟踪算法对文档图像的选定区域进行处理,得到文档图像的倾斜角度ka;
步骤102:利用倾斜角度ka对文档图像的选定区域进行校正处理;
步骤103:对步骤102的校正处理结果进行OCR识别;
步骤104:得到文档图像的选定区域的识别结果,该识别结果包括可疑字符数和识别字符数;
步骤105:利用公式识别效果参数=可疑字符数/识别字符数,计算识别效果参数Ia。
3.根据权利要求1所述的一种基于OCR识别反馈的文档图像倾斜校正方法,其特征是所述利用非边界行的文本线跟踪算法对文档图像的选定区域进行OCR识别具体包括步骤:
步骤201:利用非边界行的文本线跟踪算法对文档图像的选定区域进行处理,得到文档图像的倾斜角度kb;
步骤202:利用倾斜角度kb对文档图像的选定区域进行校正处理;
步骤203:对步骤202的校正处理结果进行OCR识别;
步骤204:得到文档图像的选定区域的识别结果,该识别结果包括可疑字符数和识别字符数;
步骤205:利用公式识别效果参数=可疑字符数/识别字符数,计算识别效果参数Ib。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201110158059 CN102184396A (zh) | 2011-06-13 | 2011-06-13 | 基于ocr识别反馈的文档图像倾斜校正方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201110158059 CN102184396A (zh) | 2011-06-13 | 2011-06-13 | 基于ocr识别反馈的文档图像倾斜校正方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102184396A true CN102184396A (zh) | 2011-09-14 |
Family
ID=44570570
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 201110158059 Pending CN102184396A (zh) | 2011-06-13 | 2011-06-13 | 基于ocr识别反馈的文档图像倾斜校正方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102184396A (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102999752A (zh) * | 2012-11-15 | 2013-03-27 | 广东欧珀移动通信有限公司 | 对图片中局部字符进行快速识别的方法、装置及终端 |
CN103593643A (zh) * | 2012-08-16 | 2014-02-19 | 百度在线网络技术(北京)有限公司 | 一种图像识别的方法及系统 |
CN103793903A (zh) * | 2012-10-29 | 2014-05-14 | 方正国际软件(北京)有限公司 | 一种利用条形码识别的图像分割方法及系统 |
CN104424472A (zh) * | 2013-09-05 | 2015-03-18 | 华为终端有限公司 | 一种图像识别方法及用户终端 |
CN105260997A (zh) * | 2015-09-22 | 2016-01-20 | 北京好运到信息科技有限公司 | 一种自动获取目标图像的方法 |
CN105512659A (zh) * | 2015-12-10 | 2016-04-20 | 广东小天才科技有限公司 | 一种文字行弯曲的修正方法及系统 |
WO2019056346A1 (zh) * | 2017-09-25 | 2019-03-28 | 深圳传音通讯有限公司 | 一种利用膨胀法校正文本图像倾斜的方法及装置 |
CN112085014A (zh) * | 2020-09-10 | 2020-12-15 | 京东方科技集团股份有限公司 | Ocr文字位置的校正方法、装置、存储介质及电子设备 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102024138A (zh) * | 2009-09-15 | 2011-04-20 | 富士通株式会社 | 字符识别方法和字符识别装置 |
-
2011
- 2011-06-13 CN CN 201110158059 patent/CN102184396A/zh active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102024138A (zh) * | 2009-09-15 | 2011-04-20 | 富士通株式会社 | 字符识别方法和字符识别装置 |
Non-Patent Citations (1)
Title |
---|
《Communication Software and Networks (ICCSN) 2011 IEEE 3rd International Conference》 20110529 Xiaoling Fu,Yazhuo Xu and Lijing Tong Document image skew adjusting based on the feedback information recognized by OCR 376-378 1-3 , * |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103593643A (zh) * | 2012-08-16 | 2014-02-19 | 百度在线网络技术(北京)有限公司 | 一种图像识别的方法及系统 |
CN103593643B (zh) * | 2012-08-16 | 2019-02-12 | 百度在线网络技术(北京)有限公司 | 一种图像识别的方法及系统 |
CN103793903A (zh) * | 2012-10-29 | 2014-05-14 | 方正国际软件(北京)有限公司 | 一种利用条形码识别的图像分割方法及系统 |
CN103793903B (zh) * | 2012-10-29 | 2018-07-27 | 方正国际软件(北京)有限公司 | 一种利用条形码识别的图像分割方法及系统 |
CN102999752A (zh) * | 2012-11-15 | 2013-03-27 | 广东欧珀移动通信有限公司 | 对图片中局部字符进行快速识别的方法、装置及终端 |
CN104424472A (zh) * | 2013-09-05 | 2015-03-18 | 华为终端有限公司 | 一种图像识别方法及用户终端 |
CN104424472B (zh) * | 2013-09-05 | 2019-02-19 | 华为终端(东莞)有限公司 | 一种图像识别方法及用户终端 |
CN105260997A (zh) * | 2015-09-22 | 2016-01-20 | 北京好运到信息科技有限公司 | 一种自动获取目标图像的方法 |
CN105512659A (zh) * | 2015-12-10 | 2016-04-20 | 广东小天才科技有限公司 | 一种文字行弯曲的修正方法及系统 |
CN105512659B (zh) * | 2015-12-10 | 2019-05-21 | 广东小天才科技有限公司 | 一种文字行弯曲的修正方法及系统 |
WO2019056346A1 (zh) * | 2017-09-25 | 2019-03-28 | 深圳传音通讯有限公司 | 一种利用膨胀法校正文本图像倾斜的方法及装置 |
CN112085014A (zh) * | 2020-09-10 | 2020-12-15 | 京东方科技集团股份有限公司 | Ocr文字位置的校正方法、装置、存储介质及电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102184396A (zh) | 基于ocr识别反馈的文档图像倾斜校正方法 | |
CN106251341B (zh) | 一种印刷品质量检测方法 | |
CN111474184B (zh) | 基于工业机器视觉的aoi字符缺陷检测方法和装置 | |
CN104751559B (zh) | 验钞装置及验钞方法 | |
KR101207127B1 (ko) | 문자 인식 전처리 방법 및 장치 | |
US20080226171A1 (en) | Correcting device and method for perspective transformed document images | |
RU2621601C1 (ru) | Устранение искривлений изображения документа | |
WO2018086233A1 (zh) | 一种字符分割方法和装置、及元件检测方法和装置 | |
CN106920245B (zh) | 一种边界检测的方法及装置 | |
US20220172337A1 (en) | Character defect detection method and device | |
CN108133216B (zh) | 基于机器视觉的可实现小数点读取的数码管读数识别方法 | |
CN104794421A (zh) | 一种qr码定位及识别方法 | |
CN106446894A (zh) | 一种基于轮廓识别球型目标物位置的方法 | |
CN112419298B (zh) | 一种螺栓节点板锈蚀检测方法、装置、设备及存储介质 | |
US20120106784A1 (en) | Apparatus and method for tracking object in image processing system | |
CN105718931B (zh) | 用于确定采集图像中的杂斑的系统和方法 | |
CN102622593A (zh) | 一种文本识别方法及系统 | |
CN113554667B (zh) | 一种基于图像识别的三维位移检测方法及装置 | |
JP2012043433A (ja) | 画像処理方法及び装置 | |
CN109671109B (zh) | 密集点云生成方法及系统 | |
CN102063621A (zh) | 文字行几何畸变校正方法和装置 | |
CN113870174A (zh) | 一种基于图像融合的紫外图像电晕识别定位方法及系统 | |
JP5772675B2 (ja) | 濃淡画像のエッジ抽出方法、エッジ抽出装置並びに濃淡画像のエッジ抽出プログラム | |
Mangla et al. | An end detection algorithm for segmentation of broken and touching characters in handwritten Gurumukhi word | |
JP2007041832A (ja) | 差分画像抽出装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20110914 |