CN106447615A - 一种扫描文档图像的倾斜校正方法 - Google Patents
一种扫描文档图像的倾斜校正方法 Download PDFInfo
- Publication number
- CN106447615A CN106447615A CN201610623260.3A CN201610623260A CN106447615A CN 106447615 A CN106447615 A CN 106447615A CN 201610623260 A CN201610623260 A CN 201610623260A CN 106447615 A CN106447615 A CN 106447615A
- Authority
- CN
- China
- Prior art keywords
- angle
- projection
- image
- length
- document image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformation in the plane of the image
- G06T3/60—Rotation of a whole image or part thereof
- G06T3/608—Skewing or deskewing, e.g. by two-pass or three-pass rotation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/24—Aligning, centring, orientation detection or correction of the image
- G06V10/247—Aligning, centring, orientation detection or correction of the image by affine transforms, e.g. correction due to perspective effects; Quadrilaterals, e.g. trapezoids
Abstract
本发明特别涉及一种扫描文档图像的倾斜校正方法。该扫描文档图像的倾斜校正方法,首先对选定的图像边缘标记点做多方向投影,其次获取投影直方图;然后计算各角度投影直方图的均方差,求出最大差分,将对应的投影角度作为倾角的粗略估值;最后以粗略估值为中心,再次以给定的检测精度为步长进行投影;重复第1次投影的工作,求出投影直方图方差的最大值,以对应的角度作为图像倾角的检测值;选取水平和垂直边缘标记点投影计算出的较小的角度作为倾斜角,对图像照倾斜角度进行旋转变换。该扫描文档图像的倾斜校正方法,在满足检测的精度的同时又能减少总的投影次数;校正速度快且准确率较高,满足了字符识别预处理的要求。
Description
技术领域
本发明涉及文档图像自动处理技术领域,特别涉及一种扫描文档图像的倾斜校正方法。
背景技术
文档图像自动处理的目的是在数字图像中识别文字,图形和图片,并按照需要提取信息。其中,文字处理包括:版面分析,切分出段落,行和单字,然后进行OCR中的识别。在OCR识别中,文本图像经常会出现一定角度的倾斜。因为图像的倾斜使OCR中字符分割发生困难,3度以上的倾斜会引起字符明显变形,使大部分OCR方法难以适应。为了将倾斜的文本图像校正,以便于字符识别中的后续处理,快速准确的检测倾斜文本图像的倾角成为一项重要的预处理技术。
目前对文档图像倾角检测的方法主要有基于Hough变换的方法,基于交叉相关性的方法,基于投影特征的方法,基于Fourier变换的方法和基于K-最近邻簇的方法。
其中,Hough变换是最常用的倾斜角检测的方法,但基于Hough算法的计算量非常大,导致该方法应用难度大。交叉相关算法是一种基于等距离的水平平行线上的像素点的相关性的方法,虽然计算得到的准确率很高,但是同样的存在计算量过大的问题。
使用文本行投影进行变换,只根据文本行就可以计算文档图像的倾斜角度。对图像中的直线可使用链码方法进行标记,对有效点进行标记和标记合并,根据直线的边缘点进行直线拟合是比较稳定可靠的方法,基于投影方法的改进,提出了两级边缘投影直方图差的算法。基于此,本发明设计了一种扫描文档图像的倾斜校正方法。旨在提出一种快速的准确的图像倾斜校正方法,解决现有数字图像字符识别业务中图像的分割识别问题,提高文档信息采集,录入准确性、减少拒识率,提高产品的易操作性和可靠性。
发明内容
本发明为了弥补现有技术的缺陷,提供了一种简单高效的扫描文档图像的倾斜校正方法。
本发明是通过如下技术方案实现的:
一种扫描文档图像的倾斜校正方法,其特征在于包括以下步骤:
(1)扫描图像,寻找图像边缘标记点;
(2)首先在预定的角度范围内以一定角度步长对选定的图像边缘标记点做多方向投影,其次获取投影直方图;然后计算各角度投影直方图的均方差,求出所有投影直方图方差的最大差分,将对应的投影角度作为倾角的粗略估值;最后以粗略估值为中心,以第1次投影步长为半径的角度范围内,再次以给定的检测精度为步长进行投影;重复第1次投影的工作,求出投影直方图方差的最大值,以对应的角度作为图像倾角的检测值;
(3)如果倾斜角度的绝对值小于设定值,不进行图像旋转;
(4)选取水平和垂直边缘标记点投影计算出的较小的角度作为倾斜角,对图像照倾斜角度进行旋转变换。
所述步骤(1)中,首先根据图像尺寸设置检测步长,对图像上、下、左、右四个区域进行检测;然后根据检测步长从水平方向和垂直方向分别检测图像,找出边缘标记点,对边缘标记点进行投影。
所述步骤(2)中,选取次级步长θ,且取值比允许的倾斜误差稍大,按公式计算初级角度步长θ1,计算公式为其中,θ1为初级步长,θ为次级步长,θmax为最大校正倾斜角度。
本发明的有益效果是:该扫描文档图像的倾斜校正方法,采用边缘标记点两级投影,提高了倾斜角的检测速度,同时采用投影直方图方差技术,投影面积方差最大的角度就是要检测的角度,只对边缘点进行投影,计算快速,在满足检测的精度的同时又能减少总的投影次数;校正速度快且准确率较高,满足了字符识别预处理的要求。
具体实施方式
为了使本发明所要解决的技术问题、技术方案及有益效果更加清楚明白,以下结合实施例,对本发明进行详细的说明。应当说明的是,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
该扫描文档图像的倾斜校正方法,包括以下步骤:
(1)扫描图像,寻找图像边缘标记点;
(2)首先在预定的角度范围内以一定角度步长对选定的图像边缘标记点做多方向投影,其次获取投影直方图;然后计算各角度投影直方图的均方差,求出所有投影直方图方差的最大差分,将对应的投影角度作为倾角的粗略估值;最后以粗略估值为中心,以第1次投影步长为半径的角度范围内,再次以给定的检测精度为步长进行投影;重复第1次投影的工作,求出投影直方图方差的最大值,以对应的角度作为图像倾角的检测值;
(3)如果倾斜角度的绝对值小于设定值,不进行图像旋转;
(4)选取水平和垂直边缘标记点投影计算出的较小的角度作为倾斜角,对图像照倾斜角度进行旋转变换。
所述步骤(1)中,首先根据图像尺寸设置检测步长,对图像上、下、左、右四个区域进行检测;然后根据检测步长从水平方向和垂直方向分别检测图像,找出边缘标记点,对边缘标记点进行投影。
所述步骤(2)中,选取次级步长θ,且取值比允许的倾斜误差稍大,按公式计算初级角度步长θ1,计算公式为其中,θ1为初级步长,θ为次级步长,θmax为最大校正倾斜角度。
该扫描文档图像的倾斜校正方法,采用边缘标记点两级投影,提高了倾斜角的检测速度,同时采用投影直方图方差技术,投影面积方差最大的角度就是要检测的角度,只对边缘点进行投影,计算快速,在满足检测的精度的同时又能减少总的投影次数;校正速度快且准确率较高,满足了字符识别预处理的要求。
Claims (3)
1.一种扫描文档图像的倾斜校正方法,其特征在于包括以下步骤:
(1)扫描图像,寻找图像边缘标记点;
(2)首先在预定的角度范围内以一定角度步长对选定的图像边缘标记点做多方向投影,其次获取投影直方图;然后计算各角度投影直方图的均方差,求出所有投影直方图方差的最大差分,将对应的投影角度作为倾角的粗略估值;最后以粗略估值为中心,以第1次投影步长为半径的角度范围内,再次以给定的检测精度为步长进行投影;重复第1次投影的工作,求出投影直方图方差的最大值,以对应的角度作为图像倾角的检测值;
(3)如果倾斜角度的绝对值小于设定值,不进行图像旋转;
(4)选取水平和垂直边缘标记点投影计算出的较小的角度作为倾斜角,对图像照倾斜角度进行旋转变换。
2.根据权利要求1所述的扫描文档图像的倾斜校正方法,其特征在于包括以下步骤:所述步骤(1)中,首先根据图像尺寸设置检测步长,对图像上、下、左、右四个区域进行检测;然后根据检测步长从水平方向和垂直方向分别检测图像,找出边缘标记点,对边缘标记点进行投影。
3.根据权利要求1所述的扫描文档图像的倾斜校正方法,其特征在于:所述步骤(2)中,选取次级步长θ,且取值比允许的倾斜误差稍大,按公式计算初级角度步长θ1,计算公式为其中,θ1为初级步长,θ为次级步长,θmax为最大校正倾斜角度。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610623260.3A CN106447615A (zh) | 2016-08-02 | 2016-08-02 | 一种扫描文档图像的倾斜校正方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610623260.3A CN106447615A (zh) | 2016-08-02 | 2016-08-02 | 一种扫描文档图像的倾斜校正方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106447615A true CN106447615A (zh) | 2017-02-22 |
Family
ID=58184907
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610623260.3A Pending CN106447615A (zh) | 2016-08-02 | 2016-08-02 | 一种扫描文档图像的倾斜校正方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106447615A (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107220644A (zh) * | 2017-04-18 | 2017-09-29 | 天津大学 | 一种心电图扫描图像倾斜度校正方法 |
CN108009990A (zh) * | 2017-11-30 | 2018-05-08 | 北京小米移动软件有限公司 | 倾斜对象处理方法及装置 |
CN108090875A (zh) * | 2018-01-11 | 2018-05-29 | 湖南乐泊科技有限公司 | 图像倾斜校正方法、装置、存储介质和计算机设备 |
CN108573473A (zh) * | 2018-04-27 | 2018-09-25 | 平安科技(深圳)有限公司 | 图片旋转方法、装置、计算机设备及存储介质 |
CN110533036A (zh) * | 2019-08-28 | 2019-12-03 | 湖南长城信息金融设备有限责任公司 | 一种票据扫描图像快速倾斜校正方法和系统 |
CN111681173A (zh) * | 2020-05-25 | 2020-09-18 | 浙江大学 | 基于最小面积边界框与投影法相结合的倾斜图像校正方法 |
CN112101351A (zh) * | 2020-09-07 | 2020-12-18 | 凌云光技术股份有限公司 | 一种基于投影的文本行旋转校正方法及装置 |
CN113128495A (zh) * | 2019-12-30 | 2021-07-16 | 广州慧睿思通科技股份有限公司 | 文本倾斜矫正方法、装置、存储介质、计算机设备 |
CN113852730A (zh) * | 2021-09-28 | 2021-12-28 | 科大讯飞股份有限公司 | 一种倾斜角确定方法及其相关设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0750415A2 (en) * | 1995-06-20 | 1996-12-27 | Canon Kabushiki Kaisha | Image processing method and apparatus |
US20070252905A1 (en) * | 2006-04-21 | 2007-11-01 | Yamaha Corporation | Image processing apparatus |
CN101930594A (zh) * | 2010-04-14 | 2010-12-29 | 山东山大鸥玛软件有限公司 | 一种扫描文档图像的快速纠偏方法 |
CN105261110A (zh) * | 2015-10-26 | 2016-01-20 | 江苏国光信息产业股份有限公司 | 一种高效dsp纸币冠字号识别方法 |
US20160131479A1 (en) * | 2014-11-12 | 2016-05-12 | Kabushiki Kaisha Topcon | Tilt Detecting System And Tilt Detecting Method |
-
2016
- 2016-08-02 CN CN201610623260.3A patent/CN106447615A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0750415A2 (en) * | 1995-06-20 | 1996-12-27 | Canon Kabushiki Kaisha | Image processing method and apparatus |
US20070252905A1 (en) * | 2006-04-21 | 2007-11-01 | Yamaha Corporation | Image processing apparatus |
CN101930594A (zh) * | 2010-04-14 | 2010-12-29 | 山东山大鸥玛软件有限公司 | 一种扫描文档图像的快速纠偏方法 |
US20160131479A1 (en) * | 2014-11-12 | 2016-05-12 | Kabushiki Kaisha Topcon | Tilt Detecting System And Tilt Detecting Method |
CN105261110A (zh) * | 2015-10-26 | 2016-01-20 | 江苏国光信息产业股份有限公司 | 一种高效dsp纸币冠字号识别方法 |
Non-Patent Citations (2)
Title |
---|
程立 等: "《基于投影轮廓的文本图像倾斜检测》", 《中国图象图形学报》 * |
高宇鹏 等: "《基于Hough变换倾斜文档校正的改进方法》", 《浙江工业大学学报》 * |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107220644B (zh) * | 2017-04-18 | 2020-04-24 | 天津大学 | 一种心电图扫描图像倾斜度校正方法 |
CN107220644A (zh) * | 2017-04-18 | 2017-09-29 | 天津大学 | 一种心电图扫描图像倾斜度校正方法 |
CN108009990A (zh) * | 2017-11-30 | 2018-05-08 | 北京小米移动软件有限公司 | 倾斜对象处理方法及装置 |
CN108090875A (zh) * | 2018-01-11 | 2018-05-29 | 湖南乐泊科技有限公司 | 图像倾斜校正方法、装置、存储介质和计算机设备 |
CN108090875B (zh) * | 2018-01-11 | 2021-11-30 | 湖南乐泊科技有限公司 | 图像倾斜校正方法、装置、存储介质和计算机设备 |
CN108573473A (zh) * | 2018-04-27 | 2018-09-25 | 平安科技(深圳)有限公司 | 图片旋转方法、装置、计算机设备及存储介质 |
CN110533036A (zh) * | 2019-08-28 | 2019-12-03 | 湖南长城信息金融设备有限责任公司 | 一种票据扫描图像快速倾斜校正方法和系统 |
CN110533036B (zh) * | 2019-08-28 | 2022-06-07 | 长城信息股份有限公司 | 一种票据扫描图像快速倾斜校正方法和系统 |
CN113128495A (zh) * | 2019-12-30 | 2021-07-16 | 广州慧睿思通科技股份有限公司 | 文本倾斜矫正方法、装置、存储介质、计算机设备 |
CN111681173A (zh) * | 2020-05-25 | 2020-09-18 | 浙江大学 | 基于最小面积边界框与投影法相结合的倾斜图像校正方法 |
CN112101351A (zh) * | 2020-09-07 | 2020-12-18 | 凌云光技术股份有限公司 | 一种基于投影的文本行旋转校正方法及装置 |
CN112101351B (zh) * | 2020-09-07 | 2024-04-19 | 凌云光技术股份有限公司 | 一种基于投影的文本行旋转校正方法及装置 |
CN113852730A (zh) * | 2021-09-28 | 2021-12-28 | 科大讯飞股份有限公司 | 一种倾斜角确定方法及其相关设备 |
CN113852730B (zh) * | 2021-09-28 | 2023-12-01 | 科大讯飞股份有限公司 | 一种倾斜角确定方法及其相关设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106447615A (zh) | 一种扫描文档图像的倾斜校正方法 | |
CN109785316B (zh) | 一种芯片表观缺陷检测方法 | |
Lu et al. | Perspective rectification of document images using fuzzy set and morphological operations | |
CN111474184B (zh) | 基于工业机器视觉的aoi字符缺陷检测方法和装置 | |
CN103258198B (zh) | 一种表格文档图像中字符提取方法 | |
Wu et al. | Traffic sign detection based on convolutional neural networks | |
CN110070090B (zh) | 一种基于手写文字识别的物流标签信息检测方法及系统 | |
Tian et al. | Text flow: A unified text detection system in natural scene images | |
WO2019104879A1 (zh) | 表格类图像的信息识别方法、电子装置及可读存储介质 | |
US20230267619A1 (en) | Method and system of recognizing object edges and computer-readable storage medium | |
JP5884560B2 (ja) | 文字認識のための画像処理方法、およびこの方法を用いた文字認識装置およびプログラム | |
CN105046252A (zh) | 一种人民币冠字码识别方法 | |
CN101930594A (zh) | 一种扫描文档图像的快速纠偏方法 | |
JP2014525626A (ja) | 画像領域を使用するテキスト検出 | |
CN106446894A (zh) | 一种基于轮廓识别球型目标物位置的方法 | |
CN107766854B (zh) | 一种基于模板匹配实现快速页码识别的方法 | |
CN103530600A (zh) | 复杂光照下的车牌识别方法及系统 | |
CN104809446A (zh) | 基于校正手掌方向的掌纹感兴趣区域快速提取方法 | |
CN113689429B (zh) | 一种基于计算机视觉的木板缺陷检测方法 | |
CN108961262B (zh) | 一种复杂场景下的条码定位方法 | |
Diem et al. | Text classification and document layout analysis of paper fragments | |
CN107463939B (zh) | 一种图像关键直线检测方法 | |
CN115601757A (zh) | 一种基于分段投影的扫描文档图像倾斜校正方法 | |
Meng et al. | Extraction of virtual baselines from distorted document images using curvilinear projection | |
Al-Shatnawi | A skew detection and correction technique for Arabic script text-line based on subwords bounding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170222 |
|
RJ01 | Rejection of invention patent application after publication |