CN111681173A - 基于最小面积边界框与投影法相结合的倾斜图像校正方法 - Google Patents
基于最小面积边界框与投影法相结合的倾斜图像校正方法 Download PDFInfo
- Publication number
- CN111681173A CN111681173A CN202010448111.4A CN202010448111A CN111681173A CN 111681173 A CN111681173 A CN 111681173A CN 202010448111 A CN202010448111 A CN 202010448111A CN 111681173 A CN111681173 A CN 111681173A
- Authority
- CN
- China
- Prior art keywords
- image
- angle
- bounding box
- rotation
- original
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 69
- 238000003702 image correction Methods 0.000 title abstract description 4
- 238000005070 sampling Methods 0.000 claims description 6
- 230000000694 effects Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 238000003709 image segmentation Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000037303 wrinkles Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/60—Rotation of whole images or parts thereof
- G06T3/608—Rotation of whole images or parts thereof by skew deformation, e.g. two-pass or three-pass rotation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/70—Denoising; Smoothing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10004—Still image; Photographic image
- G06T2207/10008—Still image; Photographic image from scanner, fax or copier
Landscapes
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Image Processing (AREA)
Abstract
本发明属于打印机扫描图像处理领域,公开了一种基于最小面积边界框与投影法相结合的倾斜图像校正方法,首先将原始倾斜图像进行二值化处理和去噪操作,再进行降采样操作;然后旋转降采样后的图像并通过最小矩形边界框面积来得到图像旋转的角度,将所述旋转的角度作为图像倾斜的近似角度;最后在所述近似角度的邻域范围内通过对原始倾斜图像进行投影法操作来计算出图像倾斜角度,并根据所述倾斜角度对原始的倾斜图像进行旋转校正。本发明提出的方法对于各种类型的倾斜文档都能较为精确的检测出其倾角值,与通常的方法相比,本发明提出的方法的鲁棒性强,精度高,并且在一定程度上提高了算法的运行速度。
Description
技术领域
本发明属于打印机扫描图像处理领域,涉及一种基于最小面积边界框与投影法相结合的倾斜图像校正方法。
背景技术
电子文档具有传输方便,占体积小,容易搜索等优势,现如今无论人们会将历史文档转化为电子文档进行保存或传输,还是将一些需要人工签字的合同的文档进行传输时,都需要打印机首先对纸质文档进行扫描,提取出文档中的光学信号然后转化为电子信号进行保存和传输。因此,扫描文档的质量直接决定了之后数字图像的信息的准确性。在实际情况中,由于一些历史文档放置很久,会出现斑点,噪点等污染,即使是较新的文件也有可能会出现褶皱等情况,出现了这些情况的文档在打印机扫描过程中都会被识别为信息进行处理,这些冗余信息的存在会影响电子文档的后续处理和正确性。此外,由于扫描需要人为的将纸质文档放入打印机中,就可能出现文档放置歪斜的情况,会导致扫描出来的文档也是倾斜的,人的眼睛一般能够识别出倾斜角度大于0.1度的文本,倾斜的文档不仅会影响读者的阅读,并且在OCR系统中也会影响着后续的图像分割,图像识别等操作。因此为了提高打印系统中图像的处理的效率和准确性,一般在其他文档操作之前需要对扫描完成的文档进行图像预处理操作以及文档倾斜校正操作。
文档的倾斜校正方法主要分为人为纠正和打印机自动纠正两大类:人为纠正主要针对于文档图像较少,并且对倾斜校正精度要求不太高的情况,校正后的效果一般;打印机自动校正方法可以减少人力,主要通过对转化的数字图像进行分析处理,此类方法能够处理各种类型文档并且具有效率和精度都较高的特点。因此在打印机系统中,文档自动校正算法是近年来很多研究学者关注的重点之一,倾斜校正算法主要包括倾斜角度的检测和图像旋转两个步骤。被广泛采用的倾斜角度检测方法主要有:(1)基于霍夫变换的方法,(2)基于最近邻连通域的方法,(3)基于投影统计的方法,(4)基于傅里叶变换的方法等。常用的图像旋转方法则包括:(1)最近邻插值法,(2)双线性插值法,(3)双三次插值法,(4)基于Hermite展开式的插值法等。上述的倾斜校正算法有些效果很高但是计算量很大,有些方法则是以牺牲了算法的精度来换取计算效率,很少有一种方法能够很好的平衡计算效率与精度。并且大部分的算法只能针对简单的纯文本图像,对于含有图像和表格等的复杂文档的效果不是很理想。
上述提到这些方法,往往对于文档具有一定的要求,例如基于霍夫变换的方法往往需要文档有较为明显的边界或者直线等特征,此外霍夫变换法涉及到空间域的转换操作,需要大量的计算,因此此类算法的计算效率不是很高。近邻法则对文档书写的字体有一定的要求,往往需要字体较为统一,当文档中含有较多的标点符号和噪点时,会导致近邻法的检测精度较低。由此可以看出,现在的算法要么计算复杂度太高,要么精度太低,且有些算法的鲁棒性较低。缺少一种方法具有很强的鲁棒性,并且可以在保证精度的情况下提高算法的运行速度。
发明内容
为了解决现有技术中存在的上述技术问题,本发明提出一种基于最小面积边界框与投影法相结合的倾斜图像校正方法,其具体技术方案如下。
基于最小面积边界框与投影法相结合的倾斜图像校正方法,其特征在于,包括如下步骤:
步骤1,将原始的倾斜图像进行二值化处理和去噪处理;
步骤2,对二值化处理和去噪处理后的倾斜图像进行降采样操作;
步骤3,旋转降采样后的倾斜图像,通过最小矩形边界框面积计算来得到所述降采样后的倾斜图像旋转的角度,将所述旋转的角度作为倾斜图像倾斜的近似角度;
步骤4,在所述近似角度的邻域范围内通过对原始的倾斜图像进行投影法操作来计算出图像倾斜角度,并根据计算出的图像倾斜角度对原始的倾斜图像进行旋转校正。
进一步的,所述步骤1中通过采用Otsu阈值法将原始的倾斜图像转化为二值图像,然后采用窗口法对二值图像进行去噪处理。
进一步的,所述步骤3具体为:多次旋转降采样后的倾斜图像并计算每次旋转时的所述倾斜图像的矩形边界框的面积;倾斜图像旋转的范围在之间,每次旋转的步长是,旋转90次,得到90个矩形边界框面积值,从90个矩形边界框面积值中找出最小值,所述最小值对应的旋转角度即倾斜图像倾斜的近似角度。
进一步的,所述旋转投影法为在水平投影下,以各行统计的前景像素点的个数之间的方差为目标函数,所述方差的值最大时,该旋转角度下图像中最多直线所在方向为水平方向,所述旋转角度为图像倾斜角度。
有益效果:
本发明提出的方法对于各种类型的倾斜图像都能较为精确的检测出其倾角值,具有鲁棒性强,精度高,并且一定程度上提高了算法的运行速度的优点。
附图说明
图1为本发明的方法流程图;
图2a为本发明的原始图像;
图2b为本发明的降采样后的图像;
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例对本发明进行进一步详细说明。
如图1所示,本发明的基于最小面积边界框与投影法相结合的倾斜图像校正方法包括如下步骤:
步骤1,将原始的倾斜图像进行二值化处理和去噪处理;
步骤2,对二值化处理和去噪处理后的倾斜图像进行降采样操作;
步骤3,旋转降采样后的倾斜图像,通过最小矩形边界框面积计算来得到所述降采样后的倾斜图像旋转的角度,将所述旋转的角度作为倾斜图像倾斜的近似角度;
步骤4,在所述近似角度的邻域范围内通过对原始的倾斜图像进行投影法操作来计算出图像倾斜角度,并根据计算出的图像倾斜角度对原始的倾斜图像进行旋转校正。
具体的,所述步骤1通过采用Otsu阈值法将原始的倾斜图像转化为二值图像,然后采用窗口法对二值图像进行去噪处理。
所述步骤2中的降采样为通过相应的算法将图像的分辨率降低,具体的,当原始图像的宽为W,高为H,经过0.25倍缩放后,就会生成宽为,高为的对应图像,所述对应图像会保持和原始图像相同的样子,但是分辨率降低,平滑度提高,像素点的个数变为原始图像的。
所述步骤3具体为:多次旋转降采样后的图像并计算每次旋转时的所述图像的矩形边界框的面积;图像旋转的范围在之间,每次旋转的步长是,即每次只选择整数角度,一共旋转90次,每次旋转时记录下当前的矩形边界框面积,一共可以得到90个矩形边界框面积值,从90个矩形边界框面积值中找出最小值,所述最小值对应的旋转角度就是图像倾斜的近似角度。
如图3a-3c所示,是同一图像在不同倾斜角度下的边界框面积的大小情况,已知图中元素周期表的面积相同,当倾角越大时,矩形边界框内的前景像素点个数不变,背景像素点个数越多,导致矩形边界框的面积越大,因此可以推断出当图像不倾斜时,其矩形边界框内的背景像素点个数最少,矩形边界框面积最小。因此可以通过不断旋转图像找出其矩形边界框面积最小的情况,此情况下的旋转角就是图像的倾角。
所述步骤4中由步骤3得到图像的一个倾斜角度的近似值,图像旋转的步长为,则推断精确的倾角值会在之间。由于有些图像的边缘效果较差,在此较小的倾角范围内不再适合使用最小矩形边界框面积来计算更加精确的倾角,因此使用旋转投影法来计算最终的倾角值,并且为了进一步提高精确度,此步骤是对原始的倾斜图像进行投影而非上述缩小后的图像。所述旋转投影法是在水平投影下,以各行统计的前景像素点的个数之间的方差为目标函数,当此方差值最大时,可以表示当前旋转角度下图像中最多的直线所在方向为水平方向的,因此可以用当前旋转角度作为图像的倾斜角度。
如图4a-4b所示,本发明的原始倾斜图像旋转校正:经过旋转投影法计算得到图像倾斜的角度并采用最近邻插值算法旋转原始的倾斜图像进行校正。
Claims (6)
1.基于最小面积边界框与投影法相结合的倾斜图像校正方法,其特征在于,包括如下步骤:
步骤1,将原始的倾斜图像进行二值化处理和去噪处理;
步骤2,对二值化处理和去噪处理后的倾斜图像进行降采样操作;
步骤3,旋转降采样后的倾斜图像,通过最小矩形边界框面积计算来得到所述降采样后的倾斜图像旋转的角度,将所述旋转的角度作为倾斜图像倾斜的近似角度;
步骤4,在所述近似角度的邻域范围内通过对原始的倾斜图像进行投影法操作来计算出图像倾斜角度,并根据计算出的图像倾斜角度对原始的倾斜图像进行旋转校正。
2.如权利要求1所述的基于最小面积边界框与投影法相结合的倾斜图像校正方法,其特征在于,所述步骤1中通过采用Otsu阈值法将原始的倾斜图像转化为二值图像,然后采用窗口法对二值图像进行去噪处理。
6.如权利要求5所述的基于最小面积边界框与投影法相结合的倾斜图像校正方法,其特征在于,所述旋转投影法为在水平投影下,以各行统计的前景像素点的个数之间的方差为目标函数,所述方差的值最大时,该旋转角度下图像中最多直线所在方向为水平方向,所述旋转角度为图像倾斜角度。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010448111.4A CN111681173A (zh) | 2020-05-25 | 2020-05-25 | 基于最小面积边界框与投影法相结合的倾斜图像校正方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010448111.4A CN111681173A (zh) | 2020-05-25 | 2020-05-25 | 基于最小面积边界框与投影法相结合的倾斜图像校正方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111681173A true CN111681173A (zh) | 2020-09-18 |
Family
ID=72434794
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010448111.4A Pending CN111681173A (zh) | 2020-05-25 | 2020-05-25 | 基于最小面积边界框与投影法相结合的倾斜图像校正方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111681173A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113888741A (zh) * | 2021-12-06 | 2022-01-04 | 智洋创新科技股份有限公司 | 一种配电室内仪表旋转图像校正方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040062455A1 (en) * | 2002-10-01 | 2004-04-01 | Eastman Kodak Company | Method for determining skew angle and location of a document in an over-scanned image |
CN103413271A (zh) * | 2013-07-18 | 2013-11-27 | 西安交通大学 | 基于局部信息的文档图像校正方法 |
CN106447615A (zh) * | 2016-08-02 | 2017-02-22 | 浪潮软件股份有限公司 | 一种扫描文档图像的倾斜校正方法 |
-
2020
- 2020-05-25 CN CN202010448111.4A patent/CN111681173A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040062455A1 (en) * | 2002-10-01 | 2004-04-01 | Eastman Kodak Company | Method for determining skew angle and location of a document in an over-scanned image |
CN103413271A (zh) * | 2013-07-18 | 2013-11-27 | 西安交通大学 | 基于局部信息的文档图像校正方法 |
CN106447615A (zh) * | 2016-08-02 | 2017-02-22 | 浪潮软件股份有限公司 | 一种扫描文档图像的倾斜校正方法 |
Non-Patent Citations (1)
Title |
---|
A. PAPANDREOU AND B. GATOS: "A Novel Skew Detection Technique Based on Vertical Projections", 《2011 INTERNATIONAL CONFERENCE ON DOCUMENT ANALYSIS AND RECOGNITION》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113888741A (zh) * | 2021-12-06 | 2022-01-04 | 智洋创新科技股份有限公司 | 一种配电室内仪表旋转图像校正方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109409374B (zh) | 一种基于联合的同批次试卷答案区域切割方法 | |
US8457403B2 (en) | Method of detecting and correcting digital images of books in the book spine area | |
Gatos et al. | Segmentation based recovery of arbitrarily warped document images | |
WO2022057607A1 (zh) | 识别对象边缘的方法、系统及计算机可读存储介质 | |
Jiang et al. | A fast approach to the detection and correction of skew documents | |
US8682080B2 (en) | Image processing apparatus, image processing method, image processing program, and storage medium | |
CN112183038A (zh) | 一种表格识别套打方法、计算机设备及计算机可读存储介质 | |
CN114299275B (zh) | 一种基于霍夫变换的车牌倾斜校正方法 | |
WO2019056346A1 (zh) | 一种利用膨胀法校正文本图像倾斜的方法及装置 | |
CN114529459B (zh) | 一种对图像边缘进行增强处理的方法和系统及介质 | |
CN101697228A (zh) | 一种文本图像处理方法 | |
CN109993161B (zh) | 一种文本图像旋转矫正方法及系统 | |
JP2009020613A (ja) | 画像処理プログラム、画像処理方法及び画像処理装置 | |
CN113591831A (zh) | 一种基于深度学习的字体识别方法、系统及存储介质 | |
CN112767358A (zh) | 基于图像特征配准的铁路电力机车故障检测方法 | |
US7079265B2 (en) | Distortion correction device for correcting imaged object to produce plane image without distortion | |
CN115619656A (zh) | 数字化档案纠偏矫正方法及系统 | |
US9077926B2 (en) | Image processing method and image processing apparatus | |
CN111681173A (zh) | 基于最小面积边界框与投影法相结合的倾斜图像校正方法 | |
CN108335266B (zh) | 一种文档图像畸变的矫正方法 | |
CN112101351A (zh) | 一种基于投影的文本行旋转校正方法及装置 | |
CN109389595B (zh) | 一种表格线交点检测方法、电子设备及可读存储介质 | |
Kaur et al. | Multi-level Image Enhancement for Text Recognition System using Hybrid Filters | |
JP3604909B2 (ja) | 画像間位置合わせ方法 | |
Konya et al. | Adaptive methods for robust document image understanding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200918 |