CN111681173A - 基于最小面积边界框与投影法相结合的倾斜图像校正方法 - Google Patents

基于最小面积边界框与投影法相结合的倾斜图像校正方法 Download PDF

Info

Publication number
CN111681173A
CN111681173A CN202010448111.4A CN202010448111A CN111681173A CN 111681173 A CN111681173 A CN 111681173A CN 202010448111 A CN202010448111 A CN 202010448111A CN 111681173 A CN111681173 A CN 111681173A
Authority
CN
China
Prior art keywords
image
angle
bounding box
rotation
original
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010448111.4A
Other languages
English (en)
Inventor
黄凯
陈子旋
蒋小文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN202010448111.4A priority Critical patent/CN111681173A/zh
Publication of CN111681173A publication Critical patent/CN111681173A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/60Rotation of whole images or parts thereof
    • G06T3/608Rotation of whole images or parts thereof by skew deformation, e.g. two-pass or three-pass rotation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/70Denoising; Smoothing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • G06T2207/10008Still image; Photographic image from scanner, fax or copier

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Image Processing (AREA)

Abstract

本发明属于打印机扫描图像处理领域,公开了一种基于最小面积边界框与投影法相结合的倾斜图像校正方法,首先将原始倾斜图像进行二值化处理和去噪操作,再进行降采样操作;然后旋转降采样后的图像并通过最小矩形边界框面积来得到图像旋转的角度,将所述旋转的角度作为图像倾斜的近似角度;最后在所述近似角度的邻域范围内通过对原始倾斜图像进行投影法操作来计算出图像倾斜角度,并根据所述倾斜角度对原始的倾斜图像进行旋转校正。本发明提出的方法对于各种类型的倾斜文档都能较为精确的检测出其倾角值,与通常的方法相比,本发明提出的方法的鲁棒性强,精度高,并且在一定程度上提高了算法的运行速度。

Description

基于最小面积边界框与投影法相结合的倾斜图像校正方法
技术领域
本发明属于打印机扫描图像处理领域,涉及一种基于最小面积边界框与投影法相结合的倾斜图像校正方法。
背景技术
电子文档具有传输方便,占体积小,容易搜索等优势,现如今无论人们会将历史文档转化为电子文档进行保存或传输,还是将一些需要人工签字的合同的文档进行传输时,都需要打印机首先对纸质文档进行扫描,提取出文档中的光学信号然后转化为电子信号进行保存和传输。因此,扫描文档的质量直接决定了之后数字图像的信息的准确性。在实际情况中,由于一些历史文档放置很久,会出现斑点,噪点等污染,即使是较新的文件也有可能会出现褶皱等情况,出现了这些情况的文档在打印机扫描过程中都会被识别为信息进行处理,这些冗余信息的存在会影响电子文档的后续处理和正确性。此外,由于扫描需要人为的将纸质文档放入打印机中,就可能出现文档放置歪斜的情况,会导致扫描出来的文档也是倾斜的,人的眼睛一般能够识别出倾斜角度大于0.1度的文本,倾斜的文档不仅会影响读者的阅读,并且在OCR系统中也会影响着后续的图像分割,图像识别等操作。因此为了提高打印系统中图像的处理的效率和准确性,一般在其他文档操作之前需要对扫描完成的文档进行图像预处理操作以及文档倾斜校正操作。
文档的倾斜校正方法主要分为人为纠正和打印机自动纠正两大类:人为纠正主要针对于文档图像较少,并且对倾斜校正精度要求不太高的情况,校正后的效果一般;打印机自动校正方法可以减少人力,主要通过对转化的数字图像进行分析处理,此类方法能够处理各种类型文档并且具有效率和精度都较高的特点。因此在打印机系统中,文档自动校正算法是近年来很多研究学者关注的重点之一,倾斜校正算法主要包括倾斜角度的检测和图像旋转两个步骤。被广泛采用的倾斜角度检测方法主要有:(1)基于霍夫变换的方法,(2)基于最近邻连通域的方法,(3)基于投影统计的方法,(4)基于傅里叶变换的方法等。常用的图像旋转方法则包括:(1)最近邻插值法,(2)双线性插值法,(3)双三次插值法,(4)基于Hermite展开式的插值法等。上述的倾斜校正算法有些效果很高但是计算量很大,有些方法则是以牺牲了算法的精度来换取计算效率,很少有一种方法能够很好的平衡计算效率与精度。并且大部分的算法只能针对简单的纯文本图像,对于含有图像和表格等的复杂文档的效果不是很理想。
上述提到这些方法,往往对于文档具有一定的要求,例如基于霍夫变换的方法往往需要文档有较为明显的边界或者直线等特征,此外霍夫变换法涉及到空间域的转换操作,需要大量的计算,因此此类算法的计算效率不是很高。近邻法则对文档书写的字体有一定的要求,往往需要字体较为统一,当文档中含有较多的标点符号和噪点时,会导致近邻法的检测精度较低。由此可以看出,现在的算法要么计算复杂度太高,要么精度太低,且有些算法的鲁棒性较低。缺少一种方法具有很强的鲁棒性,并且可以在保证精度的情况下提高算法的运行速度。
发明内容
为了解决现有技术中存在的上述技术问题,本发明提出一种基于最小面积边界框与投影法相结合的倾斜图像校正方法,其具体技术方案如下。
基于最小面积边界框与投影法相结合的倾斜图像校正方法,其特征在于,包括如下步骤:
步骤1,将原始的倾斜图像进行二值化处理和去噪处理;
步骤2,对二值化处理和去噪处理后的倾斜图像进行降采样操作;
步骤3,旋转降采样后的倾斜图像,通过最小矩形边界框面积计算来得到所述降采样后的倾斜图像旋转的角度,将所述旋转的角度作为倾斜图像倾斜的近似角度;
步骤4,在所述近似角度的邻域范围内通过对原始的倾斜图像进行投影法操作来计算出图像倾斜角度,并根据计算出的图像倾斜角度对原始的倾斜图像进行旋转校正。
进一步的,所述步骤1中通过采用Otsu阈值法将原始的倾斜图像转化为二值图像,然后采用窗口法对二值图像进行去噪处理。
进一步的,所述步骤2中所述降采样操作具体为将宽为W,高为H的原始图像,经过
Figure 479283DEST_PATH_IMAGE001
倍缩放后,生成宽为W/
Figure 290113DEST_PATH_IMAGE001
,高为H/
Figure 700366DEST_PATH_IMAGE001
的对应图像,像素点的个数变为原始图像的
Figure 69660DEST_PATH_IMAGE002
进一步的,所述步骤3具体为:多次旋转降采样后的倾斜图像并计算每次旋转时的所述倾斜图像的矩形边界框的面积;倾斜图像旋转的范围在
Figure 932573DEST_PATH_IMAGE003
之间,每次旋转的步长是
Figure 343832DEST_PATH_IMAGE004
,旋转90次,得到90个矩形边界框面积值,从90个矩形边界框面积值中找出最小值,所述最小值对应的旋转角度即倾斜图像倾斜的近似角度。
进一步的,所述步骤4中,若所述近似角度为
Figure 343012DEST_PATH_IMAGE005
,倾斜图像旋转的步长为
Figure 315778DEST_PATH_IMAGE004
,则精确的倾角值在
Figure 665988DEST_PATH_IMAGE006
之间,通过对原始的倾斜图像使用旋转投影法来计算出最终的图像倾斜角度并采用最近邻插值算法旋转原始的倾斜图像进行校正。
进一步的,所述旋转投影法为在水平投影下,以各行统计的前景像素点的个数之间的方差为目标函数,所述方差的值最大时,该旋转角度下图像中最多直线所在方向为水平方向,所述旋转角度为图像倾斜角度。
有益效果:
本发明提出的方法对于各种类型的倾斜图像都能较为精确的检测出其倾角值,具有鲁棒性强,精度高,并且一定程度上提高了算法的运行速度的优点。
附图说明
图1为本发明的方法流程图;
图2a为本发明的原始图像;
图2b为本发明的降采样后的图像;
图3a为本发明的倾角为
Figure 615359DEST_PATH_IMAGE007
下图像边界框面积大小情况;
图3b为本发明的倾角为
Figure 204DEST_PATH_IMAGE008
下图像边界框面积大小情况;
图3c为本发明的倾角为
Figure 875362DEST_PATH_IMAGE009
下图像边界框面积大小情况;
图4a为本发明的倾角为
Figure 447289DEST_PATH_IMAGE010
的原始图像;
图4b为本发明的校正后图像,检测角度
Figure 200350DEST_PATH_IMAGE011
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例对本发明进行进一步详细说明。
如图1所示,本发明的基于最小面积边界框与投影法相结合的倾斜图像校正方法包括如下步骤:
步骤1,将原始的倾斜图像进行二值化处理和去噪处理;
步骤2,对二值化处理和去噪处理后的倾斜图像进行降采样操作;
步骤3,旋转降采样后的倾斜图像,通过最小矩形边界框面积计算来得到所述降采样后的倾斜图像旋转的角度,将所述旋转的角度作为倾斜图像倾斜的近似角度;
步骤4,在所述近似角度的邻域范围内通过对原始的倾斜图像进行投影法操作来计算出图像倾斜角度,并根据计算出的图像倾斜角度对原始的倾斜图像进行旋转校正。
具体的,所述步骤1通过采用Otsu阈值法将原始的倾斜图像转化为二值图像,然后采用窗口法对二值图像进行去噪处理。
所述步骤2中的降采样为通过相应的算法将图像的分辨率降低,具体的,当原始图像的宽为W,高为H,经过0.25倍缩放后,就会生成宽为
Figure 174123DEST_PATH_IMAGE012
,高为
Figure 426375DEST_PATH_IMAGE013
的对应图像,所述对应图像会保持和原始图像相同的样子,但是分辨率降低,平滑度提高,像素点的个数变为原始图像的
Figure 203707DEST_PATH_IMAGE014
更具体的,如图2a-2b所示,原始图像的图片尺寸为
Figure 727835DEST_PATH_IMAGE015
像素,经过0.25倍缩放后的图像的图片尺寸为
Figure 556114DEST_PATH_IMAGE016
像素,经过缩小后的图像的轮廓仍然保持不变,但是像素点个数却大大减小。
所述步骤3具体为:多次旋转降采样后的图像并计算每次旋转时的所述图像的矩形边界框的面积;图像旋转的范围在
Figure 274540DEST_PATH_IMAGE003
之间,每次旋转的步长是
Figure 571792DEST_PATH_IMAGE004
,即每次只选择整数角度,一共旋转90次,每次旋转时记录下当前的矩形边界框面积,一共可以得到90个矩形边界框面积值,从90个矩形边界框面积值中找出最小值,所述最小值对应的旋转角度就是图像倾斜的近似角度。
如图3a-3c所示,是同一图像在不同倾斜角度下的边界框面积的大小情况,已知图中元素周期表的面积相同,当倾角越大时,矩形边界框内的前景像素点个数不变,背景像素点个数越多,导致矩形边界框的面积越大,因此可以推断出当图像不倾斜时,其矩形边界框内的背景像素点个数最少,矩形边界框面积最小。因此可以通过不断旋转图像找出其矩形边界框面积最小的情况,此情况下的旋转角就是图像的倾角。
所述步骤4中由步骤3得到图像的一个倾斜角度的近似值
Figure 948546DEST_PATH_IMAGE005
,图像旋转的步长为
Figure 896911DEST_PATH_IMAGE004
,则推断精确的倾角值会在
Figure 317397DEST_PATH_IMAGE006
之间。由于有些图像的边缘效果较差,在此较小的倾角范围内不再适合使用最小矩形边界框面积来计算更加精确的倾角,因此使用旋转投影法来计算最终的倾角值,并且为了进一步提高精确度,此步骤是对原始的倾斜图像进行投影而非上述缩小后的图像。所述旋转投影法是在水平投影下,以各行统计的前景像素点的个数之间的方差为目标函数,当此方差值最大时,可以表示当前旋转角度下图像中最多的直线所在方向为水平方向的,因此可以用当前旋转角度作为图像的倾斜角度。
如图4a-4b所示,本发明的原始倾斜图像旋转校正:经过旋转投影法计算得到图像倾斜的角度并采用最近邻插值算法旋转原始的倾斜图像进行校正。

Claims (6)

1.基于最小面积边界框与投影法相结合的倾斜图像校正方法,其特征在于,包括如下步骤:
步骤1,将原始的倾斜图像进行二值化处理和去噪处理;
步骤2,对二值化处理和去噪处理后的倾斜图像进行降采样操作;
步骤3,旋转降采样后的倾斜图像,通过最小矩形边界框面积计算来得到所述降采样后的倾斜图像旋转的角度,将所述旋转的角度作为倾斜图像倾斜的近似角度;
步骤4,在所述近似角度的邻域范围内通过对原始的倾斜图像进行投影法操作来计算出图像倾斜角度,并根据计算出的图像倾斜角度对原始的倾斜图像进行旋转校正。
2.如权利要求1所述的基于最小面积边界框与投影法相结合的倾斜图像校正方法,其特征在于,所述步骤1中通过采用Otsu阈值法将原始的倾斜图像转化为二值图像,然后采用窗口法对二值图像进行去噪处理。
3.如权利要求1所述的基于最小面积边界框与投影法相结合的倾斜图像校正方法,其特征在于,所述步骤2中所述降采样操作具体为将宽为W,高为H的原始图像,经过
Figure 594147DEST_PATH_IMAGE001
倍缩放后,生成宽为W/
Figure 243434DEST_PATH_IMAGE001
,高为H/
Figure 59687DEST_PATH_IMAGE001
的对应图像,像素点的个数变为原始图像的
Figure 401807DEST_PATH_IMAGE002
4.如权利要求1所述的基于最小面积边界框与投影法相结合的倾斜图像校正方法,其特征在于,所述步骤3具体为:多次旋转降采样后的倾斜图像并计算每次旋转时的所述倾斜图像的矩形边界框的面积;倾斜图像旋转的范围在
Figure 922918DEST_PATH_IMAGE003
之间,每次旋转的步长是
Figure 625164DEST_PATH_IMAGE004
,旋转90次,得到90个矩形边界框面积值,从90个矩形边界框面积值中找出最小值,所述最小值对应的旋转角度即倾斜图像倾斜的近似角度。
5.如权利要求1所述的基于最小面积边界框与投影法相结合的倾斜图像校正方法,其特征在于,所述步骤4中,若所述近似角度为
Figure 548120DEST_PATH_IMAGE005
,倾斜图像旋转的步长为
Figure 280715DEST_PATH_IMAGE004
,则精确的倾角值在
Figure 289122DEST_PATH_IMAGE006
之间,通过对原始的倾斜图像使用旋转投影法来计算出最终的图像倾斜角度并采用最近邻插值算法旋转原始的倾斜图像进行校正。
6.如权利要求5所述的基于最小面积边界框与投影法相结合的倾斜图像校正方法,其特征在于,所述旋转投影法为在水平投影下,以各行统计的前景像素点的个数之间的方差为目标函数,所述方差的值最大时,该旋转角度下图像中最多直线所在方向为水平方向,所述旋转角度为图像倾斜角度。
CN202010448111.4A 2020-05-25 2020-05-25 基于最小面积边界框与投影法相结合的倾斜图像校正方法 Pending CN111681173A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010448111.4A CN111681173A (zh) 2020-05-25 2020-05-25 基于最小面积边界框与投影法相结合的倾斜图像校正方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010448111.4A CN111681173A (zh) 2020-05-25 2020-05-25 基于最小面积边界框与投影法相结合的倾斜图像校正方法

Publications (1)

Publication Number Publication Date
CN111681173A true CN111681173A (zh) 2020-09-18

Family

ID=72434794

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010448111.4A Pending CN111681173A (zh) 2020-05-25 2020-05-25 基于最小面积边界框与投影法相结合的倾斜图像校正方法

Country Status (1)

Country Link
CN (1) CN111681173A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113888741A (zh) * 2021-12-06 2022-01-04 智洋创新科技股份有限公司 一种配电室内仪表旋转图像校正方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040062455A1 (en) * 2002-10-01 2004-04-01 Eastman Kodak Company Method for determining skew angle and location of a document in an over-scanned image
CN103413271A (zh) * 2013-07-18 2013-11-27 西安交通大学 基于局部信息的文档图像校正方法
CN106447615A (zh) * 2016-08-02 2017-02-22 浪潮软件股份有限公司 一种扫描文档图像的倾斜校正方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040062455A1 (en) * 2002-10-01 2004-04-01 Eastman Kodak Company Method for determining skew angle and location of a document in an over-scanned image
CN103413271A (zh) * 2013-07-18 2013-11-27 西安交通大学 基于局部信息的文档图像校正方法
CN106447615A (zh) * 2016-08-02 2017-02-22 浪潮软件股份有限公司 一种扫描文档图像的倾斜校正方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
A. PAPANDREOU AND B. GATOS: "A Novel Skew Detection Technique Based on Vertical Projections", 《2011 INTERNATIONAL CONFERENCE ON DOCUMENT ANALYSIS AND RECOGNITION》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113888741A (zh) * 2021-12-06 2022-01-04 智洋创新科技股份有限公司 一种配电室内仪表旋转图像校正方法

Similar Documents

Publication Publication Date Title
CN109409374B (zh) 一种基于联合的同批次试卷答案区域切割方法
US8457403B2 (en) Method of detecting and correcting digital images of books in the book spine area
Gatos et al. Segmentation based recovery of arbitrarily warped document images
WO2022057607A1 (zh) 识别对象边缘的方法、系统及计算机可读存储介质
Jiang et al. A fast approach to the detection and correction of skew documents
US8682080B2 (en) Image processing apparatus, image processing method, image processing program, and storage medium
CN112183038A (zh) 一种表格识别套打方法、计算机设备及计算机可读存储介质
CN114299275B (zh) 一种基于霍夫变换的车牌倾斜校正方法
WO2019056346A1 (zh) 一种利用膨胀法校正文本图像倾斜的方法及装置
CN114529459B (zh) 一种对图像边缘进行增强处理的方法和系统及介质
CN101697228A (zh) 一种文本图像处理方法
CN109993161B (zh) 一种文本图像旋转矫正方法及系统
JP2009020613A (ja) 画像処理プログラム、画像処理方法及び画像処理装置
CN113591831A (zh) 一种基于深度学习的字体识别方法、系统及存储介质
CN112767358A (zh) 基于图像特征配准的铁路电力机车故障检测方法
US7079265B2 (en) Distortion correction device for correcting imaged object to produce plane image without distortion
CN115619656A (zh) 数字化档案纠偏矫正方法及系统
US9077926B2 (en) Image processing method and image processing apparatus
CN111681173A (zh) 基于最小面积边界框与投影法相结合的倾斜图像校正方法
CN108335266B (zh) 一种文档图像畸变的矫正方法
CN112101351A (zh) 一种基于投影的文本行旋转校正方法及装置
CN109389595B (zh) 一种表格线交点检测方法、电子设备及可读存储介质
Kaur et al. Multi-level Image Enhancement for Text Recognition System using Hybrid Filters
JP3604909B2 (ja) 画像間位置合わせ方法
Konya et al. Adaptive methods for robust document image understanding

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200918