CN111091505B - 基于古典概型的影印图像倾斜纠正方法 - Google Patents

基于古典概型的影印图像倾斜纠正方法 Download PDF

Info

Publication number
CN111091505B
CN111091505B CN201911174717.7A CN201911174717A CN111091505B CN 111091505 B CN111091505 B CN 111091505B CN 201911174717 A CN201911174717 A CN 201911174717A CN 111091505 B CN111091505 B CN 111091505B
Authority
CN
China
Prior art keywords
document
slope
document image
image
inclination
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911174717.7A
Other languages
English (en)
Other versions
CN111091505A (zh
Inventor
黄凯
陈子旋
张晓旭
余慜
郑丹丹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN201911174717.7A priority Critical patent/CN111091505B/zh
Publication of CN111091505A publication Critical patent/CN111091505A/zh
Application granted granted Critical
Publication of CN111091505B publication Critical patent/CN111091505B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/80Geometric correction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/20Image enhancement or restoration using local operators
    • G06T5/30Erosion or dilatation, e.g. thinning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30176Document

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Image Processing (AREA)

Abstract

本发明公开了基于古典概型的影印图像倾斜纠正方法,其特征在于,包括如下步骤:步骤一,文档图像预处理,对所述文档图像进行膨胀操作;步骤二,连通域外接矩形框,对膨胀操作后的所述文档图像进行所述连通域的选取,对每个所述连通域外接矩形框;步骤三,计算文档倾斜的角度,多次随机选取两个相互独立的所述矩形框的中心点,计算其斜率,将统计次数最多的斜率作为所述文档倾斜的斜率,根据所述文档倾斜的斜率计算出所述文档倾斜的角度;步骤四,纠正所述文档图像。

Description

基于古典概型的影印图像倾斜纠正方法
技术领域
本发明涉及图像处理领域,尤其是涉及了基于古典概型的影印图像倾斜纠正方法。
背景技术
在打印机系统中,由于人为的,或者机器故障的原因,会出现扫描的文档图像出现角度倾斜的情况。角度倾斜往往会给接下来的处理带来麻烦,甚至会导致处理出错。所以出现角度倾斜时,对文档进行角度纠正就尤为重要。一般的文档的角度纠正方法有两种:一种是人为的进行扫描文档的摆正放置,另一种方法就是打印机系统中对倾斜图像进行自动的校正。人为的摆正放置往往会浪费人力,并且可能准确度不高,所以一般我们都是采用后面一种方法,在打印机系统中对输入的文档图像进行纠正。
目前常用的文档图像纠正方法主要有旋转投影法、Hough变换法、基于主成分分析的校正方法、最近邻法。旋转投影法、Hough变换法,计算复杂、量很大、耗时长,影响了打印机处理的速度和实时性;主成分分析方式主要是通过对文档图像进行倾斜的逆坐标变换,使得每个存在倾斜的像素坐标变换到主元方向上,当在主元方向上每个像素的投影分量的方差达到最大时,这时的图像就不存在倾斜程度了;最近邻法主要是将图像划分为不同的连通域来处理,对于某个连通域选取其最近邻连通域进行连线,求得此连线的斜率,统计所有连线的斜率并且都放入直方图中,寻找出直方图峰值对应的斜率便是文档倾斜的斜率,再通过斜率求出倾斜角度进行旋转纠正。
文档图像一般有双栏和单栏的分布情况,此外还有一些图像会存在于文档中,因此布局复杂的文档图像会影响上述已有方法的准确度。
发明内容
为解决现有技术的不足,提高对复杂文档图像的处理能力,提高准确定、减少计算量、提高速度,本发明采用如下的技术方案:
基于古典概型的影印图像倾斜纠正方法,包括如下步骤:
步骤一,文档图像预处理,对所述文档图像进行膨胀操作;
步骤二,连通域外接矩形框,对膨胀操作后的所述文档图像进行所述连通域的选取,对每个所述连通域外接矩形框;
步骤三,计算文档倾斜的角度,多次随机选取两个相互独立的所述矩形框的中心点,计算其斜率,将统计次数最多的斜率作为所述文档倾斜的斜率,根据所述文档倾斜的斜率计算出所述文档倾斜的角度;
步骤四,纠正所述文档图像。
所述步骤一,选取二维结构元进行所述膨胀操作,使所述文档图像中同一字符的不同部分连接,不同字符之间仍保持隔离。
所述步骤二,所述矩形框是上下两条边水平、左右两条边垂直的矩形,取所述矩形对角线的交点作为所述矩形框的中心点。
所述步骤三,随机抽取次数为中心点个数的两倍以上。
所述步骤四,采用最近邻插值算法,通过旋转纠正所述文档图像。
本发明的优势和有益效果在于:
本发明相较于以往的图像纠正算法,计算量较小,计算速度快,有较高的抗干扰性,保证计算的倾斜角度准确性的同时,更易于硬件实现。
附图说明
图1是本发明的流程图。
图2是本发明外接矩形框示意图。
图3是本发明基于古典概率求斜率的模型图。
图4是本发明基于古典概率求斜率的统计分析直方图。
图5是本发明文档图像纠正效果图。
图中:1、矩形框;2、中心点。
具体实施方式
以下结合附图和具体实施例对本发明作具体的介绍。
具体分析文档的特征,我们会发现无论是中文文档还是英文文档,都是基于一个汉字或者一个字母为单位的。并且每一个文字行的汉字或者字母的分布特点正式以一定的倾斜角度延伸的。因此我们可以考虑使用每行汉字或者字母的偏移情况来表示整个文档的偏移情况。
如图1所示,基于古典概型的影印图像倾斜纠正方法,包括如下步骤:
步骤一,文档图像预处理,对所述文档图像进行膨胀的形态学操作;
步骤二,连通域外接矩形框1,对膨胀操作后的所述文档图像进行所述连通域的选取,对每个所述连通域外接矩形框1;
步骤三,计算文档倾斜的角度,多次随机选取两个相互独立的所述矩形框1的中心点2,计算其斜率,将统计次数最多的斜率作为所述文档倾斜的斜率,根据所述文档倾斜的斜率计算出所述文档倾斜的角度;
步骤四,纠正所述文档图像。
所述步骤一,选取二维结构元进行所述膨胀操作,使所述文档图像中同一字符的不同部分连接,不同字符之间仍保持隔离。保证每个字符是一个连通域,避免同一字符不同部分单独成为一个连通域。尤其是中文字形,单个汉字不同部分之间的间隙很小,而不同汉字之间的间隙很大,例如“回”,“同”,“何”,由分离的各部分组成,如果直接进行连通域的选取就会出现一个汉字中存在好几个连通域的情况。
所述步骤二,如图2所示,所述矩形框1是上下两条边水平、左右两条边垂直的矩形,取所述矩形对角线的交点作为所述矩形框1的中心点2。在每个连通域中用中心点2代表连通域的位置,得到一个布满中心点2的文档,这些中心点2的分布一般是平行排列的,类似于原文档中字符的分布排列方式。
所述步骤三,如图1所示,随机抽取次数为中心点个数的两倍以上,N是所述随机抽取次数,P是所述中心点个数。基于古典概率模型,如图3所示,是一个简化的仅有矩形中心点2的模型;如图4所示,是对图3所述模型的分析,任取两点计算斜率,统计所有斜率出现的概率,统计对模型抽样15次、30次、150次的结果,根据古典概率模型,最大概率事件对应的斜率就是所需的倾斜斜率,认定随机抽样中出现次数最多的斜率对应的角度就是文档图像倾斜角度。
所述步骤四,如图5所示,采用最近邻插值算法,通过旋转纠正所述文档图像。由于文档大部分都是二值图像,并且考虑到计算的速度,采用最近邻插值算法。

Claims (1)

1.基于古典概型的影印图像倾斜纠正方法,其特征在于,包括如下步骤:
步骤一,文档图像预处理,对所述文档图像进行膨胀操作;选取二维结构元进行所述膨胀操作,使所述文档图像中同一字符的不同部分连接,不同字符之间仍保持隔离;
步骤二,连通域外接矩形框(1),对膨胀操作后的所述文档图像进行所述连通域的选取,对每个所述连通域外接矩形框(1);所述矩形框(1)是上下两条边水平、左右两条边垂直的矩形,取矩形对角线的交点作为所述矩形框(1)的中心点(2);
步骤三,计算文档倾斜的角度,多次随机选取两个相互独立的所述矩形框(1)的中心点(2),计算其斜率,将统计次数最多的斜率作为所述文档倾斜的斜率,根据所述文档倾斜的斜率计算出所述文档倾斜的角度;随机抽取次数为中心点个数的两倍以上;
步骤四,纠正所述文档图像;采用最近邻插值算法,通过旋转纠正所述文档图像。
CN201911174717.7A 2019-11-26 2019-11-26 基于古典概型的影印图像倾斜纠正方法 Active CN111091505B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911174717.7A CN111091505B (zh) 2019-11-26 2019-11-26 基于古典概型的影印图像倾斜纠正方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911174717.7A CN111091505B (zh) 2019-11-26 2019-11-26 基于古典概型的影印图像倾斜纠正方法

Publications (2)

Publication Number Publication Date
CN111091505A CN111091505A (zh) 2020-05-01
CN111091505B true CN111091505B (zh) 2022-06-24

Family

ID=70393777

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911174717.7A Active CN111091505B (zh) 2019-11-26 2019-11-26 基于古典概型的影印图像倾斜纠正方法

Country Status (1)

Country Link
CN (1) CN111091505B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112215756B (zh) * 2020-10-19 2024-05-03 珠海奔图电子有限公司 扫描纠偏方法、装置、存储介质及计算机设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0800148A2 (en) * 1996-04-04 1997-10-08 Hewlett-Packard Company Image processing system
JP2000113106A (ja) * 1998-10-09 2000-04-21 Fuji Xerox Co Ltd 文書画像処理装置
CN103679638A (zh) * 2013-12-25 2014-03-26 广州广电运通金融电子股份有限公司 残缺或变形的四边形图像的校正方法
CN104809715A (zh) * 2014-01-23 2015-07-29 广州南沙资讯科技园有限公司博士后科研工作站 纸币图像倾斜校正与区域提取方法
KR20150109929A (ko) * 2014-03-21 2015-10-02 주식회사 인프라웨어 히스토그램을 이용한 문서 이미지 보정 방법 및 장치
CN107038440A (zh) * 2016-02-04 2017-08-11 株式会社理光 图像倾斜校正装置、图像处理系统以及图像倾斜校正方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5448350B2 (ja) * 2008-02-22 2014-03-19 キヤノン株式会社 画像形成装置および画像形成方法
CN103455995B (zh) * 2012-05-31 2016-08-03 富士通株式会社 图像处理装置、图像处理方法和扫描仪

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0800148A2 (en) * 1996-04-04 1997-10-08 Hewlett-Packard Company Image processing system
JP2000113106A (ja) * 1998-10-09 2000-04-21 Fuji Xerox Co Ltd 文書画像処理装置
CN103679638A (zh) * 2013-12-25 2014-03-26 广州广电运通金融电子股份有限公司 残缺或变形的四边形图像的校正方法
CN104809715A (zh) * 2014-01-23 2015-07-29 广州南沙资讯科技园有限公司博士后科研工作站 纸币图像倾斜校正与区域提取方法
KR20150109929A (ko) * 2014-03-21 2015-10-02 주식회사 인프라웨어 히스토그램을 이용한 문서 이미지 보정 방법 및 장치
CN107038440A (zh) * 2016-02-04 2017-08-11 株式会社理光 图像倾斜校正装置、图像处理系统以及图像倾斜校正方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
Nagy et al.Invariant representation for rectilinear rulings.《Journal of Electronic Imaging》.2014, *
YZhang Y et al.Research on Deskew Algorithm of Scanned Image.《2018 IEEE International Conference on Mechatronics and Automation (ICMA)》.2018, *
汪等.一种纯文本图像的倾斜角校正方法.《电脑与信息技术》.2004,(第01期), *
田学东等.视觉文档图像的几何校正.《计算机应用》.2007,(第12期), *
金晅宏等.一种改进的图像水平倾斜角度测量算法的应用.《传感器与微系统》.2013,第32卷(第09期), *

Also Published As

Publication number Publication date
CN111091505A (zh) 2020-05-01

Similar Documents

Publication Publication Date Title
CN109961064B (zh) 身份证文本定位方法、装置、计算机设备及存储介质
WO2017020723A1 (zh) 一种字符分割方法、装置及电子设备
CN106384113A (zh) 基于投影和模板匹配的单双行车牌字符分割方法
JP2018519574A (ja) テキスト画像処理方法および装置
CN111353961B (zh) 一种文档曲面校正方法及装置
CN109598185B (zh) 图像识别翻译方法、装置、设备及可读存储介质
CN110647882A (zh) 图像校正方法、装置、设备及存储介质
CN101127908A (zh) 引入全局特征分类的视频图像运动处理方法及其实现装置
CN110674811B (zh) 图像识别的方法及装置
CN111914805A (zh) 表格结构化方法、装置、电子设备及存储介质
CN104574419A (zh) 镜头畸变参数标定方法及系统
CN111091505B (zh) 基于古典概型的影印图像倾斜纠正方法
JP2013101616A (ja) 様々な文字幅を有するテキスト行の文字を分割するための方法及びシステム
US8787702B1 (en) Methods and apparatus for determining and/or modifying image orientation
US7327904B2 (en) Pattern classification and filter design for increasing image resolution
CN114943729A (zh) 一种高分辨率细胞图像的细胞计数方法及系统
CN111369489B (zh) 一种图像识别方法、装置及终端设备
JP5271956B2 (ja) 原稿方向の検出方法及び装置
CN111445411A (zh) 图像去噪方法、装置、计算机设备和存储介质
CN113989823B (zh) 基于ocr坐标的图片表格还原方法及系统
CN112364835B (zh) 视频信息取帧方法、装置、设备及存储介质
CN104636741B (zh) 公式识别方法和装置
CN111695557B (zh) 一种图像处理方法及装置
JP2004086436A (ja) 画像処理装置および画像処理方法、プログラムおよび記憶媒体
CN110717908B (zh) 病理图片的处理方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant