CN104036469A - 一种文档扫描图像透字效应消除方法 - Google Patents

一种文档扫描图像透字效应消除方法 Download PDF

Info

Publication number
CN104036469A
CN104036469A CN201410301425.6A CN201410301425A CN104036469A CN 104036469 A CN104036469 A CN 104036469A CN 201410301425 A CN201410301425 A CN 201410301425A CN 104036469 A CN104036469 A CN 104036469A
Authority
CN
China
Prior art keywords
value
represent
text
gray
subset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410301425.6A
Other languages
English (en)
Other versions
CN104036469B (zh
Inventor
王建
刘长波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin University
Original Assignee
Tianjin University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin University filed Critical Tianjin University
Priority to CN201410301425.6A priority Critical patent/CN104036469B/zh
Publication of CN104036469A publication Critical patent/CN104036469A/zh
Application granted granted Critical
Publication of CN104036469B publication Critical patent/CN104036469B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Processing (AREA)
  • Character Input (AREA)

Abstract

本发明涉及一种文档扫描图像透字效应消除方法,包括下面几个步骤:灰度化;使用中值滤波处理;计算图像的灰度值中值;文本区域与背景区域分离;利用K均值方法进行正面文本与背面文本分离,分成:正面文本子集,对应于类心灰度值最低的子集;背面文本子集,对应于类心灰度值最大的子集;待确定文本子集,对应于类心灰度值在前两者之间的子集;背面文本区域重新赋值。本发明能够有效抑制双面文档扫描图像中出现的透字效应,提高扫描图像的可视质量。

Description

一种文档扫描图像透字效应消除方法
所属技术领域
本发明涉及扫描文档图像恢复技术,尤其是针对双面文档扫描图像的透字效应消除方法。
背景技术
当扫描双面打印或手写的文档时,一种常见的问题是从正面能看到背面的文字。这种现象称为“透字效应”。造成透字效应的原因是背面文本吸收了部分反射光线。扫描纸张越薄,或者反面文本的墨水渗透情况越严重,透字效应越明显。人们在构建数字图书馆时,经常需要将时间久远的文献或者手稿经扫描转化为数字图像。由于纸张以及墨水的渗透情况,扫描后的文档图像中透字效应很明显,这会严重影响扫描文档图像的可视质量。因此开展对扫描文档图像透字效应消除方面的研究是非常有必要的。
早期文献利用二值化处理消除扫描文档中的透字现象[1],但处理后的图像是以二值形式出现的,这种方法并不利于读者阅读原始文献资料的需求。还有一些方法同时使用扫描文档的正面和反面两幅图像来消除透字效应[2][3][4]。所用技术包括线性成像模型[2]、盲信号分离(BSS)[3]、独立成分分析(ICA)[4]、非负矩阵分解(NMF)[5]等。如果正反面两扫描图像严格对齐,使用这类方法可以得到很好的消除效果。但在实际情况下,文档对齐难以实现。特别是对于扫描文档较厚,或者纸张本身存在明显变形或者干扰的情况(如存放时间较长的旧文献)。另外当获取的扫描文档图像只有单面时,这种方法完全失效。还有一类基于单幅扫描图像的透字效应去除方法。如Lins等[6]首先将图像分为9个子块,并使用训练好的神经网络分类器将各个子块分为三类,分别对应于较弱、一般和较强三种透字效应干扰情况。对于不同情况的子块,分别选取对应的阈值分离正面文本区域,然后采用双线性插值技术去除背面文本的干扰。此类方法适用于扫描图像的透字效应去除,不适用于扫描文档的透字效应去除,而且,存在处理方法较为复杂的缺陷。
参考文献:
[1]J.da Silva,R.Lins,F.Martins,etal.“A new and efficient algorithm to binarize document imagesremoving back-to-front interference,”Journal of Universal computer science,vol.14,no.2,pp.299-313,2008.
[2]A.G.Sharma,“Show-through cancellation in scans of duplex printed documents,”IEEE Transactionson Image Processing,vol.10,no.5,pp.736-754,2001.
[3]A.Tonazzini,E.Salerno,and L.Bedini,“Fast correction of bleed-through distortion in grayscaledocuments by a blind source separation technique,”International Journal on Document Analysis and Recognition,vol.10,no.1,pp.17-25,2007.
[4]A.Tonazzini,L.Bedini,and E.Salerno,“Independent component analysis for document restoration,International Journal on Document Analysis and Recognition,”2004,vol.7,no.1,pp.17-27.
[5]F.Merrikh-Bayat,M.Babaie-Zadeh,and C.Jutten,“Using Non-Negative Matrix Factorization forRemoving Show-Through,”International Conference on LVA/ICA,2010.pp.482–489.
[6]R.Lins,J.Silva,S.Banergee,etal.,“Enhancing the filtering-out of the back-to-front interference incolor documents with a neural classifier,”in International Conference on Pattern Recognition(ICPR).IEEE,2010,pp.2415-2419.
发明内容
本发明的目的是提出一种针对文档扫描图像的透字效应消除方法,能够有效抑制双面文档扫描图像中出现的透字效应,提高扫描图像的可视质量。本发明的技术方案如下:
一种文档扫描图像透字效应消除方法,包括下列步骤:
步骤1:灰度化:用F表示待处理的彩色扫描文档图像,对其进行灰度化处理,并用I表示灰度化图像;
步骤2:图像滤波:对灰度化图像使用中值滤波处理图像,用IF表示滤波结果;
步骤3:获取参数:将IF中各点的灰度值按照从小到大顺序排列,并用IF(n)(n=1,2,…,N)表示,其中N为像素点总数,其中IF(1)代表IF中灰度值的最小值,IF(N)表示IF中灰度值最大值。选用IF(n)中排第1%和排第99%的灰度值,分别用Imin和Imax表示,使用Imin和Imax计算图像的灰度值中值,用Imed表示;
步骤4:文本区域与背景区域分离:将I中各点的灰度值与Imed比较,得到背景区域二值图,用IBK表示,使用Imed提取文本区域图像,用T表示,即有:
式中,T中取值为1的区域对应于文本区域,包括了正面文本区域和背面文本区域两种情况;
步骤5:正面文本与背面文本分离:选取T中取值不为1的点构成文本点集,使用像素点的灰度值作为特征,用K均值方法将其分为三类:正面文本子集,对应于类心灰度值最低的子集,其位置用二值图TF表示;背面文本子集,对应于类心灰度值最大的子集,其位置用二值图TB表示;待确定文本子集,对应于类心灰度值在TF和TB之间的子集,其位置用二值图TV表示;
遍历TV中取值为1的点,对于每一个点,考察其8邻域范围内是否存在正面文本子集点,如果存在,则将该点划归到正面文本子集TF中;否则,划归到背面文本子集TB中;
步骤6:背面文本区域重新赋值:用TB(x,y)表示TB中某个取值为1的点,用IBK(x′,y′)表示IBK中某个取值为1的某点;采用“街区距离”计算IBK(x′,y′)到TB(x,y)的距离,并从中选取距离的最小值,用DM(x,y;xm,ym)表示,设(xm,ym)是距离最小值所对应的坐标值,使用F(xm,ym,c)代替原始图像中(x,y)位置上像素点的颜色值,实现背面文区域重新赋值。
附图说明
图1是所提方法的流程图。
图2处理结果示例(a)列为输入原图(b)列为处理结果。
具体实施方式
图1所示为本发明所提方法的框图。本发明提出的方法适用于下述情况:待处理的扫描文档图像中正面文本的灰度值基本一致,反面文本的灰度值也基本一致,另外,反面文本的灰度值应该高于正面文本的灰度值。
步骤1:灰度化
用F表示待处理的彩色扫描文档图像,使用式(1)进行灰度化处理,并用I表示灰度化图像,即有:
I ( x , y ) = max c ∈ { r , g , b } F ( x , y , c ) - - - ( 1 )
式中,c表示三个颜色通道,(x,y)位置上像素点的灰度值I(x,y)是该点处红(r)、绿(g)、蓝(b)三通道的最大值。
步骤2:图像滤波
使用中值滤波处理图像,降低扫描文档图像中的噪声影响。考虑到扫描图像分辨率较高,中值滤波器所用的滤波窗口大小不能太小。所提方法使用5×5大小的窗口进行中值滤波,用IF表示滤波结果。
步骤3:获取参数
将IF中各点的灰度值按照从小到大顺序排列,并用IF(n)(n=1,2,…,N)表示,其中N为像素点总数。其中IF(1)代表IF中灰度值的最小值,IF(N)表示IF中灰度值最大值。选用IF(n)中排第1%和排第99%的灰度值,分别用Imin和Imax表示,即有:式中,符号表示对下取整运算。使用Imin和Imax计算图像的灰度值中值,用Imed表示,即有
步骤4:文本区域与背景区域分离
将I中各点的灰度值与Imed比较,得到背景区域二值图,用IBK表示,即有
使用Imed提取文本区域图像,用T表示,即有:
式中,T中取值为1的区域对应于文本区域,包括了正面文本区域和背面文本区域两种情况。
步骤5:正面文本与背面文本分离
选取T中取值不为1的点构成文本点集,使用像素点的灰度值作为特征,用K均值方法将其分为三类:正面文本子集(对应于类心灰度值最低的子集,其位置用二值图用TF表示)、背面文本子集(对应于类心灰度值最大的子集,其位置用二值图用TB表示)和待确定文本子集(对应于类心灰度值在TF和TB之间的子集,其位置用二值图用TV表示)。
遍历TV中取值为1的点,对于每一个点,考察其8邻域范围内是否存在正面文本子集点。如果存在,则将该点划归到正面文本子集TF中;否则,划归到背面文本子集TB中。
步骤6:背面文本区域重新赋值
用TB(x,y)表示TB中某个取值为1的点(对应于某个背面文本点)。用IBK(x′,y′)表示IBK中某个取值为1的某点(对应于背景点)。采用“街区距离”计算IBK(x′,y′)到TB(x,y)的距离,并从中选取距离的最小值,用DM(x,y;xm,ym)表示,即有:
D M ( x , y ; x m , y m ) = min ( x ′ , y ′ ) | I BK ( x ′ , y ′ ) = 1 { | x - x ′ | + | y - y ′ | } - - - ( 4 )
式中,(xm,ym)是距离最小值所对应的坐标值。使用F(xm,ym,c)代替原始图像中(x,y)位置上像素点的颜色值,实现背面文区域重新赋值。
采用Windows7SP1系统下的matlab2014a作为实验仿真平台。选用60幅手写文本扫描图像作为测试集。采用本发明提出的方法对测试图像进行处理,得到了良好的处理效果。对于24803508大小的图像,采用所提方法的处理速度平均为102ms。图2给出了采用所提方法的部分处理结果示例,其中左侧是输入图像,右侧是处理结果。
采用本发明所述方法,与现有技术相比,能够直接处理单幅扫描文本图像的透字效应,明显提高了扫描图像可视质量,节省了处理的时间,达到了接近实用的效果。

Claims (1)

1.一种文档扫描图像透字效应消除方法,包括下列步骤:
步骤1:灰度化:用F表示待处理的彩色扫描文档图像,对其进行灰度化处理,并用I表示灰度化图像;
步骤2:图像滤波:对灰度化图像使用中值滤波处理图像,用IF表示滤波结果;
步骤3:获取参数:将IF中各点的灰度值按照从小到大顺序排列,并用IF(n)(n=1,2,…,N)表示,其中N为像素点总数,其中IF(1)代表IF中灰度值的最小值,IF(N)表示IF中灰度值最大值。选用IF(n)中排第1%和排第99%的灰度值,分别用Imin和Imax表示,使用Imin和Imax计算图像的灰度值中值,用Imed表示;
步骤4:文本区域与背景区域分离:将I中各点的灰度值与Imed比较,得到背景区域二值图,用IBK表示,使用Imed提取文本区域图像,用T表示,即有:
式中,T中取值为1的区域对应于文本区域,包括了正面文本区域和背面文本区域两种情况;
步骤5:正面文本与背面文本分离:选取T中取值不为1的点构成文本点集,使用像素点的灰度值作为特征,用K均值方法将其分为三类:正面文本子集,对应于类心灰度值最低的子集,其位置用二值图TF表示;背面文本子集,对应于类心灰度值最大的子集,其位置用二值图TB表示;待确定文本子集,对应于类心灰度值在TF和TB之间的子集,其位置用二值图TV表示。
遍历TV中取值为1的点,对于每一个点,考察其8邻域范围内是否存在正面文本子集点,如果存在,则将该点划归到正面文本子集TF中;否则,划归到背面文本子集TB中;
步骤6:背面文本区域重新赋值:用TB(x,y)表示TB中某个取值为1的点,用IBK(x′,y′)表示IBK中某个取值为1的某点;采用“街区距离”计算IBK(x′,y′)到TB(x,y)的距离,并从中选取距离的最小值,用DM(x,y;xm,ym)表示,设(xm,ym)是距离最小值所对应的坐标值,使用F(xm,ym,c)代替原始图像中(x,y)位置上像素点的颜色值,实现背面文区域重新赋值。
CN201410301425.6A 2014-06-27 2014-06-27 一种文档扫描图像透字效应消除方法 Expired - Fee Related CN104036469B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410301425.6A CN104036469B (zh) 2014-06-27 2014-06-27 一种文档扫描图像透字效应消除方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410301425.6A CN104036469B (zh) 2014-06-27 2014-06-27 一种文档扫描图像透字效应消除方法

Publications (2)

Publication Number Publication Date
CN104036469A true CN104036469A (zh) 2014-09-10
CN104036469B CN104036469B (zh) 2017-02-15

Family

ID=51467230

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410301425.6A Expired - Fee Related CN104036469B (zh) 2014-06-27 2014-06-27 一种文档扫描图像透字效应消除方法

Country Status (1)

Country Link
CN (1) CN104036469B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105721738A (zh) * 2016-01-15 2016-06-29 天津大学 一种彩色扫描文档图像预处理方法
CN105741272A (zh) * 2016-01-25 2016-07-06 上海中信信息发展股份有限公司 去除文档图像背面渗透字迹的方法
CN105898104A (zh) * 2015-01-04 2016-08-24 陈于中 一种消减扫描图像上透出的背面内容的方法
CN106097254A (zh) * 2016-06-07 2016-11-09 天津大学 一种扫描文档图像纠偏方法
CN108257104A (zh) * 2018-01-26 2018-07-06 维沃移动通信有限公司 一种图像处理方法及移动终端
CN112261241A (zh) * 2020-10-26 2021-01-22 联想(北京)有限公司 一种图像处理方法、装置及电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0784396B1 (en) * 1996-01-11 2000-03-22 Xerox Corporation Show-through correction for two-sided documents
TW200416621A (en) * 2003-02-28 2004-09-01 Hewlett Packard Development Co Selective smoothing including bleed-through reduction
CN101547282A (zh) * 2008-03-25 2009-09-30 佳能株式会社 图像处理设备和图像处理方法
CN101567049A (zh) * 2009-05-26 2009-10-28 西安交通大学 一种半色调文档图像的噪声处理方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0784396B1 (en) * 1996-01-11 2000-03-22 Xerox Corporation Show-through correction for two-sided documents
TW200416621A (en) * 2003-02-28 2004-09-01 Hewlett Packard Development Co Selective smoothing including bleed-through reduction
CN101547282A (zh) * 2008-03-25 2009-09-30 佳能株式会社 图像处理设备和图像处理方法
CN101567049A (zh) * 2009-05-26 2009-10-28 西安交通大学 一种半色调文档图像的噪声处理方法

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105898104A (zh) * 2015-01-04 2016-08-24 陈于中 一种消减扫描图像上透出的背面内容的方法
CN105721738A (zh) * 2016-01-15 2016-06-29 天津大学 一种彩色扫描文档图像预处理方法
CN105721738B (zh) * 2016-01-15 2018-05-01 天津大学 一种彩色扫描文档图像预处理方法
CN105741272A (zh) * 2016-01-25 2016-07-06 上海中信信息发展股份有限公司 去除文档图像背面渗透字迹的方法
CN106097254A (zh) * 2016-06-07 2016-11-09 天津大学 一种扫描文档图像纠偏方法
CN106097254B (zh) * 2016-06-07 2019-04-16 天津大学 一种扫描文档图像纠偏方法
CN108257104A (zh) * 2018-01-26 2018-07-06 维沃移动通信有限公司 一种图像处理方法及移动终端
CN112261241A (zh) * 2020-10-26 2021-01-22 联想(北京)有限公司 一种图像处理方法、装置及电子设备

Also Published As

Publication number Publication date
CN104036469B (zh) 2017-02-15

Similar Documents

Publication Publication Date Title
CN104036469A (zh) 一种文档扫描图像透字效应消除方法
CN102782706B (zh) 经历光学字符识别的文本图像的文本增强
US9042649B2 (en) Color document image segmentation and binarization using automatic inpainting
US11295417B2 (en) Enhancing the legibility of images using monochromatic light sources
CN104318524A (zh) 一种基于YCbCr色彩空间的图像增强方法、装置及系统
Khodadadi et al. Text localization, extraction and inpainting in color images
CN103020929B (zh) 基于文字特征的碎纸机破碎文档恢复方法
CN102956029B (zh) 图像处理装置以及图像处理方法
CN102890820A (zh) 基于shearlet变换和维纳滤波的图像去噪方法
CN103377462A (zh) 对扫描图像进行处理的方法和装置
CN107174232A (zh) 一种心电图波形提取方法
CN102612833B (zh) 用于检测空白页的方法以及相应的多功能机
CN105741272A (zh) 去除文档图像背面渗透字迹的方法
CN102750686B (zh) 一种基于学习的超分辨文档图像复原处理方法
CN105303190A (zh) 一种基于对比度增强法的降质文档图像二值化方法
CN105069755A (zh) 多路雾霾图像增强处理装置及方法
CN102768758B (zh) 一种改进的彩色图像usm锐化方法
CN110807747B (zh) 一种基于前景蒙版的文档图像降噪方法
Amin et al. A binarization algorithm for historical arabic manuscript images using a neutrosophic approach
CN105721738B (zh) 一种彩色扫描文档图像预处理方法
Ranganatha et al. Hybrid binarization technique for degraded document images
CN104102911A (zh) 一种基于aoi的子弹表观缺陷检测系统的图像处理算法
Nishida et al. A multiscale approach to restoring scanned color document images with show-through effects
CN112488940A (zh) 一种铁路机车部件图像边缘增强方法
CN114331875A (zh) 一种基于对抗边缘学习的印刷工艺中图像出血位预测方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20170215

CF01 Termination of patent right due to non-payment of annual fee