CN105721738A - 一种彩色扫描文档图像预处理方法 - Google Patents

一种彩色扫描文档图像预处理方法 Download PDF

Info

Publication number
CN105721738A
CN105721738A CN201610027089.XA CN201610027089A CN105721738A CN 105721738 A CN105721738 A CN 105721738A CN 201610027089 A CN201610027089 A CN 201610027089A CN 105721738 A CN105721738 A CN 105721738A
Authority
CN
China
Prior art keywords
point
document image
result
file
picture
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610027089.XA
Other languages
English (en)
Other versions
CN105721738B (zh
Inventor
王建
庞彦伟
曲畅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin University
Original Assignee
Tianjin University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin University filed Critical Tianjin University
Priority to CN201610027089.XA priority Critical patent/CN105721738B/zh
Publication of CN105721738A publication Critical patent/CN105721738A/zh
Application granted granted Critical
Publication of CN105721738B publication Critical patent/CN105721738B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/405Halftoning, i.e. converting the picture signal of a continuous-tone original into a corresponding signal showing only two levels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/409Edge or detail enhancement; Noise or error suppression

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Image Processing (AREA)

Abstract

本发明涉及一种彩色扫描文档图像预处理方法,包括:将输入的彩色扫描文档图像转换为灰度图像L;对L进行对比度拉伸增强处理,增强结果用I表示;使用中值滤波器对I进行平滑处理,处理结果用F表示;进行移动平均二值化处理;噪点去除。本发明提出的针对彩色扫描文档图像的预处理方法具有:1)有很强的抗噪声干扰能力;2)与图像内容无关,适应中文、英文文档情形、各种图文混排、多种书写方向并存等复杂情形。

Description

一种彩色扫描文档图像预处理方法
所属技术领域
本发明涉及针对彩色图像的预处理技术,尤其是针对彩色扫描文档图像的灰度化、二值化和去噪技术。
背景技术
随着当信息技术的高速发展,以及办公数字化需求的不断增长,数字化的扫描文档图像正逐渐替代原始的纸质文档。扫描文档图像具有储存空间小,管理方便,处理快捷等特点。因此,对文档图像处理的研究具有重要的实用价值。文档在扫描过程中,由于设备原因或者人为因素,可能导致扫描后的文档图像存在噪声、光照不均匀,以及几何变形等不利情况,这将严重影响文档图像的视觉质量。因此有必要对原始扫描文档图像进行增强处理,提高扫描图像的视觉质量,为后续的处理步骤做好准备。
完整的扫描文档图像处理系统通常包括预处理、压缩存储、OCR(光学字符识别)等。其中预处理部分主要包括:二值化、去噪、倾斜度校正、去黑边等处理步骤。本专利提出的方法主要完成二值化和去噪功能,输入的是彩色扫描文档图像,输出的是经过去噪处理后的二值化扫描文档图像。典型的全局阈值化方法有平均灰度值法、Otsu法等[1][2]。如果图像是背景与目标比较均匀,全局阈值法是一个有效的方法。但由于文献本身污染情况,或者以及扫描光源等问题,造成扫描图像各部分目标与背景不均匀,在这种情况下使用全局阈值往往不能得到很好的处理结果。针对这类情况,可以考虑使用局部二值化方法。Bernsen算法[3]是一种经典的局部二值化方法。Bernsen算法以局部窗口内最大-最小值的均值作为中心点对应的阈值,不需要事先确定阈值,并且计算复杂度低,处理速度快。但当局部区域内部无目标点,但又存在噪声点时,容易引起误检。
经过专利申请人检索,目前与文档图像处理有关的国内发明专利主要集中在扫描文档倾斜度检测与矫正[4][5],以及透字效应去除方面[6]。俞颂阳和明伟在专利“用于二值化扫描文档图像的方法”(申请号CN201110359326.X)[7]中提出了一种用于二值化扫描文档图像的方法。该专利主要是针对二值扫描文档图像的后处理,并没有涉及彩色或灰度图像的二值化和去噪过程。
参考文献:
[1]庄军,李弼程,陈刚.一种有效的文本图像二值化方法.微计算机信息,2005(8):56-58.
[2]陈丹,张蜂,贺贵明.一种改进的文本图像二值化算法.计算机工程,2003(13):85-86.
[3]J.Bernsen.DynamicThresholdingofGraylevel.InternalConferenceonPatternRecognition,1986:1251-1255.
[4]文志强,曾志高,朱文球,专利名称:一种扫描文档图像的倾斜角自动检测方法,申请号:N201410769531.7
[5]马磊,刘江,专利名称:一种扫描文档图像的快速纠偏方法,申请号:CN201010146476.8
[6]王建,刘长波,专利名称:一种文档扫描图像透字效应消除方法,申请号:CN201410301425.6
[7]俞颂阳,明伟,专利名称:用于二值化扫描文档图像的方法,申请号:CN201110359326.X
发明内容
提出了一种针对彩色扫描文档图像的预处理方法。采用本发明所述方法,能将彩色扫描文档图像转换为二值图像,具有抗干扰能力强、适用范围广等特点。本发明的技术方案如下:
一种彩色扫描文档图像预处理方法,包括下列步骤:
1)将输入的彩色扫描文档图像转换为灰度图像L;
2)对L进行对比度拉伸增强处理,增强结果用I表示;
3)使用中值滤波器对I进行平滑处理,处理结果用F表示;
4)进行移动平均二值化处理,方法如下:
第1步:对于F中(x,y)位置上的点F(x,y),选取其上方p个点、下方p个点和当前点共2p+1个点的平均值,用M1(x,y)表示,即有
M 1 ( x , y ) = 1 2 p + 1 Σ m = - p p F ( x + m , y )
第2步:对于同一个点F(x,y),选取其左侧q个点和右侧q个点,以及当前点共2q+1个点的平均值,用M2(x,y)表示,即有
M 2 ( x , y ) = 1 2 q + 1 Σ n = - q q F ( x , y + n )
第3步:计算F(x,y)中对应的局部阈值T(x,y),令T(x,y)=α·M1(x,y)+β·M2(x,y),参数α和β用来调整水平方向和垂直方向各像素点对阈值贡献的权重;
第4步:将F(x,y)与T(x,y)进行比较,得到二值化结果,用B(x,y)表示;如果F(x,y)>T(x,y),则令B(x,y)=1;否则,B(x,y)=0,二值图B中取值为0的点,对应于潜在的前景字符点;
5)噪点去除,方法如下:
第1步:计算B各潜在字符区域的面积,用Ωs(s=1,2,3,...,S)表示,式中S为潜在前景字符区域总数;
第2步:对于某个区域Ωs,如果其面积小于16,则将Ωs内所有点全部置1;
第3步:遍历B中所有区域,将最终处理结果记为E。
上述方法中,可取p=10,q=20,可令α=β=0.4。
本专利提出的针对彩色扫描文档图像的预处理方法,包括灰度化、对比度拉伸、图像滤波、二值化和去噪等步骤。首先将输入的彩色扫描文档图像转换为灰度图像;接下来进行增强处理,包括对比度拉伸和中值滤波两步骤;然后使用移动平均法对增强后的灰度进行二值化处理;最后结合连通域分析,去除噪声点。本发明方法的特征有:1)有很强的抗噪声干扰能力;2)与图像内容无关,适应中文、英文文档情形、各种图文混排、多种书写方向并存等复杂情形。
附图说明
图1所提方法框图
图2部分实验结果(为显示方便,添加图片外轮廓线)
(a)扫描文档图像灰度图(b)灰度级拉伸和滤波结果
(c)二值化结果(d)噪点去除结果
图3部分实验结果(为显示方便,添加图片外轮廓线)
(a)左图为英文印刷文本扫描图像,右图为采用本发明的方法的处理结果
(b)左图为中文手写文本扫描图像,右图为采用本发明的方法的处理结果
具体实施方式
所提方法主要包括:灰度化、对比度拉伸、平滑滤波、二值化和噪点去除等步骤。图1给出了所提方法的框图。包括:
1、灰度化
本专利所提方法首先将输入的彩色扫描文档图像转换为灰度图像。首先判断输入扫描文档图像类型。如果是灰度图,则直接进入到下一步;如果是彩色图,则使用以下过程转换为灰度图像。
用C表示输入彩色扫描文档图像,其红、绿、蓝三通道图像分别用CR、CG和CB表示。使用式(1)得到灰度图像,并用L表示,即有:
L = 1 3 ( C R + C G + C B ) - - - ( 1 )
2灰度级拉伸
由于扫描设备等原因,可能导致扫描文档图像背景偏暗,文字与背景的对比度较低。所提方法使用对比度拉伸技术增强L,增强结果用I表示。具体过程如下:
算法1:对比度拉伸
第1步:计算L中的最大值和最小值,分别用Lmax和Lmin表示;
第2步:使用式(2)对L进行线性拉伸,处理结果用I表示;
3、平滑滤波
文档在扫描过程中可能引入噪声。所提方法使用中值滤波器对I进行平滑处理,处理结果用F表示。具体过程如下:
算法2:中值滤波
第1步:选取I中(x,y)位置上的点,用I(x,y)表示,以它为中心,选取周围的“4-邻域点”,即该点上方、下方、左方和右方的4个点,分别用I(x-1,y)、I(x+1,y)、I(x,y-1)和I(x,y+1)表示;
第2步:对这5个点的灰度值进行排序,选取中间值,记为Imed(x,y),将F(x,y)赋值为Imed(x,y)。
第3步:确定是否遍历了I中所有点,如果是,则算法结束;否则改变当前点的位置,返回第1步。
4、二值化
无论是中文还是外文,扫描文档图像中的字符大多数是按水平方向排列,单个字符笔画以水平和垂直方向为主。本专利使用提出移动平均计算局部阈值,实现二值化处理。具体实现过程如下:
算法3:移动平均二值化
第1步:对于F中(x,y)位置上的点F(x,y),选取其上方p个点、下方p个点和当前点共2p+1个点的平均值,用M1(x,y)表示,即有
M 1 ( x , y ) = 1 2 p + 1 Σ m = - p p F ( x + m , y ) - - - ( 3 )
第2步:对于同一个点F(x,y),选取其左侧q个点和右侧q个点,以及当前点共2q+1个点的平均值,用M2(x,y)表示,即有
M 2 ( x , y ) = 1 2 q + 1 Σ n = - q q F ( x , y + n ) - - - ( 4 )
第3步:计算F(x,y)中对应的局部阈值T(x,y),令T(x,y)=α·M1(x,y)+β·M2(x,y)。
第4步:将F(x,y)与T(x,y)进行比较,得到二值化结果,用B(x,y)表示。如果F(x,y)>T(x,y),则令B(x,y)=1;否则,B(x,y)=0。
在上述算法中,取p=10,q=20,参数α和β用来调整水平方向和垂直方向各像素点对阈值贡献的权重,可令α=β=0.4。二值图B中取值为0的点,对应于潜在的前景字符点。
5、噪点去除
由于各种情况的干扰,B中可能仍然存在噪声点,经过观察发现,这类噪声点通常以孤立区域存在,并且所占面积较小。对于分辨率在300dpi以上的扫描文档图像,中/英文中的字符和标点符号中有效点的尺寸都在4×4以上,而面积小于16个点的潜在前景区域,可以看做是噪点并去除。本专利使用以下过程去除噪点:
算法4:噪点去除
第1步:计算B各潜在字符区域的面积,用Ωs(s=1,2,3,...,S)表示,式中S为潜在前景字符区域总数。
第2步:对于某个区域Ωs,如果其面积小于16,则将Ωs内所有点全部置1(即变为背景点)。
第3步:遍历B中所有区域,将最终处理结果记为E。
采用Windows7SP1系统下的VisualC++2010作为实验仿真平台。选用自己采集的扫描文档图像作为测试集,共计120幅图像。扫描文档设为A4大小,水平/垂直分辨率是300dpi,像素数为2480×3508。采用本专利所提方法对测试图像进行处理,得到了良好的处理效果,平均处理速度为320ms,处理速度能够满足实时要求。
图2所示为所提方法处理过程示例。图3所示为更多的处理结果,其中(a)为英文印刷文本扫描图像情况,(b)为中文手写文本扫描图像情况,左侧为原始扫描文本图像,右侧为使用本专利所提方法得到的处理结果。为显示方便,图2和图3的文本图像人为增加黑色轮廓线。

Claims (2)

1.一种彩色扫描文档图像预处理方法,包括下列步骤:
1)将输入的彩色扫描文档图像转换为灰度图像L;
2)对L进行对比度拉伸增强处理,增强结果用I表示;
3)使用中值滤波器对I进行平滑处理,处理结果用F表示;
4)进行移动平均二值化处理,方法如下:
第1步:对于F中(x,y)位置上的点F(x,y),选取其上方p个点、下方p个点和当前点共2p+1个点的平均值,用M1(x,y)表示,即有
M 1 ( x , y ) = 1 2 p + 1 Σ m = - p p F ( x + m , y )
第2步:对于同一个点F(x,y),选取其左侧q个点和右侧q个点,以及当前点共2q+1个点的平均值,用M2(x,y)表示,即有
M 2 ( x , y ) = 1 2 q + 1 Σ n = - q q F ( x , y + n )
第3步:计算F(x,y)中对应的局部阈值T(x,y),令T(x,y)=α·M1(x,y)+β·M2(x,y),参数α和β用来调整水平方向和垂直方向各像素点对阈值贡献的权重;
第4步:将F(x,y)与T(x,y)进行比较,得到二值化结果,用B(x,y)表示;如果F(x,y)>T(x,y),则令B(x,y)=1;否则,B(x,y)=0,二值图B中取值为0的点,对应于潜在的前景字符点;
5)噪点去除,方法如下:
第1步:计算B各潜在字符区域的面积,用Ωs(s=1,2,3,...,S)表示,式中S为潜在前景字符区域总数;
第2步:对于某个区域Ωs,如果其面积小于16,则将Ωs内所有点全部置1;
第3步:遍历B中所有区域,将最终处理结果记为E。
2.根据权利要求1所述的彩色扫描文档图像预处理方法,其特征在于,取p=10,q=20,可令α=β=0.4。
CN201610027089.XA 2016-01-15 2016-01-15 一种彩色扫描文档图像预处理方法 Expired - Fee Related CN105721738B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610027089.XA CN105721738B (zh) 2016-01-15 2016-01-15 一种彩色扫描文档图像预处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610027089.XA CN105721738B (zh) 2016-01-15 2016-01-15 一种彩色扫描文档图像预处理方法

Publications (2)

Publication Number Publication Date
CN105721738A true CN105721738A (zh) 2016-06-29
CN105721738B CN105721738B (zh) 2018-05-01

Family

ID=56147146

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610027089.XA Expired - Fee Related CN105721738B (zh) 2016-01-15 2016-01-15 一种彩色扫描文档图像预处理方法

Country Status (1)

Country Link
CN (1) CN105721738B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108024026A (zh) * 2017-12-14 2018-05-11 广东金赋科技股份有限公司 一种文档快速扫描方法
CN109146809A (zh) * 2018-08-02 2019-01-04 电子科技大学 一种对扫描文档图像进行去灰边的方法
CN109214322A (zh) * 2018-08-27 2019-01-15 厦门哲林软件科技有限公司 一种文档图像视觉效果的优化方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120120453A1 (en) * 2010-11-15 2012-05-17 Konica Minolta Systems Laboratory, Inc. Method for binarizing scanned document images containing gray or light colored text printed with halftone pattern
CN102663382A (zh) * 2012-04-25 2012-09-12 重庆邮电大学 基于子网格特征自适应加权的视频图像文字识别方法
CN104036469A (zh) * 2014-06-27 2014-09-10 天津大学 一种文档扫描图像透字效应消除方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120120453A1 (en) * 2010-11-15 2012-05-17 Konica Minolta Systems Laboratory, Inc. Method for binarizing scanned document images containing gray or light colored text printed with halftone pattern
CN102663382A (zh) * 2012-04-25 2012-09-12 重庆邮电大学 基于子网格特征自适应加权的视频图像文字识别方法
CN104036469A (zh) * 2014-06-27 2014-09-10 天津大学 一种文档扫描图像透字效应消除方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
卜飞宇: "一种改进的文本图像二值化方法", 《电脑知识与技术》 *
童立靖,张艳,舒巍,占国亮,钱垚: "几种文本图像二值化方法的对比分析", 《北方工业大学学报》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108024026A (zh) * 2017-12-14 2018-05-11 广东金赋科技股份有限公司 一种文档快速扫描方法
CN109146809A (zh) * 2018-08-02 2019-01-04 电子科技大学 一种对扫描文档图像进行去灰边的方法
CN109214322A (zh) * 2018-08-27 2019-01-15 厦门哲林软件科技有限公司 一种文档图像视觉效果的优化方法及系统

Also Published As

Publication number Publication date
CN105721738B (zh) 2018-05-01

Similar Documents

Publication Publication Date Title
CN102782706B (zh) 经历光学字符识别的文本图像的文本增强
CN111401372B (zh) 一种扫描文档图文信息提取与鉴别的方法
US20070253040A1 (en) Color scanning to enhance bitonal image
CN108416766B (zh) 双侧入光式导光板缺陷视觉检测方法
CN107273896A (zh) 一种基于图像识别的车牌检测识别方法
CN101593276B (zh) 一种视频ocr图文分离方法及系统
CN105608429B (zh) 基于差分激励的鲁棒车道线检测方法
CN105374015A (zh) 基于局部对比度和笔画宽度估计的低质量文档图像二值化方法
CN105913093A (zh) 一种用于文字识别处理的模板匹配方法
CN111209876A (zh) 一种漏油缺陷检测方法及系统
CN106096610A (zh) 一种基于支持向量机的文档图像二值化方法
CN108961230B (zh) 结构表面裂缝特征的识别与提取方法
CN101630411B (zh) 基于熵值的面向输电线路部件识别的自动阈值图象分割方法
CN103325118A (zh) 一种获取碳酸盐岩岩心孔洞特征参数的方法及装置
CN106934829A (zh) 一种表面裂缝的检测方法及系统
CN101739549A (zh) 人脸检测方法及系统
CN116468640B (zh) 一种用于互联网教学的视频图像增强方法
CN105721738A (zh) 一种彩色扫描文档图像预处理方法
CN103914829B (zh) 一种含噪图像边缘检测方法
JP2013105245A (ja) 画像処理方法、装置及びプログラム
CN110008833A (zh) 基于光学遥感图像的目标船只检测方法
CN107609482B (zh) 一种基于汉字笔画特征的中文文本图像倒置判别方法
Darma et al. Segmentation of balinese script on lontar manuscripts using projection profile
CN116542963A (zh) 一种基于机器学习的浮法玻璃缺陷检测系统及检测方法
Nomura et al. A new method for degraded color image binarization based on adaptive lightning on grayscale versions

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20180501

Termination date: 20210115

CF01 Termination of patent right due to non-payment of annual fee