CN105721738B - 一种彩色扫描文档图像预处理方法 - Google Patents
一种彩色扫描文档图像预处理方法 Download PDFInfo
- Publication number
- CN105721738B CN105721738B CN201610027089.XA CN201610027089A CN105721738B CN 105721738 B CN105721738 B CN 105721738B CN 201610027089 A CN201610027089 A CN 201610027089A CN 105721738 B CN105721738 B CN 105721738B
- Authority
- CN
- China
- Prior art keywords
- point
- points
- image
- picture
- represented
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/40—Picture signal circuits
- H04N1/405—Halftoning, i.e. converting the picture signal of a continuous-tone original into a corresponding signal showing only two levels
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/40—Picture signal circuits
- H04N1/409—Edge or detail enhancement; Noise or error suppression
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Image Processing (AREA)
Abstract
本发明涉及一种彩色扫描文档图像预处理方法,包括:将输入的彩色扫描文档图像转换为灰度图像L;对L进行对比度拉伸增强处理,增强结果用I表示;使用中值滤波器对I进行平滑处理,处理结果用F表示;进行移动平均二值化处理;噪点去除。本发明提出的针对彩色扫描文档图像的预处理方法具有:1)有很强的抗噪声干扰能力;2)与图像内容无关,适应中文、英文文档情形、各种图文混排、多种书写方向并存等复杂情形。
Description
技术领域
本发明涉及针对彩色图像的预处理技术,尤其是针对彩色扫描文档图像的灰度化、二值化和去噪技术。
背景技术
随着当信息技术的高速发展,以及办公数字化需求的不断增长,数字化的扫描文档图像正逐渐替代原始的纸质文档。扫描文档图像具有储存空间小,管理方便,处理快捷等特点。因此,对文档图像处理的研究具有重要的实用价值。文档在扫描过程中,由于设备原因或者人为因素,可能导致扫描后的文档图像存在噪声、光照不均匀,以及几何变形等不利情况,这将严重影响文档图像的视觉质量。因此有必要对原始扫描文档图像进行增强处理,提高扫描图像的视觉质量,为后续的处理步骤做好准备。
完整的扫描文档图像处理系统通常包括预处理、压缩存储、OCR(光学字符识别)等。其中预处理部分主要包括:二值化、去噪、倾斜度校正、去黑边等处理步骤。本专利提出的方法主要完成二值化和去噪功能,输入的是彩色扫描文档图像,输出的是经过去噪处理后的二值化扫描文档图像。典型的全局阈值化方法有平均灰度值法、Otsu法等[1][2]。如果图像是背景与目标比较均匀,全局阈值法是一个有效的方法。但由于文献本身污染情况,或者以及扫描光源等问题,造成扫描图像各部分目标与背景不均匀,在这种情况下使用全局阈值往往不能得到很好的处理结果。针对这类情况,可以考虑使用局部二值化方法。Bernsen 算法[3]是一种经典的局部二值化方法。Bernsen算法以局部窗口内最大-最小值的均值作为中心点对应的阈值,不需要事先确定阈值,并且计算复杂度低,处理速度快。但当局部区域内部无目标点,但又存在噪声点时,容易引起误检。
经过专利申请人检索,目前与文档图像处理有关的国内发明专利主要集中在扫描文档倾斜度检测与矫正[4][5],以及透字效应去除方面[6]。俞颂阳和明伟在专利“用于二值化扫描文档图像的方法”(申请号 CN201110359326.X)[7]中提出了一种用于二值化扫描文档图像的方法。该专利主要是针对二值扫描文档图像的后处理,并没有涉及彩色或灰度图像的二值化和去噪过程。
参考文献:
[1]庄军,李弼程,陈刚.一种有效的文本图像二值化方法.微计算机信息,2005(8):56-58.
[2]陈丹,张蜂,贺贵明.一种改进的文本图像二值化算法.计算机工程,2003(13):85-86.
[3]J.Bernsen.Dynamic Thresholding of Gray level.Internal Conferenceon Pattern Recognition,1986: 1251-1255.
[4]文志强,曾志高,朱文球,专利名称:一种扫描文档图像的倾斜角自动检测方法,申请号:N201410769531.7
[5]马磊,刘江,专利名称:一种扫描文档图像的快速纠偏方法,申请号:CN201010146476.8
[6]王建,刘长波,专利名称:一种文档扫描图像透字效应消除方法,申请号:CN201410301425.6
[7]俞颂阳,明伟,专利名称:用于二值化扫描文档图像的方法,申请号:CN201110359326.X
发明内容
提出了一种针对彩色扫描文档图像的预处理方法。采用本发明所述方法,能将彩色扫描文档图像转换为二值图像,具有抗干扰能力强、适用范围广等特点。本发明的技术方案如下:
一种彩色扫描文档图像预处理方法,包括下列步骤:
1)将输入的彩色扫描文档图像转换为灰度图像L;
2)对L进行对比度拉伸增强处理,增强结果用I表示;
3)使用中值滤波器对I进行平滑处理,处理结果用F表示;
4)进行移动平均二值化处理,方法如下:
第1步:对于F中(x,y)位置上的点F(x,y),选取其上方p个点、下方p个点和当前点共2p+1个点的平均值,用M1(x,y)表示,即有
第2步:对于同一个点F(x,y),选取其左侧q个点和右侧q个点,以及当前点共2q+1个点的平均值,用M2(x,y)表示,即有
第3步:计算F(x,y)中对应的局部阈值T(x,y),令T(x,y)=α·M1(x,y)+β·M2(x,y),参数α和β用来调整水平方向和垂直方向各像素点对阈值贡献的权重;
第4步:将F(x,y)与T(x,y)进行比较,得到二值化结果,用B(x,y)表示;如果F(x,y)>T(x,y),则令B(x,y)=1;否则,B(x,y)=0,二值图B中取值为0的点,对应于潜在的前景字符点;
5)噪点去除,方法如下:
第1步:计算B各潜在字符区域的面积,用Ωs(s=1,2,3,...,S)表示,式中S为潜在前景字符区域总数;
第2步:对于某个区域Ωs,如果其面积小于16,则将Ωs内所有点全部置1;
第3步:遍历B中所有区域,将最终处理结果记为E。
上述方法中,可取p=10,q=20,可令α=β=0.4。
本专利提出的针对彩色扫描文档图像的预处理方法,包括灰度化、对比度拉伸、图像滤波、二值化和去噪等步骤。首先将输入的彩色扫描文档图像转换为灰度图像;接下来进行增强处理,包括对比度拉伸和中值滤波两步骤;然后使用移动平均法对增强后的灰度进行二值化处理;最后结合连通域分析,去除噪声点。本发明方法的特征有:1)有很强的抗噪声干扰能力;2)与图像内容无关,适应中文、英文文档情形、各种图文混排、多种书写方向并存等复杂情形。
附图说明
图1所提方法框图
图2部分实验结果(为显示方便,添加图片外轮廓线)
(a)扫描文档图像灰度图 (b)灰度级拉伸和滤波结果
(c)二值化结果 (d)噪点去除结果
图3部分实验结果(为显示方便,添加图片外轮廓线)
(a)左图为英文印刷文本扫描图像,右图为采用本发明的方法的处理结果
(b)左图为中文手写文本扫描图像,右图为采用本发明的方法的处理结果
具体实施方式
所提方法主要包括:灰度化、对比度拉伸、平滑滤波、二值化和噪点去除等步骤。图1给出了所提方法的框图。包括:
1、灰度化
本专利所提方法首先将输入的彩色扫描文档图像转换为灰度图像。首先判断输入扫描文档图像类型。如果是灰度图,则直接进入到下一步;如果是彩色图,则使用以下过程转换为灰度图像。
用C表示输入彩色扫描文档图像,其红、绿、蓝三通道图像分别用CR、CG和CB表示。使用式(1)得到灰度图像,并用L表示,即有:
2、灰度级拉伸
由于扫描设备等原因,可能导致扫描文档图像背景偏暗,文字与背景的对比度较低。所提方法使用对比度拉伸技术增强L,增强结果用I表示。具体过程如下:
算法1:对比度拉伸
第1步:计算L中的最大值和最小值,分别用Lmax和Lmin表示;
第2步:对L进行线性拉伸,处理结果用I表示;
3、平滑滤波
文档在扫描过程中可能引入噪声。所提方法使用中值滤波器对I进行平滑处理,处理结果用F表示。具体过程如下:
算法2:中值滤波
第1步:选取I中(x,y)位置上的点,用I(x,y)表示,以它为中心,选取周围的“4-邻域点”,即该点上方、下方、左方和右方的4个点,分别用I(x-1,y)、I(x+1,y)、I(x,y-1)和I(x,y+1)表示;
第2步:对这5个点的灰度值进行排序,选取中间值,记为Imed(x,y),将F(x,y)赋值为Imed(x,y)。
第3步:确定是否遍历了I中所有点,如果是,则算法结束;否则改变当前点的位置,返回第1步。
4、二值化
无论是中文还是外文,扫描文档图像中的字符大多数是按水平方向排列,单个字符笔画以水平和垂直方向为主。本专利使用提出移动平均计算局部阈值,实现二值化处理。具体实现过程如下:
算法3:移动平均二值化
第1步:对于F中(x,y)位置上的点F(x,y),选取其上方p个点、下方p个点和当前点共2p+1个点的平均值,用M1(x,y)表示,即有
第2步:对于同一个点F(x,y),选取其左侧q个点和右侧q个点,以及当前点共2q+1个点的平均值,用M2(x,y)表示,即有
第3步:计算F(x,y)中对应的局部阈值T(x,y),令T(x,y)=α·M1(x,y)+β·M2(x,y)。
第4步:将F(x,y)与T(x,y)进行比较,得到二值化结果,用B(x,y)表示。如果F(x,y)>T(x,y),则令B(x,y)=1;否则,B(x,y)=0。
在上述算法中,取p=10,q=20,参数α和β用来调整水平方向和垂直方向各像素点对阈值贡献的权重,可令α=β=0.4。二值图B中取值为0的点,对应于潜在的前景字符点。
5、噪点去除
由于各种情况的干扰,B中可能仍然存在噪声点,经过观察发现,这类噪声点通常以孤立区域存在,并且所占面积较小。对于分辨率在300dpi以上的扫描文档图像,中/英文中的字符和标点符号中有效点的尺寸都在4×4以上,而面积小于16个点的潜在前景区域,可以看做是噪点并去除。本专利使用以下过程去除噪点:
算法4:噪点去除
第1步:计算B各潜在字符区域的面积,用Ωs(s=1,2,3,...,S)表示,式中S为潜在前景字符区域总数。
第2步:对于某个区域Ωs,如果其面积小于16,则将Ωs内所有点全部置1(即变为背景点)。
第3步:遍历B中所有区域,将最终处理结果记为E。
采用Windows7SP1系统下的Visual C++2010作为实验仿真平台。选用自己采集的扫描文档图像作为测试集,共计120幅图像。扫描文档设为A4大小,水平/垂直分辨率是300dpi,像素数为2480×3508。采用本专利所提方法对测试图像进行处理,得到了良好的处理效果,平均处理速度为320ms,处理速度能够满足实时要求。
图2所示为所提方法处理过程示例。图3所示为更多的处理结果,其中(a)为英文印刷文本扫描图像情况,(b)为中文手写文本扫描图像情况,左侧为原始扫描文本图像,右侧为使用本专利所提方法得到的处理结果。为显示方便,图2和图3的文本图像人为增加黑色轮廓线。
Claims (1)
1.一种彩色扫描文档图像预处理方法,包括下列步骤:
1)将输入的彩色扫描文档图像转换为灰度图像L;
2)对L进行对比度拉伸增强处理,增强结果用I表示;
3)使用中值滤波器对I进行平滑处理,处理结果用F表示;
4)进行移动平均二值化处理,方法如下:
第1步:对于F中(x,y)位置上的点F(x,y),选取其上方p个点、下方p个点和当前点共2p+1个点的平均值,用M1(x,y)表示,即有
<mrow>
<msub>
<mi>M</mi>
<mn>1</mn>
</msub>
<mrow>
<mo>(</mo>
<mi>x</mi>
<mo>,</mo>
<mi>y</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mfrac>
<mn>1</mn>
<mrow>
<mn>2</mn>
<mi>p</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
</mfrac>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>m</mi>
<mo>=</mo>
<mo>-</mo>
<mi>p</mi>
</mrow>
<mi>p</mi>
</munderover>
<mi>F</mi>
<mrow>
<mo>(</mo>
<mi>x</mi>
<mo>+</mo>
<mi>m</mi>
<mo>,</mo>
<mi>y</mi>
<mo>)</mo>
</mrow>
</mrow>
第2步:对于同一个点F(x,y),选取其左侧q个点和右侧q个点,以及当前点共2q+1个点的平均值,用M2(x,y)表示,即有
<mrow>
<msub>
<mi>M</mi>
<mn>2</mn>
</msub>
<mrow>
<mo>(</mo>
<mi>x</mi>
<mo>,</mo>
<mi>y</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mfrac>
<mn>1</mn>
<mrow>
<mn>2</mn>
<mi>q</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
</mfrac>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>n</mi>
<mo>=</mo>
<mo>-</mo>
<mi>q</mi>
</mrow>
<mi>q</mi>
</munderover>
<mi>F</mi>
<mrow>
<mo>(</mo>
<mi>x</mi>
<mo>,</mo>
<mi>y</mi>
<mo>+</mo>
<mi>n</mi>
<mo>)</mo>
</mrow>
</mrow>
第3步:计算F(x,y)中对应的局部阈值T(x,y),令T(x,y)=α·M1(x,y)+β·M2(x,y),参数α和β用来调整水平方向和垂直方向各像素点对阈值贡献的权重;
第4步:将F(x,y)与T(x,y)进行比较,得到二值化结果,用B(x,y)表示;如果F(x,y)>T(x,y),则令B(x,y)=1;否则,B(x,y)=0,二值图B中取值为0的点,对应于潜在的前景字符点;
5)噪点去除,方法如下:
第1步:计算B各潜在字符区域的面积,用Ωs(s=1,2,3,...,S)表示,式中S为潜在前景字符区域总数;
第2步:对于某个区域Ωs,如果其面积小于16,则将Ωs内所有点全部置1;
第3步:遍历B中所有区域,将最终处理结果记为E;
取p=10,q=20,令α=β=0.4。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610027089.XA CN105721738B (zh) | 2016-01-15 | 2016-01-15 | 一种彩色扫描文档图像预处理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610027089.XA CN105721738B (zh) | 2016-01-15 | 2016-01-15 | 一种彩色扫描文档图像预处理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105721738A CN105721738A (zh) | 2016-06-29 |
CN105721738B true CN105721738B (zh) | 2018-05-01 |
Family
ID=56147146
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610027089.XA Expired - Fee Related CN105721738B (zh) | 2016-01-15 | 2016-01-15 | 一种彩色扫描文档图像预处理方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105721738B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108024026B (zh) * | 2017-12-14 | 2019-06-28 | 广东金赋科技股份有限公司 | 一种文档快速扫描方法 |
CN109146809B (zh) * | 2018-08-02 | 2022-07-26 | 电子科技大学 | 一种对扫描文档图像进行去灰边的方法 |
CN109214322A (zh) * | 2018-08-27 | 2019-01-15 | 厦门哲林软件科技有限公司 | 一种文档图像视觉效果的优化方法及系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102663382A (zh) * | 2012-04-25 | 2012-09-12 | 重庆邮电大学 | 基于子网格特征自适应加权的视频图像文字识别方法 |
CN104036469A (zh) * | 2014-06-27 | 2014-09-10 | 天津大学 | 一种文档扫描图像透字效应消除方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8947736B2 (en) * | 2010-11-15 | 2015-02-03 | Konica Minolta Laboratory U.S.A., Inc. | Method for binarizing scanned document images containing gray or light colored text printed with halftone pattern |
-
2016
- 2016-01-15 CN CN201610027089.XA patent/CN105721738B/zh not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102663382A (zh) * | 2012-04-25 | 2012-09-12 | 重庆邮电大学 | 基于子网格特征自适应加权的视频图像文字识别方法 |
CN104036469A (zh) * | 2014-06-27 | 2014-09-10 | 天津大学 | 一种文档扫描图像透字效应消除方法 |
Non-Patent Citations (2)
Title |
---|
一种改进的文本图像二值化方法;卜飞宇;《电脑知识与技术》;20140425;全文 * |
几种文本图像二值化方法的对比分析;童立靖,张艳,舒巍,占国亮,钱垚;《北方工业大学学报》;20110315;第23卷(第1期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN105721738A (zh) | 2016-06-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111401372B (zh) | 一种扫描文档图文信息提取与鉴别的方法 | |
CN110210413B (zh) | 一种基于深度学习的多学科试卷内容检测与识别系统及方法 | |
KR101403876B1 (ko) | 차량 번호판 인식 방법과 그 장치 | |
CN106096610B (zh) | 一种基于支持向量机的文档图像二值化方法 | |
JP5701182B2 (ja) | 画像処理装置、画像処理方法及びコンピュータプログラム | |
CN107491730A (zh) | 一种基于图像处理的化验单识别方法 | |
CN108805116B (zh) | 图像文本检测方法及其系统 | |
US20070253040A1 (en) | Color scanning to enhance bitonal image | |
CN105809166A (zh) | 车牌识别方法、装置及系统 | |
CN116071763B (zh) | 基于文字识别的教辅图书智能校编系统 | |
CN108133216A (zh) | 基于机器视觉的可实现小数点读取的数码管读数识别方法 | |
CN105721738B (zh) | 一种彩色扫描文档图像预处理方法 | |
JP2008225764A (ja) | 文字ノイズ除去装置、文字ノイズ除去方法、文字ノイズ除去プログラム | |
CN102737240B (zh) | 分析数字文档图像的方法 | |
CN103530625A (zh) | 一种基于数字图像处理的光学字符识别方法 | |
Brisinello et al. | Optical Character Recognition on images with colorful background | |
CN107609482B (zh) | 一种基于汉字笔画特征的中文文本图像倒置判别方法 | |
CN111445402B (zh) | 一种图像去噪方法及装置 | |
US10115195B2 (en) | Method and apparatus for processing block to be processed of urine sediment image | |
KR20150099116A (ko) | Ocr를 이용한 컬러 문자 인식 방법 및 그 장치 | |
CN114529715B (zh) | 一种基于边缘提取的图像识别方法及系统 | |
CN111784616A (zh) | 一种基于图像处理的老唱片数字化音频处理方法 | |
Sharma et al. | Data extraction from exam answer sheets using OCR with adaptive calibration of environmental threshold parameters | |
CN112991470B (zh) | 一种复杂背景下的证件寸照背景颜色检查方法及其系统 | |
Ferandji et al. | Performance Comparison of Image Edge Detection Operators for Lontara Sanskrit Scripts |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20180501 Termination date: 20210115 |
|
CF01 | Termination of patent right due to non-payment of annual fee |