CN110807747B - 一种基于前景蒙版的文档图像降噪方法 - Google Patents

一种基于前景蒙版的文档图像降噪方法 Download PDF

Info

Publication number
CN110807747B
CN110807747B CN201911049926.9A CN201911049926A CN110807747B CN 110807747 B CN110807747 B CN 110807747B CN 201911049926 A CN201911049926 A CN 201911049926A CN 110807747 B CN110807747 B CN 110807747B
Authority
CN
China
Prior art keywords
foreground mask
color
foreground
document image
background
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911049926.9A
Other languages
English (en)
Other versions
CN110807747A (zh
Inventor
李锴
沈来信
赵岳
孙明东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huayu Dalian Information Service Co ltd
Original Assignee
Beijing Thunisoft Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Thunisoft Information Technology Co ltd filed Critical Beijing Thunisoft Information Technology Co ltd
Priority to CN201911049926.9A priority Critical patent/CN110807747B/zh
Publication of CN110807747A publication Critical patent/CN110807747A/zh
Application granted granted Critical
Publication of CN110807747B publication Critical patent/CN110807747B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/70Denoising; Smoothing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/194Segmentation; Edge detection involving foreground-background segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/90Determination of colour characteristics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30176Document

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)
  • Facsimile Image Signal Circuits (AREA)

Abstract

本发明公开了一种基于前景蒙版的文档图像降噪方法,属于文档图像数据处理技术领域,该方法包括:通过随机采样统计最大频数确定图像背景颜色像素值;对比HSV空间像素值得到第一前景蒙版,针对图片亮度不均匀的情况,自适应局部二值化得到第二前景蒙版,第一前景蒙版与第二前景蒙版做and操作得到最终前景蒙版;然后,利用kmeans聚类方法得到像素板,获取代表性色彩,设定背景为之前计算得到的背景像素。本发明能有效提取文档图像的背景色并获取其前景蒙板,特别是针对前景主要是文本及图文表格的文档图像。利用前景蒙板的方法可以有效过滤去除包括背景上的无用干扰噪声而对前景主体不会造成很大损失,可以提高文档图像质量。

Description

一种基于前景蒙版的文档图像降噪方法
技术领域
本发明涉及文档图像数据处理领域,特别涉及一种基于前景蒙版的文档图像降噪方法。
背景技术
文档图像中的噪声会不同程度的影响文档的阅读以及OCR等后续文档图像识别等工作,针对文档图像的降噪十分必要。
已有技术针对黑白文档影像提出了基于分块统计的降噪方法,根据文档图像的大小及每英寸像素点的个数将图像分为N×N的图块,N一般为半个汉字高度。分块后通过对每个分块计算其黑色点占的比例判断是否为文本区域,如小于80%则计算四周图块像素比例来判断是否是杂点进行处理。该技术只能针对汉字黑白文档图像且鲁棒性差,针对手写体以及含图片表格等图像不能生效。
还有一种基于背景估计和能量最小化的低质量文档图像的二值化方法,能够适用于多种颜色书写、笔画渐变、墨迹浸润、页面有污渍或纹理、光照不均、对比度低等复杂背景的文档图像二值化处理。此专利利用笔画宽度估计观测距离,并利用观察距离计算成像高度。利用成像高度对图像做降采样缩放后得到估计背景。并利用背景图对图像做减除,并作直方图均衡化后利用能量函数实现图分割。此种方法,仅能用于低质量文档图像,且在对文字笔画宽度进行估计时,如遇到多种宽度则可能出现问题,且没有对彩色图像色彩进行保留。
现代文档图像往往包括多种图像,包括扫描图像以及相机拍摄图像。且图像中往往包括图片图表等元素,且图像多为彩色。针对多元化的文本图像,传统的像素点统计以及滤波等降噪方法往往不能奏效。
发明内容
有鉴于此,本公开提供一种基于前景蒙版的文档图像降噪方法,针对多元化的文本图像,提供降噪方案。本发明针对文档图像色彩空间进行分析,利用采样像素点及聚类得到背景像素值,针对HSV空间中的像素点距离以及自适应二值化,结合产生图像前背景蒙版,利用蒙版对图像进行处理达到降噪去噪的目的。
本发明提供了一种基于前景蒙版的文档图像降噪方法,包括如下步骤:
步骤1:确定图像背景颜色像素值;
步骤2:根据HSV色彩空间距离及自适应二值化计算前景蒙版;
步骤3:计算代表性色彩,设定背景像素,输出降噪文档图像。
根据本发明实施例的一种具体实现方式,所述步骤1确定图像背景颜色像素值,包括如下步骤:
步骤1.1:对图像像素随机采样;
步骤1.2:降低色位深度;
步骤1.3:对每类频数进行统计得到最大频数后转回原有色深度到背景RGB 数值。
根据本发明实施例的一种具体实现方式,所述步骤2根据HSV色彩空间距离及自适应二值化计算前景蒙版,包括如下步骤:
步骤2.1:将图像由RGB色彩空间转化为HSV;
步骤2.2:计算色彩相似度,设置饱和度S及明亮程度V距离阈值,对HSV 空间像素与背景值进行比对得到第一前景蒙版;
步骤2.3:对图片做自适应局部二值化得到第二前景蒙版;
步骤2.4:对第一前景蒙版与第二前景蒙版做and操作得到最终前景蒙版;
根据本发明实施例的一种具体实现方式,所述步骤3计算代表性色彩,设定背景像素,输出降噪文档图像,包括如下步骤:
步骤3.1:设置需要的色彩数量;
步骤3.2:利用kmeans聚类方法,得到色彩数量的色彩聚类,并利用每个聚类的中心作为前景值得到像素板;
步骤3.3:利用最终前景蒙版及像素板,前景像素为True做保留并利用最邻近算法得到在像素板中对应的色彩值作为新的RGB像素值,对背景Fa l se将像素设置为之前计算得到的背景像素。
根据本发明实施例的一种具体实现方式,所述步骤1.1对图像像素随机采样,采样比例具体数值可根据时间情况进行选取设置,采样比例设置在5%-15%之 间为最佳,既具有代表性又可以减少计算量。
根据本发明实施例的一种具体实现方式,所述步骤1.2,降低色位深度,将色位深度由8位转为4位,通过减少颜色数,达到每类频数增加的目的。
根据本发明实施例的一种具体实现方式,所述步骤1.3,采用了随机抽样统计最大值方法,随机抽样统计每类颜色频数,得到最大频数,对应颜色即为背景颜色,取其RGB数值。
根据本发明实施例的一种具体实现方式,所述步骤2.2,计算色彩相似度仅取饱和度S及明亮程度V的值,饱和度S及明亮程度V的阈值可选择性设置,设为0.05至0.15之间为最佳。
根据本发明实施例的一种具体实现方式,所述步骤2.3,针对照片拍摄出现的亮度不均匀情况,提出了自适应局部二值化方法,提取第二前景蒙版。
根据本发明实施例的一种具体实现方式,所述步骤3.1,设置需要的色彩数量,根据需要,基于文本图像的质量要求及人眼对色彩的识别度,设置色彩数量50~100。
本公开提供一种基于前景蒙版的文档图像降噪方法,针对多元化的文本图像,有效过滤去除包括背景上的无用干扰噪声而对前景主体不会造成很大损失, 保留了彩色颜色,对提高归档文档图像质量有较好的帮助。
附图说明
图1本发明的一种基于前景蒙版的文档图像降噪方法示意图;
图2HSV色彩空间示意图;
图3RGB到HSV空间转换计算方法示意图;
图4第一前景蒙版与第二前景蒙版做and操作结果格式示意图。
具体实施方式
下面结合附图对本公开实施例进行详细描述。
以下通过特定的具体实例说明本公开的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本公开的其他优点与功效。显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。本公开还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本公开的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。
本公开提供一种基于前景蒙版的文档图像降噪方法,针对多元化的文本图像,提供降噪方案。本发明针对文档图像色彩空间进行分析,利用采样像素点及聚类得到背景像素值,针对HSV空间中的像素点距离以及自适应二值化,结合产生图像前背景蒙版,利用蒙版对图像进行处理达到降噪去噪的目的。实施步骤如图1。
步骤1:确定图像背景颜色像素值。
具体的:
a)对输入的文档图像的像素点进行随机采样,得到一定采样数量的像素点RGB值,以随机采样结果作为图像背景像素的统计依据。随机采用的采样比例可设置在5%~15%之间,既具有代表性又可以减少计算量。例如:2081×5231 图像的像素点个数为5267011,采样5%约为26万,足够具有代表性。
b)将上述随机采样结果的像素色位深度b it depth由8位转为4位,通过减少颜色数,达到每类频数增加的目的,便于后续统计应用。
c)针对上述像素点随机抽样的结果,统计每种颜色的出现频率,对每类频数进行统计得到最大频数,最大频数对应的颜色,即为图像背景颜色,再将对应的背景颜色由4为色深转回8位色深,得到背景颜色像素的RGB数值。
步骤2:根据HSV色彩空间距离及自适应二值化计算前景蒙版。
具体的:
a)将图像由RGB色彩空间转化为HSV,HSV色彩空间表示如图2。其中H 为hue表示色相,是色彩的基本属性,S为saturat i on表示饱和度,其值在0-1 之间。V为va l ue表示明亮程度,其值在0-1之间。本方法在计算色彩相似度时仅取S及V值。RGB到HSV空间转换计算方法如图3。
b)设置S、V距离阈值,本方法根据需求将阈值设为0.05至0.15之间,对HSV空间像素与步骤1得到的背景值进行比对得到第一前景蒙版。
c)对图片做自适应局部二值化得到第二前景蒙版,此蒙版可以针对照片拍摄出现亮度不均匀情况。
d)对第一前景蒙版与第二前景蒙版做and操作得到最终前景蒙版,格式如图4。
步骤3:计算代表性色彩。
具体的:
a)设置需要的色彩数量,鉴于文本图像颜色相对比较单一以及人眼对色彩的识别度,本方法设置色彩数量为50~100。
b)针对最终前景蒙版采用的像素点,利用kmeans聚类方法得到色彩数量的色彩聚类,并利用每个聚类的中心作为前景值得到像素板。
kmeans聚类方法是一种迭代求解的聚类分析算法,其步骤是随机选取K个对象作为初始的聚类中心,然后计算每个对象与各个种子聚类中心之间的距离,把每个对象分配给距离它最近的聚类中心。聚类中心以及分配给它们的对象就代表一个聚类。每分配一个样本,聚类的聚类中心会根据聚类中现有的对象被重新计算。
c)利用最终前景蒙版及像素板,前景蒙版(第一前景蒙版与第二前景蒙版做and操作结果格式)中:情况1,结果为True,做保留并利用最邻近算法得到在像素板中对应的色彩值作为新的RGB像素值;情况2,结果为Fa l se,将像素设置为之前计算得到的背景像素。即得到降噪后的文档图像。
以上仅为说明本发明的实施方式,并不用于限制本发明,对于本领域的技术人员来说,凡在本发明的精神和原则之内,不经过创造性劳动所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (7)

1.一种基于前景蒙版的文档图像降噪方法,其特征在于,包括如下步骤:
步骤1:确定图像背景颜色像素值;
步骤2:根据HSV色彩空间距离及自适应二值化计算前景蒙版;
步骤3:计算代表性色彩,设定背景像素,输出降噪文档图像;
其中,所述的步骤1包括如下步骤:
步骤1.1:对图像像素随机采样;
步骤1.2:降低色位深度;
步骤1.3:对每类频数进行统计得到最大频数后转回原有色深得到背景RGB数值;
其中,所述的步骤2包括如下步骤:
步骤2.1:将图像由RGB色彩空间转化为HSV;
步骤2.2:计算色彩相似度,设置饱和度S和明亮程度V的距离阈值,对HSV空间像素与背景值进行比对得到第一前景蒙版;
步骤2.3:对图片做自适应局部二值化得到第二前景蒙版;
步骤2.4:对第一前景蒙版与第二前景蒙版做and操作得到最终前景蒙版;
其中,所述的步骤3包括如下步骤:
步骤3.1:设置需要的色彩数量;
步骤3.2:利用kmeans聚类方法得到色彩数量的色彩聚类,并利用每个聚类的中心作为前景值得到像素板;
步骤3.3:利用最终前景蒙版及像素板,前景像素为True的做保留并利用最邻近算法得到在像素板中对应的色彩值作为新的RGB像素值;前景像素为False的,将像素设置为之前计算得到的背景像素。
2.根据权利要求1所述的一种基于前景蒙版的文档图像降噪方法,其特征在于,所述的步骤1.1中对图像像素随机采样,采样比例具体数值根据时间情况进行选取设置,采样比例设置在5%-15%之 间。
3.根据权利要求1所述的一种基于前景蒙版的文档图像降噪方法,其特征在于,所述的步骤1.2中降低色位深度,将色位深度由8位转为4位,通过减少颜色数,达到每类频数增加的目的。
4.根据权利要求1所述的一种基于前景蒙版的文档图像降噪方法,其特征在于,所述的步骤1.3中,采用了随机抽样统计最大值方法,随机抽样统计每类颜色频数,得到最大频度数,对应颜色即为背景颜色,取其RGB数值。
5.根据权利要求1所述的一种基于前景蒙版的文档图像降噪方法,其特征在于,所述的步骤2.2中,计算色彩相似度仅取饱和度S及明亮程度V的值,饱和度S及明亮程度V的阈值选择性设置,设为0.05至0.15之间。
6.根据权利要求1所述的一种基于前景蒙版的文档图像降噪方法,其特征在于,所述的步骤2.3中,在照片拍摄出现的亮度不均匀情况下,对图片做自适应局部二值化得到第二前景蒙版。
7.根据权利要求1所述的一种基于前景蒙版的文档图像降噪方法,其特征在于,所述的步骤3.1中,设置色彩数量为50~100之间。
CN201911049926.9A 2019-10-31 2019-10-31 一种基于前景蒙版的文档图像降噪方法 Active CN110807747B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911049926.9A CN110807747B (zh) 2019-10-31 2019-10-31 一种基于前景蒙版的文档图像降噪方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911049926.9A CN110807747B (zh) 2019-10-31 2019-10-31 一种基于前景蒙版的文档图像降噪方法

Publications (2)

Publication Number Publication Date
CN110807747A CN110807747A (zh) 2020-02-18
CN110807747B true CN110807747B (zh) 2021-03-30

Family

ID=69489675

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911049926.9A Active CN110807747B (zh) 2019-10-31 2019-10-31 一种基于前景蒙版的文档图像降噪方法

Country Status (1)

Country Link
CN (1) CN110807747B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113781436B (zh) * 2021-09-10 2024-05-17 丁艳 一种基于摄像机和角度测量的高压开关状态监测方法
CN114862897B (zh) * 2022-04-24 2024-08-09 北京百度网讯科技有限公司 一种图像背景处理方法、装置及电子设备

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120075331A1 (en) * 2010-09-24 2012-03-29 Mallick Satya P System and method for changing hair color in digital images
CN105741289A (zh) * 2016-01-29 2016-07-06 大连理工大学 一种面向虚拟人超大规模切片图像的序列化自动分割方法
US9430715B1 (en) * 2015-05-01 2016-08-30 Adobe Systems Incorporated Identifying and modifying cast shadows in an image
CN106530309A (zh) * 2016-10-24 2017-03-22 成都品果科技有限公司 一种基于移动平台的视频抠图方法及系统
US20170294000A1 (en) * 2016-04-08 2017-10-12 Adobe Systems Incorporated Sky editing based on image composition
CN109389568A (zh) * 2018-10-25 2019-02-26 中国科学院上海光学精密机械研究所 自动测量皮肤光学相干层析图像中表皮厚度的方法
CN110033462A (zh) * 2019-04-08 2019-07-19 中国计量大学 基于多层次距离变换的粘连目标分割算法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120075331A1 (en) * 2010-09-24 2012-03-29 Mallick Satya P System and method for changing hair color in digital images
US9430715B1 (en) * 2015-05-01 2016-08-30 Adobe Systems Incorporated Identifying and modifying cast shadows in an image
CN105741289A (zh) * 2016-01-29 2016-07-06 大连理工大学 一种面向虚拟人超大规模切片图像的序列化自动分割方法
US20170294000A1 (en) * 2016-04-08 2017-10-12 Adobe Systems Incorporated Sky editing based on image composition
CN106530309A (zh) * 2016-10-24 2017-03-22 成都品果科技有限公司 一种基于移动平台的视频抠图方法及系统
CN109389568A (zh) * 2018-10-25 2019-02-26 中国科学院上海光学精密机械研究所 自动测量皮肤光学相干层析图像中表皮厚度的方法
CN110033462A (zh) * 2019-04-08 2019-07-19 中国计量大学 基于多层次距离变换的粘连目标分割算法

Also Published As

Publication number Publication date
CN110807747A (zh) 2020-02-18

Similar Documents

Publication Publication Date Title
CN109886974B (zh) 一种印章去除方法
CN110008954B (zh) 一种基于多阈值融合的复杂背景文本图像提取方法及系统
JP4423298B2 (ja) デジタル画像におけるテキスト状エッジの強調
Bataineh et al. An adaptive local binarization method for document images based on a novel thresholding method and dynamic windows
US7634150B2 (en) Removing ringing and blocking artifacts from JPEG compressed document images
CN104463195B (zh) 基于模板匹配的印刷体数字识别方法
CN110309806B (zh) 一种基于视频图像处理的手势识别系统及其方法
JP2003228712A (ja) イメージからテキスト状のピクセルを識別する方法
CN101599125A (zh) 复杂背景下图像处理的二值化方法
JP2008148298A (ja) 画像における異なった内容の領域を識別する方法、画像における異なった内容の領域を識別する装置、および画像における異なった内容の領域を識別するコンピュータ・プログラムを具現するコンピュータ読み取り可能な媒体
CN110807747B (zh) 一种基于前景蒙版的文档图像降噪方法
CN115760826B (zh) 一种基于图像处理的轴承磨损状况诊断方法
CN108711160B (zh) 一种基于hsi增强性模型的目标分割方法
CN112508024A (zh) 一种变压器电气铭牌钢印字体智能识别方法
CN101567049B (zh) 一种半色调文档图像的噪声处理方法
CN108205678B (zh) 一种含有亮斑干扰的铭牌文字识别处理方法
CN111445402B (zh) 一种图像去噪方法及装置
CN111414877B (zh) 去除颜色边框的表格裁切方法、图像处理设备和存储介质
CN110766614B (zh) 一种无线扫描笔的图像预处理方法和系统
JP2002042055A (ja) カラー文書画像からの文字抽出方法
CN106446904A (zh) 基于全局二值化的图像识别方法
Roe et al. Binarization of color historical document images using local image equalization and XDoG
CN111491069B (zh) 一种文档图像的色彩模式自动设定方法
CN116503264A (zh) 一种文档图像的降噪方法及装置
Priya et al. A wavelet based method for text segmentation in color images

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20240318

Address after: 116000 Chuntianyuan C-4-501, Ganjingzi District, Dalian City, Liaoning Province

Patentee after: Huayu (Dalian) Information Service Co.,Ltd.

Country or region after: China

Address before: 100084 C2301, c2302, 21 / F, building 8, yard 1, Zhongguancun East Road, Haidian District, Beijing

Patentee before: BEIJING THUNISOFT INFORMATION TECHNOLOGY Co.,Ltd.

Country or region before: China