CN116503264A - 一种文档图像的降噪方法及装置 - Google Patents
一种文档图像的降噪方法及装置 Download PDFInfo
- Publication number
- CN116503264A CN116503264A CN202310065654.1A CN202310065654A CN116503264A CN 116503264 A CN116503264 A CN 116503264A CN 202310065654 A CN202310065654 A CN 202310065654A CN 116503264 A CN116503264 A CN 116503264A
- Authority
- CN
- China
- Prior art keywords
- color
- foreground
- document image
- detected
- target detection
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 67
- 230000009467 reduction Effects 0.000 title claims abstract description 58
- 238000001514 detection method Methods 0.000 claims abstract description 106
- 238000005070 sampling Methods 0.000 claims abstract description 51
- 239000003086 colorant Substances 0.000 claims abstract description 29
- 230000003044 adaptive effect Effects 0.000 claims abstract description 10
- 238000000605 extraction Methods 0.000 claims description 7
- 238000001914 filtration Methods 0.000 claims description 7
- 238000013139 quantization Methods 0.000 claims description 5
- 230000002708 enhancing effect Effects 0.000 claims description 3
- 230000000694 effects Effects 0.000 abstract description 11
- 238000004364 calculation method Methods 0.000 abstract description 3
- 238000010586 diagram Methods 0.000 description 14
- 230000008569 process Effects 0.000 description 8
- 235000002566 Capsicum Nutrition 0.000 description 3
- 239000006002 Pepper Substances 0.000 description 3
- 241000722363 Piper Species 0.000 description 3
- 235000016761 Piper aduncum Nutrition 0.000 description 3
- 235000017804 Piper guineense Nutrition 0.000 description 3
- 235000008184 Piper nigrum Nutrition 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 150000003839 salts Chemical class 0.000 description 3
- 238000004590 computer program Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003416 augmentation Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000002146 bilateral effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 230000008595 infiltration Effects 0.000 description 1
- 238000001764 infiltration Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000004080 punching Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 230000002087 whitening effect Effects 0.000 description 1
Classifications
-
- G06T5/70—
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
- G06T11/001—Texturing; Colouring; Generation of texture or colour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
- G06T11/40—Filling a planar surface by adding surface attributes, e.g. colour or texture
-
- G06T5/77—
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/194—Segmentation; Edge detection involving foreground-background segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/90—Determination of colour characteristics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30176—Document
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Abstract
本申请公开了文档图像的降噪方法及装置,该降噪方法包括:确定待检测文档图像的背景色的像素值与像素板;基于HSV色彩空间距离及自适应二值化,确定所述待检测文档图像的前景蒙版;基于所述待检测文档图像的目标检测结果,对所述前景蒙版进行调整,获得调整后的前景蒙版;基于所述调整后的前景蒙版及所述像素板,填充所述调整后的前景蒙版的背景色及前景色,获得降噪后的图像,其中,所述背景色及像素板是对所述待检测文档图像进行交叉采样获得的;基于所述降噪后的图像与所述待检测文档图像中的背景色的差异,进行图像增强,获得降噪结果,能够提高文档降噪计算速度,提升降噪效果。
Description
技术领域
本申请涉及图像数据处理技术领域,尤其涉及一种文档图像的降噪方法及装置。
背景技术
纸质卷宗存在着不易流转、共享,且存放过程中容易污损,不方便使用卷宗内的内容,卷宗利用率低等问题。通过数字影像技术将纸质卷宗电子化,可以更好的实现卷宗的在线即时共享流转和永久化保存。
在卷宗电子化的过程中,容易受到图像采集设备(高拍仪、扫描仪、手机)和采集人员操作等诸多因素的影响,会在采集过程中,会在图片上留下严重的椒盐噪点、摩尔纹、泛白、漏光渐变、背光透字、黑边等噪声。卷宗文档图像中的噪声会从不同程度影响卷宗的正常阅读以及文档中文字的检测(OCR),以及后续的电子卷宗的深度应用。
因此,针对文档图像的降噪十分必要。
发明内容
本申请实施例提供一种新的文档图像的降噪方法,用以卷宗电子化过程中降噪的技术问题。
具体的,一种文档图像的降噪方法,包括以下步骤:
确定待检测文档图像的背景色的像素值与像素板,其中,所述背景色及像素板是对所述待检测文档图像进行交叉采样获得的;
基于HSV色彩空间距离及自适应二值化,确定所述待检测文档图像的前景蒙版;
基于所述待检测文档图像的目标检测结果,对所述前景蒙版进行调整,获得调整后的前景蒙版;
基于所述调整后的前景蒙版及所述像素板,填充所述调整后的前景蒙版的背景色及前景色,获得降噪后的图像;
基于所述降噪后的图像与所述待检测文档图像中的背景色的差异,进行图像增强,获得降噪结果。
进一步地,所述确定待检测文档图像的背景色的像素值,具体包括:
根据预设的采样点数,从所述待检测文档图像中选取对称的像素点,作为交叉采样像素点;
按照预设的色彩数量,对所述交叉采样像素点进行量化处理,获得交叉采样结果;
将所述交叉采样结果中最高频率的颜色作为所述待检测文档图像的背景色;
基于所述待检测文档图像的背景色,获得所述背景色的像素值。
进一步地,所述根据HSV色彩空间距离及自适应二值化,确定所述待检测文档图像的前景蒙版,具体包括:
将所述待检测文档图像由RGB色彩空间图像转化为HSV颜色空间图像;
基于所述HSV颜色空间图像的饱和度及明亮度的阈值对比,生成第一蒙版;
将所述RGB色彩空间图像进行自适应局部二值化,生成第二蒙版;
将所述第一蒙版与所述第二蒙版进行合并,获得前景蒙版。
进一步地,所述待检测文档图像的目标检测结果包括:指纹、红章、照片、钉孔、骑缝章、人像中的至少一种,所述基于所述待检测文档图像的目标检测结果,对所述前景蒙版进行调整,获得调整后的前景蒙版,具体包括:
若所述目标检测结果中包括人像和/或照片,则对所述前景蒙版中的人像和/或照片的相应要素保留;
若所述目标检测结果中包括钉痕和/或钉孔,则对所述前景蒙版中的钉痕和/或钉孔的相应要素进行修复;
若所述目标检测结果中包括红章,则将所述目标检测结果中红章的前景和背景进行分离,将分离后的红章的前景合并到所述前景蒙版中;
若所述目标检测结果中包括指纹,则将所述目标检测结果中的指纹的前景和背景进行分离,将分离后的指纹的前景合并到所述前景蒙版中。
在本说明书实施例中,所述若所述目标检测结果中包括钉痕和/或钉孔,则对所述前景蒙版中的钉痕和/或钉孔的相应要素进行修复,具体包括:
若所述目标检测结果中包括钉痕和/或钉孔,则采用inpaint方法,对所述前景蒙版中的钉痕和/或钉孔的相应要素进行修复。
进一步地,所述若所述目标检测结果中包括红章,则将所述目标检测结果中红章的前景和背景进行分离,将分离后的红章的前景合并到所述前景蒙版中,具体包括:
若所述目标检测结果中包括红章,则采用颜色过滤的方法,对所述目标检测结果中红章的前景和背景进行分离,将分离后的红章的前景合并到所述前景蒙版中。
进一步地,所述若所述目标检测结果中包括指纹,则将所述目标检测结果中的指纹的前景和背景进行分离,将分离后的指纹的前景合并到所述前景蒙版中,具体包括:
若所述目标检测结果中包括指纹,则采用视频背景提取方法,对所述目标检测结果中的指纹的前景和背景进行分离,将分离后的指纹的前景合并到所述前景蒙版中。
进一步地,所述基于所述调整后的前景蒙版及所述像素板,填充所述调整后的前景蒙版的背景色及前景色,获得降噪后的图像,具体包括:
以所述背景色作为所述调整后的前景蒙版的背景色;
基于所述像素板与所述待检测文档图像中的非背景色之间的欧式距离,以欧式距离最短的像素板中对应的颜色为赋予的颜色,对所述调整后的前景蒙版的前景色进行填充,获得降噪后的图像。
进一步地,所述像素板的获得,具体包括:
以所述背景色作为所述调整后的前景蒙版的背景色;
基于所述像素板与所述待检测文档图像中的非背景色之间的欧式距离,以欧式距离最短的像素板中对应的颜色为赋予的颜色,对所述调整后的前景蒙版的前景色进行填充,获得降噪后的图像。
本申请实施例还提供一种文档图像的降噪装置。
具体的,一种文档图像的降噪装置,包括:
背景色确定模块,确定待检测文档图像的背景色的像素值与像素板,其中,所述背景色及像素板是对所述待检测文档图像进行交叉采样获得的;
前景确定模块,基于HSV色彩空间距离及自适应二值化,确定所述待检测文档图像的前景蒙版;
调整模块,基于所述待检测文档图像的目标检测结果,对所述前景蒙版进行调整,获得调整后的前景蒙版;
填充模块,基于所述调整后的前景蒙版及所述像素板,填充所述调整后的前景蒙版的背景色及前景色,获得降噪后的图像;
增强模块,基于所述降噪后的图像与所述待检测文档图像中的背景色的差异,进行图像增强,获得降噪结果。
进一步地,所述确定待检测文档图像的背景色的像素值,具体包括:
根据预设的采样点数,从所述待检测文档图像中选取对称的像素点,作为交叉采样像素点;
按照预设的色彩数量,对所述交叉采样像素点进行量化处理,获得交叉采样结果;
将所述交叉采样结果中最高频率的颜色作为所述待检测文档图像的背景色;
基于所述待检测文档图像的背景色,获得所述背景色的像素值。
进一步地,所述根据HSV色彩空间距离及自适应二值化,确定所述待检测文档图像的前景蒙版,具体包括:
将所述待检测文档图像由RGB色彩空间图像转化为HSV颜色空间图像;
基于所述HSV颜色空间图像的饱和度及明亮度的阈值对比,生成第一蒙版;
将所述RGB色彩空间图像进行自适应局部二值化,生成第二蒙版;
将所述第一蒙版与所述第二蒙版进行合并,获得前景蒙版。
进一步地,所述待检测文档图像的目标检测结果包括:指纹、红章、照片、钉孔、骑缝章、人像中的至少一种,所述基于所述待检测文档图像的目标检测结果,对所述前景蒙版进行调整,获得调整后的前景蒙版,具体包括:
若所述目标检测结果中包括人像和/或照片,则对所述前景蒙版中的人像和/或照片的相应要素保留;
若所述目标检测结果中包括钉痕和/或钉孔,则对所述前景蒙版中的钉痕和/或钉孔的相应要素进行修复;
若所述目标检测结果中包括红章,则将所述目标检测结果中红章的前景和背景进行分离,将分离后的红章的前景合并到所述前景蒙版中;
若所述目标检测结果中包括指纹,则将所述目标检测结果中的指纹的前景和背景进行分离,将分离后的指纹的前景合并到所述前景蒙版中。
在本说明书实施例中,所述若所述目标检测结果中包括钉痕和/或钉孔,则对所述前景蒙版中的钉痕和/或钉孔的相应要素进行修复,具体包括:
若所述目标检测结果中包括钉痕和/或钉孔,则采用inpaint方法,对所述前景蒙版中的钉痕和/或钉孔的相应要素进行修复。
进一步地,所述若所述目标检测结果中包括红章,则将所述目标检测结果中红章的前景和背景进行分离,将分离后的红章的前景合并到所述前景蒙版中,具体包括:
若所述目标检测结果中包括红章,则采用颜色过滤的方法,对所述目标检测结果中红章的前景和背景进行分离,将分离后的红章的前景合并到所述前景蒙版中。
进一步地,所述若所述目标检测结果中包括指纹,则将所述目标检测结果中的指纹的前景和背景进行分离,将分离后的指纹的前景合并到所述前景蒙版中,具体包括:
若所述目标检测结果中包括指纹,则采用视频背景提取方法,对所述目标检测结果中的指纹的前景和背景进行分离,将分离后的指纹的前景合并到所述前景蒙版中。
进一步地,所述基于所述调整后的前景蒙版及所述像素板,填充所述调整后的前景蒙版的背景色及前景色,获得降噪后的图像,具体包括:
以所述背景色作为所述调整后的前景蒙版的背景色;
基于所述像素板与所述待检测文档图像中的非背景色之间的欧式距离,以欧式距离最短的像素板中对应的颜色为赋予的颜色,对所述调整后的前景蒙版的前景色进行填充,获得降噪后的图像。
进一步地,所述像素板的获得,具体包括:
将所述交叉采样结果中的非背景颜色加入颜色队列,将所述颜色队列中的颜色按照预设的颜色规则进行排序,将排序后的颜色队列按照预设时间间隔进行提取,获得所述像素板。
本申请实施例提供的技术方案,至少具有如下有益效果:确定待检测文档图像的背景色的像素值与像素板,其中,所述背景色及像素板是对所述待检测文档图像进行交叉采样获得的;基于HSV色彩空间距离及自适应二值化,确定所述待检测文档图像的前景蒙版;基于所述待检测文档图像的目标检测结果,对所述前景蒙版进行调整,获得调整后的前景蒙版;基于所述调整后的前景蒙版及所述像素板,填充所述调整后的前景蒙版的背景色及前景色,获得降噪后的图像;基于所述降噪后的图像与所述待检测文档图像中的背景色的差异,进行图像增强,获得降噪结果,能够提高文档降噪计算速度,提升降噪效果。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本说明书实施例提供的一种文档图像的降噪方法的示意图;
图2为本说明书实施例提供的一种交叉采样方法的示意图;
图3为本说明书实施例提供的一个获得像素板的示意图;
图4为本说明书实施例提供的一种文档图像的降噪方法的框架图;
图5为本说明书实施例提供的一种文档图像的降噪方法的效果示意图;
图6为本说明书实施例提供的一种文档图像的降噪装置的示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
现有技术中,针对黑白文档的降噪,采用的是将文档影像划分成N×N的方块,N取值的大小取决于影像的每英寸像素数;考察每个方块A以及上下左右四个方块;如果判定所考察的方块A有杂点,就把该方块A内所有的像素改成白色,从而去除文档影像的杂点。该方法只能针对汉字黑白文档图像且鲁棒性差,针对手写体以及含有图片的表格等图像不能生效。
针对彩色文档的降噪,采用的是对彩色文档图像进行灰度预处理后,采用双边滤波对图像进行降噪处理、图像背景估计、背景减除与图像增强、构造能量函数、构造网络图、最后采用基于增广路径的图割算法实现能量函数的最小化。尽管该方法能够显著提高复杂背景下的文档图像二值化效果,能够适用于多种颜色书写、笔画渐变、墨迹浸润、页面有污渍或纹理、光照不均、对比度低等复杂背景的文档图像二值化处理。但是该方法仅能用于低质量文档图像,且在对文字笔画宽度进行估计时,如遇到多种宽度则可能出现问题,且没有对彩色图像色彩进行保留。
另外一种对文档降噪的方法,通过随机采样统计获取到背景色,对比HSV空间对比HSV空间像素值得到第一前景蒙版,针对图片亮度不均匀的情况,自适应局部二值化得到第二前景蒙版,第一前景蒙版与第二前景蒙版做and操作得到最终前景蒙版;然后,利用kmeans聚类方法得到像素板,获取代表性色彩,前景填充背景色,蒙版内更具相似性填充代表性颜色。但是该方法存在耗时长,容易导致彩色图片失真,指纹、印章、照片等关键证据变色甚至丢失,且容易引起椒盐噪点,无法去除影响文档质量的黑边、打孔、钉痕,降噪后的图片偏淡或偏深。
可见,现有的针对文档降噪的方法,均无法实现较好的降噪效果。
图1为本说明书实施例提供的一种文档图像的降噪方法的示意图。如图1所示,该降噪方法包括如下步骤:
步骤S101:确定待检测文档图像的背景色的像素值与像素板,其中,所述背景色及像素板是对所述待检测文档图像进行交叉采样获得的。
一般而言,待检测的文档图像为JPG格式的文档图像。若待检测的文档图像为其他格式的文档图像,需要将其他格式的文档图像转换成JPG格式的文档图像。
所述确定待检测文档图像的背景色的像素值,具体包括:
根据预设的采样点数,从所述待检测文档图像中选取对称的像素点,作为交叉采样像素点;
按照预设的色彩数量,对所述交叉采样像素点进行量化处理,获得交叉采样结果;
将所述交叉采样结果中最高频率的颜色作为所述待检测文档图像的背景色;
基于所述待检测文档图像的背景色,获得所述背景色的像素值。
需要特别说明的是,交叉采样结果中,除最高频率的颜色之外的其他颜色,即非背景颜色,构成像素板。
与随机采样方法相比,交叉采样能够减少像素采样的数量。预设的采样点一般选取待检测文档中的像素点的1%即可。例如:2081×5231图像的像素点个数为5267011,按照1%采样,即采样5万左右即可,采样量明显降低。
在进行交叉采样时,只需要实现获取对称的像素点即可。图2为本说明书实施例提供的一种交叉采样方法的示意图。如图2所示,可以从待检测文档的四个角,沿着对角线进行采样。当然也可以选择其他对称的采样方法,选取对称像素点进行交叉采样的具体方法,并不构成对本申请的限定。
对于RGB色彩空间而言,RGB的所谓“多少”就是指亮度,并使用整数来表示。通常情况下,RGB各有256级亮度,用数字表示为从0、1、2...直到255,共256级,共包括256个颜色。在确定背景色过程中,为了减少运算量,可以根据业务需求,减少颜色数量,因此可以人为预设色彩数量。在本说明书的一个实施例中,预设的色彩数量可以为100。预设的色彩数量对应的颜色,可以通过伪聚类的方法获得,在此不再赘述。
步骤S103:基于HSV色彩空间距离及自适应二值化,确定所述待检测文档图像的前景蒙版。
在本说明书实施例中,所述根据HSV色彩空间距离及自适应二值化,确定所述待检测文档图像的前景蒙版,具体包括:
将所述待检测文档图像由RGB色彩空间图像转化为HSV颜色空间图像;
基于所述HSV颜色空间图像的饱和度及明亮度的阈值对比,生成第一蒙版;
将所述RGB色彩空间图像进行自适应局部二值化,生成第二蒙版;
将所述第一蒙版与所述第二蒙版进行合并,获得前景蒙版。
HSV(Hue,Saturation,Value)是根据颜色的直观特性确定的颜色空间,其中,H(Hue)代表色调,是色彩的基本属性;S(Saturation)代表饱和度,为介于0~1之间的数值;V(Value)代表明度,其值在0~1之间。本说明书实施例,在计算色彩相似度时,仅考虑饱和度和明亮度,饱和度与明亮度的阈值可选择性设置,一般设置为0.05至0.15为最佳。将HSV颜色空间图像与背景值进行比对获得第一蒙版。
将所述第一蒙版与所述第二蒙版进行合并,获得前景蒙版,具体的是将所述第一蒙版与所述第二蒙版进行and操作,获得前景蒙版。
步骤S105:基于所述待检测文档图像的目标检测结果,对所述前景蒙版进行调整,获得调整后的前景蒙版。
由于待检测图像中,可能存在指纹、红章、照片、钉孔、骑缝章、人像等可能影响文档噪声的目标,需要进行目标检测,获得目标检测结果。
目前,目标检测方法可以采用多种方法,在本说明书的一个实施例中,采用的是基于yolov5模型训练获得的目标检测模型。
在本说明书实施例中,所述待检测文档图像的目标检测结果包括:指纹、红章、照片、钉孔、骑缝章、人像中的至少一种,所述基于所述待检测文档图像的目标检测结果,对所述前景蒙版进行调整,获得调整后的前景蒙版,具体包括:
若所述目标检测结果中包括人像和/或照片,则对所述前景蒙版中的人像和/或照片的相应要素保留;
若所述目标检测结果中包括钉痕和/或钉孔,则对所述前景蒙版中的钉痕和/或钉孔的相应要素进行修复;
若所述目标检测结果中包括红章,则将所述目标检测结果中红章的前景和背景进行分离,将分离后的红章的前景合并到所述前景蒙版中;
若所述目标检测结果中包括指纹,则将所述目标检测结果中的指纹的前景和背景进行分离,将分离后的指纹的前景合并到所述前景蒙版中。
在本说明书实施例中,所述若所述目标检测结果中包括钉痕和/或钉孔,则对所述前景蒙版中的钉痕和/或钉孔的相应要素进行修复,具体包括:
若所述目标检测结果中包括钉痕和/或钉孔,则采用inpaint方法,对所述前景蒙版中的钉痕和/或钉孔的相应要素进行修复。
在本说明书实施例中,所述若所述目标检测结果中包括红章,则将所述目标检测结果中红章的前景和背景进行分离,将分离后的红章的前景合并到所述前景蒙版中,具体包括:
若所述目标检测结果中包括红章,则采用颜色过滤的方法,对所述目标检测结果中红章的前景和背景进行分离,将分离后的红章的前景合并到所述前景蒙版中。
在本说明书实施例中,所述若所述目标检测结果中包括指纹,则将所述目标检测结果中的指纹的前景和背景进行分离,将分离后的指纹的前景合并到所述前景蒙版中,具体包括:
若所述目标检测结果中包括指纹,则采用视频背景提取方法,对所述目标检测结果中的指纹的前景和背景进行分离,将分离后的指纹的前景合并到所述前景蒙版中。
由于指纹的边缘可能存在模糊的情况,为了实现指纹提取的完整性和清晰性,视频背景提取方法可以采用:GMM(Gaussian Mixture Model,高斯混合模型)方法。具体的,根据目标检测结果中指纹的坐标位置,确定指纹的尺寸(即指纹的宽和高);设定步长为k的窗口,在目标检测结果的图片中,滑动指纹,以模拟视频的帧;基于模拟视频的帧,利用GMM方法进行迭代,分离出指纹的前景和背景。
指纹的前景和背景的分离,也可以采用KNN(K-NearestNeighbor,邻近算法)方法,或者颜色过滤的方法。
步骤S107:基于所述调整后的前景蒙版及所述像素板,填充所述调整后的前景蒙版的背景色及前景色,获得降噪后的图像。
在本说明书实施例中,所述基于所述调整后的前景蒙版及像素板,填充所述调整后的前景蒙版的背景色及前景色,获得降噪后的图像,具体包括:
以所述背景色作为所述调整后的前景蒙版的背景色;
基于所述像素板与所述待检测文档图像中的非背景色之间的欧式距离,以欧式距离最短的像素板中对应的颜色为赋予的颜色,对所述调整后的前景蒙版的前景色进行填充,获得降噪后的图像。
对于两个颜色而言,两个颜色之间的差距,距离越大,两个颜色相差越大,反之,两个颜色越相近。利用欧式距离计算两个颜色距离后,欧式距离最短时,所对应的两个颜色的差距越小。此时,将欧式距离最短时,将像素板中对应的颜色作为赋予的颜色,对调整后的前景蒙版的前景色进行填充。
如前所述,交叉采样结果中,除最高频率的颜色之外的其他颜色,即非背景颜色,构成像素板。在本说明书实施例中,所述像素板的获得,具体包括:
将所述交叉采样结果中的非背景颜色加入颜色队列,将所述颜色队列中的颜色按照预设的颜色规则进行排序,将排序后的颜色队列按照预设时间间隔进行提取,获得所述像素板。
预设的颜色规则是基于像素的RGB色,利用不同像素点间的蓝色、绿色和红色的差异获得的。图3为本说明书实施例提供的一个获得像素板的示意图,如图3所示,以两个像素点为例,像素点1的颜色为颜色1(B,G,R),像素点2的颜色为颜色2(B,G,R)。首先进行颜色1(B)与颜色2(B)的对比,若颜色1(B)≠颜色2(B),则进一步判断颜色1(B)是否大于颜色2(B),若颜色1(B)>颜色2(B),则将颜色1(B,G,R)作为像素板的颜色,若颜色1(B)<颜色2(B),则将颜色2(B,G,R)作为像素板的颜色;若颜色1(B)=颜色2(B),则进一步进行颜色1(G)与颜色2(G)的对比,若颜色1(G)≠颜色2(G),则进一步判断颜色1(G)是否大于颜色2(G),若颜色1(G)>颜色2(G),则将颜色1(B,G,R)作为像素板的颜色,若颜色1(G)<颜色2(G),则将颜色2(B,G,R)作为像素板的颜色;若颜色1(G)=颜色2(G),则进一步进行颜色1(R)与颜色2(R)的对比,若颜色1(R)≠颜色2(R),则进一步判断颜色1(R)是否大于颜色2(R),若颜色1(R)>颜色2(R),则将颜色1(B,G,R)作为像素板的颜色,若颜色1(G)<颜色2(G),则将颜色2(B,G,R)作为像素板的颜色。基于同样的思路,将第一蒙版中的非背景颜色对应的像素进行比较,获得像素板。
步骤S109:基于所述降噪后的图像与所述待检测文档图像中的背景色的差异,进行图像增强,获得降噪结果。
由于对采样的图像进行了量化处理,因此,图片降噪后背景可能会比原图的背景略淡或者略深,因此进一步需要进行图像增强。具体的,降噪后的图像与所述待检测文档图像中的背景色的差异,计算出平均差异值,进而采用伽马变换与锐化,实现图像增加,从而获得较好的降噪结果。
为了进一步本说明书实施例提供的降噪方法,图4为本说明书实施例提供的一种文档图像的降噪方法的框架图。如图4所示,待检测文档图像经过HSV色彩空间距离生成第一蒙版,经过自适应局部二值化生成第二蒙版,第一蒙版和第二蒙版合并后,生成前景蒙版;基于待检测文档图像的目标检测结果,对前景蒙版进行调整,获得调整的前景蒙版;进一步,调整的前景蒙版及像素板,获得降噪后的图像;降噪后的图像进行图像增强,输出降噪结果。
采用本说明书实施例提供的降噪方法,能够提高文档降噪计算速度,提升降噪效果。图5为本说明书实施例提供的一种文档图像的降噪方法的效果示意图。图片从做到右分别为原图,之前的降噪效果,本申请的降噪效果。如图5A所示,能够减少椒盐噪点。如图5B所示,去除钉孔后的降噪,降噪效果更好。如图5C所示,针对图片而言,能够实现较好的降噪效果。
本说明书实施例提供了一种文档图像的降噪方法,基于同样的思路,本说明书实施例还提供一种文档图像的降噪装置。图6为本说明书实施例提供的一种文档图像的降噪装置的示意图。如图6所示,该降噪装置包括:
背景色确定模块601,确定待检测文档图像的背景色的像素值;
前景确定模块603,基于HSV色彩空间距离及自适应二值化,确定所述待检测文档图像的前景蒙版与像素板,其中,所述背景色及像素板是对所述待检测文档图像进行交叉采样获得的;
调整模块605,基于所述待检测文档图像的目标检测结果,对所述前景蒙版进行调整,获得调整后的前景蒙版;
填充模块607,基于所述调整后的前景蒙版及所述像素板,填充所述调整后的前景蒙版的背景色及前景色,获得降噪后的图像;
增强模块609,基于所述降噪后的图像与所述待检测文档图像中的背景色的差异,进行图像增强,获得降噪结果。
在本说明书实施例中,所述确定待检测文档图像的背景色的像素值,具体包括:
根据预设的采样点数,从所述待检测文档图像中选取对称的像素点,作为交叉采样像素点;
按照预设的色彩数量,对所述交叉采样像素点进行量化处理,获得交叉采样结果;
将所述交叉采样结果中最高频率的颜色作为所述待检测文档图像的背景色;
基于所述待检测文档图像的背景色,获得所述背景色的像素值。
在本说明书实施例中,所述根据HSV色彩空间距离及自适应二值化,确定所述待检测文档图像的前景蒙版,具体包括:
将所述待检测文档图像由RGB色彩空间图像转化为HSV颜色空间图像;
基于所述HSV颜色空间图像的饱和度及明亮度的阈值对比,生成第一蒙版;
将所述RGB色彩空间图像进行自适应局部二值化,生成第二蒙版;
将所述第一蒙版与所述第二蒙版进行合并,获得前景蒙版。
在本说明书实施例中,所述待检测文档图像的目标检测结果包括:指纹、红章、照片、钉孔、骑缝章、人像中的至少一种,所述基于所述待检测文档图像的目标检测结果,对所述前景蒙版进行调整,获得调整后的前景蒙版,具体包括:
若所述目标检测结果中包括人像和/或照片,则对所述前景蒙版中的人像和/或照片的相应要素保留;
若所述目标检测结果中包括钉痕和/或钉孔,则对所述前景蒙版中的钉痕和/或钉孔的相应要素进行修复;
若所述目标检测结果中包括红章,则将所述目标检测结果中红章的前景和背景进行分离,将分离后的红章的前景合并到所述前景蒙版中;
若所述目标检测结果中包括指纹,则将所述目标检测结果中的指纹的前景和背景进行分离,将分离后的指纹的前景合并到所述前景蒙版中。
在本说明书实施例中,所述若所述目标检测结果中包括钉痕和/或钉孔,则对所述前景蒙版中的钉痕和/或钉孔的相应要素进行修复,具体包括:
若所述目标检测结果中包括钉痕和/或钉孔,则采用inpaint方法,对所述前景蒙版中的钉痕和/或钉孔的相应要素进行修复。
在本说明书实施例中,所述若所述目标检测结果中包括红章,则将所述目标检测结果中红章的前景和背景进行分离,将分离后的红章的前景合并到所述前景蒙版中,具体包括:
若所述目标检测结果中包括红章,则采用颜色过滤的方法,对所述目标检测结果中红章的前景和背景进行分离,将分离后的红章的前景合并到所述前景蒙版中。
在本说明书实施例中,所述若所述目标检测结果中包括指纹,则将所述目标检测结果中的指纹的前景和背景进行分离,将分离后的指纹的前景合并到所述前景蒙版中,具体包括:
若所述目标检测结果中包括指纹,则采用视频背景提取方法,对所述目标检测结果中的指纹的前景和背景进行分离,将分离后的指纹的前景合并到所述前景蒙版中。
在本说明书实施例中,所述基于所述调整后的前景蒙版及所述像素板,填充所述调整后的前景蒙版的背景色及前景色,获得降噪后的图像,具体包括:
以所述背景色作为所述调整后的前景蒙版的背景色;
基于所述像素板与所述待检测文档图像中的非背景色之间的欧式距离,以欧式距离最短的像素板中对应的颜色为赋予的颜色,对所述调整后的前景蒙版的前景色进行填充,获得降噪后的图像。
在本说明书实施例中,所述像素板的获得,具体包括:
将所述交叉采样结果中的非背景颜色加入颜色队列,将所述颜色队列中的颜色按照预设的颜色规则进行排序,将排序后的颜色队列按照预设时间间隔进行提取,获得所述像素板。
需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,有语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
Claims (10)
1.一种文档图像的降噪方法,其特征在于,所述降噪方法包括:
确定待检测文档图像的背景色的像素值与像素板,其中,所述背景色及像素板是对所述待检测文档图像进行交叉采样获得的;
基于HSV色彩空间距离及自适应二值化,确定所述待检测文档图像的前景蒙版;
基于所述待检测文档图像的目标检测结果,对所述前景蒙版进行调整,获得调整后的前景蒙版;
基于所述调整后的前景蒙版及所述像素板,填充所述调整后的前景蒙版的背景色及前景色,获得降噪后的图像;
基于所述降噪后的图像与所述待检测文档图像中的背景色的差异,进行图像增强,获得降噪结果。
2.如权利要求1所述的降噪方法,其特征在于,所述确定待检测文档图像的背景色的像素值,具体包括:
根据预设的采样点数,从所述待检测文档图像中选取对称的像素点,作为交叉采样像素点;
按照预设的色彩数量,对所述交叉采样像素点进行量化处理,获得交叉采样结果;
将所述交叉采样结果中最高频率的颜色作为所述待检测文档图像的背景色;
基于所述待检测文档图像的背景色,获得所述背景色的像素值。
3.如权利要求1所述的降噪方法,其特征在于,所述根据HSV色彩空间距离及自适应二值化,确定所述待检测文档图像的前景蒙版,具体包括:
将所述待检测文档图像由RGB色彩空间图像转化为HSV颜色空间图像;
基于所述HSV颜色空间图像的饱和度及明亮度的阈值对比,生成第一蒙版;
将所述RGB色彩空间图像进行自适应局部二值化,生成第二蒙版;
将所述第一蒙版与所述第二蒙版进行合并,获得前景蒙版。
4.如权利要求1所述的降噪方法,其特征在于,所述待检测文档图像的目标检测结果包括:指纹、红章、照片、钉孔、骑缝章、人像中的至少一种,所述基于所述待检测文档图像的目标检测结果,对所述前景蒙版进行调整,获得调整后的前景蒙版,具体包括:
若所述目标检测结果中包括人像和/或照片,则对所述前景蒙版中的人像和/或照片的相应要素保留;
若所述目标检测结果中包括钉痕和/或钉孔,则对所述前景蒙版中的钉痕和/或钉孔的相应要素进行修复;
若所述目标检测结果中包括红章,则将所述目标检测结果中红章的前景和背景进行分离,将分离后的红章的前景合并到所述前景蒙版中;
若所述目标检测结果中包括指纹,则将所述目标检测结果中的指纹的前景和背景进行分离,将分离后的指纹的前景合并到所述前景蒙版中。
5.如权利要求4所述的降噪方法,其特征在于,所述若所述目标检测结果中包括钉痕和/或钉孔,则对所述前景蒙版中的钉痕和/或钉孔的相应要素进行修复,具体包括:
若所述目标检测结果中包括钉痕和/或钉孔,则采用inpaint方法,对所述前景蒙版中的钉痕和/或钉孔的相应要素进行修复。
6.如权利要求4所述的降噪方法,其特征在于,所述若所述目标检测结果中包括红章,则将所述目标检测结果中红章的前景和背景进行分离,将分离后的红章的前景合并到所述前景蒙版中,具体包括:
若所述目标检测结果中包括红章,则采用颜色过滤的方法,对所述目标检测结果中红章的前景和背景进行分离,将分离后的红章的前景合并到所述前景蒙版中。
7.如权利要求4所述的降噪方法,其特征在于,所述若所述目标检测结果中包括指纹,则将所述目标检测结果中的指纹的前景和背景进行分离,将分离后的指纹的前景合并到所述前景蒙版中,具体包括:
若所述目标检测结果中包括指纹,则采用视频背景提取方法,对所述目标检测结果中的指纹的前景和背景进行分离,将分离后的指纹的前景合并到所述前景蒙版中。
8.如权利要求2所述的降噪方法,其特征在于,所述基于所述调整后的前景蒙版及所述像素板,填充所述调整后的前景蒙版的背景色及前景色,获得降噪后的图像,具体包括:
以所述背景色作为所述调整后的前景蒙版的背景色;
基于所述像素板与所述待检测文档图像中的非背景色之间的欧式距离,以欧式距离最短的像素板中对应的颜色为赋予的颜色,对所述调整后的前景蒙版的前景色进行填充,获得降噪后的图像。
9.如权利要求2所述的降噪方法,其特征在于,所述像素板的获得,具体包括:
将所述交叉采样结果中的非背景颜色加入颜色队列,将所述颜色队列中的颜色按照预设的颜色规则进行排序,将排序后的颜色队列按照预设时间间隔进行提取,获得所述像素板。
10.一种文档图像的降噪装置,其特征在于,所述降噪装置包括:
背景色确定模块,确定待检测文档图像的背景色的像素值与像素板,其中,所述背景色及像素板是对所述待检测文档图像进行交叉采样获得的;
前景确定模块,基于HSV色彩空间距离及自适应二值化,确定所述待检测文档图像的前景蒙版;
调整模块,基于所述待检测文档图像的目标检测结果,对所述前景蒙版进行调整,获得调整后的前景蒙版;
填充模块,基于所述调整后的前景蒙版及所述像素板,填充所述调整后的前景蒙版的背景色及前景色,获得降噪后的图像;
增强模块,基于所述降噪后的图像与所述待检测文档图像中的背景色的差异,进行图像增强,获得降噪结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310065654.1A CN116503264A (zh) | 2023-01-13 | 2023-01-13 | 一种文档图像的降噪方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310065654.1A CN116503264A (zh) | 2023-01-13 | 2023-01-13 | 一种文档图像的降噪方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116503264A true CN116503264A (zh) | 2023-07-28 |
Family
ID=87327279
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310065654.1A Pending CN116503264A (zh) | 2023-01-13 | 2023-01-13 | 一种文档图像的降噪方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116503264A (zh) |
-
2023
- 2023-01-13 CN CN202310065654.1A patent/CN116503264A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7433535B2 (en) | Enhancing text-like edges in digital images | |
US6628833B1 (en) | Image processing apparatus, image processing method, and recording medium with image processing program to process image according to input image | |
JP3768052B2 (ja) | カラー画像処理方法、カラー画像処理装置、及びそのための記録媒体 | |
US7899258B2 (en) | Systems and methods to convert images into high-quality compressed documents | |
CN106096610B (zh) | 一种基于支持向量机的文档图像二值化方法 | |
US8355574B2 (en) | Determination of main object on image and improvement of image quality according to main object | |
US20040017579A1 (en) | Method and apparatus for enhancement of digital image quality | |
US20040096102A1 (en) | Methodology for scanned color document segmentation | |
JP2003132358A (ja) | 画像処理方法、装置およびシステム | |
JP2018121226A (ja) | 画像処理装置、画像処理方法およびプログラム | |
KR20120130684A (ko) | 화상 처리 장치, 화상 처리 방법, 및 컴퓨터 판독 가능한 매체 | |
CN108711160A (zh) | 一种基于hsi增强性模型的目标分割方法 | |
CN110210467B (zh) | 一种文本图像的公式定位方法、图像处理装置、存储介质 | |
JP2004336282A (ja) | 画像処理装置、画像処理プログラム及び該プログラムを記録した記録媒体 | |
US6985629B2 (en) | Image processing method, relative density detecting method and image processing apparatus | |
CN111445402A (zh) | 一种图像去噪方法及装置 | |
CN110807747B (zh) | 一种基于前景蒙版的文档图像降噪方法 | |
CN116503264A (zh) | 一种文档图像的降噪方法及装置 | |
CN112070771B (zh) | 基于hs通道的自适应阈值分割方法、装置和存储介质 | |
JP2007334876A (ja) | 文書イメージ処理システムおよび文書イメージ処理方法 | |
CN114581901A (zh) | 一种古建墙壁受污题记文字图像边缘提取方法 | |
CN114267035A (zh) | 一种文档图像处理方法、系统、电子设备及可读介质 | |
Solanki et al. | Performance evaluation of thresholding techniques on Modi script | |
CN112508024A (zh) | 一种变压器电气铭牌钢印字体智能识别方法 | |
Shi et al. | Digital image enhancement using normalization techniques and their application to palm leaf manuscripts |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |