CN116777783A - 一种基于扫描图像自动黑边检测修复的方法 - Google Patents

一种基于扫描图像自动黑边检测修复的方法 Download PDF

Info

Publication number
CN116777783A
CN116777783A CN202310747681.7A CN202310747681A CN116777783A CN 116777783 A CN116777783 A CN 116777783A CN 202310747681 A CN202310747681 A CN 202310747681A CN 116777783 A CN116777783 A CN 116777783A
Authority
CN
China
Prior art keywords
image
mask
repair
black
black edge
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310747681.7A
Other languages
English (en)
Inventor
王敏
陈蕊
黄莉
周杨
刘佳
唐娅梅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan Technology and Business University
Original Assignee
Sichuan Technology and Business University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan Technology and Business University filed Critical Sichuan Technology and Business University
Priority to CN202310747681.7A priority Critical patent/CN116777783A/zh
Publication of CN116777783A publication Critical patent/CN116777783A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]

Landscapes

  • Image Processing (AREA)
  • Editing Of Facsimile Originals (AREA)

Abstract

本发明公开了一种基于扫描图像自动黑边检测修复的方法,包括:图像大小处理、预设检测位置、图像黑点区域填充、黑边区域数据扩大和消噪、掩码归一化、生成制作数据集、模型训练、模型推理、计算修复区域、区域尺寸还原、合成修复图像。本发明的有益效果是图像满足修复功能,实现了黑色区域预取、黑色区域图像修复生成、图像合成、边界自然高清、快速修复的功能。

Description

一种基于扫描图像自动黑边检测修复的方法
技术领域
本发明涉及扫描文档电子化技术领域,具体涉及一种基于扫描图像自动黑边检测修复的方法。
背景技术
在纸质文件电子化过程中,因为纸质文档倾斜或纸质文档四周破损缺失,扫描后的图像存在四周黑边、缺失数据区域,呈现不规则外围黑色区域情况。常见方法可以实现规则黑边去除、不规则黑边去除,对于黑边进行简单的去除处理后,图像页面会形成明显的不协调区域,即正常数据区域和黑边区域程序边界明显,黑边区域没有得到数据填充修复。
发明内容
针对上述问题,本方法的目的是对扫描图像自动提取黑色区域,利用深度学习训练、推理生成与对应黑色周边区域和文档相协调的新数据区域,然后合成完整的修复图像,可以在应用数字档案系统中大量修复数字档案使用。本发明提供一种基于扫描图像自动黑边检测修复的方法,
本发明采用下述的技术方案:
一种基于扫描图像自动黑边检测修复的方法,包括以下步骤:
S1、获取原扫描图像生成第一图像和第二图像;
S2、对所述第一图像进行大小处理;
S3、在所述第二图像四角位置分别预设4个检测位置;
S4、判断所述4个检测位置的第一维像数值是否小于阈值,当检测位置小于阈值,在原扫描图像进行满水填充,即取得带有黑边区域的掩码图像;
S5、对所述掩码图像进行消噪和归一化处理;
S6、重复步骤S2至S5得到黑边修复文件,生成制作数据集,基于AOT-GAN网络进行图像生成训练,生成修复模型;
S7、将所述第一图像输入进训练后的AOT-GAN,重复步骤S2至S5,生成掩码数据,第一图像根据掩码数据推理计算生成第三图像;
S8、所述第三图像与步骤S7所述掩码数据进行掩码计算,提取得到只有掩码区域的修复图像第四图像,并对所述第四图像进行图像大小处理;
S9、将第四图像与原扫描图像合成得到修复图像。
进一步的,所述原扫描图像为RGB图像。
进一步的,所述第一图像大小为512*512。
进一步的,在步骤S6中,对所述AOT-GAN模型训练进行改进,具体包括:
S61、将原始的[1、2、4、8]四个尺度的空洞卷积替换为[2,4,8、16]四个尺度的空洞卷积;
S62、用GELU激活函数替换之前的RELU激活函数。
本发明的有益效果是:
图像满足修复功能,实现了黑色区域预取、黑色区域图像修复生成、图像合成、边界自然高清、快速修复的功能。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例的附图作简单地介绍,显而易见地,下面描述中的附图仅仅涉及本发明的一些实施例,而非对本发明的限制。
图1为本申请实施例提供的工作流程图;
图2为本申请实施例提供的原扫描图像;
图3为本申请实施例带有黑边区域的掩码图像示意图;
图4为本申请实施例消噪处理后的掩码图像示意图;
图5为申请实施例第四图像示意图;
图6为本申请实施例修复图像示意图
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例的附图,对本发明实施例的技术方案进行清楚、完整地描述。显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于所描述的本发明的实施例,本领域普通技术人员在无需创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面结合附图和实施例对本发明进一步说明。
如图1所示,为本申请一种基于扫描图像自动黑边检测修复的方法,具体包括以下步骤:
步骤一、获取原扫描图像生成第一图像和第二图像。
图像存在黑边的主要原因是在扫描过程中图片未放置平整或者图像出现破损卷角情况,本方法处理扫描图像为RGB图像,在图像黑边检测过程中不需要对图像做灰度或二值化处理。
如图2所示为原扫描图像,获取原扫描图像高h与宽度w,生成宽度w+2,高度h+2全0的掩码矩阵数据,即数据四周进行一圈的0填充,保障下一步填充颜色处理过程后能获取到图像四周边界完整数据。
进一步的,需要将原扫描图像生成2个图像副本分别为第一图像和第二图像。
步骤二、对所述第一图像进行大小处理。
将第一图像进行归一化大小处理,尺寸大小为512*512,因为后续深度学习修复模型AOT-GAN只能处理不高于512*512大小的图像。
步骤三、在所述第二图像四角位置分别预设4个检测位置。
在第二图像四角位置分别预设四个预处理点,坐标为[3][3]、[h-3][3]、[3][w-3]、[h-3][w-3]。
步骤四、判断所述4个检测位置的第一维像数值是否小于阈值,当检测位置小于阈值,在原扫描图像进行满水填充,即取得带有黑边区域的掩码图像。
针对出现黑边情况,只需要检测这四个点的第一维像数值是否小于阈值A,A默认值设置为4,也可以根据实际情况调整阈值A。针对小于阈值A的点,在原扫描图上进行满水填充,mask为填充数据区域,填充颜色为绿色(255,0,0)。无论四方的黑框是否相连接,通过对四个点的漫水填充,可用绿色填充图像四周所有黑边区域,对于非黑边区域,则不会进行任何填充,即不会破坏图像正常数据。
步骤五、对所述掩码图像进行消噪和归一化处理。
带有黑边区域的掩码图像为不规则图形,存在多个不连通区域,如图3所示。如果按这个区域在原图中直接去除黑色边框,可以到达去除黑边效果,但是原图中的正常图像和黑边区域之间存在边界痕迹和噪声,非常不协调。所以对当前带有黑边区域的掩码图像进行反色处理,即每一个像素从0变为255或255变为0.然后进行腐蚀操作,腐蚀操作会让正常图像区域减小、噪声图像区域减少甚至淹没消失,最后再进行反色操作,取得优化的掩码图像,如图4所示。
进一步的,对所述优化的掩码图像归一化为512*512的大小,在进行归一化大小处理之前需要将优化的掩码图像合并新的三通道图像,保持优化的掩码图像与原扫描图像的通道数目一致。
步骤六、重复步骤S2至S5得到黑边修复文件,生成制作数据集,基于AOT-GAN网络进行图像生成训练,生成修复模型。
重复进行步骤S2至S5,得到大量的黑边修复文件,组成标准黑框修复数据集,再将对应的数据集送入AOT-GAN网络进行图像生成训练。具体的,本方法注重区域补充修复、背景部分和整体风格,不需要注重文档文字具体细节内容的修复,则需要将则需要将卷积部分改为更大尺寸的空洞卷积,将原始的[1、2、4、8]四个尺度的空洞卷积替换为[2,4,8、16]四个尺度的空洞卷积。可以更快的达到训练效果。用GELU激活函数替换之前的RELU激活函数,能利用GELU函数较好的泛化能力和稳定性提高整个模型性能。GELU激活函数:
GELU(x)=0.4*x(1+tanh[sqrt(2/pi*(x+0.044715*x3))])
pi=3.14159265
训练过程执行在训练服务器上完成,这个训练过程次数优于原生态的训练时间,需要达到自定义进度或设定次数条件即可终止,生成修复模型。
步骤七、将所述第一图像输入进训练后的AOT-GAN,重复步骤S2至S5,生成掩码数据,第一图像根据掩码数据推理计算生成第三图像。
步骤八、所述第三图像与步骤S7所述掩码数据进行掩码计算,提取得到只有掩码区域的修复图像第四图像,并对所述第四图像进行图像大小处理。。
所述第三图像大小为512*512,第三图像包含了第一图像正常数据的图像,为了实现高清修复,需要将第三图像与步骤S7所述掩码数据进行掩码计算,提取到只有掩码区域的修复图像第四图像,如图5所示,通过线性插值算法将第四图像扩大到与原扫描图像大小相等。
步骤九、将第四图像与原扫描图像合成得到修复图像。
进行相与操作,第四图像中非标记区域为0与出来的结果也是0,起到屏蔽作用合成,可以生成修复图像,如图6所示。
修复图像不仅实现了原始正常图像保留、黑边缺失区域修复,还消除了黑边边界差异大情况,图像满足修复功能,实现了黑色区域预取、黑色区域图像修复生成、图像合成、边界自然高清、快速修复得功能。
以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制,虽然本发明已以较佳实施例揭露如上,然而并非用以限定本发明,任何熟悉本专业的技术人员,在不脱离本发明技术方案范围内,当可利用上述揭示的技术内容作出些许更动或修饰为等同变化的等效实施例,但凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所做的任何简单修改、等同变化与修饰,均仍属于本发明技术方案的范围内。

Claims (7)

1.一种基于扫描图像自动黑边检测修复的方法,其特征在于,包括以下几个步骤:
S1、获取原扫描图像生成第一图像和第二图像;
S2、对所述第一图像进行大小处理;
S3、在所述第二图像四角位置分别预设4个检测位置;
S4、判断所述4个检测位置的第一维像数值是否小于阈值,当检测位置小于阈值,在原扫描图像进行满水填充,即取得带有黑边区域的掩码图像;
S5、对所述掩码图像进行消噪和归一化处理;
S6、重复步骤S2至S5得到黑边修复文件,生成制作数据集,基于AOT-GAN网络进行图像生成训练,生成修复模型;
S7、将所述第一图像输入进训练后的AOT-GAN,重复步骤S2至S5,生成掩码数据,第一图像根据掩码数据推理计算生成第三图像;
S8、所述第三图像与步骤S7所述掩码数据进行掩码计算,提取得到只有掩码区域的修复图像第四图像,并对所述第四图像进行图像大小处理;
S9、将第四图像与原扫描图像合成得到修复图像。
2.根据权利要求1所述一种基于扫描图像自动黑边检测修复的方法,其特征在于,所述原扫描图像为RGB图像。
3.根据权利要求1所述一种基于扫描图像自动黑边检测修复的方法,其特征在于,所述第一图像大小为512*512。
4.根据权利要求1所述一种基于扫描图像自动黑边检测修复的方法,其特征在于,所述步骤5中消噪处理的具体步骤包括:
对所述掩码图像进行反色处理,即每一个像素从0变为255或255变为0;
再进行腐蚀操作,腐蚀操作会让掩码图像中正常图像区域减小、噪声图像区域减少甚至淹没消失;
最后进行反色处理取得优化的掩码图像。
5.根据权利要求4所述一种基于扫描图像自动黑边检测修复的方法,其特征在于,对所述优化的掩码图像归一化为512*512的大小。
6.根据权利要求5所述一种基于扫描图像自动黑边检测修复的方法,其特征在于,所述在执行对优化的掩码图像进行归一化大小处理之前,具体包括:
对所述优化的掩码图像合并新的三通道图像。
7.根据权利要求1所述一种基于扫描图像自动黑边检测修复的方法,其特征在于,在所述步骤S6中,对所述AOT-GAN模型训练进行改进,具体包括:
S61、将原始的[1、2、4、8]四个尺度的空洞卷积替换为[2,4,8、16]四个尺度的空洞卷积;
S62、用GELU激活函数替换之前的RELU激活函数。
CN202310747681.7A 2023-06-21 2023-06-21 一种基于扫描图像自动黑边检测修复的方法 Pending CN116777783A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310747681.7A CN116777783A (zh) 2023-06-21 2023-06-21 一种基于扫描图像自动黑边检测修复的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310747681.7A CN116777783A (zh) 2023-06-21 2023-06-21 一种基于扫描图像自动黑边检测修复的方法

Publications (1)

Publication Number Publication Date
CN116777783A true CN116777783A (zh) 2023-09-19

Family

ID=88011132

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310747681.7A Pending CN116777783A (zh) 2023-06-21 2023-06-21 一种基于扫描图像自动黑边检测修复的方法

Country Status (1)

Country Link
CN (1) CN116777783A (zh)

Similar Documents

Publication Publication Date Title
US6389163B1 (en) Method and apparatus for automatic image segmentation using template matching filters
US8644602B2 (en) Colour correcting foreground colours for visual quality improvement
JP4219542B2 (ja) 画像処理装置、画像処理方法および画像処理プログラムが格納された記録媒体
US20030179935A1 (en) Image processing apparatus, image processing method, image processing program, and computer-readable record medium storing image processing program
EP2545499A2 (en) Text enhancement of a textual image undergoing optical character recognition
JP2001358925A (ja) 画像処理のための装置、方法及び記録媒体
CN112508024A (zh) 一种变压器电气铭牌钢印字体智能识别方法
US5982940A (en) Image data processing device and method of processing image data
CN114792310A (zh) 一种LCD屏幕中边缘模糊的Mura缺陷检测方法
JP2008092447A (ja) 画像処理装置、画像出力装置、および画像処理方法
CN116777783A (zh) 一种基于扫描图像自动黑边检测修复的方法
CN110930358A (zh) 一种基于自适应算法的太阳能面板图像处理方法
JP3604910B2 (ja) 画像縮小装置及び画像縮小プログラムを記録した記録媒体
CN112862656B (zh) 一种抗打印扫描拍摄的数字图像水印方法
CN111556221B (zh) 一种基于电子显隐工具的印刷品半色调信息隐藏及显隐方法
Murguia Document segmentation using texture variance and low resolution images
CN110163212B (zh) 一种碑帖图像中的文字切割方法
JP2001127999A (ja) 画像処理装置および画像処理方法
CN113269692A (zh) 一种基于图像修复的视频去logo方法及系统
JP2001160903A (ja) 画像補正方法及び装置及びその方法を実行するプログラムを記録した記録媒体
JP4035696B2 (ja) 線分検出装置及び画像処理装置
CN116777768B (zh) 一种鲁棒且高效的扫描文档图像增强方法及其装置
JP3045555B2 (ja) 多階調画像情報の2値化処理方法
JP2003032480A (ja) 画像処理装置及び画像処理方法
JP3733154B2 (ja) 画像処理装置及びその方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination