CN112215783B - 一种图像噪点识别方法、装置、存储介质及设备 - Google Patents
一种图像噪点识别方法、装置、存储介质及设备 Download PDFInfo
- Publication number
- CN112215783B CN112215783B CN202011366980.9A CN202011366980A CN112215783B CN 112215783 B CN112215783 B CN 112215783B CN 202011366980 A CN202011366980 A CN 202011366980A CN 112215783 B CN112215783 B CN 112215783B
- Authority
- CN
- China
- Prior art keywords
- image
- area
- noise
- preset
- connected blocks
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 61
- 238000012545 processing Methods 0.000 claims abstract description 44
- 238000004458 analytical method Methods 0.000 claims abstract description 23
- 230000000877 morphologic effect Effects 0.000 claims abstract description 14
- 238000013135 deep learning Methods 0.000 claims description 13
- 238000004590 computer program Methods 0.000 claims description 9
- 238000012216 screening Methods 0.000 claims description 7
- 238000001914 filtration Methods 0.000 claims description 4
- 230000010339 dilation Effects 0.000 claims description 2
- 238000001514 detection method Methods 0.000 description 11
- 238000004422 calculation algorithm Methods 0.000 description 8
- 238000012549 training Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000012015 optical character recognition Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000013473 artificial intelligence Methods 0.000 description 3
- 238000013145 classification model Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 210000000746 body region Anatomy 0.000 description 2
- 238000007635 classification algorithm Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000001035 drying Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003628 erosive effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000002203 pretreatment Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000011895 specific detection Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/70—Denoising; Smoothing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/20—Image enhancement or restoration using local operators
- G06T5/30—Erosion or dilatation, e.g. thinning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/13—Edge detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/187—Segmentation; Edge detection involving region growing; involving region merging; involving connected component labelling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10004—Still image; Photographic image
- G06T2207/10008—Still image; Photographic image from scanner, fax or copier
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20021—Dividing image into blocks, subimages or windows
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20036—Morphological image processing
- G06T2207/20041—Distance transform
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30176—Document
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Character Input (AREA)
- Image Analysis (AREA)
Abstract
本发明提供一种图像噪点识别方法、装置、存储介质及设备,所述方法包括:获取扫描图像,并对扫描图像的正文区域和边缘区域进行识别;依次对扫描图像进行二值化处理、形态学膨胀处理、及连通区块分析,得到若干个连通区块及其包围框坐标;根据连通区块的包围框坐标,分别确定属于正文区域和边缘区域的连通区块;利用第一预设条件对正文区域中的连通区块进行噪点识别,并利用第二预设条件对边缘区域中的连通区块进行噪点识别。本发明通过识别出扫描图像的正文区域和边缘区域,以确定连通区块所属的区域,并分别采用不同的条件策略来对正文区域和边缘区域中的连通区块进行噪点识别,避免传统一刀切的方式,降低噪点的误识别概率。
Description
技术领域
本发明涉及图像处理技术领域,特别涉及一种图像噪点识别方法、装置、存储介质及设备。
背景技术
扫描文档生成图像过程中,由于扫描设备或人为操作等因素,使得图像存在噪点,需要应用去噪方法进行噪点去除。去噪的前提是需要识别出扫描图像中的噪点,因此需要利用噪点识别方法对扫描图像进行分析。
现有技术当中,目前使用的噪点识别方法流程如下:对图像进行距离变换得到若干个图像块,再进行连通区域分析得到包围图像块的矩形框,对矩形框内的图像块逐一分析其几何特征,几何特征在预设值范围内的图像块视为噪点污渍,并将该图像块标注出来,其它图像块则视为正常图像。
然而,目前使用的噪点识别方法存在的缺陷在于:对扫描图像噪点进行一刀切的方式进行识别,很容易造成误识别。
发明内容
基于此,本发明的目的是提供一种图像噪点识别方法、装置、存储介质及设备,以解决现有图像噪点识别方法容易造成误识别的技术问题。
根据本发明实施例的一种图像噪点识别方法,所述方法包括:
获取扫描图像,并对所述扫描图像的正文区域和边缘区域进行识别;
对所述扫描图像进行二值化处理,再对二值化处理后的图像进行形态学膨胀处理,并对膨胀处理后的图像进行连通区块分析,得到若干个连通区块及其包围框坐标;
根据所述连通区块的包围框坐标,分别确定属于所述正文区域和所述边缘区域的连通区块;
利用第一预设条件对所述正文区域中的连通区块进行噪点识别,并利用第二预设条件对所述边缘区域中的连通区块进行噪点识别。
另外,根据本发明上述实施例的一种图像噪点识别方法,还可以具有如下附加的技术特征:
进一步地,在所述获取扫描图像的步骤之后,还包括:
对所述扫描图像进行类型识别,并判断所述扫描图像是否为预设类型;
若是,则执行所述对所述扫描图像的正文区域和边缘区域进行识别的步骤。
进一步地,在判断所述扫描图像是否为预设类型的步骤之后,还包括:
若否,则发出供用户确认是否执行所述对所述扫描图像的正文区域和边缘区域进行识别的提示信息。
进一步地,在对所述扫描图像进行二值化处理,再对二值化处理后的图像进行形态学膨胀处理,并对膨胀处理后的图像进行连通区块分析,得到若干个连通区块及其包围框坐标的步骤之后,还包括:
根据所述连通区块的尺寸参数和预设参数范围,对所述连通区块进行筛选。
进一步地,根据所述连通区块的尺寸参数和预设参数范围,对所述连通区块进行筛选的步骤包括:
根据所述连通区块的尺寸参数和预设参数范围,确定所述连通区块的尺寸等级;
将属于预设的最小尺寸等级的连通区块确定为噪点,并将属于预设的最大尺寸等级的连通区块排除;
其中,已确定为噪点的连通区块和已经排除的连通区块不再继续对其进行噪点分析。
进一步地,所述利用第一预设条件对所述正文区域中的连通区块进行噪点识别的步骤包括:
遍历所述正文区域中的每个连通区块;
将所述正文区域中满足所述第一预设条件的连通区块判定为噪点;
其中,所述利用第二预设条件对所述边缘区域中的连通区块进行噪点识别的步骤包括:
遍历所述边缘区域中的每个连通区块;
将所述边缘区域中满足所述第二预设条件的连通区块判定为噪点。
进一步地,所述第一预设条件包括几何特征在第一预设范围内、不存在相邻连通区块以及不属于数字字母区域,所述第二预设条件包括几何特征在第二预设范围内,所述第一预设范围小于所述第二预设范围,所述几何特征包括高度、宽度、面积、投影长度和/或实际像素占包围框的面积比。
根据本发明实施例的一种图像噪点识别装置,所述装置包括:
区域识别模块,用于获取扫描图像,并对所述扫描图像的正文区域和边缘区域进行识别;
区块分析模块,用于对所述扫描图像进行二值化处理,再对二值化处理后的图像进行形态学膨胀处理,并对膨胀处理后的图像进行连通区块分析,得到若干个连通区块及其包围框坐标;
区块划分模块,用于根据所述连通区块的包围框坐标,分别确定属于所述正文区域和所述边缘区域的连通区块;
噪点识别模块,用于利用第一预设条件对所述正文区域中的连通区块进行噪点识别,并利用第二预设条件对所述边缘区域中的连通区块进行噪点识别。
本发明还提出一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述的图像噪点识别方法。
本发明还提出一种图像噪点识别设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述的图像噪点识别方法。
与现有技术相比,通过识别出扫描图像的正文区域和边缘区域,以确定连通区块所属的区域,并分别采用不同的条件策略来对正文区域和边缘区域中的连通区块进行噪点识别,避免采用传统一刀切的方式来识别噪点,可以有效降低噪点的误识别概率。
附图说明
图1为本发明第一实施例中的图像噪点识别方法的流程图;
图2为本发明第二实施例中的图像噪点识别方法的流程图;
图3为本发明第三实施例中的图像噪点识别装置的结构示意图。
以下具体实施方式将结合上述附图进一步说明本发明。
具体实施方式
为了便于理解本发明,下面将参照相关附图对本发明进行更全面的描述。附图中给出了本发明的若干实施例。但是,本发明可以以许多不同的形式来实现,并不限于本文所描述的实施例。相反地,提供这些实施例的目的是使对本发明的公开内容更加透彻全面。
需要说明的是,当元件被称为“固设于”另一个元件,它可以直接在另一个元件上或者也可以存在居中的元件。当一个元件被认为是“连接”另一个元件,它可以是直接连接到另一个元件或者可能同时存在居中元件。本文所使用的术语“垂直的”、“水平的”、“左”、“右”以及类似的表述只是为了说明的目的。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。本文所使用的术语“及/或”包括一个或多个相关的所列项目的任意的和所有的组合。
实施例一
请参阅图1,所示为本发明第一实施例中的图像噪点识别方法,所述方法具体包括步骤S01至步骤S04。
步骤S01,获取扫描图像,并对所述扫描图像的正文区域和边缘区域进行识别。
其中,正文区域包括表格区域和文本区域,边缘区域包括页眉页脚区域、手写页码区域、印刷数字页码区域和左右空白区域。正文区域一般是矩形区域(boundingbox),在具体实施时,可以采用基于深度学习的SSD(Single Shot Multibox Detector)目标检测算法来识别正文区域,而对于边缘区域的确定,则可以将识别到的正文区域之外的区域确定为边缘区域。
在本实施例一些情况当中,基于深度学习的SSD目标检测算法来识别正文区域的过程具体如下:
1.准备1000幅左右的扫描图像,并将图像中的正文区域、四个边缘区域逐一用矩形框标注出来,生成用于训练SSD模型的数据集。
2.利用深度学习框架Tensorflow对上述数据进行训练,得到SSD模型的配置和权重文件。由于训练时间较长,可长达0.5-2天,通常需预先训练好模型。
3.预先加载SSD模型的配置和权重文件,输入一幅扫描图像,就可实时检测文档图像中的正文区域。由于模型识别的正文区域不完全准确,可以对已识别的表格区域和文字块区域的位置进行精调,调整方式有:当表格或文字区域与正文区域相交时,扩大正文区域;当表格或文字区域在正文区域内,正文区域收缩。
步骤S02,对所述扫描图像进行二值化处理,再对二值化处理后的图像进行形态学膨胀处理,并对膨胀处理后的图像进行连通区块分析,得到若干个连通区块及其包围框坐标。
应当理解的,包围框是指连通区块边界线构成为线框,连通区块一般为矩形区块,因此包围框一般为矩形包围框。其中,包围框坐标可以为包围框四个角点、中心点或其它设定点的二维坐标值或为像素坐标值,该包围框坐标主要用于标记对应的连通区块在整张扫描图像上的位置,以便后续步骤S03识别出各个连通区块所属的区域。
步骤S03,根据所述连通区块的包围框坐标,分别确定属于所述正文区域和所述边缘区域的连通区块。
步骤S04,利用第一预设条件对所述正文区域中的连通区块进行噪点识别,并利用第二预设条件对所述边缘区域中的连通区块进行噪点识别。
在本实施例一些情况当中,所述利用第一预设条件对所述正文区域中的连通区块进行噪点识别的步骤具体包括:
遍历所述正文区域中的每个连通区块;
将所述正文区域中满足所述第一预设条件的连通区块判定为噪点。
具体地,第一预设条件具体包括几何特征在第一预设范围内、不存在相邻连通区块以及不属于数字字母区域,即当正文区域中的某个连通区块的几何特征在第一预设范围内、且不存在相邻连通区块、同时不属于数字字母区域,则判定该连通区块为噪点。需要补充说明的是,连通区块不属于数字字母区域是指连通区块内经过OCR(Optical CharacterRecognition,光学字符识别)识别不存在数字和字母。
同样地,所述利用第二预设条件对所述边缘区域中的连通区块进行噪点识别的步骤同样包括:
遍历所述边缘区域中的每个连通区块;
将所述边缘区域中满足所述第二预设条件的连通区块判定为噪点。
具体地,所述第二预设条件包括几何特征在第二预设范围内,即当边缘区域中的某个连通区块的几何特征在第二预设范围内,则判定该连通区块为噪点。其中,所述第一预设范围小于所述第二预设范围,也就是说,正文区域内的噪点识别阈值相应减小,即正文区域内相对较小的区块才会进行噪点分析,从而避免将正文区域的有效部分误认为噪点,而正文区域以外的噪点识别阈值相应增大,以尽可能多的去除边缘区域的噪点。
非穷极性列举,所述几何特征包括高度、宽度、面积、投影长度和/或实际像素占包围框的面积比,即将连通区块的实际高度、宽度、面积、投影长度和/或实际像素占包围框的面积比与、对应预设的高度范围、宽度范围、面积范围、投影长度范围和/或实际像素占包围框的面积比范围进行对比,以识别连通区块是否为噪点。
可见,在本实施例当中,正文区域相校于边缘区域的噪点识别更加严格,这样在存在文字分离或断裂、印章模糊、表格线不清晰等问题时,不会造成文字部分、断裂线被误识别为噪点,证书的底纹、图纸中的模糊部分也不会误识别为噪点,同时还能够保证距离文字较近的噪点也会被识别到。
综上,本发明上述实施例当中的图像噪点识别方法,通过识别出扫描图像的正文区域和边缘区域,以确定连通区块所属的区域,并分别采用不同的条件策略来对正文区域和边缘区域中的连通区块进行噪点识别,避免采用传统一刀切的方式来识别噪点,可以有效降低噪点的误识别概率。
实施例二
请参阅图2,所示为本发明第二实施例中的图像噪点识别方法,所述方法具体包括步骤S11至步骤S16。
步骤S11,获取扫描图像,并对所述扫描图像进行类型识别。
步骤S12,判断所述扫描图像是否为预设类型。
也就是说,本实施例还会对扫描图像进行分类,例如将扫描图像分为文档(如纯文本文档、或文本和表格混合文档)、表格、证书、图像、证书、图纸等类型。其中,所述预设类型包括文档和表格,当判断到扫描图像的类型为所述预设类型时,执行步骤S13- S16;当判断到扫描图像的类型不为所述预设类型时,则可以发出供用户确认是否执行所述对所述扫描图像的正文区域和边缘区域进行识别的提示信息,当用户选择时,则执行步骤S13- S16。也就是说,对于预设类型之外的扫描图像,可以选择是否同样按预设类型的扫描图像的噪点识别方法进行噪点识别。例如,当识别到当前扫描图像属于证书、图纸类型的扫描图像时,可选择是否按照文档类型的燥点识别方法进行处理,或者默认不进行去噪处理。
具体地,在本实施例一些情况当中,可以基于深度学习网络MobileNet来实现图像的文档类型和表格类型的识别,具体如下:
1)文档分类算法
文档分类采用基于深度学习MobileNet的分类算法识别扫描图像的类型,目前分为文档、表格、证书、图纸、其他。
方法的识别过程如下:
1.准备1000幅左右的扫描图像,标注好每张图像的类型,生成用于训练MobileNet分类模型的数据集。
2.利用深度学习框架Caffe对上述数据进行训练,得到深度学习分类模型。
3.预先加载训练好的分类模型,输入一幅图像,就可实时对扫描图像进行分类。
2)表格检测与文本块检测算法
表格的检测是算法的第一部分,若检测出表格的外边框和单元格直线,再将表格线去除后,进一步提取主要内容块,具体检测方法如下:
1.预处理阶段
a.输入源图像,彩色图像转换为灰度图;
b.缩放灰度图像,使图像最大边长为1000,扫描文档图像通常尺寸为2479×3508左右,且主要区域较大,缩小图像再处理可缩短时间;
c.对缩小图像进行Ostu二值化,获取二值图像。对于本身已经是二值图像的源图像,使用固定阈值240进行二值化。
2.表格外框检测
a.二值图像使用尺寸为3×3的结构元素,进行形态学闭操作,连接断了一点的表格线;
b.对形态学闭操作后的二值图像分别使用尺寸为1×(0.07*图像高)、(0.1*图像宽)×3的结构元素先后进行形态学腐蚀和膨胀操作,分别得到表格的垂直线和水平线图像;
c.将垂直线和水平线图像分别合并、求交集,得到直线合并图像和交点图像;
d.对直线合并图像进行外轮廓查找,独立、面积大、近似矩形且包含至少4个交点的外轮廓即为表格外框。
3.表格单元格检测
在合并图中,再对表格外框内部进行轮廓分析,近似矩形且包含至少4个交点的轮廓即为表格单元格。将找到的所有单元格外框绘制出来,即可得到整个表格的线框,表格外框和单元格均以矩形框数据缓存。
4.主要内容块检测
a.将二值图像与表格线框图叠加,达到去除表格线框的目的;
b.将去除表格线框的二值图像进行行距离变换,将图像分块
c.对分块的图像进行连通区域分析,过滤面积过小、线状的区域,即可得到矩形框标注的主要内容块。
5.后处理
将已检测到的表格外框及其单元格、主要内容块的矩形框,按照缩放为1000的比例还原为原始图像对应的大小,得到最后的区域划分。
步骤S13,对所述扫描图像的正文区域和边缘区域进行识别。
步骤S14,对所述扫描图像进行二值化处理,再对二值化处理后的扫描图像进行形态学膨胀处理,并对膨胀处理后的图像进行连通区块分析,得到若干个连通区块及其包围框坐标。
步骤S15,根据所述连通区块的包围框坐标,分别确定属于所述正文区域和所述边缘区域的连通区块。
步骤S16,利用第一预设条件对所述正文区域中的连通区块进行噪点识别,并利用第二预设条件对所述边缘区域中的连通区块进行噪点识别。
本实施例相较于第一实施例,还进一步对图像类型进行识别,并基于识别的图像类型做出相应的噪声识别策略,从而在识别图像类型和不同区域的基础上,进一步避免噪点误识别,从而进一步提升去噪效果。
为了进一步提升噪点识别精度,在一些可选实施例当中,对于连通区块在所属区域的位置不同,对应的处理办法及参数判定的宽松程度也可以略有不同,具体如下表1所示:
表1:
进一步地,在另一些可选实施例当中,在对所述扫描图像进行二值化处理,再对二值化处理后的图像进行形态学膨胀处理,并对膨胀处理后的图像进行连通区块分析,得到若干个连通区块及其包围框坐标的步骤之后,所述图像噪点识别方法还可以包括:
根据所述连通区块的尺寸参数和预设参数范围,对所述连通区块进行筛选。
在本实施例一些可选实施例当中,根据所述连通区块的尺寸参数和预设参数范围,对所述连通区块进行筛选的步骤具体包括:
根据所述连通区块的尺寸参数和预设参数范围,确定所述连通区块的尺寸等级;
将属于预设的最小尺寸等级的连通区块确定为噪点,并将属于预设的最大尺寸等级的连通区块排除;
其中,已确定为噪点的连通区块和已经排除的连通区块不再继续对其进行噪点分析。即对于一些可以直接作出判定的区块直接筛选掉,降低后续处理量,使设备能够更加迅速得到噪点识别结果。
示例而非限定,非穷极性列举,预设参数可以为面积A、宽度W、高度H,即可以按连通区块的面积A、宽度W和高度H来划分不同的尺寸等级,具体可以按下表1的参数对连通区块进行等级划分:
表2:
其中,表2中的判断参数标准A4、300DPI图像制定,输入图像根据实际大小按比例调整即可。对于较小的区域(即属于预设的最小尺寸等级的连通区块),直接可判定为噪点,更大的区域(即属于预设的最大尺寸等级的连通区块)不在分析范围内,直接排除。其他尺寸等级的区域通过后续步骤(例如步骤S15-步骤S16)进一步分析。
本发明实施例利用人工智能方法全面升级去噪方法,包括基于图像处理的表格检测,基于深度学习算法对扫描图像进行智能分类(文档、表格、证书、图纸、其他),识别图像的正文区域与边缘区域,再根据文字块在不同区域,采用不同的预设值和噪点识别策略。使得当前方案的噪点识别率达到了85%-95%,相比原有方案提升了至少10%。
实施例三
所述请查阅图3,所示为本发明第三实施例中的图像噪点识别装置,所述装置包括:
区域识别模块11,用于获取扫描图像,并对所述扫描图像的正文区域和边缘区域进行识别;
区块分析模块12,用于对所述扫描图像进行二值化处理,再对二值化处理后的图像进行形态学膨胀处理,并对膨胀处理后的图像进行连通区块分析,得到若干个连通区块及其包围框坐标;
区块划分模块13,用于根据所述连通区块的包围框坐标,分别确定属于所述正文区域和所述边缘区域的连通区块;
噪点识别模块14,用于利用第一预设条件对所述正文区域中的连通区块进行噪点识别,并利用第二预设条件对所述边缘区域中的连通区块进行噪点识别。
其中,正文区域包括表格区域和文本区域,边缘区域包括页眉页脚区域、手写页码区域、印刷数字页码区域和左右空白区域。正文区域一般是矩形区域(boundingbox),在具体实施时,可以采用基于深度学习的SSD(Single Shot Multibox Detector)目标检测算法来识别正文区域,而对于边缘区域的确定,则可以将识别到的正文区域之外的区域确定为边缘区域。
应当理解的,包围框是指连通区块边界线构成为线框,连通区块一般为矩形区块,因此包围框一般为矩形包围框。其中,包围框坐标可以为包围框四个角点、中心点或其它设定点的二维坐标值或为像素坐标值,该包围框坐标主要用于标记对应的连通区块在整张扫描图像上的位置,以便后续步骤S03识别出各个连通区块所属的区域。
在本实施例一些情况当中,所述利用第一预设条件对所述正文区域中的连通区块进行噪点识别的步骤具体包括:
遍历所述正文区域中的每个连通区块;
将所述正文区域中满足所述第一预设条件的连通区块判定为噪点。
具体地,第一预设条件具体包括几何特征在第一预设范围内、不存在相邻连通区块以及不属于数字字母区域,即当正文区域中的某个连通区块的几何特征在第一预设范围内、且不存在相邻连通区块、同时不属于数字字母区域,则判定该连通区块为噪点。需要补充说明的是,连通区块不属于数字字母区域是指连通区块内经过OCR(Optical CharacterRecognition,光学字符识别)识别不存在数字和字母。
同样地,所述利用第二预设条件对所述边缘区域中的连通区块进行噪点识别的步骤同样包括:
遍历所述边缘区域中的每个连通区块;
将所述边缘区域中满足所述第二预设条件的连通区块判定为噪点。
具体地,所述第二预设条件包括几何特征在第二预设范围内,即当边缘区域中的某个连通区块的几何特征在第二预设范围内,则判定该连通区块为噪点。其中,所述第一预设范围小于所述第二预设范围,也就是说,正文区域内的噪点识别阈值相应减小,即正文区域内相对较小的区块才会进行噪点分析,从而避免将正文区域的有效部分误认为噪点,而正文区域以外的噪点识别阈值相应增大,以尽可能多的去除边缘区域的噪点。
非穷极性列举,所述几何特征包括高度、宽度、面积、投影长度和/或实际像素占包围框的面积比,即将连通区块的实际高度、宽度、面积、投影长度和/或实际像素占包围框的面积比与、对应预设的高度范围、宽度范围、面积范围、投影长度范围和/或实际像素占包围框的面积比范围进行对比,以识别连通区块是否为噪点。
可见,在本实施例当中,正文区域相校于边缘区域的噪点识别更加严格,这样在存在文字分离或断裂、印章模糊、表格线不清晰等问题时,不会造成文字部分、断裂线被误识别为噪点,证书的底纹、图纸中的模糊部分也不会误识别为噪点,同时还能够保证距离文字较近的噪点也会被识别到。
进一步地,在本发明一些可选实施例当中,所述图像噪点识别装置还包括:
类型识别模块,用于对所述扫描图像进行类型识别,并判断所述扫描图像是否为预设类型;当所述类型识别模块判断到所述扫描图像的类型为预设类型,则所述区域识别模块11对所述扫描图像的正文区域和边缘区域进行识别。
进一步地,在本发明一些可选实施例当中,所述图像噪点识别装置还包括:
提示发出模块,用于当所述类型识别模块判断到所述扫描图像的类型不为预设类型时,发出供用户确认是否执行所述对所述扫描图像的正文区域和边缘区域进行识别的提示信息。
进一步地,在本发明一些可选实施例当中,所述图像噪点识别装置还包括:
区块筛选模块,用于根据所述连通区块的尺寸参数和预设参数范围,对所述连通区块进行筛选。
进一步地,在本发明一些可选实施例当中,所述区块筛选模块还用于根据所述连通区块的尺寸参数和预设参数范围,确定所述连通区块的尺寸等级;将属于预设的最小尺寸等级的连通区块确定为噪点,并将属于预设的最大尺寸等级的连通区块排除;其中,已确定为噪点的连通区块和已经排除的连通区块不再继续对其进行噪点分析。
进一步地,在本发明一些可选实施例当中,所述噪点识别模块还用于遍历所述正文区域中的每个连通区块;将所述正文区域中满足所述第一预设条件的连通区块判定为噪点;遍历所述边缘区域中的每个连通区块;将所述边缘区域中满足所述第二预设条件的连通区块判定为噪点。
进一步地,在本发明一些可选实施例当中,所述第一预设条件包括几何特征在第一预设范围内、不存在相邻连通区块以及不属于数字字母区域,所述第二预设条件包括几何特征在第二预设范围内,所述第一预设范围小于所述第二预设范围,所述几何特征包括高度、宽度、面积、投影长度和/或实际像素占包围框的面积比。
上述各模块、单元被执行时所实现的功能或操作步骤与上述方法实施例大体相同,在此不再赘述。
综上,本发明上述实施例当中的图像噪点识别装置,通过利用人工智能方法全面升级去噪方法,包括基于图像处理的表格检测,基于深度学习算法对扫描图像进行智能分类(文档、表格、证书、图纸、其他),识别图像的正文区域与边缘区域,再根据文字块在不同区域,采用不同的预设值和噪点识别策略,避免采用传统一刀切的方式来识别噪点,可以有效降低噪点的误识别概率,同时当前方案的噪点识别率相比原有方案提升了至少10%。
本发明实施例还提出一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述的图像噪点识别方法。
本发明实施例还提出一种图像噪点识别设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述的图像噪点识别方法。
示例而非限定,所述图像噪点识别设备具体可以为扫描设备(如打印机)、或能够处理扫描图像的计算机设备(例如电脑、笔记本等等)。具体地,处理器在一些实施例中可以是一中央处理器(Central Processing Unit, CPU)、控制器、微控制器、微处理器或其他图像噪点识别芯片,用于运行存储器中存储的程序代码或处理数据。
其中,存储器至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、磁性存储器、磁盘、光盘等。存储器在一些实施例中可以是图像噪点识别设备的内部存储单元,例如该图像噪点识别设备的硬盘。存储器在另一些实施例中也可以是图像噪点识别设备的外部存储设备,例如图像噪点识别设备上配备的插接式硬盘,智能存储卡(Smart Media Card, SMC),安全数字(SecureDigital, SD)卡,闪存卡(Flash Card)等。进一步地,存储器还可以既包括图像噪点识别设备的内部存储单元也包括外部存储设备。存储器不仅可以用于存储安装于图像噪点识别设备的应用软件及各类数据,还可以用于暂时地存储已经输出或者将要输出的数据。
可选地,该图像噪点识别设备还可以包括用户接口、网络接口、通信总线等,用户接口可以包括显示器(Display)、输入单元比如遥控器、实体按键等,可选的用户接口还可以包括标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在图像噪点识别设备中处理的信息以及用于显示可视化的用户界面。网络接口可选的可以包括标准的有线接口、无线接口(如WI-FI接口),通常用于在该图像噪点识别设备与其他电子设备之间建立通信连接。通信总线用于实现这些组件之间的连接通信。
综上,本发明上述实施例当中的图像噪点识别设备,通过利用人工智能方法全面升级去噪方法,包括基于图像处理的表格检测,基于深度学习算法对扫描图像进行智能分类(文档、表格、证书、图纸、其他),识别图像的正文区域与边缘区域,再根据文字块在不同区域,采用不同的预设值和噪点识别策略,避免采用传统一刀切的方式来识别噪点,可以有效降低噪点的误识别概率,同时当前方案的噪点识别率相比原有方案提升了至少10%。
本领域技术人员可以理解,在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。
计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或它们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、 “示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
以上实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
Claims (8)
1.一种图像噪点识别方法,其特征在于,所述方法包括:
获取扫描图像,基于深度学习方法对所述扫描图像进行类型识别,并判断所述扫描图像是否为预设类型,所述扫描图像的分类包括文档、表格、证书和图纸,所述预设类型包括文档和表格;
若是,则基于深度学习方法对所述扫描图像的正文区域和边缘区域进行识别,所述正文区域包括表格区域和文本区域;
对所述扫描图像进行二值化处理,再对二值化处理后的图像进行形态学膨胀处理,并对膨胀处理后的图像进行连通区块分析,得到若干个连通区块及其包围框坐标;
根据所述连通区块的包围框坐标,分别确定属于所述正文区域和所述边缘区域的连通区块;
利用第一预设条件对所述正文区域中的连通区块进行噪点识别,并利用第二预设条件对所述边缘区域中的连通区块进行噪点识别;
其中,所述第一预设条件包括几何特征在第一预设范围内、不存在相邻连通区块以及不属于数字字母区域,所述第二预设条件包括几何特征在第二预设范围内,所述第一预设范围小于所述第二预设范围,所述几何特征包括高度、宽度、面积、投影长度和/或实际像素占包围框的面积比。
2.根据权利要求1所述的图像噪点识别方法,其特征在于,在判断所述扫描图像是否为预设类型的步骤之后,还包括:
若否,则发出供用户确认是否执行所述对所述扫描图像的正文区域和边缘区域进行识别的提示信息。
3.根据权利要求1所述的图像噪点识别方法,其特征在于,在对所述扫描图像进行二值化处理,再对二值化处理后的图像进行形态学膨胀处理,并对膨胀处理后的图像进行连通区块分析,得到若干个连通区块及其包围框坐标的步骤之后,还包括:
根据所述连通区块的尺寸参数和预设参数范围,对所述连通区块进行筛选。
4.根据权利要求3所述的图像噪点识别方法,其特征在于,根据所述连通区块的尺寸参数和预设参数范围,对所述连通区块进行筛选的步骤包括:
根据所述连通区块的尺寸参数和预设参数范围,确定所述连通区块的尺寸等级;
将属于预设的最小尺寸等级的连通区块确定为噪点,并将属于预设的最大尺寸等级的连通区块排除;
其中,已确定为噪点的连通区块和已经排除的连通区块不再继续对其进行噪点分析。
5.根据权利要求1所述的图像噪点识别方法,其特征在于,所述利用第一预设条件对所述正文区域中的连通区块进行噪点识别的步骤包括:
遍历所述正文区域中的每个连通区块;
将所述正文区域中满足所述第一预设条件的连通区块判定为噪点;
其中,所述利用第二预设条件对所述边缘区域中的连通区块进行噪点识别的步骤包括:
遍历所述边缘区域中的每个连通区块;
将所述边缘区域中满足所述第二预设条件的连通区块判定为噪点。
6.一种图像噪点识别装置,其特征在于,所述装置包括:
区域识别模块,用于获取扫描图像,并对所述扫描图像的正文区域和边缘区域进行识别,所述正文区域包括表格区域和文本区域;
区块分析模块,用于对所述扫描图像进行二值化处理,再对二值化处理后的图像进行形态学膨胀处理,并对膨胀处理后的图像进行连通区块分析,得到若干个连通区块及其包围框坐标;
区块划分模块,用于根据所述连通区块的包围框坐标,分别确定属于所述正文区域和所述边缘区域的连通区块;
噪点识别模块,用于利用第一预设条件对所述正文区域中的连通区块进行噪点识别,并利用第二预设条件对所述边缘区域中的连通区块进行噪点识别;
其中,所述第一预设条件包括几何特征在第一预设范围内、不存在相邻连通区块以及不属于数字字母区域,所述第二预设条件包括几何特征在第二预设范围内,所述第一预设范围小于所述第二预设范围,所述几何特征包括高度、宽度、面积、投影长度和/或实际像素占包围框的面积比;
所述图像噪点识别装置还包括:
类型识别模块,用于对所述扫描图像进行类型识别,并判断所述扫描图像是否为预设类型;当所述类型识别模块判断到所述扫描图像的类型为预设类型,则所述区域识别模块对所述扫描图像的正文区域和边缘区域进行识别。
7.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-5任一所述的方法。
8.一种图像噪点识别设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-5任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011366980.9A CN112215783B (zh) | 2020-11-30 | 2020-11-30 | 一种图像噪点识别方法、装置、存储介质及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011366980.9A CN112215783B (zh) | 2020-11-30 | 2020-11-30 | 一种图像噪点识别方法、装置、存储介质及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112215783A CN112215783A (zh) | 2021-01-12 |
CN112215783B true CN112215783B (zh) | 2021-03-09 |
Family
ID=74068193
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011366980.9A Active CN112215783B (zh) | 2020-11-30 | 2020-11-30 | 一种图像噪点识别方法、装置、存储介质及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112215783B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101262549A (zh) * | 2007-03-09 | 2008-09-10 | 夏普株式会社 | 图像处理装置及处理方法、图像形成装置及记录介质 |
CN107832757A (zh) * | 2017-11-03 | 2018-03-23 | 深圳航天信息有限公司 | 一种发票图像的识别方法 |
CN110047083A (zh) * | 2019-04-01 | 2019-07-23 | 江西博微新技术有限公司 | 图像噪点识别方法、服务器及存储介质 |
CN111681257A (zh) * | 2020-05-18 | 2020-09-18 | 浙江大学 | 一种基于连通域的印刷文本图文分割方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009044616A (ja) * | 2007-08-10 | 2009-02-26 | Konica Minolta Business Technologies Inc | 画像処理装置および画像処理方法 |
KR102179435B1 (ko) * | 2018-11-07 | 2020-11-16 | 주식회사 지디에프랩 | 오염된 차량 번호판 인식이 가능한 이미지 인식 장치 |
-
2020
- 2020-11-30 CN CN202011366980.9A patent/CN112215783B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101262549A (zh) * | 2007-03-09 | 2008-09-10 | 夏普株式会社 | 图像处理装置及处理方法、图像形成装置及记录介质 |
CN107832757A (zh) * | 2017-11-03 | 2018-03-23 | 深圳航天信息有限公司 | 一种发票图像的识别方法 |
CN110047083A (zh) * | 2019-04-01 | 2019-07-23 | 江西博微新技术有限公司 | 图像噪点识别方法、服务器及存储介质 |
CN111681257A (zh) * | 2020-05-18 | 2020-09-18 | 浙江大学 | 一种基于连通域的印刷文本图文分割方法 |
Also Published As
Publication number | Publication date |
---|---|
CN112215783A (zh) | 2021-01-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6139396B2 (ja) | 文書を表す二値画像を圧縮する方法及びプログラム | |
US9158986B2 (en) | Character segmentation device and character segmentation method | |
JP5492205B2 (ja) | 印刷媒体ページの記事へのセグメント化 | |
US8947736B2 (en) | Method for binarizing scanned document images containing gray or light colored text printed with halftone pattern | |
US9171224B2 (en) | Method of improving contrast for text extraction and recognition applications | |
JP5455038B2 (ja) | 画像処理装置、画像処理方法、及びプログラム | |
US9965695B1 (en) | Document image binarization method based on content type separation | |
US20140193029A1 (en) | Text Detection in Images of Graphical User Interfaces | |
CN101122953A (zh) | 一种图片文字分割的方法 | |
CN110942074A (zh) | 字符切分识别方法、装置、电子设备、存储介质 | |
JP2002133426A (ja) | 多値画像から罫線を抽出する罫線抽出装置 | |
US11151402B2 (en) | Method of character recognition in written document | |
CN107766854B (zh) | 一种基于模板匹配实现快速页码识别的方法 | |
CN110598566A (zh) | 图像处理方法、装置、终端和计算机可读存储介质 | |
CN112507782A (zh) | 文本图像的识别方法及装置 | |
CN113688838B (zh) | 红色笔迹提取方法、系统、可读存储介质及计算机设备 | |
CN111507344A (zh) | 从图像中识别出文字的方法和装置 | |
CN113139535A (zh) | 一种ocr文档识别方法 | |
KR101571681B1 (ko) | 동질 영역을 이용한 문서 구조의 분석 방법 | |
Grover et al. | Text extraction from document images using edge information | |
Shi et al. | Image enhancement for degraded binary document images | |
JP2010186246A (ja) | 画像処理装置、方法、及び、プログラム | |
CN112215783B (zh) | 一种图像噪点识别方法、装置、存储介质及设备 | |
KR20150099116A (ko) | Ocr를 이용한 컬러 문자 인식 방법 및 그 장치 | |
Marinai | Learning algorithms for document layout analysis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |