CN112541435B - 一种图像处理的方法、装置和存储介质 - Google Patents

一种图像处理的方法、装置和存储介质 Download PDF

Info

Publication number
CN112541435B
CN112541435B CN202011470752.6A CN202011470752A CN112541435B CN 112541435 B CN112541435 B CN 112541435B CN 202011470752 A CN202011470752 A CN 202011470752A CN 112541435 B CN112541435 B CN 112541435B
Authority
CN
China
Prior art keywords
image
pixel
intersection
mask image
processed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011470752.6A
Other languages
English (en)
Other versions
CN112541435A (zh
Inventor
常战国
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beike Technology Co Ltd
Original Assignee
Beike Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beike Technology Co Ltd filed Critical Beike Technology Co Ltd
Priority to CN202011470752.6A priority Critical patent/CN112541435B/zh
Publication of CN112541435A publication Critical patent/CN112541435A/zh
Application granted granted Critical
Publication of CN112541435B publication Critical patent/CN112541435B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/28Quantising the image, e.g. histogram thresholding for discrimination between background and foreground patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Image Analysis (AREA)

Abstract

本申请公开了一种图像处理的方法、装置和存储介质,具体为获取待处理图像,其次,基于待处理图像,生成与待处理图像对应的交点掩膜图像,其中,交点掩模图像中的每个交点对应至少一个具有第一像素值的像素,然后,以交点掩模图像中的任意位置为起始位置遍历交点掩模图像,获取第一像素值所在的像素块的数量,最后,当像素块的数量小于预设数值时,过滤对应的所述待处理图像。本申请实施例通过统计待处理图像中的表格框线之间的交点个数对待处理图像的清晰度做出判断,提升识别准确率且降低了算法的时间复杂度。

Description

一种图像处理的方法、装置和存储介质
技术领域
本申请涉及计算机技术领域,尤其涉及一种图像处理的方法、装置和存储介质。
背景技术
在对表格类文字进行检测识别过程中,可能存在由于图片质量差如图片模糊等原因造成识别正确率较低的情况。而若在识别阶段发现不清晰时再重新选择可能需要耗费较长时间。可通过对图片清晰度进行判断和过滤筛选出清晰度较高的图片,但若是在移动端进行图片的清晰度判断,现有的算法普遍计算量较大或时间复杂度高,在移动端不能完全适用。
发明内容
本申请实施例提供了一种图像处理的方法,克服了在移动端不能高效准确判断图像清晰度的问题。
该方法包括:
获取待处理图像;
基于所述待处理图像,生成与所述待处理图像对应的交点掩膜图像,其中,所述交点掩模图像中的每个交点对应至少一个具有第一像素值的像素;
以所述交点掩模图像中的任意位置为起始位置遍历所述交点掩模图像,获取第一像素值所在的像素块的数量;
当所述像素块的数量小于预设数值时,过滤对应的所述待处理图像。
可选地,对所述待处理图像的灰度图像进行二值化处理,生成所述待处理图像对应的阈值图像;
提取所述阈值图像中的水平框线和竖直框线,并基于所述水平框线和所述竖直框线交叉生成所述待处理图像对应的单元格掩模图像;
基于所述单元格掩模图像中的所述水平框线和所述竖直框线形成的交点,生成所述交点掩膜图像,其中,所述交点掩模图像通过具有所述第一像素值的所述像素和/或具有第二像素值的所述像素获取。
可选地,当在所述交点掩模图像中沿所述任意位置的行方向和/或竖方向遍历到具有所述第一像素值的所述像素,且沿该具有所述第一像素值的所述像素的遍历方向的下一个相邻位置的像素值为所述第一像素值时持续遍历,直至沿所述遍历方向的下一个相邻位置的像素值为所述第二像素值时,将所述第一像素值所在位置的所述像素连续为所述像素块,并在满足遍历终止条件时,统计所述像素块的数量。
可选地,在对所述交点掩模图像进行遍历时,设置行索引和列索引,使用所述行索引对所述交点掩模图像中的行进行遍历,以及使用所述列索引对所述交点掩模图像中的列进行遍历,将所述行索引和列索引均遍历过的所述位置的所述像素值置为预设像素值;
当所述行索引和所述列索引分别对应的最小值均小于所述交点掩模图像的第一边界值且所述行索引和所述列索引分别对应的最大值均大于所述交点掩模图像的第二边界值时停止遍历,和/或,当所述交点掩模图像中包含的全部所述像素值均为预设像素值时停止遍历。
在本发明的另一个实施例中,提供了一种图像处理的装置,该装置包括:
获取模块,用于获取待处理图像;
生成模块,用于基于所述待处理图像,生成与所述待处理图像对应的交点掩膜图像,其中,所述交点掩模图像中的每个交点对应至少一个具有第一像素值的像素;
统计模块,用于以所述交点掩模图像中的任意位置为起始位置遍历所述交点掩模图像,获取第一像素值所在的像素块的数量;
过滤模块,用于当所述像素块的数量小于预设数值时,过滤对应的所述待处理图像。
可选地,所述生成模块包括:
第一生成单元,用于对所述待处理图像的灰度图像进行二值化处理,生成所述待处理图像对应的阈值图像;
第一生成单元,用于提取所述阈值图像中的水平框线和竖直框线,并基于所述水平框线和所述竖直框线交叉生成所述待处理图像对应的单元格掩模图像;
第三生成单元,用于基于所述单元格掩模图像中的所述水平框线和所述竖直框线形成的交点,生成所述交点掩膜图像,其中,所述交点掩模图像通过具有所述第一像素值的所述像素和/或具有第二像素值的所述像素获取。
可选地,所述统计模块进一步用于:
当在所述交点掩模图像中沿所述任意位置的行方向和/或竖方向遍历到具有所述第一像素值的所述像素,且沿该具有所述第一像素值的所述像素的遍历方向的下一个相邻位置的像素值为所述第一像素值时持续遍历,直至沿所述遍历方向的下一个相邻位置的像素值为所述第二像素值时,将所述第一像素值所在位置的所述像素连续为所述像素块,并在满足遍历终止条件时,统计所述像素块的数量。
可选地,所述统计模块还用于:
在对所述交点掩模图像进行遍历时,设置行索引和列索引,使用所述行索引对所述交点掩模图像中的行进行遍历,以及使用所述列索引对所述交点掩模图像中的列进行遍历,将所述行索引和列索引均遍历过的所述位置的所述像素值置为预设像素值;
当所述行索引和所述列索引分别对应的最小值均小于所述交点掩模图像的第一边界值且所述行索引和所述列索引分别对应的最大值均大于所述交点掩模图像的第二边界值时停止遍历,和/或,当所述交点掩模图像中包含的全部所述像素值均为预设像素值时停止遍历。
在本发明的另一个实施例中,提供了一种非瞬时计算机可读存储介质,所述非瞬时计算机可读存储介质存储指令,所述指令在由处理器执行时使得所述处理器执行上述一种图像处理的方法中的各个步骤。
在本发明的另一个实施例中,提供了一种终端设备,包括处理器,所述处理器用于执行上述一种图像处理的方法中的各个步骤。
基于上述实施例,首先获取待处理图像,其次,基于待处理图像,生成与待处理图像对应的交点掩膜图像,其中,交点掩模图像中的每个交点对应至少一个具有第一像素值的像素,然后,以交点掩模图像中的任意位置为起始位置遍历交点掩模图像,获取第一像素值所在的像素块的数量,最后,当像素块的数量小于预设数值时,过滤对应的所述待处理图像。本申请实施例通过统计待处理图像中的表格框线之间的交点个数对待处理图像的清晰度做出判断,提升识别准确率且降低了算法的时间复杂度。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了为本申请实施例100所提供的一种图像处理的方法的流程示意图;
图2示出了本申请实施例200提供的一种图像处理的方法的具体流程的示意图;
图3示出了本申请实施例300提供的将待处理图像转化为阈值图像的示意图;
图4示出了本申请实施例400提供的生成单元格掩模图像的示意图;
图5示出了本申请实施例500提供的交点掩模图像的示意图;
图6示出了本申请实施例600提供的移动端适用图像处理的方法的示意图;
图7示出了本申请实施例700还提供一种图像处理的装置的示意图;
图8示出了本申请实施例800所提供的一种终端设备的示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含。例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其他步骤或单元。
基于现有技术中的问题,本申请实施例提供了一种图像处理的方法,主要适用于计算机技术领域。通过形态学操作提取待处理图像中的水平框线和竖直框线,处理形成交点掩模图像,通过统计交点掩模图像中的交点的个数,对待处理图像的清晰度进行判断。在保证准确率的同时降低算法的复杂度,主要适用于移动端的图像清晰度判断。以下几个具体实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。如图1所示,为本申请实施例100提供的一种图像处理的方法的流程示意图。其中,详细步骤如下:
步骤S11,获取待处理图像。
本步骤中,本申请实施例中的待处理图像主要为含有表格的表格类图像。待处理图像主要为在移动端获取得需要判断清晰度的图像。
步骤S12,基于待处理图像,生成与待处理图像对应的交点掩膜图像,其中,交点掩模图像中的每个交点对应至少一个具有第一像素值的像素。
本步骤中,对获取的待处理图像进行处理,提取其中的水平框线和竖直框线,获取由水平框线和竖直框线交叉形成的各个交点。进一步地,由各个交点组成待处理图像对应的交点掩模图像。其中,交点掩模图像中的每个交点对应一个像素块,该像素块中包含至少一个具有第一像素值的像素,像素块也可包含多个第一像素值。除交点对应的位置,交点掩模图像中的其他位置的像素值为第二像素值。
步骤S13,以交点掩模图像中的任意位置为起始位置遍历交点掩模图像,获取第一像素值所在的像素块的数量。
本步骤中,在交点掩模图像中的任意位置沿遍历方向按行遍历和/或按列遍历交点掩模图像中的各个像素值,将其中第一像素值组成的像素块的数量作为交点掩模图像中交点的数量。其中,交点掩模图像可以由具有第一像素值的像素和/或具有第二像素值的像素组成。
步骤S14,当像素块的数量小于预设数值时,过滤对应的待处理图像。
本步骤中,基于像素块即交点的数量判断待处理图像的清晰度。其中,预设数值可基于业务需要设置。当待处理图像对应的像素块的数量小于预设数值时,确定该待处理图像的清晰度较低,并对该待处理图像进行过滤。
如上所述,基于上述实施例,首先获取待处理图像,其次,基于待处理图像,生成与待处理图像对应的交点掩膜图像,其中,交点掩模图像中的每个交点对应至少一个具有第一像素值的像素,然后,以交点掩模图像中的任意位置为起始位置遍历交点掩模图像,获取第一像素值所在的像素块的数量,最后,当像素块的数量小于预设数值时,过滤对应的所述待处理图像。本申请实施例通过统计待处理图像中的表格框线之间的交点个数对待处理图像的清晰度做出判断,提升识别准确率且降低了算法的时间复杂度。
如图2所示,为本申请实施例200提供的一种图像处理的方法的具体流程的示意图。其中,该具体流程的详细过程如下:
S201,获取待处理图像。
这里,本申请实施例中的待处理图像主要为表格类图像。
S202,生成待处理图像对应的阈值图像。
本步骤中,将获取的待处理图像转化为灰度图像后,对待处理图像的灰度图像进行二值化处理,生成待处理图像对应的阈值图像。具体地,将灰度图像通过自适应滤波器,对灰度图像进行二值化处理。即将待处理图像图像上的每个像素点的值置为0或255,使待处理图像呈现出明显的黑白效果。进一步地,将256个亮度等级的灰度图像通过适当的阀值选取而获得仍然可以反映图像整体和局部特征的二值化图像。如图3所示,为本申请实施例300示出的将待处理图像转化为阈值图像的示意图。
S203,生成单元格掩模图像。
这里,提取阈值图像中的水平框线和竖直框线,并基于水平框线和竖直框线交叉生成待处理图像对应的单元格掩模图像。具体地,使用opencv对阈值图像进行图像形态学操作,可以通过自定义的结构元素实现结构元素对阈值图像中一些对象敏感,另外一些对象不敏感,这样就会让敏感的对象改变而不敏感的对象保留输出。通过使用两个最基本的形态学操作膨胀与腐蚀操作生成水平框线和竖直框线,并基于水平框线和数值框线交叉生成阈值图像的单元格掩模图像。如图4所示,为本申请实施例400示出的生成单元格掩模图像的示意图。其中,将进行图像形态学操作后提取的水平框线和竖直框线进行排列交叉生成阈值图像对应的单元格掩模图像。
S204,生成交点掩模图像。
这里,基于单元格掩模图像中的水平框线和竖直框线形成的交点,生成仅包含该待处理图像经过处理后对应的交点的交点掩膜图像,其中,交点掩模图像通过具有第一像素值的像素和/或具有第二像素值的像素获取。具体地,每个交点对应一个或多个像素点,当交点掩模图像中存在交点时,交点对应的每个像素点的值为第一像素值。本申请实施例中的第一像素值的最佳赋值为255,第二像素值的最佳赋值为0。当在交点掩模图像中不存在交点时,则其中像素点的值均为第二像素值。如图5所示,为本申请实施例500示出的交点掩模图像的示意图。其中,第一像素值和第二像素值为交点掩模图像中的内部数据。
S205,以交点掩模图像中的任意位置为起始位置遍历交点掩模图像,统计第一像素值所在的像素块的数量。
这里,在交点掩模图像中,第一像素值组成的每一像素块为一个交点,统计像素块的数量即可获取交点的数量。具体地,在交点掩模图像中遍历查询第一像素值,统计第一像素值所在的像素块的数量的步骤为:
当在交点掩模图像中遍历到具有第一像素值的像素,且沿该第一像素值所在的像素的像素点的遍历方向的下一个相邻位置的像素值为第一像素值时持续遍历,直至沿遍历方向的下一个相邻位置的像素值为第二像素值时,将第一像素值所在的位置连续为像素块,并在满足遍历终止条件时,统计像素块的数量。
具体地,在交点掩膜图像对应的内部数据中,以任意位置为起始,采用深度优先遍历算法(Depth-First-Search,DFS)从图5中的内部数据形成的矩阵中任意位置按行或/和按列的四个方向进行遍历,统计其中由第一像素值255形成的像素块的数量。其中,第一像素值的相邻位置若也为第一像素值,则组成一个像素块。像素块可由一个第一像素值组成,也可以为相邻的多个第一像素值组成。当满足遍历的终止条件时,终止遍历。
进一步地,在对交点掩模图像进行遍历时,设置行索引和列索引,并使用行索引对交点掩模图像中的行进行遍历,以及使用列索引对交点掩模图像中的列进行遍历,将行索引和列索引均遍历过的位置的像素值置为预设像素值,本申请实施例中的预设像素值的最佳取值为0。当行索引和列索引分别对应的最小值均小于交点掩模图像的第一边界值且行索引和列索引分别对应的最大值均大于交点掩模图像的第二边界值时,和/或交点掩模图像中包含的全部像素值均为0时停止遍历。具体地,采用DFS深度优先遍历算法,设置i,j分别为行索引和列索引,以及设置m,n分别为如图5中的内部数据形成的矩阵的矩阵高和宽矩阵。当满足搜索条件时,将搜索过的像素点的像素值置为0,继续向四个方向递归搜索。遍历的终止条件为索引搜索越界且搜索边界为0,和/或交点掩模图像中包含的全部像素值均为0。即imin<0,jmin<0且imax>n,jmax>m时表示索引搜索越界且搜索边界为0,或/且交点掩模图像中包含的全部像素值均为0。
S206,当像素块的数量小于预设数值时,过滤对应的待处理图像。
这里,基于业务需要设置判断清晰度的预设数值,如可设置预设数值为50,当像素块的数量大于预设数值是则为清晰,其余情况为模糊。为模糊时,过滤该待处理图像。进一步地,本申请实施例中的图像处理的方法主要适用于移动端,即需在android等移动端部署首先配置opencv for android等,从移动端相册读取或者拍照获取待处理图像。如图6所示,为本申请实施例600示出的移动端适用图像处理的方法的示意图。
本申请实施例中的一种图像处理的方法,通过在移动端前置图像质量的判断流程,通过自适应滤波器处理灰度图像后,采用opencv膨胀腐蚀等形态学操作提取表格中的水平框线和竖直框线,之后合并为交点掩膜图像,通过深度优先算法计算交点掩膜图像中交点的个数,根据计算的交点个数与预设数值判定表格类图片的清晰度。在移动端使用opencv对表格进行检测,之后通过计算表格框线之间的交点个数对表格清晰度做出判断,保证准确率的同时,也大大降低了算法的时间复杂度,提高了表格类图像最终光学字符识别的正确率。
基于同一发明构思,本申请实施例700还提供一种图像处理的装置,其中,如图7所示,该装置包括:
获取模块71,用于获取待处理图像;
生成模块72,用于基于待处理图像,生成与待处理图像对应的交点掩膜图像,其中,交点掩模图像中的每个交点对应至少一个具有第一像素值的像素;
统计模块73,用于以交点掩模图像中的任意位置为起始位置遍历交点掩模图像,获取第一像素值所在的像素块的数量;
过滤模块74,用于当像素块的数量小于预设数值时,过滤对应的待处理图像。
本实施例中,获取模块71、生成模块72、统计模块73和过滤模块74的具体功能和交互方式,可参见图1对应的实施例的记载,在此不再赘述。
可选地,生成模块72包括:
第一生成单元,用于对待处理图像的灰度图像进行二值化处理,生成待处理图像对应的阈值图像;
第一生成单元,用于提取阈值图像中的水平框线和竖直框线,并基于水平框线和竖直框线交叉生成待处理图像对应的单元格掩模图像;
第三生成单元,用于基于单元格掩模图像中的水平框线和竖直框线形成的交点,生成所述交点掩膜图像,其中,交点掩模图像通过具有第一像素值的像素和/或具有第二像素值的像素获取。
可选地,统计模块73进一步用于:
当在交点掩模图像中沿任意位置的行方向和/或竖方向遍历到具有第一像素值的像素,且沿该具有第一像素值的像素的遍历方向的下一个相邻位置的像素值为第一像素值时持续遍历,直至沿遍历方向的下一个相邻位置的像素值为第二像素值时,将第一像素值所在位置的像素连续为所述像素块,并在满足遍历终止条件时,统计像素块的数量。
可选地,统计模块73还用于:
在对交点掩模图像进行遍历时,设置行索引和列索引,使用行索引对交点掩模图像中的行进行遍历,以及使用列索引对交点掩模图像中的列进行遍历,将行索引和列索引均遍历过的位置的像素值置为预设像素值;
当行索引和列索引分别对应的最小值均小于交点掩模图像的第一边界值且行索引和列索引分别对应的最大值均大于交点掩模图像的第二边界值时停止遍历,和/或,当交点掩模图像中包含的全部像素值均为预设像素值时停止遍历。
如图8所示,本申请的又一实施例800还提供一种终端设备,包括处理器801,其中,处理器801用于执行上述一种图像处理的方法的步骤。从图8中还可以看出,上述实施例提供的终端设备还包括非瞬时计算机可读存储介质802,该非瞬时计算机可读存储介质802上存储有计算机程序,该计算机程序被处理器801运行时执行上述一种图像处理的方法的步骤。实际应用中,该终端设备可以是一台或多台计算机,只要包括上述计算机可读介质和处理器即可。
具体地,该存储介质能够为通用的存储介质,如移动磁盘、硬盘和FLASH等,该存储介质上的计算机程序被运行时,能够执行上述的一种图像处理的方法中的各个步骤。实际应用中,所述的计算机可读介质可以是上述实施例中描述的设备/装置/系统中所包含的,也可以是单独存在,而未装配入该设备/装置/系统中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或多个程序被执行时,能够执行上述的一种图像处理的方法中的各个步骤。
根据本申请公开的实施例,计算机可读存储介质可以是非易失性的计算机可读存储介质,例如可以包括但不限于:便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件,或者上述的任意合适的组合,但不用于限制本申请保护的范围。在本申请公开的实施例中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
本申请附图中的流程图和框图,示出了按照本申请公开的各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或者代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应该注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同附图中所标注的顺序发生。例如,两个连接地表示的方框实际上可以基本并行地执行,它们有时也可以按照相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或者流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
本领域技术人员可以理解,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合,即使这样的组合或结合没有明确记载于本申请中。特别地,在不脱离本申请精神和教导的情况下,本申请的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合,所有这些组合和/或结合均落入本申请公开的范围。
最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行变更或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些变更、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围,都应涵盖在本申请的保护范围之内。

Claims (10)

1.一种图像处理的方法,其特征在于,包括:
获取待处理图像,所述待处理图像为含有表格的表格类图像;
基于所述待处理图像,生成与所述待处理图像对应的交点掩膜图像,其中,所述交点掩模图像是由所述待处理图像中水平框线和竖直框线形成交点,由各个交点组成的图像;每个交点对应一个像素块,该像素块包含至少一个具有第一像素值的像素,除交点的其他位置的像素值为第二像素值;
以所述交点掩模图像中的任意位置为起始位置遍历所述交点掩模图像,获取第一像素值所在的像素块的数量;
基于所述像素块的数量判断所述待处理图像的清晰度,当所述像素块的数量小于预设数值时,过滤对应的所述待处理图像。
2.根据权利要求1所述的方法,其特征在于,所述生成与所述待处理图像对应的交点掩膜图像的步骤包括:
对所述待处理图像的灰度图像进行二值化处理,生成所述待处理图像对应的阈值图像;
提取所述阈值图像中的所述水平框线和所述竖直框线,并基于所述水平框线和所述竖直框线交叉生成所述待处理图像对应的单元格掩模图像;
基于所述单元格掩模图像中的所述水平框线和所述竖直框线形成的交点,生成所述交点掩膜图像,其中,所述交点掩模图像通过具有所述第一像素值的所述像素和/或具有第二像素值的所述像素获取。
3.根据权利要求2所述的方法,其特征在于,所述获取第一像素值所在的像素块的数量的步骤包括:
当在所述交点掩模图像中沿所述任意位置的行方向和/或竖方向遍历到具有所述第一像素值的所述像素,且沿该具有所述第一像素值的所述像素的遍历方向的下一个相邻位置的像素值为所述第一像素值时持续遍历,直至沿所述遍历方向的下一个相邻位置的像素值为所述第二像素值时,将所述第一像素值所在位置的所述像素连续为所述像素块,并在满足遍历终止条件时,统计所述像素块的数量。
4.根据权利要求3所述的方法,其特征在于,所述遍历终止条件包括:
在对所述交点掩模图像进行遍历时,设置行索引和列索引,使用所述行索引对所述交点掩模图像中的行进行遍历,以及使用所述列索引对所述交点掩模图像中的列进行遍历,将所述行索引和列索引均遍历过的所述位置的所述像素值置为预设像素值;
当所述行索引和所述列索引分别对应的最小值均小于所述交点掩模图像的第一边界值且所述行索引和所述列索引分别对应的最大值均大于所述交点掩模图像的第二边界值时停止遍历,和/或,当所述交点掩模图像中包含的全部所述像素值均为预设像素值时停止遍历。
5.一种图像处理装置,其特征在于,包括:
获取模块,用于获取待处理图像,所述待处理图像为含有表格的表格类图像;
生成模块,用于基于所述待处理图像,生成与所述待处理图像对应的交点掩膜图像,其中,所述交点掩模图像是由所述待处理图像中水平框线和竖直框线形成交点,由各个交点组成的图像;每个交点对应一个像素块,该像素块包含至少一个具有第一像素值的像素,除交点的其他位置的像素值为第二像素值;
统计模块,用于以所述交点掩模图像中的任意位置为起始位置遍历所述交点掩模图像,获取第一像素值所在的像素块的数量;
过滤模块,用于基于所述像素块的数量判断所述待处理图像的清晰度,当所述像素块的数量小于预设数值时,过滤对应的所述待处理图像。
6.根据权利要求5所述的装置,其特征在于,所述生成模块包括:
第一生成单元,用于对所述待处理图像的灰度图像进行二值化处理,生成所述待处理图像对应的阈值图像;
第一生成单元,用于提取所述阈值图像中的水平框线和竖直框线,并基于所述水平框线和所述竖直框线交叉生成所述待处理图像对应的单元格掩模图像;
第三生成单元,用于基于所述单元格掩模图像中的所述水平框线和所述竖直框线形成的交点,生成所述交点掩膜图像,其中,所述交点掩模图像通过具有所述第一像素值的所述像素和/或具有第二像素值的所述像素获取。
7.根据权利要求6所述的装置,其特征在于,所述统计模块进一步用于:
当在所述交点掩模图像中沿所述任意位置的行方向和/或竖方向遍历到具有所述第一像素值的所述像素,且沿该具有所述第一像素值的所述像素的遍历方向的下一个相邻位置的像素值为所述第一像素值时持续遍历,直至沿所述遍历方向的下一个相邻位置的像素值为所述第二像素值时,将所述第一像素值所在位置的所述像素连续为所述像素块,并在满足遍历终止条件时,统计所述像素块的数量。
8.根据权利要求7所述的装置,其特征在于,所述统计模块还用于:
在对所述交点掩模图像进行遍历时,设置行索引和列索引,使用所述行索引对所述交点掩模图像中的行进行遍历,以及使用所述列索引对所述交点掩模图像中的列进行遍历,将所述行索引和列索引均遍历过的所述位置的所述像素值置为预设像素值;
当所述行索引和所述列索引分别对应的最小值均小于所述交点掩模图像的第一边界值且所述行索引和所述列索引分别对应的最大值均大于所述交点掩模图像的第二边界值时停止遍历,和/或,当所述交点掩模图像中包含的全部所述像素值均为预设像素值时停止遍历。
9.一种非瞬时计算机可读存储介质,其特征在于,所述非瞬时计算机可读存储介质存储指令,所述指令在由处理器执行时使得所述处理器执行如权利要求1至4任一项所述的一种图像处理的方法中的各个步骤。
10.一种终端设备,其特征在于,包括处理器,所述处理器用于执行如权利要求1至4中任一项所述的一种图像处理的方法中的各个步骤。
CN202011470752.6A 2020-12-14 2020-12-14 一种图像处理的方法、装置和存储介质 Active CN112541435B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011470752.6A CN112541435B (zh) 2020-12-14 2020-12-14 一种图像处理的方法、装置和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011470752.6A CN112541435B (zh) 2020-12-14 2020-12-14 一种图像处理的方法、装置和存储介质

Publications (2)

Publication Number Publication Date
CN112541435A CN112541435A (zh) 2021-03-23
CN112541435B true CN112541435B (zh) 2023-03-28

Family

ID=75018698

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011470752.6A Active CN112541435B (zh) 2020-12-14 2020-12-14 一种图像处理的方法、装置和存储介质

Country Status (1)

Country Link
CN (1) CN112541435B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114663897A (zh) * 2022-04-07 2022-06-24 贝壳找房网(北京)信息技术有限公司 表格提取方法与表格提取系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109726643A (zh) * 2018-12-13 2019-05-07 北京金山数字娱乐科技有限公司 图像中表格信息的识别方法、装置、电子设备及存储介质
CN109726628A (zh) * 2018-11-05 2019-05-07 东北大学 一种表格图像的识别方法及系统
CN111311543A (zh) * 2020-01-17 2020-06-19 苏州科达科技股份有限公司 图像清晰度检测方法、系统、设备及存储介质
CN111428700A (zh) * 2020-06-10 2020-07-17 上海交通大学苏州人工智能研究院 表格识别方法、装置、电子设备、存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9842573B2 (en) * 2014-11-24 2017-12-12 Electronics And Telecommunications Research Institute Apparatus and method for gaussian filtering

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109726628A (zh) * 2018-11-05 2019-05-07 东北大学 一种表格图像的识别方法及系统
CN109726643A (zh) * 2018-12-13 2019-05-07 北京金山数字娱乐科技有限公司 图像中表格信息的识别方法、装置、电子设备及存储介质
CN111311543A (zh) * 2020-01-17 2020-06-19 苏州科达科技股份有限公司 图像清晰度检测方法、系统、设备及存储介质
CN111428700A (zh) * 2020-06-10 2020-07-17 上海交通大学苏州人工智能研究院 表格识别方法、装置、电子设备、存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
面向增值税发票的图像自动处理技术研究;谢志钢;《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》;20160215;正文第2-8章 *

Also Published As

Publication number Publication date
CN112541435A (zh) 2021-03-23

Similar Documents

Publication Publication Date Title
JP7026165B2 (ja) テキスト認識方法及びテキスト認識装置、電子設備、記憶媒体
CN108108734B (zh) 一种车牌识别方法及装置
CN109214229B (zh) 一种条码扫描方法、装置及电子设备
CN109325492B (zh) 字符切割方法、装置、计算机设备及存储介质
CN110197180B (zh) 字符缺陷检测方法、装置及设备
CN110223305B (zh) 细胞分割方法、装置及可读存储介质
CN108446702B (zh) 一种图像字符分割方法、装置、设备及存储介质
CN111159150A (zh) 一种数据扩充方法及装置
CN112541435B (zh) 一种图像处理的方法、装置和存储介质
CN109508571B (zh) 一种条空定位方法、装置、电子设备及存储介质
CN114357958A (zh) 一种表格提取方法、装置、设备及存储介质
CN113468905B (zh) 图形码识别方法、装置、计算机设备和存储介质
CN113643274B (zh) 一种二维码候选区筛选的方法及装置
JPS59136875A (ja) パタ−ン識別装置
CN108268868B (zh) 身份证图像的倾斜值获取方法及装置、终端、存储介质
CN111814795B (zh) 字符分割方法、装置及计算机可读存储介质
CN109033797B (zh) 一种权限设置方法及装置
CN110084117B (zh) 基于二值图分段投影的文档表格线检测方法、系统
CN111582034A (zh) 一种景物特征提取方法和设备
CN112700407B (zh) 一种确定图像清晰度的方法、装置和存储介质
CN108510636B (zh) 图像分割方法、图像分割装置及终端设备
CN116631003A (zh) 基于p&id图纸的设备识别方法、装置、存储介质及电子设备
CN108109120B (zh) 一种点阵二维码的光照补偿方法及装置
CN113537229B (zh) 票据图像生成方法、装置、计算机设备和存储介质
CN115797327A (zh) 一种缺陷检测方法、装置、终端设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant