CN112700407B - 一种确定图像清晰度的方法、装置和存储介质 - Google Patents

一种确定图像清晰度的方法、装置和存储介质 Download PDF

Info

Publication number
CN112700407B
CN112700407B CN202011477882.2A CN202011477882A CN112700407B CN 112700407 B CN112700407 B CN 112700407B CN 202011477882 A CN202011477882 A CN 202011477882A CN 112700407 B CN112700407 B CN 112700407B
Authority
CN
China
Prior art keywords
image
processed
coordinate information
line segment
closed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011477882.2A
Other languages
English (en)
Other versions
CN112700407A (zh
Inventor
常战国
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beike Technology Co Ltd
Original Assignee
Beike Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beike Technology Co Ltd filed Critical Beike Technology Co Ltd
Priority to CN202011477882.2A priority Critical patent/CN112700407B/zh
Publication of CN112700407A publication Critical patent/CN112700407A/zh
Application granted granted Critical
Publication of CN112700407B publication Critical patent/CN112700407B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/73Deblurring; Sharpening
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30176Document

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Quality & Reliability (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)

Abstract

本申请公开了一种确定图像清晰度的方法、装置和存储介质,具体为获取待处理图像中包含的线段的坐标信息,基于坐标信息对待处理图像中包含的线段进行排序以形成表格线,在表格线组成的线框图中遍历表格线在交叉时形成的交点,若交叉分布的表格线形成对任一表项区域的封闭包络、并且在该表项区域形成的交点数量至少为第一数量信息,则确定交叉分布的表格线在该表项区域形成闭合框,并获取闭合框的第二数量信息,获取线框图中除闭合框外的非闭合框的第三数量信息,基于第二数量信息和第三数量信息,计算待处理图像的清晰度。本申请实施例通过对图像中的表格形成的闭合框和非闭合框的数量进行统计,量化判断图片清晰度的标准,提升图片识别时的准确率。

Description

一种确定图像清晰度的方法、装置和存储介质
技术领域
本申请涉及计算机技术领域,尤其涉及一种确定图像清晰度的方法、装置和存储介质。
背景技术
在对表格类文字进行检测识别过程中,可能存在由于图片质量差如图片模糊等原因造成识别正确率较低的情况。而若在识别阶段发现不清晰时再重新选择可能需要耗费较长时间。进一步地,可以前置图片质量判断的过程,即对图片质量作出判断,过滤掉模糊的图片以提高最终准确率。但对于图片质量的判断均出于主观感受,无法量化判断,可能降低识别效率和准确率。
发明内容
本申请实施例提供了一种确定图像清晰度的方法,克服了无法量化判断图片质量的问题。
该方法包括:
获取待处理图像中包含的至少一条线段的坐标信息,并基于所述坐标信息对所述待处理图像中包含的所述线段进行排序以形成表格线;
在所述表格线组成的线框图中遍历所述表格线在交叉时形成的交点;
若交叉分布的所述表格线形成对任一表项区域的封闭包络、并且在该所述表项区域形成的所述交点的数量至少为第一数量信息,则确定交叉分布的所述表格线在该所述表项区域形成闭合框,并获取所述待处理图像中包含的所述闭合框的第二数量信息;
获取所述线框图中除所述闭合框外的非闭合框的第三数量信息;
基于所述第二数量信息和所述第三数量信息,计算所述待处理图像的清晰度。
可选地,利用预先训练的线框检测模型对所述待处理图像进行框线检测,并获取所述待处理图像包含的所述线段的所述坐标信息,所述坐标信息包括首端点坐标信息和尾端点坐标信息,以及,所述线段包含横线段和竖线段,其中将所述首端点坐标信息和所述尾端点坐标信息中横坐标的差值在第一预设范围内的所述线段确定为所述横线段,将纵坐标的差值在所述第一预设范围内的所述线段确定为所述竖线段。
可选地,基于至少一条所述线段的所述首端点坐标信息和所述尾端点坐标信息,计算所述线段对应的斜率;
分别计算所述待处理图像中包含的所述横线段对应的第一平均斜率和所述竖线段对应的第二平均斜率,在至少一条所述横线段对应的所述斜率与所述第一平均斜率的差值大于第二预设范围时,过滤该所述横线段,以及,在至少一条所述竖线段对应的所述斜率与所述第二平均斜率的差值大于所述第二预设范围时,过滤该所述竖线段;
遍历所述待处理图像中包含的所述线段,当至少一个所述横线段的所述尾端点坐标信息和相邻的所述横线段的所述首端点坐标信息间的差值在第三预设范围内时,依次连接所述横线段并形成所述线框图中的横表格线,以及,当至少一个所述竖线段的所述尾端点坐标信息和相邻的所述竖线段的所述首端点坐标信息间的差值在第三预设范围内时,依次连接所述竖线段并形成所述线框图中的竖表格线。
可选地,将位于所述线框图中的所述横表格线和所述竖表格线中的首个所述交点和尾部最后一个所述交点作为边界交点;
遍历所述边界交点,判断所述边界交点所在的交叉的所述表格线与相邻的所述表格线形成的任一表项区域是否为开放包络,若为所述开放包络则确定交叉分布的表格线在该所述表项区域形成非闭合框,并获取所述非闭合框的所述第三数量信息。
可选地,将所述第二数量信息和所述第三数量信息作为所述待处理图像中包含所述线框的总数量,并将所述闭合框对应的所述第二数量信息与所述线框的所述总数量的比值作为所述待处理图像的所述清晰度。
可选地,当所述清晰度小于预设清晰度阈值时,过滤该所述待处理图像。
在本发明的另一个实施例中,提供了一种确定图像清晰度的装置,该装置包括:
第一获取模块,用于获取待处理图像中包含的至少一条线段的坐标信息,并基于所述坐标信息对所述待处理图像中包含的所述线段进行排序以形成表格线;
遍历模块,用于在所述表格线组成的线框图中遍历所述表格线在交叉时形成的交点;
第二获取模块,用于若交叉分布的所述表格线形成对任一表项区域的封闭包络、并且在该所述表项区域形成的所述交点的数量至少为第一数量信息,则确定交叉分布的所述表格线在该所述表项区域形成闭合框,并获取所述待处理图像中包含的所述闭合框的第二数量信息;
第三获取模块,用于获取所述线框图中除所述闭合框外的非闭合框的第三数量信息;
计算模块,用于基于所述第二数量信息和所述第三数量信息,计算所述待处理图像的清晰度。
可选地,所述第一获取模块进一步用于:
利用预先训练的线框检测模型对所述待处理图像进行框线检测,并获取所述待处理图像包含的所述线段的所述坐标信息,所述坐标信息包括首端点坐标信息和尾端点坐标信息,以及,所述线段包含横线段和竖线段,其中将所述首端点坐标信息和所述尾端点坐标信息中横坐标的差值在第一预设范围内的所述线段确定为所述横线段,将纵坐标的差值在所述第一预设范围内的所述线段确定为所述竖线段。
可选地,所述遍历模块包括:
计算单元,用于基于至少一条所述线段的所述首端点坐标信息和所述尾端点坐标信息,计算所述线段对应的斜率;
过滤单元,用于分别计算所述待处理图像中包含的所述横线段对应的第一平均斜率和所述竖线段对应的第二平均斜率,在至少一条所述横线段对应的所述斜率与所述第一平均斜率的差值大于第二预设范围时,过滤该所述横线段,以及,在至少一条所述竖线段对应的所述斜率与所述第二平均斜率的差值大于所述第二预设范围时,过滤该所述竖线段;
连接单元,用于遍历所述待处理图像中包含的所述线段,当至少一个所述横线段的所述尾端点坐标信息和相邻的所述横线段的所述首端点坐标信息间的差值在第三预设范围内时,依次连接所述横线段并形成所述线框图中的横表格线,以及,当至少一个所述竖线段的所述尾端点坐标信息和相邻的所述竖线段的所述首端点坐标信息间的差值在第三预设范围内时,依次连接所述竖线段并形成所述线框图中的竖表格线。
可选地,所述第三获取模块包括:
选择单元,用于将位于所述线框图中的所述横表格线和所述竖表格线中的首个所述交点和尾部最后一个所述交点作为边界交点;
获取单元,用于遍历所述边界交点,判断所述边界交点所在的交叉的所述表格线与相邻的所述表格线形成的任一所述表项区域是否为开放包络,若为所述开放包络则确定交叉分布的所述表格线在该所述表项区域形成非闭合框,并获取所述非闭合框的所述第三数量信息。
可选地,所述计算模块包括:
将所述第二数量信息和所述第三数量信息作为所述待处理图像中包含所述线框的总数量,并将所述闭合框对应的所述第二数量信息与所述线框的所述总数量的比值作为所述待处理图像的所述清晰度。
可选地,所述装置还包括:
过滤模块,用于当所述清晰度小于预设清晰度阈值时,过滤该所述待处理图像。
在本发明的另一个实施例中,提供了一种非瞬时计算机可读存储介质,所述非瞬时计算机可读存储介质存储指令,所述指令在由处理器执行时使得所述处理器执行上述一种确定图像清晰度的方法中的各个步骤。
在本发明的另一个实施例中,提供了一种终端设备,包括处理器,所述处理器用于执行上述一种确定图像清晰度的方法中的各个步骤。
基于上述实施例,首先获取待处理图像中包含的至少一条线段的坐标信息,基于坐标信息对待处理图像中包含的线段进行排序以形成表格线,其次,在表格线组成的线框图中遍历表格线在交叉时形成的交点,然后,若交叉分布的表格线形成对任一表项区域的封闭包络、并且在该表项区域形成的交点数量至少为第一数量信息,则确定交叉分布的表格线在该表项区域形成闭合框,并获取待处理图像中包含的闭合框的第二数量信息,进一步地,获取线框图中除闭合框外的非闭合框的第三数量信息,最后基于第二数量信息和第三数量信息,计算待处理图像的清晰度。本申请实施例通过对图像中的表格形成的闭合框和非闭合框的数量进行统计,量化判断图片清晰度的标准,提升图片识别时的准确率。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了为本申请实施例100所提供的一种确定图像清晰度的方法的流程示意图;
图2示出了本申请实施例200提供的一种确定图像清晰度的方法的具体流程的示意图;
图3示出了本申请实施例300提供的在待处理图像中检测到表格的示意图;
图4示出了本申请实施例400提供的表格线围成的线框图的示意图;
图5示出了本申请实施例500提供的闭合框的示意图;
图6示出了本申请实施例600提供的边界交点和非闭合框的示意图;
图7示出了本申请实施例700提供的待处理图像清晰度的计算方法的示意图;
图8示出了本申请实施例800还提供一种确定图像清晰度的装置的示意图;
图9示出了本申请实施例900所提供的一种终端设备的示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含。例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其他步骤或单元。
基于现有技术中的问题,本申请实施例提供了一种确定图像清晰度的方法,主要适用于计算机技术领域。通过线框检测模型检测出表格中的线段,过滤异常的线段,将线框按行列合并为表格线,对行列表格线排序后,按行列遍历,判定表格线组成的各个线框是否为闭合框,对于闭合框计算四点坐标,将文字识别结果与坐标对应,当图片模糊时,框线检测模型检测线框不闭合,文字与线框无法对应。因此可以通过计算闭合框和非闭合框的比值和个数等反应表格类图片的图片质量。以下几个具体实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。如图1所示,为本申请实施例100提供的一种确定图像清晰度的方法的流程示意图。其中,详细步骤如下:
步骤S11,获取待处理图像中包含的至少一条线段的坐标信息,并基于坐标信息对待处理图像中包含的线段进行排序以形成表格线。
本步骤中,本申请实施例中的待处理图像主要为含有表格的表格类图像。利用线框检测模型如线段卷积神经网络模型(Line Convolutional Neural Networks,LCNN)对待处理图像进行检测,获取其中包含的至少一条线段。其中,每条线段的坐标信息包括首端点坐标信息和尾端点坐标信息。进一步地,基于检测到的每条线段的坐标信息,在虚拟坐标系中对各个线段进行排序,按照首端点坐标信息和尾端点坐标信息排列以形成表格线。
步骤S12,在表格线组成的线框图中遍历表格线在交叉时形成的交点。
本步骤中,表格线由至少一条线段组成,基于线段的坐标信息,将满足连接条件的线段连接成表格线。一般地,连接后的线段形成的表格线包括横表格线和竖表格线,每条表格线在交叉时形成交点,由各条表格线和交点组成线框图。
步骤S13,若交叉分布的表格线形成对任一表项区域的封闭包络、并且在该表项区域形成的交点的数量至少为第一数量信息,则确定交叉分布的表格线在该表项区域形成闭合框,并获取待处理图像中包含的闭合框的第二数量信息。
本步骤中,在待处理图像对应的线框图中判断是否存在闭合框。具体地,基于表格类图像的特征,闭合框一般为由横表格线和竖表格线围成的封闭的线框。根据闭合框的特点,遍历线框图,判断按照首端点坐标信息和尾端点坐标信息排列后位置存在上下相邻或者左右相邻的表格线之间在交叉时形成的交点的数量是否至少为第一数量信息,且各个交点与表格线围成的表象区域是否为封闭包络。其中,考虑到单元格一般包含四个交点,本申请实施例中的第一数量信息的最佳实施例为4。进一步地,将相邻的表格线交叉后形成的交点的数量至少为第一数量信息信息且与表格线围成的线框封闭时,确定该线框为闭合框,并在遍历后统计线框图中确定为闭合框的第二数量信息。
步骤S14,统计线框图中除闭合框外的非闭合框的第三数量信息。
本步骤中,在线框图中统计除闭合框之外的其它非闭合框的数量,并作为第三数量进行存储。其中,非闭合框为相邻表格线之间形成的非封闭的线框。
步骤S15,基于第二数量信息和第三数量信息,计算待处理图像的清晰度。
本步骤中,闭合框对应的第二数量信息和非闭合框对应的第三数量信息的和为该待处理图像中检测到的线框的总数量,闭合框在总数量占有的比值越高,该待处理图像的清晰度越高。其中,预设清晰度阈值基于业务需要设置。当待处理图像对应的清晰度小于预设清晰度阈值时,对该待处理图像进行过滤。
如上所述,基于上述实施例,首先获取待处理图像中包含的至少一条线段的坐标信息,基于坐标信息对待处理图像中包含的线段进行排序以形成表格线,其次,在表格线组成的线框图中遍历表格线在交叉时形成的交点,然后,当相邻的表格线之间形成的交点的数量至少为第一数量信息信息,且相邻的表格线之间的交点与表格线围成的线框封闭时,确定该线框为闭合框,并获取待处理图像中包含的闭合框的第二数量信息,进一步地,获取线框图中除闭合框外的非闭合框的第三数量信息,最后基于第二数量信息和第三数量信息,计算待处理图像的清晰度。本申请实施例通过对图像中的表格形成的闭合框和非闭合框的数量进行统计,量化判断图片清晰度的标准,提升图片识别时的准确率。
如图2所示,为本申请实施例200提供的一种确定图像清晰度的方法的具体流程的示意图。其中,该具体流程的详细过程如下:
S201,获取待处理图像。
这里,本申请实施例中的待处理图像主要为表格类图像。
S202,对待处理图像进行边框检测,获取待处理图像中包含的至少一条线段。
本步骤中,首先对待处理图像使用高效场景文本检测算法(Advanced AnEfficient and Accurate Scene Text Detector,Advanced EAST)进行表格检测,获取待处理图像中的表格。如图3所示,为本申请实施例300示出的在待处理图像中检测到表格的示意图。其中,通过检测待处理图像中的表格四点坐标,获取待处理图像中包含的表格。
进一步地,利用预先训练的线框检测模型对待处理图像进行框线检测,并获取待处理图像包含的线段的坐标信息,坐标信息包括首端点坐标信息和尾端点坐标信息。其中,预先训练的线框检测模型可以为基于线段检测的卷积网络模型LCNN模型。针对每个表格做框线检测,输出检测到的线段的坐标信息。待处理图像中一般包含多条线段。另外,线段包含横线段和竖线段,其中将首端点坐标信息和尾端点坐标信息中横坐标的差值在第一预设范围内的线段确定为横线段,将纵坐标的差值在第一预设范围内的线段确定为竖线段。基于检测到的线段的首端点坐标信息和尾端点坐标信息中横坐标或者纵坐标的差值可以判断该线段为横线段或竖线段,其中第一预设范围为预先设定的数值范围。
S203,基于坐标信息对待处理图像中包含的线段进行排序。
这里,按照获取的线段的首端点坐标信息和尾端点坐标信息,在虚拟二维坐标系中进行排序。
S204,基于线段形成表格线。
这里,本申请实施例中的表格线为组成表格的表格线,表格线至少由一条线段组成。在将符合条件的线段连接为表格线之前,对异常的线段进行过滤。具体地,判断是和否为异常线段的步骤为:基于至少一条线段的首端点坐标信息和尾端点坐标信息,计算线段对应的斜率;分别计算待处理图像中包含的横线段对应的第一平均斜率和竖线段对应的第二平均斜率,在至少一条横线段对应的斜率与第一平均斜率的差值大于第二预设范围时,过滤该横线段,以及,在至少一条竖线段对应的斜率与第二平均斜率的差值大于第二预设范围时,过滤该竖线段。其中,第二预设范围与第一预设范围类似的为预先设定的数值范围。
进一步地,遍历待处理图像中包含的线段,当至少一个横线段的尾端点坐标信息和相邻的横线段的首端点坐标信息间的差值在第三预设范围内时,依次连接横线段并形成线框图中的横表格线,以及,当至少一个竖线段的尾端点坐标信息和相邻的竖线段的首端点坐标信息间的差值在第三预设范围内时,依次连接竖线段并形成线框图中的竖表格线。具体地,第三预设范围基于业务需要设置,在相邻的横线段之间进行坐标信息的判断,以及在相邻竖线段之间进行同样的操作。如图4所示,为本申请实施例400示出的表格线围成的线框图的示意图。其中,将符合条件的横线段进行连接,形成横表格线,以及形成竖表格线。
S205,在表格线组成的线框图中遍历表格线在交叉时形成的交点。
这里,如图4所示,横表格线和竖表格线在交叉时形成的交叉点为交点。
S206,计算闭合框的第二数量信息。
这里,遍历各个交点,判断上下相邻和左右相邻的表格线之间交叉形成的交点的数量以及上下相邻和左右相邻的表格线围成的线是否封闭。若交叉分布的表格线形成对任一表项区域的封闭包络、并且在该表项区域形成的交点的数量至少为第一数量信息,则确定交叉分布的表格线在该表项区域形成闭合框,并获取待处理图像中包含的闭合框的第二数量信息。其中,基于封闭的单元格的属性,设置第一数量信息为限制形成闭合框的最小单元,由第一数量信息的交点形成的封闭包络中不包括其它封闭包络。具体地,基于上下相邻和左右相邻的表格线之间交叉形成的单元格的属性一般为4个交点,本申请实施例中设置第一数量信息的最佳实施例为4。进一步地,获取待处理图像中包含的闭合框的第二数量信息。如图4所示,本申请实施例中的闭合框为最基本的框线单元,交叉分布的表格线形成对任一表项区域的封闭包络,其中表项区域为上下相邻和左右相邻的表格线交叉后形成的最小区域。另外,如图5所示,为本申请实施例500示出的待处理图像中的闭合框的示意图。
S207,计算非闭合框的第三数量信息。
这里,将位于线框图中的横表格线和竖表格线中的首个交点和尾部最后一个交点作为边界交点。遍历边界交点,判断边界交点所在的交叉的表格线与相邻的表格线形成的任一表项区域是否为开放包络,若为开放包络则确定交叉分布的表格线在该表项区域形成非闭合框,并获取非闭合框的第三数量信息。具体地,遍历列交点,计算该交点所在的行,并判定是否为行边界交点,若为边界交点,判定是否可形成非闭合框的边。进一步地,将与边界交点相关的未封闭的线框作为非闭合框,并计算非闭合框的第三数量信息。如图6所示,为本申请实施例600示出的边界交点和非闭合框的示意图。其中,非闭合框存在多种情况,图中示出其中几种情形,包括一个点或两个点形成非闭合框的情形,也包括三个点或四个点或五个点形成闭合框的情形等。其中由上下相邻和左右相邻的表格线交叉后形成的表项区域为开放包络,与闭合框的形式相区别。
S208,基于第二数量信息和第三数量信息,计算待处理图像的清晰度。
本步骤中,将第二数量信息和第三数量信息作为待处理图像中包含线框的总数量,并将闭合框对应的第二数量信息与线框的总数量的比值作为待处理图像的清晰度。具体地,清晰度得分score=闭合框/(闭合框+非闭合框)。当非闭合框=0,score=1,则表示待处理图像非常清晰;闭合框=0,score=0,则表示待处理图像非常模糊。
S209,在清晰度小于预设清晰度阈值时,过滤该待处理图像。
这里,基于业务需要设置清晰度阈值,如可设置清晰度阈值为0.95,或清晰度阈值为0.9且非闭合框对应的第三数量信息小于预设数量时如20,即清晰度score>0.95或(score>0.9且非闭合框的第三数量信息小于20时),则为清晰,其余情况为模糊。为模糊时,过滤该待处理图像。如图7所示,为本申请实施例700示出的待处理图像清晰度的计算方法的示意图。其中,示出了清晰度阈值为0.95时,两种待处理图像的清晰度。
本申请实施例中确定图像清晰度的方法在测试过程中的准确率为0.98。
本申请实施例中的一种确定图像清晰度的方法,通过前置图像质量的判断流程,对待处理图像进行线框检测,通过确定闭合框和非闭合框计算待处理图像的清晰度,准确率高且依托线上模型稳定可靠,保证识别效率。
基于同一发明构思,本申请实施例800还提供一种确定图像清晰度的装置,其中,如图8所示,该装置包括:
第一获取模块81,用于获取待处理图像中包含的至少一条线段的坐标信息,并基于坐标信息对待处理图像中包含的线段进行排序以形成表格线;
遍历模块82,在表格线组成的线框图中遍历表格线在交叉时形成的交点;
第二获取模块83,用于若交叉分布的表格线形成对任一表项区域的封闭包络、并且在该表项区域形成的交点的数量至少为第一数量信息,则确定交叉分布的表格线在该表项区域形成闭合框,并获取待处理图像中包含的闭合框的第二数量信息;
第三获取模块84,用于获取线框图中除闭合框外的非闭合框的第三数量信息;
计算模块85,用于基于第二数量信息和第三数量信息,计算待处理图像的清晰度。
本实施例中,第一获取模块81、遍历模块82、第二获取模块83、第三获取模块84和计算模块85的具体功能和交互方式,可参见图1对应的实施例的记载,在此不再赘述。
可选地,第一获取模块81进一步用于:
利用预先训练的线框检测模型对待处理图像进行框线检测,并获取待处理图像包含的所述线段的坐标信息,坐标信息包括首端点坐标信息和尾端点坐标信息,以及,线段包含横线段和竖线段,其中将首端点坐标信息和尾端点坐标信息中横坐标的差值在第一预设范围内的线段确定为所述横线段,将纵坐标的差值在第一预设范围内的线段确定为竖线段。
可选地,遍历模块82包括:
计算单元,用于基于至少一条线段的首端点坐标信息和尾端点坐标信息,计算线段对应的斜率;
过滤单元,用于分别计算待处理图像中包含的横线段对应的第一平均斜率和竖线段对应的第二平均斜率,在至少一条横线段对应的斜率与第一平均斜率的差值大于第二预设范围时,过滤该横线段,以及,在至少一条竖线段对应的斜率与第二平均斜率的差值大于第二预设范围时,过滤该竖线段;
连接单元,用于遍历待处理图像中包含的线段,当至少一个横线段的尾端点坐标信息和相邻的横线段的首端点坐标信息间的差值在第三预设范围内时,依次连接横线段并形成线框图中的横表格线,以及,当至少一个竖线段的所述尾端点坐标信息和相邻的竖线段的首端点坐标信息间的差值在第三预设范围内时,依次连接竖线段并形成线框图中的竖表格线。
可选地,第三获取模块84包括:
选择单元,用于将位于线框图中的横表格线和竖表格线中的首个交点和尾部最后一个交点作为边界交点;
获取单元,用于遍历边界交点,判断边界交点所在的交叉的表格线与相邻的表格线形成的任一表项区域是否为开放包络,若为开放包络则确定交叉分布的表格线在该表项区域形成非闭合框,并获取非闭合框的第三数量信息。
可选地,计算模块85包括:
将第二数量信息和第三数量信息作为待处理图像中包含线框的总数量,并将闭合框对应的第二数量信息与线框的总数量的比值作为待处理图像的清晰度。
可选地,该装置还包括:
过滤模块86,用于当清晰度小于预设清晰度阈值时,过滤该待处理图像。
如图9所示,本申请的又一实施例900还提供一种终端设备,包括处理器901,其中,处理器901用于执行上述一种确定图像清晰度的方法的步骤。从图9中还可以看出,上述实施例提供的终端设备还包括非瞬时计算机可读存储介质902,该非瞬时计算机可读存储介质902上存储有计算机程序,该计算机程序被处理器901运行时执行上述一种确定图像清晰度的方法的步骤。实际应用中,该终端设备可以是一台或多台计算机,只要包括上述计算机可读介质和处理器即可。
具体地,该存储介质能够为通用的存储介质,如移动磁盘、硬盘和FLASH等,该存储介质上的计算机程序被运行时,能够执行上述的一种确定图像清晰度的方法中的各个步骤。实际应用中,所述的计算机可读介质可以是上述实施例中描述的设备/装置/系统中所包含的,也可以是单独存在,而未装配入该设备/装置/系统中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或多个程序被执行时,能够执行上述的一种确定图像清晰度的方法中的各个步骤。
根据本申请公开的实施例,计算机可读存储介质可以是非易失性的计算机可读存储介质,例如可以包括但不限于:便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件,或者上述的任意合适的组合,但不用于限制本申请保护的范围。在本申请公开的实施例中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
本申请附图中的流程图和框图,示出了按照本申请公开的各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或者代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应该注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同附图中所标注的顺序发生。例如,两个连接地表示的方框实际上可以基本并行地执行,它们有时也可以按照相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或者流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
本领域技术人员可以理解,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合,即使这样的组合或结合没有明确记载于本申请中。特别地,在不脱离本申请精神和教导的情况下,本申请的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合,所有这些组合和/或结合均落入本申请公开的范围。
最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行变更或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些变更、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应所述以权利要求的保护范围为准。

Claims (10)

1.一种确定图像清晰度的方法,其特征在于,包括:
获取待处理图像中包含的至少一条线段的坐标信息,并基于所述坐标信息对所述待处理图像中包含的所述线段进行排序以形成表格线,其中,所述待处理图像为含有表格的表格类图像;
在所述表格线组成的线框图中遍历所述表格线在交叉时形成的交点;
若交叉分布的所述表格线形成对任一表项区域的封闭包络、并且在该所述表项区域形成的所述交点的数量至少为第一数量信息,则确定交叉分布的所述表格线在该所述表项区域形成闭合框,并获取所述待处理图像中包含的所述闭合框的第二数量信息;
获取所述线框图中除所述闭合框外的非闭合框的第三数量信息;
基于所述第二数量信息和所述第三数量信息,计算所述待处理图像的清晰度。
2.根据权利要求1所述的方法,其特征在于,所述获取待处理图像中包含的至少一条线段的坐标信息的步骤包括:
利用预先训练的线框检测模型对所述待处理图像进行框线检测,并获取所述待处理图像包含的所述线段的所述坐标信息,所述坐标信息包括首端点坐标信息和尾端点坐标信息,所述线段包含横线段和竖线段,其中将所述首端点坐标信息和所述尾端点坐标信息中横坐标的差值在第一预设范围内的所述线段确定为所述横线段,将纵坐标的差值在所述第一预设范围内的所述线段确定为所述竖线段。
3.根据权利要求2所述的方法,其特征在于,所述并基于所述坐标信息对所述待处理图像中包含的所述线段进行排序以形成表格线的步骤包括:
基于至少一条所述线段的所述首端点坐标信息和所述尾端点坐标信息,计算所述线段对应的斜率;
分别计算所述待处理图像中包含的所述横线段对应的第一平均斜率和所述竖线段对应的第二平均斜率,在至少一条所述横线段对应的所述斜率与所述第一平均斜率的差值大于第二预设范围时,过滤该所述横线段,以及,在至少一条所述竖线段对应的所述斜率与所述第二平均斜率的差值大于所述第二预设范围时,过滤该所述竖线段;
遍历所述待处理图像中包含的所述线段,当至少一个所述横线段的所述尾端点坐标信息和相邻的所述横线段的所述首端点坐标信息间的差值在第三预设范围内时,依次连接所述横线段并形成所述线框图中的横表格线,以及,当至少一个所述竖线段的所述尾端点坐标信息和相邻的所述竖线段的所述首端点坐标信息间的差值在第三预设范围内时,依次连接所述竖线段并形成所述线框图中的竖表格线。
4.根据权利要求3所述的方法,其特征在于,所述获取所述线框图中除所述闭合框外的非闭合框的第三数量信息的步骤包括:
将位于所述线框图中的所述横表格线和所述竖表格线中的首个所述交点和尾部最后一个所述交点分别作为边界交点;
遍历所述边界交点,判断所述边界交点所在的交叉的所述表格线与相邻的所述表格线形成的任一所述表项区域是否为开放包络,若为所述开放包络则确定交叉分布的所述表格线在该所述表项区域形成非闭合框,并获取所述非闭合框的所述第三数量信息。
5.根据权利要求3所述的方法,其特征在于,所述计算所述待处理图像的清晰度的步骤包括:
将所述第二数量信息和所述第三数量信息作为所述待处理图像中包含所述线框的总数量,并将所述闭合框对应的所述第二数量信息与所述线框的所述总数量的比值作为所述待处理图像的所述清晰度。
6.根据权利要求1所述的方法,其特征在于,在所述计算所述待处理图像的清晰度的步骤之后,所述方法进一步包括:
当所述清晰度小于预设清晰度阈值时,过滤该所述待处理图像。
7.一种确定图像清晰度的装置,其特征在于,包括:
第一获取模块,用于获取待处理图像中包含的至少一条线段的坐标信息,并基于所述坐标信息对所述待处理图像中包含的所述线段进行排序以形成表格线,其中,所述待处理图像为含有表格的表格类图像;
遍历模块,用于在所述表格线组成的线框图中遍历所述表格线在交叉时形成的交点;
第二获取模块,用于若交叉分布的所述表格线形成对任一表项区域的封闭包络、并且在该所述表项区域形成的所述交点的数量至少为第一数量信息,则确定交叉分布的所述表格线在该所述表项区域形成闭合框,并获取所述待处理图像中包含的所述闭合框的第二数量信息;
第三获取模块,用于获取所述线框图中除所述闭合框外的非闭合框的第三数量信息;
计算模块,用于基于所述第二数量信息和所述第三数量信息,计算所述待处理图像的清晰度。
8.根据权利要求7所述的装置,其特征在于,所述第一获取模块进一步用于:
利用预先训练的线框检测模型对所述待处理图像进行框线检测,并获取所述待处理图像包含的所述线段的所述坐标信息,所述坐标信息包括首端点坐标信息和尾端点坐标信息,以及,所述线段包含横线段和竖线段,其中将所述首端点坐标信息和所述尾端点坐标信息中横坐标的差值在第一预设范围内的所述线段确定为所述横线段,将纵坐标的差值在所述第一预设范围内的所述线段确定为所述竖线段。
9.一种非瞬时计算机可读存储介质,其特征在于,所述非瞬时计算机可读存储介质存储指令,所述指令在由处理器执行时使得所述处理器执行如权利要求1至6任一项所述的一种确定图像清晰度的方法中的各个步骤。
10.一种终端设备,其特征在于,包括处理器,所述处理器用于执行如权利要求1至6中任一项所述的一种确定图像清晰度的方法中的各个步骤。
CN202011477882.2A 2020-12-14 2020-12-14 一种确定图像清晰度的方法、装置和存储介质 Active CN112700407B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011477882.2A CN112700407B (zh) 2020-12-14 2020-12-14 一种确定图像清晰度的方法、装置和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011477882.2A CN112700407B (zh) 2020-12-14 2020-12-14 一种确定图像清晰度的方法、装置和存储介质

Publications (2)

Publication Number Publication Date
CN112700407A CN112700407A (zh) 2021-04-23
CN112700407B true CN112700407B (zh) 2022-08-19

Family

ID=75508160

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011477882.2A Active CN112700407B (zh) 2020-12-14 2020-12-14 一种确定图像清晰度的方法、装置和存储介质

Country Status (1)

Country Link
CN (1) CN112700407B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117037194B (zh) * 2023-05-10 2024-08-13 广州方舟信息科技有限公司 单据图像的表格识别方法、装置、电子设备及存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003036437A (ja) * 2001-07-25 2003-02-07 Konica Corp 鮮鋭性評価方法、鮮鋭性評価装置および画像記録装置
US9542736B2 (en) * 2013-06-04 2017-01-10 Paypal, Inc. Evaluating image sharpness
CN108921838A (zh) * 2018-06-29 2018-11-30 北京字节跳动网络技术有限公司 用于检测图像的方法和装置
CN110276335A (zh) * 2019-07-04 2019-09-24 华中师范大学 一种移动端试卷采集方法及装置
CN112036232B (zh) * 2020-07-10 2023-07-18 中科院成都信息技术股份有限公司 一种图像表格结构识别方法、系统、终端以及存储介质

Also Published As

Publication number Publication date
CN112700407A (zh) 2021-04-23

Similar Documents

Publication Publication Date Title
CN109613002B (zh) 一种玻璃缺陷检测方法、装置和存储介质
CN105608459B (zh) 商品图片的分割方法及其装置
CN102693420A (zh) 一种指纹模板自动更新的方法
CN111182367A (zh) 一种视频的生成方法、装置及计算机系统
CN112700407B (zh) 一种确定图像清晰度的方法、装置和存储介质
CN112686595A (zh) 物流操作违规行为的检测方法、装置、设备和存储介质
CN113642576B (zh) 一种目标检测及语义分割任务中训练图像集合的生成方法及装置
CN116071651B (zh) 一种均压场识别方法、装置、存储介质及终端
CN111597845A (zh) 一种二维码检测方法、装置、设备及可读存储介质
CN113591746A (zh) 一种文档表格结构检测方法及装置
CN115239644A (zh) 混凝土缺陷识别方法、装置、计算机设备和存储介质
CN115861816A (zh) 一种立体低涡识别方法、装置、存储介质及终端
CN113313217B (zh) 一种基于鲁棒性模板的倾角文字精准识别方法及系统
US20210089886A1 (en) Method for processing data based on neural networks trained by different methods and device applying method
CN112541435B (zh) 一种图像处理的方法、装置和存储介质
CN110084117B (zh) 基于二值图分段投影的文档表格线检测方法、系统
CN115457581A (zh) 表格提取方法、装置及计算机设备
CN111950753A (zh) 一种景区客流预测的方法及装置
CN113033720B (zh) 基于滑动窗口的车底图片异物识别方法、装置及存储介质
CN112990350B (zh) 目标检测网络训练方法及基于目标检测网络煤矸识别方法
CN115049963A (zh) 视频分类方法、装置、处理器及电子设备
CN115719472A (zh) 一种基于检测和跟踪的互补优化方法、系统、设备及存储介质
CN117291859A (zh) 一种页面异常检测方法、装置、电子设备和存储介质
CN114240924A (zh) 一种基于数字化技术的电网设备质量评估方法
CN113887674A (zh) 一种基于大数据的异常行为检测的方法与系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant