CN112434565A - 一种文档图像的模糊度评估、筛选方法和装置 - Google Patents

一种文档图像的模糊度评估、筛选方法和装置 Download PDF

Info

Publication number
CN112434565A
CN112434565A CN202011219396.0A CN202011219396A CN112434565A CN 112434565 A CN112434565 A CN 112434565A CN 202011219396 A CN202011219396 A CN 202011219396A CN 112434565 A CN112434565 A CN 112434565A
Authority
CN
China
Prior art keywords
image
fuzzy
document image
document
features
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011219396.0A
Other languages
English (en)
Inventor
李学文
伍贵宾
熊永平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Huoyanruishi Information Technology Co ltd
Original Assignee
Nanjing Huoyanruishi Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Huoyanruishi Information Technology Co ltd filed Critical Nanjing Huoyanruishi Information Technology Co ltd
Priority to CN202011219396.0A priority Critical patent/CN112434565A/zh
Publication of CN112434565A publication Critical patent/CN112434565A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种文档图像的模糊度评估、筛选方法和装置,所述方法包括:基于MaxPol滤波器提取文档图像的图像特征;将提取的图像特征输入到预先训练得到的模糊分类模型中,得到所述文档图像的模糊类型;从所述图像特征中提取对应所述模糊类型的模糊特征,将提取的模糊特征代入预先拟合出的、对应所述模糊类型的非线性公式,计算出所述文档图像的模糊度评分。应用本发明可以对文档图像的模糊度进行更为准确的量化评分,以便于根据评估的模糊度对文档图像进行筛选,提高图像的筛选效率。

Description

一种文档图像的模糊度评估、筛选方法和装置
技术领域
本发明涉及图像质量评价技术领域,特别是指一种文档图像的模糊度评估、筛选方法和装置。
背景技术
纸质文档是人们日常办公的信息传输媒介,通过拍摄文档而采集到的图像称为文档图像,随着手机、平板电脑等便携移动设备的普及,文档图像在人们生活中有着丰富的应用场景,例如发票、业务申请表、合同、个人档案等纸质资料的电子档案,以及各种图像文字识别软件等等。自然场景下采集到的文档图像质量参差不齐,根据文档图像质量来筛选图像,对优化各类应用场景有着重要作用。
文档图像的主要图像失真类型为模糊,即图像的整体质量取决于图像模糊度。图像模糊度与清晰度成反比,无参考图像清晰度评价是图像质量评价的一个重要分支,已有的方法主要有基于空间域的方法、基于频谱和小波变换等变换域的方法、基于机器学习和神经网络等数学模型的方法。但是由于文档图像的图像内容具有较为一致的图像特征,以及由于移动设备硬件配置的提升导致的文档图像分辨率较高的特点,这些方法对文档图像的处理效果欠佳。
发明内容
有鉴于此,本发明的目的在于提出一种文档图像的模糊度评估、筛选方法和装置,可以对文档图像的模糊度进行更为准确的量化评分,以便于根据评估的模糊度对文档图像进行筛选,提高图像的筛选效率。
基于上述目的,本发明提供一种文档图像的模糊度评估方法,包括:
基于MaxPol滤波器提取文档图像的图像特征;
将提取的图像特征输入到预先训练得到的模糊分类模型中,得到所述文档图像的模糊类型;
从所述图像特征中提取对应所述模糊类型的模糊特征,将提取的模糊特征代入预先拟合出的、对应所述模糊类型的非线性公式,计算出所述文档图像的模糊度评分。
其中,所述对应所述模糊类型的非线性公式中的参数是根据数据集中每个文档图像的图像特征中对应所述模糊类型的模糊特征和主观评分,预先拟合得到的。
较佳地,所述基于MaxPol滤波器提取文档图像的图像特征,具体包括:
对所述文档图像进行灰度化处理,得到灰度图像;
从水平和垂直两个方向将所述MaxPol滤波器与灰度图像进行卷积,计算出水平和垂直两个方向的特征向量;
将计算出的水平和垂直两个方向的特征向量合成为特征图像;
计算出所述特征图像中的有效像素的高阶中心矩,作为所述文档图像的图像特征。
其中,所述模糊分类模型具体根据如下方法预先训练得到:
计算所述数据集中每个文档图像的图像特征;
根据数据集中针对每个文档图像标注的模糊类型,以及计算出的每个文档图像的图像特征对模糊分类模型进行训练。
本发明还提供一种文档图像的筛选方法,包括:
根据上述的模糊度评估方法,得到文档图像的模糊度评分;
根据文档图像的模糊度评分筛选出合格的文档图像。
本发明还提供一种文档图像的模糊度评估装置,包括:
图像特征提取模块,用于基于MaxPol滤波器提取文档图像的图像特征;
模糊类型确定模块,用于将提取的图像特征输入到预先训练得到的模糊分类模型中,得到所述文档图像的模糊类型;
模糊度评分模块,用于从所述图像特征中提取对应所述模糊类型的模糊特征,将提取的模糊特征代入预先拟合出的、对应所述模糊类型的非线性公式,计算出所述文档图像的模糊度评分。
本发明还提供一种文档图像的筛选装置,包括:
如上所述的一种文档图像的模糊度评估装置中的模块;
筛选模块,用于根据根据得到的文档图像的模糊度评分筛选出合格的文档图像。
本发明还提供一种电子设备,包括中央处理单元、信号处理和存储单元,以及存储在信号处理和存储单元上并可在中央处理单元上运行的计算机程序,其中,所述中央处理单元执行如上所述的文档图像的模糊度评估、筛选方法。
本发明的技术方案中,基于MaxPol滤波器提取文档图像的图像特征;将提取的图像特征输入到预先训练得到的模糊分类模型中,得到所述文档图像的模糊类型;从所述图像特征中提取对应所述模糊类型的模糊特征,将提取的模糊特征代入预先拟合出的、对应所述模糊类型的非线性公式,计算出所述文档图像的模糊度评分;从而可以对文档图像的模糊度进行更为准确的量化评分,以便于根据评估的模糊度对文档图像进行筛选,提高图像的筛选效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种文档图像的模糊度评估方法流程图;
图2为本发明实施例提供的一种提取文档图像的图像特征的方法流程图;
图3为本发明实施例提供的一种模糊分类模型的训练方法流程图;
图4为本发明实施例提供的一种拟合出非线性公式中的参数的方法流程图;
图5a、5b分别为本发明实施例提供的一种文档图像的模糊度评估、筛选装置的内部结构框图;
图6为本发明实施例提供的一种电子设备硬件结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。
需要说明的是,除非另外定义,本发明实施例使用的技术术语或者科学术语应当为本公开所属领域内具有一般技能的人士所理解的通常意义。本公开中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的组成部分。“包括”或者“包含”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同,而不排除其他元件或者物件。“连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电性的连接,不管是直接的还是间接的。“上”、“下”、“左”、“右”等仅用于表示相对位置关系,当被描述对象的绝对位置改变后,则该相对位置关系也可能相应地改变。
本发明的发明人发现,不同模糊类型的文档图像,模糊特征不同,而现有技术对于不同模糊类型的文档图像都采用统一的处理方式,所以模糊评分的准确性不高。由此,本发明的技术方案中,使用分类模型对文档图像进行模糊类型分类后,使用对应所述模糊类型的非线性公式,计算出所述文档图像的模糊度评分,相比于现有的统一进行处理的方法,可以提高对文档图像的模糊度评分的准确性。
下面结合附图详细说明本发明实施例的技术方案。
本发明实施例提供的一种文档图像的模糊度评估、筛选方法,流程如图1所示,包括如下步骤:
步骤S101:基于MaxPol(最大多项式)滤波器提取文档图像的图像特征。
本步骤中将原始的文档图像与MaxPol滤波器进行卷积来构造特征图像,计算特征图像中有效像素的高阶中心矩作为图像特征,MaxPol滤波器的作用是:其与图像的卷积在频域中产生相等的幅度响应。具体方法流程如图2所示,包括如下子步骤:
子步骤S200:对文档图像进行灰度化处理,得到灰度图像。
本子步骤中,对文档图像进行灰度化处理,得到不包含色彩信息的灰度图像;其中,灰度图像的像素的灰度值Igray=0.299Ir+0.587Ig+0.114Ib;其中,Ir、Ig、Ib分别为文档图像中所述像素的红(Red)、绿(Green)、蓝(Blue)分量。
子步骤S201:从水平和垂直两个方向将所述MaxPol滤波器与灰度图像进行卷积,计算出水平和垂直两个方向的特征向量。
具体地,MaxPol滤波器与灰度图像均为归一化的浮点数矩阵,滤波器为1x65的对称矩阵,计算公式如式1所示:
Figure BDA0002761532330000051
其中,Ih和Iv分别表示水平方向和垂直方向的特征向量,hHVS为MaxPol滤波器,hHVS T为hHVS的转置,即转置后的卷积滤波器。
子步骤S202:将计算出的水平和垂直两个方向的特征向量合成为特征图像。
具体地,两个特征向量包含不同方向的图像特征,接下来合成Ih和Iv来构造特征图像Imap的计算公式如式2所示:
Figure BDA0002761532330000061
其中,(x,y)表示文档图像中的像素位置;即Ih(x,y)表示文档图像中位置坐标为(x,y)的像素在Ih中的特征值,Iv(x,y)表示文档图像中位置坐标为(x,y)的像素在Iv中的特征值,Imap(x,y)表示文档图像中位置坐标为(x,y)的像素在特征图像Imap中的特征值。使用该公式构造的特征图像可以削弱灰度较小像素的影响,保留与图像边缘相关的信息,即保留灰度较大像素的影响。
子步骤S203:计算出所述特征图像中的有效像素的高阶中心矩,作为所述文档图像的图像特征。
具体地,特征图像中与图像边缘相关的像素为有效像素,该部分像素灰度相对较大。在特征图像中有效像素分布集中且只占总像素的小部分,约9%左右,将像素灰度值从大到小排序,筛选出前9%的像素作为有效像素。
进而计算有效像素的高阶中心矩,将其作为文档图像的图像特征;例如,计算有效像素的2到10阶中心矩,将其作为文档图像的图像特征,计算公式如式3所示:
Figure BDA0002761532330000062
其中,n为筛选出的特征图像中的有效像素的数量,μk为k阶中心矩,k∈{2,3,...,10},
Figure BDA0002761532330000063
表示灰度图像中的像素的灰度均值。
步骤S102:将提取的图像特征输入到预先训练得到的模糊分类模型中,得到所述文档图像的模糊类型。
具体地,将文档图像的图像特征,例如,文档图像的有效像素的2到10阶中心矩输入到预训练得到的模糊分类模型中,通过模糊分类模型计算输出所述文档图像的模糊类型。通常,文档图像的模糊类型有两种,分别为失焦模糊、运动模糊。所述模糊分类模型的具体训练方法将在后续进行详细介绍。
步骤S103:从所述图像特征中提取对应所述模糊类型的模糊特征,将提取的模糊特征代入预先拟合出的、对应所述模糊类型的非线性公式,计算出所述文档图像的模糊度评分。
本步骤中,确定出所述文档图像的图像特征中与所述模糊类型对应的模糊特征;例如,失焦模糊的文档图像以有效像素的5阶中心矩作为对应的模糊特征,运动模糊的文档图像以7阶中心矩作为对应的模糊特征;
进而确定出与所述文档图像的模糊类型对应的非线性公式后,将确定的模糊特征代入确定出的非线性公式,计算出所述文档图像的模糊度评分。非线性公式中的参数的拟合方法将在后续详细介绍。
步骤S104:根据文档图像的模糊度评分筛选出合格的文档图像。
具体地,可以将文档图像的模糊度评分与设定阈值进行比较;将模糊度评分小于设定阈值的文档图像筛选为合格的文档图像。
因为文档模糊度反映了文档图像的清晰程度,亦即反映了文档图像的文档内容是否便于人工辨识,所以文档图像的模糊度评分可以用于筛选出高质量文档图像。
例如,在制作纸质文档的电子档案时,根据对文档内容清晰度的要求设定评分阈值,通过模糊度评价可以判断存档的文档图像质量是否达到标准;
或者,使用便携移动设备采集文档图像时,通过文档图像的模糊度评分可以在拍摄时筛选文档图像,以提高采集的文档图像质量。
上述的模糊分类模型的训练方法,具体流程如图3所示,具体包括如下步骤:
步骤S301:对数据集中的每个文档图像的模糊类型进行标注。
具体地,文档图像的模糊类型分为失焦模糊和运动模糊两种,其中,失焦模糊是由于拍摄镜头未将焦点对焦在拍摄对象上时所产生的模糊,运动模糊是由于拍摄镜头与拍摄对象产生了相对运动而导致的模糊;本步骤对示例中的文档图像数据集的模糊类型进行标注,根据主观判断将每张图像标注为失焦模糊或运动模糊,对标注结果进行统计。
步骤S302:计算数据集中每个文档图像的图像特征。
具体地,对于数据集中每个文档图像,可以采用上述步骤S101中的方法计算出该文档图像的图像特征。
步骤S303:使用标注了模糊类型的数据集训练模糊分类模型。
具体地,根据数据集中的每个文档图像的模糊类型和图像特征对模糊分类模型进行训练,该模糊分类模型具体可以是逻辑回归模型,该模型定义如下:
Figure BDA0002761532330000081
Figure BDA0002761532330000082
其中,g为sigmoid函数,表示文档图像的模糊类型,μ2,μ3,...,μ10分别为特征图像有效像素的2到10阶中心矩,w1,w2,...,w10为线性参数,
Figure BDA0002761532330000083
为中心矩的线性组合。分类模型的训练过程就是对线性参数进行求解,得到训练完成的模糊分类模型。
上述的非线性公式中的参数是预先拟合出来的,该公式及公式参数的拟合步骤,具体流程如图4所示,包括如下步骤:
步骤S401:对数据集中的每个文档图像的模糊度进行主观评分。
本步骤是对数据集中的每个文档图像数据集进行主观评价,以得到每个文档图像模糊度的主观评分。具体地,由于相同模糊度等级的图像是在相同的拍摄场景下采集的,包括光照强度、拍摄距离、对焦焦距等条件,所以相同模糊等级的图像应给予相同的评分。对于每个模糊度等级,由数位观察员进行评分,取所有评分的平均值作为该模糊度等级的主观评分,并基于该规则为每张图像赋予评分。
步骤S402:计算数据集中每个文档图像的模糊特征。
具体地,对于数据集中每个文档图像,从该文档图像的图像特征中提取对应该文档图像的模糊类型的模糊特征。
步骤S403:对于每种模糊类型,根据数据集中该种模糊类型的文档图像的模糊特征和主观评分,拟合出对应于该种模糊类型的非线性公式中的参数。
由于不同模糊类型的文档图像的主观评分尺度不同,对于每种模糊类型,使用对应模糊类型(具有一致特征)的文档图像数据集来计算非线性公式,可以分别得到模糊特征与主观评分的映射关系。且对于不同模糊类型的文档图像,模糊特征不同,即与主观评分最相关的中心矩不同,因此对于不同的模糊类型,需要计算对应的非线性公式。
具体地,可以采用迭代最小二乘估计方法计算文档图像模糊度的主观评分计算公式,该公式根据模糊特征来计算对应的评分。
例如,对于一种模糊类型,可以使用4个参数的非线性公式来拟合该种模糊类型的文档图像的模糊特征和主观评分,公式如式4所示:
Figure BDA0002761532330000091
其中x表示模糊特征,f(x)表示模糊度评分,k1、k2、k3、k4是公式中需要估计的回归参数。
进一步地,以
Figure BDA0002761532330000092
表示非线性公式,其中
Figure BDA0002761532330000096
文档图像i的模糊特征为xi,i∈[1,...,N],N为数据集中该种模糊类型的文档图像的数量,文档图像i的主观评分为yi
Figure BDA0002761532330000093
的计算过程是令如下式5最小化:
Figure BDA0002761532330000094
经过计算得到
Figure BDA0002761532330000095
将其代入上述式4,得到对应该种模糊类型的非线性公式。
基于上述的文档图像的模糊度评估、筛选方法,本发明实施例提供了一种文档图像的模糊度评估、筛选装置,内部结构框图分别如图5a、5b所示;其中,本发明实施例提供的一种文档图像的模糊度评估装置中包括如下模块:图像特征提取模块501、模糊类型确定模块502、模糊度评分模块503。
图像特征提取模块501用于基于MaxPol滤波器提取文档图像的图像特征;具体地,图像特征提取模块501具体可以采用上述步骤S101中的方法提取文档图像的图像特征,即图像特征提取模块501具体用于对所述文档图像进行灰度化处理,得到灰度图像;从水平和垂直两个方向将所述MaxPol滤波器与灰度图像进行卷积,计算出水平和垂直两个方向的特征向量;将计算出的水平和垂直两个方向的特征向量合成为特征图像;计算出所述特征图像中的有效像素的高阶中心矩,作为所述文档图像的图像特征。
模糊类型确定模块502用于将提取的图像特征输入到预先训练得到的模糊分类模型中,得到所述文档图像的模糊类型;
模糊度评分模块503用于从所述图像特征中提取对应所述模糊类型的模糊特征,将提取的模糊特征代入预先拟合出的、对应所述模糊类型的非线性公式,计算出所述文档图像的模糊度评分。
进一步,本发明实施例提供的一种文档图像的模糊度评估装置中还可包括:公式拟合模块504、模糊分类模型训练模块506。
公式拟合模块504用于对于每种模糊类型,根据数据集中每个文档图像的图像特征中对应该模糊类型的模糊特征和主观评分,拟合得到对应该模糊类型的非线性公式中的参数。具体地,公式拟合模块504可以根据上述图4所示流程中各步骤中的方法拟合得到所述非线性公式中的参数。
模糊分类模型训练模块506用于根据数据集中针对每个文档图像标注的模糊类型,以及计算出的每个文档图像的图像特征,对模糊分类模型进行训练,得到经过训练的模糊分类模型。
如图5b所示,本发明实施例提供的一种文档图像的筛选装置中,包括上述文档图像的模糊度评估装置中的各模块,此外,还包括:筛选模块505。
筛选模块505用于根据得到的文档图像的模糊度评分筛选出合格的文档图像。
图6示出了本实施例所提供的一种更为具体的电子设备硬件结构示意图,该设备可以包括:处理器1010、存储器1020、输入/输出接口1030、通信接口1040和总线1050。其中处理器1010、存储器1020、输入/输出接口1030和通信接口1040通过总线1050实现彼此之间在设备内部的通信连接。
处理器1010可以采用通用的CPU(Central Processing Unit,中央处理器)、微处理器、应用专用集成电路(Application Specific Integrated Circuit,ASIC)、或者一个或多个集成电路等方式实现,用于执行相关程序,以实现本说明书实施例所提供的文档图像的模糊度评估方法或文档图像的筛选方法。
存储器1020可以采用ROM(Read Only Memory,只读存储器)、RAM(Random AccessMemory,随机存取存储器)、静态存储设备,动态存储设备等形式实现。存储器1020可以存储操作系统和其他应用程序,在通过软件或者固件来实现本说明书实施例所提供的技术方案时,相关的程序代码保存在存储器1020中,并由处理器1010来调用执行。
输入/输出接口1030用于连接输入/输出模块,可以与非线性接收机相连,从非线性接收机接收信息,实现信息输入及输出。输入输出/模块可以作为组件配置在设备中(图中未示出),也可以外接于设备以提供相应功能。其中输入设备可以包括键盘、鼠标、触摸屏、麦克风、各类传感器等,输出设备可以包括显示器、扬声器、振动器、指示灯等。
通信接口1040用于连接通信模块(图中未示出),以实现本设备与其他设备的通信交互。其中通信模块可以通过有线方式(例如USB、网线等)实现通信,也可以通过无线方式(例如移动网络、WIFI、蓝牙等)实现通信。
总线1050包括一通路,在设备的各个组件(例如处理器1010、存储器1020、输入/输出接口1030和通信接口1040)之间传输信息。
需要说明的是,尽管上述设备仅示出了处理器1010、存储器1020、输入/输出接口1030、通信接口1040以及总线1050,但是在具体实施过程中,该设备还可以包括实现正常运行所必需的其他组件。此外,本领域的技术人员可以理解的是,上述设备中也可以仅包含实现本说明书实施例方案所必需的组件,而不必包含图中所示的全部组件。
本发明的技术方案中,基于MaxPol滤波器提取文档图像的图像特征;将提取的图像特征输入到预先训练得到的模糊分类模型中,得到所述文档图像的模糊类型;从所述图像特征中提取对应所述模糊类型的模糊特征,将提取的模糊特征代入预先拟合出的、对应所述模糊类型的非线性公式,计算出所述文档图像的模糊度评分;由于使用分类模型对文档图像进行模糊类型分类后,使用对应所述模糊类型的非线性公式,计算出所述文档图像的模糊度评分,因此,相比于现有的统一进行处理的方法,可以提高对文档图像的模糊度评分的准确性,以便于根据评估的模糊度对文档图像进行筛选,提高图像的筛选效率。
本实施例的计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本公开的范围(包括权利要求)被限于这些例子;在本发明的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,步骤可以以任意顺序实现,并存在如上所述的本发明的不同方面的许多其它变化,为了简明它们没有在细节中提供。
另外,为简化说明和讨论,并且为了不会使本发明难以理解,在所提供的附图中可以示出或可以不示出与集成电路(IC)芯片和其它部件的公知的电源/接地连接。此外,可以以框图的形式示出装置,以便避免使本发明难以理解,并且这也考虑了以下事实,即关于这些框图装置的实施方式的细节是高度取决于将要实施本发明的平台的(即,这些细节应当完全处于本领域技术人员的理解范围内)。在阐述了具体细节(例如,电路)以描述本发明的示例性实施例的情况下,对本领域技术人员来说显而易见的是,可以在没有这些具体细节的情况下或者这些具体细节有变化的情况下实施本发明。因此,这些描述应被认为是说明性的而不是限制性的。
尽管已经结合了本发明的具体实施例对本发明进行了描述,但是根据前面的描述,这些实施例的很多替换、修改和变型对本领域普通技术人员来说将是显而易见的。例如,其它存储器架构(例如,动态RAM(DRAM))可以使用所讨论的实施例。
本发明的实施例旨在涵盖落入所附权利要求的宽泛范围之内的所有这样的替换、修改和变型。因此,凡在本发明的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种文档图像的模糊度评估方法,其特征在于,包括:
基于最大多项式MaxPol滤波器提取文档图像的图像特征;
将提取的图像特征输入到预先训练得到的模糊分类模型中,得到所述文档图像的模糊类型;
从所述图像特征中提取对应所述模糊类型的模糊特征,将提取的模糊特征代入预先拟合出的、对应所述模糊类型的非线性公式,计算出所述文档图像的模糊度评分。
2.根据权利要求1所述的方法,其特征在于,所述对应所述模糊类型的非线性公式中的参数是根据数据集中每个文档图像的图像特征中对应所述模糊类型的模糊特征和主观评分,预先拟合得到的。
3.根据权利要求2所述的方法,其特征在于,所述基于MaxPol滤波器提取文档图像的图像特征,具体包括:
对所述文档图像进行灰度化处理,得到灰度图像;
从水平和垂直两个方向将所述MaxPol滤波器与灰度图像进行卷积,计算出水平和垂直两个方向的特征向量;
将计算出的水平和垂直两个方向的特征向量合成为特征图像;
计算出所述特征图像中的有效像素的高阶中心矩,作为所述文档图像的图像特征。
4.根据权利要求1所述的方法,其特征在于,所述模糊分类模型具体根据如下方法预先训练得到:
计算所述数据集中每个文档图像的图像特征;
根据数据集中针对每个文档图像标注的模糊类型,以及计算出的每个文档图像的图像特征对模糊分类模型进行训练。
5.一种文档图像的筛选方法,其特征在于,包括:
根据权利要求1-4任一所述的模糊度评估方法,得到文档图像的模糊度评分;
根据文档图像的模糊度评分筛选出合格的文档图像。
6.一种文档图像的模糊度评估装置,其特征在于,包括:
图像特征提取模块,用于基于MaxPol滤波器提取文档图像的图像特征;
模糊类型确定模块,用于将提取的图像特征输入到预先训练得到的模糊分类模型中,得到所述文档图像的模糊类型;
模糊度评分模块,用于从所述图像特征中提取对应所述模糊类型的模糊特征,将提取的模糊特征代入预先拟合出的、对应所述模糊类型的非线性公式,计算出所述文档图像的模糊度评分。
7.根据权利要求6所述的装置,其特征在于,还包括:
公式拟合模块,用于对于每种模糊类型,根据数据集中每个文档图像的图像特征中对应该模糊类型的模糊特征和主观评分,拟合得到对应该模糊类型的非线性公式中的参数。
8.根据权利要求6所述的装置,其特征在于,还包括:
模糊分类模型训练模块,用于根据数据集中针对每个文档图像标注的模糊类型,以及计算出的每个文档图像的图像特征,对模糊分类模型进行训练,得到经过训练的模糊分类模型。
9.一种文档图像的筛选装置,其特征在于,包括:
如权利要求6-8任一所述的装置中的模块;
筛选模块,用于根据根据得到的文档图像的模糊度评分筛选出合格的文档图像。
10.一种电子设备,包括中央处理单元、信号处理和存储单元,以及存储在信号处理和存储单元上并可在中央处理单元上运行的计算机程序,其特征在于,所述中央处理单元执行所述程序时实现如权利要求1-5任一所述的方法。
CN202011219396.0A 2020-11-04 2020-11-04 一种文档图像的模糊度评估、筛选方法和装置 Pending CN112434565A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011219396.0A CN112434565A (zh) 2020-11-04 2020-11-04 一种文档图像的模糊度评估、筛选方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011219396.0A CN112434565A (zh) 2020-11-04 2020-11-04 一种文档图像的模糊度评估、筛选方法和装置

Publications (1)

Publication Number Publication Date
CN112434565A true CN112434565A (zh) 2021-03-02

Family

ID=74695431

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011219396.0A Pending CN112434565A (zh) 2020-11-04 2020-11-04 一种文档图像的模糊度评估、筛选方法和装置

Country Status (1)

Country Link
CN (1) CN112434565A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103353985A (zh) * 2013-03-27 2013-10-16 西华大学 一种图像高斯模糊的测度方法
CN107133948A (zh) * 2017-05-09 2017-09-05 电子科技大学 基于多任务卷积神经网络的图像模糊与噪声评测方法
CN108921178A (zh) * 2018-06-22 2018-11-30 北京小米移动软件有限公司 获取图像模糊程度分类的方法、装置、电子设备
CN110232680A (zh) * 2019-05-30 2019-09-13 广智微芯(扬州)有限公司 一种图像模糊度评价方法及装置
CN110399878A (zh) * 2019-06-14 2019-11-01 南京火眼锐视信息科技有限公司 表格版式恢复方法,计算机可读介质以及计算机
CN111079740A (zh) * 2019-12-02 2020-04-28 咪咕文化科技有限公司 图像的质量评价方法、电子设备和计算机可读存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103353985A (zh) * 2013-03-27 2013-10-16 西华大学 一种图像高斯模糊的测度方法
CN107133948A (zh) * 2017-05-09 2017-09-05 电子科技大学 基于多任务卷积神经网络的图像模糊与噪声评测方法
CN108921178A (zh) * 2018-06-22 2018-11-30 北京小米移动软件有限公司 获取图像模糊程度分类的方法、装置、电子设备
CN110232680A (zh) * 2019-05-30 2019-09-13 广智微芯(扬州)有限公司 一种图像模糊度评价方法及装置
CN110399878A (zh) * 2019-06-14 2019-11-01 南京火眼锐视信息科技有限公司 表格版式恢复方法,计算机可读介质以及计算机
CN111079740A (zh) * 2019-12-02 2020-04-28 咪咕文化科技有限公司 图像的质量评价方法、电子设备和计算机可读存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
MAHDI S. HOSSEINI等: "Encoding Visual Sensitivity by MaxPol Convolution Filters for Image Sharpness Assessment", IEEE TRANSACTIONS ON IMAGE PROCESSING, vol. 28, no. 9, 19 August 2019 (2019-08-19), pages 4510 - 4525, XP011735611, DOI: 10.1109/TIP.2019.2906582 *

Similar Documents

Publication Publication Date Title
Gu et al. Learning a no-reference quality assessment model of enhanced images with big data
CN109583483B (zh) 一种基于卷积神经网络的目标检测方法和系统
CN111401324A (zh) 图像质量评估方法、装置、存储介质及电子设备
US8942482B2 (en) Image quality assessment
US11790499B2 (en) Certificate image extraction method and terminal device
CN110032989B (zh) 一种基于框线特征和像素分布的表格文档图像分类方法
CN111079764B (zh) 一种基于深度学习的低照度车牌图像识别方法及装置
US11398016B2 (en) Method, system, and computer-readable medium for improving quality of low-light images
JP5779089B2 (ja) エッジ検出装置、エッジ検出プログラム、およびエッジ検出方法
WO2023160312A1 (zh) 基于自监督学习的行人重识别方法、装置、设备及存储介质
CN111612741B (zh) 一种基于失真识别的精确无参考图像质量评价方法
CN110675334A (zh) 一种图像增强方法及装置
CN111598884A (zh) 图像数据处理方法、设备及计算机存储介质
CN110111347B (zh) 图像标志提取方法、装置及存储介质
CN114742722A (zh) 文档矫正方法、装置、电子设备及存储介质
Rana et al. Learning-based adaptive tone mapping for keypoint detection
CN112651945A (zh) 一种基于多特征的多曝光图像感知质量评价方法
JP7443030B2 (ja) 学習方法、プログラム、学習装置、および、学習済みウエイトの製造方法
CN107423739B (zh) 图像特征提取方法及装置
CN112330546A (zh) 图像增强方法及相关产品
CN111369531A (zh) 图像清晰度的评分方法、设备及存储装置
CN112419275A (zh) 图像质量确定方法、装置及系统
CN112434565A (zh) 一种文档图像的模糊度评估、筛选方法和装置
CN115690934A (zh) 基于批量人脸识别的师生考勤打卡方法及装置
CN110766153A (zh) 神经网络模型训练方法、装置及终端设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination