CN111091158B - 针对教辅图像的图像质量的分类方法、装置及设备 - Google Patents

针对教辅图像的图像质量的分类方法、装置及设备 Download PDF

Info

Publication number
CN111091158B
CN111091158B CN201911360386.6A CN201911360386A CN111091158B CN 111091158 B CN111091158 B CN 111091158B CN 201911360386 A CN201911360386 A CN 201911360386A CN 111091158 B CN111091158 B CN 111091158B
Authority
CN
China
Prior art keywords
image
block set
blocks
image block
classified
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911360386.6A
Other languages
English (en)
Other versions
CN111091158A (zh
Inventor
曾大为
何山
郭涛
胡金水
殷兵
刘聪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
iFlytek Co Ltd
Original Assignee
iFlytek Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by iFlytek Co Ltd filed Critical iFlytek Co Ltd
Priority to CN201911360386.6A priority Critical patent/CN111091158B/zh
Publication of CN111091158A publication Critical patent/CN111091158A/zh
Application granted granted Critical
Publication of CN111091158B publication Critical patent/CN111091158B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20021Dividing image into blocks, subimages or windows
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30168Image quality inspection

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Image Analysis (AREA)

Abstract

本申请提供了一种针对教辅图像的图像质量的分类方法,获取第一图像块集合以及第二图像块集合。其中,第一图像块集合中包括从待分类的图像中选取的图像块,第二图像块集合中包括从待分类的图像的印刷重建图像中选择的图像块。第一图像块集合中的图像块与第二图像块集合中的图像块一一对应,对应的图像块为位置信息相同的图像块。进一步依据第一图像块集合和第二图像块集合,确定待分类图像的质量分类结果。本申请获取的质量分类结果既可以对待分类的图像的原始数字图像进行质量评估,也可以对待分类的图像的打印图像进行质量评估。并且,在任意一个图像块集合中,图像块之间的结构不相似,由此保证了采样的多样性,从而提高评估结果的准确性。

Description

针对教辅图像的图像质量的分类方法、装置及设备
技术领域
本申请涉及图像处理技术领域,更具体地说,涉及一种针对教辅图像的图像质量的分类方法、装置、设备及可读存储介质。
背景技术
在实际应用中,数字图像的质量直接影响到受众通过图像获取的信息量。图像质量的评估有助于评价和指导图像压缩编码,指导图像处理算法并动态检测和调整图像质量,以得到质量较好的数字图像。因此在图像处理领域中,对图像质量的评估非常重要。
目前,随着数字教育的普及,越来越多的数字设备和技术被应用于教育行业中,教辅图像的图像质量的评估的重要性也愈发凸显。但是,现有的图像质量评估方法,对于教辅图像的图像质量评估的准确性不高。
发明内容
发明人在研究的过程中发现,现有的图像质量评估方法,对于教辅图像的图像质量评估的准确性不高的原因为:1、教辅图像通常会被打印使用,打印后得到的图像的相比电子版图像,质量通常有损失,例如,图1a为教辅图像的电子版图像,图1b为教辅图像的打印版图像,显然,打印版图像会出现因硬件分辨率的差异等因素造成的质量损失。而现有的图像质量评估方法,仅针对电子版的数字图像进行质量评估,所以评估结果不符合使用场景的需求。2、教辅图像多为框图或示意图,现有的图像质量评估方法中,图像块的采样方法导致采样的图像块的结构雷同,影响神经网络的分类效果,从而降低评估结果的准确性。
有鉴于此,本申请提供了一种针对教辅图像的图像质量的分类方法、装置、设备及可读存储介质,如下:
一种针对教辅图像的图像质量的分类方法,包括:
获取第一图像块集合和第二图像块集合,所述第一图像块集合中包括从待分类的图像中选取的图像块,所述第二图像块集合中包括从所述待分类的图像的印刷重建图像中选择的图像块;在任意一个图像块集合中,图像块之间的结构不相似;所述第一图像块集合中的图像块与所述第二图像块集合中的图像块一一对应,对应的图像块为位置信息相同的图像块;
基于所述第一图像块集合和所述第二图像块集合,确定所述待分类图像的质量分类结果。
可选地,待分类的图像的印刷重建图像的获取方法包括:
将所述待分类的图像放大k倍,得到放大图像,所述k为打印机的DPI与显示器的PPI之商;
将所述放大图像划分为k*k大小的子块;
对于每一个子块,均计算平均池化值,得到多个平均池化值;
所述多个平均池化值构成所述印刷重建图像。
可选地,待分类的图像的印刷重建图像的获取方法包括:
将所述待分类的图像输入预设的对抗神经网络模型,得到所述对抗神经网络模型输出的所述印刷重建图像;
其中,所述对抗神经网络模型使用样本图像和所述样本图像的印刷重建图像训练得到。
可选地,获取任意一个图像块集合包括:
从目标图像中选取N个图像块,其中,所述任意一个图像块集合为所述第一图像块集合,所述目标图像为所述待分类的图像,或,所述任意一个图像块集合为所述第二图像块集合,所述目标图像为所述印刷重建图像;
计算所述N个图像块中每个图像块的均值和方差;
计算所述N个图像块中两两图像块之间的结构相似性,所述结构相似性依据第一相似性和第二相似性确定,其中,所述第一相似性依据两个图像块各自的均值确定,所述第二相似性依据两个图像块之间的协方差确定;
删除结构相似性大于预设阈值的两个图像块中的一个图像块。
可选地,从目标图像中选取N个图像块,包括:
从所述目标图像中,随机选择M个图像块;
将所述M个图像块中,按照局部信息熵从大到小排序的前N个图像块作为所述N个图像块。
可选地,基于所述第一图像块集合和所述第二图像块集合,确定所述待分类图像的质量分类结果,包括:
将所述对应的图像块输入预设的第一模型,得到所述第一模型输出的所述对应的图像块的融合特征,所述第一模型用于分别对所述对应的图像块进行卷积运算,得到第一特征向量和第二特征向量;计算所述第一特征向量和所述第二特征向量中相同位置的特征点的外积,得到外积矩阵,并基于所述外积矩阵之和,得到所述融合特征;
基于所述融合特征,确定所述质量分类结果。
可选地,基于所述融合特征,确定所述质量分类结果,包括:
将各个所述对应的图像块的所述融合特征输入预设的第二模型,得到所述第二模型输出的所述质量分类结果,所述第二模型用于基于各个所述对应的图像块的所述融合特征得到压缩特征和特征权重;依据所述压缩特征和所述特征权重,计算所述压缩特征的加权和;基于所述加权和,得到所述质量分类结果。
一种针对教辅图像的图像质量的分类装置,包括:
图像块获取单元,用于获取第一图像块集合和第二图像块集合,所述第一图像块集合中包括从待分类的图像中选取的图像块,所述第二图像块集合中包括从所述待分类的图像的印刷重建图像中选择的图像块;在任意一个图像块集合中,图像块之间的结构不相似;所述第一图像块集合中的图像块与所述第二图像块集合中的图像块一一对应,对应的图像块为位置信息相同的图像块;
分类结果确定单元,用于基于所述第一图像块集合和所述第二图像块集合,确定所述待分类图像的质量分类结果。
一种针对教辅图像的图像质量的分类设备,包括:存储器和处理器;
所述存储器,用于存储程序;
所述处理器,用于执行所述程序,实现如上所述的针对教辅图像的图像质量的分类方法的各个步骤。
一种可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现如上所述的针对教辅图像的图像质量的分类方法的各个步骤。
由上述技术方案可以看出,本申请提供的针对教辅图像的图像质量的分类方法,因为第一图像块集合中包括从待分类的图像中选取的图像块,第二图像块集合中包括从待分类的图像的印刷重建图像中选择的图像块。又因为,第一图像块集合中的图像块与第二图像块集合中的图像块一一对应,对应的图像块为位置信息相同的图像块。所以,依据第图像块集合和第二图像块集合确定的待分类图像的质量分类结果,考虑了印刷重建图像的特征,因此分类结果能够反映待分类图像印刷后的质量,更适用于教辅图像的使用场景。又因为,在任意一个图像块集合中,图像块之间的结构不相似,避免了由于教辅图像局部结构存在较高一致性而造成图像块的结构雷同的缺点,保证了采样的多样性,有利于提高评估结果的准确性。综上所述,本申请提供的技术方案,针对教辅图像,具有更准确的分类结果。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1a示例了一种教辅图像的电子版图像;
图1b示例了一种教辅图像的打印版图像;
图2为本申请实施例提供的针对教辅图像的图像质量的分类方法的流程示意图;
图3为本申请实施例提供的一种针对教辅图像的图像质量的分类方法的模型示意图;
图4为本申请实施例提供的一种针对教辅图像的图像质量的分类方法的具体实施方式的流程示意图;
图5为本申请实施例提供的一种融合特征的获取方法示意图;
图6为本申请实施例提供的一种针对教辅图像的图像质量的分类装置的结构示意图;
图7为本申请实施例提供的一种针对教辅图像的图像质量的分类设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
图2为本申请实施例提供的针对教辅图像的图像质量的分类方法的流程示意图,具体可以包括以下步骤:
S201、获取第一图像块集合和第二图像块集合。
具体地,第一图像块集合中包括从待分类的图像中选取的图像块,第二图像块集合中包括从待分类的图像的印刷重建图像中选择的图像块。其中,待分类的图像为需要进行质量评估的原始图像,印刷重建图像为通过对该原始数字图像进行印刷图像重建得到的印刷图像。可以理解的是,该印刷图像的重建过程模拟了印刷图像质量损失机制,从而得到相对于原始图像可能存在质量损失,例如清晰度降低的印刷图像。本实施例中,待分类图像的示例可以如图1a所示,印刷重建图像的示例可以如图1b所示。
本实施例中,第一图像块集合中的图像块与第二图像块集合中的图像块一一对应,对应的图像块为位置信息相同的图像块。
将第一图像块集合记为X,且X={x1,x2,...,xn},将第二图像块集合记为Y,且Y={y1,y2,...,yn}。其中,记xi(1≤i≤n)为第一图像块集合中任一图像块,则,在第二图像块集合中,存在一个图像块yi与xi对应。可以理解的是,xi在待分类的图像中的位置,与xi对应的图像块yi在印刷重建图像中的位置相同。
本实施例获取的第一图像块集合和第二图像块集合中的任意一个图像块集合中,图像块之间的结构不相似。以第一图像块集合X为例,X中的任意两个图像块的结构不相似,即xi与xj的(1≤j≤n,j≠i)相似度小于预设阈值。
S202、基于第一图像块集合和第二图像块集合,确定待分类图像的质量分类结果。
具体地,可以获取第一图像块集合中的任一图像块的特征,以及该图像块的对应的图像块的特征,由此得到任一位置的融合特征。基于图像块集合中包括的所有位置的图像块及其对应的图像块的特征,得到所有位置的融合特征。进一步,依据所有融合特征,得到整个待分类图像的特征。例如,将所有融合特征的加和或加权和,作为整个待分类图像的特征。
进一步,基于待分类图像的特征得到质量分类结果。其中,质量分类结果可以为预设的分类等级,例如,优、良、合格、或不合格。
由上述技术方案可以看出,本申请提供的针对教辅图像的图像质量的分类方法,因为第一图像块集合中包括从待分类的图像中选取的图像块,第二图像块集合中包括从待分类的图像的印刷重建图像中选择的图像块,又因为,第一图像块集合中的图像块与第二图像块集合中的图像块一一对应,对应的图像块为位置信息相同的图像块。所以,将第一图像块集合中的任一图像块的特征与其在第二图像块集合中对应的图像块的特征相结合,可以表征待分类图像在该位置的质量特征,由此,本实施例依据获取的第一图像块集合和第二图像块集合中的对应的图像块,得到待分类图像的质量特征,由此确定待分类图像的质量分类结果。综上,由于本方法同时考虑了待分类的图像的原始数字图像中的图像块,以及印刷重建图像中的图像块,所以本申请获取的质量分类结果既可以对待分类的图像的原始数字图像进行质量评估,也可以对待分类的图像的打印图像进行质量评估,所以评估结果符合使用场景的需求。又因为,在任意一个图像块集合中,图像块之间的结构不相似,避免了由于教辅图像局部结构存在较高一致性而造成图像块的结构雷同的缺点,保证了采样的多样性,从而提高评估结果的准确性。
本申请实施例提供的针对教辅图像的图像质量的分类方法的一种具体的实现方式为:将待分类的图像输入训练得到的图像质量分类模型,得到图像质量分类模型输出的质量分类结果。
图3示例了一种图像质量分类模型的结构图,如图3所示,图像质量分类模型(30)可以包括图像重建模型301、第一模型302、和第二模型303。其中,图像重建模型301用于获取待分类的图像的印刷重建图像,图像重建模型301可以为对抗神经网络。第一模型用于输出对应的图像块的融合特征,第二模型用于输出质量分类结果。
图4为本申请实施例提供的一种基于图3所示的图像质量分类模型的图像质量的分类方法的具体实施方法的流程示意图,具体可以包括以下S401~S404。
S401、获取待分类的图像的印刷重建图像。
具体地,考虑到数字图像在印刷过程中的清晰度损失和可能出现的局部噪点,本实施例中,通过使用样本图像和样本图像的印刷重建图像训练得到对抗神经网络301。将待分类的图像输入对抗神经网络301,得到对抗神经网络301输出的待分类的图像的印刷重建图像。
本实施例中,对抗神经网络301可以选择CycleGAN生成器,CycleGAN生成器可以让两个不同风格域的图片互相转化,相比于其他的对抗神经网络,CycleGAN生成器本质上是两个镜像对称的GAN,构成一个环形网络,CycleGAN生成器输入的两张数字图像可以是两个域任意的两张数字图像,不需要是两个域的对应成对的数字图像。训练过程可以为:获取样本图像和样本图像的印刷重建图像的扫描图像,并将样本图像作为训练输入数据,将扫描图像作为目标输出数据训练CycleGAN生成器,训练得到CycleGAN生成器。
S402、获取第一图像块集合和第二图像块集合。
由上可知,第一图像块集合中的图像块与第二图像块集合中的图像块一一对应,并且对应的图像块为位置信息相同的图像块。所以,本实施例可以首先获取任意一个图像块集合,并基于该图像块集合中的图像块的位置信息,获取另一个图像块集合。
获取任意一个图像块集合的方法可以包括B1~B4。
B1、从目标图像中选取N个图像块。
其中,任意一个图像块集合可以为第一图像块集合,则目标图像为待分类的图像,或,任意一个图像块集合可以为第二图像块集合,则目标图像为印刷重建图像。
本实施例以获取第二图像块集合,目标图像为印刷重建图像为例进行介绍。
首先从印刷重建图像中,随机选择M个图像块。并计算M个图像块中每一图像块的局部信息熵。
其中,计算任一图像块(记为x)的局部信息熵的方法可以参照以下公式:
式中,H(x)为图像块x的局部信息熵,r表示任一像素值,p(rx)表示图像块x中像素值r出现的概率,即x中像素值为r的像素数与x所有像素数的比值。
进一步,将M个图像块中,按照局部信息熵从大到小排序的前N个图像块作为N个图像块。
需要说明的是,依据局部信息熵选择图像块为可选方式,也可以,随机选择N个图像块。但依据局部信息熵选择图像块的方式,能够避免选中大面积的空白区域,从而提高第一模型和第二模型获得的分类结果的准确性。
B2、计算N个图像块中每个图像块的均值和方差。
为便于描述,将N个图像块依照局部信息熵从大到小排序构成有序集合P,P={P1,P2,...,Pk,...,PN}。其中,Pk(1≤k≤N)为任一图像块。Pk的均值记为uk,方差记为σk
B3、计算N个图像块中两两图像块之间的结构相似性。
其中,结构相似性依据第一相似性和第二相似性确定。具体地,第一相似性依据两个图像块各自的均值确定,第二相似性依据两个图像块之间的协方差确定。
例如,两个图像块分别为Pe,Pf,(1≤e≤N,1≤f≤N,e≠f)。记ue为图像块Pe的均值,σe为图像块Pe的方差,uf为图像块Pf的均值,σf为图像块Pf的方差,σef为图像块Pe和Pf的协方差。
则,图像块Pe和Pf的结构相似性计算方法可以参考以下公式:
SIM(e,f)=l(e,f)α·s(e,f)β
式中,SIM(e,f)为图像块Pe和Pf的结构相似性,l(e,f)为图像块Pe和Pf的第一相似性,s(e,f)为图像块Pe和Pf的第二相似性。c1和c2预设的小常数,用于防止分母为零。
需要说明的是,第一相似性反映了图像的亮度信息,考虑到教辅图像多为二值分布的特点,第一相似性也可以在一定程度上反映两个图像块之间的内容相似性。s(e,f)可以反映图像块的结构相似性。式中的参数α和β用于调整第一相似性或第二相似性的比重。
本步骤将P={P1,P2,...,Pk,...,PN}中的图像块,按照上述计算方法计算任意两个图像块之间的结构相似性。
B4、删除结构相似性大于预设阈值的两个图像块中的一个图像块。
本步骤将上述得到的两个图像块之间的结构相似性与预设阈值SIM(max进行比较,若两个图像块之间的结构相似性大于该预设阈值,例如,SIM(e,f)>SIM(max),则删除图像块Pe或Pf
可选的,可以按照P中的排序,依次计算任意一个图像块与其它各个图像块之间的结构相似性。并删除结构相似性大于预设阈值的图像块中,排序靠后的图像块。
将所有结构相似性与预设阈值比较后,得到最后的n个图像块,可以理解的是,该n个图像块中,任意两个图像块的结构相似性小于预设阈值,即,任意两个图像块的结构不相似。需要说明的是,可以预设最小图像块数量,当n小于最小图像块数量的情况下,可以得到最小图像块数量的图像块后停止删除操作。也可以不设置最小图像块数量,而两两遍历比较所有的图像块。
由此,得到第二图像块集合Y,Y={y1,y2,...,yn}。
本实施例进一步基于第二图像块集合Y中任一图像块yi(1≤i≤n)的位置信息,从待分类的图像中获取与yi位置信息相同的图像块xi,由此得到第一图像块集合X,X={x1,x2,...,xn}。其中,yi与xi为对应的图像块。
S403、将对应的图像块输入预设的第一模型,得到第一模型输出的对应的图像块的融合特征。
具体地,第一模型用于分别对对应的图像块进行卷积运算,得到第一特征向量和第二特征向量,并计算第一特征向量和第二特征向量中相同位置的特征点的外积,得到外积矩阵,基于外积矩阵之和,得到融合特征。
具体的实施方式参照图3所示,可以包括以下步骤C1~C2。
C1、将对应的图像块输入预设的CNN模块,得到第一特征向量和第二特征向量。
其中,第一模型包括两个CNN(卷积神经网络)模块,一个CNN模块的输入为第一图像块集合中的图像块xi,另一CNN模块的输入为第二图像块集合中的与xi对应的图像块yi。任一CNN模块通过对输入的图像块进行卷积运算得到特征向量,由此,得到第一特征向量和第二特特征向量。
C2、将第一特征向量和第二特特征向量输入第一特征提取层(如双线性池化层),得到融合特征。
其中,以第一特征提取层为双线性池化层为例,计算第一特征向量和第二特征向量中相同位置,例如第一位置的特征点的外积,得到该第一位置的特征点的外积矩阵,并计算所有位置的特征点的外积矩阵的矩阵之和,得到融合特征。
图5为本申请实施例提供的一种融合特征的获取方法(即双线性池化层的功能)示意图,如图5所示,对应的图像块xi和yi通过两路CNN提取特征,得到尺寸为C*H*W的第一特征图,即第一特征向量ξ1,以及尺寸为C*H*W的第二特征图,即第二特征向量ξ2,C*H*W表示C个通道,每个通道特征图尺寸为H*W。
对于任一特征图上每个位置取尺寸为C*1*1的特征点,两组特征图上分别取相同位置处的特征点,并将两个相同位置的特征点求乘积,得到尺寸为C*C的矩阵。然后,将所有位置上对应的特征点的乘积进行求和得到尺寸为C*C的矩阵之和,将矩阵之和转换成向量形式得到双线性向量,进一步,将双线性向量归一化后得到融合特征zi
S404、将各个对应的图像块的融合特征输入预设的第二模型,得到第二模型输出的质量分类结果。
具体地,第二模型用于基于各个对应的图像块的融合特征得到压缩特征和特征权重。并依据压缩特征和特征权重,计算压缩特征的加权和。基于加权和,得到质量分类结果。
具体实现方式可以参照图3所示,包括以下D1~D3。
D1、将多对图像块的融合特征输入至第二模型中的全连接层,得到每一融合特征的压缩特征和特征权重。
例如,将融合特征z1,z2,...,zn输入至全连接层,得到任一融合特征zi的压缩特征以及特征权重,其中,zi为对应的图像块yi与xi的融合特征,压缩特征为特征向量。
其中,全连接层包括两路,一路全连接层得到融合特征的压缩特征zi。另一路全连接层将融合特征zi回归到一个标量,并通过激活函数映射到[0,1]之间,将该标量作为融合特征zi的特征权重。其中,每路全连接层为两层全连接层。
D2、将每一压缩特征和特征权重输入至第二模型中的第二特征提取层(如加权平均池化层),得到待分类的图像的特征。
其中,以第二特征提取层为加权平均池化层为例,考虑到每一图像块对于待分类图像的特征的贡献不同,将每一压缩特征根据对应的特征权重进行加权平均池化后,得到待分类的图像的特征。
D3、将待分类的图像的特征输入至分类器,得到质量分类结果。
其中,分类器由一个全连接层和Softmax激活函数构成,待分类的图像的特征经过分类器,可以得到图像的质量分类结果。
需要说明的是,本申请实施例提供的图像质量分类模型,作为一个整体,将待分类的图像输入,直接输出该待分类的图像的质量分类结果。在此情况下,图像重建模块、第一模型和第二模型可以分开训练。或者,将图像重建模型、第一模型、和第二模型分别作为单独的模块执行。其中,本实施例提供的任一模型的具体结构并不唯一,也即,还可以有其他的结构实现本申请提供的质量分类方法。
由上述技术方案可以看出,本实施例提供的教辅图像的图像质量的分类方法,得到的质量分类结果,可以实现对数字图像的质量评估以及对待分类图像的印刷图像的质量评估,由此该质量分类结果符合使用场景的需求。并且,由于任一图像块集合中的图像块结构不相似,提高了采样的多样性,所以提高了质量分类结果的准确性。
进一步地,由于教辅图像有可能包括大片的空白区域,所以本申请实施例在选取图像块集合时,首先使用局部信息熵筛选图像块,由此避免选到空白区域,从而增加模型分类结果的准确性。
进一步,本申请实施例采用双线性池化的特征融合方法获取对应的图像块的融合特征,计算的相同位置的特征点的外积捕获了特征通道之间成对的相关关系,并且这是平移不变的。由此,双线性融合提供了比线性模型更强的特征表示,并可以端到端地进行优化,使网络对局部特征具有更好地表达能力。
需要说明的是,除了使用图像重建模型输出印刷重建图像之外,还可以,使用以下流程生成印刷重建图像:
A1、将待分类的图像放大k倍,得到放大图像。
可以理解的是,数字图像在印刷过程中造成的损失是由于显示器PPI和打印机DPI差异造成的,并且印刷图像成像效果难以通过数字图像进行预判,所以本步骤中的放大倍数k取值为打印机的DPI与显示器的PPI之商。例如计算得到的商值为k=3。以此,对待分类的图像的印刷效果进行预判。
A2、将放大图像划分为k*k大小的子块。
A3、对于每一个子块,均计算平均池化值,得到多个平均池化值。
A4、多个平均池化值构成印刷重建图像。
基于A1-A4,图3所示的模型中,图像重建模型可以被替换为图像重建模块,使用A1-A4的流程得到印刷重建图像。
本申请实施例还提供了一种针对教辅图像的图像质量的分类装置,下面对本申请实施例提供的针对教辅图像的图像质量的分类装置进行描述,下文描述的针对教辅图像的图像质量的分类装置与上文描述的针对教辅图像的图像质量的分类方法可相互对应参照。
请参阅图6,示出了本申请实施例提供的一种针对教辅图像的图像质量的分类装置的结构示意图,如图6所示,该装置可以包括:
图像块获取单元601,用于获取第一图像块集合和第二图像块集合,所述第一图像块集合中包括从待分类的图像中选取的图像块,所述第二图像块集合中包括从所述待分类的图像的印刷重建图像中选择的图像块;在任意一个图像块集合中,图像块之间的结构不相似;所述第一图像块集合中的图像块与所述第二图像块集合中的图像块一一对应,对应的图像块为位置信息相同的图像块;
分类结果确定单元602,用于基于所述第一图像块集合和所述第二图像块集合,确定所述待分类图像的质量分类结果。
可选地,本装置还包括第一重建图像获取单元,用于获取待分类的图像的印刷重建图像,包括:
第一重建图像获取单元具体用于:
将所述待分类的图像放大k倍,得到放大图像,所述k为打印机的DPI与显示器的PPI之商;
将所述放大图像划分为k*k大小的子块;
对于每一个子块,均计算平均池化值,得到多个平均池化值;
所述多个平均池化值构成所述印刷重建图像。
可选地,本装置还包括第二重建图像获取单元,用于获取待分类的图像的印刷重建图像,包括:
第二重建图像获取单元具体用于:
将所述待分类的图像输入预设的对抗神经网络模型,得到所述对抗神经网络模型输出的所述印刷重建图像;
其中,所述对抗神经网络模型使用样本图像和所述样本图像的印刷重建图像训练得到。
可选地,图像块获取单元用于获取任意一个图像块集合,包括:
图像块获取单元具体用于:
从目标图像中选取N个图像块,其中,所述任意一个图像块集合为所述第一图像块集合,所述目标图像为所述待分类的图像,或,所述任意一个图像块集合为所述第二图像块集合,所述目标图像为所述印刷重建图像;
计算所述N个图像块中每个图像块的均值和方差;
计算所述N个图像块中两两图像块之间的结构相似性,所述结构相似性依据第一相似性和第二相似性确定,其中,所述第一相似性依据两个图像块各自的均值确定,所述第二相似性依据两个图像块之间的协方差确定;
删除结构相似性大于预设阈值的两个图像块中的一个图像块。
可选地,图像块获取单元用于从目标图像中选取N个图像块,包括:
图像块获取单元具体用于:
从所述目标图像中,随机选择M个图像块;
将所述M个图像块中,按照局部信息熵从大到小排序的前N个图像块作为所述N个图像块。
可选地,分类结果确定单元用于基于所述第一图像块集合和所述第二图像块集合,确定所述待分类图像的质量分类结果,包括:
分类结果确定单元具体用于:
将所述对应的图像块输入预设的第一模型,得到所述第一模型输出的所述对应的图像块的融合特征,所述第一模型用于分别对所述对应的图像块进行卷积运算,得到第一特征向量和第二特征向量;计算所述第一特征向量和所述第二特征向量中相同位置的特征点的外积,得到外积矩阵,并基于所述外积矩阵之和,得到所述融合特征;
基于所述融合特征,确定所述质量分类结果。
可选地,分类结果确定单元用于基于所述融合特征,确定所述质量分类结果,包括:
分类结果确定单元具体用于:
将各个所述对应的图像块的所述融合特征输入预设的第二模型,得到所述第二模型输出的所述质量分类结果,所述第二模型用于基于各个所述对应的图像块的所述融合特征得到压缩特征和特征权重;依据所述压缩特征和所述特征权重,计算所述压缩特征的加权和;基于所述加权和,得到所述质量分类结果。
本申请实施例还提供了一种针对教辅图像的图像质量的分类设备,请参阅图7,示出了该针对教辅图像的图像质量的分类设备的结构示意图,该设备可以包括:至少一个处理器701,至少一个通信接口702,至少一个存储器703和至少一个通信总线704。
在本申请实施例中,处理器701、通信接口702、存储器703、通信总线704的数量为至少一个,且处理器701、通信接口702、存储器703通过通信总线704完成相互间的通信。
处理器701可能是一个中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路等。
存储器703可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory)等,例如至少一个磁盘存储器。
其中,存储器存储有程序,处理器可调用存储器存储的程序,所述程序用于:
获取第一图像块集合和第二图像块集合,所述第一图像块集合中包括从待分类的图像中选取的图像块,所述第二图像块集合中包括从所述待分类的图像的印刷重建图像中选择的图像块;在任意一个图像块集合中,图像块之间的结构不相似;所述第一图像块集合中的图像块与所述第二图像块集合中的图像块一一对应,对应的图像块为位置信息相同的图像块;
基于所述第一图像块集合和所述第二图像块集合,确定所述待分类图像的质量分类结果。
可选的,所述程序的细化功能和扩展功能可参照上文描述。
本申请实施例还提供一种可读存储介质,该可读存储介质可存储有适于处理器执行的程序,所述程序用于:
获取第一图像块集合和第二图像块集合,所述第一图像块集合中包括从待分类的图像中选取的图像块,所述第二图像块集合中包括从所述待分类的图像的印刷重建图像中选择的图像块;在任意一个图像块集合中,图像块之间的结构不相似;所述第一图像块集合中的图像块与所述第二图像块集合中的图像块一一对应,对应的图像块为位置信息相同的图像块;
基于所述第一图像块集合和所述第二图像块集合,确定所述待分类图像的质量分类结果。
可选的,所述程序的细化功能和扩展功能可参照上文描述。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (9)

1.一种针对教辅图像的图像质量的分类方法,其特征在于,包括:
获取第一图像块集合和第二图像块集合,所述第一图像块集合中包括从待分类的图像中选取的图像块,所述第二图像块集合中包括从所述待分类的图像的印刷重建图像中选择的图像块;在任意一个图像块集合中,图像块之间的结构不相似;所述第一图像块集合中的图像块与所述第二图像块集合中的图像块一一对应,对应的图像块为位置信息相同的图像块;其中,所述待分类的图像为需要进行质量评估的原始图像,所述印刷重建图像为通过对该原始图像进行印刷图像重建得到的印刷图像;
基于所述第一图像块集合和所述第二图像块集合得到所有位置的融合特征,以基于所述融合特征确定所述待分类图像的质量分类结果;
其中,获取任意一个图像块集合包括:
从目标图像中选取N个图像块,其中,所述任意一个图像块集合为所述第一图像块集合,所述目标图像为所述待分类的图像,或,所述任意一个图像块集合为所述第二图像块集合,所述目标图像为所述印刷重建图像;
计算所述N个图像块中每个图像块的均值和方差;
计算所述N个图像块中两两图像块之间的结构相似性,所述结构相似性依据第一相似性和第二相似性确定,其中,所述第一相似性依据两个图像块各自的均值确定,所述第二相似性依据两个图像块之间的协方差确定;
删除结构相似性大于预设阈值的两个图像块中的一个图像块。
2.根据权利要求1所述的方法,其特征在于,所述待分类的图像的印刷重建图像的获取方法包括:
将所述待分类的图像放大k倍,得到放大图像,所述k为打印机的DPI与显示器的PPI之商;
将所述放大图像划分为k*k大小的子块;
对于每一个子块,均计算平均池化值,得到多个平均池化值;
所述多个平均池化值构成所述印刷重建图像。
3.根据权利要求1所述的方法,其特征在于,所述待分类的图像的印刷重建图像的获取方法包括:
将所述待分类的图像输入预设的对抗神经网络模型,得到所述对抗神经网络模型输出的所述印刷重建图像;
其中,所述对抗神经网络模型使用样本图像和所述样本图像的印刷重建图像训练得到。
4.根据权利要求1所述的方法,其特征在于,所述从目标图像中选取N个图像块,包括:
从所述目标图像中,随机选择M个图像块;
将所述M个图像块中,按照局部信息熵从大到小排序的前N个图像块作为所述N个图像块。
5.根据权利要求1所述的方法,其特征在于,所述基于所述第一图像块集合和所述第二图像块集合得到所有位置的融合特征,以基于所述融合特征确定所述待分类图像的质量分类结果,包括:
将所述对应的图像块输入预设的第一模型,得到所述第一模型输出的所述对应的图像块的融合特征,所述第一模型为卷积神经网络模型,用于分别对所述对应的图像块进行卷积运算,得到第一特征向量和第二特征向量;计算所述第一特征向量和所述第二特征向量中相同位置的特征点的外积,得到外积矩阵,并基于所述外积矩阵之和,得到所述融合特征;
基于所述融合特征,确定所述质量分类结果。
6.根据权利要求5所述的方法,其特征在于,所述基于所述融合特征,确定所述质量分类结果,包括:
将各个所述对应的图像块的所述融合特征输入预设的第二模型,得到所述第二模型输出的所述质量分类结果,所述第二模型用于基于各个所述对应的图像块的所述融合特征得到压缩特征和特征权重;依据所述压缩特征和所述特征权重,计算所述压缩特征的加权和;基于所述加权和,得到所述质量分类结果。
7.一种针对教辅图像的图像质量的分类装置,其特征在于,包括:
图像块获取单元,用于获取第一图像块集合和第二图像块集合,所述第一图像块集合中包括从待分类的图像中选取的图像块,所述第二图像块集合中包括从所述待分类的图像的印刷重建图像中选择的图像块;在任意一个图像块集合中,图像块之间的结构不相似;所述第一图像块集合中的图像块与所述第二图像块集合中的图像块一一对应,对应的图像块为位置信息相同的图像块;其中,所述待分类的图像为需要进行质量评估的原始图像,所述印刷重建图像为通过对该原始图像进行印刷图像重建得到的印刷图像;
分类结果确定单元,用于基于所述第一图像块集合和所述第二图像块集合得到所有位置的融合特征,以基于所述融合特征确定所述待分类图像的质量分类结果;
其中,所述图像块获取单元获取任意一个图像块集合包括:
从目标图像中选取N个图像块,其中,所述任意一个图像块集合为所述第一图像块集合,所述目标图像为所述待分类的图像,或,所述任意一个图像块集合为所述第二图像块集合,所述目标图像为所述印刷重建图像;
计算所述N个图像块中每个图像块的均值和方差;
计算所述N个图像块中两两图像块之间的结构相似性,所述结构相似性依据第一相似性和第二相似性确定,其中,所述第一相似性依据两个图像块各自的均值确定,所述第二相似性依据两个图像块之间的协方差确定;
删除结构相似性大于预设阈值的两个图像块中的一个图像块。
8.一种针对教辅图像的图像质量的分类设备,其特征在于,包括:存储器和处理器;
所述存储器,用于存储程序;
所述处理器,用于执行所述程序,实现如权利要求1~6中任一项所述的针对教辅图像的图像质量的分类方法的各个步骤。
9.一种可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现如权利要求1~6中任一项所述的针对教辅图像的图像质量的分类方法的各个步骤。
CN201911360386.6A 2019-12-25 2019-12-25 针对教辅图像的图像质量的分类方法、装置及设备 Active CN111091158B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911360386.6A CN111091158B (zh) 2019-12-25 2019-12-25 针对教辅图像的图像质量的分类方法、装置及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911360386.6A CN111091158B (zh) 2019-12-25 2019-12-25 针对教辅图像的图像质量的分类方法、装置及设备

Publications (2)

Publication Number Publication Date
CN111091158A CN111091158A (zh) 2020-05-01
CN111091158B true CN111091158B (zh) 2024-04-30

Family

ID=70397377

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911360386.6A Active CN111091158B (zh) 2019-12-25 2019-12-25 针对教辅图像的图像质量的分类方法、装置及设备

Country Status (1)

Country Link
CN (1) CN111091158B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112669289A (zh) * 2020-12-30 2021-04-16 科大讯飞股份有限公司 影像质量评估方法、装置、电子设备及存储介质

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6535221B1 (en) * 1999-06-22 2003-03-18 Oak Technology, Inc. Image enhancement method and apparatus for internet printing
CN103454282A (zh) * 2013-08-30 2013-12-18 陕西科技大学 一种基于图像灰度梯度的印刷品墨斑测量方法
WO2015180055A1 (zh) * 2014-05-28 2015-12-03 北京大学深圳研究生院 一种基于分类字典库的超分辨率图像重构方法及装置
CN105959684A (zh) * 2016-05-26 2016-09-21 天津大学 基于双目融合的立体图像质量评价方法
CN105975922A (zh) * 2016-04-29 2016-09-28 乐视控股(北京)有限公司 信息处理方法及装置
CN106203354A (zh) * 2016-07-14 2016-12-07 南京信息工程大学 基于混合深度结构的场景识别方法
CN106327539A (zh) * 2015-07-01 2017-01-11 北京大学 基于样例的图像重建方法及装置
CN106709945A (zh) * 2017-01-09 2017-05-24 方玉明 一种对于超分辨率图像的质量评价方法
CN106815839A (zh) * 2017-01-18 2017-06-09 中国科学院上海高等研究院 一种图像质量盲评估方法
CN108133456A (zh) * 2016-11-30 2018-06-08 京东方科技集团股份有限公司 人脸超分辨率重建方法、重建设备以及计算机系统
CN110136056A (zh) * 2018-02-08 2019-08-16 华为技术有限公司 图像超分辨率重建的方法和装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105046664B (zh) * 2015-07-13 2018-05-25 广东工业大学 一种基于自适应epll算法的图像去噪方法

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6535221B1 (en) * 1999-06-22 2003-03-18 Oak Technology, Inc. Image enhancement method and apparatus for internet printing
CN103454282A (zh) * 2013-08-30 2013-12-18 陕西科技大学 一种基于图像灰度梯度的印刷品墨斑测量方法
WO2015180055A1 (zh) * 2014-05-28 2015-12-03 北京大学深圳研究生院 一种基于分类字典库的超分辨率图像重构方法及装置
CN106327539A (zh) * 2015-07-01 2017-01-11 北京大学 基于样例的图像重建方法及装置
CN105975922A (zh) * 2016-04-29 2016-09-28 乐视控股(北京)有限公司 信息处理方法及装置
CN105959684A (zh) * 2016-05-26 2016-09-21 天津大学 基于双目融合的立体图像质量评价方法
CN106203354A (zh) * 2016-07-14 2016-12-07 南京信息工程大学 基于混合深度结构的场景识别方法
CN108133456A (zh) * 2016-11-30 2018-06-08 京东方科技集团股份有限公司 人脸超分辨率重建方法、重建设备以及计算机系统
CN106709945A (zh) * 2017-01-09 2017-05-24 方玉明 一种对于超分辨率图像的质量评价方法
CN106815839A (zh) * 2017-01-18 2017-06-09 中国科学院上海高等研究院 一种图像质量盲评估方法
CN110136056A (zh) * 2018-02-08 2019-08-16 华为技术有限公司 图像超分辨率重建的方法和装置

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
Pedram Mohammadi 等.Subjective and Objective Quality Assessment of Image: A Survey.Preprint Submitted to Elsevier.2014,1-50. *
吴亮.文本图像超分辨率显示算法研究.中国优秀硕士学位论文全文数据库 信息科技辑.2019,I138-2697. *
张子龙 ; 李庆武 ; 何敏 ; 武福生 ; .一种基于多尺度结构自相似性的图像超分辨率重建算法.科学技术与工程.2016,(33),92-97. *
杨村强.基于图像块多级分类和稀疏表示的超分辨率重建算法研究.中国优秀硕士学位论文全文数据库 信息科技辑.2017,I138-2622. *
熊炜 等.基于支持向量机的低质量文档图像二值化.计算机应用与软件.2018,第35卷(第35期),218-223,241. *

Also Published As

Publication number Publication date
CN111091158A (zh) 2020-05-01

Similar Documents

Publication Publication Date Title
Fu et al. Screen content image quality assessment using multi-scale difference of Gaussian
CN109711422B (zh) 图像数据处理、模型的建立方法、装置、计算机设备和存储介质
CN111080528A (zh) 图像超分辨率和模型训练方法、装置、电子设备及介质
CN111080527A (zh) 一种图像超分辨率的方法、装置、电子设备及存储介质
Li et al. Sparse representation-based image quality index with adaptive sub-dictionaries
US11416971B2 (en) Artificial intelligence based image quality assessment system
CN110717450A (zh) 自动识别原始文档的翻拍图像的训练方法和检测方法
CN106355195B (zh) 用于测量图像清晰度值的系统及其方法
CN111163338A (zh) 视频清晰度评估模型训练方法、视频推荐方法及相关装置
Li et al. Image quality assessment using deep convolutional networks
CN109635714B (zh) 文档扫描图像的矫正方法及装置
CN111047543A (zh) 图像增强方法、装置和存储介质
JP2019194821A (ja) 目標認識装置、目標認識方法及びプログラム
CN111091158B (zh) 针对教辅图像的图像质量的分类方法、装置及设备
JP2021189527A (ja) 情報処理装置、情報処理方法及びプログラム
Fu et al. Screen content image quality assessment using Euclidean distance
CN110490170B (zh) 一种人脸候选框提取方法
CN115937540A (zh) 基于Transformer编码器的图像匹配方法
CN112950592B (zh) 基于高维离散余弦变换的无参考光场图像质量评价方法
CN114119423A (zh) 图像处理方法、装置、电子设备和存储介质
Sun et al. Reduced-reference image quality assessment through SIFT intensity ratio
KR20220021495A (ko) Ai에 기반하여 스트리밍 파일의 해상도를 개선하는 방법
CN111612766A (zh) 图像质量评价方法、装置和电子设备
CN114973299B (zh) 建筑图纸构件识别方法、装置、电子设备及存储介质
Liu et al. The First Comprehensive Dataset with Multiple Distortion Types for Visual Just-Noticeable Differences

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant