CN111626409B

CN111626409B - 一种图像质量检测的数据生成方法

Info

Publication number: CN111626409B
Application number: CN202010750951.6A
Authority: CN
Inventors: 王逸飞
Original assignee: Jiangxi Gosun Guard Security Service Technology Co ltd
Current assignee: Jiangxi Gosun Guard Security Service Technology Co ltd
Priority date: 2020-07-30
Filing date: 2020-07-30
Publication date: 2020-11-24
Anticipated expiration: 2040-07-30
Also published as: CN111626409A

Abstract

本发明公开一种图像质量检测的数据生成方法，具体为：第一：基于无监督学习的深度卷积神经网络

，在于训练深度卷积神经网络，实现对输入图像的等级判断；第二：基于有监督学习的深度卷积神经网络

，确定输入图像的目标函数；第三：图像检测，将需要检测的图像输入到目标函数，获取得到最终的图像质量输出结果。本发明打破了传统方法非常依赖训练数据集的限制，可最大程度上的解压模型训练时，数据不足导致模型过拟合、数据评估不准确，过于主观的问题。

Description

一种图像质量检测的数据生成方法

技术领域

本发明涉及图像处理领域，更具体地，涉及一种图像质量检测的数据生成方法。

背景技术

深度卷积神经网络(Deep Convolution Neural Network)，目前应用于各种计算机视觉(CV)任务，如：图像分割，图像分类，图像语义分析等等，其中图像质量分析也是一个非常重要的应用分支。这个任务相较于其他的人物场景，有更大的挑战：数据来源较为困难，数据组成方式复杂，数据标注有极大的主观性。这使得这个任务在实现上有着非常的大的困难和局限性。但实际上这个使用场景又有非常大的潜力和需求：所有采集到的图片数据，并非都有被使用的价值，很多数据在一些应用场景下，都是需要达到一定的图片呈现能力的，低于某个图像呈现的效果的，这个数据将不适合使用并应该予以放弃筛选。

现在流行的，可靠的机器学习方法，主流是监督学习。这种学习方法，需要对算法提供大量的数据样本，才能实现机器学习的目标。然而，对于图像质量分析这个领域，有着相对于其他类型的数据更加复杂的采集情况：1、数据标注上，图像数据界限非常模糊，标注人员对同一个图像，图像质量的界定也会产生非常大的分歧。2、数据增强是一种通用的应用于提高监督学习泛化能力的方法，在很多的应用到机器学习的计算机视觉任务都有使用，然而这个方法也比较难以应用到图像质量分析的任务上，标注本身任务无法给与明确的评价，也使得增强产生的数据的尺度受到影响，从而使数据增强无法直接应用到监督学习的任务上。

发明内容

为了克服上述现有技术的不足，本发明提供一种图像质量检测的数据生成方法，是一种在监督学习场景下，监控相机场景的图像质量问题的数据解决方案，该方法在数据标注、数据增强方面提供了可行性，实现通过深度卷积神经网络，结合监督学习的方案，进而实现图像质量评估的方法。

为了实现上述目的，本发明的技术方案为：

一种图像质量检测的数据生成方法，包括模型训练及图像检测；

其中模型训练是：

第一部分：基于无监督学习的深度卷积神经网络

，在于训练深度卷积神经网络，实现对输入图像的等级判断；

第二部分：基于有监督学习的深度卷积神经网络

，确定输入图像的目标函数；

其中图形检测是将需要检测的图像输入到目标函数，获取得到最终的图像质量输出结果。

优选的，第一部分是基于无监督学习的深度卷积神经网络

，在于训练深度卷积神经网络，实现对输入图像的等级判断；具体是：

通过数据处理方法生成的数据集；在最简单的形式上，给定图像I ₁和I ₂对应的图像质量Q₁和Q₂，设图像质量为Q₁>Q₂，则深度学习网络G(I_i)能够实现某个映射：

G(I_i)=Q_i

在这个模型里，设已知输入图像数据的质量为G(I ₁)>G(I ₂)>G(I ₃)>…>G(I _i)…>G(I _N)且

，总有

，则优化目标为：

。

优选的，第二部分是基于有监督学习的深度卷积神经网络

，确定输入图像的目标函数，具体是：

设每个图有S个标注，一共有M个图片，则对一个输入图像I ₁，给定一组标注L={l ₁,l ₂,l ₃,…,l _s}通过深度卷积神经网络

，将深度卷积神经网络

对图像I的输出作为输入，得到模型F(I)的输出为Y={y ₁,y ₂,y ₃,…,y _s}，这个过程映射表示为：

；

则在这个过程里面，机器学习的优化目标为：

。

优选的，对于深度卷积神经网络

，由于是无监督模型，因此数据的展现形式为：对于任何给定的一个图像I，采用图像扭曲算法

对图像进行扭曲，具体是基于这种图像扭曲算法采用不同程度的参数

进行扭曲，得到针对这个图像的无监督训练图像集

；接下来，扩展这个思路，定义M个扭曲算法，则所有的扭曲算法表示为

；得到所有的扭曲Distortion排列；并且，根据图像扭曲后的质量，按照从高到低的顺序设计参数d，进而对深度卷积神经网络

产生大量的非监督数据；这些非监督数据将帮助深度卷积神经网络捕捉到不同扭曲对图像的影响。

优选的，图像检测具体为：

（1）对监控相机的图像进行分析，得到监控相机的主要集中扭曲形式：

（2）对图像数据参数进行调整，直接对图像每一种不同的扭曲方法进行建模；

在实际的训练场景中，对每一个候选图像I，每一次迭代，随机从M个扭曲方案中，选用一个扭曲方案m，并采用包含K种不同的扭曲参数的集合P来构建非监督的训练数据集，对每一组

，即

；

其中G：表示之前的神经网络映射；D：表示扭曲方法；M：扭曲方法的具体个数；I：表示输入图像；P：表示对应到每一个扭曲方法的参数集合；K：扭曲参数的个数；

：表示对应到特定的扭曲方法

的扭曲参数集合P，选择第k个特定的扭曲参数；

（3）对于模型

，需要对图像数据进行合理的标注进行描述；因此，在标注训练图像数据的时候，首先根据图像数据的呈现形式，对图像数据分成C个类别，然后让标注团队的成员，对这C个类别的数据进行打分；选择了2k+1个标注人员，因此得到打分结果S’={s₁,s₂,…,s_2k+1}，对所有的打分结果，去掉最高的m个分数和最低的m个分数，对剩下的2k+1-2m个分数进行统计，当S=C时，得到这个图像的实际标注

；其中，l表示为在这个样本的标注的结果里，展示的每一个分类中的概率：

举个例子来说：一个图，给13个人标注，一共3个等级，去掉一个最高分，去掉一个最低分，还剩下11个人。这11个人打分分别为 1个1分，5个2分，5分3分，那么，这个特定图片的标签就是

，分别代表类别1，类别2和类别3个概率；

（4）对于模型

，根据数据的标签形式对数据设计损失函数；

（5）采用标量来描述一个图像的质量，具体是将之前的类别C进行量化，然后对类别C对应的预测y，进行如下公式计算：

得到最终的IQA数值输出结果q，基于输出结果q确定图形的质量等级。

优选的，所述扭曲形式主要包括：JPEG压缩噪声，相机高感光度噪声，运动模糊，过度锐化，过高对比度，白化。

优选的，所述损失函数为回归法或KL散度法。

优选的，所述类别C=5，C个不同的分值，在模型完成推理后，会得到基于这5个类别的概率值，最终按照计算公式

，得到一个固定的IQA数值输出结果。

与现有技术相比，本发明的有益效果是：

（1）本发明打破了传统方法非常依赖训练数据集的限制，可最大程度上的解压模型训练时，数据不足导致模型过拟合、数据评估不准确，过于主观的问题。

（2）在数据增强方面，本发明有效的打破了数据增强和模型分数的强关联，使得特征提取更具有针对性。

（3）本发明解决了同质化数据的生成，传统的数据增强方式，大多采取一种数据增强方案，反复使用，使得数据在构成中具有大量的同质化信息，这些信息在作为训练数据进行学习，会导致模型的不准确性，不确定性增加，非常依赖于训练数据。

（4）本发明解决了图像质量评估场景中，评分单一的问题。一般公开的图像质量分数都为一个标量数据，但其分数来来源非常不明确，分数也有失公允。本方案可以很好的规避这类问题，同时兼顾质量表现时的便利性。

附图说明

图1为本发明流程示意图。

具体实施方式

下面结合附图和具体实施方式对本发明作进一步描述。

如图1，一种图像质量检测的数据生成方法，包括模型训练及图像检测；

其中模型训练是：

第一部分：基于无监督学习的深度卷积神经网络

第二部分：基于有监督学习的深度卷积神经网络

，确定输入图像的目标函数；

上述第一部分是基于无监督学习的深度卷积神经网络

G(I_i)=Q_i

，总有

则优化目标为：

。

第二部分是基于有监督学习的深度卷积神经网络

，确定输入图像的目标函数，具体是：

，将深度卷积神经网络

；

则在这个过程里面，机器学习的优化目标为：

。

对于深度卷积神经网络

进行扭曲，得到针对这个图像的无监督训练图像集

图像检测具体为：

即

；

：表示对应到特定的扭曲方法

的扭曲参数集合P，选择第k个特定的扭曲参数；

（3）对于模型

，分别代表类别1，类别2和类别3个概率；

（4）对于模型

，根据数据的标签形式对数据设计损失函数；目前，有两种损失函数可以使用，一种采用回归的方法，另一种采用KL散度的方式。这里都描述一下：

回归法：

KL散度法：

这两种方法，目前都测试过可以正常达到算法训练的优化目的。并没有横向的对这两个函数产生的结果进行比较，但从实际使用上来看，都能达到使用要求。

目前的算法部署上，采用KL散度的算法更为普遍，因为产生的数值更加具有连续性，数值更加合理，不会出现异常数值。

（5）最后，通常会给出一个标量，来描述一个图像的质量，而不是像之前回归的目标一样，存在一个向量的方式进行回归。为此将之前的类别C进行量化，然后对类别c对应的预测y，进行如下计算，得到最终的输出结果q：

在实际的应用场景下，采用了将5个类别，划分成{0，25，50，75，100}，5个不同的分值，模型完成推理后，会得到基于这5个类别的概率值，如{0.1，0.25，0.55，0.08，0.02}，则可以最终按照上面的计算法则，得到一个固定的IQA数值输出：41.75。可以知道这个图片大概是一个第三等级的图片。

通过本发明所述的方法最终量化的质量分数q=0.03*0+0.1*25+0.02*50+0.25*75+0.6*100=82.25，再基于该数值确定图形的质量等级。

以上所述的本发明的实施方式，并不构成对本发明保护范围的限定。任何在本发明的精神原则之内所作出的修改、等同替换和改进等，均应包含在本发明的权利要求保护范围之内。

Claims

1.一种图像质量检测的数据生成方法，其特征在于，包括模型训练及图像检测；

其中模型训练是：

第一部分：基于无监督学习的深度卷积神经网络

第二部分：基于有监督学习的深度卷积神经网络

，确定输入图像的目标函数；

其中图形检测是将需要检测的图像输入到目标函数，获取得到最终的图像质量输出结果；

第一部分是基于无监督学习的深度卷积神经网络

G(I_i)=Q_i

，总有

，则优化目标为：

。

2.根据权利要求1所述的图像质量检测的数据生成方法，其特征在于，第二部分是基于有监督学习的深度卷积神经网络

，确定输入图像的目标函数，具体是：

设每个图有S个标注，一共有M个图片，则对一个输入图像I ₁，给定一组标注L={l ₁,l ₂,l ₃,…,l _s}通过无监督学习的深度卷积神经网络

，将基于无监督学习的深度卷积神经网络

；

则在这个过程里面，机器学习的优化目标为：

。

3.根据权利要求2所述的图像质量检测的数据生成方法，其特征在于，对于深度卷积神经网络

进行扭曲，得到针对这个图像的无监督训练图像集

4.根据权利要求3所述的图像质量检测的数据生成方法，其特征在于，图像检测具体为：

，即

；

：表示对应到特定的扭曲方法

的扭曲参数集合P，选择第k个特定的扭曲参数；

（3）对于模型

，需要对图像数据进行合理的标注进行描述；因此，在标注训练图像数据的时候，首先根据图像数据的呈现形式，对图像数据分成C个类别，然后让标注团队的成员，对这C个类别的数据进行打分；选择了2k+1个标注人员，因此得到打分结果S’={s₁,s₂,…,s_2k+1}，对所有的打分结果，去掉最高的m个分数和最低的m个分数，对剩下的2k+1-2m个分数进行统计，当S=C时，到这个图像的实际标注

（4）对于模型

，根据数据的标签形式对数据设计损失函数；

5.根据权利要求4所述的图像质量检测的数据生成方法，其特征在于，所述扭曲形式主要包括：JPEG压缩噪声，相机高感光度噪声，运动模糊，过度锐化，过高对比度，白化。

6.根据权利要求5所述的图像质量检测的数据生成方法，其特征在于，所述损失函数为回归法或KL散度法。

7.根据权利要求6所述的图像质量检测的数据生成方法，其特征在于，所述类别C=5，C个不同的分值，在模型完成推理后，会得到基于这5个类别的概率值，最终按照计算公式

，得到一个固定的IQA数值输出结果。