CN110428011A

CN110428011A - 一种面向视频传输质量的深度学习图像失真分类方法

Info

Publication number: CN110428011A
Application number: CN201910721496.4A
Authority: CN
Inventors: 刘桂雄; 蒋晨杰
Original assignee: South China University of Technology SCUT
Current assignee: South China University of Technology SCUT
Priority date: 2019-08-06
Filing date: 2019-08-06
Publication date: 2019-11-08

Abstract

本发明公开了一种面向视频传输质量的深度学习图像失真分类方法，该方法包括：构建卷积神经网络，设置训练超参数，选择训练损失函数，制作训练数据集；对数据集中无失真图像做数据增强处理，形成更多不同失真类型的训练样本；设计批训练过程中随机抽取训练样本的方法；完成神经网络训练，得到训练模型，实际部署后即可实时分类视频流输入目标图像的失真类型。

Description

一种面向视频传输质量的深度学习图像失真分类方法

技术领域

本发明涉及图像失真分类评价领域，尤其涉及一种基于深度学习的图像失真分类方法。

背景技术

视频图像在传输过程中会因种种原因会产生失真，所以对于图像传输过程中出现的失真正确分类就显得很重要。现有的图像失真分类技术很多都是依赖人类视觉系统或自然图像统计的计算模型，甚至是人工分类。前者失真分类准确率相对较低，容易出现判断不一致的情况；而后者则效率很低，长时间工作容易出现疲劳误差，影响判断准确性，为此寻找一种能高效、准确、智能地分类视频图像传输失真的方法具有重要现实意义。

发明内容

为解决上述技术问题，本发明的目的是提供一种面向视频传输质量的深度学习图像失真分类方法。

本发明的目的通过以下的技术方案来实现：

一种面向视频传输质量的深度学习图像失真分类方法，包括：

A构建卷积神经网络，设置训练超参数，选择训练损失函数Loss，制作训练数据集；

B对数据集中无失真图像做数据增强处理，形成更多不同失真类型的训练样本；

C设计批训练过程中随机抽取训练样本的方法；

D完成神经网络训练，得到训练模型，实际部署后即可实时分类视频流输入的目标图像失真类型。

附图说明

图1是面向视频传输质量的深度学习图像失真分类方法流程图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合实施例及附图对本发明作进一步详细的描述。

如图1所示，一种面向视频传输质量的深度学习图像失真分类方法流程，包括以下步骤：

步骤10构建卷积神经网络，设置训练超参数，选择训练损失函数Loss，制作训练数据集；

步骤20对数据集中无失真图像做数据增强处理，形成更多不同失真类型的训练样本；

步骤30设计批训练过程中随机抽取训练样本的方法；

步骤40完成神经网络训练，得到训练模型，实际部署后即可实时分类视频流输入的目标图像失真类型；

上述步骤10具体包括：超参数设置包含最大训练步数S、单次批训练样本数N、初始学习率η₀、学习率衰减率d、学习率更新间隔M、输入图像尺寸等。

上述步骤10具体包括：使用softmax函数作为CNN的分类器，选择交叉熵函数作为损失函数。

上述步骤10具体包括：记η^t为第t次学习更新间隔的学习率，为第t次学习更新间隔期间最小损失函数值，L_min为全局最小损失函数值，则η^t更新方法为：

上述步骤10具体包括：数据集中共包含无失真C_c、白噪声失真C_n、模糊失真C_b、JPEG压缩失真C_J及JPEG2000压缩失真C_J2000共5种类型图像，并从数据集中随机抽取其中60％样本作为训练集、20％样本作为测试集、20％样本作为验证集。

上述步骤20具体包括：记I为无失真图像、θ_n为图像添加白噪声函数参数、f_n(I,θ_n)为图像添加白噪声函数、θ_b为图像添加模糊函数参数、f_b(I,θ_b)为图像添加模糊函数、θ_J为图像JPEG压缩函数参数、f_J(I,θ_J)为图像JPEG压缩函数、θ_J2000为图像JPEG2000压缩函数参数、f_J2000(I,θ_J2000)为图像JPEG2000压缩函数，通过对上述函数可实现除无失真类型外其他类型的数据增强。

上述步骤30具体包括：记I^*为随机抽取到的图像、C为随机抽取图像类型、f_C()为对应类型的数据增强函数、θ_C为函数f_C()合理取值范围内的随机参数、random(C)为数据增强随机选择函数，则I^*为：

虽然本发明所揭露的实施方式如上，但所述的内容只是为了便于理解本发明而采用的实施方式，并非用以限定本发明。任何本发明所属技术领域内的技术人员，在不脱离本发明所揭露的精神和范围的前提下，可以在实施的形式上及细节上作任何的修改与变化，但本发明的专利保护范围，仍须以所附的权利要求书所界定的范围为准。

Claims

1.一种面向视频传输质量的深度学习图像失真分类方法，其特征在于，所述方法包括：

C设计批训练过程中随机抽取训练样本的方法；

2.如权利要求1所述的面向视频传输质量的深度学习图像失真分类方法，其特征在于，所述步骤A中，训练超参数设置包含最大训练步数S、单次批训练样本数N、初始学习率η₀、学习率衰减率d、学习率更新间隔M与输入图像尺寸。

3.如权利要求1所述的面向视频传输质量的深度学习图像失真分类方法，其特征在于，所述步骤A具体包括，使用softmax函数作为CNN的分类器，选择交叉熵函数作为损失函数。

4.如权利要求1所述的面向视频传输质量的深度学习图像失真分类方法，其特征在于，所述步骤A中，记η^t为第t次学习更新间隔的学习率，为第t次学习更新间隔期间最小损失函数值，L_min为全局最小损失函数值，则η^t更新方法为：

5.如权利要求1所述的面向视频传输质量的深度学习图像失真分类方法，其特征在于，所述步骤A中，数据集中共包含无失真C_c、白噪声失真C_n、模糊失真C_b、JPEG压缩失真C_J及JPEG2000压缩失真C_J2000共5种类型图像，并从数据集中抽取60％样本构成训练集、20％样本构成测试集、20％样本构成验证集。

6.如权利要求1所述的面向视频传输质量的深度学习图像失真分类方法，其特征在于，所述步骤B具体包括，记I为无失真图像、θ_n为图像添加白噪声函数参数、f_n(I,θ_n)为图像添加白噪声函数、θ_b为图像添加模糊函数参数、f_b(I,θ_b)为图像添加模糊函数、θ_J为图像JPEG压缩函数参数、f_J(I,θ_J)为图像JPEG压缩函数、θ_J2000为图像JPEG2000压缩函数参数、f_J2000(I,θ_J2000)为图像JPEG2000压缩函数，通过对上述函数实现除无失真类型外其他类型的数据增强。

7.如权利要求1所述的面向视频传输质量的深度学习图像失真分类方法，其特征在于，所述步骤C具体包括，记I^*为随机抽取到的图像、C为随机抽取图像类型、f_C()为对应类型的数据增强函数、θ_C为函数f_C()合理取值范围内的随机参数、random(C)为数据增强随机选择函数，则I^*为：