CN110032662A

CN110032662A - 基于改进的dice损失函数的视频图像失真效应模型构建方法

Info

Publication number: CN110032662A
Application number: CN201910405257.8A
Authority: CN
Inventors: 林丽群; 陈柏林
Original assignee: Fuzhou University
Current assignee: Fuzhou University
Priority date: 2019-05-16
Filing date: 2019-05-16
Publication date: 2019-07-19

Abstract

本发明涉及一种基于改进的dice损失函数的视频图像失真效应模型构建方法。首先，基于Dice损失函数进行函数改进，加入权重因子和平滑因子更好的适应样本数据集特征；其次，在DenseNet的密集型卷积神经网络采用改进的损失函数对数据进行训练，实现模型的分类构建；最后，利用训练好的模型对现有的视频图像进行分类预测，判断视频图像是否失真。本发明方法较采用传统的损失函数训练模型相比，改进的损失函数在六种常见的视频图像失真效应数据集里识别检测的精度有所提高，优势明显。

Description

基于改进的dice损失函数的视频图像失真效应模型构建方法

技术领域

本发明涉及视频图像失真效应技术领域，特别是一种基于改进的dice损失函数的视频图像失真效应模型构建方法。

背景技术

随着计算机软硬件技术的发展和网络用户规模的快速增长,视频图像成为了人们用来表示和传达信息的一种主流方式。然而视频图像的质量在从采集到最终呈现到用户面前，会因设备受损、环境因素、转换编码等影响而引人各种失真问题,特别是混合MC/DPCM/DCT视频编码算法[ITU90、ITU95、SEC91、SEC92]产生的压缩编码失真在很大程度上会阻碍用户从视频图像中获取清楚的信息，极大的影响了用户的视觉质量。

为了消除视频图像中的失真效应这一难题，多年来许多研究人员做了大量的工作。在过去的数十年里，受计算能力的限制，视频压缩失真效应的检测和识别一直都是一项非常困难的任务。但是在2012年，卷积神经网络(CNN)实现了图像识别领域的重大突破，也开始被应用在视频编码检测任务上，表现出了良好的效果。

图像识别检测性能的提高是因为CNN网络结构(如GoogleNet和ResNet)深度的增加。但是众多研究发现，当网络结构达到一定深度后，其性能也会趋于平均精度。近年来，考虑到实验设备和计算资源等因素，研究人员也在研究卷积神经网络模型的其他方面，如损失函数、激活函数、优化器等。其中，学术界和工业界在损失函数进行了很多研究并提出了很多性能良好的损失函数，都对图像识别性能提高起到了很大作用。

发明内容

本发明的目的在于提供一种基于改进的dice损失函数的视频图像失真效应模型构建方法，该方法提高了视频图像失真效应分类检测的精度。

为实现上述目的，本发明的技术方案是：一种基于改进的dice损失函数的视频图像失真效应模型构建方法，包括如下步骤：

步骤S1、基于Dice损失函数进行函数改进，加入权重因子和平滑因子更好的适应样本数据集特征；

步骤S2、在DenseNet的密集型卷积神经网络采用改进的损失函数对数据进行训练，实现模型的分类构建；

步骤S3、利用训练好的模型对现有的视频图像进行分类预测，判断视频图像是否失真。

在本发明一实施例中，所述步骤S1具体实现如下：

步骤S11、Dice Loss描述了在图像中感兴趣的结构仅占据扫描的非常小的区域，从而使学习过程陷入损失函数的局部最小值，因此要加大前景区域的权重Dice；其中Dice可以理解为是两个轮廓区域的相似程度，如果用A、B表示两个轮廓区域所包含的点集，则Dice可以表示为如果用TP，FP，FN表示是真阳性、假阳性、假阴性的个数，则Dice可以表示为

步骤S12、基于步骤S11的原理，对Dice loss加入平滑因子和权重因子，构造了一个新的Dice loss损失函数，函数表达式如下：

其中，y_true为输入实例的真实类别，y_pred为预测输入实例属于类别1的概率，ω是权重因子，ε是平滑因子；

步骤S13、根据步骤S12所改进的Dice loss损失函数，根据样本数据集的比例和样本特点设置平滑因子和权重因子值，以更好的贴合不均衡的训练场景下、以提高模型的训练效果，同时并且可直接在评价标准上进行优化，提升拟合效果。

在本发明一实施例中，所述步骤S2具体实现如下：

步骤S21、读取数据集，并利用图片生成器对数据样本进行包括拉伸、旋转的变换和数据扩充，得到比原来数据集更大的样本集训练，提高网络识图能力以模型拟合效果：

步骤S22、载入模型网络，并根据训练要求添加新层，搭建训练模型；

步骤S23、将步骤S1所改进设置的损失函数引入网络；

步骤S24、引入训练效果评价指标ACC、ROC/AUC和F1-Score，对模型训练过程进行实时评价；

步骤S25、实时保存训练模型和数据，并根据最终迭代结果画图。

在本发明一实施例中，所述步骤S3具体实现如下：

步骤S31、引入步骤S2训练的模型构建测试网络程序；

步骤S32、将利用H.265的编码器HM16.9编码的视频导入测试网络程序，让训练好的模型自动进行识别检测；

步骤S33、将检测视频的结果以0和1的识别值输出，检测视频图像编码过程是否存在失真效应。

相较于现有技术，本发明具有以下有益效果：本发明方法有效地提高了视频图像编码过程中失真效应的识别检测精度，具有非常广泛的应用前景。

附图说明

图1是本发明实施例过程中的整体工作流程图。

图2是本发明实施例过程中的损失函数算法实现流程图。

图3是本发明实施例中基于改进的Dice损失函数的网络训练流程图。

具体实施方式

下面结合附图，对本发明的技术方案进行具体说明。

本发明提供了一种基于改进的dice损失函数的视频图像失真效应模型构建方法，包括如下步骤：

以下为本发明一具体实施例。

本实施提供种基于改进的Dice函数的视频图像失真效应分类检测模型构建方法，分类检测整体工作流程如图1所示，包括以下步骤：步骤S1：基于Dice损失函数进行函数改进，加入权重因子和平滑因子更好的适应样本数据集特征；步骤S2：在DenseNet的密集型卷积神经网络采用改进的损失函数对数据进行训练，实现模型的分类构建；步骤S3：利用训练好的模型对现有的视频图像进行分类预测，判断视频图像是否失真。

损失函数算法实现流程图如图2所述：在本实施例中，所述步骤S1中，基于Dice损失函数进行函数改进，加入权重因子和平滑因子更好的适应样本数据集特征，具体包括以下步骤：

步骤S11：Dice Loss描述了在图像中感兴趣的结构仅占据扫描的非常小的区域，从而使学习过程陷入损失函数的局部最小值，因此要加大前景区域的权重Dice。其中Dice可以理解为是两个轮廓区域的相似程度，如果用A、B表示两个轮廓区域所包含的点集，则Dice可以表示为如果用TP，FP，FN表示是真阳性、假阳性、假阴性的个数，则Dice可以表示为

步骤S12：基于步骤S11所述的原理，本发明对Dice loss这一损失函数加入了平滑因子和权重因子，构造了一个新的损失函数，函数表达式如下：

其中，y_true为输入实例的真实类别，y_pred为预测输入实例属于类别1的概率，ω是权重因子，ε是平滑因子。

步骤S13：根据步骤S12所改进的Dice loss损失函数，根据样本数据集的比例和样本特点设置平滑因子和权重因子值，更好的贴合不均衡的训练场景下、以提高模型的训练效果，同时并且可以直接在评价标准上进行优化，提升拟合效果。

基于改进的Dice损失函数的网络训练流程图如图3所述：在本实施例中，所述步骤S2用以改进的Dice损失函数在DenseNet的密集型卷积神经网络训练样本数据，具体包括以下步骤：

步骤S21：读取训练数据集，并利用图片生成器对数据样本进行拉伸旋转等变换和数据扩充，得到比原来数据集更大的样本集训练，提高网络识图能力以模型拟合效果：

步骤S22：载入模型网络，并根据训练要求添加新层，搭建训练模型；

步骤S23：将步骤S1所改进设置的损失函数引入网络；

步骤S24：引入训练效果评价指标Acc、ROC/AUC和F1-Score，对模型训练过程进行实时评价；

步骤S25：实时保存训练模型和数据，并根据最终迭代结果画图。

进一步地，所述步骤S3利用训练好的模型对现有的视频图像进行分类预测，具体包括以下步骤：

步骤S31：引入步骤S2训练的模型构建测试网络程序；

步骤S32：将利用H.265的编码器HM16.9编码的视频作为测试样本导入测试网络程序，让训练好的模型自动进行识别检测；

步骤S33：将检测视频的结果以0和1的分类标签识别值输出，检测视频图像编码过程是否存在失真效应。

以上是本发明的较佳实施例，凡依本发明技术方案所作的改变，所产生的功能作用未超出本发明技术方案的范围时，均属于本发明的保护范围。

Claims

1.一种基于改进的dice损失函数的视频图像失真效应模型构建方法，其特征在于，包括如下步骤：

2.根据权利要求1所述的基于改进的dice损失函数的视频图像失真效应模型构建方法，其特征在于，所述步骤S1具体实现如下：

3.根据权利要求1所述的基于改进的dice损失函数的视频图像失真效应模型构建方法，其特征在于，所述步骤S2具体实现如下：

步骤S23、将步骤S1所改进设置的损失函数引入网络；

4.根据权利要求1所述的基于改进的dice损失函数的视频图像失真效应模型构建方法，其特征在于，所述步骤S3具体实现如下：

步骤S31、引入步骤S2训练的模型构建测试网络程序；