CN111510721B

CN111510721B - 基于空间下采样的多描述编码高质量边重建方法

Info

Publication number: CN111510721B
Application number: CN202010278978.XA
Authority: CN
Inventors: 陈婧; 林琦; 曾焕强; 朱建清; 蔡灿辉
Original assignee: Huaqiao University
Current assignee: Huaqiao University
Priority date: 2020-04-10
Filing date: 2020-04-10
Publication date: 2022-11-01
Anticipated expiration: 2040-04-10
Also published as: CN111510721A

Abstract

本发明提供了一种基于空间下采样的多描述编码高质量边重建方法，包括，制作数据集：选取视频，通过空间下采样分成两个描述，在量化参数QP值设定下，编码，解码，将解码后的视频和相应的原始视频作为训练集；训练SD‑VSRnet网络：每五帧视频作为网络的输入，依次进行特征提取，恢复高频细节，像素重排，再与输入的中间帧进行跳跃连接得到重建的视频帧，逐帧重建获得最后的重建视频，实现SD‑VSRnet网络的训练。本发明提出的方法制作了适用于空间下采样的多描述编码高质量边重建的数据集，另外，采用视频超分辨率的神经网络，分别测试4种QP值，可以有效提高不同压缩程度的边缘解码视频重建质量。

Description

基于空间下采样的多描述编码高质量边重建方法

技术领域

本发明涉及视频编解码领域，尤其涉及一种基于空间下采样的多描述编码高质量边重建方法。

背景技术

随着第五代移动通信网络的推进和千兆WIFI的普及等，互联网和无线通道已经成为数字视频的主要传输通道。但互联网中仍然存在网络拥挤、信道干扰和无线信道的随机比特错误以及突发错误等现象。因此，研究具有容错编码能力的视频编码是十分重要的。

而在容错编码领域中，多描述视频编码(Multiple Description Coding,MDC)是一种能有效解决无线通道和互联网在传输中发生信息丢失、误码和延时等造成视频质量下降问题的容错编码方法。多描述编码技术的基本原理是将信源分解成两个或多个具有同等重要性的码流，分别通过不同的信道传输到接收端，每个码流是信源的一个描述，由于每个描述都含有其他描述所没有的信息，重建的效果将随着接收到的描述数的增多而得到改善。如果能够理想地接收到所有描述，用中心解码器重建。但在不可靠网络传输中，更常见的是只接收到部分描述，用边缘解码器重建。在基于空间下采样的多描述编码方法中，下采样过程就是像素丢失的过程。对低分辨率视频进行编解码，若只能接收到部分描述，就需要设计相应的边缘解码器，以保证视频的重建质量。因此，针对空间下采样形成不同描述的多描述编码方法，提出基于空间下采样的高质量边重建方法，可以有效提高经不可靠传输后多描述编码视频流的重建质量，具有一定的研究意义和实用价值。

发明内容

本发明的目的在于提高多描述编码视频流的边缘解码重建质量，提出一种基于空间下采样的多描述编码高质量边重建方法。

本发明解决其技术问题所采用的技术方案是：

一种基于空间下采样的多描述编码高质量边重建方法，包括制作数据集阶段、训练SD-VSRnet网络阶段、测试SD-VSRnet网络阶段，具体包括如下步骤：

步骤S1：制作数据集阶段

步骤S11：选取多种分辨率和多种场景的视频，将每一帧视频图像通过空间下采样分成两个描述；

步骤S12：在量化参数QP值设定下，通过原始HEVC编码器中编码；

步骤S13：将两个描述的码流分别打包后通过不同的信道进行传输；

步骤S14：通过原始HEVC解码器解码，将解码后的视频序列和相应的原始视频作为训练集，其中，所述解码后的视频序列作为训练的数据，所述相应的原始视频作为训练的标签；

步骤2：训练SD-VSRnet网络阶段

步骤S21：将每一帧视频以步长为36分为大小为48的图像块，每五帧作为网络的输入，逐帧顺延，每五帧视频经过双三次上采样后作为网络的输入；

步骤S21：利用不同大小的卷积层进行不同大小的特征提取；

步骤S21：通过残差学习恢复高频细节；

步骤S21：通过亚像素卷积层进行像素重排；

步骤S21：经过最大池化层，与输入的中间帧进行跳跃连接得到重建的视频帧；

步骤S21：逐帧重建获得最后的重建视频，每一个量化参数QP值训练一个网络模型，实现SD-VSRnet网络训练；

步骤3：测试网络阶段

步骤S31：选择多种不同分辨率不同视频内容视频序列作为测试集；

其中包括HEVC标准测试序列和公开数据库SJTU的5个4K分辨率的视频序列；

步骤S31：所述测试数据和训练数据是采用不同的视频序列，每个视频都通过空间下采样分成两个描述；

步骤S32：在不同量化参数QP值设定下，分别在原始HEVC编码器中编码；

步骤S32：将两个描述的码流分别打包后通过不同的信道进行传输；

步骤S32：再通过原始HEVC解码器解码，当解码端只收到一个描述时，将解码后的视频作为测试的数据。

由上述对本发明的描述可知，与现有技术相比本发明具有如下有益效果：

1、视频超分辨率网络可以有效地改善视频边缘解码后的视频质量，因此制作了适用于空间下采样的多描述编码高质量边重建的数据集。

2、本发明采用视频超分辨率的神经网络，为了验证该发明对不同压缩程度视频的性能提升效果，分别测试4种QP值，QP值分别为22，27，32，37。需要注意的是制作数据集、测试网络和训练网络的QP值是一一对应的。随着QP值的增大，视频的质量下降，但通过本发明所提的视频超分辨的神经网络可以有效提高不同压缩程度的边缘解码视频重建质量。而且本发明提出的方法比其他方法有更好的重建效果。

以下结合附图及实施例对本发明作进一步详细说明，但本发明的一种基于空间下采样的多描述编码高质量边重建方法不局限于实施例。

附图说明

图1为本发明方法的流程示意图。

图2为重建结果对比图；其中图2(a)为视频序列city的原图，图2(b)为低分辨率图，图2(c)为方法VSRnet进行三倍分辨率重建后的结果图，图2(d)本发明提出的方法重建后的结果图。

具体实施方式

参见图1所示，本发明为了解决现有多描述视频编码的边缘解码视频质量不佳的问题，提供基于空间下采样的多描述编码高质量边重建方法，具体步骤如下：

步骤S1：制作数据集阶段

步骤2：训练SD-VSRnet网络阶段

步骤S21：利用不同大小的卷积层进行不同大小的特征提取；

本实施例中通过两个3*3的卷积层和一个5*5卷积层进行不同大小的特征提取。

步骤S21：通过残差学习恢复高频细节；

步骤S21：通过亚像素卷积层进行像素重排；

步骤S21：经过最大池化层，与输入的中间帧，如附图1中的第t帧，进行跳跃连接得到重建的视频帧；

步骤3：测试网络阶段

步骤S31：选择多种不同分辨率不同视频内容视频序列作为测试集，其中包括HEVC标准测试序列和公开数据库SJTU的5个4K分辨率的视频序列；

步骤S31：所述测试数据和训练数据是采用不同的视频序列，每个视频都通过空间下采样分成两个描述，

步骤S32：在不同量化参数QP值设定下，分别在原始HEVC编码器中编码，

步骤S32：将两个描述的码流分别打包后通过不同的信道进行传输，

需要注意的是制作数据集、测试网络和训练网络的QP值是一一对应的。

QP值量化参数，反映了空间细节压缩情况。值越小，量化越精细，图像质量越高，产生的码流也越长。如QP小，大部分的细节都会被保留；QP增大，一些细节丢失，码率降低，但图像失真加强和质量下降。

随着QP值的增大，视频压缩越厉害而导致编码后的视频质量也随之下降，本发明所提的视频超分辨的神经网络可以有效提高不同压缩程度的边缘解码视频重建质量。

在本发明实施例中，如图2所示选取了视频序列city的原图(a)和低分辨率图(b)以及进行三倍分辨率重建后对比方法VSRnet(c)和本发明的结果图(d)进行主观结果比较。从用矩形选取区域的放大图看出本发明所实现的视频重建效果较好，如本发明提出的方法重建出建筑物中的分隔柱的轮廓明显比采用VSRnet方法重建的轮廓清晰，效果更好。

可从以上图中可知，本发明所提出的方法较好的视频重建效果，而且对不同压缩程度的边缘解码视频都能有很好的重建效果，具有较强的适应性，可适用多种情形。

上述实施例仅是用来说明本发明，而并非用作对本发明的限定，只要是依据本发明的技术实质，对上述实施例进行变化、变型等都将落在本发明的权利要求的范围内。

Claims

1.一种基于空间下采样的多描述编码高质量边重建方法，包括制作数据集阶段、训练SD-VSRnet网络阶段、测试SD-VSRnet网络阶段，其特征在于，具体包括如下步骤：

步骤S1：制作数据集阶段

步骤S11：选取视频，将每一帧视频图像通过空间下采样分成两个描述；

步骤S12：在量化参数QP值设定下，通过原始HEVC编码器编码；

步骤S13：将编码后的两个描述的码流分别打包后通过不同的信道进行传输；

步骤2：训练SD-VSRnet网络阶段

步骤S21：将视频帧分为图像块，同时将多帧视频经过双三次上采样后作为网络的输入，逐帧顺延；

步骤S22：利用不同大小的卷积层进行不同大小的特征提取；

步骤S23：通过残差学习恢复高频细节；

步骤S24：通过亚像素卷积层进行像素重排；

步骤S25：经过最大池化层，与输入的中间帧进行跳跃连接得到重建的视频帧；

步骤S26：逐帧重建获得重建视频，实现SD-VSRnet网络训练；

步骤3：测试网络阶段

步骤S32：视频帧通过空间下采样分成两个描述；

步骤S33：在量化参数QP值设定下，通过原始HEVC编码器编码；

步骤S34：将编码后的两个描述的码流分别打包后通过不同的信道进行传输；

步骤S35：通过原始HEVC解码器解码，当解码端只收到一个描述时，将解码后的视频作为测试的数据；

制作数据集、测试网络和训练网络的QP值是一一对应的。