CN111182312B

CN111182312B - 一种分级残差光场视频编码方法

Info

Publication number: CN111182312B
Application number: CN202010006753.9A
Authority: CN
Inventors: 颜成钢; 涂望; 金欣; 孙垚棋; 张继勇; 张勇东
Original assignee: Hangzhou Dianzi University
Current assignee: Hangzhou Dianzi University
Priority date: 2020-01-03
Filing date: 2020-01-03
Publication date: 2021-10-29
Anticipated expiration: 2040-01-03
Also published as: CN111182312A

Abstract

本发明提供一种分级残差光场视频编码方法。本发明在分级编码中心视点视频和残差视频的基础上，对中心视点视频进行分级编码，一级中心视点视频首先被编码，后经解码与二级中心视点视频作差得到二级中心视点残差视频，接着二级中心视点残差视频被编码，最后被编码的中心视点视频经解码后与对应的相邻视点视频作差得到残差视频进行编码。本发明通过对中心视点视频进行分级，减少了直接编码的子视频数量，增加了残差子视频数量，所以可有效减小总码流，提高编码效率。

Description

一种分级残差光场视频编码方法

技术领域

本发明属于光场编码领域，尤其针对光场视频，主要为了提高编码过程的压缩效率，具体涉及一种分级残差光场视频编码方法。

背景技术

光场领域是一个充满想象力的领域，如果能够将光场技术充分应用到尚在发展中的VR、AR等领域中，将会加速这些领域技术的成熟。这吸引着众多研究学者和企业投入巨大资源进行研究，一些企业致力于开发消费级光场相机，限制于当前的硬件水平，光场相机分辨率低的问题一直存在。

在当前互联网时代，基于互联网的视频消费有着巨大的市场：短视频、互联网娱乐消费内容和直播等。受制于带宽，想要在互联网上传播高质量的视频，高效的编码技术成为关键。现针对普通视频的编码技术非常成熟，但针对光场视频，编码技术尚在发展中。从编码的角度看，光场视频和普通视频最大的区别在于：光场相机通过一次曝光捕获到的一张原光场图在记录平面场景的同时记录了角度信息，这使得一张光场图是目前普通相机拍出照片的数十倍大小，拍摄视频同样如此。在未来硬件水平达到一定要求后，为了提高光场图像内容的质量，光场相机的分辨率还会大幅增加，这将导致光场图文件大小进一步的增大。在未来想要将光场技术应用到消费级AR、VR技术中，无论是影视作品还是实时AR直播与通话，存储传输光场内容时都对光场图的文件大小有着极高的要求，而编码则成为解决这个问题的关键。

编码光场视频指编码对象为多张时域连续的光场图，在这里，一张光场图被称为帧。当前的普遍做法是：每帧通过子视图分解得到同等数量的子图像，一个子图像代表一个视图，然后采用多视图编码技术对其进行编码。现有技术的主要问题是编码效率不够高效。

发明内容

针对现有技术中存在的问题，本发明提供一种分级残差光场视频编码方法。

本发明在分级编码中心视点视频和残差视频的基础上，对中心视点视频进行分级编码，一级中心视点视频首先被编码，后经解码与二级中心视点视频作差得到二级中心视点残差视频，接着二级中心视点残差视频被编码，最后被编码的中心视点视频经解码后与对应的相邻视点视频作差得到残差视频进行编码。由于在残差编码方法中残差视频的码流比直接编码的光场视频码流小得多，所以对编码整个光场视频来说，残差视频数量越多，编码的总码流越小。

本发明的步骤如下：

步骤(1)：光场视频图像预处理。

步骤(2)：中心视点视频的分级与编码。

步骤(3)：编码相邻残差视频。

步骤(4)：光场视频解码。

本发明有益效果如下：

本发明通过对中心视点视频进行分级，减少了直接编码的子视频数量，增加了残差子视频数量，所以可有效减小总码流，提高编码效率。

附图说明

图1为本发明由原始光场图像得到的子图像的示意图；

图2为本发明子图像划分及中心视点子图像分级的示意图；

图3为本发明的编码算法流程图；

图4为本发明的解码算法流程图。

具体实施方式

下面结合附图和实施例对本发明作进一步说明。

如图1-4所示，一种分级残差光场视频编码方法，步骤如下：

步骤(1)、光场视频图像预处理。

光场视频包括N个帧即N张光场图像，单张光场图像中子图像数量为(n-i)×(n-i)，其中i＝0，1或2，子图像数量随不同光场相机透镜阵列数量而变。

1-1.为方便后续分块，首先对子图像数量进行处理：

当n对3取余为0时，i＝0，采用n×n数量子图像；

当n对3取余为1时，i＝1，去除位于第一行和第一列的子图像，采用(n-1)×(n-1)数量子图像；

当n对3取余为2时，i＝2，去除首尾行和列，采用(n-2)×(n-2)数量子图像。

1-2.由于光场图像中位于四个角的子图像的亮度过低导致包含的有效信息极少，因此在编码过程中弃用四个角的子图像以及光场图像最外围一圈子图像，获得包含(n-i-1)×(n-i-1)-4个有效子图像的光场图像。对光场视频的每帧同样处理，从而得到预处理后的光场视频。

图1为本发明由原始光场图像得到的子图像的示意图。

步骤(2)、中心视点视频的分级与编码。

首先将一张光场图像中的子图像划分为((n-i)÷3)×((n-i)÷3)个块(图2中黑粗实线标出)，每个块包含9个子图像，每个块中存在一个中心视点子图像。除去位于四个角上的块以外的其余块，块中位于中心的子图像为中心视点子图像；

对位于四个角上的块：左上角的块中位于右下角的子图像、右上角的块中位于左下角的子图像、左下角的块中位于右上角的子图像和右下角的块中位于左上角的子图像分别为对应块的中心视点子图像。

块中除中心视点子图像以外的子图像称作这个中心视点子图像的相邻子图像。

然后对中心视点子图像进行分级：处在最外圈的中心视点子图像称为二级中心视点子图像，余下处在内圈的中心视点子图像称为一级中心视点子图像。

先用多视图编码技术对一级中心视点视频进行编码获得一级中心视点视频码流，将一级中心视点视频码流解码与对应的二级中心视点视频作差得到二级中心视点残差视频；再利用多视图编码技术对二级中心视点残差视频编码获得二级中心视点残差视频码流，到此，中心视点子视频完成编码。将获得的一级中心视点视频码流和二级中心视点残差视频码流统称为中心视点视频码流。

其中，一级中心视点视频与二级中心视点视频作差时的对应规则如下：

为建立一级中心视点视频与二级中心视点视频的对应关系，将二者包含到同一个块来进行划分，在图2中用虚线标出，与位于四角的一级中心视点视频对应的四角的块的大小总为5×5，剩下规模不定的块中每一个一级中心视点视频都有一个二级中心视点视频与之相对应，位于最中心的中心视点子视频无对应；位于四角的一级中心视点视频对应四角5×5块(图2中虚线标出)中包含的3个二级中心视点视频；由于步骤(1)中的处理，处理后的子图像数量为(n-i)×(n-i)，n总为3的倍数，因此每增加一个一级中心视点子图像，都有一个二级中心视点子图像与之对应。

步骤(3)、编码相邻残差视频。

如图3所示，将中心视点视频码流解码与预处理后的光场视频中的相邻子视频相减获得相邻残差视频，利用多视图编码技术对相邻残差视频进行编码，获得相邻视频码流。

步骤(4)、光场视频解码。

解码流程如图4所示：首先对一级中心视点视频码流进行解码，得到完整的一级中心视点子视频。然后将二级中心视点残差视频码流解码后与解码的一级中心视点视频作和，得到完整的二级中心视点视频，完成中心视点视频的解码。最后，对相邻视频码流进行解码，获得解码后的相邻视频。按照对应规则，与解码后的中心视点子视频作和，获得完整的解码后的光场视频。

Claims

1.一种分级残差光场视频编码方法，其特征在于，步骤如下：

步骤(1)：光场视频图像预处理；

步骤(2)：中心视点视频的分级与编码；

步骤(3)：编码相邻残差视频；

步骤(4)：光场视频解码；

步骤(1)、光场视频图像预处理，具体方法如下：

光场视频包括N个帧即N张光场图像，单张光场图像中子图像数量为(n-i)×(n-i)，其中i＝0,1或2，子图像数量随不同光场相机透镜阵列数量而变；

1-1.为方便后续分块，首先对子图像数量进行处理：

当n对3取余为0时，i＝0，采用n×n数量子图像；

当n对3取余为2时，i＝2，去除首尾行和列，采用(n-2)×(n-2)数量子图像；

1-2.由于光场图像中位于四个角的子图像的亮度过低导致包含的有效信息极少，因此在编码过程中弃用四个角的子图像以及光场图像最外围一圈子图像，获得包含(n-i-1)×(n-i-1)-4个有效子图像的光场图像；对光场视频的每帧同样处理，从而得到预处理后的光场视频；

步骤(2)、中心视点视频的分级与编码，具体步骤如下：

首先将一张光场图像中的子图像划分为((n-i)÷3)×((n-i)÷3)个块，每个块包含9个子图像，每个块中存在一个中心视点子图像；除去位于四个角上的块以外的其余块，块中位于中心的子图像为中心视点子图像；

对位于四个角上的块：左上角的块中位于右下角的子图像、右上角的块中位于左下角的子图像、左下角的块中位于右上角的子图像和右下角的块中位于左上角的子图像分别为对应块的中心视点子图像；

块中除中心视点子图像以外的子图像称作这个中心视点子图像的相邻子图像；

然后对中心视点子图像进行分级：处在最外圈的中心视点子图像称为二级中心视点子图像，余下处在内圈的中心视点子图像称为一级中心视点子图像；

先用多视图编码技术对一级中心视点视频进行编码获得一级中心视点视频码流，将一级中心视点视频码流解码与对应的二级中心视点视频作差得到二级中心视点残差视频；再利用多视图编码技术对二级中心视点残差视频编码获得二级中心视点残差视频码流，到此，中心视点子视频完成编码；将获得的一级中心视点视频码流和二级中心视点残差视频码流统称为中心视点视频码流；

为建立一级中心视点视频与二级中心视点视频的对应关系，将二者包含到同一个块来进行划分，与位于四角的一级中心视点视频对应的四角的块的大小总为5×5，剩下规模不定的块中每一个一级中心视点视频都有一个二级中心视点视频与之相对应，位于最中心的中心视点子视频无对应；位于四角的一级中心视点视频对应四角5×5块中包含的3个二级中心视点视频；由于步骤(1)中的处理，处理后的子图像数量为(n-i)×(n-i),n总为3的倍数，因此每增加一个一级中心视点子图像，都有一个二级中心视点子图像与之对应。

2.根据权利要求1所述的一种分级残差光场视频编码方法，其特征在于，步骤(3)、编码相邻残差视频，具体步骤如下：

将中心视点视频码流解码与预处理后的光场视频中的相邻子视频相减获得相邻残差视频，利用多视图编码技术对相邻残差视频进行编码，获得相邻视频码流。

3.根据权利要求2所述的一种分级残差光场视频编码方法，其特征在于，步骤(4)、光场视频解码，其特征在于：

首先对一级中心视点视频码流进行解码，得到完整的一级中心视点子视频；然后将二级中心视点残差视频码流解码后与解码的一级中心视点视频作和，得到完整的二级中心视点视频，完成中心视点视频的解码；最后，对相邻视频码流进行解码，获得解码后的相邻视频；按照对应规则，与解码后的中心视点子视频作和，获得完整的解码后的光场视频，通过对中心视点视频进行分级，减少了直接编码的子视频数量，增加了残差子视频数量，所以可有效减小总码流，提高编码效率。