CN108347605B

CN108347605B - 3d视频深度图像四叉树编码结构划分的快速决策方法

Info

Publication number: CN108347605B
Application number: CN201810096108.3A
Authority: CN
Inventors: 伏长虹; 陈浩; 高梽强
Original assignee: Nanjing University of Science and Technology
Current assignee: Nanjing University of Science and Technology
Priority date: 2018-01-31
Filing date: 2018-01-31
Publication date: 2021-09-17
Anticipated expiration: 2038-01-31
Also published as: CN108347605A

Abstract

本发明公开了一种3D视频深度图像四叉树编码结构划分的快速决策方法。该方法为：首先经由传统编码方法得到当前编码块以及其第一个小的附属编码块的最优预测模式，以及对应的率失真值；然后判断第一个小的附属编码块的最优模式是否是Skip模式，若是，则进一步判断当前编码块的率失真值是否小于或等于第一个小的附属编码块率失真值的4倍，若是，则提前终止当前编码块得四叉树编码结构划分。本发明降低了深度图像帧内预测编码的复杂度，减少了预测所需的编码时间，并保证了最终解码端合成视角的视频质量。

Description

3D视频深度图像四叉树编码结构划分的快速决策方法

技术领域

本发明属于视频编解码技术领域，特别是一种3D视频深度图像四叉树编码结构划分的快速决策方法。

背景技术

新兴的多视点加深度图的视频格式是下一代3D视频系统的最主要的格式。它采用少量视点的纹理图信息和附加的相应视点的深度图信息来表示一个3D视频场景，而更多的视点信息可由基于深度图像的3D渲染技术来合成出来。由于在当前的3D视频系统中，深度图对于提供视差信息并引导合成过程起着关键性的作用，所以深度图编码的研究有其重要的实用意义。

3D-HEVC中的深度图像编码允许编码单元进行如图1所示的递归四叉树结构划分，其中编码单元中心的序号指的是编码块的编码顺序。这种编码结构划分方式为编码带来了极大的复杂度，特别是考虑到每一层划分深度上的每一个编码块的率失真优化过程都将遍历所有的预测模式。目前，学术界已有很多针对深度图预测模式选择过程简化的研究。文献1(H.B.Zhang,C.H.Fu,Y.L.Chan,S.H.Tsang,and W.C.Siu,“Probability-based DepthIntra Mode Skipping Strategy and Novel VSO Metric for DMM Decision in 3D-HEVC,”IEEE Trans.on Circuits and Syst.for Video Tech.,Vol.PP,No.99,pp.1-1,2017)中提出了一种简化DMM模式搜索过程中的率失真计算的方法。文献2(E.G.Mora,J.Jung,M.Cagnazzo and B.Pesquet,“Initialization,limitation,and predictivecoding of the depth and texture quadtree in 3D-HEVC,”IEEE Trans.on Circuitsand Syst.for Video Tech.,Vol.24,No.9,pp.1554-1565,Sept.2014)中提出了一种用于基于对应纹理视图的四叉树结构来限制当前深度视图四叉树结构的方法。而在文献3(Miok,K.,Nam,L.,and Li,S.:‘Fast single depth intra mode decision for depthmap coding in 3D-HEVC’,Int.Conf.on ICMEW,Turin,Italian,June 2015,pp.1-6)中，Mirk M等人设计了一种通过考虑方差和估计失真来提前确定四叉树结构的快速方法。

然而，现有的快速深度图像编码技术并没有充分考虑到Skip模式的特点。通过对真实编码比特流结果的研究，我们发现Skip模式，包括帧间Skip模式以及帧内DIS模式，在不同的四叉树划分深度中都仅占有极小的率失真值。这种Skip模式的小率失真值的特性，可以极大地帮助我们确定率失真优化决策不等式的临界值。当估计临界值满足一定的条件时，我们可以选择性地提前终止当前编码块的进一步四叉树结构划分。

总而言之，现有的深度图快速编码技术并没有充分考虑到Skip模式在不同划分深度中被选为最优模式时体现出的极小率失真值的特性，且现有的深度图模式选择算法的复杂度依然有待降低。

发明内容

本发明的目的在于提供一种3D视频深度图像四叉树编码结构划分的快速决策方法，在保证合成视角中视频质量的前提下，简化深度图像预测模式选择的计算过程。

实现本发明目的的技术解决方案为：一种3D视频深度图像四叉树编码结构划分的快速决策方法，包括如下步骤：

步骤1：经由传统编码方法，得到当前编码块的最优预测模式，以及当前编码块及对应的率失真值；

步骤2：判断当前编码块是否为最小编码单元：若是，跳至步骤8；否则，进行步骤3；

步骤3：对当前编码块进行四叉树结构划分，并对得到的每一个附属编码块重复步骤4～7；

步骤4：对当前附属编码块进行传统编码方法，计算该附属编码块的最优预测模式，以及该附属编码块相应的率失真值；

步骤5：若当前附属编码块是第一个，且该附属编码块的最优预测模式是Skip模式，则进行步骤6，否则，跳至步骤7；

步骤6：判断所得小的附属编码块的率失真值的4倍是否大于或等于当前编码块的率失真值，若是，则提前终止四叉树的继续划分，并跳至步骤8，否则，进行步骤7；

步骤7：判断是否是最后一个附属编码块，若是，则进行步骤8，否则，跳至步骤4进行下一个附属编码块的处理；

步骤8：结束当前编码块的编码。

进一步地，步骤1以及步骤4中所述传统编码方法指的是3D-HEVC中的深度图像编码方法。

进一步地，步骤5中所述Skip模式，具体指：若当前编码帧不是I帧时，包括帧间Skip模式以及帧内DIS模式；若当前编码帧是I帧时，则仅包括帧内DIS模式。

进一步地，步骤6中所述提前终止当前编码块的四叉树结构继续划分，具体是指：当前编码区域在最后的编码比特流中不再会出现比当前划分深度更深层的编码单元。

本发明与现有技术相比，其显著优点在于：(1)利用Skip模式在不同划分深度中被选为最优模式时体现出极小的率失真的特性，以4倍Skip附属小编码块的率失真值来确定四叉树结构率失真优化决策的临界值，并以此来提前终止当前编码块的进一步四叉树结构划分，大大降低了编码复杂度，并扩展了深度图编码领域的研究方向；(2)降低了深度图像帧内预测编码的复杂度，减少了预测所需的编码时间，并保证了最终解码端合成视角的视频质量。

附图说明

图1为传统编码方法中的四叉树划分结构的编码顺序示意图。

图2是本发明3D视频深度图像四叉树编码结构划分的快速决策方法的流程图。

具体实施方式

本发明鉴于Skip模式的极小率失真表现的发现，通过确定四个小的附属编码块的率失真和的临界值，选择性地提前终止当前编码块的进一步四叉树结构划分。

结合图2，3D视频深度图像四叉树编码结构划分的快速决策方法，具体包括如下步骤：

步骤8：结束当前编码块的编码。

下面通过实施例，对本发明的技术方案作进一步具体的说明。

实施例

本实施例展示的是一种3D视频深度图像四叉树编码结构划分的快速决策方法，其流程如图2所示，其步骤包括：

步骤8：结束当前编码块的编码。

上述深度图编码快速方法被集成到3D-HEVC测试模型(HTM 16.1)编码器中，并与原始的HTM 16.1模型进行性能比较。测试序列和参数都参考文献”K.Muller,and A.Vetro,“Common test conditions of 3DV core experiments,”ITU-T SG 16WP 3and ISO/IECJTC 1/SC 29/WG 11JCT3V-G1100,January 2014”中提出的标准。文献”H.B.Zhang,C.H.Fu,Y.L.Chan,S.H.Tsang,and W.C.Siu,“Probability-based Depth Intra Mode SkippingStrategy and Novel VSO Metric for DMM Decision in 3D-HEVC,”IEEE Trans.onCircuits and Syst.for Video Tech.,Vol.PP,No.99,pp.1-1,2017”，以及文献”E.G.Mora,J.Jung,M.Cagnazzo and B.Pesquet,“Initialization,limitation,andpredictive coding of the depth and texture quadtree in 3D-HEVC,”IEEE Trans.onCircuits and Syst.for Video Tech.,Vol.24,No.9,pp.1554-1565,Sept.2014”中提出的快速编码方法也将被移植到深度图编码中，并与本发明方法在同样的平台上进行性能的比较。

表1本发明方法和Zhang，Mora的算法的编码结果对比

表1给出了鉴于编码时间和BDBR的编码性能比较。其中，BDBR表示同等客观视频质量的条件下，相较原始HTM方法比特率的节省情况。BDBR的计算基于总的比特率和合成视点的客观质量PSNR。编码时间比较的是相对于原始HTM16.1方法编码时间的节省情况。

从表1中可知，本发明的编码方法相较于目前最先进的方法(集成在HTM 16.1中)可以节省平均45.10％的时间，同时仅仅增加了0.09％的BDBR。这表明，本发明的编码方法降低了编码复杂度，并且同时保证了编码视频的质量。而Zhang的编码方法尽管BDBR保持得较好，但是编码时间并没有得到显著的减少。此外，Mora的方法虽然节省极大幅度的编码时间，但是BDBR的增幅表明该方法并不能保持一个相对可以接受的编码视图质量。综上，本发明的快速方法无疑最为优越。

Claims

1.一种3D视频深度图像四叉树编码结构划分的快速决策方法，其特征在于，包括如下步骤：

步骤1：经由传统编码方法，得到当前编码块的最优预测模式，以及当前编码块和当前编码块对应的率失真值；

步骤3：对当前编码块进行四叉树结构划分，并对得到的四个附属编码块进行步骤4~7；

步骤6：判断当前附属编码块的率失真值的4倍是否大于或等于当前编码块的率失真值，若是，则提前终止当前编码块四叉树的继续划分，并跳至步骤8，否则，进行步骤7；

步骤8：结束当前编码块的编码。

2.根据权利要求1所述的3D视频深度图像四叉树编码结构划分的快速决策方法，其特征在于，步骤1以及步骤4中所述传统编码方法指的是3D-HEVC中的深度图像编码方法。

3.根据权利要求1所述的3D视频深度图像四叉树编码结构划分的快速决策方法，其特征在于，步骤5中所述Skip模式，具体指：若当前编码帧不是I帧时，包括帧间Skip模式以及帧内DIS模式；若当前编码帧是I帧时，则仅包括帧内DIS模式。

4.根据权利要求1所述的3D视频深度图像四叉树编码结构划分的快速决策方法，其特征在于，步骤6中所述提前终止当前编码块四叉树的继续划分，具体是指：当前编码区域在最后的编码比特流中不再会出现比当前划分深度更深层的编码单元。