CN106210722A - 基于hevc的分层深度视频残差层数据的编码方法 - Google Patents

基于hevc的分层深度视频残差层数据的编码方法 Download PDF

Info

Publication number
CN106210722A
CN106210722A CN201610531562.8A CN201610531562A CN106210722A CN 106210722 A CN106210722 A CN 106210722A CN 201610531562 A CN201610531562 A CN 201610531562A CN 106210722 A CN106210722 A CN 106210722A
Authority
CN
China
Prior art keywords
residual error
block
hevc
pixel
error data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610531562.8A
Other languages
English (en)
Other versions
CN106210722B (zh
Inventor
马然
李泽福
康蒙蒙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Shanghai for Science and Technology
Original Assignee
University of Shanghai for Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Shanghai for Science and Technology filed Critical University of Shanghai for Science and Technology
Priority to CN201610531562.8A priority Critical patent/CN106210722B/zh
Publication of CN106210722A publication Critical patent/CN106210722A/zh
Application granted granted Critical
Publication of CN106210722B publication Critical patent/CN106210722B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/154Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/40Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/625Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using discrete cosine transform [DCT]

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明涉及一种基于HEVC的分层深度视频残差层数据的编码方法。本方法的具体步骤是:步骤1.生成LDV时进行参数调整,以滤除无用的背景区域的残差数据,同时适当增大残差数据。步骤2.残差层块校准预处理:在LDV中,残差数据的分布对当前编码框架并不友好,为了与HEVC中对CTU的四叉树划分原则保持一致,同时不改变每个CU块的划分情况,采取大小为8×8的网格进行块校准处理。步骤3.残差层编码:HEVC采取四叉树的原则对块进行划分,因为残差数据的形状并不完全符合HEVC的CU块,因此提出一种改进的CU划分原则以及选择合适CU尺寸的方法。本方法在编码LDV残差数据时,能够降低编码的比特数,同时减少了合成的虚拟视点的伪影。

Description

基于HEVC的分层深度视频残差层数据的编码方法
技术领域
本发明涉及一种基于HEVC的分层深度视频残差层数据的编码方法,使得编码残差数据所需的比特数在减小的同时,尽量减少绘制的虚拟视点伪影的出现。
背景技术
三维立体电视(3DTV)系统利用人的双眼观察物体角度的差异而辨识物体的远近这个原理,将编码后的3D视频传入人的左右眼,使观众在观看节目的同时可以体验到立体感。当前,三维视频格式包括传统立体视频表示法(Conventional stereo video,CSV)、单视点视频加深度表示法(Video-plus-depth,V+D)、多视点视频表示法(Multi-view video,MVV)和多视点视频加深度表示法(Multi-view video plus depth,MVD)。CSV表示法捕获并且传输一个视频序列对,二者具有与人眼相近的视差,在解码成像端还原捕获的场景,便可还原3D场景。它最大的优点在于其简单的原理和实现,缺点是由于只传输两路视频,接收端不能进行视角的调整设置。V+D表示法采用视频序列和相应的深度序列组合的方法来表示。该方法由于只提供了一个视点的纹理加深度序列,在终端显示的时候需要基于深度的虚拟视点绘制技术(Depth image based rendering,DIBR)得到一个虚拟视点,从而在终端显示时还原3D场景。由于能够根据不同的视角绘制出不同的虚拟视图,V+D表示法相对于传统立体视频表示法具有很大的灵活性,接收端可以进行一定的配置优化,观看者也能够调整视角而不仅仅局限于视频采集的视角。但是这种方法也存在很大的缺陷,其绘制出的虚拟视图的质量不高,存在大量的空洞、裂纹和伪影。与CSV相比,MVV表示法能够使观察者在投影区变换观看的位置,从而能够实现视角的切换,但这种方法的缺点是它需要传输多路数据,所以需要处理的数据量非常大。MVD表示法可以很好解决这个问题,MVD表示法也是传输彩色视频序列和相应的深度图序列,通过深度图绘制出某些虚拟视点再用于显示。与V+D不同的是,MVD传输多路的视频和深度序列,多路视频中的信息互补,从而使绘制的虚拟视点的质量较单向绘制的质量大大提高;但相邻的两个参考视点仍然存在很多重复的部分,对每个参考视点全部传输实际上传输了很多冗余信息。
分层深度视频(Layered depth video,LDV)源于MVD,其实质是MVD的稀疏表示形式,即在对MVD视频压缩编码之前进行预处理、以减少用于编码的数据量。LDV的改进之处在于,其传输的序列包含主视点完整的彩色序列和深度序列,其他的视点则只传输残差数据。残差数据是指主视点投影到虚拟视点上无法覆盖的区域,而辅助视点投影过去能够覆盖的部分。具体来说,就是将主视点投影到两边视点位置产生虚拟视点,由于视差和遮挡的原因,遮挡区域会重新的暴露出来产生空洞区域。分别将两边的原始视点与对应生成的虚拟视点相减,生成残差数据。由于残差的数据量很小,能够避免传输大量的冗余信息,进一步减少了需要传输的数据量。图1是LDV数据生成及绘制显示的过程。
残差层数据的生成主要由投影、小空洞填充和比较三个步骤完成,如图2所示。首先,将主视点V5通过DIBR技术投影到两个侧视点V1和V9位置,生成的虚拟视点RV1和RV9。在投影过程中,由于视角的不同和前景对背景的遮挡等原因使得某些区域在参考视点V5中不可见,却在虚拟视点中可见,从而产生空洞区域。同时,某些小的未覆盖的区域也变得可见,产生很多小的空洞和裂纹。对于一般只有1个像素宽的较小裂纹,可以通过中值滤波器对背景区域深度值进行预处理,这样既可以消除噪声又可以保存图像的细节。然而,中值滤波虽然简单,但其作用有限,无法较好地填补合成图像中的较大裂缝;反向投影可以提供比中值滤波更好的填洞效果。因此,先正向映射得到虚拟视点的纹理图和深度图,对该深度图进行中值滤波,并对经过滤波填充的空洞点进行标记,然后对标记过的点进行逆向映射到参考视点下搜索对应坐标点,以搜索到的像素填补当前虚拟视点的较大裂纹。最后将经过预处理后的RV1和V1,RV9和V9分别进行对应像素的比较,如果发现RV1和RV9的像素不存在,则将V1或V9对应的像素值保存为残差数据。反之,V1和V9对应的像素值无用,即保存为空白区域。以Ballet序列为例,最终生成的纹理和深度的残差数据如图3所示。
随着视频应用的多样化和高清、超高清视频趋势,对视频压缩性能提出了更高的要求,视频编码联合组(JCT-VC)制定了新一代视频编码标准H.265/HEVC。在HEVC中,图像可以被划分为若干个互不重叠的编码树单元(Coding tree unit,CTU),在CTU的内部,采用基于四叉树的循环分层结构。同一层次上的编码单元具有相同的分割深度。一个CTU可能只包含一个CU(即没有进行划分),也可能被划分为多个CU,如图4所示。具体判断每个CU是否进行四叉树递归划分的过程如下:(1)计算一个LCU的RDcost_SKIP。(2)依次计算帧间规则和AMP模式的率失真代价,最小值作为RDcost_Inter。(3)计算帧内预测各预测方向与水平、垂直、planar模式的率失真代价,最小值为RDcost_Intra。(4)比较RDcost_SKIP、RDcost_Inter和RDcost_Intra,将三者中的最小值作为RDcost_1。(5)将当前层次的CU进行预划分为4个子CU(Sub-CU),每个子CU分别进行(1)~(4),将每个子CU计算得到的RDcost_1求和为RDcost_2。(6)比较RDcost_1与RDcost_2,如果RDcost_1小,则说明不用继续进行下一深度的划分,对每个子CU重复上诉步骤,直至划分到CU为8×8为止。
基于HEVC的3D视频编码是为了适应多视点视频加深度的发展需要提出来的。3D-HEVC的编码结构是由HEVC扩展而来,编码每个纹理图和相关的深度图都是采用基于HEVC技术的二维视频编码结构。同时针对视点间相关性,纹理与深度间相关性提出了一些视差估计、视点间运动预测等新的编码工具。LDV残差层数据量小、残差数据分布散,若直接使用3D-HEVC进行编码,编码的性能不高。为了对LDV提供更高的压缩效果,残差数据需要进行进一步的研究。在侧视点中仅仅有小部分图像区域包含残差数据,这就为得到高压缩比率提供了可能,同时因为残差数据的形状或分布并不完全符合HEVC的按块编码框架,因此需改进划分原则以及选择合适的CU尺寸。
发明内容
本发明的目的是针对LDV残差层数据量小、残差数据分布散、HEVC采用块编码框架的特点,提出一种基于HEVC的分层深度视频残差层数据的编码方法,以实现在码率减小的同时,尽可能保证绘制的虚拟视点质量。
本发明具体的构思是:
本发明中选择三个视点(V1,V5和V9)进行编码;在编码端,对于中间视点V5(包括完整的纹理视频T5和深度视频D5),采取基本的3D-HEVC的编码方法。对于侧视点V1和V9(包括纹理视频T1和T9的残差数据和深度视频D1和D9的残差数据),纹理视频T1和T9的残差数据采取基于HEVC的改进的编码方法,深度视频D1和D9的残差数据采取深度图编码方式。解码端采取类似的方式,解码之后采取视点合成和图像修复的方法恢复出完整的视点。LDV视频的编解码结构图如图5所示。
对于侧视点残差数据的编码方法的主要过程是:首先需要进行LDV生成过程中的参数调整,在保证最终合成的虚拟视点质量的前提下,使得生成的残差数据量最小。然后对残差层进行块校准预处理,侧视点仅有小部分区域包含残差数据,并且残差层的信息分散分布,而HEVC是对视频进行分块编码,为了保持与HEVC中对CTU的四叉树划分原则保持一致,同时不改变每个块的划分情况,可以采取大小为8×8的网格进行块校准。最后编码块校准预处理后的残差层数据,HEVC中最大的CU块大小是64×64,根据四叉树的原则可以划分成更小的块。因为残差数据的分布并不完全符合HEVC的CU块,因此需要改进划分原则和选择合适的CU大小。
根据上述的构思,本发明采用下述技术方案:
一种基于HEVC的分层深度视频残差层数据的编码方法,具体步骤如下:
步骤1. 残差数据的生成:在LDV残差层数据生成过程中,需要滤除背景区域像素数目小于阈值p的小空洞,同时为了适当扩大Disocclusion区域,以像素宽度为q对深度值不连续的背景边界区域的像素进行标定。这里的阈值q和p需要调整,使得编码残差数据的代价尽量小,同时减少合成的虚拟视点伪影的出现;
步骤2. 残差层块校准预处理:HEVC中CU的大小范围是64×64到8×8之间,为了与HEVC中CTU的四叉树划分原则保持一致,同时不改变每个块的划分情况,采取大小为8×8的网格进行块校准;
步骤3. 残差层编码:HEVC采取四叉树的原则对块进行划分,但残差数据的形状并不完全符合HEVC的CU块,因此需改进CU划分原则以及选择合适的CU尺寸。
所述步骤1中,在LDV残差层数据生成过程需要对两个阈值p和q进行调整,具体步骤如下:
1)对于p值,由于深度值错误或噪声等原因,绘制过程中在背景区域会出现一些分散的小空洞,导致生成的残差数据中出现分散的像素点,这些散点并非真正的Disocclusion区域,对于最后LDV的合成并没有帮助,在绘制时这些空洞通过周围的像素点进行有效的修复,因此去掉像素的数目小于阈值p的相关区域,这里p值不能太大,否者会导致重要的信息丢失;
2)对于q值,LDV虚拟视点合成利用的是主视点完整的纹理和深度信息加上侧视点纹理和深度的残差信息,在合成虚拟视点时会有伪影的出现,为了减少伪影的出现,以像素宽度为q对深度值不连续的背景边界区域的像素进行标定,在生成残差数据过程中这部分像素不进行投影,从而扩大了Disocclusion区域,残差数据也相应增大,增大标定宽度q的方法能确保所有的遮挡区域的像素都包含进最终的残差数据中,提高绘制的虚拟视点质量,但同时残差数据的增大也会相应地导致编码代价的上升。
所述步骤2中:在LDV中,侧视点中仅有小部分图像区域包含残差数据,这就为得到高压缩比率提供了可能,然而空洞的分布对现有的编码框架并不友好,HEVC基于CU块进行编码,而残差层的信息分散分布,为了提高编码效率,减少编码的错误,需要进行块网格校准处理,处理的原则如下:
1)如果在一个块中存在的无意义的遮挡信息或者无遮挡信息,那么将该块置为空白块;
2)如果该块中存在有意义的遮挡信息,那么该块就用对应原始侧视点的像素进行填充;
HEVC中CU大小的范围是在64×64到8×8之间,为了保持与HEVC中对CTU的四叉树划分原则保持一致,同时不改变每个块的划分情况,使用大小为8×8的网格进行块校准,然后采用上述相同的处理原则进行像素值填充,因为HEVC中CU块的大小最小就是8×8,所以这种方法不会改变CU块的划分。
所述步骤3中,在编码残差数据时需要改进CU划分原则以及选择合适的CU尺寸,具体的改进方法如下:
a)如果一个CU块中不包含残差数据的像素,那么这个CU不划分,即提前终止CU的划分,且划分信息且包括划分的标记不包含进表示CU的比特流中;
b)如果将一个块划分成四个子块,其中三个子块中不包含任何残差数据的像素,只有一个子块包含残差数据,那么对该块进行划分,但是划分的标记信息不加入到比特流中,以节省比特率,在解码端该块的划分标记通过类似的方法获取;
c)如果一个CU块划分的四个子块中,不止一个块中包含残差数据的像素,那么采取与HEVC 相同的判断块是否划分或帧内/帧间编码的率失真优化模型。
本发明与现有技术相比较,具有如下显而易见的突出实质性特点和显著技术进步:
本发明方法能够有效降低编码残差数据的比特数,同时保证了合成的虚拟视点的质量。
附图说明
图1为LDV的三视点相机系统。
图2为残差层数据的生成过程图。
图3为生成的侧视点残差数据图。
图4为HEVC图像划分结构示意图。
图5为LDV的三维视频编解码框图。
图6为本发明方法具体流程图。
图7为经过块校准前后的残差对比图。
具体实施方式
本发明的优选实施例结合附图详述如下:
参见图6,一种基于HEVC的分层深度视频残差层数据的编码方法,具体步骤如下:
步骤1. 残差数据的生成:在LDV残差层数据生成过程中,需要滤除背景区域像素数目小于阈值p的小空洞,同时为了适当扩大Disocclusion区域,以像素宽度为q对深度值不连续的背景边界区域的像素进行标定。这里的阈值q和p需要调整,使得编码残差数据的代价尽量小,同时减少合成的虚拟视点伪影的出现;
步骤2. 残差层块校准预处理:HEVC中CU的大小范围是64×64到8×8之间,为了与HEVC中CTU的四叉树划分原则保持一致,同时不改变每个块的划分情况,采取大小为8×8的网格进行块校准;
步骤3. 残差层编码:HEVC采取四叉树的原则对块进行划分,但残差数据的形状并不完全符合HEVC的CU块,因此需改进CU划分原则以及选择合适的CU尺寸。
所述步骤1中,在LDV残差层数据生成过程需要对两个阈值p和q进行调整,具体步骤如下:
1)对于p值,由于深度值错误或噪声等原因,绘制过程中在背景区域会出现一些分散的小空洞,导致生成的残差数据中出现分散的像素点,这些散点并非真正的Disocclusion区域,对于最后LDV的合成并没有帮助,在绘制时这些空洞通过周围的像素点进行有效的修复,因此去掉像素的数目小于阈值p的相关区域,这里p值不能太大,否者会导致重要的信息丢失;
2)对于q值,LDV虚拟视点合成利用的是主视点完整的纹理和深度信息加上侧视点纹理和深度的残差信息,在合成虚拟视点时会有伪影的出现,为了减少伪影的出现,以像素宽度为q对深度值不连续的背景边界区域的像素进行标定,在生成残差数据过程中这部分像素不进行投影,从而扩大了Disocclusion区域,残差数据也相应增大,增大标定宽度q的方法能确保所有的遮挡区域的像素都包含进最终的残差数据中,提高绘制的虚拟视点质量,但同时残差数据的增大也会相应地导致编码代价的上升。
所述步骤2中:在LDV中,侧视点中仅有小部分图像区域包含残差数据,这就为得到高压缩比率提供了可能,然而空洞的分布对现有的编码框架并不友好,HEVC基于CU块进行编码,而残差层的信息分散分布,为了提高编码效率,减少编码的错误,需要进行块网格校准处理,处理的原则如下:
1)如果在一个块中存在的无意义的遮挡信息或者无遮挡信息,那么将该块置为空白块;
2)如果该块中存在有意义的遮挡信息,那么该块就用对应原始侧视点的像素进行填充;
HEVC中CU大小的范围是在64×64到8×8之间,为了保持与HEVC中对CTU的四叉树划分原则保持一致,同时不改变每个块的划分情况,使用大小为8×8的网格进行块校准,然后采用上述相同的处理原则进行像素值填充,因为HEVC中CU块的大小最小就是8×8,所以这种方法不会改变CU块的划分,如图7所示为经过块校准前后的残差对比图。
所述步骤3中,在编码残差数据时需要改进CU划分原则以及选择合适的CU尺寸,具体的改进方法如下:
a)如果一个CU块中不包含残差数据的像素,那么这个CU不划分,即提前终止CU的划分,且划分信息(包括划分的标记)不包含进表示CU的比特流中;
b)如果将一个块划分成四个子块,其中三个子块中不包含任何残差数据的像素,只有一个子块包含残差数据,那么对该块进行划分,但是划分的标记信息不加入到比特流中,以节省比特率,在解码端该块的划分标记通过类似的方法获取;
c)如果一个CU块划分的四个子块中,不止一个块中包含残差数据的像素,那么采取与HEVC 相同的判断块是否划分或帧内/帧间编码的率失真优化模型。

Claims (4)

1.一种基于HEVC的分层深度视频残差层数据的编码方法,其特征在于,具体步骤如下:
步骤1. 残差数据的生成:在LDV残差层数据生成过程中,需要滤除背景区域像素数目小于阈值p的小空洞,同时为了适当扩大Disocclusion区域,以像素宽度为q对深度值不连续的背景边界区域的像素进行标定,这里的阈值q和p需要调整,使得编码残差数据的代价尽量小,同时减少合成的虚拟视点伪影的出现;
步骤2. 残差层块校准预处理:HEVC中CU的大小范围是64×64到8×8之间,为了与HEVC中CTU的四叉树划分原则保持一致,同时不改变每个块的划分情况,采取大小为8×8的网格进行块校准;
步骤3. 残差层编码:HEVC采取四叉树的原则对块进行划分,但残差数据的形状并不完全符合HEVC的CU块,因此需改进CU划分原则以及选择合适的CU尺寸。
2.根据权利要求1所述的基于HEVC的分层深度视频残差层数据的编码方法,其特征在于,所述步骤1中,在LDV残差层数据生成过程需要对两个阈值p和q进行调整,具体步骤如下:
1)对于p值,由于深度值错误或噪声等原因,绘制过程中在背景区域会出现一些分散的小空洞,导致生成的残差数据中出现分散的像素点,这些散点并非真正的Disocclusion区域,对于最后LDV的合成并没有帮助,在绘制时这些空洞通过周围的像素点进行有效的修复,因此去掉像素的数目小于阈值p的相关区域,这里p值不能太大,否者会导致重要的信息丢失;
2)对于q值,LDV虚拟视点合成利用的是主视点完整的纹理和深度信息加上侧视点纹理和深度的残差信息,在合成虚拟视点时会有伪影的出现,为了减少伪影的出现,以像素宽度为q对深度值不连续的背景边界区域的像素进行标定,在生成残差数据过程中这部分像素不进行投影,从而扩大了Disocclusion区域,残差数据也相应增大,增大标定宽度q的方法能确保所有的遮挡区域的像素都包含进最终的残差数据中,提高绘制的虚拟视点质量,但同时残差数据的增大也会相应地导致编码代价的上升。
3.根据权利要求1所述的基于HEVC的分层深度视频残差层数据的编码方法,其特征在于,所述步骤2中:在LDV中,侧视点中仅有小部分图像区域包含残差数据,这就为得到高压缩比率提供了可能,然而空洞的分布对现有的编码框架并不友好,HEVC基于CU块进行编码,而残差层的信息分散分布,为了提高编码效率,减少编码的错误,需要进行块网格校准处理,处理的原则如下:
1)如果在一个块中存在的无意义的遮挡信息或者无遮挡信息,那么将该块置为空白块;
2)如果该块中存在有意义的遮挡信息,那么该块就用对应原始侧视点的像素进行填充;
HEVC中CU大小的范围是在64×64到8×8之间,为了保持与HEVC中对CTU的四叉树划分原则保持一致,同时不改变每个块的划分情况,使用大小为8×8的网格进行块校准,然后采用上述相同的处理原则进行像素值填充,因为HEVC中CU块的大小最小就是8×8,所以这种方法不会改变CU块的划分。
4.根据权利要求1所述的基于HEVC的分层深度视频残差层数据的编码方法,其特征在于,所述步骤3中,在编码残差数据时需要改进CU划分原则以及选择合适的CU尺寸,具体的改进方法如下:
a)如果一个CU块中不包含残差数据的像素,那么这个CU不划分,即提前终止CU的划分,且划分信息且包括划分的标记不包含进表示CU的比特流中;
b)如果将一个块划分成四个子块,其中三个子块中不包含任何残差数据的像素,只有一个子块包含残差数据,那么对该块进行划分,但是划分的标记信息不加入到比特流中,以节省比特率,在解码端该块的划分标记通过类似的方法获取;
c)如果一个CU块划分的四个子块中,不止一个块中包含残差数据的像素,那么采取与HEVC 相同的判断块是否划分或帧内/帧间编码的率失真优化模型。
CN201610531562.8A 2016-07-08 2016-07-08 基于hevc的分层深度视频残差层数据的编码方法 Active CN106210722B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610531562.8A CN106210722B (zh) 2016-07-08 2016-07-08 基于hevc的分层深度视频残差层数据的编码方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610531562.8A CN106210722B (zh) 2016-07-08 2016-07-08 基于hevc的分层深度视频残差层数据的编码方法

Publications (2)

Publication Number Publication Date
CN106210722A true CN106210722A (zh) 2016-12-07
CN106210722B CN106210722B (zh) 2019-06-25

Family

ID=57472482

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610531562.8A Active CN106210722B (zh) 2016-07-08 2016-07-08 基于hevc的分层深度视频残差层数据的编码方法

Country Status (1)

Country Link
CN (1) CN106210722B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107509075A (zh) * 2017-08-07 2017-12-22 福建星网智慧科技股份有限公司 一种用于avs2视频编码的快速划分cu的方法
CN108600759A (zh) * 2018-04-16 2018-09-28 北京工业大学 基于非均衡四叉树的3d-hevc快速转码方法
CN110446052A (zh) * 2019-09-03 2019-11-12 南华大学 一种3d-hevc帧内深度图快速cu深度选择方法
CN111327894A (zh) * 2018-12-15 2020-06-23 华为技术有限公司 块划分方法、视频编解码方法、视频编解码器
CN112882677A (zh) * 2021-02-08 2021-06-01 洲磊新能源(深圳)有限公司 一种rgb led多重色彩光源处理的技术方法
CN113271467A (zh) * 2021-07-19 2021-08-17 成都索贝数码科技股份有限公司 一种支持高效编辑的超高清视频分层编解码方法
WO2022126331A1 (zh) * 2020-12-14 2022-06-23 浙江大学 一种解码方法、视点间预测方法、解码器和编码器
CN115834885A (zh) * 2023-02-17 2023-03-21 宁波康达凯能医疗科技有限公司 一种基于稀疏表示的帧间图像编码方法与系统

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1128328A3 (en) * 2000-02-28 2003-11-12 Mitsubishi Denki Kabushiki Kaisha Rendering pipeline for surface elements
WO2006041261A1 (en) * 2004-10-16 2006-04-20 Electronics And Telecommunications Research Institute Method and system for encoding/decoding multi-view video based on layered-depth image
EP2061005A2 (en) * 2007-11-16 2009-05-20 Gwangju Institute of Science and Technology Device and method for estimating depth map, and method for generating intermediate image and method for encoding multi-view video using the same
CN102239506A (zh) * 2008-10-02 2011-11-09 弗兰霍菲尔运输应用研究公司 中间视合成和多视点数据信号的提取
CN103299619A (zh) * 2010-09-14 2013-09-11 汤姆逊许可公司 遮挡数据的压缩方法和装置
CN104284193A (zh) * 2013-07-12 2015-01-14 索尼公司 编码装置和编码方法、以及解码装置和解码方法
CN104822059A (zh) * 2015-04-23 2015-08-05 东南大学 一种基于gpu加速的虚拟视点合成方法
EP3324631A1 (en) * 2013-07-19 2018-05-23 Huawei Technologies Co., Ltd. Method and apparatus for encoding and decoding a texture block using depth based block partitioning

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1128328A3 (en) * 2000-02-28 2003-11-12 Mitsubishi Denki Kabushiki Kaisha Rendering pipeline for surface elements
WO2006041261A1 (en) * 2004-10-16 2006-04-20 Electronics And Telecommunications Research Institute Method and system for encoding/decoding multi-view video based on layered-depth image
EP2061005A2 (en) * 2007-11-16 2009-05-20 Gwangju Institute of Science and Technology Device and method for estimating depth map, and method for generating intermediate image and method for encoding multi-view video using the same
CN102239506A (zh) * 2008-10-02 2011-11-09 弗兰霍菲尔运输应用研究公司 中间视合成和多视点数据信号的提取
CN103299619A (zh) * 2010-09-14 2013-09-11 汤姆逊许可公司 遮挡数据的压缩方法和装置
CN104284193A (zh) * 2013-07-12 2015-01-14 索尼公司 编码装置和编码方法、以及解码装置和解码方法
EP3324631A1 (en) * 2013-07-19 2018-05-23 Huawei Technologies Co., Ltd. Method and apparatus for encoding and decoding a texture block using depth based block partitioning
CN104822059A (zh) * 2015-04-23 2015-08-05 东南大学 一种基于gpu加速的虚拟视点合成方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
KARSTEN MÜLLER,ALJOSCHA SMOLIC: ""Reliability-based generation and view synthesis in Layered Depth Video"", 《2008 IEEE 10TH WORKSHOP ON MULTIMEDIA SIGNAL PROCESSING》 *
KRISHNA RAO VIJAYANAGAR, JOOHEE KIM: ""Compression of residual layers of layered depth video using hierarchical block truncation coding"", 《2012 3DTV- CONFERENCE: THE TRUE VISION-CAPRUTE》 *
MICHAEL SCHMEING AND XIAOYI JIANG: ""Faithful Disocclusion Filling in Depth Image Based Rendering Using Superpixel-Based Inpainting"", 《IEEE TRANSACTIONS ON MULTIMEDIA》 *

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107509075A (zh) * 2017-08-07 2017-12-22 福建星网智慧科技股份有限公司 一种用于avs2视频编码的快速划分cu的方法
CN108600759A (zh) * 2018-04-16 2018-09-28 北京工业大学 基于非均衡四叉树的3d-hevc快速转码方法
CN108600759B (zh) * 2018-04-16 2021-11-12 北京工业大学 基于非均衡四叉树的3d-hevc快速转码方法
CN111327894A (zh) * 2018-12-15 2020-06-23 华为技术有限公司 块划分方法、视频编解码方法、视频编解码器
CN111327894B (zh) * 2018-12-15 2022-05-17 华为技术有限公司 块划分方法、视频编解码方法、视频编解码器
CN110446052A (zh) * 2019-09-03 2019-11-12 南华大学 一种3d-hevc帧内深度图快速cu深度选择方法
CN110446052B (zh) * 2019-09-03 2021-02-12 南华大学 一种3d-hevc帧内深度图快速cu深度选择方法
WO2022126331A1 (zh) * 2020-12-14 2022-06-23 浙江大学 一种解码方法、视点间预测方法、解码器和编码器
CN112882677A (zh) * 2021-02-08 2021-06-01 洲磊新能源(深圳)有限公司 一种rgb led多重色彩光源处理的技术方法
CN113271467A (zh) * 2021-07-19 2021-08-17 成都索贝数码科技股份有限公司 一种支持高效编辑的超高清视频分层编解码方法
CN113271467B (zh) * 2021-07-19 2021-10-22 成都索贝数码科技股份有限公司 一种支持高效编辑的超高清视频分层编解码方法
CN115834885A (zh) * 2023-02-17 2023-03-21 宁波康达凯能医疗科技有限公司 一种基于稀疏表示的帧间图像编码方法与系统

Also Published As

Publication number Publication date
CN106210722B (zh) 2019-06-25

Similar Documents

Publication Publication Date Title
CN106210722A (zh) 基于hevc的分层深度视频残差层数据的编码方法
CN100563340C (zh) 基于深度图像渲染的多通道视频流编码器和解码器
CN101720047B (zh) 基于颜色分割的多目摄像立体匹配获取深度图像的方法
CN102307304B (zh) 基于图像分割的立体视频右图像整帧丢失的错误隐藏方法
CN101610421B (zh) 视频通讯方法、装置及系统
CN102055982B (zh) 三维视频编解码方法及装置
CN101312542B (zh) 一种自然三维电视系统
CN102065296B (zh) 一种三维立体视频编码方法
KR20130079580A (ko) 사용자 선호도들에 기초하여 3d 비디오 렌더링을 조정하기 위한 3d 비디오 제어 시스템
CN102510500B (zh) 一种基于深度信息的多视点立体视频错误隐藏方法
CN102438147B (zh) 帧内同步立体视频多参考帧模式视间预测编码及解码方法
CN104202612B (zh) 基于四叉树约束的编码单元的划分方法及视频编码方法
CN111464814B (zh) 一种基于视差引导融合的虚拟参考帧生成方法
CN102790895B (zh) 一种基于最小二乘的多视点视频编码视点合成预测方法
CN103067705B (zh) 一种多视点深度视频预处理方法
CN102413332B (zh) 基于时域增强的视点合成预测多视点视频编码方法
CN102801997A (zh) 基于感兴趣深度的立体图像压缩方法
CN105306954B (zh) 一种基于视差最小可察觉误差模型的感知立体视频编码
CN103873876A (zh) 基于显著性的多视点彩色加深度视频编码方法
CN102195894B (zh) 即时通信中实现立体视频通信的系统及方法
CN103002306A (zh) 一种深度图像编码方法
CN102438167A (zh) 一种基于深度图像绘制的立体视频编码方法
CN109756719A (zh) 基于cu划分贝叶斯决策的3d-hevc帧间快速方法
CN103475884A (zh) 面向hbp编码格式的立体视频b帧整帧丢失错误隐藏方法
CN102325254B (zh) 一种立体视频的编、解码方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant