CN105934948A - 用于3d视频译码中的深度帧内和帧间预测模式的简化深度译码(sdc)的信令 - Google Patents

用于3d视频译码中的深度帧内和帧间预测模式的简化深度译码(sdc)的信令 Download PDF

Info

Publication number
CN105934948A
CN105934948A CN201380081514.8A CN201380081514A CN105934948A CN 105934948 A CN105934948 A CN 105934948A CN 201380081514 A CN201380081514 A CN 201380081514A CN 105934948 A CN105934948 A CN 105934948A
Authority
CN
China
Prior art keywords
depth
degree
video
sdc
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201380081514.8A
Other languages
English (en)
Other versions
CN105934948B (zh
Inventor
张莉
刘鸿彬
陈颖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of CN105934948A publication Critical patent/CN105934948A/zh
Application granted granted Critical
Publication of CN105934948B publication Critical patent/CN105934948B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/182Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/463Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding

Abstract

本发明描述用于在3D视频译码过程中用信号表示和处理指示用于深度帧内预测和深度帧间预测模式的简化深度译码SDC的信息的技术,所述3D视频译码过程例如是由对HEVC的3D‑HEVC扩展界定的过程。在一些实例中,本发明描述用于在3D视频译码中统一用于深度帧内预测和深度帧间预测模式的SDC的信令的技术。可统一所述SDC的信令以使得视频编码器或视频解码器使用相同语法元素用于用信号表示用于所述深度帧内预测模式和所述深度帧间预测模式两者的SDC。并且,在一些实例中,视频译码器可针对所述深度帧内预测模式和深度帧间预测模式两者使用相同语法结构或相同类型的语法结构来用信号表示和/或处理在SDC模式中产生的残余值。

Description

用于3D视频译码中的深度帧内和帧间预测模式的简化深度译 码(SDC)的信令
技术领域
本发明涉及视频译码,且更具体地说涉及用于在三维(3D)视频译码过程中对用于深度数据的残余值进行译码的技术。
背景技术
数字视频能力可并入到广泛范围的装置中,包含数字电视机、数字直播系统、无线广播系统、平板计算机、智能电话、个人数字助理(PDA)、膝上型计算机或桌上型计算机、数码相机、数字记录装置、数字媒体播放器、视频游戏装置、视频游戏控制台、蜂窝式或卫星无线电电话、视频电话会议装置、机顶盒装置及类似物。数字视频装置实施视频压缩技术,例如描述于以下各者中的那些技术:由MPEG-2、MPEG-4、ITU-T H.263、ITU-T H.264/MPEG-4第10部分高级视频译码(AVC)定义的标准、高效率视频译码(HEVC)标准,及此些标准的扩展。视频装置可更高效地发射、接收和存储数字视频信息。
编码器-解码器(编解码器)应用视频压缩技术以执行空间(图片内)预测和/或时间(图片间)预测以减少或移除视频序列中固有的冗余。对于基于块的视频译码,可将视频切片分割成视频块,视频块还可被称作树块、译码单元(CU)及/或译码节点。使用关于同一图片中的相邻块中的参考样本的空间预测编码图片的经帧内译码(I)切片中的视频块。图片的经帧间编码(P或B)切片中的视频块可使用相对于同一图片中的相邻块中的参考样本的空间预测或相对于其它参考图片中的参考样本的时间预测。图片替代地可被称为帧。
空间或时间预测导致待译码块的预测性块。残余数据表示待译码原始块与预测性块的间的像素差。经帧间译码块是根据指向形成预测块的参考样本块的运动向量和指示经译码块与预测块之间的差的残余数据编码的。根据帧内译码模式和残余数据来编码经帧内译码块。为了进一步压缩,可将残余数据从空间域变换到变换域,从而产生残余变换系数,接着可对残余变换系数进行量化。可扫描一开始按二维阵列排列的经量化变换系数,以便产生变换系数的一维向量,且可应用熵译码以实现更多压缩。
可例如从多个视角编码视图来产生多视图译码位流。多视图译码可允许解码器选择不同视图,或可能再现多个视图。另外,已经开发或正在开发的一些三维(3D)视频技术和标准利用多视图译码方面。举例来说,在一些3D视频译码过程中,不同视图可用以发射左眼和右眼视图以支持3D视频。其它3D视频译码过程可使用多视图加深度译码。在多视图加深度译码过程中,例如由HEVC的3D-HEVC扩展界定的过程,3D视频位流可含有不仅包含纹理视图分量而且包含深度视图分量的多个视图。举例来说,给定视图可包括纹理视图分量和深度视图分量。纹理视图和深度视图分量可用以构造3D视频数据。
发明内容
一般来说,本发明描述用于在3D视频译码过程中用信号表示和处理指示用于深度帧内预测和深度帧间预测模式的简化深度译码(SDC)的使用的信息的技术,所述3D视频译码过程例如由对HEVC的3D-HEVC扩展界定的过程。在一些实例中,本发明描述用于在3D视频译码中统一用于深度帧内预测和深度帧间预测模式的SDC的使用的信令的技术,例如通过使用一个语法元素来指示用于深度帧内和深度帧间预测两者的SDC的使用。
可统一SDC的信令以使得视频编码器或视频解码器(即,视频译码器)使用相同语法元素而不是单独语法元素用于用信号表示用于深度帧内预测模式和深度帧间预测模式两者的SDC。举例来说,可在CU层级用信号表示单个语法元素以指示SDC是否用于CU、CU是否经帧内预测或经帧间预测。
并且,在一些实例中,视频译码器可针对深度帧内预测模式和深度帧间预测模式两者使用相同语法结构、相同类型的语法结构或同一语法结构的不同实例来用信号表示和/或处理在SDC模式中产生的残余值。在每一情况下,可使用相同语法元素来用信号表示残余值,例如DC残余值。在一些实例中,用于用信号表示用于深度帧间预测模式的SDC的语法元素可为用于用信号表示用于深度帧内预测模式的SDC的那些语法元素的部分。在此情况下,共同语法元素可由深度帧内和深度帧间SDC模式共享。
对于用于由SDC产生的残余值的语法结构中的共享语法元素,上下文模型和二进制化过程,例如对于上下文自适应二进制算术译码(CABAC)熵译码过程,针对用于深度帧内预测和深度帧间预测模式两者的相关语法元素可统一。举例来说,用于由SDC产生的残余值的语法元素可以用于深度帧内预测模式和深度帧间预测模式两者的相同上下文模型和/或二进制化过程来译码。
在一些实例中,视频译码器可应用约束以使得当SDC经启用时停用脉码调制(PCM)译码。并且,在一些实例中,视频译码器可应用约束以使得仅针对具有特定分区大小的译码单元,SDC应用于深度帧内预测和深度帧间预测模式两者。
此外,在一些实例中,可使用单个语法元素来用信号表示SDC是否针对整个经译码视频序列或切片中的CU的深度帧内预测模式和深度帧间预测模式两者经启用或停用。所述语法元素可例如在视频参数集(VPS)扩展、序列参数集(SPS)、图片参数集(PPS)、切片片段标头或用于用信号表示视频译码语法信息的另一数据结构中呈现。作为一实例,如果此语法元素指示SDC针对序列经启用,那么可针对序列中的CU在CU层级用信号表示另一语法元素以指示是否在每一相应的CU中使用SDC。如果此语法元素指示SDC针对序列停用,那么不需要针对序列中的CU在CU层级用信号表示语法元素,因为SDC停用。替代地,可提供语法元素以针对切片的图片中的CU启用或停用SDC的使用。
在一个实例中,本发明提供一种对视频数据进行解码的方法,所述方法包括:接收指示简化深度译码(SDC)模式是否用于所述视频数据的深度译码单元(CU)的帧内预测和帧间预测两者的语法元素;当所述深度CU经帧内预测时,执行帧内预测以产生预测深度CU;当所述深度CU经帧间预测时,执行帧间预测以产生所述预测深度CU;当所述语法元素指示针对所述深度CU的预测单元(PU)的每一分区使用所述SDC模式时,接收表示所述深度CU的至少一个DC残余值的信息,其中所述至少一个DC残余值表示所述深度CU的所述PU的所述分区与所述预测深度CU的对应分区之间的像素差;以及使用所述至少一个DC残余值和所述预测深度CU重构所述深度CU。
在另一实例中,本发明提供一种对视频数据进行编码的方法,所述方法包括:当深度CU经帧内预测时,执行帧内预测以产生预测深度CU;当所述深度CU经帧间预测时,执行帧间预测以产生所述预测深度CU;当使用简化深度译码(SDC)模式时,针对所述深度CU的预测单元(PU)的每一分区,产生表示所述深度CU的至少一个DC残余值的信息,其中所述至少一个DC残余值表示所述深度CU的所述PU的所述分区与所述预测深度CU的对应分区之间的像素差;当使用所述SDC模式时,产生指示所述SDC模式用于所述视频数据的深度译码单元(CU)的帧内预测和帧间预测两者的语法元素;以及基于表示所述至少一个DC残余值的所述信息和所述语法元素在所述视频编码器中对所述深度CU进行编码。
在另一实例中,本发明提供一种视频译码器,其包括:存储器,其存储视频数据;以及一或多个处理器,其经配置以:对指示简化深度译码(SDC)模式是否用于所述视频数据的深度译码单元(CU)的帧内预测和帧间预测两者的语法元素进行译码;当所述深度CU经帧内预测时,执行帧内预测以产生预测深度CU;当所述深度CU经帧间预测时,执行帧间预测以产生所述预测深度CU;以及当使用所述SDC模式时,针对所述深度CU的预测单元(PU)的每一分区,对表示所述深度CU的至少一个DC残余值的信息进行译码,其中所述至少一个DC残余值表示所述深度CU的所述PU的所述分区与所述预测深度CU的对应分区之间的像素差。
在另一实例中,本发明提供一种对视频数据进行解码的方法,所述方法包括:当所述视频数据的深度译码单元(CU)经帧内预测时,执行帧内预测以产生预测深度CU;当所述深度CU经帧间预测时,执行帧间预测以产生所述预测深度CU;当使用简化深度译码(SDC)模式时,获得包括指示表示所述深度CU的预测单元(PU)的分区的至少一个DC残余值的信息的一或多个语法元素的语法结构,其中所述语法结构的所述语法元素针对所述帧内预测和所述帧间预测是相同的;以及使用所述至少一个DC残余值和所述预测深度CU重构所述深度CU。
在另一实例中,本发明提供一种对视频数据进行编码的方法,所述方法包括:当所述视频数据的深度译码单元(CU)经帧内预测时,执行帧内预测以产生预测深度CU;当所述深度CU经帧间预测时,执行帧间预测以产生所述预测深度CU;当使用简化深度译码(SDC)模式时,对包括指示表示所述深度CU的预测单元(PU)的分区的至少一个DC残余值的信息的一或多个语法元素的语法结构进行译码,其中所述语法结构的所述语法元素针对所述帧内预测和所述帧间预测是相同的;以及基于表示所述至少一个DC残余值的所述信息对所述深度CU进行编码。
在另一实例中,本发明提供一种视频译码器,其包括:存储器,其存储视频数据;当所述视频数据的深度译码单元(CU)经帧内预测时,执行帧内预测以产生所述视频数据的预测深度CU;当所述深度CU经帧间预测时,执行帧间预测以产生所述视频数据的所述预测深度CU;以及当使用简化深度译码(SDC)模式时,对包括指示表示所述深度CU的预测单元(PU)的分区的至少一个DC残余值的信息的一或多个语法元素的语法结构进行译码,其中所述语法结构的所述语法元素针对所述帧内预测模式和所述帧间预测模式是相同的。
在另一实例中,本发明提供一种对视频数据进行解码的方法,所述方法包括:接收第一语法元素,所述第一语法元素指示简化深度译码(SDC)模式是否针对经译码视频数据的整个序列的深度译码单元(CU)经启用;接收第二语法元素,所述第二语法元素指示所述SDC模式是否用于所述序列的所述深度CU中的一者的帧内预测和帧间预测两者;当所述序列的所述深度CU中的所述一者经帧内预测时,执行帧内预测以产生预测深度CU;当所述序列的所述深度CU中的所述一者经帧间预测时,执行帧间预测以产生所述预测深度CU;当所述第二语法元素指示使用所述SDC模式时,获得表示用于所述序列的所述深度CU中的所述一者的预测单元(PU)的分区的至少一个DC残余值的信息;以及使用所述至少一个DC残余值和所述相应预测深度CU重构所述序列的所述深度CU中的所述一者的所述PU的所述分区。
在另一实例中,本发明提供一种对视频数据进行编码的方法,所述方法包括:对指示简化深度译码(SDC)模式是否针对经译码视频数据的整个序列的深度译码单元(CU)经启用的语法元素进行编码;对指示所述SDC模式是否用于所述序列的所述深度CU中的一者的帧内预测和帧间预测两者的第二语法元素进行编码;当所述序列的所述深度CU中的一者经帧内预测时,执行帧内预测以产生预测深度CU;当所述序列的所述深度CU中的一者经帧间预测时,执行帧间预测以产生所述预测深度CU;以及当所述第二语法元素指示使用所述SDC模式时,对表示用于所述序列的所述深度CU中的所述一者的预测单元(PU)的分区的至少一个DC残余值的信息进行编码。
在另一实例中,本发明提供一种视频译码器,其包括:存储器,其存储视频数据;以及一或多个处理器,其经配置以:对指示简化深度译码(SDC)模式是否针对所述视频数据的整个码序列的深度译码单元(CU)经启用的语法元素进行译码;对指示所述SDC模式是否用于所述序列的所述深度CU中的一者的帧内预测和帧间预测两者的第二语法元素进行译码;当所述序列的所述深度CU中的一者经帧内预测时,执行帧内预测以产生预测深度CU;当所述序列的所述深度CU中的一者经帧间预测时,执行帧间预测以产生所述预测深度CU;以及当所述第二语法元素指示使用所述SDC模式时,对表示用于所述序列的所述深度CU中的所述一者的预测单元(PU)的分区的至少一个DC残余值的信息进行译码。
在附图和以下描述中阐述本发明的一或多个方面的细节。本发明中所描述的技术的其它特征、目标及优点将从描述及图式且从权利要求书而显而易见。
附图说明
图1是说明可以利用本发明的技术的实例视频译码系统的框图。
图2是说明在高效率视频译码(HEVC)中使用的帧内预测模式的图。
图3是说明用于对像素样本的8x8块进行译码的一个楔波分区模式的实例的图。
图4是说明用于对像素样本的8x8块进行译码的一个轮廓分区模式的实例的图。
图5是说明可实施本发明的技术的实例视频编码器的框图。
图6是说明可实施本发明的技术的实例视频解码器的框图。
图7是说明对语法元素进行编码以指示用于CU深度帧内预测和深度帧间预测模式两者的SDC使用的流程图。
图8是说明对语法元素进行解码以指示用于CU的深度帧内预测和深度帧间预测模式两者的SDC使用的流程图。
图9是说明对语法元素进行解码以指示SDC是否针对整个经编码视频序列中的深度CU经启用或停用的流程图。
图10是说明对单个语法结构进行解码以获得用于帧内预测和帧间预测模式的CU的PU分区的SDC残余数据的流程图。
图11是说明在解码器侧使用对SDC译码的实例约束的流程图。
图12是说明在解码器侧使用对SDC译码的另一实例约束的流程图。
具体实施方式
本发明涉及3D视频译码过程中的深度译码模式,例如HEVC的3D-HEVC扩展。更具体来说,本发明描述其中应用于深度帧内预测和深度帧间预测模式的SDC的信令是统一的技术。在一些情况下,SDC可替代地称为简化残余译码或逐片段DC译码。简化深度译码、简化残余译码和逐片段DC译码将在本文中被称作简化深度译码(SDC)。在任何情况下,如本发明中所描述,SDC可通过统一信令技术应用于深度帧内和深度帧间译码。
在3D-HEVC中,使用帧内SDC和帧间SDC模式两者。然而,在SDC的当前设计中,使用不同语法元素和上下文模型来指示在3D-HEVC中帧内SDC和帧间SDC的使用,其使得译码单元的剖析过程更复杂。在一些实例中,本发明中描述的技术可部分地通过统一用于帧内SDC和帧间SDC的语法和上下文而解决此问题。
在SDC中,一般来说,视频编码器针对深度译码单元(CU)的预测单元(PU)的每一分区仅编码一个残余。因此,在SDC中,视频编码器可针对与PU的分区相关联的像素的集合对一个残余值(例如,DC残余值)进行编码。PU可属于经帧内译码深度CU或经帧间译码深度CU。
对于PU的每一分区,并非对分区中的每一像素的差进行译码,视频编码器20可确定原始信号的平均值(即,一个待译码块的分区中的像素的平均值)与预测信号的平均值(即,预测性块的对应分区中的选定像素样本的平均值)之间的差,使用此差作为所述PU中的全部像素的DC残余,且向视频解码器用信号表示此残余值。
深度值可使用深度查找表(DLT)任选地映射到索引,所述DLT可通过分析在对全视频序列进行编码之前的第一帧内周期内的帧而构造。如果使用DLT,那么DLT可例如在序列参数集(SPS)或其它语法结构中由视频编码器发射到视频解码器,且经解码索引值可由视频解码器基于DLT而映射回到深度值。通过使用DLT,可观测到进一步译码增益。
可在译码单元(CU)层级执行帧内和帧间预测模式信令。类似地,可在CU层级用信号表示SDC模式的使用的指示。然而,当一个CU(经帧内译码或经帧间译码)是以SDC模式译码时,其可分裂成若干预测单元(PU)。每一PU可进一步分裂成若干分区。对于SDC模式,可针对CU的每一PU的每一分区用信号表示DC残余值。即,可针对CU中的PU的多个相应分区提供多个DC残余值。
对于如上文所描述的在SDC模式中的残余的信令,对于每一分区,视频编码器可在经编码位流中用信号表示当前分区及其预测符的代表性值的差。在一些实例中,可用信号表示所述差而无需所述差的变换和量化。取决于是否使用DLT可使用两个不同方法用信号表示所述残余。当未使用DLT时,直接发射(例如,作为DC残余值)具有正负号的当前分区及其预测符的代表性值之间的差量。当使用DLT时,并非直接用信号表示深度值的差,可用信号表示DLT索引的差,即,当前分区的代表性值的DLT索引与预测符的DLT索引之间的差。
在用于SDC的现有设计中,可使用不同语法元素和上下文模型来指示在3D-HEVC中使用SDC分别用于深度帧内预测模式和深度帧间预测模式。在3D-HEVC中,使用不同语法元素来指示使用SDC用于深度帧内预测模式和深度帧间预测模式使得用于译码单元(CU)的剖析过程在解码器侧较复杂。
如上文所论述,可针对每一深度CU执行帧内和帧间预测模式信令,同时也在CU层级用信号表示SDC模式的使用的指示。根据各种实例,本发明描述用于在例如3D-HEVC等3D视频译码过程中统一用于深度帧内预测和深度帧间预测模式的SDC的信令的技术。并非单独地用信号表示用于经帧内预测CU和经帧间预测CU的SDC的使用,可提供单个SDC语法元素以指示使用SDC用于CU,无论所述CU是否经帧内或经帧间预测。所述技术可由视频编码器和/或视频解码器(即,视频译码器)执行以统一3D视频译码中用于深度帧内预测和深度帧间预测模式的SDC的信令。根据本发明可统一3D视频译码过程中用于深度帧内和深度帧间预测模式的SDC的信令,所述SDC在本文可被称为简化深度译码、简化残余译码或逐片段DC译码。下文描述用于统一SDC信令的技术的各种方面。
在一些实例中,在深度译码中,视频译码器可使用仅一个语法元素(例如,sdc_flag)来指示用于深度帧内或深度帧间模式的SDC的使用。举例来说,视频编码器可使用同一SDC语法元素(例如,sdc_flag)来用信号表示使用SDC用于深度帧内预测和深度帧间预测模式两者。视频解码器可处理同一语法元素(例如,sdc_flag)以确定SDC是否将用于深度帧内预测和深度帧间预测模式。如果所述语法元素指示将使用SDC,那么SDC将用于CU以用于深度帧内预测或深度帧间预测。以此方式,不必用信号表示不同语法元素来分别指示用于深度帧内预测和深度帧间预测的SDC使用。而是,单个语法元素指示无论哪一个模式(帧内或帧间)SDC使用都用于CU。用于帧内和帧间预测两者的一个语法元素的信令可减少信令开销,促进计算效率且可能减少存储器要求。
举例来说,视频译码器可使用同一语法元素来用信号表示使用SDC用于深度帧内预测和深度帧间预测两者,而不是使用不同语法元素用于单独地用信号表示使用SDC用于深度帧内预测和深度帧间预测。因此,如果使用例如sdc_flag等单个语法元素,那么可移除指示当前译码单元(CU)利用SDC用于深度帧间预测模式的单独语法元素,例如inter_sdc_flag。同样,也可移除指示当前CU利用SDC用于深度帧内预测模式的语法元素。因此,无论当前CU是否是以深度帧内预测模式或深度帧间预测模式译码,都引入例如呈例如sdc_flag的旗标的形式的新语法元素。当此旗标等于1时,针对深度帧内预测模式或深度帧间预测两者启用SDC。
并且,在一些实例中,在深度译码中,当使用SDC对当前深度CU进行译码时,对于每一分区,表示用于经深度帧间译码CU或经深度帧内译码CU的每一PU的每一分区的DC残余值的DC残余信息可在其可由一个SDC残余语法结构直接或通过使用DLT索引值而呈现的意义上统一,所述SDC残余语法结构包含指示DC残余值的绝对值及其正负号的信息。举例来说,视频译码器可针对以深度帧内预测或深度帧间预测模式译码的CU中的PU的分区两者使用相同语法结构或相同类型的语法结构存储和/或检索在SDC模式中产生的残余值。举例来说,针对深度帧内预测且深度帧间预测模式两者,视频编码器可产生含有深度CU的PU的分区的残余值的语法结构,且视频解码器可从此语法结构获得深度CU的PU的分区的残余值。因此,用以用信号表示SDC的语法元素和语法结构可针对深度帧内和帧间译码而统一。
或者或另外,如果深度CU经帧内译码且利用SDC,那么指示当前CU是否在任何其分区中含有任何非零DC残余值的旗标(等于1)可进一步由视频编码器用信号表示且由视频解码器处理。如果此旗标是0,那么视频编码器不用信号表示DC残余值,且视频解码器推断DC残余值针对每一分区等于零。
作为另一替代方案或另外,指示当前CU是否在任何其PU分区中含有任何非零DC残余值的旗标可应用于经帧内译码和经帧间译码CU两者。确切地说,如果所述旗标等于1,那么视频解码器确定在适用时存在用于经帧内译码CU和经帧间译码CU两者的非零DC残余值。因此,此旗标可与如上文所描述用以呈现经帧内译码CU或经帧间译码CU的PU的分区的DC残余值的相同语法结构或相同类型的语法结构一起使用。
作为另一替代或添加,指示当前CU是否在任何其分区中含有任何非零DC残余值的此旗标可不与用以呈现经帧内译码CU和经帧间译码CU的DC残余值的语法结构一起使用。在此情况下,相同语法结构或相同类型的语法结构可以用于经帧内译码CU和经帧间译码CU,如上文所描述,但用信号表示DC残余值而无需使用指示当前CU是否在任何其分区中含有任何非零DC残余值的旗标。
在一些实例中,因为用于深度帧内预测和深度帧间预测模式中的SDC的DC残余值的语法结构共享相同语法元素,所以用于对相关语法元素进行熵译码(例如,上下文自适应二进制算术译码(CABAC))的上下文模型和二进制化过程也可以统一,即,同一上下文模型可以用于指示SDC使用或包含用于CU的深度帧内预测和深度帧间预测模式的DC残余值的语法元素。因此,针对通过用于深度帧内和帧间译码模式两者的SDC产生的残余值使用相同语法元素和/或语法结构可促进具体来说熵译码中的减少的计算复杂性。举例来说,用于用信号表示SDC的语法元素可以用于深度帧内预测模式和深度帧间预测模式两者的相同上下文模型和/或二进制化过程来译码。并且,载运指示表示通过SDC产生的残余值的信息的语法元素的语法结构也可以通过用于帧内预测和帧间预测的相同内容模型和/或二进制化过程来熵译码。例如在3D-HEVC译码中使用相同上下文模型用于深度帧内预测和深度帧间预测模式可尤其在解码器侧减少与熵译码相关联的计算负担和存储器要求。
作为另一实例,即使用于深度帧内模式和深度帧间模式的SDC信令可使用相同语法结构用于DC残余值,视频编码器和解码器也可经配置以使用同一语法结构的不同实例分别用于深度帧内译码和深度帧间译码。语法结构的每一实例可包含相同语法元素或相同类型的语法元素和相同结构以用信号表示SDC使用和DC残余值,但语法结构的实例可针对深度帧内预测和深度帧间预测模式单独地用信号表示此些语法元素的值,例如,用于深度帧内预测的语法结构的一个实例和用于深度帧间预测的语法结构的一个实例。因此,在此实例中,视频编码器和/或视频解码器可使用相同的上下文和/或二进制化过程用于相同语法结构的不同实例的熵译码(例如,CABAC译码),或可针对深度帧内预测和深度帧间预测模式中的SDC使用单独地维持用于语法结构的不同实例的熵译码(例如,CABAC译码)的上下文和/或二进制化过程。在一些实例中,可以旗标sdc_flag用信号表示用于帧内或帧间模式的CU的SDC使用。在指示每一分区的DC残余的语法结构中,在一些实例中,可以由depth_dc_abs指示的量值和由depth_dc_sign_flag指示的正负号来用信号表示DC残余值。
在根据本发明的一些实例中,视频解码器可经配置以应用约束以使得当使用SDC时停用脉码调制(PCM)译码。举例来说,可应用在解码器侧的约束以使得例如针对给定深度CU当sdc_flag等于1时pcm_flag将不等于1。当针对CU的深度帧内和深度帧间预测模式两者启用SDC时,PCM不用于所述CU。因此,此约束防止当指示SDC的使用的语法元素(sdc_flag)等于1时解码器启用PCM。
并且,在一些实例中,视频解码器可对SDC应用约束以使得仅针对具有特定分区大小或特定范围的分区大小的译码单元,SDC用于深度帧内预测和深度帧间预测模式两者。举例来说,视频解码器可在解码器侧对SDC应用约束以使得帧内SDC模式和帧间SDC模式两者仅用于具有2Nx2N分区大小的CU。作为一个替代方案,视频解码器可应用约束以使得帧内SDC模式用于具有2Nx2N和NxN分区大小的CU。因此,在一个实例中,SDC可以用于仅用于2Nx2N分区大小的深度帧内预测和深度帧间预测。在另一实例中,SDC可以用于仅用于2Nx2N分区大小的深度帧间预测,但SDC可以用于仅用于2Nx2N和NxN分区大小的深度帧内预测。
在一些实例中,视频编码器和/或视频解码器可经配置以使用单个语法元素,例如一位旗标或多位语法元素,来在例如用于整个经译码视频序列的解码过程中针对深度帧内预测和深度帧间预测模式两者启用和停用SDC。举例来说,此语法元素可在视频参数集(VPS)扩展、序列参数集(SPS)、图片参数集(PPS)、切片片段标头或另一数据结构中经译码,以指示SDC是否针对深度帧内预测和深度帧间预测模式两者经启用。在此实例中,所述单个语法元素指示SDC是否针对用于经译码视频序列的深度帧内和深度帧间模式两者经启用。在另一实例中,作为一个替代方案,视频编码器和/或视频解码器可对一个旗标进行译码以指示SDC是否针对深度帧内模式经启用针对整个经译码视频序列经启用,并且如果这是真的,那么另外对另一旗标进行译码以指示SDC是否针对用于整个经译码视频序列或整个切片的深度帧间模式经启用。在此实例中,使用一个语法元素来针对经译码视频序列启用或停用SDC。如果SDC经启用,那么编码器可用信号表示另一语法元素(例如,sdc_flag)以指示用于经译码视频序列内的CU的CU层级处使用SDC。如果SDC停用,那么编码器不用信号表示指示在CU层级处SDC的使用的语法元素,且解码器不接收此语法元素。
在一些实例中,可提供旗标(例如,SdcEnableFlag)以指示SDC是否经启用。所述旗标可具有随着VPS、SPS、PPS或切片标头中的对应值而变的值。可部分地确定SdcEnableFlag的值的VPS语法元素的实例包含vps_inter_sdc_flag和vps_depth_modes_flag。语法元素(sdc_flag)随后可指示SDC是否用于CU。下文提供这些语法元素的实例。在VPS、SPS、PPS或切片片段标头中可提供相似语法元素以在适用时针对整个码视频序列、图片或切片启用和停用SDC。
图1是说明如本发明中所描述可经配置以利用本发明的各种技术用于用信号表示用于深度帧内预测模式和深度帧间预测模式的SDC的实例视频编码和解码系统10的框图。在一些实例中,系统10的视频编码器20和/或视频解码器30可经配置以在例如3D-HEVC的3D视频译码过程中执行统一用于深度帧内预测和深度帧间预测模式的SDC的信令的技术。
如图1中所展示,系统10包含源装置12,其提供待在稍后时间由目的地装置14解码的经编码视频数据。具体地说,源装置12经由计算机可读媒体16将视频数据提供到目的地装置14。源装置12及目的地装置14可包括广泛范围的装置中的任一者,包含桌上型计算机、笔记型(即,膝上型)计算机、平板计算机、机顶盒、例如所谓的“智能”电话的电话手持机、所谓的“智能”板、电视、相机、显示装置、数字媒体播放器、视频游戏控制台、视频流式传输装置或类似者。在一些情况下,可装备源装置12和目的地装置14以用于无线通信。
目的地装置14可经由计算机可读媒体16接收待解码的经编码的视频数据。计算机可读媒体16可以包括能够将经编码视频数据从源装置12移动到目的地装置14的任何类型的媒体或装置。在一个实例中,计算机可读媒体16可包括通信媒体,例如发射信道,以使源装置12能够实时地将经编码视频数据直接发射到目的地装置14。
可根据通信标准(例如,无线通信协议)调制经编码的视频数据,并将其发射到目的地装置14。通信媒体可包括任何无线或有线通信媒体,例如射频(RF)频谱或一或多个物理传输线。通信媒体可形成分组网络(例如,局域网、广域网或全球网络,例如因特网)的部分。通信媒体可包含路由器、交换器、基站或任何其它可用于促进从源装置12到目的地装置14的通信的设备。
在一些实例中,经编码数据可从输出接口22输出到计算机可读存储媒体,例如非暂时性计算机可读存储媒体,即数据存储装置。类似地,经编码数据可由输入接口从存储装置存取。存储装置可包含多种分布式或本地存取的非暂时性数据存储媒体中的任一者,例如硬盘驱动器、蓝光光盘、DVD、CD-ROM、快闪存储器、易失性或非易失性存储器或任何其它用于存储经编码的视频数据的合适的数字存储媒体。在另一实例中,存储装置可对应于文件服务器或另一可存储源装置12产生的经编码视频的中间存储装置。
目的地装置14可经由流式传输或下载从存储装置存取所存储的视频数据。文件服务器可为能够存储经编码视频数据且将经编码视频数据发射到目的地装置14的任何类型的服务器。实例文件服务器包含网络服务器(例如,用于网站)、FTP服务器、网络附接存储(NAS)装置或本地磁盘驱动器。目的地装置14可以通过任何标准数据连接(包含因特网连接)来存取经编码视频数据。这可包含无线信道(例如,Wi-Fi连接)、有线连接(例如,DSL、电缆调制解调器等),或适合于存取存储在文件服务器上的经编码视频数据的两者的组合。经编码视频数据从存储装置的发射可能是流式传输发射、下载发射或其组合。
本发明的技术未必限于无线应用或设定。所述技术可以应用于视频译码以支持多种多媒体应用中的任一者,例如空中协议电视广播、有线电视发射、卫星电视发射、因特网流式视频发射(例如,经由HTTP的动态自适应流式传输(DASH))、经编码到数据存储媒体上的数字视频、存储在数据存储媒体上的数字视频的解码或其它应用。在一些实例中,系统10可经配置以支持单向或双向视频传输,以支持例如视频流式传输、视频重放、视频广播和/或视频电话等应用。
在图1的实例中,源装置12包含视频源18、视频编码器20及输出接口22。目的地装置14包含输入接口28、视频解码器30和显示装置32。根据本发明,源装置12的视频编码器20可经配置以关于非矩形分区应用基于分区的深度译码的技术。在其它实例中,源装置和目的地装置可包含其它组件或布置。举例来说,源装置12可从外部视频源18(例如外部相机)接收视频数据。同样,目的地装置14可与外部显示装置介接,而非包含集成式显示装置。
图1的所说明系统10仅为一个实例。用于深度帧内预测模式的SDC的技术可由任何数字视频编码和/或解码装置执行。尽管本发明的技术一般通过视频编码器20和/或视频解码器30来执行,但是所述技术还可通过视频编码器/解码器(通常被称作“编解码器”)来执行。此外,本发明的技术还可由视频预处理器执行。源装置12及目的地装置14仅为源装置12产生经译码视频数据用于发射到目的地装置14的所述译码装置的实例。在一些实例中,装置12、14可以实质上对称的方式操作,使得装置12、14中的每一者包含视频编码及解码组件。因此,系统10可支持视频装置12、14之间的单向或双向视频发射以(例如)用于视频流式传输、视频回放、视频广播或视频电话。
源装置12的视频源18可以包含视频俘获装置,例如摄像机、含有先前所俘获视频的视频存档和/或用于从视频内容提供者接收视频的视频馈送接口。作为另一替代方案,视频源18可产生基于计算机图形的数据作为源视频,或直播视频、存档视频与计算机产生的视频的组合。在一些情况下,如果视频源18是摄像机,那么源装置12和目的地装置14可形成所谓的智能电话、平板计算机或视频电话。然而,如上文所提及,本发明中所描述的技术可大体上适用于视频译码,且可应用于无线和/或有线应用。在每一情况下,俘获、预先俘获或计算机产生的视频可由视频编码器20编码。经编码视频信息可接着由输出接口22输出到计算机可读媒体16上。
计算机可读媒体16可包含瞬时媒体,例如无线广播或有线网络发射,或数据存储媒体(即,非暂时性存储媒体)。在一些实例中,网络服务器(未图示)可以从源装置12接收经编码视频数据,并且例如经由网络发射将经编码视频数据提供到目的地装置14。类似地,媒体生产设施(例如,光盘冲压设施)的计算装置可从源装置12接收经编码的视频数据且生产含有经编码的视频数据的光盘。因此,在各种实例中,计算机可读媒体16可以理解为包含各种形式的一或多个计算机可读媒体。
本发明可能总体上参考视频编码器20向另一装置(例如视频解码器30)“用信号表示”某些信息。但是,应理解,视频编码器20可以通过使某些语法元素与视频数据的各种经编码部分相关联来用信号表示信息。即,视频编码器20可通过将某些语法元素存储到视频数据的各种经编码部分的标头或有效负载中而“用信号表示”数据。在一些情况下,此些语法元素可在被视频解码器30接收和解码之前,先被编码和存储(例如,存储到计算机可读媒体16)。因而,术语“用信号表示”可以大体上指代用于解码经压缩的视频数据的语法或其它数据的通信,不论所述通信是实时或近乎实时发生还是在一段时间中发生,例如可能在编码时将语法元素存储到媒体上的时候发生,接着可以在存储到这个媒体之后的任何时间由解码装置检索。
目的地装置14的输入接口28从计算机可读媒体16接收信息。计算机可读媒体16的信息可包含由视频编码器20定义的语法信息,所述语法信息还供视频解码器30使用,所述语法信息包含描述块和其它经译码单元(例如,GOP)的特性和/或处理的语法元素。显示装置32向用户显示经解码视频数据,且可包括多种显示装置中的任一者,例如阴极射线管(CRT)、液晶显示器(LCD)、等离子显示器、有机发光二极管(OLED)显示器、投影装置或另一类型的显示装置。
尽管图1中未图示,但在一些方面中,视频编码器20和视频解码器30可各自与音频编码器及解码器集成,且可包含适当多路复用器-多路分用器单元或其它硬件和软件以处置共同数据流或单独数据流中的音频和视频两者的编码。如果适用的话,作为一个实例,多路复用器-多路分用器单元可符合ITU H.223多路复用器协议,或例如用户数据报协议(UDP)等其它协议。
视频编码器20和视频解码器30各自可实施为合适的多种合适的编码器或解码器电路中的任一者,例如一或多个微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑电路、软件、硬件、固件或其任何组合。视频编码器20和视频解码器30中的每一者可包含在一或多个编码器或解码器中,所述编码器或解码器中的任一者可集成为组合视频编码器/解码器(CODEC)的部分。包含视频编码器20和/或视频解码器30的装置可包括集成电路、微处理器和/或无线通信装置(例如,蜂窝式电话)。
视频编码器20及视频解码器30可根据视频译码标准操作,例如HEVC标准且更确切地说HEVC标准的3D-HEVC扩展,如本发明中参考。HEVC假定视频译码装置相对于经配置以根据其它过程(例如ITU-T H.264/AVC)执行译码的装置的若干额外能力。举例来说,虽然H.264提供了九个帧内预测编码模式,但是HM可以提供多达三十五个帧内预测编码模式。
一般来说,HEVC指定视频图片(或“帧”)可划分成包含明度和色度样本两者的树块或最大译码单元(LCU)的序列。位流内的语法数据可以界定最大译码单元(LCU,其是就像素数目来说的最大译码单元)的大小。切片包含按译码次序的若干连续树块。图片可以分割成一或多个切片。每一树块可以根据四叉树分裂成译码单元(CU)。一般来说,四叉树数据结构包含每个CU一个节点,其中一个根节点对应于所述树块。如果一个CU分裂成四个子CU,那么对应于CU的节点包含四个叶节点,其中的每一者对应于所述子CU中的一者。
四叉树数据结构的每一节点可提供用于对应CU的语法数据。举例来说,四叉树中的节点可包含分裂旗标,其表明对应于所述节点的所述CU是否分裂成子CU。用于CU的语法元素可以递归地来定义,且可以取决于CU是否分裂成数个子CU。如果CU不进一步分裂,那么将其称为叶CU。叶CU的四个子CU也可被称为叶CU,即使不存在原始叶CU的显式分裂时也是如此。举例来说,如果16x16大小的CU不进一步分裂,那么这四个8x8子CU将也被称作叶CU,虽然16x16CU从未分裂。
HEVC中的CU具有与H.264标准的宏块类似的目的,除了CU不具有大小区别。举例来说,树块可分裂成四个子节点(也称为子CU),且每一子节点又可为父节点且可分裂成另外四个子节点。最终的未经分裂子节点(被称作四叉树的叶节点)包括译码节点,还被称作叶CU。与经译码位流相关联的语法数据可定义树块可分裂的最大次数,被称作最大CU深度,且还可定义译码节点的最小大小。因此,位流还可界定最小译码单元(SCU)。本发明使用术语“块”来指HEVC的上下文中的CU、PU或TU中的任一者,或者其它标准的上下文中的类似数据结构(例如,其在H.264/AVC中的宏块及子块)。
CU包含译码节点和与所述译码节点相关联的预测单元(PU)和变换单元(TU)。CU的大小对应于译码节点的大小并且形状必须是正方形。CU的大小可介于8×8个像素至多达具有最大64×64个像素或更大的树块大小的范围内。每一CU可以含有一或多个PU和一或多个TU。举例来说,与CU相关联的语法数据可描述CU分割成一或多个PU。分割模式可在CU被跳过或经直接模式编码、经帧内预测模式编码或经帧间预测模式编码之间有所不同。在如本发明中所描述的深度译码的情况下,PU可分割为非正方形形状,或包含非矩形形状的分区。举例来说,与CU相关联的语法数据还可描述CU根据四叉树到一或多个TU的分割。TU可为正方形或非正方形(例如,矩形)形状。
HEVC标准允许根据TU变换,TU可针对不同CU而有所不同。TU的大小通常是基于针对经分割LCU定义的给定CU内的PU的大小而确定,但是情况可能并不总是如此。TU通常与PU大小相同或小于PU。在一些实例中,可以使用被称为“残余四叉树”(RQT)的四叉树结构将对应于CU的残余样本细分成较小单元。RQT的叶节点可被称为变换单元(TU)。可以变换与TU相关联的像素差值以产生变换系数,所述变换系数可经量化。
叶CU可包含一或多个预测单元(PU)。一般来说,PU表示对应于对应的CU的全部或一部分的空间区,且可包含用于检索PU的参考样本的数据。参考样本可为来自参考块的像素。在一些实例中,参考样本可从参考块获得或例如通过内插或其它技术而产生。PU还包含与预测有关的数据。举例来说,当PU经帧内模式编码时,用于PU的数据可以包含在残余四叉树(RQT)中,残余四叉树可以包含描述用于对应于PU的TU的帧内预测模式的数据。作为另一实例,当PU经帧间模式编码时,PU可以包含定义PU的一或多个运动向量的数据。举例来说,定义PU的运动向量的数据可以描述运动向量的水平分量、运动向量的垂直分量、运动向量的分辨率(例如,四分之一像素精度或八分之一像素精度)、运动向量指向的参考图片及/或运动向量的参考图片列表(例如,列表0、列表1或列表C)。
具有一或多个PU的叶CU还可包含一或多个变换单元(TU)。变换单元可使用RQT(也称为TU四叉树结构)来指定,如上文所论述。举例来说,分裂旗标可以指示叶CU是否分裂成四个变换单元。接着,每一变换单元可进一步分裂成更多个子TU。当TU未进一步分裂时,其可被称作叶TU。总体上,对于帧内译码,所有属于一叶CU的叶TU共享相同的帧内预测模式。也就是说,一般应用相同的帧内预测模式来计算叶CU的所有TU的预测值。对于帧内译码,视频编码器20可以使用帧内预测模式将每一叶TU的残余值计算为CU的对应于TU的部分与原始块之间的差。TU不一定限于PU的大小。因此,TU可大于或小于PU。对于帧内译码,PU可以与相同CU的对应叶TU并置。在一些实例中,叶TU的最大大小可以对应于对应的叶CU的大小。
此外,叶CU的TU还可与相应的四叉树数据结构(被称作残余四叉树(RQT))相关联。即,叶CU可包含指示叶CU如何分割成TU的四叉树。TU四叉树的根节点一般对应于叶CU,而CU四叉树的根节点一般对应于树块(或LCU)。未经分裂的RQT的TU被称作叶TU。一般来说,除非以其它方式提及,否则本发明分别使用术语CU及TU来指叶CU及叶TU。
视频序列通常包含一系列图片。如本文所描述,术语“图片”与“帧”可以互换地使用。即,含有视频数据的图片可被称为视频帧或简称为“帧”。图片群组(GOP)一般包括一系列一或多个视频图片。GOP可包含GOP的标头、图片中的一或多者的标头或其它处的语法数据,其描述GOP中所包含的图片的数目。图片的每一切片可包含描述用于相应的切片的编码模式的切片语法数据。视频编码器20通常对个别视频切片内的视频块进行操作以便对视频数据进行编码。视频块可与CU内的译码节点相对应。视频块可具有固定或变化的大小,并且根据指定译码标准可在大小上有所不同。
作为一实例,HEVC支持各种PU大小的预测。假设特定CU的大小是2Nx2N,那么HEVC支持2Nx2N或NxN的PU大小的帧内预测,及2Nx2N、2NxN、Nx2N或NxN的对称PU大小的帧间预测。具有2Nx2N的大小的PU表示未划分CU,因为其与其驻留的CU为相同大小。换句话说,2Nx2N PU与其CU大小相同。HM还支持用于2NxnU、2NxnD、nLx2N及nRx2N的PU大小的帧间预测的不对称分割。在不对称分割中,不分割CU的一个方向,但是将另一方向分割成25%和75%。CU的对应于25%分区的部分由“n”继之以“上”、“下”、“左”或“右”的指示来指示。因而,举例来说,“2NxnU”是指水平地分割的2Nx2N CU,其中顶部为2Nx0.5N PU,且底部为2Nx1.5N PU。
在本发明中,“NxN”与“N乘N”可互换使用来指代在垂直和水平尺寸方面的视频块的像素尺寸,例如,16x16像素或16乘16像素。大体来说,16x16块将在垂直方向上具有16个像素(y=16),且在水平方向上具有16个像素(x=16)。同样,NxN块总体上在垂直方向上具有N个像素,并且在水平方向上具有N个像素,其中N表示非负整数值。块中的像素可布置成行和列。此外,块未必需要在水平方向上与在竖直方向上具有相同数目个像素。举例来说,块可包括NxM个像素,其中M未必等于N。
在使用CU的PU的帧内预测性或帧间预测性译码之后,视频编码器20可以计算CU的TU的残余数据。PU可包括描述在空间域(还称为像素域)中产生预测性像素数据的方法或模式的语法数据,并且TU可包括在对残余视频数据应用了变换(例如离散余弦变换(DCT)、整数变换、小波变换或概念上类似的变换)变换域中的系数。残余数据可对应于未经编码图片的像素与对应于PU的预测值之间的像素差。视频编码器20可以形成包含用于CU的残余数据的TU,并且接着变换TU以产生用于CU的变换系数。
在进行用于产生变换系数的任何变换之后,视频编码器20可执行变换系数的量化。量化大体上指代对变换系数进行量化以可能减少用以表示系数的数据的量从而提供进一步压缩的过程。量化过程可以减少与系数中的一些或全部相关联的位深度。例如,n位值可在量化期间被下舍入到m位值,其中n大于m。
在量化之后,视频编码器20可扫描变换系数,从包含经量化变换系数的二维矩阵产生一维向量。扫描可以经设计以将较高能量(并且因此较低频率)的系数放置在阵列的前面,并且将较低能量(并且因此较高频率)的系数放置在阵列的背面。
在一些实例中,视频编码器20可利用预定义扫描次序来扫描经量化的变换系数以产生可被熵编码的串行化向量。在其它实例中,视频编码器20可以执行自适应扫描。在扫描经量化的变换系数以形成一维向量之后,视频编码器20可以例如根据上下文自适应可变长度译码(CAVLC)、上下文自适应二进制算术译码(CABAC)、基于语法的上下文自适应二进制算术译码(SBAC)、概率区间分割熵(PIPE)译码或另一熵编码方法编码一维向量。视频编码器20还也可熵编码与经编码视频数据相关联的语法元素以供视频解码器30在解码视频数据时使用。
视频编码器20可例如在图片标头、块标头、切片标头或GOP标头中进一步将例如基于块的语法数据、基于图片的语法数据及基于GOP的语法数据等语法数据发送到视频解码器30。GOP语法数据可以描述相应GOP中的多个图片,并且图片语法数据可以指示用于对对应图片进行编码的编码/预测模式。
视频编码器20和/或视频解码器30可执行深度数据的图片内预测译码和深度数据的帧间预测译码。另外,根据本发明的实例,视频编码器20和/或视频解码器30可例如根据多种实例中的任一者使用SDC对从视频数据的深度帧内预测译码和/或视频数据的深度帧间预测译码产生的残余数据进行译码,如将描述。更具体来说,视频编码器20和/或视频解码器30可根据本发明的技术经配置以用信号表示在例如3D-HEVC的3D视频译码过程中以更统一方式使用SDC用于深度帧内预测和深度帧间预测。
本发明描述用于基于高级编解码器的3D视频译码的技术,例如高效率视频译码(HEVC)编解码器。本发明中描述的3D译码技术包含与多视图加深度视频译码过程中的深度视图的高级帧间译码相关的深度译码技术,例如当前在开发的对HEVC的3D-HEVC扩展。下文回顾与本发明相关的视频译码标准和HEVC技术。
HEVC标准的最近草案JCTVC-L1003(本杰明·布洛斯、韩吴京、基恩斯·拉尼尔·欧姆、加里·沙利文、王叶奎、托马斯·韦甘德)“高效率视频译码(HEVC)文本规范草案10(用于FDIS和最后呼叫)”(ITU-T SG 16WP 3和ISO/IEC JTC 1/SC 29/WG 11的视频译码联合合作小组(JCT-VC),瑞士日内瓦第12次会议,2013年1月14-23日(“HEVC WD10”))以全文引用的方式并入本文中且从以下链接可用:http://phenix.it-sudparis.eu/jct/doc_ end_user/documents/12_Geneva/wg11/JCTVC-L1003-v34.zip
3D-HEVC的最近草案在JCTVC-F1001-v1(格哈德技术公司,克里斯托弗·韦格纳,陈英和叶希洪)“3D-HEVC草案文本2”(ITU-T SG 16WP 3和ISO/IEC JTC 1/SC 29/WG11的3D视频译码扩展开发联合合作小组第6次会议:瑞士日内瓦,2013年10月25日-11月1日(“3D-HEVC”))中呈现,以全文引用的方式并入本文中,且从以下链接可用:http://phenix.it- sudparis.eu/jct2/doc_end_user/documents/6_Geneva/wg11/JCT3V-F1001-v1.zip
在HEVC中,假定译码单元(CU)的大小是2Nx2N,视频编码器20和视频解码器30可支持用于帧内预测的2Nx2N或NxN的各种预测单元(PU)大小,以及用于帧间预测的2Nx2N、2NxN、Nx2N、NxN或类似的对称PU大小。视频编码器及视频解码器还可支持用于帧间预测的2NxnU、2NxnD、nLx2N及nRx2N的PU大小的不对称分割。
对于如3D-HEVC中提供的深度译码,视频编码器和视频解码器可经配置以支持用于帧内预测的多种不同深度译码分割模式,包含使用非矩形分区的模式。具有非矩形分区的深度译码的实例包含基于楔波分区的深度译码、基于轮廓分区的深度译码以及基于区边界链分区的译码。用于例如楔波分区或轮廓分区(作为实例)等非矩形分区的基于分区的帧内译码的技术可与用于由帧内预测译码产生的残余信息的译码的简化深度译码(SDC)模式结合执行。另外,对于在HEVC中的常规帧内/帧间模式,所述技术也可与用于从深度数据的帧内预测译码或帧间预测译码产生的残余信息的译码的SDC模式结合而执行。
使用3D视频译码技术译码的视频数据可经再现且显示以产生三维效应。作为一个实例,不同视图的两个图像(也就是说,对应于具有稍微不同水平位置的两个相机视角)可大体上同时显示以使得一个图像由观察者的左眼看见,且另一图像由观察者的右眼看见。
3D效果可使用(例如)立体显示器或自动立体显示器实现。立体显示器可结合相应地对所述两个图像进行过滤的护目镜而使用。举例来说,无源眼镜可使用偏光透镜或不同有色透镜或其它光学过滤技术对图像进行过滤,以确保恰当的眼睛看见恰当的图像。作为另一实例,有源眼镜可与立体显示器协调地快速遮挡交替的透镜,所述立体显示器可在显示左眼图像与右眼图像之间交替。自动立体显示器以不需要眼镜的方式显示所述两个图像。举例来说,自动立体显示器可包含经配置以致使每一图像投影到观察者的适当眼睛中的镜或棱镜。
本发明的技术涉及用于通过对深度数据进行译码以支持3D视频来对3D视频数据进行译码的技术。一般来说,术语“纹理”用以描述图像的明度(即,亮度或“明度”)值及图像的色度(即,色彩或“色度”)值。在一些实例中,纹理图像可包含一组明度数据(Y)和用于蓝色调(Cb)和红色调(Cr)的两组色度数据。在例如4:2:2或4:2:0的某些色度格式中,相对于明度数据对色度数据下取样。即,色度像素的空间分辨率可低于对应明度像素的空间分辨率,例如为明度分辨率的二分之一或四分之一。
深度数据一般描述对应纹理数据的深度值。举例来说,深度图像可包含深度像素(或深度值)的集合,其各自针对例如视图的纹理分量中的对应纹理数据描述例如视图的深度分量中的深度。每一像素可具有一或多个纹理值(例如,明度和色度),且还可具有一或多个深度值。纹理图片和深度图可以(但不需要)具有相同空间分辨率。举例来说,深度图可包含比对应纹理图片多或少的像素。深度数据可用以确定对应纹理数据的水平视差,且在一些情况下,也可以使用垂直视差。
接收纹理和深度数据的装置可显示一个视图(例如,左眼视图)的第一纹理图像,且通过使第一图像的像素值偏移基于深度值所确定的水平视差值而使用深度数据修改第一纹理图像以产生另一视图(例如,右眼视图)的第二纹理图像。一般来说,水平视差(或简称“视差”)描述第一视图中的像素与右视图中的对应像素的水平空间偏移,其中所述两个像素对应于如在所述两个视图中所表示的相同对象的相同部分。
在又其它实例中,可针对垂直于图像平面的z维度中的像素定义深度数据,使得与给定像素相关联的深度是相对于针对所述图像所定义的零视差平面而定义。此深度可用以产生用于显示像素的水平视差,使得所述像素取决于所述像素相对于零视差平面的z维度深度值而对于左眼与右眼以不同方式显示。零视差平面可针对视频序列的不同部分改变,且也可改变相对于零视差平面的深度量。
可针对左眼与右眼类似地定义位于零视差平面上的像素。位于零视差平面之前的像素可对于左眼与右眼显示于不同位置中(例如,具有水平视差),以便产生像素似乎是从垂直于图像平面的z方向上的图像出来的感觉。位于零视差平面之后的像素可显示为具有轻微模糊以轻微地感觉到深度,或可对于左眼与右眼显示于不同位置中(例如,具有与位于零视差平面之前的像素相反的水平视差)。许多其它技术也可用于传达或定义图像的深度数据。
二维视频数据大体上经译码为离散图片的序列,所述离散图片中的每一者对应于特定时间实例。也就是说,每一图片具有相对于所述序列中的其它图像的重放时间的相关联重放时间。这些图片可视为纹理图片或纹理图像。在基于深度的3D视频译码中,序列中的每一纹理图片还可对应于深度图。也就是说,对应于纹理图片的深度图描述对应纹理图片的深度数据。多视图视频数据可包含各种不同视图的数据,其中每一视图可包含纹理分量和对应深度分量的相应序列。
图片大体上对应于特定时间实例。视频数据可使用存取单元序列来表示,其中每一存取单元包含对应于特定时间例项的所有数据。因此,举例来说,对于多视图视频数据加深度译码,来自用于共同时间例项的每一视图的纹理图像加所述纹理图像中的每一者的深度图可全部包含在特定存取单元内。因此,存取单元可包含多个视图,其中每一视图可包含对应于纹理图像的纹理分量的数据以及对应于深度图的深度分量的数据。
每一存取单元可含有多个视图分量或图片。特定视图的视图分量与唯一视图id或视图次序索引相关联,以使得不同视图的视图分量与不同视图id或视图次序索引相关联。视图分量可包含纹理视图分量以及深度视图分量。同一视图中的纹理和深度视图分量可具有不同层id。纹理视图分量可经译码为一或多个纹理切片,而深度视图分量可经译码为一或多个深度切片。多视图加深度产生多种译码可能性,例如图片内、图片间、视图内、视图间、运动预测及类似物。
以此方式,3D视频数据可使用多视图视频加深度格式来表示,其中俘获或产生的视图包含与对应深度图相关联的纹理分量。此外,在3D视频译码中,纹理和深度图可经译码且多路复用到3D视频位流中。深度图可经译码为灰度级图像,其中深度图的“明度”样本(即,像素)表示深度值。
一般来说,深度数据的块(例如对应于像素的深度图的样本的块)可被称为深度块。深度值可被称为与深度样本相关联的明度值。即,深度图可大体上被视为单色纹理图片,换句话说,包含明度值且不包含色度值的纹理图片。在任何情况下,常规帧内和帧间译码方法可应用于深度图译码。
深度图通常特征在于尖锐边缘和恒定区域,且深度图中的边缘通常呈现与对应纹理数据的强相关。归因于纹理及对应深度之间的不同统计及相关性,因此已经基于2D视频编解码器设计用于深度图的不同译码方案。
下文回顾与本发明相关的HEVC技术。视频译码标准的实例包含ITU-T H.261、ISO/IEC MPEG-1Visual、ITU-T H.262或ISO/IEC MPEG-2Visual、ITU-T H.263、ISO/IEC MPEG-4Visual及ITU-T H.264(也称为ISO/IEC MPEG-4AVC),包含其可缩放视频译码(SVC)及多视图视频译码(MVC)扩展。MVC的最新联合草案描述于2010年3月的“用于通用视听服务的高级视频译码”(ITU-T建议H.264)中。
此外,存在一种新的且即将到来的视频译码标准,即上文所提及的高效率视频译码(HEVC),其由ITU-T视频译码专家组(VCEG)和ISO/IEC运动图片专家组(MPEG)的视频译码联合合作小组(JCT-VC)进行开发。
图2是说明在HEVC中使用的帧内预测模式的图。图2大体上说明与可用于HEVC中的帧内译码的各种方向性帧内预测模式相关联的预测方向。在当前HEVC中,对于每一预测单元(PU)的明度分量,以33个角度预测模式(从2到34编索引)、DC模式(以1编索引)和平面模式(以0编索引)利用帧内预测方法,如图2中所示。
在平面模式中(以0编索引),使用所谓的“平面”功能执行预测以确定视频数据块(例如,PU)内的像素中的每一者的预测符值。根据DC模式(以1编索引),使用所述块内的像素值的平均化执行预测以确定所述块内的像素中的每一者的预测符值。根据方向性预测模式,基于相邻块的沿着特定方向(如由模式指示)的经重构像素而执行预测。一般来说,图2中所示的箭头的尾端表示从其检索值的相邻像素中的相对一者,而箭头的头部表示所检索值沿着其传播以形成预测性块的方向。
对于HEVC帧内预测模式,视频编码器20和/或视频解码器30例如通过使用用于模式2到34的PU的相邻样本,使用上文所论述的各种模式产生PU中的每一像素的像素特定预测符值。视频编码器20基于块的像素的实际深度值与预测符值之间的差确定视频块的残余值,且将残余值提供到视频解码器30。根据HEVC WD10,视频编码器20变换残余值且量化变换系数,且还可对经量化变换系数进行熵编码。视频解码器30(例如,在熵解码、逆量化和逆变换之后)通过将残余值添加到预测符值而确定块的像素的经重构值。HEVC WD10中指定关于HEVC帧内预测模式的进一步细节。
在JCT-3V中,正开发两个HEVC扩展:多视图扩展(MV-HEVC)和3D视频扩展(3D-HEVC)。用于3D-HEVC的参考软件“3D-HTM版本8.2”的最近版本以全文引用的方式并入本文中且可从以下链接下载:
[3D-HTM版本8.2-dev0]:https://hevc.hhi.fraunhofer.de/svn/svn_ 3DVCSoftware/branches/HTM-8.2-dev0/
参考软件的新版本3D-HTM 9.0将在3D-HTM版本8.2之上呈现且不久将可用。
最新工作草案(文档编号:F1001)从以下可用:
http://phenix.it-sudparis.eu/jct2/doc_end_user/documents/6_Geneva/ wg11/JCT3V-F1001-v1.zip
在3D-HEVC中,如上文参考的3D-HEVC草案中界定,每一存取单元含有多个图片,且每一视图中的图片中的每一者具有唯一视图识别(id)或视图次序索引。然而,同一视图的深度图片和纹理图片可具有不同层id。
现将描述3D视频译码中的深度帧内译码。3D视频数据是使用多视图视频加深度格式来表示,其中俘获的视图(纹理)与对应深度图相关联。在3D视频译码中,译码纹理及深度图且将其多路复用到3D视频位流中。将深度图译码为灰度视频,其中明度样本表示深度值,且可将常规的帧内及帧间译码方法应用于深度图译码。
如上文所论述,深度图的特征可在于锐边缘和恒定面积。由于深度图样本的不同统计数据,基于2D视频编解码器为深度图设计不同译码方案。
在3D-HEVC中,利用与HEVC中相同的帧内预测模式的定义。即,在3D-HEVC中使用的帧内模式包含HEVC的帧内模式。并且,在3D-HEVC中,连同HEVC帧内预测模式一起引入深度模型化模式(DMM)以译码深度切片的帧内预测单元。为了深度图中的锐边缘的较好表示,当前HTM(3D-HTM版本8.2)应用DMM方法用于深度图的帧内译码。DMM中存在两种新的帧内模式。在两种模式中,将深度块分割成通过DMM模式指定的两个区,其中每一区由恒定值表示。
DMM模式可显式地用信号表示(DMM模式1),或通过位于同一地点的纹理块预测(DMM模式4)。存在在DMM中定义的两种类型的分割模型,包含楔波分割和轮廓分割。图3是说明用于对像素样本的块进行译码的楔波分区模式的实例的图。图4是说明用于对像素样本的块进行译码的轮廓分区模式的实例的图。
对于楔波分区,深度块由直线分割成两个区,如图3中所说明。对于轮廓分割,可将深度块分割成两个不规则区,如图4中所示。轮廓分割比楔波分割更灵活,但难以显式地用信号表示。在DMM模式4中,使用位于同一地点的纹理块的经重构的明度样本隐式地导出轮廓分割模式。
作为一个实例,图3提供用于8x8块40的楔波模式的说明。对于楔波分区,深度块(例如,PU)由直线46分割成两个区42、44,其中开始点48位于(Xs,Ys)且结束点50位于(Xe,Ye),如图3中所说明,其中两个区42、44也分别标记有P0和P1。块40中的每一模式由大小uB×vB二进制数位的阵列组成,所述数位标记对应样本是否属于区P0或P1,其中uB和vB分别表示当前PU的水平和垂直大小。区P0和P1在图3中分别由白色和阴影样本表示。在编码和解码两者的开始初始化楔波模式。
如图4的实例中所示,例如深度块60的深度块可使用轮廓分割分割成三个不规则形状的区62、64A和64B,其中分别将区62标记为P0且将两个区64A和64B共同标记为P1。虽然区64A中的像素不紧邻于区64B中的像素,但区64A和64B可经界定以形成一个单个区,以用于预测深度块60的PU的目的。轮廓分割可比楔波分割更灵活,但可相对更难以用信号表示。在DMM模式4中,在3D-HEVC的情况下,轮廓分割模式是使用位于同一地点的纹理块的经重构明度样本隐式地导出。
参考图3和4,深度块40和60内的每一个别正方形分别表示深度块40和60的相应个别像素。正方形内的数字值表示对应像素是否属于区42(图3的实例中的值“0”)或区44(图3的实例中的值“1”)。图3中还使用阴影来指示像素属于区42(白色正方形)还是区44(灰色阴影正方形)。
如上文所论述,每一模式(即,楔波和轮廓)可由大小uB×vB二进制数位的阵列界定,所述数位标记对应样本(即,像素)是否属于区P0或P1(其中P0对应于图3中的区42和图4中的区62,且P1对应于图3中的区44和图4中的区64A、64B),其中uB和vB分别表示当前PU的水平和垂直大小。在图3和图4的实例中,PU分别对应于块40和60。例如视频编码器20和视频解码器30的视频译码器可在译码的开始、例如编码的开始或解码的开始初始化楔波模式。
对于HEVC帧内预测模式,通过如HEVC WD10中的子条款8.4.2中指定使用PU的相邻样本针对PU中的每一像素产生像素特定帧内预测符值。
对于其它深度帧内模式,通过使用PU的多达两个相邻样本针对所述PU内的每一分区计算分区特定的DC预测符。假设bPattern[x][y]为PU的分区模式,其中x=0..N-1,y=0..N-1且N是PU的宽度。bPattern[x][y]指示像素(x,y)属于哪一分区且bPattern[x][y]可等于0或1。假设BitDepth为深度样本的位深度且假设RecSample[x][y]为PU的经重构相邻样本,其中x=-1且y=0..N-1(对应于PU的左边相邻像素)或y=-1,x=0..N-1(对应于PU的上方相邻像素)。随后,如下导出分区X的DC预测符,即DCPred[X],其中X=0或1:
●设定bT=(bPattern[0][0]!=bPattern[N-1][0])?1:0
●设定bL=(bPattern[0][0]!=bPattern[0][N-1])?1:0
●如果bT等于bL
-DCPred[X]=(RecSample[-1][0]+RecSample[0][-1])>>1
-DCPred[1-X]=bL?(RecSample[-1][N-1]+RecSample[N-1][-1])>>1:2位深度-1
●否则
-DCPred[X]=bL?RecSample[(N-1)>>1][-1]:RecSample[-1][(N-1)>>1]
-DCPred[1-X]=bL?RecSample[-1][N-1]:RecSample[N-1][-1]
如上文所论述,深度查找表(DLT)将深度索引映射到深度值。通过在对全视频序列进行编码之前分析第一帧内周期内的帧可构造DLT。在3D-HEVC的当前设计中,按升序分拣全部有效的深度值且以递增的索引插入到DLT。
DLT是任选的译码工具。在当前HTM中,如果在分析步骤从0到MAX_DEPTH_VALUE(例如,用于8位深度样本的255)的超过二分之一的值在原始深度图中出现,那么编码器20将不使用DLT。否则,将在序列参数集(SPS)和/或视频参数集(VPS)中对DLT进行译码。为了对DLT进行译码,首先以指数-哥伦布码对有效深度值的数目进行译码。随后,也以指数-哥伦布码对每一有效深度值进行译码。
编码器20从待译码的输入视频序列读取预定义数目的帧,且扫描全部样本是否有可用深度图值。在此过程期间,编码器20基于原始未经压缩深度图产生将深度值映射到有效深度值的映射表。
编码器20使用分析深度图D_t的以下算法导出深度查找表Idx2Depth(.)、索引查找表Depth2Idx(.)、深度映射表M(.)和有效深度值d_valid的数目:
1.初始化
●针对全部深度值d,布尔型向量B(d)=假
●索引计数器i=0
2.针对多个时间实例t处理Dt中的每一像素位置p:
●设定(B(Dt(p))=真以标记有效深度值
3.对B(d)中的真值的数目计数→d有效
4.对于B(d)==真的每一d:
●设定Idx2Depth(i)=d
●设定M(d)=d
●设定Depth2Idx(d)=i
●i=i+1
5.对于B(d)==假的每一d:
●找到d'=arg min|d-d'|且B(d')==真
●设定M(d)=d'
●设定Depth2Idx(d)=Depth2Idx(d')。
从索引Idx返回到深度值d的映射如下:d=Idx2Depth[Idx]。从深度值d到索引Idx的映射如下:Idx=Depth2Idx[d]。
帧内SDC模式(其也可被称作简化深度译码、简化残余译码或逐片段DC译码)在3D-HEVC连同HEVC帧内预测模式、DMM模式和链译码模式一起引入,以对深度切片的帧内PU进行译码。在当前3D-HEVC中,SDC仅应用于2Nx2N PU分区大小。并非对经量化变换系数进行译码,SDC模式表示具有以下两个类型的信息的深度块:
1.当前深度块的分区类型,包含:
a.DMM模式1(2个分区)
b.平面(1个分区)
2.对于每一分区,在位流中用信号表示残余值(像素域中)。
在SDC中定义两个子模式,包含SDC模式1和SDC模式2,其分别对应于平面和DMM模式1的分区类型。
在SDC中使用简化残余译码。在简化残余译码中,如上文所描述,针对PU的每一分区用信号表示一个DC残余值,且不应用变换或量化。
如上文所论述,为了用信号表示表示每一分区的DC残余值的信息,可应用两个方法:
1.直接对通过从当前PU中的当前分区的DC值(即,平均值,由Aver表示)减去通过相邻样本产生的由Pred表示的预测符而计算的每一分区的DC残余值进行译码。
2.当发射DLT时,并非对DC残余值进行译码,对从索引查找表映射的Aver和Pred的索引差进行译码。通过从Aver的索引减去Pred的索引而计算所述索引差。在解码器侧,基于DLT将经解码索引差和Pred的索引的总和映射回到深度值。
除类似于纹理译码的视图间样本预测和视图间运动预测之外,3D-HEVC还采用新工具,即简化帧间模式深度译码(SIDC)。
SIDC将SDC的基本想法延伸到帧间模式深度译码。因此,在以下上下文中可将SIDC简称为“帧间SDC”。然而,在许多情况下,贯穿本发明SDC将一般用以指代应用SDC用于帧内或帧间译码。帧间SDC提供替代的残余译码方法,编码器20通过所述方法针对PU仅编码一个DC残余值。编码器20和/或视频解码器30跳过变换和量化,且编码器不需要产生类似于变换树的额外残余。在CU层级在一般译码单元参数中由编码器20用信号表示且由解码器30剖析是否使用了帧间SDC。对于经帧间SDC译码的CU,针对每一PU用信号表示一个DC残余值且将其用作所述PU中的全部样本的残余。举例来说,连同深度帧内或帧间模式信令一起,SDC信令可在CU层级由编码器20执行且由解码器30接收。然而,当CU是以SDC模式译码时,CU可分裂成若干PU,且每一PU可进一步分裂成分区,例如楔波分区或轮廓分区。SDC残余数据可包含针对每一PU内的每一分区用信号表示的DC残余值。因此,在SDC模式中,PU的每一分区可具有DC残余值。
为了减小用于帧间SDC模式的信令位,视频编码器20和/或视频解码器30可将帧间SDC仅应用于非跳过CU。此外,为了避免帧间SDC模式与跳过模式之间的可能重叠,视频编码器20和/或视频解码器30仅当CU内的每一PU的DC残余非零时应用帧间SDC模式。PU的DC残余可被计算为所述PU的分区内的全部样本的原始样本值与预测样本值之间的差的平均。因为仅用信号表示原始块与预测块的分区之间的DC差,所以为了补偿AC差,采用平均移除运动估计用于深度帧间模式译码。
图5是说明可经配置以实施本发明的技术的实例视频编码器20的框图。图5是出于解释的目的而提供,且不应被视为将技术限制为本发明中所大致例示和描述者。出于解释的目的,本发明在HEVC译码且更确切地说3D-HEVC的上下文中描述视频编码器20。然而,本发明的技术可以适用于其它译码标准或方法。
在图5的实例中,视频编码器20包含预测处理单元100、残余产生单元102、变换处理单元104、量化单元106、逆量化单元108、逆变换处理单元110、重构单元112、滤波器单元114、经解码图片缓冲器116及熵编码单元118。预测处理单元100包含帧间预测处理单元120及帧内预测处理单元126。帧间预测处理单元120包含运动估计(ME)单元122及运动补偿(MC)单元124。为便于说明,将预测处理单元100的组件说明且描述为执行纹理编码和深度编码两者。在一些实例中,纹理和深度编码可由预测处理单元100的相同组件或预测处理单元100内的不同组件执行。举例来说,在一些实施方案中可提供单独的纹理和深度编码器。并且,可提供多个纹理和深度编码器以对多个视图进行编码,例如用于多视图加深度译码。在任一情况下,预测处理单元100可经配置以对纹理数据和深度数据进行帧内或帧间编码,作为例如3D-HEVC过程的3D译码过程的部分。因此,预测处理单元100可大体上根据3D-HEVC操作,经受本发明中所描述的修改和/或添加,例如与用于帧内和帧间预测模式的SDC的信令相关的那些修改和/或添加。预测处理单元100可使用如本发明中所描述的SDC或非SDC残余译码技术产生和编码用于经帧内编码或经帧间编码深度数据的残余数据。当使用SDC时,视频编码器20可编码且用信号表示指示使用SDC用于深度帧内和深度帧间预测模式两者的语法元素。在其它实例中,视频编码器20可包含更多、更少或不同功能组件。
视频编码器20可以接收视频数据。视频编码器20可对视频数据的图片的切片中每一CTU进行编码。CTU中的每一者可以与图片的大小相等的明度译码树块(CTB)以及对应的CTB相关联。作为对CTU进行编码的一部分,预测处理单元100可以执行四叉树分割以将CTU的CTB划分为逐渐更小的块。这些更小的块可以是CU的译码块。举例来说,预测处理单元100可将与CTU相关联的CTB分割成四个大小相等的子块,将子块中的一或多者分割成四个大小相等的子子块等。
视频编码器20可对CTU的CU进行编码以产生CU的经编码表示(即,经译码的CU)。作为对CU进行编码的部分,预测处理单元100可在CU的一或多个PU当中分割与CU相关联的译码块。因此,每一PU可与明度预测块和对应的色度预测块相关联。
视频编码器20和视频解码器30可支持具有各种大小的PU。如上文所指示,CU的大小可指CU的明度译码块的大小并且PU的大小可指PU的明度预测块的大小。假定特定CU的大小是2Nx2N,那么视频编码器20和视频解码器30可支持用于帧内预测的2Nx2N或NxN的PU大小,以及用于帧间预测的2Nx2N、2NxN、Nx2N、NxN或类似大小的对称PU大小。视频编码器20以及视频解码器30还可以支持用于帧间预测的2NxnU、2NxnD、nLx2N以及nRx2N的PU大小的非对称分割。根据本发明的方面,视频编码器20及视频解码器30还支持用于深度帧间译码的PU的非矩形分区。
帧间预测处理单元120可通过对CU的每个PU执行帧间预测来产生用于PU的预测性数据。用于PU的预测性数据可以包含PU的预测性样本块以及用于PU的运动信息。帧间预测处理单元120可根据PU是在I切片、P切片还是B切片中而对CU的PU执行不同操作。在I切片中,所有PU都是经帧内预测。因此,如果PU是在I切片中,则帧间预测处理单元120并不对PU执行帧间预测。因此,对于在I模式中编码的块,经预测的块是使用根据同一帧内经先前编码的相邻块进行的空间预测而形成。
如果PU在P切片中,那么运动估计(ME)单元122可针对PU的参考区搜索参考图片列表(例如,“RefPicList0”)中的参考图片。参考图片可存储在经解码图片缓冲器116中。用于PU的参考区可以是在参考图片内含有最紧密地对应于PU的样本块的样本块的区。运动估计(ME)单元122可产生指示含有PU的参考区域的参考图片的RefPicList0中的位置的参考索引。另外,运动估计(ME)单元122可以产生指示PU的译码块与相关联于参考区域的参考位置之间的空间移位的MV。举例来说,MV可为用以提供从当前经解码的图片中的坐标到参考图片中的坐标的偏移的二维向量。运动估计(ME)单元122可以将参考索引以及MV输出为PU的运动信息。基于由PU的运动向量指示的参考位置处的实际样本或经内插样本,运动补偿(MC)单元124可以产生PU的预测性样本块。
如果PU是在B切片中,则运动估计单元122可以对PU执行单向预测或双向预测。为了对PU执行单向预测,运动估计单元122可以搜索RefPicList0的参考图片,或用于PU的参考区域的第二参考图片列表(“RefPicList1”)。运动估计(ME)单元122可输出以下各项作为PU的运动信息:指示含有参考区的参考图片在RefPicList0或RefPicList1中的位置的参考索引,指示PU的样本块与和参考区相关联的参考位置之间的空间位移的MV,以及指示参考图片是在RefPicList0还是RefPicList1中的一或多个预测方向指示符。运动补偿(MC)单元124可以至少部分基于由PU的运动向量指示的参考区域处的实际样本或经内插样本来产生PU的预测性样本块。
为了对PU执行双向帧间预测,运动估计单元122可以在RefPicList0中的参考图片内搜索用于PU的参考区,并且还可以在RefPicList1中的参考图片内搜索用于PU的另一参考区。运动估计(ME)单元122可以产生指示含有参考区域的参考图片的RefPicList0以及RefPicList1中的位置的参考索引。另外,运动估计(ME)单元122可以产生指示与参考区相关联的参考位置与PU的样本块之间的空间移位的MV。PU的运动信息可包含PU的参考索引及MV。运动补偿(MC)单元124可以至少部分基于由PU的运动向量指示的参考区域处的实际样本或经内插样本来产生PU的预测性样本块。
帧内预测处理单元126可通过对PU执行帧内预测产生PU的预测性数据。用于PU的预测性数据可以包含用于PU的预测性样本块以及各种语法元素。帧内预测处理单元126可对I切片、P切片及B切片中的PU执行帧内预测。
为了对PU执行帧内预测,帧内预测处理单元126可使用多个帧内预测模式以产生PU的多个预测性数据集合,且随后例如使用速率失真优化技术选择帧内预测模式中产生可接受或最佳译码性能的一者。为了使用帧内预测模式以产生用于PU的一组预测性数据,帧内预测处理单元126可以在与帧内预测模式相关联的方向上将样本从相邻PU的样本块延伸跨越PU的样本块。假定对于PU、CU和CTU采用从左到右、从上到下的编码次序,相邻PU可在所述PU的上方、右上方、左上方或左方。帧内预测处理单元126可使用各种数目的帧内预测模式,例如,33个方向性帧内预测模式。在一些实例中,帧内预测模式的数目可以取决于与PU相关联的区域的大小。
预测处理单元100可从PU的由帧间预测处理单元120产生的预测性数据或PU的由帧内预测处理单元126产生的预测性数据当中选择CU的PU的预测性数据。在一些实例中,预测处理单元100基于预测性数据集合的速率/失真量度选择CU的PU的预测性数据。所选预测性数据的预测性样本块在本文中可被称为所选预测性样本块。
残余产生单元102可基于CU的明度、Cb及Cr译码块以及CU的PU的所选预测性明度、Cb及Cr块产生CU的明度、Cb及Cr残余块。举例来说,残余产生单元102可产生CU的残余块以使得残余块中的每一样本具有等于CU的译码块中的样本与CU的PU的对应选定预测性样本块中的对应样本之间的差的值。
变换处理单元104可以执行四叉树分割以将与CU相关联的残余块分割成与CU的TU相关联的变换块。因此,TU可以与明度变换块以及两个色度变换块相关联。CU的TU的明度变换块以及色度变换块的大小和位置可以或可不基于CU的PU的预测块的大小和位置。被称为“残余四叉树”(RQT)的四叉树结构可以包含与区域中的每一者相关联的节点。CU的TU可以对应于RQT的叶节点。
变换处理单元104可以通过将一或多个变换应用到TU的变换块而产生用于CU的每一TU的变换系数块。变换处理单元104可将各种变换应用到与TU相关联的变换块。例如,变换处理单元104可以将离散余弦变换(DCT)、定向变换或概念上类似的变换应用于变换块。在一些实例中,变换处理单元104并不将变换应用于变换块。在此类实例中,变换块可以处理为变换系数块。
量化单元106可量化系数块中的变换系数。量化过程可减少与变换系数中的一些或全部相关联的位深度。举例来说,n位变换系数可在量化期间舍入到m位变换系数,其中n大于m。量化单元106可基于与CU相关联的量化参数(QP)值量化与CU的TU相关联的系数块。视频编码器20可以通过调整与CU相关联的QP值来调整应用于与CU相关联的系数块的量化的程度。量化可能使得信息丢失,因此经量化的变换系数可以具有比原始变换系数更低的精度。
逆量化单元108以及逆变换处理单元110可以分别将逆量化以及逆变换应用于系数块,以从系数块重构残余块。重构单元112可以将经重构的残余块添加到来自由预测处理单元100产生的一或多个预测性样本块的对应样本,以产生与TU相关联的经重构变换块。通过以此方式重构CU的每一TU的变换块,视频编码器20可重构CU的译码块。
滤波器单元114可执行一或多个解块操作以减小与CU相关联的译码块中的成块假象。经解码图片缓冲器116可以在滤波器单元114对经重构的译码块执行一或多个解块操作之后存储经重构的译码块。帧间预测单元120可使用含有重构译码块的参考图片来对其它图片的PU执行帧间预测。另外,帧内预测处理单元126可使用经解码图片缓冲器116中的经重构的译码块以对处于与CU相同的图片中的其它PU执行帧内预测。
熵编码单元118可以从视频编码器20的其它功能组件接收数据。例如,熵编码单元118可以从量化单元106接收系数块,并且可以从预测处理单元100接收语法元素。熵编码单元118可以对数据执行一或多个熵编码操作以产生经熵编码的数据。例如,熵编码单元118可以对数据执行上下文自适应可变长度译码(CAVLC)操作、CABAC操作、可变到可变(V2V)长度译码操作、基于语法的上下文自适应二进制算术译码(SBAC)操作、概率区间分割熵(PIPE)译码操作、指数哥伦布编码操作或另一类型的熵编码操作。视频编码器20可以输出包含由熵编码单元118产生的经熵编码的数据的位流。例如,位流可以包含表示用于CU的RQT的数据。
视频编码器20是经配置以如本文中所描述执行用于深度帧内预测或深度帧间预测的简化残余译码的技术中的任一者的视频编码器的实例。根据本发明的一或多种技术,视频编码器20内的一或多个单元可执行本文中描述的一或多种技术作为视频编码过程的部分。类似地,视频编码器20可使用本发明的技术中的任一者执行视频解码过程以再生用作用于随后经译码视频数据的参考的视频数据。如上文所论述,视频解码过程中可利用逆量化单元108、逆变换处理单元110和重构单元112,以及视频编码器20的其它元件。视频编码器20内也可以包含额外3D处理组件。
举例来说,预测处理单元100且更确切地说帧间预测处理单元120和帧内预测处理单元126可如本文中所描述分别执行用于深度块的深度帧间预测和深度帧内预测编码的SDC模式。帧间预测处理单元120和帧内预测处理单元126在使用时可各自确定深度块(例如,PU)或其每一分区的DC残余值。预测处理单元120可以统一方式产生指示SDC用于当前PU以用于深度帧内预测和深度帧间预测的语法元素和/或语法结构,如本发明的各种实例中所描述。
帧内预测处理单元126或帧间预测处理单元120可将深度块的DC残余值连同其它语法信息一起提供到熵编码单元118,例如如图5中的虚线所说明。帧内预测处理单元126或帧间预测处理单元120可将DC残余值提供到熵编码单元118而所述值无需由变换处理单元104和量化单元106处理。在其它实例中,量化单元106可在熵编码单元118的熵译码之前量化DC残余值。所述语法信息可包含本文与本发明的技术结合针对信令所描述的各种信息、旗标或其它语法元素。
举例来说,语法信息可(作为实例)指示SDC模式是否针对深度块执行、基于分区(例如,3D-HEVC)或非基于分区(HEVC)的模式是否用以确定DC残余值,以及哪一深度帧内预测模式用以确定DC残余值。另外,所述语法信息可以统一方式指示SDC模式是否使用CU,而与帧内预测或帧间预测是否用于CU无关,即,视具体情况用于深度帧内预测或深度帧间预测。根据SDC模式,视频编码器20经配置以:基于深度帧内预测模式或深度帧间预测模式中的所指示一者而确定深度块(例如,CU的PU的分区)的至少一个DC残余值,其中所述DC残余值表示深度块的多个像素的残余值;且将表示所述DC残余值的DC残余值或信息编码到位流中。
视频编码器20是包括存储视频数据的存储器以及经配置以执行方法的一或多个处理器的视频编码器的实例,所述方法包括:当深度CU经帧内预测时在所述视频编码器中执行帧内预测以产生预测深度CU;当所述深度CU经帧间预测时在所述视频编码器中执行帧间预测以产生预测深度CU;当使用简化深度译码(SDC)模式时,对于所述深度CU的预测单元(PU)的每一分区,在所述视频编码器中产生表示所述深度CU的至少一个DC残余值的信息,其中所述至少一个DC残余值表示所述深度CU的PU的分区与预测深度CU的对应分区之间的像素差;当使用SDC模式时在视频解码器中产生指示SDC模式用于视频数据的深度译码单元(CU)的帧内预测和帧间预测两者的语法元素;以及基于表示所述至少一个DC残余值和所述语法元素的信息在所述视频编码器中对所述深度CU进行编码。
视频编码器20还是包括存储视频数据的存储器以及经配置以执行方法的一或多个处理器的视频编码器的实例,所述方法包括:当视频数据的深度译码单元(CU)经帧内预测时在所述视频编码器中执行帧内预测以产生预测深度CU;当所述深度CU经帧间预测时在所述视频编码器中执行帧间预测以产生预测深度CU;当使用简化深度译码(SDC)模式时在视频编码中对包括指示表示所述深度CU的预测单元(PU)的分区的至少一个DC残余值的信息的一或多个语法元素的语法结构进行译码,其中所述语法结构的语法元素对于帧内预测和帧间预测是相同的;以及基于表示所述至少一个DC残余值的信息而在视频编码器中编码所述深度CU。
视频编码器20还是包括存储视频数据的存储器以及经配置以执行方法的一或多个处理器的视频编码器的实例,所述方法包括:在视频编码器中对指示简化深度译码(SDC)模式是否针对经译码视频数据的整个序列的深度译码单元(CU)经启用的语法元素进行编码;对指示所述SDC模式是否用于所述序列的深度CU中的一者的帧内预测和帧间预测两者的第二语法元素进行编码;当所述序列的深度CU中的一者经帧内预测时,在视频编码器中执行帧内预测以产生预测深度CU;当所述序列的深度CU中的一者经帧间预测时,在视频编码器执行帧间预测以产生预测深度CU;以及当所述第二语法元素指示使用SDC模式时,对表示所述序列的深度CU中的所述一者的预测单元(PU)的分区的至少一个DC残余值的信息进行编码。
图6是说明经配置以执行本发明的技术的实例视频解码器30的框图。图6是出于解释的目的而提供,且不应被视为将技术限制为本发明中所大致例示及描述者。出于解释的目的,本发明在HEVC译码并且确切地说3D-HEVC译码的上下文中描述视频解码器30。然而,本发明的技术可适用于其它3D视频译码标准或方法。
在图6的实例中,视频解码器30包含熵解码单元150、预测处理单元152、逆量化单元154、逆变换处理单元156、重构单元158、滤波器单元160及经解码图片缓冲器162。预测处理单元152包含运动补偿(MC)单元164和帧内预测处理单元166。为便于说明,将预测处理单元152的组件说明且描述为执行纹理解码和深度解码两者。在一些实例中,纹理和深度解码可由预测处理单元152的相同组件或预测处理单元152内的不同组件执行。举例来说,在一些实施方案中可提供单独的纹理和深度解码器。并且,可提供多个纹理和深度解码器以对多个视图进行解码,例如用于多视图加深度译码。在任一情况下,预测处理单元152可经配置以对纹理数据和深度数据进行帧内或帧间解码,作为例如3D-HEVC过程的3D译码过程的部分。因此,预测处理单元152可大体上根据3D-HEVC操作,经受本发明中所描述的修改和/或添加,例如与用于帧内和帧间预测模式的SDC的信令相关的那些修改和/或添加。预测处理单元152可使用如本发明中所描述的SDC或非SDC残余译码技术从经帧内解码或经帧间解码的深度数据的经编码视频位流获得残余数据,且使用经帧内预测或经帧间预测深度数据和所述残余数据重构CU。当使用SDC时,视频解码器30可对指示使用SDC用于深度帧内和深度帧间预测模式两者的语法元素进行解码。在其它实例中,视频解码器30可包含较多、较少或不同的功能组件。
视频解码器30可接收位流。熵解码单元150可以剖析位流以对来自位流的语法元素进行解码。熵解码单元150可以对位流中的经熵编码的语法元素进行熵解码。预测处理单元152、逆量化单元154、逆变换处理单元156、重构单元158和滤波器单元160可基于从位流提取的语法元素而产生经解码视频数据。
位流可包括一系列NAL单元。位流的NAL单元可包含经译码切片的NAL单元。作为对位流进行编码的一部分,熵解码单元150可以从经译码的切片NAL单元提取语法元素并且对所述语法元素进行熵解码。经译码切片中的每一者可包含切片标头以及切片数据。切片标头可以含有关于切片的语法元素。切片标头中的语法元素可包含识别与含有切片的图片相关联的PPS的语法元素。PPS可参考SPS,SPS又可参考VPS。熵解码单元150还可对可包含语法信息的其它元素(例如SEI消息)进行熵解码。
切片标头、参数集或SEI消息中的任一者中的经解码语法元素可包含本文中描述为用信号表示以根据本发明中所描述的实例技术执行SDC模式的信息。举例来说,所述经解码语法元素可如本发明中所描述以统一方式指示SDC模式是否针对用于深度帧内预测和深度帧间预测模式两者的深度块执行。可将此语法信息提供到预测处理单元152以用于根据本发明中描述的技术解码和重构深度块。
一般来说,除了对来自位流的语法元素进行解码之外,视频解码器30可以对未分割CU执行重构操作。为对未经分割CU执行重构操作,视频解码器30可对CU的每一TU执行重构操作。通过对CU的每一TU执行重构操作,视频解码器30可重构CU的块。
作为对CU的TU执行重构操作的一部分,逆量化单元154可逆量化(即,解量化)与TU相关联的系数块。逆量化单元154可使用与TU的CU相关联的QP值来确定量化的程度和(同样)逆量化单元154将应用的逆量化的程度。即,可通过调整当量化变换系数时所使用的QP的值来控制压缩比,即用以表示原始序列以及经压缩的序列的位的数目的比率。压缩比还可取决于所采用的熵译码的方法。
在逆量化单元154逆量化系数块之后,逆变换处理单元156可将一或多个逆变换应用于系数块以便产生与TU相关联的残余块。例如,逆变换处理单元156可以将逆DCT、逆整数变换、逆卡忽南-拉维(Karhunen-Loeve)变换(KLT)、逆旋转变换、逆定向变换或另一逆变换应用于系数块。
如果使用帧内预测对PU进行编码,那么帧内预测处理单元166可执行帧内预测以产生PU的预测性块。帧内预测处理单元166可以使用帧内预测模式,以基于空间上相邻的PU的预测块产生用于PU的预测性明度块、Cb块以及Cr块。帧内预测处理单元166可基于从位流解码的一或多个语法元素确定用于PU的帧内预测模式。
预测处理单元152可基于从位流提取的语法元素来构造第一参考图片列表(RefPicList0)及第二参考图片列表(RefPicList1)。此外,如果使用帧间预测对PU进行编码,则熵解码单元150可以提取用于PU的运动信息。运动补偿(MC)单元164可基于PU的运动信息而确定用于PU的一或多个参考区。运动补偿(MC)单元164可以基于在用于PU的一或多个参考块处的样本块产生用于PU的预测性明度块、Cb块以及Cr块。
现在继续参考图6。重构单元158可以在适当时使用与CU的TU相关联的明度变换块、Cb变换块和Cr变换块以及CU的PU的预测性明度块、Cb块及Cr块(即,帧内预测数据或帧间预测数据)来重构CU的明度译码块、Cb译码块以及Cr译码块。举例来说,重构单元158可将明度、Cb及Cr变换块的样本添加至预测性明度、Cb及Cr块的对应样本以重构CU的明度、Cb及Cr译码块。
滤波器单元160可执行解块操作以减少与CU的明度、Cb及Cr译码块相关联的成块假象。视频解码器30可以在经解码图片缓冲器162中存储CU的明度译码块、Cb译码块以及Cr译码块。经解码图片缓冲器162可提供参考图片以用于后续运动补偿、帧内预测以及在例如图1的显示装置32等显示装置上的呈现。举例来说,视频解码器30可基于经解码图片缓冲器162中的明度、Cb及Cr块对其它CU的PU执行帧内预测或帧间预测操作。以此方式,视频解码器30可以从位流提取大量明度系数块的变换系数层级,逆量化变换系数层级,对变换系数层级应用变换以产生变换块,至少部分基于变换块产生译码块并且输出译码块用于显示。
视频解码器30是经配置以如本文中所描述执行用于统一信令和剖析指示使用SDC用于深度帧内预测模式和深度帧间预测模式两者的语法元素的技术中的任一者的视频解码器的实例。根据本发明的一或多种技术,视频解码器30内的一或多个单元可执行本文中描述的一或多种技术作为视频解码过程的部分。视频解码器30内也可以包含额外3D译码组件。
举例来说,预测处理单元152并且更确切地说帧内预测处理单元166和运动补偿(MC)单元164可确定在适用时是否在例如3D-HEVC的3D视频译码过程的深度帧内预测模式和深度帧间预测模式中执行SDC。熵解码单元150可对深度块的一或多个DC残余值以及本文所描述的语法信息进行熵解码,所述语法信息例如指示是否使用深度帧内预测或深度帧间预测对所述块进行编码以及是否针对深度帧内预测或深度帧间预测执行SDC模式以对所述块进行编码。以此方式,解码器30基于例如sdc_flag的语法元素确定是否使用SDC对当前CU(即,深度块)进行解码,且可使用相同语法结构或语法结构的不同实例来获得残余值以与经帧内预测深度块或经帧间预测深度块一起使用以重构CU。
熵解码单元150可将块的DC残余值和语法信息提供到预测处理单元152,如图6中的虚线指示。以此方式,DC残余值无需首先提供到用于逆量化和逆变换的逆量化单元154和逆变换处理单元156。在其它实例中,逆量化单元154可逆量化DC残余值,且将经解量化DC残余值提供到预测处理单元152。
运动补偿(MC)单元164可例如根据本文所描述的技术中的任一者基于如由语法信息指示的深度帧间预测模式确定用于深度块的预测符值。运动补偿(MC)单元164可利用从存储在经解码图片缓冲器162中的参考图片重构的深度块来确定经帧间预测深度块的预测符值。如果指示SDC模式,即用于深度帧内预测和帧间预测两者,那么运动补偿(MC)单元164应用SDC以重构深度块。运动补偿(MC)单元164可通过将DC残余值与预测符值求和而重构深度块。在一些实例中,运动补偿(MC)单元164可利用重构单元158用于经帧间预测深度块的残余和预测符值的求和。举例来说,熵解码单元150可将DC残余值提供到重构单元158,且运动补偿(MC)单元164可将预测符值提供到重构单元。
帧内预测处理单元166可例如根据本文所描述的技术中的任一者基于由语法信息指示的深度帧内预测模式确定深度块的预测符值。帧内预测处理单元166可利用存储在经解码图片缓冲器162中的经重构深度块确定预测符值。帧内预测处理单元166可通过将DC残余值和预测符值求和而重构深度块,如本文中所描述。在一些实例中,帧内预测处理单元166可利用重构单元158用于深度块的残余和预测符值的求和。举例来说,熵解码单元150可将DC残余值提供到重构单元,且帧内预测处理单元166可将预测符值提供到重构单元。
视频解码器30是包括一或多个处理器的视频解码器的实例,所述一或多个处理器经配置以:对指示简化深度译码(SDC)模式是否用于视频数据的深度译码单元(CU)的帧内预测和帧间预测两者的语法元素进行译码;当深度CU经帧内预测时执行帧内预测以产生预测深度CU;当深度CU经帧间预测时执行帧间预测以产生预测深度CU;以及当所述语法元素指示使用SDC模式时产生深度CU的至少一个DC残余值,其中所述至少一个DC残余值表示深度CU与预测深度CU之间的像素差。视频解码器30的所述一或多个处理器可经配置以解码所述语法元素,且使用所述至少一个DC残余值和预测深度CU重构深度CU。
另外,视频解码器30是包括一或多个处理器的视频解码器的实例,所述一或多个处理器经配置以:当视频数据的深度译码单元(CU)经帧内预测时执行帧内预测模式以产生预测深度CU;当深度CU经帧间预测时执行帧间预测模式以产生预测深度CU;以及当使用简化深度译码(SDC)模式时,对包括表示深度CU的至少一个DC残余值的信息的语法结构进行译码,其中所述语法结构的语法元素针对帧内预测模式和帧间预测模式是相同的。视频解码器30可进一步经配置以解码所述语法结构,且使用所述至少一个DC残余值和预测深度CU重构深度CU。
在另一实例中,视频解码器30是包括一或多个处理器的视频译码器的实例,所述一或多个处理器经配置以:对指示简化深度译码(SDC)模式是否用于经译码视频数据的整个序列的深度译码单元(CU)的帧内预测和帧间预测两者的语法元素进行译码;当所述序列的深度CU中的一者经帧内预测时执行帧内预测以产生预测深度CU;当所述序列的深度CU中的一者经帧间预测时执行帧间预测以产生预测深度CU;以及当所述语法元素指示使用SDC模式时,对表示所述序列的深度CU中的每一者的至少一个DC残余值的信息进行译码,其中所述至少一个DC残余值表示相应深度CU与相应预测深度CU之间的像素差。视频解码器30可经配置以使用深度CU中的每一者的所述至少一个DC残余值以及相应预测深度CU来重构深度CU。
现将描述3D-HEVC的现有草案的语法和语义。下文阐述在3D-HEVC中指示帧内/帧间SDC模式的语法元素,其中相对于3D-HEVC进行章节和表的参考。
H.7.3.2.1.2视频参数集扩展2语法
H.7.3.8.5译码单元语法
H.7.3.8.5.1深度模式参数语法
语义
等于1的vps_inter_sdc_flag[layerId]指定帧间SDC译码用于具有等于layerId的nuh_layer_id的层。等于0的vps_inter_sdc_flag[layerId]指定帧间SDC译码不用于具有等于layerId的nuh_layer_id的层。当不存在时,推断vps_inter_sdc_flag[layerId]的值等于0。
等于1的inter_sdc_flag指定残余块的简化深度译码用于当前译码单元。等于0的inter_sdc_flag指定残余块的简化深度译码不用于当前译码单元。当不存在时,推断inter_sdc_flag等于0。
inter_sdc_resi_abs_minus1[x0][y0][i]、inter_sdc_resi_sign_flag[x0][y0][i]用以如下导出InterSdcResi[x0][y0][i]:
InterSdcResi[x0][y0][i]=(1-2*inter_sdc_resi_sign_flag[x0][y0][i])*
(inter_sdc_resi_abs_minus1[x0][y0][i]+1) (H-19)
H.7.4.9.5.1深度模式参数语义
变量Log2MaxDmmCbSize设定成等于5。
变量depthIntraModeSet如下文中指定导出:
-如果log2CbSize等于6,那么将depthIntraModeSet设定成等于0。
-否则,如果log2CbSize等于3且PartMode[xC][yC]等于PART_NxN,那么将depthIntraModeSet设定成等于1。
-否则,将depthIntraModeSet设定成等于2。
depth_intra_mode[x0][y0]指定当前预测单元的深度帧内模式。表H-2指定取决于depthIntraModeSet的变量的depthIntraModeMaxLen的值和变量DepthIntraMode的值以及取决于depth_intra_mode和depthIntraModeSet的相关联名称。
变量SdcFlag[x0][y0]如下文指定导出:
SdcFlag[x0][y0]=
(DepthIntraMode[x0][y0]==INTRA_DEP_SDC_PLANAR)||(H-25)
(DepthIntraMode[x0][y0]==INTRA_DEP_SDC_DMM_WFULL)
变量DmmFlag[x0][y0]如下文指定导出:
DmmFlag[x0][y0]=
(DepthIntraMode[x0][y0]==INTRA_DEP_DMM_WFULL)||(H-26)
(DepthIntraMode[x0][y0]==INTRA_DEP_DMM_CPREDTEX)
表H-2-取决于depthIntraModeSet和depth_intra_mode的DepthIntraMode和相关联名称的规范以及取决于depthIntraModeSet的depthIntraModeMaxLen的规范
wedge_full_tab_idx[x0][y0]指定当DepthIntraMode[x0][y0]等于INTRA_DEP_DMM_WFULL时对应模式列表中的楔波模式的索引。
等于1的depth_dc_flag[x0][y0]指定depth_dc_abs[x0][y0][i]和depth_dc_sign_flag[x0][y0][i]存在。等于0的depth_dc_flag[x0][y0]指定depth_dc_abs[x0][y0][i]和depth_dc_sign_flag[x0][y0][i]不存在。
depth_dc_abs[x0][y0][i]、depth_dc_sign_flag[x0][y0][i]用以如下导出DcOffset[x0][y0][i]:
DcOffset[x0][y0][i]=
(1-2*depth_dc_sign_flag[x0][y0][i])*
(depth_dc_abs[x0][y0][i]-dcNumSeg+2)(H-27)
现将论述与SDC相关的一些最近的发展。在刘等人的JCT3V-F0126“CE5相关:3D-HEVC中用于全部帧内模式的通用SDC(CE5related:Generic SDC for all Intra modes in3D-HEVC)”(ITU-T SG 16WP 3和ISO/IEC JTC 1/SC 29/WG 11的3D视频译码扩展联合合作小组第6次会议:瑞士日内瓦,2013年10月25日-11月1日)中提出,在深度译码中,简化残余译码可应用于额外深度帧内预测模式和原始HEVC帧内预测模式。在简化残余译码中,针对PU的每一分区用信号表示一个DC残余值,即以HEVC帧内预测模式译码的PU具有一个分区,以使得所述PU内的全部像素在同一分区中,且以额外深度帧内预测模式译码的PU具有两个分区,变换和量化都被跳过,且不产生额外残余,即基于HEVC的3D编解码器中不存在变换树。
如上文所论述,用于SDC的当前设计存在的问题是使用不同语法元素和上下文模型来指示3D-HEVC中的帧内或帧间模式的使用,这使得译码单元的剖析过程更复杂。
根据本发明中描述的技术可统一3D-HEVC中的深度帧内和帧间预测模式的逐片段DC译码(SDC)的信令。此处还如下概括上文所论述的各种方面:
1.本发明中提议在深度译码的一些实例中,使用仅一个语法元素(例如,sdc_flag)来指示使用SDC用于帧内或帧间模式。
a.移除指示当前帧间CU利用SDC的inter_sdc_flag。
b.还移除用于帧内模式的SDC模式的指示。
c.不管当前译码单元是否以帧内或帧间预测译码,都引入新旗标,即
sdc_flag。当此旗标是1时,启用SDC。
2.本发明中提议在深度译码的一些实例中,在当前CU经译码为SDC时,对于每一分区,用于经帧间译码CU或经帧内译码CU的DC残余值统一为通过一个语法结构存在,所述语法结构包含DC残余值的绝对值及其正负号。
a.或者或另外,如果CU是以帧内译码,那么可进一步用信号表示指示当前CU是否在任何其分区中含有任何非零DC残余值的旗标(等于1)。如果此旗标是0,那么不用信号表示DC残余值且针对每一分区推断为等于零。
b.替代地,以上旗标适用于帧内和帧间模式两者。
c.替代地,以上旗标不用于帧内或帧间模式。
3.此外,在本发明中提议在一些实例中,用于帧间和帧内模式的DC残余值的语法结构共享相同语法元素,因此用于相关语法元素的上下文模型和二进制化过程是统一的,即相同上下文模型。
a.替代地,在一些实例中,即使帧内SDC模式和帧间SDC模式可使用相同语法结构用于DC残余值,但它们使用语法结构的不同实例,因此用于与DC残余值相关的元素的上下文针对帧内SDC和帧间SDC模式维持为分离的。
4.在本发明中提议在一些实例中,可应用解码器侧的约束,即,当sdc_flag等于1时pcm_flag将不等于1。
5.另外,在本发明中提议在一些实例中,可应用解码器侧的对SDC的约束,即,帧内SDC模式和帧间SDC模式两者仅用于2Nx2N分区大小。
a.替代地,帧内SDC模式用于包含2Nx2N和NxN的全部分区大小。
6.另外,在本发明中提议在一些实例中,针对整个经译码视频序列使用一个语法元素来在解码过程中启用/停用帧内和帧间SDC模式两者。如果所述一个语法元素指示SDC针对序列经启用,那么编码器用信号表示另一语法元素以指示SDC是否在CU层级使用,例如如参考在以上项目1中的统一sdc_flag元素的使用所描述。
a.在一些实例中,可在视频参数集扩展、序列参数集、图片参数集或切片片段标头等中设定此语法元素。
b.替代地,在一些实例中,使用一个旗标来指示用于帧内模式的SDC是否针对整个经译码视频序列经启用,如果这是真实的,那么另外使用另一旗标以指示用于帧间模式的SDC是否针对整个经译码视频序列经启用。
下文描述多种实施方案实例。根据下文的实例,对3D-HEVC的语法元素和语义做出改变。在下文的语法元素和语义中,已经改变3D-HEVC的相关部分以添加JCT3V-F0126文献中提议的语法元素和语义。以由斜体字指示的添加和以展示的删除来展示JCT3V-F0126文献中提议的改变。根据本发明的此实例,通过以黑体字呈现的新添加部分和以标记的新删除部分展示对语法元素和语义的额外改变。
下文呈现实例语法表,接着是相关语义,其中章节和表参考指代3D-HEVC中的对应章节和表参考。
以下实例说明使用sdc_flag[x0][y0]语法元素来指定在CU层级使用SDC,使用SdcEnableFlag语法元素来指示SDC是否经启用,且使用depth_dc_abs[x0][y0][i]和depth_dc_sign_flag[x0][y0][i]语法元素来分别指示DC残余值和正负号。语法元素是本发明中分别针对用信号表示SDC使用、SDC启用/停用状态以及SDC残余值所描述的语法元素的实例。在一些实例中,SdcEnableFlag语法元素可至少部分地从VPS中陈述的一或多个值导出,例如vps_inter_sdc_flag[nuh_layer_id]和vps_depth_modes_flag[nuh_layer_id],且可经配置以针对整个经译码视频序列启用或停用SDC。
H.7.3.8.5译码单元语法
H.7.3.8.5.1深度DC残余值语法表
替代地,当帧内和帧间SDC两者仅应用于具有等于2Nx2N的分区大小的CU时,可使用以下语法。
H.7.3.8.5.1深度DC残余值语法表
现将参考3D-HEVC描述实例语义和解码过程。再次,以由斜体字指示的添加和以展示的删除来展示JCT3V-F0126文献中提议的改变。根据本发明的此实例,通过以黑体字呈现的新添加部分和以标记的新删除部分展示对语法元素和语义的额外改变。
H.7.4.9.5译码单元语义
如下导出变量SdcEnableFlag:
SdcEnableFlag=
(vps_inter_sdc_flag[nuh_layer_id]&&PredMode[x0][y0]==MODE_INTER)||
(vps_depth_modes_flag[nuh_layer_id]
&&PredMode[x0][y0]==MODE_INTRA
&&PartMode[x0][y0]==PART_2Nx2N) (H-16)
等于1的sdc_flag[x0][y0]指定残余块的逐片段DC译码用于当前译码单元。等于0的sdc_flag[x0][y0]指定残余块的逐片段DC译码不用于当前译码单元。当不存在时,sdc_flag[x0][y0]推断为等于0。
等于1的hevc_intra_flag[x0][y0]指定具有在0到34的范围内的intraPredMode的帧内模式用于当前预测单元。等于0的hevc_intra_flag[x0][y0]指定另一帧内模式用于当前预测单元。当不存在时,hevc_intra_flag[x0][y0]推断为等于1。
变量DmmFlag[x0][y0]如下文指定导出:
DmmFlag[x0][y0]=!hevc_intra_flag[x0][y0] (H-25)
depth_intra_mode[x0][y0]指定当前预测单元的深度帧内模式。等于0的depth_intra_mode[x0][y0]指定DepthIntraMode[x0][y0]等于INTRA_DEP_DMM_WFULL,且等于1的depth_intra_mode[x0][y0]指定DepthIntraMode[x0][y0]等于INTRA_DEP_DMM_CPREDTEX。当不存在时,DepthIntraMode[x0][y0]推断为等于INTRA_DEP_NONE。
wedge_full_tab_idx[x0][y0]指定当DepthIntraMode[x0][y0]等于INTRA_DEP_DMM_WFULL时对应模式列表中的楔波模式的索引。
H.7.4.9.5.1深度DC残余语义
等于1的depth_dc_flag[x0][y0]指定depth_dc_abs[x0][y0][i]和depth_dc_sign_flag[x0][y0][i]存在。等于0的depth_dc_flag[x0][y0]指定depth_dc_abs[x0][y0][i]和depth_dc_sign_flag[x0][y0][i]不存在。当不存在时,depth_dc_flag[x0][y0]推断为等于1。
depth_dc_abs[x0][y0][i]、depth_dc_sign_flag[x0][y0][i]用以如下导出DcOffset[x0][y0][i]:
DcOffset[x0][y0][i]=
(1-2*depth_dc_sign_flag[x0][y0][i])*(depth_dc_abs[x0][y0][i]-dcNumSeg+2) (H-27)
H.8.4.2用于明度帧内预测模式的导出过程
对此过程的输入是相对于当前图片的左上明度样本指定当前明度预测块的左上样本的明度位置(xPb,yPb)。
在此过程中,导出明度帧内预测模式IntraPredModeY[xPb][yPb]。
表H-3指定用于帧内预测模式的值和相关联名称。
表H-3-帧内预测模式和相关联名称的规范
帧内预测模式 相关联名称
0 INTRA_PLANAR
1 INTRA_DC
2..34 INTRA_ANGULAR2..INTRA_ANGULAR34
35 INTRA_DMM_WFULL
36 INTRA_DMM_CPREDTEX
标记为0..34的IntraPredModeY[xPb][yPb]表示如图8 1中所说明的预测的方向。
-如果DepthIntraMode[xPb][yPb]等于INTRA_DEP_DMM_WFULL,那么将IntraPredModeY[xPb][yPb]设定成等于INTRA_DMM_WFULL。
-否则,如果DepthIntraMode[xPb][yPb]等于INTRA_DEP_DMM_CPREDTEX,那么将IntraPredModeY[xPb][yPb]设定成等于INTRA_DMM_CPREDTEX。
-否则(DepthIntraMode[xPb][yPb]等于INTRA_DEP_NONE),如以下有序步骤导出IntraPredModeY[xPb][yPb]:
H.8.4.4.2.1一般帧内样本预测
对此过程的输入是:
-样本位置(xTbCmp,yTbCmp),其相对于当前图片的左上样本指定当前变换块的左上样本,
-指定帧内预测模式的变量predModeIntra,
-指定变换块大小的变量nTbS,
-指定当前块的颜色分量的变量cIdx。
此过程的输出是预测样本predSamples[x][y],其中x,y=0..nTbS-1。
将变量bSamplePredFlag设定为1。
...
-否则,如果predModeIntra等于INTRA_DMM_CPREDTEX,那么以位置(xTbY,yTbY)调用子条款H.8.4.4.2.8中指定的对应帧内预测模式,其中样本阵列p和变换块大小nTbS以及bSamplePredFlag作为输入且输出是预测样本阵列predSamples。
H.8.4.4.2.8帧内预测模式INTRA_DMM_CPREDTEX的规范
对此过程的输入是:
-指定当前块的左上方样本相对于当前图片的左上方样本的样本位置(xTb,yTb),
-相邻样本p[x][y],其中x=-1,y=-1..nTbS*2-1且x=0..nTbS*2-1,y=-1,
-指定变换块大小的变量nTbS,
-指定是否产生预测样本的变量bSamplePredFlag,
此过程的输出是:
-预测样本predSamples[x][y],其中x,y=0..nTbS-1。
-楔波模式wedgePattern[x][y],其中x,y=0..nT-1。
通过以下有序步骤指定导出预测样本predSamples[x][y]的值,其中x,y=0..nTbS-1:
1.将变量recTextPic设定成等于TexturePic.的经重构明度图片样本的阵列。
2.如下文指定导出指定用于recTextPic的分段的阈值的变量textThresh。
-将变量sumTextPicVals设定成等于0。
-对于x=0..nTbS-1,以下适用
-对于y=0..nTbS-1,以下适用
sumTextPicVals+=recTextPic[xTb+x][yTb+y] (H-45)
-将变量textThresh设定成等于(sumTextPicVals>>(2*log2(nTbS)))
3.如下文指定导出指定二进制分区模式的变量wedgeletPattern[x][y],其中x,y=0..nTbS-1。
-对于x=0..nTbS-1,以下适用
-对于y=0..nTbS-1,以下适用
wedgeletPattern[x][y]=(recTextPic[xTb+x][yTb+y]>textThresh) (H-46)
4.当bSamplePredFlag等于1时,以相邻样本p[x][y]、二进制模式wedgeletPattern[x][y]、变换大小nT、设定成等于depth_dc_flag[xTb][yTb]的dcOffsetAvailFlag以及DC偏移DcOffset[xTb][yTb][0]和DcOffset[xTb][yTb][1]作为输入调用如子条款H.8.4.4.2.9中指定的深度分区值导出和指派过程,且将输出指派给predSamples[x][y]。
H.8.4.4.3深度值重构过程
对此过程的输入是:
-指定当前块的左上方明度样本相对于当前图片的左上方明度样本的明度位置(xTb,yTb),
-指定变换块大小的变量nTbS,
-预测样本predSamples[x][y],其中x,y=0..nTbS-1
-帧内预测模式predModeIntra,
此过程的输出是:
-经重构深度值样本resSamples[x][y],其中x,y=0..nTbS-1。
将变量bSamplePredFlag设定为0。
取决于predModeIntra,如下导出指定二进制分段模式的阵列wedgePattern[x][y],其中x,y=0..nTbS-1。
-如果predModeIntra等于INTRA_DMM_WFULL,那么以下适用。
wedgePattern=WedgePatternTable[Log2(nTbS)][wedge_full_tab_idx[xTb][yTb]]
-否则,如果predModeIntra等于INTRA_DMM_CPREDTEX,那么以位置(xB,yB)、预测样本predSamples、变换块大小nT以及bSamplePredFlag作为输入调用子条款H.8.4.4.2.8,且输出是楔波模式wedgePattern。
-否则(predModeIntra不等于INTRA_DMM_WFULL且predModeIntra不等于INTRA_DMM_CPREDTEX),以下适用。
-对于x,y=0..nTbS-1,将wedgePattern[x][y]设定成等于0。
取决于dlt_flag[nuh_layer_id],如下文指定导出经重构深度值样本resSamples[x][y]:
-如果dlt_flag[nuh_layer_id]等于0,那么以下适用:
-对于x,y=0..nTbS-1,如下文指定导出经重构深度值样本resSamples[x][y]:resSamples[x][y]=predSamples[x][y]+DcOffset[xTb][yTb][wedgePattern[x][y]] (H-59)
-否则(dlt_flag[nuh_layer_id]等于1),以下适用:
-如以下指定导出变量dcPred[0]和dcPred[1]:
-如果predModeIntra不等于INTRA_DMM_WFULL且predModeIntra不等于INTRA_DMM_CPREDTEX,那么以下适用:
dcPred[0]=(predSamples[0][0]+predSamples[0][nTbS-1]+
predSamples[nTbS-1][0]
+predSamples[nTbS-1][nTbS-1]+2)>>2(H-61)
-否则,如果predModeIntra等于INTRA_DMM_WFULL,那么以下适用。
dcPred[wedgePattern[0][0]]=predSamples[0][0] (H-62)
dcPred[wedgePattern[nTbS-1][0]]=predSamples[nTbS-1][0](H-63)
dcPred[wedgePattern[0][nTbS-1]]=predSamples[0][nTbS-1](H-64)
dcPred[wedgePattern[nTbS-1][nTbS-1]]=predSamples[nTbS-1][nTbS-1](H-65)
-否则,(intraPredMode等于INTRA_DMM_CPREDTEX),以下适用。
-对于x,y=0..nTbS-1,如下文指定导出经重构深度值样本resSamples[x][y]:
dltIdxPred=DepthValue2Idx[dcPred[wedgePattern[x][y]]] (H-66)
dltIdxResi=DcOffset[xTb][yTb][wedgePattern[x][y]] (H-67)
resSamples[x][y]=predSamples[x][y]+
Idx2DepthValue[dltIdxPred+dltIdxResi]-dcPred[wedgePattern[x][y]](H-68)
H.8.5.4.1总则
-如果sdc_flag等于0,那么以下适用,取决于rqt_root_cbf的值,以下适用:
-如果rqt_root_cbf等于0或skip_flag[xCb][yCb]等于1,那么将(nCbSL)x(nCbSL)阵列resSamplesL的全部样本以及两个(nCbSC)x(nCbSC)阵列resSamplesCb和resSamplesCr的全部样本设定成等于0。
-否则(rqt_root_cbf等于1),以下有序步骤适用:
以明度位置(xCb,yCb)、设定成等于(0,0)的明度位置(xB0,yB0)、设定成等于log2CbSize的变量log2TrafoSize、设定成等于0的变量trafoDepth、设定成等于nCbSL的变量nCbS以及(nCbSL)x(nCbSL)阵列resSamplesL作为输入调用如以下子条款H.8.5.4.2中指定的用于明度残余块的解码过程,且输出是(nCbSL)x(nCbSL)阵列resSamplesL的经修改版本。
以明度位置(xCb,yCb)、设定成等于(0,0)的明度位置(xB0,yB0)、设定成等于log2CbSize的变量log2TrafoSize、设定成等于0的变量trafoDepth、设定成等于1的变量cIdx、设定成等于nCbSC的变量nCbS以及(nCbSC)x(nCbSC)阵列resSamplesCb作为输入调用如以下子条款H.8.5.4.3中指定的用于色度残余块的解码过程,且输出是(nCbSC)x(nCbSC)阵列resSamplesCb的经修改版本。
以明度位置(xCb,yCb)、设定成等于(0,0)的明度位置(xB0,yB0)、设定成等于log2CbSize的变量log2TrafoSize、设定成等于0的变量trafoDepth、设定成等于2的变量cIdx、设定成等于nCbSC的变量nCbS以及(nCbSC)x(nCbSC)阵列resSamplesCr作为输入调用如以下子条款H.8.5.4.3中指定的用于色度残余块的解码过程,且输出是(nCbSC)x(nCbSC)阵列resSamplesCr的经修改版本。
-否则(sdc_flag等于1),以明度位置(xCb,yCb)、设定成等于(0,0)的明度位置(xB0,yB0)、设定成等于log2CbSize的变量log2TrafoSize、设定成等于0的变量trafoDepth、设定成等于nCbSL的变量nCbS以及nCbS阵列resSamplesL作为输入调用如以下子条款H.8.5.4.4中指定的用于简化深度译码残余块的解码过程,且输出是(nCbSL)x(nCbSL)阵列resSamplesL的经修改版本。
H.8.5.4.4用于简化深度译码残余块的解码过程
...
对于在0到nCbS的范围内的x,以下适用:
-对于在0到nCbS的范围内的y,以下适用:
-如以下指定导出变量i:
-如果x小于xOff且y小于yOff,那么将i设定成等于0。
-否则,如果x大于或等于xOff且y小于yOff,那么将i设定成等于1。
-否则,如果x小于xOff且y大于或等于yOff,那么将i设定成等于2。
-否则,(x大于或等于xOff且y大于或等于yOff),那么将i设定成等于3。
-将resSamples[x][y]的值设定成等于DcOffset[xCb][yCb][interSdcResiIdx[i]]
表H-10-用于初始化过程中的每一initializationType的ctxIdx和语法元素的关联
表H-20-语法元素和相关联二进制化
表H-22-通过上下文经译码二进位的ctxInc到语法元素的指派
根据另一实例,对3D-HEVC的语法元素和语义做出改变。在以下语法元素和语义中,已经改变3D-HEVC的相关部分以添加根据本发明的实例提议的语法元素和语义。通过以黑体字呈现的新添加部分和以黑体字标记的新删除部分展示根据本发明的此实例对语法元素和语义的改变。
下文呈现语法表,接着是相关语义。
H.7.3.8.5一般译码单元语法
H.7.3.8.5.1深度模式参数语法
H.7.3.8.5.2深度DC残余语法表
语义和解码过程
H.7.4.9.5译码单元语义
将变量SdcEnableFlag设定成等于0,且以下适用:
SdcEnableFlag=
(vps_inter_sdc_flag[nuh_layer_id]&&PredMode[x0][y0]==MODE_INTER)||
(vps_depth_modes_flag[nuh_layer_id]
&&PredMode[x0][y0]==MODE_INTRA
&&PartMode[x0][y0]==PART_2Nx2N
&&(IntraPredModeY[x0][y0]==INTRA_DMM_WFULL||IntraPredModeY[x0][y0]==INTRA_PLANAR)) (H-16)
等于1的sdc_flag[x0][y0]指定残余块的逐片段DC译码用于当前译码单元。等于0的sdc_flag[x0][y0]指定残余块的逐片段DC译码不用于当前译码单元。当不存在时,sdc_flag[x0][y0]推断为等于0。
H.7.4.9.5.1深度模式参数语义
将变量Log2MaxDmmCbSize设定成等于5。
变量depthIntraModeSet如下文中指定导出:
-如果log2CbSize等于6,那么将depthIntraModeSet设定成等于0。
-否则,如果log2CbSize等于3且PartMode[xC][yC]等于PART_NxN,那么将depthIntraModeSet设定成等于1。
-否则,将depthIntraModeSet设定成等于2。
depth_intra_mode[x0][y0]指定当前预测单元的深度帧内模式。表H-2指定取决于depthIntraModeSet的变量的depthIntraModeMaxLen的值和变量DepthIntraMode的值以及取决于depth_intra_mode和depthIntraModeSet的相关联名称。
变量DmmFlag[x0][y0]如下文指定导出:
DmmFlag[x0][y0]=(DepthIntraMode[x0][y0]==INTRA_DEP_DMM_WFULL)||(H-26)
(DepthIntraMode[x0][y0]==INTRA_DEP_DMM_CPREDTEX)
表H-2-取决于depthIntraModeSet和depth_intra_mode的DepthIntraMode和相关联名称的规范以及取决于depthIntraModeSet的depthIntraModeMaxLen的规范
H.7.4.9.5.2深度DC残余语义
等于1的depth_dc_flag[x0][y0]指定depth_dc_abs[x0][y0][i]和depth_dc_sign_flag[x0][y0][i]存在。等于0的depth_dc_flag[x0][y0]指定depth_dc_abs[x0][y0][i]和depth_dc_sign_flag[x0][y0][i]不存在。当不存在时,depth_dc_flag[x0][y0]推断为等于1。
depth_dc_abs[x0][y0][i]、depth_dc_sign_flag[x0][y0][i]用以如下导出DcOffset[x0][y0][i]:
DcOffset[x0][y0][i]=
(1-2*depth_dc_sign_flag[x0][y0][i])*(depth_dc_abs[x0][y0][i]-dcNumSeg+2)(H-27)
H.8.5.4.1总则
-如果sdc_flag等于0,那么以下适用,取决于rqt_root_cbf的值,以下适用:
-如果rqt_root_cbf等于0或skip_flag[xCb][yCb]等于1,那么将(nCbSL)x(nCbSL)阵列resSamplesL的全部样本以及两个(nCbSC)x(nCbSC)阵列resSamplesCb和resSamplesCr的全部样本设定成等于0。
-否则(rqt_root_cbf等于1),以下有序步骤适用:
以明度位置(xCb,yCb)、设定成等于(0,0)的明度位置(xB0,yB0)、设定成等于log2CbSize的变量log2TrafoSize、设定成等于0的变量trafoDepth、设定成等于nCbSL的变量nCbS以及(nCbSL)x(nCbSL)阵列resSamplesL作为输入调用如以下子条款H.8.5.4.2中指定的用于明度残余块的解码过程,且输出是(nCbSL)x(nCbSL)阵列resSamplesL的经修改版本。
以明度位置(xCb,yCb)、设定成等于(0,0)的明度位置(xB0,yB0)、设定成等于log2CbSize的变量log2TrafoSize、设定成等于0的变量trafoDepth、设定成等于1的变量cIdx、设定成等于nCbSC的变量nCbS以及(nCbSC)x(nCbSC)阵列resSamplesCb作为输入调用如以下子条款H.8.5.4.3中指定的用于色度残余块的解码过程,且输出是(nCbSC)x(nCbSC)阵列resSamplesCb的经修改版本。
以明度位置(xCb,yCb)、设定成等于(0,0)的明度位置(xB0,yB0)、设定成等于log2CbSize的变量log2TrafoSize、设定成等于0的变量trafoDepth、设定成等于2的变量cIdx、设定成等于nCbSC的变量nCbS以及(nCbSC)x(nCbSC)阵列resSamplesCr作为输入调用如以下子条款H.8.5.4.3中指定的用于色度残余块的解码过程,且输出是(nCbSC)x(nCbSC)阵列resSamplesCr的经修改版本。
-否则(sdc_flag等于1),以明度位置(xCb,yCb)、设定成等于(0,0)的明度位置(xB0,yB0)、设定成等于log2CbSize的变量log2TrafoSize、设定成等于0的变量trafoDepth、设定成等于nCbSL的变量nCbS以及nCbS阵列resSamplesL作为输入调用如以下子条款H.8.5.4.4中指定的用于简化深度译码残余块的解码过程,且输出是(nCbSL)x(nCbSL)阵列resSamplesL的经修改版本。
H.8.5.4.4用于简化深度译码残余块的解码过程
...
对于在0到nCbS的范围内的x,以下适用:
-对于在0到nCbS的范围内的y,以下适用:
-如以下指定导出变量i:
-如果x小于xOff且y小于yOff,那么将i设定成等于0。
-否则,如果x大于或等于xOff且y小于yOff,那么将i设定成等于1。
-否则,如果x小于xOff且y大于或等于yOff,那么将i设定成等于2。
-否则,(x大于或等于xOff且y大于或等于yOff),那么将i设定成等于3。
-将resSamples[x][y]的值设定成等于DcOffset[xCb][yCb][interSdcResiIdx[i]]
表H-10-用于初始化过程中的每一initializationType的ctxIdx和语法元素的关联
表H-20-语法元素和相关联二进制化
表H-22-通过上下文经译码二进位的ctxInc到语法元素的指派
图7到12是说明根据本发明由视频编码器20和/或视频解码器20执行的各种实例操作的流程图。流程图是出于说明的目的而提供且不应被视为具限制性。各种操作的次序是出于说明的目的而呈现,且不一定指示所述操作必须以所说明的次序执行。并且,在许多情况下,图7到12中说明的操作可彼此以各种组合而实践。
图7是说明例如在CU层级对语法元素进行编码以指示用于深度帧内预测和深度帧间预测模式两者的SDC使用的流程图。视频编码器20可经配置以执行图7的操作。举例来说,视频编码器30可选择SDC模式用于对深度CU的PU的分区进行译码。在一些实例中,视频编码器30可发射语法元素以启用或停用用于对整个经编码视频序列中的深度CU进行译码的SDC模式。随后,在一些实例中,如果SDC针对序列经启用,那么视频编码器30可用信号表示用于序列中的每一深度CU的语法元素以指示针对深度CU是否选择SDC。视频编码器30针对每一CU选择帧间译码模式或经帧内译码模式(202),且接着应用所述深度CU的帧间预测(204)或所述深度CU的帧内预测(206)。
可使用各种类型的SDC帧内预测。在一些实例中,对于SDC,对于当前经帧内译码,其中所述语法元素指示SDC模式是否用于当前深度CU,译码可包含当执行帧内预测以产生预测深度CU时使用来自对应于所述深度CU的深度分量的纹理分量的样本。
对于深度译码,视频编码器30可使用规则HEVC帧内预测或帧间预测模式或DMM模式,例如楔波、轮廓或平面分割模式。在任一情况下,视频编码器20可应用SDC以产生用于一或多个深度CU分区的一或多个DC残余值(208)。举例来说,通过SDC,视频编码器20可针对与深度CU的每一PU相关联的分区对仅一个DC残余值进行编码。因此,视频编码器20针对每一PU用信号表示一个DC残余值,且将所述一个DC残余值用作所述PU中的全部样本的残余。所述PU可为整个CU或CU中的个别分区,例如由楔波或轮廓分割界定的分区。
进一步参看图7,视频编码器20可对指示SDC用于CU(无论是用于帧内还是帧间模式,即用于深度帧内和深度帧间预测两者)的语法元素进行编码(210)。因此,并非独立地单独用信号表示用于深度帧内和深度帧间预测的SDC,视频编码器20产生CU的单个语法元素,其指示SDC应用于所述CU,无论所述CU是以深度帧内还是深度帧间预测译码。所述语法元素可为sdc_flag语法元素。sdc_flag语法元素可为一位旗标。作为一实例,1的sdc_flag值指示SDC将用于深度帧内和深度帧间预测两者,且0的sdc_flag值指示SDC将不用于深度帧内和深度帧间预测。再次,另一语法元素可针对整个序列启用或停用SDC。如果SDC经启用,那么可在CU层级用信号表示sdc_flag。如果SDC针对序列停用,那么在一些实例中,不用信号表示sdc_flag。再次,可基于序列、图片或切片而应用SDC的启用或停用,而可发送sdc_flag以指示在CU层级的实际SDC使用。
在一些实例中,视频编码器20可在CU层级在一般译码单元参数中用信号表示SDC语法元素sdc_flag。因此,视频编码器20可基于逐CU用信号表示SDC语法元素。在其它实例中,如上文论述,视频编码器20可在切片片段标头中用信号表示另一语法元素,其指示SDC针对切片片段中的全部深度CU经启用(或停用)。在又其它实例中,由视频编码器20产生的SDC语法元素可指示SDC针对整个图片或整个视频序列中的全部深度CU经启用(或停用)。举例来说,视频编码器20可在视频参数集(VPS)扩展(例如用于3D-HEVC)中、在序列参数集(SPS)中或在图片参数集(PPS)中用信号表示启用/停用SDC语法元素。在一些实例中,在VPS、SPS、PPS、切片标头或类似物中用信号表示的一或多个语法元素可用以计算可例如在CU层级单独地用信号表示的启用或停用旗标的值。因此,第一SDC启用语法元素可用以例如针对切片中的全部深度CU、图片中的全部深度CU或整个经编码视频序列中的全部深度CU启用或停用SDC,且第二SDC语法元素(例如,sdc_flag)可经配置以指示SDC实际上用于个别深度CU的深度帧内和深度帧间预测两者。
视频编码器20也可对具有SDC残余数据的语法结构进行编码。举例来说,在当前深度CU是以SDC译码时,对于每一分区,可在一个语法结构中呈现用于经帧间译码CU或经帧内译码CU的每一PU的每一分区的DC残余值。DC残余值可为像素值域中的DC偏移。用于分区的此单个语法结构包含分区的DC残余数据,无论所述分区经帧内还是经帧间预测。举例来说,对于帧内预测或帧间预测,所述语法结构可包含DC残余值的绝对值及其正负号(正或负)。DC残余语法元素的实例包含用以指示残余的depth_dc_abs和用以指示正负号的depth_dc_sign_flag。举例来说,depth_dc_abs和depth_dc_sign_flag可用以导出DcOffset值。以此方式,视频编码器20可经配置以将用于经帧间译码CU或经帧内译码CU的DC残余数据统一为由一个语法结构呈现。在一些实例中,语法结构中的DC残余数据可包含DC残余值和正负号。在其它实例中,可使用DLT用信号表示DC残余数据。在此情况下,可将DC残余数据用信号表示为例如用于深度PU或分区的原始DC值的DLT索引与预测DC值的DLT索引之间的差。
作为一个替代方案或另外,视频编码器20可经配置以针对经帧内译码CU用信号表示且编码旗标,其指示所述CU是否在任何其分区中含有任何非零DC残余值。如果此旗标是0,那么视频编码器20不用信号表示经帧内译码CU的任何DC残余值,且解码器30推断DC残余值针对所述CU的每一分区等于零。作为另一替代方案,由视频编码器20产生以指示CU是否在任何其分区中含有任何非零DC残余值的旗标可应用于经帧内译码和经帧间译码CU。
由视频编码器20产生且用以用信号表示经帧内预测和经帧间预测CU的DC残余值的语法结构可为单个语法结构,如上文所描述。即,可针对每一深度CU产生单个语法结构,无论所述CU是经帧内预测还是经帧间预测。以此方式,帧内预测和帧间预测模式可共享相同语法元素以用信号表示深度CU的分区的DC残余值。视频编码器20可使用用于相关语法元素的相同上下文模型和/或二进制化过程对语法结构的语法元素进行熵译码,无论深度CU是经帧内预测还是经帧间预测,进而以SDC统一用于帧内预测和帧间预测的熵译码过程。
替代地,视频编码器20可产生语法结构的单独实例,即,包含用于帧内预测的DC残余数据的一个语法结构和包含用于帧间预测的DC残余数据的一个语法结构,其中所述语法结构的实例相同或大体上相同,因为在所述语法结构的每一实例中包含相同语法元素。在此情况下,视频编码器30可单独地对所述语法结构的单独实例进行熵译码,且针对所述语法结构的帧内预测实例和所述语法结构的帧间预测实例使用相同或单独地维持的上下文且可能使用二进制化。即使所述上下文是单独维持的,帧内SDC和帧间SDC模式也仍可使用相同语法元素和相同语法结构(但在不同实例中)以载运用于深度CU的PU的分区的DC残余数据。
视频编码器214对用于与深度CU相关联的一或多个PU的预测的帧内预测或帧间预测信息进行编码(214)。举例来说,视频编码器214可对用于每一PU的译码模式的指示以及用于解码器侧的每一PU的帧间或帧内预测的任何其它信息进行编码。对于例如SDC帧内预测,视频编码器20可对用于HEVC帧内预测模式、DMM模式或其它帧内模式的帧内译码模式信息进行编码。对于例如帧间预测,视频编码器20可对用于经帧间预测深度PU和/或分区的产生的运动信息进行编码。视频编码器214可对SDC语法元素(即,指示在CU层级的SDC的使用)、SDC语法结构(即,指示用于PU分区的DC值)以及帧内或帧间预测信息进行熵译码供解码器30在解码器侧用于解码和重构深度CU作为例如3D-HEVC解码过程等3D解码过程的部分。
图8是说明例如上文参考图7描述的语法元素等SDC语法元素的解码以指示用于深度帧内预测和深度帧间预测模式两者的SDC使用的流程图。一般来说,图8从视频解码器30的解码器侧角度描述图7中说明的过程。因此,参考图7描述的各种操作和语法的细节可以类似方式应用于图8,但是从视频解码器30的角度应用。如图8中所示,视频解码器30可经配置以对用于深度CU的帧内和/或帧间预测模式信息进行解码以产生预测深度信息。另外,视频解码器30可接收且解码指示SDC是否将用于CU的SDC语法元素(例如,sdc_flag),即无论是使用深度帧内预测还是深度帧间预测模式。换句话说,所述语法元素用以用信号表示用于帧内和帧间CU两者的SDC。
如参考图7所论述,并非独立地单独接收用于深度帧内和深度帧间预测的SDC的信令,视频解码器20接收指示SDC应用于深度帧内和深度帧间预测两者的SDC语法元素。再次,所述SDC语法元素可为sdc_flag语法元素,且可另外符合上文参考图7描述的所述语法元素的描述。1的sdc_flag值可指示SDC将用于CU的深度帧内和深度帧间预测两者,且0的sdc_flag值可指示SDC将不用于CU的深度帧内和深度帧间预测。
视频解码器30可在CU层级在一般译码单元参数中接收SDC语法元素。因此,视频解码器30可基于逐CU而接收且解码SDC语法元素。在一些实例中,视频解码器30可在切片片段标头中接收另一SDC语法元素,其指示SDC针对切片片段中的全部深度CU经启用。在又其它实例中,视频解码器30可接收指示SDC针对整个经译码视频序列中或图片中的深度CU的帧内和帧间预测经启用的另一语法元素。举例来说,视频解码器30可在视频参数集(VPS)扩展(例如用于3D-HEVC)中、在序列参数集(SPS)中或在图片参数集(PPS)中接收额外SDC语法元素(指示SDC是否经启用或停用)。因此,视频解码器30可接收指示SDC针对序列、图片或切片中的CU经启用的第一SDC语法元素,以及在CU层级指示SDC实际上用于特定CU的第二SDC元素(例如,sdc_flag)。
如果将SDC指示为不使用(例如,sdc_flag=0)用于帧内预测和帧间预测(224),那么解码器30对位流进行解码以获得用于经帧内或经帧间预测PU的重构的非SDC残余数据。如果所述语法元素指示SDC使用(例如,sdc_flag=1)用于帧内预测和帧间预测(224),那么解码器30对语法结构进行解码以产生用于当前CU的深度PU的分区的SDC残余数据。这可针对CU中的PU的多个分区重复。解码器30可接收多个语法结构,其中所述语法结构包含用于相应深度PU分区的SDC残余数据。如参考图8所描述,用于每一深度PU的语法结构可为单个语法结构,无论深度PU是经帧内还是经帧间译码,或者分别用于经帧内和经帧间译码深度PU的同一语法结构的单独实例。在当前深度CU是以SDC译码时,针对每一分区,可在语法结构中呈现用于经帧间译码CU或经帧内译码CU的DC残余值。因此,用于分区的此语法结构包含分区的DC残余数据,无论所述分区经帧内还是经帧间预测。
举例来说,对于帧内预测或帧间预测,由视频解码器30解码的语法结构可包含DC残余值的绝对值及其正负号(正或负)。所述语法结构中的DC残余语法元素的实例包含用以指示残余的depth_dc_abs和用以指示正负号的depth_dc_sign_flag。以此方式,通过使用同一语法结构或至少相同语法元素来传达用于深度帧内和深度帧间译码两者的DC残余数据,视频解码器30可经配置以统一用于经帧间译码CU或经帧内译码CU的DC残余值。在一些实例中,语法结构中的DC残余数据可包含DC残余值和正负号。在其它实例中,可使用DLT用信号表示DC残余数据。在此情况下,可将DC残余数据用信号表示为例如用于深度PU或分区的原始DC值的DLT索引与预测DC值的DLT索引之间的差。
在一些实例中,如参考图7所描述,在图8的操作中,视频解码器30可经配置以针对经帧内译码CU用信号表示且解码旗标,其指示所述CU是否在任何其分区中含有任何非零DC残余值。如果此旗标是0,那么视频解码器20不剖析经帧内译码CU的任何DC残余值,且改为针对CU的每一分区推断DC残余值等于零。作为另一替代方案,由视频解码器30解码以指示CU是否在任何其分区中含有任何非零DC残余值的旗标可应用于经帧内译码和经帧间译码CU。
由视频解码器30解码的语法结构可为单个语法结构,如上文所描述。即,可针对每一深度CU产生单个语法结构,无论所述CU是经帧内预测还是经帧间预测。以此方式,帧内预测和帧间预测模式可共享相同语法元素以用信号表示深度CU的分区的DC残余值。视频解码器20可使用用于相关语法元素的相同上下文模型和二进制化过程中的至少一者对语法结构进行熵解码,无论深度CU是经帧内预测还是经帧间预测,进而以SDC统一用于帧内预测和帧间预测的熵解码过程。用于上下文自适应熵译码过程的上下文模型和二进制化过程中的至少一者针对所述语法结构中的相同语法元素(例如,depth_dc_abs和depth_dc_sign_flag)可为相同的。
替代地,在图8的操作中,视频解码器30可接收且解码语法结构的单独实例,即,包含用于帧内预测的DC残余数据的一个语法结构和包含用于帧间预测的DC残余数据的一个语法结构,其中所述语法结构的实例大体上相同,因为在所述语法结构的每一实例中包含相同语法元素,如参考图7所描述。在此情况下,视频解码器30可单独地但以相同语法元素对语法结构的单独实例进行熵解码,且使用针对语法结构的帧内预测实例和语法结构的帧间预测实例相同或单独地维持的上下文且可能使用二进制化。再次,可使用用以指示残余的depth_dc_abs和用以指示正负号的depth_dc_sign_flag的相同语法元素,无论是否提供单个语法结构或语法结构的单独实例。在每一情况下,可使用相同语法元素来传达用于帧内和帧间预测模式两者的SDC残余数据。在一些实例中,用于上下文自适应熵译码过程的上下文模型和二进制化过程中的至少一者针对语法结构的不同实例中的相同语法元素(例如,depth_dc_abs和depth_dc_sign_flag)可为相同的。在其它实例中,用于上下文自适应熵译码过程的上下文模型和二进制化过程中的一者或两者针对语法结构的不同实例中的语法元素(例如,depth_dc_abs和depth_dc_sign_flag)可为不同的。
在SDC译码或非SDC译码的情况下,视频解码器30确定深度帧内模式或深度帧间模式是否应用于当前CU(230)。视频解码器30在适用时使用提供于经编码视频位流中的模式信息对每一深度PU进行帧间预测(232)或对每一深度PU进行帧内预测(234)。所述模式信息可包含例如用于产生经帧内预测深度PU和/或分区的HEVC帧内预测模式、DMM模式或其它帧内模式的帧内译码模式信息,或用于产生经帧间预测深度PU和/或分区的帧间译码模式信息和运动信息。使用此信息,视频解码器30产生用于深度PU和/或分区的预测性样本。
视频解码器30使用SDC残余数据或非SDC残余数据和预测深度PU重构深度CU的PU的分区。举例来说,在SDC译码的情况下,对于给定PU,视频解码器30应用在SDC语法结构中用信号表示的DC残余值,或基于提供于SDC语法结构中的索引值差或其它信息而从DLT导出DC残余值。视频解码器30将DC残余值添加到预测PU分区的预测样本以重构原始样本。以此方式,视频解码器30使用SDC语法元素和SDC语法结构来统一SDC帧内和帧间解码,而不是分别使用单独语法元素和语法结构用于帧内和帧间译码。
图9是说明对语法元素进行解码以指示用于整个经编码视频序列中的深度块的SDC使用的流程图。一般来说,图9中从解码器侧角度说明的操作表示与图7和8中所示的方法一起使用的可能特征。在图9的实例中,视频解码器30对指示SDC是否针对深度帧内预测和深度帧间预测两者经启用或停用的SDC语法元素进行解码(240)。视频解码器30可例如在视频参数集(VPS)扩展、序列参数集(SPS)、图片参数集(PPS)或切片片段标头中接收SDC语法元素。当在VPS或SPS中接收时,如果SDC语法元素指示SDC的启用,那么视频解码器30应考虑SDC针对用于整个视频序列的全部经帧内预测和帧间预测模式经启用,且应在CU层级接收指示SDC是否用于所述CU的另一语法元素(例如,sdc_flag)。作为一个替代方案,当在PPS中接收SDC语法元素且指示SDC的启用时,视频解码器30可在CU层级针对对应图片的全部深度块接收额外SDC语法元素(例如,sdc_flag)。作为另一替代方案,当在切片片段标头中接收SDC语法元素且指示SDC的启用时,视频解码器30可在CU层级针对对应切片片段的全部深度块接收额外SDC语法元素(例如,sdc_flag)。
如果SDC指示为经启用(242),那么在图9的实例中,视频解码器将SDC解译为针对用于整个经译码视频序列的深度帧内和深度帧间译码模式经启用,且可针对序列中的CU剖析位流以得到在CU层级的sdc_flag语法元素。如果SDC未经启用(242),那么视频解码器30将规则非SDC残余译码应用于整个经译码视频序列的深度块。以此方式,可针对深度帧内和帧间模式以及针对整个经译码视频序列一次性用信号表示SDC启用或停用。因此,在用于整个经译码视频序列的解码过程中可使用一个语法元素来启用/停用帧内和帧间SDC模式两者。替代地,可以用于整个图片或切片片段的语法元素一次性用信号表示SDC启用/停用。在每一情况下,可以在CU层级在一般译码单元参数中的语法元素用信号表示用于CU的实际SDC使用。
在一些实例中,并非以一个语法元素指示SDC是否针对用于整个经译码视频序列或者用于图片或切片片段的帧内和帧间模式经启用,视频编码器20可编码且视频解码器30可解码单个(第一)旗标以指示SDC是否针对深度帧内预测模式经启用。举例来说,此第一旗标可用以指示SDC是否针对用于整个经译码视频序列的帧内模式经启用。在一些实例中,如果第一旗标是真,即,SDC将针对用于整个经译码视频序列的帧内模式经启用,那么视频编码器20编码且视频解码器30解码额外(第二)旗标,其用以指示SDC是否针对用于整个经译码视频序列的帧间模式经启用,即,SDC是否也针对用于整个经译码视频序列的帧间模式经启用。
如果第一旗标不是真,且SDC未针对帧内模式经启用,那么视频编码器20无需产生且视频解码器30无需剖析指示SDC是否针对帧间模式经启用的第二旗标。在一些实例中,用以指示SDC帧内的启用的第一旗标和用以指示SDC帧间的启用的第二旗标可在用于整个经译码视频序列的VPS或SPS中提供。替代地,在一些实例中,用以指示SDC帧内的启用的第一旗标和用以指示SDC帧间的启用的第二旗标可在PPS或切片片段标头中提供。在每一情况下,可在CU层级例如使用sdc_flag指示用于CU的实际SDC使用。
图10是说明对单个语法结构进行解码以获得用于帧内预测和帧间预测模式的SDC残余数据的流程图。在图10的实例中,视频解码器30如上文参考图7和8所描述对用于深度帧内和深度帧间模式两者的单个SDC语法结构进行解码。如图10中所展示,视频解码器30例如针对深度CU在CU层级对指示SDC是否用于深度帧内和深度帧间预测两者的SDC语法元素进行解码。为了图10的目的,假定所述语法元素指示使用SDC,在此情况下视频解码器30进一步对包含用于给定深度CU的PU的一或多个分区的SDC残余数据的单个SDC语法结构进行解码。
在图10的实例中,且如上文参考图7和8所描述,所述单个SDC语法结构可为针对深度帧内或帧间模式两者发送的单个语法结构,或者分别用于深度帧内模式和深度帧间模式的同一语法结构的单独实例。在每一情况下,所述语法结构使用相同语法元素用于深度帧内模式和深度帧间模式。举例来说,SDC语法结构可包含指示DC残余值和正负号或用于导出DC残余值的DLT索引差值的语法元素。用于指示DC残余数据的语法元素的实例包含用以指示残余的depth_dc_abs和用以指示正负号的depth_dc_sign_flag。
在确定深度CU是否经帧间译码或经帧内译码(254)之后,视频解码器30即刻对当前深度PU的参考样本进行帧间预测(256)或帧内预测(258)。视频解码器30随后使用在用于深度帧内或深度帧内模式的单个SDC语法结构中用信号表示或在分别用于深度帧内模式或深度帧间模式的同一SDC语法结构的单独实例中用信号表示的SDC残余数据来重构深度CU的PU的分区。举例来说,视频解码器30将DC残余值添加到经帧内或经帧间预测PU的预测样本以重构原始样本。
如果用于由SDC产生的残余值的语法结构共享相同语法元素和/或相同语法结构、上下文模型和二进制化过程,例如对于由视频编码器20和视频解码器30执行的上下文自适应二进制算术译码(CABAC)熵译码过程,那么针对用于深度帧内预测和深度帧间预测模式两者的相关语法元素可统一。举例来说,用于由SDC产生的残余值的语法元素可使用用于深度帧内预测模式和深度帧间预测模式两者的相同上下文模型由视频编码器20熵编码且由视频解码器30熵解码。
再次,作为对使用单个SDC语法结构的一个替代方案,同一SDC语法结构的单独实例可由视频编码器20编码且由视频解码器30解码以提供用于深度帧内和深度帧间模式的SDC残余数据。可对SDC语法结构的第一实例进行译码(即,编码或解码)以提供用于深度帧内模式的SDC残余数据,且可对SDC语法结构的第二实例进行译码以提供用于深度帧间模式的SDC残余数据。取决于哪一深度模式(帧内或帧间)用于深度CU,视频解码器30从SDC语法结构的相关实例(例如,用于帧内的第一实例和用于帧间的第二实例)解码和检索语法元素,且使用由所述语法元素指示的DC残余数据来重构深度CU。在此实例中,针对语法结构的每一实例在语法结构中使用相同语法元素。视频编码器20和视频编码器30可维持单独上下文和/或二进制化以用于对SDC语法结构的单独实例进行熵译码。替代地,可使用相同上下文和/或二进制化对单独实例进行熵译码(例如,CABAC)。
图11是说明在解码器侧使用对SDC译码的实例约束的流程图。如图11中所示,视频解码器30对例如sdc_flag的SDC语法元素进行解码(262)。当SDC语法元素指示例如对于CU使用SDC时(264),视频解码器30应用约束以使得例如针对当前CU停用脉码调制(PCM)(266)。当SDC译码未用于CU时,PCM可保持经启用(267)。以此方式,视频解码器30将其译码操作约束为当SDC针对CU用信号表示时不包括PCM。通过PCM停用的约束,在一些实例中,视频解码器30无需剖析PCM模式信息。
图12是说明在解码器侧使用对SDC译码的另一实例约束的流程图。作为额外约束的实例,视频解码器30可确定当前CU的分区大小(268),或者切片、图片或视频序列中待译码的每一CU的分区大小。在一个实例中,如果当前CU的分区大小不等于2Nx2N,那么视频解码器30针对相关CU停用SDC(272)。如果分区大小等于2Nx2N,那么视频解码器30可使用SDC(270)。SDC的使用将取决于用于CU的sdc_flag的值。以此方式,视频解码器30应用约束以使得SDC仅用于具有2Nx2N的分区大小的CU。作为一个替代方案,视频解码器30可应用约束以使得SDC仅用于具有2Nx2N的分区大小的帧间CU和具有2Nx2N或NxN的分区大小的帧内CU。视频编码器20可经配置以如上文所描述仅针对特定分区大小应用SDC模式。然而,通过在解码器侧施加约束,视频编码器20可能不必用信号表示哪一特定CU使用SDC模式预测。而是,视频编码器20可简单地产生SDC语法元素以指示SDC是否用于深度帧内和深度帧间模式两者,且接着将SDC应用于满足分区大小要求的CU。通过此约束,视频解码器30将非SDC译码应用于并不满足适用的分区大小要求的CU。
上文所描述的技术可由视频编码器20(图1及5)及/或视频解码器30(图1及6)执行,其两者可大体上被称作视频译码器。另外,视频译码在适用时可大体上涉及视频编码和/或视频解码。
虽然大体上相对于3D-HEVC描述本发明的技术,但不以此方式限制所述技术。上述技术也可以适用于用于视频译码的其它当前标准或未来标准。举例来说,用于深度译码的技术也可以适用于要求深度分量的译码的其它当前或未来标准,例如用于3D视频译码或其它应用。
在一或多个实例中,本文所述的功能可以用硬件、软件、固件或其任何组合来实施。如果用软件实施,则所述功能可作为一或多个指令或代码在计算机可读媒体上存储或传输,且由基于硬件的处理单元执行。计算机可读媒体可包含计算机可读存储媒体,所述计算机可读存储媒体对应于有形媒体,例如数据存储媒体或包含(例如)根据通信协议促进计算机程序从一位置传送至另一位置的任何媒体的通信媒体。以此方式,计算机可读媒体大体上可对应于(1)有形计算机可读存储媒体,其为非暂时性的,或(2)通信媒体,例如信号或载波。数据存储媒体可为可由一或多个计算机或一或多个处理器存取以检索用于实施本发明中描述的技术的指令、代码及/或数据结构的任何可用媒体。计算机程序产品可以包含计算机可读媒体。
借助于实例而非限制,此类计算机可读存储媒体可包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储装置、磁盘存储装置或其它磁性存储装置、快闪存储器或可以用来存储指令或数据结构的形式的所需程序代码并且可以由计算机存取的任何其它媒体。并且,可恰当地将任何连接称作计算机可读媒体。举例来说,如果使用同轴缆线、光纤缆线、双绞线、数字订户线(DSL)或例如红外线、无线电和微波等无线技术从网站、服务器或其它远程源传输指令,那么同轴缆线、光纤缆线、双绞线、DSL或例如红外线、无线电和微波等无线技术包含在媒体的定义中。但是,应理解,所述计算机可读存储媒体和数据存储媒体并不包含连接、载波、信号或其它暂时性媒体,而是实际上针对于非暂时性有形存储媒体。如本文中所使用,磁盘和光盘包含压缩光盘(CD)、激光光盘、光学光盘、数字多功能光盘(DVD)、软性磁盘和蓝光光盘,其中磁盘通常以磁性方式再现数据,而光盘利用激光以光学方式再现数据。以上各项的组合也应包括在计算机可读媒体的范围内。
可由例如一或多个数字信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、现场可编程逻辑阵列(FPGA)或其它等效集成或离散逻辑电路等一或多个处理器来执行指令。因此,如本文中所使用的术语“处理器”可指代上述结构或适合于实施本文中所描述的技术的任何其它结构中的任一者。另外,在一些方面中,本文中所描述的功能性可以在经配置用于编码和解码的专用硬件和/或软件模块内提供,或者并入在组合编解码器中。并且,可将所述技术完全实施于一或多个电路或逻辑元件中。
本发明的技术可在多种多样的装置或设备中实施,包含无线手持机、集成电路(IC)或一组IC(例如,芯片组)。本发明中描述各种组件、模块或单元是为了强调经配置以执行所揭示的技术的装置的功能方面,但未必需要通过不同硬件单元实现。实际上,如上文所描述,各种单元可以结合合适的软件及/或固件组合在编解码器硬件单元中,或者通过互操作硬件单元的集合来提供,所述硬件单元包含如上文所描述的一或多个处理器。描述了各种实例。这些和其它实例属于所附权利要求书的范围内。

Claims (87)

1.一种对视频数据进行解码的方法,所述方法包括:
接收指示简化深度译码SDC模式是否用于所述视频数据的深度译码单元CU的帧内预测和帧间预测两者的语法元素;
当所述深度CU经帧内预测时,执行帧内预测以产生预测深度CU;
当所述深度CU经帧间预测时,执行帧间预测以产生所述预测深度CU;
当所述语法元素指示针对所述深度CU的预测单元PU的每一分区使用所述SDC模式时,接收表示所述深度CU的至少一个DC残余值的信息,其中所述至少一个DC残余值表示所述深度CU的所述PU的所述分区与所述预测深度CU的对应分区之间的像素差;以及
使用所述至少一个DC残余值和所述预测深度CU重构所述深度CU。
2.根据权利要求1所述的方法,其中所述语法元素包括具有第一值和第二值的一位旗标,所述第一值指示所述SDC模式用于所述深度CU的帧内预测和帧间预测两者,所述第二值指示所述SDC模式不用于所述深度CU的帧内预测或帧间预测。
3.根据权利要求1所述的方法,其中所述语法元素是第一语法元素,所述方法进一步包括当所述第一语法元素指示使用所述SDC模式时在视频解码器中获得包括指示表示所述深度CU的所述PU的一个分区的所述至少一个DC残余值的所述信息的一或多个第二语法元素的语法结构,其中所述语法结构的所述第二语法元素针对所述深度CU的所述帧内预测和所述帧间预测是相同的。
4.根据权利要求3所述的方法,其中获得所述语法结构包括获得用于所述帧内预测和所述帧间预测的单个语法结构,其中所述单个语法结构包括指示表示所述深度CU的所述帧内预测和所述帧间预测中的一者的所述至少一个DC残余值的所述信息的所述第二语法元素。
5.根据权利要求3所述的方法,其中获得所述语法结构包括获得分别用于所述帧内预测和所述帧间预测的所述同一语法结构的不同实例,所述语法结构的所述不同实例中的每一者包含相同的所述第二语法元素。
6.根据权利要求5所述的方法,其中获得所述语法结构包括使用上下文自适应熵解码过程对语法结构的所述不同实例进行熵解码,且其中用于所述上下文自适应熵解码过程的上下文模型和二进制化过程中的至少一者针对所述语法结构的所述不同实例中的所述相同语法元素是相同的。
7.根据权利要求1所述的方法,其进一步包括当所述语法元素指示使用所述SDC模式时,在所述视频解码器中接收指示是否存在用于至少一个或所述帧内预测或所述帧间预测的所述深度CU的任何分区的任何非零DC残余值的旗标,所述方法进一步包括当所述旗标指示不存在用于所述深度CU的任何分区的非零DC残余值时,不接收表示所述深度CU的所述至少一个DC残余值的所述信息,且推断所述至少一个DC残余值为零。
8.根据权利要求1所述的方法,其进一步包括当所述语法元素指示使用所述SDC模式时,停用所述视频解码器针对所述深度CU的脉码调制PCM解码的使用。
9.根据权利要求1所述的方法,其进一步包括将所述SDC模式的使用限制于具有2Nx2N分区大小的深度CU。
10.根据权利要求1所述的方法,其进一步包括将所述SDC模式的使用限制于具有2Nx2N分区大小的经帧间预测深度CU以及具有2Nx2N或NxN分区大小的经帧内预测深度CU。
11.根据权利要求1所述的方法,其进一步包括当所述语法元素指示使用所述SDC模式时,使用所述SDC模式用于整个经译码视频序列中的多个深度CU中的每一者的重构。
12.根据权利要求11所述的方法,其中获得所述语法元素包括在视频参数集VPS、序列参数集SPS或图片参数集PPS中的一者中获得所述语法元素。
13.根据权利要求1所述的方法,其中获得所述语法元素包括在与所述深度CU相关联的切片片段标头中获得所述语法元素。
14.根据权利要求1所述的方法,其中所述深度CU是当前深度CU,且所述语法元素指示所述SDC模式是否用于所述当前深度CU,所述方法进一步包括当所述语法元素指示使用所述SDC模式时,使用所述SDC模式用于所述当前深度CU的重构。
15.根据权利要求1所述的方法,其中所述深度CU是当前经帧内译码深度CU,且所述语法元素指示所述SDC模式是否用于所述当前深度CU,所述方法进一步包括当执行所述帧内预测以产生所述预测深度CU时,使用来自对应于所述深度CU的深度分量的纹理分量的样本。
16.一种对视频数据进行编码的方法,所述方法包括:
当深度CU经帧内预测时,执行帧内预测以产生预测深度CU;
当所述深度CU经帧间预测时,执行帧间预测以产生所述预测深度CU;
当使用简化深度译码SDC模式时,针对所述深度CU的预测单元PU的每一分区,产生表示所述深度CU的至少一个DC残余值的信息,其中所述至少一个DC残余值表示所述深度CU的所述PU的所述分区与所述预测深度CU的对应分区之间的像素差;
当使用所述SDC模式时,产生指示所述SDC模式用于所述视频数据的深度译码单元CU的帧内预测和帧间预测两者的语法元素;以及
基于表示所述至少一个DC残余值的所述信息和所述语法元素在视频编码器中对所述深度CU进行编码。
17.根据权利要求16所述的方法,其中所述语法元素包括具有第一值和第二值的一位旗标,所述第一值指示所述SDC模式用于所述深度CU的帧内预测和帧间预测两者,所述第二值指示所述SDC模式不用于所述深度CU的帧内预测或帧间预测。
18.根据权利要求16所述的方法,其中所述语法元素是第一语法元素,所述方法进一步包括当使用所述SDC模式时:
在所述视频编码器中产生包括指示表示所述深度CU的所述至少一个DC残余值的信息的一或多个第二语法元素的语法结构,其中所述语法结构的所述第二语法元素针对所述深度CU的所述帧内预测和所述帧间预测是相同的;以及
对用于所述深度CU的所述语法结构进行编码。
19.根据权利要求18所述的方法,其中产生所述语法结构包括产生用于所述帧内预测和所述帧间预测的单个语法结构,其中所述单个语法结构包括指示表示所述深度CU的所述帧内预测和所述帧间预测中的一者的所述至少一个DC残余值的信息的所述第二语法元素。
20.根据权利要求18所述的方法,其中产生所述语法结构包括获得分别用于所述帧内预测和所述帧间预测的所述语法结构的不同实例,所述语法结构的所述不同实例中的每一者包含相同的所述第二语法元素。
21.根据权利要求20所述的方法,其中产生所述语法结构包括使用上下文自适应熵编码过程对所述语法结构的所述不同实例进行熵解码,且其中用于所述上下文自适应熵编码过程的上下文模型针对所述语法结构的所述不同实例是相同的。
22.根据权利要求16所述的方法,其进一步包括当使用所述SDC模式时,产生指示是否存在用于至少一个或所述帧内预测或所述帧间预测的所述深度CU的任何分区的任何非零DC残余值的旗标,所述方法进一步包括当所述旗标指示不存在用于所述深度CU的任何分区的非零DC残余值时,不产生表示所述深度CU的所述至少一个DC残余值的所述信息。
23.根据权利要求16所述的方法,其进一步包括将所述SDC模式的使用限制于具有2Nx2N分区大小的深度CU。
24.根据权利要求16所述的方法,其进一步包括将所述SDC模式的使用限制于具有2Nx2N分区大小的经帧间预测深度CU以及具有2Nx2N或NxN分区大小的经帧内预测深度CU。
25.根据权利要求16所述的方法,其进一步包括对所述语法元素进行编码以指示使用所述SDC模式用于整个经译码视频序列中的多个深度CU中的每一者。
26.根据权利要求25所述的方法,其中对所述语法元素进行编码包括在视频参数集VPS、序列参数集SPS或图片参数集PPS中的一者中对所述语法元素进行编码。
27.根据权利要求16所述的方法,其中对所述语法元素进行编码包括在与所述深度CU相关联的切片片段标头中对所述语法元素进行编码。
28.根据权利要求16所述的方法,其中所述深度CU是当前深度CU,且所述语法元素指示所述SDC模式是否用于所述当前深度CU,所述方法进一步包括对用于所述当前深度CU的所述语法元素进行编码。
29.根据权利要求1所述的方法,其中所述深度CU是当前经帧内译码深度CU,且所述语法元素指示所述SDC模式是否用于所述当前深度CU,所述方法进一步包括当执行所述帧内预测以产生所述预测深度CU时,使用来自对应于所述深度CU的深度分量的纹理分量的样本。
30.一种视频译码器,其包括:
存储器,其存储视频数据;以及
一或多个处理器,其经配置以:
对指示简化深度译码SDC模式是否用于所述视频数据的深度译码单元CU的帧内预测和帧间预测两者的语法元素进行译码;
当所述深度CU经帧内预测时,执行帧内预测以产生预测深度CU;
当所述深度CU经帧间预测时,执行帧间预测以产生所述预测深度CU;以及
当使用所述SDC模式时,针对所述深度CU的预测单元PU的每一分区,对表示所述深度CU的至少一个DC残余值的信息进行译码,其中所述至少一个DC残余值表示所述深度CU的所述PU的所述分区与所述预测深度CU的对应分区之间的像素差。
31.根据权利要求30所述的视频译码器,其中所述视频译码器包括视频解码器,且所述一或多个处理器经配置以对所述语法元素进行解码,对表示所述至少一个DC残余值的信息进行解码,且使用所述至少一个DC残余值和所述预测深度CU重构所述深度CU。
32.根据权利要求30所述的视频译码器,其中所述视频译码器包括视频编码器,且所述一或多个处理器经配置以对表示所述至少一个DC残余值的所述信息和所述语法元素进行编码。
33.根据权利要求30所述的视频译码器,其中所述语法元素包括具有第一值和第二值的旗标,所述第一值指示所述SDC模式用于所述深度CU的帧内预测和帧间预测两者,所述第二值指示所述SDC模式不用于所述深度CU的帧内预测或帧间预测。
34.根据权利要求30所述的视频译码器,其中所述语法元素是第一语法元素,且所述一或多个处理器经配置以当所述第一语法元素指示使用所述SDC模式时,对包括指示表示所述深度CU的所述至少一个DC残余值的所述信息的一或多个第二语法元素的语法结构进行译码,且其中所述语法结构的所述第二语法元素针对所述深度CU的所述帧内预测和所述帧间预测是相同的。
35.根据权利要求34所述的视频译码器,其中所述语法结构包括用于所述帧内预测和所述帧间预测的单个语法结构,所述单个语法结构包括指示表示所述深度CU的所述帧内预测和所述帧间预测中的一者的所述至少一个DC残余值的所述信息的所述第二语法元素。
36.根据权利要求34所述的视频译码器,其中所述语法结构包括用于所述帧内预测和所述帧间预测的所述语法结构的不同实例,所述语法结构的所述不同实例中的每一者包含相同的所述第二语法元素。
37.根据权利要求36所述的视频译码器,其中一或多个处理器经配置以使用上下文自适应熵解码过程对所述语法结构的所述不同实例进行熵译码,且其中用于所述上下文自适应熵解码过程的上下文模型针对所述语法结构的所述不同实例是相同的。
38.根据权利要求30所述的视频译码器,其中所述一或多个处理器经配置以当使用所述SDC模式时,对指示是否存在用于所述深度CU的任何分区的任何非零DC残余值的旗标进行译码,并且当所述旗标指示不存在用于所述深度CU的任何分区的非零DC残余值时,不对表示所述深度CU的所述至少一个DC残余值的所述信息进行译码。
39.根据权利要求30所述的视频译码器,其中所述视频译码器包括视频解码器,且其中所述一或多个处理器经配置以当所述语法元素指示使用所述SDC模式时,停用所述视频解码器针对所述深度CU的脉码调制PCM解码的使用。
40.根据权利要求30所述的视频译码器,其中所述视频译码器包括视频解码器,其中所述一或多个处理器经配置以将所述SDC模式的使用限制于具有2Nx2N分区大小的深度CU。
41.根据权利要求30所述的视频译码器,其中所述视频译码器包括视频解码器,其中所述一或多个处理器经配置以将所述SDC模式的使用限制于具有2Nx2N分区大小的经帧间预测深度CU以及具有2Nx2N或NxN分区大小的经帧内预测深度CU。
42.根据权利要求30所述的视频译码器,其中所述视频译码器包括视频解码器,且其中所述一或多个处理器经配置以当所述语法元素指示使用所述SDC模式时,使用所述SDC模式用于整个经译码视频序列中的多个深度CU中的每一者的重构。
43.根据权利要求30所述的视频译码器,其中所述一或多个处理器经配置以在视频参数集VPS、序列参数集SPS或图片参数集PPS中的一者中对所述语法元素进行译码。
44.根据权利要求30所述的视频译码器,其中所述一或多个处理器经配置以在与所述深度CU相关联的切片片段标头中对所述语法元素进行译码。
45.根据权利要求30所述的视频译码器,其中所述视频译码器包括视频解码器,其中所述深度CU是当前深度CU,且所述语法元素指示所述SDC模式是否用于所述当前深度CU,且所述一或多个处理器经配置以当所述语法元素指示使用所述SDC模式时,使用所述SDC模式用于所述当前深度CU的重构。
46.一种视频译码器,其包括:
用于对指示简化深度译码SDC模式是否用于视频数据的深度译码单元CU的帧内预测和帧间预测两者的语法元素进行译码的装置;
用于当所述深度CU经帧内预测时执行帧内预测以产生预测深度CU的装置;
用于当所述深度CU经帧间预测时执行帧间预测以产生所述预测深度CU的装置;以及
用于当使用所述SDC模式时针对所述深度CU的预测单元PU的每一分区对表示所述深度CU的至少一个DC残余值的信息进行译码的装置,其中所述至少一个DC残余值表示所述深度CU的所述PU的所述分区与所述预测深度CU的对应分区之间的像素差。
47.根据权利要求46所述的视频译码器,其中所述视频译码器包括视频解码器,且所述用于对所述语法元素进行译码的装置包括用于对所述语法元素进行解码的装置,所述译码器进一步包括用于使用所述至少一个DC残余值和所述预测深度CU在所述视频解码器中重构所述深度CU的装置。
48.一种非暂时性计算机可读存储媒体,其包括存储于其上的指令,所述指令当执行时致使视频译码器的一或多个处理器进行以下操作:
对指示简化深度译码SDC模式是否用于所述视频数据的深度译码单元CU的帧内预测和帧间预测两者的语法元素进行译码;
当所述深度CU经帧内预测时,执行帧内预测以产生预测深度CU;
当所述深度CU经帧间预测时,执行帧间预测以产生所述预测深度CU;以及
当使用所述SDC模式时针对所述深度CU的预测单元PU的每一分区对表示所述深度CU的至少一个DC残余值的信息进行译码,其中所述至少一个DC残余值表示所述深度CU的所述PU的所述分区与所述预测深度CU的对应分区之间的像素差。
49.根据权利要求48所述的计算机可读媒体,其中所述视频译码器包括视频解码器,且致使所述一或多个处理器对所述语法元素进行译码的所述指令包括致使所述一或多个处理器对所述语法元素进行解码的指令,所述计算机可读存储媒体进一步包括致使所述一或多个处理器使用所述至少一个DC残余值和所述预测深度CU重构所述深度CU的指令。
50.一种对视频数据进行解码的方法,所述方法包括:
当所述视频数据的深度译码单元CU经帧内预测时,执行帧内预测以产生预测深度CU;
当所述深度CU经帧间预测时,执行帧间预测以产生所述预测深度CU;
当使用简化深度译码SDC模式时,获得包括指示表示所述深度CU的预测单元PU的分区的至少一个DC残余值的信息的一或多个语法元素的语法结构,其中所述语法结构的所述语法元素针对所述帧内预测和所述帧间预测是相同的;以及
使用所述至少一个DC残余值和所述预测深度CU重构所述深度CU。
51.根据权利要求50所述的方法,其中获得所述语法结构包括获得用于所述帧内预测和所述帧间预测的单个语法结构,其中所述单个语法结构包括指示表示所述深度CU的所述帧内预测和所述帧间预测中的一者的所述至少一个DC残余值的信息的所述语法元素。
52.根据权利要求50所述的方法,其中获得所述语法结构包括获得用于所述帧内预测和所述帧间预测的所述同一语法结构的不同实例,所述同一语法结构的所述不同实例中的每一者包含相同的所述语法元素。
53.根据权利要求52所述的方法,其中获得所述同一语法结构的所述不同实例包括使用上下文自适应熵解码过程对所述语法结构的所述不同实例进行熵解码,且其中用于所述上下文自适应熵解码过程的上下文模型针对所述语法结构的所述不同实例是相同的。
54.根据权利要求50所述的方法,其中由所述语法元素指示的所述信息表示所述深度CU的所述DC残余值的绝对值以及所述DC残余值的正负号。
55.一种对视频数据进行编码的方法,所述方法包括:
当所述视频数据的深度译码单元CU经帧内预测时,执行帧内预测以产生预测深度CU;
当所述深度CU经帧间预测时,执行帧间预测以产生所述预测深度CU;
当使用简化深度译码SDC模式时,对包括指示表示所述深度CU的预测单元PU的分区的至少一个DC残余值的信息的一或多个语法元素的语法结构进行译码,其中所述语法结构的所述语法元素针对所述帧内预测和所述帧间预测是相同的;以及
基于表示所述至少一个DC残余值的所述信息对所述深度CU进行编码。
56.根据权利要求55述的方法,其中对所述语法结构进行编码包括对用于所述帧内预测和所述帧间预测的单个语法结构进行编码,其中所述单个语法结构包括指示表示所述深度CU的所述帧内预测和所述帧间预测中的一者的所述至少一个DC残余值的信息的所述语法元素。
57.根据权利要求55所述的方法,其中对所述语法结构进行编码包括对用于所述帧内预测和所述帧间预测的所述同一语法结构的不同实例进行编码,所述同一语法结构的所述不同实例中的每一者包含相同的所述语法元素。
58.根据权利要求57所述的方法,其中对所述同一语法结构的所述不同实例进行编码包括使用上下文自适应熵编码过程对所述语法结构的所述不同实例进行熵编码,且其中用于所述上下文自适应熵编码过程的上下文模型针对所述语法结构的所述不同实例是相同的。
59.根据权利要求50所述的方法,其中由所述语法元素指示的所述信息表示所述深度CU的所述DC残余值的绝对值以及所述DC残余值的正负号。
60.一种视频译码器,其包括:
存储器,其存储视频数据;以及
一或多个处理器,其经配置以:
当所述视频数据的深度译码单元CU经帧内预测时,执行帧内预测以产生所述视频数据的预测深度CU;
当所述深度CU经帧间预测时,执行帧间预测以产生所述视频数据的所述预测深度CU;以及
当使用简化深度译码SDC模式时,对包括指示表示所述深度CU的预测单元PU的分区的至少一个DC残余值的信息的一或多个语法元素的语法结构进行译码,其中所述语法结构的所述语法元素针对所述帧内预测模式和所述帧间预测模式是相同的。
61.根据权利要求60所述的视频译码器,其中所述视频译码器包括视频解码器,且所述一或多个处理器经配置以对所述语法结构中的所述语法元素进行解码以获得表示所述至少一个DC残余值的所述信息,且使用所述至少一个DC残余值和所述预测深度CU重构所述深度CU。
62.根据权利要求60所述的视频译码器,其中所述视频译码器包括视频编码器,且所述一或多个处理器经配置以对所述语法结构中的所述语法元素进行编码以指示表示所述至少一个DC残余值的所述信息和所述语法元素。
63.根据权利要求60所述的视频译码器,其中所述语法结构包括用于所述帧内预测和所述帧间预测的单个语法结构,其中所述单个语法结构包括指示表示所述深度CU的所述帧内预测和所述帧间预测中的一者的所述至少一个DC残余值的信息的所述语法元素。
64.根据权利要求60所述的视频译码器,其中所述语法结构包括用于所述帧内预测和所述帧间预测的所述同一语法结构的不同实例,所述同一语法结构的所述不同实例中的每一者包含相同的所述语法元素。
65.根据权利要求64所述的方法,其中所述一或多个处理器经配置以使用上下文自适应熵译码过程对所述语法结构的所述不同实例进行熵译码,且其中用于所述上下文自适应熵译码的上下文模型针对所述语法结构的所述不同实例是相同的。
66.根据权利要求60所述的方法,其中由所述语法元素指示的所述信息表示所述深度CU的所述DC残余值的绝对值以及所述DC残余值的正负号。
67.一种视频译码器,其包括:
用于当视频数据的深度译码单元CU经帧内预测时执行帧内预测以产生预测深度CU的装置;
用于当所述深度CU经帧间预测时执行帧间预测以产生所述预测深度CU的装置;以及
用于当使用简化深度译码SDC模式时对包括指示表示所述深度CU的预测单元PU的分区的至少一个DC残余值的信息的一或多个语法元素的语法结构进行译码的装置,其中所述语法结构的所述语法元素针对所述帧内预测模式和所述帧间预测模式是相同的。
68.根据权利要求67所述的视频译码器,其中所述视频译码器是视频解码器,所述视频解码器包括用于使用所述至少一个DC残余值和所述预测深度CU重构所述深度CU的装置。
69.一种非暂时性计算机可读存储媒体,其包括存储于其上的指令,所述指令当执行时致使视频译码器的一或多个处理器进行以下操作:
当视频数据的深度译码单元CU经帧内预测时,执行帧内预测以产生预测深度CU;
当所述深度CU经帧间预测时,执行帧间预测以产生所述预测深度CU;以及
用于当使用简化深度译码SDC模式时对包括指示表示所述深度CU的预测单元PU的分区的至少一个DC残余值的信息的一或多个语法元素的语法结构进行译码的装置,其中所述语法结构的所述语法元素针对所述帧内预测模式和所述帧间预测模式是相同的。
70.根据权利要求69所述的视频译码器,其中所述视频译码器是视频解码器,所述视频译码器包括用于使用所述至少一个DC残余值和所述预测深度CU重构所述深度CU的装置。
71.一种对视频数据进行解码的方法,所述方法包括:
接收第一语法元素,所述第一语法元素指示简化深度译码SDC模式是否针对经译码视频数据的整个序列的深度译码单元CU经启用;
接收第二语法元素,所述第二语法元素指示所述SDC模式是否用于所述序列的所述深度CU中的一者的帧内预测和帧间预测两者;
当所述序列的所述深度CU中的所述一者经帧内预测时,执行帧内预测以产生预测深度CU;
当所述序列的所述深度CU中的所述一者经帧间预测时,执行帧间预测以产生所述预测深度CU;
当所述第二语法元素指示使用所述SDC模式时,获得表示用于所述序列的所述深度CU中的所述一者的预测单元PU的分区的至少一个DC残余值的信息;以及
使用所述至少一个DC残余值和所述相应预测深度CU重构所述序列的所述深度CU中的所述一者的所述PU的所述分区。
72.根据权利要求71所述的方法,其中接收所述第一语法元素包括在视频参数集VPS、序列参数集SPS或图片参数集PPS中的一者中接收所述第一语法元素。
73.根据权利要求71所述的方法,其中所述DC残余值指示所述序列的所述CU中的一者的所述PU的所述分区中的像素的平均深度值与预测深度分区中的像素的平均深度值之间的差。
74.根据权利要求71所述的方法,其中所述第一语法元素包括具有第一值和第二值的一位旗标,所述第一值指示所述SDC模式经启用,所述第二值指示所述SDC模式未经启用。
75.一种对视频数据进行编码的方法,所述方法包括:
对指示简化深度译码SDC模式是否针对经译码视频数据的整个序列的深度译码单元CU经启用的语法元素进行编码;
对指示所述SDC模式是否用于所述序列的所述深度CU中的一者的帧内预测和帧间预测两者的第二语法元素进行编码;
当所述序列的所述深度CU中的一者经帧内预测时,执行帧内预测以产生预测深度CU;
当所述序列的所述深度CU中的一者经帧间预测时,执行帧间预测以产生所述预测深度CU;以及
当所述第二语法元素指示使用所述SDC模式时,对表示用于所述序列的所述深度CU中的所述一者的预测单元PU的分区的至少一个DC残余值的信息进行编码。
76.根据权利要求75所述的方法,其中对所述第一语法元素进行编码包括在视频参数集VPS、序列参数集SPS或图片参数集PPS中的一者中对所述语法元素进行编码。
77.根据权利要求75所述的方法,其中所述DC残余值指示所述序列的所述CU中的一者的所述PU的所述分区中的像素的平均深度值与预测深度分区中的像素的平均深度值之间的差。
78.根据权利要求75所述的方法,其中所述第一语法元素包括具有第一值和第二值的一位旗标,所述第一值指示所述SDC模式经启用,所述第二值指示所述SDC模式未经启用。
79.一种视频译码器,其包括:
存储器,其存储视频数据;以及
一或多个处理器,其经配置以:
对指示简化深度译码SDC模式是否针对所述视频数据的整个码序列的深度译码单元CU经启用的语法元素进行译码;
对指示所述SDC模式是否用于所述序列的所述深度CU中的一者的帧内预测和帧间预测两者的第二语法元素进行译码;
当所述序列的所述深度CU中的一者经帧内预测时,执行帧内预测以产生预测深度CU;
当所述序列的所述深度CU中的一者经帧间预测时,执行帧间预测以产生所述预测深度CU;以及
当所述第二语法元素指示使用所述SDC模式时,对表示用于所述序列的所述深度CU中的所述一者的预测单元PU的分区的至少一个DC残余值的信息进行译码。
80.根据权利要求79所述的视频译码器,其中所述视频译码器是视频解码器,且所述一或多个处理器经配置以使用所述至少一个DC残余值和所述相应预测深度CU重构所述序列的所述深度CU中的所述一者的所述PU的所述分区。
81.根据权利要求79所述的视频译码器,其中所述一或多个处理器经配置以在视频参数集VPS、序列参数集SPS或图片参数集PPS中的一者中对所述语法元素进行译码。
82.根据权利要求79所述的视频译码器,其中所述DC残余值指示所述CU的预测单元的分区中的像素的平均深度值与预测深度分区中的像素的平均深度值之间的差。
83.根据权利要求79所述的视频译码器,其中所述第一语法元素包括一位旗标,在所述视频解码器中使用所述至少一个DC残余值和所述相应预测深度CU重构所述序列的所述深度CU中的所述一者的所述PU的所述分区。
84.一种视频译码器,其包括:
用于对指示简化深度译码SDC模式是否针对经译码视频数据的整个序列的深度译码单元CU经启用的语法元素进行译码的装置;
用于对指示所述SDC模式是否用于所述序列的所述深度CU中的一者的帧内预测和帧间预测两者的第二语法元素进行译码的装置;
用于当所述序列的所述深度CU中的一者经帧内预测时在视频编码器中执行帧内预测以产生预测深度CU的装置;
用于当所述序列的所述深度CU中的一者经帧间预测时在所述视频编码器中执行帧间预测以产生所述预测深度CU的装置;
用于当所述第二语法元素指示使用所述SDC模式时对表示用于所述序列的所述深度CU中的所述一者的预测单元PU的分区的至少一个DC残余值的信息进行译码的装置。
85.根据权利要求84所述的视频译码器,其进一步包括用于在视频参数集VPS、序列参数集SPS或图片参数集PPS中的一者中对所述第一语法元素进行译码的装置。
86.一种非暂时性计算机可读存储媒体,其包括存储于其上的指令,所述指令在执行后即刻致使视频译码器的一或多个处理器进行以下操作:
对指示简化深度译码SDC模式是否针对经译码视频数据的整个序列的深度译码单元CU经启用的语法元素进行译码;
对指示所述SDC模式是否用于所述序列的所述深度CU中的一者的帧内预测和帧间预测两者的第二语法元素进行译码;
当所述序列的所述深度CU中的一者经帧内预测时,执行帧内预测以产生预测深度CU;
当所述序列的所述深度CU中的一者经帧间预测时,执行帧间预测以产生所述预测深度CU;
当所述第二语法元素指示使用所述SDC模式时,对表示用于所述序列的所述深度CU中的所述一者的预测单元PU的分区的至少一个DC残余值的信息进行译码。
87.根据权利要求86所述的计算机可读存储媒体,其进一步包括致使所述一或多个处理器在视频参数集VPS、序列参数集SPS或图片参数集PPS中的一者中对所述第一语法元素进行译码的指令。
CN201380081514.8A 2013-12-13 2013-12-13 解码和编码视频数据的方法和装置及计算机可读存储介质 Active CN105934948B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2013/001562 WO2015085449A1 (en) 2013-12-13 2013-12-13 Signaling of simplified depth coding (sdc) for depth intra-and inter – prediction modes in 3d video coding

Publications (2)

Publication Number Publication Date
CN105934948A true CN105934948A (zh) 2016-09-07
CN105934948B CN105934948B (zh) 2019-04-02

Family

ID=53370425

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201380081514.8A Active CN105934948B (zh) 2013-12-13 2013-12-13 解码和编码视频数据的方法和装置及计算机可读存储介质

Country Status (7)

Country Link
US (2) US10110895B2 (zh)
EP (1) EP3080987B1 (zh)
JP (1) JP6462693B2 (zh)
KR (1) KR102057369B1 (zh)
CN (1) CN105934948B (zh)
HK (1) HK1224117A1 (zh)
WO (1) WO2015085449A1 (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111279699A (zh) * 2019-04-26 2020-06-12 深圳市大疆创新科技有限公司 视频编解码的方法和装置
CN111937394A (zh) * 2018-04-02 2020-11-13 高通股份有限公司 用角度模式扩展的位置相关帧内预测组合
WO2021068920A1 (en) * 2019-10-10 2021-04-15 Beijing Bytedance Network Technology Co., Ltd. Use of non-rectangular partitions in video coding
CN112840654A (zh) * 2018-10-12 2021-05-25 韦勒斯标准与技术协会公司 使用多假设预测的视频信号处理方法和装置
CN112913248A (zh) * 2018-10-25 2021-06-04 交互数字Vc控股公司 用译码类型或译码树类型的信令进行视频编码和解码的方法和装置
CN113228634A (zh) * 2018-12-31 2021-08-06 Vid拓展公司 组合的帧内及帧间预测
CN113348665A (zh) * 2019-08-01 2021-09-03 华为技术有限公司 编码器、解码器及色度帧内模式推导的对应方法
CN113785567A (zh) * 2019-05-09 2021-12-10 高通股份有限公司 视频译码中的仿射线性加权帧内预测
CN114072849A (zh) * 2019-06-28 2022-02-18 字节跳动有限公司 屏幕内容编解码中的色度帧内模式推导
US11689735B2 (en) 2019-09-01 2023-06-27 Beijing Bytedance Network Technology Co., Ltd. Alignment of prediction weights in video coding
CN117156133A (zh) * 2023-10-27 2023-12-01 淘宝(中国)软件有限公司 一种视频编码的帧间预测模式选择方法及装置

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10110895B2 (en) 2013-12-13 2018-10-23 Qualcomm Incorporated Signaling of simplified depth coding (SDC) for depth intra- and inter-prediction modes in 3D video coding
KR20150076135A (ko) * 2013-12-26 2015-07-06 삼성전자주식회사 뎁스 부호화 방법 및 그 장치, 복호화 방법 및 그 장치
EP3140988B1 (en) * 2014-06-26 2019-09-11 Huawei Technologies Co., Ltd. Method and device for reducing a computational load in high efficiency video coding
US20170134732A1 (en) * 2015-11-05 2017-05-11 Broadcom Corporation Systems and methods for digital media communication using syntax planes in hierarchical trees
US10944963B2 (en) * 2016-05-25 2021-03-09 Arris Enterprises Llc Coding weighted angular prediction for intra coding
US10771781B2 (en) * 2018-03-12 2020-09-08 Electronics And Telecommunications Research Institute Method and apparatus for deriving intra prediction mode
WO2020057530A1 (en) 2018-09-18 2020-03-26 Huawei Technologies Co., Ltd. Coding method, device, system
CN112740689B (zh) 2018-09-18 2024-04-12 华为技术有限公司 视频编码器、视频解码器及对应方法
US10848763B2 (en) 2018-11-14 2020-11-24 Tencent America LLC Method and apparatus for improved context design for prediction mode and coded block flag (CBF)
US11889085B2 (en) * 2019-03-08 2024-01-30 Telefonaktiebolaget Lm Ericsson (Publ) Methods providing encoding/decoding of dependent/independent partitions and related devices
WO2020196655A1 (ja) * 2019-03-25 2020-10-01 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 符号化装置、復号装置、符号化方法、および復号方法
US11375243B2 (en) * 2019-07-17 2022-06-28 Tencent America LLC Method and apparatus for video coding
US20220109863A1 (en) 2020-10-02 2022-04-07 Tencent America LLC Method and apparatus for video coding

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2579592A1 (en) * 2011-10-04 2013-04-10 Thomson Licensing Method and device for inter-view-predictive encoding of data of a view, device for decoding and computer-readable storage medium carrying encoded data of a view
CN103200405A (zh) * 2013-04-03 2013-07-10 清华大学 一种3dv视频编码方法及编码器
CN103327336A (zh) * 2013-06-28 2013-09-25 华为技术有限公司 一种三维编码的方法及设备

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100319155B1 (ko) 1999-02-01 2001-12-29 구자홍 신뢰도를 이용한 대표칼라 지정방법
EP2237557A1 (en) 2009-04-03 2010-10-06 Panasonic Corporation Coding for filter coefficients
KR101791078B1 (ko) * 2010-04-16 2017-10-30 에스케이텔레콤 주식회사 영상 부호화/복호화 장치 및 방법
KR101379188B1 (ko) 2010-05-17 2014-04-18 에스케이 텔레콤주식회사 인트라 블록 및 인터 블록이 혼합된 코딩블록을 이용하는 영상 부호화/복호화 장치 및 그 방법
US9497472B2 (en) * 2010-11-16 2016-11-15 Qualcomm Incorporated Parallel context calculation in video coding
KR20120052739A (ko) * 2010-11-16 2012-05-24 삼성전자주식회사 디스플레이 구동 장치 및 그것의 영상 데이터 압축 및 복원 방법
US9398313B2 (en) * 2010-12-29 2016-07-19 Nokia Technologies Oy Depth map coding
US20120189052A1 (en) * 2011-01-24 2012-07-26 Qualcomm Incorporated Signaling quantization parameter changes for coded units in high efficiency video coding (hevc)
US9485517B2 (en) * 2011-04-20 2016-11-01 Qualcomm Incorporated Motion vector prediction with motion vectors from multiple views in multi-view video coding
US8929455B2 (en) * 2011-07-01 2015-01-06 Mitsubishi Electric Research Laboratories, Inc. Method for selecting transform types from mapping table for prediction modes
US11496760B2 (en) * 2011-07-22 2022-11-08 Qualcomm Incorporated Slice header prediction for depth maps in three-dimensional video codecs
US9800870B2 (en) 2011-09-16 2017-10-24 Qualcomm Incorporated Line buffer reduction for short distance intra-prediction
CN104247423B (zh) * 2012-03-21 2018-08-07 联发科技(新加坡)私人有限公司 可伸缩视频编码系统的帧内模式编码方法和装置
CN103533324B (zh) * 2012-07-03 2017-04-05 乐金电子(中国)研究开发中心有限公司 一种深度图像帧内编码方法、装置及编码器
CN104104964B (zh) * 2013-04-09 2019-03-12 乐金电子(中国)研究开发中心有限公司 一种深度图像帧间编码、解码方法、编码器及解码器
CN103237216B (zh) * 2013-04-12 2017-09-12 华为技术有限公司 深度图像的编解码方法和编解码装置
US9571809B2 (en) * 2013-04-12 2017-02-14 Intel Corporation Simplified depth coding with modified intra-coding for 3D video coding
US9497485B2 (en) * 2013-04-12 2016-11-15 Intel Corporation Coding unit size dependent simplified depth coding for 3D video coding
WO2015043501A1 (en) 2013-09-27 2015-04-02 Qualcomm Incorporated Residual coding for depth intra prediction modes
KR20150043227A (ko) * 2013-10-14 2015-04-22 삼성전자주식회사 뎁스 인터 부호화 방법 및 그 장치, 복호화 방법 및 그 장치
US10110895B2 (en) 2013-12-13 2018-10-23 Qualcomm Incorporated Signaling of simplified depth coding (SDC) for depth intra- and inter-prediction modes in 3D video coding

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2579592A1 (en) * 2011-10-04 2013-04-10 Thomson Licensing Method and device for inter-view-predictive encoding of data of a view, device for decoding and computer-readable storage medium carrying encoded data of a view
CN103200405A (zh) * 2013-04-03 2013-07-10 清华大学 一种3dv视频编码方法及编码器
CN103327336A (zh) * 2013-06-28 2013-09-25 华为技术有限公司 一种三维编码的方法及设备

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111937394A (zh) * 2018-04-02 2020-11-13 高通股份有限公司 用角度模式扩展的位置相关帧内预测组合
CN112840654B (zh) * 2018-10-12 2024-04-16 韦勒斯标准与技术协会公司 使用多假设预测的视频信号处理方法和装置
CN112840654A (zh) * 2018-10-12 2021-05-25 韦勒斯标准与技术协会公司 使用多假设预测的视频信号处理方法和装置
CN112913248A (zh) * 2018-10-25 2021-06-04 交互数字Vc控股公司 用译码类型或译码树类型的信令进行视频编码和解码的方法和装置
CN113228634A (zh) * 2018-12-31 2021-08-06 Vid拓展公司 组合的帧内及帧间预测
CN111279699A (zh) * 2019-04-26 2020-06-12 深圳市大疆创新科技有限公司 视频编解码的方法和装置
CN113785567A (zh) * 2019-05-09 2021-12-10 高通股份有限公司 视频译码中的仿射线性加权帧内预测
CN114072849A (zh) * 2019-06-28 2022-02-18 字节跳动有限公司 屏幕内容编解码中的色度帧内模式推导
CN114072849B (zh) * 2019-06-28 2023-12-15 字节跳动有限公司 屏幕内容编解码中的色度帧内模式推导
CN113348665A (zh) * 2019-08-01 2021-09-03 华为技术有限公司 编码器、解码器及色度帧内模式推导的对应方法
CN113348665B (zh) * 2019-08-01 2024-01-02 华为技术有限公司 编码器、解码器及色度帧内模式推导的对应方法
US11689735B2 (en) 2019-09-01 2023-06-27 Beijing Bytedance Network Technology Co., Ltd. Alignment of prediction weights in video coding
US11758143B2 (en) 2019-10-10 2023-09-12 Beijing Bytedance Network Technology Co., Ltd Motion vector handling in geometry partition mode
WO2021068920A1 (en) * 2019-10-10 2021-04-15 Beijing Bytedance Network Technology Co., Ltd. Use of non-rectangular partitions in video coding
CN117156133A (zh) * 2023-10-27 2023-12-01 淘宝(中国)软件有限公司 一种视频编码的帧间预测模式选择方法及装置
CN117156133B (zh) * 2023-10-27 2024-02-09 淘宝(中国)软件有限公司 一种视频编码的帧间预测模式选择方法及装置

Also Published As

Publication number Publication date
EP3080987B1 (en) 2021-04-07
EP3080987A1 (en) 2016-10-19
JP6462693B2 (ja) 2019-01-30
WO2015085449A1 (en) 2015-06-18
HK1224117A1 (zh) 2017-08-11
BR112016013489A2 (pt) 2017-08-08
US11039129B2 (en) 2021-06-15
KR20160096624A (ko) 2016-08-16
EP3080987A4 (en) 2017-05-03
US10110895B2 (en) 2018-10-23
CN105934948B (zh) 2019-04-02
US20180241992A1 (en) 2018-08-23
US20160316200A1 (en) 2016-10-27
JP2017505025A (ja) 2017-02-09
KR102057369B1 (ko) 2020-01-22

Similar Documents

Publication Publication Date Title
CN105934948B (zh) 解码和编码视频数据的方法和装置及计算机可读存储介质
CN105103559B (zh) 三维(3d)视频译码方法及装置
CN105052147B (zh) 用于3d-hevc的深度数据的深度译码模式信令
CN105191317B (zh) 视图内以及跨越视图的深度查找表的预测性译码
CN104025602B (zh) 三维视频译码中用信号通知视图合成预测支持
JP6312854B2 (ja) 3dビデオコーディングにおけるデルタdc残差コーディングの簡易化
CN105122812B (zh) 用于三维(3d)视频译码的高级合并模式
CN106105216A (zh) 用于3d视频译码的受约束深度帧内模式译码
CN105874788B (zh) 对3d视频译码中较大预测块的逐段dc译码的简化
CN105612747B (zh) 用于深度帧内译码的楔波样式扩展
CN105027571B (zh) 三维视频译码中导出的视差向量
CN105308956B (zh) 用于深度图帧内译码的预测子
CN105814896A (zh) 3d视频译码中的大型块和深度建模模式(dmm)
KR20160058943A (ko) 심도 인트라 예측 모드들에 대한 잔차 코딩
CN104396250A (zh) 用于3d视频译码的深度图的帧内译码
CN104272741A (zh) 多视图译码和3d译码中的视图相依性
CN106105212A (zh) 简化的子预测单元(sub‑pu)运动参数继承(mpi)
CN104335589A (zh) 用于视频译码的视图间预测的视差向量产生
CN105052145A (zh) 剖析三维视频译码中的语法元素
CN105379286A (zh) 跨层的图片分割的位流限制
CN105580365A (zh) Hevc中的基于子预测单元(pu)的时间运动向量预测和3d-hevc中的子pu设计
CN104429083A (zh) 译码用于视频译码的定时信息
CN105580364A (zh) Hevc中的基于子预测单元(pu)的时间运动向量预测和3d-hevc中的子pu设计
CN105580372A (zh) 用于3d视频译码的组合式双向预测合并候选者
CN104769948A (zh) 在视频译码中执行残差预测

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1224117

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant