CN105103559A - 用于3d-hevc的深度数据的深度译码模式信令 - Google Patents

用于3d-hevc的深度数据的深度译码模式信令 Download PDF

Info

Publication number
CN105103559A
CN105103559A CN201480018166.4A CN201480018166A CN105103559A CN 105103559 A CN105103559 A CN 105103559A CN 201480018166 A CN201480018166 A CN 201480018166A CN 105103559 A CN105103559 A CN 105103559A
Authority
CN
China
Prior art keywords
depth
degree
decoding
syntactic element
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201480018166.4A
Other languages
English (en)
Other versions
CN105103559B (zh
Inventor
张莉
陈颖
赵欣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of CN105103559A publication Critical patent/CN105103559A/zh
Application granted granted Critical
Publication of CN105103559B publication Critical patent/CN105103559B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/161Encoding, multiplexing or demultiplexing different image signal components
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/463Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2213/00Details of stereoscopic systems
    • H04N2213/005Aspects relating to the "3D+depth" image format

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)

Abstract

本发明描述用于使用不同于高效率视频译码HEVC译码模式的深度译码模式来编码及解码以多视图加上深度格式表示的三维3D视频数据的深度数据的技术。3D-HEVC过程中可用的额外深度帧内译码模式的实例包含深度模型化模式DMM、简化深度译码SDC模式及链译码模式CCM中的至少两者。另外,额外深度帧间译码模式的实例包含帧间SDC模式。在一个实例中,所述技术包含在与HEVC语法分开的深度模型化表中用信号通知用于译码3D视频数据的深度数据的深度帧内译码模式。在另一实例中,本发明的技术包含跨越所述深度译码模式中的两者或更多者而统一3D视频数据的深度数据的残差信息的信令。

Description

用于3D-HEVC的深度数据的深度译码模式信令
本申请案主张2013年3月27日申请的第61/805,901号美国临时专利申请案、2013年3月27日申请的第61/805,922号美国临时专利申请案、2013年4月11日申请的第61/811,103号美国临时专利申请案、2013年10月14日申请的第61/890,629号美国临时专利申请案以及2013年10月16日申请的第61/891,816号美国临时专利申请案的权益,以上所有申请案的标题为“用于3D-HEVC的深度图的简化帧内模式信令(SimplifiedIntraModesSignalingofDepthMapsfor3D-HEVC)”,以上申请案中的每一者的整个内容以引用的方式并入本文中。
技术领域
本发明涉及视频译码,并且更确切地说,涉及三维(3D)视频译码。
背景技术
数字视频能力可并入到广泛范围的装置中,包含数字电视、数字直播系统、无线广播系统、个人数字助理(PDA)、膝上型或桌上型计算机、平板计算机、电子图书阅读器、数码相机、数字记录装置、数字媒体播放器、视频游戏装置、视频游戏控制台、蜂窝式或卫星无线电电话、所谓的“智能电话”、视频电话会议装置、视频流式传输装置及其类似者。数字视频装置实施视频压缩技术,例如由MPEG-2、MPEG-4、ITU-TH.263或ITU-TH.264/MPEG-4第10部分高级视频译码(AVC)、ITU-TH.265高效率视频译码(HEVC)界定的标准及这些标准的扩展中所描述的视频译码技术。视频装置可通过实施此类视频压缩技术而更有效率地传输、接收、编码、解码及/或存储数字视频信息。
视频压缩技术执行空间(图片内)预测及/或时间(图片间)预测以减少或移除视频序列中固有的冗余。对于基于块的视频译码来说,视频切片(即,图片或图片的一部分)可以分割成视频块,视频块还可被称作树块、译码单元(CU)及/或译码节点。使用相对于同一图片中的相邻块中的参考样本的空间预测对图片的经帧内译码(I)切片中的视频块进行编码。图片的经帧间编码(P或B)切片中的视频块可使用相对于同一图片中的相邻块中的参考样本的空间预测或相对于其它参考图片中的参考样本的时间预测。
空间或时间预测导致对块的预测块进行译码。残差数据表示待译码的原始块与预测块之间的像素差。经帧间译码块是根据指向形成预测块的参考样本块的运动向量及指示经译码块与预测块之间的差的残差数据编码的。经帧内译码块是根据帧内译码模式及残差数据来编码。为了实现进一步压缩,可以将残差数据从像素域变换到变换域,从而产生残差变换系数,接着可以对残差变换系数进行量化。可扫描最初布置为二维阵列的经量化变换系数,以便产生变换系数的一维向量,且可应用熵译码以实现更多压缩。
可例如从多个视角编码视图来产生多视图译码位流。已经开发利用多视图译码方面的一些三维(3D)视频标准。举例来说,不同视图可传输左眼及右眼视图以支持3D视频。或者,一些3D视频译码过程可应用所谓的多视图加深度译码。在多视图加深度译码中,3D视频位流可不仅含有纹理视图分量而且含有深度视图分量。举例来说,每一视图可包括一个纹理视图分量及一个深度视图分量。
发明内容
一般来说,本发明涉及用于使用不同于高效率视频译码(HEVC)译码模式的深度译码模式编码及解码以多视图加深度格式表示的三维(3D)视频数据的深度数据的技术。3D视频译码过程(例如3D-HEVC过程)中可用的额外深度帧内译码模式的实例包含深度模型化模式(DMM)、简化深度译码(SDC)模式及链译码模式(CCM)中的至少两者。另外,额外深度帧间译码模式的实例包含帧间SDC模式。在一个实例中,本发明的技术包含用信号通知用于在与HEVC语法分开的深度模型化表中译码3D视频数据的深度数据的深度帧内译码模式。在另一实例中,本发明的技术包含跨越包含深度帧内译码模式及深度帧间译码模式的深度译码模式中的两者或更多者统一3D视频数据的深度数据的残差信息的信令。本发明的技术可通过在与HEVC帧内译码模式分开的深度模型化表语法中用信号通知深度帧内译码模式且统一用于所述深度译码模式的残差信息译码机构而减少解码器解析负担且减小所需的上下文模型的数目及二进制化方法。
在一个实例中,本发明针对一种解码视频数据的方法,所述方法包括:解码指示是否针对视频数据启用多个深度帧内译码模式中的任一者的语法元素,其中所述深度帧内译码模式不同于HEVC帧内译码模式。在解码指示启用深度帧内译码模式的语法元素之后,解码深度模型化表,基于所述深度模型化表中的一或多个语法元素而选择深度帧内译码模式中的一者,及使用选定的深度帧内译码模式解码视频数据的深度数据。
在另一实例中,本发明针对一种视频解码装置,其包括经配置以存储视频数据的存储器,及一或多个处理器。所述视频解码装置的所述处理器经配置以:解码指示是否启用多个深度帧内译码模式中的任一者的语法元素,其中所述深度帧内译码模式不同于HEVC帧内译码模式;在解码指示针对视频数据启用所述深度帧内译码模式的语法元素之后,解码深度模型化表;基于深度模型化表中的一或多个语法元素而选择深度帧内译码模式中的一者;及使用选定的深度帧内译码模式解码视频数据的深度数据。
在另一个实例中,本发明针对一种视频解码装置,其包括:用于解码指示是否启用多个深度帧内译码模式中的任一者的语法元素的装置,其中所述深度帧内译码模式不同于HEVC帧内译码模式;在解码指示针对视频数据启用所述深度帧内译码模式的语法元素之后,用于解码深度模型化表的装置;用于基于深度模型化表中的一或多个语法元素而选择深度帧内译码模式中的一者的装置;及用于使用选定的深度帧内译码模式解码视频数据的深度数据的装置。
在额外实例中,本发明针对一种计算机可读媒体,其包括在被执行时致使一或多个处理器进行以下操作的用于解码视频数据的指令:解码指示是否启用多个深度帧内译码模式中的任一者的语法元素,其中所述深度帧内译码模式不同于HEVC帧内译码模式;在解码指示针对视频数据启用所述深度帧内译码模式的语法元素之后,解码深度模型化表;基于深度模型化表中的一或多个语法元素而选择深度帧内译码模式中的一者;及使用选定的深度帧内译码模式解码视频数据的深度数据。
在另一实例中,本发明针对一种编码视频数据的方法,所述方法包括:使用多个深度帧内译码模式中的选定一者编码视频数据的深度数据,其中所述深度帧内译码模式不同于HEVC帧内译码模式;编码指示针对所述视频数据启用深度帧内译码模式的语法元素;及编码包含指示所述选定的深度帧内译码模式的一或多个语法元素的深度模型化表。
在另一个实例中,本发明针对一种视频编码装置,其包括经配置以存储视频数据的存储器,及一或多个处理器。所述视频编码装置的处理器经配置以:使用多个深度帧内译码模式中的选定一者编码视频数据的深度数据,其中所述深度帧内译码模式不同于HEVC帧内译码模式;编码指示针对所述视频数据启用深度帧内译码模式的语法元素;及编码包含指示所述选定的深度帧内译码模式的一或多个语法元素的深度模型化表。
在一个实例中,本发明针对一种解码视频数据的方法,所述方法包括:解码指示所述视频数据的深度数据的残差信息的一组语法元素,其中相同组的语法元素指示多个深度译码模式中的任一者的残差信息;解码指示用于所述视频数据的所述多个深度译码模式中的一者的一或多个语法元素;及使用所述所指示的深度译码模式基于所述深度数据的所述残差信息及相邻参考样本来解码所述视频数据的所述深度数据。
在另一实例中,本发明针对一种视频解码装置,其包括经配置以存储视频数据的存储器,及一或多个处理器。所述视频解码装置的处理器经配置以:解码指示所述视频数据的深度数据的残差信息的一组语法元素,其中相同组的语法元素指示多个深度译码模式中的任一者的残差信息;解码指示用于所述视频数据的所述多个深度译码模式中的一者的一或多个语法元素;及使用所述所指示的深度译码模式基于所述深度数据的所述残差信息及相邻参考样本来解码所述视频数据的所述深度数据。
在另一个实例中,本发明针对一种视频解码装置,其包括:用于解码指示所述视频数据的深度数据的残差信息的一组语法元素的装置,其中相同组的语法元素指示多个深度译码模式中的任一者的残差信息;用于解码指示用于所述视频数据的所述多个深度译码模式中的一者的一或多个语法元素的装置;及用于使用所述所指示的深度译码模式基于所述深度数据的所述残差信息及相邻参考样本来解码所述视频数据的所述深度数据的装置。
在额外实例中,本发明针对一种计算机可读媒体,其包括致使一或多个处理器进行以下操作的用于解码视频数据的指令:解码指示所述视频数据的深度数据的残差信息的一组语法元素,其中相同组的语法元素指示多个深度译码模式中的任一者的残差信息;解码指示用于所述视频数据的所述多个深度译码模式中的一者的一或多个语法元素;及使用所述所指示的深度译码模式基于所述深度数据的所述残差信息及相邻参考样本来解码所述视频数据的所述深度数据。
在另一实例中,本发明针对一种编码视频数据的方法,所述方法包括:使用多个深度译码模式中的选定一者编码视频数据的深度数据,其中编码所述深度数据包括基于所述视频数据的原始深度值及相邻参考样本而产生所述深度数据的残差信息;编码指示用于所述视频数据的所述选定的深度译码模式的一或多个语法元素;及编码指示所述深度数据的所述残差信息的一组语法元素,其中相同组的语法元素指示所述多个深度译码模式中的任一者的残差信息。
在另一个实例中,本发明针对一种视频编码装置,其包括经配置以存储视频数据的存储器,及一或多个处理器。所述视频编码装置的处理器经配置以:使用多个深度译码模式中的选定一者编码视频数据的深度数据以基于所述视频数据的原始深度值及相邻参考样本而产生所述深度数据的残差信息;编码指示用于所述视频数据的所述选定的深度译码模式的一或多个语法元素;及编码指示所述深度数据的所述残差信息的一组语法元素,其中相同组的语法元素指示所述多个深度译码模式中的任一者的残差信息。
在附图和下文描述中阐述本发明的一或多个实例的细节。其它特征、目标和优点将从所述描述、图式以及权利要求书而显而易见。
附图说明
图1是说明可利用本发明的用于深度数据译码的技术的实例性视频编码和解码系统的框图。
图2是说明可实施用于深度数据译码的技术的视频编码器的实例的框图。
图3是说明可实施用于深度数据译码的技术的视频解码器的实例的框图。
图4一般说明与HEVC中的方向性帧内预测模式相关联的预测方向。
图5是展示用于角度帧内预测模式的V及H的值的表。
图6A及6B是分别说明实例性深度分区型式及区边界链译码模式(CCM)中的实例性经译码链的概念图。
图7A及7B是分别说明深度模型化模式(DMM)中的用于8×8块的实例性楔形波型式及用于8×8块的实例性轮廓型式的概念图。
图8A和8B是分别说明楔形波分离线开始/结束位置的实例性粗略子集及DMM中的一个楔形波型式子集内的实例性精细化的概念图。
图9是展示用于不同PU大小的可用的DMM子模式及楔形波型式的数目的表。
图10是说明指示用于编码深度模型化表中的3D视频数据的深度数据的深度帧内译码模式的视频编码器的实例性操作的流程图。
图11是说明确定用于从深度模型化表解码3D视频数据的深度数据的深度帧内译码模式的视频解码器的实例性操作的流程图。
图12是说明使用针对两个或更多个深度译码模式统一的机制来指示3D视频数据的深度数据的残差信息的视频编码器的实例性操作的流程图。
图13是说明使用针对两个或更多个深度译码模式统一的机制来确定3D视频数据的深度数据的残差信息的视频解码器的实例性操作的流程图。
具体实施方式
一般来说,本发明涉及用于使用不同于高效率视频译码(HEVC)译码模式的深度译码模式编码及解码以多视图加深度格式表示的三维(3D)视频数据的深度数据的技术。在多视图加深度格式中,3D视频数据的所俘获视图(例如,纹理)与描述纹理数据的深度数据的对应深度图相关联。根据3D视频译码过程,例如3D-HEVC过程,纹理视图及深度图可经译码及多路复用到3D视频位流中。可将所述深度图译码为灰度级视频,其中亮度样本表示深度值。换句话说,将纹理视图的残差值映射到灰度级值,且将深度图的残差值映射到相对于零视差平面的对应于灰度级值的深度值。
深度图被表征为呈现与对应纹理的强相关的恒定区域及尖锐边缘。常规的帧间译码及帧内译码模式(例如HEVC标准中的帧间译码及帧内译码模式)可用于译码深度图,但归因于纹理与对应深度之间的不同统计及相关,已经针对深度图设计额外的预测模式。额外深度帧内译码模式的实例包含深度模型化模式(DMM)、简化深度译码(SDC)模式及链译码模式(CCM)。另外,额外深度帧间译码模式的实例包含帧间SDC模式。
DDM可包含多个子模式。在一个说明性实例中,DMM包含四个子模式,在本发明中被称作DMM_1、DMM_2、DMM_3及DMM_4。在所有四个深度子模式中,深度块被分割成由DMM型式指定的两个区,其中每一区由常量值表示。存在在DMM中界定的两个分割模型,包含楔形波分割(其中深度块被直线分割成两个区)及轮廓分割(其中深度块被分割成两个不规则区)。DMM楔形波分割型式可明确地用信号通知(DMM_1),通过空间相邻块预测(DMM_2),或通过位于同一地点的纹理块预测(DMM_3)。DMM轮廓分割型式可通过位于同一地点的纹理块预测(DMM_4)。在其它实例中,DDM可界定不同数目的深度子模式,即,多于或少于四个。
所述SDC模式还可包含多个子模式。例如,SDC模式可包含三个子模式,在本发明中被称作SDCM_DC、SDCM_DMM_1及SDCM_Planar。在SDC模式中,作为译码经量化变换系数的替代,将深度块用信号通知为分区的类型(例如,单一DC分区、两个DMM_1分区或单一平面分区)及每一分区的残差值。在帧间SDC模式中,通过译码含有单一唯一分区的每一深度块的仅一个DC残差值而进一步扩展深度帧间译码的SDC模式的概念。虽然本发明主要将SDC模式称作简化深度译码(SDC)模式,但在其它实例中,SDC模式可被称作逐分段DC译码(SDC)模式。在其它实例中,SCD模式可界定不同数目的深度子模式,即,多于或少于三个。
在CCM中,深度块被分割成由使用“链”用信号通知的任意分区型式指定的两个区。链是样本与其八个连接性样本中的一者之间的连接。每一链被指派有方向索引,且用信号通知一连串连接的链索引以界定分区型式。下文更详细地描述深度帧内译码模式及深度帧间译码模式的深度数据的信令。
在一个实例中,本发明的技术包含用信号通知用于译码深度模型化表中的3D视频数据的深度图的深度帧内译码模式。所述深度帧内译码模式可包含DMM、SDC模式及CCM中的两者或更多者。深度模型化表用信号通知与用于HEVC帧内译码模式的语法分开的用于额外深度帧内译码模式的语法。另外,所述技术包含用信号通知语法元素(例如旗标)以指示是否针对3D视频数据启用不同于HEVC帧内译码模式的深度帧内译码模式中的任一者。在启用深度帧内译码模式时(即,在用信号通知的语法元素指示针对3D视频数据启用深度帧内译码模式中的至少一者时),视频解码器解码深度模型化表以确定用于译码深度数据的深度帧内译码模式中的一者。本发明的技术可通过在深度模型化表中用信号通知与HEVC帧内译码模式分开的深度帧内译码模式且指示何时启用深度帧内译码模式及应解码深度模型化表而减少解码器解析负担。
在另一实例中,本发明的技术包含跨越深度译码模式中的两者或更多者统一3D视频数据的深度图的残差信息的信令。所述深度译码模式可包含DMM、SDC模式、帧间SDC模式及CCM中的两者或更多者。统一组的语法元素可包含指示是否针对深度译码模式中的任一者译码残差值的语法元素。所述统一组语法元素还可包含指示针对深度译码模式中的任一者的残差值的绝对值及正负号的语法元素。通过共享相同组的语法元素以指示用于深度译码模式中的两者或更多者的残差信息,还可统一用于语法元素的上下文模型选择及二进制化方法。另外,对于深度帧内模式,可在被称作残差值的帧内预测样本的产生期间或在基于残差值的深度值的重构期间不对相邻参考样本进行滤波。本发明的技术可通过统一用于深度译码模式的残差信息译码机制而减少解码器解析负担且减少所需的上下文模型及二进制化方法的数目。
图1是说明可利用用于深度数据译码的本发明的技术的实例视频编码和解码系统10的框图。如图1中所示,系统10包含源装置12,所述源装置12提供将在稍后时间由目的地装置14解码的经编码视频数据。确切地说,源装置12经由计算机可读媒体16将视频数据提供到目的地装置14。源装置12及目的地装置14可包括广泛范围的装置中的任一者,包含桌上型计算机、笔记型(即,膝上型)计算机、平板计算机、机顶盒、电话手持机(例如,所谓的“智能”电话)、所谓的“智能”平板计算机、电视机、摄像机、显示装置、数字媒体播放器、视频游戏控制台、视频流式传输装置或其类似者。在一些情况下,源装置12和目的地装置14可能经装备以用于无线通信。
目的地装置14可经由计算机可读媒体16接收待解码的经编码的视频数据。计算机可读媒体16可包括能够将经编码视频数据从源装置12移动到目的地装置14的任何类型的媒体或装置。在一个实例中,计算机可读媒体16可包括使得源装置12能够实时将经编码的视频数据直接传输到目的地装置14的通信媒体。
经编码视频数据可根据通信标准(例如,无线通信协议)来调制,且被传输到目的地装置14。通信媒体可包括任何无线或有线通信媒体,例如射频(RF)频谱或一或多个物理传输线路。通信媒体可形成基于包的网络(例如,局域网、广域网或全球网络,例如因特网)的部分。通信媒体可包含路由器、交换器、基站或可用于促进从源装置12到目的地装置14的通信的任何其它装备。
在一些实例中,经编码数据可以从输出接口22输出到存储装置。类似地,可以通过输入接口从存储装置存取经编码数据。存储装置可包含多种分布式或本地存取式数据存储媒体中的任一者,例如硬盘驱动器、蓝光光盘、DVD、CD-ROM、快闪存储器、易失性或非易失性存储器或用于存储经编码视频数据的任何其它合适的数字存储媒体。在另一实例中,存储装置可以对应于文件服务器或可存储源装置12产生的经编码视频的另一中间存储装置。
目的地装置14可经由流式传输或下载从存储装置存取经存储的视频数据。文件服务器可以是能够存储经编码视频数据并且将所述经编码视频数据传输到目的地装置14的任何类型的服务器。实例文件服务器包含网络服务器(例如,用于网站)、FTP服务器、网络附接存储(NAS)装置或本地磁盘驱动器。目的地装置14可以通过任何标准数据连接(包含因特网连接)来存取经编码视频数据。此可包含无线通道(例如,Wi-Fi连接)、有线连接(例如,DSL、缆线调制解调器,等等),或适合于存取存储于文件服务器上的经编码视频数据的以上两者的组合。经编码视频数据从存储装置的传输可能是流式传输、下载传输或其组合。
本发明的技术不一定限于无线应用或环境。所述技术可以应用于支持多种多媒体应用中的任一者的视频译码,例如空中电视广播、有线电视传输、卫星电视传输、因特网流式视频传输(例如,动态自适应HTTP流式传输(DASH))、经编码到数据存储媒体上的数字视频,存储在数据存储媒体上的数字视频的解码,或其它应用。在一些实例中,系统10可经配置以支持单向或双向视频传输,以支持例如视频流式传输、视频回放、视频广播和/或视频电话等应用。
在图1的实例中,源装置12包含视频源18、视频编码器20及输出接口22。目的地装置14包含输入接口28、视频解码器30及显示装置32。根据本发明,源装置12的视频编码器20可经配置以应用所述技术以用于多视图译码中的运动向量预测。在其它实例中,源装置及目的地装置可包含其它组件或布置。举例来说,源装置12可从外部视频源18(例如外部相机)接收视频数据。同样,目的地装置14可以与外部显示装置介接,而不是包含集成显示装置。
图1的所说明系统10只是一个实例。可以由任何数字视频编码和/或解码装置来执行用于深度数据译码的技术。尽管本发明的技术一般通过视频编码装置来执行,但是所述技术还可通过视频编码器/解码器(通常被称作“编解码器”)来执行。此外,本发明的技术还可通过视频预处理器执行。源装置12及目的地装置14仅为源装置12在其中产生经译码视频数据以供传输到目的地装置14的此些译码装置的实例。在一些实例中,装置12、14可以大体上对称的方式操作以使得装置12、14中的每一者包含视频编码和解码组件。因此,系统10可支持视频装置12、14之间的单向或双向视频传输以例如用于视频流式传输、视频回放、视频广播或视频电话。
源装置12的视频源18可包含视频俘获装置,例如摄像机、含有先前所俘获视频的视频档案和/或用于从视频内容提供者接收视频的视频馈送接口。作为另一替代方案,视频源18可产生基于计算机图形的数据作为源视频,或直播视频、存档视频与计算机产生的视频的组合。在一些情况下,如果视频源18是摄像机,则源装置12及目的地装置14可形成所谓的相机电话或视频电话。然而,如上文所提及,本发明中所描述的技术可大体上适用于视频译码,且可应用于无线及/或有线应用。在每一状况下,可由视频编码器20来编码经俘获的、经预先俘获的或计算机产生的视频。经编码视频信息可接着通过输出接口22输出到计算机可读媒体16上。
计算机可读媒体16可包含瞬时媒体,例如无线广播或有线网络传输,或存储媒体(也就是说,非暂时性存储媒体),例如硬盘、快闪驱动器、压缩光盘、数字视频光盘、蓝光光盘或其它计算机可读媒体。在一些实例中,网络服务器(未图示)可以从源装置12接收经编码视频数据,并且例如经由网络传输将经编码视频数据提供到目的地装置14。类似地,媒体生产设施(例如光盘冲压设施)的计算装置可以从源装置12接收经编码的视频数据并且生产含有经编码的视频数据的光盘。因此,在各种实例中,计算机可读媒体16可以理解为包含各种形式的一或多个计算机可读媒体。
本发明可一般涉及视频编码器20将某些信息“用信号通知”到另一装置(例如视频解码器30)。然而,应理解,视频编码器20可通过使某些语法元素与视频数据的各种经编码部分相关联而用信号通知信息。也就是说,视频编码器20可以通过将某些语法元素存储到视频数据的各种经编码部分的标头来“用信号通知”数据。在一些情况下,此类语法元素可在由视频解码器30接收及解码之前被编码及存储(例如,存储到计算机可读媒体16)。因此,术语“用信号通知”可一般涉及用于解码经压缩视频数据的语法或其它数据的通信,无论此类通信是实时还是准实时还是在时间跨度上发生,例如可能在编码时将语法元素存储到媒体时发生,所述语法元素随后可由解码装置在存储到此媒体之后的任何时间检索。
目的地装置14的输入接口28从计算机可读媒体16接收信息。计算机可读媒体16的信息可包含由视频编码器20定义的语法信息,所述语法信息也被视频解码器30使用,其包含描述块及其它经译码单元(例如GOP)的特性及/或处理的语法元素。显示装置32向用户显示经解码的视频数据,且可包括多种显示装置中的任一者,例如阴极射线管(CRT)、液晶显示器(LCD)、等离子体显示器、有机发光二极管(OLED)显示器或另一类型的显示装置。
尽管图1中未展示,但在一些方面中,视频编码器20及视频解码器30可各自与音频编码器及解码器集成,且可包含适当的MUX-DEMUX单元或其它硬件及软件,以处置对共同数据流或单独数据流中的音频及视频两者的编码。如果适用,则MUX-DEMUX单元可符合ITUH.223多路复用器协议,或例如用户数据报协议(UDP)等其它协议。
视频编码器20及视频解码器30可各自在适用时实施为多种合适的编码器或解码器电路中的任一者,例如一或多个微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑电路、软件、硬件、固件或其任何组合。视频编码器20和视频解码器30中的每一者可以包含在一或多个编码器或解码器中,所述编码器或解码器中的任一者可以集成为组合视频编码器/解码器(CODEC)的一部分。包含视频编码器20和/或视频解码器30的装置可包括集成电路、微处理器和/或无线通信装置,例如蜂窝式电话。
在一些实例中,视频编码器20及视频解码器30可根据例如3D-HEVC等视频译码标准操作,且可符合HEVC测试模型(HM)。HEVC曾由ITU-T视频译码专家组(VCEG)与ISO/IEC运动图片专家组(MPEG)的视频译码联合合作小组(JCT-VC)开发。HEVC的草案(布洛斯等人的“高效率视频译码(HEVC)文本规范草案10(针对FDIS和最后呼叫)(HighEfficiencyVideoCoding(HEVC)textspecificationdraft10(forFDIS&LastCall))”,ITU-TSG16WP3及ISO/IECJTC1/SC29/WG11的JCT-VC,第12届会议:瑞士日内瓦2013年1月14日至23日,JCTVC-L1003)可从http://phenix.int-evry.fr/jct/doc_end_user/documents/12_Geneva/wg11/JCTVC-L1003-v34.zip得到。
HEVC标准化努力是基于被称作HEVC测试模型(HM)的视频译码装置的进化模型。HM假设视频译码装置根据(例如)ITU-TH.264/AVC相对于现有装置的若干额外能力。举例来说,虽然H.264提供了九种帧内预测编码模式,但HM可提供多达三十五种帧内预测编码模式。
一般来说,HM的工作模型描述视频帧(或“图片”)可以被划分为包含亮度和色度样本两者的树块或最大译码单元(LCU)的序列。位流内的语法数据可以定义LCU的大小,LCU是在像素数目方面的最大译码单元。切片包含按译码次序的数个连续树块。图片可以分割成一或多个切片。每一树块可以根据四叉树分裂成译码单元(CU)。一般来说,四叉树数据结构包含每个CU一个节点,其中根节点对应于树块。如果CU分裂成四个子CU,那么对应于CU的节点包含四个叶节点,其中叶节点中的每一者对应于所述子CU中的一者。
四叉树数据结构的每一节点可以提供对应CU的语法数据。举例来说,四叉树中的节点可包含分裂旗标,从而指示对应于所述节点的CU是否分裂成数个子CU。用于CU的语法元素可以递归地来定义,且可以取决于CU是否分裂成子CU。如果CU不进一步分裂,那么将其称为叶CU。在本发明中,叶CU的四个子CU也将被称作叶CU,即使不存在原始叶CU的明确分裂时也是如此。举例来说,如果16×16大小的CU不进一步分裂,那么这四个8×8子CU将也被称作叶CU,虽然16×16CU从未分裂。
CU具有类似于H.264标准的宏块的目的,但是CU并不具有大小区别。举例来说,树块可以分裂成四个子节点(还称为子CU),并且每一子节点又可以是父节点并且可以分裂成另外四个子节点。最后的未经分裂子节点(被称作四叉树的叶节点)包括译码节点,还被称作叶CU。与经译码位流相关联的语法数据可以定义树块可以分裂的最大次数,被称作最大CU深度,并且还可定义译码节点的最小大小。所以,位流还可定义最小译码单元(SCU)。本发明使用术语“块”指代HEVC的上下文中的CU、PU或TU中的任一者,或者其它标准的上下文中的类似数据结构(例如,其在H.264/AVC中的宏块和子块)。
CU包含译码节点以及与所述译码节点相关联的预测单元(PU)及变换单元(TU)。CU的大小对应于译码节点的大小并且形状必须是正方形。CU的大小可以在从8×8像素直到具有最大64×64像素或更大的树块的大小的范围内。每一CU可含有一或多个PU及一或多个TU。举例来说,与CU相关联的语法数据可描述将CU分割成一或多个PU。分割模式可以在CU被跳过或经直接模式编码、帧内预测模式编码或帧间预测模式编码之间有区别。PU可分割成非正方形形状。举例来说,与CU相关联的语法数据还可描述CU根据四叉树被分割为一或多个TU。TU可以是正方形或非正方形(例如,矩形)形状。
HEVC标准允许根据TU的变换,TU可针对不同CU而有所不同。对于帧内模式,TU的大小通常是基于针对经分割LCU界定的给定CU内的PU的大小而设置,但是情况可能并不总是如此。TU通常与PU大小相同或小于PU。对于帧间模式,TU可大于PU。在一些实例中,对应于CU的残差样本可以使用被称为“残差四叉树”(RQT)的四叉树结构而细分成较小单元。RQT的叶节点可被称为变换单元(TU)。可以变换与TU相关联的像素差值以产生变换系数,可以将所述变换系数量化。
未分裂的叶CU可包含一或多个预测单元(PU)。一般来说,PU表示对应于相对应的CU的全部或一部分的空间区域,并且可包含用于检索PU的参考样本的数据。此外,PU包含与预测有关的数据。举例来说,当PU经帧内模式编码时,用于PU的数据可以包含在残差四叉树(RQT)中,残差四叉树可包含描述用于对应于PU的TU的帧内预测模式的数据。作为另一实例,当PU经帧间模式编码时,PU可包含定义PU的一或多个运动向量的数据。界定PU的运动向量的数据可描述(例如)运动向量的水平分量、运动向量的垂直分量、运动向量的分辨率(例如,四分之一像素精度或八分之一像素精度)、运动向量指向的参考帧,和/或运动向量的参考图片列表(例如,列表0、列表1或列表C)。
具有一或多个PU的叶CU还可包含一或多个变换单元(TU)。变换单元可以使用RQT(还称为TU四叉树结构)来指定,如上文所论述。举例来说,分裂旗标可以指示叶CU是否分裂成四个变换单元。接着,每一变换单元可以进一步分裂成其它的子TU。当TU不进一步分裂时,其可被称为叶TU。一般来说,对于帧内译码,属于叶CU的所有叶TU共享相同的帧内预测模式。也就是说,一般应用相同的帧内预测模式来计算叶CU的所有TU的预测值。对于帧内译码,视频编码器20可以使用帧内预测模式针对每一叶TU计算残差值,作为CU的对应于TU的部分与原始块之间的差。TU不一定限于PU的大小。因而,TU比PU大或小。对于帧内译码,PU可以与相同CU的对应叶TU并置。在一些实例中,叶TU的最大大小可以对应于对应叶CU的大小。
此外,叶CU的TU还可与相应的四叉树数据结构(被称作残差四叉树(RQT))相关联。也就是说,叶CU可包含指示叶CU如何分割成TU的四叉树。TU四叉树的根节点一般对应于叶CU,而CU四叉树的根节点一般对应于树块(或LCU)。未经分裂的RQT的TU被称作叶TU。一般来说,除非以其它方式提及,否则本发明分别使用术语CU及TU来指叶CU及叶TU。
视频序列通常包含一系列视频帧或图片。如本文所描述,术语“图片”与“帧”可以互换地使用。即,含有视频数据的图片可被称为视频帧或简称为“帧”。图片群组(GOP)一般包括一系列一或多个视频图片。GOP可包含GOP的标头、图片中的一或多者的标头或其它处的语法数据,其描述GOP中所包含的图片的数目。图片的每一切片可包含描述用于相应切片的编码模式的切片语法数据。视频编码器20通常对个别视频切片内的视频块操作以便编码视频数据。视频块可以对应于CU内的译码节点。视频块可以具有固定或变化的大小,并且根据指定译码标准可以有不同大小。
作为实例,HM支持各种PU大小的预测。假设特定CU的大小是2N×2N,那么HM支持2N×2N或N×N的PU大小的帧内预测,及2N×2N、2N×N、N×2N或N×N的对称PU大小的帧间预测。HM还支持用于2N×nU、2N×nD、nL×2N及nR×2N的PU大小的帧间预测的不对称分割。在不对称分割中,不分割CU的一个方向,而将另一方向分割成25%及75%。CU的对应于25%分区的部分由“n”继之以“上”、“下”、“左”或“右”的指示来指示。因此,例如,“2N×nU”是指经水平分割的2N×2NCU,其中顶部为2N×0.5NPU,而底部为2N×1.5NPU。
在本发明中,“N×N”与“N乘N”可以可互换地使用,以在垂直和水平尺寸方面指代视频块的像素尺寸,例如16×16像素或16乘16像素。一般来说,16×16块将在垂直方向上具有16个像素(y=16),并且在水平方向上具有16个像素(x=16)。同样地,N×N块一般在垂直方向上具有N个像素,且在水平方向上具有N个像素,其中N表示非负整数值。块中的像素可按行及列布置。此外,块不一定需要在水平方向与垂直方向上具有相同数目的像素。举例来说,块可包括N×M像素,其中M未必等于N。
在使用CU的PU的帧内预测或帧间预测译码之后,视频编码器20可以计算CU的TU的残差数据。PU可包括描述在空间域(还被称作像素域)中产生预测性像素数据的方法或模式的语法数据,并且TU可包括在对残差视频数据应用变换(例如,离散余弦变换(DCT)、整数变换、小波变换或概念上类似的变换)之后在变换域中的系数。所述残差数据可对应于未编码图片的像素与对应于PU的预测值之间的像素差。视频编码器20可以形成包含用于CU的残差数据的TU,并且接着变换TU以产生用于CU的变换系数。
在进行用于产生变换系数的任何变换之后,视频编码器20可执行变换系数的量化。量化一般是指变换系数经量化以可能减少用于表示系数的数据量从而提供进一步压缩的过程。量化过程可减少与系数中的一些系数或全部相关联的位深度。举例来说,可在量化期间将n位值向下舍入到m位值,其中n大于m。
在量化之后,视频编码器20可以扫描变换系数,从而从包含经量化的变换系数的二维矩阵产生一维向量。扫描可以经设计以将较高能量(并且因此较低频率)的系数放置在阵列的前面,并且将较低能量(并且因此较高频率)的系数放置在阵列的背面。
在一些实例中,视频编码器20可利用预先界定的扫描次序来扫描经量化的变换系数以产生可被熵编码的串行化向量。在其它实例中,视频编码器20可以执行自适应扫描。在扫描经量化变换系数以形成一维向量之后,视频编码器20可例如根据上下文自适应可变长度译码(CAVLC)、上下文自适应二进制算术译码(CABAC)、基于语法的上下文自适应二进制算术译码(SBAC)、概率区间分割熵(PIPE)译码或另一熵编码方法对所述一维向量进行熵编码。视频编码器20还可对与经编码视频数据相关联的语法元素进行熵编码以供视频解码器30在对视频数据解码时使用。
视频编码器20可例如在图片标头、块标头、切片标头或GOP标头中进一步将例如基于块的语法数据、基于图片的语法数据及基于GOP的语法数据等语法数据发送到视频解码器30。GOP语法数据可描述相应GOP中的数个图片,且图片语法数据可指示用以对对应图片进行编码的编码/预测模式。
视频编码器20和/或视频解码器30可对深度数据进行帧内译码。例如,在3D-HEVC中,视频编码器20和/或视频解码器30可用信号通知用于深度图的帧内模式。视频编码器20和/或视频解码器30代表可经配置以执行用于3D-HEVC中的深度图的简化帧内模式信令的技术的装置,如本发明中所描述。
在一个实例中,视频编码器20可经配置以用信号通知用于在深度模型化表中译码3D视频数据的深度图的深度帧内译码模式,且视频解码器30可经配置以通过解析深度模型化表语法而确定用于译码深度图的深度帧内译码模式。深度模型化表将用于额外深度帧内译码模式的语法与用于HEVC帧内译码模式的语法分开。在另一实例中,视频编码器20可经配置以使用跨越深度译码模式中的两者或更多者统一的机制用信号通知3D视频数据的深度图的残差信息,且视频解码器30可经配置以使用所述统一机制确定两个或更多个深度译码模式中的任一者的深度图的残差信息。深度译码模式可包含深度帧内译码模式及深度帧间译码模式两者。本发明的技术可减少视频解码器30上的用于确定额外深度译码模式及根据深度译码模式而译码的深度数据的残差信息的解析负担。
本发明中描述的技术可以用于支持对视频数据的编码及/或解码(统称为“译码”)以产生三维效应。作为一实例,可大体上同时显示不同视图的两个图像(即,对应于具有略微不同的水平位置的两个相机视角),以使得一个图像由观察者的左眼看到,且另一图像由观察者的右眼看到。
此3D效果可使用(例如)立体显示器或自动立体显示器来实现。立体显示器可以与相应地对两个图像进行滤波的眼镜结合使用。例如,无源玻璃可使用极化透镜或不同色彩的透镜对图像进行滤波以确保恰当的眼睛观看恰当的图像。作为另一实例,有源玻璃可与立体显示器协调地快速遮蔽替代性透镜,其可在显示左眼图像与右眼图像之间交替。自动立体显示器以不需要玻璃的方式显示器两个图像。例如,自动立体显示器可包含经配置以致使每一图像投射到观察者的适当的眼睛中的镜或棱镜。
译码3D视频数据可涉及译码纹理及深度数据。一般来说,术语“纹理”用于描述图像的照度(即,亮度或“luma”)值及图像的色度(即,色彩或“chroma”)值。在一些实例中,纹理图像可包含用于蓝色调(Cb)及红色调(Cr)的一组照度数据及两组色度数据。在例如4:2:2或4:2:0等某些色度格式中,色度数据相对于照度数据被向下取样。即,色度像素的空间分辨率可低于对应照度像素的空间分辨率,例如为照度分辨率的二分之一或四分之一。
深度数据一般描述对应纹理数据的深度值。例如,深度图可包含各自描述对应纹理数据的深度的一组深度像素(或深度值)。像素可具有一或多个纹理值(例如,照度及色度),且还可具有一或多个深度值。深度数据可以用于确定对应纹理数据的水平视差,且在一些情况下,还可使用垂直视差。常常相对于照度数据对深度数据子取样,意味着多个照度值可与一个特定深度值相关联。相对于照度数据对深度数据的子取样可类似于或不同于相对于照度数据对色度数据的子取样。
接收纹理及深度数据的装置可显示一个视图(例如,左眼视图)的第一纹理图像,且通过使第一图像的像素值偏移基于深度值而确定的水平视差值而使用深度数据修改所述第一纹理图像以产生另一视图(例如,右眼视图)的第二纹理图像。一般来说,水平视差(或简称“视差”)描述第一视图中的像素与第二视图中的对应像素的水平空间偏移,其中所述两个像素对应于如在所述两个视图中表示的相同对象的相同部分。
在又其它实例中,可针对垂直于图像平面的z维度中的像素定义深度数据,使得与给定像素相关联的深度是相对于针对所述图像定义的零视差平面而定义。此深度可用于产生用于显示像素的水平视差,使得所述像素取决于所述像素相对于零视差平面的z维度深度值而对于左眼与右眼以不同方式显示。
零视差平面可针对视频序列的不同部分而改变,且相对于零视差平面的深度量也可改变。可针对左眼与右眼类似地定义位于零视差平面上的像素。位于零视差平面之前的像素可对于左眼与右眼显示于不同位置中(例如,具有水平视差),以便产生像素似乎是从垂直于图像平面的z方向上的图像出现的感觉。
位于零视差平面之后的像素可略微模糊地显示以提供对深度的略微感知,或可对于左眼与右眼显示于不同位置中(例如,具有与位于零视差平面之前的像素相反的水平视差)。许多其它技术也可用于传达或定义图像的深度数据。
二维视频数据一般被译码为离散图片的序列,其中的每一者对应于特定时间实例。即,每一图片具有相对于序列中的其它图像的回放时间的相关联的回放时间。这些图片可被视为纹理图片或纹理图像。在基于深度的3D视频译码中,序列中的每一纹理图片还可对应于深度图。即,对应于纹理图片的深度图描述对应纹理图片的深度数据。多视图视频数据可包含各种视图的数据,其中每一视图可包含纹理图片及对应深度图片的相应序列。
如上所述,图像可对应于特定时间实例。可使用存取单元序列表示视频数据,其中每一存取单元包含对应于特定时间实例的所有数据。因此,例如,多于多视图视频数据加深度,来自共同时间实例的每一视图的纹理图像加上纹理图像中的每一者的深度图可全部包含在特定存取单元内。存取单元可包含对应于纹理图像的纹理分量及对应于深度图的深度分量的数据。
以此方式,可使用多视图视频加深度格式来表示3D视频数据,其中所俘获或所产生的视图(纹理)与对应的深度图相关联。此外,在3D视频译码中,可译码纹理及深度图且将其多路复用到3D视频位流中。可将深度图译码为灰度级图像,其中深度图的“照度”样本(即,像素)表示深度值。一般来说,深度数据的块(深度图的样本的块)可被称为深度块。深度值可指与深度样本相关联的照度值。在任何情况下,可针对深度图译码应用帧内及帧间译码方法。
深度图通常包含尖锐边缘及恒定区域,且深度图中的边缘通常呈现与对应纹理数据的强相关性。归因于纹理与对应深度之间的不同统计及相关性,可基于2D视频编解码器设计用于深度图的不同译码方案。
本发明的技术一般涉及深度图的简化译码模式信令,且可适用于高效率视频译码(HEVC)标准。联合视频组(JVT)开发出提供比先前开发的视频译码标准更高效率的HEVC的基础版本(2D)。3D视频译码联合合作小组(JCT-3V)当前在研究两个三维视频(3DV)解决方案作为HEVC的扩展。一个实例性3DV解决方案包含被称作MV-HEVC的HEVC的多视图扩展。另一实例包含深度增强型3D视频扩展(3D-HEVC)。
在3D-HEVC中,每一存取单元含有多个视图分量,每一视图分量含有唯一视图id或视图次序索引或层id。视图分量含有纹理视图分量以及深度视图分量。纹理视图分量可经译码为一或多个纹理切片,而深度视图分量可经译码为一或多个深度切片。
在一些情况下,深度数据可经帧内译码,其依赖于空间预测以减少或移除给定图片内的空间冗余。例如,在3D-HEVC中,视频译码器(例如,视频编码器或视频解码器)可使用来自基础(2D)HEVC标准的帧内预测模式译码深度切片的帧内预测单元。下文关于图4和5更详细地描述HEVC标准的帧内译码模式。
在另一实例中,视频译码器可使用区边界链译码模式译码深度切片的帧内预测单元。下文关于图6A及6B更详细地描述所述区边界链译码模式(简称为链译码模式或CCM)。一般来说,视频译码器可使用CCM将深度数据块分割为不规则形状的区,其随后可被帧内译码。
在再一实例中,视频译码器可使用简化深度译码(SDC)模式译码深度切片的帧内预测单元。在下文更详细地描述SDC模式。与其它帧内模式译码方案相比,在使用SDC模式时,视频译码器不变换或量化残差深度值。而是,视频译码器可直接译码残差深度值。
在另一实例中,视频译码器可使用深度模型化模式(DMM)译码深度切片的帧内预测单元。下文相对于图7A及7B更详细地描述3D-HEVC的DMM。在DMM的情况下,视频译码器可将深度数据的块(一般称作深度块)分割为预测区。例如,视频译码器可使用由穿过深度数据的块而绘制的任意线界定的楔形波型式或将深度块分割为两个不规则形状的区的轮廓型式来分割深度数据的块。下文关于图8A和8B及图9更详细地描述楔形波型式。
虽然可一般相对于3D-HEVC描述本发明的某些技术,但所述技术不一定以此方式受限。本文中描述的技术还可适用于其它当前标准或尚未开发的未来标准,尤其在提供深度图的简化帧内模式信令可为有利的情况下。
图2是说明可实施用于深度数据译码的技术的视频编码器20的实例的框图。视频编码器20表示可经配置以执行用于3D-HEVC中的深度图的简化译码模式信令的技术的装置,如本发明中所描述。
视频编码器20可以对视频切片内的视频块执行帧内和帧间译码。帧内译码依赖于空间预测来减少或移除给定视频帧或图片内的视频中的空间冗余。帧间译码依赖于时间预测来减少或移除视频序列的邻近帧或图片内的视频中的时间冗余。帧内模式(I模式)可以指若干基于空间的译码模式中的任一者。例如单向预测(P模式)或双向预测(B模式)等帧间模式可以指代若干基于时间的译码模式中的任一者。
如上所述,视频编码器20可经调适以执行多视图视频译码。在一些情况下,视频编码器20可经配置以译码多视图HEVC,以使得时间实例中的每一视图可由例如视频解码器30等解码器处理。对于3D-HEVC,除了编码每一视图的纹理图(即,照度及色度值)之外,视频编码器20可进一步编码每一视图的深度图。
如图2中所示,视频编码器20接收待编码的视频帧内的当前视频块。在图2的实例中,视频编码器20包含视频数据存储器41、模式选择单元40、经解码图片缓冲器(DPB)64、求和器50、变换处理单元52、量化单元54及熵编码单元56。模式选择单元40又包含运动补偿单元44、运动估计单元42、帧内预测单元46及分割单元48。为了视频块重构,视频编码器20还包含反量化单元58、反变换单元60及求和器62。还可包含解块滤波器(图2中未图示)以对块边界进行滤波,从而从经重构视频移除成块性假影。在需要时,解块滤波器将通常对求和器62的输出滤波。除了解块滤波器外,还可使用额外滤波器(环路内或环路后)。为简明起见未图示此些滤波器,但在需要时,此些滤波器可以对求和器50的输出进行滤波(作为环路内滤波器)。实例性滤波器可包含自适应环路滤波器、样本自适应偏移(SAO)滤波器或其它类型的滤波器。
视频数据存储器41可存储待由视频编码器20的组件编码的视频数据。可(例如)从视频源18获得存储在视频数据存储器41中的视频数据。经解码图片缓冲器64可为存储参考视频数据以供视频编码器20(例如)在帧内或帧间译码模式中编码视频数据中使用的参考图片存储器。视频数据存储器41及经解码图片缓冲器64可由多种存储器装置中的任一者形成,例如动态随机存储器(DRAM),包含同步DRAM(SDRAM)、磁阻式RAM(MRAM)、电阻性RAM(RRAM)或其它类型的存储器装置。视频数据存储器41和经解码图片缓冲器64可由同一存储器装置或单独的存储器装置提供。在各种实例中,视频数据存储器41可与视频编码器20的其它组件一起在芯片上,或相对于那些组件在芯片外。
在编码过程期间,视频编码器20接收待译码的视频帧或切片。帧或切片可划分成多个视频块。运动估计单元42及运动补偿单元44相对于一或多个参考帧中的一或多个块执行所接收视频块的帧间预测译码以提供时间预测。帧内预测单元46可替代地相对于与待译码的块相同的帧或切片中的一或多个相邻块执行所接收视频块的帧内预测译码以提供空间预测。视频编码器20可以执行多个译码回合,例如,以针对每一视频数据块选择适当的译码模式。
此外,分割单元48可以基于前述译码回合中的先前分割方案的评估将视频数据块分割成子块。举例来说,分割单元48可以首先将帧或切片分割成LCU,并且基于速率失真分析(例如,速率失真优化)将LCU中的每一者分割成子CU。模式选择单元40可以进一步产生指示将LCU分割成若干子CU的四叉树数据结构。四叉树的叶节点CU可包含一或多个PU和一或多个TU。
模式选择单元40可以基于错误结果选择译码模式中的一者(帧内或帧间),并且将所得的经帧内译码或经帧间译码块提供到求和器50以便产生残差块数据,并且提供到求和器62以便重构经编码块以用作参考帧。模式选择单元40还将语法元素(例如,运动向量、帧内模式指示符、分割信息及其它此类语法信息)提供到熵编码单元56。
运动估计单元42及运动补偿单元44可高度集成,但出于概念性目的而分开说明。由运动估计单元42执行的运动估计是产生运动向量的过程,所述过程估计视频块的运动。举例来说,运动向量可以指示当前视频帧或图片内的视频块的PU相对于参考帧(或其它经译码单元)内的预测块相对于当前帧(或其它经译码单元)内正经译码的当前块的移位。
预测块是经发现在像素差异方面密切地匹配待译码的块的块,其可通过绝对差总和(SAD)、平方差总和(SSD)或其它差异量度来确定。在一些实例中,视频编码器20可计算存储于经解码图片缓冲器64中的参考图片的子整数像素位置的值。举例来说,视频编码器20可以内插参考图片的四分之一像素位置、八分之一像素位置或其它分数像素位置的值。因此,运动估计单元42可相对于全像素位置及分数像素位置执行运动搜索并且输出具有分数像素精度的运动向量。
运动估计单元42通过比较经帧间译码切片中的视频块的PU的位置与参考图片的预测块的位置来计算PU的运动向量。参考图片可选自第一参考图片列表(列表0)或第二参考图片列表(列表1),其中的每一者识别存储在经解码图片缓冲器64中的一或多个参考图片。运动估计单元42将所计算的运动向量发送到熵编码单元56及运动补偿单元44。
由运动补偿单元44执行的运动补偿可涉及基于由运动估计单元42确定的运动向量而获取或产生预测块。而且,在一些实例中,运动估计单元42及运动补偿单元44可在功能上集成。在接收到当前视频块的PU的运动向量后,运动补偿单元44即刻可以在参考图片列表中的一者中定位所述运动向量指向的预测块。求和器50通过从经译码的当前视频块的像素值减去预测块的像素值从而形成像素差值来形成残差视频块,如下文所论述。一般来说,运动估计单元42相对于亮度分量执行运动估计,并且运动补偿单元44对于色度分量及亮度分量两者使用基于亮度分量计算的运动向量。模式选择单元40还可产生与视频块和视频切片相关联的供视频解码器30在对视频切片的视频块进行解码时使用的语法元素。
作为如上文所描述由运动估计单元42和运动补偿单元44执行的帧间预测的替代方案,帧内预测单元46可以对当前块进行帧内预测。明确地说,帧内预测单元46可以确定用来编码当前块的帧内预测模式。在一些实例中,帧内预测单元46可(例如)在单独编码回合期间使用各种帧内预测模式对当前块进行编码,且帧内预测单元46(在一些实例中,或为模式选择单元40)可从所测试的模式中选择将使用的适当的帧内预测模式。
举例来说,帧内预测单元46可以使用速率失真分析计算针对各种经测试帧内预测模式的速率失真值,并且从所述经测试模式当中选择具有最佳速率失真特性的帧内预测模式。速率失真分析一般确定经编码块与经编码以产生所述经编码块的原始的未经编码块之间的失真(或误差)的量,以及用于产生经编码块的位速率(也就是说,位数目)。帧内预测单元46可以根据用于各种经编码块的失真及速率计算比率,以确定哪种帧内预测模式对于所述块展现最佳速率失真值。
另外,帧内预测单元46可经配置以译码深度图的深度块。例如,帧内预测单元46可使用来自基础(2D)HEVC标准的帧内预测模式、区边界链译码模式(CCM)、简化深度译码或逐分段DC译码(SDC)或深度模型化模式(DMM)来译码深度切片的经帧内预测PU。在一些实例中,运动估计单元42及运动补偿单元44还可经配置以译码深度图的深度块。运动估计单元42及运动补偿单元44可执行根据基础(2D)HEVC标准的帧间预测或帧间SDC模式以译码深度切片的经帧间预测PU。
变换处理单元52将变换应用于残差块,从而产生残差变换系数块。所述变换可将残差信息从像素值域转换到变换域,例如频域。变换处理单元52可执行例如离散余弦变换(DCT)等变换或在概念上类似于DCT的其它变换。还可使用小波变换、整数变换、子带变换或其它类型的变换。变换处理单元52可以将所得变换系数发送到量化单元54。在一些实例中,可跳过所述变换过程。
量化单元54将变换系数量化以进一步减小位速率。量化过程可减少与系数中的一些系数或全部系数相关联的位深度。可通过调整量化参数来修改量化程度。在一些实例中,量化单元54可以接着执行对包含经量化的变换系数的矩阵的扫描。替代地,熵编码单元56可以执行所述扫描。
在量化之后,熵编码单元56对经量化的变换系数进行熵译码。举例来说,熵编码单元56可执行上下文自适应二进制算术编码(CABAC)或其它熵译码过程,例如上下文自适应可变长度译码(CAVLC)、基于语法的上下文自适应二进制算术译码(SBAC)或概率区间分割熵(PIPE)译码。在基于上下文的熵译码的情况下,上下文可以基于相邻块。在由熵编码单元56进行熵译码之后,可以将经编码位流发射到另一装置(例如,视频解码器30),或者将所述经编码位流存档以用于稍后发射或检索。
反量化单元58及反变换单元60分别应用反量化及反变换以在像素域中重构残差块,例如以供稍后用作参考块。运动补偿单元44可以通过将残差块添加到经解码图片缓冲器64的帧中的一者的预测块来计算参考块。运动补偿单元44还可将一或多个内插滤波器应用于所重构的残差块以计算子整数像素值以用于运动估计。
求和器62将经重构的残差块添加到由运动补偿单元44产生的运动补偿预测块以产生经重构视频块用于存储在经解码图片缓冲器64中。经重构视频块可由运动估计单元42和运动补偿单元44使用作为参考块以对后续视频帧中的块进行帧间译码。
根据本发明中描述的技术,视频编码器20可经配置以使用不同于HEVC译码模式的深度译码模式编码以多视图加深度格式表示的3D视频数据的深度数据。3D视频译码过程(例如3D-HEVC过程)中可用的额外深度帧内译码模式的实例包含DMM、SDC模式及CCM中的至少两者。另外,额外深度帧间译码模式的实例包含帧间SDC模式。
在一个实例中,视频编码器20用信号通知用于在深度模型化表中译码3D视频数据的深度数据的深度帧内译码模式。深度模型化表用信号通知与用于HEVC帧内译码模式的语法分开的用于额外深度帧内译码模式的语法。另外,视频编码器20用信号通知语法元素(例如旗标)以指示是否针对3D视频数据启用不同于HEVC帧内译码模式的深度帧内译码模式中的任一者。在一些实例中,所述语法元素可指示是否针对3D视频数据启用所有深度帧内译码模式。所述语法元素可包含在视频数据的视频参数集(VPS)、序列参数集(SPS)或图片参数集(SPS)中的一者中。在启用深度帧内译码模式时,由视频编码器20用信号通知的旗标向视频解码器30指示解码深度模型化表以确定用于译码深度数据的深度帧内译码模式中的一者。可在视频数据的译码单元(CU)水平或预测单元(PU)水平中的一者处编码所述深度模型化表。根据本发明的技术,视频编码器20的信令可通过在深度模型化表中用信号通知与HEVC帧内译码模式分开的深度帧内译码模式且指示何时启用深度帧内译码模式及应解码深度模型化表而减少解码器解析负担。
在另一实例中,视频编码器20可经配置以使用跨越深度译码模式中的两者或更多者统一的一组语法元素用信号通知3D视频数据的深度数据的残差信息。所述深度译码模式可包含深度帧内译码模式及深度帧间译码模式。所述组语法元素可包含指示是否针对所述深度译码模式中的任一者译码残差值的语法元素。所述组语法元素还可包含指示用于深度译码模式中的任一者的残差值的绝对值及正负号的语法元素。通过共享相同组的语法元素来指示用于深度译码模式中的两者或更多者的残差信息,视频编码器20还可统一用于共享的语法元素中的每一者的上下文模型选择及二进制化方法。另外,对于深度帧内译码模式,视频编码器20可确定不在深度数据的残差值的产生期间对相邻参考样本进行滤波。根据本发明的技术,视频编码器20的编码机制及信令可通过统一用于深度译码模式的残差信息语法而减少解码器解析负担且减少所需的上下文模型及二进制化方法的数目。
图3是说明可实施用于深度数据译码的技术的视频解码器30的实例的框图。在图3的实例中,视频解码器30包含视频数据存储器71、熵解码单元70、运动补偿单元72、帧内预测单元74、反量化单元76、反变换单元78、经解码图片缓冲器(DPB)82及求和器80。视频解码器30表示可经配置以执行用于3D-HEVC中的深度图的简化译码模式信令的技术的装置,如本发明中所描述。
视频数据存储器71可存储待由视频解码器30的组件解码的视频数据,例如经编码视频位流。可(例如)从计算机可读媒体16,例如从本地视频源(例如相机)经由视频数据的有线或无线网络通信,或通过存取物理数据存储媒体而获得存储在视频数据存储器71中的视频数据。视频数据存储器71可形成存储来自经编码视频位流的经编码视频数据的经译码图片缓冲器(CPB)。经解码图片缓冲器82可为存储参考视频数据以供视频解码器30(例如)在帧内或帧间译码模式中解码视频数据中使用的参考图片存储器。视频数据存储器71及经解码图片缓冲器82可由多种存储器装置中的任一者形成,例如动态随机存取存储器(DRAM),包含同步DRAM(SDRAM)、磁阻式RAM(MRAM)、电阻性RAM(RRAM)或其它类型的存储器装置。视频数据存储器71和参考图片存储器82可由同一存储器装置或单独的存储器装置提供。在各种实例中,视频数据存储器71可与视频解码器30的其它组件一起在芯片上,或相对于那些组件在芯片外。
在解码过程期间,视频解码器30从视频编码器20接收表示经编码视频块的视频块及相关联的语法元素的经编码视频位流。熵解码单元70熵解码位流以产生经量化系数、运动向量或帧内预测模式指示符及其它语法元素。视频解码器30可以接收在视频切片层级和/或视频块层级处的语法元素。
如上所述,视频解码器30可经调适以执行多视图视频译码。在一些情况下,视频解码器30可经配置以解码多视图HEVC。对于HEVC-3D,除了编码每一视图的纹理图(即,照度及色度值)之外,视频解码器30可进一步解码每一视图的深度图。
当视频切片经译码为经帧内译码(I)切片时,帧内预测单元74可基于用信号通知的帧内预测模式及来自当前帧或图片的先前经解码块的数据产生用于当前视频切片的视频块的预测数据。帧内预测单元74还可对深度数据进行帧内译码。例如,帧内预测单元74可使用来自基础(2D)HEVC标准的帧内预测模式、区边界链译码模式(CCM)、简化深度译码(SDC)模式或深度模型化模式(DMM)以译码深度切片的经帧内预测PU。
当视频帧被译码为经帧间译码(即,B或P)切片时,运动补偿单元72基于从熵解码单元70接收的运动向量及其它语法元素而产生用于当前视频切片的视频块的预测块。可从参考图片列表中的一者内的参考图片中的一者产生所述预测块。视频解码器30可基于存储在经解码图片缓冲器82中的参考图片使用默认建构技术建构参考帧列表:列表0和列表1。
运动补偿单元72通过解析运动向量及其它语法元素来确定用于当前视频切片的视频块的预测信息,并且使用所述预测信息产生用于正被解码的当前视频块的预测块。举例来说,运动补偿单元72使用所接收的语法元素中的一些语法元素来确定用于对视频切片的视频块进行译码的预测模式(例如,帧内预测或帧间预测)、帧间预测切片类型(例如,B切片或P切片)、用于切片的参考图片列表中的一或多者的建构信息、用于切片的每一经帧间编码视频块的运动向量、用于切片的每一经帧间译码视频块的帧间预测状态,及用以对当前视频切片中的视频块进行解码的其它信息。
运动补偿单元72还可基于内插滤波器执行内插。运动补偿单元72可使用如由视频编码器20在视频块的编码期间使用的内插滤波器来计算参考块的子整数像素的内插值。在此情况下,运动补偿单元72可根据接收的语法元素而确定由视频编码器20使用的内插滤波器并使用所述内插滤波器来产生预测块。
运动补偿单元72还可对深度数据帧间译码。例如,运动补偿单元72可根据基础(2D)HEVC标准或帧间SDC模式执行帧间预测以译码深度切片的经帧内预测PU。
反量化单元76将在位流中提供且由熵解码单元70解码的经量化变换系数反量化,即,解量化。反量化过程可包含使用由视频解码器30针对视频切片中的每一视频块计算以确定应应用的量化程度及同样的反量化程度的量化参数QPY。反变换单元78将反变换应用于变换系数(例如,反DCT、反整数变换或概念上类似的反变换过程),以便产生像素域中的残差块。
在运动补偿单元72或帧内预测单元74基于运动向量或其它语法元素而产生当前视频块(例如,纹理块或深度块)的预测块之后,视频解码器30通过对来自反变换单元78的残差块与由运动补偿单元72或帧内预测单元74产生的对应预测块求和而形成经解码视频。求和器80表示执行此求和操作的一或多个组件。
在需要时,还可应用解块滤波器以对经解码块进行滤波以便移除成块性假影。还可使用其它环路滤波器(在译码环路中或在译码环路之后)来使像素转变平滑或者以其它方式改善视频质量。接着将给定帧或图片中的经解码视频块存储在经解码图片缓冲器82中,经解码图片缓冲器82存储用于后续运动补偿的参考图片。经解码图片缓冲器82还存储经解码视频以用于稍后呈现在显示装置(例如,图1的显示装置32)上。
根据本发明中描述的技术,视频解码器30经配置以使用不同于HEVC译码模式的深度译码模式解码以多视图加深度格式表示的3D视频数据的深度数据。3D视频译码过程(例如3D-HEVC过程)中可用的额外深度帧内译码模式的实例包含DMM、SDC模式及CCM中的至少两者。另外,额外深度帧间译码模式的实例包含帧间SDC模式。
在一个实例中,视频解码器30解码指示用于在深度模型化表中译码3D视频数据的深度数据的深度帧内译码模式的语法元素。所述深度模型化表包含与用于HEVC帧内译码模式的语法分开的用于额外深度帧内译码模式的语法。另外,视频解码器30解码语法元素(例如旗标),所述语法元素指示是否针对3D视频数据启用不同于HEVC帧内译码模式的深度帧内译码模式中的任一者。在一些实例中,语法元素可指示是否针对3D视频数据启用所有深度帧内译码模式。所述语法元素可包含在视频数据的视频参数集(VPS)、序列参数集(SPS)或图片参数集(SPS)中的一者中。在视频解码器30基于经解码语法元素而确定启用深度帧内译码模式时,视频解码器30解码深度模型化表以确定用于译码深度数据的深度帧内译码模式中的一者。可在视频数据的译码单元(CU)水平或预测单元(PU)水平中的一者处解码所述深度模型化表。根据本发明的技术,所述信令可通过在深度模型化表中包含与HEVC帧内译码模式分开的深度帧内译码模式且指示何时启用深度帧内译码模式及应解码深度模型化表而减少视频解码器30处的解析负担。
在另一实例中,视频解码器30可经配置以解码指示3D视频数据的深度数据的残差信息的一组语法元素,其中所述组语法元素跨越深度译码模式中的两者或更多者是统一的。所述深度译码模式可包含深度帧内译码模式及深度帧间译码模式。所述组语法元素可包含指示是否针对深度译码模式中的任一者译码残差值的语法元素。所述组语法元素还可包含指示针对深度译码模式中的任一者的残差值的绝对值及正负号的语法元素。通过共享相同组的语法元素以指示用于深度译码模式中的两者或更多者的残差信息,视频解码器30还可统一用于共享的语法元素中的每一者的上下文模型选择及二进制化方法。另外,对于深度帧内模式,视频解码器30可基于所接收的残差值而确定不在视频数据的深度值的重构期间对相邻参考样本进行滤波。根据本发明的技术,译码机制可通过统一用于深度译码模式的残差信息语法而减少视频解码器30处的解析负担且减少所需的上下文模型及二进制化方法的数目。
现将更详细地描述与3D-HEVC一致的用于深度图的简化译码模式信令的各种技术。所述技术可与深度帧内译码模式相关,所述深度帧内译码模式包含深度模型化模式(DMM)、简化深度译码(SDC)模式及链译码模式(CCM)中的两者或更多者。所述技术可进一步与深度帧内译码模式及深度帧间译码模式(例如帧间SDC模式)两者相关。可(例如)通过或联合图1到3中说明的装置来执行此些技术。以下描述包含对各种视频译码标准及技术的论述。
在此区段中,首先回顾与本发明相关的视频译码技术。视频译码标准包含ITU-TH.261、ISO/IECMPEG-1Visual、ITU-TH.262或ISO/IECMPEG-2Visual、ITU-TH.263、ISO/IECMPEG-4Visual和ITU-TH.264(也被称为ISO/IECMPEG-4AVC),包含其可缩放视频译码(SVC)和多视图视频译码(MVC)扩展。在2010年3月的“用于通用视听服务的高级视频译码”ITU-T推荐H.264中描述MVC的联合草案。另外,存在正由ITU-TVCEG及ISO/IECMPEG的JCT-VC开发的新视频译码标准HEVC。可从http://phenix.it-sudparis.eu/jct/doc_end_user/documents/9_Geneva/wg11/JCTVC-I1003-v5.zip处获得HEVC的草案。
JCT-3V当前正在研究两个三维视频(3DV)解决方案以作为HEVC的扩展。一个实例性3DV解决方案包含被称作MV-HEVC的HEVC的多视图扩展。另一实例包含被称作3D-HEVC的深度增强型3D视频扩展。
在3D-HEVC中,使用多视图视频加深度格式表示三维(3D)视频数据,其中所俘获的视图(例如,纹理)与对应的深度图相关联。在3D-HEVC中,译码纹理及深度图且将其多路复用到3D视频位流中。将深度图译码为灰度视频,其中照度样本表示深度值,且可将常规的帧内及帧间译码方法应用于深度图译码。
通过尖锐边缘及恒定区域来表征深度图,且深度图中的边缘通常呈现与对应纹理数据的强相关性。归因于纹理与对应深度之间的不同统计及相关性,基于2D视频编解码器设计用于深度图的不同译码方案。
图4一般说明与HEVC中的方向性帧内预测模式相关联的预测方向。在基础(2D)HEVC标准中,对于每一预测单元(PU)的照度分量,帧内预测译码方法与三十三个角度预测模式(从2索引到34)、DC模式(使用1索引)及平面模式(使用0索引)一起利用,如图4中所展示。例如,如上所述,HEVC标准可包含三十五个帧内预测模式,包含平面模式(模式0)、DC模式(模式1)及33个方向性预测模式(模式2到34)。
在平面模式下,使用所谓的“平面”功能执行预测。在DC模式下,基于块内的像素值的平均化而执行预测。在方向性预测模式下,沿着特定方向(如由所述模式指示)基于的相邻块的经重构像素而执行预测。一般来说,图4中展示的箭头的尾端表示从其检索值的相邻像素中的相关一者,而箭头的头部表示其中所检索的值传播以形成预测块的方向。
MPEG中的基于HEVC的3D视频译码(3D-HEVC)编解码器是基于提案m22570及m22571中所提议的解决方案。对m22570的完全引用是:施瓦茨等人的夫朗和斐HHI(HEVC兼容配置A)对3D视频译码技术提议的描述,MPEG会议ISO/IECJTC1/SC29/WG11,Doc.MPEG11/M22570,瑞士日内瓦,2011年11月/12月。对m22571的完全引用是:施瓦茨等人的夫朗和斐HHI(HEVC兼容配置B)对3D视频技术提议的描述,MPEG会议ISO/IECJTC1/SC29/WG11,Doc.MPEG11/M22571,瑞士日内瓦,2011年11月/12月。
用于3D-HEVC的参考软件HTM版本6.0可从https://hevc.hhi.fraunhofer.de/svn/svn_3DVCSoftware/tags/HTM-6.0/获得。用于3D-HEVC的软件描述(文档编号:C1005)可从http://phenix.it-sudparis.eu/jct2/doc_end_user/documents/3_Geneva/wg11/JCT3V-C1005-v1.zip获得。例如,正上方的链接是指以下文献:塔克等人的“HEVC测试模型3”文献JCT3V-C1005_spec_d0,联合合作小组对ITU-TSG16WP3及ISO/IECJTC1/SC29/WG11的3D视频译码扩展开发,第3届会议:瑞士日内瓦,2013年1月17日至23日,及塔克等人的“3D-HEVC测试模型3(3D-HEVCTestModel3)”,文献JCT3V-C1005_d0,联合合作小组对ITU-TSG16WP3及ISO/IECJTC1/SC29/WG11的3D视频译码扩展开发,第3届会议:瑞士日内瓦,2013年1月17日至23日。
在3D-HEVC中,每一存取单元含有多个视图分量,每一视图分量含有唯一视图id或视图次序索引或层id。视图分量含有纹理视图分量以及深度视图分量。纹理视图分量被译码为一或多个纹理切片,而深度视图分量被译码为一或多个深度切片。
用于深度数据译码的可用的帧内译码模式是HEVC帧内模式、HEVC帧内脉码调制(I_PCM)模式、区边界链译码模式(CCM)、深度模型化模式(DMM)及简化深度译码模式(SDCM或SDC模式)。用于深度数据译码的可用的帧间译码模式是HEVC帧间模式及帧间SDC模式。在以下子段中依序描述其中的每一者。
在用于3D-HEVC的HEVC帧内模式中,利用与上文针对基础(2D)HEVC标准所描述的帧内预测模式的相同定义。即,支持总共三十五个帧内预测模式,其中帧内预测模式0是指平面帧内预测模式,模式1是指DC预测,且模式2到34是指具有不同方向性的角度预测模式,如图4中所说明。
图5是展示用于角度帧内预测模式的V及H的值的表。方向性帧内预测模式的角度指示为(H,V),其中所述值大致等于H/V。在图5的表中列举用于HEVC帧内模式的可能的(H,V)组合,其中通过2到34索引的每一预测模式对应于(H,V)组合中的一者。
还支持HEVCI_PCM以用于帧内译码。在HEVCI_PCM模式中,绕过预测、变换、量化及熵译码的译码机制,而通过预定义的位数目译码预测样本。
引入被称作链译码模式(CCM)的区边界链译码模式以作为用于深度图译码的一个特殊HEVC帧内预测模式。在JCT3V-A0070(黑奥等人的标题为“用于深度图的CE.6.h区边界链译码(CE.6.hRegionBoundaryChainCodingforDepth-map)”,JCT2-A0070,联合合作小组对ITU-TSG16WP3及ISO/IECJTC1/SC29/WG11的3D视频译码扩展开发,第1届会议:瑞典斯德哥尔摩,2012年7月16日至20日)中描述CCM。
在CCM中,将深度块分割成由使用“链”用信号通知的任意分区型式指定的两个区。链是样本与其八个连接性样本中的一者之间的连接。每一链被指派有方向索引,且用信号通知一连串连接链索引以界定分区型式。
图6A及6B是分别说明CCM中的实例性深度分区型式及实例性经译码链的概念图。如图6A的框200中所展示,存在8种不同类型的链,每一链被指派有范围从0到7的方向索引。链方向类型可辅助视频译码器确定深度块的分区。注意,作为直接译码方向索引(0…7)的替代,应用差分译码以用于用信号通知方向索引。
在CCM中,在rem_intra_luma_pred_mode等于31且当前PU大小等于或大于4×4但小于64×64时,在位流中发射额外旗标(edge_intra_flag)以用信号通知是否使用CCM。在此额外旗标指示将CCM应用于当前PU时,进一步在位流中用信号通知区边界的开始点(从左列或上行,edge_start_left_flag)、链的开始位置(edge_start_position)、链码的数目减1(num_edge_codes_minus1)以及用于每一链码的方向索引(edge_code)。
图6B中说明的实例性PU包含通过指示分割结构的链206分离的第一分区202及第二分区204。视频编码器(例如视频编码器20)可在经编码位流中确定及用信号通知用于当前PU的链206,而视频解码器(例如视频解码器30)可从经编码位流解析表示链206的数据。
一般来说,链206包含开始位置、链中的链接的数目(例如,链码的数目)的指示,及用于每一链码的方向索引。为了用信号通知图6B的实例中展示的任意分区型式,视频编码器20可编码一位(例如,0)以指示链206从顶部边界开始。视频编码器20可进一步编码三个位(例如,011)以指示链206在顶部边界的第三深度样本之后开始,即,开始位置“3”。视频编码器20可进一步编码四个位(例如,0110)以指示在链206中总共存在7个链接。视频编码器20还可编码一连串连接的链索引(例如,3,3,3,7,1,1,1)以指示每一链链接的方向(例如,根据块200)。在一些实例中,视频编码器20可使用查找表将每一索引转换到码字。例如视频解码器30等视频解码器可解析上文描述的信令以确定块的分割型式。视频解码器30可随后解码每一分区的深度值。
深度模型化模式(DMM)方法可以用于在帧间译码期间提供深度图中的尖锐边缘的更好的表示。可整合DMM方法以作为HEVC中所指定的帧内预测模式的替代方案。可(例如)针对每一PU用信号通知一位旗标以指定是应用DMM还是常规的帧内预测(包含HEVC帧内模式、HEVCI_PCM模式以及在一些情况下,CCM)。在一个实例中,在DMM中存在四个帧内模式,即,DMM_1、DMM_2、DMM_3及DMM_4。在所有四个模式中,深度块可被分割成由DMM型式指定的两个区,其中每一区由常量值表示。DMM型式可明确地用信号通知(DMM_1)、由空间相邻块预测(DMM_2)或由位于同一地点的纹理块预测(DMM_3及DMM_4)。存在在DMM中定义的两种分割模型,包含楔形波分割及轮廓分割。
图7A及7B是分别说明DMM中的用于8×8块的实例性楔形波型式及用于8×8块的实例性轮廓型式的概念图。图7A展示用于8×8块的一个楔形波型式。对于楔形波分区,深度块210被直线216分割成两个区212、214,其中开始点218定位于(Xs,Ys)处且结束点220定位于(Xe,Ye)处,如图7A中所说明,其中所述两个区标记有P0及P1。开始点218可被界定为点(8,0)且结束点220可被界定为点(0,8)。
在图7A的实例中,深度块210内的每一个别正方形表示深度块210的相应的个别像素。正方形内的数值表示对应像素是属于区P0212(值“0”)还是区P1214(值“1”)。还在图7A中使用阴影来指示像素是属于区212(白色正方形)还是区214(灰色正方形)。每一楔形波型式由标记对应样本是否属于区P0或P1的大小uB×vB二进制数字阵列组成,其中uB及vB分别表示深度块210的水平及垂直大小。
以此方式,例如视频编码器20及视频解码器30等视频译码器可使用线216(如由开始点218及结束点220界定)以确定深度块210的像素是属于区212(其也可被称作区“P0”)还是区214(其也可被称作区“P1”)。在编码及解码开始处初始化楔形波型式。
图7B展示用于8×8块的一个轮廓型式。对于轮廓分区,深度块230可被分割成两个不规则区。在图7B的实例中,深度块230被线236、238分割成区232及区234A、234B。虽然区234A中的像素不紧邻于区234B中的像素,但为了预测深度块230的PU,区234A及234B经界定以形成一个单一区。轮廓分割比楔形波分割更灵活,但可能相对更难以用信号通知。在子模式DMM_4中,在3D-HEVC的情况下,使用位于同一地点的纹理块的经重构照度样本隐式地导出轮廓分割型式。
在图7B的实例中,深度块230内的每一个别正方形表示深度块230的相应的个别像素。正方形内的数值表示对应的像素是属于区P0232(在图7B的实例中的值“0”)还是区P1234A、234B(在图7B的实例中的值“1”)。图7B在还使用阴影来指示像素是属于区232(白色正方形)还是区234A、234B(灰色正方形)。如上文相对于楔形波型式所论述,可通过标记对应样本(即,像素)是否属于区P0或P1的大小uB×vB二进制数字阵列界定每一轮廓型式,其中uB及vB分别表示深度块230的水平及垂直大小。
以此方式,视频译码器(例如视频编码器20及视频解码器30)可使用线236、238来确定深度块230的像素是属于区232(其也可被称作区“P0”)还是区234(其也可被称作区“P1”)。区“P1”及“P2”是根据DMM而分割的不同区的默认命名规范,且因此,深度块210的区P0将不被视为与深度块230的区P0相同的区。
在DMM中,总共存在分别针对4×4、8×8、16×16及32×32块而界定的86、782、1394及1503种不同楔形波型式。这些型式经产生且存储在编码及解码两者中。基于DMM型式的类型(楔形波或轮廓分割)及衍生物,在DMM中界定四个子模式,包含:DMM_1(显式楔形波信令)、DMM_2(经帧内预测楔形波分割)、DMM_3(分量间楔形波分割),及DMM_4(分量间轮廓分割),下文更详细地描述每一模式。
子模式DMM_1界定显式楔形波信令。在子模式DMM_1中,应用楔形波分割且在编码器(例如视频编码器20)处基于某一失真规则而选择最佳的一者。位流中用信号通知所述选定的楔形波型式的索引。七个、十个或十一个频段用于译码对应于等于4×4、8×8或大于8×8的PU大小的索引。
子模式DMM_2界定经帧内预测楔形波分割。在子模式DMM_2中,应用楔形波分割,且使用相邻帧内预测模式的信息及楔形波型式信息来预测所述选定的楔形波型式。在此情况下,避免楔形波型式索引的直接信令,且用信号通知所预测的楔形波型式的精细化。
子模式DMM_3界定分量间楔形波分割。在子模式DMM_3中,对相同存取单元的位于同一地点的照度纹理块区穷尽地尝试所有可用的楔形波型式,且将最佳匹配纹理块的一个楔形波型式选择为用于深度切片中的PU的楔形波分区。不需要楔形波分割型式的信令,但在解码器(例如视频解码器30)处需要最佳型式的穷尽搜索。
归因于3D-HEVC标准中的JCT3V-C0044的采用(王等人的标题为“深度模型化模式3的简化的CE6.h结果(CE6.hresultsonSimplificationofDepthModelingMode3)”,JCT3V-C0044,联合合作小组对ITU-TSG16WP3及ISO/IECJTC1/SC29/WG11的3D视频译码扩展开发,第3届会议:日内瓦,2013年1月17日至23日),所述子模式DMM_3已经被修改成略微不同于上文描述。例如,在经修改的子模式DMM_3中,如果使用角度帧内预测模式2到34中的一者对位于同一地点的纹理照度块帧内译码,那么用信号通知额外索引以从楔形波型式子集识别所要的或最终的楔形波型式。所述楔形波型式子集是由位于同一地点的纹理块的帧内预测方向识别。
如下描述子集的构造的详细介绍。假设楔形波型式的开始点是S(Xs,Ys)且结束点是E(Xe,Ye),那么存在对应于每一楔形波型式的一对(S,E)。对于每一帧内预测模式(即,模式2到34),如图5中展示的表中定义方向信息(Hi,Vi)。楔形波型式(由(Xs,Ys)及E(Xe,Ye)界定)与帧内模式(由(Hi,Vi)界定)之间的拟合被定义为:D[i]=|Vi×(Xs-Xe)-Hi×(Ye-Ys)|。随后,可通过搜索所有帧内预测模式当中的最小D而将每一楔形波型式映射到最接近的帧内预测模式。对应地,对于每一帧内预测模式j,存在其中每个型式的最接近的帧内预测模式是j的楔形波型式子集S(j)。
否则,在其中位于同一地点的纹理照度块未经帧内译码或帧内模式是0或1的情况下,用信号通知粗略候选楔形波型式子集中的最佳楔形波型式的索引。图8A和8B是分别说明DMM的子模式DMM_3中的楔形波分离线开始/结束位置的实例性粗略子集及一个楔形波型式子集内的实例性精细化的概念图。在图8A和8B中,黑色轮廓的圆圈指示楔形波型式的开始/结束位置,且黑色轮廓圆圈中具有灰色填充的圆圈指示开始/结束位置的粗略子集。针对每两个开始及结束位置产生粗略型式,如图8A中所展示。每一粗略候选楔形波型式子集含有至多八个参考,如图8B中所展示。应注意,对于上文描述的两种情况,用信号通知的额外索引具有相同的固定长度。
子模式DMM_4界定分量间轮廓分割。在子模式DMM_4中,在解码过程期间通过将位于同一地点的纹理块分离为两个部分而产生轮廓分割型式:第一部分含有具有大于平均值的照度样本值的像素,且第二部分含有具有小于或等于平均值的照度样本值的像素。
图9是展示针对不同PU大小的可用的DMM子模式及楔形波型式的数目的表。在实例实施方案中,对于小于或等于4×4的PU大小,仅启用子模式DMM_1及子模式DMM_3,且对于大于4×4但小于64×64的PU大小,即,8×8、16×16及32×32,启用所有四个模式。此外,在实例实施方案中,对于大于或等于64×64的PU大小,停用所有四个模式。出于清楚起见,在图9中展示的表中列举用于不同PU大小的可用的DMM子模式及楔形波型式的对应数目。
引入简化深度译码(SDC)模式以作为对其它HEVC帧内译码模式的替代性帧内译码模式。在JCT3V-B0036(雅格等人的标题为“3D-CE6.h:使用任选的深度查找表的简化深度译码(3D-CE6.h:SimplifiedDepthCodingwithanoptionalDepthLookupTable)”,联合合作小组对ITU-TSG16WP3及ISO/IECJTC1/SC29/WG11的3D视频译码扩展开发,第2届会议:中国上海,2012年10月13日至19日)中描述SDC模式。针对每一帧内深度CU用信号通知额外旗标以指定是否通过SDC模式译码当前CU。在常规的3D-HEVC过程中,仅针对具有2N×2N分区大小的CU应用SDC模式。
在所述SDC模式中,作为译码经量化变换系数的替代,将深度块表示为分区的类型,例如,单一DC分区、两个DMM_1分区或单一平面分区,且针对每一分区用信号通知残差值(像素域中)。在SDC模式中界定三个子模式,包含SDCM_DC、SDCM_DMM_1及SDCM_Planar,其分别对应于DC、DMM_1及平面的分区类型。在SDC模式中,不应用变换或量化,且可任选地使用深度查找表(DLT)将深度值映射到索引,所述深度查找表是通过在编码全序列之前在第一帧内周期内分析帧而建构。如果使用DLT,那么在序列参数集(SPS)中将整个DLT传输到解码器,例如视频解码器30,且基于所述DLT而将经解码的索引值映射回到深度值。为描述DLT的使用,在本发明中,表DLT[·]用于根据所述DLT将深度值转换到索引值,且表IDLT[·]用于将索引值转换回到深度值。
下文给出译码单元(CU)的语法表。语法的灰色突出显示的部分一般在用于深度视图的帧内译码方面指示HEVC标准与3D-HEVC标准之间的差异。
G.7.3.9.1通用译码单元语法
在帧间SDC模式中,针对深度帧间译码进一步扩展SDC模式的概念。在JCT3V-E1001(塔克等人的“3D-HEVC草案文本1(JCT-3V的输出文档)(3D-HEVCDraftText1(OutputDocumentofJCT-3V))”,联合合作小组对ITU-TSG16WP3及ISO/IECJTC1/SC29/WG11的3D视频译码扩展开发(JCT-3V),第5届会议:奥地利维也纳,2013年7月27日至8月2日)中描述帧间SDC模式。3D-HEVC的工作草案(文档编号:JCT3V-E1001)可从http://phenix.int-evry.fr/jct3v/doc_end_user/documents/5_Vienna/wg11/JCT3V-E1001-v3.zip获得。
帧间SDC模式通过仅编码含有单一唯一分区的每一PU的一个DC残差值而提供额外的残差译码方法。在帧间SDC的情况下,跳过每一PU的变换及量化,且残差块的所有其样本等于对应的用信号通知的DC残差值,其类似于在帧内译码中应用的SDC模式的子模式SDCM_DC。对于非跳过CU,进一步用信号通知一位旗标以指示是否应用帧间SDC。对于跳过CU,维持在当前3D-HEVC中进行的相同过程。如果应用帧间SDC模式,那么针对每一PU用信号通知仅一个DC残差值,否则,用信号通知传统的经量化变换系数块。
现将更详细地描述用于深度译码模式中的分区的残差译码。在包含DMM、CCM、SDC模式及帧间SDC模式的深度译码模式中,不管PU含有一个还是两个分区,可使用一个单一值用信号通知整个分区的残差(还被称作“△DC”)。此方法在本发明中被称为△DC译码。
如下定义与使用DMM的△DC译码相关的语法元素及语义。
语法元素dmm_dc_flag指示是否存在用于DMM的深度数据的残差值。dmm_dc_flag[x0][y0]等于1指定存在dmm_dc_abs[x0][y0][i]及dmm_dc_sign_flag[x0][y0][i]。dmm_dc_flag[x0][y0]等于0指定dmm_dc_abs[x0][y0][i]及dmm_dc_sign_flag[x0][y0][i]不存在。
在存在残差值时,dmm_dc_abs[x0][y0][i]及dmm_dc_sign_flag[x0][y0][i]的语法元素分别指示用于DMM的深度数据的残差值的量值(即,绝对值)及正负号。这些语法元素用于如下导出DcOffset[x0][y0][i]:
DcOffset[x0][y0][i]=(1-2*dmm_dc_sign_flag[x0][y0][i])*dmm_dc_abs[x0][y0][i].
如下导出使用DMM而译码的每一分区的△DC值。在编码器(例如视频编码器20)处,对于每一分区i(i=0,1),使用相邻参考样本导出所预测的DC值predDC[i]。分区i内的原始样本的平均值被计算为origDC[i]。如果未应用DLT,那么将残差值deltaDC[i]导出为origDC[i]-predDC[i]。否则,应用DLT且将deltaDC[i]导出为DLT[origDC[i]]-DLT[predDC[i]]。在任一情况下,可基于编码器优化进一步调整deltaDC[i]。
在解码器(例如视频解码器30)处,对于每一分区i(i=0,1),接收残差值deltaDC[i],且使用相邻参考样本导出所预测的DC值predDC[i]。如果未应用DLT,那么将分区i中的每一预测样本的值(即,经重构深度值)导出为predDC[i]+deltaDC[i]。否则,应用DLT,且将分区i中的每一预测样本的值导出为IDLT[DLT[predDC[i]]+deltaDC[i]]。
如下定义与使用CCM的△DC译码相关的语法元素及语义。
语法元素edge_dc_flag指示是否存在用于CCM的深度数据的残差值。edge_dc_flag[x0][y0]等于1指定edge_dc_abs[x0][y0][i]及edge_dc_sign_flag[x0][y0][i]存在,且edge_dc_flag[x0][y0]等于0指定edge_dc_abs[x0][y0][i]及edge_dc_sign_flag[x0][y0][i]不存在。
在存在残差值时,edge_dc_abs[x0][y0][i]及edge_dc_sign_flag[x0][y0][i]的语法元素分别指示用于CCM的深度数据的残差值的量值(即,绝对值)及正负号。这些语法元素用于如下导出DcOffset[x0][y0][i]:
DcOffset[x0][y0][i]=(1-2*edge_dc_sign_flag[x0][y0][i])*edge_dc_abs[x0][y0][i]
如下导出使用CCM而译码的每一分区的△DC值。在CCM中,永不应用DLT,且△DC以在编码器(例如视频编码器20)处经量化的方式通过缩放因数scaleF被译码,其中scaleF是通过最小值1和最大值裁剪的QPY表示应用于照度变换系数译码的量化参数,且BitDepthY指示应用于照度样本表示的位深度。在例如视频解码器30等解码器处使用解量化而补偿回此缩放因数。以此方式,针对CCM用信号通知的△DC的值可小得多的。
在视频编码器20处,对于每一分区i(i=0,1),使用相邻参考样本导出所预测的DC值predDC[i]。分区i内的原始样本的平均值被计算为origDC[i]。对于每一分区i,将经量化残差值deltaDC[i]导出为(origDC[i]-predDC[i])/scaleF,且可基于编码器优化进一步调整deltaDC[i]。
在视频解码器30处,对于每一分区i,接收经量化残差值deltaDC[i],且将残差值deltaDC[i]解量化为deltaDC[i]=deltaDC[i]*scaleF。其后,对于每一分区i,使用相邻参考样本导出所预测的DC值predDC[i]。将分区i内的每一预测样本的值(即,经重构深度值)导出为deltaDC[i]与predDC[i]的总和。在本文档中,CCM中的△DC值的导出中所涉及的以上量化及解量化过程被称作高级量化及高级解量化。
如下定义与使用SDC模式的残差译码相关的语法元素及语义。
语法元素sdc_residual_flag指示用于SDC模式的深度数据的残差值是否存在。sdc_residual_flag[x0][y0][i]等于0指定片段i的残差是零。sdc_residual_flag等于1指定残差是非零且存在片段i的sdc_residual_sign_flag及sdc_residual_abs[i]语法元素。
在存在残差值时,sdc_residual_abs_minus1[x0][y0][i]及sdc_residual_sign_flag[x0][y0][i]的语法元素分别指示用于SDC模式的深度数据的残差值的量值(即,绝对值)及正负号。这些语法元素用于如下导出片段i的SdcResidual[x0][y0][i]:
SdcResidual[x0][y0][i]=(1-2*sdc_residual_sign_flag[x0][y0][i])*(sdc_residual_mag_minus1[x0][y0][i]+1)
如下定义与使用帧间SDC模式的残差译码相关的语法元素及语义。
语法元素inter_sdc_flag指示是否存在用于帧间SDC模式的深度数据的残差值。inter_sdc_flag等于1指定针对当前译码单元使用残差块的简化深度译码。inter_sdc_flag等于0指定未针对当前译码单元使用残差块的简化深度译码。当不存在时,推断inter_sdc_flag等于0。
在存在残差值时,inter_sdc_resi_abs_minus1[x0][y0][i]及inter_sdc_resi_sign_flag[x0][y0][i]的语法元素分别指示用于帧间SDC模式的深度数据的残差值的量值(即,绝对值)及正负号。这些语法元素用于如下导出InterSdcResi[x0][y0][i]:
InterSdcResi[x0][y0][i]=(1-2*inter_sdc_resi_sign_flag[x0][y0][i])*(inter_sdc_resi_abs_minus1[x0][y0][i]+1)
如下导出使用SDC模式及帧间SDC模式而译码的每一分区的△DC值。在SDC模式及帧间SDC模式两者中,以与上文相对于DMM所描述的类似方式导出每一分区的△DC值。在例如视频编码器20等编码器处,对于每一分区i(i=0,1),使用相邻参考样本导出所预测的DC值predDC[i]。分区i内的原始样本的平均值被计算为origDC[i]。如果未应用DLT,那么将残差值deltaDC[i]导出为origDC[i]-predDC[i]。否则,应用DLT,且将deltaDC[i]导出为DLT[origDC[i]]-DLT[predDC[i]]。
在例如视频解码器30等解码器处,对于每一分区i(i=0,1),接收残差值deltaDC[i]且使用相邻参考样本导出所预测的DC值predDC[i]。如果未应用DLT,那么将分区i中的每一预测样本的值(即,经重构深度值)导出为predDC[i]+deltaDC[i]。否则,应用DLT,且将分区i中的每一预测样本的值(即,经重构深度值)导出为IDLT[DLT[predDC[i]]+deltaDC[i]]。
在HEVC及3D-HEVC中,对于照度分量,在例如视频编码器20等编码器处的产生过程之前且在例如视频解码器30等解码器处的深度值重构过程之前对用于帧内预测样本(即,残差值)产生的相邻参考样本进行滤波。通过给定帧内预测模式及变换块大小控制滤波。例如,如果帧内预测模式是DC或变换块大小等于4×4,那么不对相邻样本进行滤波。作为另一实例,如果给定帧内预测模式与垂直模式(或水平模式)之间的距离大于预定义阈值,那么启用滤波过程。在一些实例中,预定义阈值对于变换块大小8、16及32中的每一者分别是7、1及0。
对于相邻样本滤波,可使用[1,2,1]滤波器及双线性滤波器。如果HEVC中定义的若干条件为真,则有条件地使用双线性滤波。在常规的3D-HEVC过程中,对相邻参考样本的滤波未应用于DMM,但应用于CCM。
3D-HEVC中的深度译码模式的常规的译码及信令机制可在解码器(例如视频解码器30)处产生若干问题。作为一个实例,不同深度帧内译码模式(例如DMM、SDC模式及CCM)的使用的个别信令会增加解码器解析负担。作为另一实例,引入不同语法元素以译码深度帧内译码模式中的每一者。因此,需要额外的上下文模型,其会增加解码器处的存储器复杂度。在另一个实例中,在遍历一个CU中的所有PU的一个环路中用信号通知DMM的使用。另外,遍历一个CU中的所有PU的若干环用于译码额外信息,其是不必要的,但会增加解码器处的解析复杂度。
本发明中描述的技术涉及使用3D-HEVC标准中的不同于HEVC译码模式的深度译码模式来编码及解码3D视频数据的深度数据。3D-HEVC中可用的额外深度帧内译码模式的实例包含DMM、SDC模式及CCM中的至少两者。另外,额外深度帧间译码模式的实例包含帧间SDC模式。下文更详细地描述的技术可由视频编码器20(图1及2)及/或视频解码器30(图1及3)执行,其两者可一般被称作视频译码器。
在第一实例中,本发明的技术包含在深度模型化表中用信号通知用于译码3D视频数据的深度图的深度帧内译码模式。所述深度模型化表用信号通知与用于HEVC帧内译码模式的语法分开的用于额外深度帧内译码模式的语法。以此方式,用于深度帧内译码模式的额外语法经设计成具有与用于帧内译码模式的HEVC语法中的原始更少的交互。
所述技术还包含用信号通知语法元素(例如旗标)以指示是否针对3D视频数据启用不同于HEVC帧内模式的深度帧内译码模式中的任一者。作为仅在视频数据的视频参数集(VPS)中具有vps_dmm_flag以指示当前深度层是否使用DMM的替代,所述技术包含在视频数据的VPS、SPS或PPS中的一者中用信号通知单一旗标以指示是否启用深度帧内译码模式(包含DMM、CCM及SDC模式中的至少两者)中的任一者或停用所有深度帧内译码模式。在一些实例中,所述单一旗标可指示是否启用所有深度帧内译码模式。本发明的技术可通过在深度模型化表中用信号通知与HEVC帧内译码模式分开的深度帧内译码模式且指示何时启用深度帧内译码模式且应解析深度模型化表而减少视频解码器30处的解析负担。
在停用深度帧内译码模式时,视频解码器30不解码深度模型化表且选择不同于深度帧内译码模式的HEVC帧内译码模式中的一者,例如HEVC帧内译码模式或HEVCI_PCM模式。在启用深度帧内译码模式时,视频解码器30接收及解码深度模型化表以选择用于译码深度数据的深度帧内译码模式中的一者。例如,所述深度模型化表可包含指示DMM的子模式中的一者、SDC模式的子模式中的一者或用于解码深度数据的CCM的一或多个语法元素。在一些实例中,可将指示DMM子模式、SDC子模式及CCM的不同语法元素分组在一起,使得所述不同模式由一个语法元素指示。
替代地,可将DMM及CCM的子模式DMM_1及DMM_3视为HEVC帧内译码模式的部分。在此情况下,深度模型化表可包含用于DMM的至少一个子模式(例如DMM_2及/或DMM_4),及SDC模式的三个子模式(即,SDCM_DM、SDCM_DMM_1及SDCM_Planar)的语法元素。在其中将CCM定义为HEVC帧内译码模式的情况下,所述技术包含在与深度模型化表分开的链译码表中用信号通知用于CCM的深度数据的残差信息。
另外,作为在若干环中单独地用信号通知所有PU的dmm_flag、所有PU的DMM子模式及所有PU的其它DMM相关信息的替代,CU语法表或深度模型化表可经设计以一起包含一个PU的所有DMM信息,接着是另一PU的信息,以此类推。因此,仅需要遍历当前CU中的所有PU的一个环路。
在第二实例中,本发明的技术包含跨越深度译码模式中的两者或更多者而统一用于3D视频数据的深度图的残差信息的信令。定义指示深度数据的残差信息的一组语法元素,其中相同组语法元素指示用于深度译码模式中的任一者的残差信息。所述组语法元素指示用于深度译码模式中的任一者的深度数据的每一译码分区的至少一个残差值。
所述统一的一组语法元素可包含指示是否针对深度译码模式(包含DMM、CCM、SDC模式及帧间SDC模式中的至少两者)中的任一者译码残差值的语法元素。所述统一组语法元素还可包含指示用于深度译码模式中的任一者的残差值的绝对值及正负号的语法元素。在一些情况下,所述统一组语法元素可包含在上文描述的深度模型化表中以指示用于译码深度数据的深度帧内译码模式中的一者,且指示深度数据的残差值。
在常规的3D-HEVC过程中,用于DMM及CCM的残差信息的信令是通过语法元素edge_dc_flag、edge_dc_1_abs、edge_dc_2_abs、dmm_dc_1_abs、dmm_dc_2_abs、edge_dc_1_sign_flag、edge_dc_2_sign_flag、dmm_dc_1_sign_flag及dmm_dc_2_sign_flag。在一个实例中,根据本发明中描述的技术,可统一用于DMM及CCM的残差信息语法元素以减少视频解码器30处的解析负担及残差信息语法元素所需的上下文模型的数目。
在另一实例中,所述技术统一用于DMM、CCM及SDC模式的残差信息信令。在另一个实例中,用于帧间SDC模式的残差信息的信令还可与用于DMM、CCM及SDC模式的残差信息的信令统一。一般来说,对于所有深度译码模式,在针对PU的两个分区中的每一者或仅PU的唯一分区用信号通知残差时,可以深度译码模式共享相同组的语法元素的方式统一信令机制。
通过共享相同组的语法元素以指示用于深度译码模式中的两者或更多者的残差信息,还可统一用于所述语法元素的上下文模型选择及二进制化方法。例如,跨越深度译码模式中的两者或更多者共享的语法元素中的每一者可仅需要一个上下文模型。以此方式,可将相同组的上下文模型(例如用于共享的语法元素中的每一者的一组上下文模型)应用于深度译码模式中的任一者。另外,可针对深度译码模式中的任一者使用单一上下文模型选择方法。
根据所述技术,上下文模型选择可基于当前深度块的分区的数目。对于用信号通知是否针对帧间SDC模式译码残差值的语法元素,上下文模型选择可取决于应用于当前CU的分区数目。另一方面,对于用信号通知是否针对DMM、CCM或SDC模式译码残差值的相同语法元素,上下文模型选择可取决于应用于当前PU的分区数目。
在常规的3D-HEVC过程中,用信号通知用于DMM、CCM及SDC模式的残差值的绝对值的语法元素的二进制化当前分别由语法元素edge_dc_abs、dmm_dc_abs及sdc_residual_abs_minus1表示。本发明的技术包含通过使用相同的二进制化方法统一这些语法元素以减少视频解码器30处的解析复杂度。这些语法元素的统一的二进制化方法可与常规上用于SDC模式中的语法元素(即,sdc_residual_abs_minus1)或用于DMM中的语法元素(即,dmm_dc_abs)的二进制化方法中的任一者相同。
用信号通知用于帧间SDC模式的残差值的绝对值的语法元素的二进制化还可统一成与用于SDC模式或DMM的二进制化方法相同。一般来说,对于将深度CU(或深度PU)分割为若干片段且针对每一片段仅用信号通知一个残差值的所有深度译码模式,可统一用信号通知残差值的绝对值及正负号的语法元素的二进制化以减少视频解码器30处的解析复杂度。本发明的技术可通过统一用于深度译码模式的残差信息译码机制而减少解码器解析负担且减少所需的上下文模型及二进制化方法的数目。
另外,对于深度帧内模式,可不在被称作残差值的帧内预测样本的产生期间或在基于残差值的深度值的重构期间对相邻参考样本进行滤波。例如,根据本发明的技术,在帧内预测样本产生期间对相邻参考样本的滤波可被停用,且不在DMM、CCM及SDC模式的子模式SDCM_DMM_1中应用。
如上文所描述,在常规的3D-HEVC过程中,已经针对DC帧内预测模式(包含SDC模式的子模式SDCM_DC)停用对相邻参考样本的滤波。在另一实例中,可进一步针对SDC模式的子模式SDCM_Planar停用在帧内预测样本产生期间对相邻参考样本的滤波。以此方式,视频解码器30可根据深度译码模式中的任一者基于所接收的残差信息及相邻参考样本来解码深度数据以重构视频数据的深度值,而不对相邻参考样本进行滤波。类似地,视频编码器20可根据深度译码模式中的任一者基于视频数据的原始深度值及相邻参考样本而产生深度数据的残差值,而不对相邻参考样本进行滤波。
作为替代方案,对于DMM、CCM及SDC模式的子模式SDCM_DMM_1及SDCM_Planar,可始终应用在帧内预测样本产生期间对相邻参考样本的滤波。在此情况下,滤波方法可取决于所应用的深度译码模式。
此外,所述技术包含使用深度查找表(DLT)基于用于DMM、SDC模式、帧间SDC模式及CMM中的任一者的分区的一个单一所传输的残差值而统一用于重构深度值的过程。对于深度译码模式中的任一者,在视频解码器30处,可以使用DLT将预测值索引转换到分区的预测值,即,经重构深度值,其中预测值索引是所传输的残差值与所预测的DC值索引的总和。在根据CCM基于用于分区的一个单一所传输的残差值及预测值而产生残差信息时,可移除单一残差值的在视频编码器20处的高级量化及在视频解码器30处的高级解量化。通过从CCM移除高级量化,解码过程可与DMM及SDC模式统一使用DLT。
以此方式,视频解码器30使用DLT重构译码分区内的深度值以使用等于针对译码分区接收的单一残差值及识别从相邻参考样本导出的预测值的DLT索引值的总和的索引值来查找值。视频解码器30不执行对所接收的单一残差值的高级解量化。类似地,视频编码器20使用DLT而产生用于译码分区的单一残差值,其中用于译码分区的单一残差值等于识别译码分区内的原始深度值的平均值的第一DLT索引值与识别从相邻参考样本导出的预测值的第二DLT索引值的差异。视频编码器20不执行对所产生的单一残差值的高级量化。
下文描述3D-HEVC中的3D视频数据的深度数据的深度译码模式信令的若干详细实施实例。
在本发明的技术的第一实例中,视频编码器20编码指示启用深度帧内译码模式的旗标,且编码包含指示使用深度帧内译码模式中的选定一者编码深度数据的一或多个语法元素的深度模型化表。在启用深度帧内译码模式时,如由用信号通知的旗标指示,视频解码器30接收及解码深度模型化表以选择所述深度帧内译码模式来解码深度数据。
在此实例中,作为在深度译码模式中使用多个语法元素来指示SDC模式、DMM或HEVC帧内译码模式(包含CCM)的使用的替代,一个语法元素指示深度帧内译码模式(包含DMM、SDC模式及CCM中的至少两者)的启用。指示深度帧内译码模式中的选定一者的一或多个语法元素包含在与HEVC语法分开的深度模型化表中,且可从用于CU的HEVC语法移除一些条件。
在用信号通知深度模型化表的第一实例技术的第一替代方案中,添加一个语法元素depth_intra_mode以指示CU语法表及深度模型化表中的深度视图的帧内译码模式,且用信号通知CCM以作为一个额外的深度帧内译码模式而不是HEVC帧内预测模式的部分。在其它实例中,一个以上语法元素可指示CU语法表及深度模型化表中的深度帧内译码模式。下文以灰色突出显示对3D-HEVC标准的添加,且使用删除线指示从3D-HEVC标准的删除。
G.7.3.9.1通用译码单元语法
可如下定义新引入的语法“depth_modeling_table”。
H.xxxx深度模型化表语法
如下定义用于CU语法表及深度模型化表的语义。
可将DepthModesFlag设定成等于针对VPS中的每一深度层用信号通知的语法元素depth_modes_flag。depth_modes_flag[i]等于1指示针对具有等于i的layer_id的深度层启用DMM、CCM及SDC模式。depth_modes_flag[i]等于0指示针对具有等于i的layer_id的深度层停用DMM、CCM及SDC模式。
no_residual_syntax_flag(HEVC规范中的rqt_root_cbf)等于1指定transform_tree()语法对于当前译码单元是存在的。rqt_root_cbf等于0指定transform_tree()语法对于当前译码单元是不存在的。在rqt_root_cbf不存在且sdcFlag[x0][y0]等于0时,推断其值等于1。在rqt_root_cbf不存在且sdcFlag[x0][y0]等于1时,推断其值等于0。
替代地,用于SDC模式的no_residual_syntax_flag的语义及残差信息(包含sdc_residual_flag、sdc_residual_sign_flag及sdc_residual_abs_minus1)的信令保持不变。在此情况下,可移除以上呈现的深度模型化表中的语法的最后部分(表的第二行至最后一行的开始于“elseif(sdcFlag[x0][y0]){”且结束于“}”)
intra_chroma_pred_mode[x0][y0]指定用于色度样本的帧内预测模式。阵列索引x0、y0指定所考虑的预测块的左上方照度样本相对于图片的左上方照度样本的位置(x0,y0)。在当前视图分量是深度视图分量时,此语法不存在。或者,在SDC模式应用于当前译码单元时,此语法不存在。
depth_intra_mode[x0][y0]可为下表1中展示的值中的一者。下文以灰色突出显示对3D-HEVC标准的添加,且使用删除线指示从3D-HEVC标准的删除。
表1:depth_intra_mode的解译
在一些替代方案中,可所应用呈现DepthIntraMode的其它二进位串。另外,在当前模式是DMM时(例如,在depth_intra_mode等于SDCM_DMM_1及DMM_1时),存在prev_intra_luma_pred_flag。或者,在表1中,可移除子模式DMM_2。此外,在表1中,可应用深度帧内译码模式的任何其它次序。
作为另一替代方案,子模式DMM_2可被CCM代替且上表1可如下表2中重新定义。
表2:depth_intra_mode的解译
在其中使用CCM代替子模式DMM_2的情况下,如上表2中所展示,可通过移除如所示的行而修改深度模型化表的语法。使用删除线指示从上文呈现的深度模型化表的删除。
H.xxxx深度模型化表语法
如下定义用于上文呈现的经修改的深度模型化表的语义。
dmm_delta_flag[x0][y0]等于0指定DC偏移值不可用且dmm_delta_flag[x0][y0]等于1指定DC偏移值可用。在dmm_delta_flag[x0][y0]等于1时,进一步通过dmm_dc_abs及dmm_dc_sign_flag用信号通知用于每一分区的DC偏移值(即,残差值)。
使用dmm_dc_abs[x0][y0][i]及thedmm_dc_sign_flag[x0][y0][i]如下导出QuantDCOffsetPi[x0][y0]值:
QuantDCOffsetP0[x0][y0]=(1-2*dmm_dc_sign_flag[x0][y0][0])*dmm_dc_abs[x0][y0][0](H-x)
QuantDCOffsetP1[x0][y0]=(1-2*dmm_dc_sign_flag[x0][y0][1])*dmm_dc_abs[x0][y0][1](H-x)
edge_dc_abs[x0][y0][i]及edge_dc_sign_flag[x0][y0][i]及DcOffsetPi[x0][y0]值如下。
DcOffsetP0[x0][y0]=(1-2*edge_dc_sign_flag[x0][y0][0])*edge_dc_abs[x0][y0][0](H-X)
DcOffsetP1[x0][y0]=(1-2*edge_dc_sign_flag[x0][y0][1])*edge_dc_abs[x0][y0][1](H-X)
在解码语法元素depth_intra_mode时,可应用下表3中展示的以下上下文模型来译码第一及/或第二二进位:
表3:使用左边及上方语法元素的ctxIdxInc的规范
在表3中展示的上下文模型规范的一个替代方案中,可仅在第一二进位等于0(即,(depth_intra_mode<3))时应用用于译码第二二进位的condL及condA的使用。在另一个替代方案中,仅一个上下文可用于语法元素depth_intra_mode的头两个二进位中的每一者。在另一替代方案中,仅一个上下文可用于第一二进位,且可绕过译码第二二进位。对于语法元素depth_intra_mode的剩余二进位,可针对它们中的每一者使用一个上下文。在其它实例中,可绕过译码depth_intra_mode的剩余二进位。用于译码语法元素depth_intra_mode的上下文的初始化可取决于切片类型。
用信号通知深度模型化表的第一实例技术的第二替代方案类似于上文描述的第一替代方案。然而,在第二替代方案中,可如下进一步统一在深度模型化表中用信号通知DMM及CCM深度帧内译码模式及相关联的残差信息,即,使用语法元素dmm_delta_flag、edge_dc_flag、edge_dc_abs、dmm_dc_abs、edge_dc_sign_flag及dmm_dc_sign_flag。以灰色突出显示对上文描述的第一替代方案上的深度模型化表的添加,且使用删除线指示删除。
H.xxxx深度模型化表语法
如下定义用于经修改的深度模型化表的语义。
dmm_cmm_delta_flag[x0][y0]等于0指定DC偏移值不可用,且dmm_cmm_delta_flag[x0][y0]等于1指定DC偏移值可用于经CCM或DMM译码的PU。在dmm_cmm_delta_flag[x0][y0]等于1时,进一步通过dmm_cmm_dc_abs及cmm_dc_sign_flag用信号通知用于每一分区的DC偏移值。
使用dmm_cmm_dc_abs[x0][y0][i]及dmm_cmm_dc_sign_flag[x0][y0][i]如下导出QuantDCOffsetPi[x0][y0]值,其中i是0到1:
QuantDCOffsetPi[x0][y0]=(1-2*dmm_cmm_dc_sign_flag[x0][y0][I])*dmm_cmm_dc_abs[x0][y0][I](H-x)
用信号通知深度模型化表的第一实例技术的第三替代方案类似于上文描述的第一替代方案。然而,在第三替代方案中,可用的深度帧内模式的数目与常规的3D-HEVC标准保持不变,同时使用一个语法元素(即,depth_intra_mode)在CU语法表及深度模型化表中用信号通知一个PU的帧内译码模式。将与深度帧内译码模式(即,DMM及SDC模式)相关的额外语法元素放入与CU语法表中的HEVC帧内译码模式语法分开的深度模型化表中。在此实例中,由于将CCM定义为HEVC帧内译码模式的部分,所以引入与深度模型化表分开的链译码语法表。以灰色突出显示对上文描述的第一替代方案上的CU及深度模型化表的添加,且使用删除线指示删除。
G.7.3.9.1通用译码单元语法
在第三替代方案中,从深度模型化表移除CCM相关语法元素,并且替代地,引入新链译码语法表“ccm_info”。
H.xxxx深度模型化表语法
H.xxxx链译码模式语法
如下定义用于上文呈现的经修改的深度模型化表的语义。depth_intra_mode[x0][y0]可为下表4中展示的值中的一者。表4表示与常规的3D-HEVC标准不变的可用的深度帧内模式。
表4:depth_intra_mode的解译
在一个替代方案中,用于语法元素depth_intra_mode等于0、1及2(即,指示SDCM平面、包含CCM的HEVC帧内及SDCM_DMM_1)的二进位串可分别设定成“000”、“001”及“01”。在另一个替代方案中,用于语法元素depth_intra_mode等于0、1及2的二进位串可分别设定成“000”、“01”及“001”。在另一替代方案中,可使用前三个深度帧内模式的其它次序。一般来说,可应用用以呈现DepthIntraMode的其它二进位串。
例如,3D-HEVC标准中的深度帧内模式的可用的数目可减小1,即,可移除DMM_2。在表5及下文呈现的经修改的深度模型化语法表中使用删除线指示与上文呈现的深度模型化表在语义及语法表上的改变。
表5:depth_intra_mode的解译
H.xxxx深度模型化表语法
在另一实例中,可不在深度帧内译码中考虑SDC模式的子模式SDCM_DC。在那种情况下,depth_intra_mode等于6可被CCM取代。
用信号通知深度模型化表的第一实例技术的第四替代方案类似于上文描述的第三替代方案。然而,在第四替代方案中,将DMM的子模式DMM_1及DMM_3视为HEVC帧内译码模式的部分。以灰色突出显示对上文描述的第三替代方案上的CU及深度模型化表的语法及语义的添加,且使用删除线指示删除。
G.7.3.9.1通用译码单元语法
H.xxxx深度模型化表语法
H.xxxx链译码模式语法
如下定义用于上文呈现的CU语法表及经修改的深度模型化表的语义。depth_intra_mode[x0][y0]可为下表6中展示的值中的一者。
表6:depth_intra_mode的解译
dmm_ccm_directional_intra_idc[x0+i][y0+i]可为下表7中展示的值中的一者。
表7:dmm_ccm_directional_intra_idc的解译
在本发明的技术的第二实例中,简化用于DMM、HEVC帧内模式及CCM的语法表及语法元素。在此实例中,作为在若干环中单独地用信号通知所有PU的dmm_flag、所有PU的DMM子模式及所有PU的其它DMM相关信息的替代,CU语法表或深度模型化表可经设计以一起包含一个PU的所有DMM信息,接着是另一PU的信息,以此类推。因此,仅需要遍历当前CU中的所有PU的一个环路。
在简化用于深度帧内译码模式的语法表及元素的第二实例技术的第一替代方案中,相关语义保持不变,同时修改CU语法表以使其对于视频解码器30处的解析过程更简单。下文以灰色突出显示对3D-HEVC标准的添加,且使用删除线指示从3D-HEVC标准的删除。
G.7.3.9.1通用译码单元语法
在简化用于深度帧内译码模式的语法表及元素的第二实例技术的第二替代方案中,在应用DMM或CCM时统一与DC偏移的信令相关的语法元素。以灰色突出显示对上文描述的第一替代方案上的CU语法表的语法及语义的添加,且使用删除线指示删除。
G.7.3.9.1通用译码单元语法
如下界定上文呈现的CU语法表的语义。
使用dc_0_abs[x0][y0]、dc_0_sign_flag[x0][y0]、dc_1_abs[x0][y0]及dc_1_sign_flag[x0][y0]如下导出QuantDCOffsetP0[x0][y0]及QuantDCOffsetP1[x0][y0]值:
QuantDCOffsetP0[x0][y0]=(1-2*dc_0_sign_flag[x0][y0])*dc_0_abs[x0][y0](G-19)
QuantDCOffsetP1[x0][y0]=(1-2*dc_1_sign_flag[x0][y0])*dc_1_abs[x0][y0](G-20)
在本发明的技术的第三实例中,视频编码器20使用跨越深度译码模式中的两者或更多者统一的信令机制用信号通知3D视频数据的深度数据的残差信息。以此方式,视频解码器30可解码相同组的语法元素来确定用于深度译码模式中的任一者的残差信息。统一的一组语法元素可包含指示是否针对深度译码模式中的任一者译码残差值的语法元素。所述统一组语法元素还可包含指示用于深度译码模式中的任一者的残差值的绝对值及正负号的语法元素。通过共享相同组的语法元素以指示用于深度译码模式中的两者或更多者的残差信息,还可统一用于语法元素的上下文模型选择及二进制化方法。
下文以灰色突出显示对3D-HEVC标准的添加,且使用删除线指示从3D-HEVC标准的删除。3D-HEVC的工作草案(文档编号:JCT3V-E1001)可从http://phenix.int-evry.fr/jct3v/doc_end_user/documents/5_Vienna/wg11/JCT3V-E1001-v3.zip获得。3D-HEVC的软件描述(文档编号:JCT3V-E1005)可从http://phenix.int-evry.fr/jct3v/doc_end_user/documents/5_Vienna/wg11/JCT3V-E1005-v1.zip获得。
H.7.3.8.5.1深度模式参数语法
如下定义与上文呈现的深度模式参数语法表相关联的语义。
H.7.4.9.5.1深度模式参数语义
depth_dc_flag[x0][y0]等于1指定depth_dc_abs[x0][y0][i]及depth_dc_sign_flag[x0][y0][i]存在。depth_dc_flag[x0][y0]等于0指定depth_dc_abs[x0][y0][i]及depth_dc_sign_flag[x0][y0][i]不存在且导出为0。使用depth_dc_abs[x0][y0][i]如下导出depth_dc_abs[x0][y0][i]。
depth_dc_abs[x0][y0][i]+=(dcNumSeg==1?1:0)
使用depth_dc_sign_flag[x0][y0][i]如下导出DcOffset[x0][y0][i]。
DcOffset[x0][y0][i]=(1-2*depth_dc_sign_flag[x0][y0][i])*depth_dc_abs[x0][y0][i](H-24)
H.8.4.4.2.11深度分区值导出及指派过程
对此过程的输入如下。
-相邻样本p[x][y],其中x=-1,y=-1..nTbS*2-1且x=0..nTbS*2-1,y=-1
-二元阵列partitionPattern[x][y],其中x,y=0..nTbS-1,指定分区0和分区1中的预测块的分割。
-指定变换块大小的变量nTbS
-旗标dcOffsetAvailFlag,指定DC偏移值是否可用
-变量dcOffsetP0及dcOffsetP1,指定块分区的DC偏移
此过程的输出如下。
-所预测的样本predSamples[x][y],其中x,y=0..nTbS-1
如以下所指定而导出变量vertEdgeFlag及horEdgeFlag。
vertEdgeFlag=(partitionPattern[0][0]!=partitionPattern[nTbS-1][0])?1:0(H-45)
horEdgeFlag=(partitionPattern[0][0]!=partitionPattern[0][nTbS-1])?1:0(H-46)
如以下所指定而导出变量dcVal0及dcVal1。
-如果vertEdgeFlag等于horEdgeFlag,以下适用:
dcValBR=horEdgeFlag?
((p[-1][nTbS-1]+p[nTbS-1][-1])>>1):(1<<(BitDepthY-1))(H-47)
dcValLT=(p[-1][0]+p[0][-1])>>1(H-48)
-否则(horEdgeFlag不等于vertEdgeFlag),以下适用:
dcValBR=horEdgeFlag?p[-1][nTbS-1]:p[nTbS-1][-1](H-49)
dcValLT=horEdgeFlag?p[(nTbS-1)>>1][-1]:
p[-1][(nTbS-1)>>1](H-50)
如以下所指定而导出所预测的样本值predSamples[x][y]。
-对于在0到(nTbS-1)的范围内的x(包括0及nTbS-1),以下适用:
-对于在0到(nTbS-1)的范围内的y(包括0及nTbS-1),以下适用:
-如以下所指定而导出变量predDcVal及dcOffset:
predDcVal=(partitionPattern[x][y]==partitionPattern[0][0])?dcValLT:dcValBR(H-52)
dcOffset=dcOffsetAvailFlag?(partitionPattern[x][y]==0?dcOffsetP0:dcOffsetP1):0(H-53)
-如果dlt_flag[nuh_layer_id]等于0,以下适用:
predSamples[x][y]=predDcVal+dcOffset(H-55)
-否则(dlt_flag[nuh_layer_id]等于1),以下适用:
predSamples[x][y]=Idx2DepthValue[DepthValue2Idx[predDcVal]+dcOffset](H-56)
H.8.4.4.3深度值重构过程
对此过程的输入如下。
-照度位置(xTb,yTb),指定相对于当前图片的左上照度样本的当前块的左上照度样本
-变量nTbS,指定变换块大小
-所预测的样本predSamples[x][y],其中x,y=0..nTbS-1
-帧内预测模式predModeIntra
此过程的输出如下。
-经重构的深度值样本resSamples[x][y],其中x,y=0..nTbS-1
取决于predModeIntra,如下导出指定二元分段型式的阵列wedgePattern[x][y],其中x,y=0..nTbS-1。
-如果predModeIntra等于INTRA_DMM_WFULL,以下适用。
wedgePattern=WedgePatternTable[Log2(nTbS)][wedge_full_tab_idx[xTb][yTb]]
-否则(predModeIntra不等于INTRA_DMM_WFULL),以下适用:
-对于x,y=0..nTbS-1,wedgePattern[x][y]被设定为等于0
取决于dlt_flag[nuh_layer_id],如以下所指定而导出经重构的深度值样本resSamples[x][y]。
-如果dlt_flag[nuh_layer_id]等于0,以下适用:
-对于x,y=0..nTbS-1,如以下所指定而导出经重构的深度值样本resSamples[x][y]:
resSamples[x][y]=predSamples[x][y]+
DcOffset[xTb][yTb][wedgePattern[x][y]](H-59)
-否则(dlt_flag[nuh_layer_id]等于1),以下适用:
-如以下所指定而导出变量dcPred[0]及dcPred[1]:
-如果predModeIntra等于INTRA_DC,以下适用:
dcPred[0]=predSamples[nTbS-1][nTbS-1](H-60)
-否则,如果predModeIntra等于INTRA_PLANAR,以下适用:
dcPred[0]=(predSamples[0][0]+predSamples[0][nTbS-1]+predSamples[nTbS-1][0]+predSamples[nTbS-1][nTbS-1]+2)>>2(H-61)
-否则,(predModeIntra等于INTRA_DMM_WFULL),以下适用:
dcPred[wedgePattern[0][0]]=predSamples[0][0](H-62)
dcPred[wedgePattern[nTbS-1][0]]=predSamples[nTbS-1][0](H-63)
dcPred[wedgePattern[0][nTbS-1]]=predSamples[0][nTbS-1](H-64)
dcPred[wedgePattern[nTbS-1][nTbS-1]]=predSamples[nTbS-1][nTbS-1](H-65)
-对于x,y=0..nTbS-1,如以下所指定而导出经重构的深度值样本
resSamples[x][y]:
dltIdxPred=DepthValue2Idx[dcPred[wedgePattern[x][y]]](H-66)
dltIdxResi=DcOffset[xTb][yTb][wedgePattern[x][y]](H-67)
resSamples[x][y]=predSamples[x][y]+Idx2DepthValue[dltIdxPred+dltIdxResi]-dcPred[wedgePattern[x][y]](H-68)
H.9.3.2.2上下文变量的初始化过程
子条款9.3.2.2中的规范应用以下修改。
-所有对子条款7.3.8.1到7.3.8.11中指定的过程的参考被对子条款H.7.3.8.1到H.7.3.8.11中指定的过程的参考取代。
-表H-12附加到表9-4的末尾。
-表H-13到表H-24附加到子条款的末尾。
表H-12:初始化过程中的每一初始化类型的ctxIdx与语法元素的关联
表H-21:depth_intra_modectxIdx的initValue的值
表H-22:depth_dc_flagctxIdx的initValue的值
表H-25:inter_sdc_flagctxIdx的initValue的值
表H-26:inter_sdc_resi_abs_minus1ctxIdx的initValue的值
表H-27:inter_sdc_resi_sign_flagctxIdx的initValue的值
H.9.3.3二进制化过程
H.9.3.3.1通用
子条款9.3.3.1中的规范应用以下修改。
-表H-28附加到表9-32的末尾。
表H-28:语法结构和相关联的二进制化
在一个替代方案中,可以仅二进位具有取决于分区数目的特定上下文的方式将语法元素depth_dc_flag二进制化,如下文所示。
H.9.3.4.2ctxTable、ctxIdx及bypassFlag的导出过程
H.9.3.4.2.1通用
子条款9.3.4.2.1中的规范应用以下修改:
-表H-31附加到表9-37的末尾。
表H-31:将ctxInc指派到具有经上下文译码的二进位的语法元素
或者,以不同分区(第一或第二)共享相同上下文的方式将语法元素depth_dc_flag二进制化,如下文所展示。
表H-31:将ctxInc指派到具有经上下文译码的二进位的语法元素
本发明的技术的第四实例类似于上文所描述的第三实例。然而,在第四实例中,针对DMM、CCM及至少SDC模式的子模式SDCM_DMM_1移除在帧内预测样本产生期间使用的对相邻参考样本的滤波。如上文所描述,已经针对DC帧内预测模式(包含子模式SDCM_DC)停用所述滤波。在一些实例中,还可针对SDC模式的子模式SDCM_Planar移除所述滤波。
在此实例中,视频编码器20基于视频数据的原始深度值及相邻参考样本而产生3D视频数据的深度数据的残差值,而不对相邻参考样本进行滤波。类似地,视频解码器30基于所接收的深度数据的残差值及相邻参考样本而重构视频数据的深度值,而不对相邻参考样本进行滤波。
下文以灰色突出显示对3D-HEVC标准的添加,且使用删除线指示从3D-HEVC标准的删除。
H.8.4.4.2.3相邻样本的滤波过程
对此过程的输入如下。
-相邻样本p[x][y],其中x=-1,y=-1..nTbS*2-1且x=0..nTbS*2-1,y=-1
-变量nTbS,指定变换块大小
此过程的输出是经滤波的样本pF[x][y],其中x=-1,y=-1..nTbS*2-1且x=0..nTbS*2-1,y=-1.
如下导出变量filterFlag。
-如果以下条件中的一或多者为真,则filterFlag设定为等于0:
-predModeIntra等于INTRA_DC.
-predModeIntra大于INTRA_ANGULAR34。
-nTbS等于4。
-否则,以下适用:
-变量minDistVerHor设定为等于Min(Abs(predModeIntra-26),Abs(predModeIntra-10)).
-变量intraHorVerDistThres[nTbS]在表8-3中指定。
-如下导出变量filterFlag:
-如果minDistVerHor大于intraHorVerDistThres[nTbS],则filterFlag设定为等于1。
-否则,filterFlag设定为等于0。
表8-3:各种变换块大小的intraHorVerDistThres[nTbS]的规范
nTbS=8 nTbS=16 nTbS=32
intraHorVerDistThres[nTbS] 7 1 0
在语法元素filterFlag等于1时,以下适用。
-如下导出变量biIntFlag:
-如果所有以下条件为真,则biIntFlag设定为等于1:
-strong_intra_smoothing_enabled_flag等于1
-nTbS等于32
-Abs(p[-1][-1]+p[nTbS*2-1][-1]-2*p[nTbS-1][-1])<(1<<(BitDepthY-5))
-Abs(p[-1][-1]+p[-1][nTbS*2-1]-2*p[-1][nTbS-1])<(1<<(BitDepthY-5))
-否则,biIntFlag设定为等于0。
-如下执行滤波:
-如果biIntFlag等于1,如下导出经滤波的样本值pF[x][y],其中x=-1,y=-1..63且x=0..63,y=-1:
[1]pF[-1][-1]=p[-1][-1](8-30)
[2]pF[-1][y]=((63-y)*p[-1][-1]+(y+1)*p[-1][63]+32)>>6fory=0..62(8-31)
[3]pF[-1][63]=p[-1][63](8-32)
[4]pF[x][-1]=((63-x)*p[-1][-1]+(x+1)*p[63][-1]+32)>>6forx=0..62(8-33)
[5]pF[63][-1]=p[63][-1](8-34)
-否则(biIntFlag等于0),如下导出经滤波的样本值pF[x][y],其中x=-1,y=-1..nTbS*2-1且x=0..nTbS*2-1,y=-1:
[6]pF[-1][-1]=(p[-1][0]+2*p[-1][-1]+p[0][-1]+2)>>2(8-35)
[7]pF[-1][y]=(p[-1][y+1]+2*p[-1][y]+p[-1][y-1]+2)>>2fory=0..nTbS*2-2(8-36)
[8]pF[-1][nTbS*2-1]=p[-1][nTbS*2-1](8-37)
[9]pF[x][-1]=(p[x-1][-1]+2*p[x][-1]+p[x+1][-1]+2)>>2forx=0..nTbS*2-2(8-38)
[10]pF[nTbS*2-1][-1]=p[nTbS*2-1][-1](8-39)
图10是说明指示用于在深度模型化表中编码3D视频数据的深度数据的深度帧内模式的视频编码器的实例性操作的流程图。相对于来自图1及2的视频编码器20描述所述实例性操作。视频编码器20产生表示经编码视频数据的至少一部分的视频位流。在此实例中,视频数据包括以多视图加深度格式表示的3D视频数据,其中根据3D-HEVC过程译码纹理数据及对应的深度数据。视频数据的深度数据可为表示视频数据的对应纹理数据的深度数据的深度图。
根据本发明的技术,视频编码器20使用不同于HEVC帧内译码模式的多个深度帧内译码模式中的选定一者编码视频数据的深度数据(300)。所述深度帧内译码模式可包含DMM、SDC模式及CCM中的至少两者。视频编码器20可根据所述选定的深度帧内译码模式基于视频数据的原始深度值及相邻参考样本而产生所预测的深度数据的残差值。视频编码器20随后编码指示针对视频数据启用深度帧内模式的语法元素(302)。所述语法元素可为深度模式旗标,其中所述旗标的第一值指示深度帧内译码模式中的至少一者被启用,且所述旗标的第二值指示没有深度帧内译码模式被启用。在其它实例中,所述语法元素可为深度模式旗标,其中所述旗标的第一值指示所有深度帧内译码模式被启用,且所述旗标的第二值指示没有深度帧内译码模式被启用。
基于指示深度帧内译码模式被启用的语法元素,视频编码器20进一步编码深度模型化表,所述深度模型化表包含指示与用于HEVC帧内译码模式的语法元素分开的深度帧内译码模式中的选定一者的语法元素(304)。例如,所述深度模型化表可包含指示用于编码深度数据的特定深度帧内译码模式的一或多个语法元素,所述特定深度帧内译码模式例如为DMM的子模式中的一者、SDC模式的子模式中的一者,或CCM。在一些实例中,可将CCM及/或DMM子模式中的至少一者定义为HEVC帧内译码模式,并且因此,未包含在深度模型化表中。
另外,深度模型化表可包含指示用于指定深度帧内译码模式的深度数据的残差信息的一组语法元素。所述组语法元素可包含指示是否存在深度数据的残差值以及在存在的情况下指示深度数据的残差值的绝对值及正负号的语法元素。在一些实例中,相同组的语法元素可指示用于所述多个深度帧内译码模式中的任一者的残差信息。
在其中使用不同于深度帧内译码模式的HEVC帧内译码模式中的一者编码深度数据且语法元素指示没有深度帧内模式被启用的情况下,视频编码器20不编码或传输深度模型化表。替代地,在那种情况下,视频编码器20编码指示HEVC帧内译码模式中的一者的一或多个语法元素。例如,所指示的HEVC帧内译码模式可为HEVC帧内译码模式或HEVCI_PCM模式。在一些实例中,所指示的HEVC帧内译码模式可为DDM的子模式或被定义为HEVC帧内译码模式的CCM。在CCM被定义为HEVC帧内译码模式的情况下,用于CCM的语法元素未包含在深度模型化表中,但可替代地包含在单独的链译码表中。
图11是说明从深度模型化表选择深度帧内译码模式以解码3D视频数据的深度数据的视频解码器的实例性操作的流程图。相对于来自图1及3的视频解码器30描述所述实例性操作。视频解码器30接收表示经编码视频数据的至少一部分的视频位流。在此实例中,视频数据包括以多视图加深度格式表示的3D视频数据,其中根据3D-HEVC过程译码纹理数据及对应的深度数据。视频数据的深度数据可为表示视频数据的对应纹理数据的深度数据的深度图。
根据本发明的技术,视频解码器30解码来自位流的指示是否针对视频数据启用多个深度帧内译码模式中的任一者的语法元素,其中所述深度帧内译码模式不同于HEVC帧内译码模式(310)。所述深度帧内译码模式可包含DMM、SDC模式及CCM中的至少两者。所述语法元素可为深度模式旗标,其中所述旗标的第一值指示深度帧内译码模式中的至少一者被启用,且所述旗标的第二值指示没有深度帧内译码模式被启用。在其它实例中,所述语法元素可为深度模式旗标,其中所述旗标的第一值指示所有深度帧内译码模式被启用,且所述旗标的第二值指示没有深度帧内译码模式被启用。在解码指示深度帧内译码模式被启用的语法元素(312的是分支)之后,视频解码器30还解码深度模型化表,所述深度模型化表包含与用于HEVC帧内译码模式的语法元素分开的用于深度帧内译码模式的语法元素(316)。
在其中语法元素指示没有深度帧内模式被启用(312的否分支)的情况下,视频解码器30不解码深度模型化表。替代地,在那种情况下,视频解码器30选择不同于深度帧内译码模式的HEVC帧内译码模式中的一者(314)。所述选定的HEVC帧内译码模式可为HEVC帧内译码模式或HEVCI_PCM模式。在一些实例中,所述选定的HEVC帧内译码模式可为DMM的子模式或被定义为HEVC帧内译码模式的CCM。在被定义为HEVC帧内译码模式的CCM的情况下,用于CCM的语法元素未包含在深度模型化表中,而是可替代地包含在单独的链译码表中。
在针对视频数据启用深度帧内译码模式且视频解码器30解码深度模型化表(312、316的是分支)时,视频解码器30基于深度模型化表中的语法元素而选择深度帧内译码模式中的一者(318)。例如,所述深度模型化表可包含指示用于解码深度数据的特定深度帧内译码模式的一或多个语法元素,所述特定深度帧内译码模式例如为DMM的子模式中的一者、SDC模式的子模式中的一者,或CCM。在一些实例中,CCM及/或DMM子模式中的至少一者可被定义为HEVC帧内译码模式,并且因此未包含在深度模型化表中。
另外,深度模型化表可包含指示用于指定深度帧内译码模式的深度数据的残差信息的一组语法元素。所述组语法元素可包含指示是否存在深度数据的残差值以及在存在的情况下指示深度数据的残差值的绝对值及正负号的语法元素。在一些实例中,相同组的语法元素可指示用于所述多个深度帧内译码模式中的任一者的残差信息。
视频解码器30随后使用所述选定的深度帧内译码模式解码视频数据的深度数据(320)。例如,视频解码器30可根据所述选定的深度帧内译码模式基于深度数据的残差值及相邻参考样本而重构视频数据的深度值。可随后存储视频数据的经重构深度值或使用所述经重构深度值在显示装置上呈现3D视频数据。
图12是说明使用针对两个或更多个深度译码模式统一的机制来指示3D视频数据的深度数据的残差信息的视频编码器的实例性操作的流程图。相对于来自图1及2的视频编码器20描述所述实例性操作。视频编码器20产生表示经编码视频数据的至少一部分的视频位流。在此实例中,所述视频数据包括以多视图加深度格式表示的3D视频数据,其中根据3D-HEVC过程译码纹理数据及对应的深度数据。视频数据的深度数据可为表示视频数据的对应纹理数据的深度数据的深度图。
视频编码器20选择用于编码视频数据的深度数据的多个深度译码模式中的一者(330)。所述深度译码模式可为包含DMM、SDC模式及CCM中的至少两者的深度帧内译码模式。在其它实例中,所述深度译码模式可包含深度帧内译码模式及深度帧间译码模式两者。在那种情况下,所述深度译码模式可包含DMM、SDC模式、帧间SDC模式及CCM中的至少两者。
根据本发明的技术,视频解码器30可在根据所述选定的深度译码模式编码深度数据之前不对相邻参考样本进行滤波(332)。在一些情况下,可针对深度帧内译码模式中的任一者停用对相邻参考样本的滤波。在其它情况下,可针对DDM、CCM及至少SDC模式的子模式SDCM_DC及SDCM_DMM_1停用对相邻参考样本的滤波。视频编码器20随后使用所述选定的深度译码模式编码视频数据的深度数据以基于视频数据的原始深度值及相邻参考样本而产生所预测的深度数据的残差信息(334)。
视频编码器20编码指示用于视频数据的选定的深度译码模式的一或多个语法元素(336)。在一些实例中,视频编码20可编码不同语法元素以指示不同深度译码模式中的每一者。在其它实例中,视频编码器20可编码指示针对视频数据启用深度帧内模式的语法元素。在所述语法元素指示深度帧内译码模式被启用时,视频编码器20可进一步编码深度模型化表,所述深度模型化表包含指示与用于HEVC帧内译码模式的语法分开的深度帧内译码模式中的选定一者的一或多个语法元素。
根据本发明的技术,视频编码器20随后编码指示视频数据的深度数据的残差信息的一组语法元素,其中相同组的语法元素指示用于所述多个深度译码模式中的任一者的残差信息(338)。例如,所述组语法元素可指示用于深度译码模式中的任一者的深度数据的每一译码分区的至少一个残差值。所述组语法元素可在DMM、SDC模式、帧间SDC模式及CCM中的至少两者之间共享。
视频编码器20可使用单一上下文模型选择方法从单一组上下文模型选择用于指示用于深度译码模式中的任一者的残差信息的所述组语法元素的上下文模型。例如,跨越深度译码模式中的两者或更多者共享的语法元素中的每一者可仅需要一个上下文模型。以此方式,可将相同组的上下文模型(例如,用于共享的语法元素中的每一者的一组上下文模型)应用于深度译码模式中的任一者。
指示深度数据的残差信息的所述组语法元素可包含指示针对深度译码模式中的任一者是否存在深度数据的残差值的语法元素。例如,在其中所述组语法元素指示用于深度帧内译码模式中的任一者的残差信息的情况下,视频编码器20可基于应用于深度数据的当前PU的译码分区的数目而选择用于指示是否存在深度数据的残差值的语法元素的上下文模型。在其中所述组语法元素指示用于帧间SDC模式的残差信息的其它情况下,视频编码器20可基于深度数据的当前CU的译码分区的数目而选择用于指示是否存在深度数据的残差值的语法元素的上下文模型。
另外,所述组语法元素可包含指示用于深度译码模式中的任一者的深度数据的残差值的绝对值及正负号的语法元素。例如,视频编码器20可使用用于深度译码模式(包含深度帧内译码模式及深度帧间译码模式)中的任一者的单一二进制化方法将指示深度数据的残差值的绝对值及正负号的语法元素二进制化。所述单一二进制化方法可为常规上用于DMM、SDC模式或CCM的二进制化方法中的一者。
图13是说明使用针对两个或更多个深度译码模式统一的机制来确定3D视频数据的深度数据的残差信息的视频解码器的实例性操作的流程图。相对于来自图1及3的视频解码器30描述所述实例性操作。视频解码器30接收表示经编码视频数据的至少一部分的视频位流。在此实例中,所述视频数据包括以多视图加深度格式表示的3D视频数据,其中根据3D-HEVC过程译码纹理数据及对应的深度数据。视频数据的深度数据可为表示视频数据的对应纹理数据的深度数据的深度图。
根据本发明的技术,视频解码器30解码来自位流的指示视频数据的深度数据的残差信息的一组语法元素,其中相同组的语法元素指示用于多个深度译码模式中的任一者的残差信息(350)。例如,所述组语法元素可指示用于深度译码模式中的任一者的深度数据的每一译码分区的至少一个残差值。所述深度译码模式可为包含DMM、SDC模式及CCM中的至少两者的深度帧内译码模式。在其它实例中,所述深度译码模式可包含深度帧内译码模式及深度帧间译码模式两者。在那种情况下,深度译码模式可包含DMM、SDC模式、帧间SDC模式及CCM中的至少两者。
视频解码器30可使用单一上下文模型选择方法从单一组上下文模型选择用于指示用于深度译码模式中的任一者的残差信息的所述组语法元素的上下文模型。例如,跨越深度译码模式中的两者或更多者共享的语法元素中的每一者可仅需要一个上下文模型。以此方式,可将相同组的上下文模型(例如用于共享的语法元素中的每一者的一组上下文模型)应用于深度译码模式中的任一者。
指示深度数据的残差信息的所述组语法元素可包含指示针对深度译码模式中的任一者是否存在深度数据的残差值的语法元素。例如,在其中所述组语法元素指示用于深度帧内译码模式中的任一者的残差信息的情况下,视频解码器30可基于应用于深度数据的当前PU的译码分区的数目而选择用于指示是否存在深度数据的残差值的语法元素的上下文模型。在其中所述组语法元素指示用于帧间SDC模式的残差信息的其它情况下,视频解码器30可基于深度数据的当前CU的译码分区的数目而选择用于指示是否存在深度数据的残差值的语法元素的上下文模型。
另外,所述组语法元素可包含指示用于深度译码模式中的任一者的深度数据的残差值的绝对值及正负号的语法元素。例如,视频解码器30可使用用于深度译码模式(包含深度帧内译码模式及深度帧间译码模式)中的任一者的单一二进制化方法将指示深度数据的残差值的绝对值及正负号的语法元素解二进制化。所述单一二进制化方法可为常规上用于DMM、SDC模式或CCM的二进制化方法中的一者。
视频解码器30还解码来自位流的指示用于视频数据的深度译码模式中的一者的一或多个语法元素(352)。在一些实例中,视频解码器30可解码不同语法元素以指示不同深度译码模式中的每一者。在其它实例中,视频解码器30可解码指示是否针对视频数据启用深度帧内译码模式中的任一者的语法元素。在解码指示深度帧内译码模式被启用的语法元素之后,视频解码器30还可解码深度模型化表,所述深度模型化表包含指示与用于HEVC帧内译码模式的语法元素分开的深度帧内译码模式中的一者的一或多个语法元素。
根据本发明的技术,视频解码器30可在根据所指示的深度译码模式解码深度数据之前不对相邻参考样本进行滤波(354)。在一些情况下,可针对深度帧内译码模式中的任一者停用对相邻参考样本的滤波。在其它情况下,可针对DDM、CCM及至少SDC模式的子模式SDCM_DC及SDCM_DMM_1停用对相邻参考样本的滤波。视频解码器30随后使用所指示的深度译码模式基于深度数据的残差信息及相邻参考样本来解码视频数据的深度数据以重构视频数据的深度值(356)。可随后存储视频数据的经重构深度值或使用所述经重构深度值在显示装置上呈现3D视频数据。
上文描述的技术可由视频编码器20(图1及2)及/或视频解码器30(图1及3)执行,其两者可一般被称作视频译码器。另外,在适用时,视频译码可一般涉及视频编码及/或视频解码。虽然一般相对于3D-HEVC描述本发明的技术,但所述技术不以此方式受限。上文描述的技术还可适用于其它当前标准或尚未开发的未来标准。
应理解,取决于实例,本文中的任何所描述的方法的某些动作或事件可以用不同顺序执行、可以添加、合并或全部省略(例如,实践所述方法并不需要所有的所描述动作或事件)。此外,在某些实例中,可例如通过多线程处理、中断处理或多个处理器同时而非依序执行动作或事件。此外,虽然为了清晰起见,本发明的某些方面被描述为是通过单个模块或单元执行,但是应理解,本发明的技术可以通过与视频译码器相关联的单元或模块的组合执行。
虽然在上文描述所述技术的各种方面的特定组合,但提供这些组合仅为了说明本发明中描述的技术的实例。因此,本发明的技术不应限于这些实例组合且可涵盖本发明中描述的技术的各种方面的任何可设想的组合。
在一或多个实例中,所描述的功能可以用硬件、软件、固件或其任何组合来实施。如果以软件实施,则所述功能可作为一或多个指令或代码在计算机可读媒体上存储或传输,且由基于硬件的处理单元执行。计算机可读媒体可包含计算机可读存储媒体,其对应于有形媒体,例如数据存储媒体,或包含任何促进将计算机程序从一处传送到另一处的媒体(例如,根据通信协议)的通信媒体。
以此方式,计算机可读媒体一般可对应于(1)非暂时性的有形计算机可读存储媒体或(2)例如信号或载波等通信媒体。数据存储媒体可为可由一或多个计算机或一或多个处理器存取以检索用于实施本发明中描述的技术的指令、代码及/或数据结构的任何可用媒体。计算机程序产品可包含计算机可读存储媒体和封装材料。
举例来说且并非限制,所述计算机可读媒体可包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储装置、磁盘存储装置或其它磁性存储装置,快闪存储器,或可用于存储呈指令或数据结构的形式的所要程序代码且可由计算机存取的任何其它媒体。同样,任何连接可恰当地称为计算机可读媒体。举例来说,如果使用同轴电缆、光纤缆线、双绞线、数字订户线(DSL)或例如红外线、无线电和微波等无线技术从网站、服务器或其它远程源传输指令,那么同轴电缆、光纤缆线、双绞线、DSL或例如红外线、无线电和微波等无线技术包含在媒体的定义中。
然而,应理解,所述计算机可读存储媒体和数据存储媒体并不包含连接、载波、信号或其它瞬时媒体,而是实际上针对非瞬时的有形存储媒体。如本文所使用,磁盘及光盘包含压缩光盘(CD)、激光光盘、光学光盘、数字多功能光盘(DVD)、软性磁盘及蓝光光盘,其中磁盘通常以磁性方式重现数据,而光盘使用激光以光学方式重现数据。上述各者的组合也应包含在计算机可读媒体的范围内。
指令可以由一或多个处理器执行,所述一或多个处理器例如是一或多个数字信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、现场可编程逻辑阵列(FPGA)或其它等效的集成或离散逻辑电路。因此,如本文中所使用的术语“处理器”可指上述结构或适合于实施本文中所描述的技术的任一其它结构中的任一者。另外,在一些方面中,本文中所描述的功能性可以在经配置用于编码和解码的专用硬件和/或软件模块内提供,或者并入在组合编解码器中。并且,可将所述技术完全实施于一或多个电路或逻辑元件中。
本发明的技术可实施于广泛多种装置或设备中,包含无线手持机、集成电路(IC)或IC组(例如,芯片组)。本发明中描述各种组件、模块或单元是为了强调经配置以执行所揭示技术的装置的功能方面,但不必需要通过不同硬件单元实现。实际上,如上文所描述,各种单元可以结合合适的软件及/或固件组合在编码解码器硬件单元中,或者通过互操作硬件单元的集合来提供,所述硬件单元包含如上文所描述的一或多个处理器。
已描述本发明的各种方面。这些及其它方面在所附权利要求书的范围内。

Claims (50)

1.一种解码视频数据的方法,所述方法包括:
解码指示所述视频数据的深度数据的残差信息的一组语法元素,其中相同组语法元素指示用于多个深度译码模式中的任一者的残差信息;
解码指示用于所述视频数据的所述多个深度译码模式中的一者的一或多个语法元素;及
使用所述所指示的深度译码模式基于所述深度数据的所述残差信息及相邻参考样本来解码所述视频数据的所述深度数据。
2.根据权利要求1所述的方法,其中所述深度译码模式包括深度帧内译码模式,所述深度帧内译码模式包含深度模型化模式DMM、简化深度译码SDC模式及链译码模式CCM中的至少两者。
3.根据权利要求1所述的方法,其中所述深度译码模式包括深度模型化模式DMM、简化深度译码SDC模式、帧间SDC模式及链译码模式CCM中的至少两者。
4.根据权利要求1所述的方法,其中所述组语法元素指示用于所述深度译码模式中的任一者的所述深度数据的每一译码分区的至少一个残差值。
5.根据权利要求1所述的方法,其中所述组语法元素包含指示所述深度数据的残差值针对所述深度译码模式中的任一者是否存在的语法元素。
6.根据权利要求5所述的方法,其进一步包括基于所述深度数据的译码分区的数目而选择用于指示所述深度数据的残差值针对所述深度译码模式中的任一者是否存在的所述语法元素的上下文模型。
7.根据权利要求1所述的方法,其中所述组语法元素包含指示用于所述深度译码模式中的任一者的所述深度数据的残差值的绝对值及正负号的语法元素。
8.根据权利要求7所述的方法,其进一步包括使用单一二进制化方法将指示用于所述深度译码模式中的任一者的所述深度数据的所述残差值的所述绝对值及所述正负号的所述语法元素解二进制化。
9.根据权利要求1所述的方法,其进一步包括使用单一上下文模型选择方法从应用于所述深度译码模式中的任一者的相同组上下文模型选择用于所述深度译码模式中的任一者的所述组语法元素的上下文模型。
10.根据权利要求1所述的方法,其中解码所述深度数据包括根据所述所指示的深度译码模式基于所述残差信息及所述相邻参考样本而重构所述视频数据的深度值,而不对所述相邻参考样本进行滤波。
11.根据权利要求10所述的方法,其中所述所指示的深度译码模式是深度帧内译码模式,且其中针对至少深度模型化模式DMM、链译码模式CCM、简化深度译码SDC模式的子模式SDCM_DMM_1及所述SDC模式的子模式SDCM_DC停用对所述相邻参考样本的所述滤波。
12.根据权利要求1所述的方法,其中所述所指示的深度译码模式是不同于高效率视频译码HEVC帧内译码模式的多个深度帧内译码模式中的一者,且其中解码指示所述深度译码模式中的所述一者的所述一或多个语法元素包括:
解码指示是否针对所述视频数据启用所述多个深度帧内译码模式中的任一者的语法元素;
在解码指示所述深度帧内译码模式被启用的所述语法元素之后,解码包含所述一或多个语法元素的深度模型化表,其中所述深度模型化表包含与用于所述HEVC帧内译码模式的语法元素分开的用于所述深度帧内译码模式的语法元素;及
基于所述深度模型化表中的所述一或多个语法元素而选择所述深度帧内译码模式中的所述一者。
13.一种视频解码装置,其包括:
存储器,其经配置以存储视频数据;及
一或多个处理器,其经配置以:
解码指示所述视频数据的深度数据的残差信息的一组语法元素,其中相同组语法元素指示用于多个深度译码模式中的任一者的残差信息;
解码指示用于所述视频数据的所述多个深度译码模式中的一者的一或多个语法元素;及
使用所述所指示的深度译码模式基于所述深度数据的所述残差信息及相邻参考样本来解码所述视频数据的所述深度数据。
14.根据权利要求13所述的装置,其中所述深度译码模式包括深度帧内译码模式,所述深度帧内译码模式包含深度模型化模式DMM、简化深度译码SDC模式及链译码模式CCM中的至少两者。
15.根据权利要求13所述的装置,其中所述深度译码模式包括深度模型化模式DMM、简化深度译码SDC模式、帧间SDC模式及链译码模式CCM中的至少两者。
16.根据权利要求13所述的装置,其中所述组语法元素指示用于所述深度译码模式中的任一者的所述深度数据的每一译码分区的至少一个残差值。
17.根据权利要求13所述的装置,其中所述组语法元素包含指示所述深度数据的残差值针对所述深度译码模式中的任一者是否存在的语法元素。
18.根据权利要求17所述的装置,其中所述处理器经配置以基于所述深度数据的译码分区的数目而选择用于指示所述深度数据的残差值针对所述深度译码模式中的任一者是否存在的所述语法元素的上下文模型。
19.根据权利要求13所述的装置,其中所述组语法元素包含指示用于所述深度译码模式中的任一者的所述深度数据的残差值的绝对值及正负号的语法元素。
20.根据权利要求19所述的装置,其中所述处理器经配置以使用单一二进制化方法将指示用于所述深度译码模式中的任一者的所述深度数据的所述残差值的所述绝对值及所述正负号的所述语法元素解二进制化。
21.根据权利要求13所述的装置,其中所述处理器经配置以使用单一上下文模型选择方法从应用于所述深度译码模式中的任一者的相同组上下文模型选择用于所述深度译码模式中的任一者的所述组语法元素的上下文模型。
22.根据权利要求13所述的装置,其中所述处理器经配置以根据所述所指示的深度译码模式基于所述残差信息及所述相邻参考样本而重构所述视频数据的深度值,而不对所述相邻参考样本进行滤波。
23.根据权利要求22所述的装置,其中所述所指示的深度译码模式是深度帧内译码模式,且其中针对至少深度模型化模式DMM、链译码模式CCM、简化深度译码SDC模式的子模式SDCM_DMM_1及所述SDC模式的子模式SDCM_DC停用对所述相邻参考样本的所述滤波。
24.根据权利要求13所述的装置,其中所述所指示的深度译码模式是不同于高效率视频译码HEVC帧内译码模式的多个深度帧内译码模式中的一者,且其中所述处理器经配置以:
解码指示是否针对所述视频数据启用所述多个深度帧内译码模式中的任一者的语法元素;
在解码指示所述深度帧内译码模式被启用的所述语法元素之后,解码包含所述一或多个语法元素的深度模型化表,其中所述深度模型化表包含与用于所述HEVC帧内译码模式的语法元素分开的用于所述深度帧内译码模式的语法元素;及
基于所述深度模型化表中的所述一或多个语法元素而选择所述深度帧内译码模式中的所述一者。
25.一种视频解码装置,其包括:
用于解码指示视频数据的深度数据的残差信息的一组语法元素的装置,其中相同组语法元素指示用于多个深度译码模式中的任一者的残差信息;
用于解码指示用于所述视频数据的所述多个深度译码模式中的一者的一或多个语法元素的装置;及
用于使用所述所指示的深度译码模式基于所述深度数据的所述残差信息及相邻参考样本来解码所述视频数据的所述深度数据的装置。
26.一种包括用于解码视频数据的指令的计算机可读媒体,所述指令致使一或多个处理器:
解码指示所述视频数据的深度数据的残差信息的一组语法元素,其中相同组语法元素指示用于多个深度译码模式中的任一者的残差信息;
解码指示用于所述视频数据的所述多个深度译码模式中的一者的一或多个语法元素;及
使用所述所指示的深度译码模式基于所述深度数据的所述残差信息及相邻参考样本来解码所述视频数据的所述深度数据。
27.一种编码视频数据的方法,所述方法包括:
使用多个深度译码模式中的选定一者编码所述视频数据的深度数据,其中编码所述深度数据包括基于所述视频数据的原始深度值及相邻参考样本而产生所述深度数据的残差信息;
编码指示用于所述视频数据的所述选定的深度译码模式的一或多个语法元素;及
编码指示所述视频数据的所述残差信息的一组语法元素,其中相同组语法元素指示用于所述多个深度译码模式中的任一者的残差信息。
28.根据权利要求27所述的方法,其中所述深度译码模式包括深度帧内译码模式,所述深度帧内译码模式包含深度模型化模式DMM、简化深度译码SDC模式及链译码模式CCM中的至少两者。
29.根据权利要求27所述的方法,其中所述深度译码模式包括深度模型化模式DMM、简化深度译码SDC模式、帧间SDC模式及链译码模式CCM中的至少两者。
30.根据权利要求27所述的方法,其中所述组语法元素指示用于所述深度译码模式中的任一者的所述深度数据的每一译码分区的至少一个残差值。
31.根据权利要求27所述的方法,其中所述组语法元素包含指示所述深度数据的残差值针对所述深度译码模式中的任一者是否存在的语法元素。
32.根据权利要求31所述的方法,其进一步包括基于所述深度数据的译码分区的数目而选择用于指示所述深度数据的残差值针对所述深度译码模式中的任一者是否存在的所述语法元素的上下文模型。
33.根据权利要求27所述的方法,其中所述组语法元素包含指示用于所述深度译码模式中的任一者的所述深度数据的残差值的绝对值及正负号的语法元素。
34.根据权利要求33所述的方法,其进一步包括使用单一二进制化方法将指示用于所述深度译码模式中的任一者的所述深度数据的所述残差值的所述绝对值及所述正负号的所述语法元素解二进制化。
35.根据权利要求27所述的方法,其进一步包括使用单一上下文模型选择方法从应用于所述深度译码模式中的任一者的相同组上下文模型选择用于所述深度译码模式中的任一者的所述组语法元素的上下文模型。
36.根据权利要求27所述的方法,其中编码所述深度数据包括根据所述所指示的深度译码模式基于所述视频数据的所述原始深度值及所述相邻参考样本而产生所述深度数据的残差值,而不对所述相邻参考样本进行滤波。
37.根据权利要求36所述的方法,其中所述所指示的深度译码模式是深度帧内译码模式,且其中针对至少深度模型化模式DMM、链译码模式CCM、简化深度译码SDC模式的子模式SDCM_DMM_1及所述SDC模式的子模式SDCM_DC停用对所述相邻参考样本的所述滤波。
38.根据权利要求27所述的方法,其中所述选定的深度译码模式是不同于高效率视频译码HEVC帧内译码模式的多个深度帧内译码模式中的一者,且其中编码指示所述选定的深度帧内模式的所述一或多个语法元素包括:
编码指示针对所述视频数据启用所述深度帧内译码模式的语法元素;及
编码包含指示所述深度帧内译码模式中的所述选定一者的所述一或多个语法元素的深度模型化表,其中所述深度模型化表包含与用于所述HEVC帧内译码模式的语法元素分开的用于所述深度帧内译码模式的语法元素。
39.一种视频编码装置,其包括:
存储器,其经配置以存储视频数据;及
一或多个处理器,其经配置以:
使用多个深度译码模式中的选定一者编码所述视频数据的深度数据以基于所述视频数据的原始深度值及相邻参考样本而产生所述深度数据的残差信息;
编码指示用于所述视频数据的所述选定的深度译码模式的一或多个语法元素;及
编码指示所述视频数据的所述残差信息的一组语法元素,其中相同组语法元素指示用于所述多个深度译码模式中的任一者的残差信息。
40.根据权利要求39所述的装置,其中所述深度译码模式包括深度帧内译码模式,所述深度帧内译码模式包含深度模型化模式DMM、简化深度译码SDC模式及链译码模式CCM中的至少两者。
41.根据权利要求39所述的装置,其中所述深度译码模式包括深度模型化模式DMM、简化深度译码SDC模式、帧间SDC模式及链译码模式CCM中的至少两者。
42.根据权利要求39所述的装置,其中所述组语法元素指示用于所述深度译码模式中的任一者的所述深度数据的每一译码分区的至少一个残差值。
43.根据权利要求39所述的装置,其中所述组语法元素包含指示所述深度数据的残差值针对所述深度译码模式中的任一者是否存在的语法元素。
44.根据权利要求43所述的装置,其中所述处理器经配置以基于所述深度数据的译码分区的数目而选择用于指示所述深度数据的残差值针对所述深度译码模式中的任一者是否存在的所述语法元素的上下文模型。
45.根据权利要求39所述的装置,其中所述组语法元素包含指示用于所述深度译码模式中的任一者的所述深度数据的残差值的绝对值及正负号的语法元素。
46.根据权利要求45所述的装置,其中所述处理器经配置以使用单一二进制化方法将指示用于所述深度译码模式中的任一者的所述深度数据的所述残差值的所述绝对值及所述正负号的所述语法元素解二进制化。
47.根据权利要求39所述的装置,其中所述处理器经配置以使用单一上下文模型选择方法从应用于所述深度译码模式中的任一者的相同组上下文模型选择用于所述深度译码模式中的任一者的所述组语法元素的上下文模型。
48.根据权利要求39所述的装置,其中所述处理器经配置以根据所述所指示的深度译码模式基于所述视频数据的所述原始深度值及所述相邻参考样本而产生所述深度数据的残差值,而不对所述相邻参考样本进行滤波。
49.根据权利要求48所述的装置,其中所述所指示的深度译码模式是深度帧内译码模式,且其中针对至少深度模型化模式DMM、链译码模式CCM、简化深度译码SDC模式的子模式SDCM_DMM_1及所述SDC模式的子模式SDCM_DC停用对所述相邻参考样本的所述滤波。
50.根据权利要求39所述的装置,其中所述选定的深度译码模式是不同于高效率视频译码HEVC帧内译码模式的多个深度帧内译码模式中的一者,且其中所述处理器经配置以:
编码指示针对所述视频数据启用所述深度帧内译码模式的语法元素;及
编码包含指示所述深度帧内译码模式中的所述选定一者的所述一或多个语法元素的深度模型化表,其中所述深度模型化表包含与用于所述HEVC帧内译码模式的语法元素分开的用于所述深度帧内译码模式的语法元素。
CN201480018166.4A 2013-03-27 2014-03-27 三维(3d)视频译码方法及装置 Active CN105103559B (zh)

Applications Claiming Priority (13)

Application Number Priority Date Filing Date Title
US201361805922P 2013-03-27 2013-03-27
US201361805901P 2013-03-27 2013-03-27
US61/805,901 2013-03-27
US61/805,922 2013-03-27
US201361811103P 2013-04-11 2013-04-11
US61/811,103 2013-04-11
US201361890629P 2013-10-14 2013-10-14
US61/890,629 2013-10-14
US201361891816P 2013-10-16 2013-10-16
US61/891,816 2013-10-16
US14/226,012 2014-03-26
US14/226,012 US9369708B2 (en) 2013-03-27 2014-03-26 Depth coding modes signaling of depth data for 3D-HEVC
PCT/US2014/032050 WO2014160880A1 (en) 2013-03-27 2014-03-27 Depth coding modes signaling of depth data for 3d-hevc

Publications (2)

Publication Number Publication Date
CN105103559A true CN105103559A (zh) 2015-11-25
CN105103559B CN105103559B (zh) 2019-01-15

Family

ID=50625203

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201480018166.4A Active CN105103559B (zh) 2013-03-27 2014-03-27 三维(3d)视频译码方法及装置

Country Status (6)

Country Link
US (1) US9369708B2 (zh)
EP (1) EP2979453B1 (zh)
JP (1) JP6133489B2 (zh)
KR (1) KR101810757B1 (zh)
CN (1) CN105103559B (zh)
WO (1) WO2014160880A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106791876A (zh) * 2016-12-16 2017-05-31 浙江大学 一种基于3d‑hevc的深度图快速帧内预测方法
CN109840471A (zh) * 2018-12-14 2019-06-04 天津大学 一种基于改进Unet网络模型的可行道路分割方法
CN112040247A (zh) * 2018-09-10 2020-12-04 华为技术有限公司 视频解码方法及视频解码器

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102289112B1 (ko) 2012-11-30 2021-08-13 소니그룹주식회사 화상 처리 장치 및 방법
US9516306B2 (en) 2013-03-27 2016-12-06 Qualcomm Incorporated Depth coding modes signaling of depth data for 3D-HEVC
EP2983359A4 (en) * 2013-04-05 2016-08-24 Samsung Electronics Co Ltd INTERLAY VIDEO CODING METHOD AND DEVICE, AND INTERLAYER VIDEO DECODING METHOD AND DEVICE FOR COMPENSATING THE LUMINUM DIFFERENCE
CN104104964B (zh) * 2013-04-09 2019-03-12 乐金电子(中国)研究开发中心有限公司 一种深度图像帧间编码、解码方法、编码器及解码器
WO2014166119A1 (en) * 2013-04-12 2014-10-16 Mediatek Inc. Stereo compatibility high level syntax
WO2014172387A1 (en) * 2013-04-15 2014-10-23 Huawei Technologies Co., Ltd. Method and apparatus of depth prediction mode selection
WO2015057947A1 (en) * 2013-10-17 2015-04-23 Huawei Technologies Co., Ltd. Improved reference pixel selection and filtering for intra coding of depth map
US9716884B2 (en) * 2014-03-20 2017-07-25 Hfi Innovation Inc. Method of signaling for mode selection in 3D and multi-view video coding
US20170214939A1 (en) * 2014-03-31 2017-07-27 Samsung Electronics Co., Ltd. Method and apparatus for encoding or decoding depth image
KR20160001647A (ko) * 2014-06-26 2016-01-06 주식회사 케이티 다시점 비디오 신호 처리 방법 및 장치
CN107659823B (zh) * 2014-06-26 2020-07-14 华为技术有限公司 一种帧内深度图像块解码的方法及装置
CN106576169A (zh) * 2014-09-30 2017-04-19 寰发股份有限公司 深度编码中用于深度建模模式的查找表尺寸减小的方法
WO2016061132A1 (en) * 2014-10-13 2016-04-21 Huawei Technologies Co., Ltd. System and method for depth map coding for smooth depth map area
JP2018050091A (ja) * 2015-02-02 2018-03-29 シャープ株式会社 画像復号装置、画像符号化装置および予測ベクトル導出装置
US10630992B2 (en) 2016-01-08 2020-04-21 Samsung Electronics Co., Ltd. Method, application processor, and mobile terminal for processing reference image
US10609367B2 (en) 2016-12-21 2020-03-31 Qualcomm Incorporated Low-complexity sign prediction for video coding
SG11201909450WA (en) * 2017-04-11 2019-11-28 Vid Scale Inc 360-degree video coding using face continuities
JP2022530240A (ja) 2019-05-02 2022-06-28 北京字節跳動網絡技術有限公司 複数の参照フィルタを使用するイントラビデオコーディング
JP2022531435A (ja) 2019-05-11 2022-07-06 北京字節跳動網絡技術有限公司 複数のイントラ符号化方法の相互作用
WO2020228693A1 (en) * 2019-05-12 2020-11-19 Beijing Bytedance Network Technology Co., Ltd. Coding of multiple intra prediction methods
CN114342408A (zh) 2019-08-26 2022-04-12 北京字节跳动网络技术有限公司 视频编码中帧内编码模式的扩展
KR20220051340A (ko) 2019-08-30 2022-04-26 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 인트라 코딩에서 서브 파티셔닝

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101292538A (zh) * 2005-10-19 2008-10-22 汤姆森特许公司 使用可缩放的视频编码的多视图视频编码
US20100054615A1 (en) * 2008-09-02 2010-03-04 Samsung Electronics Co., Ltd. Method and apparatus for encoding/decoding image by using adaptive binarization
US20110122225A1 (en) * 2009-11-23 2011-05-26 General Instrument Corporation Depth Coding as an Additional Channel to Video Sequence
CA2846425A1 (en) * 2011-08-30 2013-03-07 Nokia Corporation An apparatus, a method and a computer program for video coding and decoding

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110003549A (ko) * 2008-04-25 2011-01-12 톰슨 라이센싱 깊이 신호의 코딩
CN102461171A (zh) 2009-05-01 2012-05-16 汤姆森特许公司 三维视频的参考画面列表
US8537200B2 (en) * 2009-10-23 2013-09-17 Qualcomm Incorporated Depth map generation techniques for conversion of 2D video data to 3D video data
US8913662B2 (en) 2011-01-06 2014-12-16 Qualcomm Incorporated Indicating intra-prediction mode selection for video coding using CABAC
US8902982B2 (en) * 2011-01-17 2014-12-02 Samsung Electronics Co., Ltd. Depth map coding and decoding apparatus and method
US9565449B2 (en) * 2011-03-10 2017-02-07 Qualcomm Incorporated Coding multiview video plus depth content
US9654785B2 (en) 2011-06-09 2017-05-16 Qualcomm Incorporated Enhanced intra-prediction mode signaling for video coding using neighboring mode
US9288505B2 (en) * 2011-08-11 2016-03-15 Qualcomm Incorporated Three-dimensional video with asymmetric spatial resolution
US9332283B2 (en) 2011-09-27 2016-05-03 Broadcom Corporation Signaling of prediction size unit in accordance with video coding
US20130114691A1 (en) 2011-11-03 2013-05-09 Qualcomm Incorporated Adaptive initialization for context adaptive entropy coding
US20140002594A1 (en) * 2012-06-29 2014-01-02 Hong Kong Applied Science and Technology Research Institute Company Limited Hybrid skip mode for depth map coding and decoding
US9516306B2 (en) 2013-03-27 2016-12-06 Qualcomm Incorporated Depth coding modes signaling of depth data for 3D-HEVC

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101292538A (zh) * 2005-10-19 2008-10-22 汤姆森特许公司 使用可缩放的视频编码的多视图视频编码
US20100054615A1 (en) * 2008-09-02 2010-03-04 Samsung Electronics Co., Ltd. Method and apparatus for encoding/decoding image by using adaptive binarization
US20110122225A1 (en) * 2009-11-23 2011-05-26 General Instrument Corporation Depth Coding as an Additional Channel to Video Sequence
CA2846425A1 (en) * 2011-08-30 2013-03-07 Nokia Corporation An apparatus, a method and a computer program for video coding and decoding

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
GERHARD TECH: "3D-HEVC Test Model 3", 《JOINT COLLABORATIVE TEAM ON 3D VIDEO CODING EXTENSION DEVELOPMENT OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106791876A (zh) * 2016-12-16 2017-05-31 浙江大学 一种基于3d‑hevc的深度图快速帧内预测方法
CN106791876B (zh) * 2016-12-16 2019-06-25 浙江大学 一种基于3d-hevc的深度图快速帧内预测方法
CN112040247A (zh) * 2018-09-10 2020-12-04 华为技术有限公司 视频解码方法及视频解码器
US11706417B2 (en) 2018-09-10 2023-07-18 Huawei Technologies Co., Ltd. Video decoding method and video decoder
CN109840471A (zh) * 2018-12-14 2019-06-04 天津大学 一种基于改进Unet网络模型的可行道路分割方法

Also Published As

Publication number Publication date
JP6133489B2 (ja) 2017-05-24
US9369708B2 (en) 2016-06-14
EP2979453B1 (en) 2020-12-23
JP2016518051A (ja) 2016-06-20
WO2014160880A1 (en) 2014-10-02
US20140301454A1 (en) 2014-10-09
KR20150135398A (ko) 2015-12-02
EP2979453A1 (en) 2016-02-03
KR101810757B1 (ko) 2017-12-19
CN105103559B (zh) 2019-01-15

Similar Documents

Publication Publication Date Title
CN105052147A (zh) 用于3d-hevc的深度数据的深度译码模式信令
CN105103559B (zh) 三维(3d)视频译码方法及装置
CN104025602B (zh) 三维视频译码中用信号通知视图合成预测支持
CN105393536B (zh) 使用位移向量从预测性块的帧内预测
US10404999B2 (en) Residual coding for depth intra prediction modes
CN106464881B (zh) 块自适应颜色空间转换译码的方法和装置
CN105191317B (zh) 视图内以及跨越视图的深度查找表的预测性译码
CN105612747B (zh) 用于深度帧内译码的楔波样式扩展
JP6312854B2 (ja) 3dビデオコーディングにおけるデルタdc残差コーディングの簡易化
CN105934948B (zh) 解码和编码视频数据的方法和装置及计算机可读存储介质
CN105874788B (zh) 对3d视频译码中较大预测块的逐段dc译码的简化
CN105027571B (zh) 三维视频译码中导出的视差向量
CN104584557B (zh) 对视频数据进行编码、解码的方法、装置以及计算机可读介质
CN106664425A (zh) 视频译码中的跨分量预测
CN106105216A (zh) 用于3d视频译码的受约束深度帧内模式译码
CN105580365A (zh) Hevc中的基于子预测单元(pu)的时间运动向量预测和3d-hevc中的子pu设计
CN105580364A (zh) Hevc中的基于子预测单元(pu)的时间运动向量预测和3d-hevc中的子pu设计
CN105308956A (zh) 用于深度图帧内译码的预测子
CN107660341A (zh) 切片级帧内块复制及其它视频译码改进
CN105814896A (zh) 3d视频译码中的大型块和深度建模模式(dmm)
CN106464885A (zh) 块自适应颜色空间转换译码
CN105379286A (zh) 跨层的图片分割的位流限制
CN104813668A (zh) 在三维视频译码中的自适应性明度补偿
CN104509115A (zh) 用于高效视频译码(hevc)和扩展的视频参数集
CN104396250A (zh) 用于3d视频译码的深度图的帧内译码

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant