CN107710765A - 分组用于视频译码的调色盘旁通槽 - Google Patents

分组用于视频译码的调色盘旁通槽 Download PDF

Info

Publication number
CN107710765A
CN107710765A CN201680033638.2A CN201680033638A CN107710765A CN 107710765 A CN107710765 A CN 107710765A CN 201680033638 A CN201680033638 A CN 201680033638A CN 107710765 A CN107710765 A CN 107710765A
Authority
CN
China
Prior art keywords
color saucer
current
video data
block
syntactic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201680033638.2A
Other languages
English (en)
Other versions
CN107710765B (zh
Inventor
瑞珍·雷克斯曼·乔许
瓦迪姆·谢廖金
濮伟
邹锋
马尔塔·卡切维奇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of CN107710765A publication Critical patent/CN107710765A/zh
Application granted granted Critical
Publication of CN107710765B publication Critical patent/CN107710765B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/93Run-length coding

Abstract

本发明提供一种译码视频数据的实例方法,所述方法包含:从经译码视频位流译码指示是否将转置程序应用于当前视频数据块的调色盘的调色盘索引的语法元素;从所述经译码视频位流且在所述经译码视频位流中的在指示是否将所述转置程序应用于所述当前视频数据块的所述调色盘的调色盘索引的所述语法元素之后的位置处,解码相关于所述当前视频数据块的差异量化参数QP及/或色度QP偏移的一或多个语法元素;且基于用于所述当前视频数据块的所述调色盘以及相关于所述当前视频数据块的差异QP及/或色度QP偏移的所述一或多个语法元素来解码所述当前视频数据块。

Description

分组用于视频译码的调色盘旁通槽
本申请案要求2015年6月12日申请的美国临时申请案第62/175,137号的权益,所述临时申请案的全部内容以引用的方式并入本文中。
技术领域
本发明涉及视频编码及解码。
背景技术
数字视频频能力可并入到广泛范围的装置中,所述装置包含数字电视、数字直播系统、无线广播系统、个人数字助理(PDA)、膝上型或台式计算机、平板计算机、电子书阅读器、数字照相机、数字记录装置、数字媒体播放器、视频游戏装置、视频游戏机、蜂窝式或卫星无线电电话(所谓的“智能型电话”)、视频电话会议装置、视频流式传输装置及其类似装置。数字视频装置实施视频压缩技术,例如由MPEG-2、MPEG-4、ITU-T H.263、ITU-T H.264/MPEG-4第10部分高级视频译码(Advanced Video Coding;AVC)定义的标准、ITU-T-H.265高效率视频译码(High Efficiency Video Coding;HEVC)标准及此些标准的扩展中所描述的技术。视频装置可通过实施此些视频压缩技术而更高效地发射、接收、编码、解码及/或存储数字视频信息。
视频压缩技术执行空间(图片内)预测及/或时间(图片间)预测来减少或去除视频序列中固有的冗余。对于基于块的视频译码,可将视频切片(即,视频帧或视频帧的部分)分割成视频块。图片的经帧内译码(I)切片中的视频块是使用相对于同一图片中的相邻块中的参考样本的空间预测来编码。图片的经帧间译码(P或B)切片中的视频块可使用相对于同一图片中的相邻块中的参考样本的空间预测或相对于其它参考图片中的参考样本的时间预测。图片可被称作帧,且参考图片可被称作参考帧。
空间或时间预测产生用于待译码的块的预测性块。残余数据表示待译码的原始块与预测性块之间的像素差。经帧间译码块是根据指向形成预测性块的参考样本块的运动向量来编码,且残余数据指示经译码块与预测性块之间的差。经帧内译码块是根据帧内译码模式及残余数据而编码。为了进一步压缩,可将残余数据从像素域变换到变换域,从而产生可接着经量化的残余系数。最初布置在二维阵列中的经量化系数可经扫描以便产生系数的一维向量,且熵译码可经应用以达成甚至更大程度压缩。
发明内容
在一个实例中,一种解码视频数据的方法包含:从经译码视频位流解码指示是否将转置程序应用于当前视频数据块的调色盘的调色盘索引的语法元素;从所述经译码视频位流且在所述经译码视频位流中的在指示是否将所述转置程序应用于所述当前视频数据块的所述调色盘的调色盘索引的所述语法元素之后的位置处,解码相关于所述当前视频数据块的差异量化参数(QP)及/或色度QP偏移的一或多个语法元素;且基于用于所述当前视频数据块的所述调色盘以及相关于所述当前视频数据块的差异QP及/或色度QP偏移的所述一或多个语法元素来解码所述当前视频数据块。
在另一实例中,一种编码视频数据的方法包含:在经译码视频位流中编码指示是否将转置程序应用于当前视频数据块的调色盘的调色盘索引的语法元素;在所述经译码视频位流中且在所述经译码视频位流中的在指示是否将所述转置程序应用于所述当前视频数据块的所述调色盘的调色盘索引的所述语法元素之后的位置处,编码相关于所述当前视频数据块的差异QP及/或色度QP偏移的一或多个语法元素;及基于用于所述当前视频数据块的所述调色盘以及相关于所述当前视频数据块的差异QP及/或色度QP偏移的所述一或多个语法元素来编码所述当前视频数据块。
在另一实例中,一种用于译码视频数据的装置包含经配置以存储视频数据的存储器及一或多个处理器。在此实例中,所述一或多个处理器经配置以:在经译码视频位流中译码指示是否将转置程序应用于当前视频数据块的调色盘的调色盘索引的语法元素;在所述经译码视频位流中且在所述经译码视频位流中的在指示是否将所述转置程序应用于所述当前视频数据块的所述调色盘的调色盘索引的所述语法元素之后的位置处译码相关于所述当前视频数据块的差异QP及/或色度QP偏移的一或多个语法元素;且基于用于所述当前视频数据块的所述调色盘以及相关于所述当前视频数据块的差异QP及/或色度QP偏移的所述一或多个语法元素来译码所述当前视频数据块。
在另一实例中,一种用于译码视频数据的装置包含:用于在经译码视频位流中译码指示是否将转置程序应用于当前视频数据块的调色盘的调色盘索引的语法元素的装置;用于在所述经译码视频位流中且在所述经译码视频位流中的在指示是否将所述转置程序应用于所述当前视频数据块的所述调色盘的调色盘索引的所述语法元素之后的位置处,译码相关于所述当前视频数据块的差异QP及/或色度QP偏移的一或多个语法元素的装置;及用于基于用于所述当前视频数据块的所述调色盘以及相关于所述当前视频数据块的差异QP及/或色度QP偏移的所述一或多个语法元素来译码所述当前视频数据块的装置。
在另一实例中,一种计算机可读存储媒体,其存储当被执行时会致使视频译码装置的一或多个处理器进行以下操作的指令:在经译码视频位流中译码指示是否将转置程序应用于当前视频数据块的调色盘的调色盘索引的语法元素;在所述经译码视频位流中且在所述经译码视频位流中的在指示是否将所述转置程序应用于所述当前视频数据块的所述调色盘的调色盘索引的所述语法元素之后的位置处,译码相关于所述当前视频数据块的差异QP及/或色度QP偏移的一或多个语法元素;且基于用于所述当前视频数据块的所述调色盘以及相关于所述当前视频数据块的差异QP及/或色度QP偏移的所述一或多个语法元素来译码所述当前视频数据块。
在另一实例中,一种计算机可读存储媒体,其存储当由视频解码装置处理时会致使所述视频解码装置的一或多个处理器进行以下操作的经译码视频位流的至少一部分:确定是否将转置程序应用于当前视频数据块的调色盘的调色盘索引;及基于用于所述当前视频数据块的所述调色盘及所述当前视频数据块的差异QP及一或多个色度QP偏移来解码所述视频数据的所述当前块,其中相关于所述差异QP的一或多个语法元素及相关于所述当前视频数据块的所述一或多个色度QP偏移的一或多个语法元素位于所述经译码视频位流中的在指示是否将所述转置程序应用于所述当前视频数据块的所述调色盘的调色盘索引的语法元素之后的位置处。
在随附图式及以下描述中阐述一或多个实例的细节。从实施方式及图式以及从权利要求书将显而易见其它特征、目标及优点。
附图说明
图1为说明可使用本发明中所描述的技术的实例视频译码系统的框图。
图2为说明可实施本发明中所描述的技术的实例视频编码器的框图。
图3为说明可实施本发明中所描述的技术的实例视频解码器的框图。
图4为说明与本发明的技术一致的确定用于译码视频数据的调色盘的实例的概念图。
图5为说明与本发明的技术一致的确定到用于像素块的调色盘的索引的实例的概念图。
图6为说明根据本发明的一或多种技术的用于使用调色盘模式来解码视频数据块的实例程序的流程图。
图7为说明根据本发明的一或多种技术的用于使用调色盘模式来编码视频数据块的实例程序的流程图。
具体实施方式
本发明描述用于视频译码及压缩的技术。确切地说,本发明描述用于视频数据的基于调色盘的译码的技术。举例来说,本发明描述用以支持译码视频内容,尤其是具有调色盘译码的屏幕内容的技术,例如用于改进式调色盘索引二进制化的技术及用于针对调色盘译码发信的技术。
在传统视频译码中,假设图像为连续色调且在空间上平滑。基于此些假设,已开发各种工具,例如基于块的变换、滤波等等,且此些工具已展示针对自然内容视频的良好性能。
然而,在如远程台式计算机、协同工作及无线显示器的应用中,计算机产生的屏幕内容可为待压缩的主要内容。此类型的内容倾向于具有离散色调及特征清晰线,及高对比度对象边界。连续色调及平滑的假设可不再适用,且因此传统视频译码技术可不为用以压缩的高效方式。
基于屏幕内容视频的特性,引入调色盘译码以改进屏幕内容译码(SCC)效率,如在ITU-T SG 16WP 3及ISO/IEC JTC 1/SC 29/WG 11的视频译码联合合作小组(JointCollaboration Team-Video Coding;JCT-VC),第13次会议:韩国仁川,2013年4月18日到26日,文件:JCTVC-M0323,Guo等人的“Palette Mode for Screen Content Coding”(其可在http://phenix.it-sudparis.eu/jct/doc_end_user/documents/13_Incheon/wg11/JCTVC-M0323-v3.zip处获得(下文中为“JCTVC-M0323”))中所提出。特定来说,基于在SCC中一个CU内的色彩通常集中在几个峰值的事实,调色盘译码引入查找表(即,调色盘)来压缩重复性像素值。针对特定CU提供调色盘,CU内的像素经映射到调色盘索引。在第二阶段中,提议有效的从左复制游程长度方法以有效地压缩索引块的重复模式。在一些实例中,调色盘索引译码模式可推广到针对游程长度译码的从左侧复制及从上方复制两者。应注意,在一些实例中,可不针对调色盘译码调用变换程序以避免使锐边模糊,使锐边模糊可对屏幕内容的视觉质量产生巨大负面影响。
如上文所论述,本发明描述基于调色盘的译码,其可尤其适合于屏幕产生的内容译码。举例来说,假设视频数据的特定区域具有相对较小数目个色彩。视频译码器(视频编码器或视频解码器)可将所谓的“调色盘”译码为用于表示特定区域(例如,给定块)的视频数据的色彩表。每一像素可与调色盘中表示像素的色彩的项目相关联。举例来说,视频译码器可译码将像素值映射到调色盘中的适当值的索引。
在以上实例中,视频编码器可通过确定用于块的调色盘、定位调色盘中的项目以表示每一像素的色彩值及运用像素的将像素值映射到调色盘的索引值编码调色盘而编码视频数据块。视频解码器可从经编码位流获得用于块的调色盘,以及块的像素的索引值。视频解码器可将像素的索引值映射到调色盘的项目以重构建块的明度及色度像素值。
以上实例打算提供对基于调色盘的译码的一般描述。在各种实例中,本发明中所描述的技术可包含用于发信基于调色盘的译码模式、发射调色盘、预测调色盘、导出调色盘以及发射基于调色盘的译码映射及其它语法元素中的一或多个的各种组合的技术。此些技术可改进视频译码效率,例如需要较少位来表示屏幕产生的内容。
举例来说,根据本发明的方面,视频译码器(视频编码器或视频解码器)可译码用于使用调色盘译码模式而译码的每一块的一或多个语法元素。举例来说,视频译码器可译码palette_mode_flag以指示基于调色盘的译码模式是否将用于译码特定块。在此实例中,视频编码器可运用等于一的值来编码palette_mode_flag以指定使用调色盘模式来编码当前正经编码的块(“当前块”)。在此状况下,视频解码器可从经编码位流获得palette_mode_flag,且应用基于调色盘的译码模式以解码块。在存在多于一个基于调色盘的译码模式可用(例如,存在多于一个基于调色盘的技术可用于译码)的例子中,一或多个语法元素可指示用于块的多个不同调色盘模式中的一个。
在一些情况下,视频编码器可运用等于零的值来编码palette_mode_flag以指定不使用调色盘模式来编码当前块。在此些情况下,视频编码器可使用多种帧间预测性、帧内预测性或其它译码模式中的任一个来编码块。当palette_mode_flag等于零时,视频编码器可编码额外信息(例如,语法元素)以指示用于编码相应块的特定模式。在一些实例中,如下文所描述,所述模式可为HEVC译码模式。出于实例的目的而描述palette_mode_flag的使用。在其它实例中,例如多位码的其它语法元素可用以指示基于调色盘的译码模式是否将用于一或多个块,或指示将使用多个模式中的哪些模式。
当使用基于调色盘的译码模式时,调色盘可由编码器在经编码视频数据位流中发射以供由解码器使用。调色盘可经发射以用于每一块,或可在图片或切片中的数个块当中共享。调色盘可指对于块来说为主要及/或代表性的数个像素值,包含(例如)一明度值及两个色度值。
在一些实例中,例如转置旗标的语法元素可经译码以指示是否将转置程序应用于当前调色盘的调色盘索引。如果转置旗标为零,那么用于样本的调色盘索引可以水平横向扫描方式译码。相似地,如果转置旗标为一,那么用于样本的调色盘索引可以垂直横向扫描方式译码。此可被认为假设水平横向扫描来解码索引值且接着转置块(行到列)。
本发明的方面包含用于译码调色盘的技术。举例来说,根据本发明的方面,视频编码器可编码一或多个语法元素以定义调色盘。视频编码器可编码以定义用于当前视频数据块的当前调色盘的一些实例语法元素包含但不限于:指示是否将转置程序应用于当前调色盘的调色盘索引(即,是否)的语法元素(例如,palette_transpose_flag);相关于差异量化参数(QP)的一或多个语法元素(例如,cu_qp_delta_palette_abs、cu_qp_delta_palette_sign_flag、cu_chroma_qp_palette_offset_flag及/或cu_chroma_qp_palette_offset_idx);相关于当前视频数据块的色度QP偏移的一或多个语法元素;指示先于阵列中的非零项目的零的数目的一或多个语法元素(例如,palette_predictor_run),所述阵列指示是否将来自预测因子调色盘的项目再用于当前调色盘中;指示经明确地发信的当前调色盘中的项目的数目的一或多个语法元素(例如,num_signalled_palette_entries);指示当前调色盘中的调色盘项目中的分量的值的一或多个语法元素(例如,palette_entry);指示当前视频数据块是否包含至少一个经转义译码样本的一或多个语法元素(例如,palette_escape_val_present_flag);指示经明确地发信或推断的当前调色盘中的项目的数目的一或多个语法元素(例如,num_palette_indices_idc);及指示当前调色盘项目的阵列中的索引的一或多个语法元素(例如,palette_index_idc)。举例来说,当根据HEVC屏幕内容译码(SCC)草案3(ITU-TSG 16WP 3及ISO/IEC JTC 1/SC 29/WG 11的视频译码联合合作小组(JCT-VC),第20次会议:瑞士日内瓦,2015年2月10日到2月17日,文件:JCTVC-T1005,Joshi等人的“High Efficiency Video Coding(HEVC)Screen Content Coding:Draft 3”(其可在http://phenix.int-evry.fr/jct/doc_end_user/documents/20_Geneva/wg11/JCTVC-T1005-v2.zip处获得(下文中为“HEVC SCC草案3”)))操作时,视频译码器可发信palette_coding()语法表(HEVC SCC草案3的第7.3.8.8部分)中所列举的语法元素,下文如表1再现。
表1
除了提供语法元素包含在位流中所按照的次序以外,表1还提供用于语法元素中的每一个的描述符,其指示针对每一语法元素的编码类型。作为一个实例,视频编码器可使用无正负号整数第0阶指数哥伦布码(Exp-Golomb-code)(其中首先是左侧位)来编码具有ue(v)描述符的语法元素。作为另一实例,视频编码器可使用上下文自适应性算术熵码(context-adaptive arithmetic entropy-code;CABAC)来编码具有ae(v)描述符的语法元素。当使用CABAC来编码语法元素的槽时,视频编码器可使用上下文来编码所述槽中的一或多个,及/或可在无上下文的情况下编码所述槽中的一或多个。在无上下文的情况下使用CABAC来编码槽可被称作旁通模式。下文如表2部分地再现,HEVC SCC草案3进一步提供一表(HEVC SCC草案3的表9到47),其指示在有上下文的情况下译码表1中所列举的语法元素的哪些槽(即,如上下文“0”及上下文“1”所指示)且在旁通模式中译码哪些槽。
表2
表1与表2的比较展示HEVC SCC草案3规定在cu_qp_delta_palette_abs之前的所有语法元素(即,num_signalled_palette_entries、palette_entry及palette_escape_val_present_flag)被旁通译码。相似地,在palette_transpose_flag之后且在last_palette_run_type_flag之前的语法元素(即,num_palette_indices_idc及palette_index_idc)也被旁通译码。
当使用CABAC与上下文来编码槽时,视频编码器可将上下文从存储器载入到存储器中。在一些实例中,视频编码器可具有有限的可用存储器资源,且/或将上下文载入到存储器中可为耗时的。因而,视频编码器可需要最小化将上下文载入到存储器中的时间量。在一些实例中,将旁通槽分组在一起可减少将上下文载入到存储器中的时间量,此可增加CABAC输送量。
在ITU-T SG 16WP 3及ISO/IEC JTC 1/SC 29/WG 11的视频译码联合合作小组(JCT-VC),第21次会议:波兰华沙,2015年6月19日到26日,文件:JCTVC-U0090,Ye等人的“CE1-related:Palette Mode Context and Codeword Simplification”(其可在http://phenix.it-sudparis.eu/jct/doc_end_user/documents/21_Warsaw/wg11/JCTVC-U0090-v1.zip处获得(下文中为“JCTVC-U0090”))中,提出应在last_palette_run_type_flag之后发信palette_transpose_flag。特定来说,JCTVC-U0090提出修改palette_coding()语法表,如下文在表3中所展示(其中插入斜体文本,且删除[[双方括号斜体]]文本)。
表3
然而,在一些实例中,由JCTVC-U0090提出的语法元素的布置可不为最优选的。举例来说,当相关于差异QP(即,cu_qp_delta_palette_abs及cu_qp_delta_palette_sign_flag)及色度QP偏移(即,cu_chroma_qp_palette_offset_flag及cu_chroma_qp_palette_offset_idx)的语法元素存在时,由JCTVC-U0090提出的语法元素的布置可不引起对任何额外旁通槽分组。
根据本发明的一或多种技术,视频编码器可编码用以定义当前调色盘的语法元素以使得连续地编码使用旁通模式编码的语法元素。举例来说,与在指示是否将转置程序应用于当前视频数据块的调色盘的调色盘索引的语法元素之前,编码相关于当前视频数据块的差异量化参数(QP)及/或色度QP偏移的一或多个语法元素相反,视频编码器可在指示是否将转置程序应用于当前视频数据块的调色盘的调色盘索引的语法元素之后,编码相关于当前视频数据块的差异QP及/或色度QP偏移的一或多个语法元素。
下文在表4中展示palette_coding()语法表可如何经修改以将相关于差异QP及色度QP偏移的语法元素的发信移动到palette_transpose_flag之后的一个实例(其中与HEVCSCC草案3中的表4的先前版本,插入斜体文本且删除[[双方括号斜体]]文本)。
表4
通过将相关于当前视频数据块的差异QP及/或色度QP偏移的一或多个语法元素移动到指示是否将转置程序应用于当前视频数据块的调色盘的调色盘索引的语法元素之后,视频编码器可将使用旁通模式译码的较大数目个语法元素分组在一起(即,连续地编码)。举例来说,通过将相关于当前视频数据块的差异QP及/或色度QP偏移的一或多个语法元素移动到指示是否将转置程序应用于当前视频数据块的调色盘的调色盘索引的语法元素之后,视频编码器可将指示经明确地发信或推断的当前调色盘中的项目的数目的一或多个语法元素(例如,num_palette_indices_idc)及指示当前调色盘项目的阵列中的索引的一或多个语法元素(例如,palette_index_idc)与以下分组在一起:相关于当前视频数据块的色度QP偏移的一或多个语法元素;指示先于阵列中的非零项目的零的数目的一或多个语法元素(例如,palette_predictor_run),所述阵列指示是否将来自预测因子调色盘的项目再用于当前调色盘中;指示经明确地发信的当前调色盘中的项目的数目的一或多个语法元素(例如,num_signalled_palette_entries);指示当前调色盘中的调色盘项目中的分量的值的一或多个语法元素(例如,palette_entry);及指示当前视频数据块是否包含至少一个经转义译码样本的一或多个语法元素(例如,palette_escape_val_present_flag)。以此方式,本发明的技术可增加CABAC输送量,此可减少使用调色盘模式编码来编码视频数据所需的时间。举例来说,通过将经旁通译码的语法元素分组在一起,视频译码器可使用CABAC译码发动机来依序编码经分组语法元素,而无需开始、停止、重新开始、重新载入及复位CABAC译码发动机。
表4仅为语法元素可如何布置的一个实例。在一些实例中,相关于差异QP及色度QP偏移的语法元素可进一步沿语法表向下移动。举例来说,相关于差异QP及色度QP偏移的语法元素可放置成紧接在转义样本的分量值(即,palette_escape_val)之前。下文在表5中展示相关于差异QP及色度QP偏移的语法元素可如何放置成紧接在用于转义样本的分量值之前的一个实例(其中与HEVC SCC草案3相比,插入斜体文本,且删除[[双方括号斜体]]的文本)。
表5
用于视频数据的基于调色盘的译码的技术可与一或多种其它译码技术(例如用于帧间或帧内预测性译码的技术)一起使用。举例来说,如下文更详细地描述,编码器或解码器或组合式编码器-解码器(编码解码器)可经配置以执行帧间及帧内预测性译码,以及基于调色盘的译码。
在一些实例中,基于调色盘的译码技术可经配置以与一或多个视频译码标准一起使用。一些实例视频译码标准包含但不限于ITU-T H.261、ISO/IEC MPEG-1Visual、ITU-TH.262或ISO/IEC MPEG-2Visual、ITU-T H.263、ISO/IEC MPEG-4Visual及ITU-T H.264(还被称作ISO/IEC MPEG-4AVC),包含其可扩展视频译码(SVC)及多视图视频译码(MVC)扩展。
最近,ITU-T视频译码专家组(Video Coding Experts Group;VCEG)及ISO/IEC动画专家组(Motion Picture Experts Group;MPEG)的视频译码联合合作小组(JCT-VC)已完成新的视频译码标准(即,高效率视频译码(HEVC))的设计。已完成HEVC标准的复本(即,ITU-TH.265,Series H:AUDIOVISUAL AND MULTIMEDIA SYSTEMS Infrastructure ofaudiovisual services-Coding of moving video,2015年4月)可在https://www.itu.int/rec/T-REC-H.265-201504-I/en处获得(下文中为“HEVC标准”)。
JCT-VC还正在开发对HEVC的范围扩展(Range Extension to HEVC)(即,HEVC屏幕内容译码(SCC))。HEVC SCC的最近草案(ITU-T SG 16WP 3及ISO/IEC JTC 1/SC 29/WG 11的视频译码联合合作小组(JCT-VC),第21次会议:波兰华沙,2015年6月16日到6月19日,Joshi等人的“High Efficiency Video Coding(HEVC)Screen Content Coding:Draft 4”)可从http://phenix.it-sudparis.eu/jct/doc_end_user/documents/21_Warsaw/wg11/JCTVC-U1005-v2.zip获得(下文中为“HEVC SCC草案4”)。
就HEVC构架来说,作为实例,基于调色盘的译码技术可经配置以用作译码单元(coding unit;CU)模式。在其它实例中,基于调色盘的译码技术可经配置以用作HEVC的框架中的预测单元(prediction unit;PU)模式。因此,在CU模式的上下文中描述的所有以下所公开的程序可另外或替代地适用于PU。然而,此些基于HEVC的实例不应被视为约束或限制本文中所描述的基于调色盘的译码技术,这是因为此些技术可经应用以独立地或作为其它现有或尚待开发的系统/标准的部分工作。在此些状况下,用于调色盘译码的单元可为正方形块、矩形块或甚至非矩形形状区域。
图1为说明可使用本发明的技术的实例视频译码系统10的框图。如本文中所使用,术语“视频译码器”大体上指代视频编码器及视频解码器两者。在本发明中,术语“视频译码”或“译码”可一般来说指代视频编码或视频解码。视频译码系统10的视频编码器20及视频解码器30表示可经配置以执行根据本发明中所描述的各种实例的用于基于调色盘的视频译码的技术的装置的实例。举例来说,视频编码器20及视频解码器30可经配置以使用基于调色盘的译码或非基于调色盘的译码而选择性地译码各种视频数据块(例如,HEVC译码中的CU或PU)。非基于调色盘的译码模式可指各种帧间预测性时间译码模式或帧内预测性空间译码模式,例如由HEVC标准指定的各种译码模式。
如图1所展示,视频译码系统10包含源装置12及目的地装置14。源装置12产生经编码视频数据。因此,源装置12可被称作视频编码装置或视频编码设备。目的地装置14可解码由源装置12产生的经编码视频数据。因此,目的地装置14可被称作视频解码装置或视频解码设备。源装置12及目的地装置14可为视频译码装置或视频译码设备的实例。
源装置12及目的地装置14可包括广泛范围的装置,所述装置包含台式计算机、移动计算装置、笔记型(例如,膝上型)计算机、平板计算机、机顶盒、例如所谓的“智能型”电话的电话手持机、电视、照相机、显示装置、数字媒体播放器、视频游戏机、车载计算机或其类似装置。
目的地装置14可经由信道16而从源装置12接收经编码视频数据。信道16可包括能够将经编码视频数据从源装置12移动到目的地装置14的一或多个媒体或装置。在一个实例中,信道16可包括使源装置12能够实时地将经编码视频数据直接发射到目的地装置14的一或多个通信媒体。在此实例中,源装置12可根据通信标准(例如,无线通信协议)调制经编码视频数据,且可将经调制视频数据发射到目的地装置14。一或多个通信媒体可包含无线及/或有线通信媒体,例如射频(radio frequency;RF)频谱或一或多个物理发射线。一或多个通信媒体可形成基于包的网络(例如,局域网、广域网或全球网络(例如,因特网))的部分。一或多个通信媒体可包含路由器、交换器、基站,或促进从源装置12到目的装置14的通信的其它设备。
在另一实例中,信道16可包含存储由源装置12产生的经编码视频数据的存储媒体。在此实例中,目的地装置14可经由磁盘存取或卡存取而存取存储媒体。存储媒体可包含例如以下的多种本地存取式数据存储媒体:蓝光光盘、DVD、CD-ROM、快闪存储器,或用于存储经编码视频数据的其它合适的数字存储媒体。
在另一实例中,信道16可包含存储由源装置12产生的经编码视频数据的文件服务器或另一中间存储装置。在此实例中,目的地装置14可经由流式传输或下载而存取存储在文件服务器或其它中间存储装置处的经编码视频数据。文件服务器可为能够存储经编码视频数据且将经编码视频数据发射到目的地装置14的类型的服务器。实例文件服务器包含网页服务器(例如,用于网站)、文件传送协议(file transfer protocol;FTP)服务器、网络附接存储(network attached storage;NAS)装置及本地磁盘驱动器。
目的地装置14可经由标准数据连接(例如,因特网连接)来存取经编码视频数据。数据连接的实例类型可包含适合于存取存储在文件服务器上的经编码视频数据的无线信道(例如,Wi-Fi连接)、有线连接(例如,DSL、电缆调制解调器等等),或两者的组合。经编码视频数据从文件服务器的发射可为流式传输发射、下载发射或两者的组合。
本发明的技术并不限于无线应用或设置。所述技术可应用于支持多种多媒体应用的视频译码,例如空中电视广播、有线电视发射、卫星电视发射、流式传输视频发射,例如经由因特网编码视频数据以存储在数据存储媒体上、解码存储在数据存储媒体上的视频数据,或其它应用。在一些实例中,视频译码系统10可经配置以支持单向或双向视频发射从而支持例如视频流式传输、视频播放、视频广播及/或视频电话的应用。
图1仅为实例,且本发明的技术可适用于未必包含编码装置与解码装置之间的任何数据通信的视频译码设置(例如,视频编码或视频解码)。在其它实例中,数据是从本地存储器检索,经由网络进行流式传输,或其类似方式。视频编码装置可编码数据且将数据存储到存储器,且/或视频解码装置可从存储器检索数据及解码数据。在许多实例中,通过彼此并不通信而是简单地将数据编码到存储器及/或从存储器检索数据且解码数据的装置来执行编码及解码。源装置12及目的地装置14可包括广泛范围的装置中的任一个,包含台式计算机、笔记型(即,膝上型)计算机、平板计算机、机顶盒、电气设备、例如所谓的“智能型”电话的电话手持机、所谓的“智能型”平板、电视、照相机、显示装置、数字媒体播放器、视频游戏机、视频流式传输装置或其类似装置。在一些状况下,源装置12及目的地装置14可经装备以用于无线通信。
目的地装置14可经由链路16而接收待解码的经编码视频数据。链路16可包括能够将经编码视频数据从源装置12移动到目的地装置14的任何类型的媒体或装置。在一个实例中,链路16可包括使得源装置12能够实时地将经编码视频数据直接发射到目的地装置14的通信媒体。可根据通信标准(例如,无线通信协议)调制经编码的视频数据,且将经编码的视频数据发射到目的地装置14。通信媒体可包括任何无线或有线通信媒体,例如射频(RF)频谱或一或多个物理发射线。通信媒体可形成基于包的网络(例如,局域网、广域网或全球网络(例如因特网))的部分。通信媒体可包含路由器、交换器、基站或可用于促进从源装置12到目的地装置14的通信的任何其它设备。
替代地,可将经编码数据从输出接口22输出到存储装置19。相似地,输入接口可从存储装置19存取经编码数据。存储装置19可包含多种分散式或本地存取式数据存储媒体中的任一个,例如硬盘、蓝光光盘、DVD、CD-ROM、快闪存储器、易失性或非易失性存储器,或用于存储经编码视频数据的任何其它合适的数字存储媒体。在另一实例中,存储装置19可对应于可保持由源装置12产生的经编码视频的文件服务器或另一中间存储装置。目的地装置14可经由流式传输或下载而从存储装置19存取所存储的视频数据。文件服务器可为能够存储经编码视频数据且将所述经编码视频数据发射到目的地装置14的任何类型的服务器。实例文件服务器包含网页服务器(例如,用于网站)、FTP服务器、网络附接存储(NAS)装置或本地磁盘驱动器。目的地装置14可经由任何标准数据连接(包含因特网连接)而存取经编码视频数据。此数据连接可包含适合于存取存储在文件服务器上的经编码的视频数据的无线信道(例如,Wi-Fi连接)、有线连接(例如,DSL、电缆调制解调器等等),或两者的组合。经编码视频数据从存储装置19的发射可为流式传输发射、下载发射或两者的组合。
本发明的技术未必限于无线应用或设置。所述技术可应用于支持多种多媒体应用中的任一个的视频译码,例如空中电视广播、有线电视发射、卫星电视发射、流式传输视频发射,例如经由因特网编码数字视频以存储在数据存储媒体上、解码存储在数据存储媒体上的数字视频,或其它应用。在一些实例中,系统10可经配置以支持单向或双向视频发射从而支持例如视频流式传输、视频播放、视频广播及/或视频电话的应用。
在图1的实例中,源装置12包含视频源18、视频编码器20及输出接口22。在一些状况下,输出接口22可包含调制器/解调器(调制解调器)及/或发射器。在源装置12中,视频源18可包含例如视频俘获装置(例如,摄像机)、含有先前所俘获视频的视频封存档、用以从视频内容提供者接收视频的视频馈入接口,及/或用于将计算机图形数据产生为源视频的计算机图形系统的源,或此些源的组合。作为一个实例,如果视频源18为摄像机,那么源装置12及目的地装置14可形成所谓的照相机电话或视频电话。然而,本发明中所描述的技术一般来说可适用于视频译码,且可应用于无线及/或有线应用。
可由视频编码器20编码所俘获视频、预俘获的视频或计算机产生的视频。经编码视频数据可经由源装置12的输出接口22而直接发射到目的地装置14。经编码视频数据还可(或替代地)存储到存储装置19上以供稍后由目的地装置14或其它装置存取以用于解码及/或播放。
目的地装置14包含输入接口28、视频解码器30及显示装置32。在一些状况下,输入接口28可包含接收器及/或调制解调器。目的地装置14的输入接口28经由链路16接收经编码视频数据。经由链路16传达或在存储装置19上提供的经编码视频数据可包含由视频编码器20产生以由视频解码器(例如,视频解码器30)用于解码视频数据的多种语法元素。在通信媒体上发射、存储在存储媒体上,或存储在文件服务器的经编码视频数据内可包含此些语法元素。
显示装置32可与目的地装置14集成或在目的地装置14外部。在一些实例中,目的地装置14可包含集成显示装置,且还经配置以与外部显示装置介接。在其它实例中,目的地装置14可为显示装置。一般来说,显示装置32向用户显示经解码视频数据,且可包括例如以下的多种显示装置中的任一个:液晶显示器(LCD)、等离子体显示器、有机发光二极管(OLED)显示器或另一类型的显示装置。
视频编码器20及视频解码器30可根据视频压缩标准(例如最近完成的HEVC标准(及其目前在开发下的各种扩展))操作。替代地,视频编码器20及视频解码器30可根据其它专有或工业标准(例如,ITU-T H.264标准,替代地被称作MPEG-4,第10部分,高级视频译码(AVC))或此些标准的扩展而操作。然而,本发明的技术并不限于任何特定译码标准。视频压缩标准的其它实例包含VP8及VP9。
尽管图1中未展示,但在一些方面中,视频编码器20及视频解码器30可各自与音频编码器及解码器集成,且可包含适当的MUX-DEMUX单元或其它硬件及软件,以处置共同数据流或单独数据流中的音频及视频两者的编码。在一些实例中,如果适用,那么MUX-DEMUX单元可符合ITU H.223多路复用器协议或其它协议(例如,用户数据报协议(user datagramprotocol;UDP))。
视频编码器20及视频解码器30各自可实施为多种合适编码器电路中的任一个,例如包含微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑、软件、硬件、固件或其任何组合的一或多个集成电路。当以软件部分地实施技术时,装置可将用于软件的指令存储在合适的非暂时性计算机可读媒体中,且使用一或多个处理器来执行例如集成电路的硬件中的指令以执行本发明的技术。视频编码器20及视频解码器30中的每一个可包含在一或多个编码器或解码器中,编码器或解码器中的任一个可集成为相应装置中的组合式编码器/解码器(编码解码器(CODEC))的部分。
如上文所介绍,JCT-VC最近已完成HEVC标准的开发。HEVC标准化成果是基于视频译码装置的演进模型(被称作HEVC测试模型(HEVC Test Model;HM))。HM根据(例如)ITU-TH.264/AVC假设视频译码装置相对于现有装置的若干额外能力。举例来说,H.264提供九个帧内预测编码模式,而HM可提供多达三十五个帧内预测编码模式。
在HEVC及其它视频译码规范中,视频序列通常包含一系列图片。图片还可被称作“帧”。图片可包含三个样本阵列,指示为SL、SCb及SCr。SL为明度样本的二维阵列(即,块)。SCb为Cb色讯(chrominance)样本的二维阵列。SCr为Cr色讯样本的二维阵列。色讯样本在本文中还可被称作“色度(chroma)”样本。在其它情况下,图片可为单色的,且可仅包含明度样本阵列。
为了产生图片的经编码表示,视频编码器20可产生译码树型单元(coding treeunit;CTU)的集合。CTU中的每一个可包括明度样本的译码树型块、色度样本的两个对应译码树型块,及用以译码所述译码树型块的样本的语法结构。在单色图片或具有三个单独色彩平面的图片中,CTU可包括单一译码树型块及用以译码所述译码树型块的样本的语法结构。译码树型块可为样本的N×N块。CTU还可被称作“树型块”或LCU。HEVC的CTU可大致类似于例如H.264/AVC的其它标准的宏块。然而,CTU未必限于特定大小且可包含一或多个译码单元(CU)。切片可包含按光栅扫描次序连续地定序的整数数目个CTU。
为了产生经译码CTU,视频编码器20可对CTU的译码树型块递回地执行四分树分割,以将译码树型块划分成译码块,因此命名为“译码树型单元”。译码块可为样本的N×N块。CU可包括具有明度样本阵列、Cb样本阵列及Cr样本阵列的图片的明度样本的译码块,及色度样本的两个对应译码块,以及用以译码所述译码块的样本的语法结构。在单色图片或具有三个单独色彩平面的图片中,CU可包括单一译码块及用以译码所述译码块的样本的语法结构。
视频编码器20可将CU的译码块分割成一或多个预测块。预测块为供应用相同预测的样本的矩形(即,正方形或非正方形)块。CU的预测单元(PU)可包括明度样本的预测块、色度样本的两个对应预测块及用以预测所述预测块的语法结构。在单色图片或具有三个单独色彩平面的图片中,PU可包括单一预测块及用以预测所述预测块的语法结构。视频编码器20可产生CU的每一PU的明度、Cb及Cr预测块的预测性明度块、Cb块及Cr块。
视频编码器20可使用帧内预测或帧间预测来产生PU的预测性块。如果视频编码器20使用帧内预测来产生PU的预测性块,那么视频编码器20可基于与PU相关联的图片的经解码样本而产生PU的预测性块。如果视频编码器20使用帧间预测来产生PU的预测性块,那么视频编码器20可基于不同于与PU相关联的图片的一或多个图片的经解码样本而产生PU的预测性块。
在视频编码器20产生CU的一或多个PU的预测性明度块、Cb块及Cr块之后,视频编码器20可产生CU的明度残余块。CU的明度残余块中的每一样本指示CU的预测性明度块中的一个中的明度样本与CU的原始明度译码块中的对应样本之间的差异。另外,视频编码器20可产生CU的Cb残余块。CU的Cb残余块中的每一样本可指示CU的预测性Cb块中的一个中的Cb样本与CU的原始Cb译码块中的对应样本之间的差异。视频编码器20还可产生CU的Cr残余块。CU的Cr残余块中的每一样本可指示CU的预测性Cr块中的一个中的Cr样本与CU的原始Cr译码块中的对应样本之间的差异。
此外,视频编码器20可使用四分树分割以将CU的明度残余块、Cb残余块及Cr残余块分解成一或多个明度变换块、Cb变换块及Cr变换块。变换块为供应用相同变换的样本的矩形(例如,正方形或非正方形)块。CU的变换单元(transform unit;TU)可包括明度样本的变换块、色度样本的两个对应变换块及用以使变换块样本变换的语法结构。因此,CU的每一TU可与明度变换块、Cb变换块及Cr变换块相关联。与TU相关联的明度变换块可为CU的明度残余块的子块。Cb变换块可为CU的Cb残余块的子块。Cr变换块可为CU的Cr残余块的子块。在单色图片或具有三个单独色彩平面的图片中,TU可包括单一变换块及用以使变换块的样本变换的语法结构。
视频编码器20可将一或多个变换应用于TU的明度变换块以产生TU的明度系数块。系数块可为变换系数的二维阵列。变换系数可为纯量。视频编码器20可将一或多个变换应用于TU的Cb变换块以产生TU的Cb系数块。视频编码器20可将一或多个变换应用于TU的Cr变换块以产生TU的Cr系数块。
在产生系数块(例如,明度系数块、Cb系数块或Cr系数块)之后,视频编码器20可量化所述系数块。量化通常指代对变换系数进行量化以可能地减少用以表示变换系数的数据的量,从而提供进一步压缩的程序。在视频编码器20量化系数块之后,视频编码器20可对指示经量化变换系数的语法元素进行熵编码。举例来说,视频编码器20可对指示经量化变换系数的语法元素执行上下文自适应性二进制算术译码(Context-Adaptive BinaryArithmetic Coding;CABAC)。
视频编码器20可输出包含形成经译码图片及关联数据的表示的一序列位的位流。位流可包括一序列NAL单元。NAL单元为含有NAL单元中的数据的类型的指示的语法结构及含有呈视需要穿插有模拟阻止位的RBSP形式的数据的位组。NAL单元中的每一个包含NAL单元标头,且封装RBSP。NAL单元标头可包含指示NAL单元类型码的语法元素。由NAL单元的NAL单元标头指定的NAL单元类型码指示NAL单元的类型。RBSP可为含有封装在NAL单元内的整数数目个位组的语法结构。在一些情况下,RBSP包含零位。
不同类型的NAL单元可囊封不同类型的RBSP。举例来说,第一类型的NAL单元可囊封PPS的RBSP,第二类型的NAL单元可囊封经译码切片的RBSP,第三类型的NAL单元可囊封SEI消息的RBSP,等等。囊封视频译码数据的RBSP(与参数集及SEI消息的RBSP相对)的NAL单元可被称作VCL NAL单元。
视频解码器30可接收由视频编码器20产生的位流。另外,视频解码器30可剖析位流以从位流获得语法元素。视频解码器30可至少部分地基于从位流获得的语法元素而重构建视频数据的图片。用以重构建视频数据的程序可大体上与由视频编码器20执行的程序互逆。另外,视频解码器30可反量化与当前CU的TU相关联的系数块。视频解码器30可对系数块执行反变换以重构建与当前CU的TU相关联的变换块。通过将当前CU的PU的预测性块的样本添加到当前CU的TU的变换块的对应样本,视频解码器30可重构建当前CU的译码块。通过重构建图片的每一CU的译码块,视频解码器30可重构建图片。
在一些实例中,视频编码器20及视频解码器30可经配置以执行基于调色盘的译码。举例来说,在基于调色盘的译码(并非执行上文所描述的帧内预测性或帧间预测性译码技术)中,视频编码器20及视频解码器30可将所谓的调色盘译码为色彩值的表以用于表示特定区域(例如,给定块)的视频数据。每一像素可与表示像素的色彩的调色盘中的一项目相关联,例如,与明度(Y)值及色度(Cb及Cr)值相关联。举例来说,视频编码器20及视频解码器30可译码将像素值与调色盘中的适当值相关的索引。
在以上实例中,视频编码器20可通过以下来编码视频数据块:确定用于块的调色盘;定位调色盘中的项目以表示每一像素的值;及运用用于将像素值与调色盘相关的像素的索引值来编码调色盘。视频解码器30可从经编码位流获得用于块的调色盘,以及块的像素的索引值。视频解码器30可将像素的索引值与调色盘的项目相关以重构建块的像素值。
本发明的方面涉及调色盘导出,其可在编码器处及在解码器处发生。作为一个实例,视频编码器20可通过导出当前块中的像素的直方图而导出用于当前块的调色盘。在一些实例中,直方图可表达为H={vi,fi),i={0,1,2,…,M}},其中M+1为当前块中的不同像素值的数目,vi为像素值,且fi为vi出现的数目(即,当前块中有多少像素具有像素值vi)。在此些实例中,直方图大体上表示像素值在当前块中出现的次数。
当导出直方图时,视频编码器20可初始化一或多个变量。作为一个实例,视频编码器20可将调色盘索引idx初始化为0,(即,设置idx=0)。作为另一实例,视频编码器20可将调色盘P初始化为空(即,设置j=0)。
视频编码器20可(例如)按降序排序直方图,以使得更多次出现的像素接近值列表的前面放置。举例来说,视频编码器20可根据fi的降序排序H,且经定序列表可表达为Ho={ui,fi),i={0,1,2,…,M},fi≥fi+1}。在此实例中,经定序列表包含在列表的前面(顶部)处的最频繁出现的像素值及在列表的后面(底部)处的最不频繁出现的像素值。
视频编码器20可将来自直方图的一或多个项目复制到调色盘中。作为一个实例,视频编码器20可将直方图中具有最大频率的项目插入到调色盘中。举例来说,视频编码器20可将(j,uj)插入到调色盘P中(即,P=P∪{(idx,uj)})。在一些实例中,在将项目插入到调色盘中之后,视频编码器20可评估直方图中具有下一最大频率的项目以插入到调色盘中。举例来说,视频编码器20可设置idx=idx+1,j=j+1。
视频编码器20可确定具有下一最大频率的项目(即,uj+1)是否在调色盘中的任何像素(即,x)的邻域内(即,Distance(uj+1,x)<Thresh)。举例来说,视频编码器20可通过确定项目的值是否在调色盘中的任何像素的值的临限距离内而确定所述项目是否在调色盘中的任何像素的邻域内。在一些实例中,视频编码器20可灵活地选择距离函数。作为一个实例,视频编码器20可选择距离函数作为绝对差的和(sum of absolute differences;SAD)或三个色彩分量(例如,亮度、蓝色色调色讯及红色色调色讯中的每一个)或一色彩分量(例如,亮度、蓝色色调色讯或红色色调色讯中的一个)的预测平方误差的和(sum of squarederror;SSE)。在一些实例中,视频编码器20可灵活地选择阈值Thresh。作为一个实例,视频编码器20可选择取决于当前块的量化参数(QP)的阈值。作为另一实例,视频编码器20可选择取决于idx的值或j的值的阈值。
如果视频编码器20确定具有下一最大频率的项目(即,uj+1)在调色盘中的任何像素的邻域内,那么视频编码器20可不插入直方图中的项目。如果视频编码器20确定具有下一最大频率的项目(即,uj+1)不在调色盘中的任何像素的邻域内,那么视频编码器20可插入直方图中的项目。
视频编码器20可继续在调色盘中插入项目直到满足一或多个条件为止。一些实例条件为当idx=M时,当j=M时,或当调色盘的大小大于预定义的值时。
基于调色盘的译码可具有一定量发信额外负荷。举例来说,可需要数个位来发信调色盘的特性(例如调色盘的大小)以及调色盘自身。另外,可需要若干位来发信块的像素的索引值。在一些实例中,本发明的技术可减少发信此信息所需的位的数目。举例来说,本发明中所描述的技术可包含用于发信基于调色盘的译码模式、发射调色盘、预测调色盘、导出调色盘以及发射基于调色盘的译码映射及其它语法元素中的一或多个的各种组合的技术。
在一些实例中,视频编码器20及/或视频解码器30可使用另一调色盘预测调色盘。举例来说,视频编码器20及/或视频解码器30可确定具有指示第一像素值的第一项目的第一调色盘。视频编码器20及/或视频解码器30可接着基于第一调色盘的第一项目确定指示第二调色盘的第二像素值的一或多个第二项目。视频编码器20及/或视频解码器30还可使用第二调色盘译码视频数据块的像素。
当基于第一调色盘中的项目确定第二调色盘的项目时,视频编码器20可编码多种语法元素,其可由视频解码器用以重构建第二调色盘。举例来说,视频编码器20可在位流中编码一或多个语法元素以指示整个调色盘(或多个调色盘,在视频数据的每一色彩分量(例如,Y、Cb、Cr或Y、U、V或R、G、B)具有单独调色盘的状况下)为从当前正被译码的块的一或多个相邻块复制。预测(例如,复制)当前块的当前调色盘的项目所凭借的调色盘可被称作预测性调色盘。预测性调色盘可含有来自包含在空间上相邻的块及/或按块的特定扫描次序的相邻块的一或多个相邻块的调色盘项目。举例来说,相邻块可在空间上位于当前正被译码的块左侧(左相邻块)或位于当前正被译码的块的上(上部相邻块)。在另一实例中,视频编码器20可使用当前块的因果相邻者中的最频繁样本值来确定预测性调色盘项目。在另一实例中,相邻块可与当前正根据用以译码块的特定扫描次序译码的块相邻。即,相邻块可为在当前块之前按扫描次序译码的一或多个块。视频编码器20可编码一或多个语法元素以指示复制调色盘所凭借的相邻块的位置。
在一些实例中,可逐个项目执行调色盘预测。举例来说,视频编码器20可编码一或多个语法元素以针对预测性调色盘的每一项目指示调色盘项目是否包含在当前块的调色盘中。如果视频编码器20未预测用于当前块的调色盘的项目,那么视频编码器20可编码一或多个额外语法元素以指定未经预测项目,以及此些项目的数目。
上文所描述的语法元素可被称作调色盘预测向量。举例来说,如上文所提及,视频编码器20及视频解码器30可基于来自相邻块的一或多个调色盘(统称为参考调色盘)预测用于当前块的调色盘。当产生参考调色盘时,可在将最近调色盘添加到队列的前面时使用先进先出(first-in first-out;FIFO)。如果队列超过预定义的阈值,那么最老的元素可弹出。在将新元素推到队列的前面中之后,可应用修剪程序以从队列的开头计数,去除重复的元素。特定来说,在一些实例中,视频编码器20可编码(且视频解码器30可解码)0到1向量以指示是否将参考调色盘中的像素值再用于当前调色盘。作为实例,如表6的实例中所展示,参考调色盘可包含六个项(例如,六个索引值及相应像素值)。
索引 像素值
0 v0
1 v1
2 v2
3 v3
4 v4
5 v5
表6
在出于说明目的的实例中,视频编码器20可发信指示v0、v2、v3、v4及v5再用于当前调色盘中而v1不被再使用的向量(1,0,1,1,1,1)。除了再用v0、v2、v3、v4及v5以外,视频编码器20还可将两个新项添加到具有索引5及6的当前调色盘。下文表7中展示用于此实例的当前调色盘。
表7
为了针对向量中的每一项译码调色盘预测0-1向量,视频编码器20可译码一个位以表示其值。另外,可二进制化及发信无法预测的调色盘项的数目(例如,新调色盘项目(上文表7的实例中的u0及u1)的数目)。
本发明的其它方面涉及构建及/或发射允许视频编码器20及/或视频解码器30确定像素值的映射。举例来说,本发明的其它方面涉及构建及/或发射将特定像素与调色盘的项目相关的索引的映射。
在一些实例中,视频编码器20可指示块的像素是否具有调色盘中的对应值。在出于说明目的的实例中,假设映射的(i,j)项目对应于视频数据块中的(i,j)像素位置。在此实例中,视频编码器20可编码用于块的每一像素位置的旗标。视频编码器20可针对(i,j)项目将旗标设置为等于一以指示在(i,j)位置处的像素值为调色盘中的多个值中的一个。当色彩包含在调色盘中(即,旗标等于一)时,视频编码器20还可编码指示(i,j)项目的调色盘索引(其识别调色盘中的色彩)的数据。当像素的色彩并未包含在调色盘中(即,旗标等于零)时,视频编码器20还可编码指示像素的样本值的数据,所述像素可被称作转义像素。视频解码器30可从经编码位流获得上文所描述的数据,且使用所述数据来确定块中的特定位置的调色盘索引及/或像素值。
在一些情况下,可在给定位置处的像素映射到的调色盘索引与相邻像素映射到同一调色盘索引的概率之间存在相关性。即,当像素映射到特定调色盘索引时,一或多个相邻像素(就空间位置来说)映射到同一调色盘索引的概率可相对较高。
在一些实例中,视频编码器20及/或视频解码器30可相对于视频数据块的一或多个索引而确定及译码同一视频数据块的一或多个索引。举例来说,视频编码器20及/或视频解码器30可经配置以确定与视频数据块中的第一像素相关联的第一索引值,其中第一索引值将第一像素的值与调色盘的项目相关。视频编码器20及/或视频解码器30还可经配置以基于第一索引值而确定与视频数据块中的一或多个第二像素相关联的一或多个第二索引值,且译码视频数据块的第一像素及一或多个第二像素。因此,在此实例中,可相对于映射的索引而译码所述映射的一或多个其它索引。
如上文所论述,视频编码器20及/或视频解码器30可使用若干不同技术以相对于映射的索引而译码映射的其它索引值。举例来说,视频编码器20及/或视频解码器30可使用索引模式、上方复制模式及过渡模式以相对于映射的索引而译码映射的其它索引值。
在基于托板的译码的“索引模式”下,视频编码器20及/或视频解码器30可首先发信调色盘索引。如果索引等于调色盘的大小,那么此情形指示样本为转义样本。在此状况下,视频编码器20及/或视频解码器30可发信每一分量的样本值或经量化样本值。举例来说,如果调色盘大小为4,那么对于非转义样本,调色盘索引在[0,3]的范围内。在此状况下,索引值4可表示转义样本。如果索引指示非转义样本,那么视频编码器20及/或视频解码器30可发信游程长度,其可由指示所述游程长度的非负值n-1指定共享同一索引的按扫描次序的后续样本的数目,此意味包含所述当前像素的随后n个像素具有与首先发信的索引相同的像素索引。
在基于调色盘的译码的“从上方复制”模式中,视频编码器20及/或视频解码器30可发信非负游程长度值m-1以指示对于包含当前像素的随后m个像素,调色盘索引分别与其正上方相邻者相同。应注意,“从上方复制”模式在调色盘索引在“从上方复制”游程模式内可不同的意义上不同于“索引”模式。
如上文所论述,在一些实例中,可能需要将旁通槽分组在一起(即,以增加CABAC输送量)。根据本发明的一或多种技术,视频编码器20可编码且视频解码器30可解码用以定义当前调色盘的语法元素,以使得将用旁通模式予以译码的语法元素分组在一起。举例来说,与在指示是否将转置程序应用于当前视频数据块的调色盘的调色盘索引的语法元素之前,译码相关于当前视频数据块的差异量化参数(QP)及/或色度QP偏移的一或多个语法元素相反,视频编码器20及/或视频解码器30可在指示是否将转置程序应用于当前视频数据块的调色盘的调色盘索引的语法元素之后,译码相关于用于当前视频数据块的差异QP及/或色度QP偏移的一或多个语法元素。以此方式,视频编码器20及/或视频解码器30可使用旁通模式来译码较大群组的语法元素,此可增加CABAC输送量。
在一些实例中,相关于当前视频数据块的差异QP的一或多个语法元素可包含:指定当前视频数据块的明度QP与当前块的明度QP的预测因子之间的差的绝对值的语法元素(例如,cu_qp_delta_palette_abs);及指定当前视频数据块的明度QP与当前块的明度QP的预测因子之间的差的正负号的语法元素(例如,cu_qp_delta_palette_sign_flag)。在一些实例中,相关于当前视频数据块的色度QP偏移的一或多个语法元素可包含:指示是否将一或多个偏移列表中的项目添加到当前块的明度QP以确定当前块的色度QP的语法元素(例如,cu_chroma_qp_palette_offset_flag);及指定添加到当前块的明度QP的一或多个偏移列表中的每一个中的项目的索引以确定当前块的色度QP的语法元素(例如,cu_chroma_qp_palette_offset_idx)。因而,视频编码器20及/或视频解码器30可各自经配置以在位流中的第一位置处译码palette_transpose_flag语法元素,且在位流中的第二位置(其在第一位置之后)处译码cu_qp_delta_palette_abs语法元素、cu_qp_delta_palette_sign_flag语法元素、cu_chroma_qp_palette_offset_flag语法元素及cu_chroma_qp_palette_offset_idx语法元素。
图2为说明可实施本发明的技术的实例视频编码器20的框图。出于解释的目的而提供图2,且不应将所述图视为对如本发明中所广泛例示及描述的技术的限制。出于解释的目的,本发明描述在HEVC译码的上下文中的视频编码器20。然而,本发明的技术可适用于其它译码标准或方法。
视频编码器20表示可经配置以根据本发明中所描述的各种实例执行用于基于调色盘的视频译码的技术的装置的实例。举例来说,视频编码器20可经配置以使用基于调色盘的译码或非基于调色盘的译码而选择性地译码视频数据的各种块(例如,HEVC译码中的CU或PU)。非基于调色盘的译码模式可指各种帧间预测性时间译码模式或帧内预测性空间译码模式,例如由HEVC标准指定的各种译码模式。在一个实例中,视频编码器20可经配置以产生具有指示像素值的项目的调色盘,选择调色盘中的像素值以表示视频数据块的至少一些位置的像素值,且发信使视频数据块的位置中的至少一些位置与分别对应于选定像素值的调色盘中的项目相关联的信息。经发信的信息可由视频解码器30用以解码视频数据。
在图2的实例中,视频编码器20包含预测处理单元100、残余产生单元102、变换处理单元104、量化单元106、反量化单元108、反变换处理单元110、重构建单元112、滤波器单元114、经解码图片缓冲器116及熵编码单元118。预测处理单元100包含帧间预测处理单元120及帧内预测处理单元126。帧间预测处理单元120包含运动估计单元及运动补偿单元(未展示)。视频编码器20还包含基于调色盘的编码单元122,其经配置以执行本发明中所描述的基于调色盘的译码技术的各种方面。在其它实例中,视频编码器20可包含更多、更少或不同功能的组件。
视频编码器20可接收视频数据。视频编码器20可编码视频数据图片的切片中的每一CTU。CTU中的每一个可与具有相等大小的明度译码树型块(CTB)及图片的对应CTB相关联。作为编码CTU的部分,预测处理单位100可执行四分树分割以将CTU的CTB划分成逐渐变小的块。较小块可为CU的译码块。举例来说,预测处理单元100可将与CTU相关联的CTB分割成四个相等大小的子块,将所述子块中的一或多个分割成四个相等大小的子子块,等等。
视频编码器20可编码CTU的CU以产生所述CU的经编码的表示(即,经译码的CU)。作为编码CU的部分,预测处理单元100可分割与CU的一或多个PU当中的CU相关联的译码块。因此,每一PU可与明度预测块及对应的色度预测块相关联。视频编码器20及视频解码器30可支持具有各种大小的PU。如上文所指示,CU的大小可指CU的明度译码块的大小,且PU的大小可指PU的明度预测块的大小。假设特定CU的大小为2N×2N,那么视频编码器20及视频解码器30可支持用于帧内预测的2N×2N或N×N的PU大小,及用于帧间预测的2N×2N、2N×N、N×2N、N×N或相似大小的对称PU大小。视频编码器20及视频解码器30还可支持用于帧间预测的2N×nU、2N×nD、nL×2N及nR×2N的PU大小的不对称分割。
帧间预测处理单元120可通过对CU的每一PU执行帧间预测而产生用于PU的预测性数据。用于PU的预测性数据可包含PU的预测性样本块及用于PU的运动信息。取决于PU是在I切片中、P切片中还是B切片中,帧间预测处理单元120可针对CU的PU执行不同操作。在I切片中,所有PU经帧内预测。因此,如果PU在I切片中,那么帧间预测处理单元120并不对PU执行帧间预测。因此,对于在I模式中编码的块,经预测的块是使用空间预测从同一帧内的先前经编码的相邻块而形成。
如果PU是在P切片中,那么帧间预测处理单元120的运动估计单元可在用于PU的参考区域的参考图片列表(例如,“RefPicList0”)中搜索参考图片。用于PU的参考区域可为参考图片内含有最紧密地对应于PU的样本块的样本块的区域。运动估计单元可产生指示含有用于PU的参考区域的参考图片的RefPicList0中的位置的参考索引。另外,运动估计单元可产生指示PU的译码块与相关联于参考区域的参考位置之间的空间位移的MV。举例来说,MV可为提供从当前经解码图片中的坐标到参考图片中的坐标的偏移的二维向量。运动估计单元可输出参考索引及MV作为PU的运动信息。帧间预测处理单元120的运动补偿单元可基于在由PU的运动向量指示的参考位置处的实际或内插样本产生PU的预测性样本块。
如果PU在B切片中,那么运动估计单元可针对PU执行单向预测或双向预测。为了针对PU执行单向预测,运动估计单元可搜索RefPicList0或用于PU的参考区域的第二参考图片列表(“RefPicList1”)的参考图片。运动估计单元可输出以下作为PU的运动信息:参考索引,其指示在含有参考区域的参考图片的RefPicList0或RefPicList1中的位置;MV,其指示PU的样本块与相关联于参考区域的参考位置之间的空间位移;及一或多个预测方向指示符,其指示参考图片是在RefPicList0中还是在RefPicList1中。帧间预测处理单元120的运动补偿单元可至少部分地基于在由PU的运动向量指示的参考区域处的实际或内插样本产生PU的预测性样本块。
为了针对PU执行双向帧间预测,运动估计单元可在用于PU的参考区域的RefPicList0中搜索参考图片,且还可在用于PU的另一参考区域的RefPicList1中搜索参考图片。运动估计单元可产生指示含有参考区域的参考图片的RefPicList0及RefPicList1中的位置的参考图片索引。另外,运动估计单元可产生指示相关联于参考区域的参考位置与PU的样本块之间的空间位移的MV。PU的运动信息可包含参考索引及PU的MV。运动补偿单元可至少部分地基于由PU的运动向量指示的参考区域处的实际或经内插样本来产生PU的预测性样本块。
根据本发明的各种实例,视频编码器20可经配置以执行基于调色盘的译码。就HEVC框架来说,作为实例,基于调色盘的译码技术可经配置以用作译码单元(CU)模式。在其它实例中,基于调色盘的译码技术可经配置以用作HEVC的构架中的PU模式。因此,在CU模式的上下文中的本文中所描述的所有经公开程序(贯穿本发明)可另外或替代地应用于PU。然而,此些基于HEVC的实例不应被视为约束或限制本文中所描述的基于调色盘的译码技术,这是因为此些技术可经应用以独立地或作为其它现有或尚待开发的系统/标准的部分工作。在此些状况下,用于调色盘译码的单元可为正方形块、矩形块或甚至非矩形形状区域。
举例来说,当(例如)针对CU或PU选择基于调色盘的编码模式时,基于调色盘的编码单元122可执行基于调色盘的编码。举例来说,基于调色盘的编码单元122可经配置以产生具有指示像素值的项目的调色盘,选择调色盘中的像素值以表示视频数据块的至少一些位置的像素值,且发信使视频数据块的位置中的至少一些位置与分别对应于选定像素值的调色盘中的项目相关联的信息。尽管将各种功能描述为由基于调色盘的编码单元122执行,但此些功能中的一些或全部可由其它处理单元或不同处理单元的组合来执行。
基于调色盘的编码单元122可产生语法元素以定义用于视频数据块的调色盘。基于调色盘的编码单元122可产生以定义用于当前视频数据块的当前调色盘的一些实例语法元素包含但不限于:指示是否将转置程序应用于当前调色盘的调色盘索引的语法元素(例如,palette_transpose_flag);相关于差异量化参数(QP)的一或多个语法元素(例如,cu_qp_delta_palette_abs、cu_qp_delta_palette_sign_flag、cu_chroma_qp_palette_offset_flag及/或cu_chroma_qp_palette_offset_idx);相关于当前视频数据块的色度QP偏移的一或多个语法元素;指示先于阵列中的非零项目的零的数目的一或多个语法元素(例如,palette_predictor_run),所述阵列指示是否将来自预测因子调色盘的项目再用于当前调色盘中;指示经明确地发信的当前调色盘中的项目的数目的一或多个语法元素(例如,num_signalled_palette_entries);指示当前调色盘中的调色盘项目中的分量的值的一或多个语法元素(例如,palette_entry);指示当前视频数据块是否包含至少一个经转义译码样本的一或多个语法元素(例如,palette_escape_val_present_flag);指示经明确地发信或推断的当前调色盘中的项目的数目的一或多个语法元素(例如,num_palette_indices_idc);及指示当前调色盘项目的阵列中的索引的一或多个语法元素(例如,palette_index_idc)。基于调色盘的编码单元122可将定义用于当前块的当前调色盘的所产生的语法元素输出到视频编码器20的一或多个其它组件,例如熵编码单元118。
因此,视频编码器20可经配置以使用如本发明中所描述的基于调色盘的译码模式来编码视频数据块。视频编码器20可使用调色盘译码模式来选择性地编码视频数据块,或使用不同模式(例如,此HEVC帧间预测性或帧内预测性译码模式)来编码视频数据块。视频数据块可为(例如)根据HEVC译码程序产生的CU或PU。视频编码器20可通过帧间预测性时间预测或帧内预测性空间译码模式编码一些块,且通过基于调色盘的译码模式解码其它块。
帧内预测处理单元126可通过对PU执行帧内预测而产生PU的预测性数据。PU的预测性数据可包含PU的预测性样本块及各种语法元素。帧内预测处理单元126可对I切片、P切片及B切片中的PU执行帧内预测。
为了对PU执行帧内预测,帧内预测处理单元126可使用多个帧内预测模式来产生PU的预测性数据的多个集合。为了使用帧内预测模式产生PU的预测性数据的集合,帧内预测处理单元126可使样本在与帧内预测模式相关联的方向上从相邻PU的样本块跨越所述PU的样本块而扩展。对于PU、CU及CTU,假设从左到右、从上而下的编码次序,那么相邻PU可在PU上方、右上方、左上方或左侧。帧内预测处理单元126可使用不同数目个帧内预测模式,例如,33个定向帧内预测模式。在一些实例中,帧内预测模式的数目可取决于与PU相关联的区域的大小。
预测处理单元100可从帧间预测处理单元120产生的PU的预测性数据或帧内预测处理单元126产生的PU的预测性数据当中选择CU的PU的预测性数据。在一些实例中,预测处理单元100基于预测性数据集的速率/失真度量而选择CU的PU的预测性数据。选定预测性数据的预测性样本块在本文中可被称作选定预测性样本块。
残余产生单元102可基于CU的明度译码块、Cb译码块及Cr译码块及CU的PU的选定预测性明度块、预测性Cb块及预测性Cr块而产生CU的明度残余块、Cb残余块及Cr残余块。举例来说,残余产生单元102可产生CU的残余块,使得残余块中的每一样本的值等于CU的译码块中的样本与CU的PU的对应选定预测性样本块中的对应样本之间的差。
变换处理单元104可执行四分树分割以将与CU相关联的残余块分割成与CU的TU相关联的变换块。因此,TU可与明度变换块及两个色度变换块相关联。CU的TU的明度及色度变换块的大小及位置可或可不基于CU的PU的预测块的大小及位置。被称为“残余四分树”(residual quad-tree;RQT)的四分树结构可包含与区域中的每一个相关联的节点。CU的TU可对应于RQT的叶节点。
变换处理单元104可通过将一或多个变换应用于TU的变换块而产生CU的每一TU的变换系数块。变换处理单元104可将各种变换应用于与TU相关联的变换块。举例来说,变换处理单元104可将离散余弦变换(discrete cosine transform;DCT)、定向变换或概念上相似的变换应用于变换块。在一些实例中,变换处理单元104并不将变换应用于变换块。在此些实例中,变换块可经处理为变换系数块。
量化单元106可量化系数块中的变换系数。量化程序可减少与变换系数中的一些或全部相关联的位深度。举例来说,n位变换系数可在量化期间被降值舍位到m位变换系数,其中n大于m。量化单元106可基于与CU相关联的量化参数(QP)值量化与CU的TU相关联的系数块。视频编码器20可通过调整与CU相关联的QP值来调整应用于与CU相关联的系数块的量化程度。量化可使得信息丢失,因此经量化的变换系数可具有比原始变换系数低的精确度。
反量化单元108及反变换处理单元110可分别将反量化及反变换应用于系数块,以从系数块重构建残余块。重构建单元112可将经重构建的残余块添加到来自由预测处理单元100产生的一或多个预测性样本块的对应样本,以产生与TU相关联的经重构建变换块。通过以此方式重构建用于CU的每一TU的变换块,视频编码器20可重构建CU的译码块。
滤波器单元114可执行一或多个解块操作以减少与CU相关联的译码块中的块伪影。在滤波器单元114对经重构建译码块执行一或多个解块操作之后,经解码图片缓冲器116可存储经重构建译码块。帧间预测处理单元120可使用含有经重构建译码块的参考图片,以对其它图片的PU执行帧间预测。另外,帧内预测处理单元126可使用经解码图片缓冲器116中的经重构建译码块,以对处于与CU相同的图片中的其它PU执行帧内预测。
熵编码单元118可从视频编码器20的其它功能组件接收数据。举例来说,熵编码单元118可从量化单元106接收系数块,且可从预测处理单元100接收语法元素。熵编码单元118可对数据执行一或多个熵编码操作以产生经熵编码的数据。举例来说,熵编码单元118可对数据执行上下文自适应性可变长度译码(CAVLC)操作、CABAC操作、可变到可变(V2V)长度译码操作、基于语法的上下文自适应性二进制算术译码(SBAC)操作、概率区间分割熵(PIPE)译码操作、指数哥伦布编码操作或另一类型的熵编码操作。视频编码器20可输出包含由熵编码单元118产生的经熵编码的数据的位流。举例来说,位流可包含表示CU的RQT的数据。
如上文所论述,基于调色盘的编码单元122可将定义用于当前块的当前调色盘的所产生的语法元素输出到熵编码单元118。熵编码单元118可使用CABAC与上下文来编码从基于调色盘的编码单元122接收的语法元素的一或多个槽,且在无上下文的情况下使用CABAC来编码从基于调色盘的编码单元122接收的语法元素的一或多个槽(即,旁通模式)。在一些实例中,熵编码单元118可使用上下文或如上文在表2中所定义的旁通模式来编码语法元素的槽。
如上文所论述,可能需要将经旁通译码的槽分组在一起以增加CABAC输送量。在SCC草案3中,对palette_predictor_run、num_signalled_palette_entries、palette_entry及palette_escape_val_present_flag语法元素的槽进行旁通译码,且将其分组在一起。然而,当也对num_palette_indices_idc及palette_index_idc语法元素的槽进行旁通译码时,不将其与palette_predictor_run、num_signalled_palette_entries、palette_entry及palette_escape_val_present_flag语法元素的槽分组在一起。替代地,在HEVCSCC草案3中,通过相关于当前视频数据块的差异量化参数(QP)及/或色度QP偏移的一或多个语法元素(即,cu_qp_delta_palette_abs、cu_qp_delta_palette_sign_flag、cu_chroma_qp_palette_offset_flag及cu_chroma_qp_palette_offset_idx)及指示是否将转置程序应用于当前视频数据块的调色盘的调色盘索引的语法元素(即,palette_transpose_flag)而将num_palette_indices_idc及palette_index_idc语法元素与palette_predictor_run、num_signalled_palette_entries、palette_entry及palette_escape_val_present_flag语法元素分离。
根据本发明的一或多种技术,熵编码单元118可编码用以定义当前调色盘的语法元素,以使得连续地编码使用旁通模式编码的语法元素。举例来说,与将palette_predictor_run、num_signalled_palette_entries、palette_entry及palette_escape_val_present_flag语法元素的槽与num_palette_indices_idc及palette_index_idc语法元素的槽分离相反,熵编码单元118可在指示是否将转置程序应用于当前视频数据块的调色盘的调色盘索引的语法元素之后编码相关于当前视频数据块的差异QP及/或色度QP偏移的一或多个语法元素,以使得将palette_predictor_run、num_signalled_palette_entries、palette_entry以及palette_escape_val_present_flag、num_palette_indices_idc及palette_index_idc语法元素的槽分组在一起。以此方式,熵编码单元118的CABAC输送量可增加。
图3为说明经配置以实施本发明的技术的实例视频解码器30的框图。出于解释的目的而提供图3,且其并不限制如本发明中所广泛例示及描述的技术。出于解释的目的,本发明描述在HEVC译码的上下文中的视频解码器30。然而,本发明的技术可适用于其它译码标准或方法。
视频解码器30表示可经配置以执行根据本发明中所描述的各种实例的用于基于调色盘的视频译码的技术的装置的实例。举例来说,视频解码器30可经配置以使用基于调色盘的译码或非基于调色盘的译码而选择性地解码视频数据的各种块(例如,HEVC译码中的CU或PU)。非基于调色盘的译码模式可指各种帧间预测性时间译码模式或帧内预测性空间译码模式,例如由HEVC标准指定的各种译码模式。在一个实例中,视频解码器30可经配置以产生具有指示像素值的项目的调色盘,接收将视频数据块的至少一些位置与调色盘中的项目相关联的信息,基于所述信息选择调色盘中的像素值,且基于选定像素值重构建块的像素值。
在图3的实例中,视频解码器30包含熵解码单元150、预测处理单元152、反量化单元154、反变换处理单元156、重构建单元158、滤波器单元160及经解码图片缓冲器162。预测处理单元152包含运动补偿单元164及帧内预测处理单元166。视频解码器30还包含经配置以执行本发明中所描述的基于调色盘的译码技术的各种方面的基于调色盘的解码单元165。在其它实例中,视频解码器30可包含更多、更少或不同功能的组件。
在一些实例中,视频解码器30可进一步包含视频数据存储器149。视频数据存储器149可存储待由视频解码器30的组件解码的视频数据,例如经编码视频位流。举例来说,可从信道16(例如,从例如照相机的本地视频源)经由视频数据的有线或无线网络通信或通过存取物理数据存储媒体而获得存储在视频数据存储器149中的视频数据。视频数据存储器149可形成存储来自经编码视频位流的经编码视频数据的经译码图片缓冲器(codedpicture buffer;CPB)。CPB可为存储参考视频数据以供由视频解码器30用于解码视频数据(例如,在帧内或帧间译码模式中)的参考图片存储器。视频数据存储器149可由多种存储器装置中的任一个形成,所述存储器装置例如动态随机存取存储器(DRAM)(包含同步DRAM(SDRAM))、磁阻式RAM(MRAM)、电阻式RAM(RRAM)或其它类型的存储器装置。视频数据存储器149及经解码图片缓冲器162可由相同存储器装置或单独存储器装置提供。在各种实例中,视频数据存储器149可与视频解码器30的其它组件一起在芯片上,或相对于那些组件在芯片外。
经译码图片缓冲器(CPB)可接收及存储位流的经编码视频数据(例如,NAL单元)。熵解码单元150可从CPB接收经编码视频数据(例如,NAL单元)且剖析NAL单元以解码语法元素。熵解码单元150可对NAL单元中的经熵编码语法元素进行熵解码。预测处理单元152、反量化单元154、反变换处理单元156、重构建单元158及滤波器单元160可基于从位流提取的语法元素而产生经解码视频数据。
位流的NAL单元可包含经译码切片NAL单元。作为解码位流的部分,熵解码单元150可从经译码切片NAL单元提取语法元素且对所述语法元素进行熵解码。经译码切片中的每一个可包含切片标头及切片数据。切片标头可含有关于切片的语法元素。切片标头中的语法元素可包含识别与含有切片的图片相关联的PPS的语法元素。
除了解码来自位流的语法元素之外,视频解码器30可对未经分割的CU执行重构建操作。为了对未经分割的CU执行重构建操作,视频解码器30可对CU的每一TU执行重构建操作。通过对CU的每一TU执行重构建操作,视频解码器30可重构建CU的残余块。
作为对CU的TU执行重构建操作的部分,反量化单元154可反量化(即,解量化)与TU相关联的系数块。反量化单元154可使用与TU的CU相关联的QP值来确定量化程度,且同样地,确定反量化单元154所应用的反量化程度。即,可通过调整在量化变换系数时所使用的QP的值控制压缩比(即,用以表示原始序列的位数目与用以表示压缩序列的位数目的比率)。压缩比还可取决于所使用的熵译码的方法。
在反量化单元154反量化系数块之后,反变换处理单元156可将一或多个反变换应用于系数块以便产生与TU相关联的残余块。举例来说,反变换处理单元156可将反DCT、反整数变换、反卡忽南-拉维变换(Karhunen-Loeve transform;KLT)、反旋转变换、反定向变换或另一反变换应用于系数块。
如果PU使用帧内预测进行编码,那么帧内预测处理单元166可执行帧内预测以产生用于PU的预测性块。帧内预测处理单元166可使用帧内预测模式以基于空间上相邻的PU的预测块而产生用于PU的预测性明度块、Cb块及Cr块。帧内预测处理单元166可基于从位流解码的一或多个语法元素而确定用于PU的帧内预测模式。
预测处理单元152可基于从位流提取的语法元素而构建第一参考图片列表(RefPicList0)及第二参考图片列表(RefPicList1)。此外,如果PU使用帧间预测进行编码,那么熵解码单元150可提取PU的运动信息。运动补偿单元164可基于PU的运动信息而确定用于PU的一或多个参考区域。运动补偿单元164可基于用于PU的一或多个参考块处的样本块而产生用于PU的预测性明度块、Cb块及Cr块。
重构建单元158可在适用时使用与CU的TU相关联的明度变换块、Cb变换块及Cr变换块以及CU的PU的预测性明度块、预测性Cb块及预测性Cr块(即,帧内预测数据或帧间预测数据)来重构建CU的明度译码块、Cb译码块及Cr译码块。举例来说,重构建单元158可将明度变换块、Cb变换块及Cr变换块的样本添加到预测性明度块、Cb块及Cr块的对应样本,以重构建CU的明度译码块、Cb译码块及Cr译码块。
滤波器单元160可执行解块操作以减少与CU的明度译码块、Cb译码块及Cr译码块相关联的块伪影。视频解码器30可将CU的明度译码块、Cb译码块及Cr译码块存储在经解码图片缓冲器162中。经解码图片缓冲器162可提供参考图片以用于后续运动补偿、帧内预测及在显示装置(例如,图1的显示装置32)上的呈现。举例来说,视频解码器30可基于经解码图片缓冲器162中的明度块、Cb块及Cr块而对其它CU的PU执行帧内预测或帧间预测操作。以此方式,视频解码器30可从位流提取显著明度系数块的变换系数层级,反量化变换系数层级,将变换应用于变换系数层级以产生变换块,至少部分地基于变换块而产生译码块,且输出译码块以供显示。
根据本发明的各种实例,视频解码器30可经配置以执行基于调色盘的译码。举例来说,如当(例如)针对CU或PU选择基于调色盘的解码模式时,基于调色盘的解码单元165可执行基于调色盘的解码。举例来说,基于调色盘的解码单元165可经配置以产生具有指示像素值的项目的调色盘,接收将视频数据块的至少一些位置与调色盘中的项目相关联的信息,基于所述信息选择调色盘中的像素值,且基于选定像素值重构建块的像素值。尽管各种功能经描述为由基于调色盘的解码单元165执行,但此些功能中的一些或全部可由其它处理单元或不同处理单元的组合来执行。
基于调色盘的解码单元165可接收调色盘译码模式信息,且在调色盘译码模式信息指示调色盘译码模式适用于块时执行以上操作。当调色盘译码模式信息指示调色盘译码模式不适用于块时,或当其它模式信息指示使用不同模式时,预测处理单元152会在调色盘译码模式信息指示调色盘译码模式不适用于块时,使用非基于调色盘的译码模式(例如,使用运动补偿单元164的此HEVC帧间预测性模式,或使用帧内预测处理单元166的帧内预测性译码模式)来解码视频数据块。视频数据块可为(例如)根据HEVC译码程序产生的CU或PU。视频解码器30可通过帧间预测性时间预测或帧内预测性空间译码模式而解码一些块,且通过基于调色盘的译码模式而解码其它块。基于调色盘的译码模式可包括多个不同的基于调色盘的译码模式中的一个,或可存在单一基于调色盘的译码模式。
由基于调色盘的解码单元165接收的调色盘译码模式信息可包括调色盘模式语法元素,例如旗标。调色盘模式语法元素的第一值指示调色盘译码模式适用于块,且调色盘模式语法元素的第二值指示调色盘译码模式不适用于视频数据块。基于调色盘的解码单元165可接收在预测性单元层级、译码单元等级、切片层级或图片层级中的一或多个下的调色盘译码模式信息,或可接收在图片参数集(PPS)、序列参数集(SPS)或视频参数集(VPS)中的至少一个中的调色盘译码模式信息。
在一些实例中,基于调色盘的解码单元165可基于译码块的大小、帧类型、色彩空间、色彩分量、帧大小、帧速率、可调式视频译码中的层id或与视频数据块相关联的多视图译码中的视图id中的一或多个来推断调色盘译码模式信息。
基于调色盘的解码单元165还可经配置以接收定义调色盘中的至少一些项目与视频数据的信息,且至少部分地基于所接收信息而产生调色盘。调色盘的大小可为固定的或可变的。在一些状况下,调色盘的大小为可变的且可基于与视频数据一起发信的信息而调节。所发信的信息可指定调色盘中的项目是否为调色盘中的最后项目。而且,在一些状况下,调色盘可具有最大大小。
调色盘可为包含指示块的明度分量及色度分量的像素值的项目的单一调色盘。在此状况下,调色盘中的每一项目为指示用于明度分量及两个色度分量的像素值的三重项目。替代地,调色盘包括包含指示块的明度分量的像素值的项目的明度调色盘,及包含指示块的相应色度分量的像素值的项目的色度调色盘。
在一些实例中,基于调色盘的解码单元165可通过基于先前处理的数据预测调色盘中的项目而产生调色盘。先前处理的数据可包含用于先前解码的相邻块的调色盘,或来自调色盘的信息。基于调色盘的解码单元165可接收指示是否将预测调色盘中的项目的预测语法元素。预测语法元素可包含分别指示是否将预测用于明度分量与色度分量的调色盘中的项目的多个预测语法元素。
在一些实例中,基于调色盘的解码单元165可基于用于切片或图片中的左相邻块或顶部相邻块的调色盘中的项目而预测调色盘中的至少一些项目。在此状况下,调色盘中的基于左相邻块或顶部相邻块的调色盘中的项目预测的项目可由基于调色盘的解码单元165基于指示选择左相邻块或顶部相邻块以供预测的语法元素而预测。语法元素可为具有指示选择左相邻块或顶部相邻块以供预测的值的旗标。
在一些实例中,基于调色盘的解码单元165可接收指示是否将逐个项目地预测调色盘中的至少一些选定项目的一或多个预测语法元素,且因此产生项目。基于调色盘的解码单元165可预测项目中的一些项目,且接收直接指定调色盘中的其它项目的信息。
由基于调色盘的解码单元165接收的将视频数据块的至少一些位置与调色盘中的项目相关联的信息可包括包含用于块中的至少一些位置的调色盘索引值的映射信息,其中调色盘索引值中的每一个对应于调色盘中的项目中的一个。映射信息可包含各自指示具有相同调色盘索引值的块中的连续位置的数目的一或多个游程语法元素。
在一些实例中,基于调色盘的解码单元165可接收指示借以从用于块中的位置的另一排的调色盘项目复制用于块中的位置的一排的调色盘项目的排复制的信息。基于调色盘的解码单元165可使用此信息来执行排复制以确定用于块的各种位置的调色盘中的项目。位置的排可包括块的位置行、行的一部分、列或列的一部分。
基于调色盘的解码单元165可部分地通过接收块的一或多个位置的像素值,及将所述像素值添加到调色盘中的项目以动态地产生在游程中的调色盘的至少一部分而产生调色盘。添加像素值可包括将像素值添加到包括初始项目集合的初始调色盘,或添加到不包含初始项目集合的空调色盘。在一些实例中,添加包括添加像素值以将新项目添加到包括初始项目集合的初始调色盘或填充初始调色盘中的现有项目,或替换或改变初始调色盘中的项目的像素值。
在一些实例中,调色盘可为经量化调色盘,在所述经量化调色盘中,选自用于块中的位置中的一个的调色盘的像素值不同于所述块中的所述位置的实际像素值,以使得解码程序有损。举例来说,相同像素值可选自用于具有不同实际像素值的两个不同位置的调色盘。
如上文所论述,基于调色盘的解码单元165可接收定义用于当前视频数据块的调色盘的信息。举例来说,基于调色盘的解码单元165可从熵解码单元150接收多个语法元素。在一些实例中,熵解码单元150可根据语法表解码来自经译码视频位流的多个语法元素。作为一个实例,熵解码单元150可根据上文在表1中所再现的HEVC SCC草案3的调色盘语法表而解码来自经译码视频位流的多个语法元素。然而,如上文所论述,HEVC SCC草案3中的语法元素的布置可不最优选。确切地说,HEVC SCC草案3中的语法元素的布置未最大化被分组在一起的经旁通模式译码的语法元素的数目,此可减少CABAC输送量。
根据本发明的一或多种技术,熵解码单元150可解码用以定义当前调色盘的语法元素,以使得额外经旁通模式译码的语法元素被分组在一起。举例来说,与将palette_predictor_run、num_signalled_palette_entries、palette_entry及palette_escape_val_present_flag语法元素的槽与num_palette_indices_idc及palette_index_idc语法元素的槽分离相反,熵解码单元150可在指示是否将转置程序应用于当前视频数据块的调色盘的调色盘索引的语法元素之后解码相关于当前视频数据块的差异QP及/或色度QP偏移的一或多个语法元素,以使得将palette_predictor_run、num_signalled_palette_entries、palette_entry以及palette_escape_val_present_flag、num_palette_indices_idc及palette_index_idc语法元素的槽分组在一起。作为一个实例,熵解码单元150可按上文在表4中所展示的次序解码用以定义当前调色盘的语法元素。作为另一实例,熵解码单元150可按上文在表5中所展示的次序解码用以定义当前调色盘的语法元素。以此方式,熵解码单元150的CABAC输送量可增加。
图4为说明与本发明的技术一致的确定用于译码视频数据的调色盘的实例的概念图。图4的实例包含图片178,其具有与第一调色盘184相关联的第一译码单元(CU)180及与第二调色盘192相关联的第二CU 188。如下文更详细地且根据本发明的技术而描述,第二调色盘192是基于第一调色盘184。图片178还包含通过帧内预测译码模式译码的块196及通过帧间预测译码模式译码的块200。
出于解释的目的,在视频编码器20(图1及图2)及视频解码器30(图1及图3)的上下文中且关于HEVC标准描述图4的技术。然而,应理解,本发明的技术并不限于此方式,且可由其它视频译码处理器及/或装置在其它视频译码程序及/或标准中应用。
一般来说,调色盘指代对于当前正经译码的CU(例如,在图4的实例中为CU 188)来说为主要的及/或代表性的数个像素值。第一调色盘184及第二调色盘192经展示为包含多个调色盘。在一些实例中,视频译码器(例如视频编码器20或视频解码器30)可针对CU的每一色彩分量单独地译码调色盘。举例来说,视频编码器20可编码用于CU的明度(Y)分量的调色盘、用于CU的色度(U)分量的另一调色盘及用于CU的色度(V)分量的又一调色盘。在此实例中,Y调色盘的项目可表示CU的像素的Y值,U调色盘的项目可表示CU的像素的U值,且V调色盘的项目可表示CU的像素的V值。在另一实例中,视频编码器20可编码用于CU的明度(Y)分量的调色盘,及用于CU的两个分量(U,V)的另一调色盘。在此实例中,Y调色盘的项目可表示CU的像素的Y值,且U-V调色盘的项目可表示CU的像素的U-V值对。
在其它实例中,视频编码器20可编码用于CU的所有色彩分量的单一调色盘。在此实例中,视频编码器20可编码具有为三重值(包含Yi、Ui及Vi)的第i个项目的调色盘。在此状况下,调色盘包含用于像素的分量中的每一个的值。因此,作为具有多个独立调色盘的调色盘集合的调色盘184及192的表示仅为一个实例且不打算为限制性的。
在图4的实例中,第一调色盘184包含分别具有项目索引值1、项目索引值2及项目索引值3的三个项目202到206。项目202到206将索引值分别与包含像素值A、像素值B及像素值C的像素值相关。如本文中所描述,并非对第一CU 180的实际像素值进行译码,而是视频译码器(例如视频编码器20或视频解码器30)可使用基于调色盘的译码以使用索引1到3对块的像素译码。即,对于第一CU 180的每一像素位置,视频编码器20可编码用于像素的索引值,其中所述索引值与第一调色盘184中的一或多个中的像素值相关联。视频解码器30可从位流获得索引值且使用所述索引值及第一调色盘184中的一或多个来重构建像素值。因此,第一调色盘184由视频编码器20在经编码视频数据位流中发射以供视频解码器30在基于调色盘的解码使用。一般来说,一或多个调色盘可经发射以用于每一CU或可在不同CU当中共享。
视频编码器20及视频解码器30可基于第一调色盘184确定第二调色盘192。举例来说,视频编码器20可编码用于每一CU(作为实例,包含第二CU 188)的pred_palette_flag以指示用于CU的调色盘是否是从与一或多个其它CU(例如相邻CU(在空间上或基于扫描次序)或因果相邻者的最频繁样本)相关联的一或多个调色盘预测。举例来说,当此旗标的值等于一时,视频解码器30可确定用于第二CU 188的第二调色盘192是从一或多个已解码调色盘预测且因此在含有pred_palette_flag的位流中不包含用于第二CU 188的新调色盘。当此旗标等于零时,视频解码器30可确定用于第二CU 188的调色盘192作为新的调色盘包含在位流中。在一些实例中,pred_palette_flag可经单独地译码以用于CU的每一不同色彩分量(例如,三个旗标,对于YUV视频中的CU,一个用于Y、一个用于U且一个用于V)。在其它实例中,单一pred_palette_flag可经译码以用于CU的所有色彩分量。
在以上实例中,每一CU发信pred_palette_flag以指示是否预测用于当前块的调色盘的项目中的任一个。在一些实例中,可基于每一项目发信一或多个语法元素。即,旗标可针对调色盘预测因子的每一项目经发信以指示所述项目是否存在于当前调色盘中。如上文所提及,如果未预测调色盘项目,那么可明确地发信调色盘项目。
当相对于第一调色盘184确定第二调色盘192(例如,pred_palette_flag等于一)时,视频编码器20及/或视频解码器30可定位确定预测性调色盘(在此实例中,第一调色盘184)所凭借的一或多个块。预测性调色盘可与当前正被译码的CU(即,第二CU 188)的一或多个相邻CU(例如,相邻CU(在空间上或基于扫描次序)或因果相邻者的最频繁样本)相关联。一或多个相邻CU的调色盘可与预测因子调色盘相关联。在一些实例(例如,图4中所说明的实例)中,视频编码器20及/或视频解码器30可在确定用于第二CU 188的预测性调色盘时定位左相邻CU(第一CU 180)。在其它实例中,视频编码器20及/或视频解码器30可相对于第二CU 188定位在其它位置中的一或多个CU(例如,上部CU(CU 196))。
视频编码器20及/或视频解码器30可基于阶层确定用于调色盘预测的CU。举例来说,视频编码器20及/或视频解码器30可最初识别左相邻CU(第一CU 180)以用于调色盘预测。如果左相邻CU不可用于预测(例如,左相邻CU是运用不同于基于调色盘的译码模式的模式(例如,帧内预测模式或帧内预测模式)经译码,或左相邻CU位于图片或切片的最左边缘处),那么视频编码器20及/或视频解码器30可识别上部相邻CU(CU196)。视频编码器20及/或视频解码器30可继续根据预定位置次序搜索可用CU直到定位具有可用于调色盘预测的调色盘的CU。在一些实例中,视频编码器20及/或视频解码器30可基于相邻块的多个块及/或经重构建样本而确定预测性调色盘。
虽然图4的实例将第一调色盘184说明为来自单一CU(第一CU 180)的预测性调色盘,但在其它实例中,视频编码器20及/或视频解码器30可从相邻CU的组合定位用于预测的调色盘。举例来说,视频编码器20及/或视频解码器可应用一或多个公式、函数、规则或其类似者以基于多个相邻CU中的一个或组合的调色盘而产生调色盘。
在又其它实例中,视频编码器20及/或视频解码器30可构建包含用于调色盘预测的数个可能候选者的候选者列表。可在视频编码器20及视频解码器30两者处应用修剪程序以去除列表中重复的候选者。在此些实例中,视频编码器20可编码候选者列表的索引以指示列表中的候选者CU,从所述列表选择用于调色盘预测的当前CU(例如,复制调色盘)。视频解码器30可以相同方式构建候选者列表,解码索引,且使用经解码索引来选择对应CU的调色盘以供与当前CU一起使用。
在出于说明目的的实例中,视频编码器20及视频解码器30可构建包含位于当前正被译码的CU上方的一个CU及位于当前正被译码的CU左侧的一个CU的候选者列表。在此实例中,视频编码器20可编码一或多个语法元素以指示候选者选择。举例来说,视频编码器20可编码具有零值的旗标以指示用于当前CU的调色盘是从位于当前CU左侧的CU复制。视频编码器20可编码具有值为一的旗标以指示用于当前CU的调色盘是从位于当前CU上方的CU复制。视频解码器30解码旗标且选择适当CU以用于调色盘预测。
在又其它实例中,视频编码器20及/或视频解码器30基于包含在一或多个其它调色盘中的样本值出现在一或多个相邻CU中的频率而确定用于当前正被译码的CU的调色盘。举例来说,视频编码器20及/或视频解码器30可跟踪与在译码预定数目的CU期间最频繁使用的索引值相关联的色彩。视频编码器20及/或视频解码器30可将最频繁使用的色彩包含在用于当前正被译码的CU的调色盘中。
在一些实例中,视频编码器20及/或视频解码器30可执行基于逐个项目的调色盘预测。举例来说,视频编码器20可编码用于预测性调色盘的每一项目的一或多个语法元素(例如一或多个旗标),其指示是否将相应预测性调色盘项目再用于当前调色盘中(例如,另一CU的调色盘中的像素值是否由当前调色盘再用)。在此实例中,视频编码器20可在给定项目为来自预测性调色盘的经预测值时针对所述项目编码具有等于一的值的旗标(例如,与相邻CU相关联的调色盘的对应项目)。视频编码器20可针对特定项目编码具有等于零的值的旗标以指示特定项目并非从另一CU的调色盘预测。在此实例中,视频编码器20还可编码指示非预测调色盘项目的值的额外数据。
在图4的实例中,第二调色盘192包含分别具有项目索引值1、项目索引值2、项目索引值3及项目索引4的四个项目208到214。项目208到214分别将索引值与包含像素值A、像素值B、像素值C及像素值D的像素值相关。视频编码器20及/或视频解码器30可使用上文所描述的技术中的任一个来定位第一CU 180以为了调色盘预测,且将第一调色盘184的项目1到3复制到第二调色盘192的项目1到3以用于译码第二CU 188。以此方式,视频编码器20及/或视频解码器30可基于第一调色盘184确定第二调色盘192。另外,视频编码器20及/或视频解码器30可译码用于项目4的数据以待与第二调色盘192包含在一起。此信息可包含未从预测因子调色盘预测的调色盘项目的数目及对应于那些调色盘项目的像素值。
在一些实例中,根据本发明的方面,一或多个语法元素可指示调色盘(例如第二调色盘192)是否完全从预测性调色盘(图4中展示为第一调色盘184,但其可由来自一或多个块的项目构成)预测或第二调色盘192的特定项目是否被预测。举例来说,初始语法元素可指示是否所有项目被预测。如果初始语法元素指示并非所有项目被预测(例如,具有0值的旗标),那么一或多个额外语法元素可指示第二调色盘192的哪些项目是从预测性调色盘预测。
根据本发明的一些方面,可从正被译码的数据的一或多个特性推断与调色盘预测相关联的某些信息。即,视频编码器20及视频解码器30可基于被译码数据的一或多个特性执行调色盘预测,而非视频编码器20编码语法元素(及视频解码器30解码此些语法元素)。
图5为说明与本发明的技术一致的确定到用于像素的块的调色盘的索引的实例的概念图。举例来说,图5包含将关联于索引值的像素的相应位置与调色盘244的项目相关的索引值(值1、2及3)的映射240。可以与上文关于图4所描述的第一调色盘184及第二调色盘192相似的方式来确定调色盘244。
再次,出于解释的目的,在视频编码器20(图1及图2)及视频解码器30(图1及图3)的上下文中且关于HEVC视频译码标准描述图5的技术。然而,应理解,本发明的技术并不限于此方式,且可由其它视频译码处理器及/或装置在其它视频译码程序及/或标准中应用。
虽然映射240在图5的实例中说明为包含每一像素位置的索引值,但应理解,在其它实例中,并非所有像素位置可与将像素值与调色盘244的项目相关的索引值相关联。即,如上文所提及,在一些实例中,如果像素值并不包含在调色盘244中,那么视频编码器20可编码(且视频解码器30可从经编码位流获得)用于映射240中的位置的实际像素值(或其经量化版本)的指示。
在一些实例中,视频编码器20及视频解码器30可经配置以译码指示哪些像素位置与哪些索引值相关联的额外映射。举例来说,假设映射中的(i,j)项目对应于CU的(i,j)位置。视频编码器20可针对映射的每一项目(即,每一像素位置)编码一或多个语法元素,其指示所述项目是否具有相关联的索引值。举例来说,视频编码器20可编码具有值为一的旗标以指示在CU中的(i,j)位置处的像素值为调色盘244中的值中的一个。在此实例中,视频编码器20还可编码调色盘索引(在图5的实例中展示为值1到3)以指示调色盘中的所述像素值且允许视频解码器重构建像素值。在调色盘244包含单一项目及相关联像素值的情况下,视频编码器20可跳过索引值的发信。视频编码器20可将旗标编码为具有零的值以指示在CU中的(i,j)位置处的像素值并非调色盘244中的值中的一个。在此实例中,视频编码器20还可编码供视频解码器30用于重构建像素值的像素值的指示。在一些情况下,可以有损方式译码像素值。
CU的一个位置中的像素的值可提供CU的其它位置中的一或多个其它像素的值的指示。举例来说,CU的相邻像素位置将具有相同像素值或可映射到相同索引值(在有损译码状况下,其中多于一个的像素值可映射到单一索引值)的概率可相对较高。
因此,视频编码器20可编码指示具有相同像素值或索引值的按给定扫描次序的连续像素或索引值的数目的一或多个语法元素。如上文所提及,相同值像素或索引值的串可在本文中称为游程(run)。在出于说明目的的实例中,如果按给定扫描次序的两个连续像素或索引具有不同值,那么游程等于零。如果按给定扫描次序的两个连续像素或索引具有相同值但按扫描次序的第三像素或索引具有不同值,那么游程等于一。对于具有相同值的三个连续索引或像素,游程为二,等等。视频解码器30可从经编码位流获得指示游程的语法元素,且使用数据来确定具有相同像素或索引值的连续位置的数目。
可包含在游程中的索引的数目可受扫描次序影响。举例来说,考虑映射240的排266、268及270的光栅扫描。假设水平的从左到右的扫描方向(例如光栅扫描次序),行266包含三个索引值“1”、两个索引值“2”及三个索引值“3”。行268包含五个索引值“1”及三个索引值“3”。在此实例中,对于行266,视频编码器20可编码指示行266的第一值(所述行的最左侧值)为1(其具有为2的游程),接着为具有游程为1的索引值2,接着为具有游程为2的索引值3的语法元素。在所述光栅扫描之后,视频编码器20可接着开始运用最左侧值译码行268。举例来说,视频编码器20可编码指示行268的第一值为1(其具有为4的游程),接着为具有游程为2的索引值3的语法元素。视频编码器20可以相同方式继续进行排270。
之后,按光栅扫描次序,可紧跟在先前排的最后索引之后扫描当前排的第一索引。然而,在一些实例中,可不需要按光栅扫描次序扫描索引。举例来说,可不需要按光栅扫描次序扫描索引,其中:视频数据块的第一排(例如,行266)包含邻近于视频数据块的第一边缘的第一像素(例如,行266的最左侧像素,其具有为1的索引值)及邻近于视频数据块的第二边缘的最后像素(例如,行266的最右侧像素,其具有为3的索引值);视频数据块的第二排(例如,行268)包含邻近于视频数据块的第一边缘的第一像素(例如,行268的最左侧像素,其具有为1的索引值)及邻近于视频数据块的第二边缘的最后像素(例如,行268的最右侧像素,其具有为3的索引值),第一排的最后像素邻近于第二排的最后像素,且第一边缘与第二边缘平行,且第一排中的最后像素与第二排中的最后像素具有相同索引值,但与第二排中的第一像素具有不同索引值。与其它类型的视频内容相比,此情形(即,其中第一排中的最后像素的索引值与第二排中的最后像素的索引值相同,但不同于第二排中的第一像素的索引值)可更频繁地出现在计算机产生的屏幕内容中。
在一些实例中,视频编码器20可在编码映射的索引时使用蛇形扫描次序。举例来说,视频编码器20可紧跟在第一排的最后像素之后扫描第二排的最后像素。以此方式,视频编码器20可改进游程长度译码的效率。
举例来说,与使用光栅扫描次序相对,视频编码器20可使用蛇形扫描次序译码映射240的值。在出于说明目的的实例中,考虑映射240的行266、268及270。使用蛇形扫描次序(例如以蛇形进行扫描的次序)时,视频编码器20可以以下方式译码映射240的值:其开始于行266的左侧位置,继续进行直到行266的最右侧位置,下移到行268的最左侧位置,继续进行直到行268的最左侧位置,及下移到行270的最左侧位置。举例来说,视频编码器20可编码指示行266的第一位置为一,且在扫描方向上的两个连续项目的下一游程与行266的第一位置相同的一或多个语法元素。
视频编码器20可编码指示行266的下一位置(即,从左到右的第四位置)为二,且在扫描方向上的下一连续项目与行266的第四位置相同的一或多个语法元素。视频编码器20可编码指示行266的下一位置(即,第六位置)为三,且在扫描方向上的五个连续项目的下一游程与行266的第六位置相同的一或多个语法元素。视频编码器20可编码指示行268在扫描方向上的下一位置(即,行268从右到左的第四位置)为一,且在扫描方向上的九个连续项目的下一游程与行268的第四位置相同的一或多个语法元素。
以此方式,通过使用蛇形扫描次序,视频编码器20可编码较长长度的游程,其可改进译码效率。举例来说,使用光栅扫描时,行266的最后游程(对于索引值3)等于2。然而,使用蛇形扫描时,行266的最后游程延伸到行268中且等于5。
视频解码器30可接收上文所描述的语法元素且重构建行266、268及270。举例来说,视频解码器30可从经编码位流获得指示当前正被译码的映射240的位置的索引值的数据。视频解码器30还可获得指示具有相同索引值的按扫描次序的连续位置的数目的数据。
图6为说明根据本发明的一或多种技术的用于使用调色盘模式来解码视频数据块的实例程序的流程图。图6的技术可由视频解码器(例如图1及图3中所说明的视频解码器30)执行。出于说明目的,在图1及图3的视频解码器30的上下文内描述图6的技术,但具有不同于视频解码器30的所述配置的配置的视频解码器还可执行图6的技术。
如上文所论述,可能需要最大化被分组在一起的语法元素的经旁通模式译码的槽的数目。根据本发明的一或多种技术,视频解码器30可从经译码视频位流且使用旁通模式来解码用于当前视频数据块的调色盘的语法元素的群组(602)。举例来说,视频解码器30的熵解码单元150可使用旁通模式来解码以下槽:指示先于阵列中的非零项目的零的数目的一或多个语法元素(例如,一或多个palette_predictor_run语法元素),所述阵列指示是否将来自预测因子调色盘的项目再用于当前调色盘中;指示经明确地发信的当前调色盘中的项目的数目的语法元素(例如,num_signalled_palette_entries语法元素);各自指示当前调色盘中的项目中的分量的值的一或多个语法元素(例如,一或多个palette_entry语法元素);指示当前视频数据块是否包含至少一个经转义译码样本的语法元素(例如,palette_escape_val_present_flag语法元素);指示经明确地发信或推断的当前调色盘中的项目的数目的语法元素(例如,num_palette_indices_idc语法元素);及指示当前调色盘项目的阵列中的索引的一或多个语法元素(例如,一或多个palette_index_idc语法元素)。在一些实例中,为了解码经旁通译码的语法元素的群组,视频解码器30可依序解码包含在语法元素的群组中的语法元素而不解码任何未经旁通译码的槽。如上文所论述,将大数目个经旁通译码的槽/语法元素分组在一起可改进视频解码器30的CABAC输送量。确切地说,将经旁通译码的语法元素分组可使得视频解码器30能够避免开始/停止/重新开始CABAC发动机。相比之下,当不将经旁通译码的语法元素分组时,视频解码器30可必须频繁地开始CABAC发动机以解码具有第一上下文的非经旁通译码的槽,停止CABAC发动机以解码经旁通译码的槽,开始CABAC发动机以解码具有第一上下文的另一未经旁通译码的槽,等等。如上文所论述,CABAC发动机的重复切换可减少CABAC发动机的输送量。
视频解码器30可使用CABAC与上下文且在经译码视频位流中的在语法元素的群组之后的位置处,解码指示是否将转置程序应用于当前视频数据块的调色盘的调色盘索引的语法元素(604)。举例来说,视频解码器30的熵解码单元150可在无上下文的情况下使用CABAC来解码palette_transpose_flag语法元素的槽。
视频解码器30可使用CABAC与上下文且在经译码视频位流中的在指示是否将转置程序应用于当前视频数据块的调色盘的调色盘索引的语法元素之后的位置处,解码相关于当前视频数据块的差异量化参数(QP)及/或色度QP偏移的一或多个语法元素(606)。举例来说,视频解码器30的熵解码单元150可使用CABAC与一或多个上下文来解码以下槽:指定当前视频数据块的QP(例如,明度QP)与当前块的QP的预测因子之间的差的绝对值的语法元素(例如,cu_qp_delta_abs);指定当前视频数据块的QP与当前块的QP的预测因子之间的差的正负号的语法元素(例如,cu_qp_delta_sign_flag);指示是否将一或多个偏移列表中的项目添加到当前块的明度QP以确定当前块的色度QP的语法元素(例如,cu_chroma_qp_offset_flag);及指定被添加到当前块的明度QP以确定当前块的色度QP的一或多个偏移列表中的每一个中的项目的索引的语法元素(例如,cu_chroma_qp_offset_idx)。
在一些实例中,视频解码器30可基于使用旁通模式解码的语法元素的群组的语法元素的值而解码相关于当前视频数据块的差异QP及/或色度QP偏移的一或多个语法元素。作为一个实例,视频解码器30可解码相关于当前视频数据块的差异QP及/或色度QP偏移的一或多个语法元素,其中指示当前视频数据块是否包含至少一个经转义译码样本的语法元素的群组的语法元素指示当前视频数据块确实包含至少一个转义样本。作为另一实例,视频解码器30可不解码相关于当前视频数据块的差异QP及/或色度QP偏移的一或多个语法元素,其中指示当前视频数据块是否包含至少一个经转义译码样本的语法元素的群组的语法元素指示当前视频数据块并不包含至少一个转义样本。
视频解码器30可基于语法元素的群组及指示是否将转置程序应用于当前视频数据块的调色盘的调色盘索引的语法元素而产生用于当前视频数据块的调色盘(608),且基于所产生的调色盘及相关于当前视频数据块的差异QP及/或色度QP偏移的一或多个语法元素而解码当前视频数据块(610)。举例来说,基于调色盘的解码单元165可产生具有指示像素值的项目的调色盘,接收将当前视频数据块的至少一些位置与调色盘中的项目相关联的信息,基于所述信息选择调色盘中的像素值,且基于选定像素值重构建块的像素值。
图7为说明根据本发明的一或多种技术的用于使用调色盘模式来编码视频数据块的实例程序的流程图。图7的技术可由视频编码器(例如图1及图2中所说明的视频编码器20)执行。出于说明目的,在图1及图2的视频编码器20的上下文内描述图7的技术,但具有不同于视频编码器20的所述配置的配置的视频译码器还可执行图7的技术。
如上文所论述,可能需要最大化被分组在一起的语法元素的经旁通模式译码的槽的数目。根据本发明的一或多种技术,视频编码器20可在经译码视频位流中且使用旁通模式来编码用于当前视频数据块的调色盘的语法元素的群组(702)。举例来说,视频编码器20的熵编码单元118可使用旁通模式来编码以下槽:指示先于阵列中的非零项目的零的数目的一或多个语法元素(例如,一或多个palette_predictor_run语法元素),所述阵列指示是否将来自预测因子调色盘的项目再用于当前调色盘中;指示经明确地发信的当前调色盘中的项目的数目的语法元素(例如,num_signalled_palette_entries语法元素);各自指示当前调色盘中的项目中的分量的值的一或多个语法元素(例如,一或多个palette_entry语法元素);指示当前视频数据块是否包含至少一个经转义译码样本的语法元素(例如,palette_escape_val_present_flag语法元素);指示经明确地发信或推断的当前调色盘中的项目的数目的语法元素(例如,num_palette_indices_idc或num_palette_indices_minus1语法元素);及指示当前调色盘项目的阵列中的索引的一或多个语法元素(例如,一或多个palette_index_idc语法元素)。
视频编码器20可使用CABAC与上下文且在经译码视频位流中的在语法元素的群组之后的位置处,编码指示是否将转置程序应用于当前视频数据块的调色盘的调色盘索引的语法元素(704)。举例来说,视频编码器20的熵编码单元118可使用CABAC与上下文来编码palette_transpose_flag语法元素的槽。
视频编码器20可使用CABAC与上下文且在经译码视频位流中的在指示是否将转置程序应用于当前视频数据块的调色盘的调色盘索引的语法元素之后的位置处,编码相关于当前视频数据块的差异量化参数(QP)及/或色度QP偏移的一或多个语法元素(706)。举例来说,视频编码器20的熵编码单元118可使用CABAC与一或多个上下文来编码以下槽:指定当前视频数据块的明度QP与当前块的明度QP的预测因子之间的差的绝对值的语法元素(例如,cu_qp_delta_abs);指定当前视频数据块的明度QP与当前块的明度QP的预测因子之间的差的正负号的语法元素(例如,cu_qp_delta_sign_flag);指示是否将一或多个偏移列表中的项目添加到当前块的明度QP以确定当前块的色度QP的语法元素(例如,cu_chroma_qp_offset_flag);及指定被添加到当前块的明度QP以确定当前块的色度QP的一或多个偏移列表中的每一个中的项目的索引的语法元素(例如,cu_chroma_qp_offset_idx)。
在一些实例中,视频编码器20可基于使用旁通模式编码的语法元素的群组的语法元素的值而编码相关于当前视频数据块的差异QP及/或色度QP偏移的一或多个语法元素。作为一个实例,视频编码器20可编码相关于当前视频数据块的差异QP及/或色度QP偏移的一或多个语法元素,其中指示当前视频数据块是否包含至少一个经转义译码样本的语法元素的群组的语法元素指示当前视频数据块确实包含至少一个转义样本。作为另一实例,视频编码器20可不编码相关于当前视频数据块的差异QP及/或色度QP偏移的一或多个语法元素,其中指示当前视频数据块是否包含至少一个经转义译码样本的语法元素的群组的语法元素指示当前视频数据块并不包含至少一个转义样本。
应认识到,取决于实例,本文中所描述的技术中的任一个的某些动作或事件可以不同序列执行、可添加、合并或完全省略所述动作或事件(例如,并非所有所描述动作或事件对于所述技术的实践是必要的)。此外,在某些实例中,可(例如)经由多线程处理、中断处理或多个处理器同时而非依序执行动作或事件。另外,虽然出于清晰目的,本发明的某些方面被描述为由单一模块或单元执行,但应理解,本发明的技术可由与视频译码器相关联的单元或模块的组合来执行。
出于说明目的,本发明的某些方面已关于开发HEVC标准而进行描述。然而,本发明中所描述的技术可适用于其它视频译码程序,包含尚未开发的其它标准或专有视频译码程序。
上文所描述的技术可由视频编码器20(图1及2)及/或视频解码器30(图1及3)执行,所述两者通常可被称作视频译码器。同样地,视频译码可指视频编码或视频解码(在适用时)。
虽然在上文描述技术的各种方面的特定组合,但提供此些组合仅为了说明本发明中所描述的技术的实例。因此,本发明的技术不应限于此些实例组合且可涵盖本发明中所描述的技术的各种方面的任何可设想组合。
在一或多个实例中,所描述的功能可以硬件、软件、固件或其任何组合来实施。如果以软件实施,那么所述功能可作为一或多个指令或代码而在计算机可读媒体上存储或发射,且由基于硬件的处理单元执行。计算机可读媒体可包含计算机可读存储媒体,其对应于有形媒体,例如数据存储媒体,或包含促进将计算机程式从一处传送到另一处(例如,根据通信协议)的任何媒体的通信媒体。以此方式,计算机可读媒体大体可对应于(1)为非暂时性的有形计算机可读存储媒体,或(2)例如信号或载波的通信媒体。数据存储媒体可为可由一或多个计算机或一或多个处理器存取以检索用于实施本发明中所描述的技术的指令、代码及/或数据结构的任何可用媒体。计算机程式产品可包含计算机可读媒体。
作为实例而非限制,此些计算机可读存储媒体可包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储器、磁盘存储器或其它磁性存储装置、快闪存储器或可用以存储呈指令或数据结构形式的所要程序代码且可由计算机存取的任何其它媒体。而且,任何连接适当地称为计算机可读媒体。举例来说,如果使用同轴缆线、光缆、双绞线、数字用户线(DSL)或无线技术(例如红外线、无线电及微波)从网站、服务器或其它远程源发射指令,那么同轴缆线、光缆、双绞线、DSL或无线技术(例如红外线、无线电及微波)包含在媒体的定义中。然而,应理解,计算机可读存储媒体及数据存储媒体不包含连接、载波、信号或其它暂时性媒体,而是实际上关于非暂时性有形存储媒体。如本文中所使用,磁盘及光盘包含光盘(CD)、激光光盘、光学光盘、数字多功能光盘(DVD)、软盘及蓝光光盘,其中磁盘通常以磁性方式再现数据,而光盘使用激光以光学方式再现数据。以上组合还应包含在计算机可读媒体的范围内。
可由例如一或多个数字信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、现场可编程逻辑阵列(FPGA)或其它等效集成式或离散逻辑电路的一或多个处理器来执行指令。因此,如本文中所使用的术语“处理器”可指上述结构或适合于实施本文中所描述的技术的任何其它结构中的任一个。另外,在一些方面中,本文中所描述的功能性可提供在经配置用于编码及解码的专用硬件及/或软件模块内,或并入在组合式编码解码器中。而且,所述技术可完全实施在一或多个电路或逻辑元件中。
本发明的技术可在多种装置或设备中实施,所述装置或设备包含无线手持机、集成电路(IC)或IC的集合(例如,芯片集合)。本发明中描述各种组件、模块或单元以强调经配置以执行所公开技术的装置的功能方面,但未必要求由不同硬件单元来实现。实情为,如上文所描述,可将各种单元组合在编码解码器硬件单元中,或由互操作性硬件单元(包含如上文所描述的一或多个处理器)的集合结合合适的软件及/或固件来提供所述单元。
已描述各种实例。此些及其它实例是在以下权利要求书的范围内。

Claims (30)

1.一种解码视频数据的方法,所述方法包括:
从经译码视频位流解码指示是否将转置程序应用于当前视频数据块的调色盘的调色盘索引的语法元素;
从所述经译码视频位流且在所述经译码视频位流中的在指示是否将所述转置程序应用于所述当前视频数据块的所述调色盘的调色盘索引的所述语法元素之后的位置处,解码相关于所述当前视频数据块的差异量化参数QP及/或色度QP偏移的一或多个语法元素;及
基于用于所述当前视频数据块的所述调色盘及相关于所述当前视频数据块的差异QP及/或色度QP偏移的所述一或多个语法元素来解码所述当前视频数据块。
2.根据权利要求1所述的方法,其中:
解码指示是否将所述转置程序应用于所述当前视频数据块的调色盘索引的所述语法元素包括使用上下文自适应性二进制算术译码CABAC与上下文来解码指示是否将所述转置程序应用于所述当前视频数据块的调色盘索引的所述语法元素,且
解码相关于差异QP及/或色度QP偏移的所述一或多个语法元素包括使用CABAC与上下文来解码相关于差异QP及/或色度QP偏移的所述一或多个语法元素。
3.根据权利要求1所述的方法,其中指示是否将所述转置程序应用于所述当前视频数据块的调色盘索引的所述语法元素包括palette_transpose_flag语法元素。
4.根据权利要求1所述的方法,其中相关于差异QP的所述一或多个语法元素包括以下中的一个或两个:指示所述当前块的QP与所述当前块的所述QP的预测因子之间的差的绝对值的语法元素;及指示所述当前块的所述QP与所述当前块的所述QP的所述预测因子之间的所述差的正负号的语法元素。
5.根据权利要求1所述的方法,其中相关于色度QP偏移的所述一或多个语法元素包括以下中的一个或两个:指示是否将一或多个偏移列表中的项目添加到所述当前块的明度QP以确定所述当前块的色度QP的语法元素;及指示被添加到所述当前块的所述明度QP以确定所述当前块的所述色度QP的所述一或多个偏移列表中的每一个中的项目的索引的语法元素。
6.根据权利要求1所述的方法,其进一步包括:
使用旁通模式而从所述经译码视频位流解码语法元素的群组,其中所述群组包括以下中的一或多个:
指示先于阵列中的非零项目的零的数目的一或多个语法元素,所述阵列指示是否将来自预测因子调色盘的项目再用于所述当前调色盘中,
指示经明确地发信的所述当前调色盘中的项目的数目的语法元素,
各自指示所述当前调色盘中的项目中的分量的值的一或多个语法元素,
指示所述当前视频数据块是否包含至少一个经转义译码样本的语法元素,
指示经明确地发信或推断的所述当前调色盘中的索引的数目的语法元素,及
指示当前调色盘项目的阵列中的索引的一或多个语法元素。
7.根据权利要求6所述的方法,其中以下中的一或多个:
指示先于阵列中的非零项目的零的数目的所述一或多个语法元素包括一或多个palette_predictor_run语法元素,所述阵列指示是否将来自预测因子调色盘的项目再用于所述当前调色盘中,
指示经明确地发信的所述当前调色盘中的项目的数目的所述语法元素包括num_signalled_palette_entries语法元素,
各自指示所述当前调色盘中的项目中的分量的值的所述一或多个语法元素包括一或多个palette_entry语法元素,
指示所述当前视频数据块是否包含至少一个经转义译码样本的所述语法元素包括palette_escape_val_present_flag,
指示经明确地发信或推断的所述当前调色盘中的索引的数目的所述语法元素包括num_palette_indices_idc语法元素,且
指示当前调色盘项目的阵列中的索引的所述一或多个语法元素包括一或多个palette_index_idc语法元素。
8.根据权利要求6所述的方法,其中解码语法元素的所述群组包括在所述经译码视频位流中的在指示是否将所述转置程序应用于所述当前视频数据块的调色盘索引的所述语法元素之前的位置处,从所述经译码视频位流解码语法元素的所述群组。
9.根据权利要求6所述的方法,其进一步包括:
从所述经译码视频位流,在使用旁通模式译码的语法元素的所述群组之后解码指示游程类型旗标在所述当前视频数据块内的最后出现的语法元素。
10.根据权利要求9所述的方法,其中解码指示游程类型旗标在所述当前视频数据块内的所述最后出现的所述语法元素包括使用上下文自适应性二进制算术译码CABAC与上下文来解码指示游程类型旗标在所述当前视频数据块内的所述最后出现的所述语法元素。
11.一种编码视频数据的方法,所述方法包括:
在经译码视频位流中编码指示是否将转置程序应用于当前视频数据块的调色盘的调色盘索引的语法元素;
在所述经译码视频位流中且在所述经译码视频位流中的在指示是否将所述转置程序应用于所述当前视频数据块的所述调色盘的调色盘索引的所述语法元素之后的位置处,编码相关于所述当前视频数据块的差异量化参数QP及/或色度QP偏移的一或多个语法元素;及
基于用于所述当前视频数据块的所述调色盘及相关于所述当前视频数据块的差异QP及/或色度QP偏移的所述一或多个语法元素来编码所述当前视频数据块。
12.根据权利要求11所述的方法,其中:
编码指示是否将所述转置程序应用于所述当前视频数据块的调色盘索引的所述语法元素包括使用上下文自适应性二进制算术译码CABAC与上下文来编码指示是否将所述转置程序应用于所述当前视频数据块的调色盘索引的所述语法元素,且
编码相关于差异QP及/或色度QP偏移的所述一或多个语法元素包括使用CABAC与上下文来编码相关于差异QP及/或色度QP偏移的所述一或多个语法元素。
13.根据权利要求11所述的方法,其中指示是否将所述转置程序应用于所述当前视频数据块的调色盘索引的所述语法元素包括palette_transpose_flag语法元素。
14.根据权利要求11所述的方法,其中相关于差异QP的所述一或多个语法元素包括以下中的一个或两个:指示所述当前块的QP与所述当前块的所述QP的预测因子之间的差的绝对值的语法元素;及指示所述当前块的所述QP与所述当前块的所述QP的所述预测因子之间的所述差的正负号的语法元素。
15.根据权利要求11所述的方法,其中相关于色度QP偏移的所述一或多个语法元素包括以下中的一个或两个:指示是否将一或多个偏移列表中的项目添加到所述当前块的明度QP以确定所述当前块的色度QP的语法元素;及指示被添加到所述当前块的所述明度QP以确定所述当前块的所述色度QP的所述一或多个偏移列表中的每一个中的项目的索引的语法元素。
16.根据权利要求11所述的方法,其进一步包括:
使用旁通模式而在所述经译码视频位流中编码语法元素的群组,其中所述群组包括以下中的一或多个:
指示先于阵列中的非零项目的零的数目的一或多个语法元素,所述阵列指示是否将来自预测因子调色盘的项目再用于所述当前调色盘中,
指示经明确地发信的所述当前调色盘中的项目的数目的语法元素,
各自指示所述当前调色盘中的项目中的分量的值的一或多个语法元素,
指示所述当前视频数据块是否包含至少一个经转义译码样本的语法元素,
指示经明确地发信或推断的所述当前调色盘中的索引的数目的语法元素,及
指示当前调色盘项目的阵列中的索引的一或多个语法元素。
17.根据权利要求16所述的方法,其中以下中的一或多个:
指示先于阵列中的非零项目的零的数目的所述一或多个语法元素包括一或多个palette_predictor_run语法元素,所述阵列指示是否将来自预测因子调色盘的项目再用于所述当前调色盘中,
指示经明确地发信的所述当前调色盘中的项目的数目的所述语法元素包括num_signalled_palette_entries语法元素,
各自指示所述当前调色盘中的项目中的分量的值的所述一或多个语法元素包括一或多个palette_entry语法元素,
指示所述当前视频数据块是否包含至少一个经转义译码样本的所述语法元素包括palette_escape_val_present_flag,
指示经明确地发信或推断的所述当前调色盘中的索引的数目的所述语法元素包括num_palette_indices_minus1语法元素,且
指示当前调色盘项目的阵列中的索引的所述一或多个语法元素包括一或多个palette_index_idc语法元素。
18.根据权利要求16所述的方法,其中编码语法元素的所述群组包括在所述经译码视频位流中,在所述经译码视频位流中的在指示是否将所述转置程序应用于所述当前视频数据块的调色盘索引的所述语法元素之前的位置处编码语法元素的所述群组。
19.根据权利要求16所述的方法,其进一步包括:
在所述经译码视频位流中,在使用旁通模式译码的语法元素的所述群组之后编码指示游程类型旗标在所述当前视频数据块内的最后出现的语法元素。
20.根据权利要求19所述的方法,其中编码指示游程类型旗标在所述当前视频数据块内的所述最后出现的所述语法元素包括使用上下文自适应性二进制算术译码CABAC与上下文来编码指示游程类型旗标在所述当前视频数据块内的所述最后出现的所述语法元素。
21.一种用于编码或解码视频数据的装置,所述装置包括:
存储器,其经配置以存储视频数据;
一或多个处理器,其经配置以:
在经译码视频位流中编码或解码指示是否将转置程序应用于当前视频数据块的调色盘的调色盘索引的语法元素;
在所述经译码视频位流中且在所述经译码视频位流中的在指示是否将所述转置程序应用于所述当前视频数据块的所述调色盘的调色盘索引的所述语法元素之后的位置处,编码或解码相关于所述当前视频数据块的差异量化参数QP及/或色度QP偏移的一或多个语法元素;及
基于用于所述当前视频数据块的所述调色盘及相关于所述当前视频数据块的差异QP及/或色度QP偏移的所述一或多个语法元素来编码或解码所述当前视频数据块。
22.根据权利要求21所述的装置,其中:
为了编码或解码指示是否将所述转置程序应用于所述当前视频数据块的调色盘索引的所述语法元素,所述一或多个处理器经配置以使用上下文自适应性二进制算术译码CABAC与上下文来编码或解码指示是否将所述转置程序应用于所述当前视频数据块的调色盘索引的所述语法元素,且
为了编码或解码相关于差异QP及/或色度QP偏移的所述一或多个语法元素,所述一或多个处理器经配置以使用CABAC与上下文来编码或解码相关于差异QP及/或色度QP偏移的所述一或多个语法元素。
23.根据权利要求21所述的装置,其中指示是否将所述转置程序应用于所述当前视频数据块的调色盘索引的所述语法元素包括palette_transpose_flag语法元素。
24.根据权利要求21所述的装置,其中所述一或多个处理器经进一步配置以:
使用旁通模式而在所述经译码视频位流中编码或解码语法元素的群组,其中所述群组包括以下中的一或多个:
指示先于阵列中的非零项目的零的数目的一或多个语法元素,所述阵列指示是否将来自预测因子调色盘的项目再用于所述当前调色盘中,
指示经明确地发信的所述当前调色盘中的项目的数目的语法元素,
各自指示所述当前调色盘中的项目中的分量的值的一或多个语法元素,
指示所述当前视频数据块是否包含至少一个经转义译码样本的语法元素,
指示经明确地发信或推断的所述当前调色盘中的索引的数目的语法元素,及
指示当前调色盘项目的阵列中的索引的一或多个语法元素。
25.根据权利要求24所述的装置,其中以下中的一或多个:
指示先于阵列中的非零项目的零的数目的所述一或多个语法元素包括一或多个palette_predictor_run语法元素,所述阵列指示是否将来自预测因子调色盘的项目再用于所述当前调色盘中,
指示经明确地发信的所述当前调色盘中的项目的数目的所述语法元素包括num_signalled_palette_entries语法元素,
各自指示所述当前调色盘中的项目中的分量的值的所述一或多个语法元素包括一或多个palette_entry语法元素,
指示所述当前视频数据块是否包含至少一个经转义译码样本的所述语法元素包括palette_escape_val_present_flag,
指示经明确地发信或推断的所述当前调色盘中的项目的数目的所述语法元素包括num_palette_indices_minus1语法元素,且
指示当前调色盘项目的阵列中的索引的所述一或多个语法元素包括一或多个palette_index_idc语法元素。
26.根据权利要求24所述的装置,其中为了编码或解码语法元素的所述群组,所述一或多个处理器经配置以在所述经译码视频位流中,在所述经译码视频位流中的在指示是否将所述转置程序应用于所述当前视频数据块的调色盘索引的所述语法元素之前的位置处编码或解码语法元素的所述群组。
27.根据权利要求24所述的装置,其中所述一或多个处理器经进一步配置以:
在所述经译码视频位流中,在使用旁通模式译码的语法元素的所述群组之后编码或解码指示游程类型旗标在所述当前视频数据块内的最后出现的语法元素。
28.根据权利要求27所述的装置,其中为了编码或解码指示游程类型旗标在所述当前视频数据块内的所述最后出现的所述语法元素,所述一或多个处理器经配置以使用上下文自适应性二进制算术译码CABAC与上下文来编码或解码指示游程类型旗标在所述当前视频数据块内的所述最后出现的所述语法元素。
29.一种用于解码视频数据的装置,所述装置包括:
用于从经译码视频位流解码指示是否将转置程序应用于当前视频数据块的调色盘的调色盘索引的语法元素的装置;
用于从所述经译码视频位流且在所述经译码视频位流中的在指示是否将所述转置程序应用于所述当前视频数据块的所述调色盘的调色盘索引的所述语法元素之后的位置处,解码相关于所述当前视频数据块的差异量化参数QP及/或色度QP偏移的一或多个语法元素的装置;及
用于基于用于所述当前视频数据块的所述调色盘及相关于所述当前视频数据块的差异QP及/或色度QP偏移的所述一或多个语法元素来解码所述当前视频数据块的装置。
30.一种计算机可读存储媒体,其存储当由视频解码装置处理时会致使所述视频解码装置的一或多个处理器进行以下操作的经译码视频位流的至少一部分:
确定是否将转置程序应用于当前视频数据块的调色盘的调色盘索引;且
基于用于所述当前视频数据块的所述调色盘及所述当前视频数据块的差异量化参数QP及一或多个色度QP偏移来解码所述视频数据的所述当前块,
其中相关于所述差异QP的一或多个语法元素及相关于所述当前视频数据块的所述一或多个色度QP偏移的一或多个语法元素位于在所述经译码视频位流中在指示是否将所述转置程序应用于所述当前视频数据块的所述调色盘的调色盘索引的语法元素之后的位置处。
CN201680033638.2A 2015-06-12 2016-06-09 用于译码视频数据的方法和装置及计算机可读存储介质 Active CN107710765B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201562175137P 2015-06-12 2015-06-12
US62/175,137 2015-06-12
US15/177,201 2016-06-08
US15/177,201 US11146788B2 (en) 2015-06-12 2016-06-08 Grouping palette bypass bins for video coding
PCT/US2016/036572 WO2016201032A1 (en) 2015-06-12 2016-06-09 Grouping palette bypass bins for video coding

Publications (2)

Publication Number Publication Date
CN107710765A true CN107710765A (zh) 2018-02-16
CN107710765B CN107710765B (zh) 2020-10-09

Family

ID=56148736

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201680033638.2A Active CN107710765B (zh) 2015-06-12 2016-06-09 用于译码视频数据的方法和装置及计算机可读存储介质

Country Status (22)

Country Link
US (1) US11146788B2 (zh)
EP (1) EP3308542B1 (zh)
JP (1) JP6771493B2 (zh)
KR (1) KR102600210B1 (zh)
CN (1) CN107710765B (zh)
AU (1) AU2016276687B2 (zh)
BR (1) BR112017026591A2 (zh)
CA (1) CA2985484A1 (zh)
CL (1) CL2017003125A1 (zh)
CO (1) CO2017012619A2 (zh)
ES (1) ES2751576T3 (zh)
HK (1) HK1245544A1 (zh)
HU (1) HUE049589T2 (zh)
IL (1) IL255439B (zh)
MX (1) MX2017016049A (zh)
MY (1) MY189186A (zh)
PH (1) PH12017502250A1 (zh)
RU (1) RU2706877C2 (zh)
SA (1) SA517390502B1 (zh)
TW (1) TWI759265B (zh)
WO (1) WO2016201032A1 (zh)
ZA (1) ZA201708380B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020177072A1 (en) * 2019-03-05 2020-09-10 Zte Corporation Cross-component quantization in video coding
CN113508585A (zh) * 2019-03-13 2021-10-15 高通股份有限公司 用于视频译码中的调色板语法的分组译码
CN113826388A (zh) * 2019-03-12 2021-12-21 弗劳恩霍夫应用研究促进协会 用于混合视频编码的编码器、解码器、方法及视频比特流以及计算机程序
CN114402615A (zh) * 2020-04-13 2022-04-26 腾讯美国有限责任公司 用于视频编码的方法和设备

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6122516B2 (ja) * 2015-01-28 2017-04-26 財團法人工業技術研究院Industrial Technology Research Institute エンコーディング方法及びエンコーダ
WO2016200100A1 (ko) * 2015-06-10 2016-12-15 삼성전자 주식회사 적응적 가중치 예측을 위한 신택스 시그널링을 이용하여 영상을 부호화 또는 복호화하는 방법 및 장치
US10694202B2 (en) * 2016-12-01 2020-06-23 Qualcomm Incorporated Indication of bilateral filter usage in video coding
TWI635742B (zh) * 2017-01-09 2018-09-11 晨星半導體股份有限公司 動態影像編碼裝置及動態影像編碼方法
EP3425911A1 (en) 2017-07-06 2019-01-09 Thomson Licensing A method and a device for picture encoding and decoding
CN108833937B (zh) * 2018-05-30 2021-03-23 华为技术有限公司 视频处理方法和装置
CN113475077B (zh) * 2019-02-24 2023-11-17 北京字节跳动网络技术有限公司 调色板模式使用指示的独立编解码
US11423642B2 (en) * 2019-03-01 2022-08-23 Tencent America LLC Method and apparatus for point cloud compression
CN113711604B (zh) 2019-04-20 2023-10-27 北京字节跳动网络技术有限公司 视频编解码中色度和亮度语法元素的信令
CN113785574B (zh) 2019-05-30 2022-10-11 北京字节跳动网络技术有限公司 色度分量的自适应环路滤波
US11210813B2 (en) * 2019-05-30 2021-12-28 Tencent America LLC Method and apparatus for point cloud compression
KR20240024349A (ko) * 2019-07-05 2024-02-23 엘지전자 주식회사 영상 디코딩 방법 및 그 장치
CN117459744A (zh) * 2019-07-20 2024-01-26 北京字节跳动网络技术有限公司 调色板模式使用指示的条件相关编解码
CA3148417A1 (en) 2019-07-21 2021-01-28 Lg Electronics Inc. Image encoding/decoding method and device for signaling chroma component prediction information according to whether palette mode is applicable, and method for transmitting bitstream
KR20220044278A (ko) 2019-08-15 2022-04-07 바이트댄스 아이엔씨 상이한 분할 구조들을 갖는 팔레트 모드
EP4000263A4 (en) 2019-08-15 2022-09-07 ByteDance Inc. ENTROPIC CODING FOR VANE ESCAPE SYMBOL
JP2022548737A (ja) * 2019-09-19 2022-11-21 バイトダンス インコーポレイテッド パレット・モードのための量子化パラメータ導出
WO2021055114A1 (en) * 2019-09-20 2021-03-25 Alibaba Group Holding Limited Method and system for signaling chroma quantization parameter offset
KR20220071268A (ko) * 2019-11-05 2022-05-31 엘지전자 주식회사 팔레트 코딩 또는 변환 유닛을 위한 양자화 파라미터 정보 기반 영상 또는 비디오 코딩
US20220408104A1 (en) * 2019-11-05 2022-12-22 Lg Electronics Inc. Image or video coding based on chroma quantization parameter offset information
US20220408093A1 (en) * 2019-11-05 2022-12-22 Lg Electronics Inc. Video decoding method and device for coding chroma quantization parameter offset-related information
WO2021091265A1 (ko) * 2019-11-05 2021-05-14 엘지전자 주식회사 양자화 파라미터 오프셋 관련 정보의 시그널링 기반 영상 또는 비디오 코딩
US20220368907A1 (en) * 2019-11-05 2022-11-17 Lg Electronics Inc. Image or video coding based on signaling of quantization parameter-related information
WO2021091261A1 (ko) * 2019-11-05 2021-05-14 엘지전자 주식회사 양자화 관련 정보 기반 영상 또는 비디오 코딩
WO2021112651A1 (ko) * 2019-12-05 2021-06-10 한국전자통신연구원 팔레트 모드를 사용하는 영상 부호화/복호화를 위한 방법, 장치 및 기록 매체

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101217668A (zh) * 2008-01-14 2008-07-09 浙江大学 基于块分类的混合图像压缩方法
US20100214577A1 (en) * 2009-02-23 2010-08-26 Owen James E Encoding of non-indexed data for printing using indexed rgb
CN104221374A (zh) * 2012-04-11 2014-12-17 高通股份有限公司 在视频译码中分群经旁路译码语法元素

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6748116B1 (en) 2000-08-22 2004-06-08 Airzip, Inc. Apparatus and method for compressing and decompressing image files
US7346009B2 (en) 2002-09-30 2008-03-18 Mosaid Technologies, Inc. Dense mode coding scheme
WO2007148909A1 (en) 2006-06-19 2007-12-27 Lg Electronics, Inc. Method and apparatus for processing a vedeo signal
CN101888555B (zh) 2006-11-17 2013-04-03 Lg电子株式会社 用于解码/编码视频信号的方法及装置
TWI341657B (en) 2007-04-03 2011-05-01 Nat Univ Tsing Hua Cabac decoding method
US8023562B2 (en) 2007-09-07 2011-09-20 Vanguard Software Solutions, Inc. Real-time video coding/decoding
US7733245B2 (en) 2008-06-25 2010-06-08 Aclara Power-Line Systems Inc. Compression scheme for interval data
KR101750046B1 (ko) 2010-04-05 2017-06-22 삼성전자주식회사 트리 구조에 따른 부호화 단위에 기반한 인루프 필터링을 수반하는 비디오 부호화 방법과 그 장치 및 복호화 방법과 그 장치
US9055305B2 (en) 2011-01-09 2015-06-09 Mediatek Inc. Apparatus and method of sample adaptive offset for video coding
KR101526349B1 (ko) 2010-10-05 2015-06-05 미디어텍 인크. 영역 기반의 적응 루프 필터링의 방법 및 장치
US8861617B2 (en) 2010-10-05 2014-10-14 Mediatek Inc Method and apparatus of region-based adaptive loop filtering
US10244239B2 (en) 2010-12-28 2019-03-26 Dolby Laboratories Licensing Corporation Parameter set for picture segmentation
US20120230418A1 (en) 2011-03-08 2012-09-13 Qualcomm Incorporated Coding of transform coefficients for video coding
US20120294353A1 (en) 2011-05-16 2012-11-22 Mediatek Inc. Apparatus and Method of Sample Adaptive Offset for Luma and Chroma Components
EP2988511A1 (en) 2011-08-04 2016-02-24 MediaTek Inc. Method and apparatus for reordered binarization of syntax elements in cabac
US10129540B2 (en) 2012-04-10 2018-11-13 Texas Instruments Incorporated Reduced complexity coefficient transmission for adaptive loop filtering (ALF) in video coding
US9584802B2 (en) 2012-04-13 2017-02-28 Texas Instruments Incorporated Reducing context coded and bypass coded bins to improve context adaptive binary arithmetic coding (CABAC) throughput
WO2013177975A1 (en) 2012-05-29 2013-12-05 Mediatek Inc. Method and apparatus for coding of sample adaptive offset information
WO2014084108A1 (ja) 2012-11-30 2014-06-05 ソニー株式会社 画像処理装置および方法
US9912942B2 (en) 2012-12-28 2018-03-06 Qualcomm Incorporated High-frequency-pass sample adaptive offset in video coding
US11259020B2 (en) 2013-04-05 2022-02-22 Qualcomm Incorporated Determining palettes in palette-based video coding
US9558567B2 (en) 2013-07-12 2017-01-31 Qualcomm Incorporated Palette prediction in palette-based video coding
US10009632B2 (en) 2014-03-05 2018-06-26 Qualcomm Incorporated Flicker detection and mitigation in video coding
CN104104951B (zh) 2014-07-30 2017-05-03 北京邮电大学 Hevc中屏幕内容编码的码率控制方法
EP3219099B1 (en) * 2014-12-19 2021-04-28 HFI Innovation Inc. Methods of palette based prediction for non-444 color format in video and image coding
WO2016123388A1 (en) * 2015-01-29 2016-08-04 Vid Scale, Inc. Palette coding modes and palette flipping
CN107431824B (zh) 2015-04-08 2020-10-02 寰发股份有限公司 视频编解码中调色板模式上下文编解码和二值化的方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101217668A (zh) * 2008-01-14 2008-07-09 浙江大学 基于块分类的混合图像压缩方法
US20100214577A1 (en) * 2009-02-23 2010-08-26 Owen James E Encoding of non-indexed data for printing using indexed rgb
CN104221374A (zh) * 2012-04-11 2014-12-17 高通股份有限公司 在视频译码中分群经旁路译码语法元素

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
JOSHI R: "HEVC Screen Content Coding Draft Text 1", 《JOINT COLLABORATIVE TEAM ON VIDEO CODING OF ISO/IEC JTC1/SC29/WG11 AND ITU-T SG.16》 *
JOSHI R: "HEVC Screen Content Coding Draft Text 3", 《JOINT COLLABORATIVE TEAM ON VIDEO CODING OF ISO/IEC JTC1/SC29/WG11 AND ITU-T SG.16》 *
SOLE J: "Non-CE6:Delta QP signalling for palette", 《JOINT COLLABORATIVE TEAM ON VIDEO CODING OF ISO/IEC JTC1/SC29/WG11 AND ITU-T SG.16》 *
YE J: "CE1-related: Palette Mode Context and Codeword Simplification", 《JOINT COLLABORATIVE TEAM ON VIDEO CODING OF ISO/IEC JTC1/SC29/WG11 AND ITU-T SG.16》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020177072A1 (en) * 2019-03-05 2020-09-10 Zte Corporation Cross-component quantization in video coding
CN113826388A (zh) * 2019-03-12 2021-12-21 弗劳恩霍夫应用研究促进协会 用于混合视频编码的编码器、解码器、方法及视频比特流以及计算机程序
CN113508585A (zh) * 2019-03-13 2021-10-15 高通股份有限公司 用于视频译码中的调色板语法的分组译码
CN114402615A (zh) * 2020-04-13 2022-04-26 腾讯美国有限责任公司 用于视频编码的方法和设备

Also Published As

Publication number Publication date
ES2751576T3 (es) 2020-04-01
TWI759265B (zh) 2022-04-01
US11146788B2 (en) 2021-10-12
TW201703525A (zh) 2017-01-16
CL2017003125A1 (es) 2018-05-18
JP2018524873A (ja) 2018-08-30
CO2017012619A2 (es) 2018-01-05
IL255439A0 (en) 2017-12-31
BR112017026591A2 (pt) 2018-08-14
US20160373745A1 (en) 2016-12-22
AU2016276687A1 (en) 2017-11-30
SA517390502B1 (ar) 2020-06-16
EP3308542B1 (en) 2019-07-24
RU2017142953A (ru) 2019-07-12
HUE049589T2 (hu) 2020-09-28
IL255439B (en) 2020-09-30
RU2706877C2 (ru) 2019-11-21
NZ737096A (en) 2021-11-26
ZA201708380B (en) 2022-11-30
KR20180018532A (ko) 2018-02-21
AU2016276687B2 (en) 2019-12-12
JP6771493B2 (ja) 2020-10-21
EP3308542A1 (en) 2018-04-18
PH12017502250A1 (en) 2018-06-11
KR102600210B1 (ko) 2023-11-08
RU2017142953A3 (zh) 2019-09-24
CA2985484A1 (en) 2016-12-15
MY189186A (en) 2022-01-31
WO2016201032A1 (en) 2016-12-15
MX2017016049A (es) 2018-02-21
CN107710765B (zh) 2020-10-09
HK1245544A1 (zh) 2018-08-24

Similar Documents

Publication Publication Date Title
CN107710765A (zh) 分组用于视频译码的调色盘旁通槽
CN106537916B (zh) 编码和解码视频数据的方法和装置及计算机可读存储介质
CN106464915B (zh) 基于调色板的视频译码中的最大调色板参数
CN106464884B (zh) 基于调色板的视频译码中的译码行程
CN106464883B (zh) 基于调色板的视频译码中的逃脱样本译码方法、装置及设备
CN106416249B (zh) 用于编码/解码视频数据的方法和装置
CN105264891B (zh) 一种对视频数据进行解码、编码的方法及装置
CN106717004B (zh) 视频译码中的跨分量预测和自适应色彩变换的协调
CN108028940A (zh) 调色板模式视频译码中转义像素信号值的限制
CN105075270B (zh) 在视频译码中停用正负号数据隐藏
CN104054347B (zh) 在视频译码中波前平行处理的使用的指示
CN103959785B (zh) 在视频译码中用于色度分量的变换单位分割
CN110100436A (zh) 使用导出色度模式译码视频数据
CN107113436A (zh) 用于次取样格式的调色模式
CN106464877A (zh) 在视频译码中确定将解块滤波应用于经调色板译码块
CN107409215A (zh) 用于视频译码的调色板模式译码
CN110100439A (zh) 用于视频译码的帧内预测技术
CN108141605A (zh) 帧内块复制合并模式及不可用帧内块复制参考区域的填充
CN106559669A (zh) 图像预测的方法及装置
CN108464001A (zh) 用于视频译码的多类型树框架
CN107925764A (zh) 视频译码中的系数等级译码
CN107211148A (zh) 在视频译码中调色板块大小的限制
CN106471809A (zh) 视频译码中的单一色彩调色板模式
CN107409209A (zh) 用于线性模型预测模式的降取样处理
CN106105207A (zh) 用于视频译码的具有行程长度码的调色板预测器信令

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1245544

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant