CN107113436A - 用于次取样格式的调色模式 - Google Patents

用于次取样格式的调色模式 Download PDF

Info

Publication number
CN107113436A
CN107113436A CN201580067697.7A CN201580067697A CN107113436A CN 107113436 A CN107113436 A CN 107113436A CN 201580067697 A CN201580067697 A CN 201580067697A CN 107113436 A CN107113436 A CN 107113436A
Authority
CN
China
Prior art keywords
pixel
current block
component
color value
color
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201580067697.7A
Other languages
English (en)
Other versions
CN107113436B (zh
Inventor
瑞珍·雷克斯曼·乔许
瓦迪姆·谢廖金
濮伟
罗哈斯 霍埃尔·索赖
马尔塔·卡切维奇
邹锋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of CN107113436A publication Critical patent/CN107113436A/zh
Application granted granted Critical
Publication of CN107113436B publication Critical patent/CN107113436B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/182Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • H04N19/45Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder performing compensation of the inverse transform mismatch, e.g. Inverse Discrete Cosine Transform [IDCT] mismatch
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/587Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal sub-sampling or interpolation, e.g. decimation or subsequent interpolation of pictures in a video sequence
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/93Run-length coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding

Abstract

本发明描述用以将调色模式译码技术扩展到色度分量处于与明度分量不同的分辨率的情况的技术。调色表的条目包含三个颜色值,且所述三个颜色值或所述三个颜色值中的单一者是基于像素包含明度分量和色度分量两者还是仅包含明度分量而选择。

Description

用于次取样格式的调色模式
本申请案主张2014年12月19日申请的美国临时申请案第62/094,737号的权益,所述申请案的全部内容在此以其全文引用的方式并入。
技术领域
本发明涉及视频编码和解码。
背景技术
数字视频能力可并入到广泛范围的装置中,包含数字电视、数字直播系统、无线广播系统、个人数字助理(PDA)、膝上型或桌面计算机、平板计算机、电子书阅读器、数码相机、数字记录装置、数字媒体播放器、视频游戏装置、视频游戏控制面板、蜂窝式或卫星无线电电话(所谓的“智能电话”)、视频电话会议装置、视频流式传输装置及类似者。数字视频装置实施视频压缩技术,例如由MPEG-2、MPEG-4、ITU-T H.263、ITU-TH.264/MPEG-4第10部分高级视频译码(AVC)所定义的标准、目前正在开发的高效率视频译码(HEVC)标准及这些标准的扩展中所描述的那些视频压缩技术。视频装置可经由实施这些视频压缩技术而更有效地发射、接收、编码、解码和/或存储数字视频信息。
视频压缩技术执行空间(图片内)预测和/或时间(图片间)预测来减少或去除视频序列中固有的冗余。对于基于块的视频译码,可将视频切片(即,视频帧或视频帧的一部分)分割成视频块。图片的经帧内译码(I)切片中的视频块是使用相对于同一图片中的相邻块中的参考样本的空间预测来编码。图片的经帧间译码(P或B)切片中的视频块可使用相对于同一图片中的相邻块中的参考样本的空间预测或相对于其它参考图片中的参考样本的时间预测。空间或时间预测产生待译码的块的预测性块。残余数据表示待译码的原始块与预测性块之间的像素差。经帧间译码块是根据指向形成预测性块的参考样本的块的运动向量来编码,且残余数据指示经译码块与预测性块之间的差。根据帧内译码模式和残余数据来编码经帧内译码块。为进行进一步压缩,可将残余数据从像素域变换至变换域,从而产生可接着进行量化的残余变换系数。
发明内容
本发明描述用于调色模式译码的实例技术,其中色度分量的分辨率小于明度分量的分辨率。调色表的条目包含三个颜色值,一个颜色值用于明度分量及两个色度分量中的每一者。如果块的像素具有明度分量和两个色度分量,那么全部三个颜色值用于像素的调色模式译码。然而,如果块的像素仅具有明度分量而无色度分量,那么仅单个颜色值(例如,三个颜色值中的第一者)用于像素的调色模式译码。
在一个实例中,本发明描述一种解码视频数据的方法,所述方法包括:针对视频数据的当前块导出包含具有三个颜色值的条目的单个调色表;确定视频数据的当前块中的像素是否包含明度分量和色度分量;基于对当前块中的像素是否包含明度分量和色度分量的确定而确定待从单个调色表检索的颜色值的数目;及基于对待检索的颜色值的数目的确定来调色模式解码视频数据的当前块中的像素。
在一个实例中,本发明描述一种用于解码视频数据的装置,所述装置包括:存储器单元,其经配置以存储用于视频数据的当前块的包括具有三个颜色值的条目的调色表;及视频解码器,其经配置以:针对视频数据的当前块导出调色表且并未针对当前块导出其它调色表以供存储于存储器单元中;确定视频数据的当前块中的像素是否包含明度分量和色度分量;基于对当前块中的像素是否包含明度分量和色度分量的确定而确定待从调色表检索的颜色值的数目;及基于对待检索的颜色值的数目的确定来调色模式解码视频数据的当前块中的像素。
在一个实例中,本发明描述一种其上存储有指令的非暂时性计算机可读存储媒体,所述指令在经执行时引起用于解码视频数据的装置的一或多个处理器进行以下操作:针对视频数据的当前块导出包含具有三个颜色值的条目的单个调色表;确定视频数据的当前块中的像素是否包含明度分量和色度分量;基于对当前块中的像素是否包含明度分量和色度分量的确定而确定待从单个调色表检索的颜色值的数目;及基于对待检索的颜色值的数目的确定来调色模式解码视频数据的当前块中的像素。
在一个实例中,本发明描述一种用于解码视频数据的装置,所述装置包括:用于针对视频数据的当前块导出包含具有三个颜色值的条目的单个调色表的装置;用于确定视频数据的当前块中的像素是否包含明度分量和色度分量的装置;用于基于对当前块中的像素是否包含明度分量和色度分量的确定而确定待从单个调色表检索的颜色值的数目的装置;及用于基于对待检索的颜色值的数目的确定来调色模式解码视频数据的当前块中的像素的装置。
在一个实例中,本发明描述一种编码视频数据的方法,所述方法包括:确定视频数据的当前块中的像素将不基于单个调色表编码;确定视频数据的当前块中的像素是否包含明度分量和色度分量;基于对当前块中的像素是否包含明度分量和色度分量的确定而确定待在位流中传信的颜色值的数目;及基于颜色值的经确定数目在位流中针对像素传信用于重构建当前块的颜色值。
在一个实例中,本发明描述一种用于编码视频数据的装置,所述装置包括:存储器单元,其经配置以存储用于视频数据的当前块的调色表;及视频编码器,其经配置以:确定视频数据的当前块中的像素将不基于调色表编码;确定视频数据的当前块中的像素是否包含明度分量和色度分量;基于对当前块中的像素是否包含明度分量和色度分量的确定而确定待在位流中传信的颜色值的数目;及基于颜色值的经确定数目在位流中针对像素传信用于重构建当前块的颜色值。
在以下随附图式及描述中阐述一或多个实例的细节。其它特征、目标及优点将从所述描述及图式以及申请专利范围而显而易见。
附图说明
图1为绘示可利用本发明中所描述的技术的实例视频译码系统的框图。
图2为绘示可实施本发明中所描述的技术的实例视频编码器的框图。
图3为绘示可实施本发明中所描述的技术的实例视频解码器的框图。
图4为绘示确定用于基于调色的视频译码的调色盘条目的实例的概念图。
图5绘示调色预测的实例。
图6为绘示确定对用于像素的块的调色盘的索引的实例的概念图。
图7为绘示从先前经译码行复制调色索引的实例的概念图。
图8为绘示用于相位对准情况的4:2:0色度次取样格式的实例的概念图。
图9为绘示用于相位未对准情况的4:2:0色度次取样格式的实例的概念图。
图10为绘示解码视频数据的实例的流程图。
图11为绘示编码视频数据的实例的流程图。
具体实施方式
本发明描述用于视频译码和压缩的技术。特定来说,本发明描述用于视频数据的基于调色盘的视频译码的技术。在基于调色盘的视频译码中,视频译码器(例如,视频编码器或视频解码器)导出用于像素块的调色表,其中调色表中的每一条目包含经由索引识别到调色表中的颜色值。对于将调色模式译码技术应用到4:4:4取样格式的情况,针对块中的每一像素,存在三个颜色值:一个明度分量和两个色度分量。因此,调色表中的每一条目包含三个颜色值。
然而,可用使用非4:4:4取样格式的调色模式译码技术来增加译码效率。在非4:4:4取样格式中,例如在4:2:2或4:2:0取样格式中,色度分量可相对于明度分量经次取样。因此,对于非4:4:4取样格式,视频数据块中的一些像素包含全部三个颜色值:明度分量和两个色度分量,且视频数据块中的一些像素仅包含单一颜色值:明度分量。
本发明中所描述的技术描述使用用于非4:4:4取样格式的调色模式译码的方式。对于非4:4:4取样格式,视频译码器导出调色表且调色表中的每一条目包含三个颜色值。然而,检索全部三个颜色值还是三个颜色值中的单一颜色值基于视频数据块中的像素包含全部三个颜色值还是单一颜色值。如果像素仅包含单一颜色,那么检索单一颜色值。如果像素包括全部三个颜色,那么检索全部三个颜色值。
在一些实例中,基于调色的译码技术可经配置以与一或多个视频译码标准一起使用。最近,ITU-T视频译码专家组(VCEG)与ISO/IEC运动图片专家组(MPEG)的视频译码联合协作小组(JCT-VC)已定案新的视频译码标准的设计,即高效率视频译码(HEVC)“ITU-TH.265,H系列:视听与多媒体系统,移动视频的视听服务的基础设施—移动视频的译码,高效率视频译码(ITU-T H.265,Series H:Audiovisual and Multimedia Systems,Infrastructure of audiovisual services-Coding of moving video,High efficiencyvideo coding)”(国际电信联盟,2014年10月)。最新HEVC规格(被称作HEVC版本1)可从http://www.itu.int/rec/T-REC-H.265-201304-I获得。对HEVC的范围扩展(即HEVC-Rext)也正由JCT-VC开发。范围扩展的最近工作草案(WD)(被称作RExt WD7)可从http://phenix.int-evry.fr/jct/doc_end_user/documents/17_Valencia/wg11/JCTVC-Q1005-v4.zip获得。最近,JCT-VC已开始开发基于HEVC-Rext的屏幕内容译码(SCC)。屏幕内容译码(SCC)的工作草案在“好效率视频译码(HEVC)屏幕内容译码:草案2(High EfficiencyVideo Coding(HEVC)Screen Content Coding:Draft 2)”(JCTVC-S1005)中提供给Joshi等人、ITU-T SG 16WP 3与ISO/IEC JTC 1/SC 29/WG 11的视频译码联合协作小组(JCT-VC),且可从http://phenix.int-evry.fr/jct/doc_end_user/current_document.php?id=9793获得。
本发明中所描述的技术涉及具有(例如)HEVC扩展或其它屏幕内容相关的视频编解码器的屏幕内容译码(SCC)。常用国际视频译码标准包括ITU-T H.261、ISO/IEC MPEG-1视觉、ITU-T H.262或ISO/IEC MPEG-2视觉、ITU-T H.263、ISO/IEC MPEG-4视觉及ITU-TH.264(也称为ISO/IEC MPEG-4AVC)、高效率视频译码(HEVC)等。如上文所描述,对HEVC的屏幕内容译码扩展(称作SCC)正在开发中。如上文亦提及,包括调色模式描述的SCC的最新工作草案(WD)可在JCTVC-S1005“好效率视频译码(HEVC)屏幕内容译码:草案2(HighEfficiency Video Coding(HEVC)Screen Content Coding:Draft 2)”(ITU-T SG16WP3与ISO/IEC JTC 1/SC29/WG11的视频译码联合协作小组(JCT-VC)第18次会议:日本,札幌,2014年6月30日至7月9日)中获得。
在传统视频译码中,假定图像为连续色调且在空间上平滑的自然图像。基于这些假定,已开发不同工具,例如基于块的变换、过滤等,且这些工具已展示针对自然内容视频的良好性能。然而,在类似远程桌面计算机、协同工作和无线显示器的应用中,计算机产生的屏幕内容可为待压缩的主要内容。此类型的内容倾向于具有离散色调及特征尖锐线,以及高对比度的对象边界。连续色调及平滑度的假定可能不再适用,且因此,传统视频译码技术可能为压缩内容的低效率方式。
本发明描述基于调色的译码,其可特别适合于屏幕产生的内容译码。举例来说,假定视频数据的特定区域具有相对较小数目的颜色。视频译码器(视频编码器或视频解码器)可将所谓的“调色盘”译码为用于表示特定区域(例如,给定块)的视频数据的颜色表。每一像素可与表示像素的颜色(例如,明度及色度或仅明度,如下文更详细地描述)的调色盘中的条目相关联。举例来说,视频译码器可译码使像素值与调色盘中的适当值相关的索引。如本文所描述,调色盘条目索引可被称作调色盘索引或简称为索引。由此,在调色模式中,调色盘可包括经由表示可用作块样本的预测子或用作最终重构建的块样本的颜色值的索引编号的条目。调色盘中的每一条目取决于使用的特定颜色格式可含有一个颜色分量(例如,明度值)、两个颜色分量(例如,两个色度值)或三个颜色分量(例如,RGB、YUV或类似者)。如本发明中所描述,调色盘(也称作调色表)包含用于每一条目的三个颜色分量,但检索一个颜色分量还是全部三个颜色分量基于像素仅包含明度分量还是明度分量和色度分量的组合。
就HEVC构架来说,作为实例,基于调色盘的译码技术可经配置以用作译码单元(CU)模式。在其它实例中,基于调色盘的译码技术可经配置以用作HEVC的构架中的PU模式。因此,在CU模式的情境中描述的所有以下所公开的处理程序可另外或替代地适用于PU。然而,这些基于HEVC的实例不应被视为约束或限制本文中所描述的基于调色盘的译码技术,因而,这些技术可经应用以独立地或作为其它现有或尚待开发的系统/标准的部分工作。在这些情况下,用于调色盘译码的单元可为正方形块、矩形块或甚至非矩形形状区域。
使用调色译码模式,视频编码器可经由确定用于块的调色盘、定位调色盘中表示每一像素的值的条目及用像素的使像素值与调色盘相关的索引值编码调色盘来编码视频数据的块。视频解码器可从经编码位流获得用于块的调色盘,以及用于块的像素的索引值。视频解码器可使像素的索引值与调色盘的条目相关以重构建块的像素值。举例来说,调色盘的条目与调色盘索引一起可用于确定块的一或多个像素分量的值或“样本”。以上实例意欲提供基于调色盘的译码的一般描述。
本发明使用术语“信号”或“传信”来指示视频编码器将信息提供到视频解码器的方式。语法元素(或其它类型的数据)的传信不应被理解为意谓视频解码器立即从视频编码器接收经传信的信息;但是,其可为有可能的。在一些实例中,视频编码器可传信存储于存储装置中的信息(例如,语法元素或其它视频数据)。视频解码器可接着在稍后时间从存储装置检索信息。
在调色模式中,块的每一像素可用COPY_INDEX_MODE、COPY_ABOVE_MODE或ESCAPE模式来译码,除了可能块的起初行仅可能用COPY_INDEX_MODE或ESCAPE模式来译码。语法元素palette_run_type_flag指示使用COPY_INDEX_MODE还是COPY_ABOVE_MODE。在复制索引模式中(即,palette_run_type_flag等于COPY_INDEX_MODE),传信调色盘索引(即,语法元素palette_index),接着传信调色盘执行值palette_run。执行值指示将具有相同调色盘索引的后续像素的数目。在COPY_ABOVE_MODE中,仅可传信执行值,其指示从定位于当前像素正上方的像素复制调色盘索引的后续像素的数目。ESCAPE模式经译码于COPY_INDEX_MODE或COPY_ABOVE_MODE内,其中特定调色盘索引用于指示此模式。在当前调色盘版本中,此索引等于调色盘大小。在ESCAPE模式中,像素三元组(YCbCr或RGB)或其经量化版本经传信为palette_escape_val。
对每块传信旗标palette_escape_val_present_flag以指示逸出像素的使用。此旗标等于1指示在经调色盘译码的块中存在至少一个逸出像素,否则旗标等于0。
调色盘大小受限于0至max_palette_size的范围内。可传信最大大小。
对于用调色模式译码的块,调色盘可从先前经调色盘译码的块的调色盘条目预测、可明确地经传信为新条目,或可完全再使用先前经译码块的调色盘。后一情况被称为调色盘共享,且可传信旗标palette_share_flag以指示先前块的整个调色盘未作修改而按原样再使用。
在调色模式中,块中的像素扫描可属于两个类型:垂直跨越扫描或水平跨越(蛇形)扫描。根据每块单元传信的旗标palette_transpose_flag导出块中所使用的扫描模式。
在上文所描述的译码模式中,值的“执行”通常可指代经译码在一起的像素值的字符串。执行通常可关于包括于所述执行中且经一起处理或译码为群组(例如,执行长度)的元素的数目而描述。在一些实例中,执行可包含相同值的像素值。举例来说,索引模式中的执行可指示具有相同索引值的值的字符串(如上文所提及)。在出于说明的目的的实例中,如果给定扫描次序中的两个连续像素具有不同值,那么执行长度等于零。如果给定扫描次序中的两个连续像素具有相同值但扫描次序中的第三像素具有不同值,那么执行长度等于一,等等。
图1为绘示可利用本发明的技术的实例视频译码系统10的框图。如本文中所使用,术语“视频译码器”通常指视频编码器和视频解码器两者。在本发明中,术语“视频译码”或“译码”通常可指视频编码或视频解码。视频译码系统10的视频编码器20和视频解码器30表示可经配置以执行根据本发明中所描述的各种实例的用于基于调色盘的视频译码的技术的装置的实例。举例来说,视频编码器20和视频解码器30可经配置以译码块的像素,其中色度分量相对于明度分量经次取样。
如图1中所示,视频译码系统10包含源装置12和目的地装置14。源装置12产生经编码视频数据。因此,源装置12可被称作视频编码装置或视频编码设备。目的地装置14可解码由源装置12产生的经编码视频数据。因此,目的地装置14可被称作视频解码装置或视频解码设备。源装置12和目的地装置14可为视频译码装置或视频译码设备的实例。
源装置12和目的地装置14可包括广泛范围的装置,包含桌面计算机、行动计算装置、笔记型(例如,膝上型)计算机、平板计算机、机顶盒、例如所谓的“智能型”电话的电话手持机、电视、相机、显示装置、数字媒体播放器、视频游戏控制面板、车载计算机或类似者。
目的地装置14可经由信道16从源装置12接收经编码视频数据。信道16可包括能够将经编码视频数据从源装置12移动到目的地装置14的一或多个媒体或装置。在一个实例中,信道16可包括使源装置12能够实时地将经编码视频数据直接发射到目的地装置14的一或多个通信媒体。在此实例中,源装置12可根据通信标准(例如,无线通信协议)调制经编码视频数据,且可将经调制视频数据发射到目的地装置14。一或多个通信媒体可包括无线和/或有线通信媒体,例如射频(RF)频谱或一或多个实体发射线。一或多个通信媒体可形成基于分组的网络(例如局域网、广域网或全球网络(例如,因特网))的部分。一或多个通信媒体可包括路由器、交换器、基站或促进从源装置12到目的地装置14的通信的其它设备。
在另一实例中,信道16可包含存储由源装置12所产生的经编码视频数据的存储媒体。在此实例中,目的地装置14可(例如)经由磁盘存取或卡存取而存取存储媒体。存储媒体可包含多种本地存取的数据存储媒体,例如蓝光光盘、DVD、CD-ROM、闪存,或用于存储经编码视频数据的其它合适的数字存储媒体。
在另一实例中,信道16可包含存储由源装置12所产生的经编码视频数据的文件服务器或另一中间存储装置。在此实例中,目的地装置14可经由流式传输或下载而存取存储于文件服务器或其它中间存储装置处的经编码视频数据。文件服务器可为能够存储经编码视频数据且将经编码视频数据发射到目的地装置14的类型的服务器。实例文件服务器包括网页服务器(例如,用于网站)、档案传送协议(FTP)服务器、网络附接存储(NAS)装置及本地磁盘驱动器。
目的地装置14可经由标准数据连接(例如,因特网连接)来存取经编码视频数据。数据连接的实例类型可包含适合于存取存储于文件服务器上的经编码视频数据的无线信道(例如,Wi-Fi连接)、有线连接(例如,DSL、电缆调制解调器等),或两者的组合。经编码视频数据从文件服务器的发射可为流式传输、下载发射或两者的组合。
本发明的技术不限于无线应用或设定。所述技术可应用于支持多种多媒体应用(例如,(例如)经由因特网的空中电视广播、有线电视发射、卫星电视发射、流式视频发射)的视频译码、供存储于数据存储媒体上的数字视频的编码、存储于数据存储媒体上的数字视频的解码,或其它应用。在一些实例中,视频译码系统10可经配置以支持单向或双向视频发射以支持例如视频流、视频播放、视频广播和/或视频电话的应用。
图1中所绘示的视频译码系统10仅为实例,且本发明的技术可适用于未必包含编码装置与解码装置之间的任何数据通信的视频译码设定(例如,视频编码或视频解码)。在其它实例中,数据从本地存储器检索,经由网络或类似者而流式传输。视频编码装置可编码数据并将数据存储到存储器,和/或视频解码装置可从存储器检索数据并解码数据。在许多实例中,由并不彼此通信但简单地将数据编码至存储器和/或从存储器检索数据并解码数据的装置来执行编码及解码。
在图1的实例中,源装置12包含视频源18、视频编码器20和输出接口22。在一些实例中,输出接口22可包含调制器/解调器(调制解调器)和/或发射器。视频源18可包含视频捕获装置(例如,视频相机)、含有先前所捕获的视频数据的视频存盘、用以从视频内容提供商接收视频数据的视频馈入接口,和/或用于产生视频数据的计算机图形系统,或这些视频数据源的组合。
视频编码器20可编码来从视频源18的视频数据。在一些实例中,源装置12经由输出接口22将经编码视频数据直接发射到目的地装置14。在其它实例中,经编码视频数据也可存储于存储媒体或文件服务器上,以供目的地装置14稍后存取以用于解码和/或播放。
在图1的实例中,目的地装置14包含输入接口28、视频解码器30及显示装置32。在一些实例中,输入接口28包含接收器和/或调制解调器。输入接口28可经由信道16接收经编码视频数据。显示装置32可与目的地装置14集成或可在目的地装置14外部。一般来说,显示装置32显示经解码视频数据。显示装置32可包括各种显示装置,例如液晶显示器(LCD)、等离子显示器、有机发光二极管(OLED)显示器,或另一类型的显示装置。
视频编码器20和视频解码器30各自可实施为各种合适电路中的任一者,例如一或多个微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑、硬件或其任何组合。如果部分地以软件来实施所述技术,那么装置可将用于软件的指令存储于合适的非暂时性计算机可读存储媒体中,且可在硬件中使用一或多个处理器来执行所述指令以执行本发明的技术。可将前述各者(包括硬件、软件、硬件与软件的组合等)中的任一者视为一或多个处理器。视频编码器20和视频解码器30中的每一者可包括于一或多个编码器或解码器中,编码器或解码器中的任一者可集成为相应装置中的组合式编码器/解码器(编解码器)的部分。
本发明通常可指代视频编码器20将某一信息“传信”或“发射”到另一装置,例如,视频解码器30。术语“传信”或“发射”通常可指代用于解码经压缩视频数据的语法元素和/或其它数据的通信。此通信可实时地或近乎实时地发生。替代地,此通信可在一时间跨度内发生,例如,此通信可能在当编码时在经编码位流中将语法元素存储到计算机可读存储媒体时发生,所述语法元素在存储到此媒体之后接着可由解码装置在任何时间检索。
在一些实例中,视频编码器20和视频解码器30根据视频压缩标准(例如上文提及且在HEVC版本1中描述的HEVC标准)操作。除了基础HEVC标准(HEVC版本1)以外,也不断努力以产生HEVC的可调式视频译码、多视图视频译码和3D译码扩展。此外,可提供基于调色盘的译码模式(例如,如本发明中所描述)以用于HEVC标准的扩展(例如,对HEVC的屏幕内容译码扩展)。在一些实例中,本发明中描述的用于基于调色盘的译码的技术可应用于经配置以根据其它视频译码标准(例如,ITU-T-H.264/AVC标准或未来标准)操作的编码器及解码器。因此,HEVC编解码器中用于译码单元(CU)或预测单元(PU)的译码的基于调色盘的译码模式的应用是出于实例的目的而描述。
在HEVC及其它视频译码标准中,视频序列通常包含一系列图片。图片也可被称作“帧”。图片可包括表示三个相应样本阵列的三个分量,表示为SL、SCb和SCr。SL为明度样本的二维阵列(即,块)。SCb为Cb色度样本的二维阵列。SCr为Cr色度(chrominance)样本的二维阵列。色度样本在本文中亦可被称作“色度(chroma)”样本。在其它情况下,图片可为单色的,且可仅包含明度样本阵列。
为了产生图片的经编码表示,视频编码器20可产生译码树型单元(CTU)的集合。CTU中的每一者可为明度样本的译码树型块、色度样本的两个对应译码树型块,及用于对译码树型块的样本进行译码的语法结构。译码树型块可为样本的N×N块。CTU也可被称作“树型块”或“最大译码单元”(LCU)。HEVC的CTU可广泛地类似于例如H.264/AVC的其它标准的宏块。然而,CTU未必限于特定大小,且可包含一或多个译码单元(CU)。切片可包括在光栅扫描中连续排序的整数数目个CTU。
为产生经译码CTU,视频编码器20可对CTU的译码树型块递归地执行四分树分割,以将译码树型块划分成译码块,因此命名为“译码树型单元”。译码块为样本的N×N块。CU可为图片的明度样本的译码块和色度样本的两个对应译码块,所述图片具有明度样本阵列、Cb样本阵列及Cr样本阵列,以及用以对译码块的样本进行译码的语法结构。视频编码器20可将CU的译码块分割为一或多个预测块。预测块可为其上应用相同预测的样本的矩形(即,正方形或非正方形)块。CU的预测单元(PU)可为图片的明度样本的预测块、色度样本的两个对应预测块,及用以对预测块样本进行预测的语法结构。视频编码器20可针对CU的每一PU的明度、Cb及Cr预测块产生预测性明度块、Cb块及Cr块。
视频编码器20可使用帧内预测或帧间预测来产生(例如,确定)PU的预测性块。如果视频编码器20使用帧内预测来产生PU的预测性块,那么视频编码器20可基于与PU相关联的图片的经解码样本产生PU的预测性块。
如果视频编码器20使用帧间预测来产生(例如,确定)PU的预测性块,那么视频编码器20可基于不同于与PU相关联的图片的一或多个图片的经解码样本产生PU的预测性块。视频编码器20可使用单向预测或双向预测以产生PU的预测性块。当视频编码器20使用单向预测来产生PU的预测性块时,PU可具有单一运动向量(MV)。当视频编码器20使用双向预测来产生PU的预测性块时,PU可具有两个MV。
在视频编码器20产生CU的一或多个PU的预测性明度块、Cb块及Cr块之后,视频编码器20可产生CU的明度残余块。CU的明度残余块中的每一样本指示CU的预测性明度块中的一者中的明度样本与CU的原始明度译码块中的对应样本之间的差异。另外,视频编码器20可产生CU的Cb残余块。CU的Cb残余块中的每一样本可指示CU的预测性Cb块中的一者中的Cb样本与CU的原始Cb译码块中的对应样本之间的差异。视频编码器20也可产生CU的Cr残余块。CU的Cr残余块中的每一样本可指示CU的预测性Cr块中的一者中的Cr样本与CU的原始Cr译码块中的对应样本之间的差异。
此外,视频编码器20可使用四分树分割以将CU的明度残余块、Cb残余块和Cr残余块分解成一或多个明度变换块、Cb变换块及Cr变换块。变换块可为其上应用相同变换的样本的矩形块。CU的变换单元(TU)可为明度样本的变换块、色度样本的两个对应变换块,及用以对变换块样本进行变换的语法结构。因此,CU的每一TU可与明度变换块、Cb变换块及Cr变换块相关联。与TU相关联的明度变换块可为CU的明度残余块的子块。Cb变换块可为CU的Cb残余块的子块。Cr变换块可为CU的Cr残余块的子块。
视频编码器20可将一或多个变换应用到TU的明度变换块,以产生TU的明度系数块。系数块可为变换系数的二维阵列。变换系数可为纯量。视频编码器20可将一或多个变换应用于TU的Cb变换块以产生TU的Cb系数块。视频编码器20可将一或多个变换应用于TU的Cr变换块以产生TU的Cr系数块。
在产生系数块(例如,明度系数块、Cb系数块或Cr系数块)之后,视频编码器20可量化所述系数块。量化通常指对变换系数进行量化以可能地减少用以表示变换系数的数据的量,从而提供进一步压缩的处理程序。在视频编码器20量化系数块之后,视频编码器20可熵编码指示经量化变换系数的语法元素。举例来说,视频编码器20可对指示经量化变换系数的语法元素执行情境自适应性二进制算术译码(CABAC)。视频编码器20可在位流中输出经熵编码的语法元素。
视频编码器20可输出包含经熵编码的语法元素的位流。位流可包含形成经译码图片及相关联数据的表示的位的序列。位流可包括网络抽象层(NAL)单元的序列。NAL单元中的每一者包含NAL单元标头且封装原始字节序列负载(RBSP)。NAL单元标头可包含指示NAL单元类型码的语法元素。由NAL单元的NAL单元标头指定的NAL单元类型码指示NAL单元的类型。RBSP可为含有封装于NAL单元内的整数数目个字节的语法结构。在一些情况下,RBSP包括零个位。
不同类型的NAL单元可封装不同类型的RBSP。举例来说,第一类型的NAL单元可封装图片参数集(PPS)的RBSP,第二类型的NAL单元可封装经译码切片的RBSP,第三类型的NAL单元可封装SEI的RBSP,等等。封装视频译码数据的RBSP(如与参数集及SEI消息的RBSP相反)的NAL单元可被称作视频译码层(VCL)NAL单元。
视频解码器30可接收由视频编码器20产生的位流。另外,视频解码器30可剖析位流以从位流解码语法元素。视频解码器30可至少部分地基于从位流解码的语法元素而重构建视频数据的图片。重构建视频数据的处理程序通常可与由视频编码器20执行的处理程序互逆。举例来说,视频解码器30可使用PU的MV来确定当前CU的PU的预测性块。另外,视频解码器30可逆量化与当前CU的TU相关联的变换系数块。视频解码器30可对变换系数块执行逆变换,以重构建与当前CU的TU相关联的变换块。视频解码器30可经由将当前CU的PU的预测性块的样本添加至当前CU的TU的变换块的对应样本来重构建当前CU的译码块。经由重构建图片的每一CU的译码块,视频解码器30可重构建图片。
在一些实例中,视频编码器20和视频解码器30可经配置以执行基于调色盘的译码。举例来说,在基于调色盘的译码中(而非或除了执行上文所描述的帧内预测性或帧间预测性译码技术),视频编码器20和视频解码器30可将所谓的调色盘译码为用于表示特定区域(例如,给定块)的视频数据的颜色表。每一像素可与调色盘中表示像素的颜色的条目相关联。举例来说,视频编码器20和视频解码器30可译码使像素值与调色盘中的适当条目相关的索引。
在以上实例中,视频编码器20可经由确定用于块的调色盘、定位调色盘中表示每一像素的值的条目及用像素的使像素值与调色盘相关的索引值编码调色盘而编码视频数据的块。视频解码器30可从经编码位流获得用于块的调色盘,以及块的像素的索引值。视频解码器30可使像素的索引值与调色盘的条目相关以重构建块的像素值。
在一些实例中,视频编码器20可编码指示给定扫描次序中的具有相同像素值的连续像素的数目的一或多个语法元素。相同值的像素值的字符串在本文中可被称作“执行”。在用于说明的目的的实例中,如果给定扫描次序中的两个连续像素具有不同值,那么执行等于零。如果给定扫描次序中的两个连续像素具有相同值,但所述扫描次序中的第三个像素具有不同值,那么执行等于一。视频解码器30可从经编码位流获得指示执行的语法元素并使用数据来确定具有相同索引值的连续像素位置的数目。
在一些实例中,视频编码器20和视频解码器30可针对映射的一或多个条目执行线复制。举例来说,视频编码器20可指示映射中的特定条目的像素值等于所述特定条目上方的线中的条目。视频编码器20也可将所述扫描次序中等于特定条目上方的线中的条目的索引的数目指示为执行。在此实例中,视频编码器20和/或视频解码器30可从所指定的相邻线及从当前译码的索引映射的线的所指定数目的条目复制索引值。
根据本发明的方面,视频编码器20和视频解码器30可执行下文关于图4至7所描述或在本发明中以其它方式所描述的用于调色盘译码的技术的任何组合。换句话说,关于图4至7所描述的实例不应被视为限制本发明中所描述的技术或以其它方式由本发明中所描述的技术所要求。
本发明描述用以译码调色模式中的当前块的实例技术。在本发明中,术语“当前块”通常用于指代具有明度分量的明度块及具有相应色度分量的两个色度块。如本发明中所使用的“当前块”的一个实例为上文所定义的译码单元(CU)。HEVC标准定义CU如下:具有三个样本阵列的图片的明度样本的译码块、色度样本的两个对应译码块,或单色图片或使用三个单独颜色平面译码的图片的样本的译码块,以及用以译码样本的语法结构。
如上文所描述,存在用于屏幕内容译码(SCC)的当前工作草案。在当前SCC工作草案(JCTVC-S1005)中,仅针对4:4:4色度次取样格式定义调色模式,其中明度块大小与色度块大小相等。为改善译码效率,可能需要设计用于例如4:2:0或4:2:2的非4:4:4色度次取样格式的调色模式,其中色度样本块通常小于明度样本块。举例来说,对于4:2:0色度次取样格式及8×8块,明度样本块大小为8×8,而对应的色度样本块大小为4×4(例如,垂直及水平色度两者均减半)。对于4:2:2色度次取样格式及8×8,明度样本块大小为8×8,而对应的色度样本块大小为4×8(例如,水平色度减半)。作为实例,假定经调色模式译码的当前块为8×8大小的CU。对于此8×8大小的CU,存在一个8×8大小的明度块,及用于4:2:2次取样格式的两个4×8色度块或用于4:2:0次取样的两个4×4色度块。
本发明描述用以设计用于非4:4:4色度次取样格式的调色模式的若干技术。这些技术可划分成若干部分,其中每一部分可单独地应用或以与其它部分的任何组合应用。每一部分可表示可对于当前调色模式设计进行的修改,且可采用本发明中并未提及的调色模式的方面,但不限于与4:4:4调色模式中的方面相同。
对于调色表导出,在4:4:4调色模式中,每一调色盘条目由颜色三元组(例如,Y、Cb及Cr)构成。对于块中的每一非逸出像素,向其指派指向调色表中的条目的调色盘索引。对应的颜色三元组可用于重构建。然而,在非4:4:4的情况下,明度样本(明度分量)的数目可大于色度样本(色度分量)的数目,且块中的每一像素可不具有三个颜色分量。
在一些实例中,视频编码器20和视频解码器30可各自导出调色表。如本发明中所使用,词组“导出调色表”或其等效者指代视频编码器20或视频解码器30确定调色表的值的任何方式。举例来说,从视频编码器20的角度,视频编码器20可基于正经编码的块的颜色值确定调色表的值。从视频解码器30的角度,视频解码器30可基于所接收位流中含有的信息确定调色盘的值。在两个这些实例中,视频编码器20可被视为导出调色表,且视频解码器30可被视为导出调色表。用以确定调色表的值的其它方式为可能的,且被视为由词组“导出调色表”或其等效者所涵盖。
此同一调色表包括明度样本及色度样本的颜色值。在本发明中,术语颜色值及颜色分量可互换使用。调色表中的每一条目包含三个颜色分量(例如,三个颜色值):明度样本的第一颜色分量、第一色度分量的第二颜色分量和第二色度分量的第三颜色分量。
当视频解码器30将解码以调色模式译码的当前块(例如,基于调色表重构建当前块)时,视频解码器30可利用此单个调色表来重构建当前块。举例来说,视频解码器30可利用此单个调色表而不用其它调色表来重构建使用此调色表的此当前块的明度块和两个色度块,所述调色表包含用于明度块的明度分量和相应色度块的两个色度分量的颜色值(例如,颜色分量)。
对于N×N大小的CU(例如,N×N大小的当前块),存在具有明度分量的对应的N×N明度块。因此,存在针对CU中的每一像素的一个对应的明度样本。然而,对于次取样,并不存在针对CU中的每一像素的一个对应的色度样本。举例来说,对于4:2:2次取样,对应色度块具有N/2×N色度样本,且因此,对于CU中的每两个像素,相应色度块中存在一个对应样本。对于4:2:0次取样,对应的色度块具有N/2×N/2色度样本,且因此,对于CU中的每四个像素,相应色度块中存在一个对应样本。
在一些实例中,对于当前块(例如,CU)中的每一像素,视频解码器30可确定当前块的像素包含对应明度分量和色度分量还是仅包含对应明度分量。基于对当前块的像素是否包含明度分量和色度分量的确定,视频解码器30可确定待从调色表检索的颜色值的数目。举例来说,如果视频解码器30确定当前块中的像素包含明度分量和色度分量,那么视频解码器30可从调色表检索全部三个颜色值。然而,如果视频解码器30确定当前块中的像素包含明度分量但无色度分量,那么视频解码器30可从调色表检索三个颜色值中的一个而不是全部三个颜色值(例如,三个颜色值中的第一者)。
视频解码器30可基于对待检索的颜色值的数目的确定来对当前块中的像素进行调色模式解码。举例来说,视频解码器30可接收将一个条目识别到调色表中的单一索引。如果视频解码器30确定将检索三个颜色值,那么视频解码器30可将全部三个颜色值从所识别的条目检索到调色表中,且将每一相应颜色值指派到明度块中的对应样本及相应色度块中的对应样本。如果视频解码器30确定将检索一个颜色值,那么视频解码器30可将三个颜色值中的一个颜色值从所识别的条目检索到调色表中,且将所述颜色值指派到明度块中的对应样本。
根据以上实例,对于次取样格式,视频解码器30可能能够在相比于非次取样格式而无需实质上改变视频解码处理程序的情况下重构建当前块的像素(例如,重构建对应于CU的相应明度块及色度块的明度样本及色度样本)。举例来说,对于4:4:4取样格式,针对当前块(例如,CU)中的每一像素,明度块及两个色度块中存在对应样本。对于此4:4:4取样格式,视频编码器20传信单个调色表中的单一索引,且视频解码器30基于调色表中由索引识别的条目检索全部三个颜色值并为明度样本及色度样本中的每一者指派相应颜色值。
对于次取样格式,视频解码器30可导出单个调色表并将信号条目接收至此调色表中,类似于非次取样格式。然而,视频解码器30检索的颜色值的数目可针对当前块的不同像素而不同。以此方式,视频编码器20传信以用于4:4:4取样格式及用于次取样格式的位流为相同的,但视频解码器30可基于对当前块中的像素包含明度分量和色度分量还是包含明度分量而无色度分量的确定而选择性地检索不同数目个颜色值。
尽管在基于调色表中的条目对像素进行调色模式译码时用于次取样格式的位流可无需相对于非次取样格式改变,但对于逸出像素,用于次取样格式的位流可不同于用于非次取样格式的那些位流。逸出像素为颜色值不在导出的调色表中的像素。针对逸出像素,视频编码器20明确地传信明度分量及色度分量的颜色值(可能经量化)。
对于非次取样格式,视频编码器20可针对逸出像素传信且视频解码器30可接收相应明度块和色度块中的对应明度样本和色度样本中的每一者的颜色值。对于次取样格式,在一些实例中,视频编码器20可针对仅存在明度分量的逸出像素仅传信一个颜色值,且针对存在明度分量及两个色度分量的逸出像素传信全部三个颜色值。在这些实例中,视频解码器30可基于对当前块的逸出像素是否包含明度分量和色度分量的确定来确定待从位流剖析的颜色值的数目。视频解码器30接着可基于对待从位流剖析的颜色值的数目的确定而解码像素(例如,重构建像素)。
以上实例技术可概括如下。这些实例技术针对4:2:2及4:2:0调色块从解码器的角度(即,视频解码器30的角度)加以描述。在此情况下,每一调色盘条目由颜色分量(即,三个颜色值)构成。针对块(例如,CU)中的每一像素,确定一索引(例如,经由解码或可为复制索引或复制上方执行的一部分)。位流语法类似于4:4:4情况中的语法。如果像素由明度分量和色度分量两者构成且像素索引并不指示逸出像素,那么对应调色盘条目的全部三个颜色分量用于预测或重构建。如果像素仅由明度分量构成且像素索引并不指示逸出(ESCAPE)像素,那么对应调色盘条目的仅第一颜色分量用于预测或重构建。在逸出像素的情况下,如果像素仅由明度分量构成,那么从位流读取单一分量值(可能经量化)。类似地,如果逸出像素由明度分量和色度分量构成,那么从位流读取三个分量值(可能经量化)。
在以上实例中,视频解码器30可基于对像素包含明度分量和色度分量还是包含明度分量而无色度分量的确定来确定从调色表读取多少颜色值或从位流剖析多少颜色值。可存在视频解码器30可确定像素包含明度分量和色度分量还是包含明度分量而无色度分量的多种方式,且本发明中所描述的技术不受限于任一个此类技术。作为一个实例方式,视频解码器30可基于相位对准来确定像素包括明度分量及色度分量还是包括明度分量而无色度分量。
如关于图8及9更详细地描述的相位对准通常指当前块的明度分量与色度分量之间的关联。举例来说,对于4:2:0次取样,针对CU中的四个像素(例如,像素的2×2子块)的群组,明度块中存在样本的2×2子块的对应群组,且相应色度块中仅存在一个样本。因此,相应色度块中的一个样本可对应于明度块的2×2子块中的四个像素中的任一者(例如,一个色度分量对应于四个明度分量)。
举例来说,对于CU中的2×2子块,存在左上方、右上方、左下方及右下方的像素。相位对准指示色度块中的样本对应于CU中的2×2子块中的左上方、右上方、左下方还是右下方像素,所述2×2子块为明度块中的同一子块。视频解码器30可利用相位对准来确定像素包含明度分量和色度分量还是包含明度分量而无色度分量。此相位对准仅用于译码的目的。色度样本的实际实体位置可不同于由相位对准指示的实体位置。色度位置可与偶数分数像素位置对准。
举例来说,假定色度块中的样本与CU的2×2子块的左上方像素对准。在此实例中,当前块的明度分量与当前块的色度分量之间的相位对准指示明度块中的2×2子块的左上方样本与色度块中的样本相关联。在视频解码器30对2×2子块的左上方像素进行调色模式解码时,视频解码器30可针对逸出像素确定将检索来自调色表的全部三个颜色值或确定将剖析来自位流的全部三个颜色值。对于CU的2×2子块的右上方、右下方及左下方像素,视频解码器30可针对逸出像素确定将检索来自调色表的仅一个颜色值或确定将剖析来自位流的仅一个颜色值。
尽管以上实例描述与2×2子块的左上方像素的相位对准,但是本发明中所描述的技术并不受限如此,且相位对准可用于2×2子块的右上方、右下方或左下方像素。更一般来说,对于4:2:0次取样,一个相位对准可为当前块中具有偶数x坐标及偶数y坐标的每一像素与色度块相位对准(例如,当前块的明度分量与色度分量之间的相位对准指示明度块中具有偶数x坐标及偶数y坐标的样本对应于色度块中的样本)。另一相位对准可为当前块中具有偶数x坐标及奇数y坐标的每一像素与色度块相位对准(例如,当前块的明度分量与色度分量之间的相位对准指示明度块中具有偶数x坐标及奇数y坐标的样本对应于色度块中的样本)。另一相位对准可为当前块中具有奇数x坐标及偶数y坐标的每一像素与色度块相位对准(例如,当前块的明度分量与色度分量之间的相位对准指示明度块中具有奇数x坐标及偶数y坐标的样本对应于色度块中的样本)。另一相位对准可为当前块中具有奇数x坐标及奇数y坐标的每一像素与色度块相位对准(例如,当前块的明度分量与色度分量之间的相位对准指示明度块中具有奇数x坐标及奇数y坐标的样本对应于色度块中的样本)。
用于4:2:2的相位对准可为类似的,不同之处在于针对色度块中的每一个样本,在当前块中存在两个像素。对于4:2:2的情况,一个相位对准可为当前块中具有偶数x坐标的每一像素与色度块相位对准(例如,当前块的明度分量与色度分量之间的相位对准指示明度块中具有偶数x坐标的样本对应于色度块中的样本)。另一相位对准可为当前块中具有奇数x坐标的每一像素与色度块相位对准(例如,当前块的明度分量与色度分量之间的相位对准指示明度块中具有奇数x坐标的样本对应于色度块中的样本)。4:2:2次取样格式中的y坐标的值可为不相关的,因为仅水平部分经半取样且垂直部为相同的。
可预设用于图片的特定相位对准。作为另一实例,视频编码器20可传信指示相位对准的信息(例如,在存在四个可能相位对准时用于4:2:0次取样的二位值,或在存在两个可能相位对准时用于4:2:2次取样的一位值)。视频解码器30可基于指示相位对准的信号信息确定相位对准。作为另一实例,视频编码器20和视频解码器30可基于其它因素(例如,邻近块的内容、先前块的相位对准等)隐含地确定相位对准,以使得视频编码器20不需要明确地指示相位对准且不需要预设相位对准。
以此方式,视频解码器30可确定当前块的明度分量与当前块的色度分量之间的相位对准。为确定当前块中的像素是否包含明度分量和色度分量,视频解码器30可基于所确定的相位对准来确定当前块中的像素是否包含明度分量和色度分量。
上文描述使用单个调色表进行调色模式解码且基于当前块的明度分量与当前块的色度分量的相位对准确定是否应从调色表条目检索全部三个颜色值或仅一个颜色值的一个实例。上文还描述基于当前块的明度分量与当前块的色度分量的相位对准针对逸出像素确定是否应从位流剖析三个颜色值或一个颜色值的实例。
然而,本发明中所描述的实例技术并未如此受限。下文描述额外实例且重申一些上文所描述的实例。如果适用,那么以下技术可结合上文或独立于上文而使用。
在一些实例中,可使用多个调色表(例如,具有全部三个颜色的一个调色盘、用于明度分量的一个调色盘和用于色度分量的另一调色盘)而非具有单个调色表。可改变调色表导出以经由允许具有小于三个颜色分量的调色盘条目(例如,调色盘条目可为颜色三元组(例如,Y、U、V)、颜色对(例如,U、V)或单一颜色(例如,Y),或任何其它颜色组合)来解释此差异。视频编码器20可(例如)使用0三元组、10对及11单一条目或其它手段指示包含于调色盘条目中的调色盘条目类型或颜色分量的数目。根据此指示,如果传信新调色盘条目,那么视频编码器20可仅传信对应的颜色分量。举例来说,如果条目为一对,那么仅传信两个新颜色分量作为新调色盘条目。
在更特定的情况下,调色盘条目可仅属于两个类型:三元组和单一分量,且视频编码器20可传信一位旗标以指示条目类型。尽管针对此特定情况描述一些实例技术,但更一般的方法(不止使用三元组或单一条目)应被视为在本发明的范围内。
例如三元组、对或单一分量的类似条目可用于调色盘预测子列表中。替代地或另外,调色盘预测子列表可始终由三元组构成。可经由可能仅使用对应的颜色而从三元组预测对及单一分量条目。举例来说,如果从三元组(A,B,C)预测到单一分量条目,那么单一分量调色盘条目的对应分量值等于A。此实例也适用于使用单一调色盘(例如,使用调色盘预测子列表)作为导出单一调色盘的方式的以上实例。
在一些实例中,单独调色盘及调色盘预测子列表经维持以用于三元组和单一分量调色盘条目。在此情况下,视频编码器20可分别针对三元组和单一分量调色盘条目单独地传信调色盘预测子再使用旗标和新调色盘条目。
调色盘索引可用于指示用以预测(或表示)块中的像素的调色盘条目,且可将与调色盘条目相关联的颜色指派至视频解码器30平台处的像素。
对于调色盘索引,替代或除了关于调色表导出的以上描述之外,调色盘条目可仅由三元组构成,即使并非调色盘条目中的所有颜色可用于预测块中的特定像素。在本发明中所描述的技术中,视频编码器20及视频解码器30可根据块内的像素位置和色度颜色格式(例如,相位对准)导出预测(例如,表示)某一像素所必要的颜色的数目。举例来说,在4:2:0色度颜色格式中,四个明度样本具有一个对应的色度对(U及V),即,每第二列及每第二行可具有一像素,其具有三个颜色分量且所有其它像素将仅具有明度分量。因此,在一个实例中,色度样本可在行索引及列索引两者为偶数时存在。明度样本与色度样本的不同对准也是可能的。因此,调色盘索引最初可指示调色表中的三个颜色分量。如果特定像素位置仅具有明度样本,那么三元组的仅第一颜色分量可用于预测(表示)像素。
以相同方式,对于用COPY_INDEX_MODE或COPY_ABOVE_MODE译码的一组像素,可基于像素位置和色度颜色格式导出待复制的颜色分量的数目。调色模式的执行值可指示模式内的明度像素系列(并非所有明度样本具有对应的色度样本)的长度或一般来说更完整的颜色分量的长度。
如果像素为逸出像素(即,颜色值经明确地传信),那么可基于像素位置及色度颜色格式导出待传信的颜色的数目。因此,如果像素位置不具有色度样本,那么针对逸出像素仅译码明度值。
可经由考虑明度样本的数目多达色度样本的数目的4倍且就准确度来说可指派更多权重至明度分量来导出调色表。然而,如果需要具有仅一种调色盘导出方法,那么可经由使用4:4:4调色盘导出方法经由次取样明度分量以匹配色度像素或经由增加取样色度分量以匹配明度样本的数目来导出调色表。
对于颜色特定调色盘及调色盘预测子,当像素具有不同数目个相关联颜色分量时,单独调色表可经维持以用于不同类型的调色盘条目。举例来说,可使用具有仅三元组条目及单一条目的两个调色表。可根据像素位置及色度颜色格式导出待用于某一像素的调色盘分量的数目,且可根据调色盘索引从所导出的调色表类型选择颜色分量。执行值可对应于通常为明度的较长的颜色分量。
举例来说,如果用COPY_INDEX_MODE译码一组像素,那么视频编码器20可传信调色盘索引及执行值且视频解码器30可接收调色盘索引和执行值。对于所传信的执行值内的每一明度像素,视频解码器30可首先导出与像素相关联的颜色分量的数目(即,其为三元组还是单一条目)。接着,视频解码器30可从对应的调色表选择适当数目的颜色。
调色盘预测子可为仅基于三元组的,或可根据调色盘条目类型分离并单独地维持。如果调色盘预测子仅由三元组构成且当从调色盘预测子预测调色盘条目时,那么仅复制所需要的颜色。
替代地或另外,调色表可根据像素类型(例如,三元组或单一条目)分离,但所述表可仍具有三元组且可根据像素类型仅使用所需要的颜色。在此情况下,共同调色盘预测子可仅仅由所有所使用的条目组成,因为所有条目是基于三元组的。
对于波前同步,如果启用波前并行处理(WPP),那么调色盘预测子及上一经调色盘译码的块的调色盘大小存储于译码树型单元(CTU)列中的每一第二CTU的末端处以用于下一CTU列同步的目的。如果调色盘或调色盘预测子根据条目类型分离,那么可能需要存储调色盘预测子的每一类型和/或上一经调色盘译码的块的调色盘大小的每一类型以用于WPP同步。
下文描述一些实例方面以进一步辅助理解。这些实例可单独地应用或以任何组合一起应用。一个实例技术为上文所描述的技术,其中每一调色盘条目包含三个颜色值,且视频解码器30基于当前块中的像素包含明度分量和色度分量还是包含明度分量而无色度分量来确定待检索的颜色值的数目。视频解码器30亦可基于当前块中的像素是否包含明度分量和色度分量针对逸出像素确定待从位流剖析的颜色值的数目。
如上文所描述,视频编码器20和视频解码器30可使用相位对准信息来确定像素包含明度分量和色度分量还是包含明度分量而无色度分量。视频编码器20可传信参数集(例如,序列参数集(SPS)或图片参数集(PPS))、切片标头中的相位对准信息,且视频解码器30可接收所述相位对准信息,且视频可用性信息(VUI)可用以传达相位对准。举例来说,如果调色表中仅使用三元组,那么建议使用SPS或PPS或切片标头中的语法元素来指示不同相位对准。替代地或另外,VUI可用于传达此信息。
举例来说,在图8中,明度像素位置A、C、I及K被认为具有三个颜色分量(例如,明度分量和两个色度分量),且其余明度像素位置被认为具有单一颜色分量(例如,明度分量而无色度分量)。在另一实例中,如图9中所绘示,位置E、G、M及O中的明度像素位置被视为具有三个颜色分量(例如,明度分量及两个色度分量),而其余明度像素位置被视为具有单一颜色分量(例如,明度分量而无色度分量)。
因此,建议语法元素指示此类不同情况(例如,语法元素指示相位对准)。举例来说,当元素等于‘00’时,使用明度像素位置A、C、I、K导出色度像素值。当元素等于‘01’时,使用明度像素位置B、D、J、L导出色度像素值。当元素等于‘10’时,使用明度像素位置E、G、M、O导出色度像素值。当元素等于‘11’时,使用明度像素位置F、H、N、P导出色度像素值。
在以上实例中,使用仅一个明度位置来导出色度像素值。然而,本发明中所描述的技术并不如此受限。在另一实例中,视频编码器20和视频解码器30可使用多于一个明度位置来导出色度像素值。举例来说,在图9中,在视频编码器20或视频解码器30获得用于明度位置A、B、E、F的索引之后,可使用调色表将这些索引值映射到四个颜色三元组中。因此,存在四个色度对(例如,用于明度位置A的两个色度颜色值、用于明度位置B的两个色度颜色值、用于明度位置E的两个色度颜色值和用于明度位置F的两个色度颜色值)。
在一个实例中,视频编码器20和视频解码器30可使用这些四个色度对的平均值作为重构建的色度像素值。替代地或另外,视频编码器20和视频解码器30可选择两个或三个色度对,且使用其平均值作为重构建的色度像素值。替代地或另外,视频编码器20和视频解码器30可将这些四个色度对使用于4接头滤波器中,且使用经过滤的像素值作为重构建的色度像素值。
在另一实例中,在4:4:4调色模式中,对于COPY_ABOVE_MODE,当前像素共享与其上方相邻像素相同的颜色三元组。在非4:4:4模式中,对于具有全部三个分量的像素位置,为复制色度分量,视频编码器20和视频解码器30可从当前像素位置上方具有全部三个分量的最近位置复制色度分量。
举例来说,在图8中,如果明度位置K处于复制上方模式,那么视频解码器30复制位置C的色度分量,而非从G复制索引并经由查找调色表获得对应的色度分量值。
图2为绘示可实施本发明的技术的实例视频编码器20的框图。出于解释的目的而提供图2,且不应将图2视为对如本发明中广泛例示及描述的技术的限制。出于解释的目的,本发明描述在HEVC译码的情境中的视频编码器20。然而,本发明的技术可适用于其它译码标准或方法。
视频编码器20表示可经配置以根据本发明中所描述的各种实例执行用于基于调色盘的视频译码的技术的装置的实例。举例来说,视频编码器20可经配置以利用调色模式译码当前块,其中对应色度块的大小不同于对应明度块的大小。
在图2的实例中,视频编码器20包含预测处理单元100、视频数据存储器101、残差产生单元102、变换处理单元104、量化单元106、逆量化单元108、逆变换处理单元110、重构建单元112、滤波器单元114、经解码图片缓冲器116和熵编码单元118。预测处理单元100包含帧间预测处理单元120和帧内预测处理单元126。帧间预测处理单元120包含运动估计单元和运动补偿单元(未展示)。视频编码器20也包含基于调色盘的编码单元122,其经配置以执行本发明中所描述的基于调色盘的译码技术的各种方面。在其它实例中,视频编码器20可包含更多、更少或不同功能组件。
视频数据存储器101可存储待由视频编码器20的组件编码的视频数据。可(例如)从视频源18获得存储于视频数据存储器101中的视频数据。经解码图片缓冲器116可为存储用于视频编码器20(例如)以帧内或帧间译码模式编码视频数据的参考视频数据的参考图片存储器。视频数据存储器101和经解码图片缓冲器116可由多种存储器装置中的任一者形成,例如,动态随机存取存储器(DRAM)(包含同步DRAM(SDRAM))、磁阻式RAM(MRAM)、电阻式RAM(RRAM)或其它类型的存储器装置。可由同一存储器装置或单独存储器装置提供视频数据存储器101和经解码图片缓冲器116。在各种实例中,视频数据存储器101可与视频编码器20的其它组件一起在芯片上,或相对于那些组件在芯片外。
视频编码器20可接收视频数据。视频编码器20可编码视频数据的图片的切片中的每一CTU。CTU中的每一者可与相等大小的明度译码树型块(CTB)及图片的对应CTB相关联。作为编码CTU的部分,预测处理单元100可执行四分树分割以将CTU的CTB划分成逐渐较小的块。较小块可为CU的译码块。举例来说,预测处理单元100可将与CTU相关联的CTB分割成四个相等大小的子块,将所述子块中的一或多者分割成四个相等大小的子块,等等。
视频编码器20可编码CTU的CU以产生CU的经编码表示(即,经译码CU)。作为编码CU的部分,预测处理单元100可分割与CU的一或多个PU中的CU相关联的译码块。因此,每一PU可与明度预测块及对应的色度预测块相关联。视频编码器20和视频解码器30可支持具有各种大小的PU。如上文所指示,CU的大小可指CU的明度译码块的大小,且PU的大小可指PU的明度预测块的大小。假定特定CU的大小为2N×2N,那么视频编码器20和视频解码器30可支持用于帧内预测的2N×2N或N×N的PU大小,及用于帧间预测的2N×2N、2N×N、N×2N、N×N或类似的对称PU大小。视频编码器20和视频解码器30也可支持用于帧间预测的2N×nU、2N×nD、nL×2N及nR×2N的PU大小的不对称分割。
帧间预测处理单元120可经由对CU的每一PU执行帧间预测而产生用于PU的预测性数据。用于PU的预测性数据可包含PU的预测性块和PU的运动信息。取决于PU是在I切片中、P切片中还是B切片中,帧间预测单元121可针对CU的PU执行不同操作。在I切片中,所有PU经帧内预测。因此,如果PU在I切片中,那么帧间预测单元121不对PU执行帧间预测。因此,对于在I模式中编码的块,经预测块是使用空间预测从同一帧内的先前经编码的相邻块而形成。
如果PU在P切片中,那么帧间预测处理单元120的运动估计单元可在用于PU的参考区域的参考图片列表(例如,“RefPicList0”)中搜寻参考图片。用于PU的参考区域可为参考图片内含有最紧密地对应于PU的样本块的样本块的区域。运动估计单元可产生指示含有用于PU的参考区域的参考图片的RefPicList0中的位置的参考索引。另外,运动估计单元可产生指示PU的译码块与关联于参考区域的参考位置之间的空间移位的MV。举例来说,MV可为提供从当前经解码图片中的坐标到参考图片中的坐标的偏移的二维向量。运动估计单元可输出参考索引及MV作为PU的运动信息。帧间预测处理单元120的运动补偿单元可基于由PU的运动向量指示的参考位置处的实际或经内插样本而产生PU的预测性块。
如果PU在B切片中,那么帧间预测处理单元120的运动估计单元可针对PU执行单向预测或双向预测。为针对PU执行单向预测,运动估计单元可搜寻RefPicList0或用于PU的参考区域的第二参考图片列表(“RefPicList1”)的参考图片。运动估计单元可输出以下各者作为PU的运动信息:指示含有参考区域的参考图片的RefPicList0或RefPicList1中的位置的参考索引、指示PU的预测块与关联于参考区域的参考位置之间的空间移位的MV,及指示参考图片在RefPicList0中还是在RefPicList1中的一或多个预测方向指示符。帧间预测处理单元120的运动补偿单元可至少部分地基于由PU的运动向量指示的参考区域处的实际或经内插样本而产生PU的预测性块。
为针对PU执行双向帧间预测,运动估计单元可在用于PU的参考区域的RefPicList0中搜寻参考图片,且也可在用于PU的另一参考区域的RefPicList1中搜寻参考图片。运动估计单元可产生指示含有参考区域的参考图片的RefPicList0和RefPicList1中的位置的参考图片索引。另外,运动估计单元可产生指示关联于参考区域的参考位置与PU的样本块之间的空间移位的MV。PU的运动信息可包含参考索引和PU的MV。帧间预测处理单元120的运动补偿单元可至少部分地基于由PU的运动向量指示的参考区域处的实际或经内插样本而产生PU的预测性块。
根据本发明的各种实例,视频编码器20可经配置以执行基于调色盘的译码。就HEVC构架来说,作为实例,基于调色盘的译码技术可经配置以用作译码单元(CU)模式。在其它实例中,基于调色盘的译码技术可经配置以用作HEVC的构架中的PU模式。因此,本文中(贯穿本发明)在CU模式的情境中描述的全部所公开处理程序可另外或替代地适用于PU。然而,这些基于HEVC的实例不应被视为约束或限制本文中所描述的基于调色盘的译码技术,因而,这些技术可经应用以独立地或作为其它现有或尚待开发的系统/标准的部分工作。在这些情况下,用于调色盘译码的单元可为正方形块、矩形块或甚至非矩形形状区域。
举例来说,当(例如)针对CU或PU选择基于调色盘的编码模式时,基于调色盘的编码单元122可执行基于调色盘的编码。举例来说,基于调色盘的编码单元122可经配置以产生具有指示像素值的条目的调色盘,选择调色盘中的像素值以表示视频数据的块中的至少一些位置的像素值,及传信使视频数据的块的至少一些位置与调色盘中分别对应于所选择像素值的条目相关联的信息。尽管将各种功能描述为经由基于调色盘的编码单元122执行,但这些功能中的一些或全部可经由其它处理单元或不同处理单元的组合执行。
根据本发明的方面,基于调色盘的编码单元122可经配置以执行下文关于图4至7所描述或本发明中以其它方式所描述的用于调色盘译码的技术的任何组合。作为一个实例,基于调色盘的编码单元122可导出用于当前块的调色表,且将调色表存储于视频数据存储器101中。在一些情况下,基于调色盘的编码单元122可基于调色表确定视频数据的当前块中的像素并未经编码(例如,像素为逸出像素)。在此实例中,基于调色盘的编码单元122可确定视频数据的当前块中的像素是否包含明度分量和色度分量。举例来说,基于调色盘的编码单元122可确定明度分量与色度分量的相位对准,并确定当前块中的像素是否包含明度分量和色度分量。
基于调色盘的编码单元122可基于对当前块中的像素是否包含明度分量和色度分量的确定而确定待在位流中传信的颜色值的数目,且视频编码器20可基于颜色值的经确定数目在位流中针对像素传信用于重构建当前块的颜色值。在此情况下,像素为逸出像素,意谓用于此像素的明度值和/或色度值不在调色盘中。如果明度值/色度值在调色盘中,那么视频编码器20将传信调色盘索引。
作为一个实例,基于调色盘的编码单元122可基于对当前块中的逸出像素包含明度分量和色度分量的确定而针对逸出像素确定将在位流中传信三个颜色值。在此实例中,视频编码器20传信用于视频解码器30所使用以重构建当前块的逸出像素的三个颜色值。作为另一实例,基于调色盘的编码单元122可基于对当前块中的逸出像素仅包含明度分量而无任何色度分量的确定而确定将在位流中仅传信单一颜色值。在此实例中,视频编码器20针对像素仅传信视频解码器30所使用以重构建逸出像素的一个颜色值。
帧内预测处理单元126可经由对PU执行帧内预测而产生用于PU的预测性数据。用于PU的预测性数据可包括PU的预测性块及各种语法元素。帧内预测处理单元126可对I切片、P切片及B切片中的PU执行帧内预测。
为对PU执行帧内预测,帧内预测处理单元126可使用多个帧内预测模式以产生用于PU的预测性数据的多个集合。帧内预测处理单元126可使用来自相邻PU的样本块的样本来产生用于PU的预测性块。对于PU、CU及CTU,假定从左至右、从上而下的编码次序,那么相邻PU可在PU上方、右上方、左上方或左边。帧内预测处理单元126可使用各种数目的帧内预测模式,例如,各种方向的帧内预测模式。在一些实例中,帧内预测模式的数目可取决于与PU相关联的区域的大小。
预测处理单元100可从由帧间预测处理单元120针对PU产生的预测性数据或由帧内预测处理单元126针对PU产生的预测性数据当中选择用于CU的PU的预测性数据。在一些实例中,预测处理单元100基于预测性数据的集合的速率/失真度量而选择用于CU的PU的预测性数据。所选择的预测性数据的预测性块在本文中可被称作所选择的预测性块。
残差产生单元102可基于CU的明度、Cb及Cr译码块及CU的PU的所选择的预测性明度、Cb及Cr块而产生CU的明度、Cb及Cr残余块。举例来说,残差产生单元102可产生CU的残余块,以使得残余块中的每一样本具有等于CU的译码块中的样本与CU的PU的对应所选择预测性块中的对应样本之间的差的值。
变换处理单元104可执行四分树分割以将与CU相关联的残余块分割成与CU的TU相关联的变换块。因此,TU可与明度变换块和两个色度变换块相关联。CU的TU的明度变换块和色度变换块的大小和位置可或可不基于CU的PU的预测块的大小及位置。被称为“残余四分树”(RQT)的四分树结构可包括与区域中的每一者相关联的节点。CU的TU可对应于RQT的分叶节点。
变换处理单元104可经由将一或多个变换应用于TU的变换块而产生用于CU的每一TU的变换系数块。变换处理单元104可将各种变换应用于与TU相关联的变换块。举例来说,变换处理单元104可将离散余弦变换(DCT)、定向变换或在概念上类似的变换应用于变换块。在一些实例中,变换处理单元104并不将变换应用于变换块。在这些实例中,变换块可经处理为变换系数块。
量化单元106可量化系数块中的变换系数。量化处理程序可减少与变换系数中的一些或全部相关联的位深度。举例来说,在量化期间,可将n位变换系数无条件舍去为m位变换系数,其中n大于m。量化单元106可基于与CU相关联的量化参数(QP)值来量化与CU的TU相关联的系数块。视频编码器20可经由调整与CU相关联的QP值来调整应用于与CU相关联的系数块的量化程度。量化可引入信息的损失;因此,经量化变换系数相较于量化前的原始变换系数可具有较低精确度。
逆量化单元108和逆变换处理单元110可分别将逆量化和逆变换应用于系数块,以从系数块重构建残余块。重构建单元112可将经重构建的残余块添加至来自由预测处理单元100产生的一或多个预测性块的对应样本,以产生与TU相关联的经重构建的变换块。经由以此方式重构建CU的每一TU的变换块,视频编码器20可重构CU的译码块。
滤波器单元114可执行一或多个解块操作以减少与CU相关联的译码块中的块假影。在滤波器单元114对经重构建的译码块执行一或多个解块操作之后,经解码图片缓冲器116可存储经重构建的译码块。帧间预测处理单元120可使用含有经重构建的译码块的参考图片,以对其它图片的PU执行帧间预测。另外,帧内预测处理单元126可使用经解码图片缓冲器116中的经重构建的译码块,以对处于与CU相同的图片中的其它PU执行帧内预测。
熵编码单元118可从视频编码器20的其它功能组件接收数据。举例来说,熵编码单元118可从量化单元106接收系数块且可从预测处理单元100接收语法元素。熵编码单元118可对数据执行一或多个熵编码操作,以产生经熵编码的数据。举例来说,熵编码单元118可对数据执行情境自适应性可变长度译码(CAVLC)操作、CABAC操作、可变至可变(V2V)长度译码操作、基于语法的情境自适应性二进制算术译码(SBAC)操作、概率区间分割熵(PIPE)译码操作、指数哥伦布编码操作或另一类型的熵编码操作。视频编码器20可输出包含由熵编码单元118产生的经熵编码数据的位流。举例来说,位流可包含表示用于CU的RQT的资料。
图3为绘示经配置以实施本发明的技术的实例视频解码器30的框图。出于解释的目的而提供图3,且其并不限制如本发明中所广泛例示及描述的技术。出于解释的目的,本发明描述在HEVC译码的情境中的视频解码器30。然而,本发明的技术可适用于其它译码标准或方法。
视频解码器30表示可经配置以执行根据本发明中描述的各种实例的用于基于调色盘的视频译码的技术的装置的实例。举例来说,视频解码器30可经配置以利用调色模式译码当前块,其中对应色度块的大小不同于对应明度块的大小。
在图3的实例中,视频解码器30包含熵解码单元150、视频数据存储器151、预测处理单元152、逆量化单元154、逆变换处理单元156、重构建单元158、滤波器单元160,以及经解码图片缓冲器162。预测处理单元152包含运动补偿单元164和帧内预测处理单元166。视频解码器30亦包含经配置以执行本发明中所描述的基于调色盘的译码技术的各种方面的基于调色盘的解码单元165。在其它实例中,视频解码器30可包含更多、更少或不同功能组件。
视频数据存储器151可存储待由视频解码器30的组件解码的视频数据,例如经编码视频位流。可(例如)从计算机可读媒体16(例如,从本地视频源(例如,相机))经由视频数据的有线或无线网络通信或者经由存取实体数据存储媒体而获得存储于视频数据存储器151中的视频数据。视频数据存储器151可形成存储来自经编码视频位流的经编码视频数据的经译码图片缓冲器(CPB)。经解码图片缓冲器162可为存储用于视频解码器30(例如)以帧内或帧间译码模式解码视频数据的参考视频数据的参考图片存储器。视频数据存储器151及经解码图片缓冲器162可由多种存储器装置中的任一者形成,例如,动态随机存取存储器(DRAM)(包含同步DRAM(SDRAM))、磁阻式RAM(MRAM)、电阻式RAM(RRAM)或其它类型的存储器装置。可由同一存储器装置或单独的存储器装置提供视频数据存储器151和经解码图片缓冲器162。在各种实例中,视频数据存储器151可与视频解码器30的其它组件一起在芯片上,或相对于那些组件在芯片外。
视频数据存储器151中的经译码图片缓冲器(CPB)可接收并存储位流的经编码视频数据(例如,NAL单元)。熵解码单元150可从CPB接收经编码视频数据(例如,NAL单元)并剖析NAL单元以解码语法元素。熵解码单元150可熵解码NAL单元中的经熵编码的语法元素。预测处理单元152、逆量化单元154、逆变换处理单元156、重构建单元158及滤波器单元160可基于从位流提取的语法元素而产生经解码视频数据。
位流的NAL单元可包含经译码切片NAL单元。作为解码位流的部分,熵解码单元150可从经译码切片NAL单元提取语法元素并对所述语法元素进行熵解码。经译码切片中的每一者可包括切片标头及切片数据。切片标头可含有关于切片的语法元素。切片标头中的语法元素可包括识别与含有切片的图片相关联的PPS的语法元素。
除了解码来自位流的语法元素之外,视频解码器30可对未分割的CU执行重构建操作。为了对未分割的CU执行重构建操作,视频解码器30可对CU的每一TU执行重构建操作。经由针对CU的每一TU执行重构操作,视频解码器30可重构建CU的残余块。
作为对CU的TU执行重构建操作的部分,逆量化单元154可对与TU相关联的系数块进行逆量化(即,解量化)。逆量化单元154可使用与TU的CU相关联的QP值来确定量化程度且同样地确定逆量化单元154应用的逆量化程度。即,可经由调整在量化变换系数时使用的QP值来控制压缩比,即,用以表示原始序列及经压缩序列的位计数的比率。压缩比也可取决于所采用的熵译码的方法。
在逆量化单元154对系数块进行逆量化之后,逆变换处理单元156可将一或多个逆变换应用于系数块,以便产生与TU相关联的残余块。举例来说,逆变换处理单元156可将逆DCT、逆整数变换、逆Karhunen-Loeve变换(KLT)、逆旋转变换、逆定向变换或另一逆变换应用于系数块。
如果PU是使用帧内预测来编码,那么帧内预测处理单元166可执行帧内预测以产生用于PU的预测性块。帧内预测处理单元166可使用帧内预测模式以基于在空间上相邻的PU的预测块而产生PU的预测性明度块、Cb块及Cr块。帧内预测处理单元166可基于从位流解码的一或多个语法元素确定用于PU的帧内预测模式。
预测处理单元152可基于从位流提取的语法元素而构建第一参考图片列表(RefPicList0)和第二参考图片列表(RefPicList1)。此外,如果PU是使用帧间预测来编码,那么熵解码单元150可提取用于PU的运动信息。运动补偿单元164可基于PU的运动信息而确定用于PU的一或多个参考区域。运动补偿单元164可基于在用于PU的一或多个参考块处的样本块而产生用于PU的预测性明度块、Cb块及Cr块。
重构建单元158可在适用时使用与CU的TU相关联的明度变换块、Cb变换块及Cr变换块以及CU的PU的预测性明度块、Cb块及Cr块(即,帧内预测数据或帧间预测数据)来重构建CU的明度译码块、Cb译码块及Cr译码块。举例来说,重构建单元158可将明度变换块、Cb变换块及Cr变换块的样本添加到预测性明度块、Cb块及Cr块的对应样本,以重构建CU的明度译码块、Cb译码块和Cr译码块。
滤波器单元160可执行解块操作以减少与CU的明度译码块、Cb译码块及Cr译码块相关联的块假影。视频解码器30可将CU的明度译码块、Cb译码块和Cr译码块存储于经解码图片缓冲器162中。经解码图片缓冲器162可提供参考图片以用于后续运动补偿、帧内预测及在显示装置(例如,图1的显示装置32)上呈现。举例来说,视频解码器30可基于经解码图片缓冲器162中的明度块、Cb块及Cr块对其它CU的PU执行帧内预测操作或帧间预测操作。
根据本发明的各种实例,视频解码器30可经配置以执行基于调色盘的译码。举例来说,当(例如)针对CU或PU选择基于调色盘的解码模式时,基于调色盘的解码单元165可执行基于调色盘的解码。举例来说,基于调色盘的解码单元165可经配置以产生具有指示像素值的条目的调色盘,接收使视频数据块中的至少一些像素位置与调色盘中的条目相关的信息,基于信息选择调色盘中的像素值,且基于调色盘中的所选择的像素值重构建块的像素值。尽管各种功能经描述为经由基于调色盘的解码单元165执行,但这些功能中的一些或全部可经由其它处理单元或不同处理单元的组合执行。
基于调色盘的解码单元165可接收调色盘译码模式信息,且在调色盘译码模式信息指示调色盘译码模式适用于块时执行以上操作。在调色盘译码模式信息指示调色盘译码模式不适用于块时,或在其它模式信息指示不同模式的使用时,预测处理单元152使用基于非调色盘的译码模式(例如,此HEVC帧间预测或帧内预测译码模式)解码视频数据的块。视频数据的块可为(例如)根据HEVC译码程序产生的CU或PU。基于调色盘的译码模式可包括多个不同的基于调色盘的译码模式中的一者,或可存在单个基于调色盘的译码模式。
根据本发明的方面,基于调色盘的解码单元165可经配置以执行下文关于图4至7所描述或本发明中以其它方式所描述的用于调色盘译码的技术的任何组合。举例来说,基于调色盘的解码单元165可针对视频数据的当前块导出包含具有三个颜色值的条目的单个调色表。视频数据存储器151可存储包含具有三个颜色值的条目的调色表。
基于调色盘的解码单元165可确定视频数据的当前块中的像素是否包含明度分量和色度分量。举例来说,基于调色盘的解码单元165可确定当前块的明度分量与当前块的色度分量之间的相位对准。基于调色盘的解码单元165可基于所确定的相位对准来确定当前块中的像素是否包含明度分量和色度分量。
在一些实例中,基于调色盘的解码单元165可基于对当前块中的像素是否包含明度分量和色度分量的确定来确定待从调色表检索的颜色值的数目。基于调色盘的解码单元165基于对当前块中的像素包含明度分量和色度分量的确定而确定将从调色表检索三个颜色值。基于调色盘的解码单元165基于对当前块中的像素仅包含明度分量而无任何色度分量的确定而确定仅将从调色表检索三个颜色值中的单一颜色值。一般来说,视频解码器30可接收将一个条目识别到调色表中的单一索引。基于调色盘的解码单元165可基于对当前块中的像素是否包含明度分量和色度分量的确定而确定待从所识别的条目检索至调色表中的颜色值的数目。
基于调色盘的解码单元165可基于对待检索的颜色值的数目的确定而对视频数据的当前块中的像素进行调色模式解码。举例来说,如果基于调色盘的解码单元165确定像素包含明度分量和色度分量,那么基于调色盘的解码单元165可从调色表检索三个颜色值,且将三个颜色值中的每一者指派至像素的相应明度分量和色度分量。如果基于调色盘的解码单元165确定像素仅包含明度分量而无任何色度分量,那么基于调色盘的解码单元165可从调色表检索单一颜色值(例如,三个颜色值中的第一所识别颜色值),且将所述单一颜色值指派至像素的明度分量。
在以上实例中,当前块的像素是基于调色表中的一或多个颜色值而解码。然而,在一些实例中,当前块中的像素(例如,逸出像素)可不基于调色表解码。在这些实例中,基于调色盘的解码单元165可确定当前块中的逸出像素是否包含明度分量和色度分量。
基于调色盘的解码单元165可基于对当前块中的逸出像素是否包含明度分量和色度分量的确定而确定待从位流剖析的颜色值的数目。举例来说,基于调色盘的解码单元165可基于对当前块中的逸出像素包含明度分量和色度分量的确定而确定将从位流剖析三个颜色值(可能经量化)。作为另一实例,基于调色盘的解码单元165可基于对当前块中的逸出像素仅包含明度分量而无任何色度分量的确定而确定将从位流仅剖析单一颜色值(可能经量化)。
对于逸出像素,基于调色盘的解码单元165可基于待从位流剖析的颜色值的经确定数目来解码逸出像素。如果逸出像素包含明度分量和色度分量,那么基于调色盘的解码单元165可剖析三个颜色值(可能经量化)并将相应颜色值指派至明度分量及两个色度分量。如果逸出像素仅包含明度分量而无任何色度分量,那么基于调色盘的解码单元165可剖析仅一个颜色值(可能经量化)并将彼颜色值指派至明度分量。
图4为绘示确定用于译码视频数据的调色盘的实例的概念图。图4的实例包含图片178,其具有与第一调色盘184相关联的第一译码单元(CU)180和与第二调色盘192相关联的第二CU 188。第一CU 180和第二CU 188使用调色模式(PAL)来译码。如下文更详细地描述,第二调色盘192是基于第一调色盘184。图片178还包含用帧内预测译码模式译码的块196和用帧间预测译码模式译码的块200。
基于屏幕内容视频的特性,文件JCTVC-M0323(“用于屏幕内容译码的调色模式(Palette Mode for Screen Content Coding)”,L.Guo等人,JCTVC-M0323,韩国仁川,2013年4月18日至26日)中首次提出引入调色盘译码以改善SCC效率,所述文件的全部内容以引用的方式并入本文中。具体来说,基于在SCC中,一个CU内的颜色通常集中于几个峰值的事实,调色盘译码引入查找表(即,颜色调色盘)来压缩重复的像素值。在给定用于特定CU的调色盘的情况下,CU内的像素经映射到调色盘索引。在第二阶段中,提出从左侧执行长度复制的技术以有效地压缩索引块的重复图案。在文件JCTVC-N0249(“非RCE3:用于屏幕内容译码的经修改调色模式(Non-RCE3:Modified Palette Mode for Screen Content Coding)”,Guo等人,JCTVC-N0249,奥地利维也纳,2013年7月25日至8月2日)中,调色盘索引译码模式经一般化以准许用执行长度译码从左侧复制和从上方复制两者。应注意,在一些情况下,不针对调色盘译码调用变换程序以避免模糊锐边,模糊锐边对屏幕内容的视觉质量具有不利影响。
一般来说,调色盘为存储(索引、像素值)对的数据结构。可(例如)经由当前CU中的像素值的直方图在视频编码器20处决定经设计的调色盘。举例来说,将直方图中的峰值添加至调色盘中,而低频像素值并未包括于调色盘中。
出于解释的目的,在视频编码器20(图1及图2)和视频解码器30(图1及图3)的情境中并关于HEVC视频译码标准描述图4的技术。然而,应理解,本发明的技术不以此方式受限,且可经由其它视频译码处理器和/或装置在其它视频译码程序和/或标准中应用。
一般来说,调色盘是指对于当前正经译码的CU(图4的实例中的CU 180)来说为主要的和/或代表性的若干像素值。第一调色盘184和第二调色盘192经展示为包含多个调色盘。在一些实例中,根据本发明的方面,视频译码器(例如视频编码器20或视频解码器30)可针对CU的每一颜色分量单独地译码调色盘。举例来说,视频编码器20可编码用于CU的明度(Y)分量的调色盘、用于CU的色度(U)分量的另一调色盘,及用于CU的色度(V)分量的又一调色盘。在此实例中,Y调色盘的条目可表示CU的像素的Y值,U调色盘的条目可表示CU的像素的U值,且V调色盘的条目可表示CU的像素的V值。
在其它实例中,视频编码器20可编码用于CU的全部颜色分量的单个调色盘。在此实例中,视频编码器20可编码具有为三重值(包括Yi、Ui及Vi)的第i个条目的调色盘。在此情况下,调色盘包含用于像素的分量中的每一者的值。因此,作为具有多个个别调色盘的调色盘集合的调色盘184及192的表示仅为一个实例且不意欲为限制性的。
在图4的实例中,第一调色盘184中的每一者包含分别具有条目索引值1、条目索引值2及条目索引值3的三个条目202至206。条目202至206分别使索引值与包含像素值A、像素值B及像素值C的像素值相关。如本文所描述,视频译码器(例如视频编码器20或视频解码器30)可使用基于调色盘的译码以使用索引1至3对块的像素进行译码,而非对第一CU 180的实际像素值进行译码。即,对于第一CU 180的每一像素位置,视频编码器20可编码像素的索引值,其中索引值与第一调色盘184中的一或多者中的像素值相关联。视频解码器30可从位流获得索引值并使用索引值和第一调色盘184中的一或多者重构建像素值。因此,第一调色盘184为经由视频编码器20在经编码视频数据位流中发射以供视频解码器30在基于调色盘的解码中使用。
在一些实例中,可从另一调色盘(例如,先前在译码期间使用的调色盘)预测调色盘的一或多个条目。举例来说,调色盘可包含从预测子调色盘复制的条目。预测子调色盘可包含来自先前使用调色模式译码的块或来自其它经重构建的样本的调色盘条目。对于预测子调色盘中的每一条目,二进制旗标可包含于位流中以指示是否将那个条目复制到当前调色盘(例如,经由旗标=1指示)。用于相应调色盘条目的一系列二进制旗标可被称作二进制调色盘预测向量。另外,当前调色盘可包含经明确传信的新条目。也可传信新条目的数目。
在图4的实例中,视频编码器20和视频解码器30可基于第一调色盘184来确定第二调色盘192。举例来说,视频编码器20和/或视频解码器30可定位从其确定预测性调色盘(在此实例中为第一调色盘184)的一或多个块。在一些实例(例如图4中所绘示的实例)中,视频编码器20和/或视频解码器30可在确定用于第二CU 188的预测性调色盘时定位先前经译码的CU,例如左侧相邻CU(第一CU 180)。
在图4的实例中,第二调色盘192包含分别具有条目索引值1、条目索引值2及条目索引值3的三个条目208至212。条目208至212分别使索引值与包含像素值A、像素值B及像素值D的像素值相关。在此实例中,视频编码器20可译码指示第一调色盘184的哪些条目包含于第二调色盘192中的一或多个语法元素。在图4的实例中,一或多个语法元素经绘示为向量216。向量216具有若干相关联位子(或位),其中每一位子指示与所述位子相关联的调色盘预测子是否用于预测当前调色盘的条目。举例来说,向量216指示第一调色盘184中的前两个条目(202及204)包括于第二调色盘192中(向量216中的值“1”),而第一调色盘184中的第三条目不包含于第二调色盘192中(向量216中的值“0”)。在图4的实例中,向量为布尔(Boolean)向量。
在一些实例中,视频编码器20及视频解码器30可在执行调色盘预测时确定调色盘预测子列表(其也可被称作调色盘预测子表)。调色盘预测子列表可包含来自用以预测用于译码当前块的调色盘的一或多个条目的一或多个相邻块的调色盘的条目。视频编码器20和视频解码器30可以相同方式来构建列表。视频编码器20和视频解码器30可译码数据(例如向量216)以指示调色盘预测子列表的哪些条目将包含于用于译码当前块的调色盘中。
图5绘示调色盘预测的实例。举例来说,对于SCC,一个切片内的CU块可共享许多主要颜色。因此,如上文相对于图4所提及,使用先前调色模式CU的调色盘(按CU解码次序)作为参考来预测当前块的调色盘可为可能的。具体来说,可传信0至1二进制向量以指示当前调色盘是否再使用参考调色盘中的像素值。作为实例,在图5中,假定参考调色盘具有6个项目。可用当前调色盘传信向量(1,0,1,1,1,1),所述向量指示v0、v2、v3、v4及v5再用于当前调色盘中而v1未经再用。如果当前调色盘含有不可从参考调色盘预测的颜色,那么译码未经预测的颜色的数目且随后可直接传信这些颜色。举例来说,在图5中,可在位流中直接传信u0及u1
图6为绘示确定对用于像素的块的调色盘的索引的实例的概念图。举例来说,在当前HEVC屏幕内容译码测试模型2(SCM 2)参考软件中,从规范性角度,调色盘译码的两个主要方面为针对正在调色模式中译码的块中的每一样本对调色盘译码及对调色盘索引译码。如上文所提及,调色盘索引的译码可使用两个主要模式(包括索引模式及自上方复制模式)执行。在索引模式中,最初可传信(例如)调色盘索引。如果索引等于调色盘的大小,那么此情形指示样本为逸出样本。在此情况下,传信用于每一分量的样本值或经量化样本值。在自上方复制模式中,仅非负执行长度值m-1可经发射以指示后续m个像素(包括当前一个像素)分别共享调色盘索引作为其正上方的相邻者。
在一些实例中,可使用palette_mode旗标来传信用于特定块的调色模式。如上文所提及,索引模式也用于指示逸出样本,即,不属于调色盘的样本。在当前设计中,自上方复制模式不可能用于调色盘块的第一行。另外,自上方复制模式可不遵循另一自上方复制模式。在这些情况下,推断出索引模式。
在当前设计中,调色模式是以CU层级传信,但以PU层级传信所述调色模式可系可能的。亦可传信旗标palette_esc_val_present_flag来指示当前块中的逸出样本的存在。以不同方式传信调色模式亦系可能的。举例来说,在文件JCTVC-P0231(W.Pu、F.Zou、M.Karczewicz及R.Joshi,“非RCE4:RCE4测试2中的调色盘的精确化(Non-RCE4:Refinementof the palette in RCE4Test 2)”,JCTVC-P0231)中,提出使用显式旗标来指示当前样本是否为逸出样本。如果当前样本为非逸出样本,那么传信另一旗标以指示调色模式为自上方复制模式还是索引模式。
图6的实例包含使关联于索引值的像素的相应位置与调色盘244的条目相关的索引值(值1、2及3)的映射240。虽然映射240在图6的实例中经绘示为包含每一像素位置的索引值,但应理解,在其它实例中,并非全部像素位置可与使像素值与调色盘244的条目相关的索引值相关联。即,如上文所提及,在一些实例中,如果像素值并不包含于调色盘244中,那么视频编码器20可编码(且视频解码器30可从经编码位流获得)用于映射240中的位置的实际像素值(或其经量化版本)的指示。
在一些实例中,视频编码器20和视频解码器30可经配置以译码指示哪些像素位置与索引值相关联的额外映射。举例来说,假定映射中的(i,j)条目对应于CU的(i,j)位置。视频编码器20可针对指示条目是否具有相关联索引值的映射的每一条目(即,每一像素位置)来编码一或多个语法元素。在此实例中,视频编码器20也可编码调色盘索引(在图6的实例中展示为值1至3)以指示调色盘中的对应像素值并允许视频解码器30重构建像素值。
CU的一个位置中的像素的值可提供CU的其它位置中的一或多个其它像素的值的指示。举例来说,可存在CU的相邻像素位置将具有相同像素值或可映射至相同索引值(在有损译码情况下,其中多于一个像素值可映射到单一索引值)的相对高概率。
因此,视频编码器20可编码指示在给定扫描次序中的经译码为一群组的连续像素或索引值的数目的一或多个语法元素。所谓的值的“字符串”可被称作具有执行长度的执行。举例来说,索引模式中的执行可指示具有相同索引值的像素的字符串。在另一实例中,自上方复制模式中的执行长度可指示共享与上方相邻像素相同的值的像素值的字符串。视频解码器30可从经编码位流获得指示执行的语法元素,并使用数据来确定经译码在一起的连续位置的数目。
如上文所提及,可结合复制上部(亦被称作自上方复制)模式或复制左侧模式(也被称作索引模式)使用执行。在用于说明的目的的实例中,考虑映射240的行264及268。假定水平的从左至右的扫描方向,行264包括三个索引值“1”、两个索引值“2”及三个索引值“3”。行268包括五个索引值“1”及三个索引值“3”。在此实例中,视频编码器20在编码用于行268的数据(例如,复制上部模式)时可识别行264的特定条目,然后识别执行。举例来说,视频编码器20可编码指示行268的第一位置(行268的最左边的位置)与行264的第一位置相同的一或多个语法元素。视频编码器20也可编码指示在行268中的扫描方向上的两个连续条目的下一执行与行264的第一位置相同的一或多个语法元素。
在对指示行264的第一位置及两个条目(上文提及)的执行的一或多个语法元素进行编码之后,视频编码器20可针对线268中的第四及第五位置(从左至右)编码指示第四位置的值1的一或多个语法元素及指示为1的执行的一或多个语法元素(例如,复制左侧模式)。因此,视频编码器20在不参考另一线的情况下编码这些两个位置。在一些实例中,复制左侧模式也可被称作“值”模式。
视频编码器20可随后相对于上行264编码行268中具有索引值3的第一位置(例如,指示从上行264的复制及扫描次序中的具有相同索引值的连续位置的执行)。因此,视频编码器20可在(例如)使用执行相对于线的其它值译码所述线的像素值或索引值,相对于另一线(或列)的值译码线的像素值或索引值或其组合之间进行选择。在一些实例中,视频编码器20可执行速率/失真优化以作出选择。
视频解码器30可接收上文所描述的语法元素,且可重构建行268。举例来说,视频解码器30可获得指示相邻列中的特定位置的数据,从所述相邻列复制当前正经译码的映射240的位置的相关联索引值。视频解码器30也可获得指示在扫描次序中经处理为群组(例如,在具有执行长度的执行中)的连续位置的数目的数据。尽管关于水平扫描次序进行描述,但本发明的技术也可应用于另一扫描方向,例如垂直扫描方向或对角线(例如,在块中成45度或135度对角)扫描方向。
图7为绘示从先前经译码行复制调色盘索引的实例的概念图。图7的实例通常可说明复制先前行(Copy Previous Row)模式。举例来说,如上文所提及,复制先前行模式可类似于自上方复制模式操作;然而,可明确传信从其复制索引的行。复制先前行模式可使得待从先前经译码行复制的像素值能够超出当前正经译码的像素正上方的行。
举例来说,为达成更佳的译码效率,复制先前行模式允许使用任何先前经译码行作为参考。可将复制先前行模式添加于可用调色模式候选列表中。在选择复制先前行模式时可对行索引信息进行译码。可使用截断二进制码字对行索引进行译码。可针对更接近当前行定位的行指定更短的码字。如同其它调色模式,可在位流中译码匹配长度(例如,经译码在一起的位置的执行长度)。为减少与自上方复制模式的冗余,复制先前模式可从当前CU的第三行开始有效。
在申请于2014年6月20的美国临时申请案第62/015,177号(“177临时案)及申请于2014年6月27的美国临时申请案第62/018,477号(“477临时案),以及文件JCTVC-R0202(F.Zou、M.Karczewicz、R.Joshi及J.Sole,“非SCCE3:用于调色译码的从先前行复制模式(Non-SCCE3:Copy from previous row mode for palette coding)”,JCTVC-R0202)中,提出复制先前行(也被称作“从先前列复制(Copy from Previous Row)”)的若干方面,包括但不限于可用于表示“索引”、“自上方复制”及“复制先前行”模式的模式译码/传信技术。在一些实例中,截断一元译码可用于这些三个模式。在这些实例中,在一些模式不可用时可减小最大符号值,从而减少间接费用成本。
图10为绘示解码视频数据的实例的流程图。视频解码器30可针对视频数据的当前块导出包含具有三个颜色值的条目的单个调色表(1000)。视频数据存储器151可存储调色表。
视频解码器30可确定视频数据的当前块中的像素是否包含明度分量和色度分量(1002)。举例来说,视频解码器30可确定当前块的明度分量与当前块的色度分量之间的相位对准。视频解码器30可基于所确定的相位对准来确定当前块中的像素是否包含明度分量和色度分量。
视频解码器30可基于对当前块的像素是否包含明度分量和色度分量的确定而确定待从调色表检索的颜色值的数目(1004)。视频解码器30可基于对待检索的颜色值的数目的确定而对视频数据的当前块中的像素进行调色模式解码(1006)。
举例来说,视频解码器30可接收将一个条目识别到调色表中的单一索引。在此实例中,视频解码器30可基于对当前块中的像素是否包含明度分量和色度分量的确定而确定待从所识别的条目检索到调色表中的颜色值的数目。
在一个实例中,视频解码器30可基于对当前块中的像素包含明度分量和色度分量的确定而确定将从调色表检索三个颜色值。在此实例中,为了对像素进行调色模式解码,视频解码器30可从调色表检索三个颜色值,并将所述三个颜色值中的每一者指派至像素的相应明度分量及色度分量。
在另一实例中,视频解码器30可基于对当前块中的像素仅包含明度分量而无任何色度分量的确定来确定将仅从调色表检索三个颜色值的单个颜色值。在此实例中,为了对像素进行调色模式解码,视频解码器30可从调色表检索单个颜色值,并将所述单个颜色值指派至像素的明度分量。举例来说,单个颜色值可为存储于调色表中的三个颜色值中的第一所识别颜色值。
在图10中所绘示的以上实例中,当前块的像素可被视为第一像素。在一些实例中,视频解码器30可确定当前块中的第二像素将不基于调色表解码(例如,第二像素为逸出像素)。视频解码器30可确定当前块中的第二像素是否包含明度分量和色度分量,且基于对当前块中的第二像素是否包含明度分量和色度分量的确定而确定待从位流剖析的颜色值的数目。颜色值可能经量化,且在以下描述中,尽管未明确陈述,但应假定颜色值可能经量化。然而,颜色值可不一定始终经量化。
视频解码器30可基于待从位流剖析的颜色值的经确定数目来解码当前块中的第二像素。视频解码器30基于对当前块中的第二像素包含明度分量和色度分量的确定而确定将从位流剖析三个颜色值,且视频解码器30基于对当前块中的第二像素仅包含明度分量而无任何色度分量的确定来确定将仅从位流剖析单个颜色值。
图11为绘示编码视频数据的实例的流程图。视频编码器20可确定视频数据的当前块中的像素(例如,逸出像素)将不基于存储于视频数据存储器101中的调色表来编码(1100)。视频编码器20可确定视频数据的当前块中的像素是否包含明度分量和色度分量(1102),且可基于对当前块中的像素是否包含明度分量和色度分量的确定而确定待在位流中传信的颜色值的数目(1104)。视频编码器20可基于颜色值的经确定数目在位流中针对像素传信用于重构建当前块的颜色值(1106)。
作为一个实例,为确定待在位流中传信的颜色值的数目,视频编码器20可基于对当前块中的像素包含明度分量和色度分量的确定而确定将在位流中传信三个颜色值。为传信颜色值,视频编码器20可传信用于视频解码器30所使用以重构建当前块的像素的三个颜色值。
作为另一实例,为确定待在位流中传信的颜色值的数目,视频编码器20可基于对当前块中的像素仅包含明度分量而无任何色度分量的确定来确定将在位流中仅传信单个颜色值。为传信,视频编码器20可针对像素仅传信视频解码器30所使用以重构建当前块的一个颜色值。
上文所描述的技术可经由视频编码器20(图1及2)和/或视频解码器30(图1及3)执行,所述两者通常可被称作视频译码器。同样地,如果适用,那么视频译码可指视频编码或视频解码。另外,视频编码及视频解码通常可被称作“处理”视频数据。
应理解,本文所描述的所有技术可单独地或以组合方式使用。本发明包含可取决于某些因素(例如,块大小、调色盘大小、切片类型等)改变的若干传信方法。在传信或推断语法元素中的此类变化可事先对编码器及解码器为已知或可在视频参数集(VPS)、序列参数集(SPS)、图片参数集(PPS)、切片标头中在图案块层级或其它处经明确地传信。
将认识到,取决于实例,本文中所描述的技术中的任一者的某些动作或事件可以不同序列执行,可添加、合并或完全省略所述动作或事件(例如,并非所有所描述动作或事件对于所述技术的实践都是必要的)。此外,在某些实例中,可(例如)经由多线程处理、中断处理或多个处理器同时而非依序地执行动作或事件。另外,尽管出于清晰的目的将本发明的某些方面描述为经由单一模块或单元执行,但应理解,本发明的技术可经由与视频译码器相关联的单元或模块的组合来执行。
尽管在上文描述技术的各种方面的特定组合,但提供这些组合仅为了说明本发明中所描述的技术的实例。因此,本发明的技术不应限于这些实例组合且可涵盖本发明中描述的技术的各种方面的任何可设想组合。
在一或多个实例中,所描述的功能可以硬件、软件、固件或其任何组合来实施。如果以软件实施,那么所述功能可作为一或多个指令或程序代码而存储于计算机可读媒体上或经由计算机可读媒体发射,且由基于硬件的处理单元执行。计算机可读媒体可包括计算机可读存储媒体,其对应于例如数据存储媒体的有形媒体,或通信媒体,其包括(例如)根据通信协议促进将计算机程序从一处传送到另一处的任何媒体。以此方式,计算机可读媒体通常可对应于(1)非暂时性的有形计算机可读存储媒体,或(2)例如信号或载波的通信媒体。数据存储媒体可为可经由一或多个计算机或一或多个处理器存取以检索指令、程序代码和/或数据结构以用于实施本发明所描述的技术的任何可用媒体。计算机程序产品可包含计算机可读媒体。
经由实例而非限制,这些计算机可读存储媒体可包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储器、磁盘存储器或其它磁性存储装置、闪存或可用以存储呈指令或数据结构形式的所要程序代码且可由计算机存取的任何其它媒体。又,任何连接被适当地称为计算机可读媒体。举例来说,如果使用同轴缆线、光缆、双绞线、数字用户线(DSL)或无线技术(例如红外线、无线电及微波)而从网站、服务器或其它远程源发射指令,那么同轴缆线、光缆、双绞线、DSL或无线技术(例如红外线、无线电及微波)包含于媒体的定义中。然而,应理解,计算机可读存储媒体及数据存储媒体不包含连接、载波、信号或其它暂时性媒体,而实情为涉及非暂时性有形存储媒体。如本文中所使用,磁盘及光盘包括紧密光盘(CD)、激光光盘、光学光盘、数字多功能光盘(DVD)、软性磁盘及蓝光光盘,其中磁盘通常以磁性方式再生数据,而光盘用激光以光学方式再生数据。以上的组合还应包括于计算机可读媒体的范围内。
可经由例如一或多个数字信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、现场可编程逻辑阵列(FPGA)或其它等效集成或离散逻辑电路的一或多个处理器来执行指令。因此,如本文中所使用的术语“处理器”可指代前述结构或适合于实施本文中所描述的技术的任何其它结构中的任一者。此外,在一些方面中,本文中所描述的功能性可提供在经配置用于编码及解码的专用硬件和/或软件模块内,或并入于组合式编解码器中。又,所述技术可完全实施于一或多个电路或逻辑组件中。
本发明的技术可以多种装置或设备予以实施,所述装置或设备包含无线手机、集成电路(IC)或IC的集合(例如,芯片集合)。本发明中描述各种组件、模块或单元以强调经配置以执行所公开技术的装置的功能方面,但未必需要经由不同硬件单元来实现。确切来说,如上文所描述,可将各种单元组合于编解码器硬件单元中,或经由互操作性硬件单元(包括如上文所描述的一或多个处理器)的集合而结合合适软件和/或固件来提供所述单元。
已描述各种实例。这些及其它实例在以下申请专利范围的范围内。

Claims (36)

1.一种解码视频数据的方法,所述方法包括:
针对所述视频数据的当前块导出包含具有三个颜色值的条目的单个调色表;
确定所述视频数据的当前块中的像素是否包含明度分量和色度分量;
基于对所述当前块中的所述像素是否包含所述明度分量和所述色度分量的所述确定来确定待从所述单个调色表检索的颜色值的数目;及
基于对待检索的颜色值的所述数目的所述确定来对所述视频数据的所述当前块中的所述像素进行调色模式解码。
2.根据权利要求1所述的方法,其进一步包括:
确定所述当前块的明度分量与所述当前块的色度分量之间的相位对准,
其中确定所述当前块中的所述像素是否包含所述明度分量和所述色度分量包含基于所述所确定的相位对准确定所述当前块中的所述像素是否包含所述明度分量和所述色度分量。
3.根据权利要求1所述的方法,其中确定颜色值的所述数目包括基于对所述当前块中的所述像素包含所述明度分量和所述色度分量的所述确定来确定将从所述单个调色表检索三个颜色值,且其中对所述当前块中的所述像素进行调色模式解码包括从所述单个调色表检索所述三个颜色值及将所述三个颜色值中的每一者指派至所述像素的相应明度分量和色度分量。
4.根据权利要求1所述的方法,其中确定颜色值的所述数目包括基于对所述当前块中的所述像素仅包含所述明度分量而无任何所述色度分量的所述确定来确定将从所述单个调色表仅检索所述三个颜色值中的单个颜色值,且其中对所述当前块中的所述像素进行调色模式解码包括从所述单个调色表检索所述单个颜色值及将所述单个颜色值指派至所述像素的所述明度分量。
5.根据权利要求4所述的方法,其中所述单个颜色值包括所述三个颜色值中的第一经识别颜色值。
6.根据权利要求1所述的方法,其中所述像素包括第一像素,所述方法进一步包括:
确定所述当前块中的第二像素将不基于所述单个调色表解码;
确定所述当前块中的所述第二像素是否包含明度分量和色度分量;
基于对所述当前块中的所述第二像素是否包含所述明度分量和所述色度分量的所述确定来确定待从位流剖析的颜色值的数目;及
基于待从所述位流剖析的颜色值的所述经确定数目来解码所述当前块中的所述第二像素。
7.根据权利要求6所述的方法,其中确定待从所述位流剖析的颜色值的所述数目包括基于对所述当前块中的所述第二像素包含所述明度分量和所述色度分量的所述确定来确定将从所述位流剖析三个颜色值。
8.根据权利要求6所述的方法,其中确定待从所述位流剖析的颜色值的所述数目包括基于对所述当前块中的所述第二像素仅包含所述明度分量而无任何所述色度分量的所述确定来确定将从所述位流仅剖析单个颜色值。
9.根据权利要求1所述的方法,其进一步包括:
接收识别所述单个调色表中的一个条目的单一索引,
其中确定待检索的颜色值的所述数目包括基于对所述当前块中的所述像素是否包含所述明度分量和所述色度分量的所述确定来确定待从所述单个调色表中的所述经识别条目检索的颜色值的所述数目。
10.一种用于解码视频数据的装置,所述装置包括:
存储器单元,其经配置以存储用于所述视频数据的当前块的包含具有三个颜色值的条目的调色表;及
视频解码器,其经配置以:
针对所述视频数据的所述当前块导出所述调色表且并未针对所述当前块导出其它调色表以供存储于所述存储器单元中;
确定所述视频数据的所述当前块中的像素是否包含明度分量和色度分量;
基于对所述当前块中的所述像素是否包含所述明度分量和所述色度分量的所述确定来确定待从所述调色表检索的颜色值的数目;及
基于对待检索的颜色值的所述数目的所述确定来对所述视频数据的所述当前块中的所述像素进行调色模式解码。
11.根据权利要求10所述的装置,其中所述视频解码器经配置以:
确定所述当前块的明度分量与所述当前块的色度分量之间的相位对准,
其中为了确定所述当前块中的所述像素是否包含所述明度分量和所述色度分量,所述视频解码器经配置以基于所述经确定的相位对准来确定所述当前块中的所述像素是否包含所述明度分量和所述色度分量。
12.根据权利要求10所述的装置,其中为了确定颜色值的所述数目,所述视频解码器经配置以基于对所述当前块中的所述像素包含所述明度分量和所述色度分量的所述确定来确定将从所述调色表检索三个颜色值,且其中为了对所述当前块中的所述像素进行调色模式解码,所述视频解码器经配置以从所述调色表检索所述三个颜色值并将所述三个颜色值中的每一者指派到所述像素的相应明度分量和色度分量。
13.根据权利要求10所述的装置,其中为了确定颜色值的所述数目,所述视频解码器经配置以基于对所述当前块中的所述像素仅包含所述明度分量而无任何所述色度分量的所述确定来确定将从所述调色表仅检索所述三个颜色值中的单个颜色值,且其中为了对所述当前块中的所述像素进行调色模式解码,所述视频解码器经配置以从所述调色表检索所述单个颜色值并将所述单个颜色值指派到所述像素的所述明度分量。
14.根据权利要求13所述的装置,其中所述单个颜色值包括所述三个颜色值中的第一经识别颜色值。
15.根据权利要求10所述的装置,其中所述像素包括第一像素,且其中所述视频解码器经配置以:
确定所述当前块中的第二像素将不基于所述调色表解码;
确定所述当前块中的所述第二像素是否包含明度分量和色度分量;
基于对所述当前块中的所述第二像素是否包含所述明度分量和所述色度分量的所述确定来确定待从位流剖析的颜色值的数目;及
基于待从所述位流剖析的颜色值的所述经确定数目来解码所述当前块中的所述第二像素。
16.根据权利要求15所述的装置,其中为了确定待从所述位流剖析的颜色值的所述数目,所述视频解码器经配置以基于对所述当前块中的所述第二像素包含所述明度分量和所述色度分量的所述确定来确定将从所述位流剖析三个颜色值。
17.根据权利要求15所述的装置,其中为了确定待从所述位流剖析的颜色值的所述数目,所述视频解码器经配置以基于对所述当前块中的所述第二像素仅包含所述明度分量而无任何所述色度分量的所述确定来确定将从所述位流仅剖析单个颜色值。
18.根据权利要求10所述的装置,所述视频解码器经配置以:
接收识别所述调色表中的一个条目的单一索引,
其中为了确定待检索的颜色值的所述数目,所述视频解码器经配置以基于对所述当前块中的所述像素是否包含所述明度分量和所述色度分量的所述确定来确定待从所述调色表中的所述经识别条目检索的颜色值的所述数目。
19.根据权利要求10所述的装置,其中所述装置包括微处理器、集成电路、无线通信装置或经配置以显示包括所述当前块的图片的显示器中的至少一个。
20.一种上面存储有指令的非暂时性计算机可读存储媒体,所述指令在经执行时引起用于解码视频数据的装置的一或多个处理器进行以下操作:
针对所述视频数据的当前块导出包含具有三个颜色值的条目的单个调色表;
确定所述视频数据的所述当前块中的像素是否包含明度分量和色度分量;
基于对所述当前块中的所述像素是否包含所述明度分量和所述色度分量的所述确定来确定待从所述单个调色表检索的颜色值的数目;及
基于对待检索的颜色值的所述数目的所述确定来对所述视频数据的所述当前块中的所述像素进行调色模式解码。
21.根据权利要求20所述的非暂时性计算机可读存储媒体,其进一步包括引起所述一或多个处理器进行以下操作的指令:
确定所述当前块的明度分量与所述当前块的色度分量之间的相位对准,
其中引起所述一或多个处理器确定所述当前块中的所述像素是否包含所述明度分量和所述色度分量的所述指令包括引起所述一或多个处理器基于所述经确定的相位对准来确定所述当前块中的所述像素是否包含所述明度分量和所述色度分量的指令。
22.根据权利要求20所述的非暂时性计算机可读存储媒体,其中引起所述一或多个处理器确定颜色值的所述数目的所述指令包括引起所述一或多个处理器基于对所述当前块中的所述像素包含所述明度分量和所述色度分量的所述确定来确定将从所述单个调色表检索三个颜色值的指令,且其中引起所述一或多个处理器对所述当前块中的所述像素进行调色模式解码的所述指令包括引起所述一或多个处理器从所述单个调色表检索所述三个颜色值并将所述三个颜色值中的每一者指派至所述像素的相应明度分量和色度分量的指令。
23.根据权利要求20所述的非暂时性计算机可读存储媒体,其中引起所述一或多个处理器确定颜色值的所述数目的所述指令包括引起所述一或多个处理器基于对所述当前块中的所述像素仅包含所述明度分量且无任何所述色度分量的所述确定来确定将从所述单个调色表仅检索所述三个颜色值中的单个颜色值的指令,且其中引起所述一或多个处理器对所述当前块中的所述像素进行调色模式解码的所述指令包括引起所述一或多个处理器从所述单个调色表检索所述单个颜色值并将所述单个颜色值指派至所述像素的所述明度分量的指令。
24.一种用于解码视频数据的装置,所述装置包括:
用于针对所述视频数据的当前块导出包含具有三个颜色值的条目的单个调色表的装置;
用于确定所述视频数据的当前块中的像素是否包含明度分量和色度分量的装置;
用于基于对所述当前块中的所述像素是否包含所述明度分量和所述色度分量的所述确定来确定待从所述单个调色表检索的颜色值的数目的装置;及
用于基于对待检索的颜色值的所述数目的所述确定来对所述视频数据的所述当前块中的所述像素进行调色模式解码的装置。
25.根据权利要求24所述的装置,其进一步包括:
用于确定所述当前块的明度分量与所述当前块的色度分量之间的相位对准的装置,
其中用于确定所述当前块中的所述像素是否包含所述明度分量和所述色度分量的所述装置包括用于基于所述经确定的相位对准来确定所述当前块中的所述像素是否包含所述明度分量和所述色度分量的装置。
26.根据权利要求24所述的装置,其中用于确定颜色值的所述数目的所述装置包括用于基于对所述当前块中的所述像素包含所述明度分量和所述色度分量的所述确定来确定将从所述单个调色表检索三个颜色值的装置,且其中用于对所述当前块中的所述像素进行调色模式解码的所述装置包括用于从所述单个调色表检索所述三个颜色值的装置及用于将所述三个颜色值中的每一者指派至所述像素的相应明度分量和色度分量的装置。
27.根据权利要求24所述的装置,其中用于确定颜色值的所述数目的所述装置包括用于基于对所述当前块中的所述像素仅包含所述明度分量且无任何所述色度分量的所述确定来确定将从所述单个调色表仅检索所述三个颜色值中的单个颜色值的装置,且其中用于对所述当前块中的所述像素进行调色模式解码的所述装置包括用于从所述单个调色表检索所述单个颜色值的装置及用于将所述单个颜色值指派至所述像素的所述明度分量的装置。
28.一种编码视频数据的方法,所述方法包括:
确定所述视频数据的当前块中的像素将不基于单个调色表编码;
确定所述视频数据的所述当前块中的所述像素是否包含明度分量和色度分量;
基于对所述当前块中的所述像素是否包含所述明度分量和所述色度分量的所述确定来确定待在位流中传信的颜色值的数目;及
基于颜色值的所述经确定数目在所述位流中针对所述像素传信用于重构建所述当前块的颜色值。
29.根据权利要求28所述的方法,其中确定待在所述位流中传信的颜色值的所述数目包括基于对所述当前块中的所述像素包含所述明度分量和所述色度分量的所述确定来确定将在所述位流中传信三个颜色值,且其中传信颜色值包括针对所述像素传信三个颜色值。
30.根据权利要求28所述的方法,其中确定待在所述位流中传信的颜色值的所述数目包括基于对所述当前块中的所述像素仅包含所述明度分量且无任何所述色度分量的所述确定来确定将在所述位流中仅传信单个颜色值,且其中传信包含针对所述像素仅传信一个颜色值。
31.根据权利要求28所述的方法,其中传信颜色值包括传信经量化颜色值。
32.一种用于编码视频数据的装置,所述装置包括:
存储器单元,其经配置以存储用于所述视频数据的当前块的调色表;及
视频编码器,其经配置以:
确定所述视频数据的所述当前块中的像素将不基于所述调色表编码;
确定所述视频数据的所述当前块中的所述像素是否包含明度分量和色度分量;
基于对所述当前块中的所述像素是否包含所述明度分量和所述色度分量的所述确定来确定待在位流中传信的颜色值的数目;及
基于颜色值的所述经确定数目在所述位流中针对所述像素传信用于重构建所述当前块的颜色值。
33.根据权利要求32所述的装置,其中为了确定待在所述位流中传信的颜色值的所述数目,所述视频编码器经配置以基于对所述当前块中的所述像素包含所述明度分量和所述色度分量的所述确定来确定将在所述位流中传信三个颜色值,且其中为了传信颜色值,所述视频编码器经配置以针对所述像素传信三个颜色值。
34.根据权利要求32所述的装置,其中为了确定待在所述位流中传信的颜色值的所述数目,所述视频编码器经配置以基于对所述当前块中的所述像素仅包含所述明度分量且无任何所述色度分量的所述确定来确定将在所述位流中仅传信单个颜色值,且其中为了传信,所述视频编码器经配置以针对所述像素仅传信一个颜色值。
35.根据权利要求32所述的装置,其中为了传信颜色值,所述视频编码器经配置以传信经量化颜色值。
36.根据权利要求32所述的装置,其中所述装置包括微处理器、集成电路、无线通信装置或经配置以捕获包含所述当前块的图片的相机中的至少一个。
CN201580067697.7A 2014-12-19 2015-12-18 用于解码视频数据的方法和装置以及计算机可读存储媒体 Active CN107113436B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201462094737P 2014-12-19 2014-12-19
US62/094,737 2014-12-19
US14/973,648 2015-12-17
US14/973,648 US10097839B2 (en) 2014-12-19 2015-12-17 Palette mode for subsampling format
PCT/US2015/066763 WO2016100859A1 (en) 2014-12-19 2015-12-18 Palette mode for subsampling format

Publications (2)

Publication Number Publication Date
CN107113436A true CN107113436A (zh) 2017-08-29
CN107113436B CN107113436B (zh) 2020-06-23

Family

ID=55229832

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201580067697.7A Active CN107113436B (zh) 2014-12-19 2015-12-18 用于解码视频数据的方法和装置以及计算机可读存储媒体

Country Status (7)

Country Link
US (1) US10097839B2 (zh)
EP (1) EP3235247A1 (zh)
JP (1) JP6625644B2 (zh)
KR (1) KR102478411B1 (zh)
CN (1) CN107113436B (zh)
TW (1) TWI689197B (zh)
WO (1) WO2016100859A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114208185A (zh) * 2019-07-23 2022-03-18 北京字节跳动网络技术有限公司 预测处理中调色板模式的模式确定
US11924432B2 (en) 2019-07-20 2024-03-05 Beijing Bytedance Network Technology Co., Ltd Condition dependent coding of palette mode usage indication

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20130034566A (ko) * 2011-09-28 2013-04-05 한국전자통신연구원 제한된 오프셋 보상 및 루프 필터를 기반으로 하는 영상 부호화 및 복호화 방법 및 그 장치
SG10201900004UA (en) 2014-12-19 2019-02-27 Hfi Innovation Inc Methods of palette based prediction for non-444 color format in video and image coding
CN107211147A (zh) * 2015-01-14 2017-09-26 Vid拓展公司 用于非4:4:4屏幕内容视频的调色板编码
JP2021523586A (ja) * 2018-03-25 2021-09-02 ビー1、インスティテュート、オブ、イメージ、テクノロジー、インコーポレイテッドB1 Institute Of Image Technology, Inc. 映像符号化/復号化方法及び装置
US10949087B2 (en) 2018-05-15 2021-03-16 Samsung Electronics Co., Ltd. Method for rapid reference object storage format for chroma subsampled images
US11449256B2 (en) 2018-05-15 2022-09-20 Samsung Electronics Co., Ltd. Method for accelerating image storing and retrieving differential latency storage devices based on access rates
AU2020256658A1 (en) 2019-04-12 2021-10-28 Beijing Bytedance Network Technology Co., Ltd. Most probable mode list construction for matrix-based intra prediction
WO2020211807A1 (en) 2019-04-16 2020-10-22 Beijing Bytedance Network Technology Co., Ltd. Matrix derivation in intra coding mode
WO2020221373A1 (en) 2019-05-01 2020-11-05 Beijing Bytedance Network Technology Co., Ltd. Matrix-based intra prediction using filtering
WO2020221372A1 (en) 2019-05-01 2020-11-05 Beijing Bytedance Network Technology Co., Ltd. Context coding for matrix-based intra prediction
KR20220003078A (ko) * 2019-05-03 2022-01-07 후아웨이 테크놀러지 컴퍼니 리미티드 타일, 브릭 및 슬라이스에 대한 웨이브프론트 병렬 처리
KR20220006055A (ko) * 2019-05-11 2022-01-14 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 다중 인트라 코딩 방법 사이의 상호 작용
WO2020233663A1 (en) 2019-05-22 2020-11-26 Beijing Bytedance Network Technology Co., Ltd. Matrix-based intra prediction using upsampling
CN114051735A (zh) 2019-05-31 2022-02-15 北京字节跳动网络技术有限公司 基于矩阵的帧内预测中的一步下采样过程
EP3963885A4 (en) 2019-06-05 2022-12-14 Beijing Bytedance Network Technology Co., Ltd. DETERMINING CONTEXT FOR MATRIX-BASED INTRAPREDICTION
US11115658B2 (en) * 2019-06-25 2021-09-07 Qualcomm Incorporated Matrix intra prediction and cross-component linear model prediction harmonization for video coding
US11330306B2 (en) * 2019-08-07 2022-05-10 Tencent America LLC Method and apparatus for video coding
KR20220082847A (ko) 2019-10-28 2022-06-17 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 색상 성분에 기초한 신택스 시그널링 및 파싱
WO2021106612A1 (ja) * 2019-11-28 2021-06-03 ソニーグループ株式会社 画像処理装置および方法
KR102505301B1 (ko) * 2019-12-05 2023-03-06 한국전자통신연구원 팔레트 모드를 사용하는 영상 부호화/복호화를 위한 방법, 장치 및 기록 매체
WO2021112651A1 (ko) * 2019-12-05 2021-06-10 한국전자통신연구원 팔레트 모드를 사용하는 영상 부호화/복호화를 위한 방법, 장치 및 기록 매체
US11683489B2 (en) * 2019-12-26 2023-06-20 Qualcomm Incorporated Monochrome palette mode for video coding
CN117528122A (zh) * 2020-03-27 2024-02-06 北京达佳互联信息技术有限公司 对视频进行解码的方法、电子装置、存储介质和程序产品
US11496731B2 (en) * 2020-06-08 2022-11-08 Tencent America LLC String matching with single color value

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040151372A1 (en) * 2000-06-30 2004-08-05 Alexander Reshetov Color distribution for texture and image compression
US7343037B1 (en) * 2004-02-04 2008-03-11 Microsoft Corporation Dynamic, locally-adaptive, lossless palettization of color and grayscale images

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110110416A1 (en) * 2009-11-12 2011-05-12 Bally Gaming, Inc. Video Codec System and Method
US9558567B2 (en) * 2013-07-12 2017-01-31 Qualcomm Incorporated Palette prediction in palette-based video coding
US9906799B2 (en) 2014-06-20 2018-02-27 Qualcomm Incorporated Copy from previous rows for palette mode coding

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040151372A1 (en) * 2000-06-30 2004-08-05 Alexander Reshetov Color distribution for texture and image compression
US7343037B1 (en) * 2004-02-04 2008-03-11 Microsoft Corporation Dynamic, locally-adaptive, lossless palettization of color and grayscale images

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
D.FLYNN: "BoG report on Range Extensions topics", 《JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11 15TH MEETING: GENEVA》 *
XUN GUO,ET.AL.: "RCE4:Test 1.Major-color-based screen content coding", 《JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11 16TH MEETING: SAN JOSÉ, US》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11924432B2 (en) 2019-07-20 2024-03-05 Beijing Bytedance Network Technology Co., Ltd Condition dependent coding of palette mode usage indication
CN114208185A (zh) * 2019-07-23 2022-03-18 北京字节跳动网络技术有限公司 预测处理中调色板模式的模式确定
CN114208185B (zh) * 2019-07-23 2023-12-29 北京字节跳动网络技术有限公司 预测处理中调色板模式的模式确定

Also Published As

Publication number Publication date
KR102478411B1 (ko) 2022-12-15
CN107113436B (zh) 2020-06-23
WO2016100859A1 (en) 2016-06-23
US10097839B2 (en) 2018-10-09
US20160182913A1 (en) 2016-06-23
JP6625644B2 (ja) 2019-12-25
TWI689197B (zh) 2020-03-21
TW201633784A (zh) 2016-09-16
KR20170097655A (ko) 2017-08-28
EP3235247A1 (en) 2017-10-25
JP2018505590A (ja) 2018-02-22

Similar Documents

Publication Publication Date Title
CN107113436A (zh) 用于次取样格式的调色模式
CN106537916B (zh) 编码和解码视频数据的方法和装置及计算机可读存储介质
CN108028940A (zh) 调色板模式视频译码中转义像素信号值的限制
CN106105228B (zh) 一种处理视频数据的方法、装置及计算机可读介质
CN105874796B (zh) 用于基于调色板的视频译码的颜色索引译码
CN106797479B (zh) 对于并行处理的帧内块复制预测限制
CN106416249B (zh) 用于编码/解码视频数据的方法和装置
CN106464915B (zh) 基于调色板的视频译码中的最大调色板参数
CN106464884B (zh) 基于调色板的视频译码中的译码行程
CN106797477B (zh) 用于解码及编码视频数据的方法和设备
CN106464883B (zh) 基于调色板的视频译码中的逃脱样本译码方法、装置及设备
CN106464881B (zh) 块自适应颜色空间转换译码的方法和装置
CN107710765A (zh) 分组用于视频译码的调色盘旁通槽
CN106105200B (zh) 基于调色板的视频译码
CN105075272B (zh) 在基于调色板的视频译码中确定调色板索引的方法及设备
CN103959779B (zh) 在视频译码中用于自适应环路滤波和样本自适应偏移的基于最大译码单元(lcu)或分区的语法
CN106105207A (zh) 用于视频译码的具有行程长度码的调色板预测器信令
CN106464877A (zh) 在视频译码中确定将解块滤波应用于经调色板译码块
CN107409215A (zh) 用于视频译码的调色板模式译码
CN109196869A (zh) 帧内预测模式的基于邻近的发信号
CN106471809A (zh) 视频译码中的单一色彩调色板模式
CN108141605A (zh) 帧内块复制合并模式及不可用帧内块复制参考区域的填充
CN109716774A (zh) 用于视频译码的可变数目的帧内模式
CN110100439A (zh) 用于视频译码的帧内预测技术
CN108028932A (zh) 用于视频译码的调色板预测初始化及合并

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant