CN105308959B - 用于视频译码的自适应颜色变换 - Google Patents

用于视频译码的自适应颜色变换 Download PDF

Info

Publication number
CN105308959B
CN105308959B CN201480034283.XA CN201480034283A CN105308959B CN 105308959 B CN105308959 B CN 105308959B CN 201480034283 A CN201480034283 A CN 201480034283A CN 105308959 B CN105308959 B CN 105308959B
Authority
CN
China
Prior art keywords
video
block
color
colour switching
transformation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201480034283.XA
Other languages
English (en)
Other versions
CN105308959A (zh
Inventor
金佑植
霍埃尔·索赖·罗哈斯
马尔塔·卡切维奇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of CN105308959A publication Critical patent/CN105308959A/zh
Application granted granted Critical
Publication of CN105308959B publication Critical patent/CN105308959B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/46Colour picture communication systems
    • H04N1/64Systems for the transmission or the storage of the colour picture signal; Details therefor, e.g. coding or decoding means therefor
    • H04N1/648Transmitting or storing the primary (additive or subtractive) colour signals; Compression thereof
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/19Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding using optimisation based on Lagrange multipliers

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Color Television Systems (AREA)
  • Image Processing (AREA)

Abstract

本发明涉及一种用于对视频数据进行译码的装置,所述装置包含存储器和至少一个处理器,所述至少一个处理器经配置以:确定与关联于译码单元的多个颜色变换相关联的成本;选择所述多个颜色变换中具有最低相关联成本的颜色变换;使用所述多个颜色变换中的所述选定颜色变换变换具有第一红、绿、蓝RGB颜色空间的第一视频数据块以产生具有第二颜色空间的第二视频数据块;以及对具有所述第二颜色空间的所述第二视频块进行编码。

Description

用于视频译码的自适应颜色变换
本申请案主张2013年6月21日申请的第61/838,152号美国申请案的优先权,所述美国申请案的整个内容以全文引用方式并入本文。
技术领域
本发明涉及视频译码。
背景技术
数字视频能力可以并入到多种多样的装置中,包含数字电视、数字直播系统、无线广播系统、个人数字助理(PDA)、膝上型或桌上型计算机、平板计算机、电子图书阅读器、数码相机、数字记录装置、数字媒体播放器、视频游戏装置、视频游戏控制台、蜂窝式或卫星无线电电话(所谓的“智能电话”)、视频电话会议装置、视频流式传输装置及类似者。数字视频装置实施视频译码技术,例如通过MPEG-2、MPEG-4、ITU-T H.263、ITU-T H.264/MPEG-4第10部分高级视频译码(AVC)、高效率视频译码(HEVC)标准及此类标准的扩展(例如,可缩放视频译码(SVC)、多视图视频译码(MVC)和范围扩展)定义的标准中描述的技术。视频装置可通过实施这些视频译码技术而更有效率地发射、接收、编码、解码和/或存储数字视频信息。
视频译码技术包含空间(图片内)预测及/或时间(图片间)预测以减少或移除视频序列中固有的冗余。对于基于块的视频译码来说,视频切片(例如,视频帧或视频帧的一部分)可分割成视频块,视频块还可被称作树块、译码树单元(CTU)、译码单元(CU)和/或译码节点。使用相对于同一图片中的相邻块中的参考样本的空间预测对图片的经帧内译码(I)切片中的视频块进行编码。图片的经帧间译码(P或B)切片中的视频块可使用关于同一图片中的相邻块中的参考样本的空间预测或关于其它参考图片中的参考样本的时间预测。图片可被称作帧,且参考图片可被称作参考帧。
空间或时间预测导致用于待译码块的预测块。残余数据表示待译码原始块与预测性块之间的像素差。经帧间译码块是根据指向形成预测性块的参考样本的块的运动向量和指示经译码块与预测性块之间的差的残余数据来编码。经帧内译码块是根据帧内译码模式和残余数据而编码。为了实现进一步压缩,可以将残余数据从像素域变换到变换域,从而产生残余变换系数,接着可以对残余变换系数进行量化。可以扫描最初用二维阵列布置的经量化变换系数,以便产生变换系数的一维向量,并且可以应用熵译码以实现更多的压缩。
发明内容
一般来说,本发明描述与视频译码器相关的技术,所述视频译码器经配置以在具有第一颜色空间的视频数据块的样本与具有第二颜色空间的样本块之间变换。所述颜色空间可包含RGB(红、绿、蓝)、YCbCr、YCgCo或另一颜色空间。作为视频预处理的部分,可能需要以具有RGB颜色空间的视频来工作。一旦预处理完成,所述视频便常常转换到不同颜色空间,例如YCbCr格式。从一个颜色空间(例如,RGB)到另一颜色空间的颜色转换可造成颜色失真,用户可将其感知为主观质量降级。本发明的技术中的一或多者是针对当将视频从RGB视频输入源压缩为具有不同颜色空间的视频(反之亦然)时可改善压缩效率和/或减少失真的颜色变换。
根据本发明的技术,一种对视频数据进行编码的方法包含:确定与关联于译码单元的多个颜色变换相关联的成本;以及选择所述多个颜色变换中具有最低相关联成本的颜色变换。所述方法进一步包含:使用所述多个颜色变换中的所述选定颜色变换自适应地变换具有第一红、绿、蓝(RGB)颜色空间的第一视频数据块以产生具有第二颜色空间的第二视频数据块;以及对具有所述第二颜色空间的所述第二视频块进行编码。
在根据本发明的技术的另一实例中,一种对视频数据进行解码的方法包含:在位流中接收与经译码单元相关联的语法数据,所述语法数据指示多个逆颜色变换中的一者;基于所述所接收语法数据选择所述多个逆颜色变换中的逆颜色变换;使用所述多个逆颜色变换中的所述选定逆颜色变换将具有第一颜色空间的第一视频数据块逆变换到具有第二红、绿、蓝(RGB)颜色空间的第二视频块;以及对具有所述第二RGB颜色空间的所述第二视频块进行解码。
本发明的另一实例描述一种用于对视频数据进行编码的装置,所述装置包含:存储器,其经配置以存储视频数据;以及至少一个处理器,其经配置以:确定与关联于译码单元的多个颜色变换相关联的成本;选择所述多个颜色变换中具有最低相关联成本的颜色变换;使用所述多个颜色变换中的所述选定颜色变换变换具有第一红、绿、蓝(RGB)颜色空间的第一视频数据块以产生具有第二颜色空间的第二视频数据块;以及对具有所述第二颜色空间的所述第二视频块进行编码。
本发明的另一实例描述一种用于对视频数据进行解码的装置,所述装置包含:存储器,其经配置以存储视频数据;以及至少一个处理器,其经配置以:在位流中接收与经译码单元相关联的语法数据,所述语法数据指示多个逆颜色变换中的一者;基于所述所接收语法数据选择所述多个逆颜色变换中的逆颜色变换;使用所述多个逆颜色变换中的所述选定逆颜色变换将具有第一颜色空间的第一视频数据块逆变换到具有第二红、绿、蓝(RGB)颜色空间的第二视频块;以及对具有所述第二RGB颜色空间的所述第二视频块进行解码。
本发明的另一实例描述一种用于对视频进行解码的装置。所述装置包含:用于在位流中接收与经译码单元相关联的语法数据的装置,所述语法数据指示多个逆颜色变换中的一者;用于基于所述所接收语法数据选择所述多个逆颜色变换中的逆颜色变换的装置;用于使用所述多个逆颜色变换中的所述选定逆颜色变换将具有第一颜色空间的第一视频数据块逆变换到具有第二红、绿、蓝(RGB)颜色空间的第二视频块的装置;以及用于对具有所述第二RGB颜色空间的所述第二视频块进行解码的装置。
在另一实例中,一种非暂时性计算机可读存储媒体具有存储于其上的指令,所述指令当执行时致使至少一个处理器:在位流中接收与经译码单元相关联的语法数据,所述语法数据指示多个逆颜色变换中的一者;基于所述所接收语法数据选择所述多个逆颜色变换中的逆颜色变换;使用所述多个逆颜色变换中的所述选定逆颜色变换将具有第一颜色空间的第一视频数据块逆变换到具有第二红、绿、蓝(RGB)颜色空间的第二视频块;以及对具有所述第二RGB颜色空间的所述第二视频块进行解码。
在随附图式及以下描述中阐述一或多个实例的细节。其它特征、目标和优点将从所述描述、图式以及权利要求书而显而易见。
附图说明
图1是说明可实施本发明的一或多个技术的实例视频编码和解码系统的框图。
图2是说明根据本发明的一或多个方面的可实施用于使用颜色变换将具有RGB颜色空间的视频数据块变换为具有第二颜色空间的视频数据块的技术的实例视频编码器的框图。
图3是说明根据本发明的一或多个方面的可实施用于使用颜色空间将具有第一颜色空间的视频数据变换到具有第二RGB颜色空间的视频数据的技术的视频解码器的实例的框图。
图4是说明根据本发明的一或多个方面的可利用用于使用颜色变换将具有RGB颜色空间的视频数据变换到具有第二颜色空间的视频数据的技术的视频编码器的另一实例的框图。
图5是说明根据本发明的一或多个方面的可利用用于使用逆颜色变换将具有第一颜色空间的视频数据块逆变换到具有第二RGB颜色空间的视频数据视频数据块的技术的视频解码器的另一实例的框图。
图6是说明根据本发明的一或多个方面的用于使用颜色变换将具有RGB颜色空间的视频数据变换到具有第二颜色空间的视频数据的过程的流程图。
图7是说明根据本发明的一或多个方面的用于使用逆颜色变换将具有第一颜色空间的视频数据块变换到具有第二RGB颜色空间的视频数据块的过程的流程图。
图8是说明用于将具有第一颜色空间的原始视频数据块逆变换到具有第二RGB颜色空间的视频数据块的过程的流程图。
图9是说明用于将具有第一颜色空间的残余视频数据块逆变换到具有第二RGB颜色空间的视频数据块的过程的流程图。
图10是说明用于将具有第一颜色空间的原始视频数据块变换到具有第二RGB颜色空间的视频数据块的过程的流程图。
图11是说明用于将具有第一颜色空间的残余视频数据块变换到具有第二RGB颜色空间的视频数据块的过程的流程图。
具体实施方式
视频译码器(即,视频编码器或解码器)大体上经配置以对大体上表示为图片序列的视频序列进行译码。通常,视频译码器使用基于块的译码技术对图片序列中的每一者进行译码。作为基于块的视频译码的部分,视频译码器将视频序列的每一图片划分为数据块。视频译码器个别地对块中的每一者进行译码(即,编码或解码)。对视频数据块进行编码大体上涉及通过产生原始块的一或多个预测性块以及对应于原始块与所述一或多个预测性块之间的差的残余块来对原始数据块进行编码。具体来说,原始视频数据块包含由“样本”的一或多个通道组成的像素值的矩阵,且预测性块包含其中的每一者也由预测性样本组成的经预测像素值的矩阵。残余块的每一样本指示预测性块的样本与原始块的对应样本之间的差。
用于视频数据块的预测技术一般分类为帧内预测及帧间预测。帧内预测(即,空间预测)大体上涉及从相邻经先前译码块的像素值预测块。帧间预测大体上涉及从经先前译码图片的像素值预测块。
每一视频数据块的像素各自表示特定格式的颜色,称为“颜色空间”。换句话说,块“具有”特定颜色空间。颜色空间也可被称作“彩色空间”。颜色空间是描述其中颜色可表示为数字的元组的方式的数学模型。不同视频译码标准可使用不同颜色空间用于表示视频数据。作为一个实例,由视频译码联合合作小组(JCT-VC)开发的高效率视频译码(HEVC)视频标准的主简档使用YCbCr颜色空间来表示视频数据块的像素。
YCbCr颜色空间大体上指代其中视频数据的每一像素由颜色信息的三个样本分量或通道“Y”、“Cb”和“Cr”表示的颜色空间。Y通道含有特定样本的明度(即,亮度)数据。Cb和Cr分量分别是蓝色差和红色差色度分量。YCbCr常常用以表示经压缩视频数据中的颜色,因为Y、Cb和Cr分量中的每一者之间存在强去相关,意味着Y、Cb和Cr通道中的每一者之间存在极少的重复或冗余的数据。使用YCbCr颜色空间对视频数据进行译码因此在许多情况下提供良好压缩性能。
另外,许多视频译码技术利用称为“色度子取样”的技术来进一步改善颜色数据的压缩。色度子取样指代针对块使用比明度信息少的色度信息对视频数据块进行译码,即相对于同一块中的明度样本的数目使用较少色度样本。具有YCbCr颜色空间的视频数据的色度子取样通过根据模式选择性省略色度分量而减少经译码视频位流中用信号表示的色度值的数目。在经色度子取样视频数据的块中,所述块的每一像素大体上存在明度样本。然而,视频译码器可仅用信号表示所述块的一些像素的Cb和Cr样本。
经配置以用于色度子取样的视频译码器内插像素的Cb和Cr分量,其中Cb和Cr值针对像素的经色度子取样块不显式地用信号表示。色度子取样良好起作用以减少色度数据量而不会在较均匀的像素块中引入许多失真。色度子取样良好起作用以表示具有广泛不同色度值的视频数据,且在那些情况中可引入大量失真。
作为对HEVC标准的扩展的HEVC范围扩展针对额外颜色空间和色度子取样格式以及针对增加的颜色位深度为HEVC添加支持。颜色位深度是用以表示颜色空间的分量的位数目。对其它颜色空间的支持可包含对编码和解码视频数据的RGB来源的支持以及对译码具有其它颜色空间的视频数据的支持。
对于一些应用,例如视频预处理应用,在HEVC视频中使用除YCbCr外的颜色空间可为有用的。高保真度视频源(例如,视频相机)可使用RGB颜色空间、使用可对应于红、绿和蓝颜色通道中的每一者的单独电荷耦合装置(CCD)俘获视频数据。RGB颜色空间(且具体来说RGB 4:4:4颜色空间)将每一像素表示为红、绿和蓝颜色样本的组合。
视频处理软件和预处理应用程序可与RGB颜色空间而不是颜色分量(例如YCbCr颜色空间的分量)较好地工作或可仅与其兼容。另外,一些RGB颜色空间可包含每一像素的R、G和B样本中的每一者,即视频译码器可不执行色度子取样。无色度子取样的视频块与使用色度子取样格式的视频块相比可具有较好的主观视觉质量。
然而,RGB经受的缺点在于红、绿和蓝颜色分量中的每一者之间存在显著相关。由于RGB颜色空间中的相对较高颜色相关,表示具有RGB颜色空间的视频数据块所需的数据量可比使用其它颜色空间表示的视频数据块大得多。
为了改善压缩性能,根据本发明的技术中的一或多者配置的视频译码器可将具有例如RGB颜色空间的第一颜色空间的视频数据块转换到具有例如YCbCr或另一颜色空间等不同颜色空间的视频块,反之亦然。然而,在RGB与另一颜色空间之间转换可引入失真,其可对视频质量具有不利影响。失真可为第一与第二颜色空间之间的不同位深度的结果。根据本发明的技术中的一或多者配置的视频译码器也可能将视频数据从RGB转换到不同颜色空间而不引入任何失真。本发明的技术中的一或多者是针对用于使用颜色变换将具有RGB颜色空间的视频数据变换到第二颜色空间以压缩RGB视频数据而不引入过量失真的技术。
本发明的技术中的一或多者使用颜色变换将具有第一颜色空间的视频数据块变换到具有第二颜色空间的视频数据块。在一些实例中,颜色变换是矩阵,其当与颜色空间的样本矩阵相乘时产生具有与颜色变换矩阵相关联的颜色空间的像素。在一些实例中,颜色变换可包括一或多个方程式。本发明的技术中的一或多者进一步针对可经配置以自适应地变换具有RGB颜色空间的视频数据块以产生具有第二颜色空间的视频数据块的视频译码器。第二颜色空间可为当在颜色空间之间变换样本时视频译码器可从中进行选择的多个颜色空间中的一者。
为了确定所述一或多个颜色空间中的哪一者来变换具有RGB颜色空间的视频数据,视频译码器可例如基于某个度量自适应地选择变换。在一些实例中,视频译码器可确定与颜色变换中的每一者相关联的成本值,且可确定产生最低成本的颜色变换。在另一实例中,所述成本可基于RGB视频数据块的颜色分量中的每一者与第二颜色空间的颜色分量之间的相关。具有最低相关联成本的颜色变换可为具有与源视频的RGB颜色分量最紧密相关的颜色分量的颜色变换。在一些实例中,视频解码器可基于从视频编码器接收的语法数据选择逆颜色变换。所述语法数据可指示所述一或多个颜色变换的逆颜色变换以应用于视频数据的经译码单元的一或多个块。
HEVC视频译码标准界定树状结构,其界定视频数据块。本发明的技术可应用于HEVC树状结构的多种不同分量。在HEVC中,视频译码器基于树状结构将经译码图片(也被称作“帧”)分成块。此些块可被称为树块。在一些情况下,树块还可称为最大译码单元(LCU)。HEVC的树块可大致类似于例如H.264/AVC等先前视频译码标准的宏块。然而,不同于一些视频译码标准的宏块,树块不限于某一大小(例如,某一数目的像素)。树块可包含一或多个译码单元(CU),其可递归地划分成子译码单元(子CU)。
每一CU可包含一或多个变换单元(TU)。每一TU可包含已经变换的残余数据。另外,每一CU可包含一或多个预测单元(PU)。PU包含与CU的预测模式相关的信息。本发明的技术可将颜色变换应用于块,例如LCU、CU、子CU、PU、TU、宏块、宏块分区、子宏块或其它类型的视频数据块中的一或多者。
视频译码器可经配置以在视频译码过程的不同阶段执行本发明的技术。在一个实例中,视频编码器可将颜色变换应用于输入视频信号,例如具有RGB颜色空间的视频块。视频编码器可随后对具有第二颜色空间的经变换块操作。举例来说,视频编码器可对经变换块进行编码。在解码期间,视频解码器可执行大体上互逆过程以重构具有第二颜色空间的块,且可恰在输出经重构图片之前应用逆颜色变换。
在另一实例中,根据本发明的技术配置的视频编码器可使用所述多个颜色变换中的选定颜色变换将具有RGB颜色空间的残余视频数据块变换到具有第二颜色空间的第二视频数据块。以类似方式配置的视频解码器可将所述多个颜色变换中的选定逆颜色变换应用于具有第二颜色空间的残余数据块以将所述块变换为具有RGB颜色空间的残余数据块。
视频译码器可以若干不同方式用信号表示或确定特定颜色变换已应用于视频数据块。在一个实例中,视频译码器可针对每一块译码(即,编码或解码)指示所述多个颜色变换中的选定变换用以变换块以及与所述视频数据块相关联的颜色空间的数据(例如,索引值)。索引值还可指示视频解码器应当应用于逆变换所述块的选定逆颜色变换。
在第二实例中,视频编码器可确定单个颜色变换应用以变换图片的每一块。在此实例中,视频译码器可基于个别基础确定是否将颜色变换应用于图片的块中的每一者,例如使用本发明中在别处描述的基于成本的准则中的一或多者。视频译码器可随后对指示所述单个变换是否已应用于CVS的块中的每一者的数据进行译码。编码器对例如旗标语法元素等数据进行编码,所述数据指示所述单个颜色变换已应用于一个块或多个块,或所述单个颜色变换尚未应用于所述块或多个块(即,没有变换已应用于所述块)。视频解码器对指示所述单个颜色变换已应用于所述块或多个块或所述单个颜色变换尚未应用于所述块或多个块的数据进行解码,且将逆颜色变换应用于所述块。在这些实例中,第一旗标值可指示变换已应用,而所述旗标语法元素的第二不同值可指示没有变换已应用。
在一些实例中,视频编码器确定单个颜色变换应当应用于CVS的图片的块中的每一者。换句话说,视频编码器选择单个颜色变换以应用于CVS的全部图片的全部块。视频编码器使用所确定的单个颜色变换变换CVS的块中的每一者。使用所述单个颜色变换变换CVS的图片的全部块,且没有块未经变换。因为全部块是使用所确定的颜色变换而变换,所以视频译码器对指示特定块已使用所确定的颜色变换经变换的任何数据进行译码可为不必要的。
本发明的颜色变换可包含但不一定限于恒等变换、差分变换、经加权差分变换、离散余弦变换(DCT)、YCbCr变换、YCgCo变换、YCgCo-R变换和/或本文未具体描述的变换。应用恒等变换可与根本不应用变换相同。
为了将颜色变换应用于具有RGB颜色空间的视频数据块,视频编码器可将3x1矩阵与颜色变换矩阵相乘。所述3x1矩阵可包括红、绿和蓝颜色分量。所述矩阵乘法的结果是具有第二颜色空间的像素或像素集合。视频译码器可将颜色变换矩阵应用于视频块的每一像素。视频译码器可基于成本准则选择适当矩阵,如本发明中在别处所描述。
在解码期间,根据本发明的技术中的一或多者配置的视频解码器可基于经译码视频位流中用信号表示的数据选择逆变换矩阵。另外,视频译码器可将3x1矩阵与逆变换矩阵相乘。所述3x1矩阵可包括第二颜色空间的像素数据。所述乘法的结果是RGB颜色空间中的像素。
图1是说明根据本发明的一或多个方面的可实施用于使用颜色变换将具有第一表示的视频数据变换到具有第二颜色空间的视频数据的技术的实例视频编码和解码系统10的框图。
图1是说明根据本发明的一或多个方面的可实施用于使用颜色变换而变换具有第一空间的视频数据块以产生具有具有第二颜色空间的数据的第二视频块的技术的实例视频编码和解码系统的框图。在图1的实例中,源装置12包含视频源18、视频编码器20和输出接口22。目的地装置14包含输入接口28、视频解码器30和显示装置32。在其它实例中,源装置和目的地装置可包含其它组件或布置。举例来说,源装置12可从外部视频源18(例如,外部相机)接收视频数据。同样地,目的地装置14可以与外部显示装置介接,而不是包含集成显示装置。根据本发明,源装置12的视频编码器20可经配置以应用使用多个颜色变换中的颜色变换将具有第一颜色空间的第一数据块变换到具有第二颜色空间的第二视频数据块的技术,且对具有第二颜色空间的第二视频块进行译码。
明确地说,源装置12经由计算机可读媒体16将视频数据提供到目的地装置14。源装置12及目的地装置14可包括多种多样的装置中的任一者,包含桌上型计算机、笔记型(即,膝上型)计算机、平板计算机、机顶盒、电话手持机(例如所谓的“智能”电话)、所谓的“智能”平板计算机、电视机、相机、显示装置、数字媒体播放器、视频游戏控制台、视频流式传输装置或类似者。在一些情况下,源装置12和目的地装置14可经装备以用于无线通信。
目的地装置14可经由计算机可读媒体16接收待解码的经编码的视频数据。计算机可读媒体16可包括能够将经编码视频数据从源装置12移动到目的地装置14的任何类型的媒体或装置。在一个实例中,计算机可读媒体16可包括使得源装置12能够实时将经编码的视频数据直接发射到目的地装置14的通信媒体。计算机可读媒体16可包含瞬时媒体,例如无线广播或有线网络发射,或存储媒体(即,非暂时性存储媒体),例如硬盘、快闪驱动器、压缩光盘、数字视频光盘、蓝光光盘或其它计算机可读媒体。在一些实例中,网络服务器(未图示)可以从源装置12接收经编码视频数据,并且例如经由网络发射将经编码视频数据提供到目的地装置14。类似地,媒体生产设施(例如光盘冲压设施)的计算装置可以从源装置12接收经编码的视频数据并且生产容纳经编码的视频数据的光盘。因此,在各种实例中,计算机可读媒体16可以理解为各种形式的一或多个计算机可读媒体。
经编码视频数据可以根据通信标准(例如,无线通信协议)来调制,并且被发射到目的地装置14。通信媒体可包括任何无线或有线通信媒体,例如射频(RF)频谱或一或多个物理发射线路。通信媒体可形成基于包的网络(例如局域网、广域网或全球网络,例如因特网)的一部分。通信媒体可包含路由器、交换器、基站或任何其它可以用于促进从源装置12到目的地装置14的通信的设备。
在一些实例中,输出接口22可将经编码数据输出到存储装置。类似地,输入接口28可从存储装置存取经编码数据。存储装置可包含多种分布式或本地存取的数据存储媒体中的任一者,例如硬盘驱动器、蓝光光盘、DVD、CD-ROM、快闪存储器、易失性或非易失性存储器或任何其它用于存储经编码的视频数据的合适的数字存储媒体。在另一实例中,存储装置可以对应于文件服务器或可存储由源装置12产生的经编码视频的另一中间存储装置。目的地装置14可(例如,经由流式传输或下载)从存储装置存取经存储的视频数据。文件服务器可为能够存储经编码的视频数据且将经编码的视频数据发射到目的地装置14的任何类型的服务器。实例文件服务器包含网络服务器(例如,用于网站)、FTP服务器、网络附接存储(NAS)装置、超文本传送协议(HTTP)流式传输服务器或局部磁盘驱动器。目的地装置14可通过标准数据连接(包含因特网连接)来存取经编码视频数据。此可包含适合于存取存储于文件服务器上的经编码的视频数据的无线信道(例如,Wi-Fi连接)、有线连接(例如,DSL、电缆调制解调器等)或两者的组合。经编码视频数据从存储装置的传输可能是流式传输发射、下载发射或其组合。
本发明的技术不必限于无线应用或设置。所述技术可以应用于视频译码并且支持多种多媒体应用中的任一者,例如空中协议电视广播、有线电视发射、卫星电视发射、因特网流式传输视频发射(例如动态自适应HTTP流式传输(DASH))、经编码到数据存储媒体上的数字视频,存储在数据存储媒体上的数字视频的解码,或其它应用。在一些实例中,系统10可经配置以支持单向或双向视频发射,以支持例如视频流式传输、视频重放、视频广播和/或视频电话等应用。
图1的系统10仅是一个实例。用于使用多个颜色变换中的颜色变换将具有第一颜色空间的数据块变换到具有第二颜色空间的第二视频数据块的技术可由任何数字视频编码和/或解码装置执行。尽管本发明的技术总体上由视频编码装置执行,但是所述技术还可通过视频编码器/解码器(通常被称作“编解码器”)执行。此外,本发明的技术还可通过视频预处理器执行。源装置12及目的地装置14仅为这些译码装置的实例,其中源装置12产生用于发射到目的地装置14的经译码视频数据。在一些实例中,装置12、14可以实质上对称的方式操作,使得装置12、14中的每一者包含视频编码和解码组件。因此,系统10可支持视频装置12、14之间的单向或双向视频发射,例如用于视频流式传输、视频重放、视频广播或视频电话。
源装置12的视频源18可包含视频俘获装置,例如摄像机、含有先前所俘获视频的视频存档及/或用于从视频内容提供者接收视频的视频馈送接口。在一些实例中,视频源18产生基于计算机图形的数据作为源视频,或实况视频、所存档视频和计算机产生的视频的组合。在一些情况下,视频源18可为摄像机。在一些实例中,视频源18可为摄像机。在一些实例中,源装置12和目的地装置14可为所谓的相机电话或视频电话。在各种实例中,视频源18可输出具有RGB颜色空间的输入信号。然而,如上文所提及,本发明中所描述的技术可大体上适用于视频译码,且可应用于无线及/或有线应用。在每一情况下,可由视频编码器20来编码经俘获的、经预先俘获的或计算机产生的视频。输出接口22可将经编码视频信息输出到计算机可读媒体16上。
计算机可读媒体16可包含瞬时媒体,例如无线广播或有线网络发射,或存储媒体(即,非暂时性存储媒体),例如硬盘、快闪驱动器、压缩光盘、数字视频光盘、蓝光光盘或其它计算机可读媒体。在一些实例中,网络服务器(未图示)可以从源装置12接收经编码视频数据,并且例如经由网络发射将经编码视频数据提供到目的地装置14。类似地,媒体生产设施(例如光盘冲压设施)的计算装置可以从源装置12接收经编码的视频数据并且生产容纳经编码的视频数据的光盘。因此,在各种实例中,计算机可读媒体16可以理解为包含各种形式的一或多个计算机可读媒体。
在图1的实例中,目的地装置14的输入接口28从计算机可读媒体16接收信息。计算机可读媒体16的信息可包含由视频编码器20界定的语法信息,其包含描述块和其它经译码单元(例如,GOP)的特性和/或处理的语法元素。显示装置32向用户显示经解码视频数据。显示装置32可包括多种显示装置中的任一者,例如阴极射线管(CRT)显示器、液晶显示器(LCD)、等离子显示器、有机发光二极管(OLED)显示器,或另一类型的显示装置。
视频编码器20及视频解码器30可根据由视频译码联合合作小组(JCT-VC)开发的视频译码标准操作,所述视频译码标准例如最近完成的高效率视频译码(HEVC)以及HEVC范围扩展。或者,视频编码器20和视频解码器30可以根据其它专有或业界标准来操作,所述标准例如是ITU-T H.264标准,也被称为MPEG-4第10部分高级视频译码(AVC),或此类标准的扩展。然而,本发明的技术不限于任何特定译码标准。视频译码标准的其它实例包含MPEG-2和ITU-T H.263。
尽管图1中未展示,但在一些方面中,视频编码器20及视频解码器30可各自与音频编码器及解码器集成,并且可包含适当多路复用器-多路分用器(MUX-DEMUX)单元或其它硬件及软件,以处置对共同数据流或单独数据流中的音频及视频两者的编码。如果适用的话,MUX-DEMUX单元可符合ITU H.223多路复用器协议,或例如用户数据报协议(UDP)等其它协议。
视频编码器20和视频解码器30各自可实施为例如一或多个微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑、软件、硬件、固件或其任何组合等多种合适的编码器电路中的任一者。当部分以软件实施所述技术时,装置可将用于所述软件的指令存储于合适的非暂时性计算机可读媒体中并使用一或多个处理器用硬件执行所述指令以执行本发明的技术。视频编码器20和视频解码器30中的每一者可包含在一或多个编码器或解码器中,所述编码器或解码器中的任一者可以集成为相应装置中的组合编码器/解码器(编解码器)的部分。
视频序列通常包含一系列视频帧或图片。图片群组(GOP)一般包括一系列的视频图片中的一或多者。GOP可包含描述GOP中所包含的图片数目的GOP的标头中、图片中的一或多者的标头中或别处的语法数据。图片的每一切片可包含描述用于相应的切片的编码模式的切片语法数据。视频编码器20通常对个别视频切片内的视频块进行操作以便编码视频数据。
HEVC描述视频帧或图片可划分成树块(即,最大译码单元(LCU)或“译码树单元”(CTU))的序列。树块可包含明度和/或色度样本。位流内的语法数据可界定LCU的大小,LCU是在像素数目方面的最大译码单元。在一些实例中,CTU中的每一者包括明度样本的译码树块、色度样本的两个对应的译码树块,以及用以对译码树块的样本进行译码的语法结构。在单色图片或具有三个单独颜色平面的图片中,CTU可包括单个译码树块及用于对所述译码树块的样本进行译码的语法结构。译码树块可为样本的NxN块。视频帧或图片可以被分割成一或多个切片。切片包含呈译码次序(例如,光栅扫描次序)的若干连续树块。
每一树块可根据四叉树分裂成一或多个译码单元(CU)。总的来说,四叉树数据结构包含每个CU一个节点,其中根节点对应于所述树块。如果CU分裂成四个子CU,那么对应于CU的节点包含四个叶节点,其中叶节点中的每一者对应于所述子CU中的一者。
四叉树数据结构的每一节点可提供对应CU的语法数据。举例来说,四叉树中的节点可包含分裂旗标,从而指示对应于所述节点的所述CU是否分裂成子CU。用于CU的语法元素可以递归地来定义,且可以取决于CU是否分裂成子CU。如果CU未进一步分裂,那么所述CU称为叶CU。
视频编码器20可对CTU的译码树块递归地执行四叉树分割以将译码树块划分为译码块,因此名称为“译码树单元”。译码块可以是样本的NxN块。在一些实例中,CU包括具有明度样本阵列、Cb样本阵列和Cr样本阵列的图片的明度样本的译码块以及色度样本的两个对应的译码块,以及用以对译码块的样本进行译码的语法结构。在单色图片或具有三个单独颜色平面的图片中,CU可包括单个译码块及用于对所述译码块的样本进行译码的语法结构。
CU具有类似于H.264标准的宏块的用途,但是CU并不具有大小区别。举例来说,树块可分裂成四个子节点(也被称作子CU),且每一子节点又可为父节点且可分裂成另外四个子节点。最后的未经分裂子节点(被称作四叉树的叶节点)包括译码节点,也称为叶CU。与经译码位流相关联的语法数据可界定树块可分裂的最大次数,被称作最大CU深度,且还可界定译码节点的最小大小。因此,位流还可定义最小译码单元(SCU)。本发明使用术语“块”指代HEVC的上下文中可进一步包含一或多个预测单元(PU)或变换单元(TU)的CU或其它标准的上下文中的相似数据结构(例如,H.264/AVC中的宏块及其子块)中的任一者。
CU包含一或多个预测单元(PU)和一或多个变换单元(TU)。CU的大小对应可为正方形或矩形形状。CU的大小范围可从8x8像素到具有最大64x64像素或更大的树块的大小。举例来说,与CU相关联的语法数据可描述CU到一或多个PU的分割。分割模式可在CU被跳过或经直接模式编码、帧内预测模式编码或帧间预测模式编码之间有区别。CU可经分割以使得CU的PU可为非正方形形状。举例来说,与CU相关联的语法数据还可描述CU根据四叉树分割成一或多个TU。
视频编码器20可以将CU的译码块分割成一或多个预测块。预测块可为应用相同预测的样本的矩形(即,正方形还是非正方形)块。CU的PU可包括图片的明度样本的预测块、图片的色度样本的两个对应的预测块,以及用以对预测块样本进行预测的语法结构。在单色图像或具有三个单独彩色平面的图片中,PU可包括单个预测块,及用以对预测块样本进行预测的语法结构。
变换块可以是对其应用相同变换的样本的矩形块。CU的变换单元(TU)可包括明度样本的变换块、色度样本的两个对应变换块及用以对变换块样本进行变换的语法结构。因此,CU的每一TU可具有明度变换块、Cb变换块以及Cr变换块。TU的明度变换块可为CU的明度残余块的子块。Cb变换块可以是CU的Cb残余块的子块。Cr变换块可以是CU的Cr残余块的子块。在单色图像或具有三个单独彩色平面的图片中,TU可包括单个变换块,及用以对变换块样本进行变换的语法结构。TU可以是正方形或非正方形(例如,矩形)形状。换句话说,对应于TU的变换块可为正方形或非正方形形状。
HEVC标准允许根据TU进行的变换,TU可针对不同CU而有所不同。TU的大小通常是基于针对经分割LCU定义的给定CU内的PU的大小而确定,但情况可能并非始终如此。TU通常与PU大小相同或小于PU。在一些实例中,对应于CU的残余样本可使用被称为“残余四叉树”(RQT)的四叉树结构细分成较小单元。RQT的叶节点可被称作变换单元(TU)。可变换与TU相关联的像素差值以产生可经量化的变换系数。
总的来说,PU表示对应于对应CU的全部或一部分的空间区域,并且可包含用于检索PU的参考样本的数据。此外,PU包含与预测有关的数据。在一些实例中,可使用帧内模式或帧间模式对PU进行编码。作为另一实例,当PU经帧间模式编码时,PU可包含界定PU的一或多个运动向量的数据。界定PU的运动向量的数据可描述(例如)运动向量的水平分量、运动向量的垂直分量、运动向量的分辨率(例如,四分之一像素精度或八分之一像素精度)、运动向量所指向的参考图片,及/或运动向量的参考图片列表(例如,列表0、列表1或列表C)。
如上文所指出,具有一或多个PU的叶CU也可包含一或多个TU。TU可以使用RQT(还被称作TU四叉树结构)来指定,如上文所论述。举例来说,分裂旗标可以指示叶CU是否分裂成四个变换单元。随后,每一TU可进一步分裂为另外的若干子TU。当TU未进一步分裂时,其可被称作叶TU。通常,对于帧内译码,所有属于叶CU的叶TU共享相同的帧内预测模式。也就是说,通常应用相同帧内预测模式来计算叶CU的所有TU的预测值。对于帧内译码,视频编码器可以使用帧内预测模式针对每一叶TU计算残余值,作为CU的对应于TU的部分与原始块之间的差。TU不一定限于PU的大小。因此,TU可比PU大或小。对于帧内译码,PU可与同一CU的对应叶TU位于同一地点。在一些实例中,叶TU的最大大小可以对应于对应的叶CU的大小。
此外,叶CU的TU也可以与称为RQT的相应四叉树数据结构相关联。即,叶CU可包含指示叶CU如何分割成TU的四叉树。TU四叉树的根节点总体上对应于叶CU,而CU四叉树的根节点总体上对应于树块。未经分裂的RQT的TU被称作叶TU。一般来说,除非另有陈述,否则本发明分别使用术语CU和TU来指代叶CU和叶TU。
PU和TU两者可含有(即,对应于)对应于与所述块相关联的颜色空间的通道中的每一者的一或多个样本块。PU的块可包含预测性块的样本,且TU的块可为包含对应于原始块与预测性块之间的差的残余样本的块。对于与YCbCr颜色空间相关联的块,明度样本的块可对应于“Y”通道,且色度块的两个不同通道可分别对应于Cb和Cr通道。
作为一实例,HEVC支持各种PU大小的预测。假设特定CU的大小为2Nx2N,那么HEVC支持2Nx2N或NxN的PU大小的帧内预测,及2Nx2N、2NxN、Nx2N或NxN的对称PU大小的帧间预测。HEVC还支持用于2NxnU、2NxnD、nLx2N和nRx2N的PU大小的帧间预测的不对称分割。在不对称分割中,不分割CU的一个方向,而另一方向分割成25%及75%。CU的对应于25%分区的部分通过“n”接着是“向上”、“向下”、“左”或“右”的指示来指示。因而,举例来说,“2NxnU”是指水平地分割的2Nx2N CU,其中上方有2Nx0.5N PU,而下方有2Nx1.5N PU。
在本发明中,“NxN”与“N乘N”可互换地使用以依据垂直和水平尺寸来指代视频块的像素尺寸,例如,16x16像素或16乘16像素。一般来说,16x16块在垂直方向上具有16个像素(y=16),且在水平方向上具有16个像素(x=16)。同样地,NxN块一般在垂直方向上具有N个像素,且在水平方向上具有N个像素,其中N表示非负整数值。块中的像素可按行及列布置。此外,块未必需要在水平方向与垂直方向上具有相同数目个像素。举例来说,块可包括NxM像素,其中M未必等于N。
在使用CU的PU进行帧内预测译码或帧间预测译码之后,视频编码器20或视频解码器30可计算用于CU的TU的残余数据。PU可包括描述在空间域(还称为像素域)中产生预测性像素数据的方法或模式的语法数据,并且TU可包括在对残余视频数据应用了变换(例如离散余弦变换(DCT)、整数变换、小波变换或概念上类似的变换)变换域中的系数。残余数据可对应于未经编码图片的像素与对应于PU的预测值之间的像素差。视频编码器20或视频解码器30可形成包含用于CU的残余数据的TU,且接着变换TU以生成用于CU的变换系数。换句话说,视频编码器20可将变换应用于TU的变换块以产生TU的变换系数块。视频解码器30可将逆变换应用于TU的变换系数块以重构TU的变换块。
在应用变换(如果存在)以产生变换系数后,视频编码器20或视频解码器30可执行变换系数的量化。换句话说,视频编码器20可量化变换系数块的变换系数。视频解码器30可解量化变换系数块的变换系数。量化通常是指变换系数经量化以可能减少用于表示系数的数据量从而提供进一步压缩的过程。量化过程可减少与系数中的一些或全部相关联的位深度。举例来说,n位值可在量化期间被下舍入到m位值,其中n大于m。逆量化(即,解量化)可增加系数中的一些或全部的位深度。
在量化之后,视频编码器20可扫描变换系数,从包含经量化变换系数的二维矩阵产生一维向量。所述扫描可经设计以将较高能量(并且因此较低频率)系数放置在阵列的前面,并且将较低能量(并且因此较高频率)系数放置在阵列的后面。在一些实例中,视频编码器20或视频解码器30可利用预定义的扫描次序来扫描经量化的变换系数以产生可经熵编码的串行化向量。在其它实例中,视频编码器20或视频解码器30可执行自适应扫描。在扫描经量化的变换系数以形成一维向量之后,视频编码器20或视频解码器30可以例如根据上下文自适应二进制算术译码(CABAC)、上下文自适应可变长度译码(CAVLC)、基于语法的上下文自适应二进制算术译码(SBAC)、概率区间分割熵(PIPE)译码或另一熵编码方法来熵编码一维向量。视频编码器20还可熵编码与经编码视频数据相关联的语法元素以供视频解码器30在解码视频数据时使用。
为了执行CABAC,视频编码器20可向待发射的符号指派上下文模型内的上下文。上下文可涉及(例如)符号的相邻值是否为非零。为执行CAVLC,视频编码器20可选择用于待发射的符号的可变长度码。可变长度译码(VLC)中的码字可经构造使得相对较短码对应于更可能的符号,而较长码对应于较不可能的符号。以此方式,使用VLC可与例如对待发射的每一符号使用等长码字相比实现位节省。概率确定可基于指派到符号的上下文。
视频编码器20可例如在帧标头、块标头、切片标头或GOP标头中进一步将例如基于块的语法数据、基于帧的语法数据及基于GOP的语法数据等语法数据发送到视频解码器30。GOP语法数据可描述相应GOP中的数个帧,且帧语法数据可指示用以对对应帧进行编码的编码/预测模式。
本发明的技术中的一或多者是针对用于将视频数据从第一颜色空间变换到第二颜色空间的技术。因此,视频编码器20表示视频译码器的实例,所述视频译码器经配置以:确定与关联于译码单元的多个颜色变换相关联的成本,选择所述多个颜色变换中具有最低相关联成本的颜色变换,使用所述多个颜色变换中的选定颜色变换变换具有第一红、绿、蓝(RGB)颜色空间的第一视频数据块以产生具有第二颜色空间的第二视频数据块,且对具有第二颜色空间的第二视频块进行编码。
视频解码器30表示视频译码器的实例,所述视频译码器经配置以:在位流中接收与经译码单元相关联的语法数据,所述语法数据指示多个逆颜色变换中的一者;基于所接收的语法数据选择所述多个逆颜色变换中的逆颜色变换;使用所述多个逆颜色变换中的选定逆颜色变换将具有第一颜色空间的第一视频数据块逆变换到具有第二红、绿、蓝(RGB)颜色空间的第二视频块;以及对具有第二RGB颜色空间的第二视频块进行解码。
图2是说明根据本发明的一或多个方面的可实施用于使用颜色变换将具有第一RGB颜色空间的视频数据块变换为具有第二颜色空间的视频数据的技术的实例视频编码器20A的框图。在图2的实例中,视频编码器20A可执行视频切片内的视频块的帧内和帧间译码。在一些实例中,视频编码器20A可为图1的视频编码器20的实例。帧内译码依赖于空间预测来减少或去除给定视频帧或图片内的视频中的空间冗余。帧间译码依赖于时间预测来减少或去除视频序列的邻近帧或图片内的视频中的时间冗余。帧内模式(I模式)可指代若干基于空间的译码模式中的任一者。例如单向预测(P模式)或双向预测(B模式)等帧间模式可指代若干基于时间的译码模式中的任一者。
在图2的实例中,视频编码器20A包含模式选择单元40、参考图片存储器64、求和器50、变换处理单元52、量化单元54及熵编码单元56。模式选择单元40又包含运动补偿单元44、运动估计单元42、帧内预测单元46及分割单元48。为了视频块重构,视频编码器20A还包含逆量化单元58、逆变换单元60及求和器62。还可包含解块滤波器(图2中未图示)以对块边界进行滤波,从而从经重构视频移除成块假象。在需要时,解块滤波器将通常滤波求和器62的输出。除了解块滤波器外,还可使用额外滤波器(环路内或环路后)。为简洁起见未图示这些滤波器,但是必要时,这些滤波器可对求和器50的输出进行滤波(作为环路内滤波器)。
在编码过程期间,视频编码器20A接收待译码的视频帧或切片。所述帧或切片可以划分成多个视频块。以此方式,视频编码器20A可接收待编码视频帧内的当前视频块。在各种实例中,所述视频帧或切片可具有RGB颜色空间。在一些实例中,视频编码器20A可经配置以使用颜色空间变换将称为“原始信号”的RGB视频数据变换到第二颜色空间的块,如下文更详细描述。在此实例中,视频编码器20A在运动帧间或帧内预测之前执行变换。
运动估计单元42及运动补偿单元44可相对于一或多个参考帧中的一或多个块执行所接收视频块的帧间预测性译码以提供时间预测。帧内预测单元46可替代地相对于与待译码块相同的帧或切片中的一或多个相邻块执行所接收视频块的帧内预测性译码以提供空间预测。帧内预测单元46和/或运动补偿单元44可经配置以使用变换将RGB视频数据的预测性和/或残余块(即,在已执行帧内或帧间预测之后)变换到第二颜色空间。预测性块和残余块均可被称作“残余信号”。视频编码器20A可执行多个译码遍次,例如以针对每一视频数据块选择适当的译码模式。
求和器50可通过确定预测性块的像素值与正译码的当前视频块的像素值之间的差而形成残余视频块。在一些实例中,求和器50可确定不确定或编码残余块。
分割单元48可基于前述译码遍次中的先前分割方案的评估将视频数据块分割成子块。举例来说,分割单元48可起初将帧或切片分割成LCU,并且基于速率失真分析(例如,速率失真优化)将LCU中的每一者分割成子CU。模式选择单元40可以进一步产生指示LCU划分成子CU的四叉树数据结构。四叉树的叶节点CU可包含一或多个PU和一或多个TU。
模式选择单元40可例如基于误差结果选择译码模式中的一者(帧内或帧间),且可将所得经帧内或帧间译码块提供到求和器50。求和器50可产生残余块数据。举例来说,求和器50可产生当前CU的残余块数据以使得残余块数据的每一样本等于当前CU的译码块中的样本与当前CU的PU的预测块的对应样本之间的差。求和器62可重构经编码块(即,译码块)以用作参考帧。模式选择单元40还将语法元素(例如运动向量、帧内模式指示符、分割信息和其它这些语法信息)提供到熵编码单元56。
在根据本发明的技术中的一或多者的各种实例中,模式选择单元40可经配置以从一个以上颜色变换选择向第二颜色空间的一个变换以使得选定颜色变换优化速率失真成本函数,例如拉格朗日成本函数。模式选择单元或视频编码器20A的另一单元(例如熵译码单元56)可在经译码视频位流中对例如索引值等语法元素进行编码。经编码索引值可指示优化拉格朗日成本函数的选定颜色变换。
运动估计单元42与运动补偿单元44可高度集成,但出于概念目的而分别加以说明。运动估计单元42执行的运动估计为产生运动向量的过程,所述过程估计视频块的运动。举例来说,运动向量可指示当前视频帧或图片内的视频块的PU相对于参考帧(或其它经译码单元)内的预测性块相对于当前帧(或其它经译码单元)内正被译码的当前块的位移。换句话说,运动向量可指示PU的预测块与参考图片中的对应预测性块之间的位移。预测性块为被发现在像素差方面与待译码的块(即,预测块)密切匹配的块,像素差可通过绝对差总和(SAD)、平方差总和(SSD)或其它差度量来确定。
在一些实例中,视频编码器20A可计算存储于参考图片存储器64中的参考图片的子整数像素位置的值。换句话说,视频编码器20A可将一或多个内插滤波器应用于一或多个参考图片的样本以产生PU的预测性块中的样本。在一些实例中,视频编码器20A可内插参考图片的四分之一像素位置、八分之一像素位置或其它分数像素位置的值。因此,运动估计单元42可相对于整数像素位置及分数像素位置执行运动搜索且输出具有分数像素精度的运动向量。
运动估计单元42可通过比较PU的位置与参考图片的预测性块的位置来计算用于经帧间译码切片中的视频块的PU的运动向量。参考图片可以选自第一参考图片列表(列表0)或第二参考图片列表(列表1),其中的每一者识别存储在参考图片存储器64中的一或多个参考图片。如果运动估计单元42已计算运动向量,那么运动估计单元42可将计算的运动向量发送到熵编码单元56和运动补偿单元44。
运动补偿单元44可执行运动补偿。运动补偿可涉及基于由运动估计单元42针对PU确定的所述一或多个运动向量获取或产生PU的一或多个预测性块。再次,在一些实例中,运动估计单元42与运动补偿单元44可在功能上集成。在接收到当前视频块的PU的运动向量后,运动补偿单元44可即刻基于所述运动向量定位来自参考图片列表中的一者的图片的预测性块。一般来说,运动估计单元42相对于明度分量执行运动估计,且运动补偿单元44针对色度分量和明度分量两者使用基于明度分量计算的运动向量。模式选择单元40还可产生与视频块及视频切片相关联的供视频解码器30在解码视频切片的视频块时使用的语法元素。
作为如上文所描述由运动估计单元42及运动补偿单元44执行的帧间预测的替代方案,帧内预测单元46可以对当前块进行帧内预测。明确地说,帧内预测单元46可确定用以编码当前块的帧内预测模式。在一些实例中,帧内预测单元46可例如在分开的编码遍次期间使用各种帧内预测模式编码当前块,且帧内预测单元46(或在一些实例中为模式选择单元40)可从所述测试模式中选择适当帧内预测模式来使用。
举例来说,帧内预测单元46可以使用速率失真分析计算针对各种经测试帧内预测模式的速率失真值,并且从所述经测试帧内预测模式当中选择具有最佳速率失真特性的帧内预测模式。速率失真分析一般确定经编码块与经编码以产生所述经编码块的原始的未经编码块之间的失真(或误差)的量,以及用于产生经编码块的位速率(即,位数目)。帧内预测单元46可以根据用于各种经编码块的失真及速率计算比率,以确定哪个帧内预测模式对于所述块展现最佳速率失真值。
在选择用于块的帧内预测模式后,帧内预测单元46可将指示用于块的所选帧内预测模式的信息提供到熵编码单元56。熵编码单元56可编码指示所选帧内预测模式的信息。视频编码器20A在发射的位流中可包含配置数据,其可包含多个帧内预测模式索引表和多个经修改的帧内预测模式索引表(也称为码字映射表),对用于各种块的上下文进行编码的定义,以及对最可能帧内预测模式、帧内预测模式索引表和经修改的帧内预测模式索引表的指示以用于所述上下文中的每一者。
视频编码器20A可通过确定来自模式选择单元40的预测数据(例如,预测性块)与来自正译码的原始视频块(例如,译码块)的数据之间的差而形成残余视频块。求和器50表示执行此差运算的一或多个组件。变换处理单元52可将变换应用于残余块,从而产生包括残余变换系数值的视频块(即,变换系数块)。举例来说,变换处理单元52可应用离散余弦变换(DCT)或概念上相似的变换以产生残余系数值。变换处理单元52可以执行概念上类似于DCT的其它变换。还可使用小波变换、整数变换、子频带变换或其它类型的变换。在任何状况下,变换处理单元52向残余块应用所述变换,从而产生残余变换系数的块。所述变换可将残余信息从像素值域转换到变换域,例如频域。变换处理单元52可将所得变换系数发送到量化单元54。量化单元54可量化所述变换系数以进一步减小位速率。量化过程可减少与系数中的一些系数或全部相关联的位深度。可通过调整量化参数来修改量化程度。在一些实例中,量化单元54可以接着执行对包含经量化的变换系数的矩阵的扫描。或者,熵编码单元56可执行所述扫描。
在量化之后,熵编码单元56对经量化的变换系数进行熵译码。换句话说,熵编码单元56可对表示经量化变换系数的语法元素进行熵编码。举例来说,熵编码单元56可以执行上下文自适应二进制算术译码(CABAC)、上下文自适应可变长度译码(CAVLC)、基于语法的上下文自适应二进制算术译码(SBAC)、概率区间分割熵(PIPE)译码或另一熵译码技术。就基于上下文的熵译码而论,上下文可基于相邻块。在由熵编码单元56进行熵译码之后,可将经编码位流发射到另一装置(例如,视频解码器30),或者将所述经编码位流存档以用于稍后发射或检索。
逆量化单元58及逆变换单元60分别应用逆量化及逆变换以在像素域中重构残余块,例如以供稍后用作参考块。举例来说,逆量化单元58可解量化变换系数块。逆变换单元60可通过将逆变换应用于经解量化变换系数块而重构TU的变换块。求和器62将经重构的残余块加到由运动补偿单元44产生的经运动补偿的预测块以产生经重构的视频块以用于存储在参考图片存储器64中。运动估计单元42和运动补偿单元44可使用经重构视频块作为参考块以对后续视频帧中的块进行帧间译码(即,帧间预测)。运动补偿单元44还可将一或多个内插滤波器应用于经重构残余块以计算子整数像素值用于运动估计。
运动估计单元42可确定视频编码器20A可用来预测经帧间预测的一或多个PU的像素值的一或多个参考图片。运动估计单元42可将每一参考图片作为LTRP或短期参考图片用信号表示。运动估计单元42可在经解码图片缓冲器(DPB)(例如,参考图片存储器64)中存储参考图片直到所述图片被标记为不用于参考。视频编码器20A的模式选择单元40可编码包含用于一或多个参考图片的识别信息的各种语法元素。
除图2中说明的各种单元之外,视频编码器20A还可进一步包含一或多个颜色空间变换器单元和/或自适应颜色空间变换器单元,其可执行颜色变换或逆颜色变换。自适应颜色空间变换器单元可位于图2中说明的各种单元之间,例如在模式选择单元40之前和/或在量化单元54之后。下文相对于图4的实例更详细地描述视频编码器20A中的自适应颜色空间变换器单元的位置。
以此方式,图2中的视频编码器20A表示经配置以确定与关联于译码单元的多个颜色变换相关联的成本的视频编码器的实例。视频编码器20A可进一步经配置以选择所述多个颜色变换中具有最低相关联成本的颜色变换,使用所述多个颜色变换中的选定颜色变换变换具有第一红、绿、蓝(RGB)颜色空间的第一视频数据块以产生具有第二颜色空间的第二视频数据块,以及对具有第二颜色空间的第二视频块进行编码。
图3是说明根据本发明的一或多个方面的可实施用于使用颜色变换将具有第一颜色空间的视频数据变换到具有第二RGB颜色空间的视频数据的技术的视频解码器的实例的框图。在图3的实例中,视频解码器30A包含熵解码单元70、运动补偿单元72、帧内预测单元74、逆量化单元76、逆变换单元78、参考图片存储器82及求和器80。视频解码器30A可为图1的视频解码器30的实例。在一些实例中,视频解码器30A可执行一般与相对于视频编码器20A(图2)所描述的编码遍次互逆的解码遍次。
在解码过程期间,视频解码器30A从视频编码器20A接收表示经编码视频切片的视频块及相关联语法元素的经编码视频位流。视频解码器30A的熵解码单元70熵解码位流以产生经量化系数、运动向量或帧内预测模式指示符及其它语法元素。熵解码单元70可将运动向量及其它语法元素转发到运动补偿单元72。
熵解码单元70可接收指示多个逆颜色变换中的一者的CU的语法数据。视频解码器30A可基于所述语法数据选择用于块或经译码单元的逆变换。在一些实例中,所述语法数据可包括索引值语法元素。所述索引值可指示选定颜色变换是所述一或多个颜色变换中使上述拉格朗日成本函数最小化的颜色变换。在一些实例中,所述索引值可指示所述多个逆颜色变换中具有最低相关联失真成本的选定逆颜色变换。
在一些实例中,所述索引语法元素可指示所述多个逆颜色变换中与在RGB颜色空间的颜色分量与关联于所述多个颜色变换中的每一者的多个颜色分量中的每一者之间具有最高相关联相关的颜色空间相关联的选定逆颜色变换。在一些实例中,所述语法数据可为相对于当前CU或当前块的一或多个相邻经重构块的语法数据(例如,指示应用于那些块的逆变换)。视频解码器30A可在一些实例中基于相对于第一块和第二块中的至少一者的经重构相邻块的语法元素确定最高相关。视频解码器30A可在视频切片层级和/或视频块层级以及在其它层级接收所述语法元素。
视频解码器30A可基于存储在参考图片存储器82中的参考图片(例如,使用默认构造技术)构造参考图片列表(列表0和列表1)。当视频切片经译码为经帧内译码(I)切片时,帧内预测单元74可产生当前视频切片的视频块的预测数据。帧内预测单元74可基于来自当前帧或图片的先前经解码块的用信号表示的帧内预测模式和数据而产生预测数据。当视频解码器30A将视频帧的切片译码为经帧间译码(即,B、P或GPB)切片时,运动补偿单元72可基于从熵解码单元70接收的运动向量和其它语法元素产生当前视频切片的视频块的预测性块。运动补偿单元72可从参考图片列表中的一者内的参考图片中的一者产生预测性块。
运动补偿单元72可使用运动向量和/或语法元素来预测确定当前视频切片的视频块的预测信息。在一些实例中,运动补偿单元72可基于从熵解码单元70接收的运动向量产生预测信息。运动补偿单元72可使用所述预测信息产生正经解码的当前视频块的预测性块。举例来说,运动补偿单元72使用所接收语法元素中的一些语法元素确定用于译码当前视频切片的视频块的预测模式(例如,帧内预测或帧间预测)、帧间预测切片类型(例如,B切片、P切片或GPB切片)、切片的参考图片列表中的一或多者的构造信息、当前视频切片的每一经帧间编码的视频块的运动向量、切片的每一经帧间译码的视频块的帧间预测状态,及用以解码当前视频切片中的视频块的其它信息。
当PU的运动向量具有子像素精度时,运动补偿单元72可将一或多个内插滤波器应用于参考图片的样本以产生PU的预测性块。换句话说,运动补偿单元72还可基于内插滤波器执行内插。运动补偿单元72可使用视频编码器20在视频块的编码期间使用的相同内插滤波器来计算参考块的子整数像素的经内插值。因此,在一些实例中,运动补偿单元72可从所接收的语法元素确定由视频编码器20使用的内插滤波器且可使用所述内插滤波器产生预测性块。
逆量化单元76将在位流中提供且由熵解码单元70解码的经量化变换系数逆量化,即解量化。逆量化过程可包含使用量化参数QPY以确定量化程度以及同样确定应当应用的逆量化程度。视频解码器30A可计算视频切片中的每一视频块的量化参数QPY
逆变换单元78可接收经解量化变换系数块。如果针对当前块跳过变换,那么逆变换单元78可接收经解量化残余块。逆变换单元78可使用逆变换变换所接收的块。在一些实例中,逆变换(例如,逆DCT、逆整数变换,或概念上相似的逆变换过程)到变换系数以便在像素域中产生残余块(例如,变换块)。逆变换单元78可输出称为“经重构残余信号”的信号。在一些实例中,逆变换单元78或逆自适应颜色变换器(在图5的实例中更详细说明)可根据本发明的技术使用逆颜色变换将变换系数和/或残余块从第一颜色空间逆变换到第二空间的块。
视频解码器30A还可基于语法元素或其它信息确定当前块是经帧内预测的。如果当前视频块是经帧内预测的,那么帧内预测单元74可对当前块进行解码。帧内预测单元74可从与当前块的同一图片确定相邻预测性块。帧内预测单元74可基于预测性块产生变换系数块和/或残余块。
在运动补偿单元72或帧内预测单元74基于运动向量和其它语法元素产生当前视频块的变换系数块和/或残余块之后,视频解码器30A通过组合来自逆变换单元78的残余块与由运动补偿单元72产生的对应预测性块而形成经解码视频块。求和器80表示可以执行此求和运算的一或多个组件。如果需要的话,还可应用解块滤波器以对经解码块进行滤波,以便移除成块假象。其它环路过滤器(再译码环路中或在译码环路之后)也可用于使像素转变变平滑或者以其它方式改善视频质量。参考图片存储器82存储给定帧或图片中的经解码视频块,视频解码器30可使用其用于后续运动补偿。参考图片存储器82还可存储经解码视频以用于稍后在显示装置(例如,图1的显示装置32)上呈现。
在一些实例中一旦视频解码器30产生经重构视频,视频解码器30便可输出经重构视频块作为经解码视频(例如,用于显示或存储)。在其它实例中,视频解码器30可进一步经配置以使用逆颜色变换将称为“经重构信号”的经重构视频数据的块从第一颜色空间变换到第二RGB颜色空间。
如上文所描述,在帧间预测期间,运动补偿单元72可确定视频解码器30A可用来形成用于经解码的当前块的预测性视频块的一或多个参考图片。运动补偿单元72可基于经译码视频位流的指示参考图片是标记用于长期参考还是短期参考的语法元素确定参考图片为长期参考图片还是短期参考图片。运动补偿单元72可在经解码图片缓冲器(DPB)(例如,参考图片存储器82)中存储参考图片直到所述参考图片被标记为不用于参考。
视频解码器30A的运动补偿单元72可解码各种语法元素,包含用以形成用于当前解码块的预测性块的一或多个参考图片的识别信息。在解码经帧间预测的PU期间,运动补偿单元72可解码在作用中序列参数集中发信的用于当前图片的一或多个LTRP的识别信息。运动补偿单元72还可解码当前图片的切片标头或当前图片的图片参数集中用于预测当前图片的一或多个短期参考图片的识别信息。
除图3中说明的各种单元之外,视频解码器30A还可进一步包含一或多个颜色变换器单元和/或自适应颜色变换器单元,其可执行颜色变换或逆颜色变换。自适应颜色变换单元可位于图3中说明的各种单元之间,例如在熵解码单元70之前和/或在逆变换单元78之后。下文关于图5的实例更详细地描述视频解码器30A中的自适应颜色变换器单元的位置。
以此方式,图3中的视频解码器30A表示视频解码器的实例,所述视频解码器经配置以使用一或多个逆颜色变换中的逆颜色变换将具有第一颜色空间的第一视频数据块变换到具有红、绿、蓝(RGB)颜色空间的第二视频数据块,以及对具有RGB颜色空间的第二视频块进行解码。
在另一实例中,视频解码器30A可表示视频解码器的实例,所述视频解码器经配置以:使用一或多个逆颜色变换中的逆颜色变换将具有第一颜色空间的第一视频数据块自适应地变换到具有第二颜色空间的第二视频数据块,其中所述第二颜色空间是RGB颜色空间;以及对具有RGB颜色空间的第二视频块进行解码。
图4是说明根据本发明的一或多个方面的可利用用于使用颜色变换将具有RGB颜色空间的视频数据变换到具有第二颜色空间的视频数据块的技术的另一实例视频编码器20B的框图。
图4说明视频编码器20A的较详细版本。视频编码器20B可为视频编码器20A(图2)或视频编码器20(图1)的实例。图4的实例说明用于实施本发明的技术的两个可能的实例。在第一实施方案中,视频编码器20B使用一或多个颜色变换中的颜色变换将具有第一颜色空间的输入视频信号的第一块自适应地变换到具有第二颜色空间的第二块。第二所说明的实例执行相同技术,但对残余视频数据块而不是输入信号执行颜色变换。
在图4的实例中,由于开关101、105、113、121当前切换的通路,视频编码器20B展示为对视频数据的预测性块和残余块(即,原始信号)执行颜色变换。如果开关101、105、113和121经切换替代的位置,那么视频编码器20B经配置以在执行运动估计和运动预测之前对具有RGB颜色空间的原始信号的视频数据块执行颜色变换以变换到具有第二颜色空间的视频数据块,而不是变换预测性和/或残余视频数据的块。
现在更详细地描述如图4中所说明的对残余视频数据块执行颜色变换的过程。在图4的实例中,原始信号100传递到预测处理单元104(遵循开关101的路径)。预测处理单元104可从来自参考图片存储器122的一或多个参考图片接收数据。预测处理单元104产生预测性视频数据块,且组合来自原始信号100的预测性视频数据块以产生残余信号124。在此实例中,自适应颜色变换器106将视频数据的预测性块和残余块从RGB颜色空间变换到具有第二颜色空间的视频的第二预测性块和第二残余块。在一些实例中,视频编码器20B可基于成本函数选择第二颜色空间和颜色变换。
变换/量化单元108可对具有第二颜色空间的第二视频块执行变换(例如,离散余弦变换)。另外,变换/量化单元108可量化第二视频块(即,经变换残余视频块)。熵编码器110可对经量化残余视频块进行熵编码。熵编码器可输出包含用于由视频解码器(例如视频解码器30)解码的经量化残余视频块的位流。
解量化/逆变换单元112也可接收经量化、经变换系数和/或残余视频块,且可逆变换且解量化所述经变换系数和残余视频块。经解量化经逆变换视频块此时仍可具有第二颜色空间。解量化/逆变换的结果是经重构残余信号126。逆自适应颜色变换器114可基于与由自适应颜色变换器106执行的变换相关联的逆颜色变换对经重构残余信号进行逆颜色变换。所得经逆自适应颜色变换的系数和/或残余视频块此时可具有RGB颜色空间。
在将逆颜色变换应用于残余视频块后,预测补偿器116可将预测性块加回到残余视频块。解块滤波器118可对所得块进行解块。SAO滤波器120可执行SAO滤波。参考图片存储器122可随后存储所得经重构信号128用于未来使用。
为了对输入信号的视频块(即,未经编码视频数据)而不是残余视频数据块进行颜色变换,将开关101翻转到交替位置,且自适应变换器102使用一或多个颜色变换中的颜色变换将输入视频块从具有RGB颜色空间的视频块颜色变换到第二颜色空间。以预测处理单元104的预测如上文所描述进行,但结果可直接馈送到变换/量化单元108,因为开关105在交替位置中(与图4中说明的位置相比),而不是由自适应颜色变换器106进行颜色变换。
变换/量化单元108、熵译码器110和解量化/逆变换单元112可各自如上所述相对于颜色变换残余视频块而操作,且经重构信号126产生且也在第二颜色空间中。经重构信号126经由开关113馈送到预测补偿器116。开关113在图4中说明的位置的交替位置中,且逆自适应颜色变换器114被绕过。预测补偿器116、解块滤波器118和SAO滤波器120可如上所述相对于颜色变换残余视频块以产生经重构信号128而操作。然而,不同于上述经重构信号128,在此实例中,经重构信号128的块仍可具有第二颜色空间,而不是RGB颜色空间。
经重构信号128可经由开关121馈送到逆自适应颜色变换器130,开关121在图4中说明的位置的交替位置中。逆自适应颜色变换器130可将经重构信号128的块逆颜色变换到具有RGB颜色空间的块,且参考图片存储器122可将所述块存储为参考图片的块用于未来参考。
如上文所描述,视频编码器20B可选择一或多个颜色空间的变换以将具有RGB颜色空间的视频数据的第一块变换到第二颜色空间。在一些实例中,视频编码器20B通过计算与颜色变换中的每一者相关联的速率失真成本而自适应地选择颜色变换。举例来说,视频编码器20B可选择所述多个颜色变换中具有CU或CU的块的最低相关联失真成本的颜色变换。视频编码器20B可用信号表示索引语法元素或其它语法数据,其指示具有最低相关联失真成本的选定颜色变换。
在一些实例中,视频编码器20B可利用考虑通过颜色变换(例如,实现的压缩)的位速率之间的折衷以及与颜色变换相关联的失真的拉格朗日成本函数。在一些实例中,拉格朗日成本对应于L=D+λR,其中L是拉格朗日成本,D是失真,λ是拉格朗日乘数,且R是位速率。在一些实例中,视频编码器20B可用信号表示指示所述多个颜色变换中使拉格朗日成本最小化的颜色变换的索引语法元素。
在一些高性能或高保真度视频译码应用或配置中,应高于最小化位速率而最小化失真。在此些情况下,当将视频数据从RGB颜色空间变换到第二颜色空间时,视频编码器20B可选择颜色变换以及导致最少失真的颜色空间。视频编码器20B可用信号表示指示选定颜色变换或导致最少失真的颜色空间的索引语法元素。
在一些其它情况中,视频编码器20B可基于RGB视频数据块的颜色分量中的每一者与第二颜色空间的块的颜色分量之间的相关而计算将RGB颜色空间的块变换到第二颜色空间的成本。具有最低相关联成本的颜色变换可为具有与输入信号的RGB颜色分量最紧密相关的颜色分量的颜色变换。视频编码器20B可用信号表示指示在其颜色分量与RGB颜色分量之间具有最高相关的选定颜色变换的索引语法元素。
应认识到在一些情况下,视频编码器20B可针对不同CU、LCU、CTU等选择不同颜色变换。即,对于单个图片,视频编码器20B可选择与不同颜色空间相关联的不同颜色变换。选择多个不同颜色变换可较好地优化译码效率且减少速率失真。为了指示视频编码器20B针对当前块已选择的多个变换中的哪一个变换,视频编码器20B可用信号表示对应于选定颜色变换的索引值。视频编码器20B可用信号表示视频CTU、CU、PU和TU的第一块中的一或多者处的索引值。
然而,在一些情况下,视频编码器20B可确定将应用于一个或多个块或经译码图片序列(称为CVS)的单个颜色变换。在选择仅一个颜色变换的情况下,对于每一块,视频编码器20B可用信号表示旗标语法元素。所述旗标语法元素的一个值可指示视频编码器20B已将单个变换应用于当前块或CVS中的全部图片。旗标语法元素的另一值指示没有变换已应用于当前块。视频编码器20B可基于个别基础确定是否将颜色变换应用于图片的块中的每一者,例如使用上述基于成本的准则。
在一些实例中,视频编码器20B确定是否将所述多个逆颜色变换中的预定义颜色变换应用于多个块中的每一者。举例来说,视频编码器20B和视频解码器30B可利用默认预定义颜色变换/逆颜色变换。响应于确定将预定义颜色变换应用于多个块中的每一者,视频编码器20B可使用预定义颜色变换变换多个块中的每一者而无需解码指示预定义颜色变换已应用于所述多个视频数据块中的每一者的数据。
以互逆方式,视频解码器30B可经配置以确定是否将所述多个逆颜色变换中的预定义逆颜色变换应用于多个块中的每一者。响应于确定将预定义逆颜色变换应用于多个块中的每一者,视频解码器30B可使用预定义颜色变换逆变换多个块中的每一者而无需解码指示预定义颜色变换已应用于所述多个视频数据块中的每一者的数据。
本发明的颜色变换可包含但不一定限于对视频数据块的恒等变换、差分变换、经加权差分变换、DCT、YCbCr变换、YCgCo变换和YCgCo-R变换。根据本发明的技术配置的视频译码器(例如视频编码器20B)可应用这些变换中的一或多者和/或其逆变换以及其它变换,例如向/从以下各者的变换:Adobe RGB、sRGB、scRGB、Rec.709、Rec.2020、Adobe宽色域RGB、ProPhoto RGB、CMYK、Pantone、YIQ、YDbDr、YPbPr、xvYCC、ITU BT.601、ITU BT.709、HSV,以及本文未专门描述的其它颜色空间、彩色空间和/或色度子取样格式。
为了将颜色变换应用于具有RGB颜色空间的视频数据块,视频编码器20B可将包括RGB像素的红、绿和蓝颜色分量的3x1矩阵与颜色变换矩阵相乘。所述乘法的结果是具有第二颜色空间的像素。视频译码器可将颜色变换矩阵应用于视频块的每一像素以产生第二颜色空间中的像素的第二块。现在更详细地描述各种颜色变换。
在一些实例中,视频编码器20B可应用恒等变换矩阵或逆恒等变换矩阵。所述恒等变换矩阵包括:
且视频解码器30A可应用的逆变换矩阵包括:
当视频译码器应用恒等变换时,所得像素值相同于输入像素值,即应用恒等变换等效于根本不应用颜色变换。视频编码器20B可当需要维持视频块的RGB颜色空间时选择恒等变换。
在另一实例中,视频编码器20B可应用差分变换矩阵。所述差分变换矩阵包括:
视频解码器30A可应用互逆的逆差分矩阵,其包括:
在另一实例中,视频编码器20B可经配置应用经加权差分变换或逆经加权差分变换。所述经加权差分变换矩阵包括:
且视频解码器30B可应用的逆经加权差分矩阵包括:
在经加权差分变换中,α1和α2是视频译码器可调整的参数。在一些实例中,视频编码器20A可根据以下方程式计算参数α1和α2
α1=cov(G,B)/var(G),以及
α2=cov(G,R)/var(G)。
在各种实例中,视频编码器20B可在经译码视频位流中用信号表示α1和α2的值。
在这些方程式中,R对应于RGB颜色空间的红色通道,G对应于绿色通道,且B对应于蓝色通道。在差分变换方程式中,“cov()”是协方差函数,且“var()”是方差函数。
为了确定R、G和B的值,编码器或解码器可利用参考像素的集合以便确保当由编码器或解码器计算时协方差和方差函数具有相同结果或权重。在一些实例中,特定参考像素可在经译码视频位流中用信号表示(例如,作为经译码视频位流中的语法元素)。在其它实例中,编码器和解码器可经预编程以使用某些参考像素。
在一些实例中,视频编码器20B可当使用差分变换变换块时限制或约束α1和α2的值。视频译码器可将α1和α2的值约束为整数或二进数字的集合,例如1/2、1/4、1/8等。在其它实例中,视频译码器可将α1和α2限制于具有二进数字的分数的值,例如1/8、2/8、3/8、...、8/8。二进数字或二进分数是具有2的幂的分母且其中分子是整数的有理数。限制α1和α2的值可改善对α1和α2进行译码的位流效率。
在其它实例中,视频编码器20B可经配置以使用DCT变换变换具有RGB颜色空间的块以产生第二块。DCT变换块的样本以将样本表达为不同频率和振幅的正弦信号的总和。DCT变换或逆变换可在余弦函数的总和方面将像素变换到有限数据点序列和从有限数据点序列变换像素。DCT变换矩阵对应于:
以互逆方式,视频解码器30B可经配置以将逆变换应用于使用DCT变换的块而将所述块恢复回到原始样本。逆DCT变换矩阵对应于:
视频编码器20B还可将YCbCr变换应用于具有RGB颜色空间的块以产生具有YCbCr颜色空间的块。如上文所描述,YCbCr颜色空间包含明度(Y)分量,以及蓝色度(Cb)和红色度(Cr)分量。YCbCr变换矩阵可对应于:
视频解码器30B可经配置以应用逆YCbCr变换以将具有YCbCbr颜色空间的块转换到具有RGB颜色空间的块。逆YCbCr变换矩阵可对应于:
视频编码器20B还可将YCgCo变换应用于具有RGB颜色空间的块以产生具有YCgCo颜色空间的块。YCgCo颜色空间包含明度(Y)分量,以及绿色度(Cg)和橙色度(Co)分量。YCgCo变换矩阵可对应于:
视频解码器30B可经配置以应用逆YCgCo变换以将具有YCgCo颜色空间的块转换到具有RGB颜色空间的块。逆YCgCo变换矩阵可对应于:
视频编码器20B还可经配置以将YCgCo-R变换应用于具有RGB颜色空间的块以产生具有YCgCo-R颜色空间的块。YCgCo-R颜色空间包含明度(Y)分量,以及绿色度(Cg)和橙色度(Co)分量。然而不同于上述YCgCo变换,YCgCg-R变换是可逆的,例如YCgCg-R变换例如由于舍入误差而不会产生任何失真。
YCbCr变换矩阵可对应于:
视频解码器30B可经配置以应用逆YCgCo-R变换。YCgCo-R逆变换将具有YCgCo-R颜色空间的块逆变换到具有RGB颜色空间的块。逆YCgCo-R变换矩阵可对应于:
为了应用本文所描述的颜色变换中的任一者,视频编码器20B可实施具有灵活参数的提升方案。提升方案是将离散小波变换分解为简单滤波阶梯的有限序列的技术,称为提升阶梯或梯子结构。视频编码器20B可在经译码视频位流中用信号表示所述参数,或视频编码器20B可以相同方式导出所述参数。提升方案的一个实例如下:
其中a、b、c和d是如上文所描述的参数。在此提升方案中,R、G和B分别是红、绿和蓝颜色通道或样本。如同上文相对于经加权差分变换所述的α参数,a、b、c和d的值可受限或有限,例如因此正负号可仅为正或负。在一些情况下,提升方案中可存在额外阶梯,例如:
其中f、g、h、i和j是参数。当使用提升方案时以及在其它实例中,视频编码器20A和视频解码器30A可正规化三个分量的输出深度,R”'、B”和G”可在预定位深度内经正规化,其针对每一分量可不一定相同。
以此方式,图4的视频编码器20B表示视频编码器,所述视频译码器经配置以确定与关联于译码单元的多个颜色变换相关联的成本,选择所述多个颜色变换中具有最低相关联成本的颜色变换,使用所述多个颜色变换中的选定颜色变换变换具有第一红、绿、蓝(RGB)颜色空间的第一视频数据块以产生具有第二颜色空间的第二视频数据块,且对具有第二颜色空间的第二视频块进行编码。
图5是说明根据本发明的一或多个方面的可利用用于使用逆颜色变换将具有第一颜色空间的视频数据逆变换到具有第二RGB颜色空间的视频数据的技术的另一实例视频解码器30B的框图。
图5说明视频解码器30B的较详细版本。在一些实例中,视频解码器30B可为视频解码器30A(图2)和/或视频解码器30(图1)的实例。图5的实例说明用于实施本发明的技术的两个可能的实例。在第一实施方案中,视频解码器30B使用多个逆颜色变换中的逆颜色变换将输入视频信号的块从第一颜色空间(例如,非RGB颜色空间)自适应地逆变换到具有第二RGB颜色空间的第二块。第二所说明的实例执行相同技术,但对残余视频数据块而不是输入信号执行逆颜色变换。
在图5的实例中,视频解码器30B展示为由于开关145和156当前切换的通路而对残余视频数据块实例执行逆颜色变换。如果开关145和156经切换替代的位置,那么视频解码器30B经配置以将具有第一表示的输入视频数据块逆颜色变换到具有第二RGB颜色空间的视频数据块,而不是逆变换残余视频数据块。
现在更详细地描述如图5中所说明的对残余视频数据块执行逆颜色变换的过程。在图5的实例中,经编码输入位流140(也被称作输入信号)传递到熵解码单元142。熵解码单元142可对位流140进行熵解码以产生具有第一颜色空间的经量化残余视频数据块。举例来说,熵解码单元142可对包含在位流140中的特定语法元素进行熵解码。解量化/逆变换单元144可解量化变换系数块。另外,解量化/逆变换单元144可将逆变换应用于变换系数块以确定包括残余视频数据的变换块。因此,解量化/逆变换单元144可解量化且逆变换位流140的经熵解码视频数据块。当视频解码器30B经配置以逆颜色变换残余数据块时,开关148将具有第一颜色空间的残余视频数据块馈送到逆自适应颜色变换器150。以此方式,逆自适应颜色变换器150可接收TU的变换块。
逆自适应颜色变换器150可将具有第一颜色空间的视频数据块自适应地逆变换到具有第二RGB颜色空间的第二视频数据块。举例来说,逆自适应颜色变换器150可选择逆变换以应用于TU的变换块。在此实例中,逆自适应颜色变换器150可将选定逆变换应用于变换块以便将所述变换块从第一颜色空间变换到RGB颜色空间。预测补偿单元152可组合来自存储器154的参考图片。举例来说,预测补偿单元152可接收CU的TU的变换块。在此实例中,预测补偿单元152可确定CU的译码块。在此实例中,CU的译码块的每一样本可等于变换块中的样本与CU的PU的预测块中的对应样本的总和。解块滤波器156可对经组合经重构图像进行解块。SAO滤波器单元158可在适用的情况下执行额外SAO滤波。
SAO滤波器158的输出是经重构信号160。如果视频解码器30B经配置以逆颜色变换残余视频数据块,那么开关162将经重构信号160馈送到参考图片存储器154用于未来用作参考图片。视频解码器30B还可输出经重构信号160作为图像/视频164。
在其中视频解码器30B经配置以逆颜色变换原始输入信号的块而不是残余视频数据块的实例中,熵解码单元142和解量化/逆变换单元144以先前描述的方式操作。开关148在交替位置中且直接将经重构残余信号馈送到预测补偿单元152。此时,提供到预测补偿单元152的残余块仍在第一颜色空间而不是RGB颜色空间中。
预测补偿单元152可重构原始图像的块且可组合残余块与来自参考图片存储器154的图片的一或多个块。解块滤波器156和SAO滤波器158可如上文相对于逆变换残余视频数据块描述而操作。SAO滤波器158的输出是其块仍在第一颜色空间中的经重构信号160,且不可具有RGB颜色空间(例如,如果使用恒等变换则所述块可仍具有RGB颜色空间)。
经重构信号160可经由开关162馈送到逆自适应颜色变换器166,开关162与图5中说明的位置相比在交替位置中。逆自适应颜色变换器166可使用一或多个逆颜色变换中的逆颜色变换将具有第一颜色空间的经重构信号的块逆颜色变换到具有第二RGB颜色空间的第二视频数据块。在一些实例中,解码器30B使用的特定逆变换可在位流140中用信号表示。逆自适应颜色变换器166可将具有第二颜色空间的第二块馈送用于输出作为图像/视频164,以及馈送到参考图片存储器154用于未来存储和用作参考图片。
以此方式,视频解码器30B表示视频译码器装置的实例,所述视频译码器装置经配置以确定与多个逆颜色变换相关联的成本,且选择所述多个逆颜色变换中具有最低相关联成本的逆颜色变换。视频解码器30B可进一步经配置以使用所述多个逆颜色变换中的选定逆颜色变换将具有第一颜色空间的第一视频数据块自适应地逆变换到具有第二红、绿、蓝(RGB)颜色空间的第二视频块,且对具有第二RGB颜色空间哦第二视频块进行解码。
图6是说明根据本发明的一或多个方面的用于使用颜色变换将具有RGB颜色空间的视频数据变换到具有第二颜色空间的视频数据的过程的流程图。仅出于说明的目的,图6的方法可由视频编码器执行,例如对应于图1、2和4的视频编码器20、20A和/或20B的视频编码器。
在图6的方法中,视频编码器20可确定与关联于译码单元的多个颜色变换相关联的成本(180),且从多个颜色变换选择具有最低相关联成本的颜色变换(182)。视频编码器20可进一步经配置以使用所述多个颜色变换中的选定颜色变换将具有第一RGB颜色空间的第一视频数据块变换到具有第二颜色空间的第二视频块(184)。此外,视频编码器20可对具有第二颜色空间的第二视频块进行编码(186)。在一些实例中,对第二视频块进行编码可包括对原始块进行编码。在一些实例中,编码可包括对残余块进行编码。
在一些实例中,所述一或多个颜色变换可包括由以下各者组成的群组中的一或多者:恒等变换,差分变换,经加权差分变换,离散余弦变换(DCT),YCbCr变换,YCgCo变换,以及YCgCo-R变换。现将更详细地论述颜色变换。
在一些实例中,恒等变换包括:
在一些实例中,差分变换包括:
在一些实例中,DCT变换包括:
在一些实例中,YCbCr变换包括:
在一些实例中,
YCgCo变换包括:
在一些实例中,YCgCo-R变换包括:
在各种实例中,视频编码器20、20A或20B可使用提升方案导出本文所描述的颜色变换中的任一者,包含选定颜色变换。提升方案可对应于:
其中a、b、c和d是参数。视频编码器20、20A或20B可根据以下进一步利用提升方案的变化:
其中e、f、g、h、I和j是参数。在这些提升方案实例中,R、B和G可对应于红、绿和蓝样本。作为使用提升方案导出一或多个颜色变换的部分,视频编码器20可正规化提升方案的每一颜色通道的位深度。
在一些实例中,经加权差分变换包括:
在差分变换的一些实例中,α1=cov(G,B)/var(G),α2=cov(G,R)/var(G),R对应于RGB颜色空间的红色通道,G对应于RGB颜色空间的绿色通道,B对应于RGB颜色空间的蓝色通道,“cov()”是协方差函数,且“var()”是方差函数。在一些实例中,协方差函数和方差函数是使用参考像素的集合计算的。
在各种实例中,视频编码器20可对α1和α2的值进行编码。α1和α2的值也可以约束于包括由以下各项组成的群组中的至少一者的值的集合:整数的集合,二进数字的集合,以及具有二进数字的分数的集合。
在一些实例中,在图6的方法中,视频编码器20可进一步用信号表示指示一或多个颜色空间的颜色变换已应用于具有第二颜色空间的第二视频块的数据。
在一些实例中,在图6的方法中,所述第一块可包括视频数据图片中的多个块中的块,且视频编码器20可进一步经配置以确定是否将所述一或多个颜色变换中的单个变换应用于所述多个块。响应于确定将单个变换应用于所述多个块,视频编码器20可针对所述多个块中的每一者用信号表示旗标语法元素。旗标的第一值指示所述单个变换已应用,且旗标的第二值指示所述单个变换尚未应用。
在各种实例中,第一视频数据块可包括以下各项中的至少一者:CTU,CU,PU和TU。
在其它实例中,所述第一块包括视频数据图片中的多个块中的单个块,且视频编码器20进一步经配置以:确定是否将颜色变换中的一或多者中的单个颜色变换应用于视频数据块中的每一者,响应于确定将单个颜色变换应用于所述块中的每一者,且使用所述单个颜色变换变换所述块中的每一者而无需用信号表示指示所述单个颜色变换已应用于视频数据块中的每一者的数据。
在另一实例中,视频编码器20A可经配置以选择所述多个颜色变换的所述多个颜色变换中使对应于L=D+λR的拉格朗日成本最小化的颜色变换,其中L是拉格朗日成本,D是失真值,λ是拉格朗日乘数,且R是位速率值。视频编码器20A可进一步经配置以在经译码视频位流中用信号表示指示选定颜色变换的语法元素。所述用信号表示的语法元素可包括对应于选定颜色变换的索引值。
在一些实例中,视频编码器20可进一步经配置以确定与所述一或多个颜色变换中的每一者相关联的失真成本。视频编码器20可随后选择具有最低相关联失真成本的颜色变换且使用选定颜色变换将具有RGB颜色空间的第一视频块变换到第二视频块。视频编码器20可进一步经配置以在经译码视频位流中用信号表示指示选定颜色变换(即,具有最低相关联失真成本的变换)的语法元素。所述用信号表示的语法元素可包括对应于选定颜色变换的索引值。
在各种实例中,视频编码器20可进一步经配置以确定第一视频块的RGB颜色空间的颜色分量与同所述一或多个颜色变换中的每一者相关联的每一颜色空间之间的相关,其中用以将具有RGB颜色空间的第一视频块变换到具有第二颜色空间的第二视频块的颜色变换是所述多个颜色变换中与具有最高相关联相关的颜色空间相关联的颜色变换。
在一些实例中,第一数据块可包括残余数据块,或第一视频数据块可包括原始信号的视频数据块。
图7是说明根据本发明的一或多个方面的用于使用逆颜色变换将具有第一颜色空间的视频数据变换到具有第二RGB颜色空间的视频数据的过程的流程图。仅出于说明的目的,图7的方法可由视频解码器执行,例如对应于图1、3和5中说明的视频解码器30、30A和/或30B的视频编码器。
在图7的方法中,视频解码器30可在位流中接收与经译码单元相关联的语法数据,所述语法数据指示多个逆颜色变换中的一者(200),且基于所接收的语法数据选择所述多个逆颜色变换中的逆颜色变换(202)。视频解码器30可使用所述多个逆颜色变换中的选定逆颜色变换将具有第一颜色空间的第一视频数据块逆变换到具有第二红、绿、蓝(RGB)颜色空间的第二视频块(204)。此外,视频解码器30可对具有第二RGB颜色空间的第二视频块进行解码(206)。在一些实例中,经解码块可包括变换系数的原始块。在一些实例中,经解码块可包括变换系数的残余块。
在各种实例中,所述一或多个逆颜色变换可包括由以下各项组成的群组中的至少一者:逆恒等变换、逆差分变换、逆经加权差分变换、逆离散余弦变换(DCT)、逆YCbCr变换、逆YCgCo变换和逆YCgCo-R变换中的一或多者。现将描述所述一或多个逆颜色变换。
在各种实例中,恒等变换包括:
在一些实例中,逆差分变换包括:
在一些实例中,逆DCT变换包括:
在一些实例中,其中逆YCbCr变换包括:
在一些实例中,逆YCgCo变换包括:
在一些实例中,逆YCgCo-R变换包括:
在各种实例中,视频解码器30可使用对应于以下的提升方案导出逆颜色变换中的一或多者,例如选定逆颜色变换:
其中a、b、c和d是参数。在各种实例中,视频解码器30可经配置以根据以下使用提升方案的另一变化:
其中e、f、g、h、i和j是参数。在一些实例中视频解码器30可进一步正规化提升方案的每一颜色通道的位深度。
在各种实例中,逆经加权差分变换包括:
在逆经加权差分变换的各种实例中,α1=cov(G,B)/var(G),α2=cov(G,R)/var(G),R对应于RGB颜色空间的红色通道,G对应于RGB空间的绿色通道,B对应于RGB颜色空间的蓝色通道,“cov()”是协方差函数,且“var()”是方差函数。在各种实例中,视频解码器30可使用参考像素的集合计算协方差函数和方差函数。在一些实例中,视频解码器30可进一步经配置以例如基于经译码视频位流中的语法元素对α1和α2的值进行解码。
在一些实例中,视频解码器30可将α1和α2的值约束于包括由以下各项组成的群组中的至少一者的值的集合:整数的集合,二进数字的集合,以及具有二进数字的分数的集合。
在各种实例中,视频解码器30可使用对应于以下的提升方案实施本发明中描述的颜色变换中的任一者:
其中a、b、c和d是参数。
在一些实例中,视频解码器30可使用上述提升方案的另一变化实施本发明中描述的颜色变换中的任一者。在提升方案的此变化中:
其中e、f、g、h、i和j是参数。
在各种实例中,在图7的方法中,视频解码器30可进一步经配置以使用提升方案导出逆颜色变换中的一或多者,且正规化提升方案的每一颜色通道的位深度。
在各种实例中,视频解码器可进一步经配置以对指示所述一或多个颜色空间中的颜色变换已应用于具有第一颜色空间的第一视频块的数据进行解码。
视频解码器30可进一步经配置以对指示是否将所述一或多个逆颜色变换中的单个逆变换应用于所述多个块的旗标语法元素的值进行解码。所述旗标的第一值(例如,“0”值或“1”值)可指示所述单个变换已应用,且所述旗标的第二值指示所述单个变换尚未应用。另外,所述第一旗标值可指示逆变换所述多个块,且所述第二旗标值可指示不将逆变换应用于所述多个块。视频解码器30可基于所述旗标语法元素的值确定将单个逆颜色变换应用于所述多个块,视频解码器30可基于所述语法元素的值逆变换所述多个块中的每一块。
在各种实例中,第一视频数据块可包括由以下各项组成的群组中的至少一者:CTU,CU,PU,和TU。
在又另一实例中,视频解码器30可对用于经译码单元的旗标语法元素进行解码。视频解码器30可进一步经配置以基于所述语法元素的值确定所述一或多个颜色变换中的单个颜色变换是否已应用于第一块。在这些实例中,所述旗标的第一值可指示应用所述单个逆变换,且所述旗标的第二值指示不应用所述单个逆变换。
在一些实例中,视频解码器30可对指示所述多个多个逆颜色变换中优化对应于L=D+λR的拉格朗日成本的逆颜色变换的语法元素进行解码。在此实例中,L是拉格朗日成本,D是失真值,λ是拉格朗日乘数,且R是位速率值。
在各种实例中,第一数据块可包括经重构信号的块。替代地,所述第一块可包括经重构残余信号的块。所述第一块可为由残余块和预测性块组成的群组中的至少一者。
在一些实例中,用以将具有第一颜色空间的第一视频块逆变换到具有第二RGB颜色空间的第二视频块的逆颜色变换是所述一或多个逆颜色变换中具有最低相关联失真成本的逆颜色变换。
在一些实例中,用以将具有第一颜色空间的第一视频块变换到具有第二RGB颜色空间的第二视频块的颜色变换是所述一或多个逆颜色变换中与在RGB颜色空间的颜色分量与同所述一或多个逆颜色变换中的每一者相关联哦多个颜色分量中的每一者之间具有最高相关联相关的颜色空间相关联的逆颜色变换。
在各种其它实例中,所述第一数据块包括残余数据块。在另一实例中,所述第一视频数据块包括原始信号的视频数据块。
应认识到,取决于实例,本文中所描述的技术中的任一者的某些动作或事件可用不同序列执行、可添加、合并或全部省略(例如,实践所述技术并不需要所有的所描述动作或事件)。此外,在某些实例中,可同时(例如,通过多线程处理、中断处理或多个处理器)而非顺序地执行动作或事件。
图8是说明用于将具有第一颜色空间的视频数据块变换到具有第二RGB颜色空间的视频数据块的过程的流程图。视频解码器30B可经配置以执行图9中说明的过程。视频解码器30B可经配置以在位流中接收与经译码单元相关联的语法数据,所述语法数据指示多个逆颜色变换中的一者(260),且基于所接收的语法数据选择所述多个逆颜色变换中的逆颜色变换(262)。视频解码器30A可进一步经配置以使用具有最低相关联成本的选定颜色变换变换具有第一红、绿、蓝(RGB)颜色空间的第一原始视频数据块以产生具有第二颜色空间的第二视频数据块(264),且对具有第二颜色空间的第二视频块进行解码(266)。
图9是说明用于将具有第一颜色空间的视频数据块变换到具有第二RGB颜色空间的视频数据块的过程的流程图。视频解码器30B可经配置以执行图9中说明的过程。视频解码器30B可经配置以在位流中接收与经译码单元相关联的语法数据,所述语法数据指示多个逆颜色变换中的一者(280),且基于所接收的语法数据选择所述多个逆颜色变换中的逆颜色变换(282)。视频解码器30B可进一步经配置以使用具有最低相关联成本的选定颜色变换逆变换具有第一红、绿、蓝(RGB)颜色空间的第一残余视频数据块以产生具有第二颜色空间的第二视频数据块(284),且对具有第二颜色空间的第二视频块进行解码(286)。
图10是说明用于将具有第一颜色空间的原始视频数据块变换到具有第二RGB颜色空间的视频数据块的过程的流程图。视频编码器20A可经配置以执行图9中说明的过程。视频编码器20A可经配置以确定与多个颜色变换相关联的成本(300),且选择所述多个颜色变换中具有最低相关联成本的颜色变换(302)。视频编码器20A可进一步经配置以使用具有最低相关联成本的选定颜色变换变换具有第一红、绿、蓝(RGB)颜色空间的第一原始视频数据块以产生具有第二颜色空间的第二视频数据块(304),且对具有第二颜色空间的第二视频块进行编码(306)。
图11是说明用于将具有第一颜色空间的残余视频数据块变换到具有第二RGB颜色空间的视频数据块的过程的流程图。视频编码器20A可经配置以执行图9中说明的过程。视频编码器20A可经配置以确定与多个颜色变换相关联的成本(320),且选择所述多个颜色变换中具有最低相关联成本的颜色变换(322)。视频编码器20A可进一步经配置以使用具有最低相关联成本的选定颜色变换变换具有第一红、绿、蓝(RGB)颜色空间的第一残余视频数据块以产生具有第二颜色空间的第二视频数据块(324),且对具有第二颜色空间的第二视频块进行编码(326)。
在一或多个实例中,所描述的功能可以用硬件、软件、固件或其任何组合来实施。如果用软件实施,那么所述功能可作为一或多个指令或代码在计算机可读媒体上存储或发射,且由基于硬件的处理单元执行。计算机可读媒体可包含计算机可读存储媒体,所述计算机可读存储媒体对应于有形媒体,例如,数据存储媒体或包含(例如)根据通信协议促进计算机程序从一位置传送至另一位置的任何媒体的通信媒体。以此方式,计算机可读媒体通常可对应于(1)有形计算机可读存储媒体,其是非暂时性的,或(2)通信媒体,例如信号或载波。数据存储媒体可以是可由一或多个计算机或一或多个处理器存取以检索用于实施本发明中描述的技术的指令、代码和/或数据结构的任何可用的媒体。计算机程序产品可包含计算机可读媒体。
以实例说明且非限制,此类计算机可读存储媒体可包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储装置、磁盘存储装置或其它磁性存储装置、快闪存储器或可用来存储呈指令或数据结构的形式的所要程序代码并且可由计算机存取的任何其它媒体。而且,任何连接被恰当地称为计算机可读媒体。举例来说,如果使用同轴电缆、光纤电缆、双绞线、数字订户线(DSL)或例如红外线、无线电及微波等无线技术从网站、服务器或其它远程源发射指令,那么同轴电缆、光纤电缆、双绞线、DSL或例如红外线、无线电及微波等无线技术包含于媒体的定义中。然而,应理解,所述计算机可读存储媒体和数据存储媒体并不包含连接、载波、信号或其它暂时性媒体,而是实际上针对于非暂时性有形存储媒体。如本文所使用,磁盘及光盘包含压缩光盘(CD)、激光光盘、光学光盘、数字多功能光盘(DVD)、软性磁盘及蓝光光盘,其中磁盘通常以磁性方式再现数据,而光盘用激光以光学方式再现数据。以上各者的组合也应包含在计算机可读媒体的范围内。
指令可以由一或多个处理器执行,所述一或多个处理器例如一或多个数字信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、或其它等效的集成或离散逻辑电路。因此,如本文中所使用的术语“处理器”可指代上述结构或适合于实施本文中所描述的技术的任何其它结构中的任一者。此外,在一些方面中,本文所述的功能性可在经配置用于编码及解码的专用硬件及/或软件模块内提供,或并入在组合编解码器中。并且,所述技术可以完全实施于一或多个电路或逻辑元件中。
本发明的技术可以在广泛多种装置或设备中实施,包括无线手持机、集成电路(IC)或一组IC(例如,芯片组)。本发明中描述各种组件、模块或单元是为了强调经配置以执行所揭示技术的装置的功能方面,但未必需要通过不同硬件单元实现。相反地,如上文所描述,各种单元可结合合适的软件和/或固件组合在编解码器硬件单元中,或者由互操作硬件单元的集合来提供,所述硬件单元包含如上文所描述的一或多个处理器。
已描述各种实例。这些和其它实例以及此些实例的特定组合在所附权利要求书的范围内。

Claims (14)

1.一种对视频数据进行编码的方法,所述方法包括:
确定与将经加权差分颜色变换应用于译码单元相关联的成本,
其中所述经加权差分颜色变换包括:
其中α1=cov(G,B)/var(G),
其中α2=cov(G,R)/var(G),
其中R对应于所述RGB颜色空间的红色通道,
其中G对应于所述RGB颜色空间的绿色通道,
其中B对应于所述RGB颜色空间的蓝色通道,
其中cov()是协方差函数,且
其中var()是方差函数,
基于所述成本确定是否将所述经加权差分颜色变换应用于所述译码单元;
基于将所述经加权差分颜色变换应用于所述译码单元的所述确定,使用所述经加权差分颜色变换变换所述译码单元的第一块以产生变换域残余系数的第二块,
其中所述第一块包括所述译码单元的像素域残余系数;
用信号表示指示所述经加权差分颜色变换是否已应用于所述第一块的数据;
对变换域残余系数的所述第二块进行编码;以及
在位流中对α1和α2的值进行编码。
2.根据权利要求1所述的方法,其中α1和α2的所述值被约束于包括由以下各项组成的群组中的至少一者的值的集合:
整数的集合,二进数字的集合,以及具有二进数字的分数的集合。
3.一种对视频数据进行解码的方法,所述方法包括:
在位流中接收与经译码单元相关联的语法数据,所述语法数据指示逆经加权差分颜色变换中的一者,所述逆经加权差分颜色变换包括:
其中α1=cov(G,B)/var(G),
其中α2=cov(G,R)/var(G),
其中R对应于所述RGB颜色空间的红色通道,
其中G对应于所述RGB颜色空间的绿色通道,
其中B对应于所述RGB颜色空间的蓝色通道,
其中cov()是协方差函数,且
其中var()是方差函数,
基于所述所接收语法数据确定是否应用所述逆经加权差分颜色变换;
从所述位流对α1和α2的值进行解码;
基于将所述逆经加权差分颜色变换应用于所述译码单元的所述确定,使用所述逆经加权差分颜色变换逆变换所述译码单元的第一块以产生像素域残余系数的第二块;
其中所述第一块包括所述译码单元的变换域残余系数;以及
对像素域残余系数的所述第二块进行解码。
4.根据权利要求3所述的方法,其中α1和α2的所述值被约束于包括由以下各项组成的群组中的至少一者的值的集合:
整数的集合,二进数字的集合,以及具有二进数字的分数的集合。
5.根据权利要求3所述的方法,所述方法进一步包括:
对用于所述经译码单元的旗标语法元素的值进行解码;以及
基于所述旗标语法元素的所述值确定是否将所述逆经加权颜色变换应用于所述第一块,
其中所述旗标的第一值指示应用所述逆经加权颜色变换;且
其中所述旗标的第二值指示不应用所述逆经加权颜色变换。
6.一种用于对视频数据进行编码的装置,所述装置包括:
存储器,其经配置以存储视频数据;以及
至少一个处理器,其经配置以:
确定与将经加权差分颜色变换应用于译码单元相关联的成本,其中确定所述经加权差分变换包括:
其中α1=cov(G,B)/var(G),
其中α2=cov(G,R)/var(G),
其中R对应于所述RGB颜色空间的红色通道,
其中G对应于所述RGB颜色空间的绿色通道,
其中B对应于所述RGB颜色空间的蓝色通道,
其中cov()是协方差函数,且
其中var()是方差函数,
基于所述成本确定是否将所述经加权差分颜色变换应用于所述译码单元;
基于将所述经加权差分颜色变换应用于所述译码单元的所述确定,使用所述经加权差分颜色变换变换所述译码单元的第一块以产生变换域残余系数的第二块,其中所述第一块包括所述译码单元的像素域残余系数;
用信号表示指示所述经加权差分颜色变换是否已应用于所述第一块的数据;
对变换域残余系数的所述第二块进行编码;以及
在位流中对α1和α2的值进行编码。
7.根据权利要求6所述的装置,其中所述装置包括以下各者中的至少一者:
集成电路;
微处理器;以及
无线通信装置。
8.根据权利要求6所述的装置,其中α1和α2的所述值被约束于包括由以下各项组成的群组中的至少一者的值的集合:
整数的集合,二进数字的集合,以及具有二进数字的分数的集合。
9.一种用于对视频数据进行解码的装置,所述装置包括:
存储器,其经配置以存储视频数据;以及
至少一个处理器,其经配置以:
在位流中接收与经译码单元相关联的语法数据,所述语法数据指示逆经加权差分颜色变换,所述逆经加权差分颜色变换包括:
其中α1=cov(G,B)/var(G),
其中α2=cov(G,R)/var(G),
其中R对应于所述RGB颜色空间的红色通道,
其中G对应于所述RGB颜色空间的绿色通道,
其中B对应于所述RGB颜色空间的蓝色通道,
其中cov()是协方差函数,且
其中var()是方差函数,
基于所述所接收语法数据确定是否应用所述逆经加权差分颜色变换;
从所述位流对α1和α2的值进行解码;
基于将所述逆经加权差分颜色变换应用于所述译码单元的所述确定,使用所述逆经加权差分颜色变换逆变换所述译码单元的第一块以产生像素域残余系数的第二块,
其中所述第一块包括所述译码单元的变换域残余系数;以及
对像素域残余系数的所述第二块进行解码。
10.根据权利要求9所述的装置,其中所述装置包括以下各者中的至少一者:
集成电路;
微处理器;以及
无线通信装置。
11.根据权利要求9所述的装置,其中α1和α2的所述值被约束于包括由以下各项组成的群组中的至少一者的值的集合:
整数的集合,二进数字的集合,以及具有二进数字的分数的集合。
12.根据权利要求9所述的装置,其中所述至少一个处理器进一步经配置以:
对用于所述经译码单元的旗标语法元素的值进行解码;以及
基于所述旗标语法元素的所述值确定是否将所述逆经加权颜色变换应用于所述第一块,
其中所述旗标的第一值指示应用所述逆经加权颜色变换;且
其中所述旗标的第二值指示不应用所述逆经加权颜色变换。
13.一种用于对视频进行解码的装置,所述装置包括:
用于在位流中接收与经译码单元相关联的语法数据的装置,所述语法数据指示逆经加权差分颜色变换,所述逆经加权差分颜色变换包括:
其中α1=cov(G,B)/var(G),
其中α2=cov(G,R)/var(G),
其中R对应于所述RGB颜色空间的红色通道,
其中G对应于所述RGB颜色空间的绿色通道,
其中B对应于所述RGB颜色空间的蓝色通道,
其中cov()是协方差函数,且
其中var()是方差函数,
用于基于所述所接收语法数据确定是否应用所述逆经加权差分颜色变换的装置;
用于从所述位流对α1和α2的值进行解码的装置;
用于基于将所述逆经加权差分颜色变换应用于所述译码单元的所述确定使用所述逆经加权差分颜色变换逆变换所述译码单元的第一块以产生像素域残余系数的第二块的装置,
其中所述第一块包括所述译码单元的变换域残余系数;以及
用于对像素域残余系数的所述第二块进行解码的装置。
14.一种具有存储于其上的指令的非暂时性计算机可读存储媒体,所述指令当执行时致使至少一个处理器:
在位流中接收与经译码单元相关联的语法数据,所述语法数据指示逆经加权差分颜色变换,所述逆经加权差分颜色变换包括:
其中α1=cov(G,B)/var(G),
其中α2=cov(G,R)/var(G),
其中R对应于所述RGB颜色空间的红色通道,
其中G对应于所述RGB颜色空间的绿色通道,
其中B对应于所述RGB颜色空间的蓝色通道,
其中cov()是协方差函数,且
其中var()是方差函数,
基于所述所接收语法数据确定是否应用所述逆经加权差分颜色变换;
从所述位流对α1和α2的值进行解码;
基于将所述逆经加权差分颜色变换应用于所述译码单元的所述确定,使用所述逆经加权差分颜色变换逆变换所述译码单元的第一块以产生像素域残余系数的第二块,其中所述第一块包括所述译码单元的变换域残余系数;以及
对像素域残余系数的所述第二块进行解码。
CN201480034283.XA 2013-06-21 2014-06-20 用于视频译码的自适应颜色变换 Active CN105308959B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201361838152P 2013-06-21 2013-06-21
US61/838,152 2013-06-21
US14/309,867 US20140376611A1 (en) 2013-06-21 2014-06-19 Adaptive color transforms for video coding
US14/309,867 2014-06-19
PCT/US2014/043438 WO2014205363A1 (en) 2013-06-21 2014-06-20 Adaptive color transforms for video coding

Publications (2)

Publication Number Publication Date
CN105308959A CN105308959A (zh) 2016-02-03
CN105308959B true CN105308959B (zh) 2019-03-01

Family

ID=51211862

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201480034283.XA Active CN105308959B (zh) 2013-06-21 2014-06-20 用于视频译码的自适应颜色变换

Country Status (8)

Country Link
US (1) US20140376611A1 (zh)
EP (1) EP3011738A1 (zh)
JP (1) JP6728039B2 (zh)
KR (1) KR102223583B1 (zh)
CN (1) CN105308959B (zh)
BR (1) BR112015032151A2 (zh)
CA (1) CA2912454C (zh)
WO (1) WO2014205363A1 (zh)

Families Citing this family (49)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2551801C2 (ru) * 2011-01-13 2015-05-27 Кэнон Кабусики Кайся Устройство кодирования изображения, способ кодирования изображения и программа, а также устройство декодирования изображения, способ декодирования изображения и программа
US9648330B2 (en) 2013-07-15 2017-05-09 Qualcomm Incorporated Inter-color component residual prediction
TWI676389B (zh) * 2013-07-15 2019-11-01 美商內數位Vc專利控股股份有限公司 至少一種色彩轉換之編碼方法和編碼器、解碼器、顯示裝置、編碼視訊訊號、電腦程式製品及處理器可讀式媒體
US9648332B2 (en) 2013-10-28 2017-05-09 Qualcomm Incorporated Adaptive inter-color component residual prediction
US9215469B2 (en) * 2014-01-10 2015-12-15 Sony Corporation Intra-plane and inter-plane predictive method for RGB image coding
CN105264888B (zh) * 2014-03-04 2018-09-14 微软技术许可有限责任公司 用于对色彩空间、色彩采样率和/或比特深度自适应切换的编码策略
AU2014385774B2 (en) * 2014-03-04 2019-01-17 Microsoft Technology Licensing, Llc Adaptive switching of color spaces, color sampling rates and/or bit depths
WO2015139010A1 (en) * 2014-03-14 2015-09-17 Vid Scale, Inc. Systems and methods for rgb video coding enhancement
US11070810B2 (en) 2014-03-14 2021-07-20 Qualcomm Incorporated Modifying bit depths in color-space transform coding
US10116937B2 (en) 2014-03-27 2018-10-30 Microsoft Technology Licensing, Llc Adjusting quantization/scaling and inverse quantization/scaling when switching color spaces
JP6194427B2 (ja) 2014-10-06 2017-09-06 テレフオンアクチーボラゲット エルエム エリクソン(パブル) 量子化パラメータのコーディング及び導出
WO2016054765A1 (en) * 2014-10-08 2016-04-14 Microsoft Technology Licensing, Llc Adjustments to encoding and decoding when switching color spaces
EP3222044A1 (en) * 2014-11-21 2017-09-27 VID SCALE, Inc. One-dimensional transform modes and coefficient scan order
CN107005695B (zh) 2014-11-28 2020-01-07 联发科技股份有限公司 用于视频编码的替代变换的方法及装置
US10349064B2 (en) 2015-03-10 2019-07-09 Apple Inc. Adaptive chroma downsampling and color space conversion techniques
US10674182B2 (en) 2015-06-05 2020-06-02 Telefonaktiebolaget Lm Ericsson (Publ) Pixel pre-processing and encoding
US20180146213A1 (en) * 2015-06-05 2018-05-24 Telefonaktiebolaget Lm Ericsson (Publ) Filtering for video processing
US10390020B2 (en) * 2015-06-08 2019-08-20 Industrial Technology Research Institute Video encoding methods and systems using adaptive color transform
US10560695B2 (en) 2015-06-26 2020-02-11 Telefonaktiebolaget Lm Ericsson (Publ) Encoding and decoding of pictures in a video
US10225561B2 (en) * 2015-10-08 2019-03-05 Mediatek Inc. Method and apparatus for syntax signaling in image and video compression
US20170105012A1 (en) * 2015-10-08 2017-04-13 Mediatek Inc. Method and Apparatus for Cross Color Space Mode Decision
WO2017083784A1 (en) 2015-11-11 2017-05-18 Apple Inc. Adaptive chroma downsampling and color space conversion techniques
JP6593122B2 (ja) * 2015-11-20 2019-10-23 富士通株式会社 動画像符号化装置、動画像符号化方法、及びプログラム
US10448024B2 (en) * 2016-01-11 2019-10-15 Qualcomm Incorporated System and methods for calculating distortion in display stream compression (DSC)
WO2017173593A1 (en) * 2016-04-06 2017-10-12 Mediatek Singapore Pte. Ltd. Separate coding secondary transform syntax elements for different color components
JP2021526329A (ja) 2018-06-07 2021-09-30 インターデジタル ヴイシー ホールディングス, インコーポレイテッド 映像のコード化又は映像の復号のためのシンタックス要素
US11256528B2 (en) * 2018-10-26 2022-02-22 Nvidia Corporation Individual application window streaming suitable for remote desktop applications
AU2020214083B2 (en) * 2019-02-02 2023-06-01 Beijing Bytedance Network Technology Co., Ltd. Buffer management for intra block copy in video coding
KR20210123300A (ko) 2019-02-02 2021-10-13 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 비디오 코딩에서 인트라 블록 복사를 위한 버퍼 관리
CN117395439A (zh) 2019-03-01 2024-01-12 北京字节跳动网络技术有限公司 用于视频编解码中的帧内块复制的基于方向的预测
CN117640927A (zh) 2019-03-04 2024-03-01 北京字节跳动网络技术有限公司 视频编解码中的帧内块复制中的实施方式方面
US11949870B2 (en) * 2019-06-21 2024-04-02 Qualcomm Incorporated Context modeling for low-frequency non-separable transformation signaling for video coding
CN114175645B (zh) 2019-07-06 2024-04-12 北京字节跳动网络技术有限公司 用于视频编解码中的帧内块复制的虚拟预测缓冲
CA3146391A1 (en) 2019-07-10 2021-01-14 Beijing Bytedance Network Technology Co., Ltd. Sample identification for intra block copy in video coding
EP3981146A4 (en) 2019-07-11 2022-08-03 Beijing Bytedance Network Technology Co., Ltd. BITSTREAM CONFORMITY RESTRICTIONS FOR INTRA-BLOCK COPY IN VIDEO ENCODING
US20220286714A1 (en) * 2019-08-23 2022-09-08 Hfi Innovation Inc. Method and Apparatus of Partitioning Small Size Coding Units with Partition Constraints
KR20220058889A (ko) 2019-09-14 2022-05-10 바이트댄스 아이엔씨 비디오 코딩의 크로마 양자화 파라미터
CN114651442A (zh) 2019-10-09 2022-06-21 字节跳动有限公司 视频编解码中的跨分量适应性回路滤波
US11412235B2 (en) 2019-10-10 2022-08-09 Tencent America LLC Color transform for video coding
CN114556924B (zh) 2019-10-14 2024-01-26 字节跳动有限公司 视频处理中色度残差的联合编解码与滤波的方法、装置及介质
CN115066897A (zh) * 2019-11-14 2022-09-16 抖音视界有限公司 低位深度视觉媒体数据的编解码
KR20220106116A (ko) 2019-12-09 2022-07-28 바이트댄스 아이엔씨 비디오 코딩에서 양자화 그룹 사용
CN114902657A (zh) * 2019-12-31 2022-08-12 字节跳动有限公司 视频编解码中的自适应颜色变换
EP4085637A4 (en) * 2020-01-05 2023-06-07 Beijing Dajia Internet Information Technology Co., Ltd. METHOD AND APPARATUS FOR VIDEO ENCODING IN A 4:4:4 CHROMA FORMAT
US20230139083A1 (en) * 2020-01-25 2023-05-04 Lg Electronics Inc. Image or video coding based on color space conversion
US20230103632A1 (en) * 2020-01-25 2023-04-06 Lg Electronics Inc. Act residual-based image or video coding
US20240048733A1 (en) * 2020-01-25 2024-02-08 Lg Electronics Inc. Image or video coding for residuals using color space transformation
US11323732B2 (en) * 2020-04-13 2022-05-03 Tencent America LLC Method and apparatus for video coding
US11900840B2 (en) * 2021-12-13 2024-02-13 Qualcomm Incorporated Chrominance optimizations in rendering pipelines

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1538844A2 (en) * 2003-11-26 2005-06-08 Samsung Electronics Co., Ltd. Color image residue transformation and encoding method

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10144992A1 (de) * 2001-09-12 2003-03-27 Mpm Beteiligungs Gmbh Formaufspannplatte einer Spritzgießmaschine
JP2003348594A (ja) * 2002-05-27 2003-12-05 Sony Corp 画像復号装置及び方法
US7894530B2 (en) * 2004-05-07 2011-02-22 Broadcom Corporation Method and system for dynamic selection of transform size in a video decoder based on signal content
US20050259730A1 (en) * 2004-05-18 2005-11-24 Sharp Laboratories Of America, Inc. Video coding with residual color conversion using reversible YCoCg
WO2007079781A1 (en) * 2006-01-13 2007-07-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Picture coding using adaptive colour space transformation
US9225991B2 (en) * 2013-05-30 2015-12-29 Apple Inc. Adaptive color space transform coding

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1538844A2 (en) * 2003-11-26 2005-06-08 Samsung Electronics Co., Ltd. Color image residue transformation and encoding method

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
coding of 4:4:4 video in professional extension;TOPIWALA;《9. JVT MEETING》;20030905;全文
Macrobl ock-Adaptive Residual Color Space Transforms for 4:4:4 video coding;DETLEV MARPE ET AL.;《IMAGE PROCESSING, 2006 IEEE INTERNATIONAL CONFERENCE ON, IEEE,PI》;20061001;全文

Also Published As

Publication number Publication date
EP3011738A1 (en) 2016-04-27
JP2016526830A (ja) 2016-09-05
WO2014205363A1 (en) 2014-12-24
JP6728039B2 (ja) 2020-07-22
KR102223583B1 (ko) 2021-03-04
CA2912454C (en) 2023-02-14
CN105308959A (zh) 2016-02-03
BR112015032151A2 (pt) 2017-07-25
CA2912454A1 (en) 2014-12-24
KR20160024886A (ko) 2016-03-07
US20140376611A1 (en) 2014-12-25

Similar Documents

Publication Publication Date Title
CN105308959B (zh) 用于视频译码的自适应颜色变换
US10986340B2 (en) Coding adaptive multiple transform information for video coding
CN112740681B (zh) 自适应多重变换译码
US11683527B2 (en) Extended multiple transform selection for video coding
CN105379270B (zh) 颜色分量间残余预测
CN105723707B (zh) 用于视频译码的色彩残差预测
CN105637866B (zh) 自适应色彩分量间残差预测
US20180205946A1 (en) Coding video data using derived chroma mode
CN103190147B (zh) 用于视频译码的语法元素的联合译码方法及设备
CN104604224B (zh) 可缩放视频译码中的变换基底调整
AU2016228221A1 (en) Method and Apparatus for Encoding/Decoding Image
KR20180004249A (ko) 고효율 비디오 코딩(hevc) 스크린 콘텐츠 코딩(scc) 확장을 위한 어드밴스드 코딩 기법
EP3192263A1 (en) Improved palette mode in high efficiency video coding (hevc) screen content coding (scc)
KR20210135245A (ko) 비디오 코딩에서의 암시적 변환 선택
EP3824628A1 (en) Transform variations of multiple separable transform selection
WO2021061998A1 (en) Simplified palette predictor update for video coding
KR20210103481A (ko) 비디오 코딩을 위한 트리-기반 변환 유닛 (tu) 파티션
KR20220146469A (ko) 결합된 픽셀/변환 기반 양자화에 의한 비디오 코딩을 위한 양자화 파라미터 제어 방법
WO2021081302A1 (en) Parametric graph-based separable transforms for video coding

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant