CN101507284B - 用于对视频颜色增强数据进行编码的方法和设备,以及用于对视频颜色增强数据进行解码的方法和设备 - Google Patents

用于对视频颜色增强数据进行编码的方法和设备,以及用于对视频颜色增强数据进行解码的方法和设备 Download PDF

Info

Publication number
CN101507284B
CN101507284B CN2006800553696A CN200680055369A CN101507284B CN 101507284 B CN101507284 B CN 101507284B CN 2006800553696 A CN2006800553696 A CN 2006800553696A CN 200680055369 A CN200680055369 A CN 200680055369A CN 101507284 B CN101507284 B CN 101507284B
Authority
CN
China
Prior art keywords
transfer function
video image
value
lut
bit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2006800553696A
Other languages
English (en)
Other versions
CN101507284A (zh
Inventor
高永英
武宇文
陈颖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
InterDigital VC Holdings Inc
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Publication of CN101507284A publication Critical patent/CN101507284A/zh
Application granted granted Critical
Publication of CN101507284B publication Critical patent/CN101507284B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N11/00Colour television systems
    • H04N11/04Colour television systems using pulse code modulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/90Dynamic range modification of images or parts thereof
    • G06T5/92Dynamic range modification of images or parts thereof based on global image properties
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/40Image enhancement or restoration using histogram techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/50Image enhancement or restoration using two or more images, e.g. averaging or subtraction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/46Colour picture communication systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/36Scalability techniques involving formatting the layers as a function of picture distortion after decoding, e.g. signal-to-noise [SNR] scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10024Color image

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Image Processing (AREA)

Abstract

越来越多地使用优于传统的8比特颜色深度的可见亮度和对比度的高精度重现,促进了被称作高比特深度的增强动态范围的发展。本发明提供了一种编码方法,用于对M比特RGB像素的第一低比特深度视频图像(IMBL)和N比特RGB像素的第二高比特深度视频图像(IMEL)进行编码,M<N,其中,第一和第二视频图像具有相同的空间分辨率,所述编码方法包括:基于第一和第二视频图像的颜色直方图(HistBL,HistEL)产生第一转换函数(LUTinter);基于第一转换函数(LUTinter)产生第二转换函数(LUTfinal);将第二转换函数(LUTfinal)应用(TR)到第一视频图像,其中,产生变换的第一视频图像(IMTR,BL);对残差(IMres)f进行计算并编码;对第一视频图像(IMBL)进行编码;以及发送编码的第一视频图像(IMBL)、第二转换函数(LUTfinal)和编码的差值。

Description

用于对视频颜色增强数据进行编码的方法和设备,以及用于对视频颜色增强数据进行解码的方法和设备
技术领域
本发明涉及一种用于对视频颜色增强数据进行编码的方法和设备,本发明还涉及一种用于对视频颜色增强数据进行解码的方法和设备。
背景技术
近年来,优于传统的8比特颜色深度的可见亮度和对比度的高精度重现逐渐使用在诸如医学成像、高质量支持视频的计算机游戏和专业摄影室等许多领域以及家庭影院相关应用中。该处理促进了增强动态范围(为了便于与传统8比特颜色深度相比较,这里被称作高比特深度)的发展。与为捕获和显示设备产生极高像素分辨率的电子传感器、处理器和存储器件的发展对比,数字成像系统的颜色功能进展缓慢。自第一代数字化可视内容的出现起,8比特颜色深度成为捕获和显示设备的主要技术。
考虑到未来相当长时间内标准8比特和更高比特数字成像系统将同时存在于消费者市场的事实,颜色比特深度可扩展性是有益的。不同的颜色比特深度对于例如多媒体内容传送期间的终端显示设备尤为重要。
发明内容
本发明提供了一种用于实现视频颜色空间可扩展性的方法和设备。根据本发明的一个方面,提供了一种用于对颜色增强层进行编码的方法和设备,该方法和设备有差别地对该颜色增强层进行编码。本发明的另一方面是一种用于对视频信号进行解码来获得传统颜色比特深度图像或增强颜色比特深度图像的方法和设备。
原则上,本发明的编码方面包括以下步骤:产生转换函数,例如以适于建立输入颜色值到输出颜色值的映射的查找表(LUT)的形式,该输入颜色值和输出颜色值均包括2M种不同颜色;向具有较低或传统颜色比特深度的第一视频图像应用转换函数;在转换后的视频图像和具有较高颜色比特深度(N比特,N>M;但与第一视频图像的空间分辨率相同)的第二视频图像之间产生差值图像或残差;并且对残差进行编码。然后,将编码后的第一视频图像、转换函数的参数(例如,LUT本身)和编码后的残差发送到接收机。也可以对转换函数的参数进行编码。另外,也如此表示转换函数的参数。
第一和第二图像可以分别视作颜色基本层和颜色增强层。
特别地,可以通过将第一和第二视频图像的颜色直方图进行比较来获得转换函数,为此,将具有2M个bin的第一图像的颜色直方图变换成具有2N个bin(N>M)的“平滑”颜色直方图,并且从平滑的直方图和定义了平滑的颜色直方图的值和颜色增强层直方图的值之间的变换的颜色增强层直方图来确定转换函数。针对红、绿和蓝基本显示颜色来分别进行所述过程。
根据本发明的解码方面,一种用于解码的方法包括:从比特流中提取第一和第二视频图像的视频数据,提取颜色增强控制数据,还对第一视频图像进行解码和重建,其中,获得具有各为M比特的颜色像素值的重建的第一视频图像,并且从颜色增强控制数据中重建实现转换函数的映射表。然后,将该映射表应用到重建的第一视频图像的每一个像素,产生的变换视频图像作为预测图像,随后利用解码的第二视频图像对该预测图像进行更新。解码的第二视频图像是残差图像,并且更新产生了具有各为N比特(N>M)的像素的增强视频图像,并因此产生比重建的第一视频图像更高的颜色空间。
针对红、绿和蓝基本视频颜色分别执行上述步骤。因此,完整的视频信号可以包括:针对每一幅图像的编码的低颜色分辨率图像,以及针对这些颜色中每一项的残差图像和转换函数的参数,上述均用于产生更高颜色分辨率图像。有利地,基于原始视频图像的R-G-B值来执行产生转换函数和残差图像,因此产生转换函数和残差图像独立于进一步的视频编码。因此,然后可以使用任何传统编码对低颜色分辨率图像进行编码,例如根据MPEG或JVT标准(AVC、SVC等)。同样,在解码端,基于传统解码来执行颜色增强,因此独立于编码格式进行解码。
因此,具有比特深度显示功能的设备(例如,8比特显示器)仅需要对具有较低颜色比特深度的颜色基本层进行解码,而具有增强颜色比特深度显示功能的高级设备(例如,12比特显示器)还可以对颜色增强层和红、绿和蓝的变换表进行解码,并产生具有完全颜色空间应用的图像。
本发明涉及一种新型的视频可扩展性(即,颜色比特深度可扩展性),并且提供了一种颜色比特深度预测解决方案,可以应用在颜色比特深度可缩放的编解码器的中间层预测以提高编码效率。使用转换函数来在产生残差图像之前产生预测图像的优点在于,由于预测图像更加匹配相应的颜色增强层图像,因此编码更加有效。例如,由颜色基本层中8比特值9Ahex描述的特定绿色值可以映射到颜色增强层中16种不同的12比特颜色值(从9A0hex到9AFhex)。尽管在一个图像中这16个值中的一个可以在颜色增强层中起主导作用,其可以是其他图像的其他值。因此,本发明实现了颜色增强层的优化编码。
在从属权利要求、以下说明书和附图中公开了本发明的有利实施例。
附图说明
参照附图对本发明的示例性实施例进行描述,附图中
图1是颜色比特深度可伸缩视频编码和解码的结构;
图2是编码处理的流程图;
图3是平滑直方图规范的流程图;
图4是直方图平滑的示例;
图5是解码处理的流程图;以及
图6是完整增强层解码器的概要。
具体实施方式
图1示出了颜色比特深度可伸缩视频编码和解码的总体结构。编码器ENC以M比特的传统颜色分辨率和N比特(N>M)的增强颜色分辨率对每一幅视频图像接收两次。不同于产生两个独立分离的视频流,而是产生颜色基本层和颜色增强层,其中颜色增强层依赖于颜色基本层。如图1所示,在编码器和解码器中执行中间层预测,用于预测更高比特深度的颜色。
图1中的基本层编码器方框包含所有传统编码步骤,例如任意空间和/或时间冗余度缩减技术,例如产生分离的亮度和色度值、DCT变换等。在解码器端,基本层解码器执行相应的解码。“基本层”和“增强层”仅指颜色比特深度。有利地,任何视频编码和解码方法可以独立于本发明所实现的颜色增强处理而用于基本层。基本层解码器的输出适于传统显示设备,而增强层解码器的输出适于能够针对红、绿和蓝部分图像中的每一项显示2N(N>M)个不同的颜色值的高质量显示器。如果M例如为8,则N的示例为10、12或16比特,而原则上可以实现M和N(N>M)的所有组合。诸如质量可扩展性、空间可扩展性和时域可扩展性、中间层预测等类似的其他类型的可扩展性显著影响编码效率。
本发明提出了一种基于平滑直方图规范的颜色比特深度预测的空间均匀方法。考虑描述相同场景的两幅图像。对于这两幅图像,相应的像素(这里“相应的像素”表示分别属于两幅图像但在图像坐标系统中具有相同坐标的两个像素)指出相同的场景位置。相应的像素之间的唯一不同是颜色比特深度。假设利用M比特长度的码字对一副图像的每一种颜色进行编码,而利用N比特长度的码字对其他图像进行编码,其中M<N。遵照使预测N比特图像和原始N比特图像之间的差值最小化的准则,逆颜色映射的任务是从M比特图像中产生N比特图像的预测版本。可以通过例如被广泛接受并使用在视频压缩领域的PSNR的任意方法来测量预测的N比特图像和原始N比特图像之间的差值。另外,在这种情况下,最重要的方面是预测图像如何有效地用于随后的残差数据压缩,而不是预测图像看起来是什么样子的。
图2示出了本发明一个实施例的总体编码过程。使用实现映射函数的查找表LUTfinal对基本层图像IMBL进行变换TR。变换TR的结果是变换的基本层图像IMTR,BL。查找表LUTfinal从另一中间查找表LUTinter产生,该中间查找表LUTinter从基本层图像(优选地,重建的基本层图像)的颜色直方图、和增强层图像的颜色直方图产生。由于这些图像的不同颜色分辨率,这些图像的颜色直方图不仅具有不同数量的bin(一个bin用于每一个可能的颜色),而且针对每一种基本层颜色、和序列的每一幅图像,分布在增强层图像的bin之间的值也可以不同。例如,如果基本层具有M比特并且增强层具有N比特,基本层直方图的每一个bin与增强层直方图的2N-M个bin相对应,即每一个基本层像素值将按照惯例用来预测2N-M个像素值中的一个。通过考虑两幅图像的颜色直方图可以优化这种预测。如下所述,中间查找表LUTinter实现了描述增强层图像的颜色直方图HistEL和从基本层图像IMBL产生的颜色直方图SmHistBL之间的变换的直方图转换函数。
变换的基本层图像IMTR,BL用于预测增强层图像IMEL,计算差值或残差Δ,编码的IMres并发送,所有这些处理分别用于R、G和B。
图3示出了提出的空间均匀逆颜色映射的细节。为了更好的理解,将基本层(M比特)图像命名为“输入图像”NI,而增强层(N比特)图像被重新命名为“期望图像”DI。一个基本思想是将直方图规范1(1R.C.Gonzalez and R.E.Woods,“Digital image processing”,2ndedition,pp.94-102,Prentice Hall,2002)的算法应用到NI和DI。产生查找表来转换NI,从而使其具有如DI的直方图规定的特定直方图。
然而,当对颜色比特深度预测采用经典直方图规范时,存在两个主要缺陷。首先,由于直方图具有离散值,因此转换的NI不能具有与DI完全相同的直方图。相反,转换的NI的直方图近似于DI的直方图。其次,两个直方图的不同bin大小(由不同比特深度所引起)破坏了它们之间的匹配(bin大小表示每一个颜色分量的级的数目,例如,8比特图像的bin大小为256)。这是经考虑的颜色比特深度预测中的特定缺陷。例如,在NI是DI简单比特移位的情况下,通过直方图规范获得的转换NI的PSNR通常低于通过简单逆比特移位获得的转换NI的PSNR。
为了克服这些缺陷,提出在规范NI的直方图之前将其“平滑”。平滑的直方图SmHistBL具有与DI的直方图HistEL相同的bin大小,DI的直方图HistEL充当直方图规范处理的期望直方图。将经典直方图规范算法应用到平滑直方图和期望直方图上。最后,执行被称作“概率映射”的后处理来获得LUT。图3示出了平滑的直方图规范的流程图。px(xk),k=0,1,…,2M-1表示NI的直方图HistBL,通过pz(zk),k=0,1,…2N-1描述DI的直方图HistEL
在图3中,对于低比特(M比特)图像NI,一个颜色通道的直方图是px=(x)。通过使用方程(5)来平滑该直方图,并且产生具有与高比特(N比特)图像DI的直方图相同的bin大小的平滑直方图px′(x)。累加该值,从而产生sk(对于图3的示例,k=1,...,16)。可以将sk表示为函数F(xk′)。高比特(N比特)图像DI具有相同颜色通道的直方图Pz(z),累积该直方图pz(z)来产生vk(k与如上所述的k相同)。可以将vk表示为函数G(zk)。然后,确定分布vj,针对sk的每一值(从高比特图像DI的vk值)给出最佳匹配值vl。该分布vj建立从值sk(因此xk′)到值vk的变换,并且是变换G的逆。
以下,对直方图平滑的处理进行描述。直方图平滑的目的是“拉伸(stretch)”输入直方图,从而使其具有与期望直方图相同的bin大小。这是直方图规范处理的必备条件。以下为图3中的表示,px(xk)的值均匀分布到相应的范围[xk′,xk′+1,…xk′+2(N-M)-1]中,如方程(5)所示:
Figure G2006800553696D00061
为了确保“均匀分布”,使用非归一化的直方图。图4中示出了平滑直方图的简单示例。图4a)示出了具有2比特的颜色比特深度的基本层输入图像的颜色直方图,即,特定颜色(例如,红色)的22=4个可能颜色值。直方图平滑处理将直方图“拉伸”到4比特颜色比特深度,即24=16个可能的颜色值。输入图像的单个bin中的值的数目是具有该特定颜色值的输入图像之内的像素数目,例如,与值0相对应的最左边的值40表示具有值为0的“红色”(在该直方图中指“红”色)的输入图像的40个像素。平滑处理将这些值分布到平滑直方图的2N-M个相应的bin。在该示例中,根据2N-M=4,平滑直方图的前4个bin与原始直方图的第一个bin相对应。如图4b)所示,根据方程(5),原始直方图的值40被平均地分布到平滑直方图的4个相应的bin。
平滑的思想在于,提高了输入直方图的连续性,从而直方图规范将更加有效。详细地,将图3中所示的方程(1)、(2)和(4)的可选描述成连续的灰度图像:
s = F ( x ) = ∫ 0 x p x ( u ) du - - - ( 1 ′ )
v = G ( z ) = ∫ 0 z p z ( w ) dw - - - ( 2 ′ )
y=G-1(s)=G-1[F(x)](4′)
在连续灰度级的情况下,可以将输入直方图规范为与期望的直方图完全相同。然而,如上所述,对于离散灰度级,仅可以实现近似期望的直方图。此外,由于灰度级的数目接近无穷,因此近似接近精确匹配。因此,理论上,平滑过程等同于在输入直方图的离散化期间增加采样率,平滑过程优于具有不同bin大小的两个直方图之间的直接直方图规范。
平滑直方图仅是该算法中的中间步骤。不存在与其相对应的图像。
以下对概率映射处理进行描述。一旦已经将经典直方图规范算法应用到平滑直方图px′(x)和期望直方图pz(z),就产生中间LUTyk′=LUTinter(xk′)。下个问题是从其相应范围xk′,xk′+1,…,xk′+2(N-M)-1]的多个映射值中选择唯一映射值xk。示例地,提出了两种不同准则作为概率映射的准则,如等式(6)和(7)所示:
y k = arg max y l ′ { p z ( y l ′ ) , y l ′ = LUT inter ( x l ′ ) , x l ′ ∈ [ x k ′ , x k ′ + 1 , · · · , x k ′ + 2 ( N - M ) - 1 ] } - - - ( 6 )
其中,yk是映射值xk。产生最终LUTyk=LUTfinal(xk)来将原始直方图映射到期望直方图,其中,k=0,1,…,2M-1,yk∈{zl,l=0,1,…,2N-1}。
方程(6)表示,在与xk相对应的2N-M个值之间,选择在期望直方图Pz(y1′)中具有最大值的一个值。
方程(7)表示,在与xk相对应的2N-M个值之间,使用小于或等于其平均值的最接近的整数作为最终的映射值。
由于LUTinter将输入图像的平滑直方图映射到期望图像的直方图,因此LUTinter是“一对一”映射。然而,如果考虑输入图像的直接直方图,可以看到每一个xk与2N-M个值相对应。“概率映射”的任务是仅从2N-M个值中选择一个值作为最终映射值xk。因此,LUTfinal仍旧是“一对一”映射:将每一个值xk映射到一个值yk。LUT的映射是可逆的,这是因为期望图像的全部值(2N)中仅2M个值具有相应的xk
当将上述算法应用到输入图像和期望图像时,计算两幅图像的直方图。然后,平滑输入直方图,产生“平滑直方图”。在保留步骤(经典直方图规范和概率映射)完成之后,产生最终LUT来将输入直方图的级映射到期望直方图的级。然后,通过将LUT应用到输入图像的每一个像素来产生预测图像。
图6示出了具有针对R、G和B图像的分离分支的完整增强层编码器的概述。对基本层进行传统编码。
本发明可用于视频编码器和视频解码器,并且特别可用于对颜色基本层和具有最优效率的相同空间分辨率的颜色增强层进行编码/解码。

Claims (6)

1.一种用于对第一视频图像(IMBL)和第二视频图像(IMEL)进行编码的方法,第一视频图像(IMBL)包括各具有M比特的RGB像素值,第二视频图像(IMEL)包括各具有N比特的RGB像素值,M<N,其中,第一和第二视频图像的相应的像素之间的唯一不同是颜色比特深度,所述方法包括以下步骤:
-产生第一转换函数(LUTinter),所述第一转换函数(LUTinter)具有2N个可能的输入值并基于第一和第二视频图像的颜色直方图(HistBL,HistEL);
-基于第一转换函数(LUTinter)产生第二转换函数(LUTfinal),其中,第二转换函数具有2M个可能的输入值并包括将其每一个输入值映射到第一转换函数的2(N-M)个相应值之一的函数;
-将第二转换函数(LUTfinal)应用(TR)到第一视频图像,其中,第二转换函数用于映射像素,并且产生变换的第一视频图像(IMTR,BL);
-计算变换的第一视频图像(IMTR,BL)和第二视频图像(IMEL)之间的差值(IMres);
-对差值(IMres)进行编码;
-对第一视频图像(IMBL)进行编码;以及
-发送编码的第一视频图像(IMBL)、第二转换函数(LUTfinal)和编码的差值(IMres);
其中,产生第一转换函数(LUTinter)的步骤包括以下步骤:
-产生第一视频图像的第一颜色直方图(HistBL),所述第一颜色直方图具有2M个bin;
-产生第二视频图像的第二颜色直方图(HistEL),所述第二颜色直方图具有2N个bin;以及
-从第一颜色直方图(HistBL)产生(sm)具有2N个bin的平滑颜色直方图(SmHistBL),其中,将第一直方图的每一个bin的值分布到2N-M个bin中,并且第一转换函数(LUTinter)定义了平滑颜色直方图(SmHistBL)和第二颜色直方图(HistEL)之间的转换。
2.根据权利要求1的方法,其中,在应用(TR)第二转换函数的步骤中所述第一视频图像是重建的第一视频图像,以及/或者在产生第一转换函数(LUTinter)的步骤中所述第一视频图像是重建的第一视频图像。
3.根据权利要求1或2的方法,其中,用于将第二转换函数(LUTfinal)的每一个输入值映射到第一转换函数的2(N-M)个相应值之一的函数是概率映射(pm)函数。
4.根据权利要求3的方法,其中,概率映射函数针对第二转换函数的2M个值中的每一个从第一转换函数的2N-M个相应值中选择一个值,所选值是第二直方图(HistEL)中的最大值。
5.根据权利要求3的方法,其中,概率映射函数针对第二转换函数的2M个值中的每一个从第一转换函数的2N-M个相应值中选择一个值,所选值是小于或等于所述2N-M个相应值的平均值的最接近的整数。
6.一种对第一视频图像(IMBL)和第二视频图像(IMEL)进行编码的设备,第一视频图像(IMBL)包括各具有M比特的RGB像素值,第二视频图像(IMEL)包括各自具有N比特的RGB像素值,M<N,其中,第一和第二视频图像的相应的像素之间的唯一不同是颜色比特深度,所述设备包括:
-用于产生第一转换函数(LUTinter)的装置,所述第一转换函数(LUTinter)具有2N个可能的输入值并基于第一和第二视频图像的颜色直方图(HistBL,HistEL);
-用于基于第一转换函数(LUTinter)产生第二转换函数(LUTfinal)的装置,其中,第二转换函数具有2M个可能的输入值,并包括将其每一个输入值映射到第一转换函数的2(N-M)个相应值之一的函数;
-用于将第二转换函数(LUTfinal)应用(TR)到第一视频图像的装置,其中,第二转换函数用于映射像素,并且产生变换的第一视频图像(IMTR,BL);
-用于计算变换的第一视频图像(IMTR,BL)和第二视频图像(IMEL)之间的差值(IMres)的装置;
-用于对差值(IMres)进行编码的装置;
-用于对第一视频图像(IMBL)进行编码的装置;以及
-用于发送编码的第一视频图像(IMBL)、第二转换函数(LUTfinal)和编码的差值(IMres)的装置;
其中,用于产生第一转换函数(LUTinter)的装置包括:
-用于产生第一视频图像的第一颜色直方图(HistBL)的装置,所述第一颜色直方图具有2M个bin;
-用于产生第二视频图像的第二颜色直方图(HistEL)的装置,所述第二颜色直方图具有2N个bin;以及
-用于从第一颜色直方图(HistBL)产生(sm)具有2N个bin的平滑颜色直方图(SmHistBL)的装置,其中,将第一直方图的每一个bin的值分布到2N-M个bin中,并且第一转换函数(LUTinter)定义了平滑颜色直方图(SmHistBL)和第二颜色直方图(HistEL)之间的转换。
CN2006800553696A 2006-07-17 2006-07-17 用于对视频颜色增强数据进行编码的方法和设备,以及用于对视频颜色增强数据进行解码的方法和设备 Active CN101507284B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2006/001699 WO2008019524A1 (en) 2006-07-17 2006-07-17 Method and apparatus for encoding video color enhancement data, and method and apparatus for decoding video color enhancement data

Publications (2)

Publication Number Publication Date
CN101507284A CN101507284A (zh) 2009-08-12
CN101507284B true CN101507284B (zh) 2012-06-27

Family

ID=39081897

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2006800553696A Active CN101507284B (zh) 2006-07-17 2006-07-17 用于对视频颜色增强数据进行编码的方法和设备,以及用于对视频颜色增强数据进行解码的方法和设备

Country Status (7)

Country Link
US (1) US8761249B2 (zh)
EP (1) EP2041983B1 (zh)
JP (1) JP4991851B2 (zh)
KR (1) KR101196975B1 (zh)
CN (1) CN101507284B (zh)
DE (1) DE602006019006D1 (zh)
WO (1) WO2008019524A1 (zh)

Families Citing this family (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100531291C (zh) 2004-11-01 2009-08-19 彩色印片公司 对增强的色彩空间内容进行母版制作和分发的方法和系统
US8773494B2 (en) * 2006-08-29 2014-07-08 Microsoft Corporation Techniques for managing visual compositions for a multimedia conference call
WO2008083521A1 (en) 2007-01-10 2008-07-17 Thomson Licensing Video encoding method and video decoding method for enabling bit depth scalability
US8085852B2 (en) * 2007-06-26 2011-12-27 Mitsubishi Electric Research Laboratories, Inc. Inverse tone mapping for bit-depth scalable image coding
KR101509070B1 (ko) * 2007-10-16 2015-04-06 톰슨 라이센싱 비트 깊이 크기 조정 능력에 관한 아티팩트 제거 방법 및 장치
US9338475B2 (en) 2008-04-16 2016-05-10 Intel Corporation Tone mapping for bit-depth scalable video codec
US9538176B2 (en) 2008-08-08 2017-01-03 Dolby Laboratories Licensing Corporation Pre-processing for bitdepth and color format scalable video coding
CN104333766B (zh) * 2008-08-22 2018-08-07 汤姆逊许可证公司 用于内容传送的方法和系统
US8432413B2 (en) * 2008-11-17 2013-04-30 Xrfiles, Inc. System and method for the display of extended bit depth high resolution images
KR101740741B1 (ko) 2009-02-11 2017-06-08 톰슨 라이센싱 톤 매핑 및 톤 역매핑을 이용하는 비트 심도 스케일링 가능 비디오 인코딩 및 디코딩을 위한 방법 및 장치
JP5027171B2 (ja) * 2009-02-25 2012-09-19 日本電信電話株式会社 画像符号化方法,画像符号化装置および画像符号化プログラム
BRPI1009443B1 (pt) 2009-03-13 2021-08-24 Dolby Laboratories Licensing Corporation Método de geração de parâmetros de mapeamento de tons inverso, método de compactação de dados de vídeo e método para geração de um fluxo de bits de saída a partir de um fluxo de bits de entrada
JP2010278724A (ja) * 2009-05-28 2010-12-09 Olympus Corp 画像処理装置、画像処理方法及び画像処理プログラム
TWI407426B (zh) * 2010-04-15 2013-09-01 Nuvoton Technology Corp 顯示裝置及其控制電路以及顯示影像資料之方法
TWI431512B (zh) * 2010-06-23 2014-03-21 Ind Tech Res Inst 三維控制端點之辨識方法及應用其之電腦可讀取媒體
CN102331883B (zh) * 2010-07-14 2013-11-06 财团法人工业技术研究院 三维控制端点的辨识方法及应用其的计算机可读介质
CN101923708B (zh) * 2010-08-09 2012-07-25 福建华映显示科技有限公司 深度图强化方法
JP2012060261A (ja) 2010-09-06 2012-03-22 Sony Corp 画像処理装置および方法
KR20120087233A (ko) 2010-12-03 2012-08-07 한국전자통신연구원 영상 융합을 이용한 타일 맵 서비스 방법 및 이를 위한 시스템
WO2012122425A1 (en) * 2011-03-10 2012-09-13 Dolby Laboratories Licensing Corporation Bitdepth and color scalable video coding
EP2686825B1 (en) 2011-03-17 2015-01-07 Dolby Laboratories Licensing Corporation Generating alternative versions of image content using histograms
US8334911B2 (en) 2011-04-15 2012-12-18 Dolby Laboratories Licensing Corporation Encoding, decoding, and representing high dynamic range images
TWI513327B (zh) 2011-04-15 2015-12-11 Dolby Lab Licensing Corp 高動態範圍影像的編碼、解碼及表示
US9036042B2 (en) 2011-04-15 2015-05-19 Dolby Laboratories Licensing Corporation Encoding, decoding, and representing high dynamic range images
CN103106668B (zh) * 2011-11-09 2016-08-03 佳能株式会社 基于颜色直方图来描述图像区域的方法和系统
US8934726B2 (en) 2011-12-19 2015-01-13 Dolby Laboratories Licensing Corporation Video codecs with integrated gamut management
CN102542528B (zh) * 2011-12-26 2013-10-09 Tcl集团股份有限公司 一种图像转换处理方法及系统
TWI556629B (zh) 2012-01-03 2016-11-01 杜比實驗室特許公司 規定視覺動態範圍編碼操作及參數
US9756353B2 (en) 2012-01-09 2017-09-05 Dolby Laboratories Licensing Corporation Hybrid reference picture reconstruction method for single and multiple layered video coding systems
WO2014034463A1 (ja) * 2012-08-27 2014-03-06 ソニー株式会社 送信装置、送信方法、受信装置および受信方法
TWI545964B (zh) * 2012-09-14 2016-08-11 鴻海精密工業股份有限公司 影像白平衡方法及攝像裝置
KR101901184B1 (ko) 2012-09-20 2018-09-21 삼성전자주식회사 깊이 영상을 사용한 컬러 영상 처리 장치 및 방법
EP2898694B1 (en) * 2012-09-24 2019-06-19 Huawei Technologies Co., Ltd. Video compression with color space scalability
US9532057B2 (en) * 2012-12-28 2016-12-27 Qualcomm Incorporated Inter-layer prediction using sample-adaptive adjustments for bit depth scalable video coding
US10469866B2 (en) * 2013-04-05 2019-11-05 Samsung Electronics Co., Ltd. Method and apparatus for encoding and decoding video with respect to position of integer pixel
US9445713B2 (en) 2013-09-05 2016-09-20 Cellscope, Inc. Apparatuses and methods for mobile imaging and analysis
US9948916B2 (en) 2013-10-14 2018-04-17 Qualcomm Incorporated Three-dimensional lookup table based color gamut scalability in multi-layer video coding
US10531105B2 (en) 2013-12-17 2020-01-07 Qualcomm Incorporated Signaling partition information for 3D lookup table for color gamut scalability in multi-layer video coding
US9756337B2 (en) 2013-12-17 2017-09-05 Qualcomm Incorporated Signaling color values for 3D lookup table for color gamut scalability in multi-layer video coding
US9445111B2 (en) * 2014-01-08 2016-09-13 Sony Corporation Image processing apparatus and image processing method
CN106031174B (zh) * 2014-02-21 2019-10-29 索尼公司 传输装置、传输方法、接收装置以及接收方法
US10531109B2 (en) 2015-01-27 2020-01-07 Dolby Laboratories Licensing Corporation Predictive image encoding and decoding with pixel group based quantization
KR102337438B1 (ko) * 2016-03-18 2021-12-09 코닌클리케 필립스 엔.브이. Hdr 비디오의 인코딩 및 디코딩
US11178204B1 (en) * 2017-02-23 2021-11-16 Cox Communications, Inc. Video processor to enhance color space and/or bit-depth
CN111145100B (zh) * 2018-11-02 2023-01-20 深圳富泰宏精密工业有限公司 动态影像生成方法及系统、计算机装置、及可读存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4857993A (en) * 1988-04-27 1989-08-15 Universal Video Communications Corp. Method and system for decompressing digital color video statistically encoded data
EP1591963A1 (en) * 2004-04-29 2005-11-02 Mitsubishi Electric Information Technology Centre Europe B.V. Adaptive quantisation of a depth map
CN1694486A (zh) * 2004-04-30 2005-11-09 微软公司 多级图像的适应性压缩

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6185327B1 (en) * 1998-05-04 2001-02-06 Eastman Kodak Company Method and system for the reduction of memory capacity required for a digital representation of an image
US6882685B2 (en) 2001-09-18 2005-04-19 Microsoft Corporation Block transform and quantization for image and video coding
US7006699B2 (en) 2002-03-27 2006-02-28 Microsoft Corporation System and method for progressively transforming and coding digital data
JP2005027168A (ja) * 2003-07-04 2005-01-27 Canon Inc 画像処理装置及び方法
US7991238B2 (en) * 2004-04-30 2011-08-02 Neiversan Networks Co. Llc Adaptive compression of multi-level images
US20050259729A1 (en) 2004-05-21 2005-11-24 Shijun Sun Video coding with quality scalability
EP2290983B1 (en) 2006-01-23 2015-09-02 Max-Planck-Gesellschaft zur Förderung der Wissenschaften e.V. High dynamic range codecs

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4857993A (en) * 1988-04-27 1989-08-15 Universal Video Communications Corp. Method and system for decompressing digital color video statistically encoded data
EP1591963A1 (en) * 2004-04-29 2005-11-02 Mitsubishi Electric Information Technology Centre Europe B.V. Adaptive quantisation of a depth map
CN1694486A (zh) * 2004-04-30 2005-11-09 微软公司 多级图像的适应性压缩

Also Published As

Publication number Publication date
EP2041983B1 (en) 2010-12-15
US20090285283A1 (en) 2009-11-19
CN101507284A (zh) 2009-08-12
WO2008019524A1 (en) 2008-02-21
KR101196975B1 (ko) 2012-11-02
JP2009544198A (ja) 2009-12-10
US8761249B2 (en) 2014-06-24
KR20090052849A (ko) 2009-05-26
EP2041983A4 (en) 2010-04-07
DE602006019006D1 (de) 2011-01-27
JP4991851B2 (ja) 2012-08-01
EP2041983A1 (en) 2009-04-01

Similar Documents

Publication Publication Date Title
CN101507284B (zh) 用于对视频颜色增强数据进行编码的方法和设备,以及用于对视频颜色增强数据进行解码的方法和设备
CN106488246B (zh) 用于增强动态范围信号的分层编码的自适应整形的方法
CN108900823B (zh) 一种视频信号处理的方法及装置
US10158835B2 (en) Extending image dynamic range
CN101371583B (zh) 编码/解码高动态范围图像的方法和设备
US6697521B2 (en) Method and system for achieving coding gains in wavelet-based image codecs
JP6141295B2 (ja) 知覚的に無損失のおよび知覚的に強調された画像圧縮システムならびに方法
KR20210050186A (ko) 영상의 ai 부호화 및 ai 복호화 방법, 및 장치
US11200639B1 (en) Apparatus and method for performing artificial intelligence encoding and decoding on image by using low-complexity neural network
CN101622878A (zh) 用于实现位深度可分级性的视频编码方法和视频解码方法
CN106464887A (zh) 图像解码方法及其装置以及图像编码方法及其装置
CN102281446B (zh) 一种分布式视频编码中基于视觉感知特性的量化方法
Richter Backwards compatible coding of high dynamic range images with JPEG
US20130235231A1 (en) Vector embedded graphics coding
Mantiuk et al. High dynamic range image and video compression-fidelity matching human visual performance
WO2022266955A1 (zh) 图像解码及处理方法、装置及设备
CN1418014A (zh) 编码方法和编码装置
KR102166337B1 (ko) 영상의 ai 부호화 방법 및 장치, 영상의 ai 복호화 방법 및 장치
CN116416216A (zh) 基于自监督特征提取的质量评价方法、存储介质及终端
WO2017129147A1 (zh) 图像的编码、解码方法及装置、以及图像的编解码系统
WO2021168624A1 (zh) 视频图像编码方法、设备及可移动平台
KR102421719B1 (ko) 저복잡도 신경망을 이용한 영상의 ai 부호화 장치 및 방법, ai 복호화 장치 및 방법
Hsiao et al. Dual-Layer Lossless Coding for Infrared Video
CN106961601A (zh) 视频数据的压缩和解压缩
CN116584093A (zh) Ai编码装置及其操作方法和ai解码装置及其操作方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CP02 Change in the address of a patent holder

Address after: I Si Eli Murli Nor, France

Patentee after: THOMSON LICENSING

Address before: French Boulogne - Bilang Kurt

Patentee before: THOMSON LICENSING

CP02 Change in the address of a patent holder
TR01 Transfer of patent right

Effective date of registration: 20190529

Address after: American Delaware

Patentee after: Interactive Digital VC Holdings

Address before: I Si Eli Murli Nor, France

Patentee before: THOMSON LICENSING

TR01 Transfer of patent right