CN101507284B - 用于对视频颜色增强数据进行编码的方法和设备,以及用于对视频颜色增强数据进行解码的方法和设备 - Google Patents
用于对视频颜色增强数据进行编码的方法和设备,以及用于对视频颜色增强数据进行解码的方法和设备 Download PDFInfo
- Publication number
- CN101507284B CN101507284B CN2006800553696A CN200680055369A CN101507284B CN 101507284 B CN101507284 B CN 101507284B CN 2006800553696 A CN2006800553696 A CN 2006800553696A CN 200680055369 A CN200680055369 A CN 200680055369A CN 101507284 B CN101507284 B CN 101507284B
- Authority
- CN
- China
- Prior art keywords
- transfer function
- video image
- value
- lut
- bit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 29
- 238000012546 transfer Methods 0.000 claims abstract description 47
- 238000013507 mapping Methods 0.000 claims description 19
- 238000006243 chemical reaction Methods 0.000 claims description 18
- 230000008569 process Effects 0.000 claims description 8
- 230000009466 transformation Effects 0.000 claims description 3
- 238000011161 development Methods 0.000 abstract description 3
- 230000000007 visual effect Effects 0.000 abstract 1
- 239000010410 layer Substances 0.000 description 40
- 239000004744 fabric Substances 0.000 description 8
- 230000014509 gene expression Effects 0.000 description 7
- 238000012545 processing Methods 0.000 description 7
- 239000003086 colorant Substances 0.000 description 5
- 238000009499 grossing Methods 0.000 description 4
- 239000011229 interlayer Substances 0.000 description 3
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000006073 displacement reaction Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 241001270131 Agaricus moelleri Species 0.000 description 1
- 244000188472 Ilex paraguariensis Species 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000002059 diagnostic imaging Methods 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000012958 reprocessing Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N11/00—Colour television systems
- H04N11/04—Colour television systems using pulse code modulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/90—Dynamic range modification of images or parts thereof
- G06T5/92—Dynamic range modification of images or parts thereof based on global image properties
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/40—Image enhancement or restoration using histogram techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/50—Image enhancement or restoration using two or more images, e.g. averaging or subtraction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/46—Colour picture communication systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/105—Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/14—Coding unit complexity, e.g. amount of activity or edge presence estimation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/186—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/30—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
- H04N19/36—Scalability techniques involving formatting the layers as a function of picture distortion after decoding, e.g. signal-to-noise [SNR] scalability
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10016—Video; Image sequence
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10024—Color image
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Image Processing (AREA)
Abstract
越来越多地使用优于传统的8比特颜色深度的可见亮度和对比度的高精度重现,促进了被称作高比特深度的增强动态范围的发展。本发明提供了一种编码方法,用于对M比特RGB像素的第一低比特深度视频图像(IMBL)和N比特RGB像素的第二高比特深度视频图像(IMEL)进行编码,M<N,其中,第一和第二视频图像具有相同的空间分辨率,所述编码方法包括:基于第一和第二视频图像的颜色直方图(HistBL,HistEL)产生第一转换函数(LUTinter);基于第一转换函数(LUTinter)产生第二转换函数(LUTfinal);将第二转换函数(LUTfinal)应用(TR)到第一视频图像,其中,产生变换的第一视频图像(IMTR,BL);对残差(IMres)f进行计算并编码;对第一视频图像(IMBL)进行编码;以及发送编码的第一视频图像(IMBL)、第二转换函数(LUTfinal)和编码的差值。
Description
技术领域
本发明涉及一种用于对视频颜色增强数据进行编码的方法和设备,本发明还涉及一种用于对视频颜色增强数据进行解码的方法和设备。
背景技术
近年来,优于传统的8比特颜色深度的可见亮度和对比度的高精度重现逐渐使用在诸如医学成像、高质量支持视频的计算机游戏和专业摄影室等许多领域以及家庭影院相关应用中。该处理促进了增强动态范围(为了便于与传统8比特颜色深度相比较,这里被称作高比特深度)的发展。与为捕获和显示设备产生极高像素分辨率的电子传感器、处理器和存储器件的发展对比,数字成像系统的颜色功能进展缓慢。自第一代数字化可视内容的出现起,8比特颜色深度成为捕获和显示设备的主要技术。
考虑到未来相当长时间内标准8比特和更高比特数字成像系统将同时存在于消费者市场的事实,颜色比特深度可扩展性是有益的。不同的颜色比特深度对于例如多媒体内容传送期间的终端显示设备尤为重要。
发明内容
本发明提供了一种用于实现视频颜色空间可扩展性的方法和设备。根据本发明的一个方面,提供了一种用于对颜色增强层进行编码的方法和设备,该方法和设备有差别地对该颜色增强层进行编码。本发明的另一方面是一种用于对视频信号进行解码来获得传统颜色比特深度图像或增强颜色比特深度图像的方法和设备。
原则上,本发明的编码方面包括以下步骤:产生转换函数,例如以适于建立输入颜色值到输出颜色值的映射的查找表(LUT)的形式,该输入颜色值和输出颜色值均包括2M种不同颜色;向具有较低或传统颜色比特深度的第一视频图像应用转换函数;在转换后的视频图像和具有较高颜色比特深度(N比特,N>M;但与第一视频图像的空间分辨率相同)的第二视频图像之间产生差值图像或残差;并且对残差进行编码。然后,将编码后的第一视频图像、转换函数的参数(例如,LUT本身)和编码后的残差发送到接收机。也可以对转换函数的参数进行编码。另外,也如此表示转换函数的参数。
第一和第二图像可以分别视作颜色基本层和颜色增强层。
特别地,可以通过将第一和第二视频图像的颜色直方图进行比较来获得转换函数,为此,将具有2M个bin的第一图像的颜色直方图变换成具有2N个bin(N>M)的“平滑”颜色直方图,并且从平滑的直方图和定义了平滑的颜色直方图的值和颜色增强层直方图的值之间的变换的颜色增强层直方图来确定转换函数。针对红、绿和蓝基本显示颜色来分别进行所述过程。
根据本发明的解码方面,一种用于解码的方法包括:从比特流中提取第一和第二视频图像的视频数据,提取颜色增强控制数据,还对第一视频图像进行解码和重建,其中,获得具有各为M比特的颜色像素值的重建的第一视频图像,并且从颜色增强控制数据中重建实现转换函数的映射表。然后,将该映射表应用到重建的第一视频图像的每一个像素,产生的变换视频图像作为预测图像,随后利用解码的第二视频图像对该预测图像进行更新。解码的第二视频图像是残差图像,并且更新产生了具有各为N比特(N>M)的像素的增强视频图像,并因此产生比重建的第一视频图像更高的颜色空间。
针对红、绿和蓝基本视频颜色分别执行上述步骤。因此,完整的视频信号可以包括:针对每一幅图像的编码的低颜色分辨率图像,以及针对这些颜色中每一项的残差图像和转换函数的参数,上述均用于产生更高颜色分辨率图像。有利地,基于原始视频图像的R-G-B值来执行产生转换函数和残差图像,因此产生转换函数和残差图像独立于进一步的视频编码。因此,然后可以使用任何传统编码对低颜色分辨率图像进行编码,例如根据MPEG或JVT标准(AVC、SVC等)。同样,在解码端,基于传统解码来执行颜色增强,因此独立于编码格式进行解码。
因此,具有比特深度显示功能的设备(例如,8比特显示器)仅需要对具有较低颜色比特深度的颜色基本层进行解码,而具有增强颜色比特深度显示功能的高级设备(例如,12比特显示器)还可以对颜色增强层和红、绿和蓝的变换表进行解码,并产生具有完全颜色空间应用的图像。
本发明涉及一种新型的视频可扩展性(即,颜色比特深度可扩展性),并且提供了一种颜色比特深度预测解决方案,可以应用在颜色比特深度可缩放的编解码器的中间层预测以提高编码效率。使用转换函数来在产生残差图像之前产生预测图像的优点在于,由于预测图像更加匹配相应的颜色增强层图像,因此编码更加有效。例如,由颜色基本层中8比特值9Ahex描述的特定绿色值可以映射到颜色增强层中16种不同的12比特颜色值(从9A0hex到9AFhex)。尽管在一个图像中这16个值中的一个可以在颜色增强层中起主导作用,其可以是其他图像的其他值。因此,本发明实现了颜色增强层的优化编码。
在从属权利要求、以下说明书和附图中公开了本发明的有利实施例。
附图说明
参照附图对本发明的示例性实施例进行描述,附图中
图1是颜色比特深度可伸缩视频编码和解码的结构;
图2是编码处理的流程图;
图3是平滑直方图规范的流程图;
图4是直方图平滑的示例;
图5是解码处理的流程图;以及
图6是完整增强层解码器的概要。
具体实施方式
图1示出了颜色比特深度可伸缩视频编码和解码的总体结构。编码器ENC以M比特的传统颜色分辨率和N比特(N>M)的增强颜色分辨率对每一幅视频图像接收两次。不同于产生两个独立分离的视频流,而是产生颜色基本层和颜色增强层,其中颜色增强层依赖于颜色基本层。如图1所示,在编码器和解码器中执行中间层预测,用于预测更高比特深度的颜色。
图1中的基本层编码器方框包含所有传统编码步骤,例如任意空间和/或时间冗余度缩减技术,例如产生分离的亮度和色度值、DCT变换等。在解码器端,基本层解码器执行相应的解码。“基本层”和“增强层”仅指颜色比特深度。有利地,任何视频编码和解码方法可以独立于本发明所实现的颜色增强处理而用于基本层。基本层解码器的输出适于传统显示设备,而增强层解码器的输出适于能够针对红、绿和蓝部分图像中的每一项显示2N(N>M)个不同的颜色值的高质量显示器。如果M例如为8,则N的示例为10、12或16比特,而原则上可以实现M和N(N>M)的所有组合。诸如质量可扩展性、空间可扩展性和时域可扩展性、中间层预测等类似的其他类型的可扩展性显著影响编码效率。
本发明提出了一种基于平滑直方图规范的颜色比特深度预测的空间均匀方法。考虑描述相同场景的两幅图像。对于这两幅图像,相应的像素(这里“相应的像素”表示分别属于两幅图像但在图像坐标系统中具有相同坐标的两个像素)指出相同的场景位置。相应的像素之间的唯一不同是颜色比特深度。假设利用M比特长度的码字对一副图像的每一种颜色进行编码,而利用N比特长度的码字对其他图像进行编码,其中M<N。遵照使预测N比特图像和原始N比特图像之间的差值最小化的准则,逆颜色映射的任务是从M比特图像中产生N比特图像的预测版本。可以通过例如被广泛接受并使用在视频压缩领域的PSNR的任意方法来测量预测的N比特图像和原始N比特图像之间的差值。另外,在这种情况下,最重要的方面是预测图像如何有效地用于随后的残差数据压缩,而不是预测图像看起来是什么样子的。
图2示出了本发明一个实施例的总体编码过程。使用实现映射函数的查找表LUTfinal对基本层图像IMBL进行变换TR。变换TR的结果是变换的基本层图像IMTR,BL。查找表LUTfinal从另一中间查找表LUTinter产生,该中间查找表LUTinter从基本层图像(优选地,重建的基本层图像)的颜色直方图、和增强层图像的颜色直方图产生。由于这些图像的不同颜色分辨率,这些图像的颜色直方图不仅具有不同数量的bin(一个bin用于每一个可能的颜色),而且针对每一种基本层颜色、和序列的每一幅图像,分布在增强层图像的bin之间的值也可以不同。例如,如果基本层具有M比特并且增强层具有N比特,基本层直方图的每一个bin与增强层直方图的2N-M个bin相对应,即每一个基本层像素值将按照惯例用来预测2N-M个像素值中的一个。通过考虑两幅图像的颜色直方图可以优化这种预测。如下所述,中间查找表LUTinter实现了描述增强层图像的颜色直方图HistEL和从基本层图像IMBL产生的颜色直方图SmHistBL之间的变换的直方图转换函数。
变换的基本层图像IMTR,BL用于预测增强层图像IMEL,计算差值或残差Δ,编码的IMres并发送,所有这些处理分别用于R、G和B。
图3示出了提出的空间均匀逆颜色映射的细节。为了更好的理解,将基本层(M比特)图像命名为“输入图像”NI,而增强层(N比特)图像被重新命名为“期望图像”DI。一个基本思想是将直方图规范1(1R.C.Gonzalez and R.E.Woods,“Digital image processing”,2ndedition,pp.94-102,Prentice Hall,2002)的算法应用到NI和DI。产生查找表来转换NI,从而使其具有如DI的直方图规定的特定直方图。
然而,当对颜色比特深度预测采用经典直方图规范时,存在两个主要缺陷。首先,由于直方图具有离散值,因此转换的NI不能具有与DI完全相同的直方图。相反,转换的NI的直方图近似于DI的直方图。其次,两个直方图的不同bin大小(由不同比特深度所引起)破坏了它们之间的匹配(bin大小表示每一个颜色分量的级的数目,例如,8比特图像的bin大小为256)。这是经考虑的颜色比特深度预测中的特定缺陷。例如,在NI是DI简单比特移位的情况下,通过直方图规范获得的转换NI的PSNR通常低于通过简单逆比特移位获得的转换NI的PSNR。
为了克服这些缺陷,提出在规范NI的直方图之前将其“平滑”。平滑的直方图SmHistBL具有与DI的直方图HistEL相同的bin大小,DI的直方图HistEL充当直方图规范处理的期望直方图。将经典直方图规范算法应用到平滑直方图和期望直方图上。最后,执行被称作“概率映射”的后处理来获得LUT。图3示出了平滑的直方图规范的流程图。px(xk),k=0,1,…,2M-1表示NI的直方图HistBL,通过pz(zk),k=0,1,…2N-1描述DI的直方图HistEL。
在图3中,对于低比特(M比特)图像NI,一个颜色通道的直方图是px=(x)。通过使用方程(5)来平滑该直方图,并且产生具有与高比特(N比特)图像DI的直方图相同的bin大小的平滑直方图px′(x)。累加该值,从而产生sk(对于图3的示例,k=1,...,16)。可以将sk表示为函数F(xk′)。高比特(N比特)图像DI具有相同颜色通道的直方图Pz(z),累积该直方图pz(z)来产生vk(k与如上所述的k相同)。可以将vk表示为函数G(zk)。然后,确定分布vj,针对sk的每一值(从高比特图像DI的vk值)给出最佳匹配值vl。该分布vj建立从值sk(因此xk′)到值vk的变换,并且是变换G的逆。
以下,对直方图平滑的处理进行描述。直方图平滑的目的是“拉伸(stretch)”输入直方图,从而使其具有与期望直方图相同的bin大小。这是直方图规范处理的必备条件。以下为图3中的表示,px(xk)的值均匀分布到相应的范围[xk′,xk′+1,…xk′+2(N-M)-1]中,如方程(5)所示:
为了确保“均匀分布”,使用非归一化的直方图。图4中示出了平滑直方图的简单示例。图4a)示出了具有2比特的颜色比特深度的基本层输入图像的颜色直方图,即,特定颜色(例如,红色)的22=4个可能颜色值。直方图平滑处理将直方图“拉伸”到4比特颜色比特深度,即24=16个可能的颜色值。输入图像的单个bin中的值的数目是具有该特定颜色值的输入图像之内的像素数目,例如,与值0相对应的最左边的值40表示具有值为0的“红色”(在该直方图中指“红”色)的输入图像的40个像素。平滑处理将这些值分布到平滑直方图的2N-M个相应的bin。在该示例中,根据2N-M=4,平滑直方图的前4个bin与原始直方图的第一个bin相对应。如图4b)所示,根据方程(5),原始直方图的值40被平均地分布到平滑直方图的4个相应的bin。
平滑的思想在于,提高了输入直方图的连续性,从而直方图规范将更加有效。详细地,将图3中所示的方程(1)、(2)和(4)的可选描述成连续的灰度图像:
y=G-1(s)=G-1[F(x)](4′)
在连续灰度级的情况下,可以将输入直方图规范为与期望的直方图完全相同。然而,如上所述,对于离散灰度级,仅可以实现近似期望的直方图。此外,由于灰度级的数目接近无穷,因此近似接近精确匹配。因此,理论上,平滑过程等同于在输入直方图的离散化期间增加采样率,平滑过程优于具有不同bin大小的两个直方图之间的直接直方图规范。
平滑直方图仅是该算法中的中间步骤。不存在与其相对应的图像。
以下对概率映射处理进行描述。一旦已经将经典直方图规范算法应用到平滑直方图px′(x)和期望直方图pz(z),就产生中间LUTyk′=LUTinter(xk′)。下个问题是从其相应范围xk′,xk′+1,…,xk′+2(N-M)-1]的多个映射值中选择唯一映射值xk。示例地,提出了两种不同准则作为概率映射的准则,如等式(6)和(7)所示:
其中,yk是映射值xk。产生最终LUTyk=LUTfinal(xk)来将原始直方图映射到期望直方图,其中,k=0,1,…,2M-1,yk∈{zl,l=0,1,…,2N-1}。
方程(6)表示,在与xk相对应的2N-M个值之间,选择在期望直方图Pz(y1′)中具有最大值的一个值。
方程(7)表示,在与xk相对应的2N-M个值之间,使用小于或等于其平均值的最接近的整数作为最终的映射值。
由于LUTinter将输入图像的平滑直方图映射到期望图像的直方图,因此LUTinter是“一对一”映射。然而,如果考虑输入图像的直接直方图,可以看到每一个xk与2N-M个值相对应。“概率映射”的任务是仅从2N-M个值中选择一个值作为最终映射值xk。因此,LUTfinal仍旧是“一对一”映射:将每一个值xk映射到一个值yk。LUT的映射是可逆的,这是因为期望图像的全部值(2N)中仅2M个值具有相应的xk。
当将上述算法应用到输入图像和期望图像时,计算两幅图像的直方图。然后,平滑输入直方图,产生“平滑直方图”。在保留步骤(经典直方图规范和概率映射)完成之后,产生最终LUT来将输入直方图的级映射到期望直方图的级。然后,通过将LUT应用到输入图像的每一个像素来产生预测图像。
图6示出了具有针对R、G和B图像的分离分支的完整增强层编码器的概述。对基本层进行传统编码。
本发明可用于视频编码器和视频解码器,并且特别可用于对颜色基本层和具有最优效率的相同空间分辨率的颜色增强层进行编码/解码。
Claims (6)
1.一种用于对第一视频图像(IMBL)和第二视频图像(IMEL)进行编码的方法,第一视频图像(IMBL)包括各具有M比特的RGB像素值,第二视频图像(IMEL)包括各具有N比特的RGB像素值,M<N,其中,第一和第二视频图像的相应的像素之间的唯一不同是颜色比特深度,所述方法包括以下步骤:
-产生第一转换函数(LUTinter),所述第一转换函数(LUTinter)具有2N个可能的输入值并基于第一和第二视频图像的颜色直方图(HistBL,HistEL);
-基于第一转换函数(LUTinter)产生第二转换函数(LUTfinal),其中,第二转换函数具有2M个可能的输入值并包括将其每一个输入值映射到第一转换函数的2(N-M)个相应值之一的函数;
-将第二转换函数(LUTfinal)应用(TR)到第一视频图像,其中,第二转换函数用于映射像素,并且产生变换的第一视频图像(IMTR,BL);
-计算变换的第一视频图像(IMTR,BL)和第二视频图像(IMEL)之间的差值(IMres);
-对差值(IMres)进行编码;
-对第一视频图像(IMBL)进行编码;以及
-发送编码的第一视频图像(IMBL)、第二转换函数(LUTfinal)和编码的差值(IMres);
其中,产生第一转换函数(LUTinter)的步骤包括以下步骤:
-产生第一视频图像的第一颜色直方图(HistBL),所述第一颜色直方图具有2M个bin;
-产生第二视频图像的第二颜色直方图(HistEL),所述第二颜色直方图具有2N个bin;以及
-从第一颜色直方图(HistBL)产生(sm)具有2N个bin的平滑颜色直方图(SmHistBL),其中,将第一直方图的每一个bin的值分布到2N-M个bin中,并且第一转换函数(LUTinter)定义了平滑颜色直方图(SmHistBL)和第二颜色直方图(HistEL)之间的转换。
2.根据权利要求1的方法,其中,在应用(TR)第二转换函数的步骤中所述第一视频图像是重建的第一视频图像,以及/或者在产生第一转换函数(LUTinter)的步骤中所述第一视频图像是重建的第一视频图像。
3.根据权利要求1或2的方法,其中,用于将第二转换函数(LUTfinal)的每一个输入值映射到第一转换函数的2(N-M)个相应值之一的函数是概率映射(pm)函数。
4.根据权利要求3的方法,其中,概率映射函数针对第二转换函数的2M个值中的每一个从第一转换函数的2N-M个相应值中选择一个值,所选值是第二直方图(HistEL)中的最大值。
5.根据权利要求3的方法,其中,概率映射函数针对第二转换函数的2M个值中的每一个从第一转换函数的2N-M个相应值中选择一个值,所选值是小于或等于所述2N-M个相应值的平均值的最接近的整数。
6.一种对第一视频图像(IMBL)和第二视频图像(IMEL)进行编码的设备,第一视频图像(IMBL)包括各具有M比特的RGB像素值,第二视频图像(IMEL)包括各自具有N比特的RGB像素值,M<N,其中,第一和第二视频图像的相应的像素之间的唯一不同是颜色比特深度,所述设备包括:
-用于产生第一转换函数(LUTinter)的装置,所述第一转换函数(LUTinter)具有2N个可能的输入值并基于第一和第二视频图像的颜色直方图(HistBL,HistEL);
-用于基于第一转换函数(LUTinter)产生第二转换函数(LUTfinal)的装置,其中,第二转换函数具有2M个可能的输入值,并包括将其每一个输入值映射到第一转换函数的2(N-M)个相应值之一的函数;
-用于将第二转换函数(LUTfinal)应用(TR)到第一视频图像的装置,其中,第二转换函数用于映射像素,并且产生变换的第一视频图像(IMTR,BL);
-用于计算变换的第一视频图像(IMTR,BL)和第二视频图像(IMEL)之间的差值(IMres)的装置;
-用于对差值(IMres)进行编码的装置;
-用于对第一视频图像(IMBL)进行编码的装置;以及
-用于发送编码的第一视频图像(IMBL)、第二转换函数(LUTfinal)和编码的差值(IMres)的装置;
其中,用于产生第一转换函数(LUTinter)的装置包括:
-用于产生第一视频图像的第一颜色直方图(HistBL)的装置,所述第一颜色直方图具有2M个bin;
-用于产生第二视频图像的第二颜色直方图(HistEL)的装置,所述第二颜色直方图具有2N个bin;以及
-用于从第一颜色直方图(HistBL)产生(sm)具有2N个bin的平滑颜色直方图(SmHistBL)的装置,其中,将第一直方图的每一个bin的值分布到2N-M个bin中,并且第一转换函数(LUTinter)定义了平滑颜色直方图(SmHistBL)和第二颜色直方图(HistEL)之间的转换。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/CN2006/001699 WO2008019524A1 (en) | 2006-07-17 | 2006-07-17 | Method and apparatus for encoding video color enhancement data, and method and apparatus for decoding video color enhancement data |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101507284A CN101507284A (zh) | 2009-08-12 |
CN101507284B true CN101507284B (zh) | 2012-06-27 |
Family
ID=39081897
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2006800553696A Active CN101507284B (zh) | 2006-07-17 | 2006-07-17 | 用于对视频颜色增强数据进行编码的方法和设备,以及用于对视频颜色增强数据进行解码的方法和设备 |
Country Status (7)
Country | Link |
---|---|
US (1) | US8761249B2 (zh) |
EP (1) | EP2041983B1 (zh) |
JP (1) | JP4991851B2 (zh) |
KR (1) | KR101196975B1 (zh) |
CN (1) | CN101507284B (zh) |
DE (1) | DE602006019006D1 (zh) |
WO (1) | WO2008019524A1 (zh) |
Families Citing this family (45)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100531291C (zh) | 2004-11-01 | 2009-08-19 | 彩色印片公司 | 对增强的色彩空间内容进行母版制作和分发的方法和系统 |
US8773494B2 (en) * | 2006-08-29 | 2014-07-08 | Microsoft Corporation | Techniques for managing visual compositions for a multimedia conference call |
WO2008083521A1 (en) | 2007-01-10 | 2008-07-17 | Thomson Licensing | Video encoding method and video decoding method for enabling bit depth scalability |
US8085852B2 (en) * | 2007-06-26 | 2011-12-27 | Mitsubishi Electric Research Laboratories, Inc. | Inverse tone mapping for bit-depth scalable image coding |
KR101509070B1 (ko) * | 2007-10-16 | 2015-04-06 | 톰슨 라이센싱 | 비트 깊이 크기 조정 능력에 관한 아티팩트 제거 방법 및 장치 |
US9338475B2 (en) | 2008-04-16 | 2016-05-10 | Intel Corporation | Tone mapping for bit-depth scalable video codec |
US9538176B2 (en) | 2008-08-08 | 2017-01-03 | Dolby Laboratories Licensing Corporation | Pre-processing for bitdepth and color format scalable video coding |
CN104333766B (zh) * | 2008-08-22 | 2018-08-07 | 汤姆逊许可证公司 | 用于内容传送的方法和系统 |
US8432413B2 (en) * | 2008-11-17 | 2013-04-30 | Xrfiles, Inc. | System and method for the display of extended bit depth high resolution images |
KR101740741B1 (ko) | 2009-02-11 | 2017-06-08 | 톰슨 라이센싱 | 톤 매핑 및 톤 역매핑을 이용하는 비트 심도 스케일링 가능 비디오 인코딩 및 디코딩을 위한 방법 및 장치 |
JP5027171B2 (ja) * | 2009-02-25 | 2012-09-19 | 日本電信電話株式会社 | 画像符号化方法,画像符号化装置および画像符号化プログラム |
BRPI1009443B1 (pt) | 2009-03-13 | 2021-08-24 | Dolby Laboratories Licensing Corporation | Método de geração de parâmetros de mapeamento de tons inverso, método de compactação de dados de vídeo e método para geração de um fluxo de bits de saída a partir de um fluxo de bits de entrada |
JP2010278724A (ja) * | 2009-05-28 | 2010-12-09 | Olympus Corp | 画像処理装置、画像処理方法及び画像処理プログラム |
TWI407426B (zh) * | 2010-04-15 | 2013-09-01 | Nuvoton Technology Corp | 顯示裝置及其控制電路以及顯示影像資料之方法 |
TWI431512B (zh) * | 2010-06-23 | 2014-03-21 | Ind Tech Res Inst | 三維控制端點之辨識方法及應用其之電腦可讀取媒體 |
CN102331883B (zh) * | 2010-07-14 | 2013-11-06 | 财团法人工业技术研究院 | 三维控制端点的辨识方法及应用其的计算机可读介质 |
CN101923708B (zh) * | 2010-08-09 | 2012-07-25 | 福建华映显示科技有限公司 | 深度图强化方法 |
JP2012060261A (ja) | 2010-09-06 | 2012-03-22 | Sony Corp | 画像処理装置および方法 |
KR20120087233A (ko) | 2010-12-03 | 2012-08-07 | 한국전자통신연구원 | 영상 융합을 이용한 타일 맵 서비스 방법 및 이를 위한 시스템 |
WO2012122425A1 (en) * | 2011-03-10 | 2012-09-13 | Dolby Laboratories Licensing Corporation | Bitdepth and color scalable video coding |
EP2686825B1 (en) | 2011-03-17 | 2015-01-07 | Dolby Laboratories Licensing Corporation | Generating alternative versions of image content using histograms |
US8334911B2 (en) | 2011-04-15 | 2012-12-18 | Dolby Laboratories Licensing Corporation | Encoding, decoding, and representing high dynamic range images |
TWI513327B (zh) | 2011-04-15 | 2015-12-11 | Dolby Lab Licensing Corp | 高動態範圍影像的編碼、解碼及表示 |
US9036042B2 (en) | 2011-04-15 | 2015-05-19 | Dolby Laboratories Licensing Corporation | Encoding, decoding, and representing high dynamic range images |
CN103106668B (zh) * | 2011-11-09 | 2016-08-03 | 佳能株式会社 | 基于颜色直方图来描述图像区域的方法和系统 |
US8934726B2 (en) | 2011-12-19 | 2015-01-13 | Dolby Laboratories Licensing Corporation | Video codecs with integrated gamut management |
CN102542528B (zh) * | 2011-12-26 | 2013-10-09 | Tcl集团股份有限公司 | 一种图像转换处理方法及系统 |
TWI556629B (zh) | 2012-01-03 | 2016-11-01 | 杜比實驗室特許公司 | 規定視覺動態範圍編碼操作及參數 |
US9756353B2 (en) | 2012-01-09 | 2017-09-05 | Dolby Laboratories Licensing Corporation | Hybrid reference picture reconstruction method for single and multiple layered video coding systems |
WO2014034463A1 (ja) * | 2012-08-27 | 2014-03-06 | ソニー株式会社 | 送信装置、送信方法、受信装置および受信方法 |
TWI545964B (zh) * | 2012-09-14 | 2016-08-11 | 鴻海精密工業股份有限公司 | 影像白平衡方法及攝像裝置 |
KR101901184B1 (ko) | 2012-09-20 | 2018-09-21 | 삼성전자주식회사 | 깊이 영상을 사용한 컬러 영상 처리 장치 및 방법 |
EP2898694B1 (en) * | 2012-09-24 | 2019-06-19 | Huawei Technologies Co., Ltd. | Video compression with color space scalability |
US9532057B2 (en) * | 2012-12-28 | 2016-12-27 | Qualcomm Incorporated | Inter-layer prediction using sample-adaptive adjustments for bit depth scalable video coding |
US10469866B2 (en) * | 2013-04-05 | 2019-11-05 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding and decoding video with respect to position of integer pixel |
US9445713B2 (en) | 2013-09-05 | 2016-09-20 | Cellscope, Inc. | Apparatuses and methods for mobile imaging and analysis |
US9948916B2 (en) | 2013-10-14 | 2018-04-17 | Qualcomm Incorporated | Three-dimensional lookup table based color gamut scalability in multi-layer video coding |
US10531105B2 (en) | 2013-12-17 | 2020-01-07 | Qualcomm Incorporated | Signaling partition information for 3D lookup table for color gamut scalability in multi-layer video coding |
US9756337B2 (en) | 2013-12-17 | 2017-09-05 | Qualcomm Incorporated | Signaling color values for 3D lookup table for color gamut scalability in multi-layer video coding |
US9445111B2 (en) * | 2014-01-08 | 2016-09-13 | Sony Corporation | Image processing apparatus and image processing method |
CN106031174B (zh) * | 2014-02-21 | 2019-10-29 | 索尼公司 | 传输装置、传输方法、接收装置以及接收方法 |
US10531109B2 (en) | 2015-01-27 | 2020-01-07 | Dolby Laboratories Licensing Corporation | Predictive image encoding and decoding with pixel group based quantization |
KR102337438B1 (ko) * | 2016-03-18 | 2021-12-09 | 코닌클리케 필립스 엔.브이. | Hdr 비디오의 인코딩 및 디코딩 |
US11178204B1 (en) * | 2017-02-23 | 2021-11-16 | Cox Communications, Inc. | Video processor to enhance color space and/or bit-depth |
CN111145100B (zh) * | 2018-11-02 | 2023-01-20 | 深圳富泰宏精密工业有限公司 | 动态影像生成方法及系统、计算机装置、及可读存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4857993A (en) * | 1988-04-27 | 1989-08-15 | Universal Video Communications Corp. | Method and system for decompressing digital color video statistically encoded data |
EP1591963A1 (en) * | 2004-04-29 | 2005-11-02 | Mitsubishi Electric Information Technology Centre Europe B.V. | Adaptive quantisation of a depth map |
CN1694486A (zh) * | 2004-04-30 | 2005-11-09 | 微软公司 | 多级图像的适应性压缩 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6185327B1 (en) * | 1998-05-04 | 2001-02-06 | Eastman Kodak Company | Method and system for the reduction of memory capacity required for a digital representation of an image |
US6882685B2 (en) | 2001-09-18 | 2005-04-19 | Microsoft Corporation | Block transform and quantization for image and video coding |
US7006699B2 (en) | 2002-03-27 | 2006-02-28 | Microsoft Corporation | System and method for progressively transforming and coding digital data |
JP2005027168A (ja) * | 2003-07-04 | 2005-01-27 | Canon Inc | 画像処理装置及び方法 |
US7991238B2 (en) * | 2004-04-30 | 2011-08-02 | Neiversan Networks Co. Llc | Adaptive compression of multi-level images |
US20050259729A1 (en) | 2004-05-21 | 2005-11-24 | Shijun Sun | Video coding with quality scalability |
EP2290983B1 (en) | 2006-01-23 | 2015-09-02 | Max-Planck-Gesellschaft zur Förderung der Wissenschaften e.V. | High dynamic range codecs |
-
2006
- 2006-07-17 EP EP20060761443 patent/EP2041983B1/en active Active
- 2006-07-17 JP JP2009519775A patent/JP4991851B2/ja active Active
- 2006-07-17 CN CN2006800553696A patent/CN101507284B/zh active Active
- 2006-07-17 KR KR20097001015A patent/KR101196975B1/ko active IP Right Grant
- 2006-07-17 WO PCT/CN2006/001699 patent/WO2008019524A1/en active Application Filing
- 2006-07-17 US US12/309,335 patent/US8761249B2/en active Active
- 2006-07-17 DE DE200660019006 patent/DE602006019006D1/de active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4857993A (en) * | 1988-04-27 | 1989-08-15 | Universal Video Communications Corp. | Method and system for decompressing digital color video statistically encoded data |
EP1591963A1 (en) * | 2004-04-29 | 2005-11-02 | Mitsubishi Electric Information Technology Centre Europe B.V. | Adaptive quantisation of a depth map |
CN1694486A (zh) * | 2004-04-30 | 2005-11-09 | 微软公司 | 多级图像的适应性压缩 |
Also Published As
Publication number | Publication date |
---|---|
EP2041983B1 (en) | 2010-12-15 |
US20090285283A1 (en) | 2009-11-19 |
CN101507284A (zh) | 2009-08-12 |
WO2008019524A1 (en) | 2008-02-21 |
KR101196975B1 (ko) | 2012-11-02 |
JP2009544198A (ja) | 2009-12-10 |
US8761249B2 (en) | 2014-06-24 |
KR20090052849A (ko) | 2009-05-26 |
EP2041983A4 (en) | 2010-04-07 |
DE602006019006D1 (de) | 2011-01-27 |
JP4991851B2 (ja) | 2012-08-01 |
EP2041983A1 (en) | 2009-04-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101507284B (zh) | 用于对视频颜色增强数据进行编码的方法和设备,以及用于对视频颜色增强数据进行解码的方法和设备 | |
CN106488246B (zh) | 用于增强动态范围信号的分层编码的自适应整形的方法 | |
CN108900823B (zh) | 一种视频信号处理的方法及装置 | |
US10158835B2 (en) | Extending image dynamic range | |
CN101371583B (zh) | 编码/解码高动态范围图像的方法和设备 | |
US6697521B2 (en) | Method and system for achieving coding gains in wavelet-based image codecs | |
JP6141295B2 (ja) | 知覚的に無損失のおよび知覚的に強調された画像圧縮システムならびに方法 | |
KR20210050186A (ko) | 영상의 ai 부호화 및 ai 복호화 방법, 및 장치 | |
US11200639B1 (en) | Apparatus and method for performing artificial intelligence encoding and decoding on image by using low-complexity neural network | |
CN101622878A (zh) | 用于实现位深度可分级性的视频编码方法和视频解码方法 | |
CN106464887A (zh) | 图像解码方法及其装置以及图像编码方法及其装置 | |
CN102281446B (zh) | 一种分布式视频编码中基于视觉感知特性的量化方法 | |
Richter | Backwards compatible coding of high dynamic range images with JPEG | |
US20130235231A1 (en) | Vector embedded graphics coding | |
Mantiuk et al. | High dynamic range image and video compression-fidelity matching human visual performance | |
WO2022266955A1 (zh) | 图像解码及处理方法、装置及设备 | |
CN1418014A (zh) | 编码方法和编码装置 | |
KR102166337B1 (ko) | 영상의 ai 부호화 방법 및 장치, 영상의 ai 복호화 방법 및 장치 | |
CN116416216A (zh) | 基于自监督特征提取的质量评价方法、存储介质及终端 | |
WO2017129147A1 (zh) | 图像的编码、解码方法及装置、以及图像的编解码系统 | |
WO2021168624A1 (zh) | 视频图像编码方法、设备及可移动平台 | |
KR102421719B1 (ko) | 저복잡도 신경망을 이용한 영상의 ai 부호화 장치 및 방법, ai 복호화 장치 및 방법 | |
Hsiao et al. | Dual-Layer Lossless Coding for Infrared Video | |
CN106961601A (zh) | 视频数据的压缩和解压缩 | |
CN116584093A (zh) | Ai编码装置及其操作方法和ai解码装置及其操作方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CP02 | Change in the address of a patent holder |
Address after: I Si Eli Murli Nor, France Patentee after: THOMSON LICENSING Address before: French Boulogne - Bilang Kurt Patentee before: THOMSON LICENSING |
|
CP02 | Change in the address of a patent holder | ||
TR01 | Transfer of patent right |
Effective date of registration: 20190529 Address after: American Delaware Patentee after: Interactive Digital VC Holdings Address before: I Si Eli Murli Nor, France Patentee before: THOMSON LICENSING |
|
TR01 | Transfer of patent right |