CN116391356A - 用于具有编码效率约束的hdr视频的颜色变换 - Google Patents

用于具有编码效率约束的hdr视频的颜色变换 Download PDF

Info

Publication number
CN116391356A
CN116391356A CN202180070803.2A CN202180070803A CN116391356A CN 116391356 A CN116391356 A CN 116391356A CN 202180070803 A CN202180070803 A CN 202180070803A CN 116391356 A CN116391356 A CN 116391356A
Authority
CN
China
Prior art keywords
image
color
offset vector
color space
transform matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180070803.2A
Other languages
English (en)
Inventor
苏冠铭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby Laboratories Licensing Corp
Original Assignee
Dolby Laboratories Licensing Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby Laboratories Licensing Corp filed Critical Dolby Laboratories Licensing Corp
Publication of CN116391356A publication Critical patent/CN116391356A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/90Dynamic range modification of images or parts thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/56Extraction of image or video features relating to colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/60Extraction of image or video features relating to illumination properties, e.g. using a reflectance or lighting model
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10024Color image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20172Image enhancement details
    • G06T2207/20208High dynamic range [HDR] image processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Color Image Communication Systems (AREA)
  • Image Processing (AREA)

Abstract

使用基于标准的RGB到YCbCr颜色变换,在一组编解码效率约束下得到新的RGB到YCC 3×3变换矩阵和3×1偏移向量。新的RGB到YCC 3×3变换包括光亮度缩放因子和2×2色度子矩阵,这保留了基于标准的RGB到YCbCr变换的能量,同时维持或提高了编解码效率。它还增加了对流式传输视频应用中的授权机制或水印机制的支持。还提供了使用利用图像整形的新的颜色变换的示例。

Description

用于具有编码效率约束的HDR视频的颜色变换
相关申请的交叉引用
本申请要求于2020年10月14日提交的美国临时专利申请号63/091,436以及于2020年10月14日提交的欧洲专利申请号20201683.8的优先权,该专利申请均通过援引以其全文并入本文。
技术领域
本公开总体上涉及图像。更具体地,本发明的实施例涉及用于具有编码效率约束的高动态范围(HDR)视频的颜色变换和处理。
背景技术
如本文所使用的,术语“动态范围(DR)”可以与人类视觉系统(HVS)感知图像中的强度(例如,光亮度(luminance)、亮度(luma))范围的能力有关,该强度范围例如是从最暗的灰色(黑色)到最亮的白色(高光)。从这个意义上说,DR与“参考场景的(scene-referred)”强度有关。DR还可以涉及显示设备充分或近似渲染特定阔度(breadth)的强度范围的能力。从这个意义上说,DR与“参考显示的(display-referred)”强度有关。除非在本文的描述中的任何一点明确指定特定的意义具有特定的意思,否则应该推断为术语可以在任一意义上例如可互换地使用。
如本文所使用的,术语高动态范围(HDR)涉及跨越人类视觉系统(HVS)的14至15个数量级的DR阔度。实际上,相对于HDR,人类可以同时感知强度范围中的广泛阔度的DR可能会被稍微截短。如本文所使用的,术语视觉动态范围(VDR)或增强动态范围(EDR)可以单独地或可互换地与这种DR有关:该DR可在场景或图像内由包括眼运动的人类视觉系统(HVS)感知,从而允许场景或图像上的一些光适性变化。如本文所使用的,VDR可以与跨越5至6个数量级的DR有关。因此,虽然相对于参考真实场景的HDR可能稍微窄一些,但VDR或EDR可以代表宽DR阔度并且也可以被称为HDR。
实际上,图像包括一个或多个颜色分量(例如,亮度Y以及色度Cb和Cr),其中,每个颜色分量由每像素n位的精度表示(例如,n=8)。例如,使用伽马光亮度编码,其中n≤8的图像(例如,彩色24位JPEG图像)被认为是标准动态范围的图像,而其中n≥10的图像可以被认为是增强动态范围的图像。HDR图像还可以使用如由工业光魔公司(Industrial Light andMagic)开发的OpenEXR文件格式等高精度(例如,16位)浮点格式来存储和分发。
大多数消费类桌面显示器目前支持200到300cd/m2或尼特的光亮度。大多数消费类HDTV的范围为300到500尼特,其中,新型号达到1,000尼特(cd/m2)。因此,这样的传统显示器代表了相对于HDR的较低动态范围(LDR),也被称为标准动态范围(SDR)。随着HDR内容的可用性由于捕获设备(例如,相机)和HDR显示器(例如,杜比实验室的PRM-4200专业参考监视器)两者的发展而提高,HDR内容可以被颜色分级并被显示在支持更高动态范围(例如,从1,000尼特到5,000尼特或更高)的HDR显示器上。
如本文所使用的,术语“前向整形(forward reshaping)”表示数字图像从其原始位深度和原始码字分布或表示(例如,伽马、PQ、HLG等)到相同或不同位深度和不同码字分布或表示的图像的样本到样本映射或码字到码字映射的过程。整形允许以固定的比特率改善可压缩性或改善图像质量。例如,非限制性地,可以将整形应用于10位或12位PQ编解码的HDR视频,以提高10位视频编码架构中的编码效率。在接收器中,在对接收到的信号(该信号可能经历也可能未经历整形)进行解压缩之后,接收器可以应用“逆(或后向)整形函数”以将信号恢复为其原始码字分布和/或实现更高的动态范围。
由于位深度的限制和对后向兼容性的潜在需求,在典型的单层HDR分发场景中,HDR内容作为SDR基层和元数据的结合被传输。传统解码器可以从SDR基层提取可视的SDR流,但是较新的HDR解码器可以将元数据应用于SDR基层以重建与原始HDR源接近近似的HDR版本。如发明人在此所理解的,期望有在这样的HDR内容分发中将内容保护和提高编码效率相结合的改进技术。
在本节中描述的方法是可以采用的方法,但不一定是先前已经设想到或采用过的方法。因此,除非另有指示,否则不应该认为本节中描述的任何方法仅凭其纳入本节就可被视为现有技术。类似地,除非另有指明,否则不应认为基于本节而已经在任何现有技术中认识到关于一种或多种方法所识别的问题。
附图说明
在附图中以举例而非限制的方式来图示本发明的实施例,并且其中类似的附图标记指代类似的元素,并且在附图中:
图1A描绘了根据实施例的使用颜色变换和整形函数的用于HDR数据的示例单层编码器;
图1B描绘了根据实施例的与图1A的编码器相对应的示例HDR解码器;以及
图2描绘了根据实施例的用于生成颜色变换参数的示例过程。
具体实施方式
本文描述了用于在HDR视频编码的编码效率约束下的颜色变换的方法。在以下说明中,出于解释的目的,阐述了许多具体细节以便提供对本发明的透彻理解。然而,明显的是,可以在没有这些具体细节的情况下实践本发明。在其他情形中,为了避免不必要地遮蔽、模糊或混淆本发明,没有详尽地描述众所周知的结构和设备。
概述
本文描述的示例实施例涉及在HDR图像编码的编码效率约束下的颜色变换。在实施例中,处理器:
接收在第一动态范围中并且在第一颜色空间中的输入图像;
基于从第一颜色空间到基于标准的颜色空间的颜色变换来获取第一3×3颜色变换矩阵和第一3×1偏移向量;
将第一3×3颜色变换矩阵应用(210)于输入图像,以生成具有光亮度分量和色度分量的第一图像;
生成第一图像的针对光亮度分量和色度分量的最小像素值和最大像素值;
基于第一图像中的最小光亮度像素值和最大光亮度像素值来计算(215)光亮度缩放值;
基于编码效率约束和第一3×3颜色变换矩阵来计算2×2色度变换矩阵的元素;基于光亮度缩放值和2×2色度变换矩阵来形成3×3中间变换矩阵;
将3×3中间变换矩阵应用(225)于第一图像以生成第二图像;
基于第一偏移向量以及第二图像的光亮度分量和色度分量中的最小像素值和最大像素值来生成中间3×1偏移向量;以及生成(230):
输出3×3颜色变换矩阵,其方式为将第一3×3颜色变换矩阵与3×3中间变换矩阵相乘;
输出3×1偏移向量,其方式为将第一3×1偏移向量与中间3×1偏移向量相加;以及
第二颜色空间中的输出图像,其方式为将输出3×1偏移向量与第二图像的像素值相加。
示例HDR编码系统
图1A和图1B根据实施例图示了使用颜色变换和图像整形两者的示例单层后向兼容编解码器框架。更具体地,图1A图示了可以用上游视频编码器中的一个或多个计算处理器来实施的示例编码器架构。图1B图示了也可以用一个或多个下游视频解码器中的一个或多个计算处理器来实施的示例解码器架构。
在这个框架下,给定参考HDR内容(105)和对应的参考SDR内容(108)(即表示与HDR内容相同的图像、但被颜色分级并表示在标准动态范围内的内容),经整形的SDR内容(134)由实施编码器架构的上游编码设备在经编码的视频信号(144)的单个层中编码为SDR内容并作为SDR内容传输。接收到的SDR内容由实施解码器架构的下游解码设备在视频信号的单个层中接收并解码。后向整形的元数据(152)也和经整形的内容一起在视频信号中被编码和传输,使得HDR显示设备可以基于(经整形的)SDR内容和后向整形的元数据来重建HDR内容。不失一般性地,在一些实施例中,如在非后向兼容的系统中,经整形的SDR内容本身可能不可观看,而是必须与将生成可观看的SDR或HDR内容的后向整形函数相结合才能观看。在支持后向兼容性的其他实施例中,传统SDR解码器仍然可以回放接收到的SDR内容而无需采用后向整形函数。
如图1A中图示的,给定HDR图像(120)、其对应的SDR图像(125)和目标动态范围,在步骤130中生成前向整形函数之后,然后给定前向整形函数,将前向整形映射步骤(132)应用于HDR图像(120)以生成经整形的SDR基层(134)。压缩块(142)(例如,根据如AVC、HEVC、AV1、VVC等任何已知视频编码算法实施的编码器)将SDR图像(134)压缩/编码在视频信号的单个层(144)中。另外,后向整形函数生成器(150)可以生成可以作为元数据(152)传输到解码器的后向整形函数。在一些实施例中,元数据(152)可以表示前向整形函数(130),因此,将由解码器来生成后向整形函数(未示出)。
表示/指定最佳后向整形函数的后向整形元数据的示例可以包括但不一定仅限于以下各项中任一项:逆色调映射函数、逆亮度映射函数、逆色度映射函数、查找表(LUT)、多项式、逆显示管理系数/参数等。在各个实施例中,亮度后向整形函数和色度后向整形函数可以共同或单独得到/优化,可以使用各种技术得到,例如但不限于,如本公开稍后描述的。
由后向整形函数生成器(150)基于经整形的SDR图像(134)和目标HDR图像(120)生成的后向整形元数据(152)可以作为视频信号144的一部分(例如,作为补充增强信息(SEI)消息传递)被复用。
在一些实施例中,后向整形元数据(152)作为整体图像元数据的一部分被承载在视频信号中,整体图像元数据与视频信号中的其中SDR图像被编码的单个层分开地被承载在视频信号中。例如,后向整形元数据(152)可以被编码在经编码的比特流中的分量流中,该分量流可以与或可以不与其中SDR图像(134)被编码的(经编码的比特流的)单个层分开。
因此,可以在编码器侧生成或预生成后向整形元数据(152),以利用在编码器侧可获得的强大的计算资源和离线编码流程(包括但不限于内容自适应多轮次、超前操作、逆亮度映射、逆色度映射、基于CDF的直方图近似和/或传递等)。
图1A的编码器架构可以用于避免将目标HDR图像(120)直接编码为视频信号中的经编码的/压缩的HDR图像;相反,视频信号中的后向整形元数据(152)可以用于使下游解码设备能够将(被编码在视频信号中的)SDR图像(134)后向整形为与参考HDR图像(120)相同或接近近似/最佳近似的重建的图像。
在实施例中,参考SDR和HDR信号可以在不适合于直接编码的颜色格式中(例如,在RGB颜色格式中)可用。传统上,这样的信号被转化为如YCbCr、YUV等对编解码器友好的格式。颜色变换块110和115表示使用3×3RGB矩阵和3×1偏移向量的RGB到YCC变换。如本文所使用的,术语“YCC”表示通用亮度-色度类颜色表示,类似于YUV和YCbCr,但是使用专有颜色变换来从RGB输入数据中生成的。这些块可以用于执行(例如,根据Rec.709(参考文献[4])或Rec.2020(参考文献[5])的)传统颜色变换、或根据后续节中要呈现的示例实施例的编码效率约束下的颜色变换。
在一些实施例中,如图1B中图示的,在编解码器框架的解码器侧接收编码有单个层(144)中的经整形的SDR图像和作为整体图像元数据的一部分的后向整形元数据(152)的视频信号作为输入。解压缩块(154)将视频信号的单个层(144)中的经压缩的视频数据解压缩/解码成经解码的SDR图像(156)。解压缩154通常对应于压缩142的逆过程。经解码的SDR图像(156)可以与经受过压缩块(142)中和解压缩框(154)中的量化误差的SDR图像(134)相同,这些量化误差可能已经针对SDR显示设备进行了优化。在后向兼容的系统中,经解码的SDR图像(156)可以在表示SDR颜色变换(110)的逆变换的合适的逆SDR颜色变换(175)之后在输出SDR视频信号(177)中被输出(例如,通过HDMI接口、通过视频链路等),以在SDR显示设备上渲染。
可选地、替代地或另外地,在同一个或另一个实施例中,后向整形块158从输入视频信号中提取后向(或前向)整形元数据(152),基于整形元数据(152)构建后向整形函数,并基于最佳后向整形函数对经解码的SDR图像(156)执行后向整形操作,以生成经后向整形的图像(160)(或重建的HDR图像)。在一些实施例中,在合适的逆HDR颜色变换(170)(表示HDR颜色变换115的逆变换)之后,经后向整形的图像(172)表示与参考HDR图像(105)相同或接近近似/最佳近似的生产质量或接近生产质量的HDR图像。经后向整形的图像(172)可以在输出HDR视频信号中被输出(例如,通过HDMI接口、通过视频链路等),以在HDR显示设备上渲染。
在一些实施例中,颜色变换(170)可以是特定于HDR显示设备的显示管理操作的一部分,并且可以作为HDR图像渲染操作的一部分对后向整形的图像(160)执行,该HDR图像渲染操作在HDR显示设备上渲染经后向整形的图像(160)。
经由颜色变换进行的内容保护
返回到图1A,在实施例中,令参考HDR RGB信号(105)被3×3RGB到YCbCr矩阵
Figure BDA0004179366540000061
和3×1偏移向量/>
Figure BDA0004179366540000062
转换为YCbCr。对应的3×3YCbCr到RGB矩阵/>
Figure BDA0004179366540000063
和3×1偏移向量/>
Figure BDA0004179366540000064
将在解码器侧(170)处使用。为确保可还原性,在实施例中,后向颜色变换矩阵是前向矩阵的逆矩阵,即,/>
Figure BDA0004179366540000065
在实施例中,/>
Figure BDA0004179366540000066
和/>
Figure BDA0004179366540000067
值可以是元数据(152)的一部分。通常,但非限制性地,使用Rec.709规范或Rec.2020规范来确定/>
Figure BDA0004179366540000068
和/>
Figure BDA0004179366540000069
在块110中,将使用编码器侧处的3×3RGB到YCC颜色矩阵
Figure BDA00041793665400000610
和3×1偏移向量
Figure BDA00041793665400000611
来对参考SDR RGB信号(108)进行颜色转换。对于逆SDR颜色变换(175),对应的3×3YCC到RGB矩阵/>
Figure BDA00041793665400000612
和3×1偏移向量/>
Figure BDA00041793665400000613
将在解码器侧处被使用。为确保可还原性,后向颜色变换矩阵是前向矩阵的逆矩阵,即,/>
Figure BDA00041793665400000614
在实施例中,/>
Figure BDA0004179366540000071
和/>
Figure BDA0004179366540000072
数据可以作为元数据(152)的一部分进行传送。/>
Figure BDA0004179366540000073
和/>
Figure BDA0004179366540000074
不一定由Rec.709规范(或任何其他基于标准的变换)来定义;事实上,它们是根据示例实施例的要调整的设计参数。注意,在前向整形(132)之后,经整形的信号(134)将与SDR颜色变换(110)的输出(125)处于同一个颜色空间中。在解码器中,如图1B所表示的,以下示例操作场景是可能的:
对授权设备进行内容保护
如所讨论的,在编码器侧处,经由
Figure BDA0004179366540000075
和/>
Figure BDA0004179366540000076
基层被映射到YCC。那些参数由稍后要描述的算法设计并且不是标准参数(例如,Rec.709、Rec.2020等)。为恢复正确的颜色,需要对应参数/>
Figure BDA0004179366540000077
和/>
Figure BDA0004179366540000078
因为/>
Figure BDA0004179366540000079
和/>
Figure BDA00041793665400000710
值不一定基于如Rec.709等标准,所以当传统设备不具有关于
Figure BDA00041793665400000711
和/>
Figure BDA00041793665400000712
的信息时,设备将用默认的Rec.709矩阵将YCC转换为RGB,这将在颜色和明亮度方面生成不可观看的图片。相反,如果接收器可以访问正确的/>
Figure BDA00041793665400000713
和/>
Figure BDA00041793665400000714
值,那么重建的SDR RGB图像的颜色将是正确的。因此,在这样的场景中,专有颜色变换可以用作“授权”机制以控制查看甚至HDR内容的SDR版本。
在另一个实施例中,可以使用专有颜色信息作为“指纹”或“水印”方案。例如,内容提供商可以决定将不同的颜色变换矩阵用于不同的分发区域(例如,欧洲、亚洲、美国等)或者用于特定的流式传输提供商(例如,亚马逊公司、Hulu等)。
对HDR内容进行恢复
在HDR回放模式下,可以用传入的元数据从仅使用一种颜色变换的基线YCC SDR图像来重建HDR RGB图像。在实施例中,通过使用如多颜色通道多元回归(MMR)预测器(参考文献[1])等颜色交叉预测器,这是可行的。即使SDR源的颜色不正确,MMR预测器的性质也可以使解码器能够恢复正确的YCbCr颜色中的HDR数据。给定YCbCr HDR输出(160),可以使用
Figure BDA00041793665400000715
和/>
Figure BDA00041793665400000716
相关的元数据来将输出从YCbCr转换为RGB。
总之,在实施例中,
Figure BDA00041793665400000717
和/>
Figure BDA00041793665400000718
颜色变换参数可以对保护内容起到关键作用。只要设备不具有正确的/>
Figure BDA00041793665400000719
和/>
Figure BDA00041793665400000720
使用默认的YCC2RGB矩阵就会生成不正确的输出。利用对/>
Figure BDA00041793665400000721
和/>
Figure BDA00041793665400000722
进行的精心设计,为维持或甚至提高编码效率,可以创建不可观看的基层并且甚至提高压缩效率。在以下节中,呈现了用于构建/>
Figure BDA00041793665400000723
和/>
Figure BDA00041793665400000724
以实现那些目标的方法。
如前所讨论的,希望在约束下设计SDR RGB到YCC的颜色变换
Figure BDA0004179366540000081
和对应的SDR YCC到/>
Figure BDA0004179366540000082
的逆颜色变换以维持或提高编码效率。将/>
Figure BDA0004179366540000083
和/>
Figure BDA0004179366540000084
中的12个系数表示为:
Figure BDA0004179366540000085
以及
Figure BDA0004179366540000086
给定前向变换参数,可以从前向变换得到后向或逆变换部分为:
Figure BDA0004179366540000087
以及
Figure BDA0004179366540000088
只要RGB到YCC矩阵中的任何系数从基于标准的矩阵(例如,Rec.709矩阵)偏离,使用规则Rec.709矩阵来转换为RGB就会表现出错误的颜色和明亮度。考虑到所有编码标准是在YCbCr颜色空间中进行操作的假定下进行设计的,虽然得到
Figure BDA0004179366540000089
和/>
Figure BDA00041793665400000810
参数似乎有极大的灵活性,但是不可以随机选择那些参数,因为它们可能影响编码效率。因此,需要解决两个主要问题:(1)应该维持整体视频编码效率以及(2)应该禁止亮度/色度信息泄露。
在实施例中,可以基于如Rec.709或Rec.2020的现有的颜色空间转换矩阵来得到新的矩阵。将基于标准的颜色变换集(例如,如Rec.709或Rec.2020中所定义的那些)表示为:
Figure BDA00041793665400000811
以及
Figure BDA00041793665400000812
例如,在Rec.709下,对于SMPTE范围(对于8位码字,[16,235]):
Figure BDA0004179366540000091
以及
Figure BDA0004179366540000092
对于全范围([0,1))
Figure BDA0004179366540000093
以及
Figure BDA0004179366540000094
Figure BDA0004179366540000095
在实施例中,
Figure BDA0004179366540000096
中的新系数是通过将/>
Figure BDA0004179366540000097
与另一个3×3矩阵Ws相乘而获得的,其中,
Figure BDA0004179366540000098
因此:
Figure BDA0004179366540000099
以及
Figure BDA00041793665400000910
对于等于单位矩阵I的Ws,则
Figure BDA00041793665400000911
将RGB SDR信号的第i个像素的三个输入分量表示为3×1向量
Figure BDA00041793665400000912
在应用
Figure BDA0004179366540000101
变换后,中间结果是/>
Figure BDA0004179366540000102
对于第i个像素,
Figure BDA0004179366540000103
在与Ws相乘之后,结果s″=Wss′由下式给出:
Figure BDA0004179366540000104
对于3×1向量,定义新的向量
Figure BDA0004179366540000105
Figure BDA0004179366540000106
最终的3×1向量是
Figure BDA0004179366540000107
或者
Figure BDA0004179366540000108
s″和
Figure BDA0004179366540000109
值的组合表示基层,该基层将被传递至视频压缩模块:
Figure BDA00041793665400001010
或者
Figure BDA00041793665400001011
首先考虑使光亮度分量不变的情况。然后,设计自由度从12个参数减少为8个参数。
Figure BDA00041793665400001012
以及
Figure BDA0004179366540000111
可以进一步约束矩阵以便不允许光亮度泄漏到色度中(即,无亮度和色度串扰),如下式中:
Figure BDA0004179366540000112
因为亮度分量不变,所以可以假定视频压缩效率取决于两个色度分量中的能量。因此,在实施例中,可以通过拥有如下的另一个约束来控制编码效率:通过Ws变换之后的色度能量应该与变换之前的色度能量成比例。换言之,给定缩放值α2
(s″i,1)2+(s″i,2)2=α2((s′i,1)2+(s′i,2)2)。 (16)
如果α=1,则调整之前和之后的色度能量是相同的,并且对视频压缩编解码器的影响应该是最小的。另一方面,如果期望增加颜色加密的裕度以使猜测参数更难,则可以允许较小的δ≥0差异(例如,δ=0.1),使得
1-δ≤α≤1+δ,
同时满足能量约束。
注意,增大这个色度缩放因子相当于在基层中给色度分配更多的码字,因此,基带信号量化损失会变得更少并且预期会有更好的视频编码增益,这也经过了数值模拟验证。然后,可以得到3×3矩阵Ws的设计指南,如下。从Ws矩阵代入s″1和s″2,得到
(w11s′1,1+w12s′i,2)2+(w21s′i,1+w22s′i,2)2=α2(s′i,1)22(s′i,2)2
通过重新布置等式,
((w11)2+(w21)22)(s′i,1)2+((w12)2+(w22)22)(s′i,2)2+2(w11w12+w12w22)s′i,1s′i,2=0
为满足所有的s′i,1和s′i,2值,矩阵系数需要满足以下一组等式:
Figure BDA0004179366540000113
等式(17)表示所提出的设计的核心约束。非限制性地,满足等式(17)的示例包括:
第一示例
令θ表示控制参数,使得例如
Figure BDA0004179366540000121
注意,通过简单地置换cos(θ)和sin(θ)的位置并改变其对应的符号以满足等式(17),可以用多种其他的变型重写等式(18)。例如:
Figure BDA0004179366540000122
可以度或弧度为单位来表达θ参数,例如,θ∈[0,2π]或θ∈[0,360]度。
第二示例
将Cb和Cr进行简单交换也满足等式(17),产生
Figure BDA0004179366540000123
再次,通过适当地改变符号,可以生成替代性的变型,如下式中:
Figure BDA0004179366540000124
为了生成3×1
Figure BDA0004179366540000125
向量,组合的3×3矩阵Ws和/>
Figure BDA0004179366540000126
向量需要满足以下约束,使得归一化数据的最终输出在范围[0,1]内,即,没有数据被裁剪:
Figure BDA0004179366540000127
或者
Figure BDA0004179366540000128
或者更准确地说,得到3×1
Figure BDA0004179366540000129
向量,使得
Figure BDA00041793665400001210
如果
Figure BDA00041793665400001211
不存在,则需要返回重新设计Ws。例如,在等式(18)下,需要为α和θ选择新的值。
注意,调整偏移相当于调整色度的DC值。在使用有损视频压缩时,这种调整不会影响编码效率。
在实施例中,还可以将简单的线性缩放和偏移应用于亮度分量,以利用附加的基层码字并且因此减少基带量化误差并提高编码效率。在这种情况下,等式(5)从12个参数减少为10个参数。
Figure BDA0004179366540000131
以及
Figure BDA0004179366540000132
此外,为满足等式(17)和(22),还需要约束β和p0的值,使得经整形的亮度
Figure BDA0004179366540000133
不被裁剪。因此,给定如下约束
Figure BDA0004179366540000134
0≤βs′i,0+p0+ns,0≤1。 (24)
根据等式(24),给定β的值,偏移p0被确定为:
-βmin{s′i,0}-ns,0≤p0≤1-βmax{s′i,0}-ns,0。 (25)
在将亮度映射到基层的全范围(例如,[0,1))时,可以如下选择这些参数:
Figure BDA0004179366540000135
p0=-βmin{s′i,0}-ns,0。 (27)
图2描绘了根据实施例的用于确定颜色变换矩阵
Figure BDA0004179366540000136
的示例流程(200)。在步骤205中,以中间3×3矩阵的简化的3×3形式Ws开始,该形式满足用于维持编码效率的约束,即等式(17)。例如,不失一般性地,可以使用等式(18)和(23)的组合来以下式的形式开始
Figure BDA0004179366540000137
以及
Figure BDA0004179366540000141
在这个示例中,需确定参数β、α、θ和向量
Figure BDA0004179366540000142
在实施例中,设计流程可以如下进行:
·步骤210:给定基于标准的颜色变换矩阵
Figure BDA0004179366540000143
(例如,根据Rec.709等的矩阵)和参考输入SDR数据(si),计算/>
Figure BDA0004179366540000144
并且确定经变换的数据的在每个颜色通道中的最小值和最大值,即,min{s′i,ch}和max{s′i,ch},其中,ch表示三个颜色通道(例如,Y、Cb或Cr)之一。
·步骤215:在这个步骤中,可以选择亮度缩放值。例如,如果β≠1,,则需确定β。其上限由在步骤210中计算的最大亮度值和最小亮度值界定。选择β>1可以提高在亮度上的编码效率,但是可能在这个过程中会强制进行更多的迭代以生成输出颜色变换矩阵。根据等式(26),
Figure BDA0004179366540000145
·步骤220:在这个步骤中,可以在Ws中选择色度相关的参数,例如,α和θ。选择α>1可以提高在色度上的编码效率。选择θ≠0可以改变颜色,从而(可选地)提供简单的内容保护机制。在这个步骤结束时,矩阵Ws被完全限定。
·步骤225:将Ws应用于步骤210的输出以针对每个像素计算s″i=Wss′i。这些值将辅助选择偏移3×1向量。例如,根据等式(25)和(27),给定基于标准的偏移向量
Figure BDA0004179366540000146
Figure BDA0004179366540000147
Figure BDA0004179366540000148
如果根据步骤225没有可行的解决方案,则在可选地调整亮度缩放值(227)之后,可能需要返回到步骤220并且为α和/或θ选择替代性的值。否则,在定义向量
Figure BDA0004179366540000151
的参数之后,在步骤230中,可以生成最终的矩阵/>
Figure BDA0004179366540000152
和偏移/>
Figure BDA0004179366540000153
在解码器中,给定
Figure BDA0004179366540000154
和/>
Figure BDA0004179366540000155
YCC到RGB颜色转换操作包括:
Figure BDA0004179366540000156
现有的整形技术可以是基于帧的,即,新的整形元数据与每个新的帧一起传输,或者是基于场景的,即,新的整形元数据与每个新的场景一起传输。如本文所使用的,对于视频序列(帧/图像的序列),术语“场景(scene)”可以涉及共享相似光亮度、颜色和动态范围特性的视频序列中的一系列连续帧。基于场景的方法在访问全场景的视频工作流流水线中起效良好;然而,一些场景只包括单个帧并不罕见(例如,在淡入和淡出中)。
根据需要,过程200还可以在帧级或场景级上更新;然而,为维持编码效率,优选在整个序列内、场景内、或图片组(GOP)内维持同样的颜色变换。为了使过程200适应于场景或图片组,可以用基于场景的最小像素值和最大像素值来代替基于帧的最小像素值和最大像素值。例如,等式(26)可以重写为:
Figure BDA0004179366540000157
其中,
Figure BDA0004179366540000158
Figure BDA0004179366540000159
其中,对于L个连续帧,max{s′,j i,0}nin{s′,j i,0}表示在第0个(例如,亮度)颜色分量的第j个帧s′中的最大像素值和最小像素值。在序列级上,
Figure BDA00041793665400001510
和/>
Figure BDA00041793665400001511
可以是计算的值或受SMPTE约束的范围值。s″的每个颜色分量的基于场景的最小像素值和最大像素值可以以类似的方式计算。
构建整形函数
如前所讨论的,非标准颜色变换
Figure BDA00041793665400001512
(110)也可以用作允许从接收到的经整形的SDR数据重建参考HDR输入(105)的接近近似的系统的一部分。在将适当的逆SDR变换应用于接收到的基层(156)之后,可以应用后向整形(158);然而,使用适当的前向整形,可以消除额外的逆颜色变换步骤并且直接提取在适当的(例如,标准定义的)YCbCr颜色空间中的重建的HDR内容。接下来将描述这个过程。非限制性地,一些步骤是在被称为三维映射表(3DMT或d3DMT)表示的上下文中描述的,其中,为了简化操作,每个帧都表示为三维映射表,其中,每个颜色分量(例如,Y、Cb或Cr)都被细分为“仓(bin)”,并且用每个仓内的像素平均值而不是用显式像素值来表示图像。3DMT制定的细节可以在参考文献[2]中找到。
在实施例中,生成前向整形函数的步骤(130)需要两组参考输入:(1)参考HDRYCbCr像素值(120)和(2)参考SDR YCC像素值(125)。对于HDR信号,将参考RGB HDR数据的输入第i个像素的三个颜色分量表示为3×1向量
Figure BDA0004179366540000161
将在HDR颜色转换(115)期间要使用的RGB到YCbCr矩阵和偏移向量表示为
Figure BDA0004179366540000162
以及
Figure BDA0004179366540000163
经由乘以矩阵
Figure BDA0004179366540000164
以及加上偏移来获得YCbCr HDR值/>
Figure BDA0004179366540000165
即/>
Figure BDA0004179366540000166
因此,对于第i个像素
Figure BDA0004179366540000167
对于SDR输入,代替从现有的基于标准的RGB到YCbCr变换获取输出,使用经修改的变换的输出,根据等式(13)给出为:
Figure BDA0004179366540000168
给定这两个参考信号,可以应用已知的方法以生成前向整形函数和后向整形函数。作为示例而非限制性地,可以经由累计密度函数(CDF)匹配过程(参考文献[2-3])来构建亮度前向整形函数,其中:a)计算HDR亮度信号
Figure BDA0004179366540000171
的直方图,表示为{hv(b)},并且计算经颜色变换的SDR亮度信号/>
Figure BDA0004179366540000172
的直方图,表示为{hs(b)};b)基于这两个直方图来构建SDR累计密度函数和HDR累计密度函数;以及c)使用CDF匹配来获得查找表(FLUT)以将HDRYCbCr输入数据映射到SDRYCC数据。这可以表达为:
Figure BDA0004179366540000173
其中,
Figure BDA0004179366540000174
表示要在块132中使用的前向映射。
对于色度,使用在HDR信号
Figure BDA0004179366540000175
与SDR信号/>
Figure BDA0004179366540000176
之间的参数化(例如,MMR)表示来构建d3DMT表示(参考文献[2])。将d3DMT对条目表示为/>
Figure BDA0004179366540000177
Figure BDA0004179366540000178
假定有P个这样的仓/对。例如,给定MMR扩展模型,描述为:
Figure BDA0004179366540000179
可以收集所有的HDR三通道输入的所有P个仓
Figure BDA00041793665400001710
然后,令SDR中的ch通道表示为:
Figure BDA00041793665400001711
使用“a/B”表示,其中,T表示转置矩阵,
BF=(VF)TVF
Figure BDA00041793665400001712
在均方误差(MSE)最小化准则下,使预测误差最小化为目标参考SDR信号sch的最佳MMR系数可以给出为:
Figure BDA00041793665400001713
并且经前向整形的SDR d3DMT条目可以表达为:
Figure BDA00041793665400001714
后向亮度整形函数可以通过以下方式来生成:首先反向追溯前向LUT以生成后向整形1D-LUT(BLUT),表示声
Figure BDA0004179366540000181
然后将/>
Figure BDA0004179366540000182
映射近似为分段多项式函数(例如,使用使用2阶多项式的8段近似)。
为了生成色度后向整形映射,也可以使用多项式近似(例如,MMR),其方式为考虑以下两项之间的参数化模型:(a)d3DMT中的经前向整形的3通道SDR仓和(2)d3DMT中的原始HDR色度仓。
将第i个经前向整形的SDR仓的MMR扩展形式表示为:
Figure BDA0004179366540000183
在收集所有三个SDR通道输入的P个仓之后
Figure BDA0004179366540000184
给出ch通道的向量HDR表示为
Figure BDA0004179366540000185
并且另一个“a/B”表示为
BB=(SB)TSB
Figure BDA0004179366540000186
使在参考HDR信号与重建的HDR信号之间的预测误差最小化的最佳MMR系数由下式给出:
Figure BDA0004179366540000187
并且重建的HDR信号(160)可以生成为:
Figure BDA0004179366540000188
元数据152包括
Figure BDA0004179366540000189
和/>
Figure BDA00041793665400001810
的值。
参考文献
这些参考文献中的每一篇都通过引用以其全文并入。
1.G-M.Su等人,“Multiple color channel multiple regression predictor”,美国专利8,811,490。
2.Q.Song等人,PCT专利申请序列号PCT/US 2019/031620,“High-fidelity fullreference and high-efficiency reduced reference encoding in end-to-endsingle-layer backward compatible encoding pipeline”,于2019年5月9日提交,公开为WO 2019/217751。
3.B.Wen等人,“Inverse luma/chroma mappings with histogram transfer andapproximation”,美国专利10,264,287。
4.Rec.ITU-R BT.709,“Parameter values for the HDTV standards forproduction and international programme exchange”,ITU,06/2015。
5.Rec.ITU-R BT.2020,“Parameter values for ultra-high definitiontelevision systems for production and international programme exchange”,ITU,06/2014。
示例计算机系统实施方式
本发明的实施例可以利用计算机系统、以电子电路和部件来配置的系统、集成电路(IC)设备(如微控制器、现场可编程门阵列(FPGA)或另一个可配置或可编程逻辑器件(PLD)、离散时间或数字信号处理器(DSP)、专用IC(ASIC))和/或包括这样的系统、设备或部件中的一个或多个的装置来实施。计算机和/或IC可以执行、控制或实行与HDR视频编码的编码效率约束下的颜色变换相关的指令,如本文所描述的那些指令。计算机和/或IC可以计算与本文所描述的HDR视频编码的编码效率约束下的颜色变换相关的各种参数或值中的任何参数或值。图像和视频动态范围扩展实施例可以以硬件、软件、固件及其各种组合来实施。
本发明的某些实施方式包括执行软件指令的计算机处理器,该软件指令使处理器执行本发明的方法。例如,显示器、编码器、机顶盒、转码器等中的一个或多个处理器可以通过执行处理器可访问的程序存储器中的软件指令来实施用于如上所述的HDR视频编码的编码效率约束下的颜色变换的方法。还可以以程序产品的形式提供本发明。程序产品可以包括承载包括指令的一组计算机可读信号的任何非暂态有形介质,该指令在被数据处理器执行时使数据处理器执行本发明的方法。根据本发明的程序产品可以采用各种非暂态且有形形式中的任何一种。程序产品可以包括例如物理介质,如包括软盘、硬盘驱动器的磁性数据存储介质、包括CD ROM、DVD的光学数据存储介质、包括ROM、闪速RAM的电子数据存储介质等。程序产品上的计算机可读信号可以可选地被压缩或加密。
在上面提到部件(例如,软件模块、处理器、组件、设备、电路等)的情况下,除非另有指明,否则对该部件的提及(包括对“装置”的提及)应该被解释为包括执行所描述部件的功能的(例如,功能上等同的)任何部件为该部件的等同物,包括在结构上不等同于执行本发明的所图示示例实施例中的功能的所公开结构的部件。
等同物、扩展、替代方案和杂项
如此描述了与HDR视频编码的编码效率约束下的颜色变换有关的示例实施例。在前述说明中,已经参考许多具体细节描述了本发明的实施例,这些具体细节可能因实施方式而异。因此,指明本发明以及申请人的发明意图的唯一且排他性指示是根据本申请以具体形式发布的权利要求组,其中,这样的权利要求发布包括任何后续校正。本文中针对这样的权利要求中包含的术语明确阐述的任何定义应该支配如在权利要求中使用的这样的术语的含义。因此,权利要求中未明确引用的限制、元素、性质、特征、优点或属性不应该以任何方式限制这样的权利要求的范围。因此,应当从说明性而非限制性意义上看待本说明书和附图。
可以根据以下枚举的示例实施例(EEE)来理解本发明的各个方面:
EEE 1.一种用于在编码效率约束下生成颜色变换数据的方法,所述方法包括:
接收在第一动态范围中并且在第一颜色空间中的输入图像;
基于从所述第一颜色空间到基于标准的颜色空间的颜色变换来获取第一3×3颜色变换矩阵和第一3×1偏移向量;
将所述第一3×3颜色变换矩阵应用(210)于所述输入图像,以生成具有光亮度分量和色度分量的第一图像;
生成所述第一图像的针对所述光亮度分量和所述色度分量的最小像素值和最大像素值;
基于所述第一图像中的最小光亮度像素值和最大光亮度像素值来计算(215)光亮度缩放值;
基于编码效率约束和所述第一3×3颜色变换矩阵来计算2×2色度变换矩阵的元素;
基于所述光亮度缩放值和所述2×2色度变换矩阵来形成3×3中间变换矩阵;
将所述3×3中间变换矩阵应用(225)于所述第一图像以生成第二图像;
基于所述第一偏移向量以及所述第二图像的光亮度分量和色度分量中的最小像素值和最大像素值来生成中间3×1偏移向量;以及生成(230):
通过将所述第一3×3颜色变换矩阵与所述3×3中间变换矩阵相乘得到的输出3×3颜色变换矩阵;
通过将所述第一3×1偏移向量与所述中间3×1偏移向量相加得到的输出3×1偏移向量;以及
通过将所述输出3×1偏移向量与所述第二图像的像素值相加得到的第二颜色空间中的输出图像。
EEE 2.如EEE 1所述的方法,进一步包括:
生成反向3×3颜色变换矩阵和反向3×1偏移向量,以将图像数据从所述第二颜色空间变换到所述第一颜色空间,其中,所述反向3×1偏移向量等于所述输出3×1偏移向量,并且所述反向3×3颜色变换矩阵包括所述输出3×3颜色变换矩阵的逆矩阵。
EEE 3.如EEE 1或2所述的方法,其中,所述第一颜色空间包括RGB颜色空间,所述基于标准的颜色空间包括YCbCr颜色空间,并且所述第一3×3颜色变换矩阵和所述第一3×1偏移向量基于Rec.709标准或Rec.2020标准。
EEE 4.如前述EEE中任一项所述的方法,其中,所述光亮度缩放值被设置为1或者由下式界定
Figure BDA0004179366540000211
其中,s′i,0表示归一化到[0,1]中的所述第一图像中的第i个像素的光亮度值,max{s′i,0}表示所述第一图像中的最大光亮度值,并且min{s′i,0}表示所述第一图像中的最小光亮度值。
EEE 5.如前述EEE中任一项所述的方法,其中,在计算2×2色度变换矩阵的元素时,所述编码效率约束包括在由所述2×2色度变换矩阵进行的色度变换之前和之后所述第一图像中的像素的色度值的能量保留准则。
EEE 6.如EEE 5所述的方法,其中,所述能量保留准则包括
(s″i,1)2+(s″i,2)2=α2((s′i,1)2+(s′i,2)2),
其中,对于第i个像素,s′i,1和s′i,2表示在应用所述2×2色度变换矩阵之前所述像素的色度值,并且s″i,1和s″i,2表示在应用所述2×2色度变换矩阵之后所述像素的色度值。
EEE 7.如EEE 6所述的方法,其中,对于2×2变换矩阵
Figure BDA0004179366540000221
在所述能量保留准则下
(w11)2+(w21)2=α2
(w12)2+(w22)2=α2
w11w12+w12w22=0
其中,α是接近1的常数。
EEE 8.如EEE 7所述的方法,其中,所述2×2变换矩阵包括
Figure BDA0004179366540000222
其中,θ与[0,2π]中的自由参数相对应。
EEE 9.如前述EEE中任一项所述的方法,其中,形成所述3×3中间变换矩阵Ws包括形成
Figure BDA0004179366540000223
其中,β表示所述光亮度缩放值,并且α和θ是参数。
EEE 10.如EEE 6或EEE 9所述的方法,其中,α=1,或者
1-δ≤α≤1+δ,
其中,δ是小于0.5的参数。
EEE 11.如前述EEE中任一项所述的方法,其中,生成所述中间3×1偏移向量[p0 p1p2]T包括计算偏移向量元素以满足偏移向量约束
-min{s″i,0}-ns,0≤p0≤1-max{s″i,0}-ns,0
-min{s″i,1}-s,1≤p1≤1-max{s″i,1}-ns,1
-min{s″i,2}-ns,2≤p2≤1-max{s″i,2}-ns,2
其中,s″i,j表示所述第二图像中的第i个像素的第j个颜色分量的像素值,并且[ns,0 ns,1 ns,2]T表示所述第一偏移向量。
EEE 12.如EEE 11所述的方法,进一步包括在确定至少一个偏移向量元素不满足其偏移向量约束时,通过以下方式来进行迭代:
基于更新的光亮度缩放值和/或更新的2×2色度变换矩阵来形成更新的3×3中间变换矩阵;
将所述更新的3×3中间变换矩阵应用(225)于所述第一图像以生成所述第二图像;
以及生成所述中间3×1偏移向量以满足所述偏移向量约束。
EEE 13.如前述EEE中任一项所述的方法,进一步包括:
接收在所述第一颜色空间中的第一高动态范围(HDR)图像,所述第一HDR图像表示与所述第一图像相同的场景、但在高于所述第一动态范围的第二动态范围中;
将基于标准的颜色变换应用于所述第一HDR图像,以生成在所述第二动态范围中的第二HDR图像;
将前向整形函数应用于所述第二HDR图像,以生成在所述第一动态范围中的基图像,其中,所述前向整形函数将来自所述第二动态范围和所述基于标准的颜色空间的像素值映射到在所述第一动态范围和所述第二颜色空间中的像素值;
压缩所述基图像,以生成在所述第二颜色空间中的经压缩的图像;以及存储输出信号,所述输出信号包括所述经压缩的图像、所述输出3×3颜色变换矩阵、所述输出3×1偏移向量和后向整形函数的参数,以基于所述经压缩的图像来重建输出HDR图像。
EEE 14.如EEE 13所述的方法,其中,在解码器中接收所述输出信号进一步包括:
解压缩所述经压缩的图像,以生成在所述第一动态范围和所述第二颜色空间中的中间基信号;以及
基于所述中间基信号、所述输出3×3颜色变换矩阵和所述输出3×1偏移向量,生成在所述第一颜色空间和所述第一动态范围中的第一输出信号,或者
基于所述中间基信号和所述后向整形函数的参数,生成在所述标准颜色空间中的HDR输出信号,其中,所述后向整形函数将像素值从所述第二颜色空间和所述第一动态范围映射到所述基于标准的颜色空间和所述第二动态范围。
EEE 15.一种非暂态计算机可读存储介质,其上存储有计算机可执行指令,用于利用一个或多个处理器执行根据EEE 1至14中任一项所述的方法。

Claims (15)

1.一种用于在编码效率约束下生成颜色变换数据的方法,所述方法包括:
接收在第一动态范围中并且在第一颜色空间中的输入图像;
基于从所述第一颜色空间到基于标准的颜色空间的颜色变换来获取第一3×3颜色变换矩阵和第一3×1偏移向量;
将所述第一3×3颜色变换矩阵应用(210)于所述输入图像,以生成具有光亮度分量和色度分量的第一图像;
生成所述第一图像的针对所述光亮度分量的最小像素值和最大像素值;
基于所述第一图像中的最小光亮度像素值和最大光亮度像素值来计算(215)光亮度缩放值;
基于编码效率约束和所述第一3×3颜色变换矩阵来计算2×2色度变换矩阵的元素;
基于所述光亮度缩放值和所述2×2色度变换矩阵来形成3×3中间变换矩阵;
将所述3×3中间变换矩阵应用(225)于所述第一图像以生成第二图像;
生成所述第二图像的针对所述光亮度分量和所述色度分量的最小像素值和最大像素值;
基于所述第一偏移向量以及所述第二图像的光亮度分量和色度分量中的最小像素值和最大像素值来生成中间3×1偏移向量;以及生成(230):
通过将所述第一3×3颜色变换矩阵与所述3×3中间变换矩阵相乘得到的输出3×3颜色变换矩阵;
将所述第一3×1偏移向量与所述中间3×1偏移向量相加得到的输出3×1偏移向量;以及
将所述输出3×1偏移向量与所述第二图像的像素值相加得到的第二颜色空间中的输出图像。
2.如权利要求1所述的方法,进一步包括:
生成反向3×3颜色变换矩阵和反向3×1偏移向量,以将图像数据从所述第二颜色空间变换到所述第一颜色空间,其中,所述反向3×1偏移向量等于所述输出3×1偏移向量,并且所述反向3×3颜色变换矩阵包括所述输出3×3颜色变换矩阵的逆矩阵。
3.如权利要求1或2所述的方法,其中,所述第一颜色空间包括RGB颜色空间,所述基于标准的颜色空间包括YCbCr颜色空间,并且所述第一3×3颜色变换矩阵和所述第一3×1偏移向量基于Rec.709标准或Rec.2020标准。
4.如前述权利要求中任一项所述的方法,其中,所述光亮度缩放值被设置为1或者由下式界定
Figure FDA0004179366530000021
其中,si,0表示归一化到[0,1]中的所述第一图像中的第i个像素的光亮度值,max{s′i,0}表示所述第一图像中的最大光亮度值,并且min{s′i,0}表示所述第一图像中的最小光亮度值。
5.如前述权利要求中任一项所述的方法,其中,在计算2×2色度变换矩阵的元素时,所述编码效率约束包括在由所述2×2色度变换矩阵进行的色度变换之前和之后所述第一图像中的像素的色度值的能量保留准则。
6.如权利要求5所述的方法,其中,所述能量保留准则包括
(s″i,1)2+(s″i,2)2=α2((s″i,1)2+(s′i,2)2),
其中,对于第i个像素,s′i,1和s′i,2表示在应用所述2×2色度变换矩阵之前所述像素的色度值,并且s″i,1和s″i,2表示在应用所述2×2色度变换矩阵之后所述像素的色度值。
7.如权利要求6所述的方法,其中,对于2×2变换矩阵
Figure FDA0004179366530000022
在所述能量保留准则下
Figure FDA0004179366530000023
其中,α是接近1的常数。
8.如权利要求7所述的方法,其中,所述2×2变换矩阵包括
Figure FDA0004179366530000031
其中,θ与[0,2π]中的自由参数相对应。
9.如前述权利要求中任一项所述的方法,其中,形成所述3×3中间变换矩阵Ws包括形成
Figure FDA0004179366530000032
其中,β表示所述光亮度缩放值,并且α和θ是参数。
10.如权利要求6或权利要求9所述的方法,其中,α=1,或者
1-δ≤α≤1+δ,
其中,δ是小于0.5的参数。
11.如前述权利要求中任一项所述的方法,其中,生成所述中间3×1偏移向量[p0p1p2]T包括计算偏移向量元素以满足偏移向量约束
Figure FDA0004179366530000033
其中,s″i,j表示所述第二图像中的第i个像素的第j个颜色分量的像素值,并且[ns,0ns,1ns,2]T表示所述第一偏移向量。
12.如权利要求11所述的方法,进一步包括在确定至少一个偏移向量元素不满足其偏移向量约束时,通过以下方式来进行迭代:
基于更新的光亮度缩放值和/或更新的2×2色度变换矩阵来形成更新的3×3中间变换矩阵;
将所述更新的3×3中间变换矩阵应用(225)于所述第一图像以生成所述第二图像;
以及生成所述中间3×1偏移向量以满足所述偏移向量约束。
13.如前述权利要求中任一项所述的方法,进一步包括:
接收在所述第一颜色空间中的第一高动态范围(HDR)图像,所述第一HDR图像表示与所述第一图像相同的场景、但在高于所述第一动态范围的第二动态范围中;
将基于标准的颜色变换应用于所述第一HDR图像,以生成在所述第二动态范围中的第二HDR图像;
将前向整形函数应用于所述第二HDR图像,以生成在所述第一动态范围中的基图像,其中,所述前向整形函数将来自所述第二动态范围和所述基于标准的颜色空间的像素值映射到在所述第一动态范围和所述第二颜色空间中的像素值;
压缩所述基图像,以生成在所述第二颜色空间中的经压缩的图像;以及存储输出信号,所述输出信号包括所述经压缩的图像、所述输出3×3颜色变换矩阵、所述输出3×1偏移向量和后向整形函数的参数,以基于所述经压缩的图像来重建输出HDR图像。
14.如权利要求13所述的方法,其中,在解码器中接收所述输出信号进一步包括:
解压缩所述经压缩的图像,以生成在所述第一动态范围和所述第二颜色空间中的中间基信号;以及
基于所述中间基信号、所述输出3×3颜色变换矩阵和所述输出3×1偏移向量,生成在所述第一颜色空间和所述第一动态范围中的第一输出信号,或者
基于所述中间基信号和所述后向整形函数的参数,生成在所述标准颜色空间中的HDR输出信号,其中,所述后向整形函数将像素值从所述第二颜色空间和所述第一动态范围映射到所述基于标准的颜色空间和所述第二动态范围。
15.一种非暂态计算机可读存储介质,其上存储有计算机可执行指令,用于利用一个或多个处理器执行根据权利要求1至14中任一项所述的方法。
CN202180070803.2A 2020-10-14 2021-10-14 用于具有编码效率约束的hdr视频的颜色变换 Pending CN116391356A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US202063091436P 2020-10-14 2020-10-14
EP20201683.8 2020-10-14
US63/091,436 2020-10-14
EP20201683 2020-10-14
PCT/US2021/054994 WO2022081851A1 (en) 2020-10-14 2021-10-14 Color transformation for hdr video with a coding-efficiency constraint

Publications (1)

Publication Number Publication Date
CN116391356A true CN116391356A (zh) 2023-07-04

Family

ID=78372133

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180070803.2A Pending CN116391356A (zh) 2020-10-14 2021-10-14 用于具有编码效率约束的hdr视频的颜色变换

Country Status (5)

Country Link
US (1) US20230368344A1 (zh)
EP (1) EP4229869A1 (zh)
JP (1) JP2023545130A (zh)
CN (1) CN116391356A (zh)
WO (1) WO2022081851A1 (zh)

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
PL2782348T3 (pl) 2011-04-14 2018-04-30 Dolby Laboratories Licensing Corp Zmienna objaśniająca regresji wielorakiej kanału wielu barw
US10257526B2 (en) * 2015-05-01 2019-04-09 Disney Enterprises, Inc. Perceptual color transformations for wide color gamut video coding
WO2017015564A1 (en) * 2015-07-22 2017-01-26 Arris Enterprises Llc System for coding high dynamic range and wide color gamut sequences
JP6320440B2 (ja) * 2015-08-04 2018-05-09 ドルビー ラボラトリーズ ライセンシング コーポレイション ハイダイナミックレンジ信号のための信号再構成
US10264287B2 (en) 2016-10-05 2019-04-16 Dolby Laboratories Licensing Corporation Inverse luma/chroma mappings with histogram transfer and approximation
CN111434114B (zh) * 2017-12-01 2024-06-11 交互数字Vc控股公司 处理图像
US11277627B2 (en) 2018-05-11 2022-03-15 Dolby Laboratories Licensing Corporation High-fidelity full reference and high-efficiency reduced reference encoding in end-to-end single-layer backward compatible encoding pipeline

Also Published As

Publication number Publication date
WO2022081851A1 (en) 2022-04-21
EP4229869A1 (en) 2023-08-23
US20230368344A1 (en) 2023-11-16
JP2023545130A (ja) 2023-10-26

Similar Documents

Publication Publication Date Title
CN110301134B (zh) 整合的图像整形和视频编码
TWI729377B (zh) 用於將影像自第一動態範圍映射至第二動態範圍之方法
CN112106357B (zh) 用于对图像数据进行编码和解码的方法及装置
EP3011741B1 (en) Adaptive reshaping for layered coding of enhanced dynamic range signals
CN107995497B (zh) 高动态范围视频的屏幕自适应解码
CN105744277B (zh) 分层vdr编译码中的层分解
US11653034B2 (en) Enhancement decoder for video signals with multi-level enhancement and coding format adjustment
CN107852511B (zh) 用于hdr和宽色域信号的信号整形和编码
EP3510772A1 (en) Coding of high dynamic range video using segment-based reshaping
CN113170205B (zh) 整形函数生成方法及装置以及图像解码方法及装置
EP3834411B1 (en) Reducing banding artifacts in hdr imaging via adaptive sdr-to-hdr reshaping functions
WO2018231968A1 (en) Efficient end-to-end single layer inverse display management coding
EP3105926A1 (en) Piecewise inter-layer prediction for signals with enhanced dynamic range
WO2018049335A1 (en) Coding of high dynamic range video using segment-based reshaping
US10200703B2 (en) Inter-layer prediction for signals with enhanced dynamic range
EP3639238A1 (en) Efficient end-to-end single layer inverse display management coding
CN114556940A (zh) 视频编解码器中的质量与计算复杂度之间的可调整的折衷
CN116391356A (zh) 用于具有编码效率约束的hdr视频的颜色变换
US20230254494A1 (en) Image prediction for hdr imaging in open-loop codecs
US20230412813A1 (en) Enhancement decoder for video signals with multi-level enhancement and coding format adjustment

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40090463

Country of ref document: HK