CN106488246A - 用于增强动态范围信号的分层编码的自适应整形 - Google Patents

用于增强动态范围信号的分层编码的自适应整形 Download PDF

Info

Publication number
CN106488246A
CN106488246A CN201611156282.XA CN201611156282A CN106488246A CN 106488246 A CN106488246 A CN 106488246A CN 201611156282 A CN201611156282 A CN 201611156282A CN 106488246 A CN106488246 A CN 106488246A
Authority
CN
China
Prior art keywords
conversion
value
signal
chromatic
function
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201611156282.XA
Other languages
English (en)
Other versions
CN106488246B (zh
Inventor
苏冠铭
R·阿特肯斯
J·S·米勒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby Laboratories Licensing Corp
Original Assignee
Dolby Laboratories Licensing Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby Laboratories Licensing Corp filed Critical Dolby Laboratories Licensing Corp
Publication of CN106488246A publication Critical patent/CN106488246A/zh
Application granted granted Critical
Publication of CN106488246B publication Critical patent/CN106488246B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/182Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/192Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/36Scalability techniques involving formatting the layers as a function of picture distortion after decoding, e.g. signal-to-noise [SNR] scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明公开了用于增强动态范围信号的分层编码的自适应整形。编码器接收将以分层表示被编码的输入的增强动态范围(EDR)图像。输入图像可以使用一个或多个视频编码器不支持的位深格式被伽玛编码或感知编码。该输入图像被重映射到一个或多个量化层以使用可用视频编码器来产生适合于压缩的输出码字。展现了确定用于线性和非线性映射函数的最佳函数参数的算法。给定映射函数,反向映射函数可以作为查找表被发送到解码器,或者它可以使用分段多项式近似来近似。还展现了用于表示反向映射函数的多项式近似技术以及减小颜色偏移的色度转化方案。

Description

用于增强动态范围信号的分层编码的自适应整形
本申请是基于申请号为201480034679.4、申请日为2014年6月16日、发明名称为“用于增强动态范围信号的分层编码的自适应整形”的专利申请的分案申请。
相关申请的交叉引用
本申请要求以下专利申请的优先权:2013年6月17日提交的美国临时专利申请No.61/836,044;2014年3月12日提交的美国临时专利申请No.61/951,914;以及2014年5月23日提交的美国临时专利申请No.62/002,631,每件专利申请的全部内容特此通过引用并入。
本申请还涉及2014年3月25日提交的国际申请No.PCT/US2014/031716,该申请的全部内容通过引用并入本文。
技术领域
本发明一般涉及视频图像。更具体地,本发明的实施例涉及用于分层编码和解码的、具有高或增强动态范围的图像的自适应整形(reshape)。
背景技术
如本文中所使用的,术语“动态范围”(DR)可以与人类心理视觉系统(HVS)感知图像中的例如从最黑暗的暗(黑)到最明亮的亮(白)的强度(例如,照度、亮度)范围的能力有关。在这个意义上,DR与“场景参考(scene-referred)”强度有关。DR还可以与显示设备充分地或近似地呈现特定广度(breadth)的强度范围的能力有关。在这个意义上,DR与“显示器参考(display-referred)”强度有关。除非特定的意义在本文的描述中的任何点处被明确地指定为具有特别的重要性,否则应推断该术语可以在任一意义上(例如,可互换地)被使用。
如本文中所使用的,术语高动态范围(HDR)与跨越人类视觉系统(HVS)的一些14-15个数量级的DR广度有关。例如,具有(例如,在统计、生物计量或眼科意义上)基本上正常的视觉的适应良好的人类具有跨越大约15个数量级的强度范围。适应的人类可以感知如仅少数光子那么少的昏暗光源。然而,这些相同的人类可以感知沙漠、海或雪中的正午的太阳的近乎痛苦的耀眼强度(或者甚至瞥向太阳,但是短暂地以防止伤害)。该跨度不过对于“适应的”人类(例如,其HVS具有进行重置和调整的时间段的那些人)是可用的。
相反,与HDR相比较,在其上人类可以同时感知强度范围中的广泛广度的DR有些截短。如本文中所使用的,术语增强动态范围(EDR)或视觉动态范围(VDR)可以单独地或可互换地与HVS可同时感知的DR有关。如本文中所使用的,EDR可以与跨越5至6个数量级的DR有关。因此,尽管与真实场景参考HDR相比较,可能有些较窄,但是EDR却表示宽的DR广度。
在实际中,图像包括一个或多个颜色分量(例如,亮度Y以及色度Cb和Cr),其中,每个颜色分量通过每一像素n位的精度表示(例如,n=8))。尽管亮度动态范围和位深不是等同的实体,但是它们通常是相关的。其中n≤8的图像(例如,彩色24位JPEG图像)被认为是标准动态范围的图像,而其中n>8的图像可以被认为是增强动态范围的图像。EDR和HDR图像也可以使用高精度(例如,16位)浮点格式(诸如由Industrial Light and Magic开发的OpenEXR文件格式)来进行存储和分发。
视频信号可以通过多个参数(诸如位深、颜色空间、色域和分辨率)表征。现代的电视和视频回放设备(例如,蓝光播放器)支持各种分辨率,包括标清(例如,720×480i)和高清(HD)(例如,1920×1080p)。超高清(UHD)是具有至少3,840×2,160分辨率(被称为4KUHD)以及高达7680×4320的选项(被称为8K UHD)的下一代分辨率格式。超高清也可以被称为Ultra HD、UHDTV或超高视觉。如本文中所使用的,UHD表示高于HD分辨率的任何分辨率。
为了支持与旧有的8位回放设备以及新的HDR或UHD编码和显示技术的后向兼容,可以使用多种格式来将UHD和HDR(或EDR)视频数据从上游设备递送到下游设备。给定EDR流,一些解码器可以使用8位层的集合来重构内容的HD SDR或EDR版本。高级解码器可以使用以比传统的8位高的位深编码的层的第二集合来重构内容的UHD EDR版本以在更有能力的显示器上呈现它。如发明人在这里所意识到的,用于EDR视频的编码和分发的改进技术是所希望的。
在本部分中描述的方法是可以追寻的方法,但不一定是以前已设想或追寻的方法。因此,除非另有指示,否则不应仅仅由于在本部分中所描述的任一方法包括在本部分中就假定它们有资格作为现有技术。类似地,针对一种或多种方法识别出的问题不应基于本部分就假定已在任何现有技术中被认识到,除非另有指示。
附图说明
本发明的实施例在附图的图中通过示例的方式、而非以限制的方式被示出,并且在附图中,相似的附图标记指的是类似的元素,并且其中:
图1A描绘根据本发明的实施例的EDR分层编码的示例框架;
图1B描绘根据本发明的实施例的EDR分层解码的示例框架;
图2描绘基于幂函数的示例EDR信号整形函数,其中,函数参数α根据本发明的实施例而确定。
图3描绘根据本发明的实施例的用于确定用于EDR输入的前向成形函数的最佳指数的示例过程;
图4描绘根据本发明的实施例的用于确定EDR码字的前向映射的示例过程;
图5描绘根据本发明的实施例的输入EDR码字(vc)到基于块的缩放因子(k(vc))的中间映射的示例;
图6描绘根据本发明的实施例的输入EDR码字到最终输出的整形符号的示例映射;
图7描绘根据本发明的实施例计算的反向映射的示例;
图8A和图8B描绘根据本发明的实施例的色度范围缩放的示例;以及
图9描绘根据本发明的实施例的编码和解码管线的示例。
具体实施方式
本文中描述了用于具有增强动态范围(EDR)的视频图像的分层编码的自适应整形技术。在以下描述中,出于解释的目的,阐明了大量具体的细节,以便提供本发明的透彻理解。然而,将清楚的是,本发明可以在没有这些具体细节的情况下实施。在其它情况下,公知的结构和设备没有被详尽地描述,以便避免不必要地封闭、模糊或混淆本发明。
概述
本文中所描述的示例实施例涉及用于高效分层编码的、具有高或增强动态范围的视频图像的自适应整形。编码器接收将以分层表示被编码的输入的增强动态范围(EDR)图像。输入图像可以使用可用视频编码器中的一个或多个不支持的位深格式被伽玛编码或感知编码。输入图像被重映射到一个或多个量化层以使用可用视频编码器来产生适合于压缩的输出码字。
在一个实施例中,重映射是基于使用单个函数参数的幂函数。展现了基于对于输入EDR图像中的每个块计算基于块的复杂性量度(measure)、并然后评估量化图像中的量化引起的失真的量来确定最佳函数参数的技术。
在另一个实施例中,使用基于块的复杂性度量(诸如标准偏差)以及基于块的线性量化模型(其中,对于每个图像块确定单独的最优的量化器缩放器(scaler))来产生最佳映射。该单独的最优的缩放器被组合以对于每个输入码字确定包络斜率(envelope slope),并且基于包络斜率来确定输入码字与输出码字之间的最优的前向映射函数。反向映射函数可以作为查找表被发送到解码器,或者它可以使用分段多项式近似来近似。
在另一个实施例中,给定反向映射查找表,使用分段多项式近似技术来近似逆向(inverse)映射函数。
在解码器中,对编码的位流层进行解码以产生解码的视频层,该解码的视频层被再组合以产生单个解码信号。然后,给定接收到的定义编码器整形或映射函数的参数,对解码信号进行逆向映射以产生从编码器发送到解码器的原始EDR信号的估计。
在另一个实施例中,可以对输入视频信号的色度颜色分量进行转化(translate),以使得期望的白点(white point)的坐标被近似地移位(shift)到转化的色度范围的中心。
用于视频信号整形和分层分解的示例框架
分层编码和解码
现有的显示器和回放设备(诸如HDTV、机顶盒或蓝光播放器)通常支持高达1080pHD分辨率(例如,在每秒60帧时的1920×1080)的信号。对于消费者应用,这样的信号现在通常以其中通常色度分量具有比亮度分量低的分辨率的亮度-色度颜色格式(例如,YCbCr或YUV 4:2:0颜色格式)、每一颜色分量每一像素使用8位的位深来进行压缩。由于8-位深和对应的低动态范围,这样的信号通常被称为具有标准动态范围(SDR)的信号。随着新的电视标准(诸如超高清(UHD))正被开发,可能所希望的是对具有增强分辨率和/或增强动态范围的信号进行编码。
视频图像通常被伽玛编码以补偿人类视觉系统的性质。例如,ITU-R Rec.2020定义了UHDTV信号的推荐伽玛编码。对于EDR图像,感知量化(PQ)可以提供对于传统的伽玛编码的更好的替代。人类视觉系统以非常非线性的方式对增加的光水平(level)进行响应。人类看见刺激的能力受该刺激的亮度、该刺激的大小、构成该刺激的空间频率、以及眼睛在一个人观看该刺激的特定时刻适应的亮度水平影响。感知量化器函数将线性的输入灰度水平映射到与人类视觉系统中的对比灵敏度阈值更好地匹配的输出灰度水平。在其全部内容通过引用并入本文的、2012年12月6日提交的、J.S.Miller等人的标题为“Perceptualluminance nonlinearity-based image data exchange across different displaycapabilities”、序号为PCT/US2012/068212的PCT申请(将被称为‘212申请)中描述了PQ映射函数的示例,在该申请中,给定固定的刺激大小,对于每一个亮度水平(即,刺激水平),根据最灵敏的适应水平和最灵敏的空间频率(根据HVS模型)来选择该亮度水平处的最小可见对比步长(step)。与传统的表示物理阴极射线管(CRT)设备的响应曲线、并且巧合地可能具有与人类视觉系统响应的方式非常粗略的相似性的伽玛曲线相比,如‘212申请所确定的PQ曲线使用相对简单的函数模型来模拟人类视觉系统的真实视觉响应。
在其全部内容通过引用并入本文的、2013年3月26日提交的、标题为“Encodingperceptually-quantized video content in multi-layer VDR coding”的、从现在开始将被称为‘388申请的美国临时申请序号61/805,388(该申请还于2014年3月25日被作为PCT/US2014/031716提交)中,发明人描述了使用两层编码器对PQ编码的EDR图像数据进行高效编码和传输的图像整形技术。本申请通过描述可应用于使用单层编码器或多层编码器两者对EDR数据进行编码的新颖的映射或整形技术来在‘388申请上进行了扩展。
图1A描绘根据本发明的实施例的EDR分层编码的示例框架。输入信号(102)包括具有可能已被伽玛或PQ编码的EDR像素值的视频帧的序列。对于总共L个编码层,该系统包括至少一个基本层(BL)视频编码器(120-0),并且可以包括一个或多个增强层(EL)视频编码器(120-1,120-L-1),直到L-1。例如,对于L=2,该系统包括双层编码器。视频编码器(120)可以全部是相同的或不同的,从而实现用于视频压缩的已知的或未来的编码格式中的任何一个,诸如:MPEG-2、MPEG-4、part 2、H.264(或AVC)、H.265(或HEVC)等。此外,一个层中的视频编码器可以支持与另一个层中的视频编码器不同的位深。例如,不失一般性,实施例可以包括以下配置:
●单层HEVC编码器,其支持至少10位的位深,但是优选地支持12位或更多。
●双层编码器,其中,两个编码器可以使用相同的格式(比如说H.264)来进行编码,并且两个编码器支持相同的或不同的位深(比如说,8位和10位)
●双层编码器,其中,两个编码器可以使用不同的编码格式来进行编码,并且每一个可以支持不同的位深(比如说,8位、以及10位或更多)
●多层编码器,其中,至少一个编码器为8位MPEG-2编码器,而至少一个其它编码器为HEVC或H.264编码器。
视频编码器(120)可以全部通过单个处理器或者通过一个或多个处理器来实现。
根据实施例,信号整形模块(110)将输入的EDR信号(被表示为v)量化为更好地符合视频编码器(120)的特性(诸如最大支持位深)的信号s(112)。如本文中所使用的,术语整形、量化和(前向)映射表示将输入信号从第一动态范围映射到通常低于第一动态范围的第二动态范围的输出信号的等同功能,并且可以可互换地使用。
令Bl表示由第l层视频编码器(120-l,l=0,1,2,…,L-1)使用的位深,则,对于总共NT=N0+N1+…+NL-1个码字,每个层可以支持多达Nl=2Bl个输入码字。例如,对于L=1(单层)且B0=10,存在210=1024个量化码字。对于L=2(双层)且B0=B1=8,则存在28+28=512个量化码字。当L=2且B10=10、B1=8时,则存在总共210+28=1280个量化码字。因此,该系统可以适应视频编码标准的任何组合,每个视频编码标准以它自己的位深进行操作。
令s=f(v)表示信号整形/量化函数(110)。稍后将更详细地描述这样的函数的示例。标识整形函数的参数可以被包括在元数据信号(119)中。在一些实施例中,元数据(119)可以被元数据编码器(125)编码,并且经编码的元数据(127)可以被用信号发送到解码器(如图1B中所描绘的解码器),以用于适当的逆向量化和解码。在另一个实施例中,信号整形(110)可以包括信号整形函数族,从而对于一个或多个层或者层内的一个或多个色度分量,使用单独的成形函数。例如,在实施例中,用于基本层(l=0)的信号整形函数可以是线性函数,而用于第一增强层(l=1)的信号整形函数可以包括非线性函数或分段线性函数。
层分解
在实施例中,令量化信号s(112)的像素值被分成由段边界{pi,i=0,1,…,L}限定的L个段,其中,p0通常表示对于s的最小可能值(例如,p0=0),并且
对于i=1,…,L (1)
例如,对于L=1,p0=0并且p1=N0。该模块将把所有的码字编码到基本层。
对于L=2,p0=0,p1=N0,p2=N0+N1。在实施例中,将在层0中对具有{p0,p1}之间的码字的像素进行编码,并且将在层1中对具有{p1,p2}之间的码字的像素进行编码。一般地,给定L个层,对于每个层l,该层处的sl个像素被编码为:
sl=Clip3(s,pl,pl+1-1)-pl,l=0,1,2,…,L-1, (2)
其中,d=Clip3(s,a,b)表示裁剪(clip)函数,其中,如果a≤s≤b,则d=s,如果s<a,则d=a,以及如果s>b,则d=b。
在层分解(115)之后,在实施例中,每个层sl(117-l,l=0,1,…,L-1)可以被视频编码器(120)独立地编码以产生经压缩的位流(122)。如在‘388申请中所讨论的,在一些实施例中,可以将图1A中所描绘的系统修改为也允许层间预测。在这样的实施例中,预测器可以被用于基于l-1层的像素值来估计第l层的像素值;然后不是直接对第l层的像素值进行编码,而是简单地对实际值与预测值之间的残差进行编码和发送。
在一些实施例中,经编码的位流(122)、经编码的元数据(127)和其它数据(例如,音频数据)可以被复用为单个位流,并且作为单个复用的位流(未示出)被发送到解码器。
图1B描绘了根据本发明的实施例的EDR分层解码的示例框架。如图1B中所描绘的,在接收的可以组合音频、视频和辅助数据(未示出)的位流的解复用之后,将接收的经编码的位流(122)中的每一个馈送给视频解码器阵列(130)。解码器(130)对应于编码器(120),并且产生经解码的视频信号(132)中的一个或多个。使用信号逆向整形和层合成器(140)单元,接收的分层信号被组合和逆向成形以产生信号(142),其表示原始EDR信号(102)的估计。在实施例中,可以如下产生输出EDR信号(142):
其中,f-1()表示信号整形函数(110)的逆(或逆的接近的近似),并且表示重构的层信号(132),其表示原始sl信号(117)的非常接近的近似。如图1B中所描绘的,在接收的层之间不存在层间预测;然而,如视频编码领域中已知的,该系统可以被容易地扩展到如下的解码器:在这些解码器中,使用接收的残差信号和层间预测来产生信号。
使用幂函数的EDR信号整形
如‘388申请中所描述的,对于PQ编码的信号,在实施例中,信号整形函数(110)可以被表达为:
其中,vL和vH表示考虑输入EDR信号(102)下的颜色通道中的最小值和最大值,并且cL和cH表示对应的最小输出值和最大输出值。例如,在实施例中,如等式(1)中所定义的,cL=0并且cH=pL-1。α的值是恒定的,但是可以基于每一帧、每一场景或其它合适的标准而改动和变化。图2描绘了对于α<1的等式(4)的幂整形函数的示例。在实施例中,如果输入(112)被PQ编码,则α>1,否则,如果输入(112)被伽玛编码,则α<1。
在‘388申请中,描述了使用基于块内的像素的标准偏差或者块内的最小像素值与最大像素值之间的差的块复杂性度量(MEDR)来确定α的最佳值的方法。除了这些度量之外,可以基于块的空间特性或频率特性来应用其它复杂性量度。例如,MEDR可以对应于块中的像素的方差、块的DC值、或者其DCT系数或像素值的另一个函数。
考虑包括F个视频帧的视频场景,每个帧被分成N个块(例如,每个块为8×8个像素)。图像块可以重叠,或者在优选实施例中,不重叠。图3描绘了基于一般化的块复杂性量度MEDR(j,n)(例如,不失一般性,块内的像素值的标准偏差)来计算最佳α的过程。
如图3中所描绘的,在步骤(305)(在该步骤中,对场景中的所有帧中的每个块计算MEDR(j,n))之后,在步骤(310)中,构造集合Фj,该集合Фj包括满足某一标准(例如,MEDR(j,n)>T,其中,T是预先指定的阈值,比如说0)的所有图像块。
步骤(315)、(320)和(325)包括对于预定范围(例如,MIN_α≤αj≤MAX_α)内的各种αj值计算的循环(327)。例如,开始αj可以被设置为等于1,并且然后可以根据原始EDR视频数据被如何编码而增大或减小。例如,对于PQ编码的数据,它将被增大,而对于伽玛编码的数据,它将被减小。在步骤(320)中,使用给定的αj和等式(4),对输入数据EDR进行量化,并且可以对每个经量化的块计算新的度量MLD(j,n,αj)。在一些实施例中,复杂性量度MLD可以与复杂性量度MEDR相同。在一些其它的实施例中,这两个复杂性量度可以是不同的。对输入的EDR数据量化越多,经量化的信号(112)的特性将改变越多。理想地,量化(110)应使输入尽可能少地失真。在步骤(325)中,可以应用由于量化而导致的失真的量度以识别选择的αj是否是最佳的。例如,在实施例中,如果
则αj可以被选择为最佳的,其中,Tσ是另一个预定的阈值(例如,Tσ=0)。
在场景中的所有块已被量化之后,在步骤(330)中选择总体最优的alpha值。例如,在实施例中,对于α>1,总体最优的α被选择为所有最佳的αj值之中最小的那一个。类似地,对于α<1,总体最优的α被选择为所有最佳的αj值之中最大的那一个。
在一些实施例中,为了针对由于视频编码器(120)的有损压缩而导致的量化影响进行调整,可以进一步调整总体最佳的alpha(例如,α=α+Δα,其中,当α>1时Δ为负值,而当α<1时Δ为正值)。相同的参数优化过程也可以被容易地扩展到其它的由多于一个的函数参数表征的线性或非线性量化和整形函数。
表1以伪代码提供了根据实施例的基于图3中所描绘的过程对伽玛编码的值进行整形的示例算法,其中,期望的α<1。
表1—对于伽玛编码的EDR信号计算最优α的方法
在解码器中,逆向成形运算(140)可以被表达为:
在一些实施例中,等式(4)的幂函数可以被表达为分段线性多项式、分段2-d或3-d阶多项式或分段B样条。在这样的实现中,建议应强制执行段之间的平滑度和单调性约束以避免量化相关的伪像。然后可以应用与较早描述的或者在‘388申请中描述的那些搜索方法类似的搜索方法。
块自适应整形函数
再次考虑包括F个视频帧的视频场景,每个帧被分成N个块(例如,每个块为8×8个像素)。图像块可以重叠,或者在优选实施例中,不重叠。图4描绘了根据实施例的将输入的EDR码字(102)映射为经整形的输出值(112)的示例数据流程。
如前所述,可以定义基于块的复杂性量度(MEDR)。在实施例中,在步骤(405)中,不失一般性,考虑将基于块中的像素的标准偏差(std)而计算的复杂性量度。注意,检查帧j(j=1,2,…,F)中的块n的标准偏差是否为零(例如,MEDR(j,n)=stdjn=0)等于检查该块中的最大值(例如,B(j,n))与该块中的最小值(例如,A(j,n))之间的差是否为0。
假定整形函数(110)通过分段线性线构造,则对于输入vi∈[A(j,n) B(j,n)],局部量化器可以被表达为:
其中,k(j,n)是调整第j帧中的第n块处的量化器的斜率的缩放因子。
在步骤(410)中,令Ф表示块度量满足某一标准的所有块的集合。例如,令Ф表示在量化之前具有非零标准偏差的所有块的集合,或者
Φ={(j,n)|B(j,n)-A(j,n)>0}. (7)
在实施例中,给定阈值Tth(其中,不失一般性,Tth≥1),给定块的最小像素值和最大像素值,在步骤(415)中,可以如下导出最优的k(j,n):
给定数据{A(j,n),B(j,n),k(j,n)},该三元组值揭示了,在段[A(j,n),B(j,n)]内部,量化器应具有至少k(j,n)的斜率。假定特定的EDR码(例如,vc)可以属于多个[A(j,n),B(j,n)]段,则对于EDR码字vc,需要对于每个码字确定最大斜率以满足所有块。
令θ(vc)表示覆盖码字vc的所有块之中的所有段的集合,或者
θ(vc)={(j,n)|A(j,n)≤vc≤B(j,n),(j,n)∈Φ}. (9)
然后,在步骤(420)中,码字vc处的所需斜率可以被确定为属于θ(vc)集合的那些块内的所有最优斜率的包络,或者
在步骤(425)中,令所有这样的包络斜率的和被表示为:
然后,对于每个vc码字,不失一般性,在步骤(430)中,可以如下定义累积斜率函数:
为了保证所有的码字被映射在[cL,cH]界限内,可以使用以下等式来计算从vc码字到si值的映射:
给定等式(13),可以使用前向映射查找表(例如,)来计算输入的vc值和输出的si值之间的映射。在实施例中,该表可以以数据存储,或者作为图像元数据(119)的一部分被发送到解码器以使得解码器可以重构逆向映射过程。
在示例实施例中,表2使用伪代码概括了图4中所描绘的映射过程。
表2
在一些实施例中,在等式(12)中,替代函数可以被用于计算累积斜率函数K(vc)。例如,可以如以下等式中那样在k(vc)值被求和之前对k(vc)值进行滤波或加权:
其中,wi表示具有(2u+1)个滤波器抽头的滤波器的滤波器系数或预定权重(例如,u=2并且滤波器系数对应于低通滤波器的那些滤波器系数)。
图5描绘了给定[0,255]的[cL,cH]范围的对于帧的测试序列的、vc码字对包络斜率k(vc)值的示例绘图。
给定图5中描绘的数据,图6描绘了vc映射的示例。
逆向整形
在解码器中,给定等式(13)的值,可以如下确定逆向量化器或整形函数(140):
对于每个经解码的码字
换句话说,对于量化域中的给定码字通过以下操作来构造对应的估计的EDR码字首先对具有量化值的所有像素进行分组,找到对应的EDR码字,并然后对所有收集的EDR码字取平均。从等式(16),后向查找表可以被构造,并且被以数据存储或者例如作为元数据(119)的一部分发送到解码器。
给定图6中描绘的数据,图7描绘了映射或逆向整形(140)的示例。
在实施例中,可以使用元数据(119,127)将由关系定义的映射发送到解码器。这样的方法就位率开销来说可能太昂贵。例如,对于8位数据,查找表可以包括每次存在场景改变时将发送的255个条目。在其它实施例中,可以将逆向映射转化为分段多项式近似。这样的多项式通常可以包括一阶多项式和二阶多项式,尽管也可以使用更高阶的多项式或B样条。对于某一层l(l=0,1,…,L-1)近似LUT的多项式的数量可以根据可用带宽和处理复杂性而变化。在实施例中,基本层使用多达8个段,而增强层使用单个段。
表3描绘了根据实施例的使用二阶多项式来近似解码器LUT表的示例算法。
表3—使用2d阶多项式的LUT近似
如表3中所描绘的,在实施例中,近似过程的输入包括:(比如说,使用等式(16)计算的)原始查找表、LUT中的值与通过多项式近似产生的那些值之间的可接受的误差容限、可用码字的数量、以及其第一码字值(参见等式(1))。输出可以包括每个多项式的端点(也被称为枢轴点)以及多项式系数。
从第一枢轴点开始,该算法试图不失一般性地使用二次多项式来拟合可用码字的最大可能范围。可以使用任何已知的多项式拟合算法,诸如均方误差多项式拟合等。
当计算的最大误差超过输入容限时,则存储最优多项式的参数,并且开始搜索新的多项式,直到整个LUT表被映射为止。
在一些实施例中,可以用于近似LUT的多项式的数量可以被约束为固定值,比如说八个。在该情况下,可以将更高的误差容限融合到算法中。
表3的方法也可以被容易地修改以适应其它近似函数,诸如更高阶的多项式、B样条、或近似函数的组合。
感知均匀的颜色空间中的编码
视频信号通常在熟悉的RGB颜色空间中被呈现;然而,大多数视频压缩标准(诸如MPEG-2、H.264(AVC)、H.265(HEVC)等)已被优化以在对立的颜色空间(诸如YCbCr或YUV)中进行操作。这些颜色空间对于对8-10位标准动态范围(SDR)视频进行编码并发送是足够的,然而,从每一像素的位数要求的观点来讲,当对EDR视频进行编码并发送时,它们可能不是最高效的。例如,在过去,Lu’v’和Log(L)u’v’颜色空间也已被建议。
如发明人所意识到的,感知均匀空间中的信号的编码可能得益于u’和v’色度数据在被视频编解码器处理之前的附加处理。例如,在实施例中,在编码器中,这样的处理可以被作为信号整形过程(110)的一部分对输入信号(102)执行。
白点转化
在实施例中,从线性XYZ到Luma u’v’颜色空间的转换可以包括以下步骤:
a)定义白点(例如,D65)的坐标
b)针对Luma=f(Y)进行求解,以及
c)从X、Y和Z,针对u’和v’进行求解
如本文中所使用的,函数f(Y)表示任何明度相关的函数,诸如L(或L’)、log(L)等。在优选实施例中,f(Y)可以表示如在‘212申请中所描述的感知量化(PQ)映射函数。
在实施例中,白点可以被定义为具有u’坐标和v’坐标的D65(6500K):
Du=d65u=0.1978300066428;
Dv=d65v=0.4683199949388;
在实施例中,可以如下导出u’和v’:
如果(X+15Y+3Z)≠0,则
并且如果(X+15Y+3Z)=0,则
u’=Du (17c)
v’=Dv (17d)
逆向操作包括:
a)定义白点(例如,D65)的坐标
b)针对Y=f-1(Luma)进行求解
c)从u’和v’,针对X和Z进行求解
例如,在使用根据‘212申请的感知量化函数的实施例中,可以应用对应的逆向PQ映射来产生Y个像素值。
在实施例中,可以如下导出X和Z:
如果v’≠0,则
并且如果v’=0,则X=Z=Y。 (18c)
图8A描绘了u’v’色度空间中的白点(805)(例如,D65)的传统映射。如图8A中所描绘的,u’和v’色度值的范围对于u’近似为(0,0.623),对于v’近似为(0,0.587)。如图8A中所描绘的,D65白点在u’v’信号表示中不居中。这可能在对色度分量进行子采样和上采样以在原始的4:4:4颜色格式与在视频编码中通常使用的4:2:0或4:2:2颜色格式之间转化之后导致颜色偏移。为了缓解这样的颜色偏移,建议将变换函数应用于色度值。在一个实施例中,变换函数将白点近似移位到经转化的u’v’的中心;然而,在可能想要看到色度误差下降的情况下,白点可以被转化为任何其它的颜色值。例如,如果经转化的值u′t和v′t在范围(0,1)中,则可以应用以下映射:
u′t=(u′-Du)a1+b1, (19a)
v′t=(v′-Dv)a2+b2, (19b)
其中,Du和Dv表示所选择的白点的原始的u’坐标和v’坐标,(b1,b2)确定白点在转化的颜色空间中的期望位置的坐标,并且ai(i=1,2)是基于期望的转化点以及u’和v’的最小值和最大值而计算的常数。在一个实施例中,转化参数(例如,a1和a2)对于整个视频序列可以是固定的。在另一个实施例中,可以基于每一个场景或每一个帧来计算转化参数以利用传入(incoming)的内容的色度范围的变化。
图8B描绘了根据示例实施例的白点(805)在经转化的色度空间中的映射。在图8B中,原始的u’和v’色度值被转化使得所选择的点(例如,D65)近似处于经转化的色度空间的中心(0.5,0,5)。例如,如果经转化的值u′t和v′t在(0,1)中,则对于b1=b2=0.5,在一个实施例中,可以应用以下映射:
u′t=(u′-Du)1.175+0.5, (20a)
v′t=(v′-Dv)1.105+0.5, (20b)
其中,Du和Dv表示所选择的白点的u’坐标和v’坐标。该转化将导致色度误差表现为欠饱和,而不是色调偏移。本领域的普通技术人员将意识到,非线性函数也可以被应用于u’和v’色度值来实现相同的转化。这样的非线性函数可以将更高的精度分配给近中性色以进一步降低由于编码和量化而导致的颜色误差的可见性。
减小色度熵
如果u’和v’像素分量被乘以光度的函数,则可以进一步改进色度细节的可见性。例如,在实施例中,可以如下导出经转化的色度值:
u′t=g(Luma)(u′-Du)a1+b1, (21a)
v′t=g(Luma)(v′-Dv)a2+b2 (21b)
其中,g(Luma)表示亮度通道的函数。在实施例中,g(Luma)=Luma。
在解码器中,传入的信号可以被表示为Luma u’tv’t。在许多应用中,该信号在进一步处理之前必须被转换回XYZ、RGB或某一其它的颜色空间。在示例实施例中,从Luma u’tv’t到XYZ的颜色转换过程可以包括以下步骤:
a)取消(undo)亮度编码
Y=f-1(Luma)
b)取消对u’t和v’t值的范围缩放以恢复u’和v’
c)使用等式(18)来还原X和Z
在一些实施例中,可以在任何颜色变换之前将传入的信号的Luma、u’t和v’t分量规范化到(0,1)范围中。在一些实施例中,等式(17)-(21)可以使用查找表、乘法和加法的组合来实现。例如,在实施例中,令
Y=f-1(Luma),
B=3u’,
C=20v’,并且
D=1/(4v’)
表示以Luma、u’和v’作为其输入的三个查找表的输出,然后,从等式(18),可以如下使用四个乘法和两个加法来计算X和Z值:
Z=(Y*D)*(12-B-C),
并且
X=(Y*D)*(3*B).
例如,在实施例中,对于10位编码的信号,每个LUT可以具有1024个条目,每个条目对于目标应用处于足够高的精度(例如,32位)。
图9描绘了根据本发明的实施例的编码和解码管线的示例。输入信号(902)可以为RGB 4:4:4或任何其它合适的颜色格式。在步骤(910)中,例如通过对亮度值使用感知量化(PQ)映射并且对色度值使用等式(17),信号(902)被转化为感知Luma u’v’格式。在步骤(915)中,应用例如如等式(19)-(21)中所描绘的变换以将原始的u’v’色度值转化为经转化的色度值u’t和v’t,以使得白点被近似放置在经转化的色度空间的中心处。经颜色变换和转化的Luma u’tv’t4:4:4信号(例如,917)可以在被视频编码器(920)编码之前被颜色子采样(未示出)为4:2:0或4:2:2格式。视频编码器(920)可以包括如前所述的信号整形(110)和层分解(115)过程。在接收器上,视频解码器(930)产生解码的信号(932)。视频解码器(930)可以包括信号逆向整形和层合成器(140)。在可选的颜色上采样(例如,从4:2:0到4:4:4)之后,反向色度转化步骤(935)可以通过使(915)中的转化操作反向来将Luma u’tv’t信号(932)转化回Luma u’v’信号(937)。最后,可以将Luma u’v’信号(937)转化为RGB或其它适当的颜色空间中的输出信号(942)以用于显示或进一步的处理。
感知量化的IPT颜色空间中的编码
白点转化也可以被应用于其它颜色空间,诸如IPT颜色空间或IPT-PQ颜色空间,表现为理想地适合于具有增强或高动态范围的视频信号的编码的感知量化的颜色空间。IPT-PQ颜色空间在其全部内容通过引用并入本文的、R.Atkins等人的、标题为“Displaymanagement for high dynamic range video”的、2014年2月13日提交的PCT申请PCT/US2014/016304中首次被描述。
如其全部内容通过引用并入本文的、Proc.6th Color Imaging Conference:ColorScience,Systems,and Applications,IS&T,Scottsdale,Arizona,Nov.1998,pp.8-13中的、F.Ebner和M.D.Fairchild的“Development and testing of a color space(ipt)withimproved hue uniformity”(将被称为Ebner论文)中所描述的IPT颜色空间是人类视觉系统中的锥体之间的颜色差异的模型。在这个意义上,它像YCbCr或CIE-Lab颜色空间;然而,在一些科学研究中已表明比这些空间更好地模仿人类视觉处理。像CIE-Lab那样,IPT是对于某一参考亮度的规范化空间。在实施例中,规范化可以基于目标显示器的最大亮度。
如本文中所使用的术语“PQ”指的是感知量化。人类视觉系统以非常非线性的方式对增加的光水平进行响应。人类看见刺激的能力受该刺激的亮度、该刺激的大小、构成该刺激的空间频率、以及眼睛在一个人观看该刺激的特定时刻适应的亮度水平影响。在优选实施例中,感知量化器函数将线性的输入灰度水平映射到与人类视觉系统中的对比灵敏度阈值更好地匹配的输出灰度水平。‘212申请中描述了PQ映射函数的示例,在该申请中,给定固定的刺激大小,对于每一个亮度水平(即,刺激水平),根据最灵敏的适应水平和最灵敏的空间频率(根据HVS模型)来选择该亮度水平处的最小可见对比步长。与传统的表示物理阴极射线管(CRT)设备的响应曲线、并且巧合地可能具有与人类视觉系统响应的方式非常粗略的相似性的伽玛曲线相比,如‘212申请所确定的PQ曲线使用相对简单的函数模型来模拟人类视觉系统的真实视觉响应。
表1描述了用于在显示器的一个点处将数字视频码值转换为绝对线性亮度水平的感知曲线EOTF的计算。还包括用于将绝对线性亮度转换为数字码值的逆向OETF计算。
表1
示例性等式定义
D=感知曲线数字码值,SDI-法定无符号整数,10或12位
b=数字信号表示中的每一分量的位数,10或12
V=规范化的感知曲线信号值,0≤V≤1
Y=规范化的亮度值,0≤Y≤1
L=绝对亮度值,0≤L≤10,000cd/m2
示例性EOTF解码等式:
示例性OETF编码等式:
D=INT(1015·V·2b-10)+4·2b-10 (t3)
示例性常数:
注释:
1.运算符INT对于0至0.4999…的范围中的小数部分返回值0,而对于0.5至0.9999…的范围中的小数部分返回值+1,即,它对大于0.5的小数进行上舍入。
2.所有常数被定义为12位有理数的整数倍以避免四舍五入问题。
3.R、G或B信号分量将以与上述Y信号分量相同的方式计算。
将信号转换到IPT-PQ颜色空间可以包括以下步骤:
a)将信号从输入的颜色空间(例如,RGB或YCbCr)转换到XYZ
b)将信号如下从XYZ转换到IPT-PQ:
a.将3×3XYZ应用于LMS矩阵以将信号从XYZ转换到LMS
b.将LMS信号的每个颜色分量转换为感知量化的LMS信号(L’M’S’或LMS-PQ)(例如,通过应用等式(t2))
c.将3×3LMS应用于IPT矩阵以将LMS-PQ信号转换到IPT-PQ颜色空间
3×3XYZ到LMS和L’M’S’(或LMS-PQ)到IPT转换度量的示例可以在Ebner论文中找到。假定IPT-PQ信号的色度分量(例如,P’和T’)在范围(-0.5,0.5)中,则可以加上偏置(bias)α(例如,α=0.5),以使得色度分量的范围基本上在范围(0,1)内,例如:
P′=P′+a (22a)
T′=T′+a (22b)
逆向颜色操作可以包括以下步骤:
a)减去被加到色度分量的任何偏置值
b)将3×3I’P’T’应用于LMS转换矩阵以从IPT-PQ转换到LMS-PQ
c)应用逆向PQ函数以从LMS-PQ转换到LMS(例如,通过使用等式(t1))
d)将3×3LMS应用于XYZ变换以从LMS转换到XRZ,以及
e)从XYZ转换到选择的设备相关的颜色空间(例如,RGB或YCbCr)。
在实际中,可以使用预先计算的1-D查找表(LUT)来执行编码和/或解码期间的颜色变换步骤。
减小色度熵
如前所述,如果P’和T’像素分量被乘以光度(例如,I’)的函数,则可以进一步改进色度细节的可见性。例如,在实施例中,可以如下导出转化的色度值:
P′t=g(I′)(P′-a)+a, (23a)
T′t=g(I′)(T′-a)+a, (23b)
其中,g(I’)表示亮度通道(I’)的线性或非线性函数。在实施例中,g(I’)=I’。
示例计算机系统实现
本发明的实施例可以利用以下来实现:计算机系统、在电子电路系统和组件中配置的系统、集成电路(IC)器件(诸如微控制器)、现场可编程门阵列(FPGA)、或另一个可配置的或可编程的逻辑器件(PLD)、离散时间或数字信号处理器(DSP)、专用IC(ASIC)、和/或包括这样的系统、器件或组件中的一个或多个的装置。计算机和/或IC可以执行、控制、或执行与用于具有增强动态范围(EDR)的视频图像的分层编码的自适应整形技术(诸如本文中所描述的那些)相关的指令。计算机和/或IC可以计算与本文中所描述的自适应整形过程相关的各种参数或值中的任何一个。图像和视频实施例可以以硬件、软件、固件和其各种组合来实现。
本发明的某些实现包括执行使处理器执行本发明的方法的软件指令的计算机处理器。例如,显示器、编码器、机顶盒、转码器等中的一个或多个处理器可以实现与用于具有增强动态范围(EDR)的视频图像的分层编码的自适应整形技术相关的方法,如上所述通过执行可供处理器访问的程序存储器中的软件指令。还可以以程序产品的形式来提供本发明。程序产品可以包括携载计算机可读信号集的任何介质,该计算机可读信号集包括当被数据处理器执行时使数据处理器执行本发明的方法的指令。根据本发明的程序产品可以为多种多样的形式中的任何一种。程序产品可以包括例如物理介质,诸如磁性数据存储介质(包括软盘、硬盘驱动器)、光学数据存储介质(包括CD ROM、DVD)、电子数据存储介质(包括ROM、闪速RAM)等。程序产品上的计算机可读信号可选地可以被压缩或加密。
在组件(例如,软件模块、处理器、组装件、器件、电路等)在以上被提到的情况下,除非另有指示,否则对该组件的论述(包括对“部件(means)”的论述)应被解释为包括作为该组件的等同物的、执行所描述的组件的功能(例如,在功能上等同)的任何组件,包括在结构上不等同于所公开的结构的、执行本发明的示出的示例实施例中的功能的组件。
等同、扩展、替代和其它
如此描述了与用于具有增强动态范围(EDR)的视频图像的分层编码的自适应整形技术相关的示例实施例。在前面的说明书中,参照在不同实现之间可以有所变化的大量的具体细节描述了本发明的实施例。因此,本发明是什么、申请人意图本发明是什么的唯一的且排他的指示是本申请发布的特定形式的一组权利要求,这样的权利要求以该特定形式发布,包括任何后续修正。在本文中对于这样的权利要求中所包含的术语明确阐述的任何定义应决定这样的术语在权利要求中所使用的意义。因此,在权利要求中没有明确记载的限制、元素、性质、特征、优点或属性均不得以任何方式限制这样的权利要求的范围。说明书和附图因此要在例示性、而非限制性的意义上被看待。

Claims (8)

1.一种用于对与第一颜色空间对应的颜色格式的输入信号进行视频编码的方法,所述输入信号与预定义的白点相关联,所述方法包括:
将所述输入信号转化到与所述第一颜色空间不同的感知量化的颜色空间,所述转化的输入信号包括亮度值(Luma)和色度值(u’,v’),所述色度值定义色度空间;
确定所述色度空间中的与所述预定义的白点对应的色度坐标(Du,Dv);
将色度转化函数应用于所述色度空间以将所述色度空间转化为转化的色度空间,其中,所述色度转化函数被配置为将所述白点移位至所述转化的色度空间中的坐标的预定集合,其中,所述坐标的预定集合:基本上对应于所述色度值(u’t,v’t)的转化范围的中心,或者被选择为期望色度误差下降的颜色值;以及
对所述转化的色度空间中的所述输入信号的色度值和所述输入信号的转化的亮度值进行编码以产生编码的位流。
2.根据权利要求1所述的方法,其中,感知量化的颜色空间包括感知量化的亮度分量(Luma)以及u’和v’色度分量。
3.根据权利要求1所述的方法,其中,所述色度转化函数包括计算:
Ct=(C-Dc)a+b,
其中,对于色度分量,C表示输入的色度值,Ct表示转化的色度值,DC表示确定的与所述色度分量对应的白点色度坐标值,α为常数,并且b是白点坐标的预定集合的坐标值。
4.根据权利要求3所述的方法,其中,b近似等于0.5,并且α被定义为在1.0与1.5之间。
5.根据权利要求1所述的方法,其中,所述色度转化函数包括计算:
Ct=g(Luma)(C-Dc)a+b,
其中,对于色度分量,C表示输入的色度值,Ct表示转化的色度值,DC表示确定的与所述色度分量对应的白点色度坐标值,g(Luma)表示转化的输入信号的亮度分量的函数,α为常数,并且b是白点坐标的预定集合的坐标值。
6.根据权利要求1所述的方法,还包括在编码步骤之前对所述输入信号在转化的色度空间中的色度分量进行颜色子采样。
7.根据权利要求1所述的方法,其中,所述白点的坐标的预定集合近似处于所述转化的色度空间的中心。
8.根据权利要求1所述的方法,其中,所述色度转化函数包括计算:
Ct=g(I)(C-a)+a,
其中,对于色度分量,C表示输入的色度值,Ct表示转化的色度值,g(I)表示转化的输入信号的亮度分量的函数,并且α为常数,其中,C包括信号在感知量化的IPT颜色空间(IPT-PQ)中的色度分量,并且I包括信号在感知量化的IPT颜色空间中的亮度分量。
CN201611156282.XA 2013-06-17 2014-06-16 用于增强动态范围信号的分层编码的自适应整形的方法 Active CN106488246B (zh)

Applications Claiming Priority (8)

Application Number Priority Date Filing Date Title
US201361836044P 2013-06-17 2013-06-17
US61/836,044 2013-06-17
US201461951914P 2014-03-12 2014-03-12
US61/951,914 2014-03-12
US201462002631P 2014-05-23 2014-05-23
US62/002,631 2014-05-23
CN201480034679.4A CN105324997B (zh) 2013-06-17 2014-06-16 用于增强动态范围信号的分层编码的自适应整形
PCT/US2014/042583 WO2014204865A1 (en) 2013-06-17 2014-06-16 Adaptive reshaping for layered coding of enhanced dynamic range signals

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201480034679.4A Division CN105324997B (zh) 2013-06-17 2014-06-16 用于增强动态范围信号的分层编码的自适应整形

Publications (2)

Publication Number Publication Date
CN106488246A true CN106488246A (zh) 2017-03-08
CN106488246B CN106488246B (zh) 2019-06-11

Family

ID=51134441

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201480034679.4A Active CN105324997B (zh) 2013-06-17 2014-06-16 用于增强动态范围信号的分层编码的自适应整形
CN201611156282.XA Active CN106488246B (zh) 2013-06-17 2014-06-16 用于增强动态范围信号的分层编码的自适应整形的方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201480034679.4A Active CN105324997B (zh) 2013-06-17 2014-06-16 用于增强动态范围信号的分层编码的自适应整形

Country Status (6)

Country Link
US (2) US9584811B2 (zh)
EP (1) EP3011741B1 (zh)
JP (3) JP6038360B2 (zh)
CN (2) CN105324997B (zh)
HK (1) HK1217393A1 (zh)
WO (1) WO2014204865A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110099194A (zh) * 2018-01-31 2019-08-06 辉达公司 使用可变分段查找表改善视频信号的传输
CN111567049A (zh) * 2018-01-11 2020-08-21 高通股份有限公司 用于针对视频编码的相等范围和其它dra参数的信令机制

Families Citing this family (66)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4087247A1 (en) 2014-02-26 2022-11-09 Dolby Laboratories Licensing Corp. Luminance based coding tools for video compression
CN110460744B (zh) * 2014-06-10 2022-03-08 松下知识产权经营株式会社 亮度变换装置和亮度变换方法
CN110675840B (zh) * 2014-06-26 2022-03-25 松下知识产权经营株式会社 显示装置及显示方法
MX360781B (es) * 2014-09-22 2018-11-16 Panasonic Ip Man Co Ltd Método de reproducción y aparato de reproducción.
US9936199B2 (en) 2014-09-26 2018-04-03 Dolby Laboratories Licensing Corporation Encoding and decoding perceptually-quantized video content
EP3035688B1 (en) 2014-12-18 2019-07-31 Dolby Laboratories Licensing Corporation Encoding and decoding of 3d hdr images using a tapestry representation
WO2016120261A1 (en) 2015-01-27 2016-08-04 Thomson Licensing Methods, systems and apparatus for electro-optical and opto-electrical conversion of images and video
CN111654697B (zh) * 2015-01-30 2022-07-19 交互数字Vc控股公司 对彩色画面进行编码和解码的方法和装置
EP3051489A1 (en) * 2015-01-30 2016-08-03 Thomson Licensing A method and apparatus of encoding and decoding a color picture
WO2016120354A1 (en) * 2015-01-30 2016-08-04 Thomson Licensing Method and device for matching colors between color pictures of different dynamic range
JP6834939B2 (ja) * 2015-02-17 2021-02-24 ソニー株式会社 送信装置、送信方法、受信装置および受信方法
CN107409213B (zh) * 2015-03-02 2020-10-30 杜比实验室特许公司 用于高动态范围图像的内容自适应感知量化器
CN112929670A (zh) * 2015-03-10 2021-06-08 苹果公司 自适应色度下采样和色彩空间转换技术
JP6374614B2 (ja) * 2015-03-20 2018-08-15 ドルビー ラボラトリーズ ライセンシング コーポレイション 信号再整形近似
WO2016154336A1 (en) * 2015-03-25 2016-09-29 Dolby Laboratories Licensing Corporation Chroma subsampling and gamut reshaping
US10015491B2 (en) 2015-04-06 2018-07-03 Dolby Laboratories Licensing Corporation In-loop block-based image reshaping in high dynamic range video coding
US20160309154A1 (en) * 2015-04-17 2016-10-20 Qualcomm Incorporated Dynamic range adjustment for high dynamic range and wide color gamut video coding
WO2016172091A1 (en) * 2015-04-22 2016-10-27 Dolby Laboratories Licensing Corporation Signal reshaping and coding in the ipt-pq color space
US10257526B2 (en) * 2015-05-01 2019-04-09 Disney Enterprises, Inc. Perceptual color transformations for wide color gamut video coding
WO2016199409A1 (en) * 2015-06-07 2016-12-15 Sharp Kabushiki Kaisha Systems and methods for optimizing video coding based on a luminance transfer function or video color component values
US10397585B2 (en) * 2015-06-08 2019-08-27 Qualcomm Incorporated Processing high dynamic range and wide color gamut video data for video coding
CN107431822B (zh) 2015-06-09 2019-11-29 华为技术有限公司 图像编解码方法和设备
EP3113495A1 (en) * 2015-06-30 2017-01-04 Thomson Licensing Methods and devices for encoding and decoding a hdr color picture
EP3113496A1 (en) 2015-06-30 2017-01-04 Thomson Licensing Method and device for encoding both a hdr picture and a sdr picture obtained from said hdr picture using color mapping functions
US10701359B2 (en) 2015-06-30 2020-06-30 Dolby Laboratories Licensing Corporation Real-time content-adaptive perceptual quantizer for high dynamic range images
EP3323243B1 (en) 2015-07-16 2022-01-19 Dolby Laboratories Licensing Corporation Signal reshaping and decoding for hdr signals
US10575005B2 (en) 2015-07-22 2020-02-25 Dolby Laboratories Licensing Corporation Video coding and delivery with both spatial and dynamic range scalability
TWI764870B (zh) * 2015-07-28 2022-05-21 法商內數位麥德遜專利控股有限公司 視訊訊號處理裝置及方法
JP6320440B2 (ja) * 2015-08-04 2018-05-09 ドルビー ラボラトリーズ ライセンシング コーポレイション ハイダイナミックレンジ信号のための信号再構成
WO2017030425A1 (ko) * 2015-08-20 2017-02-23 엘지전자 주식회사 방송 신호 송신 장치, 방송 신호 수신 장치, 방송 신호 송신 방법, 및 방송 신호 수신 방법
WO2017053432A1 (en) 2015-09-21 2017-03-30 Vid Scale, Inc. Inverse reshaping for high dynamic range video coding
WO2017053846A1 (en) * 2015-09-23 2017-03-30 Arris Enterprises Llc System and method for reshaping and adaptation of high dynamic range video data
US10778983B2 (en) 2015-09-23 2020-09-15 Dolby Laboratories Licensing Corporation Preserving texture/noise consistency in video codecs
JP6990179B2 (ja) 2015-10-28 2022-01-12 インターデジタル ヴイシー ホールディングス, インコーポレイテッド 共通の情報データセットによって駆動される候補プロセスセットから、ビデオデータに適用されるプロセスを選択するための方法及び装置
US10311558B2 (en) * 2015-11-16 2019-06-04 Dolby Laboratories Licensing Corporation Efficient image processing on content-adaptive PQ signal domain
EP3367657B1 (en) * 2015-12-23 2021-06-02 Huawei Technologies Co., Ltd. Image signal conversion method and apparatus, and terminal device
CN106937121B (zh) * 2015-12-31 2021-12-10 中兴通讯股份有限公司 图像解码和编码方法、解码和编码装置、解码器及编码器
US10165275B2 (en) 2016-01-26 2018-12-25 Dolby Laboratories Licensing Corporation Content-adaptive reshaping for high dynamic range images
US10223774B2 (en) 2016-02-02 2019-03-05 Dolby Laboratories Licensing Corporation Single-pass and multi-pass-based polynomial approximations for reshaping functions
US10032262B2 (en) * 2016-02-02 2018-07-24 Dolby Laboratories Licensing Corporation Block-based content-adaptive reshaping for high dynamic range images
CN108885783B (zh) 2016-03-23 2022-02-15 杜比实验室特许公司 编码和解码可逆制作质量单层视频信号
US10397586B2 (en) 2016-03-30 2019-08-27 Dolby Laboratories Licensing Corporation Chroma reshaping
EP3226563B1 (en) * 2016-03-30 2021-06-23 Dolby Laboratories Licensing Corp. Chroma reshaping
US10542296B2 (en) 2016-05-10 2020-01-21 Dolby Laboratories Licensing Corporation Chroma reshaping of HDR video signals
EP3456047B1 (en) * 2016-05-10 2020-02-26 Dolby Laboratories Licensing Corporation Chroma reshaping of hdr video signals
WO2017201139A1 (en) * 2016-05-19 2017-11-23 Dolby Laboratories Licensing Corporation Chroma reshaping for high dynamic range images
WO2018039665A1 (en) * 2016-08-26 2018-03-01 Dolby Laboratories Licensing Corporation Chroma reshaping based on just noticeable differences
EP3504875B1 (en) * 2016-08-26 2020-06-24 Dolby Laboratories Licensing Corporation Chroma reshaping based on just noticeable differences
ES2967322T3 (es) * 2016-08-30 2024-04-29 Dolby Laboratories Licensing Corp Remodelación en tiempo real de códec monocapa retrocompatible
US10507005B2 (en) * 2016-09-22 2019-12-17 General Electric Company Spectral calibration of spectral computed tomography (CT)
KR102636100B1 (ko) * 2016-12-16 2024-02-13 삼성전자주식회사 데드존에 기초하여 양자화를 수행하는 인코더 및 이를 포함하는 비디오 처리 시스템
US11301972B2 (en) 2017-03-03 2022-04-12 Dolby Laboratories Licensing Corporation Color saturation adjustment in non-uniform color space
CN110770787B (zh) 2017-06-16 2023-04-07 杜比实验室特许公司 高效端到端单层逆向显示管理编码
KR102580314B1 (ko) 2017-06-29 2023-09-19 돌비 레버러토리즈 라이쎈싱 코오포레이션 통합된 이미지 정형 및 비디오 코딩
CN110999301B (zh) 2017-08-15 2023-03-28 杜比实验室特许公司 位深度高效图像处理
US10609372B2 (en) 2017-09-29 2020-03-31 Dolby Laboratories Licensing Corporation Up-conversion to content adaptive perceptual quantization video signals
MX2020008499A (es) * 2018-02-14 2020-09-25 Dolby Laboratories Licensing Corp Reconfiguracion de imagenes en codificacion de video usando la optimizacion de tasa-distorsion.
UY38111A (es) * 2018-02-28 2019-10-01 Dolby Laboratories Licensing Corp Codificador lineal para el procesamiento de imágenes o video
US10757428B2 (en) 2018-10-10 2020-08-25 Apple Inc. Luma and chroma reshaping of HDR video encoding
US10484784B1 (en) 2018-10-19 2019-11-19 xMEMS Labs, Inc. Sound producing apparatus
US11405582B2 (en) * 2019-06-28 2022-08-02 Meta Platforms, Inc. Preprocessing of high-dynamic-range video using a hybrid lookup table scheme
US20230039038A1 (en) * 2019-11-27 2023-02-09 Dolby Laboratories Licensing Corporation Rate-control-aware reshaping in hdr imaging
MX2022013191A (es) * 2020-04-22 2023-01-05 Dolby Laboratories Licensing Corp Optimización iterativa de funciones de remodelación en códec de imágenes hdr de una sola capa.
US11516429B2 (en) 2020-04-22 2022-11-29 Grass Valley Limited System and method for image format conversion using 3D lookup table approximation
US11544826B2 (en) * 2021-04-30 2023-01-03 Realnetworks, Inc. Intelligent metadata service for video enhancement
CN115390780B (zh) * 2022-10-28 2023-02-10 广州市保伦电子有限公司 一种拼接屏配对方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050100091A1 (en) * 2003-11-11 2005-05-12 Media Glue Corporation Coded signal separating apparatus, coded signal merging apparatus, coded signal separating and merging system, and methods thereof
CN101282437A (zh) * 2008-04-19 2008-10-08 青岛海信电器股份有限公司 一种解码装置
CN101355634A (zh) * 2008-08-26 2009-01-28 北京中星微电子有限公司 一种调整图像色度的方法和系统
CN102349290A (zh) * 2009-03-10 2012-02-08 杜比实验室特许公司 扩展动态范围和扩展维数图像信号转换

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5313298A (en) 1992-03-05 1994-05-17 Rubin, Bednarek And Associates, Inc. Video companding method and system
US6560285B1 (en) 1998-03-30 2003-05-06 Sarnoff Corporation Region-based information compaction as for digital images
JP2002109523A (ja) 2000-09-28 2002-04-12 Minolta Co Ltd 撮像装置、光学フィルタ群および画像データ変換装置
US7023580B2 (en) * 2001-04-20 2006-04-04 Agilent Technologies, Inc. System and method for digital image tone mapping using an adaptive sigmoidal function based on perceptual preference guidelines
US20030111533A1 (en) 2001-12-19 2003-06-19 Koninklijke Philips Electronics N.V. RGB led based white light control system with quasi-uniform color metric
TW548509B (en) * 2002-11-12 2003-08-21 Novatek Microelectronics Corp Estimation method for white-point offset of the white balance point
JP2005037996A (ja) * 2003-07-15 2005-02-10 Matsushita Electric Ind Co Ltd 画像処理装置および方法
JP2006071332A (ja) 2004-08-31 2006-03-16 Fuji Photo Film Co Ltd 演色性評価方法及びその装置並びにこの演色性評価方法で評価して製造した発光装置
ES2551561T3 (es) * 2006-01-23 2015-11-19 MAX-PLANCK-Gesellschaft zur Förderung der Wissenschaften e.V. Codecs de alto rango dinámico
US8493514B2 (en) 2007-07-16 2013-07-23 Lg Electronics Inc. Apparatus for controlling color temperature
US8019150B2 (en) 2007-10-11 2011-09-13 Kwe International, Inc. Color quantization based on desired upper bound for relative quantization step
US8446961B2 (en) * 2008-07-10 2013-05-21 Intel Corporation Color gamut scalability techniques
CN102388612B (zh) * 2009-03-13 2014-10-08 杜比实验室特许公司 高动态范围、可视动态范围和宽色域视频的分层压缩
US8390642B2 (en) * 2009-04-30 2013-03-05 Hewlett-Packard Development Company, L.P. System and method for color space setting adjustment
JP5337269B2 (ja) 2010-04-27 2013-11-06 東京エレクトロン株式会社 アモルファスシリコン膜の成膜方法および成膜装置
TWI479898B (zh) 2010-08-25 2015-04-01 Dolby Lab Licensing Corp 擴展影像動態範圍
JP2012108707A (ja) 2010-11-17 2012-06-07 Toyota Motor Corp 制御装置
KR20120091578A (ko) * 2011-02-09 2012-08-20 삼성전자주식회사 영상의 밝기 변환 방법 및 장치
JP6009538B2 (ja) 2011-04-28 2016-10-19 コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. Hdr画像を符号化及び復号するための装置及び方法
JP2013046095A (ja) 2011-08-22 2013-03-04 Canon Inc 通信装置
WO2013039730A2 (en) * 2011-09-15 2013-03-21 Dolby Laboratories Licensing Corporation Method and system for backward compatible, extended dynamic range encoding of video
US11640656B2 (en) * 2011-09-27 2023-05-02 Koninklijke Philips N.V. Apparatus and method for dynamic range transforming of images
TWI575933B (zh) 2011-11-04 2017-03-21 杜比實驗室特許公司 階層式視覺動態範圍編碼中之層分解技術
ES2727965T3 (es) 2011-12-06 2019-10-21 Dolby Laboratories Licensing Corp Dispositivo y método para mejorar el intercambio de datos de imágenes basado en no linealidad de luminancia perceptual a través de diferentes capacidades de visualización
JP5511882B2 (ja) 2012-04-19 2014-06-04 ギガフォトン株式会社 極端紫外光源装置
KR102157032B1 (ko) 2013-02-21 2020-09-18 돌비 레버러토리즈 라이쎈싱 코오포레이션 고 동적 범위 비디오에 대한 디스플레이 관리
CN105052143B (zh) 2013-03-26 2018-04-20 杜比实验室特许公司 对多层vdr译码中的感知量化的视频内容进行编码

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050100091A1 (en) * 2003-11-11 2005-05-12 Media Glue Corporation Coded signal separating apparatus, coded signal merging apparatus, coded signal separating and merging system, and methods thereof
CN101282437A (zh) * 2008-04-19 2008-10-08 青岛海信电器股份有限公司 一种解码装置
CN101355634A (zh) * 2008-08-26 2009-01-28 北京中星微电子有限公司 一种调整图像色度的方法和系统
CN102349290A (zh) * 2009-03-10 2012-02-08 杜比实验室特许公司 扩展动态范围和扩展维数图像信号转换

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111567049A (zh) * 2018-01-11 2020-08-21 高通股份有限公司 用于针对视频编码的相等范围和其它dra参数的信令机制
CN111567049B (zh) * 2018-01-11 2022-04-29 高通股份有限公司 用于针对视频编码的相等范围和其它dra参数的信令机制
CN110099194A (zh) * 2018-01-31 2019-08-06 辉达公司 使用可变分段查找表改善视频信号的传输
US10880531B2 (en) 2018-01-31 2020-12-29 Nvidia Corporation Transfer of video signals using variable segmented lookup tables

Also Published As

Publication number Publication date
JP6038360B2 (ja) 2016-12-07
EP3011741B1 (en) 2018-03-07
CN105324997B (zh) 2018-06-29
WO2014204865A1 (en) 2014-12-24
JP2017022737A (ja) 2017-01-26
CN106488246B (zh) 2019-06-11
JP2016529741A (ja) 2016-09-23
US20170085881A1 (en) 2017-03-23
CN105324997A (zh) 2016-02-10
US9584811B2 (en) 2017-02-28
US20160134872A1 (en) 2016-05-12
EP3011741A1 (en) 2016-04-27
JP2017079471A (ja) 2017-04-27
US9716887B2 (en) 2017-07-25
JP6312775B2 (ja) 2018-04-18
HK1217393A1 (zh) 2017-01-06
JP6181259B2 (ja) 2017-08-16

Similar Documents

Publication Publication Date Title
CN105324997B (zh) 用于增强动态范围信号的分层编码的自适应整形
JP7114653B2 (ja) 高ダイナミックレンジおよび広色域シーケンスを符号化するシステム
US9936199B2 (en) Encoding and decoding perceptually-quantized video content
US11153589B2 (en) High dynamic range adaptation operations at a video decoder
US20240048739A1 (en) Adaptive perceptual mapping and signaling for video coding
JP2018530282A (ja) 高ダイナミックレンジおよび広色域シーケンスの再形成および符号化のためのシステム
Mai et al. Visually favorable tone-mapping with high compression performance in bit-depth scalable video coding
EP3314892A1 (en) Encoding and decoding of pictures in a video
EP3308541A1 (en) System for coding high dynamic range and wide color gamut sequences
EP3272120A1 (en) Adaptive perceptual mapping and signaling for video coding

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant