CN108513134B - 根据解码后的图像数据重建图像数据的方法和设备 - Google Patents

根据解码后的图像数据重建图像数据的方法和设备 Download PDF

Info

Publication number
CN108513134B
CN108513134B CN201711360544.9A CN201711360544A CN108513134B CN 108513134 B CN108513134 B CN 108513134B CN 201711360544 A CN201711360544 A CN 201711360544A CN 108513134 B CN108513134 B CN 108513134B
Authority
CN
China
Prior art keywords
image data
parameters
image
bitstream
decoded
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711360544.9A
Other languages
English (en)
Other versions
CN108513134A (zh
Inventor
皮埃尔·安德里翁
大卫·图泽
尼古拉·卡拉梅利
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
InterDigital VC Holdings Inc
Original Assignee
InterDigital VC Holdings Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from EP17305212.7A external-priority patent/EP3367684A1/en
Application filed by InterDigital VC Holdings Inc filed Critical InterDigital VC Holdings Inc
Publication of CN108513134A publication Critical patent/CN108513134A/zh
Application granted granted Critical
Publication of CN108513134B publication Critical patent/CN108513134B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • G06T5/92
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/435Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/50Image enhancement or restoration by the use of more than one image, e.g. averaging, subtraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/20Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/65Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using error resilience
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/98Adaptive-dynamic-range coding [ADRC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/434Disassembling of a multiplex stream, e.g. demultiplexing audio and video streams, extraction of additional data from a video stream; Remultiplexing of multiplex streams; Extraction or processing of SI; Disassembling of packetised elementary stream
    • H04N21/4344Remultiplexing of multiplex streams, e.g. by modifying time stamps or remapping the packet identifiers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs
    • H04N21/4402Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/64Circuits for processing colour signals
    • H04N9/68Circuits for processing colour signals for controlling the amplitude of colour signals, e.g. automatic chroma control circuits
    • H04N9/69Circuits for processing colour signals for controlling the amplitude of colour signals, e.g. automatic chroma control circuits for modifying the colour signals by gamma correction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20172Image enhancement details
    • G06T2207/20208High dynamic range [HDR] image processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration

Abstract

本原理涉及一种用于根据解码后的图像数据
Figure DDA0001509963520000011
和从比特流(101)获得的参数来重建代表原始图像数据(I1)的图像数据(I3)的方法或设备,其中已根据所述原始图像数据(I1)处理所述参数,其特征在于所述方法包括:‑检查(102)所述参数是否丢失、损坏或与向其添加图形或覆层的解码后的图像数据不一致;‑当所述参数中的至少一个参数丢失、损坏或与向其添加图形或覆层的解码后的图像数据不一致时,‑根据指示如何处理所述参数的信息数据(ID,103)来选择(104)恢复模式(RMi);以及‑通过应用所选的恢复模式(RMi)来恢复(105)所述至少一个丢失的、损坏的或不一致的参数,然后考虑所述恢复后的参数(12)重建图像数据(I3)。

Description

根据解码后的图像数据重建图像数据的方法和设备
技术领域
本原理通常涉及根据解码后的图像/视频数据进行图像/视频重建。具体地但非排他地,本原理的技术领域涉及恢复用于根据另一图像重建图像的参数。
背景技术
本部分旨在向读者介绍可能与以下描述和/或要求保护的本原理的各个方面有关的技术的各个方面。这个讨论被认为有助于向读者提供背景信息,以便更好地理解本原理的各个方面。因此,应该理解的是,应当从这个角度来理解这些陈述,而不是将其作为对现有技术的承认。
在下文中,图像数据指特定图像/视频格式中的一个或多个样本阵列(像素值),所述格式规定了与图像(或视频)的像素值相关的所有信息以及可以由显示器和/或任何其他设备用于例如可视化图像(或视频)和/或对图像(或视频)进行解码的所有信息。图像包括通常表示图像的亮度(或亮度)的第一样本阵列形状的第一分量和通常表示图像的色彩(或色度)的其他样本阵列形状的第二和第三分量。或者同样地,相同的信息也可以由一组色彩样本阵列来表示,例如传统的三色RGB表示。
像素值由C个值的向量来表示,其中C是分量的数量。矢量的每个值用定义像素值的最大动态范围的比特数来表示。
标准动态范围图像(SDR图像)是其亮度值由有限比特数(通常为8)表示的图像。这种有限的表示不允许正确呈现小信号变化,特别是在黑暗和明亮的亮度范围内。在大动态范围图像(HDR图像)中,信号表示被扩展成在其整个范围内保持高精度的信号。在HDR图像中,表示亮度级的像素值通常以浮点格式表示(通常每个分量至少10比特,即,浮点型或半浮点型),最流行的格式是openEXR半浮点格式(每个RGB分量16比特,即,每像素48比特),或表示为具有长表示的整数,通常至少16比特。
高效视频编码(HEVC)标准(ITU-T H.265 ITU(10/2014)的电信标准化部门,H系列:视听和多媒体系统、视听服务的基础设施——对运动视频的编码、高效视频编码,建议ITU-T H.265)支持部署具有增强观看体验的新视频业务,诸如超HD广播业务。除了增加的空间分辨率之外,超HD还可以带来比目前部署的标准动态范围(SDR)HD-TV更宽的色域(WCG)和更高的动态范围(HDR)。已经提出了用于对HDR/WCG视频进行表示和编码的不同解决方案(SMPTE 2014,“High Dynamic Range Electro-Optical Transfer Function ofMastering Reference Displays”,或2014年的SMPTE ST 2084,或者Diaz,R.,Blinstein,S.和Qu,S.“Integrating HEVC Video Compression with a High Dynamic Range VideoPipeline”,SMPTE Motion Imaging Journal,Vol.125,Issue 1.2016年2月,第14-21页)。
与解码和呈现设备的SDR向后兼容性是在诸如广播或多播系统等某些视频分配系统中的重要特征。
基于单层编码/解码过程的解决方案可以向后兼容(例如,SDR兼容)并可以利用已有的传统分配网络和服务。
这种基于单层的分配解决方案支持在支持HDR消费电子(CE)设备上进行高质量HDR呈现同时,还提供在支持SDR的CE设备上进行高质量SDR呈现。
这种基于单层的分配解决方案产生编码信号(例如,SDR信号)以及可用于根据解码后的信号(例如,SDR信号)重建另一信号(例如,HDR信号)的相关元数据(每个视频帧或场景几个字节)。
用于重建信号的元数据存储参数值可以是静态的或动态的。静态元数据意味着针对视频(一组图像)和/或程序保持不变的元数据。
静态元数据对于整个视频内容(场景、电影、剪辑...)是有效的,并且可以不依赖于图像内容。他们可以定义例如图像格式或色彩空间、色域。例如,SMPTE ST 2086:2014,“Mastering Display Color Volume Metadata Supporting High Luminance and WideColor Gamut Images”就是这样一种用于制作环境的静态元数据。主控显示器色彩容量(MDCV)SEI(补充增强信息)消息是ST 2086对于H.264/AVC(“用于通用视听服务的高级视频编码”,H系列:视听和多媒体系统,ITU建议ITU-T H.264,电信标准化部门,2012年1月)和HEVC视频编解码器二者的分配特点。
动态元数据是依赖于内容的,即元数据可以随图像/视频内容而改变(例如,针对每个图像或每组图像)。例如,SMPTE ST 2094:2016标准系列“用于色彩容量变换的动态元数据”是在制作环境中使用的动态元数据。由于色彩重新映射信息(CRI)SEI消息,SMPTEST2094-30可以沿着HEVC编码的视频流分配。
其他基于单层的分配解决方案存在于分配网络上,其中显示适应动态元数据与传统视频信号一起被传送。这些基于单层的分配解决方案可以产生HDR 10比特图像数据(例如,将信号表示为如ITU-R BT.2100-0建议“ITU-R BT.2100-0建议,针对用于制作和国际节目交换的大动态范围电视机的图像参数值”中规定的HLG10或PQ10信号的图像数据)和来自输入信号(通常为12或16比特)的关联元数据,使用例如HEVC Main 10配置文件编码方案来对所述HDR 10比特图像数据进行编码,并根据解码后的视频信号和所述关联元数据来重建视频信号。重建后信号的动态范围根据可以取决于目标显示器的特性的关联元数据进行调整。
动态元数据传输在实际的真实制作和分配设施中很难保证,并且有可能由于拼接、叠加层插入、修剪比特流的专业设备、附属公司的流处理以及目前缺乏针对元数据运输贯穿整个后期制作/专业工厂的标准化,丢失或破坏动态元数据。
基于单层的分配解决方案在不存在不同的一堆动态元数据的情况下无法进行工作,其中所述元数据的一部分对于保证成功重建视频信号是关键的。
当动态元数据与添加了图形或覆层的图像不一致时,也会出现类似的问题。例如,当将图形(覆层、OSD、...)插入(添加到)分配链外部的图像时,出现该问题,这是因为当图形被插入(添加到)所述图像时还应用针对所述图像计算的元数据。然后元数据被视为与向其添加图形或覆层的图像不一致,这是由于它们可能不适应于包含图形或覆层的所述图像的部分。
这些问题的特征可能在于当随着时间显示解码后的图像时在图形的固定部分上的图像闪烁,或在于包含用不适当的元数据处理过的图形或覆层的图像部分上的不期望效果(例如,饱和、修剪)(例如,通过针对暗内容生成的元数据处理亮OSD)。
发明内容
以下给出本原理的简要概述,以提供对本原理的一些方面的基本理解。该发明内容并不是本原理的广泛概述,其并非旨在识别本原理的关键或重要要素。以下概述仅以简化形式呈现本原理的一些方面,作为以下提供的更详细描述的序言。
为了弥补现有技术的至少一个缺点,本发明的目的在于提供一种用于根据解码后的图像数据和从比特流获得的参数来重建表示原始图像数据的图像数据的方法和设备,其中已经根据所述原始图像数据处理所述参数。该方法包括:
-检查所述参数是否丢失、损坏或与向其添加图形或覆层的解码后图像数据不一致;
-当所述参数中的至少一个参数丢失、损坏或与向其添加图形或覆层的解码后图像数据不一致时,
-根据指示如何处理所述参数的信息数据来选择恢复模式;以及
-通过应用所选的恢复模式来恢复所述至少一个丢失的、损坏的或不一致的参数,然后考虑所述恢复后的参数来进行所述图像数据的重建。
根据一个实施例,由比特流中的语法元素来显式地发信号通知信息数据。
根据一个实施例,隐式地发信号通知信息数据(ID)。
根据一个实施例,信息数据识别应用于原始图像数据以处理所述参数的处理。
根据一个实施例,当没有从比特流中检索到参数时,认为参数丢失。
根据一个实施例,当满足以下条件中的至少一个时,认为参数是损坏的:
-它的值超过了值的范围;
-所述参数不具有基于其他参数值的相关值。
根据一个实施例,恢复模式是用恢复后的参数替换所有参数,即使只有一部分参数不是损坏的、丢失的或与向其添加图形或覆层的解码后的图像数据不一致。
根据一个实施例,恢复模式是用恢复的参数替换每个丢失的、损坏的或不一致的参数。
根据一个实施例,恢复模式是用先前存储的一组预定参数值的值替换丢失的、损坏的或不一致的参数。
根据一个实施例,根据原始图像数据的至少一个特性、或用于对原始图像数据或要重建的图像数据进行分级的主控显示器的至少一个特性、或重建后图像数据或目标显示器的至少一个特性,来选择恢复模式。
根据其他方面,本原理还涉及一种包括用于实现上述方法的装置的设备以及一种非暂时性处理器可读介质,其中当在计算机上执行该程序时,该程序的程序代码指令执行上述方法的步骤。
附图说明
附图中示出了本原理的示例。附图中:
图1示出了根据本原珲的示例的用于根据解码后的图像
Figure BDA0001509963500000051
来重建表示原始图像I1的图像I3的方法的步骤的图;/>
图2示出了根据本原理的示例的支持内容制作并向支持HDR和SDR的CE显示器进行传送的端对端工作流程;
图3示出了根据本原理的示例的图2的端对端工作流程的变型;
图4示出了根据本原理的另一实施例的图2的端对端工作流程的变型;
图5a示出了感知传递函数的图示;
图5b示出了用于映射的分段曲线的示例;
图5c示出了用于将信号转换回到线性光域的曲线的示例;
图6示出了根据本原理的示例的使用根据解码后的图像数据和从比特流获得的参数来重建图像的方法的另一示例;以及
图7示出了根据本原理的示例的设备的架构的示例;
用相同的附图标记来表示相似或相同的元件。
具体实施方式
将在下文中参考附图更全面地描述本原理,其中附图示出了本原理的示例。然而,本原理可以以许多替代形式来体现,并且不应被解释为限于在此阐述的示例。因此,虽然本原理容许各种修改和替代形式,但是其具体示例在附图中以示例的方式示出,并且将在这里详细描述。然而,应该理解的是,并不意图将本原理限制于所公开的特定形式,相反,本发明覆盖了落入如权利要求所定义的本原理的精神和范围内的所有修改形式、等同形式和替代形式。
这里使用的术语仅仅是为了描述特定的示例,而不是为了限制本发明的原理。如本文所使用的,除非上下文另外明确指出,否则单数形式“a”,“an”和“the”也旨在包括复数形式。将进一步理解的是,当在本说明书中使用时,术语“包含”、“包含了”、“包括”和/或“包括了”指明存在所陈述的特征、整体、步骤、操作、元件和/或组件,但并不排除一个或多个其他特征、整体、步骤、操作、元件、组件和/或其组合的存在或增加。此外,当元件被称为“响应”或“连接”到另一元件时,其可以直接响应或连接到另一元件,或者可以存在中间元件。相反,当元素被称为“直接响应”或“直接连接”到其他元件时,不存在中间元件。如本文所使用的,术语“和/或”包括一个或多个相关所列项目的任何和所有组合,并且可以缩写为“/”。
应该理解,虽然这里可以使用术语第一、第二等来描述各种元件,但是这些元件不应该被这些术语限制。这些术语仅用于区分一个元件和另一元件。例如,第一元件可以被称为第二元件,并且类似地,第二元件可以被称为第一元件,而不偏离本原理的教导。
尽管一部分图在通信路径上包括箭头以示出通信的主要方向,但是应该理解,通信可以以与所描绘的箭头相反的方向发生。
针对框图和操作流程图描述了一些示例,其中每个框表示电路元件、模块或包括用于实现指定逻辑功能的一个或多个可执行指令的代码部分。还应该注意的是,在其他实施方式中,框中记录的功能可以不按照提到的顺序发生。例如,取决于所涉及的功能,连续示出的两个框实际上可以基本上同时执行,或者框有时可以以相反的顺序执行。
此处,对“根据示例”或“在示例中”的引用意味着结合示例描述的特定特征、结构或特性可以被包括在本原理的至少一个实现中。在说明书中各处出现的短语“根据一个示例”或“在示例中”不一定都指的是相同的示例,也不必是与其他示例相互排斥的单独或替代的示例。
在权利要求中出现的附图标记仅是为了说明而对权利要求的范围没有限制作用。
虽然没有明确地描述,但是本实例和变体可以以任何组合或子组合来使用。
在下文中,例如(C1,C2,C3)的大写符号指定第一图像的分量,例如(c1,c2,c3)的小写符号指定另一图像的分量,其中所述另一图像的亮度的动态范围低于第一图像的亮度的动态范围。
图像的亮度的动态范围是所述图像的亮度值的最大值与最小值之间的比值。通常,对于HDR图像,SDR图像的亮度的动态范围是500(100cd/m2相对0.2cd/m2),针对HDR图像是10000(1000cd/m2相对0.1cd/m2)。
下文中,当质数符号是大写符号时,例如
Figure BDA0001509963500000071
的那些质数符号表示第一图像的伽马压缩分量,且当质数符号是小写符号时,例如(y’,u’,v’)的那些质数符号表示第二图像的伽马压缩分量。
本原理被描述用于编码/解码/重建图像,但是,因为依次地对序列图像中的每个图像进行编码/解码/重建,因此将本原理扩展到图像序列(视频)的编码/解码/重建,如下所述。
图1示出根据本原理的示例的用于根据解码后的图像
Figure BDA0001509963500000088
重建表示原始图像I1的图像I3的方法的步骤的图。
在步骤10中,获得一组参数SP以重建图像I3。这些参数是从比特流B获得的参数P,或当至少一个参数P丢失、损坏或与向其添加图形或覆层的解码后的图像
Figure BDA0001509963500000081
不一致时恢复的参数Pr。
在步骤11中,模块M1获得解码后的图像
Figure BDA0001509963500000082
并且在步骤12中,模块M2通过使用该组参数SP来根据解码后的图像/>
Figure BDA0001509963500000083
重建图像I3
从比特流(信号)B或任何其他比特流获得解码后的图像数据
Figure BDA0001509963500000084
并且可能的是所述比特流可以存储在本地存储器或任何其他存储介质上。
在(步骤10的)子步骤101中,模块M3获得重建图像I3所需的参数P。
在(步骤10的)子步骤102中,模块M4检查参数P中的至少一个是否丢失、损坏或与向其添加图形或覆层的解码后的图像
Figure BDA0001509963500000085
不一致。
当没有参数P丢失、损坏或与向其添加图形或覆层的解码后的图像
Figure BDA0001509963500000086
不一致时,参数组SP仅包括参数P。
当参数P中的至少一个丢失、损坏或与向其添加图形或覆层的解码图像
Figure BDA0001509963500000087
不一致时,在(步骤10的)子步骤103中,模块M5获得对已如何处理所述参数加以指示的信息数据ID,在(步骤10的)的子步骤104中,模块M6根据所述信息数据ID选择恢复模式RMi,并在(步骤10的)子步骤105中,模块M7通过应用选择的恢复模式RMi来恢复所述至少一个丢失、损坏或不一致的参数。将至少一个恢复的参数Pr添加到参数组SP中。/>
在步骤12中,然后考虑所述至少一个恢复的参数Pr来重建图像I3
该方法是有利的,因为当基于多个单层的分配解决方案共享用于承载公共参数组的相同语法元素组时以及当所述基于单层的分配解决方案需要不同的恢复模式(处珲)来恢复丢失的、损坏的或不一致的参数时,其允许获得针对基于单层的分配解决方案的参数,从而确保针对所述基于单层的分配解决方案中的每一个成功重建图像I3
当CE设备(通常是机顶盒或播放器)在解码后的图像
Figure BDA0001509963500000091
的顶部插入图形时,该方法也是有利的,这是因为该方法选择特定恢复模式以用适应于解码后的图像/>
Figure BDA0001509963500000092
加上图形(或覆层)的参数来替换不一致的参数,并通过使用来自向其添加图形或覆层的所述解码后的图像/>
Figure BDA0001509963500000093
的所述恢复参数来重建图像I3,从而避免一些闪烁伪影或影响重建画面质量的不期望效果。
参考图1所述的方法可以用于当必须根据解码后的图像重建图像时的各种应用。
图2示出了根据本原理的示例的支持内容制作和向支持HDR和SDR的CE显示器进行传送的端到端工作流程。
该工作流程涉及具有关联元数据的基于单层的分配解决方案,并且示出了使用用于根据解码后的图像数据
Figure BDA0001509963500000094
以及根据图1所示的本原理的示例获得的一组参数SP来重建代表原始图像数据I1的图像I3的方法。
基本上,这种基于单层的分配解决方案包括预处理部分和后处理部分。
在预处理部分处,预处理阶段20分解输出图像I12中的原始图像I1和一组参数SP,且切换步骤24确定原始图像I1或输出图像I12是否被编码在比特流B中(步骤23)。
在步骤23中,可以用任何传统视频编解码器对图像I2进行编码,并且在整个现有传统分配网络中传送比特流B,其中伴随的关联元数据(参数组SP)在特定信道上传送或嵌入在比特流B中。
在一个变体中,具有伴随元数据的比特流B存储在诸如蓝光盘或存储器或机顶盒的寄存器的存储介质上。
在一个变体中,伴随的关联元数据由另一个特定信道或单独的存储介质上的存储库承载。
优选地,用H.265/HEVC编解码器(ITU-T H.265 ITU(10/2014)的电信标准化部门,H系列:视听和多媒体系统、视听服务的基础设施——对运动视频的编码、高效视频编码,建议ITU-T H.265)或H.264/AVC(“通用视听服务的高级视频编码”,H系列:视听与多媒体系统,ITU-T H.264建议,ITU电信标准化部门,2012年1月)来对视频进行编码。
在信息数据ID确定在步骤23中对原始图像I1(有可能表示为分量(C1,U’,V’)或Y′CbCr 4∶2∶0 PQ10或HLG10视频信号)进行编码的情况下,可以用HEVC Main 10配置文件来编码所述原始图像I1
在信息数据ID确定在步骤23中对输出图像I12进行编码的情况下,可以用包括Main10或Main配置文件的任何HEVC配置文件来编码所述输出图像I12,其中可以将所述输出图像I12表示为Y′CbCr4∶2∶0伽马传输特性(标准动态范围)信号。
信息数据ID也可以作为关联元数据传送(步骤23)。在后处理部分处,根据比特流B获得解码后的图像
Figure BDA0001509963500000101
(步骤11),如图1所示地获得一组参数SP(步骤10),且作为预处理阶段20的功能反转的后处理阶段12根据解码后的图像/>
Figure BDA0001509963500000102
和参数组SP来重建图像I3。
这种基于单层的分配解决方案还可以包括可选的格式适应步骤21、22、25、26。
例如,在步骤21(可选)中,原始图像I1的格式可以适应于预处理阶段20的输入的特定格式(C1,U’,V’),且在步骤22(可选)中,输出图像I12的格式(c,u’,v’)也可以适应于在编码之前的特定输出格式。在步骤25中,解码后的图像
Figure BDA0001509963500000103
的格式可以适应于后处理阶段12的输入的特定格式,且在步骤26中,图像I3可以适应于目标装置(例如,机顶盒、连接的TV、支持HDR/SDR的CE设备、蓝光盘播放器)的至少一个特性,和/或当解码后的图像/>
Figure BDA0001509963500000104
和图像I3或原始图像I1表示在不同的色彩空间和/或色域中时,可以使用反转色域映射。
所述格式适应步骤(21、22、25、26)可以包括色彩空间转换和/或色域映射。可以使用常用格式适应处理,诸如RGB到YUV或YUV到RGB转换、BT.709到BT.2020或BT.2020到BT.709、下采样或上采样色度分量等。应注意,公知的YUV色彩空间也指现有技术中公知的YCbCr。ETSI建议,ETSI TS 103 433 V1.1.1(2016-8版)建议的附录E提供了格式适应处理和反转色域映射的示例(附录D)。
所述输入格式适应步骤21还可以包括:通过对原始图像I1应用传递函数,来将原始图像I1的比特深度适应为特定比特深度,例如10比特。例如,可以使用PQ或HLG传输功能(ITU-R BT.2100-0建议)。
更详细地,预处理阶段20包括步骤200-202。
在步骤200中,通过映射原始图像I1的第一分量C1来获得输出图像I12的第一分量c1:
c1=TM(C1)
其中TM是映射函数。映射函数TM可以减小或增加原始图像I1的亮度的动态范围,并且其反转可以增加或减小图像的亮度的动态范围。
在步骤201中,通过根据第一分量c1校正原始图像I1的第二分量和第三分量U′、V′,来导出输出图像I12的第二分量和第三分量u′、v′。
色度分量的校正可以通过调整映射的参数来维持控制。因此,色彩饱和度以及色调受到控制。
根据步骤201的实施例,第二分量U′和第三分量V′被除以缩放函数β0(c1),该函数的值取决于第一分量c1
在数学上,第二分量u′和第三分量v′由下式给出:
Figure BDA0001509963500000111
可选地,在步骤202,可以调整第一分量c1以进一步控制感知的饱和度,如下:
c=c1-max(0,a.u′+b.V′)
其中a和b是参数组SP的两个参数。
该步骤202允许控制输出图像I12的亮度,以保证感知到的输出图像I12的色彩和原始图像I1的色彩之间的色彩匹配。
参数组SP可以包括相对于映射函数TM或其逆ITM、缩放函数β0(c1)的参数。这些参数与动态元数据相关联并且承载在比特流中(例如,比特流B)。参数a和b也可以承载在比特流中。
更详细地,在后处珲部分,在步骤10中,如图1所示,获得一组参数SP。
根据步骤10的实施例,参数组SP由从特定信道或从比特流(包括比特流B)获得的静态/动态元数据所承载,可能存储在存储介质上
在步骤11中,模块M1通过对比特流B进行解码来获得解码后的图像
Figure BDA0001509963500000121
然后将解码后的图像/>
Figure BDA0001509963500000122
用于支持SDR或HDR的CE显示器。
更详细地,后处理阶段12包括步骤120-122。
在可选步骤120中,可以如下调整解码后的图像
Figure BDA0001509963500000123
的第一分量c:
c1=c+max(0,a.u′+b.v′)
其中a和b是参数组SP的两个参数。
在步骤121,通过对第一分量c1进行逆映射,来得到图像I3的第一分量C1:
C1=ITM(c1)
在步骤122,通过根据分量c1对解码后的图像
Figure BDA0001509963500000124
的第二分量和第三分量u′、v′进行逆校正,来导出图像I3的第二分量和第三分量U′、V′。
根据一个实施例,第二分量u′和第三分量v′乘以缩放函数β0(c1),其中缩放函数β0(c1)的值取决于第一分量c1
在数学上,第一分量和第二分量U′、V′由下式给出:
Figure BDA0001509963500000125
根据图2的方法的第一实施例,如图3所示,在预处理部分处,原始图像I1的第一分量C1是从原始图像I1的RGB分量获得的线性光亮度分量L,表示为:
Figure BDA0001509963500000126
且第二分量和第三分量U′、V′是通过对原始图像I1的RGB分量应用使用平方根(接近BT.709OETF)的伪伽马化来导出的:
Figure BDA0001509963500000127
在步骤200中,通过映射所述线性光亮度分量L,来获得输出图像I12的第一分量y1
y1=TM(L)
在步骤201中,通过根据第一分量y1校正第一分量U′和第二分量V′,来导出输出图像I12的第二分量u′和第三分量v′。
在后处理部分处,在步骤121,通过对第一分量c1进行逆映射来获得图像I3的线性光亮度分量L:
L=ITM(y1)
在步骤122中,通过根据第一分量y1对输出图像I12的第二分量和第三分量u′、v′进行逆校正,来导出图像I3的第二分量和第三分量U′、V′。
根据步骤122的实施例,将第二分量u′和第三分量v′乘以缩放函数β0(y1),其中缩放函数β0(y1)的值取决于第一分量y1
在数学上,第一分量和第二分量U′、V′由下式给出:
Figure BDA0001509963500000131
根据图2的方法的第二实施例,如图4所示,在预处理部分处,原始图像I1的第一分量C1是根据原始图像I1的伽玛压缩RGB分量而获得的分量Y′:
Figure BDA0001509963500000132
且通过对原始图像I1的RGB分量应用伽马化得到第二分量和第三分量U′、V′:
Figure BDA0001509963500000133
其中γ可以是伽马因子,优选地等于2.4。
应注意,作为非线性信号的分量Y′与线性光亮度分量L不同。
在步骤200中,通过映射所述分量Y′来得到输出图像I12的第一分量y′1
y′1=TM(Y′)
在步骤121中,通过对第一分量y′1进行逆映射来获得重建后的分量
Figure BDA0001509963500000141
Figure BDA0001509963500000142
其中ITM是映射函数TM的逆函数。
因此,重建后的分量
Figure BDA0001509963500000143
的值属于分量Y′的值的动态范围。
在步骤201中,通过根据第一分量y′1和重建后的分量
Figure BDA0001509963500000144
校正第一分量和第二分量U’、V’,来导出输出图像I12的第二分量和第三分量u′、v′。
该步骤201允许控制输出图像I12的色彩并保证它们与原始图像I1的色彩匹配。
色度分量的校正可以通过调整映射(逆映射)的参数来维持控制。因此,色彩饱和度和色调受到控制。通常,当使用非参数感知传递函数时,这种控制是不可能的。
根据步骤201的一个实施例,第二分量U′和第三分量V′被除以缩放函数β0(y′1),其中缩放函数β0(y′1)的值取决于重建后的分量
Figure BDA0001509963500000145
相对分量y′1的比率:
Figure BDA0001509963500000146
其中Ω是取决于原始图像I1的色彩原色的恒定值(例如,对于BT.2020等于1.3)。
在后处理部分处,在步骤121中,通过对第一分量y′1进行逆映射来获得图像I3的分量
Figure BDA0001509963500000147
Figure BDA0001509963500000148
在步骤122,通过根据第一分量y′1和分量
Figure BDA0001509963500000149
对解码后的图像/>
Figure BDA00015099635000001410
的第二分量和第三分量u′、v′进行逆校正,来导出图像I3的第二和第三分量U’、V’。
根据步骤122的一个实施例,将第二分量u′和第三分量v′乘以缩放函数β0(y′1)。
在数学上,第一分量和第二分量U′、V′由下式给出:
Figure BDA0001509963500000151
映射函数TM基于感知传递函数,其目标是将原始图像I1的分量转换为输出图像I12的分量,从而降低(或增加)其亮度值的动态范围。因此,输出图像I12的分量的值属于比原始图像I1的分量的值更低(或更大)的动态范围。
所述感知传递函数使用有限的控制参数组。
图5a示出了可以用于映射亮度分量的感知传递函数的图示,且可以使用用于映射亮度分量的类似感知传递函数。
该映射由主控显示器峰值亮度参数(在图5a中等于5000cd/m2)来控制。为了更好地控制黑白电平,应用在依赖于内容的黑白电平之间拉伸的信号。然后,使用由三部分构成的分段曲线来映射转换后的信号,如图5b所示。下部和上部是线性的,分别由shadowGain和highlightGain参数确定陡度。中间部分是抛物线,在两个线性部分之间提供平滑桥梁。由midToneWidthAdjFactor参数确定交叉的宽度。
可以例如通过使用JCTVC-W0133中定义的用于承载SMPTE ST2094-20元数据的SEI消息,来传送作为元数据的所有控制映射的参数。
图5c示出了感知传递函数TM(图5a)的逆函数的示例,以示出可以如何基于目标传统显示器最大亮度(例如100cd/m2)来将感知优化视频信号转换回线性光域。
在步骤10(图1)中,获得参数组SP以根据解码后的图像
Figure BDA0001509963500000152
重建图像I3
可以根据从比特流(例如,比特流B)获得的元数据,来获得这些参数。
建议ETSI TS 103 433 V1.1.1第6条,2016-08提供了所述元数据的语法的示例。
描述了建议ETSI TS 103 433 v1.1.1的语法,以便根据SDR视频重建HDR视频,但是该语法可以扩展到根据任何解码后的图像
Figure BDA0001509963500000153
重建任何图像I3
由于根据动态元数据导出的逆映射函数ITM和缩放函数β0(.)取决于第一分量c1,所以后处理(步骤12)对逆映射函数ITM和缩放函数β0(.)进行操作。
根据建议ETSI TS 103 433 V1.1.1,可以根据所谓的基于参数的模式或基于表格的模式来传送所述动态元数据。
基于参数的模式可以对分配工作流程是有利的,其主要目标是提供直接SDR向后兼容服务,其中该服务具有非常低的用于承载动态元数据的附加有效载荷或带宽使用率。基于表格的模式可以对配备有低端终端的工作流程是有利的,或者当需要更高水平的适应来正确表示HDR和SDR流时,基于表格的模式是有利的。
在基于参数的模式中,要传送的动态元数据是代表逆函数ITM的亮度映射参数,即
tmlnputSignalBlackLevelOffset;
tmInputSignalWhiteLevelOffset;
shadowGain;
highlightGain;
midToneWidthAdjFactor;
tmOutputFineTuning参数;
此外,要传送的其他动态元数据是用于定义函数β0(.)的色彩校正参数(saturationGainNum Val、saturationGainX(i)和saturationGainY(i))(ETSI建议ETSITS 103 433 V1.1.1条款6.3.5和6.30.6)。
应注意,参数a和b可以分别承载/隐藏在saturationGain函数参数中,如上所述。
可以使用HEVC色彩容量重建信息(CVRI)用户数据注册的SEI消息来传送这些动态元数据,其中所述消息的语法基于SMPTE ST2094-20规范(建议ETSI TS 103 433 V1.1.1附录A.3)。
典型的动态元数据有效载荷是每场景大约25字节。
在步骤101中,将CVRI SEI消息解析为SEI消息以获得映射参数和色彩校正参数。
在步骤12中,根据获得的映射参数重建(导出)逆映射函数ITM(所谓的lutMapY)(更多细节参见建议ETSI TS 103 433 V1.1.1条款7.2.3.1)。
在步骤12中,还根据所获得的色彩校正参数重建(导出)缩放函数β0(.)(所谓的lutCC)(更多细节参见建议ETSI TS 103 433 V1.1.1条款7.2.3.2)。
在基于表格的模式中,要传送的动态数据是代表逆映射函数ITM的分段线性曲线的枢轴点。例如,动态元数据是指示枢轴点的数量的luminanceMappingNum Val,指示枢轴点的x值的luminanceMappingX以及指示枢轴点的y值的luminanceMappingY(更多细节参见建议ETSI TS 103 433 V1.1.1条款6.2.7和6.3.7)。
此外,要传送的其他动态元数据可以是代表缩放函数β0(.)的分段线性曲线的枢轴点。例如,动态元数据是指示枢轴点的数量的colorCorrectionNum Val,指示枢轴点的x值的colorCorrectionX,指示枢轴点的y值的colorCorrectionY(更多细节参见建议ETSITS 103 433 V1.1.1条款6.2.8和6.3.8)。
可以使用HEVC色彩重映射信息(CRI)SEI消息来传送这些动态元数据,其中所述消息的语法基于SMPTE ST 2094-30规范(建议ETSI TS 103 433 V1.1.1附录A.4)。
典型的有效载荷大约是每个场景160字节。
在步骤102中,解析CRI(色彩再映射信息)SEI消息(如在2016年12月公布的HEVC/H.265版本中所规定的)以获得表示逆映射函数ITM的分段线性曲线的枢轴点和表示缩放函数β0(.)的分段线性曲线的枢轴点以及色度与亮度注入参数a和b。
在步骤12中,根据相对于代表逆映射函数ITM的分段线性曲线的那些枢轴点,导出逆映射函数ITM(更多细节参见建议ETSI TS 103 433 V1.1.1条款7.2.3.3)。
在步骤12中,还根据相对于表示缩放函数β0(.)的分段线性曲线的那些枢轴点,导出缩放函数β0(.)(更多细节参见建议ETSI TS 103 433 V1.1.1条款7.2.3.4)。
请注意,还由后处理阶段使用的静态元数据可以通过SEI消息传送。例如,对基于参数的模式或基于表格的模式的选择可以由如建议ETSI TS 103 433 V1.1.1(条款A.2.2)定义的信息(TSI)用户数据注册的SEI消息(payloadMode)承载。诸如例如色彩原色或最大显示主控显示器亮度的静态元数据由AVC HEVC定义的主控显示器色彩容量(MDCV)SEI消息来传送。
根据步骤103的实施例,通过比特流中的语法元素明确地发信号通知信息数据ID,并且因此通过解析比特流而获得信息数据ID。
例如,所述语法元素是SEI消息的一部分。
根据一个实施例,所述信息数据ID识别应用于原始图像I1以处理参数组SP的处理。
根据该实施例,然后,信息数据ID可以被用于推导如何使用该参数来重建图像I3(步骤12)。
例如,当信息数据ID等于1时,信息数据ID指示已经通过将预处理阶段(步骤20)应用于原始HDR图像I1而获得参数SP,且解码后的图像
Figure BDA0001509963500000181
是SDR图像。
当信息数据ID等于2时,信息数据ID指示已通过将预处理阶段(步骤20)应用于HDR10比特图像(步骤20的输入)而获得所述参数,解码后的图像
Figure BDA0001509963500000182
是HDR10图像且映射函数TM是PQ传递函数。
当信息数据ID等于3时,信息数据ID指示已通过将预处理阶段(步骤20)应用于HDR10图像(步骤20的输入)而获得该参数,解码后的图像
Figure BDA0001509963500000183
是HLG10图像且映射函数TM是对原始图像I1的HLG传递函数。
根据步骤103的实施例,隐式地发信号通知信息数据ID。
例如,HEVC(附录E)或AVC(附录E)的VUI中存在的语法元素transfer-characteristics通常识别要使用的传递函数(映射函数TM)。因为不同的单层分配解决方案使用不同的传递函数(PQ、HLG、...),所以可以使用语法元素transfer-characteristics来隐含地识别要使用的恢复模式。
也可以由在较高的传输层或系统层定义的服务来隐式地发信号通知信息数据ID。
根据另一示例,可以通过解析比特流承载的MDCV SEI消息来获得图像I3的峰值亮度值和色彩空间,且可以从峰值亮度值和色彩空间的特定组合(色彩原色)来推导信息数据ID。
根据步骤102的一个实施例,当参数P不存在于比特流中(从其中检索不到)时,认为参数P丢失。
例如,在参数P由诸如以上所述CVRI或CRI SEI消息的SEI消息承载的情况下,当SEI消息未在比特流中传输时或当解析SEI消息失败时,认为参数P丢失(不存在)。
根据步骤103的实施例,当满足以下条件中的至少一个时,认为参数P是损坏的:
-其值超出确定的值范围(例如,当兼容范围为0至6时,saturation_gain_num_val等于10);
-所述参数不具有基于其他参数值的相干值(例如,saturation_gain_y[i]包含离群值,即远离其他saturation_gain_y[i]值的值;通常saturation_gain[0]直到saturation_gain[4]的值的范围等于0到16,而saturation_gain[1]=255)。
根据该方法的一个实施例,恢复模式RMi将用恢复参数Pr替换全部参数P,即使只有一部分参数P没有损坏、丢失或与向其添加图形或覆层的解码后的图像
Figure BDA0001509963500000191
不一致。
根据该方法的一个实施例,另一恢复模式RMj是用恢复参数Pr替换每个丢失的、损坏的或不一致的参数P。
根据该方法的一个实施例,恢复模式RMi是用先前存储的一组预定参数值的值替换丢失的、损坏的或不一致的参数P。
例如,一组预定参数值可以收集由CRI和/或CVRI SEI消息承载的至少一个元数据的预定值。
例如,可以针对由信息数据ID识别的每个基于单层的分配解决方案确定特定的一组预定参数值。
表1是针对3种不同的基于单层的分配解决方案的特定组预定值的非限制性示例。
Figure BDA0001509963500000192
Figure BDA0001509963500000201
表1
根据表1,根据信息数据ID定义了三组不同的预定值。这些组的预定值针对后处理阶段使用的一些参数定义了恢复值。将其他参数设置为针对不同单层解决方案相同的固定值。
根据步骤104的实施例,根据原始视频(图像I1)的至少一个特性(通常为原始内容或用于对输入图像数据或要重建的图像数据进行分级的主控显示器的峰值亮度),或另一视频的至少一个特性(通常是重建后的图像I3或目标显示器的的峰值亮度)来选择恢复模式RMi。
根据一个实施例,恢复模式RMi将检查是否存在原始视频(I1)或用于对输入图像数据或要重建的图像数据进行分级的主控显示器的特性(例如,如ST2086所限定的特性),并根据所述特性计算至少一个恢复参数。如果输入视频的所述特性不存在且不存在主控显示器的特性,则检查是否存在重建后的图像I3或目标显示器的特性(例如,CTA-861.3中定义的峰值亮度),并根据所述特性计算至少一个恢复参数。如果重建后的图像I3的所述特性不存在且目标显示器的所述特性不存在,则至少一个恢复参数是固定值(例如,由视频标准化委员会或行业论坛所固定,例如1000cd/m2)。
根据非限制性示例,表2提供了由后处理阶段使用的一些参数的恢复值的示例,其依赖于关于输入/输出内容和主控/目标显示器的可用信息的存在。
Figure BDA0001509963500000211
表2
可以根据通过解析MDCV SEI/ST 2086消息(如果存在)而获得的输入/输出视频色彩空间BT.709或BT.2020(输入或输出视频的特性)来设置参数matrix_coefficient_value[i]。恢复模式取决于所述色彩空间。
可以根据通过解析MDCV SEI/ST 2086消息(如果存在)而获得的值来计算参数shadow_gain_control。
例如,从所述MDCV SEI/ST 2086消息获得表示主控显示器的峰值亮度的信息,并且通过下式(恢复模式1)计算参数shadow_gain_control:
shadow_gain_control=Clip(0;255;Floor(rs(hdrDisplayMaxLuminance)x127,5+0,5))
其中
Figure BDA0001509963500000221
且/>
Figure BDA0001509963500000222
很可能的是在服务级别信息或特定工作流程中,hdrDisplayMaxLuminance的值是已知的。当这个特性可用时,这个值也可以被设置为目标(呈现)显示器的峰值亮度。否则(恢复模式2),它被任意设置为默认值,通常为1000cd/m2。该默认值对应于当前大部分HDR市场中当前观察到的参考最大显示器主控亮度。
图6示出了根据本原理示例的使用用于根据解码图像数据
Figure BDA0001509963500000223
和从比特流B获得的一组参数SP来重建图像I3的方法的另一示例。
所述示例旨在至少部分地实现在执行覆层插入和混合机制(例如,机顶盒或UltraHD蓝光播放器)和向决定模块发信号通知/发送已向解码后的图像
Figure BDA0001509963500000224
添加覆层的事件(通常,overlay_present_flag设置为1)的任何(中间)设备中。
当覆层(图形)未被添加到解码后的图像
Figure BDA0001509963500000225
时,获得该组参数SP(步骤10),获得解码后的图像/>
Figure BDA0001509963500000226
(步骤11),并且如图1所述地重建图像I3(步骤12)。
当覆层必须被添加到解码后的图像
Figure BDA0001509963500000227
时,获得解码后的图像/>
Figure BDA0001509963500000228
(步骤11),且在步骤60中,通过将图形(覆层)添加到解码后的图像/>
Figure BDA0001509963500000229
来获得合成图像I’2
然后获得信息数据ID(步骤103),选择恢复模式(步骤104),并应用所选恢复模式RMi(步骤105)以获得恢复参数Pr
然后根据恢复参数Pr和解码后的图像
Figure BDA00015099635000002210
来重建图像I3(步骤12)。
根据一个实施例,通过训练不同方面的大的图像组(明亮、黑暗、具有标志...)来获得参数Pr
可选地(图6中未示出),可以在诸如电视机的远程设备中执行步骤12。在这种情况下,将解码后的图像
Figure BDA00015099635000002211
加上参数P或合成图像I’2加上参数Pr传送到所述电视机。
在图1-6中,模块是功能单元,其可以与可区分的物理单元有关或无关。例如,这些模块或其中一些模块可以集合在一个独特的组件或电路中,或者对软件的功能有贡献。相反,一些模块可能由单独的物理实体组成。使用纯硬件(例如,使用诸如ASIC(专用集成电路)或FPGA(现场可编程门阵列)或VLSI(超大规模集成)的专用硬件)或根据嵌入在设备中的若干集成电子组件或根据硬件和软件组件的混合,来实现与本原理兼容的装置。
图7表示可以被配置为执行结合图1-6所描述的方法的设备70的示例性架构。
设备70包括通过数据和地址总线71链接在一起的以下元件:
-微处理器72(或CPU),其例如是DSP(或数字信号处理器);
-ROM(或只读存储器)73;
-RAM(或随机存取存储器)74;
-用于从应用接收数据以发送的I/O接口75;和
-电池76
根据一个示例,电池76在设备外部。在所提及的每个存储器中,说明书中使用的词语“寄存器”可以对应于小容量区域(一些比特)或非常大的区域(例如,整个程序或接收或解码的大量数据)。ROM 73至少包括程序和参数。ROM 73可以存储根据本原理执行技术的算法和指令。当打开时,CPU 72将程序上载到RAM中并执行相应指令。
RAM 64在寄存器中包括由CPU 72执行并在设备70接通之后上载的程序、寄存器中的输入数据、寄存器中的方法的不同状态中的中间数据以及寄存器中的用于执行所述方法的其他变量。
这里描述的实现方式可以例如实现为方法或过程、装置、软件程序、数据流或信号。即使仅在单一形式的实现方式(例如,仅作为方法或设备讨论)的上下文中讨论,所讨论的特征的实现方式也可以以其他形式(例如程序)实现。装置可以实现为例如适当的硬件、软件和固件。例如,可以在诸如包括计算机、微处理器、集成电路或可编程逻辑器件的处理器(通常被称为处理设备)的装置中执行所述方法。处理器还包括通信设备,诸如例如计算机、手机、便携式/个人数字助理(PDA)以及促进终端用户之间的信息通信的其它设备。
根据一个例子,从源获得输入视频或输入视频的原始图像。例如,所述源属于一个集合,包括:
-本地存储器(73或74),例如视频存储器或RAM(或随机存取存储器)、闪存、ROM(或只读存储器)、硬盘;
-存储接口(75),例如,与大容量存储器、RAM、闪存、ROM、光盘或磁性支撑件的接口;
-通信接口(75),例如,有线接口(例如总线接口、广域网接口、局域网接口)或无线接口(如IEEE 802.11接口或
Figure BDA0001509963500000241
接口);以及
-图像捕获电路(例如,诸如CCD(或电荷耦合器件)或CMOS(或互补金属氧化物半导体)的传感器)。
根据示例,将承载元数据的比特流发送到目的地。例如,这些比特流之一或两者都存储在本地或远程存储器中,例如,视频存储器(74)或RAM(74)、硬盘(73)。在一个变型中,至少一个比特流被发送到存储接口(75)(例如,与大容量存储器、闪速存储器、ROM、光盘或磁性支撑件的接口)和/或经由通信接口(75)传输所述至少一个比特流(例如,点对点链路、通信总线、点对多点链路或广播网络的接口)。
根据其他示例,从源获得承载元数据的比特流。示例性地,从本地存储器(例如,视频存储器(74)、RAM(74)、ROM(73)、闪存(73)或硬盘(73))读取比特流。在一个变型中,比特流是从存储接口(75)(例如,与大容量存储器、RAM、ROM、闪存、光盘或磁性支撑件的接口)接收的和/或经由通信接口(75)(例如,与点对点链路、总线、点对多点链路或广播网络的接口)接收。
根据示例,被配置为执行上述方法的设备70属于包括以下项的组合:
-移动设备;
-通信设备;
-游戏设备;
-平板电脑(或平板计算机);
-笔记本电脑;
-静止图像摄像机;
-视频摄像机;
-编码/解码芯片;
-电视机;
-机顶盒;
-显示器;
-静止图像服务器;和
-视频服务器(例如,广播服务器、视频点播服务器或网络服务器)。
本文描述的各种过程和特征的实现方式可以体现为各种不同的设备或应用。这样的设备的示例包括编码器、解码器、处理来自解码器的输出的后处理器、向编码器提供输入的预处理器、视频编码器、视频解码器、视频编解码器、网络服务器、机顶盒、膝上型电脑、个人计算机、手机、PDA以及用于处理图像或视频或其他通信设备的任何其他设备。应该清楚的是,该设备可以是移动的,甚至可以安装在移动车辆中。
另外,所述方法可以由处理器执行的指令实现,且这样的指令(和/或由实现方式产生的数据值)可以存储在计算机可读存储介质上。计算机可读存储介质可以采取计算机可读程序产品的形式,该程序产品体现在一个或多个计算机可读介质中,并且在计算机可读介质上包含可由计算机执行的计算机可读程序代码。这里使用的计算机可读存储介质被认为是非暂态存储介质,其具有将信息存储其中的固有能力以及从中提供信息检索的固有能力。计算机可读存储介质可以是例如但不限于电子的、磁性的、光学的、电磁的、红外的或半导体的系统、装置或设备,或前述的任何适当组合。应该珲解的是,如本领域普通技术人员容易珲解的,下面提供本发明原珲可以应用的计算机可读存储介质的多个具体示例仅是说明性的而不是详尽的列举:便携式电脑软盘、硬盘、只读存储器(ROM)、可擦可编程只读存储器(EPROM或闪存)、便携式光盘只读存储器(CD-ROM)、光存储设备、磁存储设备或上述器件的任何合适组合。
这些指令可以形成有形地体现在处理器可读介质上的应用程序。
指令可以例如是硬件、固件、软件或其组合的形式。可以在例如操作系统、单独应用或两者组合中找到指令。因此,处理器的特征在于例如被配置为执行处理的设备和包括具有用于执行处理的指令的处理器可读介质的设备(诸如存储设备)。此外,处理器可读介质可以除了指令之外或代替指令来存储由实施方式产生的数据值。
如本领域技术人员显而易见的,实现方式可以产生被格式化以承载例如可存储或传输的信息的各种信号。该信息可以包括例如用于执行方法的指令或由所描述的实现方式中的一个所产生的数据。例如,信号可以被格式化以承载作为数据的用于写入或读取本原理的所描述示例的语法的规则,或者承载作为数据的由本原理的所描述示例写入的实际语法值。这样的信号可以被格式化为例如电磁波(例如,使用频谱的射频部分)或者基带信号。格式化可以包括例如编码数据流和用编码数据流调制载波。信号承载的信息可以是例如模拟或数字信息。如已知的,该信号可以通过各种不同的有线或无线链路传输。该信号可以被存储在处理器可读介质上。
已经描述了许多实现方式。然而,将会理解,可以进行各种修改。例如,可以组合、补充、修改或移除不同实现方式的元素以产生其他实现。另外,普通技术人员将会理解,其他结构和过程可以替代所公开的那些结构和过程,并且所得到的实现方式将以至少基本上相同的方式执行至少基本上相同的功能,以至少实现与所公开的实现方式基本上相同的结果。因此,本申请构思了上述和其他实施方式。

Claims (13)

1.一种用于根据从比特流(101)解码后的图像数据
Figure QLYQS_1
和从比特流(101)获得已根据原始图像数据(I1)处理的参数来重建代表原始图像数据(I1)的图像数据(I3)的方法,其中所述原始图像数据(I1)被编码在所述比特流(101)中,其特征在于所述方法包括:
响应于确定将图形覆盖在解码图像上:
-根据指示如何处理所述参数的信息数据(ID)来选择(104)恢复模式(RMi);
-通过应用所选的恢复模式(RMi)来恢复(105)所述参数,并且
-基于所述解码后的图像数据和恢复的所述参数来重建图像数据,其中至少包括对所述解码后的图像数据的亮度的逆映射和所述解码后的图像数据的色度校正。
2.根据权利要求1所述的方法,其中通过比特流中的语法元素来显式地发信号通知所述信息数据(ID)。
3.根据权利要求1所述的方法,其中隐式地发信号通知所述信息数据(ID)。
4.根据权利要求1至3之一所述的方法,其中所述信息数据(ID)识别对所述原始图像数据(I1)应用何种处理来处理所述参数。
5.根据权利要求1-3之一所述的方法,其中恢复模式是用预先存储的一组预定参数替换所述参数。
6.根据权利要求1-3之一所述的方法,其中,根据原始图像数据或用于对原始图像数据或要重建的图像数据进行分级的主控显示器的至少一个特性,或重建后的图像数据或用于呈现的显示器的至少一个特性,选择恢复模式。
7.一种用于根据从比特流解码后的图像数据以及从所述比特流获得已根据原始图像数据处理的参数来重建代表原始图像数据的图像数据的设备,其中所述原始图像数据被编码在所述比特流中,其特征在于所述设备包括用于执行以下操作的装置:
响应于确定将图形覆盖在解码图像上:
-根据指示如何处理所述参数的信息数据(ID)来选择(104)恢复模式(RMi);
-通过应用所选的恢复模式(RMi)来恢复(105)所述参数,并且
-基于所述解码后的图像数据和恢复的所述参数来重建图像数据,其中至少包括对所述解码后的图像数据的亮度的逆映射和所述解码后的图像数据的色度校正。
8.根据权利要求7所述的设备,其中通过比特流中的语法元素来显式地发信号通知所述信息数据(ID)。
9.根据权利要求7所述的设备,其中隐式地发信号通知所述信息数据(ID)。
10.根据权利要求7至9之一所述的设备,其中所述信息数据(ID)识别对所述原始图像数据(I1)应用何种处理来处理所述参数。
11.根据权利要求7-9之一所述的设备,其中恢复模式是用预先存储的一组预定参数替换所述参数。
12.根据权利要求7-9之一所述的设备,其中,根据原始图像数据或用于对原始图像数据或要重建的图像数据进行分级的主控显示器的至少一个特性,或重建后的图像数据或用于呈现的显示器的至少一个特性,选择恢复模式。
13.一种非暂时性处理器可读介质,当在计算机上执行所述非暂时性处理器可读介质的程序时,所述非暂时性处理器可读介质的程序代码指令执行根据权利要求1-6之一所述的方法的步骤。
CN201711360544.9A 2017-02-24 2017-12-15 根据解码后的图像数据重建图像数据的方法和设备 Active CN108513134B (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
EP17305212.7 2017-02-24
EP17305212.7A EP3367684A1 (en) 2017-02-24 2017-02-24 Method and device for decoding a high-dynamic range image
EP17158481.6 2017-02-28
EP17158481 2017-02-28

Publications (2)

Publication Number Publication Date
CN108513134A CN108513134A (zh) 2018-09-07
CN108513134B true CN108513134B (zh) 2023-05-26

Family

ID=60811990

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201711360544.9A Active CN108513134B (zh) 2017-02-24 2017-12-15 根据解码后的图像数据重建图像数据的方法和设备
CN201880025039.5A Active CN110574376B (zh) 2017-02-24 2018-02-19 用于解码高动态范围图像的方法和设备

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201880025039.5A Active CN110574376B (zh) 2017-02-24 2018-02-19 用于解码高动态范围图像的方法和设备

Country Status (10)

Country Link
US (1) US11257195B2 (zh)
EP (2) EP3367685B1 (zh)
JP (1) JP7086587B2 (zh)
KR (2) KR102458747B1 (zh)
CN (2) CN108513134B (zh)
BR (2) BR102017027195A2 (zh)
CA (2) CA2989134A1 (zh)
MX (2) MX2022003583A (zh)
RU (2) RU2758035C2 (zh)
WO (1) WO2018153800A1 (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11310532B2 (en) 2017-02-24 2022-04-19 Interdigital Vc Holdings, Inc. Method and device for reconstructing image data from decoded image data
CN111434114A (zh) * 2017-12-01 2020-07-17 交互数字Vc控股公司 处理图像
CN109598671A (zh) * 2018-11-29 2019-04-09 北京市商汤科技开发有限公司 图像生成方法、装置、设备及介质
CN111654707B (zh) * 2020-06-03 2022-03-15 福建师范大学福清分校 一种基于俄罗斯方块的信息隐藏方法及终端
CN112188179B (zh) * 2020-08-28 2022-07-08 北京小米移动软件有限公司 图像缩略图显示方法、图像缩略图显示装置及存储介质
CN113592770B (zh) * 2021-06-23 2024-02-23 中国科学院南京地理与湖泊研究所 一种去除水草影响的藻华遥感识别方法
US11606605B1 (en) * 2021-09-30 2023-03-14 Samsung Electronics Co., Ltd. Standard dynamic range (SDR) / hybrid log-gamma (HLG) with high dynamic range (HDR) 10+
CN114936174B (zh) * 2022-06-09 2024-01-30 中国兵器工业计算机应用技术研究所 基于地面无人平台的图像处理与融合计算方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5856973A (en) * 1996-09-10 1999-01-05 Thompson; Kenneth M. Data multiplexing in MPEG server to decoder systems
WO2016120424A1 (en) * 2015-01-30 2016-08-04 Thomson Licensing Method and apparatus for encoding and decoding high dynamic range (hdr) videos
EP3113496A1 (en) * 2015-06-30 2017-01-04 Thomson Licensing Method and device for encoding both a hdr picture and a sdr picture obtained from said hdr picture using color mapping functions

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006279388A (ja) 2005-03-29 2006-10-12 Matsushita Electric Ind Co Ltd 動画像復号化装置および動画像復号化方法
US8406569B2 (en) * 2009-01-19 2013-03-26 Sharp Laboratories Of America, Inc. Methods and systems for enhanced dynamic range images and video from multiple exposures
WO2010151555A1 (en) * 2009-06-24 2010-12-29 Dolby Laboratories Licensing Corporation Method for embedding subtitles and/or graphic overlays in a 3d or multi-view video data
EP2375751A1 (en) * 2010-04-12 2011-10-12 Panasonic Corporation Complexity reduction of edge-detection based spatial interpolation
TWI559779B (zh) 2010-08-25 2016-11-21 杜比實驗室特許公司 擴展影像動態範圍
TWI800092B (zh) 2010-12-03 2023-04-21 美商杜比實驗室特許公司 音頻解碼裝置、音頻解碼方法及音頻編碼方法
CN103339946B (zh) * 2010-12-03 2015-10-07 Lg电子株式会社 用于接收多视图三维广播信号的接收设备和方法
US9075806B2 (en) * 2011-02-22 2015-07-07 Dolby Laboratories Licensing Corporation Alignment and re-association of metadata for media streams within a computing device
US9451274B2 (en) * 2011-04-28 2016-09-20 Koninklijke Philips N.V. Apparatuses and methods for HDR image encoding and decoding
JP2013066075A (ja) * 2011-09-01 2013-04-11 Sony Corp 送信装置、送信方法および受信装置
JP6407717B2 (ja) * 2011-09-27 2018-10-17 コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. 画像のダイナミックレンジ変換のための装置及び方法
WO2014128586A1 (en) * 2013-02-21 2014-08-28 Koninklijke Philips N.V. Improved hdr image encoding and decoding methods and devices
US9648351B2 (en) 2013-10-24 2017-05-09 Dolby Laboratories Licensing Corporation Error control in multi-stream EDR video codec
US9819947B2 (en) * 2014-01-02 2017-11-14 Vid Scale, Inc. Methods, apparatus and systems for scalable video coding with mixed interlace and progressive content
CN106031172B (zh) * 2014-02-25 2019-08-20 苹果公司 用于视频编码和解码的自适应传递函数
US20150264345A1 (en) * 2014-03-13 2015-09-17 Mitsubishi Electric Research Laboratories, Inc. Method for Coding Videos and Pictures Using Independent Uniform Prediction Mode
RU2667034C2 (ru) * 2014-05-28 2018-09-13 Конинклейке Филипс Н.В. Способы и устройства для кодирования hdr-изображений и способы и устройства для использования таких кодированных изображений
AU2016270443B2 (en) 2015-06-05 2019-01-03 Apple Inc. Rendering and displaying high dynamic range content
WO2017019818A1 (en) 2015-07-28 2017-02-02 Vid Scale, Inc. High dynamic range video coding architectures with multiple operating modes
EP3131284A1 (en) * 2015-08-13 2017-02-15 Thomson Licensing Methods, systems and aparatus for hdr to hdr inverse tone mapping
US10674150B2 (en) * 2015-09-23 2020-06-02 Arris Enterprises Llc System and method for reshaping and adaptation of high dynamic range video data
CN106937121B (zh) 2015-12-31 2021-12-10 中兴通讯股份有限公司 图像解码和编码方法、解码和编码装置、解码器及编码器

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5856973A (en) * 1996-09-10 1999-01-05 Thompson; Kenneth M. Data multiplexing in MPEG server to decoder systems
WO2016120424A1 (en) * 2015-01-30 2016-08-04 Thomson Licensing Method and apparatus for encoding and decoding high dynamic range (hdr) videos
EP3113496A1 (en) * 2015-06-30 2017-01-04 Thomson Licensing Method and device for encoding both a hdr picture and a sdr picture obtained from said hdr picture using color mapping functions

Also Published As

Publication number Publication date
KR20180098117A (ko) 2018-09-03
BR112019017651A2 (pt) 2020-03-31
CN110574376B (zh) 2022-10-21
RU2758035C2 (ru) 2021-10-25
KR20190117686A (ko) 2019-10-16
EP3367685A1 (en) 2018-08-29
EP3586509A1 (en) 2020-01-01
KR102458747B1 (ko) 2022-10-24
CN108513134A (zh) 2018-09-07
CA3054488A1 (en) 2018-08-30
RU2017144024A (ru) 2019-06-17
CA2989134A1 (en) 2018-08-24
JP2018191269A (ja) 2018-11-29
US11257195B2 (en) 2022-02-22
US20200394774A1 (en) 2020-12-17
CN110574376A (zh) 2019-12-13
JP7086587B2 (ja) 2022-06-20
EP3367685B1 (en) 2024-04-24
WO2018153800A1 (en) 2018-08-30
MX2017016554A (es) 2018-11-09
RU2021128023A (ru) 2021-10-28
RU2017144024A3 (zh) 2021-04-19
MX2022003583A (es) 2022-05-26
BR102017027195A2 (pt) 2018-10-30

Similar Documents

Publication Publication Date Title
CN108513134B (zh) 根据解码后的图像数据重建图像数据的方法和设备
JP7340659B2 (ja) 復号された画像データから画像データを再構成する方法および装置
CN111316625B (zh) 用于从第一图像生成第二图像的方法和设备
CN114338947B (zh) 用于色域映射的方法和设备
CN110521198B (zh) 用于重构hdr图像的方法和设备
EP3493150A1 (en) Tone mapping adaptation for saturation control
US10600163B2 (en) Method and device for reconstructing a display adapted HDR image
US11741585B2 (en) Method and device for obtaining a second image from a first image when the dynamic range of the luminance of the first image is greater than the dynamic range of the luminance of the second image
CN112400324A (zh) 用于处理视频信号的方法和装置
WO2019203973A1 (en) Method and device for encoding an image or video with optimized compression efficiency preserving image or video fidelity
WO2019108899A1 (en) Saturation control for high-dynamic range reconstruction
CN111466117A (zh) 处理图像
JP7074461B2 (ja) ディスプレイ適合hdr画像を再構成する方法およびデバイス
KR102369771B1 (ko) 디스플레이 적응형 hdr 이미지를 재구성하기 위한 방법 및 디바이스
CA2986520A1 (en) Method and device for reconstructing a display adapted hdr image
RU2776101C1 (ru) Способ и устройство для восстановления адаптированного к дисплею изображения hdr
US11575944B2 (en) Method and apparatus for encoding an image
EP3528201A1 (en) Method and device for controlling saturation in a hdr image

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
TA01 Transfer of patent application right

Effective date of registration: 20191108

Address after: Delaware, USA

Applicant after: Interactive Digital VC Holdings

Address before: Icelemulino, France

Applicant before: THOMSON LICENSING

TA01 Transfer of patent application right
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant