CN109076244A - 用于产生和处理视频的内容色域体积消息的方法和系统 - Google Patents

用于产生和处理视频的内容色域体积消息的方法和系统 Download PDF

Info

Publication number
CN109076244A
CN109076244A CN201780028212.2A CN201780028212A CN109076244A CN 109076244 A CN109076244 A CN 109076244A CN 201780028212 A CN201780028212 A CN 201780028212A CN 109076244 A CN109076244 A CN 109076244A
Authority
CN
China
Prior art keywords
content
video
pictures
volume
brightness value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201780028212.2A
Other languages
English (en)
Other versions
CN109076244B (zh
Inventor
A·K·瑞玛苏布雷蒙尼安
D·布达伊哲·桑斯利
J·索莱·罗哈斯
D·鲁萨诺夫斯基
M·卡切维奇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of CN109076244A publication Critical patent/CN109076244A/zh
Application granted granted Critical
Publication of CN109076244B publication Critical patent/CN109076244B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明描述用于处理内容色域体积消息的系统、方法和计算机可读媒体。在一些实例中,获得视频数据。所述视频数据可包含从摄像机获得的视频数据、经编码视频数据或经解码视频数据。处理与所述视频数据相关联的内容色域体积信息。所述内容色域体积信息指示所述视频数据的一或多个图片的内容色域体积。举例来说,所述内容色域体积信息包含:与所述一或多个图片的最小亮度相关联的第一亮度值、与所述一或多个图片的最大亮度相关联的第二亮度值和描述所述一或多个图片的色域的一或多个色彩原色的一或多个色度坐标。

Description

用于产生和处理视频的内容色域体积消息的方法和系统
技术领域
本申请案涉及视频译码和压缩。更特定来说,本申请案涉及产生和处理指示视频内容的内容色域体积的消息。
背景技术
许多装置和系统允许处理并输出视频数据以供消耗。数字视频数据包含大量数据以满足消费者和视频提供者的需求。举例来说,视频数据的消费者需要具有最高质量(具有高保真度、分辨率、帧速率等等)的视频。因此,满足此些需求所需的大量视频数据对处理并存储视频数据的通信网络和装置造成负担。
可使用各种视频译码技术来压缩视频数据。根据一或多个视频译码标准执行视频译码。举例来说,视频译码标准包含高效视频译码(HEVC)、高级视频译码(AVC)、活动图片专家组(MPEG)译码等等。视频译码通常使用利用存在于视频图像或序列中的冗余的预测方法(例如,帧间预测、帧内预测等等)。视频译码技术的重要目标为将视频数据压缩成使用较低位速率的形式,同时避免视频质量的降级或使视频质量的降级最小化。随着不断演进的视频服务变得可用,需要具有更佳译码效率的编码技术。
发明内容
在一些实施中,描述用于产生和处理含有描述视频内容的色域体积的信息的消息的技术和系统。举例来说,视频编码装置(或其它传输侧装置)可确定所编码内容的色域体积,且可产生具有描述视频内容的色域体积的内容色域体积信息的内容色域体积消息。客户端侧装置(例如,视频解码装置、视频播放装置、视频显示装置或其它合适的装置)可接收内容色域体积消息,处理内容色域体积信息,且使用内容色域体积信息来以适用于所述装置的方式呈现或显示视频内容。举例来说,具有显示器的装置可映射视频内容以最佳地拟合显示器的色彩特性,所述色彩特性可不同于视频内容的色彩特性。任何合适的装置可使用内容色域体积信息来呈现或显示视频内容,而无需受限于任何特定应用或程序。在一些情况下,色域体积在确定体积的内容的特定处理阶段描述内容的限定体积;内容的后续处理(例如,色彩空间转换、量化、上升采样、降低采样和/或压缩和/或其它处理)可使内容的一或多个样本存在于色域体积外部。
由内容色域体积消息所描述的视频内容的色域体积可包含视频内容的色域以及视频内容所占用的最小亮度和最大亮度。最小亮度和最大亮度为视频内容限于其内的亮度值,且定义视频内容的可能亮度值范围。色域可包含在由最小和最大亮度提供的亮度值范围内的每一亮度值的可能色彩值。在一些实例中,色域可跨亮度值范围恒定。举例来说,最大色域可用于亮度值范围内的所有亮度值。在其它实例中,色域可根据视频内容在范围内的亮度值中的一或多个下的实际可能色彩值而跨亮度值范围发生变化。
在一些实例中,可在图片基础上用信号传送内容色域体积消息。举例来说,内容色域体积消息可包含于经编码视频位流中或与经编码视频位流包含在一起以用于作为位流的部分的每一图片。在另一实例中,内容色域体积消息可包含于经编码视频位流中或与经编码视频位流包含在一起以仅用于位流的某些图片(例如,每n数目个图片、在每一随机存取图片处或图片的其它子集)。在一些实例中,内容色域体积消息可为补充增强信息(SEI)消息。
根据至少一个实例,提供一种处理视频数据的方法。所述方法包括获得视频数据。所述方法进一步包括处理与视频数据相关联的内容色域体积信息。所述内容色域体积信息指示所述视频数据的一或多个图片的内容色域体积。所述内容色域体积信息包含:与一或多个图片的最小亮度相关联的第一亮度值、与一或多个图片的最大亮度相关联的第二亮度值和描述一或多个图片的色域的一或多个色彩原色的一或多个色度坐标。
在处理视频数据的另一实例中,提供一种设备,其包含经配置以存储视频数据的存储器和处理器。所述处理器经配置以获得且可获得视频数据。所述处理器经进一步配置以处理且可处理与视频数据相关联的内容色域体积信息。所述内容色域体积信息指示所述视频数据的一或多个图片的内容色域体积。所述内容色域体积信息包含:与一或多个图片的最小亮度相关联的第一亮度值、与一或多个图片的最大亮度相关联的第二亮度值和描述一或多个图片的色域的一或多个色彩原色的一或多个色度坐标。
在处理视频数据的另一实例中,提供其上存储有指令的非暂时性计算机可读媒体,所述指令在由一或多个处理器执行时使得所述一或多个处理器:获得视频数据;且处理与视频数据相关联的内容色域体积信息,所述内容色域体积信息指示视频数据的一或多个图片的内容色域体积,其中所述内容色域体积信息包含:与一或多个图片的最小亮度相关联的第一亮度值、与一或多个图片的最大亮度相关联的第二亮度值和描述一或多个图片的色域的一或多个色彩原色的一或多个色度坐标。
在处理视频数据的另一实例中,提供一种设备,其包含用于获得视频数据的装置。所述设备进一步包括用于处理与视频数据相关联的内容色域体积信息的装置。所述内容色域体积信息指示所述视频数据的一或多个图片的内容色域体积。所述内容色域体积信息包含:与一或多个图片的最小亮度相关联的第一亮度值、与一或多个图片的最大亮度相关联的第二亮度值和描述一或多个图片的色域的一或多个色彩原色的一或多个色度坐标。
在一些方面中,第一亮度值包含正规化最小亮度值,且第二亮度值包含正规化最大亮度值。
在一些方面中,第一亮度值用于导出一或多个图片的最小亮度值。在一些方面中,第二亮度值用于导出一或多个图片的最大亮度值。
在一些方面中,与视频数据一起提供语法元素。所述语法元素指示内容色域体积信息的子集经用信号传送。
在一些方面中,使用补充增强信息(SEI)消息的一或多个语法元素来用信号传送内容色域体积信息。
在一些方面中,一或多个色度坐标包含指定一或多个图片的三个色彩原色的三个色度坐标。在一些情况下,三个色度坐标包含:用于一或多个图片的绿色色彩原色的绿色色度坐标、用于一或多个图片的红色色彩原色的红色色度坐标和用于一或多个图片的蓝色色彩原色的蓝色色度坐标。
在一些方面中,所述设备包括具有用于捕捉图片的摄像机的移动装置。在一些方面中,所述设备包括用于显示视频数据的显示器。
根据至少一个其它实例,提供一种编码视频数据的方法。所述方法包括获得视频数据。所述方法进一步包括使用视频数据来产生经编码视频位流。所述方法进一步包括产生视频数据的内容色域体积信息。所述内容色域体积信息包含:与视频数据的最小亮度相关联的第一亮度值、与视频数据的最大亮度相关联的第二亮度值和描述视频数据的色域的一或多个色彩原色的一或多个色度坐标。
在编码视频数据的另一实例中,提供一种设备,其包含经配置以存储视频数据的存储器和处理器。所述处理器经配置以获得且可获得视频数据。所述处理器经进一步配置以使用且可使用视频数据来产生经编码视频位流。所述处理器经进一步配置以产生且可产生视频数据的内容色域体积信息。所述内容色域体积信息包含:与视频数据的最小亮度相关联的第一亮度值、与视频数据的最大亮度相关联的第二亮度值和描述视频数据的色域的一或多个色彩原色的一或多个色度坐标。
在编码视频数据的另一实例中,提供其上存储有指令的非暂时性计算机可读媒体,所述指令在由一或多个处理器执行时使得所述一或多个处理器:获得视频数据;且使用视频数据来产生经编码视频位流,其中所述经编码视频位流包含视频数据的内容色域体积信息,所述内容色域体积信息包含:与视频数据的最小亮度相关联的第一亮度值、与视频数据的最大亮度相关联的第二亮度值和描述视频数据的色域的一或多个色彩原色的一或多个色度坐标。
在编码视频数据的另一实例中,提供一种设备,其包含用于获得视频数据的装置。所述设备进一步包括用于使用视频数据来产生经编码视频位流的装置。所述设备进一步包括用于产生视频数据的内容色域体积信息的装置。所述内容色域体积信息包含:与视频数据的最小亮度相关联的第一亮度值、与视频数据的最大亮度相关联的第二亮度值和描述视频数据的色域的一或多个色彩原色的一或多个色度坐标。
在一些方面中,上文所述的用于编码视频数据的方法、设备和计算机可读媒体可进一步包括产生内容色域体积消息,以及将内容色域体积信息包含在内容色域体积消息中。在一些方面中,上文所述的用于编码视频数据的方法、设备和计算机可读媒体可进一步包括将内容色域体积消息传输给客户端装置。在一些方面中,上文所述的用于编码视频数据的方法、设备和计算机可读媒体可进一步包括将经编码视频位流传输给客户端装置。在一些方面中,在经编码视频位流中传输内容色域体积消息。在一些方面中,与经编码视频位流分开地传输内容色域体积消息。在一些方面中,在位流中或与位流分开地在图片级别处包含内容色域体积信息。
在一些方面中,第一亮度值包含正规化最小亮度值,且第二亮度值包含正规化最大亮度值。
在一些方面中,第一亮度值用于导出视频数据的最小亮度值。在一些方面中,第二亮度值用于导出视频数据的最大亮度值。
在一些方面中,使用补充增强信息(SEI)消息的一或多个语法元素来用信号传送内容色域体积信息。
在一些方面中,一或多个色度坐标包含指定视频内容的三个色彩原色的三个色度坐标。在一些情况下,所述三个色度坐标包含:用于视频数据的绿色色彩原色的绿色色度坐标、用于视频数据的红色色彩原色的红色色度坐标和用于视频数据的蓝色色彩原色的蓝色色度坐标。
在一些方面中,所述设备包括具有用于捕捉图片的摄像机的移动装置。
根据至少一个其它实例,提供一种处理视频数据的方法。所述方法包括获得视频数据。所述方法进一步包括获得视频数据的一或多个图片的内容色域体积信息。所述内容色域体积信息包含:与一或多个图片的最小亮度相关联的第一亮度值、与一或多个图片的最大亮度相关联的第二亮度值和描述一或多个图片的色域的一或多个色彩原色的一或多个色度坐标。所述方法进一步包括使用内容色域体积信息来确定一或多个图片的内容色域体积。
在处理视频数据的另一实例中,提供一种设备,其包含经配置以存储视频数据的存储器和处理器。所述处理器经配置以获得且可获得视频数据。所述处理器经进一步配置以获得且可获得视频数据的一或多个图片的内容色域体积信息。所述内容色域体积信息包含:与一或多个图片的最小亮度相关联的第一亮度值、与一或多个图片的最大亮度相关联的第二亮度值和描述一或多个图片的色域的一或多个色彩原色的一或多个色度坐标。所述处理器经进一步配置以使用且可使用内容色域体积信息来确定一或多个图片的内容色域体积。
在处理视频数据的另一实例中,提供其上存储有指令的非暂时性计算机可读媒体,所述指令在由一或多个处理器执行时使得所述一或多个处理器:获得视频数据;获得视频数据的一或多个图片的内容色域体积信息,所述内容色域体积信息包含与一或多个图片的最小亮度相关联的第一亮度值、与一或多个图片的最大亮度相关联的第二亮度值和描述一或多个图片的色域的一或多个色彩原色的一或多个色度坐标;且使用内容色域体积信息来确定一或多个图片的内容色域体积。
在处理视频数据的另一实例中,提供一种设备,其包含用于获得视频数据的装置。所述设备进一步包括用于获得视频数据的一或多个图片的内容色域体积信息的装置。所述内容色域体积信息包含:与一或多个图片的最小亮度相关联的第一亮度值、与一或多个图片的最大亮度相关联的第二亮度值和描述一或多个图片的色域的一或多个色彩原色的一或多个色度坐标。所述设备进一步包括用于使用内容色域体积信息来确定一或多个图片的内容色域体积的装置。
在一些方面中,所述设备还可包含经配置以接收视频数据(例如,视频位流或经解码视频数据)的接收器。在此些方面中,上文所述的用于处理视频数据的方法、设备和计算机可读媒体可进一步包括解码经编码视频位流以获得视频数据且获得内容色域体积信息。在此些方面中,上文所述的用于处理视频数据的方法、设备和计算机可读媒体可进一步包括获得先前经解码视频数据以及使用内容色域体积信息来处理经解码视频数据。
在一些方面中,第一亮度值包含正规化最小亮度值,且第二亮度值包含正规化最大亮度值。
在一些方面中,确定一或多个图片的内容色域体积包含使用第一亮度值导出一或多个图片的最小亮度值。在一些方面中,确定一或多个图片的内容色域体积包含使用第二亮度值导出一或多个图片的最大亮度值。
在一些方面中,使用补充增强信息(SEI)消息的一或多个语法元素来用信号传送内容色域体积信息。
在一些方面中,一或多个色度坐标包含指定一或多个图片的三个色彩原色的三个色度坐标。在一些情况下,所述三个色度坐标包含:用于视频数据的绿色色彩原色的绿色色度坐标、用于视频数据的红色色彩原色的红色色度坐标和用于视频数据的蓝色色彩原色的蓝色色度坐标。
在一些方面中,在经编码视频位流中传输内容色域体积消息。在一些方面中,与经编码视频位流分开地传输内容色域体积消息。在一些方面中,在位流中或与位流分开地在图片级别处包含内容色域体积信息。
在一些方面中,所述设备包含用于显示视频数据的显示器。在一些方面中,所述设备包含具有摄像机的移动装置。
此发明内容并不打算识别所要求标的物的关键或基本特征,也不打算单独使用以确定所要求标的物的范围。应参考此专利的整个说明书的适当部分、任何或所有图式和每一权利要求来理解标的物。
当参考以下说明书、权利要求书和随附图式时,前述内容连同其它特征和实施例将变得更显而易见。
附图说明
专利或申请案文件含有至少一个彩制图式。在申请且支付必要的费用后,专利局将提供具有彩色图式的本专利或专利申请公开案的复本。
下文参考以下图式详细描述本发明的说明性实施例:
图1为说明根据一些实例的编码装置和解码装置的实例的框图。
图2为说明根据一些实例的用于BT.709色彩空间中的视频内容和用于BT.2020色彩空间中的视频内容的光谱轨迹和色域的实例的图式。
图3为说明根据一些实例的处于一亮度(luminance)值的视频内容的内容色域的实例的图式。
图4为说明根据一些实例的视频内容的内容色域、容器色域和显示器色域的实例的图式。
图5为说明根据一些实例的视频内容的内容色域、容器色域和显示器色域的其它实例的图式。
图6为说明根据一些实例的跨视频内容的可能亮度值范围的视频内容的内容色域的实例的图式。
图7为说明根据一些实例的跨视频内容的可能亮度值范围的视频内容的内容色域的另一实例的图式。
图8为说明根据一些实例的具有内容色域体积补充增强信息(SEI)消息的视频位流的实例的图式。
图9示出说明根据一些实例的处理视频数据的程序的实例的流程图。
图10示出说明根据一些实例的编码视频数据的程序的实例的流程图。
图11示出说明根据一些实例的处理视频数据的程序的实例的流程图。
图12为说明根据一些实例的实例视频编码装置的框图。
图13为说明根据一些实例的实例视频解码装置的框图。
具体实施方式
下文提供本发明的某些方面和实施例。此些方面和实施例中的一些可独立地应用,且其中的一些可以将对所属领域的技术人员显而易见的组合来应用。在以下描述中,出于解释的目的,阐述特定细节以便提供对本发明的实施例的透彻理解。然而,将显而易见的是,可在无此些特定细节的情况下实践各种实施例。图式和描述不打算为限定性的。
随后描述仅提供示范性实施例,且并不打算限制本发明的范围、适用性或配置。确切地说,示范性实施例的随后描述将为所属领域的技术人员提供实施示范性实施例的能够实现的描述。应理解,可在不背离如所附权利要求书中所阐述的本发明的精神和范围的情况下对元件的功能和布置做出各种改变。
在以下描述中给出特定细节以提供对实施例的透彻理解。然而,所属领域的一般技术人员将理解,可在无此些特定细节的情况下实践实施例。举例来说,电路、系统、网络、过程和其它组件可以框图形式展示为组件以免在不必要细节下混淆实施例。在其它情况下,可在无不必要的细节的情况下展示熟知电路、过程、算法、结构和技术以便避免混淆实施例。
而且,应注意,个别实施例可描述为经描绘为流程图、作业图、数据流程图、结构图或框图的过程。尽管流程图可将操作描述为顺序过程,但可并行地或同时执行许多操作。此外,可重新排列操作的次序。过程虽然在其操作完成时终止,但可具有不包含于图中的额外步骤。过程可对应于方法、函数、程序、子例程、子程序等。当过程对应于函数时,其终止可对应于函数返回到呼叫函数或主函数。
术语“计算机可读媒体”包含(但不限于)便携式或非便携式存储装置、光学存储装置和能够存储、含有或携载指令和/或数据的各种其它媒体。计算机可读媒体可包含非暂时性媒体,其中可存储数据且不包含载波和/或无线地或经由有线连接传播的暂时电子信号。非暂时性媒体的实例可包含(但不限于)磁盘或磁带、例如紧密光盘(CD)或数字化通用光盘(DVD)的光学存储媒体、快闪存储器、存储器或存储器装置。计算机可读媒体可具有存储于其上的代码和/或机器可执行指令,所述代码和/或机器可执行指令可表示程序、函数、子程序、程序、例程、子例程、模块、软件包、类别或指令、数据结构或程序语句的任何组合。可通过传递和/或接收信息、数据、引数、参数或存储器内容来将码段耦合到另一码段或硬件电路。信息、引数、参数、数据等可经由包含存储器共享、消息传递、符记传递、网络传输等等的任何合适方式来传递、转递或传输。
此外,实施例可由硬件、软件、固件、中间软件、微码、硬件描述语言或其任何组合实施。当以软件、固件、中间软件或微码实施时,用以执行必要任务的程序码或码段(例如,计算机程序产品)可存储于计算机可读或机器可读媒体中。处理器可执行必要任务。
本文描述使用视频编码器、解码器、视频播放器、视频显示器和/或其它视频处理装置进行视频处理和视频译码的若干系统和方法。在一些实例中,描述用于产生和处理含有描述视频内容的色域体积的信息的消息的一或多个系统和方法。消息可包含补充增强信息(SEI)消息或其它适合的消息。客户端侧装置可根据装置的参数使用内容色域体积信息来呈现或显示视频内容。下文进一步详细地描述此些系统和方法的细节。
随着更多装置和系统为消费者提供消耗数字视频数据的能力,对高效视频译码技术的需要变得更加重要。需要视频译码来减少处置存在于数字视频数据中的大量数据所必要的存储和传输需求。各种视频译码技术可用于将视频数据压缩成使用较低位速率同时维持高视频质量的形式。
图1为说明包含编码装置104和解码装置112的系统100的实例的框图。编码装置104可为源装置的部分,且解码装置112可为接收装置的部分。源装置和/或接收装置可包含电子装置,例如移动或固定电话手机(例如,智能型电话、蜂窝式电话等等)、台式计算机、膝上型或笔记型计算机、平板计算机、机顶盒、电视、摄像机、显示装置、数字媒体播放器、视频游戏控制台、视频流式传输装置、因特网协议(IP)摄像机或任何其它合适的电子装置。在一些实例中,源装置和接收装置可包含用于无线通信的一或多个无线收发器。本文中所描述的译码技术适用于各种多媒体应用中的视频译码,所述多媒体应用包含流式视频传输(例如,经由因特网)、电视广播或传输、用于存储于数据存储媒体上的数字视频的编码、存储于数据存储媒体上的数字视频的解码或其它应用。在一些实例中,系统100可支持单向或双向视频传输以支持例如视频会议、视频流式传输、视频播放、视频广播、游戏和/或视频电话的应用。
编码装置104(或编码器)可用于使用视频译码标准或协议编码视频数据以产生经编码视频位流。视频译码标准包含ITU-T H.261、ISO/IEC MPEG-1 Visual、ITU-T H.262或ISO/IEC MPEG-2 Visual、ITU-T H.263、ISO/IEC MPEG-4 Visual和ITU-T H.264(也称为ISO/IEC MPEG-4 AVC),包含其可调式视频译码(SVC)和多视图视频译码(MVC)扩展。最近的视频译码标准高效视频译码(HEVC)已由ITU-T视频译码专家组(VCEG)和ISO/IEC活动图片专家组(MPEG)的视频译码联合协作小组(JCT-VC)定案。HEVC的各种扩展处理多层视频译码,且也正由JCT-VC开发,所述扩展包含HEVC的多视图扩展(被称作MV-HEVC)和HEVC的可调式扩展(被称作SHVC)或任何其它合适的译码协议。
本文中所描述的许多实施例提供使用HEVC标准或其扩展的实例。然而,本文中所描述的技术和系统还可适用于其它译码标准,例如AVC、MPEG、其扩展或已可用或尚不可用或尚未开发的其它合适的译码标准。因此,虽然可参考特定视频译码标准来描述本文中所描述的技术和系统,但所属领域的一般技术人员将了解,描述不应解释为仅适用于所述特定标准。
参看图1,视频源102可将视频数据提供给编码装置104。视频源102可为源装置的部分,或可为除源装置以外的装置的部分。视频源102可包含视频捕捉装置(例如,视频摄像机、摄像机电话、视频电话等等)、含有经存储视频的视频存档、提供视频数据的视频服务器或内容提供者、从视频服务器或内容提供者接收视频的视频馈入接口、用于产生计算机图形视频数据的计算机图形系统、此些源的组合或任何其它合适的视频源。
来自视频源102的视频数据可包含一或多个输入图片或帧。图片或帧为作为视频的部分的静态图像。编码装置104的编码器发动机106(或编码器)编码视频数据以产生经编码视频位流。在一些实例中,经编码视频位流(或“视频位流”或“位流”)为一系列一或多个经译码视频序列。经译码视频序列(CVS)包含一系列存取单元(AU),其始于具有在基础层中且具有某些性质的随机存取点图片的AU,直到且不包含具有在基础层中且具有某些性质的随机存取点图片的下一AU。举例来说,开始CVS的随机存取点图片的某些性质可包含等于1的RASL旗标(例如,NoRaslOutputFlag)。否则,随机存取点图片(具有等于0的RASL旗标)不开始CVS。存取单元(AU)包含一或多个经译码图片和对应于共享相同输出时间的经译码图片的控制信息。图片的经译码图块在位流级别中囊封到被称作网络抽象层(NAL)单元的数据单元中。举例来说,HEVC视频位流可包含有包含NAL单元的一或多个CVS。NAL单元中的每一个具有NAL单元标头。在一个实例中,标头对于H.264/AVC(除了多层扩展以外)为一个字节且对于HEVC为两个字节。NAL单元标头中的语法元素采用指定位,且因此对所有种类的系统和输送层可见,例如输送流、实时输送(RTP)协议、文件格式和其它。
HEVC标准中存在两种类别的NAL单元,包含视频译码层(VCL)NAL单元和非VCL NAL单元。VCL NAL单元包含经译码图片数据的一个图块或图块片段(如下描述),且非VCL NAL单元包含关于一或多个经译码图片的控制信息。在一些情况下,NAL单元可被称作包。HEVCAU包含含有经译码图片数据的VCL NAL单元和对应于经译码图片数据的非VCL NAL单元(如果存在)。
NAL单元可含有形成视频数据的经译码表示(例如,视频中的图片的经译码表示)的位序列(例如,经编码视频位流、位流的CVS等等)。编码器发动机106通过将每一图片分割成多个图块来产生图片的经译码表示。一图块独立于其它图块,以使得在不依赖于来自同一图片内的其它图块的数据的情况下译码所述图块中的信息。图块包含一或多个图块片段,所述一或多个图块片段包含一独立图块片段和(如果存在)依赖于先前图块片段的一或多个依赖性图块片段。图块接着被分割成明度(luma)样本和色度(chroma)样本的译码树型块(CTB)。明度样本的CTB和色度样本的一或多个CTB连同用于所述样本的语法被称为译码树型单元(CTU)。CTU为用于HEVC编码的基本处理单元。CTU可分裂成具有不同大小的多个译码单元(CU)。CU含有被称为译码块(CB)的明度和色度样本阵列。
明度CB和色度CB可进一步分裂成预测块(PB)。PB为针对帧间预测或块内复制预测(在可用或经启用以供使用时)使用相同运动参数的明度分量或色度分量的样本的块。所述明度PB和一或多个色度PB连同相关联语法形成预测单元(PU)。对于帧间预测,针对每一PU在位流中用信号传送一组运动参数(例如,一或多个运动向量、参考索引等等),且所述组运动参数用于所述明度PB和一或多个色度PB的帧间预测。对于块内复制预测,还可针对每一PU用信号传送一组运动参数(例如,一或多个块向量等等),且所述组运动参数可用于块内复制预测。CB还可分割成一或多个变换块(TB)。TB表示色彩分量的样本的正方形块,对所述正方形块应用相同二维变换以用于译码预测残余信号。变换单元(TU)表示明度样本和色度样本的TB以及对应语法元素。
CU的大小对应于译码模式的大小,且可为正方形形状。举例来说,CU的大小可为8×8样本、16×16样本、32×32样本、64×64样本或至多对应CTU的大小的任何其它适当大小。短语“N×N”在本文中用于指就竖直和水平尺寸而言视频块的像素尺寸(例如,8像素×8像素)。可按行和列来布置块中的像素。在一些实施例中,块在水平方向上可不具有与在竖直方向上数目相同的像素。与CU相关联的语法数据可描述(例如)将CU分割成一或多个PU。分割模式可在CU经帧内预测模式编码或帧间预测模式编码之间有所不同。PU可被分割成非正方形形状。与CU相关联的语法数据还可描述(例如)根据CTU将CU分割成一或多个TU。TU可为正方形或非正方形形状。
根据HEVC标准,可使用变换单元(TU)来执行变换。TU可针对不同CU而变化。可基于给定CU内的PU的大小来设定TU的大小。TU可与PU大小相同或小于PU。在一些实例中,可使用被称为残余四分树(RQT)的四分树结构将对应于CU的残余样本再分成较小单元。RQT的叶节点可对应于TU。可变换与TU相关联的像素差值以产生变换系数。变换系数可接着由编码器发动机106量化。
一旦视频数据的图片被分割成CU,编码器发动机106就使用预测模式来预测每一PU。接着从原始视频数据减去预测单元或预测块以得到残余(如下描述)。对于每一CU,可使用语法数据在位流内部用信号传送预测模式。预测模式可包含帧内预测(或图片内预测)或帧间预测(或图片间预测)。帧内预测利用图片内的空间相邻样本之间的相关关系。举例来说,使用帧内预测时,使用(例如)DC预测以找出PU的平均值、使用平面预测以使平面表面拟合于PU、使用方向预测以从相邻数据外插或使用任何其它合适类型的预测从同一图片中的相邻图像数据预测每一PU。帧间预测使用图片之间的时间相关关系以便导出图像样本的块的经运动补偿预测。举例来说,使用帧间预测时,使用运动补偿预测从一或多个参考图片(按输出次序在当前图片之前或之后)中的图像数据预测每一PU。可(例如)在CU级别决定使用图片间预测还是图片内预测来译码图片区域。
在一些实例中,图片的一或多个图块被指派有图块类型。图块类型包含I图块、P图块和B图块。I图块(帧内预测帧,可独立解码)为图片的仅通过帧内预测译码的图块,且因此可独立解码,这是因为I图块仅需要帧内的数据来预测图块的任何预测单元或预测块。P图块(单向预测帧)为图片的可通过帧内预测和通过单向帧间预测译码的图块。P图块内的每一预测单元或预测块通过帧内预测或帧间预测译码。当应用帧间预测时,预测单元或预测块仅通过一个参考图片加以预测,且因此参考样本仅来自一个帧的一个参考区。B图块(双向预测性帧)为图片的可通过帧内预测和通过帧间预测(例如,双向预测或单向预测)来译码的图块。可从两个参考图片双向预测B图块的预测单元或预测块,其中每一图片贡献一个参考区,且两个参考区的样本集合经加权(例如,具有相同权重或具有不同权重)以产生双向预测块的预测信号。如上文所解释,一个图片的图块被独立译码。在一些情况下,图片可仅作为一个图块而被译码。
PU可包含关于预测程序的数据(例如,运动参数或其它合适的数据)。举例来说,当PU使用帧内预测而编码时,PU可包含描述用于PU的帧内预测模式的数据。作为另一实例,当PU使用帧间预测而编码时,PU可包含定义用于PU的运动向量的数据。定义用于PU的运动向量的数据可描述(例如)运动向量的水平分量(Δx)、运动向量的竖直分量(Δy)、运动向量的分辨率(例如,整数精确度、四分之一像素精确度或八分之一像素精确度)、运动向量指向的参考图片、参考索引、运动向量的参考图片列表(例如,列表0、列表1或列表C)或其任何组合。
编码装置104接着可执行变换和量化。举例来说,在预测之后,编码器发动机106可计算对应于PU的残余值。残余值可包括正经译码的像素的当前块(PU)与用于预测当前块的预测块(例如,当前块的经预测版本)之间的像素差值。举例来说,在产生预测块(例如,发出帧间预测或帧内预测)之后,编码器发动机106可通过从当前块减去由预测单元产生的预测块来产生残余块。残余块包含量化当前块的像素值与预测块的像素值之间的差的一组像素差值。在一些实例中,残余块可以二维块格式(例如,像素值的二维矩阵或阵列)表示。在此些实例中,残余块为像素值的二维表示。
使用块变换来变换可在执行预测之后剩余的任何残余数据,此变换可基于离散余弦变换、离散正弦变换、整数变换、小波变换、其它合适的变换函数或其任何组合。在一些情况下,可将一或多个块变换(例如,大小32×32、16×16、8×8、4×4或其它合适的大小)应用于每一CU中的残余数据。在一些实施例中,TU可用于由编码器发动机106实施的变换和量化程序。具有一或多个PU的给定CU还可包含一或多个TU。如下文进一步详细描述,可使用块变换将残余值变换成变换系数,且接着可使用TU来量化和扫描残余值以产生用于熵译码的串行化变换系数。
在一些实施例中,在使用CU的PU进行帧内预测性或帧间预测性译码之后,编码器发动机106可计算用于CU的TU的残余数据。PU可包括空间域(或像素域)中的像素数据。在应用块变换之后,TU可包括变换域中的系数。如先前所提及,残余数据可对应于未经编码图片的像素与对应于PU的预测值之间的像素差值。编码器发动机106可形成包含用于CU的残余数据的TU,且接着可变换TU以产生CU的变换系数。
编码器发动机106可执行变换系数的量化。量化通过量化变换系数以减少用于表示系数的数据的量而提供进一步压缩。举例来说,量化可减少与系数中的一些或全部相关联的位深度。在一个实例中,具有n位值的系数可在量化期间降值舍入为m位值,其中n大于m。
一旦执行量化,经译码视频位流就包含经量化变换系数、预测信息(例如,预测模式、运动向量、块向量等等)、分割信息和任何其它合适数据(例如其它语法数据)。接着可通过编码器发动机106熵编码经译码视频位流的不同元素。在一些实例中,编码器发动机106可利用预定义扫描次序来扫描经量化变换系数以产生可经熵编码的串行化向量。在一些实例中,编码器发动机106可执行自适应扫描。在扫描经量化变换系数以形成向量(例如,一维向量)之后,编码器发动机106可熵编码向量。举例来说,编码器发动机106可使用上下文自适应可变长度译码、上下文自适应二进制算术译码、基于语法的上下文自适应二进制算术译码、概率区间分割熵译码或另一合适的熵编码技术。
如先前所描述,HEVC位流包含一组NAL单元,包含VCL NAL单元和非VCL NAL单元。VCL NAL单元包含形成经译码视频位流的经译码图片数据。举例来说,形成经译码视频位流的位序列存在于VCL NAL单元中。非VCL NAL单元可含有具有与经编码视频位流相关的高级别信息的参数集以及其它信息。举例来说,参数集可包含视频参数集(VPS)、序列参数集(SPS)和图片参数集(PPS)。参数集的目标的实例包含位速率效率、误差容错(errorresiliency)和提供系统层接口。每一图块参考单个作用中PPS、SPS和VPS以存取解码设备112可用于解码图块的信息。可针对每一参数集译码一识别符(ID),包含VPS ID、SPS ID和PPS ID。SPS包含SPS ID和VPS ID。PPS包含PPS ID和SPS ID。每一图块标头包含PPS ID。使用ID,可针对给定图块识别作用中参数集。
PPS包含适用于给定图片中的所有图块的信息。因此,图片中的所有图块参考同一PPS。不同图片中的图块还可参考同一PPS。SPS包含适用于同一经译码视频序列(CVS)或位流中的所有图片的信息。如先前所描述,经译码视频序列为一系列存取单元(AU),其始于在基础层中且具有某些性质(如上文所描述)的随机存取点图片(例如,瞬时解码参考(IDR)图片或断链存取(BLA)图片或其它适当的随机存取点图片),直到且不包含具有在基础层中且具有某些性质的随机存取点图片的下一AU(或位流的末端)。SPS中的信息可不在经译码视频序列内的图片间变化。经译码视频序列中的图片可使用同一SPS。VPS包含适用于经译码视频序列或位流内的所有层的信息。VPS包含具有适用于全部经译码视频序列的语法元素的语法结构。在一些实施例中,可与经编码位流一起频带内传输VPS、SPS或PPS。在一些实施例中,可在与含有经译码视频数据的NAL单元分开的传输中频带外传输VPS、SPS或PPS。
视频位流还可包含补充增强信息(SEI)消息。举例来说,SEI NAL单元可为视频位流的部分。在一些情况下,SEI消息可含有解码程序不需要的信息。举例来说,虽然SEI消息中的信息对于解码器解码位流的视频图片而言可为不必需的,但解码器可使用所述信息来改进图片的显示或处理(例如,经解码输出)。可将元数据嵌入SEI消息中的信息。在一个说明性实例中,SEI消息中的信息可由解码器侧实体使用以改进内容的可视性。在一些情况下,某些应用标准可强制位流中存在此些SEI消息,使得可为符合应用标准的所有装置带来质量改进(例如,携载用于帧可相容平面立体3DTV视频格式的帧封装SEI消息,其中针对视频的每一帧携载SEI消息;处置恢复点SEI消息;在DVB中使用拉移式扫描矩形SEI消息;以及许多其它实例)。
编码装置104的输出端110可经由通信链路120将组成经编码视频位流数据的NAL单元发送给接收装置的解码装置112。解码装置112的输入端114可接收NAL单元。通信链路120可包含由无线网络、有线网络或有线网络与无线网络的组合提供的信道。无线网络可包含任何无线接口或无线接口的组合,且可包含任何合适的无线网络(例如,因特网或其它广域网、基于包的网络、WiFiTM、射频(RF)、UWB、WiFi-Direct、蜂窝式、长期演进(LTE)、WiMaxTM等等)。有线网络可包含任何有线接口(例如,光纤、以太网、电力线以太网、经由同轴缆线的以太网、数字信号线(DSL)等等)。可使用各种设备来实施有线和/或无线网络,所述设备例如基站、路由器、存取点、桥接器、网关、交换器等等。可根据通信标准(例如,无线通信协议)调制经编码视频位流数据,且将其传输给接收装置。
在一些实例中,编码装置104可将经编码视频位流数据存储于存储器108中。输出端110可从编码器发动机106或从存储器108检索经编码视频位流数据。存储器108可包含多种分布式或本地存取的数据存储媒体中的任一个。举例来说,存储器108可包含硬盘驱动器、存储光盘、快闪存储器、易失性或非易失性存储器或用于存储经编码视频数据的任何其它合适的数字存储媒体。
解码装置112的输入端114接收经编码视频位流数据,且可将视频位流数据提供给解码器发动机116或提供给存储器118以供稍后由解码器发动机116使用。解码器发动机116可通过熵解码(例如,使用熵解码器)且检索组成经编码视频数据的一或多个经译码视频序列的元素来解码经编码视频位流数据。解码器发动机116接着可重新按比例调整经编码视频位流数据且对经编码视频位流数据执行反变换。残余数据接着经传递到解码器发动机116的预测级。解码器发动机116接着预测像素的块(例如,PU)。在一些实例中,将预测添加到反变换的输出(残余数据)。
解码装置112可将经解码视频输出到视频目的地装置122,所述视频目的地装置可包含显示器或用于向内容的消费者显示经解码视频数据的其它输出装置。在一些方面中,视频目的地装置122可为包含解码装置112的接收装置的部分。在一些方面中,视频目的地装置122可为不同于接收装置的单独装置的部分。
在一些实施例中,视频编码装置104和/或视频解码装置112可分别与音频编码装置和音频解码装置集成。视频编码装置104和/或视频解码装置112还可包含实施上文所描述的译码技术所必要的其它硬件或软件,例如一或多个微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑、软件、硬件、固件或其任何组合。视频编码装置104和视频解码装置112可集成为相应装置中的组合式编码器/解码器(编解码器)的部分。下文参看图12描述编码装置104的特定细节的实例。下文参看图13描述解码装置112的特定细节的实例。
HEVC标准的扩展包含多视图视频译码扩展(被称作MV-HEVC)和可调式视频译码扩展(被称作SHVC)。MV-HEVC和SHVC扩展共享分层译码的概念,其中不同层包含于经编码视频位流中。经译码视频序列中的每一层由唯一层识别符(ID)定址。层ID可存在于NAL单元的标头中以识别NAL单元所相关联的层。在MV-HEVC中,不同层可表示视频位流中的同一场景的不同视图。在SHVC中,提供以不同空间分辨率(或图片分辨率)或以不同重构建保真度表示视频位流的不同可调式层。可调式层可包含基础层(其中层ID=0)和一或多个增强层(其中层ID=1、2、…n)。基础层可符合HEVC的第一版本的配置文件,且表示位流中的最低可用层。与基础层相比,增强层具有增加的空间分辨率、时间分辨率或帧速率和/或重构建保真度(或质量)。增强层经阶层式组织,且可(或可不)取决于较低层。在一些实例中,可使用单一标准编解码器来译码不同层(例如,使用HEVC、SHVC或其它译码标准来编码所有层)。在一些实例中,可使用多标准编解码器来译码不同层。举例来说,可使用AVC来译码基础层,同时可使用HEVC标准的SHVC和/或MV-HEVC扩展来译码一或多个增强层。
一般来说,层包含一组VCL NAL单元和对应的一组非VCL NAL单元。NAL单元经指派有特定层ID值。在层可取决于较低层的意义上,层可为阶层式的。层集合指代表示于位流内的自含式的层的集合,意谓层集合内的层在解码程序中可取决于层集合中的其它层,但不取决于任何其它层来进行解码。因此,层集合中的层可形成可表示视频内容的独立位流。可通过子位流检索程序的操作从另一位流获得层集合中的层的集合。层集合可对应于待在解码器希望根据某些参数操作时经解码的层的集合。
动态范围定义视频内容中可用的发光亮度的范围或显示器可再现的发光亮度的范围。举例来说,标准动态范围(SDR)使用常规伽玛曲线来描述视频的动态范围和显示器的动态范围能力,所述伽玛曲线是基于阴极射线管显示器的限制。已掌握典型地用于具有100烛光每平方米(cd/m2)的最大亮度的SDR,但一些显示器可选择以高于100cd/m2的峰值亮度显示SDR内容。高动态范围(HDR)描述比SDR视频或显示器具有更大发光亮度范围的视频或显示器。举例来说,HDR视频内容可允许2,000cd/m2的亮度。HDR视频内容可由此允许显示器提供峰值亮度水平。
除高动态范围(HDR)外,用于提供更真实视频体验的另一方面为色彩维度。色彩维度通常由色域定义。图2为展示呈三角形204形式的标准动态范围(SDR)色域的图式,所述色域是基于BT.709色域红色、绿色和蓝色色彩原色。还展示呈三角形202形式的用于超高清晰度电视(UHDTV)的较宽色域,其是基于BT.2020色域红色、绿色和蓝色色彩原色。图2还描绘所谓的光谱轨迹(由舌形区域206定界),所述光谱轨迹表示自然色彩(例如,人眼可见的色彩)的限制。如图2所说明,从BT.709色彩原色(曲线204)移动到BT.2020色彩原色(曲线202)旨在提供具有约70%更多色彩的UHDTV服务。经标记为D65的圆点指定给定规范的白色色彩。下表1中展示色域规范的若干实例。
表1.色域参数
如上文所提及,HDR提供图片的动态范围(与亮度相关)相较于较小动态范围(例如,由SDR提供的动态范围)的增加。广色域(WCG)提供色彩可能性(例如,红色、绿色和蓝色的更多值)相较于更窄色域的增加。HDR与WCG一起可提供视频内容的更生动的显示。
色域体积指代由存在于(即,包含于)视频内容中或显示器能够表示的一组色彩指定的三维区。可在不同色彩空间中指定色域体积,所述色彩空间包含(但不限于)XYZ、xyY、LAB和LUV色彩空间。举例来说,xyY色彩空间中的色域体积通过视频内容的色域(在x维度和y维度中)以及视频内容所占用或显示器能够表示的最小和最大亮度(Y)来定义。
就当前视频译码标准(例如,HEVC译码标准或其它相关译码标准)和视频内容的色域信息而言存在各种问题。举例来说,视频位流含有描述视频内容或仅内容的特性的若干语法元素。视频可用性信息(VUI)含有指示内容在其中经译码的容器的参数(例如,容器色域)。然而,不存在与视频位流一起(例如,在其外部或与其分离)或在视频位流中(例如,作为其部分或包括于其内)用信号传送的色域和视频内容所占用的色域体积的指示。
在许多应用中,知晓内容占用的色域体积是有益的。举例来说,在内容将从一个色域体积转换成另一色域体积(例如,从内容占用的一色域体积转换成显示器支持的较小色域体积(就内容所占用的色域体积而言较小))时,知晓色域体积可为有益的。在另一实例中,色域和色域体积的信息在描述用于将第一色域体积转换成第二色域体积的色域体积转换函数时是有益的。知晓用于特定内容的色域体积变化的方式还可用于指定对内容进行的一或多个后处理步骤。
举例来说,消费者显示器侧装置(例如,电视、移动装置、虚拟实境装置或具有显示器的其它合适装置)可具有与视频内容的制作工作室或其它来源中的显示器的能力不同的能力。显示器侧装置需要能够映射所接收内容以最佳地拟合其显示器。在一个说明性实例中,电视网络可将电影发送给三星(Samsung)电视和索尼(Sony)电视。存在可用于映射视频内容的色彩映射算法。在一些情况下,视频内容提供者可强制装置使用现有色彩映射算法。然而,不同装置的制造商可能不想使用强制的映射信息,且可能偏好开发用于其自己装置的其自己的映射算法。举例来说,三星和索尼装置可具有不同的显示器能力和特性,且可根据显示器能力和特性使用不同的应用或程序来映射内容。在此些情况下,不同装置可能无法经调谐以使用强制的映射信息。
本文描述用于产生和处理含有描述视频内容的色域体积的信息的消息的系统和方法。可针对视频译码和视频应用标准(例如,H.265/HEVC、H.264/AVC、BDA、MPEG、DVB或其它)定义所述消息。本文中所描述的技术和方法中的一或多个可独立应用或与其它组合应用。与回路的特定迭代相关联的一或多个语法元素可与回路的所有迭代相关联且在回路外部经用信号传送,或反之亦然。
在一些情况下,内容色域体积消息可由编码装置(例如,编码装置104)产生,且可由解码装置(例如,解码装置112)、播放装置、显示装置和/或任何其它显示器侧或客户端侧装置接收和处理。举例来说,视频编码装置(或其它传输侧装置)可确定正经编码的内容的色域体积。在一个说明性实例中,可使用图片中每一色彩原色坐标的最大值和所述图片的最大亮度(例如,在红绿蓝(RGB)空间、xyY色彩空间或其它合适的色彩空间中)来确定色域体积。还可使用用于确定色域体积的其它合适技术。编码装置可产生具有(例如,包含)描述视频内容的色域体积的内容色域体积信息的内容色域体积消息。客户端侧装置(例如,视频解码装置、视频播放装置、视频显示装置、其一组合或其它合适的装置)可接收内容色域体积消息,处理所述内容色域体积消息内的内容色域体积信息,并使用所述内容色域体积信息来以适合于装置的方式呈现或显示视频内容。举例来说,具有显示器的装置(例如,电视、移动装置或其它合适的装置)可映射视频内容以最佳地拟合(或优化)显示器的色彩特性,所述色彩特性可不同于视频内容的色彩特性。任何合适的装置可使用内容色域体积信息来呈现或显示视频内容,而无需受限于任何特定应用或程序。举例来说,替代强制(即,要求)装置使用用于将视频内容映射到显示器或转换视频内容的特定算法或程序,可将视频内容在色域体积方面的特性提供给装置,且装置可映射或转换视频以便使用其自己的映射或其它基于色彩的算法来为其显示器提供最佳质量视频。内容色域体积消息中的内容色域体积信息还可用于除色彩映射外的目的,例如在不同亮度之间转换(例如,从HDR转换为低动态范围(LDR)以用于仅可显示LDR内容的显示器)或其它基于色彩的功能。在其它实例中,内容色域体积消息内的内容色域体积信息可由显示器侧装置使用以确定显示器侧装置除了进行用于呈现和/或显示内容的常见转换链外不必进行任何处理。举例来说,当内容色域体积消息描述内容满足特定准则,例如内容占用的色域体积小于显示器所支持的色域体积或几乎与显示器的色域体积大小相同时,显示器侧装置可确定显示器侧装置不需要额外处理以最佳地呈现和/或显示内容。避免常见处理链外的转换程序/映射算法可极有益于对功率消耗需求敏感的装置(例如,移动装置或其它合适的装置)。避免额外处理还可提供避免与设定和/或执行经修改的转换程序相关联的延迟的益处。举例来说,在启用额外处理的同时显示内容可造成例如帧定格的受损表达。
由内容色域体积消息所描述的视频内容的色域体积可包含视频内容的色域以及视频内容所占用的最小亮度和最大亮度。图3为说明视频内容的内容色域302的实例的图式。图3到图7的x轴和y轴对应于图2中所展示的曲线图的x轴和y轴,其中不同色域(色域302、402、422、432、502、522、532、622A到622C和722A到722C)包含色彩轨迹206内的色彩。最小亮度值314和最大亮度值312为视频内容受限于其内的亮度值。举例来说,最小亮度值314和最大亮度值312定义视频内容的亮度值范围。
内容色域302包含定义视频内容在由最小亮度值314和最大亮度值312所定义的亮度值范围内的特定亮度值下的可能彩度(chrominance)(或色彩)值的区域占据面积。可识别描述视频内容的色域302的色彩原色的色度坐标。举例来说,图3中展示蓝色色彩原色的色度坐标xB,yB 316、红色色彩原色的色度坐标xR,yR 318和绿色色彩原色的色度坐标xG,yG320。
如先前所提及,除了视频内容的色域外,还可定义显示装置的色域和在其中译码内容的容器的色域。图4为说明视频内容的色域402、待在其上呈现视频内容的显示器的色域422和在其中译码视频内容的容器的色域432的实例的图式。
容器色域432的说明性实例包含BT.2020色域。举例来说,如果容器为BT.2020容器,那么视频内容可包含在BT.2020容器的色域内的色彩。如先前所提及,包含于视频位流中或与视频位流一起包含的视频可用性信息(VUI)可含有指示容器色域432的参数。举例来说,VUI可包含指定容器为BT.2020容器的信息。基于VUI中的容器信息,客户端侧装置将知晓使用BT.2020容器的蓝色色彩原色的坐标xB,yB 426、BT.2020容器的红色色彩原色的坐标xR,yR 428和BT.2020容器的绿色色彩原色的坐标xG,yG 430,如图4中所展示。VUI可包含于位流的参数集中,例如SPS或VPS。
类似于图3中所展示的色域302,视频内容的内容色域402定义视频内容在亮度值范围内的特定亮度值下的可能彩度(或色彩)值。图4中所展示的色度坐标xB,yB 416、xR,yR418和xG,yG 420提供定义内容色域402的色彩原色的坐标。
显示器色域422的一说明性实例为P3色域,其被视为广色域(WCG)。显示器色域422定义显示器可呈现的色彩范围。显示器色域422的色彩原色(顶点)可描述显示器可呈现的最大色彩。在许多情况下,显示装置可具有小于容器色域的色域。在图4所展示的实例中,显示器色域422小于容器色域432。显示器色域422涵盖内容色域402的所有可能色彩,其指示显示器可呈现视频内容中可能存在的所有色彩。在此实例中,由于显示器能够显示视频内容的所有色彩,因此显示器不必映射或转换视频内容的色彩中的任一个以匹配显示器的能力。
然而,在一些情况下,如果视频内容的内容色域包含显示器的色域外的色彩,那么显示器将不能够显示那些色彩。图5为说明视频内容的色域502、待在其上呈现视频内容的显示器的色域522和在其中译码视频内容的容器的色域532的实例的图式。容器色域532可包含BT.2020色域或其它合适的容器色域。容器色域532的原色坐标包含BT.2020容器的蓝色色彩原色的坐标xB,yB 526、BT.2020容器的红色色彩原色的坐标xR,yR 528和BT.2020容器的绿色色彩原色的坐标xG,yG 530。
内容色域502定义视频内容在亮度值范围内的特定亮度值下的可能彩度(或色彩)值。图5中所展示的蓝色色度坐标xB,yB 516、红色色度坐标xR,yR 518和绿色色度坐标xG,yG520提供定义内容色域502的色彩原色的坐标。显示器色域522定义显示器可呈现的色彩范围,且可由描述显示器可呈现的最大色彩的色彩原色定义。显示器色域522可类似于图4的显示器色域422,且可包含P3色域。
如图5中所展示,显示器色域522未涵盖内容色域502所覆盖的所有色彩。举例来说,内容色域502的绿色色彩原色的色度坐标xG,yG 520与显示器无法呈现的绿色色彩有关。在此些情况下,显示器必须将所接收视频内容映射或转换成显示器色域522内的色彩。类似地,如果显示器的亮度能力并未涵盖视频内容的最小亮度和最大亮度,那么显示器将必须把视频内容的亮度值中的一些映射到显示器的亮度能力。装置可使用内容色域体积消息的内容色域体积信息来执行映射。举例来说,装置可基于在经编码视频位流中用信号传送的消息的一或多个语法元素导出视频内容的内容色域体积。
在一个说明性实例中,内容色域体积消息指示视频内容的色域体积(包含内容色域502以及内容所占用的最小亮度和最大亮度),且显示器(或具有显示器的装置)可基于内容色域体积消息中的内容色域体积信息而识别内容中靠近绿色区的某些色彩在显示器的色域体积外。如果显示器不进行任何色彩映射,那么常规处理链可由于显示器的色域体积外的色彩的再现而产生不可预测的质量。显示器可执行许多色彩映射算法中的一个,其可通过内容色域体积扩展超出显示器色域体积的程度确定。在一些实例中,针对在显示器色域522外的内容色域502中的每一第一色彩,显示器可选择显示器色域522中的第二色彩(例如,在xy空间中在欧几里得(Euclidean)距离中最接近的色彩、朝向显示器的白点(如图2中所展示)的色彩或其它合适的色彩),且可使用所述第二色彩的彩度值来显示第一色彩。以此方式,显示器可确定什么将为映射算法的结果。在一些实例中,显示器还可选择另一算法来执行整个内容色域502到显示器色域522外部的一对一映射。具有内容色域体积信息的内容色域体积消息的存在使得显示器侧装置能够确定需要进行何种处理(如果存在)。
图6为说明跨视频内容的可能亮度值范围的视频内容的各种内容色域622A、622B和622C的实例的图式。可能亮度值范围由最大亮度612和最小亮度614定义。在图6的实例中,视频内容的内容色域跨亮度值范围恒定。展示用于最大亮度值612的第一内容色域622A。展示用于亮度值636的第二内容色域622B。展示用于最小亮度值614的第三内容色域622C。如所展示,内容色域622A到622C中的全部针对不同亮度值612、614和636具有相同色彩值占据面积。
用于亮度值范围内的不同亮度值的色域可以各种方式加以定义。在一个实例中,可确定视频内容在范围内的不同亮度值下的所有实际色域中的最大色域。最大色域接着可用作用于亮度值范围内的所有亮度值的色域。在另一实例中,可确定视频内容在不同亮度值下的色域的平均色域。平均色域接着可用作用于亮度值范围内的所有亮度值的色域。可使用任何其它合适的技术来确定用于所有亮度值的色域。
在其它实例中,色域可根据视频内容在范围内的亮度值中的一或多个下的实际可能色彩值而跨亮度值范围发生变化。图7为说明跨视频内容的可能亮度值范围的视频内容的内容色域722A、722B和722C的另一实例的图式。可能亮度值范围由最大亮度712和最小亮度714定义。在图7中所展示的实例中,视频内容的内容色域跨亮度值范围发生变化。图7中所展示的每一亮度值下的色域包含实际色域,而非跨所有亮度值的预定恒定色域。举例来说,展示用于最大亮度值712的第一内容色域722A,展示用于亮度值736的第二内容色域722B,且展示用于最小亮度值714的第三内容色域722C。如所展示,内容色域722A到722C针对不同亮度值712、714和736具有不同色彩值占据面积。
如先前所提及,客户端侧(或显示器侧)装置可使用内容色域体积消息的内容色域体积信息来执行各种色彩相关功能,例如色彩或亮度之间的映射。举例来说,装置可基于在经编码视频位流中用信号传送的消息的一或多个语法元素导出视频内容的内容色域体积。下文进一步提供包含内容色域体积消息的各种语法元素和变量的实例语法结构。
在一些实例中,消息中的内容色域体积信息可包含描述内容的色域的原色的色度坐标。使用图3作为一说明性实例,内容色域体积消息可包含描述内容色域302的色彩原色的xB,yB 316色度坐标的值、xR,yR 318色度坐标的值和xG,yG 320色度坐标的值。在一些实例中,视频内容的色度坐标可以正规化色度坐标的形式经包含。下文展示指示视频内容的色彩原色的色度坐标的内容色域体积消息的语法元素的一个说明性实例为content_gamut_primary_x[c]和content_gamut_primary_y[c],其中c为色彩原色分量(例如,红色(R)、绿色(G)、蓝色(B)或其它合适的色彩分量)。此些语法元素的另一实例包含ccv_primaries_x[c]和ccv_primaries_y[c]。
在一些实例中,内容色域体积消息中的内容色域体积信息可包含用于导出内容的最小亮度值的值(在本文中被称作亮度值)。在一个说明性实例中,导出结果可为固定点(如何用信号传送语法元素)到浮点(以尼特(nit)为单位)转换。还可使用任何其它合适的技术。下文展示指示用于导出最小亮度值的亮度值的内容色域体积消息的语法元素的一个说明性实例为content_volume_min_lum_value。此语法元素的另一实例包含ccv_min_luminance_value。在一些实例中,内容色域体积消息中的内容色域体积信息还可包含用于导出内容的最大亮度值的亮度值。固定点(如何用信号传送语法元素)到浮点(以尼特为单位)转换或任何其它合适的技术可用于导出最大亮度值。下文展示指示用于导出最大亮度值的亮度值的内容色域体积消息的语法元素的一个说明性实例为content_volume_max_lum_value。此语法元素的另一实例包含ccv_max_luminance_value。在一些实例中,内容色域体积消息中的内容色域体积信息还可包含用于导出内容的平均亮度值的值。指示用于导出平均亮度值的亮度值的内容色域体积消息的语法元素的一个说明性实例为ccv_avg_luminance_value。
在一些实例中,内容色域体积消息的内容色域体积信息可包含用于指定视频内容的色域的色彩原色色度坐标的数目。使用图3作为一说明性实例,三个色彩原色色度坐标可用于指定色域,所述色度坐标包含xB,yB 316色度坐标(用于蓝色原色)、xR,yR色度坐标318(用于红色原色)和xG,yG 320色度坐标(用于绿色原色)。在此实例中,内容色域体积消息中的数目可包含数目三以指示三个色彩原色色度坐标被用于指定视频内容的色域。下文展示指示用于指定视频内容的色域的色彩原色色度坐标的数目的内容色域体积消息的语法元素的一个说明性实例为content_gamut_num_primaries。在一些实例中,用于指定视频内容的色域的色彩原色色度坐标的数目可为预定义或预设数目(例如,视频内容的三个色度坐标的预设数目)。在预设数目的实例中,用于指定视频内容的色域的色彩原色色度坐标的数目不包含于内容色域体积消息中,且客户端侧装置将已知所述预设数目。
在一些实例中,内容色域体积消息中的内容色域体积信息可包含用于指定内容色域体积的多个亮度范围值。在一些实例中,内容色域体积消息可包含用以指定亮度范围相等间隔开还是经明确用信号传送的语法元素。所述语法元素可具有指定多个范围类型的多个值(例如,针对一个值以线性标度相等间隔开、针对另一值以对数标度相等间隔开等等)。
在一些实例中,内容色域体积消息中的内容色域体积信息可包含指定用于指定内容色域体积的亮度值的多个值。在一些实例中,针对经指定的(或基于一或多个其它语法元素推断的)每一亮度值,内容色域体积消息可(例如,在语法元素中)指定用于导出内容色域体积的多个色度坐标。在一些实例中,内容色域体积消息可(例如,在语法元素中)指定用于导出内容色域体积的色彩的色度坐标。
在一些实例中,内容色域体积消息包含补充增强信息(SEI)消息。举例来说,上文所描述的指定内容色域体积信息的语法元素可呈SEI消息的形式。图8为说明具有内容色域体积补充增强信息(SEI)消息的视频位流的实例的图式。视频位流800包含VPS 841、SPS842和PPS 843。如先前所描述,视频位流800的图片中的每一图块参考作用中VPS、SPS和PPS(例如,使用VPS ID、SPS ID和PPS ID)以存取解码装置可用于解码图块的信息。PPS 843可包含适用于给定图片(例如,图片240)中的所有图块的信息。SPS 842可包含适用于视频位流800中的所有图片或适用于视频位流800的同一经译码视频序列(CVS)中的所有图片的信息。VPS 841可包含适用于视频位流800或视频位流800的CVS内的所有层的信息。举例来说,VPS 831可包含具有适用于整个经译码视频序列的语法元素的语法结构。在图8中所展示的实例中,与视频位流800一起频带内用信号传送VPS 841、SPS 842和PPS 843。在其它实例中,可在与含有经译码视频数据的位流800的NAL单元分离的传输中频带外传输VPS 841、SPS 842和/或PPS 843。
视频位流800还包含关于图片840的信息,包含内容色域体积SEI消息844、图块845和图块846。虽然图8的实例中仅展示一个SEI消息,但位流800可包含用于图片840的多于一个SEI消息。举例来说,额外SEI消息可用于用信号传送除内容色域体积信息外的信息。图8中所展示的内容色域体积SEI消息844在图片基础上经用信号传送(针对图片840)。在一些情况下,虽然内容色域体积SEI消息844可能无法在图片基础上经用信号传送(如图8中所展示),但可在块基础上经用信号传送(仅针对位流800的某些图片(例如,每n个数目的图片、在每一随机存取图片处或图片的其它子集)经用信号传送)、在序列级别基础上经用信号传送(针对CVS)、在层基础上经用信号传送、针对整个位流800经用信号传送或其一组合。而且,虽然图8的实例中仅展示图片840的两个图块845和846,但图片840可分割成多于两个图块。在一些情况下,除图8中所展示的信息外的信息可包含于用于图片840的视频位流800中。
在一些实例中,内容色域体积消息可包含于VUI中或包含于一或多个其它参数集(例如,PPS、SPS和/或VPS)中,或可使用HEVC规范或其它规范中未规定的方式来包含所述消息。
在一些实例中,内容色域体积消息中的内容色域体积信息可(例如,使用语法元素)指定用于导出内容色域体积的语法元素的子集可存在于内容色域体积消息(例如,内容色域体积SEI消息)中。在一些实例中,语法元素的一些值用于指示用于导出内容色域体积的语法元素的子集可经用信号传送。在此些实例中,语法元素的其它值用于指示用于导出内容色域体积的语法元素的子集可能无法经用信号传送。
在一些实例中,内容色域体积消息中的内容色域体积信息可包含指示在内容色域体积消息(例如,内容色域体积SEI消息)中用信号传送的多个隐含内容色域体积表示的语法元素。在一些实例中,隐含体积表示可包含与内容的色域(例如,围封内容的一个、一些或所有色彩的色域)相关联的色彩原色中的一或多个以及所述原色或色彩分量中的每一个的最小值和最大值。在一些实例中,内容色域体积消息可用信号传送指定其中指示隐含内容色域体积表示的色彩空间的语法元素。
在一些实例中,内容色域体积消息可用信号传送指示在内容色域体积消息(例如,内容色域体积SEI消息)中用信号传送的多个显式内容色域体积表示的语法元素。在一些实例中,显式体积表示可包含在一个(或多个)色彩分量中指定范围的指示中的一或多个,以及用于指定与一或多个范围或第一分量的一或多个值相关联的内容的色域体积的横截面的第二和第三分量的一或多个坐标。在一些实例中,内容色域体积消息可用信号传送指定其中指示显式内容色域体积表示的色彩空间的语法元素。
在一些实例中,内容色域体积消息可在内容色域体积消息(例如,内容色域体积SEI消息)中用信号传送视频信号信息,包含色彩原色、矩阵系数、转移特性和一或多个视频范围中的至少一或多个。
图9为说明使用本文中所描述技术中的一或多种来处理视频数据的程序900的实例的流程图。在块902处,程序900包含获得视频数据。在一些实例中,视频数据可包含由图像捕捉装置捕捉的视频图片。在一些实例中,视频数据可包含经编码视频数据(例如,经编码视频位流)。在一些实例中,视频数据可包含经解码视频数据。
在块904处,程序900包含处理与视频数据相关联的内容色域体积信息。所述内容色域体积信息指示所述视频数据的一或多个图片的内容色域体积。所述内容色域体积信息包含:与一或多个图片的最小亮度相关联的第一亮度值、与一或多个图片的最大亮度相关联的第二亮度值和描述一或多个图片的色域的一或多个色彩原色的一或多个色度坐标。
在视频数据包含由图像捕捉装置捕捉的视频图片的实例中,处理视频数据可包含产生内容色域体积信息。在此些实例中,处理内容色域体积信息可进一步包含产生内容色域体积消息和将内容色域体积信息包含于内容色域体积消息中。在一些方面中,程序900可包含将内容色域体积消息传输给客户端装置(例如,在经编码视频位流中传输或与经编码视频位流分开传输)。
在视频数据包含经编码视频数据(例如,经编码视频位流)的实例中,处理内容色域体积信息可包含从经编码视频数据解码内容色域体积信息和将内容色域体积信息应用于经解码视频数据。
在视频数据包含经解码视频数据的实例中,处理内容色域体积信息可包含将内容色域体积信息应用于经解码视频数据。在此些实例中,执行所述处理的装置(例如,播放装置、显示装置或其它合适的装置)可不解码视频数据。
在一些实例中,第一亮度值包含正规化最小亮度值,且第二亮度值包含正规化最大亮度值,如先前所描述。
在一些实施中,第一亮度值用于导出一或多个图片的最小亮度值。在一些实施中,第二亮度值用于导出一或多个图片的最大亮度值。举例来说,如先前所描述,固定点(如何用信号传送语法元素)到浮点(以尼特为单位)转换技术可用于导出最小和/或最大亮度值。还可使用任何其它合适的技术。在一些实施中,第一亮度值为最小亮度值,在此情况下,装置可直接使用第一亮度值作为最小亮度值。在一些实施中,第二亮度值为最大亮度值,在此情况下,装置可直接使用第二亮度值作为最大亮度值。
在一些实例中,与视频数据一起提供语法元素。语法元素指示内容色域体积信息的子集经用信号传送。举例来说,语法元素可指定用于导出内容色域体积的语法元素的子集存在于内容色域体积消息中。在一些情况下,语法元素的一些值用于指示用于导出内容色域体积的语法元素的子集可经用信号传送。语法元素的其它值可用于指示用于导出内容色域体积的语法元素的子集可不经用信号传送。语法元素涉及JCTVC-Z1005标准文本中的语法元素ccv_min_luminance_value_present_flag、ccv_max_luminance_value_present_flag和ccv_avg_luminance_value_present_flag。
在一些实施中,使用补充增强信息(SEI)消息的一或多个语法元素来用信号传送内容色域体积信息。举例来说,可产生包含内容色域体积信息的内容色域体积SEI消息。
在一些实例中,一或多个色度坐标包含指定一或多个图片的三个色彩原色的三个色度坐标。所属领域的一般技术人员将了解,可用信号传送其它数目的色度坐标。在一些情况下,三个色度坐标包含:用于一或多个图片的绿色色彩原色的绿色色度坐标、用于一或多个图片的红色色彩原色的红色色度坐标和用于一或多个图片的蓝色色彩原色的蓝色色度坐标。
图10为说明使用本文中所描述技术中的一或多种来编码视频数据的程序1000的实例的流程图。在1002处,程序1000包含获得视频数据。视频数据可包含由图像捕捉装置捕捉的视频图片。视频数据可从图像捕捉装置或从存储视频数据的存储装置获得。
在1004处,程序1000包含使用视频数据来产生经编码视频位流。可使用本文中所描述的编码技术来产生视频位流。在1006处,程序1000包含产生视频数据的内容色域体积信息。所述内容色域体积信息包含:与视频数据的最小亮度相关联的第一亮度值、与视频数据的最大亮度相关联的第二亮度值和描述视频数据的色域的一或多个色彩原色的一或多个色度坐标。
在一些实例中,程序1000包含产生内容色域体积消息。程序1000可将内容色域体积信息包含在内容色域体积消息中。在一些实施中,程序1000可包含将内容色域体积消息传输给客户端装置(例如,解码器装置、播放装置、显示装置等等)。在一些实例中,程序1000包含将经编码视频位流传输给客户端装置。在一些情况下,内容色域体积消息在经编码视频位流中加以传输(例如,作为位流的一或多个包或NAL单元)。在一些情况下,与经编码视频位流分开传输内容色域体积消息。在一些实例中,可在图片级别上产生内容色域体积信息,在此情况下,内容色域体积信息描述图片的内容色域体积。在其它实例中,可在其它视频内容级别上产生内容色域体积信息,例如在块基础上(仅针对位流的某些图片(例如,每n个数目的图片、在每一随机存取图片处或图片的其它子集))、在序列级别基础上(针对CVS)、在层基础上用信号传送、针对整个位流用信号传送或其一组合。
在一些实例中,第一亮度值包含正规化最小亮度值,且第二亮度值包含正规化最大亮度值,如先前所描述。
在一些实施中,第一亮度值用于导出一或多个图片的最小亮度值。在一些实施中,第二亮度值用于导出一或多个图片的最大亮度值。举例来说,如先前所描述,固定点(如何用信号传送语法元素)到浮点(以尼特为单位)转换技术可用于导出最小和/或最大亮度值。还可使用任何其它合适的技术。在一些实施中,第一亮度值为最小亮度值,在此情况下,装置可直接使用第一亮度值作为最小亮度值。在一些实施中,第二亮度值为最大亮度值,在此情况下,装置可直接使用第二亮度值作为最大亮度值。
在一些实例中,与视频数据一起提供语法元素。语法元素指示内容色域体积信息的子集经用信号传送。举例来说,语法元素可指定用于导出内容色域体积的语法元素的子集存在于内容色域体积消息中。在一些情况下,语法元素的一些值用于指示用于导出内容色域体积的语法元素的子集可经用信号传送。语法元素的其它值可用于指示用于导出内容色域体积的语法元素的子集可不经用信号传送。语法元素涉及JCTVC-Z1005标准文本中的语法元素ccv_min_luminance_value_present_flag、ccv_max_luminance_value_present_flag和ccv_avg_luminance_value_present_flag。
在一些实施中,使用补充增强信息(SEI)消息的一或多个语法元素来用信号传送内容色域体积信息。举例来说,可产生包含内容色域体积信息的内容色域体积SEI消息。
在一些实例中,一或多个色度坐标包含指定一或多个图片的三个色彩原色的三个色度坐标。所属领域的一般技术人员将了解,可用信号传送其它数目的色度坐标。在一些情况下,三个色度坐标包含:用于一或多个图片的绿色色彩原色的绿色色度坐标、用于一或多个图片的红色色彩原色的红色色度坐标和用于一或多个图片的蓝色色彩原色的蓝色色度坐标。
图11为说明使用本文中所描述技术中的一或多种来处理视频数据的另一程序1100的实例的流程图。在1102处,程序1100包含获得视频数据。在一些实例中,视频数据可包含经编码视频数据(例如,经编码视频位流)。在一些实例中,视频数据可包含经解码视频数据。
在1104处,程序1100包含获得用于视频数据的一或多个图片的内容色域体积信息。所述内容色域体积信息包含:与一或多个图片的最小亮度相关联的第一亮度值、与一或多个图片的最大亮度相关联的第二亮度值和描述一或多个图片的色域的一或多个色彩原色的一或多个色度坐标。
在1106处,程序1100包含使用内容色域体积信息来确定一或多个图片的内容色域体积。
在一些方面中,程序1100包含接收视频数据(例如,视频位流或经解码视频数据)。在视频数据为经编码视频数据的情况下,程序1100包含解码经编码视频位流以获得视频数据以及获得内容色域体积信息。程序1100接着可包含使用内容色域体积信息来处理经解码视频数据。在视频数据为经解码视频数据的情况下,程序1100包含获得先前经解码视频数据,以及使用内容色域体积信息来处理所述经解码视频数据。可使用本文中所描述的技术使用内容色域体积信息来处理视频数据(例如,将视频内容的彩度(色彩)和/或亮度值映射到显示器的彩度和/或亮度能力,或内容色域体积信息的其它合适用途)。
在一些实例中,第一亮度值包含正规化最小亮度值,且第二亮度值包含正规化最大亮度值,如先前所描述。
在一些实施中,第一亮度值用于导出一或多个图片的最小亮度值。在一些实施中,第二亮度值用于导出一或多个图片的最大亮度值。举例来说,如先前所描述,固定点(如何用信号传送语法元素)到浮点(以尼特为单位)转换技术可用于导出最小和/或最大亮度值。还可使用任何其它合适的技术。在一些实施中,第一亮度值为最小亮度值,在此情况下,装置可直接使用第一亮度值作为最小亮度值。在一些实施中,第二亮度值为最大亮度值,在此情况下,装置可直接使用第二亮度值作为最大亮度值。
在一些实例中,与视频数据一起提供语法元素。语法元素指示内容色域体积信息的子集经用信号传送。举例来说,语法元素可指定用于导出内容色域体积的语法元素的子集存在于内容色域体积消息中。在一些情况下,语法元素的一些值用于指示用于导出内容色域体积的语法元素的子集可经用信号传送。语法元素的其它值可用于指示用于导出内容色域体积的语法元素的子集可不经用信号传送。语法元素涉及JCTVC-Z1005标准文本中的语法元素ccv_min_luminance_value_present_flag、ccv_max_luminance_value_present_flag和ccv_avg_luminance_value_present_flag。
在一些实施中,使用补充增强信息(SEI)消息的一或多个语法元素来用信号传送内容色域体积信息。举例来说,可产生包含内容色域体积信息的内容色域体积SEI消息。
在一些实例中,一或多个色度坐标包含指定一或多个图片的三个色彩原色的三个色度坐标。所属领域的一般技术人员将了解,可用信号传送其它数目的色度坐标。在一些情况下,三个色度坐标包含:用于一或多个图片的绿色色彩原色的绿色色度坐标、用于一或多个图片的红色色彩原色的红色色度坐标和用于一或多个图片的蓝色色彩原色的蓝色色度坐标。
在一些实例中,程序900、1000和1100可通过计算装置或设备(例如,图1中所展示的系统100)执行。举例来说,程序900可通过图1和图12中所展示的编码装置104、通过另一视频源侧装置或视频传输装置、通过图1和图12中所展示的解码装置112和/或通过另一客户端侧装置(例如,播放装置、显示器或任何其它客户端侧装置)执行。程序1000可通过图1和图12中所展示的编码装置104或通过另一视频源侧装置或视频传输装置执行。程序1100可通过图1和图13中所展示的解码装置112或通过另一客户端侧装置(例如,播放装置、显示器或任何其它客户端侧装置)执行。在一些情况下,计算装置或设备可包含处理器、微处理器、微计算机或经配置以进行程序900、1000和1100的步骤的装置的其它组件。在一些实例中,计算装置或设备可包含经配置以捕捉包含视频帧的视频数据(例如,视频序列)的摄像机。在一些实例中,摄像机或捕捉视频数据的其它捕捉装置与计算装置分离,在此情况下,计算装置接收或获得经捕捉视频数据。计算装置可进一步包含经配置以传达视频数据的网络接口。网络接口可经配置以传达基于因特网协议(IP)的数据或其它类型的数据。在一些实例中,计算装置或设备可包含用于显示输出视频内容(例如,视频位流的图片的样本)的显示器。
程序900、1000和1100经说明为逻辑流程图,所述程序的操作表示可以硬件、计算机指令或其一组合实施的一连串操作。在计算机指令的上下文中,操作表示存储于一或多个计算机可读存储媒体上的计算机可执行指令,所述计算机可执行指令在由一或多个处理器执行时执行所述操作。一般来说,计算机可执行指令包含执行特定功能或实施特定数据类型的例程、程序、对象、组件、数据结构等等。描述操作的次序并不打算被理解为限制,且任何数目个经描述操作可按任何次序和/或与实施程序并行地组合。
此外,程序900、1000和1100可在经配置有可执行指令的一或多个计算机系统的控制下加以执行且可被实施为通过硬件或其组合共同执行于一或多个处理器上的代码(例如,可执行指令、一或多个计算机程序或一或多个应用程序)。如上文所提及,代码可存储于计算机可读或机器可读存储媒体上,(例如)呈包括可由一或多个处理器执行的多个指令的计算机程序的形式。计算机可读或机器可读存储媒体可为非暂时性的。
现在描述提供上文所描述技术的实例的各种说明性实施例。展示所述实施例作为标准(所述标准的一实例包含于标准文献JCTVC-Z1005中)的语法结构、语法元素、变量、语义和其它部分的补充。
实施例1
下文提供用于用信号传送上文所提及的色域信息的语法结构和语法语义的实例:
语法结构
语义
content_color_volume_id含有可用于识别SEI消息的目的的识别数目。content_color_volume_id的值应介于0到232-2范围内(包括性的)。
可如由应用程序确定而使用0到255和512到231-1之间的content_color_volume_id值。保留256到511和231到232-2之间的content_color_volume_id值以供ITU-T|ISO/IEC未来使用。遇到介于256到511范围内(包括性的)或介于231到232–2范围内(包括性的)的content_color_volume_id值的解码器应将其忽略。
等于1的content_color_volume_persistence_cancel_flag指示SEI消息以应用于当前层的输出次序取消任何先前内容色域体积SEI消息的持续。等于0的content_color_volume_persistence_cancel_flag指示跟随有内容色域体积信息。
在一些替代方案中,不用信号传送content_color_volume_persistence_cancel_flag且内容色域体积SEI消息的持续经指定为按输出次序以当前图片开始直到接收到下一内容色域体积SEI消息或当新的CLVS开始时的图片。在其它替代方案中,使用POC值(或从POC值导出的值)或使用另一识别符明确地用信号传送SEI消息持续的图片的数目。在一些替代方案中,解码次序还可用于定义持续。
content_gamut_num_primaries指定用于描述内容色域的原色的数目。content_gamut_num_primaries的值应介于0到7的范围内(包括性的)。
content_gamut_primary_x[c]和content_gamut_primary_y[c]分别指定以0.00002增加的内容色域的色彩原色分量c的正规化x和y色度坐标,根据如ISO 11664-1中所指定的x和y的CIE 1931定义(还参见ISO 11664-3和CIE 15)。对于使用红色、绿色和蓝色色彩原色描述内容色域,建议等于0的索引值c应对应于绿色原色,等于1的c应对应于蓝色原色,且等于2的c应对应于红色色彩原色(还参见附件E和表E.3)。content_gamut_primaries_x[c]和content_gamut_primaries_y[c]的值应介于0到50 000范围内(包括性的)。当存在时,等于4、5和6的索引c对应于青色、洋红色和黄色原色。
content_volume_min_lum_value指定用于指定内容的色域体积的最小亮度值。content_volume_min_lum_value的值的单位为0.0001烛光每平方米。
content_volume_max_lum_value指定用于指定内容的色域体积的最大亮度值。content_volume_max_lum_value的值的单位为0.0001烛光每平方米。
content_volume_num_lum_ranges指定用于描述内容体积的亮度范围的数目。content_volume_num_lum_ranges的值应介于0到255范围内(包括性的)。
等于1的content_volume_equal_lum_ranges_flag指定语法元素content_volume_lum_range_value[i]未经明确用信号传送。等于0的content_volume_equal_lum_ranges_flag指定语法元素content_volume_lum_range_value[i]经明确用信号传送。
content_volume_lum_value[i]用以指定用于指定色域体积的第i亮度值,其单位与content_volume_min_lum_value和content_volume_max_lum_value相同。content_volume_lum_values[0]的值经推断等于content_volume_min_lum_value,且content_volume_lum_values[content_volume_num_lum_ranges]的值经推断等于content_volume_max_lum_value(包括性的)。如下导出变量ContentVolumeLuminanceRange[]:
for(i=0;i<=content_volume_num_lum_ranges;i++)
ContentVolumeLuminanceRange[i]=content_volume_lum_value[i]
位流符合性的要求为,对于介于0到content_volume_num_lum_ranges-1范围内(包括性的)的i而言,ContentVolumeLuminanceRange[i]的值小于ContentVolumeLuminanceRange[i+1]的值。
在一些替代方案中,ContentVolumeLuminanceRange[i]的值经指定小于或等于ContentVolumeLuminanceRange[i+1]。
content_volume_num_chrom[i]指定与用于描述内容的色域体积的第i亮度范围相关联的色度的数目。content_volume_num_chrom的值应介于0到15的范围内(包括性的)。
content_volume_chrom_x[i][j]和content_volume_chrom_y[i][j]分别指定以0.00002增加的用于导出第i亮度范围的色域体积的估计值的第j色度坐标的正规化x和y色度坐标,根据如ISO 11664-1中所指定的x和y的CIE 1931定义(还参见ISO 11664-3和CIE15)。content_volume_chrom_x[i][j]和content_volume_chrom_y[i][j]的值应介于0到50000的范围内(包括性的)。
对于i的给定值,使convexRegion[i]通过介于0到content_volume_num_chrom[i]-1的范围内(包括性的)的j的content_volume_chrom_x[i][j]和content_volume_chrom_y[i][j]指代色度坐标的二维凸包。
位流符合性的要求为,对于介于0到content_volume_num_chrom[i]-1范围内(包括性的)的j而言,边界convexRegion[i]包含所有色度坐标content_volume_chrom_x[i][j]和content_volume_chrom_y[i][j]。
色域体积经指定包括于使用介于0到content_volume_num_lum_ranges范围内(包括性的)的i的坐标ContentVolumeLuminanceRange[i]和convexRegion[i]导出的3D区域(colorVolumeBoundingRegion)内。区域colorVolumeBoundingRegion定义如下:如果以下条件中的一个适用,那么具有色度坐标(x,y)和亮度值Y的任何色彩包括于colorVolumeBoundingRegion中:
-Y等于content_volume_lum_max_value且Y包括于convexRegion[content_volume_lum_max_value]中。
-Y小于content_volume_lum_max_value,且存在介于0到content_volume_num_lum_ranges范围内(包括性的)的至少一个lumIdx、色度坐标(x1,y1)和(x2,y2)以及实数k,使得(x1,y1)和(x2,y2)分别属于ContentVolumeLuminanceRange[lumIdx]和ContentVolumeLuminanceRange[lumIdx+1],k的值介于0到1范围内(包括性的),并且k*x1+(1–k)*x2等于x且k*y1+(1–k)*y2等于y。
在一个替代方案中,对于介于0到content_volume_num_lum_ranges-1范围内(包括性的)的每一个i而言,对于介于ContentVolumeLuminanceRange[i]到ContentVolumeLuminanceRange[i+1]范围内的亮度值而言,色域体积经指定包括在由色度坐标content_volume_chrom_x[i][j]和content_volume_chrom_y[i][j]指定的content_volume_num_chrom[i]点的凸包内。
在一些替代方案中,content_volume_min_lum_value和content_volume_max_lum_value的最大值限于固定范围内。举例来说,语法元素的值可受限而小于或等于10000尼特。
在一些替代方案中,语法元素content_volume_min_lum_value和content_volume_max_lum_value经指定为内容的正规化最小和最大亮度。
在一些替代方案中,添加限制,使得针对每一亮度指定色度点的最小数目且将语法元素content_volume_num_chrom[i]译码为基于色度点的最小数目的差值。
在一些替代方案中,以不同色彩空间描述色域体积且携载的语法元素对应于坐标。举例来说,当在YCbCr空间中描述经译码内容时,用于描述凸包的亮度值对应于明度码字,且用于描述凸包的色度坐标对应于色度码字。在此些替代方案中,用于描述亮度坐标和色度坐标的位数目可等于位流中的明度值和色度值的位深度。
在另一替代方案中,使用经δ译码值来指定用于指定描述内容色域体积的凸包的亮度值。举例来说,用信号传送语法元素content_volume_lum_range_width[]:
content_volume_lum_range_width[i]用于指定第i亮度范围的宽度,其单位与content_volume_min_lum_value和content_volume_max_lum_value相同。如下导出变量ContentVolumeLuminanceRange[]:
在一些替代方案中,content_volume_equal_lum_ranges_flag经用信号传送为整数,其中一个值指示用于描述内容色域体积的亮度点在线性域中相等地间隔开,另一值指示用于描述内容色域体积的亮度点在对数域中相等地间隔开,且又一值指示亮度点经明确用信号传送。
实施例2
在此实施例中,语法结构与实施例1中类似,通过关于用信号传送的改变推断用于指定内容色域体积的亮度值和一些语法元素的推断值。还对内容色域体积的导出进行修改。
语法结构
语义
内容色域体积SEI消息指示可供显示装置使用以根据显示器规范映射内容的内容的色域体积。
content_color_volume_id含有可用于识别SEI消息的目的的识别数目。content_color_volume_id的值应介于0到232-2范围内(包括性的)。
可如由应用程序确定而使用0到255和512到231-1之间的content_color_volume_id值。保留256到511和231到232-2之间的content_color_volume_id值以供ITU-T|ISO/IEC未来使用。遇到介于256到511范围内(包括性的)或介于231到232–2范围内(包括性的)的content_color_volume_id值的解码器应将其忽略。
等于1的content_color_volume_persistence_cancel_flag指示SEI消息以应用于当前层的输出次序取消任何先前内容色域体积SEI消息的持续。等于0的content_color_volume_persistence_cancel_flag指示跟随有内容色域体积信息。
对于介于0到2范围内(包括性的)的c而言,content_gamut_primary_x[c]和content_gamut_primary_y[c]分别指定以0.00002增加的内容色域的色彩原色分量c的正规化x和y色度坐标,根据如ISO 11664-1中所指定的x和y的CIE 1931定义(还参见ISO11664-3和CIE 15)。对于使用红色、绿色和蓝色色彩原色描述内容色域,建议等于0的索引值c应对应于绿色原色,等于1的c应对应于蓝色原色,且等于2的c应对应于红色色彩原色(还参见附件E和表E.3)。content_gamut_primaries_x[c]和content_gamut_primaries_y[c]的值应介于0到50 000范围内(包括性的)。
content_volume_min_lum_value指定用于指定内容的色域体积的最小亮度值。content_volume_min_lum_value的值的单位为0.0001烛光每平方米。
content_volume_max_lum_value指定用于指定内容的色域体积的最大亮度值。content_volume_max_lum_value的值的单位为0.0001烛光每平方米。
等于0的content_volume_info_present_flag指定SEI消息中不存在指定内容色域体积信息的额外语法元素。等于1的content_volume_info_present_flag指定SEI消息中存在指定内容色域体积信息的额外语法元素。
content_volume_num_lum_ranges_minus1加1指定用于描述内容体积的亮度范围的数目。content_volume_num_lum_ranges_minus1的值应介于0到255范围内(包括性的)。当不存在时,推断content_volume_num_lum_ranges_minus1的值等于0。
变量ContentVolumeNumLumRanges经设定等于content_volume_num_lum_ranges_minus1+1。
等于0的content_volume_equal_lum_ranges_idc指定语法元素content_volume_lum_value[i]经明确用信号传送。等于1或2的content_volume_equal_lum_ranges_idc指定语法元素content_volume_lum_value[i]未经明确用信号传送。当content_volume_num_lum_ranges_minus1等于0时,推断content_volume_equal_lum_ranges_idc的值等于1。content_volume_equal_lum_ranges_idc的值应介于0到2范围内(包括性的)。保留等于3的content_volume_equal_lum_ranges_idc的值以供ITU-T|ISO/IEC未来使用。
当content_volume_equal_lum_ranges_idc等于0时,content_volume_lum_value[i]用以导出用于指定色域体积的第i亮度值,其单位与content_volume_min_lum_value和content_volume_max_lum_value相同。
对于介于0到ContentVolumeNumLumRanges范围内(包括性的)的i,如下导出变量ContentVolumeLuminanceRange[]:
其中“/”运算指示不舍入到整数的除法。
content_volume_num_chrom[i]指定与用于描述内容的色域体积的第i亮度范围相关联的色度的数目。content_volume_num_chrom[i]的值应介于0到15范围内(包括性的)。当不存在时,推断content_volume_num_chrom[i]的值等于3。
content_volume_chrom_x[i][j]和content_volume_chrom_y[i][j]分别指定以0.00002增加的用于导出第i亮度值的色域体积的估计值的第j色度坐标的正规化x和y色度坐标,根据如ISO 11664-1中所指定的x和y的CIE 1931定义(还参见ISO 11664-3和CIE15)。content_volume_chrom_x[i][j]和content_volume_chrom_y[i][j]的值应介于0到50000的范围内(包括性的)。
当不存在时,对于介于0到content_volum_num_chrom[i]-1范围内(包括性的)的c和介于0到ContentVolumeNumLumRanges范围内(包括性的)的i而言,推断content_volume_chrom_x[i][c]和content_volume_chrom_y[i][c]的值分别等于content_gamut_primary_x[c]和content_gamut_primary_y[c]。
对于介于0到ContentVolumeNumLumRanges范围内(包括性的)的i的每一个值,使convexRegion[i]指代介于0到content_volume_num_chrom[i]-1范围内(包括性的)的j的色度坐标content_volume_chrom_x[i][j]和content_volume_chrom_y[i][j]的二维凸包。
内容的色域体积colorVolumeBoundingRegion被定义为介于0到ContentVolumeNumLumRanges-1的范围内(包括性的)的i的colorVolumeRegions[i]的联集,其中colorVolumeRegions[i]被定义为点convexRegion[i]和convexRegion[i+1]的三维凸包:
在一些替代方案中,如下导出色域体积:
位流符合性的要求为,对于介于0到content_volume_num_chrom[i]-1范围内(包括性的)的j而言,convexRegion[i]的边界包含所有色度坐标content_volume_chrom_x[i][j]和content_volume_chrom_y[i][j]。
色域体积经指定包括在使用介于0到ContentVolumeNumLumRanges范围内(包括性的)的i的坐标ContentVolumeLuminanceRange[i]和convexRegion[i]导出的3D区域colorVolumeBoundingRegion内。区域colorVolumeBoundingRegion定义如下:如果以下条件中的一个适用,那么具有色度坐标(x,y)和亮度值Y的任何色彩包括于colorVolumeBoundingRegion中:
-Y等于content_volume_lum_max_value且Y包括于convexRegion[content_volume_lum_max_value]中。
-Y小于content_volume_lum_max_value,且存在色度坐标(x1,y1)和(x2,y2)、介于0到1范围内(包括性的)的实数k和介于0到ContentVolumeNumLumRanges-1范围内(包括性的)的至少一个lumIdx,使得(x1,y1)和(x2,y2)分别属于convexRegion[lumIdx]和convexRegion[lumIdx+1],Y大于或等于ContentVolumeLuminanceRange[lumIdx]且小于ContentVolumeLuminanceRange[lumIdx+1],并且k*x1+(1-k)*x2等于x且k*y1+(1-k)*y2等于y。
在一些替代方案中,当content_volume_equal_lum_ranges_idc等于2时,使用固定点实施方案导出变量ContentVolumeLuminanceRange[]。
实施例3
在此实施例中,用信号传送一或多个隐含色域体积表示和一或多个显式色域体积表示,包含指示体积表示的数目的语法元素和指定所指示的体积表示的类型的指示符。术语色域(color)和色域(colour)在本文中具有相同意义。
语法结构
内容色域体积SEI消息的语法
内容色域体积SEI消息的语义
内容色域体积SEI消息指示可供显示装置使用以根据显示器规范映射内容的内容的色域体积。当经解码视频的色彩空间与内容色域体积表示的色彩空间不匹配时,进行转换程序以将经解码视频变换为色域体积的表示,且接着通过存在于SEI消息中的色域体积表示描述体积表示。当内容色域体积表示处于线性域中时,使用colour_primaries、transfer_charactreristics和matrix_coeffs将经解码视频变换成线性光域中的表示。
content_colour_volume_id含有可用于识别SEI消息的目的的识别数目。content_colour_volume_id的值应介于0到232-2范围内(包括性的)。
可如由应用程序确定而使用0到255和512到231-1之间的content_colour_volume_id值。保留256到511和231到232-2之间的content_colour_volume_id值以供ITU-T|ISO/IEC未来使用。遇到介于256到511范围内(包括性的)或介于231到232-2范围内(包括性的)的content_colour_volume_id值的解码器应将其忽略。
等于1的content_colour_volume_persistence_cancel_flag指示SEI消息以应用于当前层的输出次序取消任何先前内容色域体积SEI消息的持续。等于0的content_colour_volume_persistence_cancel_flag指示跟随有内容色域体积信息。
对于介于0到2范围内(包括性的)的c而言,content_gamut_primary_x[c]和content_gamut_primary_y[c]分别指定以0.00002增加的内容色域的色彩原色分量c的正规化x和y色度坐标,根据如ISO 11664-1中所指定的x和y的CIE 1931定义(还参见ISO11664-3和CIE 15)。对于使用红色、绿色和蓝色色彩原色描述内容色域,建议等于0的索引值c应对应于绿色原色,等于1的c应对应于蓝色原色,且等于2的c应对应于红色色彩原色(还参见附件E和表E.3)。content_gamut_primaries_x[c]和content_gamut_primaries_y[c]的值应介于0到50 000范围内(包括性的)。
content_volume_min_lum_value指定用于指定内容的色域体积的最小亮度值。content_volume_min_lum_value的值的单位为0.0001烛光每平方米。
content_volume_max_lum_value指定用于指定内容的色域体积的最大亮度值。content_volume_max_lum_value的值的单位为0.0001烛光每平方米。
colour_volume_num_implicit_repn指定在SEI消息中指定的内容的隐含体积表示的数目。colour_volume_num_implicit_repn的值应介于0到7范围内(包括性的)。保留介于8到255范围内(包括性的)的colour_volume_num_implicit_repn值以供ITU-T|ISO/IEC未来使用。
如表1中所描述,colour_volume_implicit_repn_type[i]指定语法元素impl_vol_repn_primary_x[i][]、impl_vol_repn_primary_y[i][]、impl_vol_repn_primary_min[i][]和impl_vol_repn_primary_max[i][]以及变量NumValsRepn[i]和PrimariesPresentFlag[i]的解释。colour_volume_implicit_repn_type[i]的值应介于0到6范围内(包括性的)。保留介于7到255范围内(包括性的)的colour_volume_implicit_repn_type[i]值以供ITU-T|ISO/IEC未来使用。
colour_volume_impl_repn_primary_x[i][j]和colour_volume_impl_repn_primary_y[i][j]分别指定如表1中所解释的以0.00002增加的原色色域体积表示的色彩原色分量c的正规化x和y色度坐标,根据如ISO 11664-1中所指定的x和y的CIE 1931定义(还参见ISO 11664-3和CIE 15)。对每一原色的索引值的解释如表1中所指定。colour_volume_impl_repn_primary_x[i][j]和colour_volume_impl_repn_primary_y[i][j]的值应介于0到50 000范围内(包括性的)。
colour_volume_impl_primary_min[i][j]和colour_volume_impl_primary_max[i][j]分别指定以0.0001烛光每平方米为单位的转换成对应色彩空间后的信号的标称最大值和最小值,其中色彩空间在表1中指定。当存在时,colour_volume_impl_primary_min[i][j]应小于colour_volume_impl_primary_max[i][j]。
当colour_volume_implicit_repn_type[i]等于3、4或6时,以两两互补标记法用信号传送语法元素colour_volume_impl_repn_primary_min[i][]和colour_volume_impl_repn_primary_max[i][]。当colour_volume_implicit_repn_type等于0、1、2和5时,不以两两互补标记法用信号传送colour_volume_impl_repn_primary_min[i][]和colour_volume_impl_repn_primary_max[i][]。
表1:explicit_volume_representation_type的解释
colour_volume_num_explicit_repn指定在SEI消息中指定的内容的显式体积表示的数目。colour_volume_num_explicit_repn的值应介于0到2范围内(包括性的)。保留介于3到255范围内(包括性的)的colour_volume_num_explicit_repn值以供ITU-T|ISO/IEC未来使用。
如表1中所描述,colour_volume_explicit_repn_type[i]指定语法元素colour_volume_expl_num_coord_1[i][j][k]、colour_volume_expl_num_coord_2[i][j][k]和colour_volume_expl_range_value[i][j]的解释。colour_volume_explicit_repn_type[i]的值应介于0到1范围内(包括性的)。保留介于2到255范围内(包括性的)的colour_volume_explicit_repn_type[i]值以供ITU-T|ISO/IEC未来使用。
colour_volume_expl_num_ranges_minus2[i]加2指定用于第i显式表示的范围数目以描述如由表1所指定的色彩空间中的内容体积的横截面。colour_volume_explicit_num_ranges_minus2[i]的值应介于0到255范围内(包括性的)。当不存在时,推断colour_volume_explicit_num_ranges_minus2[i]的值等于0。
设定变量ColourVolumeExplNumRanges[i]等于colour_volume_explicit_num_ranges_minus2[i]+2。
等于0的colour_volume_expl_ranges_idc[i]指定语法元素colour_volume_expl_range_value[i][j]经明确用信号传送。等于1或2的colour_volume_expl_ranges_idc[i]指定介于1到ColourVolumeExplNumRanges[i]-1范围内(包括性的)的j的语法元素colour_volume_expl_range_value[i][j]不经明确用信号传送。当colour_volume_expl_num_ranges_minus2等于0时,推断colour_volume_expl_ranges_idc[i]的值等于1。colour_volume_expl_ranges_idc[i]的值应介于0到2范围内(包括性的)。保留等于3的colour_volume_expl_ranges_idc[i]的值以供ITU-T|ISO/IEC未来使用。
使用colour_volume_expl_range_val[i][j]导出第一维度的第j值,如由colour_volume_explicit_repn_type[i]和表1的语义所描述,其用于指定内容的色域体积。colour_volume_expl_range_val[i][j]的值以0.0001单位增加,如针对表1中的第一维度所指定。
对于介于0到ColourVolumeExplNumRanges[i]范围内(包括性的)的i而言,如下导出变量ColourVolumeExplRange[]:
colour_volume_expl_num_coord[i]指定与内容的色域体积的第i显式表示的第j亮度范围相关联的点的数目。colour_volume_expl_num_coord[i]的值应介于0到15范围内(包括性的)。
colour_volume_expl_coord_1[i][j][k]和colour_volume_expl_coord_2[i][j][k]分别指定对应于第j范围的第k坐标的第二和第三分量的坐标,所述第j范围用于导出以0.00002增加的色域体积的估计值。colour_volume_expl_coord_1[i][j][k]和colour_volume_expl_coord_2[i][j][k]的值应介于0到50 000范围内(包括性的)。
对于介于0到ColourVolumeExplNumRanges[i]范围内(包括性的)的j的每一个值,使convexRegion[i][j]指代介于0到colour_volume_expl_num_coord[i]-1范围内(包括性的)的k的坐标colour_volume_expl_coord_1[i][j][k]和colour_volume_expl_coord_2[i][j][k]的二维凸包。
内容的色域体积colourVolumeBoundingRegion被定义为介于0到ColourVolumeExplNumRanges[i]-1范围内(包括性的)的j的colourVolumeRegions[i][j]的联集,其中colourVolumeRegions[i][j]被定义为点convexRegion[i][j]和convexRegion[i][j+1]的三维凸包:
在其它替代方案中,还可针对线性域中的RGB分量、非线性域中的RGB分量或非线性域中的YCbCr中的一或多个用信号传送显式体积表示。
在一些替代方案中,以如相应语法元素的语义中所描述的增量表示与隐含和显式体积表示相关联的语法元素,且在表中描述色域表示的相应分量的单位。
可使用经压缩视频或使用未经压缩视频帧(在压缩之前或在压缩之后)来实施本文中所描述的内容色域体积技术。实例视频编码和解码系统包含提供稍后待由目的地装置解码的经编码视频数据的源装置。特定来说,源装置经由计算机可读媒体将视频数据提供给目的地装置。源装置和目的地装置可包括广泛范围的装置中的任一种,包含台式计算机、笔记型(即,膝上型)计算机、平板计算机、机顶盒、电话手机(例如,所谓的“智能型”手机)、所谓的“智能型”平板、电视、摄像机、显示装置、数字媒体播放器、视频游戏控制台、视频流式传输装置等等。在一些情况下,源装置和目的地装置可经装备以用于无线通信。
目的地装置可经由计算机可读媒体接收待解码的经编码视频数据。计算机可读媒体可包括能够将经编码视频数据从源装置移动到目的地装置的任何类型的媒体或装置。在一个实例中,计算机可读媒体可包括通信媒体以使得源装置能够实时地将经编码视频数据直接传输给目的地装置。可根据通信标准(例如,无线通信协议)调制经编码视频数据,且将经编码视频数据传输给目的地装置。通信媒体可包括任何无线或有线通信媒体,例如射频(RF)频谱或一或多个物理传输线。通信媒体可形成基于包的网络(例如,局域网、广域网或例如因特网的全球网络)的部分。通信媒体可包含路由器、交换器、基站或可用于促进从源装置到目的地装置的通信的任何其它设备。
在一些实例中,经编码数据可从输出接口输出到存储装置。类似地,可通过输入接口从存储装置存取经编码数据。存储装置可包含多种分布式或本地存取的数据存储媒体中的任一种,例如硬盘驱动器、蓝光光盘、DVD、CD-ROM、快闪存储器、易失性或非易失性存储器或用于存储经编码视频数据的任何其它合适的数字存储媒体。在另一实例中,存储装置可对应于文件服务器或可存储由源装置产生的经编码视频的另一中间存储装置。目的地装置可经由流式传输或下载从存储装置存取所存储的视频数据。文件服务器可为能够存储经编码视频数据且将彼经编码视频数据传输给目的地装置的任何类型的服务器。实例文件服务器包含网页服务器(例如,用于网站)、FTP服务器、网络附接存储(NAS)装置或本地磁盘机。目的地装置可经由任何标准数据连接(包含因特网连接)来存取经编码视频数据。此数据连接可包含无线信道(例如,Wi-Fi连接)、有线连接(例如,DSL、缆线调制解调器等)或适用于存取存储于文件服务器上的经编码视频数据的两者的一组合。来自存储装置的经编码视频数据的传输可为流式传输、下载传输或其组合。
本发明的技术不必限于无线应用或设定。所述技术可应用于视频译码以支持多种多媒体应用中的任一种,例如,空中电视广播、有线电视传输、卫星电视传输、因特网流式视频传输(例如,经由HTTP的动态自适应流式传输(DASH))、经编码到数据存储媒体上的数字视频、存储于数据存储媒体上的数字视频的解码或其它应用。在一些实例中,系统可经配置以支持单向或双向视频传输以支持例如视频流式传输、视频播放、视频广播和/或视频电话的应用。
在一个实例中,源装置包含视频源、视频编码器和输出接口。目的地装置可包含输入接口、视频解码器和显示装置。源装置的视频编码器可经配置以应用本文中所公开的技术。在其它实例中,源装置和目的地装置可包含其它组件或布置。举例来说,源装置可从外部视频源(例如,外部摄像机)接收视频数据。同样,目的地装置可与外部显示装置介接,而非包含集成式显示装置。
以上实例系统仅为一个实例。用于并行地处理视频数据的技术可由任何数字视频编码和/或解码装置执行。尽管本发明的技术通常由视频编码装置执行,但所述技术还可由视频编码器/解码器(通常被称作“编解码器”)执行。此外,本发明的技术还可由视频预处理器执行。源装置和目的地装置仅为源装置产生经译码视频数据以供传输给目的地装置的此类译码装置的实例。在一些实例中,源装置和目的地装置可以大体上对称的方式操作,使得所述装置中的每一个包含视频编码和解码组件。因此,实例系统可支持视频装置之间的单向或双向视频传输以用于(例如)视频流式传输、视频播放、视频广播或视频电话。
视频源可包含视频捕捉装置,例如视频摄像机、含有先前捕捉的视频的视频存档和/或用以从视频内容提供者接收视频的视频馈入接口。作为另一替代方案,视频源可产生基于计算机图形的数据作为源视频,或实况视频、存档视频和计算机产生的视频的组合。在一些情况下,如果视频源为视频摄像机,那么源装置和目的地装置可形成所谓的摄像机电话或视频电话。然而,如上文所提及,本发明中描述的技术一般可应用于视频译码,且可应用于无线和/或有线应用。在每一情况下,可由视频编码器编码所捕捉、经预捕捉或计算机产生的视频。经编码视频信息接着可由输出接口输出到计算机可读媒体上。
如所提及,计算机可读媒体可包含例如无线广播或有线网络传输的暂时性媒体,或存储媒体(即,非暂时性存储媒体),例如硬盘驱动器、闪存驱动器、紧密光盘、数字视频光盘、蓝光光盘或其它计算机可读媒体。在一些实例中,网络服务器(未图示)可从源装置接收经编码视频数据,且(例如)经由网络传输将经编码视频数据提供给目的地装置。类似地,媒体生产设施(例如,光盘冲压设施)的计算装置可从源装置接收经编码视频数据且生产含有经编码视频数据的光盘。因此,在各种实例中,计算机可读媒体可理解为包含各种形式的一或多个计算机可读媒体。
目的地装置的输入接口从计算机可读媒体接收信息。计算机可读媒体的信息可包含由视频编码器定义的语法信息(其还由视频解码器使用),所述语法信息包含描述块和其它经译码单元(例如,图片群组(GOP))的特性和/或处理的语法元素。显示装置将经解码视频数据显示给用户,且可包括多种显示装置中的任一种,例如阴极射线管(CRT)、液晶显示器(LCD)、等离子体显示器、有机发光二极管(OLED)显示器或另一类型的显示装置。已描述本发明的各种实施例。
编码装置104和解码装置112的特定细节分别展示于图12和图13中。图12为说明可实施本发明中所描述技术中的一或多种的实例编码装置104的框图。编码装置104可(例如)产生本文中所描述的语法结构(例如,VPS、SPS、PPS或其它语法元素的语法结构)。编码装置104可执行视频图块内的视频块的帧内预测和帧间预测译码。如先前所描述,帧内译码至少部分地依赖于空间预测以减少或去除给定视频帧或图片内的空间冗余。帧间译码至少部分地依赖于时间预测以减少或去除视频序列的邻近或周围帧内的时间冗余。帧内模式(I模式)可指若干基于空间的压缩模式中的任一种。帧间模式(例如,单向预测(P模式)或双向预测(B模式))可指若干基于时间的压缩模式中的任一个。
编码装置104包含分割单元35、预测处理单元41、滤波器单元63、图片存储器64、求和器50、变换处理单元52、量化单元54和熵编码单元56。预测处理单元41包含运动估计单元42、运动补偿单元44和帧内预测处理单元46。对于视频块重构建,编码装置104还包含反量化单元58、反变换处理单元60和求和器62。滤波器单元63打算表示一或多个回路滤波器,例如解块滤波器、自适应回路滤波器(ALF)和样本自适应偏移(SAO)滤波器。尽管滤波器单元63在图12中展示为回路滤波器,但在其它配置中,滤波器单元63可实施为后回路滤波器。后处理装置57可对由编码装置104产生的经编码视频数据执行额外处理。在一些情况下,本发明的技术可通过编码装置104实施。然而,在其它情况下,本发明的技术中的一或多种可通过后处理装置57实施。
如图12中所展示,编码装置104接收视频数据,且分割单元35将数据分割成视频块。分割还可包含分割成图块、图块区段、图像块或其它较大单元以及(例如)根据LCU和CU的四分树结构的视频块分割。编码装置104通常说明对待编码的视频图块内的视频块进行编码的组件。可将图块划分成多个视频块(且可能划分成被称作图像块的视频块集合)。预测处理单元41可基于错误结果(例如,译码速率和失真程度等等)选择多个可能译码模式中的一个(例如,多个帧内预测译码模式中的一个或多个帧间预测译码模式中的一个)以用于当前视频块。预测处理单元41可将所得经帧内或帧间译码块提供给求和器50以产生残余块数据且提供给求和器62以重构建经编码块以用作参考图片。
预测处理单元41内的帧内预测处理单元46可执行当前视频块相对于与待译码的当前块在同一帧或图块中的一或多个相邻块的帧内预测译码,以提供空间压缩。预测处理单元41内的运动估计单元42和运动补偿单元44执行当前视频块相对于一或多个参考图片中的一或多个预测性块的帧间预测性译码,以提供时间压缩。
运动估计单元42可经配置以根据视频序列的预定图案来确定用于视频图块的帧间预测模式。预定图案可将序列中的视频图块指定为P图块、B图块或GPB图块。运动估计单元42和运动补偿单元44可高度集成,但出于概念目的而单独说明。由运动估计单元42执行的运动估计为产生估计视频块的运动的运动向量的程序。运动向量(例如)可指示当前视频帧或图片内的视频块的预测单元(PU)相对于参考图片内的预测性块的位移。
预测性块为就像素差而言被发现紧密匹配待译码的视频块的PU的块,所述像素差可通过绝对差总和(SAD)、平方差总和(SSD)或其它差度量来确定。在一些实例中,编码装置104可计算存储于图片存储器64中的参考图片的子整数像素位置的值。举例来说,编码装置104可内插参考图片的四分之一像素位置、八分之一像素位置或其它分数像素位置的值。因此,运动估计单元42可执行相对于全像素位置和分数像素位置的运动搜索且输出具有分数像素精度的运动向量。
运动估计单元42通过比较PU的位置与参考图片的预测性块的位置而计算经帧间译码图块中的视频块的PU的运动向量。参考图片可选自第一参考图片列表(列表0)或第二参考图片列表(列表1),所述参考图片列表中的每一个识别存储于图片存储器64中的一或多个参考图片。运动估计单元42将所计算的运动向量发送给熵编码单元56和运动补偿单元44。
由运动补偿单元44执行的运动补偿可涉及基于由运动估计确定的运动向量提取或产生预测性块,可能执行内插达子像素精度。在接收到当前视频块的PU的运动向量之后,运动补偿单元44可在参考图片列表中定位运动向量指向的预测性块。编码装置104通过从正经译码的当前视频块的像素值减去预测性块的像素值从而形成像素差值来形成残余视频块。像素差值形成用于块的残余数据,且可包含明度和色度差分量两者。求和器50表示执行此减法运算的一或多个组件。运动补偿单元44还可产生与视频块和视频图块相关联的语法元素,以供解码装置112用于解码视频图块的视频块。
作为如上文所描述的由运动估计单元42和运动补偿单元44执行的帧间预测的替代方案,帧内预测处理单元46可对当前块进行帧内预测。特定地说,帧内预测处理单元46可确定帧内预测模式以用以编码当前块。在一些实例中,帧内预测处理单元46可(例如)在单独的编码遍次期间使用各种帧内预测模式编码当前块,且帧内预测处理单元46可从所测试模式选择适当帧内预测模式来使用。举例来说,帧内预测处理单元46可使用对各种所测试帧内预测模式的速率-失真分析来计算速率-失真值,且可在所测试模式间选择具有最佳速率-失真特性的帧内预测模式。速率-失真分析大体上确定经编码块与原始未经编码块(其经编码以产生经编码块)之间的失真(或误差)量,以及用以产生经编码块的位速率(即,位的数目)。帧内预测处理单元46可从各种经编码块的失真和速率计算比率以确定哪一帧内预测模式展现块的最佳速率-失真值。
在任何情况下,在选择用于块的帧内预测模式之后,帧内预测处理单元46可将指示用于块的所选择帧内预测模式的信息提供给熵编码单元56。熵编码单元56可编码指示所选择帧内预测模式的信息。编码装置104可将各种块的编码上下文的定义以及用于上下文中的每一个的最可能的帧内预测模式、帧内预测模式索引表和经修改的帧内预测模式索引表的指示包含于经传输位流配置数据中。位流配置数据可包含多个帧内预测模式索引表和多个经修改的帧内预测模式索引表(也被称作码字映射表)。
在预测处理单元41经由帧间预测或帧内预测产生当前视频块的预测性块之后,编码装置104通过从当前视频块减去预测性块而形成残余视频块。残余块中的残余视频数据可包含于一或多个TU中且被应用于变换处理单元52。变换处理单元52使用例如离散余弦变换(DCT)或概念上类似变换的变换将残余视频数据变换成残余变换系数。变换处理单元52可将残余视频数据从像素域转换到变换域(例如,频域)。
变换处理单元52可将所得变换系数发送给量化单元54。量化单元54量化变换系数以进一步降低位速率。所述量化程序可减小与所述系数中的一些或所有相关联的位深度。可通过调整量化参数来修改量化程度。在一些实例中,量化单元54可接着执行对包含经量化变换系数的矩阵的扫描。替代性地,熵编码单元56可执行扫描。
在量化之后,熵编码单元56对经量化变换系数进行熵编码。举例来说,熵编码单元56可执行上下文自适应可变长度译码(CAVLC)、上下文自适应二进制算术译码(CABAC)、基于语法的上下文自适应二进制算术译码(SBAC)、概率区间分割熵(PIPE)译码或另一熵编码技术。在通过熵编码单元56进行熵编码之后,可将经编码位流传输给解码装置112,或加以存档以供稍后由解码装置112传输或检索。熵编码单元56还可对正经译码的当前视频图块的运动向量和其它语法元素进行熵编码。
反量化单元58和反变换处理单元60分别应用反量化和反变换以重构建像素域中的残余块以供稍后用作参考图片的参考块。运动补偿单元44可通过将残余块添加到参考图片列表内的参考图片中的一个的预测性块来计算参考块。运动补偿单元44还可将一或多个内插滤波器应用于经重构建残余块,以计算子整数像素值以用于运动估计中。求和器62将经重构建残余块添加到由运动补偿单元44所产生的经运动补偿预测块以产生用于存储于图片存储器64中的参考块。参考块可由运动估计单元42和运动补偿单元44用作参考块以帧间预测后续视频帧或图片中的块。
以此方式,图12的编码装置104表示经配置以产生经编码视频位流的语法的视频编码器的实例。如上文所描述,编码装置104可(例如)产生用于CRI SEI消息的语法。编码装置104可执行本文中所描述技术中的任一种,包含上文关于图9和图10所描述的程序。已大体上关于编码装置104描述本发明的技术,但如上文所提及,本发明的技术中的一些还可通过后处理装置57实施。
图13为说明实例解码装置112的框图。解码装置112包含熵解码单元80、预测处理单元81、反量化单元86、反变换处理单元88、求和器90、滤波器单元91和图片存储器92。预测处理单元81包含运动补偿单元82和帧内预测处理单元84。在一些实例中,解码装置112可执行大体上与关于图12的编码装置104描述的编码遍次互逆的解码遍次。解码装置112可执行本文中所描述技术中的任一种,包含上文关于图9和图11所描述的程序。
在解码程序期间,解码装置112接收表示由编码装置104发送的经编码视频图块的视频块和相关联语法元素的经编码视频位流。在一些实施例中,解码装置112可从编码装置104接收经编码视频位流。在一些实施例中,解码装置112可从网络实体79接收经编码视频位流,所述网络实体例如服务器、媒体感知网络元件(MANE)、视频编辑器/剪接器或经配置以实施上文所描述技术中的一或多种的其它此类装置。网络实体79可或可不包含编码装置104。本发明中所描述的技术中的一些可在网络实体79将经编码视频位流传输给解码装置112之前由网络实体79实施。在一些视频解码系统中,网络实体79和解码装置112可为单独装置的部分,而在其它情况下,关于网络实体79所描述的功能性可由包括解码装置112的相同装置执行。
解码装置112的熵解码单元80对位流进行熵解码以产生经量化系数、运动向量和其它语法元素。熵解码单元80将运动向量和其它语法元素转递到预测处理单元81。解码装置112可接收视频图块级别和/或视频块级别的语法元素。熵解码单元80可处理并剖析例如VPS、SPS和PPS的一或多个参数集中的固定长度语法元素和可变长度语法元素两者。
当视频图块经译码为经帧内译码(I)图块时,预测处理单元81的帧内预测处理单元84可基于来自当前帧或图片的先前经解码块的经用信号传送帧内预测模式和数据而产生当前视频图块的视频块的预测数据。当视频帧经译码为经帧间译码(即,B、P或GPB)图块时,预测处理单元81的运动补偿单元82基于从熵解码单元80接收的运动向量和其它语法元素而产生当前视频图块的视频块的预测性块。可从参考图片列表内的参考图片中的一个产生预测性块。解码装置112可基于存储于图片存储器92中的参考图片使用默认构建技术来构建参考帧列表(列表0和列表1)。
运动补偿单元82通过剖析运动向量和其它语法元素来确定当前视频图块的视频块的预测信息,且使用所述预测信息产生正经解码的当前视频块的预测性块。举例来说,运动补偿单元82可使用参数集中的一或多个语法元素来确定用于译码视频图块的视频块的预测模式(例如,帧内或帧间预测)、帧间预测图块类型(例如,B图块、P图块或GPB图块)、图块的一或多个参考图片列表的构建信息、图块的每一经帧间编码视频块的运动向量、图块的每一经帧间译码视频块的帧间预测状态和用以解码当前视频图块中的视频块的其它信息。
运动补偿单元82还可基于内插滤波器执行内插。运动补偿单元82可使使用如在编码视频块期间供编码装置104使用的内插滤波器来计算参考块的次整数像素的内插值。在此情况下,运动补偿单元82可从所接收语法元素确定编码装置104使用的内插滤波器,且可使用内插滤波器来产生预测性块。
反量化单元86反量化(或解量化)位流中所提供且由熵解码单元80解码的经量化变换系数。反量化程序可包含使用由编码装置104针对视频图块中的每一视频块计算的量化参数来确定应应用的量化程度和(同样地)反量化程度。反变换处理单元88将反变换(例如,反DCT或其它合适的反变换)、反整数变换或概念上类似的反变换程序应用于变换系数以便产生像素域中的残余块。
在运动补偿单元82基于运动向量和其它语法元素产生当前视频块的预测性块之后,解码装置112通过将来自反变换处理单元88的残余块与由运动补偿单元82所产生的对应预测性块求和来形成经解码视频块。求和器90表示执行此求和运算的一或多个组件。如果需要,还可使用回路滤波器(在译码回路中或在译码回路后)以使像素转变平滑,或以其它方式改进视频质量。滤波器单元91打算表示一或多个回路滤波器,例如解块滤波器、自适应回路滤波器(ALF)和样本自适应偏移(SAO)滤波器。尽管滤波器单元91在图13中展示为回路中滤波器,但在其它配置中,滤波器单元91可实施为回路后滤波器。给定帧或图片中的经解码视频块接着存储于图片存储器92中,所述图片存储器存储用于后续运动补偿的参考图片。图片存储器92还存储经解码视频以供稍后呈现于显示装置(例如,图1中所展示的视频目的地装置122)上。
在前述描述中,参考其特定实施例描述申请案的方面,但所属领域的技术人员将认识到本发明不限于此。因此,尽管申请案的说明性实施例已经在本文中详细地描述,但应理解,本发明概念可以其它方式不同地实施并采用,且所附权利要求书打算经解释为包含除现有技术所限制外的此些变化。上文所描述的发明的各种特征和方面可单独地或联合地使用。另外,实施例可用于超出本文所描述的那些环境和应用的任何数目个环境和应用,而不脱离本说明书的更广精神和范围。因此,本说明书和图式被视为说明性而非限定性。出于说明的目的,以特定次序描述方法。应了解,在替代实施例中,可以与所描述的次序不同的次序来执行所述方法。
在组件被描述为“经配置以”执行某些操作的情况下,可(例如)通过设计电子电路或其它硬件以执行操作、通过程序设计可编程电子电路(例如,微处理器或其它适合的电子电路)以执行操作或其任何组合来实现此些配置。
结合本文所公开的实施例而描述的各种说明性逻辑块、模块、电路和算法步骤可被实施为电子硬件、计算机软件、固件或其组合。为了清楚地说明硬件与软件的此可互换性,各种说明性组件、块、模块、电路和步骤已在上文大体按其功能性加以描述。此功能性被实施为硬件还是软件取决于特定应用和强加于整个系统上的设计约束。所属领域的技术人员可针对每一特定应用以变化方式实施所描述功能性,但此些实施决策不应被解译为导致脱离本发明的范围。
本文中所描述的技术还可实施于电子硬件、计算机软件、固件或其任何组合中。此些技术可实施于多种装置中的任何装置中,例如,通用计算机、无线通信装置手机或具有多种用途(包含在无线通信装置手机和其它装置中的应用)的集成电路装置。可将描述为模块或组件的任何特征一起实施于集成式逻辑装置中或分开来实施为离散但可互操作的逻辑装置。如果以软件实施,那么所述技术可至少部分由包括程序码的计算机可读数据存储媒体实现,所述程序码包含在经执行时执行上文所描述方法中的一或多种的指令。计算机可读数据存储媒体可形成计算机程序产品的部分,计算机程序产品可包含包装材料。计算机可读媒体可包括存储器或数据存储媒体,例如,随机存取存储器(RAM)(例如同步动态随机存取存储器(SDRAM))、只读存储器(ROM)、非易失性随机存取存储器(NVRAM)、电可擦除可编程只读存储器(EEPROM)、快闪存储器、磁性或光学数据存储媒体等等。另外或替代地,所述技术可至少部分由计算机可读通信媒体实现,所述计算机可读通信媒体携载或传达呈指令或数据结构的形式且可由计算机存取、读取和/或执行的程序码,例如,传播的信号或波。
程序码可由可包含一或多个处理器的处理器执行,例如,一或多个数字信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、场可编程逻辑阵列(FPGA)或其它等效集成式或离散逻辑电路。此处理器可经配置以执行本发明中所描述技术中的任何技术。通用处理器可为微处理器;但在替代例中,处理器可为任何常规处理器、控制器、微控制器或状态机。处理器还可实施为计算装置的组合,例如DSP与微处理器的组合、多个微处理器、结合DSP核心的一或多个微处理器,或任何其它此配置。因此,如本文中所使用的术语“处理器”可指前述结构、前述结构的任何组合或适合于实施本文中描述的技术的任何其它结构或设备中的任一个。此外,在一些方面中,本文中描述的功能性可提供于经配置用于编码和解码的专用软件模块或硬件模块内,或并入于组合式视频编码器-解码器(编解码器)中。

Claims (30)

1.一种处理视频数据的方法,所述方法包括:
获得所述视频数据;和
处理与所述视频数据相关联的内容色域体积信息,所述内容色域体积信息指示所述视频数据的一或多个图片的内容色域体积,其中所述内容色域体积信息包含:与所述一或多个图片的最小亮度相关联的第一亮度值、与所述一或多个图片的最大亮度相关联的第二亮度值和描述所述一或多个图片的色域的一或多个色彩原色的一或多个色度坐标。
2.根据权利要求1所述的方法,其中所述第一亮度值包含正规化最小亮度值,且其中所述第二亮度值包含正规化最大亮度值。
3.根据权利要求1所述的方法,其中所述第一亮度值用于导出所述一或多个图片的最小亮度值,且其中所述第二亮度值用于导出所述一或多个图片的最大亮度值。
4.根据权利要求1所述的方法,其中与所述视频数据一起提供语法元素,所述语法元素指示所述内容色域体积信息的子集经用信号传送。
5.根据权利要求1所述的方法,其中使用补充增强信息SEI消息的一或多个语法元素来用信号传送所述内容色域体积信息。
6.根据权利要求1所述的方法,其中所述一或多个色度坐标包含指定所述一或多个图片的三个色彩原色的三个色度坐标。
7.根据权利要求6所述的方法,其中所述三个色度坐标包含:用于所述一或多个图片的绿色色彩原色的绿色色度坐标、用于所述一或多个图片的红色色彩原色的红色色度坐标和用于所述一或多个图片的蓝色色彩原色的蓝色色度坐标。
8.一种设备,其包括:
存储器,其经配置以存储视频数据;和
处理器,其经配置以:
获得所述视频数据;且
处理与所述视频数据相关联的内容色域体积信息,所述内容色域体积信息指示所述视频数据的一或多个图片的内容色域体积,其中所述内容色域体积信息包含:与所述一或多个图片的最小亮度相关联的第一亮度值、与所述一或多个图片的最大亮度相关联的第二亮度值和描述所述一或多个图片的色域的一或多个色彩原色的一或多个色度坐标。
9.根据权利要求8所述的设备,其中所述第一亮度值包含正规化最小亮度值,且其中所述第二亮度值包含正规化最大亮度值。
10.根据权利要求8所述的设备,其中所述第一亮度值用于导出所述一或多个图片的最小亮度值,且其中所述第二亮度值用于导出所述一或多个图片的最大亮度值。
11.根据权利要求8所述的设备,其中与所述视频数据一起提供语法元素,所述语法元素指示所述内容色域体积信息的子集经用信号传送。
12.根据权利要求8所述的设备,其中使用补充增强信息SEI消息的一或多个语法元素来用信号传送所述内容色域体积信息。
13.根据权利要求8所述的设备,其中所述一或多个色度坐标包含指定所述一或多个图片的三个色彩原色的三个色度坐标。
14.根据权利要求13所述的设备,其中所述三个色度坐标包含:用于所述一或多个图片的绿色色彩原色的绿色色度坐标、用于所述一或多个图片的红色色彩原色的红色色度坐标和用于所述一或多个图片的蓝色色彩原色的蓝色色度坐标。
15.根据权利要求8所述的设备,其中所述设备包括具有用于捕捉图片的摄像机的移动装置。
16.根据权利要求8所述的设备,其进一步包括:
显示器,其用于显示所述视频数据。
17.一种上面存储有指令的非暂时性计算机可读媒体,所述指令在由一或多个处理器执行时使得所述一或多个处理器:
获得视频数据;且
处理与所述视频数据相关联的内容色域体积信息,所述内容色域体积信息指示所述视频数据的一或多个图片的内容色域体积,其中所述内容色域体积信息包含:与所述一或多个图片的最小亮度相关联的第一亮度值、与所述一或多个图片的最大亮度相关联的第二亮度值和描述所述一或多个图片的色域的一或多个色彩原色的一或多个色度坐标。
18.根据权利要求17所述的非暂时性计算机可读媒体,其中所述第一亮度值包含正规化最小亮度值,且其中所述第二亮度值包含正规化最大亮度值。
19.根据权利要求17所述的非暂时性计算机可读媒体,其中所述第一亮度值用于导出所述一或多个图片的最小亮度值,且其中所述第二亮度值用于导出所述一或多个图片的最大亮度值。
20.根据权利要求17所述的非暂时性计算机可读媒体,其中与所述视频数据一起提供语法元素,所述语法元素指示所述内容色域体积信息的子集经用信号传送。
21.根据权利要求17所述的非暂时性计算机可读媒体,其中使用补充增强信息SEI消息的一或多个语法元素来用信号传送所述内容色域体积信息。
22.根据权利要求17所述的非暂时性计算机可读媒体,其中所述一或多个色度坐标包含指定所述一或多个图片的三个色彩原色的三个色度坐标。
23.根据权利要求22所述的非暂时性计算机可读媒体,其中所述三个色度坐标包含:用于所述一或多个图片的绿色色彩原色的绿色色度坐标、用于所述一或多个图片的红色色彩原色的红色色度坐标和用于所述一或多个图片的蓝色色彩原色的蓝色色度坐标。
24.一种设备,其包括:
用于获得视频数据的装置;和
用于处理与所述视频数据相关联的内容色域体积信息的装置,所述内容色域体积信息指示所述视频数据的一或多个图片的内容色域体积,其中所述内容色域体积信息包含:与所述一或多个图片的最小亮度相关联的第一亮度值、与所述一或多个图片的最大亮度相关联的第二亮度值和描述所述一或多个图片的色域的一或多个色彩原色的一或多个色度坐标。
25.根据权利要求24所述的设备,其中所述第一亮度值包含正规化最小亮度值,且其中所述第二亮度值包含正规化最大亮度值。
26.根据权利要求24所述的设备,其中所述第一亮度值用于导出所述一或多个图片的最小亮度值,且其中所述第二亮度值用于导出所述一或多个图片的最大亮度值。
27.根据权利要求24所述的设备,其中与所述视频数据一起提供语法元素,所述语法元素指示所述内容色域体积信息的子集经用信号传送。
28.根据权利要求24所述的设备,其中使用补充增强信息SEI消息的一或多个语法元素来用信号传送所述内容色域体积信息。
29.根据权利要求24所述的设备,其中所述一或多个色度坐标包含指定所述一或多个图片的三个色彩原色的三个色度坐标。
30.根据权利要求29所述的设备,其中所述三个色度坐标包含:用于所述一或多个图片的绿色色彩原色的绿色色度坐标、用于所述一或多个图片的红色色彩原色的红色色度坐标和用于所述一或多个图片的蓝色色彩原色的蓝色色度坐标。
CN201780028212.2A 2016-05-17 2017-05-15 用于产生和处理视频的内容色域体积消息的方法和系统 Active CN109076244B (zh)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
US201662337844P 2016-05-17 2016-05-17
US62/337,844 2016-05-17
US201662339665P 2016-05-20 2016-05-20
US62/339,665 2016-05-20
US201662399304P 2016-09-23 2016-09-23
US62/399,304 2016-09-23
US15/594,207 2017-05-12
US15/594,207 US11102495B2 (en) 2016-05-17 2017-05-12 Methods and systems for generating and processing content color volume messages for video
PCT/US2017/032674 WO2017200925A1 (en) 2016-05-17 2017-05-15 Methods and systems for generating and processing content color volume messages for video

Publications (2)

Publication Number Publication Date
CN109076244A true CN109076244A (zh) 2018-12-21
CN109076244B CN109076244B (zh) 2021-07-06

Family

ID=58995246

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780028212.2A Active CN109076244B (zh) 2016-05-17 2017-05-15 用于产生和处理视频的内容色域体积消息的方法和系统

Country Status (9)

Country Link
US (1) US11102495B2 (zh)
EP (1) EP3459255A1 (zh)
JP (1) JP2019517205A (zh)
KR (1) KR102464291B1 (zh)
CN (1) CN109076244B (zh)
AU (1) AU2017267544A1 (zh)
BR (1) BR112018073439A2 (zh)
TW (1) TW201806388A (zh)
WO (1) WO2017200925A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116700646A (zh) * 2022-12-19 2023-09-05 荣耀终端有限公司 图像色差处理方法和装置

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10225561B2 (en) * 2015-10-08 2019-03-05 Mediatek Inc. Method and apparatus for syntax signaling in image and video compression
EP3375194A1 (en) * 2015-11-09 2018-09-19 Thomson Licensing Method and device for adapting the video content decoded from elementary streams to the characteristics of a display
PT3523970T (pt) * 2016-10-05 2022-10-07 Dolby Laboratories Licensing Corp Mensagens de informação de volume de cor de origem
US11533450B2 (en) 2017-09-25 2022-12-20 Comcast Cable Communications, Llc Anti-piracy video transmission and display
KR102631517B1 (ko) 2018-08-28 2024-01-30 후아웨이 테크놀러지 컴퍼니 리미티드 픽처 분할 방법 및 장치
US11289003B2 (en) 2018-10-25 2022-03-29 Baylor University System and method for a multi-primary wide gamut color system
US10997896B2 (en) 2018-10-25 2021-05-04 Baylor University System and method for a six-primary wide gamut color system
US11062638B2 (en) 2018-10-25 2021-07-13 Baylor University System and method for a multi-primary wide gamut color system
US11069279B2 (en) 2018-10-25 2021-07-20 Baylor University System and method for a multi-primary wide gamut color system
US10607527B1 (en) 2018-10-25 2020-03-31 Baylor University System and method for a six-primary wide gamut color system
US11403987B2 (en) 2018-10-25 2022-08-02 Baylor University System and method for a multi-primary wide gamut color system
US11043157B2 (en) 2018-10-25 2021-06-22 Baylor University System and method for a six-primary wide gamut color system
US11488510B2 (en) 2018-10-25 2022-11-01 Baylor University System and method for a multi-primary wide gamut color system
US11037481B1 (en) 2018-10-25 2021-06-15 Baylor University System and method for a multi-primary wide gamut color system
US10950162B2 (en) 2018-10-25 2021-03-16 Baylor University System and method for a six-primary wide gamut color system
US11373575B2 (en) 2018-10-25 2022-06-28 Baylor University System and method for a multi-primary wide gamut color system
US11475819B2 (en) 2018-10-25 2022-10-18 Baylor University System and method for a multi-primary wide gamut color system
US11069280B2 (en) 2018-10-25 2021-07-20 Baylor University System and method for a multi-primary wide gamut color system
US10950161B2 (en) 2018-10-25 2021-03-16 Baylor University System and method for a six-primary wide gamut color system
US11315467B1 (en) 2018-10-25 2022-04-26 Baylor University System and method for a multi-primary wide gamut color system
US11030934B2 (en) 2018-10-25 2021-06-08 Baylor University System and method for a multi-primary wide gamut color system
US11189210B2 (en) 2018-10-25 2021-11-30 Baylor University System and method for a multi-primary wide gamut color system
US11532261B1 (en) 2018-10-25 2022-12-20 Baylor University System and method for a multi-primary wide gamut color system
US11587491B1 (en) 2018-10-25 2023-02-21 Baylor University System and method for a multi-primary wide gamut color system
US11289000B2 (en) 2018-10-25 2022-03-29 Baylor University System and method for a multi-primary wide gamut color system
US11410593B2 (en) 2018-10-25 2022-08-09 Baylor University System and method for a multi-primary wide gamut color system
US11341890B2 (en) 2018-10-25 2022-05-24 Baylor University System and method for a multi-primary wide gamut color system
KR20200095651A (ko) * 2019-02-01 2020-08-11 삼성전자주식회사 고 동적 범위 콘텐트를 재생하는 전자 장치 및 그 방법
US10990855B2 (en) * 2019-06-13 2021-04-27 Baidu Usa Llc Detecting adversarial samples by a vision based perception system
US20220360787A1 (en) * 2019-06-21 2022-11-10 Telefonaktiebolaget Lm Ericsson (Publ) Video coding layer up-switching indication
EP4115611A4 (en) * 2020-03-30 2023-06-28 ByteDance Inc. Slice type in video coding
WO2022086629A1 (en) * 2020-10-21 2022-04-28 Baylor University System and method for a multi-primary wide gamut color system
US11501419B1 (en) * 2021-06-03 2022-11-15 Baylor University System and method for displaying super saturated color
US11816819B2 (en) 2021-06-03 2023-11-14 Baylor University System and method for displaying super saturated color

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102388612A (zh) * 2009-03-13 2012-03-21 杜比实验室特许公司 高动态范围、可视动态范围和宽色域视频的分层压缩
CN102917228A (zh) * 2008-08-25 2013-02-06 微软公司 可伸缩视频编码和解码中的转换操作
CN103098453A (zh) * 2010-09-13 2013-05-08 杜比实验室特许公司 使用色域外颜色坐标的数据传输
CN104380738A (zh) * 2012-06-29 2015-02-25 索尼公司 图像处理装置及方法
WO2015054307A2 (en) * 2013-10-07 2015-04-16 Vid Scale, Inc. Combined scalability processing for multi-layer video coding
WO2015052935A1 (en) * 2013-10-11 2015-04-16 Sharp Kabushiki Kaisha Color information and chromaticity signaling
CN104685878A (zh) * 2012-09-24 2015-06-03 夏普株式会社 具有颜色空间缩放性的视频压缩
WO2015089352A1 (en) * 2013-12-13 2015-06-18 Vid Scale, Inc Color gamut scalable video coding device and method for the phase alignment of luma and chroma using interpolation
CN105379258A (zh) * 2013-07-14 2016-03-02 Lg电子株式会社 在数字广播系统中发送和接收用于表达高质量色彩的超高清晰度广播信号的方法和设备
CN106031143A (zh) * 2014-02-21 2016-10-12 皇家飞利浦有限公司 颜色空间和用于视频的解码器

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2716028B1 (en) 2011-05-27 2020-07-22 Dolby Laboratories Licensing Corporation Scalable systems for controlling color management comprising varying levels of metadata
JP6294489B2 (ja) * 2013-09-06 2018-03-14 エルジー エレクトロニクス インコーポレイティド デジタル放送システムにおける広域明るさ表現のための超高画質放送信号送受信方法及び装置
EP3058747B1 (en) * 2013-10-15 2019-11-20 Nokia Technologies Oy Scalable video encoding and decoding using syntax element
WO2016154336A1 (en) * 2015-03-25 2016-09-29 Dolby Laboratories Licensing Corporation Chroma subsampling and gamut reshaping
US10455240B2 (en) * 2015-04-15 2019-10-22 Sony Corporation Reproduction device, reproduction method, and program
US9616957B2 (en) 2015-07-10 2017-04-11 Paul Yaffe Motorcycle fairing adjustment member and assembly and method of adjusting a motorcycle fairing
EP3340636A4 (en) * 2015-08-20 2019-01-09 LG Electronics Inc. BROADCAST SIGNAL TRANSMISSION APPARATUS, BROADCAST SIGNAL RECEIVING APPARATUS, BROADCAST SIGNAL TRANSMISSION METHOD, AND BROADCAST SIGNAL RECEIVING METHOD
AU2015227469A1 (en) * 2015-09-17 2017-04-06 Canon Kabushiki Kaisha Method, apparatus and system for displaying video data
US10140953B2 (en) * 2015-10-22 2018-11-27 Dolby Laboratories Licensing Corporation Ambient-light-corrected display management for high dynamic range images

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102917228A (zh) * 2008-08-25 2013-02-06 微软公司 可伸缩视频编码和解码中的转换操作
CN102388612A (zh) * 2009-03-13 2012-03-21 杜比实验室特许公司 高动态范围、可视动态范围和宽色域视频的分层压缩
CN103098453A (zh) * 2010-09-13 2013-05-08 杜比实验室特许公司 使用色域外颜色坐标的数据传输
CN104380738A (zh) * 2012-06-29 2015-02-25 索尼公司 图像处理装置及方法
CN104685878A (zh) * 2012-09-24 2015-06-03 夏普株式会社 具有颜色空间缩放性的视频压缩
CN105379258A (zh) * 2013-07-14 2016-03-02 Lg电子株式会社 在数字广播系统中发送和接收用于表达高质量色彩的超高清晰度广播信号的方法和设备
WO2015054307A2 (en) * 2013-10-07 2015-04-16 Vid Scale, Inc. Combined scalability processing for multi-layer video coding
WO2015052935A1 (en) * 2013-10-11 2015-04-16 Sharp Kabushiki Kaisha Color information and chromaticity signaling
WO2015089352A1 (en) * 2013-12-13 2015-06-18 Vid Scale, Inc Color gamut scalable video coding device and method for the phase alignment of luma and chroma using interpolation
CN106031143A (zh) * 2014-02-21 2016-10-12 皇家飞利浦有限公司 颜色空间和用于视频的解码器

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
黄汉奇: "基于宽色域显示设备的色域映射研究", 《中国优秀硕士论文全文数据库(电子期刊)》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116700646A (zh) * 2022-12-19 2023-09-05 荣耀终端有限公司 图像色差处理方法和装置
CN116700646B (zh) * 2022-12-19 2024-05-28 荣耀终端有限公司 图像色差处理方法和装置

Also Published As

Publication number Publication date
KR102464291B1 (ko) 2022-11-04
EP3459255A1 (en) 2019-03-27
WO2017200925A1 (en) 2017-11-23
KR20190008222A (ko) 2019-01-23
JP2019517205A (ja) 2019-06-20
TW201806388A (zh) 2018-02-16
US11102495B2 (en) 2021-08-24
BR112018073439A2 (pt) 2019-03-26
US20170339418A1 (en) 2017-11-23
CN109076244B (zh) 2021-07-06
AU2017267544A1 (en) 2018-10-25

Similar Documents

Publication Publication Date Title
CN109076244A (zh) 用于产生和处理视频的内容色域体积消息的方法和系统
CN109964485B (zh) 用于处理视频数据的装置和方法及计算机可读介质
CN109196868A (zh) 用于产生用于视频图片的区域嵌套消息的方法和系统
CN106464920B (zh) 用于在参数集中用信号表示层集合的信息的系统和方法
CN107690803B (zh) 用于高动态范围及广色域视频译码的自适应常量照度方法
CN106464919B (zh) 用于编码和解码具有视频数据的多层位流的方法和装置
CN105637878B (zh) 在视频译码中用于基于子解码图片缓冲器(sub-dpb)的dpb操作的传信
CN105723707B (zh) 用于视频译码的色彩残差预测
CN104396253B (zh) 解码和编码视频数据的方法和装置及计算机可读存储媒体
CN109643531A (zh) 具有反馈信道的色域自适应
CN108702519A (zh) 用于产生对视频的颜色重新映射信息的补充增强信息消息的方法及系统
CN108028935A (zh) 用于高动态范围及广色域视频译码的补充增强信息(sei)消息
CN110431849A (zh) 包含用于视频译码的子图片位流的视频内容的信令传输
CN108702503A (zh) 用于视频编码和解码的装置、方法及计算机程序
CN107439013A (zh) 用于高动态范围和宽色域视频译码的动态范围调整
CN109196867A (zh) 在帧内预测中使用的参考线索引的隐式译码
CN108028936A (zh) 视频译码中成分的范围调整的固定点实施
CN106664427A (zh) 用于选择性地执行位流符合性检查的系统和方法
CN106233728B (zh) 视频数据的解码方法、编码方法、解码装置、编码装置及计算机可读存储媒体
TW202143737A (zh) 用於動態範圍調整的靈活色度處理
CN109691111A (zh) 在补充增强信息消息中传信色彩重新映射信息的目标显示参数
CN109479150A (zh) 用于显示器调适的色彩重映射信息sei消息发信号

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant