CN109196868A - 用于产生用于视频图片的区域嵌套消息的方法和系统 - Google Patents

用于产生用于视频图片的区域嵌套消息的方法和系统 Download PDF

Info

Publication number
CN109196868A
CN109196868A CN201780027773.0A CN201780027773A CN109196868A CN 109196868 A CN109196868 A CN 109196868A CN 201780027773 A CN201780027773 A CN 201780027773A CN 109196868 A CN109196868 A CN 109196868A
Authority
CN
China
Prior art keywords
region
area
message
picture
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201780027773.0A
Other languages
English (en)
Other versions
CN109196868B (zh
Inventor
阿达许·克里许纳·瑞玛苏布雷蒙尼安
霍埃尔·索莱·罗哈斯
王业魁
德米特罗·鲁萨诺夫斯基
德内·布达伊哲·桑斯利
马尔塔·卡切维奇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of CN109196868A publication Critical patent/CN109196868A/zh
Application granted granted Critical
Publication of CN109196868B publication Critical patent/CN109196868B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/167Position within a video image, e.g. region of interest [ROI]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明描述用于产生区域嵌套消息的系统、方法和计算机可读媒体。在一些实例中,获得视频位流,且使用所述视频数据来产生经编码视频位流。所述经编码视频位流包含区域嵌套消息,所述区域嵌套消息含有多个嵌套消息和定义所述经编码视频位流的图片的至少第一区域的区域数据。举例来说,所述区域嵌套消息的第一嵌套消息包含第一数据集和指示所述图片的所述第一区域与所述第一数据集相关联的第一区域识别符。

Description

用于产生用于视频图片的区域嵌套消息的方法和系统
技术领域
本申请案涉及视频译码。更具体来说,本申请案涉及产生用于视频图片的区域嵌套消息。
背景技术
诸多装置和系统允许处理并输出视频数据以供消费。数字视频数据包含大量数据以满足消费者和视频提供者的需求。举例来说,视频数据的消费者期望具有高保真度、分辨率、帧速率等的最高质量的视频。因此,需要满足这些需求的大量视频数据对通信网络和处理并存储所述视频数据的装置添加负担。
各种视频译码技术可用于压缩视频数据。根据一或多个视频译码标准执行视频编码。举例来说,视频译码标准包含高效率视频译码(HEVC)、高阶视频译码(AVC)、动画专家组(MPEG)译码等。视频译码通常运用利用视频图像或序列中存在的冗余的预测方法(例如,帧间预测、帧内预测等)。视频译码技术的重要目标为将视频数据压缩成使用较低位率的形式,同时避免视频质量的降级或使其最小化。随着不断演进的视频服务变得可用,需要具有优选译码效率的编码技术。
发明内容
在一些实施方案中,描述用于产生待应用于视频图片的一或多个区域的消息和/或元数据的技术和系统。图片的区域可包含所述图片的空间部分(且并非整个图片)。在一些状况下,技术和系统可发信一或多个图片的区域集和消息和/或数据(例如,元数据)集,且可使所述消息和/或所述数据的子集与所述所指定区域的子集相关联。所述消息可包含补充增强信息(SEI)消息或可被包含在视频位流中或包含有视频位流的任何其它合适的消息。
在一些实例中,所述消息可包含关于视频图片的区域嵌套消息。所述区域嵌套消息可用于发信图片区域集(例如,使用定义每一图片区域的区域数据)以及与所述图片区域集相关联的信息。区域嵌套消息可经发信用于图片且所述区域嵌套消息中的信息可包含嵌套在所述区域嵌套消息中的一或多个消息(本文中被称作“嵌套消息”或“可区域嵌套消息”)。
所述区域嵌套消息的嵌套消息可包含可应用于所述图片的一或多个区域的一或多个数据集(例如,元数据或其它数据集)。在一些实例中,嵌套消息中的数据集可定义可由解码器装置、播放器装置或其它装置对一或多个区域执行的功能。在一些说明性实施例中,数据集可包含用于对图片的一或多个区域执行胶卷粒纹合成功能的胶卷粒纹特性,用于对一或多个区域执行色调映射功能的色调映射信息,和/或用于对视频图片的区域执行功能的任何其它合适的数据。在一些状况下,嵌套消息中的数据集可指定一或多个区域特有的内容的特性。在一个说明性实例中,所述数据集可包含关于与所述一或多个区域相关联的内容的最大亮度的信息。在其它状况下,嵌套消息中的所述数据集可指定可由解码器装置、播放器装置或其它装置用于根据装置的约束或根据装置操作的条件来处理一或多个区域特定的内容的提示或信息。举例来说,数据集可包含关于编码器可考虑适合用于处理内容的第一滤波器系数集,且所述解码器装置、播放器或其它装置可选择使用那些系数,或可使用所述第一系数集来导出第二系数集以将其应用于属于与所述数据集相关联的所述一或多个区域的内容。
关于图片的区域嵌套消息可包含定义图片的每一区域仅一次的区域数据,且区域嵌套消息中的嵌套消息可包含识别嵌套信息中的数据集欲应用于的区域的区域识别符或与所述区域识别符相关联。举例来说,定义区域的区域数据可被含在区域嵌套消息中,其中所述区域经定义用于经指派到所述区域的嵌套消息应用于其的一或多个图片。在一些状况下,区域嵌套消息的嵌套消息可包含一或多个区域识别符。可将区域识别符指派到嵌套消息中的数据集以指示所述数据集欲应用于的区域。使用此技术,区域数据并非必须针对每一嵌套消息或针对欲应用于图片的每一数据集个别地发信。
在一些实例中,区域嵌套消息中的嵌套消息包含数据集(例如,元数据,或其它数据集)和指示所述数据集可应用于的图片的任何区域的一或多个区域识别符。在一些实例中,嵌套消息包含定义多个功能的多个数据集,且也包含用以指示所述数据集欲应用于的图片的区域的所述多个数据集的一或多个区域识别符。在一些状况下,区域嵌套消息的多个嵌套消息可应用于同一图片中的共同区域。举例来说,区域嵌套消息的第一嵌套消息可包含可应用于第一区域的一或多个数据集,且区域嵌套消息的第二嵌套消息可包含可应用于第一区域的一或多个数据集。
在一些状况中,区域嵌套消息可在同一区域嵌套消息中多于一次地定义相同区域;然而,在此状况中,与区域的两个情况相关联的识别符将不同以区别所述情况。这些实例可在重复的区域与一或多个其它区域重叠时且在一或多个数据集应用于区域时发生,在所述状况中,可需要由指示符指示的不同性质来确定可应用于重叠区域中的一或多个像素的数据集。
在一些实例中,区域嵌套消息为区域嵌套补充增强信息(SEI)消息。区域嵌套SEI消息可包含定义图片的多个区域的多个区域数据,和具有数据集和区域识别符的多个嵌套SEI消息。
根据编码视频数据的至少一个实例,提供编码视频数据的方法。所述方法包括:获得所述视频数据。所述方法进一步包括:使用所述视频数据产生包含区域嵌套消息的经编码视频位流。所述区域嵌套消息包含多个嵌套消息和定义所述经编码视频位流的图片的至少第一区域的区域数据。所述区域嵌套消息的第一嵌套消息包含第一数据集,以及指示所述图片的所述第一区域与所述第一数据集相关联的第一区域识别符。
在编码视频数据的另一实例中,提供包含经配置以存储视频数据的存储器和处理器的设备。处理器经配置以获得视频数据且可获得视频数据。处理器经进一步配置以且可使用视频数据产生包含区域嵌套消息的经编码视频位流。所述区域嵌套消息包含多个嵌套消息和定义所述经编码视频位流的图片的至少第一区域的区域数据。所述区域嵌套消息的第一嵌套消息包含第一数据集,以及指示所述图片的所述第一区域与所述第一数据集相关联的第一区域识别符。
在编码视频数据的另一实例中,提供存储有指令的非暂时性计算机可读媒体,所述指令在由一或多个处理器执行时致使所述一或多个处理器:获得视频数据;和使用所述视频数据产生包含区域嵌套消息的经编码视频位流,所述区域嵌套消息包含多个嵌套消息和定义所述经编码视频位流的图片的至少第一区域的区域数据,其中所述区域嵌套消息的第一嵌套消息包含第一数据集以及指示所述图片的第一区域与第一数据集相关联的第一区域识别符。
在编码视频数据的另一实例中,提供包含用于获得视频数据的装置的设备。所述设备进一步包含用于使用所述视频数据产生包含区域嵌套消息的经编码视频位流的装置。所述区域嵌套消息包含多个嵌套消息和定义所述经编码视频位流的图片的至少第一区域的区域数据。所述区域嵌套消息的第一嵌套消息包含第一数据集,以及指示所述图片的所述第一区域与所述第一数据集相关联的第一区域识别符。
在一些方面中,区域嵌套消息为区域嵌套补充增强信息(SEI)消息,且其中所述多个嵌套消息为嵌套SEI消息。
在一些方面中,使用所述第一数据集来基于所述第一区域识别符对所述第一区域执行第一功能。
在一些方面中,所述第一数据集基于所述第一区域识别符指定所述第一区域的特性。
在一些方面中,定义所述图片的区域的所述第一区域的所述区域数据被包含在所述区域嵌套消息中一次。
在一些方面中,所述第一嵌套消息进一步包含第二数据集,其中所述第二数据集与所述第一区域识别符相关联以指示所述第一区域与所述第二数据集相关联。
在一些方面中,所述区域嵌套消息包含定义所述图片的多个区域的多个区域数据,且所述第一嵌套消息的所述第一数据集与所述图片的所述多个区域中的多个区域相关联。在一些方面中,所述第一嵌套消息进一步包含第二区域识别符,所述第二区域识别符指示与所述第一数据集相关联的所述图片的所述多个区域中的第二区域。在一些方面中,所述第一数据集可独立地应用于所述第一区域和所述第二区域中的每一个。
在一些方面中,所述区域嵌套消息包含第二嵌套消息,所述第二嵌套消息包含第二数据集和指示所述第一区域与所述第二数据集相关联的第一区域识别符。
在一些方面中,所述区域嵌套消息进一步包含所述图片的多个区域的数目。
在一些方面中,所述区域数据定义所述第一区域的一或多个边界或定义在所述第一区域中含有的样本。
在一些方面中,所述区域数据定义所述第一区域的一或多个边界从所述图片的一或多个边界的一或多个偏移。
在一些方面中,所述区域数据将所述第一区域定义为矩形区域。
在一些方面中,当图片的样本在图片的两个或多于两个区域中时,可应用于两个或多于两个区域中的区域的第一类型的嵌套消息可应用于样本,所述区域在所述两个或多于两个区域间具有最大区域识别符值。在一些方面中,可应用于两个或多于两个区域中的另一区域的第一类型的另一嵌套消息不可应用于样本,所述另一区域在所述两个或多于两个区域间不具有最大区域识别符值。
在一些方面中,其中所述区域嵌套消息进一步包含识别所述区域嵌套消息的用途的语法元素。
在一些方面中,所述区域嵌套消息进一步包含所述区域嵌套消息中的多个嵌套消息的数目。
在一些方面中,多个嵌套消息的嵌套消息具有与在嵌套消息未被嵌套在区域嵌套消息中的情况下相同的持续性。
在一些方面中,所述区域嵌套消息包含关于所述第一嵌套消息的索引集,所述索引集指示所述第一数据集欲应用于的一或多个区域。
在一些方面中,所述索引集包含至少所述第一区域识别符。
在一些方面中,所述设备包括具有用于捕捉图片的摄影机的移动装置。
根据解码视频数据的至少一个实例,提供解码视频数据的方法。所述方法包括接收视频位流。所述方法进一步包括:从所述视频位流获得区域嵌套消息,所述区域嵌套消息包含多个嵌套消息和定义所述经编码视频位流的图片的至少一第一区域的区域数据,其中所述区域嵌套消息的第一嵌套消息包含第一数据集和指示所述图片的所述第一区域与所述第一数据集相关联的第一区域识别符。
在解码视频数据的另一实例中,提供包含经配置以存储视频数据的存储器和处理器的设备。所述处理器经配置以接收视频位流且可接收视频位流。处理器经进一步配置以且可从视频位流获得区域嵌套消息,所述区域嵌套消息包含多个嵌套消息和定义所述经编码视频位流的图片的多个区域的多个区域数据,其中所述区域嵌套消息的第一嵌套消息包含第一数据集以及指示所述图片的所述第一区域与所述第一数据集相关联的第一区域识别符。
在解码视频数据的另一实例中,提供存储有指令的非暂时性计算机可读媒体,所述指令在由一或多个处理器执行时致使所述一或多个处理器:接收视频位流;以及从所述视频位流获得区域嵌套消息,所述区域嵌套消息包含多个嵌套消息以及定义所述经编码视频位流的图片的多个区域的多个区域数据,其中所述区域嵌套消息的第一嵌套消息包含第一数据集以及指示所述图片的所述第一区域与所述第一数据集相关联的第一区域识别符。
在解码视频数据的另一实例中,提供包含用于接收视频位流的装置的设备。所述设备进一步包含用于从所述视频位流获得区域嵌套消息的装置,所述区域嵌套消息包含多个嵌套消息和定义所述经编码视频位流的图片的多个区域的多个区域数据,其中所述区域嵌套消息的第一嵌套消息包含第一数据集以及指示所述图片的第一区域与第一数据集相关联的第一区域识别符。
在一些方面中,使用所述第一数据集来基于所述第一区域识别符对所述第一区域执行第一功能。在一些方面中,方法、设备和非暂时性计算机可读媒体进一步包含解码图片且使用第一数据集对图片的第一区域执行第一功能。基于第一区域识别符对第一区域执行第一功能。
在一些方面中,所述第一数据集基于所述第一区域识别符指定所述第一区域的特性。
在一些方面中,区域嵌套消息为区域嵌套补充增强信息(SEI)消息,且其中所述多个嵌套消息为嵌套SEI消息。
在一些方面中,定义所述图片的第一区域的区域数据被包含在区域嵌套消息中一次。
在一些方面中,所述第一嵌套消息进一步包含第二数据集,其中所述第二数据集与所述第一区域识别符相关联以指示所述第一区域与所述第二数据集相关联。
在一些方面中,所述区域嵌套消息包含定义所述图片的多个区域的多个区域数据,且所述第一嵌套消息的所述第一数据集与所述图片的所述多个区域中的多个区域相关联。
在一些方面中,所述第一嵌套消息进一步包含第二区域识别符,所述第二区域识别符指示与所述第一数据相关联的所述图片的所述多个区域中的第二区域。
在一些方面中,所述第一数据集可独立地应用于所述第一区域和所述第二区域中的每一个。
在一些方面中,所述区域嵌套消息包含第二嵌套消息,所述第二嵌套消息包含第二数据集和指示所述第一区域与所述第二数据集相关联的第一区域识别符。
在一些方面中,所述区域嵌套消息进一步包含所述图片的多个区域的数目。
在一些方面中,所述区域数据定义所述第一区域的一或多个边界或定义含在所述第一区域中的样本。
在一些方面中,所述区域数据定义所述第一区域的一或多个边界从所述图片的一或多个边界的一或多个偏移。
在一些方面中,所述区域数据将所述第一区域定义为矩形区域。
在一些方面中,当图片的样本在图片的两个或多于两个区域中时,可应用于两个或多于两个区域中的一区域的第一类型的嵌套消息可应用于样本,所述区域在所述两个或多于两个区域间具有最大区域识别符值。在一些方面中,可应用于两个或多于两个区域中的另一区域的第一类型的另一嵌套消息不可应用于所述样本,所述另一区域在两个或多于两个区域间不具有最大区域识别符值。
在一些方面中,所述区域嵌套消息进一步包含识别所述区域嵌套消息的用途的语法元素。
在一些方面中,所述区域嵌套消息进一步包含所述区域嵌套消息中的多个嵌套消息的数目。
在一些方面中,多个嵌套消息的嵌套消息具有与在嵌套消息未被嵌套在区域嵌套消息中的情况下相同的持续性。
在一些方面中,所述区域嵌套消息包含关于所述第一嵌套消息的索引集,所述索引集指示所述第一数据集欲应用于的一或多个区域。
在一些方面中,所述索引集包含至少所述第一区域识别符。
在一些方面中,设备包含用于显示经重新映射的一或多个样本的显示器。在一些方面中,设备包含具有摄影机的移动装置。
发明内容既不希望识别所主张标的物的关键或基本特征,也不希望用于用以确定所主张标的物的范围的隔离。应参考本专利的整个说明书的适当部分、任何或全部图式和每一请求项来理解标的物。
在参考以下说明书、权利要求书和随附图式时,上述连同其它特征和实施例将变得较显而易见。
附图说明
下文参考以下图来详细描述本发明的说明性实施例:
图1为根据一些实例说明编码装置和解码装置的实例的框图。
图2为根据一些实例说明具有多个补充增强信息(SEI)消息的视频位流的实例的图。
图3为根据一些实施例说明区域嵌套SEI消息的实例的图。
图4A为根据一些实例说明具有经优先化的区域的图片的实例的图。
图4B为根据一些实例说明不具有经优先化的区域的图片的实例的图。
图5为根据一些实例说明区域嵌套SEI消息的另一实例的图。
图6根据一些实例说明编码视频数据的过程的实例的流程图。
图7根据一些实例说明解码视频数据的过程的实例的流程图。
图8为根据一些实施例说明实例性视频编码装置的框图。
图9为根据一些实例说明实例性视频解码装置的框图。
具体实施方式
下文提供本发明的某些方面和实施例。这些方面和实施例中的一些可独立地应用且其中的一些可以组合方式应用,如所属领域的技术人员将明了。在以下描述中,出于阐释的目的,阐明具体细节以便提供对本发明的实施例的透彻理解。然而,将了解,可在无这些具体细节的情况下实践各种实施例。图和说明并非希望为限制性。
后续描述仅提供示范性实施例,且并不希望限制本发明的范围、适用性或配置。确切来说,示范性实施例之后续描述将为所属领域的技术人员提供用于实施示范性实施例的启用描述。应理解可在不脱离如随附权利要求书所阐明的本发明的精神和范围的情况下对功能和元件的布置做出各种改变。
在以下描述给出具体细节以提供对实施例的透彻理解。然而,所属领域的技术人员将理解,可在无这些具体细节的情况下实践实施例。举例来说,电路、系统、网络、过程和其它组件可以框图形式展示为组件以便不以不必要细节模糊实施例。在其它情况中,众所周知电路、过程、算法、结构和技术可经展示无不必要细节以便避免模糊实施例。
此外,应注意,个别实施例可被描述为过程,其被描绘为流程图、作业图、数据流程图、结构图或框图。虽然流程图可将操作描述为顺序过程,但操作中的诸多操作可并行或同时地执行。另外,可重新排列操作的次序。过程可在其操作完成时终止,但可具有图中未包含的额外步骤。过程可对应于方法、功能、程序、次例程、子程序等。当过程对应于功能时,其终止可对应于将所述功能返回到呼叫功能或主功能。
术语“计算机可读媒体”包含(但不限于)便携式或非便携式存储装置、光学存储装置,和能够存储、含有或携载指令和/或数据的各种其它媒体。计算机可读媒体可包含可将数据存储于其中且不包含以无线方式或通过有线连接传播的载波和/或暂时电子信号的非暂时性媒体。非暂时性媒体的实例可包含但不限于磁盘或磁带、光学存储媒体(例如光盘(CD)或数字通用光盘(DVD))、快闪存储器、存储器或存储器装置。计算机可读媒体其上可存储有代码和/或机器可执行指令,所述代码和/或机器可执行指令可表示程序、函数、子程序、程序、例程、次例程、模块、软件封装、类别或指令、数据结构或程序语句的任何组合。码段可通过传递和/或接收信息、数据、引数、参数或存储器内容来耦合到另一码段或硬件电路。信息、引数、参数、数据等可包含存储器共享、消息传递、令牌传递、网络发射等来传递、转发或发射。
此外,实施例可由硬件、软件、固件、中间软件、微码、硬件描述语言或其任何组合来实施。当以软件、固件、中间软件或微码实施时,用以执行必要任务的程序代码或码段(例如,计算机程序产品)可被存储在计算机可读或机器可读媒体中。处理器可执行必要任务。
本文中描述使用视频编码器、解码器、视频播放器和其它视频处理装置的视频处理和视频译码的数个系统和方法。在一些实例中,处理视频数据的一或多个系统和方法经描述用于提供区域嵌套消息,所述区域嵌套消息各自包含多个嵌套消息和定义多个区域的数据。区域嵌套消息的实例为区域嵌套补充增强信息(SEI)消息。举例来说,可针对图片产生区域嵌套SEI消息,且可包含定义图片的多个区域的区域数据以及含有用于对多个区域执行功能的数据的多个嵌套SEI消息。下文进一步详细地描述这些系统和方法的细节。
随着更多装置和系统为消费者提供消费数字视频数据的能力,对高效视频译码技术的需要变得更重要。需要视频译码以减少处置数字视频数据中存在的大量数据所需要的存储和发射要求。可使用各种视频译码技术来将视频数据压缩成使用较低位率同时维持高视频质量的形式。
图1为说明包含编码装置104和解码装置112的系统100的实例的框图。编码装置104可为源装置的部分,且解码装置112可为接收装置的部分。源装置和/或接收装置可包含电子装置,例如移动或静止电话手机(例如,智能型电话、蜂窝式电话等)、台式计算机、膝上型或笔记型计算机、平板计算机、机顶盒、电视、摄影机、显示装置、数字媒体播放器、视频游戏控制台、视频流式传输装置、因特网协议(IP)摄影机或任何其它适合电子装置。在一些实例中,源装置和接收装置可包含用于无线通信的一或多个无线收发器。本文中所描述的译码技术适用于各种多媒体应用程序中的视频译码,包含流式传输视频发射(例如,通过因特网)、电视广播或发射、编码数字视频以供存储在数据存储媒体上、解码经存储在数据存储媒体上的数字视频,或其它应用程序。在一些实例中,系统100可支持单向或双向视频发射以支持例如视频会议、视频流式传输、视频播放、视频广播、游戏和/或视频电话的应用程序。
编码装置104(或编码器)可用以使用视频译码标准或协议来对视频数据进行编码以产生编码视频位流。视频译码标准包含ITU-TH.261、ISO/IECMPEG-1Visual、ITU-TH.262或ISO/IECMPEG-2Visual、ITU-TH.263、ISO/IECMPEG-4Visual和ITU-TH.264(也称作ISO/IECMPEG-4AVC),包含其可缩放视频译码(SVC)和多视图视频译码(MVC)扩展。ITU-T视频译码专家组(VCEG)和ISO/IEC动画专家组(MPEG)的视频译码联合协作团队(JCT-VC)已完成最新视频译码标准,高效率视频译码(HEVC)。HEVC的各种扩展处理多层视频译码且也由JCT-VC研发,包含HEVC的多视图扩展(称作MV-HEVC),和HEVC的可缩放扩展(称作SHVC),或其任何其它适合译码协议。
本文中描述的诸多实施例使用HEVC标准或其扩展来描述实例。然而,本文中所描述的技术和系统也可应用于其它译码标准,例如,AVC、MPEG、其扩展,或已获得或尚未获得或制定的其它适合译码标准。因此,虽然可参考特定视频译码标准来描述本文中所描述的技术和系统,但所属领域的技术人员将了解,描述不应解释为仅适用于特定标准。
参考图1,视频源102可将视频数据提供到编码装置104。视频源102可为源装置的部分,或可为除源装置外的装置的部分。视频源102可包含视频捕捉装置(例如,摄像机、摄影机电话、视频电话等)、含有所存储视频的视频封存、提供视频数据的视频服务器或内容提供器、从视频服务器或内容提供器接收视频的视频馈送接口、用于产生计算机图形视频数据的计算机图形系统、这些源的组合,或任何其它适合视频源。
来自视频源102的视频数据可包含一或多个输入图片或帧。图片或帧为视频的部分的静止图像。编码装置104的编码器引擎106(或编码器)对视频数据进行编码以产生编码视频位流。在一些实例中,编码视频位流(或“视频位流”或“位流”)为一系列一或多个译码视频序列。译码视频序列(CVS)包含以在基层中具有随机存取点图片且具有某些性质的存取单元(AU)开始直到且不包含在基层中具有随机存取点图片且具有某些性质的下一AU的一系列AU。举例来说,开始CVS的随机存取点图片的某些性质可包含等于1的RASL旗标(例如,NoRaslOutputFlag)。否则,随机存取点图片(具有等于0的RASL旗标)不开始CVS。存取单元(AU)包含一或多个译码图片和对应于共享相同输出时间的译码图片的控制信息。图片的经译码切片以位流级囊封到称作网络抽象层(NAL)单元的数据单元中。举例来说,HEVC视频位流可包含一或多个CVS,所述一或多个CVS包含NAL单元。NAL单元中的每一个具有NAL单元标头。在一个实例中,标头针对H.264/AVC(多层扩展除外)为一字节且针对HEVC为两字节。NAL单元标头中的语法元素呈指定位且因此对所有种类的系统和输送层(例如,输送流式传输、实时输送(RTP)协议、文件格式,和其它)可见。
HEVC标准中存在两种类NAL单元,包含视频译码层(VCL)NAL单元和非VCLNAL单元。VCL NAL单元包含译码图片数据的一个切片或切片段(下文所描述),且非VCL NAL单元包含与一或多个译码图片有关的控制信息。在一些状况下,NAL单元可被称作包。HEVC AU包含含有译码图片数据的VCL NAL单元和对应于译码图片数据的非VCL NAL单元(如果存在)。
NAL单元可含有位序列,所述位形成视频数据的译码表示(例如,编码视频位流、位流的CVS等),例如视频中的图片的译码表示。编码器引擎106通过将每一图片分割成多个切片来产生图片的译码表示。切片独立于其它切片使得切片中的信息经译码而不相依于相同图片内的其它切片的数据。切片包含一或多个切片段,包含独立切片段,且如果存在,相依于先前切片段的一或多个相依切片段。接着将切片分割成明度样本和色度样本的译码树形块(CTB)。明度样本的CTB和色度样本的一或多个CTB连同样本的语法被称作编码树形单元(CTU)。在一些状况下,CTU也可被称作最大译码单元(LCU)。CTU为HEVC编码的基本处理单元。可将CTU分裂成多个不同大小的译码单元(CU)。CU含有被称作译码块(CB)的明度和色度样本阵列。
可将明度和色度CB进一步分裂成预测块(PB)。PB为使用相同运动参数来进行帧间预测或帧内块复制预测(在可用或经启用以供使用时)的明度或色度分量的样本的块。明度PB和一或多个色度PB连同相关联语法形成预测单元(PU)。针对帧内预测,运动参数集(例如,一或多个运动向量、参考索引等)在位流中发信用于每一PU且用于对明度PB和一或多个色度PB的帧间预测。针对帧内块复制预测,运动参数集(例如,一或多个块向量等)也可发信用于每一PU且可用于帧内块复制预测。CB也可经分裂成一或多个变换块(TB)。TB表示将相同二维变换应用于其以对预测残余信号进行译码的色彩分量的样本的正方形块。变换单元(TU)表示明度和色度样本的TB,和对应语法元素。
CU的大小对应于译码模式的大小且形状可为正方形。举例来说,CU的大小可为8×8个样本、16×16个样本、32×32个样本、64×64个样本,或高达对应CTU的大小的任何其它适当大小。短语“N×N”在本文中用于以垂直和水平尺寸方面(例如,8个像素×8个像素)指代视频块的像素尺寸。块中的像素可经布置成行和列。在一些实施例中,块不可能在水平方向具有与在垂直方向相同数目个像素。举例来说,与CU相关联的语法数据可描述将CU分割成一或多个PU。分割模式可在CU为帧内预测模式编码或帧间预测模式编码之间不同。PU可被分割成非正方形形状。举例来说,与CU相关联的语法数据也可描述根据CTU将CU分割成一或多个TU。TU的形状可为正方形或非正方形。
根据HEVC标准,可使用变换单元(TU)执行变换。TU可针对不同CU不同。TU可基于给定CU内的PU的大小而定大小。TU可为与PU相同或比其小的大小。在一些实例中,可使用称作残余四元树(RQT)的四元树结构将对应于CU的残余样本细分成较小单元。RQT的叶节点可对应于TU。可变换与TU相关联的像素差值以产生变换系数。可接着由编码器引擎106将变换系数量化。
一旦将视频数据的图片分割成CU,编码器引擎106使用预测模式预测每一PU。接着将预测单元或预测块从原始视频数据减去以获得残余(下文加以描述)。针对每一CU,可使用语法数据在位流内发信预测模式。预测模式可包含帧内预测(或图片内预测)或帧间预测(或图片间预测)。帧内预测利用图片内的空间相邻样本之间的相关性。例如,使用帧内预测,使用(例如)DC预测来找到PU的平均值、平面预测来使平面表面配合PU、方向预测来从邻近数据外推或任何其它适合类型的预测来从相同图片中的邻近图片数据预测每一PU。帧间预测使用图片之间的时间相关性以便导出对图片样本的块的运动补偿预测。例如,使用帧间预测,使用运动补偿预测从一或多个参考图片(在输出次序中在当前图片之前或之后)中的音频数据据预测每一PU。举例来说,可在CU层级处作出是使用图片间抑或图片内预测来对图片区域作出译码的决策。
在一些实例中,图片的一或多个切片经指派帧类型。切片类型包含I切片、P切片和B切片。I切片(帧内,可独立解码)为仅由帧内预测译码的图片的切片,且因此可独立解码,这是因为I帧仅需要帧内的数据来预测帧的任何预测单元或预测块。P切片(单向预测帧)为可用帧内预测和用单向帧间预测译码的图片的切片。用帧内预测或帧间预测来译码P切片内的每一预测单元或预测块。当帧间预测应用时,仅通过一个参考图片来预测预测单元或预测块,且因此参考样本仅来自一个帧的一个参考区域。B切片(双向预测帧)为可用帧内预测且用帧间预测(例如,双向预测或单向预测)来译码的图片的切片。B切片的预测单元或预测块可从两个参考图片双向预测,其中每一图片有助于一个参考区域且两个参考区域的样本集经加权重(例如,具有相对权重或具有不同权重)以产生双向预测块的预测信号。如上文所阐释,独立地译码一个图片的切片。在一些状况中,可将图片译码为仅一个切片。
PU可包含与预测过程有关的数据(例如,运动参数或其它合适的数据)。举例来说,当使用帧内预测对PU进行编码时,PU可包含描述PU的帧内预测模式的数据。作为另一实例,当使用帧间预测时对PU进行编码时,PU可包含定义PU的运动向量的数据。定义PU的运动向量的数据可(例如)描述运动向量的水平分量(Δx)、运动向量的垂直分量(Δy)、运动向量的分辨率(例如,整数精度、四分之一像素精度或八分之一像素精度)、运动向量指向的参考图片,参考索引、运动向量的参考图片列表(例如,列表0、列表1或列表C),或其任何组合。
编码装置104可接着执行变换和量化。举例来说,在预测之后,编码器引擎106可计算对应于PU的残余值。残余值可包括所译码的像素的当前块(PU)与用于预测当前块(例如,当前块的预测版本)之间的像素差值。举例来说,在产生预测块(例如,发布帧间预测或帧内预测)之后,编码器引擎106可通过将由预测单元产生的预测块从当前块减去来产生参与块。参与块包含量化当前块的像素值与预测块的像素值之间的差的像素差值集。在一些实例中,可以二维块格式(例如,像素值的二维矩阵或阵列)表示。在这些实例中,参与块为像素值的二维表示。
使用块变换来变换在执行预测之后可能剩余的任何残余数据,此可能基于离散余弦变换、离散正弦变换、整数变换、小波变换、其它适合变换函数,或其任何组合。在一些状况中,可将一或多个块变换(例如,大小32×32、16×16、8×8、4×4或其它合适大小)应用于每一CU中的残余数据。在一些实施例中,TU可用于由编码器引擎106实施的变换和量化过程。具有一或多个PU的给定CU也可包含一或多个TU。如下文进一步详细描述,可使用块变换将残余值变换成变换系数,且接着使用TU将其量化并进行扫描以产生序列化变换系数以供熵编码。
在一些实施例中,在使用CU的PU进行帧内预测或帧间预测译码之后,编码器引擎106可计算关于CU的TU的残余数据。PU可包括在空间域(或像素域)中的像素数据。TU可在应用块变换之后包括在变换域中的系数。如先前所述,残余数据可对应于未编码图片的像素与对应于PU的预测值之间的像素差值。编码器引擎106可形成包括关于CU的残余数据的TU,且接着变换TU以产生关于CU的变换系数。
编码器引擎106可执行变换系数的量化。量化通过量化变换系数而提供进一步压缩以减少用于表示系数的数据量。举例来说,量化可减少与系数中的一些或全部相关联的位深度。在一个实例中,具有n位值的系数可在量化期间向下舍入到m位值,其中n大于m。
一旦执行量化,译码视频位流包含经量化变换系数、预测信息(例如,预测模式、运动向量等)、分割信息和任何其它适合数据,例如,其它语法数据。可接着通过编码器引擎106对译码视频位流的不同元素进行熵编码。在一些实例中,编码器引擎106可利用预定义扫描次序来扫描量化变换系数以产生可经熵编码的串行化向量。在一些实例中,编码器引擎106可执行自适应扫描。在扫描经量化变换系数以形成向量(例如,一维向量)之后,编码器引擎106可对所述向量进行熵编码。举例来说,编码器引擎106可使用上下文自适应可变长度译码、上下文自适应二进制算法译码、基于语法的上下文自适应二进制算法译码、概率区间分割熵译码或另一适合熵编码技术。
如先前所描述,视频位流包含一群组NAL单元,包含VCL NAL单元和非VCL NAL单元。VCL NAL单元包含形成译码视频位流的译码图片数据。例如,形成译码视频位流的位序列存在在VCL NAL单元中。除其它信息外,非VCL NAL单元也可含有具有与编码视频位流有关的高级信息的参数集。举例来说,参数集可包含视频参数集(VPS)、序列参数集(SPS)和图片参数集(PPS)。参数集的目标的实例包含位率效率、误差弹性和提供系统层接口。每一切片参考单个有效PPS、SPS和VPS以存取解码装置112可用于解码切片的信息。识别符(ID)可经译码用于每一参数集,包含VPS ID、SPS ID和PPS ID。SPS包含SPS ID和VPS ID。PPS包含PPS ID和SPS ID。每一切片标头包含PPS ID。使用ID,可针对给定切片识别有效参数集。
PPS包含适用于给定图片中的所有切片的信息。由于上述情况,因此图片中的所有切片指相同PPS。不同图片中的切片也可指相同PPS。SPS包含适用于相同译码视频序列(CVS)或位流中的所有图片的信息。如先前所描述,译码视频序列为一系列存取单元(AU),所述系列存取单元以在基础层中且具有某些性质的(上文所描述)随机存取点图片(例如,瞬时解码参考(IDR)图片或断链存取(BLA)图片,或其它适当随机存取点图片)开始,直到且不包含具有在基础层中且具有某些性质的随机存取点图片之下一AU(或位流的结束)。SPS中的信息可不会在译码视频序列内逐图片改变。译码视频序列中的图片可使用相同SPS。VPS包含适用于译码视频序列或位流内的所有层的信息。VPS包含具有适用于整个译码视频序列的语法元素的语法结构。在一些实施例中,可随编码位流带内发射VPS、SPS或PPS。在一些实施例中,与含有译码视频数据的NAL单元相比,可以单独发射带外发射VPS、SPS或PPS。
视频位流还可包含补偿增强信息(SEI)消息。举例来说,SEI NAL单元可为视频位流的部分。在一些状况中,SEI消息可含有解码过程并不需要的信息。举例来说,SEI消息中的信息对解码器解码位流的视频图片并非必要的,但解码器可使用SEI消息的信息来改善图片(例如,经解码输出)的显示或处理。SEI消息中的信息可为嵌入式元数据。在一个说明性实例中,SEI消息中的信息可由解码器侧实体用于改善内容的可视性在一些情况中,某些应用标准可要求此SEI消息存在于位流中以使得为符合应用标准的所有装置带来质量的改善(例如,针对帧兼容平面立体3DTV视频格式携载帧包装SEI消息,其中除诸多其它实例外,SEI消息也经携载用于视频的每一帧,处置恢复点SEI消息,将全屏幕扫描矩形SEI消息用于DVB)。
编码装置104的输出110可通过通信链路120将构成经编码视频位流数据的NAL单元发送到接收装置的解码装置112。解码装置112的输入114可接收NAL单元。通信链路120可包含由无线网络、有线网络、或有线和无线网络的组合提供的信号。无线网络可包含任何无线接口或无线接口的组合且可包含任何适合无线网络(例如,因特网或其它广域网、基于包的网络、WiFiTM、射频(RF)、UWB、WiFi直连、蜂窝式、长期演进(LTE)、WiMaxTM等)。有线网络可包含任何有线接口(例如,光纤、乙太网、电力线乙太网、通过同轴缆线的乙太网、数字信号线(DSL)等)。可使用各种装备(例如,基站、路由器、存取点、网桥、网关、交换器等)来实施有线和/或无线网络。可根据通信标准(例如,无线通信协议)来调制经编码视频位流,并将其发射到接收装置。
在一些实例中,编码装置104可将经编码视频位流存储在存储装置108中。输出110可从编码器引擎106或从存储装置108检索经编码视频位流数据。存储装置108可包含各种分散式或本地存取数据存储媒体中的任何者。举例来说,存储装置108可包含硬盘机、存储碟、快闪存储器、易失性或非易失性存储器,或用于存储经编码视频数据的任何其它适合数字存储媒体。
解码装置112的输入114接收经编码视频位流数据且可将视频位流数据提供到解码器引擎116或存储装置118以供由解码器引擎116稍后使用。解码器引擎116可通过熵解码(例如,使用熵解码器)并提取构成经编码视频数据的一或多个译码视频序列的元素来对经编码视频位流数据进行解码。解码器引擎116可接着重新缩放且对经编码视频位流数据执行逆变换。接着将残余数据传递到解码器引擎116的预测级。解码器引擎116接着预测像素块(例如,PU)。在一些实例中,将预测新增到逆变换(残余数据)的输出。
解码装置112可将解码视频输出到视频目的地装置122,所述视频目的地装置可包含用于向内容的消费者显示经解码视频数据的显示器或其它输出装置。在一些方面中,视频目的地装置122可为包含解码装置112的接收装置的部分。在一些方面中,视频目的地装置122可为除接收装置外的单独装置的部分。
在一些实施例中,视频编码装置104和/或视频解码装置112可分别与音频编码装置和音频解码装置集成。视频编码装置104和/或视频解码装置112也可包含实施上文所描述的译码技术所需的其它硬件或软件,例如,一或多个微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑、软件、硬件、固件或其任何组合。视频编码装置104和视频解码装置112可集成成相应装置中的组合式编码/解码器(编解码器)的部分。下文参考图8描述编码装置104的具体细节的实例。下文参考图9描述解码装置112的具体细节的实例。
HEVC标准的扩展包含多视图视频译码扩展(称作MV-HEVC),和可缩放视频译码扩展(称作SHVC)。MV-HEVC和SHVC扩展共享分层译码的概念,其中不同层被包含在编码视频位流中。通过唯一层识别符(ID)来定址译码视频序列中的每一层。层ID可存在于NAL单元的标头中以识别与NAL单元相关联的层。在MV-HEVC中,不同层可表示视频位流中的相同场景的不同视图。在SHVC中,提供以不同空间分辨率(或图片分辨率)或以不同重构保真度表示视频位流的不同可缩放层。可缩放层可包含基层(具有层ID=0)和一或多个增强层(具有层ID=1、2、…,n)。基层可符合HEVC的第一版本的简档且表示位流中最低可用层。如与基层相比,增强层已使空间分辨率、时间分辨率或帧速率和/或重构保真度(或质量)增加。增强层可经分层组织且可(或可不)相依于下部层。在一些实例中,可使用单个标准编解码器来对不同层进行译码(例如,使用HEVC、SHVC或其它编码标准来对所有层进行编码)。在一些实例中,可使用多标准编解码器来对不同层进行译码。举例来说,可使用AVC来对基层进行译码,而可使用HEVC标准的SHVC和/或MV-HEVC扩展来对一或多个增强层进行译码。
一般来说,层包含一组VCL NAL单元和一组对应的非VCL NAL单元。NAL单元经指派特定层ID值。在层可相依于下部层的意义上,层可为阶层式。层组是指位流内表示的自足式的一组层,意味着层组内的层可在解码过程中相依于层组中的其它层,但不相依于用于解码的任何其它层。因此,层组中的层可形成可表示视频内容的独立位流。层组中的所述组的层可通过子位流提取过程的操作从另一位流获得。层组可对应于在解码器想要根据某些参数操作时将被解码的所述组的层。
如先前所描述,补偿增强信息(SEI)消息可被包含在视频位流中。HEVC规范包含并非解码译码图片所需要但提供可对解码器侧实体处理经解码图片(例如,用于改善经解码输出的显示或处理以增强内容的可视性)有益的额外信息的数个SEI消息。解码译码图片也需要一些SEI消息,例如与一致性有关的那些消息,和其它消息。虽然在一些状况下并不要求解码器剖析或处理SEI消息,但一些应用标准可强加要求某些SEI消息存在于视频位流中的要求,且在一些状况下,要求使用这些SEI消息中的信息来进行特定处理。在一些实例中,嵌套SEI消息(例如,可缩放嵌套SEI消息)包含一或多个SEI消息且指示一或多个SEI消息适用于一或多个位流子集(例如,适用于一组层)。
图2为实例性视频位流200的部分的图。视频位流200包含VPS 231、SPS 232和PPS233。如先前所描述,视频位流200的图片中的每一切片参考有效VPS、SPS和PPS(例如,使用VPS ID、SPS ID和PPS ID)来存取解码装置可用于解码切片的信息。PPS 233可包含应用于给定图片(例如图片230)中的所有切片的信息。SPS 232可包含应用于视频位流200中的所有图片或视频位流200的相同译码视频序列(CVS)中的所有图片的信息。VPS 231可包含应用于视频位流200内的所有层或视频位流200的CVS的信息。举例来说,VPS 231可包含具有应用于整个译码视频序列的语法元素的语法结构。在图2中所展示的实例中,VPS 231、SPS232和PPS 233在频带内用视频位流200发信。在其它实例中,与含有译码视频数据的位流200的NAL单元相比,可在单独发射中频带外发射VPS 231、SPS 232和/或PPS 233。
视频位流也包含与图片230有关的信息,包含SEI消息234、SEI消息235、SEI消息236、切片237和切片238。虽然图2的实例中展示图片230的仅两个帧237和238,但图片230可分割成多于两个切片。此外,在一些状况中,除图2中所展示的信息外的信息可包含在图片230的视频位流200中。
数据集(例如,元数据或其它数据)可包含在SEI消息(例如,SEI消息234、235和236)中。数据集可由解码器装置、播放器装置或接收器侧上的其它装置使用来对图片执行一或多个功能(例如,在解码图片之前或之后,但通常在之后)。举例来说,SEI消息中的数据集可经执行或使用以对图片执行一或多个功能。在另一实例中,SEI消息中的数据集可指定一或多个区域特定的内容的特性。在另一实例中,SEI消息中的数据集可提供解码器装置、播放器装置或其它装置可用于处理一或多个区域的内容的提示或其它信息(例如,根据装置的约束或根据装置操作的条件)。SEI消息中的数据集也可用于各种其它用途。
在一个说明性实例中,SMPTE-2094-1标准描述对视频内容的色彩容量变换有用的动态元数据,例如在预期(例如,终端用户装置的)目标显示器与主控显示器(例如,视频生产侧处的参考监视器)相比具有不同亮度、色彩容量或传送特性时。举例来说,元数据可受主控显示器的特性约束(例如,如SMPTE ST 2086:201x中所定义),但确保维持创造性意图,但也可使用内容相依性元数据。从编码器发送的后设信息可在目标显示器具有不同特性时对欲显示的图片有益。SMPTE-2094有关文件中已指定数个应用,也指定元数据的不同携载以支持这些应用。尽管视频标准的上下文中的应用可指视频流式传输化,视频广播、视频电话、视频会议和其它此类用途状况,但本文件中的措词“应用”也用于指根据SMPTE-2094执行色彩容量变换中的一些的特定状况。此些“应用”的实例包含在以较小色彩容量或较低亮度显示内容时,当在标准动态范围(SDR)显示器处显示高动态范围(HDR)内容时,和其它应用。也可指定其它“应用”。
跨越各种应用的包含在SEI消息中的数据(例如,对应于SMPTE-2094-1的元数据)的共同特征包含目标显示器特性(例如,原色、白点,以及其它特性)、持续性和元数据应用于的区域的描述。在一些状况中,一或多个元数据集可经发送用于(SMPTE-2094标准的)不同“应用”中的区域(例如,矩形区域或其它形状的区域),用于不同目标显示器,和用于其它用途。举例来说,发送到解码器的元数据(例如,SMPTE-2094-1元数据或其它元数据)可与元数据应用于其的区域相关联。
返回到图2,SEI消息234、SEI消息235和SEI消息236中的每一个包含与图片230的不同区域相关联(例如,定义)的区域数据以及与对应于特定SEI消息的图片230的区域相关联的元数据。举例来说,SEI消息234包含定义图片230的第一区域的区域1数据241和第一元数据242集,所述第一元数据集定义可对第一区域执行的功能、第一区域的特性、与装置约束或操作条件有关的提示和/或其它信息等。第一区域可类似于图4A中所展示的区域1402。SEI消息235包含定义图片230的第二区域的区域2数据243以及定义功能、特性、提示或应用于第二区的类似者的第二元数据244集。第二区域可类似于图4A中所展示的区域2404。SEI消息236也包含定义图片的第一区域的区域1数据241,但包含定义另一功能、其它特性、其它提示或应用于第一区域的类似者的第三元数据245集。
存在关于视频内容的元数据(例如,与图片有关的SMPTE-2094元数据或其它数据)的各种问题。作为一个实例,针对可应用于图片区域的元数据,为支持不同应用,可针对相同区域发信多于一个元数据集,在此状况下,针对可应用于彼区域的每一元数据集发信定义给定区域的数据。举例来说,如图2中所展示,定义图片230的第一区域的区域1数据241经发信用于SEI消息234中的元数据242和SEI消息236中的元数据245两者。然而,针对每一个别元数据集处理(例如,发信和/或接收)区域(例如,区域数据)是低效的。元数据集的数目可变得非常大。举例来说,在给定时间例项处针对十个目标显示器中的每一个和十五个应用中的每一个可存在三个元数据集。个别地针对这些元数据集中的每一个处理区域数据可产生问题。
存在关于SEI消息的其它问题。举例来说,可以区域特定方式应用一些SEI消息。不具有支持不同区域特定应用的共同框架将导致对跨越SEI消息的区域特定语法元素的重复定义。可能具有区域特定应用或功能的SEI消息的一个说明性实例包含胶卷粒纹特性SEI消息,其用于将关于胶卷粒纹合成的参数模型输送到解码器。可在图片的不同部分中(例如,在图片的不同区域中)以不同方式感知胶卷粒纹特性。启用基于区域的发信将有助于描述这些特性。举例来说,此基于区域的发信将有助于在同一图片中存在从然图像(胶卷粒纹模型可应用于其)和人工产生内容(其可能不具有与其相关联的任何胶卷粒纹)两者的混合式内容。
可具有区域特定应用的SEI消息的另一说明性实例为色调映射信息SEI消息。发信色调映射信息SEI消息以提供信息或数据集以使得能够将定制的所输出解码图片的色彩样本重新映射到特定显示环境。在一个说明性实例中,数个视频应用(例如,新闻广播、运动赛事或其它视频应用)允许用于在显示器上同时显示从不同源显现的数据的画中画模式。此两个(或多于两个)视频源的特性可为非常不同的。举例来说,可在光照条件受控制的工作室中捕捉主视频(使用整个显示区显示),且可在光照机器不同(例如,黑暗)的从然环境中捕捉插入的图片(显示为在整个显示区上方的较小视窗)。当同一视频中存在具有不同特性的不同内容(来自不同源)时,允许经调准于特定源的色调映射将为有益的。
可能具有区域特定应用的SEI消息的其它说明性实例为后滤波提示SEI消息和色度重新采样滤波提示SEI消息。举例来说,使用后滤波提示SEI消息来指示对设计供用于解码图片的后处理之后滤波器有用的信息或数据集。滤波器对处理内容非常有用以便减轻处理的效应,和/或增强所显示内容的质量。视频信号(或内容)的特性基于内容的区域的特性而变化。类似情况适用于色度重新采样滤波提示SEI消息。
可具有区域特定应用的SEI消息的另一说明性实例为色彩重新映射信息SEI消息。色彩重新映射信息(CRI)SEI消息具有数个用途,其中的一个为使来自一个色彩表示的内容适应于另一色彩表示(例如,从BT.2020到BT.709,色彩容量转换,或其它色彩表示调适或转换)。CRI SEI消息的另一用途为使视频信号再成形以满足各种应用要求。此处再次,针对固定内容和具有不同特性的内容,待应用的SEI消息的CRI参数可跨越同一图片内的不同区域不同。
可具有区域特定应用的SEI消息的另一说明性实例为拐点功能信息SEI消息。拐点功能信息的基于区域的发信的动机类似于色调映射信息的动机-提供信息以实现将定制的解码图片的色彩样本映射到特定显示环境。不同之处在于色调映射信息在非线性域中应用映射功能,而拐点功能信息在线性光域中应用映射功能。
在所有上述实例中,SEI消息的当前发信仅允许发信应用于整个图片的信息。允许基于区域发信无需重新定义实际SEI消息将为有益的。
此外,现有SEI消息可再用于使用区域特定发信的不同应用。在一个说明性实例中,SMPTE 2094-30标准使用在色彩重新映射信息(CRI)SEI消息中发信的信息。避免针对SMPTE 2094-30标准重新定义CRI SEI消息将是有益的。然而,SMPTE 2094-30中可存在未包含在CRI SEI消息中的某些语法元素。此外,SMPTE-2094特定的CRI SEI消息的扩展可并非纯熟且高效的设计。
本文中所描述的实施例包含用于产生待应用于视频图片的区域的视频和/或数据集(例如,元数据或其它数据)的方法和系统。在一些状况中,方法和系统可发信图片的区域集(或子集)、消息和/或数据(例如,元数据或其它数据)集,以及消息中的每一个对区域的应用。举例来说,视频和/或数据子集可与指定的区域的子集相关联。消息可包含补充增强信息(SEI)消息或可被包含在视频译码和视频应用标准(例如H.265/HEVC、H.264/AVC、BDA、MPEG、DVB或其它标准)的视频位流中或包含有所述视频位流的任何其它合适的消息。本文中所描述的实例可单独地或与一或多个其它实例、实施例或实施方案组合应用。与回圈的特定反复相关联的一或多个语法元素可与回圈的所有反复相关联且在回圈外部发信,或反之亦然。
在一些实例中,区域嵌套消息可经产生用于视频图片。区域嵌套消息可经产生用于图片且可用于发信图片区域集(例如,使用定义每一图片区域的区域数据)、作为区域嵌套消息中的嵌套消息的消息集(本文中被称作“嵌套消息”或“可区域嵌套消息”)和嵌套消息与图片区域的关联性。举例来说,区域集(包含一或多个区域)可连同与区域相关联的嵌套消息集指定在区域嵌套消息中。图片的区域可包含图片的空间部分或子集(例如,如图4中所展示)。
图片的区域嵌套消息中定义的嵌套消息可包含可应用于所述图片的一或多个区域的一或多个数据集(例如,元数据或其它数据集)。在一些实例中,嵌套消息中的数据集定义可由解码器装置、播放器装置或其它装置对一或多个区域执行的功能。举例来说,数据集可定义任何合适功能,例如使用胶卷粒纹特性SEI消息、色调映射信息SEI消息、后滤波提示SEI消息、色度重新采样滤波提示SEI消息、色彩重新映射信息SEI消息、拐点功能信息SEI消息或用于对视频图片的区域执行功能的任何其它合适数据执行的功能。在一些实例中,嵌套消息中的数据集定义含在一或多个区域中的内容的特性。在一个说明性实例中,数据集可包含指定含在一或多个区域中的内容的最大亮度的信息。在一些状况中,数据集中的特性或其它信息可由将应用于一或多个区域的另一功能使用。在一些实例中,嵌套消息中的所述数据集可指定可由解码器装置、播放器装置或其它装置用于根据装置的约束或根据装置操作的条件来处理含在一或多个区域的内容的提示或其它信息。在一个说明性实例中,数据集可包含关于编码器可考虑适合用于处理内容的第一滤波器系数集,且所述解码器装置、播放器或其它装置可选择使用那些系数,以将其应用于属于与所述数据集相关联的所述一或多个区域的内容。在另一实例中,装置可使用第一系数集导出第二系数集,且可将第二系数集应用于一或多个区域的内容。
区域嵌套消息中的区域数据可定义图片的每一区域一次,且区域嵌套消息中的嵌套消息可与识别嵌套消息中的数据集待应用的区域的区域识别符相关联。举例来说,区域嵌套消息的嵌套消息可包含指示嵌套消息中的任何数据待应用的区域的一或多个区域识别符。可将区域识别符指派到嵌套消息中的数据集以指示所述数据集欲应用于的区域。在一些状况中,仅区域嵌套消息中的一或多个数据集可应用于的图片的区域是由区域嵌套消息的区域数据定义。举例来说,如果图片含有四个区域,但区域嵌套消息中的一或多个数据集仅可用于四个区域中的两者,那么仅一或多个数据集可应用于的两个区域经定义在区域嵌套消息中。在一些状况中,图片的所有区域可定义在区域嵌套消息中。在一些实例中,索引集可被包含在指示或指向嵌套消息中的一或多个数据应用于的一或多个区域(例如,使用区域识别符)的嵌套消息。使用此技术,区域数据并非必须针对每一嵌套消息或针对欲应用于图片的每一数据集单独地发信。
区域嵌套消息的一个实例为区域嵌套补充增强信息(SEI)消息。关于图片的区域嵌套SEI消息可包含定义图片的至少一个区域的区域数据,且也可包含具有数据集和一或多个区域识别符的多个嵌套SEI消息。举例来说,可产生并发信指定一或多个嵌套SEI消息应用于其的矩形区域(或具有其它合适的形状的区域)的区域嵌套SEI消息。出于说明目的下文使用含有嵌套SEI消息的嵌套SEI消息来描述各种实例,但所属领域的技术人员将了解由实例涵盖的概念也可应用于含有嵌套消息的其它类型的嵌套消息。
在一些实例中,装置(例如,编码装置或其它合适的装置)可发信一或多个图片的区域集和元数据集或SEI消息的列表。举例来说,装置可发信图片的区域集和与图片的区域中的一或多个相关联的元数据集的列表。在另一实例中,装置可发信图片的区域集和与区域中的一或多个相关联的SEI消息。SEI消息可包含定义可对图片的区域执行的功能,定义区域的特性,定义装置可使用来处理区域且与装置的约束或操作条件有关的提示或其它信息等的数据集或元数据。在一些方面中,如上文所描述,区域集可在区域嵌套SEI消息中发信,且嵌套SEI消息可包含嵌套SEI消息和与区域和相关联的元数据。
图3为说明经产生用于视频位流的图片的区域嵌套SEI消息350的实例的图。区域嵌套SEI消息350可由装置产生,例如编码装置104或可将区域嵌套SEI消息350存储在视频位流中或用视频位流将区域嵌套SEI消息350发射到接收装置(例如解码装置112或可解码或以其它方式处理区域嵌套SEI消息350的其它装置)的其它装置。区域嵌套SEI消息350包含定义图片中的多个区域的区域数据351且也包含多个嵌套SEI消息(嵌套SEI消息352和嵌套SEI消息353)。虽然多个区域由区域数据351定义,但在一或多个元数据集仅可用于一个区域时的状况下可定义仅一个区域。
区域数据351包含区域1数据354、区域2数据355到区域N数据356。区域1数据354定义图片中的第一区域,区域2数据355定义图片中的第二区域,且区域N数据356定义图片中的第N区域。由关于给定区域嵌套SEI消息的区域数据定义的区域的数目可包含任何合适数目个区域(例如,两个区域、三个区域、五个区域或任何其它合适数目个区域),其可由用于定义视频内容的应用或标准定义。在一些状况中,编码器可基于发信的应用或元数据和内容而作出针对图片定义的区域的数目的确定。举例来说,在位流中或用位流发信用于图片的区域的数目,且解码器、播放器、显示器或其它装置从位流获得区域信息。
在一些实例中,区域数据351可包含在区域嵌套SEI消息350中指定的图片的多个区域,使得与经发信用于这些区域的元数据相关联的信息可应用于区域中的一或多个。举例来说,语法元素可包含在指示区域的数目的嵌套SEI消息350的语法中(例如,下文的实例性语法中所展示的rns_num_rect_regions,其也可被重写为regional_nesting_num_rect_regions)。
区域数据351可以各种方式定义图片的不同区域。在一些实例中,区域经指定成矩形区域。在其它实例中,区域可被指定为任何其它合适的形状。举例来说,可发信非矩形区域,且发信与指示元数据可应用于的区域和样本相关联的语法元素。
在一些实例中,区域数据351可包含指定区域的边界的语法元素集。在一些实施方案中,可通过指定区域边界从图片的对应边界的偏移来定义区域的边界。下文在实例性语法结构中展示指定区域的边界偏移的语法元素的实例(例如,rns_rect_region_left_offset[i]、rns_rect_region_top_offset[i]、rns_rect_region_right_offset[i],和rns_rect_region_bottom_offset[i])。举例来说,rns_rect_region_left_offset[i]指定第i矩形区域的左上样本从嵌套SEI消息中指定的左图片边界的水平偏移。在一些实施方案中,区域数据351包含与指定矩形区域的左上和右下样本的位置的边界相关联的语法元素。也可使用其它形式的发信边界,例如发信矩形区域的右上和左下样本,或任何其它合适形式的发信边界。
在一些实例中,在图片的边界上指定区域。存在不同类型的图片边界,包含解码图片边界和输出图片边界(或一致性剪裁边界或窗)。经解码图片边界为经解码且存储在经解码图片缓冲器中的图片边界。然而,在输出之前,图片可经重新定大小(例如,重新定大小成小于经解码图片的大小)。举例来说,经解码图片可由于一或多种原因而不同于输出图片,例如这是因为图片分辨率并非最小译码单元(CU)大小的倍数,这是因为经解码图片具有可不呈现用于输出的一些信息或内容,或出于其它原因。
在一些实例中,在经解码图片边界上指定区域。可以明度样本位置(或图片的其它色彩分量,例如色度)为单位指定图片的矩形区域(或其它形状)的偏移。在一个说明性实例中,第i矩形区域含有色度样本,所述色度样本具有从SubWidthC*regional_nesting_rect_left_offset[i]到pic_width_in_luma_samples-(SubWidthC*regional_nesting_rect_right_offset[i]+1)(包含两者)的水平图片坐标,和从SubHeightC*regional_nesting_rect_top_offset[i]到pic_height_in_luma_samples-(SubHeightC*regional_nesting_rect_bottom_offset[i]+1)(包含两者)的垂直图片坐标。SubWidthC和SubHeightC用于依据样本单元按比例调整语法元素。举例来说,在4:2:0视频中,如果边界并非在偶数行和列处开始,那么不清楚色度值是否属于区域。如此,在使用4:2:0视频的此实例中,可使用两个样本单位的单位,在此状况下SubWidthC和SubHeightC皆为2。在另一实例中,针对4:4:4视频,SubWidthC和SubHeightC将为1。
在一些实例中,在一致性裁剪窗上指定区域。举例来说,在一些状况下,可通过使用任意样本值来延伸图片区域和在参数集(例如,PPS、SPS、VPS等)中指定一致性裁剪窗来译码不表示最小CU大小的整数倍的图片大小。举例来说,裁剪窗可包含用以指示经译码图片的输出区域的参数。在一些实例中,裁剪窗参数可指示输出图片小于经解码图片的时间。
在一些实例中,在由图片边界指定的区域上指定区域,所述图片边界由于图片宽度和图片高度相关联的位流中的语法元素指定。举例来说,如果存在指定除经解码图片边界和输出图片边界外的边界的其它装置,那么可在那些边界上指定区域。
在一些实例中,基于全屏幕矩形的发信而发信区域。在一些状况中,全屏幕矩形可提供一致性裁剪窗参数以指示输出图片小于经解码图片的时间。举例来说,全屏幕矩形语法可指定一或多个矩形相对于一致性裁剪窗的坐标(例如,由有效参数集(例如,SPS、PPS或VPS)指定)。在一个说明性实例中,可以相对于明度采样栅格的十六分之一明度样本间隔为单位指定每一坐标。所属领域的技术人员将了解可将任何间隔用于坐标。全屏幕矩形可包含在SEI消息中,或可在位流中发信或在位流外部传达。全屏幕矩形可基于上文所描述区域ID与全域嵌套SEI消息350相关联。
区域数据351也可包含与一或多个区域相关联的样本(例如,图片的像素)。在一个实例中,区域1数据354可包含第一区域的ID,定义第一区域的边界的信息,以及与第一区域相关联的样本。语法元素集可用于指定第一区域的区域ID、边界和样本。在一些实施方案中,区域可包含在区域的边界范围内的所有样本。在一些实施方案中,除位于区域的边界内的样本外,在区域的边界上的样本,或经导出在区域的边界附近的样本也与经发信用于应用于区域的元数据相关联。举例来说,可将第一区域的区域ID映射到在第一区域的边界内的像素,且也可将其映射到在边界上的像素和/或经导出在第一区域的边界附近的样本。
在一些实施方案中,经发信用于任何特定改头像的区域不重叠,使得不存在于经指定用于给定图片的多于一个区域相关联的样本。在其它实施方案中,用于图片的区域可重叠,在此状况下样本可属于多个区域。
在一些实例中,区域数据351可包含关于由区域数据351定义的每一区域的ID。举例来说,区域1数据354可包含关于第一区域的第一ID,且区域2数据355可包含关于第二区域的第二ID。下文展示用于发信区域ID的语法元素的实例(例如,rns_rect_region_id[i],指示关于在SEI消息中指定的第i矩形区域的识别符)。区域ID可用于确定特定嵌套SEI消息中的元数据对与识别符相关联的区域的适用性。在一些状况中,不同区域的区域ID可与所述区域与其相关联的嵌套SEI消息352和353中的元数据357、359相关联。在一些状况中,区域ID可用于指示图片中的区域的优先顺序。在一个说明性实例中,当样本与多于一个区域相关联时,可应用于样本的元数据为与来自包含样本的区域间的包含样本且具有识别符的最大值的区域相关联。举例来说,第一嵌套SEI消息352(和元数据357)可应用于第一区域,且第二嵌套SEI消息353(和元数据359)可应用于第二区域。在此实例中,如果图片中的样本在第一区域且在第二区域中,且第二区域具有高于第一区域的区域ID,那么将通过解码器或其它装置将嵌套SEI消息353的元数据359应用于样本。在一些实例中,在选择具有相同类型或用途且可经定义用于图片的重叠区域的多个元数据时,使用此优先顺序。举例来说,基于优先顺序选择SEI消息和/或元数据应用可受限于相同类型的嵌套SEI消息。在一个说明性实例中,如果区域1和区域2重叠,且如果色调映射SEI应用于区域1且CRI消息应用于区域2,那么不存在任何优先顺序问题。然而,在第一类型的嵌套SEI(例如,嵌套色调映射SEI)应用于区域1且第一类型的另一嵌套SEI应用于区域2时可发生问题,在此状况下,可能需要优先顺序来解决两个区域的重叠像素。
发信具有优先顺序的区域可有助于使发信更高效。举例来说,如在图4A中所展示,图片400A含有两个区域,包含第一区域402(区域1)和第二区域404(区域2)。第二区域404为图片的中间的小矩形区域,且第一区域402为图片的其余部分。在一个实例中,图片的第一区域402具有所施加的一个元数据集(例如,元数据357),且图片的剩余部分(第二区域404)具有所施加的另一元数据集(例如,元数据359)。第一区域402可发信作为具有比第二区域404低的优先顺序的完整图片。举例来说,使用优选顺序识别符(ID),仅两个区域必须指定,其中第二区域404具有较高优先顺序ID。在无优先顺序ID的情况下,必须指定五个区域,如图4B中所展示。举例来说,在无优先顺序ID的情况下,图片将不能够具有重叠区域,这是因为其将不清楚将如何处置重叠的区域。在一个说明性实例中,如图4B中所展示,不使用优先顺序将导致发信五个区域,这是因为所述区域将必须为不重叠的。
在一些方面中,装置(例如,编码装置或其它装置)可产生区域数据351以使得其指定(例如,使用语法元素)用于在嵌套SEI消息中定义区域的边界和可应用样本的单元。举例来说,语法元素的值可指定所使用的单位为样本位置。在一些实施方案中,用作用以描述区域的边界的单位的样本位置对应于明度样本位置。举例来说,可以明度样本位置为单位指定矩形区域的偏移。在一些实施方案中,样本位置可对应于图片的分量(例如,明度分量、色度分量中的一或多个、明度与色度分量的组合等)中的一或多个的位置。在另一实例中,另一值可指定为译码树单元(CTU)的单元。在另一实例中,又一值可指定单位为图像块。在一些实例中,基于图像块在位流中是否经启用而将约束包含在语法元素上。
在一些实施例中,可将约束新增到区域嵌套SEI消息350的语法或语意以使得指定区域的一或多个语法元素表示有效区域或表示非空区域。举例来说,约束可指示样本位置的坐标小于或大于另一样本位置的另一坐标。在一个说明性实例中,可新增指示左上样本位置的水平坐标小于区域的右下样本位置的水平坐标的约束。在另一说明性实例中,可新增左上样本位置的垂直坐标小于区域的右下样本位置的垂直坐标的类似约束。在指定图像边界的其它形式以确保所指定区域为非空或为有效区域时可新增类似约束。此约束的一个说明性实例如下:SubWidthC*(regional_nesting_rect_left_offset[i]+regional_nesting_rect_right_offset[i])的值应小于pic_width_in_luma_samples,且SubHeightC*(regional_nesting_rect_top_offset[i]+regional_nesting_rect_bottom_offset[i])的值应小于pic_height_in_luma_samples。
在一些实施例中,可将约束新增到嵌套SEI消息350的语法或语意以使得当针对图片的两个或多于两个区域定义特定类型(或用途)的嵌套SEI消息的一或多个例项时,区域的识别符(例如,区域ID,其可使用例如rns_rect_region_id或regional_nesting_rect_region_id的语法元素发信)的值针对两个或多于两个区域中的任何者不应为相同的。在一些实例中,SEI消息的类型由payloadType变量定义。在一些实例中,SEI消息的类型由payloadType变量和SEI消息中的语法元素的子集的值的组合来定义。此约束的一个说明性实例如下:位流一致性的要求为regional_nesting_rect_region_id[i]的值在区域嵌套SEI消息中针对0到regional_nesting_num_rect_regions-1范围(包含0、regional_nesting_num_rect_regions-1)中的任何两个不同值不应相同;当listOfRegionNestableMessageTypes中的特定类型的SEI消息存在于一个区域嵌套SEI消息中且应用于当前图片的区域列表listA且listOfRegionNestableMessageTypes中的同一类型的另一SEI消息存在于区域嵌套SEI消息中且应用于当前图片中的区域的列表listB,位流一致性的要求为针对通过从listA选择一者且从listB选择另一者形成的任何对或区域,两个区域的regional_nesting_rect_region_id[]的值不应为相同的直到两个区域为完全相同的且两个SEI消息为完全相同的。
如先前所阐释,装置可产生区域嵌套SEI消息350使得其将嵌套SEI消息352和353的区域特定应用发信到解码器或其它装置。返回到图3,区域嵌套SEI消息350经展示为具有两个嵌套SEI消息,包含嵌套SEI消息352和嵌套SEI消息353。所属领域的技术人员将了解区域嵌套SEI消息350可包含任何合适数目个嵌套SEI消息。嵌套在区域嵌套SEI消息350中的嵌套SEI消息的数目可基于图片的区域的数目,基于欲应用于图片的应用或功能的数目,基于编码器或其它装置确定针对图片的区域应指定的特性的数目,或基于其它参数。
不同嵌套SEI消息352和353可由编码器或其它装置产生且由解码器或其它装置用于不同用途。嵌套SEI消息352和353具有实现SEI消息352、353的用途的不同元数据。在一个实例中,SEI消息352或353的元数据可由解码器装置、播放器或其它装置用于执行与SEI消息352或353的用途有关的功能。在另一实例中,SEI消息352或353的元数据可根据SEI消息352或353的用途而指定图片(例如,图片的区域)的特性。不同嵌套SEI消息352和353可已定义指示嵌套SEI消息的用途的类型。举例来说,嵌套SEI消息352可具有第一类型且可用于第一用途,且嵌套SEI信息353可具有第二类型且可用于第二用途。嵌套SEI消息352和353可用于可应用于视频图片的区域的任何用途。嵌套SEI消息352、353的SEI或元数据类型的说明性实例可包含胶卷粒纹特性SEI消息、后滤波提示SEI消息、色度重新采样滤波提示SEI消息、色调映射信息SEI消息、拐点功能信息SEI消息、色度重新映射信息SEI消息,或可以区域为基础应用于图片的一或多个区域的任何其它SEI消息或数据。
在一个说明性实例中,嵌套SEI消息352可用于从第一动态范围转换成第二动态范围,例如从高动态范围(HDR)转换成标准动态范围(SDR)。例如,用高动态范围/宽色域(HDR/WCG)主控的源内容可经变换用于在具有较小色彩容量(例如,与藉以主控内容的范围或色域相比,较低亮度范围或较小色域,或较低亮度范围和较小色域)的显示器(例如,SDR显示器)上呈现。在此实例中,嵌套SEI消息352可包含CRI SEI消息,且嵌套SEI消息352的元数据357可包含用以执移动态范围转换的数据。举例来说,元数据357可包含预查找表、色彩重新映射矩阵和后查找表。预查找表和后查找表可包含不同或类似分段线性函数(例如,关于每一色彩分量的分段线性函数)。色彩重新映射矩阵可包含线性模型,例如在存在三个色彩分量时的3×3矩阵。举例来说,色彩重新映射矩阵可跨越每一图片样本的所有色彩分量应用且可用于映射色彩分量的系数。
在另一说明性实例中,嵌套SEI消息353可用于色调映射,且可包含色调映射信息SEI消息。嵌套SEI消息353的元数据359可包含用于对由一或多个区域ID 360指定的一或多个区域执行色调映射的数据。
在一些实施方案中,装置可产生区域嵌套SEI消息350以使得其指定嵌套SEI消息(例如,嵌套SEI消息352、353)的语意使得嵌套SEI消息或元数据集中的每一个可用于嵌套SEI消息(例如,如由一或多个区域ID 358和360指示)中所指定的区域中的一或多个。在一些状况中,一或多个区域识别符(ID)、索引或指标可被包含在嵌套SEI消息中或与其相关联以指示嵌套SEI消息可应用于哪些区域。举例来说,针对每一嵌套SEI消息(例如,嵌套SEI消息352、353)或元数据集(例如,元数据357、359),装置可产生区域嵌套SEI消息350以将索引、识别符或指标集发信到与嵌套SEI消息相关联的区域列表,索引、识别符或指标集指示欲将嵌套SEI消息或元数据集应用于由所述索引、识别符或指标中的每一个指示的每一区域。如图3中所展示,嵌套SEI消息352中定义的一或多个区域ID 358指示元数据357欲应用的图片的一或多个区域(由区域数据351定义)。举例来说,一或多个区域ID 358可被包含作为指向对应区域的索引或指标。在一些状况中,解码器(或其它装置)可将元数据357仅应用于由一或多个区域ID 358指定的图片的一或多个区域(且因此执行功能,解释特性,或使用与元数据357相关联的提示或其它信息)。解码器也可将元数据359仅应用于由一或多个区域ID 360指定的图片的一或多个区域。区域ID 358和360并未定义区域的参数,但参考由区域数据351定义的区域。因此,区域并非必须针对区域嵌套SEI消息350中的每一嵌套SEI消息重新定义。通过针对区域嵌套SEI消息350中的所有嵌套SEI仅定义区域一次,节省字节的数目,此可增加译码效率、带宽和其它益处。
在一些实施方案中,装置可产生区域嵌套SEI消息350以含有可与当前图片相关联的一或多个SEI消息的索引、识别符或指标列表。在一些实例中,替代将SEI消息明确嵌套在区域嵌套SEI消息350内,可发信SEI消息的索引、识别符或指示列表。索引、识别符或指标可包含在SEI消息中发信的一或多个识别符、SEI消息的有效负载类型或其它形式的识别。
在一些实施方案中,装置可产生区域嵌套SEI消息350以使得其包含识别区域嵌套SEI消息350的用途的一或多个语法元素。举例来说,用途并不与嵌套SEI消息350中的嵌套SEI消息的用途和/或语意矛盾,且可控管嵌套消息全部促进的全部用途。在一个实例中,ID值1可指示嵌套SEI消息一起(例如,色调映射器、滤波器等)用于提供旧型显示器中的视频内容的最佳再现性。在另一实例中,ID值可由外部应用标准使用。在一些实例中,可发信确定区域嵌套SEI消息350中的嵌套SEI消息的用途或使用SEI消息的应用的一或多个识别符。在一些实例中,识别符也可用于指定嵌套SEI消息350内的一或多个语法元素的语法和语意。在下文所展示的实例性语法中展示识别符的实例性语法元素(例如,展示为rns_id或regional_nesting_id)。
在一些实施方案中,装置可产生区域嵌套SEI消息350以使得其包含在嵌套SEI消息350中发信的SEI消息或元数据的数目。用于发信数目的实例性语法元素在下文所展示的实例性语法中展示(例如,为num_seis_in_rns_minus1或num_sei_messages_in_regional_nesting_minus1)。在一些实施方案中,装置可发信用于导出在嵌套SEI消息中发信的SIE消息或元数据集的数目的数目。
在一些实施方案中,区域嵌套SEI消息350可经产生以包含指示所发信字节的数目的数目,后续接着与和嵌套SEI消息350相关联的每一嵌套SEI消息(嵌套SEI消息352、353)或每一元数据集(例如,元数据357、359)相关联的那些字节。字节的解释可由在HEVC或其它相关规范的外的装置指定,或可基于区域嵌套SEI消息350的识别符的值。
在一些实施方案中,嵌套SEI消息(例如,区域嵌套SEI消息350)的持续性是在嵌套在嵌套SEI消息中的嵌套SEI消息或元数据集中的那些方面指定。可应用于第一图片(或在可应用时,可应用于接入单元)的SEI消息的持续性或持续性范围指示SEI消息可应用于的含有第一图片的层内的图片(或在可用时,指示接入单元)。在一些状况中,每一嵌套SEI消息具有与在SEI消息非嵌套式的情况下相同的持续性范围。下文在表1中展示不同SEI消息类型的持续性范围的实例。在一些状况中,嵌套SEI消息独立地应用于区域嵌套SEI消息中所定义的区域,且嵌套SEI消息的持续性独立地应用于每一窗口。在一些实例中,嵌套SEI消息的持续性可被忽略且持续性可在嵌套SEI消息内由所发信的一或多个语法元素指定或由语意指定。
SEI消息 持续性范围
胶卷粒纹特性 由SEI消息的语法指定
后滤波器提示 含有SEI消息的接入单元
色调映射信息 由SEI消息的语法指定
色度重新采样滤波器提示 含有SEI消息的CLVS
拐点功能信息 由SEI消息的语法指定
色彩重新映射信息 由SEI消息的语法指定
表1:嵌套SEI消息的持续性
在一些实施方案中,装置可产生区域嵌套SEI消息350以包含指定明确发信的某些其它语法元素的语法元素。举例来说,语法元素可指示在区域嵌套SEI消息350中明确地发信与一或多个嵌套SEI消息(嵌套SEI消息352、353)应用于的应用相关联的语法元素、与目标系统相关联的语法元素,或与应用和目标系统有关的语法元素。下文展示此语法元素的实例(例如,作为rns_info_present_flag)。举例来说,区域嵌套SEI消息350可发信嵌套SEI消息(嵌套SEI消息352、353)或元数据集(例如,元数据357、359)可应用于的应用有关的语法元素。在一些状况中,这些语法元素可包含应用识别符和应用版本。作为另一实例,区域嵌套SEI消息350可发信嵌套SEI消息或元数据集可应用于目标系统有关的语法元素。在一些状况中,这些语法元素可包含与目标系统和对应白点坐标相关联的显示器原色。在一些状况中,这些语法元素可包含与目标显示器相关联的最小和最大亮度。
在一些实施方案中,装置可产生区域嵌套SEI消息350以在每一嵌套SEI消息(例如,嵌套SEI消息352、353)或元数据集(例如,元数据357、359)的每一可用区域内发信子集区域。在一些实例中,装置可在区域嵌套SEI消息350中发信指定其中指定子集区域的域的语法元素。举例来说,语法元素的一个值(例如,0或1)可指定域为YCbCr,且另一值(例如,1或0)可指定域为空间域。在一些实例中,装置可发信或导出针对可用区域指定的多个范围或边界。在一些实例中,装置可发信指定所指定的范围或边界的类型的语法元素。举例来说,一个语法元素可指定:指定下界和上界。在另一实例中,另一语法元素或值可指定:指定圆碟。在另一实例中,可指定指定椭圆区域的语法元素的又一值。在一些实例中,装置可发信或导出多个与每一范围或界限时间相关联的值且可发信那些值。在一些实例中,装置可发信指示嵌套SEI消息应用于的可用区域内的子集区域在所指定范围或界限内抑或在所指定范围/界限外部的旗标。
图5为说明经产生用于视频位流的图片的区域嵌套SEI消息570的另一实例的图。区域嵌套SEI消息570可由装置产生,例如编码装置104或可将区域嵌套SEI消息570存储在视频位流中或用视频位流将区域嵌套SEI消息570发射到接收装置(例如解码装置112或可解码或以其它方式处理区域嵌套SEI消息350的其它装置)的其它装置。
区域嵌套SEI消息570类似于区域嵌套SEI消息350,且包含在图片中定义多个区域的区域数据571且也包含多个嵌套SEI消息572和573。区域数据571类似于区域数据351,且包含区域1数据574、区域2数据575直到区域N数据576。上文关于区域嵌套SEI消息350所描述的所有实例可应用于区域嵌套SEI消息570。虽然多个区域由区域数据571定义,但在一或多个元数据集仅可用于一个区域时的状况下可定义仅一个区域。
区域嵌套SEI消息570含有可应用于同一图片中的至少一个共同区域的多个嵌套消息572和573。嵌套SEI消息572包含指示嵌套SEI消息572待应用于的用途的类型。举例来说,嵌套SEI消息572可用于从第一动态范围转换到第二动态范围,在此状况下嵌套SEI消息572可为CRI SEI消息。嵌套SEI消息572包含多个数据集和多个区域识别符(ID)。数据集包含元数据577和元数据578,所述元数据577和元数据578皆可在图片的不同区域上用于所识别用途(例如,从HDR转换到SDR,或其它用途)。举例来说,元数据577和元数据578可包含用于嵌套SEI消息572的用途(例如,HDR到SDR转换,或其它用途)的元数据的不同值。所属领域的技术人员将了解嵌套SEI消息572可包含多于两个元数据集和多于三个区域ID。
元数据577和578的每一集可应用于的一或多个区域由区域ID所识别,包含区域1ID 579、区域2ID 580和区域3ID 581。可将不同区域ID 579、580、581映射到元数据577、578的集合中的一个或两个。举例来说,元数据577可映射到区域1ID 579和区域2ID 580两者或与其相关联,向元数据577将应用于的解码器或其它装置指示第一区域(由区域1ID579识别且由区域1数据574定义)和第二区域(由区域2ID 580识别且由区域2数据575定义)。可将元数据578映射到区域3ID 581或与其相关联,指示元数据578将应用于第三区域(由区域3ID 581识别且由区域数据571定义)。在一个说明性实例中,元数据577可包含可应用于具有某些特性(例如,色彩特性)的视频的CRI SEI消息的元数据的第一版本,且第一区域和第二区域可包含具有某些特性的样本。在此实例中,元数据578可为可应用于具有不同特性的视频的CRI SEI消息的元数据的第二版本,且第三区域可包含具有不同特性的样本。在另一说明性实例中,图片的内容可含有具有不同特性的三个区域——图片可含有例如天空的明亮区域,例如覆盖在物件的阴影中的区域的黑暗区域,和具有适度亮度的图片的区域部分。当欲将此内容呈现于具有不同于使用来控制所述内容的特性的特性的显示器中时,可将一或多个CRI SEI消息应用于所述内容以便使所述内容适应于所述显示器。在此状况下,将不同CRI消息应用于具有不同特性的三个区域(例如明亮、黑暗和适度明亮区域)可为有益的。适度明亮的区域可在无需任何处理的情况下显示且可发信作为区域3。明亮区域和黑暗区域将必须使用CRI消息通过以下步骤来映射:将这些区域发信作为区域1和区域2,将区域1和区域2映射到CRI元数据577和元数据578(例如,使用区域1ID 579和区域2ID580),和在位流中发送对应CRI元数据577(用于区域1)和元数据578(用于区域2)。
其它嵌套SEI消息573包含不同于嵌套SEI消息572的类型,所述类型指示嵌套SEI消息573将应用于的用途。举例来说,嵌套SEI消息573可用于滤波经解码视频图片,用于执行色调映射,或用于可在区域特定基础上应用的另一合适用途。嵌套SEI消息573包含元数据582和元数据583以及区域1ID 579和区域3ID 581。所属领域的技术人员将了解嵌套SEI消息573可包含多于两个元数据集和多于两个区域ID。
元数据582和元数据583皆可用于在图片的不同区域上的嵌套SEI消息573的识别用途(例如,经解码图片滤波,或其它用途)。举例来说,元数据582和元数据583可包含用于所述用途(例如,经解码图片滤波,或其它用途)的元数据的不同值。元数据582和583的每一集合可应用于的一或多个区域由区域ID(包含区域1ID 579和区域3ID 581)识别。可将元数据582映射到区域1ID 579或与其相关联,向解码器或其它装置指示元数据582将应用于第一区域(由区域1ID 579识别且由区域1数据574定义)。可将元数据583映射到区域3ID 581或与其相关联,指示元数据583将应用于第三区域(由区域3ID 581识别且由区域数据571定义)。
如图5中所展示,区域嵌套SEI消息570允许由多个嵌套SEI消息共享所定义区域(例如,由区域1数据574定义的第一区域和由区域数据571中未展示的其它区域数据定义的第三区域),而无需针对每一嵌套SEI消息重新定义区域。举例来说,两个嵌套SEI消息572和573的用途或应用可定义或使用类似或相同区域。替代针对嵌套SEI消息572和573中的两者重新定义区域两次,嵌套SEI消息572和573可通过包含区域1ID 579和区域3ID 581而包含区域数据571的指标。
图6为说明使用本文中所描述技术中的一或多个编码视频数据的过程600的实例的流程图。在块602处,过程600包含获得视频数据。举例来说,视频数据可包含使用装置的摄影机捕捉的图片。在另一实例中,视频数据可从存储装置获得。
在块604处,过程600包含使用视频数据产生经编码视频位流。经编码视频位流可使用本文中所描述的译码技术来产生。所述经编码视频位流包含区域嵌套消息,所述区域嵌套消息包含多个嵌套消息和定义所述经编码视频位流的图片的至少第一区域的区域数据。在一些实例中,区域数据可定义图片的多个区域(例如,使用多个区域数据集)。所述区域嵌套消息的第一嵌套消息包含第一数据集,和指示所述图片的所述第一区域与所述第一数据集相关联的第一区域识别符。举例来说,第一区域识别符可与第一嵌套消息中的第一数据集相关联或可映射到所述第一数据集,且可指示(例如,向解码器、播放器、显示器或其它合适的装置)将第一数据集应用于第一区域,第一数据集可由将应用于第一区域的另一功能使用,和/或以其它方式指示第一数据集将用于第一区域的内容。
在一些实施方案中,区域嵌套消息为区域嵌套补充增强信息(SEI)消息,且所述多个嵌套消息为嵌套SEI消息。区域嵌套消息的实例为图3中所展示的区域嵌套SEI消息350。区域嵌套消息的另一实例为图5中所展示的区域嵌套SEI消息570。
在一些实例中,使用所述第一数据集来基于所述第一区域识别符对所述第一区域执行第一功能。数据集可定义任何合适功能,例如使用胶卷粒纹特性SEI消息、色调映射信息SEI消息、后滤波提示SEI消息、色度重新采样滤波提示SEI消息、色彩重新映射信息SEI消息、拐点功能信息SEI消息或用于对视频图片的区域执行功能的任何其它合适数据执行的功能。
在一些方面中,所述第一数据集基于所述第一区域识别符指定所述第一区域的特性。举例来说,第一数据集可包含关于第一区域的内容的最大亮度的信息,第一区域的内容的最小亮度,第一区域的内容的色彩特性,或区域内容的其它特性。在另一实例中,第一数据集可包含解码器装置、播放器装置、显示器装置或其它装置可用于根据装置的约束或根据装置操作的条件处理第一区域的内容。
在一些方面中,定义所述图片的第一区域的区域数据被包含在区域嵌套消息中一次。在这些状况下,区域未必经重新定义用于每一嵌套消息,使得区域数据并非必须针对每一嵌套消息或针对欲应用于图片的每一数据集单独地发信。
在一些实例中,所述第一嵌套消息进一步包含第二数据集,且所述第二数据集与所述第一区域识别符相关联以指示所述第一区域与所述第二数据集相关联。举例来说,第一区域识别符可与第一嵌套消息中的第二数据集相关联或可映射到所述第二数据集,且可指示(例如,向解码器、播放器、显示器或其它合适的装置)将第二数据集应用于第一区域,第二数据集可由将应用于第一区域的另一功能使用,和/或以其它方式指示第二数据集将用于第一区域的内容。
在一些实例中,所述区域嵌套消息包含定义所述图片的多个区域的多个区域数据,且所述第一嵌套消息的所述第一数据集与所述图片的所述多个区域中的多个区域相关联和/或可应用于多个区域。举例来说,第一数据集可与第一嵌套消息中的多个区域相关联或可映射到所述多个区域。在一些状况下,所述第一嵌套消息进一步包含第二区域识别符,所述第二区域识别符指示与所述第一数据相关联的所述图片的所述多个区域中的第二区域。举例来说,第二区域识别符可与第一嵌套消息中的第一数据集相关联或可映射到所述第一数据集,且可指示(例如,向解码器、播放器、显示器或其它合适的装置)将第一数据集应用于第二区域,第一数据集可由将应用于第二区域的另一功能使用,和/或以其它方式指示第一数据集将用于第二区域的内容。在这些状况下,所述第一数据集可独立地应用于所述第一区域和所述第二区域中的每一个(或以其它方式与其相关联)。举例来说,第一数据集可由解码器、播放器、显示器或其它合适装置独立地应用于第一区域和第二区域。
在一些实例中,所述区域嵌套消息包含第二嵌套消息,且所述第二嵌套消息包含与第一区域识别符相关联的第二数据集,因此指示所述第一区域与所述第二数据集相关联。举例来说,第一区域识别符可与第二嵌套消息中的第二数据集相关联或可映射到所述第二数据集,且可指示(例如,向解码器、播放器、显示器或其它合适的装置)将第二数据集应用于第一区域,第二数据集可由将应用于第一区域的另一功能使用,和/或以其它方式指示第二数据集将用于第一区域的内容。在此类实例中,第一数据集和第二数据集欲应用于第一区域(例如,由解码器装置、播放器装置、显示器装置或其它合适的装置)。关于第一区域的区域数据仅必须针对区域嵌套消息包含一次,且第一识别符可与第一数据集和第二数据集相关联以指示将两个数据集应用于第一区域。
在一些方面中,所述区域嵌套消息进一步包含所述图片的多个区域的数目。
在一些实例中,多个区域数据定义所述第一区域的一或多个边界或定义含在所述第一区域中的样本。在一些实例中,所述区域数据定义所述第一区域的一或多个边界从所述图片的一或多个边界的一或多个偏移。在一些实例中,所述区域数据将所述第一区域定义为矩形区域。
在一些实施方案中,当图片的样本在图片的两个或多于两个区域中时,可应用于两个或多于两个区域中的一个区域的第一类型的嵌套消息可应用于所述样本,所述区域在所述两个或多于两个区域间具有最大区域识别符值。在一些状况下,可应用于两个或多于两个区域中的另一区域的第一类型的另一嵌套消息不可应用于所述样本,所述另一区域在两个或多于两个区域间不具有最大区域识别符值。
在一些实例中,所述区域嵌套消息进一步包含识别所述区域嵌套消息的用途的语法元素。在一些状况下,所述区域嵌套消息进一步包含所述区域嵌套消息中的多个嵌套消息的数目。
在一些实例中,多个嵌套消息的嵌套消息具有与在嵌套消息未被嵌套在区域嵌套消息中的情况下相同的持续性。举例来说,嵌套消息的持续性可在将其新增到区域嵌套消息时不改变。
在一些实例中,区域嵌套消息包含关于第一嵌套消息的索引集。索引集指示第一数据集将应用于的一或多个区域。举例来说,索引集可包含至少第一区域识别符。
图7为说明使用本文中所描述的技术中的一或多个解码视频数据的过程700的实例的流程图。在702处,过程700包含:接收视频位流。视频位流可包含多个经编码图片,且可使用语法元素和具有信息的变量来解码所述图片并处理所述经解码图片。
在块704处,过程700包含从视频位流获得区域嵌套消息。所述区域嵌套消息包含多个嵌套消息和定义所述经编码视频位流的图片的至少第一区域的区域数据。所述区域嵌套消息的第一嵌套消息包含第一数据集,和指示所述图片的所述第一区域与所述第一数据集相关联的第一区域识别符。
在一些实例中,使用所述第一数据集来基于所述第一区域识别符对所述第一区域执行第一功能。数据集可定义任何合适功能,例如使用胶卷粒纹特性SEI消息、色调映射信息SEI消息、后滤波提示SEI消息、色度重新采样滤波提示SEI消息、色彩重新映射信息SEI消息、拐点功能信息SEI消息或用于对视频图片的区域执行功能的任何其它合适数据执行的功能。
过程700(在由解码装置执行时)也可包含解码图片和使用第一数据集对图片的第一区域执行第一功能。基于第一区域识别符对第一区域执行第一功能。可使用本文中所描述译码技术解码图片(和视频位流的其它图片)。
在一些实例中,所述第一数据集基于所述第一区域识别符指定所述第一区域的特性。举例来说,第一数据集可包含关于第一区域的内容的最大亮度的信息,第一区域的内容的最小亮度,第一区域的内容的色彩特性,或区域内容的其它特性。在另一实例中,第一数据集可包含解码器装置、播放器装置、显示器装置或其它装置可用于根据装置的约束或根据装置操作的条件处理第一区域的内容。
在一些实施中,区域嵌套消息为区域嵌套补充增强信息(SEI)消息,且所述多个嵌套消息为嵌套SEI消息。区域嵌套消息的实例为图3中所展示的区域嵌套SEI消息350。区域嵌套消息的另一实例为图5中所展示的区域嵌套SEI消息570。
在一些方面中,定义所述图片的第一区域的区域数据被包含在区域嵌套消息中一次。在这些状况下,区域未必经针对每一嵌套消息重新定义,使得区域数据并非必须针对每一嵌套消息或针对欲应用于图片的每一数据集单独地发信。
在一些实例中,第一嵌套消息进一步包含第二数据集,且第二数据集与第一区域识别符相关联以指示第一区域与第二数据集相关联(例如,欲将第二数据集应用于第一区域或可用于对第一区域执行另一功能,或其它合适适用性)。
在一些实例中,所述区域嵌套消息包含定义所述图片的多个区域的多个区域数据,且所述第一嵌套消息的所述第一数据集与所述图片的所述多个区域中的多个区域相关联。在一些状况下,所述第一嵌套消息进一步包含第二区域识别符,所述第二区域识别符指示与所述第一数据相关联的所述图片的所述多个区域中的第二区域。在这些状况下,所述第一数据集可独立地应用于所述第一区域和所述第二区域中的每一个。
在一些实例中,区域嵌套消息包含第二嵌套消息,且第二嵌套消息包含第二数据集和第一区域识别符,因此指示第一区域与第二数据集相关联。在这些实例中,第一数据集和第二数据集可应用于第一区域(例如,由解码器装置、播放器装置、显示器装置或其它合适的装置)。关于第一区域的区域数据仅必须针对区域嵌套消息包含一次,且第一识别符可与第一数据集和第二数据集相关联以指示将两个数据集应用于第一区域。
在一些方面中,所述区域嵌套消息进一步包含所述图片的多个区域的数目。
在一些实例中,所述区域数据定义所述第一区域的一或多个边界或定义含在所述第一区域中的样本。在一些实例中,多个区域数据定义所述第一区域的一或多个边界从所述图片的一或多个边界的一或多个偏移。在一些实例中,多个区域数据将多个区域定义为矩形区域。
在一些实施方案中,当图片的样本在图片的两个或多于两个区域中时,可应用于两个或多于两个区域中的一个区域的第一类型的嵌套消息可应用于所述样本,所述区域在两个或多于两个区域间具有最大区域识别符值。在一些状况下,可应用于两个或多于两个区域中的另一区域的第一类型的另一嵌套消息不可应用于所述样本,所述另一区域在两个或多于两个区域间不具有最大区域识别符值。
在一些实例中,所述区域嵌套消息进一步包含识别所述区域嵌套消息的用途的语法元素。在一些状况下,所述区域嵌套消息进一步包含所述区域嵌套消息中的多个嵌套消息的数目。
在一些实例中,多个嵌套消息中的嵌套消息具有与在嵌套消息未被嵌套在区域嵌套消息中的情况下相同的持续性。举例来说,嵌套消息的持续性可在将其新增到区域嵌套消息时不改变。
在一些实例中,区域嵌套消息包含关于第一嵌套消息的索引集。索引集指示第一数据集将应用于的一或多个区域。举例来说,索引集可包含至少第一区域识别符。
在一些实例中,过程600和700可由计算装置或设备(例如图1中所展示的系统100)执行。举例来说,过程600可由图1和图8中所展示的编码装置104,或由另一视频源侧装置或视频发射装置执行。过程700可由图1和图9中所展示的解码装置112或由另一客户端侧装置(例如播放器装置、播放器或任一其它客户端侧装置)执行。在一些状况中,计算装置或设备可包含处理器、微处理器、微计算机或经配置以实施过程600和700的步骤的装置的其它组件。在一些实例中,计算装置或设备可包含经配置以捕捉包含视频帧的视频数据(例如,视频序列)的摄影机。在一些实例中,捕捉视频数据的摄影机或其它捕捉装置与计算装置分离,在此状况下,计算装置接收或获得所捕捉视频数据。计算装置可进一步包含经配置以传递视频数据的网络接口。网络接口可经配置以传递基于因特网协议(IP)的数据或其它类型的数据。在一些实例中,计算装置或设备可包含用于显示输出视频内容(例如视频位流的图片的样本)的显示器。
过程600和700经说明为逻辑流程图,其操作表示可以硬件、计算机指令或其组合实施的一系列操作。在计算机指令的上下文中,操作表示在由一或多个处理器执行时执行所述所叙述操作的经存储在一或多个计算机可读存储媒体上的计算机可执行指令。通常,计算机可执行指令包含执行特定功能或实施特定数据类型的例程、程序、物件、组件、数据结构等。描述操作的次序并非希望解释为限制性,且所描述操作中的任何数目者可以任何次序和/或并行组合以实施过程。
另外,过程600和700可在经配置有可执行指令的一或多个计算机系统的控制下执行,且可经实施为在一或多个处理器上、通过硬件或其组合来共同执行的代码(例如,可执行指令、一或多个计算机程序,或一或多个应用程序)。如上文所述,代码可经存储在计算机可读或机器可读存储媒体上,例如,呈包括可由一或多个处理器执行的多个指令的计算机程序形式。计算机可读或机器可读存储媒体可为非暂时性的。
描述提供上文所描述技术的实例的各种说明性实施例。实施例经展示为标准的语法元素、变量、语意和其它部分(其实例包含在标准文件JCTVC-Z1005中)的新增和删除。针对实施例1,标准的语法和语意的新增经指示在“<insert>”符号与“<insertend>”符号之间(例如,“<insert>所新增文字<insertend>”)。针对后续实施例2到6,相对于实施例1的语法元素的新增经展示在“<insert>”符号与“<insertend>”符号之间(例如,“<insert>所新增文字<insertend>”),且删除经展示在“<delete>”符号与“<deleteend>”符号之间(例如,“<delete>所新增文字<deleteend>”)。
实施例1
在此实施例中,通过SEI消息-区域嵌套SEI消息发信图片的区域和SEI消息和相关联元数据。
SEI有效负载语法结构
关于区域嵌套SEI消息的payloadType值可基于HEVC规范中的其它SEI消息设定成不同值。
区域嵌套SEI消息语法结构
区域嵌套SEI消息语意
区域嵌套SEI消息提供用以使SEI消息与图片的区域(所述区域在SEI消息中指定)相关联的机制。
区域嵌套SEI消息含有一或多个SEI消息。当SEI消息嵌套在区域嵌套SEI消息中时,将SEI消息的语意解释为可独立地应用于SEI消息中指定的每一区域。在当前图片中的特定样本存在于由与当前图片相关联的区域嵌套SEI消息指定的多于一个区域中时,应用于特定样本的SEI消息可由SEI消息中的其它语法元素或由在此规范的外的装置确定。
每一嵌套SEI消息具有与在SEI消息非嵌套式的情况下相同的持续性范围。
以下限制应用于将SEI消息嵌套在区域嵌套SEI消息中为位流一致性的要求:
-具有等于以下值的payloadType的SEI消息不应嵌套于区域嵌套SEI消息中:0(缓冲周期)、1(图片定时)、2(全屏幕)、3(滤波器有效负载)、4(所暂存的用户数据)、5(未暂存的用户数据)、6(恢复点)、9(场景信息)、15(图片快照)、16(逐步细化分段开始)、17(逐步细化分段结束)、45(帧包装布置)、47(显示器定向)、56(绿色元数据)、128(图片的结构)、129(有效参数集)、130(解码单元信息)、131(时间子层零索引)、132(经解码图片杂凑)、133(可缩放嵌套)、134(区域再新)、135(无显示器)、136(时间译码)、137(主控显示器色彩容量)、138(分段矩形帧包装)、139(时间运动约束图像块集)、143(解交错字段)、144(内容光能级)、145(相依RAP)、146(经译码区域)、160(层不存在)、161(层间约束图像块集)、162(bsp嵌套)、163(bsp初始到达时间)、164(替补位流性质)、165(alpha色板信息)、166(叠对信息)、167(时间mv预测)、168(帧字段信息)、176(三维参考显示器)、177(深度表示信息)、178(多视图场景)、179(多视图获取)、180(多视图位置)、181(替代深度)、182(替代特性)和183(周围观看环境)。[Ed.(AR):上述情形当前包含全部,胶卷粒纹特性、后滤波器提示、色调映射信息、重新采样滤波器提示和色度重新映射信息SEI消息除外。]
注意:与可缩放嵌套SEI消息不同,嵌套在区域嵌套SEI信息中的SEI消息不应被提取且发送作为单独SEI消息,这是因为在嵌套SEI消息中发信的值可能不可应用于可应用区域外部。
rns_id含有可用于识别一或多个区域嵌套SEI消息的用途的识别数字。rns_id的值应在0到232-2范围(包含0、232-2)中。
可使用从0到255和从512到231-1的rns_id值,如由应用程序所确定。从256到511和从231到232-2的rns_id值经保留用于供由ITU-T|ISO/IEC未来使用。遇到在256到511(包含256、511)范围中或在231到232-2(包含231、232-2)范围中的rns_id值的解码器应忽略所述值。
rns_region_size_type_idc指定在SEI消息中指定区域的边界的单位。当rns_region_size_type_idc等于0时,语法元素rns_region_left_top_[]、rns_region_left_top_y[]、rns_region_bottom_right_x[]和rns_region_bottom_right_y[]以样本为单位。当rns_region_size_type_idc等于1时,语法元素rns_region_left_top_[]、rns_region_left_top_y[]、rns_region_bottom_right_x[]和rns_region_bottom_right_y[]以CTU为单位。当rns_region_size_type_idc等于2时,语法元素rns_region_left_top_[]rns_region_left_top_y[]、rns_region_bottom_right_x[]和rns_region_bottom_right_y[]以图像块为单位加以指定。
rns_num_rect_regions指定由SEI消息指定的矩形区域的数目。rns_num_rect_regions的值应在1到255范围(包含1、255)中。等于0的rns_num_rect_regions的值经保留以供由ITU-T|ISO/IEC未来使用。
rns_rect_region_id[i]指示用于SEI消息中指定的第i矩形区域的识别符。
除非由本说明中未指定的一些装置另有指示,否则当样本属于多于一个矩形区域时,与具有rns_rect_region_id[]的最大值且包含样本的区域相关联的SEI消息可应用于样本。
注意-rns_rect_region_id[i]可用作用于指示在与不同元数据集相关联的多于一个区域可应用于图片的给定样本或区域时应所述应用对应于哪些区域的元数据参数的优先顺序编号。
在一些替代方案中,针对与当前图片相关联的一或多个区域嵌套SEI消息中指定的每一区域,将rns_rect_region_id[i]的值限制成唯一的。当rns_rect_region_id[i]的值针对与当前图片相关联的一或多个区域嵌套SEI消息中指定的两个区域相等时,可能要求将与区域的边界相关联的语法元素的子集的值限制成相等的。在一些替代方案中,语法元素子集可包含语法元素rns_region_left_top_[]、rns_region_left_top_y[]、rns_region_bottom_right_x[],和rns_region_bottom_right_y[]。举例来说,可新增以下约束:
当rns_rect_region_id[i]的值针对可应用于当前图片的一或多个区域嵌套SEI消息中所指定的任何两个区域相等时,rns_region_left_top_[]、rns_region_left_top_y[]、rns_region_bottom_right_x[]和rns_region_bottom_right_y[]的值应相等为位流一致性的要求。
rns_rect_region_left_top_x[i]指定SEI消息中指定的第i矩形区域的左上单元的水平坐标。其中定义rns_rect_region_left_top_x[i]的单元由rns_region_size_type_idc语法元素指定。
rns_rect_region_left_top_y[i]指定SEI消息中指定的第i矩形区域的左上单元的垂直坐标。其中定义rns_rect_region_left_top_y[i]的单元由rns_region_size_type_idc语法元素指定。
rns_rect_region_bottom_right_x[i]指定SEI消息中指定的第i矩形区域的右下单元的水平坐标。其中定义rns_rect_region_bottom_right_x[i]的单元由rns_region_size_type_idc语法元素指定。
rns_rect_region_bottom_right_y[i]指定SEI消息中指定的第i矩形区域的右下单元的垂直坐标。其中定义rns_rect_region_bottom_right_y[i]的单元由rns_region_size_type_idc语法元素指定。
num_seis_in_rns_minus1加1指定SEI消息中指定的SEI消息的数目。num_seis_in_rns_minus1的值应在0到255范围(包含0、255)中。
regional_nesting_zero_bit应等于0。
rns_num_data_bytes[i]指定由紧紧地在语法元素rns_num_data_bytes[i]之后的rns_data_byte[i][j]的例项发信的数据的字节的数目。rns_num_data_bytes[i]的值应在0到255范围(包含0、255)中。
rns_data_byte[i][j]可具有任何值。除非由未在本说明书中的装置另有指定,否则解码器应忽略rns_data_byte[i][j]的值。
在替代方案中,可将以下约束中的一或多个新增到区域嵌套SEI消息的语意:
-在tiles_enabled_flag的值针对与当前图片相关联PPS等于0时,具有等于2的rns_region_size_type_idc的值的区域嵌套SEI消息不应与当前图片相关联。
在另一替代方案中,嵌套SEI消息的持续性经更动控制,且替代地语法元素在区域嵌套SEI消息中发信以指示区域嵌套SEI信息的持续性的结束和其内的内容。可针对区域的子集或针对嵌套SEI消息的子集指定持续性的结束。
在另一替代方案中,语法元素rns_num_rect_regions的值范围经指定成相依于语法元素rns_region_size_type_idc。
在另一替代方案中,发信第一语法元素以指示在区域嵌套SEI消息中指定的区域的形状,且可取决于第一语法元素的值而发信与矩形区域相关联的语法元素。
在另一替代方案中,仅在rns_num_rect_regions大于0时才在存在语法元素rns_region_size_type_idc之前移动语法元素rns_num_rect_regions。
实施例2
在此实施例中,语法类似于实施例1的语法,rns_num_data_bytes和rns_data_byte语法元素在SEI消息的回圈外部发信除外。
rns_num_data_bytes指定作为紧在语法元素rns_num_data_bytes之后的rns_data_byte发信的数据的字节的数目。rns_num_data_bytes的值应在0到255范围(包含0、255)中。
语法元素的剩余部分的语意保持与实施例1中定义相同。
在一个替代方案中,语法元素rns_num_data_bytes经译码为ue(v)元素,或具有经指定在位流中或通过在位流外部的装置指定的固定数目个位。
实施例3
在此实施例中,语法结构类似于实施例1中的语法结构,其中可能不发信rns_data_byte,且发信与目标显示器系统有关的信息和与所嵌套的SEI消息相关联的应用。
等于1的rns_info_present_flag指定明确地发信语法元素application_identifier、application_version、targeted_system_prim_chromaticity_x[]、targeted_system_prim_chromaticity_y[]、targeted_display_max_luminance和targeted_display_min_luminance。等于0的target_sytem_info_present_flag指定未明确地发信语法元素application_identifier、application_version、targeted_system_prim_chromaticity_x[]、targeted_system_prim_chromaticity_y[]、targeted_display_max_luminance和targeted_display_min_luminance,且指定这些语法元素的值未指定。
application_identifier为可用于识别SEI消息的识别符。application_identifier为在0到255(包含0、255)的范围中的整数。
application_version指示与SEI消息相关联的版本。application_version应在0到255(包含0、255)的范围中。
targeted_system_prim_chromaticity_x[c]和targeted_system_prim_chromaticity_y[c](针对c在0到2(包含0、2)的范围中)用于指定以0.0001为单位的目标显示器的原色。
targeted_system_prim_chromaticity_x[4]和targeted_system_prim_chromaticity_y[4]用于指定以0.0001为单位的目标显示器的白点色度。
targeted_display_max_luminance用于导出对应于SEI消息的目标显示器的最大亮度。targeted_display_max_luminance的值是以0.01烛光/平方米为单位指定。
targeted_display_min_luminance用于导出对应于SEI消息的目标显示器的最小亮度。targeted_display_min_luminance的值是以0.0001烛光/平方米为单位指定。
语法元素的剩余部分的语意保持与实施例1中定义相同。
在一个替代方案中,可不发信语法元素rns_info_present_flag且可发信语法元素rns_num_data_bytes,且语法元素application_identifier、application_version、targeted_system_prim_chromaticity_x[]、targeted_system_prim_chromaticity_y[]、targeted_display_max_luminance,和targeted_display_min_luminance的存在可能相依于rns_num_data_bytes的值。
在另一替代方案中,可在如下含有SEI消息的回圈内部发信语法元素application_identifier、application_version、targeted_system_prim_chromaticity_x[]、targeted_system_prim_chromaticity_y[]、targeted_display_max_luminanc,andtargeted_display_min_luminance,在此状况下,回圈的第i反复中的语法元素与第iSEI消息相关联。
实施例4
在此实施例中,针对SEI消息的回圈的每一反复发信区域列表的索引,且与反复相关联的索引用于指定由于反复可用将SEI信息和任何元数据发信到的区域。
wns_num_applicable_regions_minus1[i]加1指定在SEI消息中指定的区域集间在第i反复中发信的SEI消息和元数据可应用于的区域的数目。wns_num_applicable_regions_minus1[i]的值应在0到wns_num_rect_regions-1(包含0、wns_num_rect_regions-1)的范围中。
wns_applicable_region_idx[i][j]指定可应用于第i SEI消息或语法结构的第j区域的索引。用于表示wns_applicable_region_idx[i][j]的位的数目等于Ceil(Log2(wns_num_region_minus1+1))。
实施例5
此实施例类似于实施例4,其中针对每一可用区域,发信子集区域以指示对应SEI消息和元数据可应用于的可应用区域的子集。在此实施例中,SEI消息中指定的区域已被称作窗,且样本已被称作为像素。发信此子集区域的实例如下:
等于1的wns_pixel_selector_flag[i][j]指定像素选择器经指定用于语法元素集的第i SEI消息的第j可应用窗。等于0的wns_pixel_selector_flag[i][j]指定像素选择器未指定英语语法元素的第i SEI消息的第j可应用窗。
wns_selector_domain_id[i][j]指定像素选择器经定义用于语法元素集的第iSEI消息的第j可用窗的域。wns_selector_domain_id[i][j]的值应在0到255范围(包含0、255)中。
等于0的wns_selector_domain_id[i][j]指定像素选择器经定义于空间域且像素选择器范围经指定在像素域中。等于1的wns_selector_domain_id[i][j]指定像素选择器经定义在YCbCr域中。
可使用wns_selector_domain_id[i][j]的从32到63和从128到255的值,如由应用程序所确定。从3到31且从64到127的wns_selector_domain_id[i][j]的值经保留供由ITU-T|ISO/IEC未来使用。遇到在3到31(包含3、31)的范围中或在64到127(包含64、127)范围中的wns_selector_domain_id[i][j]的值的解码器应忽略所述值。
wns_selector_num_comps_minus1[i][j]加1指定针对语法元素集的第i SEI消息的第j可应用窗定义的范围说明符的数目。wns_selector_num_comps_minus1[i][j]的值应在0到2(包含0、2)的范围中
wns_selector_range_idc[i][j][k]指定用以导出像素选择器的wns_selector_range_val[][][][]的解释。wns_selector_range_idc[i][j][k]的值应在0到15(包含0、15)的范围中
阵列NumValsSelectorRange[i][j][k]的值经如下导出:
范围类型 wns_selector_range_idc[i][j][k] NumValsSelectorRange[i][j][k]
范围 0 2
圆碟 1 3
椭圆 2 6
wns_selector_range_val[i][j][k][m](针对m在0到NumValsSelectorRange[i][j][k]-1(包含0、NumValsSelectorRange[i][j][k]-1)范围中)用于导出对应于第j可应用窗的像素选择器。
等于1的wns_selector_range_outside_flag[i][j][k]指定由用于第j可应用窗的第k像素选择器指示的可应用区域在由第k像素选择器指定的区域外部。等于0的wns_selector_range_outside_flag[i][j][k]指定由用于第j可应用窗的第k像素选择器指示的可应用区域在由第k像素选择器指定的区域内。
实施例6
此实施例类似于实施例1,其中针对每一可应用于区域,基于偏移指定区域边界。
rns_region_size_type_idc指定在SEI消息中指定区域的边界的单位。当rns_region_size_type_idc等于0时,语法元素rns_region_left_offset[]、rns_region_top_offset[]、rns_region_right_offset[],和rns_region_bottom_offset[]以样本为单位。当rns_region_size_type_idc等于1时,语法元素rns_region_left_offset[]、rns_region_top_offset[]、rns_region_right_offset[],和rns_region_bottom_offset[]以CTU为单位。当rns_region_size_type_idc等于2时,语法元素rns_region_left_offset[]、rns_region_top_offset[]、rns_region_right_offset[],和rns_region_bottom_offset[]以图像块为单位指定。
rns_rect_region_left_offset[i]指定第i矩形区域的左上样本从SEI消息中指定的左图片边界的水平偏移。其中rns_rect_region_left_offset[i]的单元由rns_region_size_type_idc语法元素指定。
rns_rect_region_top_offset[i]指定第i矩形区域的左上单元从SEI消息中指定的顶部图片边界的垂直偏移。其中rns_rect_region_top_offset[i]的单元由rns_region_size_type_idc语法元素指定。
rns_rect_region_right_offset[i]指定第i矩形区域的右下单元从SEI消息中指定的右图片边界的水平偏移。其中rns_rect_region_right_offset[i]的单元由rns_region_size_type_idc语法元素指定。
rns_rect_region_bottom_offset[i]指定第i矩形区域的右下单元从SEI消息中指定之下部图片边界的垂直偏移。其中rns_rect_region_bottom_offset[i]的单元由rns_region_size_type_idc语法元素指定。
在rns_region_size_type_idc等于0时,第i矩形区域经定义为具有从rns_region_left_offset[i]开始到pic_width_in_luma_samples-rns_region_right_offset[i]+1的水平坐标,和从rns_region_top_offset[i]到pic_height_in_luma_samples-rns_region_bottom_offset[i]+1的垂直坐标的区域。
在rns_region_size_type_idc等于1时,第i矩形区域经定义为具有从CtbSizeY*rns_region_left_offset[i]开始到CtbSizeY*(PicWidthInCtbsY-rns_region_right_offset[i]+1)-1的水平坐标,和从CtbSizeY*rns_region_top_offset[i]到CtbSizeY*(PicHeightInCtbsY-rns_region_bottom_offset[i]+1)-1的垂直坐标的区域
在rns_region_size_type_idc等于2时,第i矩形区域经定义为具有从columnPosStartInLumaSamples[rns_region_left_offset[i]]开始到columnPosStartInLumaSamples[num_tile_columns_minus1-rns_region_right_offset[i]+1]-1的水平坐标,和从rowPosStartInLumaSamples[rns_region_top_offset[i]]到rowPosStartInLumaSamples[num_tile_rows_minus1-rns_region_bottom_offset[i]+1]-1的垂直坐标的区域,其中columnPosStartInLumaSamples[j](针对j在0到num_tile_columns_minus1+1(包含0、num_tile_columns_minus1+1)范围中),和rowPosStartInLumaSamples[k](针对k在范围0到num_tile_rows_minus1+1(包含0、num_tile_rows_minus1+1)范围中)经如下导出:
在一些替代方案中,以样本位置的倍数为单位发信语法元素。此倍数可为固定(例如,可以两个样本位置为单位指定偏移)或基于位流中的其它语法元素或由其它装置指定。在一些替代方案中,也可发信负偏移值且所述偏移值可经译码以允许正或负值。
在一些替代方案中,可不发信语法元素中的一或多个。在未发信时,值可被推断成默认值且与默认值相关联的语意可应用。举例来说,在一些替代方案中,可不发信语法元素rns_region_size_type_idc且用于指定区域的边界的单元经设定成样本位置(例如,明度样本位置)。针对上文替代方案或实例所描述的方法中的一些可不仅应用于实施例中所描述的语意,但也可应用于用于描述样本位置的语法元素的其它值。
在一些替代方案中,可使用固定数目个位发信语法元素中的一或多个,且在其它替代方案中,可使用可变量目个位发信一或多个语法元素。举例来说,在此实施例中,可使用固定数目个位(例如8个位)发信语法元素rns_region_size_type_idc、rns_num_rect_regions,和num_seis_in_rns_minus1中的一或多个,或可使用可变量目个位(例如,使用指数哥伦布码)来发信语法元素rns_region_left_offset[]、rns_region_top_offset[]、rns_region_right_offset[]和rns_region_bottom_offset[]中的一或多个。在一个替代方案中,使用固定数目个位(可为8的倍数)发信区域嵌套SEI消息中的所有语法元素,且可不发信由regional_nesting_zero_bit指示的字节对准位。在一些替代方案中,可使用固定数目个位发信仅未包含在嵌套SEI消息内的区域嵌套SEI消息中的那些语法元素,且可使用固定数目或可变量目个位(例如,使用指数哥伦布码)来发信嵌套SEI消息内部的语法元素。用于表示语法元素的位的数目可为固定值或可在位流中或通过其它装置发信。
实施例7
在此实施例中,语法和语意类似于先前实施例,且新增约束以使得充分定义SEI在各种区域上的应用。
列表listOfRegionNestableSEIMessages包含以下类型的SEI消息:
-具有tone_map_id的特定值的色调映射信息SEI消息
-具有knee_function_id的特定值的拐点功能信息SEI消息
-具有color_remap_id的特定值的色彩重新映射信息SEI消息
-胶卷粒纹特性SEI消息
-后滤波器提示SEI消息
-色度重新采样滤波器提示SEI消息
当listOfRegionNestableSEIMessages中的特定类型的SEI消息存在于一个区域嵌套SEI消息中且应用于当前图片的区域列表listA且listOfRegionNestableSEIMessages中的同一类型的另一SEI消息存在于区域嵌套SEI消息中且应用于当前图片中的区域的列表listB,位流一致性的要求为针对通过从listA选择一者且从listB选择另一者形成的任何对或区域,两个区域的rns_rect_region_id[]的值不应为相同的直到两个区域为完全相同的且两个SEI消息为完全相同的。
在一些实例中,不允许一个区域的rns_rect_region_id[]的值等于同一区域嵌套(RN)SEI消息中定义的任何其它区域的rns_rect_region_id[]。在一些实例中,允许RNSEI消息中的任何两个区域的rns_rect_region_id[]的值相同,只要属于listOfRegionNestableSEIMessages的同一类型的两个SEI信息(一个SEI应用于一个区域且另一SEI应用于另一区域)皆不应用于同一图片。
在一些实例中,listOfRegionNestableSEIMessages也包含用户数据暂存SEI消息和用户数据未暂存SEI消息中的一个或任一个。
本文中所描述的与区域嵌套消息有关的技术可使用经压缩视频或使用未经压缩视频帧(在压缩之前或之后)实施。实例性视频编码和解码系统包括源装置,所述源装置提供经编码视频数据以稍后由目的地装置进行解码。明确地说,源装置经由计算机可读媒体将视频数据提供到目的地装置。源装置和目的地装置可包括广泛范围的装置中的任一个,包含台式计算机、笔记型(即,膝上型)计算机、平板计算机、机顶盒、电话手机(例如,所谓“智能型”电话)、所谓“智能型”板、电视机、摄影机、显示装置、数字媒体播放器、视频游戏主机、视频流式传输装置等。在一些状况下,源装置和目的地装置可经配备以供无线通信。
目的地装置可接收经编码视频数据以经由计算机可读媒体进行解码。计算机可读媒体可包括能够将经编码视频数据从源装置移动到目的地装置的任何类型的媒体或装置。在一个实例中,计算机可读媒体可包括通信媒体以使源装置能够实时地将经编码视频数据直接发射到目的地装置。可根据通信标准(例如,无线通信协议)来调制经编码视频数据,并将其发射到目的地装置。通信媒体可包括任何无线或有线通信媒体,例如,射频(RF)频谱或一或多个物理发射线。通信媒体可形成基于包的网络的部分,例如局域网、广域网或例如因特网的全球网络。通信媒体可包括路由器、交换机、基站或可用于促进从源装置到目的地装置的通信的任何其它装备。
在一些实例中,可将编码数据从输出接口输出到存储装置。类似地,可由输入接口从存储装置存取编码数据。存储装置可包括各种分布式或本地存取数据存储媒体中的任何者,例如硬盘机、蓝光光盘、DVD、CD-ROM、快闪存储器、易失性或非易失性存储装置或任何其它适于存储经编码视频数据的数字存储媒体。在又一实例中,存储装置可对应于文件服务器或可存储由源装置产生的经编码视频的另一中间存储装置。目的地装置可经由流式传输或下载从存储装置存取所存储视频数据。文件服务器可为能够存储经编码视频数据且将彼经编码视频数据发射到目的地装置的任何类型的服务器。实例性文件服务器包含网页服务器(例如,用于网站)、FTP服务器、网络附加存储(NAS)装置或本地磁盘机。目的地装置可通过任何标准数据连接(包含因特网连接)来存取经编码视频数据。此可包括无线信道(例如,Wi-Fi连接)、有线连接(例如,DSL、缆线调制解调器等等),或适于存取存储于文件服务器上的经编码视频数据的两者的组合。来自存储装置的经编码视频数据的发射可为流式传输式发射、下载发射或其组合。
本发明的技术未必限于无线应用或设定。所述技术可应用于支持各种多媒体应用中的任何者的视频编码,例如无线电视广播、有线电视发射、卫星电视发射、因特网流式传输视频发射,例如通过HTTP的动态自适应流式传输(DASH)、经编码到数据存储媒体上的数字视频、对存储于数据存储媒体上的数字视频的解码或其它应用。在一些实例中,系统可经配置以支持单向或双向视频发射以支持例如视频流式传输化处理、视频播放、视频广播和/或视频电话的应用。
在一个实例中,源装置包含视频源、视频编码器和输出接口。目的地装置可包括输入接口、视频解码器和显示装置。源装置的视频编码器可经配置以应用本文中所揭示的技术。在其它实例中,源装置和目的地装置可包含其它组件或布置。举例来说,源装置可从外部视频源(例如,外部摄影机)接收视频数据。同样地,目的地装置可与外部显示装置介接,而非包含集成式显示装置。
上述实例系统仅为一个实例。用于并行处理视频数据的技术可由任何数字视频编码和/或解码装置执行。尽管本发明的技术通常由视频编码装置执行,但技术也可由视频编码器/解码器(通常称作为“CODEC”)执行。此外,本发明的技术也可由视频预处理器执行。源装置和目的地装置仅为其中源装置产生经编码视频数据以供发射到目的地装置的这些编码装置的实例。在一些实例中,源装置和目的地装置可以基本上对称方式操作使得装置中的每一个包含视频编码和解码组件。因此,实例性系统可支持视频装置之间的单向或双向视频发射,例如,用于视频流式传输、视频播放、视频广播或视频电话。
视频源可包含视频捕捉装置,例如摄像机、含有先前所捕捉视频的视频封存,和/或用以从视频内容提供器接收视频的视频馈送接口。作为又一替代方案,视频源可产生基于计算机图形数据作为源视频,或直播视频、经封存视频和计算机-产生视频的组合。在一些状况下,如果视频源为摄像机,那么源装置和目的地装置可形成所谓摄影机电话或视频电话。然而,如上文所提及,本发明中所描述的技术通常可应用于视频解码,且可应用于无线和/或有线应用。在每一状况下,所捕捉、预捕捉或计算机产生视频可由视频编码器进行编码。可接着由输出接口将经编码视频信息输出到计算机可读媒体上。
如所述,计算机可读媒体可包含瞬时性媒体,例如无线广播或有线网络发射;或存储媒体(即,非暂时性存储媒体),例如,硬盘机、快闪磁盘机、光盘、数字视频磁盘、蓝光光盘,或其它计算机可读媒体。在一些实例中,网络服务器(未图示)可从源装置接收经编码视频数据且将经编码视频数据提供到目的地装置,例如,经由网络发射。类似地,媒体生产设施(例如,光盘冲压设施)的计算装置可从源装置接收经编码视频数据且产生含有经编码视频数据的光盘。因此,在各种实例中,计算机可读媒体可被理解为包含各种形式的一或多个计算机可读媒体。
目的地装置的输入接口从计算机可读媒体接收信息。计算机可读媒体的信息可包含由视频编码器定义的语法信息,所述语法信息也由视频解码器使用,其包含描述块和其它经编码单元(例如,图片组(GOP))的特性和/或处理的语法元素。显示装置向用户显示经解码视频数据,且可包括各种显示装置中的任一个,例如,阴极射线管(CRT)、液晶显示器(LCD)、等离子显示器、有机发光二极管(OLED)显示器或另一类型的显示装置。已描述本发明的各种实施例。
分别在图8和图9中展示编码装置104和解码装置112的具体细节。图8为说明可实施本发明中所描述的技术中的一或多个的实例性编码装置104的框图。举例来说,编码装置104可产生本文中所描述的语法结构(例如,VPS、SPS、PPS或其它语法元素的语法结构)。编码装置104可对视频切片内的视频块执行帧内预测和帧间预测译码。如先前所描述,帧内译码至少部分地依赖于空间预测以减少或去除给定视频帧或图片内的空间冗余。帧间译码至少部分地依赖于时间预测以减少或去除视频序列的邻近或周围帧内的时间冗余。帧内模式(I模式)可指数个基于空间的压缩模式中的任一个。帧间模式(例如,单向预测(P模式)或双向预测(B模式))可指数个基于时间的压缩模式中的任一个。
编码装置104包含分割单元35、预测处理单元41、滤波器单元63、图片存储器64、求和器50、变换处理单元52、量化单元54和熵编码单元56。预测处理单元41包含运动估计单元42、运动补偿单元44和帧内预测处理单元46。为视频块重新构造,编码装置104也包含逆量化单元58、逆变换处理单元60和求和器62。滤波器单元63希望表示一或多个环路滤波器,例如,去块滤波器、自适应环路滤波器(ALF)和样本自适应偏移(SAO)滤波器。尽管滤波器单元63在图8中经展示为在环路滤波器中,但在其它布置中,滤波器单元63可经实施为后环路滤波器。后处理装置57可对由编码装置104产生的经编码视频数据执行额外处理。本发明的技术可在一些例项中由编码装置104实施。然而,在其它情况中,可由后处理装置57实施本发明的技术中的一或多个。
如图8中所展示,编码装置104接收视频数据,且分割单元35将数据分割成视频块。分割也可包含分割成切片、切片段、图像块或其它较大单元,以及视频块分割,例如根据LCU和CU的四元树结构。编码装置104通常说明待编码的视频切片内的编码视频块的组件。可将切片划分成多个视频块(且可能划分成称作图像块的数组视频块)。预测处理单元41可基于误差结果(例如,编码速率和失真水平等)针对当前视频块选择多个可能译码模式中的一个,例如多个帧内预测译码模式中的一个或多个帧间预测译码模式中的一个。预测处理单元41可将所得帧内或帧间经编码块提供到求和器50以产生残余块数据,以及到求和器62以重构经编码块供用作参考图片。
预测处理单元41内的帧内预测处理单元46可相对于与待编码的当前块相同的帧或切片中的一或多个相邻块执行当前视频块的帧内预测译码以提供空间压缩。预测处理单元41内的运动估计单元42和运动补偿单元44相对于一或多个参考图片中的一或多个预测块执行对当前视频块的帧间预测译码以提供时间压缩。
运动估计单元42可经配置以根据视频序列的预定图案而确定视频切片的帧间预测模式。预定图案可将序列中的视频切片指定为P切片、B切片或GPB切片。运动估计单元42和运动补偿单元44可高度集成,但出于概念目的予以单独说明。由运动估计单元42执行的运动估计为产生运动向量的过程,所述运动向量估计视频块的运动。举例来说,运动向量可指示当前视频帧或图片内的视频块的预测单元(PU)相对于参考图片内预测块的位移。
预测块为经发现在像素差方面接近匹配待译码的视频块的PU,所述像素差可通过以下各项来确定:绝对差值和(SAD)、平方差值和(SSD)或其它差值度量。在一些实例中,编码装置104可计算存储在图片存储器64中的参考图片的分段整数(sub-integer)像素位置的值。举例来说,编码装置104可内插参考图片的四分之一像素位置、八分之一像素位置或其它分数像素位置的值。因此,运动估计单元42可相对于全像素位置和分数像素位置执行运动搜索且输出具有分数像素精度的运动向量。
运动估计单元42通过比较帧间译码切片中的视频块的PU的位置与参考图片的预测块的位置来计算所述PU的运动向量。参考图片可选自第一参考图片列表(列表0)或第二参考图片列表(列表1),所述列表中的每一个识别存储在图片存储器64中的一或多个参考图片。运动估计单元42将所计算运动向量发送到熵编码单元56和运动补偿单元44。
由运动补偿单元44执行的运动补偿可涉及:基于由运动估计确定的运动向量而提取或产生预测块,可能对子像素精度执行插值。在接收到关于当前视频块的PU的运动向量时,运动补偿单元44可将运动向量指向的预测块定位于参考图片列表中。编码装置104通过将预测块的像素值从所译码的当前视频块的像素值减去从而形成像素差值来形成残余视频块。像素差值形成块的残余数据,且可包含明度和色度差分量两者。求和器50表示执行此减法运算的(多个)组件。运动补偿单元44也可产生与在解码视频切片的视频块中供解码装置112使用的视频块和视频切片相关联的语法元素。
帧内预测处理单元46可帧内预测当前块,作为由运动估计单元42和运动补偿单元44执行的帧间预测的替代方案,如上文所描述。明确地说,帧内预测处理单元46可确定帧内预测模式以用于对当前块进行编码。在一些实例中,帧内预测处理单元46可(例如)在单独编码步骤期间使用各种帧内预测模式来对当前块进行编码,且帧内预测处理单元46可从所测试模式选择适当帧内预测模式来使用。举例来说,帧内预测处理单元46可针对各种所测试帧内预测模式使用速率失真分析来计算速率失真值,且在所测试模式中可选择具有最佳速率失真特性的帧内预测模式。速率失真分析通常确定经编码块与原始未经编码块(其经编码以产生经编码块)之间的失真(或错误)量,以及用于产生经编码块的位率(即,位的数目)。帧内预测处理单元46可依据各种经编码块的失真和速率来计算比率以确定哪一帧内预测模式展现块的最佳速率失真值。
在任何状况下,在针对块选择帧内预测模式之后,帧内预测处理单元46可将指示块的所选择帧内预测模式的信息提供到熵编码单元56。熵编码单元56可对指示所选择帧内预测模式的信息进行编码。编码装置104可在所发射位流配置数据中包含各种块的编码上下文的定义以及最可能帧内预测模式的指示、帧内预测模式指数表和用于上下文中的每一个的经修改的帧内预测模式指数表。位流配置数据可包含多个帧内预测模式指数表和多个经修改的帧内预测模式指数表(还称作码字映射表)。
在预测处理单元41经由帧间预测或帧内预测产生关于当前视频块的预测块之后,编码装置104通过将预测块从当前视频块减去来形成残余视频块。残余块中的残余视频数据可被包含在一或多个TU中且应用于变换处理单元52。变换处理单元52使用变换(例如,离散余弦变换(DCT)或概念上类似变换)将残余视频数据变换成残余变换系数。变换处理单元52可将来自像素域的残余视频数据转换成变换域,例如,频域。
变换处理单元52可将所得变换系数发送到量化单元54。量化单元54量化变换系数以进一步减小位率。量化过程可减少与系数中的一些或全部相关联的位深度。量化程度可通过调整量化参数来修改。在一些实例中,量化单元54可接着对包含经量化变换系数的矩阵执行扫描。替代地,熵编码单元56可执行扫描。
在量化之后,熵编码单元56对经量化变换系数进行熵编码。举例来说,熵编码单元56可执行上下文自适应可变长度译码(CAVLC)、上下文自适应二进制算法译码(CABAC)、基于语法的上下文自适应二进制算法译码(SBAC)、概率区间分割熵(PIPE)译码或另一熵编码技术。在由熵编码单元56进行的熵编码之后,可将经编码位流发射到解码装置112或封存以供稍后由解码装置112进行发射或检索。熵编码单元56也可对用于正译码的当前视频切片的运动向量和其它语法元素进行熵编码。
逆量化单元58和逆变换处理单元60分别应用逆量化和逆变换以重构像素域中的残余块以供稍后用作参考图片的参考块。运动补偿单元44可通过将残余块新增到参考图片列表内的参考列表中的一个的预测块来计算参考块。运动补偿单元44也可将一或多个内插滤波器应用于经重构残余块以计算供用于运动估计的子整数像素值。求和器62将经重构的残余块加入到由运动补偿单元44产生的运动补偿预测块以产生参考块以存储在图片存储器64中。参考块可由运动估计单元42和运动补偿单元44用作参考块以对随后视频帧或图片中的块进行帧间预测。
以此方式,图8的编码装置104表示经配置以产生编码视频位流的语法的视频编码器的实例。编码装置104可(例如)产生关于区域嵌套SEI消息的语法,如上文所描述。编码装置104可执行本文中所描述的技术中的任何者,包含上文关于图6所描述的过程。已描述已关于编码装置104的本发明的技术,但如上文所提及,本发明的技术中的一些技术也可由后处理装置57实施。
图9为说明实例性解码装置的框图。解码装置112包含熵解码单元80、预测处理单元81、逆量化单元86、逆变换处理单元88、求和器90、滤波器单元91和图片存储器92。预测处理单元81包含运动补偿单元82和帧内预测处理单元84。解码装置112可在一些实例中,执行通常与从图8关于编码装置104所描述的编码步骤互逆的解码步骤。解码装置112可执行本文中所描述的技术中的任何者,包含上文关于图7所描述的过程。
在解码过程期间,解码装置112接收表示经编码视频切片的视频块的经编码视频位流和由编码装置104发送的相关联语法元素。在一些实施例中,解码装置112可接收来自编码装置104的经编码视频位流。在一些实施例中,解码装置112可从网络实体79(例如,服务器、媒体感知网络元件(MANE)、视频编辑器/拼接器或经配置以实施上文所描述的技术中的一或多个的其它此类装置)接收经编码视频位流。网络实体79可或可不包含编码装置104。本发明中所描述的技术中的一些可在网络实体79将经编码视频位流发射到解码装置112之前由网络实体79实施。在一些视频解码系统中,网络实体79和解码装置112可为单独装置的部分,而在其它情况中,关于网络实体79所描述的功能性可由包括解码装置112的相同装置执行。
解码装置112的熵解码单元80对位流进行熵解码以产生经量化系数、运动向量和其它语法元素。熵解码单元80将运动向量和其它语法元素转发到预测处理单元81。解码装置112可接收视频切片等级和/或视频块等级的语法元素。熵解码单元80可处理和剖析一或多个参数集中的固定长度语法元素和可变长度语法元素,例如,VPS、SPS和PPS。
在视频切片经译码为帧内译码(I)切片时,预测处理单元81的帧内预测处理单元84可基于来自当前帧或图片的先前经解码块的所发信帧内预测模式和数据来产生关于当前视频切片的视频块的预测数据。当视频帧经译码为帧间译码(即,B、P或GPB)切片时,预测处理单元81的运动补偿单元82基于从熵解码单元80接收的运动向量和其它语法元素来产生当前时序切片的视频块的预测块。可由参考图片列表内的参考图片中的一个产生预测块。解码装置112可基于图片存储器92中所存储的参考图片来使用默认构造技术构造参考帧列表(列表0和列表1)。
运动补偿单元82通过剖析运动向量和其它语法元素来确定当前视频切片的视频块的预测信息,且使用预测信息来产生所解码的当前视频块的预测块。举例来说,运动补偿单元82可使用参数集中的一或多个语法元素来确定用于对视频切片的视频块进行译码的预测模式(例如,帧内或帧间预测)、帧间预测切片类型(例如,B切片、P切片或GPB切片)、关于切片的一或多个参考图片列表的构造信息、关于切片的每一帧间编码视频块的运动向量、关于切片的每一帧间编码视频块的帧间预测状态和用以对当前视频切片中的视频块进行解码的其它信息。
运动补偿单元82也可基于内插滤波器执行内插。运动补偿单元82可使用如在对视频块进行编码期间由编码装置104所使用的内插滤波器来计算参考块的分段整数像素的内插值。在此状况下,运动补偿单元82可依据所接收语法元素来确定由编码装置104所使用的内插滤波器且使用内插滤波器来产生预测块。
逆量化单元86使在位流中提供且由熵解码单元80解码的经量化变换系数逆量化,或解量化。逆量化过程可包含使用视频切片中的每一视频块的由编码装置104计算的量化参数来确定量化的程度和同样地应所述应用的逆量化的程度。逆变换处理单元88将逆变换(例如,逆DCT或其它合适逆变换)、逆整数变换或概念上类似逆变换过程应用于变换系数以便在像素域中产生残余块。
在运动补偿单元82基于运动向量和其它语法元素来产生当前视频块的预测块之后,解码装置112通过对来自逆变换处理单元88的残余块与由运动补偿单元82产生的对应预测块求和来形成经解码的视频块。求和器90表示执行此加法运算的(多个)组件。如果期望,那么也可使用其它环路滤波器(在编码环路中或在编码环路之后)来平滑像素过渡,或以其它方式改进视频质量。滤波器单元91希望表示一或多个环路滤波器,例如,去块滤波器、自适应环路滤波器(ALF),和样本自适应偏移(SAO)滤波器。尽管滤波器单元91在图9中经展示为在环路滤波器中,但在其它布置中,滤波器单元91可经实施为后环路滤波器。接着将给定帧或图片中的经解码视频块存储在参考图片存储器92中,所述参考图片存储器存储用于后续运动补偿的参考图片。图片存储器92还存储经解码视频供稍后在显示装置(例如,图1中所展示的视频目的地装置122)上呈现。
在前述描述中,参考其具体实施例描述本申请的方面,但所属领域的技术人员将认识到本发明并不限于其。因此,虽然本文中已详细地描述应用的说明性实施例,但应理解发明性概念可另外以不同方式体现和使用,且所附权利要求书希望被解释为包含这些变化,除由现有技术限制。上文所描述本发明的各种特征和方面可单独地或共同地使用。此外,实施例可用于除本文中所描述的那些外的任何数目个环境和应用而不脱离本说明书的较广泛精神和范围。因此,说明书和图式应视为说明性而非限制性。出于说明的目的,方法是以特定次序进行描述。应了解,在替代实施例中,方法可以不同于所描述的次序的次序来执行。
在组件经描述为“经配置以”执行某些操作的情况下,可(例如)通过设计电子电路或其它硬件以执行操作、通过编程可编程电子电路(例如,微处理器或其它合适电子电路)以执行操作或其任何组合来完成此配置。
结合本文中所揭示的实施例描述的各种说明性逻辑块、模块、电路和算法步骤可实施为电子硬件、计算机软件、固件或其组合。为清楚地说明硬件和软件的此可互换性,上文通常已就其功能性方面描述了各种说明性组件、块、模块、电路和步骤。此功能性是实施为硬件抑或软件取决于强加于整个系统的特定应用和设计约束。虽然所属领域的技术人员可针对每一特定应用以变化方式实施所描述功能性,但不应将此类实施决策解释为导致对本发明的范围的脱离。
本文中所描述的技术还可以电子硬件、计算机软件、固件或其任一组合来实施。这些技术可以各种装置中的任一个实施,例如通用计算机、无线通信装置收集,或具有多个用途(包括无线通信装置收集和其它装置中的应用)的集成电路装置。经描述为模块或组件的任何特征可一起实施于集成式逻辑装置中或单独地实施为离散但可集成逻辑装置。如果以软件实施,那么所述技术可至少部分地由包括程序代码的计算机可读数据存储媒体实现,所述程序代码包含在被执行时执行上文所描述的方法中的一或多个的指令。计算机可读数据存储媒体可形成可包含包装材料的计算机程序产品的部分。计算机可读媒体可包括存储器或数据存储媒体,例如,随机存取存储器(RAM),例如同步动态随机存取存储器(SDRAM)、只读存储器(ROM)、非易失性随机存取存储器(NVRAM)、电可抹除可编程只读存储器(EEPROM)、FLASH存储器、磁性或光学数据存储媒体,等。技术另外或替代地可至少部分地由计算机可读通信媒体实现,所述计算机可读通信媒体携载或传递呈可由计算机存取、读取和/或执行的指令或数据结构形式的程序代码,例如,经传播信号或波。
程序代码可由处理器执行,所述处理器可包含一或多个处理器,例如一或多个数字信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、现场可编程逻辑阵列(FPGA)或其它等效集成或离散逻辑电路。此处理器可经配置以执行本发明中所描述的技术中的任何者。通用处理器可为微处理器,但在替代方案中,处理器可为任一常规处理器、控制器、微控制器或状态机。也可将处理器实施为计算装置的组合,例如DSP与微处理器的组合、多个微处理器、结合DSP核心的一或多个微处理器或任一其它此类配置。因此,如本文中所使用的术语“处理器”可指前述结构、前述结构的任何组合或适于实施本文中所描述的技术的任何其它结构或设备中的任一个。另外,在一些方面中,本文中所描述的功能性可提供在经配置以用于编码和解码或并入于组合式视频编码器-解码器(CODEC)中的专用软件模块或硬件模块内。

Claims (70)

1.一种设备,其包括:
存储器,其经配置以存储视频数据;以及
处理器,其经配置以:
获得所述视频数据;以及
使用所述视频数据产生包含区域嵌套消息的经编码视频位流,所述区域嵌套消息包含多个嵌套消息和定义所述经编码视频位流的图片的至少第一区域的区域数据,其中所述区域嵌套消息的第一嵌套消息包含第一数据集和指示所述图片的所述第一区域与所述第一数据集相关联的第一区域识别符。
2.根据权利要求1所述的设备,其中所述区域嵌套消息为区域嵌套补充增强信息SEI消息,且其中所述多个嵌套消息为嵌套SEI消息。
3.根据权利要求1所述的设备,其中所述第一数据集用以基于所述第一区域识别符对所述第一区域执行第一功能。
4.根据权利要求1所述的设备,其中所述第一数据集基于所述第一区域识别符指定所述第一区域的特性。
5.根据权利要求1所述的设备,其中定义所述图片的所述第一区域的所述区域数据被包含在所述区域嵌套消息中一次。
6.根据权利要求1所述的设备,其中所述第一嵌套消息进一步包含第二数据集,其中所述第二数据集与所述第一区域识别符相关联以指示所述第一区域与所述第二数据集相关联。
7.根据权利要求1所述的设备,其中所述区域嵌套消息包含定义所述图片的多个区域的多个区域数据,且其中所述第一嵌套消息的所述第一数据集与所述图片的所述多个区域中的多个区域相关联。
8.根据权利要求7所述的设备,其中所述第一嵌套消息进一步包含第二区域识别符,所述第二区域识别符指示与所述第一数据集相关联的所述图片的所述多个区域中的第二区域。
9.根据权利要求8所述的设备,其中所述第一数据集可独立地应用于所述第一区域和所述第二区域中的每一个。
10.根据权利要求1所述的设备,其中所述区域嵌套消息包含第二嵌套消息,所述第二嵌套消息包含第二数据集和指示所述第一区域与所述第二数据集相关联的所述第一区域识别符。
11.根据权利要求1所述的设备,其中所述区域嵌套消息进一步包含所述图片的多个区域的数目。
12.根据权利要求1所述的设备,其中所述区域数据定义所述第一区域的一或多个边界或定义含在所述第一区域中的样本。
13.根据权利要求1所述的设备,其中所述区域数据定义所述第一区域的一或多个边界从所述图片的一或多个边界的一或多个偏移。
14.根据权利要求1所述的设备,其中所述区域数据将所述第一区域定义为矩形区域。
15.根据权利要求1所述的设备,其中当所述图片的样本在所述图片的两个或多于两个区域中时,可应用于所述两个或多于两个区域中的区域的第一类型的嵌套消息可应用于所述样本,所述区域在所述两个或多于两个区域间具有最大区域识别符值。
16.根据权利要求15所述的设备,其中可应用于所述两个或多于两个区域中的另一区域的所述第一类型的另一嵌套消息不可应用于所述样本,所述另一区域在所述两个或多于两个区域间不具有所述最大区域识别符值。
17.根据权利要求1所述的设备,其中所述区域嵌套消息进一步包含识别所述区域嵌套消息的用途的语法元素。
18.根据权利要求1所述的设备,其中所述区域嵌套消息进一步包含所述区域嵌套消息中的所述多个嵌套消息的数目。
19.根据权利要求1所述的设备,其中所述多个嵌套消息的嵌套消息具有与在所述嵌套消息未被嵌套在所述区域嵌套消息中的情况下相同的持续性。
20.根据权利要求1所述的设备,其中所述区域嵌套消息包含关于所述第一嵌套消息的索引集,所述索引集指示所述第一数据集欲应用于的一或多个区域。
21.根据权利要求20所述的设备,其中所述索引集包含至少所述第一区域识别符。
22.根据权利要求1所述的设备,其中所述设备包括具有用于捕捉图片的摄影机的移动装置。
23.一种解码视频数据的方法,所述方法包括:
接收视频位流;以及
从所述视频位流获得区域嵌套消息,所述区域嵌套消息包含多个嵌套消息和定义所述视频位流的图片的至少第一区域的区域数据,其中所述区域嵌套消息的第一嵌套消息包含第一数据集和指示所述图片的所述第一区域与所述第一数据集相关联的第一区域识别符。
24.根据权利要求23所述的方法,其中使用所述第一数据集来基于所述第一区域识别符对所述第一区域执行第一功能。
25.根据权利要求24所述的方法,其进一步包括:
解码所述图片;以及
使用所述第一数据集对所述图片的所述第一区域执行所述第一功能,其中所述第一功能是基于所述第一区域识别符对所述第一区域执行。
26.根据权利要求23所述的方法,其中所述第一数据集基于所述第一区域识别符指定所述第一区域的特性。
27.根据权利要求23所述的方法,其中所述区域嵌套消息为区域嵌套补充增强信息SEI消息,且其中所述多个嵌套消息为嵌套SEI消息。
28.根据权利要求23所述的方法,其中定义所述图片的所述第一区域的区域数据被包含在所述区域嵌套消息中一次。
29.根据权利要求23所述的方法,其中所述第一嵌套消息进一步包含第二数据集,其中所述第二数据集与所述第一区域识别符相关联以指示所述第一区域与所述第二数据集相关联。
30.根据权利要求23所述的方法,其中所述区域嵌套消息包含定义所述图片的多个区域的多个区域数据,且其中所述第一嵌套消息的所述第一数据集与所述图片的所述多个区域中的多个区域相关联。
31.根据权利要求30所述的方法,其中所述第一嵌套消息进一步包含第二区域识别符,所述第二区域识别符指示与所述第一数据集相关联的所述图片的所述多个区域中的第二区域。
32.根据权利要求31所述的方法,其中所述第一数据集可独立地应用于所述第一区域和所述第二区域中的每一个。
33.根据权利要求23所述的方法,其中所述区域嵌套消息包含第二嵌套消息,所述第二嵌套消息包含第二数据集和指示所述第一区域与所述第二数据集相关联的所述第一区域识别符。
34.根据权利要求23所述的方法,其中所述区域嵌套消息进一步包含所述图片的多个区域的数目。
35.根据权利要求23所述的方法,其中所述区域数据定义所述第一区域的一或多个边界或定义含在所述第一区域中的样本。
36.根据权利要求23所述的方法,其中所述区域数据定义所述第一区域的一或多个边界从所述图片的一或多个边界的一或多个偏移。
37.根据权利要求23所述的方法,其中所述区域数据将所述第一区域定义为矩形区域。
38.根据权利要求23所述的方法,其中当所述图片的样本在所述图片的两个或多于两个区域中时,可应用于所述两个或多于两个区域中的区域的第一类型的嵌套消息可应用于所述样本,所述区域在所述两个或多于两个区域间具有最大区域识别符值。
39.根据权利要求38所述的方法,其中可应用于所述两个或多于两个区域中的另一区域的所述第一类型的另一嵌套消息不可应用于所述样本,所述另一区域在所述两个或多于两个区域间不具有所述最大区域识别符值。
40.根据权利要求23所述的方法,其中所述区域嵌套消息进一步包含识别所述区域嵌套消息的用途的语法元素。
41.根据权利要求23所述的方法,其中所述区域嵌套消息进一步包含所述区域嵌套消息中的所述多个嵌套消息的数目。
42.根据权利要求23所述的方法,其中所述多个嵌套消息的嵌套消息具有与在所述嵌套消息未被嵌套在所述区域嵌套消息中的情况下相同的持续性。
43.根据权利要求23所述的方法,其中所述区域嵌套消息包含关于所述第一嵌套消息的索引集,所述索引集指示所述第一数据集欲应用于的一或多个区域。
44.根据权利要求43所述的方法,其中所述索引集包含至少所述第一区域识别符。
45.一种设备,其包括:
接收器,其经配置以接收视频位流;
存储器,其经配置以存储所述视频位流的视频数据;以及
处理器,其经配置以从所述视频位流获得区域嵌套消息,所述区域嵌套消息包含多个嵌套消息和定义所述视频位流的图片的至少第一区域的区域数据,其中所述区域嵌套消息的第一嵌套消息包含第一数据集和指示所述图片的所述第一区域与所述第一数据集相关联的第一区域识别符。
46.根据权利要求45所述的设备,其中所述第一数据集用以基于所述第一区域识别符对所述第一区域执行第一功能。
47.根据权利要求46所述的设备,其中所述处理器经进一步配置以:
解码所述图片;以及
使用所述第一数据集对所述图片的所述第一区域执行所述第一功能,其中所述第一功能是基于所述第一区域识别符对所述第一区域执行。
48.根据权利要求45所述的设备,其中所述第一数据集基于所述第一区域识别符指定所述第一区域的特性。
49.根据权利要求45所述的设备,其中所述区域嵌套消息为区域嵌套补充增强信息SEI消息,且其中所述多个嵌套消息为嵌套SEI消息。
50.根据权利要求45所述的设备,其中定义所述图片的所述第一区域的区域数据被包含在所述区域嵌套消息中一次。
51.根据权利要求45所述的设备,其中所述第一嵌套消息进一步包含第二数据集,其中所述第二数据集与所述第一区域识别符相关联以指示第一区域与所述第二数据集相关联。
52.根据权利要求45所述的设备,其中所述区域嵌套消息包含定义所述图片的多个区域的多个区域数据,且其中所述第一嵌套消息的所述第一数据集与所述图片的所述多个区域中的多个区域相关联。
53.根据权利要求52所述的设备,其中所述第一嵌套消息进一步包含第二区域识别符,所述第二区域识别符指示与所述第一数据集相关联的所述图片的所述多个区域中的第二区域。
54.根据权利要求53所述的设备,其中所述第一数据集可独立地应用于所述第一区域和所述第二区域中的每一个。
55.根据权利要求45所述的设备,其中所述区域嵌套消息包含第二嵌套消息,所述第二嵌套消息包含第二数据集和指示所述第一区域与所述第二数据集相关联的所述第一区域识别符。
56.根据权利要求45所述的设备,其中所述区域嵌套消息进一步包含所述图片的多个区域的数目。
57.根据权利要求45所述的设备,其中所述区域数据定义所述第一区域的一或多个边界或定义含在所述第一区域中的样本。
58.根据权利要求45所述的设备,其中所述区域数据定义所述第一区域的一或多个边界从所述图片的一或多个边界的一或多个偏移。
59.根据权利要求45所述的设备,其中所述区域数据将所述第一区域定义为矩形区域。
60.根据权利要求45所述的设备,其中当所述图片的样本在所述图片的两个或多于两个区域中时,可应用于所述两个或多于两个区域中的区域的第一类型的嵌套消息可应用于所述样本,所述区域在所述两个或多于两个区域间具有最大区域识别符值。
61.根据权利要求60所述的设备,其中可应用于所述两个或多于两个区域中的另一区域的所述第一类型的另一嵌套消息不可应用于所述样本,所述另一区域在所述两个或多于两个区域间不具有所述最大区域识别符值。
62.根据权利要求45所述的设备,其中所述区域嵌套消息进一步包含识别所述区域嵌套消息的用途的语法元素。
63.根据权利要求45所述的设备,其中所述区域嵌套消息进一步包含所述区域嵌套消息中的所述多个嵌套消息的数目。
64.根据权利要求45所述的设备,其中所述多个嵌套消息的嵌套消息具有与在所述嵌套消息未被嵌套在所述区域嵌套消息中的情况下相同的持续性。
65.根据权利要求45所述的设备,其中所述区域嵌套消息包含关于所述第一嵌套消息的索引集,所述索引集指示所述第一数据集欲应用于的一或多个区域。
66.根据权利要求65所述的设备,其中所述索引集包含至少所述第一区域识别符。
67.根据权利要求45所述的设备,其进一步包括:
显示器,其用于显示所述视频数据。
68.根据权利要求45所述的设备,其中所述设备包括具有摄影机的移动装置。
69.一种存储有指令的非暂时性计算机可读媒体,所述指令在由一或多个处理器执行时致使所述一或多个处理器进行以下操作:
获得视频数据;以及
使用所述视频数据产生包含区域嵌套消息的经编码视频位流,所述区域嵌套消息包含多个嵌套消息和定义所述经编码视频位流的图片的至少第一区域的区域数据,其中所述区域嵌套消息的第一嵌套消息包含第一数据集和指示所述图片的所述第一区域与所述第一数据集相关联的第一区域识别符。
70.一种用于解码视频数据的设备,其包括:
用于获得视频数据的装置;以及
用于使用所述视频数据产生包含区域嵌套消息的经编码视频位流的装置,所述区域嵌套消息包含多个嵌套消息和定义所述经编码视频位流的图片的至少第一区域的区域数据,其中所述区域嵌套消息的第一嵌套消息包含第一数据集和指示所述图片的所述第一区域与所述第一数据集相关联的第一区域识别符。
CN201780027773.0A 2016-05-10 2017-05-08 用于产生用于视频图片的区域嵌套消息的方法和系统 Active CN109196868B (zh)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
US201662334354P 2016-05-10 2016-05-10
US62/334,354 2016-05-10
US201662336435P 2016-05-13 2016-05-13
US62/336,435 2016-05-13
US201662405161P 2016-10-06 2016-10-06
US62/405,161 2016-10-06
US15/588,516 2017-05-05
US15/588,516 US10554981B2 (en) 2016-05-10 2017-05-05 Methods and systems for generating regional nesting messages for video pictures
PCT/US2017/031558 WO2017196727A1 (en) 2016-05-10 2017-05-08 Methods and systems for generating regional nesting messages for video pictures

Publications (2)

Publication Number Publication Date
CN109196868A true CN109196868A (zh) 2019-01-11
CN109196868B CN109196868B (zh) 2021-05-25

Family

ID=58708076

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780027773.0A Active CN109196868B (zh) 2016-05-10 2017-05-08 用于产生用于视频图片的区域嵌套消息的方法和系统

Country Status (10)

Country Link
US (2) US10554981B2 (zh)
EP (1) EP3456054B1 (zh)
JP (1) JP6816166B2 (zh)
KR (1) KR102156993B1 (zh)
CN (1) CN109196868B (zh)
AU (1) AU2017263318A1 (zh)
BR (1) BR112018073052A2 (zh)
CA (1) CA3019859A1 (zh)
TW (1) TW201742464A (zh)
WO (1) WO2017196727A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114402623A (zh) * 2019-04-19 2022-04-26 北京达佳互联信息技术有限公司 用于嵌入图像的补充增强信息消息
CN114501070A (zh) * 2022-04-14 2022-05-13 全时云商务服务股份有限公司 视频会议同步额外信息的编解码方法、处理方法和系统

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10554981B2 (en) 2016-05-10 2020-02-04 Qualcomm Incorporated Methods and systems for generating regional nesting messages for video pictures
WO2017203942A1 (ja) * 2016-05-25 2017-11-30 ソニー株式会社 画像処理装置、および画像処理方法、並びにプログラム
US11503314B2 (en) * 2016-07-08 2022-11-15 Interdigital Madison Patent Holdings, Sas Systems and methods for region-of-interest tone remapping
AU2017339463B2 (en) * 2016-10-05 2020-09-03 Dolby Laboratories Licensing Corporation Source color volume information messaging
KR20200107945A (ko) 2018-01-12 2020-09-16 소니 주식회사 정보 처리 장치 및 방법
EP3759920A1 (en) * 2018-03-21 2021-01-06 Huawei Technologies Co., Ltd. Signaling a constraint flag in a video bitstream
WO2019235904A1 (ko) * 2018-06-08 2019-12-12 엘지전자 주식회사 360 비디오 시스템에서 오버레이 처리 방법 및 그 장치
WO2020032136A1 (ja) * 2018-08-08 2020-02-13 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 三次元データ符号化方法、三次元データ復号方法、三次元データ符号化装置、及び三次元データ復号装置
EP4035372A4 (en) * 2019-09-23 2022-11-23 Telefonaktiebolaget LM Ericsson (publ) SEGMENT POSITION SIGNALING WITH SUB-PICTURE SLICE POSITION DERIVATION
US11265357B2 (en) * 2019-10-10 2022-03-01 Microsoft Technology Licensing, Llc AV1 codec for real-time video communication
EP4032309A1 (en) * 2019-12-04 2022-07-27 Google LLC Remapping for mixed dynamic range content
US20220279185A1 (en) * 2021-02-26 2022-09-01 Lemon Inc. Methods of coding images/videos with alpha channels
WO2022200042A1 (en) * 2021-03-25 2022-09-29 Nokia Technologies Oy General region-based hash
BR112023015552A2 (pt) * 2021-04-12 2023-11-14 Ericsson Telefon Ab L M Referenciamento de mensagem
WO2023171513A1 (en) * 2022-03-08 2023-09-14 Sharp Kabushiki Kaisha Systems and methods for signaling sublayer non-reference information in video coding
WO2024039540A1 (en) * 2022-08-15 2024-02-22 Bytedance Inc. Signaling of neural-network post-filter purposes and output chroma format
WO2024091399A1 (en) * 2022-10-24 2024-05-02 Op Solutions, Llc Systems and methods for region packing based encoding and decoding

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013030458A1 (en) * 2011-08-31 2013-03-07 Nokia Corporation Multiview video coding and decoding
US20140003489A1 (en) * 2012-07-02 2014-01-02 Nokia Corporation Method and apparatus for video coding
WO2014107396A1 (en) * 2013-01-07 2014-07-10 Qualcomm Incorporated Non-nested sei messages in video coding
WO2015056182A2 (en) * 2013-10-15 2015-04-23 Nokia Technologies Oy Video encoding and decoding
CA2951522A1 (en) * 2014-06-20 2015-12-23 Qualcomm Incorporated Extensible design of nesting supplemental enhancement information (sei) messages

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101255226B1 (ko) * 2005-09-26 2013-04-16 한국과학기술원 스케일러블 비디오 코딩에서 다중 roi 설정, 복원을위한 장치 및 방법
US20100142613A1 (en) * 2007-04-18 2010-06-10 Lihua Zhu Method for encoding video data in a scalable manner
WO2010095410A1 (ja) * 2009-02-20 2010-08-26 パナソニック株式会社 記録媒体、再生装置、集積回路
JP2011041249A (ja) * 2009-05-12 2011-02-24 Sony Corp データ構造および記録媒体、並びに、再生装置、再生方法、プログラム、およびプログラム格納媒体
JP4957831B2 (ja) * 2009-08-18 2012-06-20 ソニー株式会社 再生装置および再生方法、並びに記録装置および記録方法
JP5728649B2 (ja) * 2010-08-06 2015-06-03 パナソニックIpマネジメント株式会社 再生装置、集積回路、再生方法、プログラム
US9894370B2 (en) * 2014-03-24 2018-02-13 Qualcomm Incorporated Generic use of HEVC SEI messages for multi-layer codecs
JP6331882B2 (ja) * 2014-08-28 2018-05-30 ソニー株式会社 送信装置、送信方法、受信装置および受信方法
US10554981B2 (en) 2016-05-10 2020-02-04 Qualcomm Incorporated Methods and systems for generating regional nesting messages for video pictures

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013030458A1 (en) * 2011-08-31 2013-03-07 Nokia Corporation Multiview video coding and decoding
US20140003489A1 (en) * 2012-07-02 2014-01-02 Nokia Corporation Method and apparatus for video coding
WO2014107396A1 (en) * 2013-01-07 2014-07-10 Qualcomm Incorporated Non-nested sei messages in video coding
CN104919802A (zh) * 2013-01-07 2015-09-16 高通股份有限公司 在视频译码中的非嵌套式补充增强信息消息
WO2015056182A2 (en) * 2013-10-15 2015-04-23 Nokia Technologies Oy Video encoding and decoding
CN105981387A (zh) * 2013-10-15 2016-09-28 诺基亚技术有限公司 使用可分级嵌套sei消息的视频编码和解码
CA2951522A1 (en) * 2014-06-20 2015-12-23 Qualcomm Incorporated Extensible design of nesting supplemental enhancement information (sei) messages

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
MISKA M. HANNUKSELA, YE-KUI WANG: "《Joint Video Team (JVT) of ISO/IEC MPEG & ITU-T VCEG (ISO/IEC JTC1/SC29/WG11 and ITU-T SG16 Q.6) 20th Meeting, Klagenfurt, Austria, July 2006》", 12 July 2006 *
MISKA M. HANNUKSELA: "The coded region completion SEI message in multi-layer context", 《JOINT COLLABORATIVE TEAM ON VIDEO CODING(JCT-VC) OF ITU-T SG16 WP3 AND ISO/IEC JTC 1/SC 29/WG11 JCTVC-T0047》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114402623A (zh) * 2019-04-19 2022-04-26 北京达佳互联信息技术有限公司 用于嵌入图像的补充增强信息消息
CN114402623B (zh) * 2019-04-19 2023-06-09 北京达佳互联信息技术有限公司 用于嵌入图像的补充增强信息消息
CN114501070A (zh) * 2022-04-14 2022-05-13 全时云商务服务股份有限公司 视频会议同步额外信息的编解码方法、处理方法和系统

Also Published As

Publication number Publication date
BR112018073052A2 (pt) 2019-02-26
WO2017196727A1 (en) 2017-11-16
EP3456054C0 (en) 2023-12-13
EP3456054A1 (en) 2019-03-20
JP6816166B2 (ja) 2021-01-20
KR20190004709A (ko) 2019-01-14
TW201742464A (zh) 2017-12-01
US10554981B2 (en) 2020-02-04
US20170332085A1 (en) 2017-11-16
US20200204809A1 (en) 2020-06-25
JP2019515572A (ja) 2019-06-06
AU2017263318A1 (en) 2018-10-18
CN109196868B (zh) 2021-05-25
KR102156993B1 (ko) 2020-09-16
CA3019859A1 (en) 2017-11-16
US11159805B2 (en) 2021-10-26
EP3456054B1 (en) 2023-12-13

Similar Documents

Publication Publication Date Title
CN109196868A (zh) 用于产生用于视频图片的区域嵌套消息的方法和系统
US11102495B2 (en) Methods and systems for generating and processing content color volume messages for video
CN106464920B (zh) 用于在参数集中用信号表示层集合的信息的系统和方法
CN106664427B (zh) 用于对视频数据进行编码的设备和方法及计算机可读媒体
CN105637878B (zh) 在视频译码中用于基于子解码图片缓冲器(sub-dpb)的dpb操作的传信
CN105794212B (zh) 一种处理多层视频数据的方法及装置
CN109196867A (zh) 在帧内预测中使用的参考线索引的隐式译码
CN109964485A (zh) 用于发信号给及约束具有动态元数据的高动态范围(hdr)视频系统的系统及方法
EP3424217B1 (en) Methods and systems for generating color remapping information supplemental enhancement information messages for video
CN108028936A (zh) 视频译码中成分的范围调整的固定点实施
CN104396253A (zh) 用于高效视频译码(hevc)和扩展的视频参数集
CN106233729B (zh) 解码视频数据的方法、装置及编码视频数据的方法、装置
CN109691111A (zh) 在补充增强信息消息中传信色彩重新映射信息的目标显示参数

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant