CN109691111A - 在补充增强信息消息中传信色彩重新映射信息的目标显示参数 - Google Patents

在补充增强信息消息中传信色彩重新映射信息的目标显示参数 Download PDF

Info

Publication number
CN109691111A
CN109691111A CN201780053813.9A CN201780053813A CN109691111A CN 109691111 A CN109691111 A CN 109691111A CN 201780053813 A CN201780053813 A CN 201780053813A CN 109691111 A CN109691111 A CN 109691111A
Authority
CN
China
Prior art keywords
sei message
display capabilities
video
remap
video data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201780053813.9A
Other languages
English (en)
Inventor
阿达许·克里许纳·瑞玛苏布雷蒙尼安
德米特罗·鲁萨诺夫斯基
罗哈斯 霍埃尔·索赖
德内·布达伊哲·桑斯利
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of CN109691111A publication Critical patent/CN109691111A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/156Availability of hardware or computational resources, e.g. encoding based on power-saving criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本发明描述用于在源装置与吸收装置之间传送最优译码参数的技术。所述吸收装置可在位流中接收视频数据和一组一或多个补充增强信息SEI消息,其中每一SEI消息包括对显示能力集合和重新映射参数集合的指示。所述吸收装置随后可针对所述一组一或多个SEI消息中的每一SEI消息将所述相应SEI消息中所指示的显示能力的所述相应集合与用于所述吸收装置的显示能力的目标集合进行比较。响应于确定由第一SEI消息所指示的显示能力的第一集合与显示能力的所述目标集合兼容,所述吸收装置可使用由所述第一SEI消息所指示的重新映射参数的相应集合调适所述视频数据。

Description

在补充增强信息消息中传信色彩重新映射信息的目标显示 参数
本申请案请求2016年9月2日提交的第62/383,356号美国临时申请案的权益,所述申请案的全部内容以引用的方式并入本文中。
技术领域
本发明涉及视频处理。
背景技术
数字视频能力可并入到广泛范围的装置中,包含数字电视、数字直播系统、无线广播系统、个人数字助理(PDA)、膝上型或台式计算机、平板计算机、电子书阅读器、数码相机、数字记录装置、数字媒体播放器、视频游戏装置、视频游戏控制台、蜂窝式或卫星无线电电话、所谓的“智能电话”、视频电话会议装置、视频流式传输装置和类似者。数字视频装置实施视频译码技术,例如描述于由以下定义的标准中的那些技术:由MPEG-2、MPEG-4、ITU-TH.263、ITU-T H.264/MPEG-4第10部分高级视频译码(AVC)、ITU-T H.265、高效视频译码(HEVC)以及这类标准的扩展。视频装置可通过实施这些视频译码技术而更高效地发射、接收、编码、解码和/或存储数字视频信息。
视频译码技术包含空间(图片内)预测和/或时间(图片间)预测以减少或去除视频序列中固有的冗余。对于基于块的视频译码来说,视频切片(例如,视频帧或视频帧的一部分)可分割成视频块,视频块还可被称作树块、译码单元(CU)和/或译码节点。使用相对于同一图片中的相邻块中的参考样本的空间预测对图片的经帧内译码(I)切片中的视频块进行编码。图片的经帧间译码(P或B)切片中的视频块可使用相对于相同图片中的相邻块中的参考样本的空间预测,或相对于其它参考图片中的参考样本的时间预测。图片可以被称为帧,且参考图片可以被称为参考帧。
空间或时间预测产生用于待译码块的预测性块。残余数据表示待译码原始块与预测性块之间的像素差。经帧间译码块是根据指向形成预测性块的参考样本块的运动向量和指示经译码块与预测性块之间的差的残余数据来编码的。经帧内译码块是根据帧内译码模式和残余数据来编码的。为了进一步压缩,可将残余数据从像素域变换到变换域,从而产生残余变换系数,随后可以将残余变换系数量化。可扫描最初布置成二维阵列的经量化变换系数,以便产生变换系数的一维向量,且可应用熵译码以实现甚至更多压缩。
可捕捉、译码及显示的色彩值的总数可由色域定义。色域指代装置可捕捉(例如相机)或再生(例如显示器)的色彩的范围。通常,色域在装置之间有所不同。对于视频译码,可使用视频数据的预定义色域以使得视频译码过程中的每一装置可经配置以处理同一色域中的像素值。相较于传统上用于视频译码的色域,一些色域经定义为具有较大范围的色彩。具有较大范围的色彩的这类色域可被称为宽色域(WCG)。
视频数据的另一方面为动态范围。动态范围通常定义为视频信号的最大亮度(例如明度)与最小亮度之间的比率。过去使用的共同视频数据的动态范围被视为具有标准动态范围(SDR)。视频数据的其它实例规范定义具有最大亮度与最小亮度之间的更大比率的色彩数据。这类视频数据可被描述为具有高动态范围(HDR)。
发明内容
一般来说,本发明描述用于在源装置与吸收装置之间传送最优译码参数的技术。所述吸收装置可在位流中接收视频数据和一组一或多个补充增强信息(SEI)消息,其中每一SEI消息包括对显示能力集合和重新映射参数(例如,色彩重新映射信息)集合的指示。所述吸收装置随后可针对所述一组一或多个SEI消息中的每一SEI消息将所述相应SEI消息中所指示的显示能力的所述相应集合与用于所述吸收装置的显示能力的目标集合进行比较。响应于确定由第一SEI消息所指示的显示能力的第一集合与显示能力的所述目标集合兼容,所述吸收装置可使用由所述第一SEI消息所指示的重新映射参数的相应集合调适所述视频数据。
在一个实例中,本发明涉及一种通过吸收装置处理视频数据的方法,所述方法包含:在位流中接收所述视频数据;在所述位流中接收一组一或多个补充增强信息(SEI)消息,其中每一SEI消息包括对一或多个显示能力的集合的指示和对一或多个重新映射参数的集合的指示;针对所述一组一或多个SEI消息中的每一SEI消息,将所述相应SEI消息中所指示的一或多个显示能力的所述相应集合与用于所述吸收装置的一或多个显示能力的目标集合进行比较以确定一或多个显示能力的所述相应集合与一或多个显示能力的所述目标集合的兼容性;和响应于确定由所述一组一或多个SEI消息中的第一SEI消息所指示的一或多个显示能力的第一集合与用于所述吸收装置的一或多个显示能力的目标集合兼容,使用由所述第一SEI消息所指示的一或多个重新映射参数的相应集合调适所述视频数据。
在另一实例中,本发明涉及一种用于处理视频数据的吸收装置,所述吸收装置包含:用于存储视频数据的存储器;和一或多个处理器,其经配置以:在位流中接收所述视频数据;在所述位流中接收一组一或多个补充增强信息(SEI)消息,其中每一SEI消息包括对一或多个显示能力的集合的指示和对一或多个重新映射参数的集合的指示;针对所述一组一或多个SEI消息中的每一SEI消息,将所述相应SEI消息中所指示的一或多个显示能力的所述相应集合与用于所述吸收装置的一或多个显示能力的目标集合进行比较以确定一或多个显示能力的所述相应集合与一或多个显示能力的所述目标集合的兼容性;和响应于确定由所述一组一或多个SEI消息中的第一SEI消息所指示的一或多个显示能力的第一集合与用于所述吸收装置的一或多个显示能力的所述目标集合兼容,使用由所述第一SEI消息所指示的一或多个重新映射参数的相应集合调适所述视频数据。
在另一实例中,本发明涉及一种非暂时性计算机可读存储媒体,其存储有在由吸收装置的一或多个处理器执行时使得所述一或多个处理器进行以下操作的指令:在位流中接收所述视频数据;在所述位流中接收一组一或多个补充增强信息SEI消息,其中每一SEI消息包括对一或多个显示能力的集合的指示和对一或多个重新映射参数的集合的指示;针对所述一组一或多个SEI消息中的每一SEI消息,将所述相应SEI消息中所指示的一或多个显示能力的所述相应集合与用于所述吸收装置的一或多个显示能力的目标集合进行比较,以确定一或多个显示能力的所述相应集合与一或多个显示能力的所述目标集合的兼容性;和响应于确定由所述一组一或多个SEI消息中的第一SEI消息所指示的一或多个显示能力的第一集合与用于所述吸收装置的一或多个显示能力的所述目标集合兼容,使用由所述第一SEI消息所指示的一或多个重新映射参数的相应集合调适所述视频数据。
在另一实例中,本发明涉及一种设备,其包含:用于在位流中接收所述视频数据的装置;用于在所述位流中接收一组一或多个补充增强信息(SEI)消息的装置,其中每一SEI消息包括对一或多个显示能力的集合的指示和对一或多个重新映射参数的集合的指示;用于针对所述一组一或多个SEI消息中的每一SEI消息,将所述相应SEI消息中所指示的一或多个显示能力的所述相应集合与用于所述吸收装置的一或多个显示能力的目标集合进行比较以确定一或多个显示能力的所述相应集合与一或多个显示能力的所述目标集合的兼容性的装置;和用于响应于确定由所述一组一或多个SEI消息中的第一SEI消息所指示的一或多个显示能力的第一集合与用于所述吸收装置的一或多个显示能力的目标集合兼容,使用由所述第一SEI消息所指示的一或多个重新映射参数的相应集合调适所述视频数据的装置。
在另一实例中,本发明涉及一种通过源装置处理视频数据的方法,所述方法包括:针对一或多个显示能力的第一集合确定用于所述视频数据的一或多个重新映射参数的第一集合;在第一补充增强信息(SEI)消息中对一或多个显示能力的所述第一集合和一或多个重新映射参数的所述第一集合进行译码;和在位流中向吸收装置发送所述第一SEI消息和所述视频数据。
在另一实例中,本发明涉及一种用于处理视频数据的源装置,所述吸收装置包含:用于存储视频数据的存储器;及一或多个处理器,其经配置以:针对一或多个显示能力的第一集合确定用于所述视频数据的一或多个重新映射参数的第一集合;在第一补充增强信息(SEI)消息中对一或多个显示能力的所述第一集合和一或多个重新映射参数的所述第一集合进行译码;和在位流中向吸收装置发送所述第一SEI消息和所述视频数据。
在另一实例中,本发明涉及一种非暂时性计算机可读存储媒体,其存储有在由源装置的一或多个处理器执行时使得所述一或多个处理器进行以下操作的指令:针对一或多个显示能力的第一集合确定用于所述视频数据的一或多个重新映射参数的第一集合;在第一补充增强信息(SEI)消息中对一或多个显示能力的所述第一集合和一或多个重新映射参数的所述第一集合进行译码;和在位流中向吸收装置发送所述第一SEI消息和所述视频数据。
在另一实例中,本发明涉及一种设备,其包含:用于针对一或多个显示能力的第一集合确定用于所述视频数据的一或多个重新映射参数的第一集合的装置;用于在第一补充增强信息(SEI)消息中对一或多个显示能力的所述第一集合和一或多个重新映射参数的所述第一集合进行译码的装置;和用于在位流中向吸收装置发送所述第一SEI消息和所述视频数据的装置。
在附图和下文描述中阐述本发明的一或多个实例的细节。本发明的其它特征、目标和优点将根据所述描述和图式以及权利要求书显而易见。
附图说明
图1为说明根据本发明技术的实例系统的框图,所述实例系统包含视频编译装置、客户端装置和吸收装置,其中所述吸收装置经配置以从客户端装置接收重新映射参数。
图2为说明通过色彩重新映射信息(CRI)补充增强信息(SEI)消息传信的处理步骤的概念图。
图3为说明HDR数据的概念的概念图。
图4为说明实例色域的概念图。
图5为说明HDR/WCG表示转换的实例的流程图。
图6为说明HDR/WCG逆转换的实例的流程图。
图7为说明从在感知上均匀的代码层级到线性明度的视频数据转换(包含SDR和HDR)的电光传递函数(EOTF)的实例的概念图。
图8为说明视频编码器的实例的框图。
图9为说明视频解码器的实例的框图。
图10为说明可实施本发明的技术的吸收装置的实例的框图。
图11为说明根据本发明的技术的吸收装置的实例技术的流程图,所述吸收装置经配置以从源装置接收CRI SEI消息。
图12为说明根据本发明的技术的源装置的实例技术的流程图,所述源装置经配置以向吸收装置发送CRI SEI消息。
具体实施方式
本发明涉及视频数据的处理和/或译码以改进用于将视频数据从第一色彩空间映射到第二色彩空间的色彩重新映射信息(CRI)补充增强信息(SEI)消息的应用。更具体地,本发明的技术包含实现CRI SEI消息的传信以供与不同能力的目标显示器进行显示调适的装置。举例来说,源装置可向吸收装置发送多个CRI SEI消息。每一CRI SEI消息可包含对显示参数集合的指示和对重新映射参数的对应集合的指示。所述吸收装置可将显示参数的各种集合与用于所述吸收装置的显示参数的目标集合进行比较。所述吸收装置可选择具有与用于所述吸收装置的目标显示参数最密切匹配的显示参数的CRI SEI消息并使用对应重新映射参数调适用于所述吸收装置的视频数据。本发明的技术适用于数字视频接口,例如支持将超高清(UHD)、高动态范围(HDR)和宽色域(WCG)视频信号传信到终端装置/显示器或TV的那些接口。
通过这种方式,吸收装置可更高效地处理所接收视频数据,因为视频数据的色彩可更紧密地与吸收装置的色域对准。这可导致吸收装置显示具有对于来自源装置的原始视频数据色彩更加真实的更清晰图像,以及降低的功率消耗。此外,使得吸收装置能够选择最适合其能力的重新映射参数(即,与其能力相关联更多参数)可使得源装置能够将内容处理成所述吸收装置支持或优选的格式。这可降低包含显示调适和色量变换的过程的吸收装置的设计的复杂性,因为这些过程中的一些可在源装置处进行。本文中所描述的技术亦可使得源装置能够执行内容到吸收装置的HDR或WCG能力的引导式映射以便保持艺术目的。本文所描述的技术和装置可改进用于对CRI SEI消息和相关视频数据进行译码的混合式视频译码系统(例如,H.265/HEVC、H.264/AVC等)的压缩效率。
视频译码标准(包含混合式视频译码标准)包含ITU-T H.261、ISO/IEC MPEG-1Visual、ITU-T H.262或ISO/IEC MPEG-2Visual、ITU-T H.263、ISO/IEC MPEG-4Visual和ITU-T H.264(也称为ISO/IEC MPEG-4AVC),包含其可缩放视频译码(SVC)和多视图视频译码(MVC)扩展。已由ITU-T视频译码专家组(VCEG)和ISO/IEC动画专家组(MPEG)的视频译码联合合作小组(JCT-VC)定案新的视频译码标准(即,高效视频译码(HEVC,也被称为H.265)的设计。HEVC草案规范被称作HEVC工作草案10(WD10),布洛斯等人,“高效视频译码(HEVC)文本规范草案10(针对FDIS和最后呼叫)(High efficiency video coding(HEVC)textspecification draft 10(for FDIS&Last Call)”(ITU-T SG16WP3和ISO/IEC JTC1/SC29/WG11视频译码联合合作小组(JCT-VC),第12次会议,瑞士日内瓦,2013年1月14日到23日,JCTVC-L1003v34)。定案的HEVC标准被称作HEVC版本1。
缺陷报告包含Wang等人“高效视频译码(HEVC)缺陷报告(High efficiency videocoding(HEVC)Defect Report)”(ITU-T SG16WP3和ISO/IEC JTC1/SC29/WG11视频译码联合合作小组(JCT-VC),第14次会议:维也纳,奥地利,2013年7月25日至8月2日,JCTVC-N1003v1)。所定案的HEVC标准文件被公布为“ITU-T H.265,SERIES H:视听及多媒体系统,视听服务基础架构—移动视频的译码—高效视频译码(ITU-T H.265,Series H:Audiovisual and Multimedia Systems,Infrastructure of audiovisual services-Coding of moving video,High efficiency video coding)”(国际电信联盟(ITU)的电信标准化部门,2013年4月),且所定案的HEVC标准的另一版本公布于2014年10月。
在解码过程之后,未经压缩的视频信号通过高速数字物理接口传信到终端消费装置,例如显示器或TV。消费电子产品装置(例如数字电视(DTV)、数字有线、卫星或地面机顶盒(STB))和相关外围装置(包含(但不限于)DVD播放器/刻录机)和其它相关源或吸收器利用未经压缩数字接口的协议、要求和建议在CTA-861规范中指定。
图1为说明根据本发明的技术的实例吸收装置的框图,所述吸收装置经配置以从源装置接收重新映射参数。如图1中所示,系统10包含视频编译装置12,其提供在稍后待由客户端装置14解码的经编码视频数据,所述客户端装置14将经解码视频数据发送到吸收装置32以供显示。具体来说,视频编译装置12经由计算机可读媒体16将视频数据提供到客户端装置14。视频编译装置12、客户端装置14和吸收装置32可包括广泛范围的装置中的任一者,包含台式计算机、笔记型(即,膝上型)计算机、平板计算机、机顶盒、电话手持机(例如所谓的“智能”电话)、所谓的“智能”平板、电视、相机、显示装置、数字媒体播放器、视频游戏控制台、视频流式传输装置或类似者。在一些情况下,视频编译装置12和客户端装置14可经装备以用于无线通信。
客户端装置14可经由计算机可读媒体16接收待解码的经编码视频数据。计算机可读媒体16可包括能够将经编码视频数据从视频编译装置12移动到客户端装置14的任何类型的媒体或装置。在一个实例中,计算机可读媒体16可包括通信媒体以使得视频编译装置12能够实时地将经编码视频数据直接发射到客户端装置14。经编码视频数据可根据例如有线或无线通信协议的通信标准来调制,且发射到客户端装置14。通信媒体可包括任何无线或有线通信媒体,例如射频(RF)频谱或一或多个物理发射线。通信媒体可形成基于包的网络(例如,局域网、广域网或全球网络,例如因特网)的部分。通信媒体可包含路由器、交换机、基站或可用于促进从视频编译装置12到客户端装置14的通信的任何其它设备。
在其它实例中,计算机可读媒体16可包含非暂时性存储媒体,例如硬盘、闪存驱动器、压缩光盘、数字视频光盘、蓝光光盘或其它计算机可读媒体。在一些实例中,网络服务器(图中未示)可例如经由网路发射从视频编译装置12接收经编码视频数据且将经编码视频数据提供到客户端装置14。类似地,媒体生产设施(例如光盘冲压设施)的计算装置可从视频编译装置12接收经编码视频数据且生产含有经编码的视频数据的光盘。因此,在各种实例中,计算机可读媒体16可理解为包含各种形式的一或多个计算机可读媒体。
在一些实例中,经编码数据可从输出接口22输出到存储装置。类似地,经编码数据可由输入接口从存储装置存取。存储装置可包含多种分布式或本地存取式数据存储媒体中的任一者,例如硬盘驱动器、蓝光光盘、DVD、CD-ROM、闪存存储器、易失性或非易失性存储器或用于存储经编码视频数据的任何其它适合数字存储媒体。在另一实例中,存储装置可对应于文件服务器或可存储由视频编译装置12产生的经编码视频的另一中间存储装置。客户端装置14可经由流式传输或下载从存储装置存取所存储视频数据。文件服务器可为能够存储经编码视频数据并将经编码视频数据发射到客户端装置14的任何类型的服务器。实例文件服务器包含网络服务器(例如,用于网站)、FTP服务器、网络连接存储(NAS)装置或本地磁盘驱动器。客户端装置14可通过包含因特网连接的任何标准数据连接来存取经编码视频数据。所述连接可包含无线信道(例如,Wi-Fi连接)、有线连接(例如,DSL、电缆调制解调器等)或适于存取文件服务器上所存储的经编码视频数据的两者的组合。经编码视频数据从存储装置的发射可为流式传输发射、下载发射或其组合。
本发明的技术不必限于无线应用或设置。所述技术可应用于支持多种多媒体应用中的任一者的视频译码,所述多媒体应用例如空中电视广播、有线电视发射、卫星电视发射、因特网流式传输视频发射(例如,HTTP动态自适应流式传输(DASH))、被编码到数据存储媒体上的数字视频,存储在数据存储媒体上的数字视频的解码,或其它应用。在一些实例中,系统10可经配置以支持单向或双向视频发射,从而支持例如视频流式传输、视频回放、视频广播和/或视频电话等应用。
在图1的实例中,视频编译装置12包含视频源18、视频预处理器19、视频编码器20和输出接口22。客户端装置14包含输入接口28、视频解码器30和视频后处理器31。吸收装置32包含处理器33。客户端装置14的视频后处理器31和吸收装置32的处理器33可经配置以实施本发明的技术,包含应用于某些色彩空间中的视频数据以实现HDR和WCG视频数据的更高效压缩的传信和相关操作。在一些实例中,视频预处理器19可与视频编码器20分离。在其它实例中,视频预处理器19可为视频编码器20的一部分。在其它实例中,源装置和目的地装置可包含其它组件或布置。举例来说,视频编译装置12可从例如外部相机的外部视频源18接收视频数据。同样地,客户端装置14可能以一体式吸收装置而非独立装置形式包含吸收装置32。
图1的所说明的系统10仅为一个实例。用于处理HDR和WCG视频数据的技术可由任何数字视频编码和/或视频解码装置执行。此外,本发明的技术也可由视频预处理器和/或视频后处理器执行。视频预处理器可为经配置以在编码之前(例如,在HEVC编码之前)处理视频数据的任何装置。视频后处理器可为经配置以在解码之后(例如,在HEVC解码之后)处理视频数据的任何装置。视频编译装置12、客户端装置14和吸收装置32仅为这类译码装置的实例,其中视频编译装置12产生经译码视频数据以供发射到客户端装置14。在一些实例中,装置12、14和32可以基本上对称的方式操作,使得装置12、14和32中的每一者包含视频编码和解码组件以及视频预处理器和视频后处理器(分别例如视频预处理器19和视频后处理器31)。因此,系统10可支持视频装置12、14之间的单向或双向视频发射,以例如用于视频流式传输、视频回放、视频广播或视频电话。
视频编译装置12的视频源18可包含视频捕捉装置,例如摄像机、含有先前所捕捉视频的视频存档和/或用于从视频内容提供者接收视频的视频馈送接口。作为另一替代方案,视频源18可产生基于计算机图形的数据作为源视频,或实况视频、存档视频与计算机产生的视频的组合。在一些情况下,如果视频源18为摄像机,那么视频编译装置12和客户端装置14可形成所谓的相机电话或视频电话。然而,如上文所提及,本发明中描述的技术一般来说可能适用于视频译码和视频处理,且可应用于无线和/或有线应用。在每一情况下,可由视频编码器20编码所捕捉、预先捕捉或计算机产生的视频。经编码视频信息随后可通过输出接口22输出到计算机可读媒体16上。
客户端装置14的输入接口28从计算机可读媒体16接收信息。计算机可读媒体16的信息可包含由视频编码器20定义的也供视频解码器30使用的语法信息,所述语法信息包含描述块及其它经译码单元(例如,图片群组(GOP))的特征和/或处理的语法元素。吸收装置32向用户显示经解码视频数据,且可包括多种显示装置中的任一者,例如阴极射线管(CRT)、液晶显示器(LCD)、等离子显示器、有机发光二极管(OLED)显示器或另一类型的显示装置。
视频编码器20和视频解码器30各自可实施为多种适合编码器电路中的任一者,例如一或多个微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑、软件、硬件、固件或其任何组合。当部分以软件实施所述技术时,装置可将用于所述软件的指令存储于适合非暂时性计算机可读媒体中并使用一或多个处理器以硬件执行所述指令,从而执行本发明的技术。视频编码器20和视频解码器30中的每一者可包含在一或多个编码器或解码器中,所述编码器或解码器中的任一者可集成为相应装置中的组合编码器/解码器(编解码器)的部分。
视频预处理器19和视频后处理器31各自可实施为各种适合编码器电路中的任一者,例如一或多个微处理器、DSP、ASIC、FPGA、离散逻辑、软件、硬件、固件或其任何组合。当部分以软件实施所述技术时,装置可将用于所述软件的指令存储于适合非暂时性计算机可读媒体中并使用一或多个处理器以硬件执行所述指令,从而执行本发明的技术。
在一些实例中,视频编码器20和视频解码器30根据视频压缩标准操作,所述视频压缩标准例如为ISO/IEC MPEG-4Visual和ITU-T H.264(也称为ISO/IEC MPEG-4 AVC),包含其可缩放视频译码(SVC)扩展、多视图视频译码(MVC)扩展和基于MVC的三维视频(3DV)扩展。在一些情况下,符合基于MVC的3DV的任何位流始终含有顺应MVC配置文件(例如,立体声高配置文件)的子位流。此外,正努力产生H.264/AVC的3DV译码扩展,即基于AVC的3DV。视频译码标准的其它实例包含ITU-T H.261、ISO/IEC MPEG-1Visual、ITU-T H.262或ISO/IECMPEG-2Visual、ITU-T H.263、ISO/IEC MPEG-4 Visual和ITU-T H.264ISO/IEC Visual。在其它实例中,视频编码器20和视频解码器30可经配置以根据HEVC标准操作。
视频后处理器31可经配置以发送位流34到吸收装置32和处理器33。处理器33可处理位流34内的数据并在显示装置上输出图形图片或视频。位流34可包含视频数据以及CRISEI消息35。CRI SEI消息35可为具有提供用于视频数据的重新映射参数以将视频数据从一个色彩空间映射到另一个的特殊用途的SEI消息。根据本文中所描述的技术,CRI SEI消息35也可各自含有对应于重新映射参数的一或多个显示能力的集合,其中特定的一个CRISEI消息35中的重新映射参数为与对应显示能力兼容的重新映射参数。
如将在下文更详细地阐释,视频后处理器31和处理器33可经配置以实施本发明的技术。在一些实例中,视频后处理器31可针对一或多个显示能力的第一集合确定一或多个重新映射参数的第一集合。视频后处理器31随后可在第一补充增强信息(SEI)消息中对一或多个显示能力的第一集合和一或多个重新映射参数的第一集合进行译码。视频后处理器31还可针对一或多个显示能力的第二集合确定用于视频数据的一或多个重新映射参数的第二集合,并在第二SEI消息中对一或多个显示能力的第二集合和一或多个重新映射参数的第二集合进行译码。视频后处理器31随后可在位流34中向吸收装置32发送第一SEI消息、第二SEI消息和视频数据。
处理器33可在位流34并从视频后处理器31接收视频数据和第一SEI消息和第二SEI消息。针对SEI消息中的每一者,处理器33可将相应SEI消息中所指示的一或多个显示能力的相应集合与用于吸收装置32的一或多个显示能力的目标集合进行比较,以确定一或多个显示能力的所述相应集合与一或多个显示能力的所述目标集合的兼容性。响应于确定由一组一或多个SEI消息中的第一SEI消息所指示的一或多个显示能力的第一集合与用于吸收装置的一或多个显示能力的目标集合兼容,处理器33可使用由第一SEI消息所指示的一或多个重新映射参数的相应集合调适视频数据。
在一组一或多个SEI消息包括仅单个SEI消息的实例中,处理器33可确定单个SEI消息中的一或多个显示能力的集合是否与一或多个显示能力的目标集合兼容。如果单个SEI消息中的一或多个显示能力的集合与一或多个显示能力的目标集合兼容,那么处理器33可使用所述单个SEI消息中的重新映射信息调适视频数据。反之,如果单个SEI消息中的一或多个显示能力的集合不与一或多个显示能力的目标集合兼容,那么处理器33可避免调适视频数据或调整重新映射信息,使得视频数据可根据目标显示参数来显示。
在一组一或多个SEI消息包括多个SEI消息的实例中,处理器33可分析相应SEI消息中的一或多个显示能力的每一集合并选择与一或多个显示能力的目标集合兼容的SEI消息。处理器33随后可使用由所选SEI消息所指示的一或多个重新映射参数的相应集合调适视频数据。
视频预处理器19、视频后处理器31和处理器33各自可实施为多种适合编码器电路中的任一者,例如一或多个微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑、软件、硬件、固件或其任何组合。当部分以软件实施所述技术时,装置可将用于所述软件的指令存储于适合非暂时性计算机可读媒体中并使用一或多个处理器以硬件执行所述指令,从而执行本发明的技术。如上文所论述,视频预处理器19和视频后处理器31可分别为与视频编码器20和视频解码器30分离的装置。在其它实例中,视频预处理器19可与视频编码器20集成在单个装置中,且视频后处理器31可与视频解码器30集成在单个装置中。
在HEVC及其它视频译码标准中,视频序列通常包含一系列图片。图片也可被称作“帧”。图片可包含三个样本阵列,标示为SL、SCb和SCr。SL为明度样本的二维阵列(即,块)。SCb为Cb彩度样本的二维阵列。SCr为Cr彩度样本的二维阵列。彩度样本(chrominance sample)在本文中还可被称作“色度(chroma)”样本。在其它情况下,图片可为单色的且可仅包含明度样本阵列。
视频编码器20可产生一组译码树单元(CTU)。CTU中的每一者可包括明度样本的译码树块、色度样本的两个对应译码树块和用于对译码树块的样本进行译码的语法结构。在黑白图片或具有三个独立色彩平面的图片中,CTU可包括单个译码树块及用于对所述译码树块的样本进行译码的语法结构。译码树块可为N×N样本块。CTU也可被称作“树块”或“最大译码单元(LCU)”。HEVC的CTU可广泛类似于例如H.264/AVC的其它视频译码标准的宏块。然而,CTU未必限于特定大小,且可包含一或多个译码单元(CU)。切片可包含在光栅扫描中连续排序的整数数目个CTU。
本发明可使用术语“视频单元”或“视频块”来指代样本的一或多个块及用于对样本的一或多个块的样本进行译码的语法结构。视频单元的实例类型可包含HEVC中的CTU、CU、PU、变换单元(TU),或其它视频译码标准的宏块、宏块分区等等。
为产生经译码CTU,视频编码器20可在CTU的译码树块上以递归方式执行四叉树分割,以将译码树块划分为译码块,因此命名为“译码树单元”。译码块可为N×N样本块。CU可包括具有明度样本阵列、Cb样本阵列和Cr样本阵列的图片的明度样本的译码块和色度样本的两个对应译码块,以及用于对译码块的样本进行译码的语法结构。在黑白图片或具有三个独立色彩平面的图片中,CU可包括单个译码块及用于对所述译码块的样本进行译码的语法结构。
视频编码器20可将CU的译码块分割为一或多个预测块。预测块可为对其应用相同预测的样本的矩形(即,正方形或非正方形)块。CU的预测单元(PU)可包括图片的明度样本的预测块,图片的色度样本的两个对应的预测块,以及用以对预测块样本进行预测的语法结构。在黑白图片或具有三个独立色彩平面的图片中,PU可包括单个预测块和用于对预测块样本进行预测的语法结构。视频编码器20可产生用于CU的每一PU的明度预测块、Cb预测块以及Cr预测块的预测性明度块、Cb块以及Cr块。
视频编码器20可使用帧内预测或帧间预测来产生用于PU的预测性块。如果视频编码器20使用帧内预测产生PU的预测性块,那么视频编码器20可基于与PU相关联的图片的经解码样本来产生PU的预测性块。
如果视频编码器20使用帧间预测产生PU的预测性块,则视频编码器20可基于除与PU相关的图片以外的一或多个图片的经解码样本产生PU的预测性块。帧间预测可为单向帧间预测(即,单向预测)或双向帧间预测(即,双向预测)。为执行单向预测或双向预测,视频编码器20可产生用于当前切片的第一参考图片列表(RefPicList0)以及第二参考图片列表(RefPicList1)。
参考图片列表中的每一者可包含一或多个参考图片。当使用单向预测时,视频编码器20可搜索RefPicList0和RefPicList1中的任一者或两者中的参考图片,以确定参考图片内的参考位置。此外,当使用单向预测时,视频编码器20可至少部分地基于对应于参考位置的样本产生PU的预测性样本块。此外,当使用单向预测时,视频编码器20可产生指示PU的预测块与参考位置之间的空间位移的单一运动向量。为指示PU的预测块与参考位置之间的空间位移,运动向量可包含指定PU的预测块与参考位置之间的水平位移的水平分量且可包含指定PU的预测块与参考位置之间的垂直位移的垂直分量。
在使用双向预测来编码PU时,视频编码器20可确定RefPicList0中的参考图片中的第一参考位置及RefPicList1中的参考图片中的第二参考位置。视频编码器20随后可至少部分基于对应于第一参考位置和第二参考位置的样本产生PU的预测性块。此外,当使用双向预测来编码PU时,视频编码器20可产生指示PU的样本块与第一参考位置之间的空间位移的第一运动,和指示PU的预测块与第二参考位置之间的空间位移的第二运动。
在视频编码器20产生CU的一或多个PU的预测性明度块、Cb块和Cr块之后,视频编码器20可产生CU的明度残余块。CU的明度残余块中的每一样本指示CU的预测性明度块中的一者中的明度样本与CU的原始明度译码块中的对应样本之间的差异。另外,视频编码器20可产生CU的Cb残余块。CU的Cb残余块中的每一样本可指示CU的预测性Cb块中的一者中的Cb样本与CU的原始Cb译码块中对应的样本之间的差异。视频编码器20还可产生CU的Cr残余块。CU的Cr残余块中的每一样本可指示CU的预测性Cr块中的一者中的Cr样本与CU的原始Cr译码块中的对应样本之间的差异。
此外,视频编码器20可使用四叉树分割将CU的明度残余块、Cb残余块和Cr残余块分解成一或多个明度变换块、Cb变换块和Cr变换块。变换块可为对其应用相同变换的样本的矩形块。CU的变换单元(TU)可包括明度样本的变换块、色度样本的两个对应变换块和用以对变换块样本进行变换的语法结构。在黑白图片或具有三个独立色彩平面的图片中,TU可包括单个变换块和用以对变换块样本进行变换的语法结构。因此,CU的每一TU可与明度变换块、Cb变换块和Cr变换块相关联。与TU相关联的明度变换块可为CU的明度残余块的子块。Cb变换块可为CU的Cb残余块的子块。Cr变换块可为CU的Cr残余块的子块。
视频编码器20可将一或多个变换应用到TU的明度变换块以产生TU的明度系数块。系数块可为变换系数的二维阵列。变换系数可为标量。视频编码器20可将一或多个变换应用到TU的Cb变换块以产生TU的Cb系数块。视频编码器20可将一或多个变换应用到TU的Cr变换块以产生TU的Cr系数块。
在产生系数块(例如,明度系数块、Cb系数块或Cr系数块)之后,视频编码器20可量化系数块。量化一般指代对变换系数进行量化以可能减少用以表示变换系数的数据的量从而提供进一步压缩的过程。此外,视频编码器20可逆量化变换系数且将逆变换应用到变换系数,以便重构图片的CU的TU的变换块。视频编码器20可使用CU的TU的经重构变换块以及CU的PU的预测性块以重构CU的译码块。通过重构图片的每一CU的译码块,视频编码器20可重构所述图片。视频编码器20可将经重构图片存储在经解码图片缓冲器(DPB)中。视频编码器20可使用DPB中的经重构图片以供用于帧间预测及帧内预测。
在视频编码器20量化系数块之后,视频编码器20可对指示经量化变换系数的语法元素进行熵编码。举例来说,视频编码器20可对指示经量化变换系数的语法元素执行上下文自适应二进制算术译码(CABAC)。视频编码器20可在位流中输出经熵编码语法元素。
视频编码器20可输出包含位序列的位流,所述位序列形成经译码图片和相关联数据的表示。所述位流可包括网络抽象层(NAL)单元序列。NAL单元中的每一者包含NAL单元标头且包封原始字节序列有效负载(RBSP)。NAL单元标头可包含指示NAL单元类型代码的语法元素。由NAL单元的NAL单元标头指定的NAL单元类型代码指示NAL单元的类型。RBSP可为含有包封在NAL单元内的整数数目个字节的语法结构。在一些情况下,RBSP包含零个位。
不同类型的NAL单元可包封不同类型的RBSP。举例来说,第一类型的NAL单元可包封用于图片参数集(PPS)的RBSP,第二类型的NAL单元可包封用于经译码切片的RBSP,第三类型的NAL单元可包封用于补充增强信息(SEI)的RBSP,等等。PPS为可含有适用于零或多个完整经译码图片的语法元素的语法结构。包封视频译码数据的RBSP(与参数集及SEI消息的RBSP相对)的NAL单元可被称作视频译码层(VCL)NAL单元。包封经译码切片的NAL单元在本文中可被称作经译码切片NAL单元。经译码切片的RBSP可包含切片标头和切片数据。
视频解码器30可接收位流。另外,视频解码器30可解析位流以从位流对语法元素进行解码。视频解码器30可至少部分地基于从位流解码的语法元素重构视频数据的图片。重构视频数据的过程可大体上与视频编码器20执行的过程互逆。举例来说,视频解码器30可使用PU的运动向量,以确定当前CU的PU的预测性块。视频解码器30可使用PU的一或多个运动向量来产生PU的预测性块。
另外,视频解码器30可逆量化与当前CU的TU相关联的系数块。视频解码器30可对系数块执行逆变换以重构与当前CU的TU相关联的变换块。视频解码器30可通过将当前CU的PU的预测性样本块的样本添加到当前CU的TU的变换块的对应样本来重构当前CU的译码块。通过重构图片的每一CU的译码块,视频解码器30可重构所述图片。视频解码器30可将经解码图片存储在经解码图片缓冲器中以供输出和/或用于解码其它图片。
下一代视频应用可用表示利用HDR和WCG捕捉的景物的视频数据来操作。所利用的动态范围和色域的参数为视频内容的两个独立属性,且其用于数字电视和多媒体服务目的的规范由数个国际标准定义。举例来说,ITU-R Rec.BT.709“用于产生和国际程序交换的HDTV标准的参数值(Parameter values for the HDTV standards for production andinternational programme exchange)”定义用于HDTV(高清电视)的参数,例如标准动态范围(SDR)和标准色域,且ITU-R Rec.BT.2020“用于产生和国际程序交换的超高清电视系统的参数值(Parameter values for ultra-high definition television systems forproduction and international programme exchange)”指定超高清电视(UHDTV)参数,例如HDR和WCG。还存在指定其它系统中的动态范围和色域属性的其它标准开发组织(SDO)文件,例如,在SMPTE-231-2(电影与电视工程师学会(Society of Motion Picture andTelevision Engineers))中定义DCI-P3色域,且在SMPTE-2084中定义HDR的一些参数。在下文提供对视频数据的动态范围和色域的简要说明。
动态范围通常定义为视频信号的最小亮度(例如明度)与最大亮度之间的比率。也可依据“f-光圈(f-stop)”来测量动态范围,其中一个f光圈对应于信号的动态范围的双倍。在MPEG的定义中,HDR内容是以大于16个f光圈表示亮度变化的特征的内容。在一些条款中,10与16个f光圈之间的层级被视为中间动态范围,但其在其它定义中被视为HDR。在本发明的一些实例中,HDR视频内容可为与传统使用的具有标准动态范围的视频内容(例如由ITU-R Rec.BT.709指定的视频内容)相比具有更高动态范围的任何视频内容。
补充增强信息(SEI)消息包含于视频位流中,通常为了载送对于解码器解码所述位流来说不重要的信息。所述信息适用于改进经解码输出的显示或处理,例如,这类信息可由解码器侧实体用来改进内容的可观看性。
还可能的是,某些应用标准(例如,数字视频广播(DVB),高级电视系统委员会(advanced television systems committee;ATSC))授权位流中的这类SEI消息的存在,使得可改进符合所述应用标准(帧兼容的平面立体3DTV视频格式的帧填充SEI消息的载送,其中载送SEI消息以用于视频的每一帧、恢复点SEI消息的处置、DVB中的全景扫描矩形SEI消息的使用)的所有装置的质量。
可使用HEVC标准中定义的色彩再映射信息(CRI)SEI消息来传达用于将一个色彩空间中的图片映射到另一色彩空间的信息。CRI SEI消息的语法可包含三个部分:三个1-D查找表的第一集合(前LUT)、之后的3×3矩阵以及之后的三个1-D查找表的第二集合(后LUT)。针对每一色彩分量,例如R、G、B或Y、Cb、Cr,独立LUT经定义用于前LUT和后LUT两者。
CRI SEI消息包含被称作colour_remap_id的语法元素,其不同值可用于指示SEI消息的不同目的。图2展示供CRI SEI消息使用的色彩重新映射信息/过程的典型结构。
CRI SEI消息的语法可类似于以下各者:
上文针对CRI SEI消息所描述的变量的语义可包含以下各者(应注意,完整语义可在HEVC标准中获得):
色彩重新映射信息SEI消息提供用以实现输出图片的经重构色彩样本的重新映射的信息。视频译码装置可将色彩重新映射信息直接应用到经解码样本值,不论其在明度和彩度域中还是在RGB域中。用于色彩重新映射信息SEI消息中的色彩重新映射模型由应用于每一色彩分量(由本文中的语法元素的“前”集合所指定)的第一分段线性函数、应用于三个色彩分量的三乘三矩阵以及应用于每一色彩分量(由本文中的语法元素的“后”集合所指定)的第二分段线性函数组成。用于显示的输出图片的色彩重新映射为任选的并且不影响本文中指定的解码过程。
color_remap_id含有视频译码装置可使用以识别色彩重新映射信息的用途的识别号。color_remap_id的值可在0到232-2的范围内(包含端值)。
如由本申请案所确定,可使用从0到255和从512到231-1的color_remap_id值。从256到511(包含端值)且从231到232-2(包含端值)的color_remap_id值经保留以供ITU-T|ISO/IEC将来使用。解码器可忽略含有在256到511的范围内(包含端值)或在231到232-2的范围内(包含端值)的color_remap_id值的所有CRI SEI消息,且位流可能不会含有这些值。
视频译码装置可使用color_remap_id支持适合于不同显示场景的不同色彩重新映射过程。举例来说,不同colour_remap_id值可对应于由显示器支持的不同的经重新映射的色彩空间。
除了color_remap_matrix_coefficients指定经重新映射的经重构图片的色彩空间而非用于CLVS的色彩空间之外,color_remap_matrix_coefficients具有如matrix_coeffs语法元素的条款E.3.1中所指定的相同语义。当不存在时,视频译码装置推断color_remap_matrix_coefficients值等于matrix_coeffs值。
color_remap_input_bit_depth指定相关联图片的明度及色度分量或RGB分量的位深度,以用于解译色彩重新映射信息SEI消息的目的。当任何色彩重新映射信息SEI消息以不等于经译码明度和色度分量或经译码RGB组分的位深度的color_remap_input_bit_depth值存在时,SEI消息指代经执行以将经译码视频转换成具有等于color_remap_input_bit_depth的位深度的经转换视频的转码操作的假定结果。
color_remap_input_bit_depth的值可在8到16的范围内(包含端值)。从0到7(包含端值)且从17到255(包含端值)的color_remap_input_bit_depth值经保留以供ITU-T|ISO/IEC将来使用。解码器可忽略含有在0到7的范围内(包含端值)或在17到255的范围内(包含端值)的color_remap_input_bit_depth的所有色彩重新映射SEI消息,且位流可能不会含有这些值。
color_remap_bit_depth指定由色彩重新映射信息SEI消息描述的色彩重新映射函数的输出的位深度。
color_remap_bit_depth的值可在8到16的范围内(包含端值)。从0到7(包含端值)且从17到255(包含端值)的color_remap_bit_depth值经保留以供ITU-T|ISO/IEC将来使用。解码器可忽略含有从0到7(包含端值)或在17到255的范围内(包含端值)的color_remap_bit_depth值的所有色彩重新映射SEI消息。
pre_lut_num_val_minus1[c]加1针对第c个分量在分段线性重新映射函数中指定枢轴点的数目,其中c等于0指代明度或G分量,c等于1指代Cb或B分量,且c等于2指代Cr或R分量。当pre_lut_num_val_minus1[c]等于0时,对于第c个分量,输入值的默认端点为0和2color_remap_input_bit_depth-1,且输出值的对应默认端点为0和2color_remap_bit_depth-1。在符合本说明书的此版本的位流中,pre_lut_num_val_minus1[c]的值可在0到32的范围内(包含端值)。
pre_lut_coded_value[c][i]指定第c个分量的第i个枢轴点的值。用以表示pre_lut_coded_value[c][i]的位数目为((color_remap_input_bit_depth+7)>>3)<<3。
pre_lut_target_value[c][i]指定第c个分量的第i个枢轴点的值。用以表示pre_lut_target_value[c][i]的位数目为((color_remap_bit_depth+7)>>3)<<3。
post_lut_num_val_minus[]、post_lut_coded_value[][]和post_lut_target_value[][]的语义分别类似于re_lut_num_val_minus[]、pre_lut_coded_value[][]和pre_lut_target_value[][]的语义;用以表示post_lut_coded_value[][]和post_lut_target_value[][]的位数目等于color_remap_bit_depth。
人类视觉系统(HVS)能够感知比SDR内容和HDR内容大得多的动态范围。然而,HVS包含用以将HVS的动态范围变窄为所谓的同步范围的自适应机制。同步范围的宽度可取决于当前光照条件(例如当前亮度)。在图3中展示对由HDTV的SDR提供的动态范围、UHDTV的期望HDR和HVS动态范围的视觉化。
一些实例视频应用和服务受ITU Rec.709调控,并且提供SDR,通常支持每m2约0.1到100坎德拉(candela,cd)(通常称为“尼特(nit)”)的亮度(例如明度)范围,从而导致小于10个f光圈。期望一些实例的下一代视频服务提供高达16个f光圈的动态范围。虽然这类内容的详细规范目前尚处于开发中,但是已在SMPTE-2084和ITU-R Rec.2020中指定一些初始参数。
除HDR以外更真实的视频体验的另一方面为色彩维度。色彩维度通常由色域定义。图4为展示SDR色域(基于BT.709色彩元的三角形100)以及用于UHDTV的更宽色域(基于BT.2020色彩元的三角形102)的概念图。图4还描绘所谓的光谱轨迹(由舌形区104界定),表示自然色彩的限值。如图4所说明,从BT.709(三角形100)移动到BT.2020(三角形102),色彩元旨在提供具有约70%的更多色彩的UHDTV服务。D65指定针对BT.709和/或BT.2020规范的实例白色色彩。
在表1中展示针对DCI-P3、BT.709和BT.202色彩空间的色域规范的实例。
表1-色域参数
如表1中可见,色域可由白点的X值和Y值以及原色的X值和Y值定义(例如,红色(R)、绿色(G)和蓝色(B))。X值和Y值表示色彩的色度(X)及亮度(Y),如由CIE 1931色彩空间所定义。CIE 1931色彩空间定义纯色之间的联系(例如在波长方面)和人眼如何感知这类色彩。
HDR/WCG视频数据通常每分量(甚至是浮点)以极高精度获取且存储,具有4:4:4色度次取样格式和极宽色彩空间(例如CIE XYZ)。这表示目标在于高精度且几乎是在数学上无损的。然而,用于存储HDR/WCG视频数据的这种格式可包含大量冗余且对于压缩目的来说可能并非最优。具有基于HVS的假设的更低精度格式通常用于最先进视频应用。
用于压缩目的的视频数据格式转换过程的一个实例包含三个主要过程,如图5中所示。图5的技术可由源装置12执行。线性RGB数据110可为HDR/WCG视频数据且可存储在浮点表示中。线性RGB数据110可使用用于动态范围压实的非线性传递函数(TF)112压实。传递函数112可使用任何数目的非线性传递函数(例如,如SMPTE-2084中所定义的PQ TF)压实线性RGB数据110。在一些实例中,色彩转换过程114将压实数据转换成更紧凑或稳固的色彩空间(例如YUV或YCrCb色彩空间),其更适合于通过混合视频编码器压缩。所述数据随后使用浮点至整数表示量化单元116量化以产生经转换的HDR'数据118。在所述实例中,HDR'数据118呈整数表示。HDR'数据现呈更适合于通过混合视频编码器(例如应用HEVC技术的视频编码器20)进行压缩的格式。给出图5中所描绘的过程的次序作为实例,且所述次序可在其它应用中变化。举例来说,色彩转换可先于TF过程。另外,可将额外处理(例如空间次取样)应用于色彩分量。
解码器侧处的逆转换描绘于图5中。图6的技术可由目的地装置14执行。可通过使用混合视频解码器(例如应用HEVC技术的视频解码器30)解码视频数据在目的地装置14处获得经转换HDR'数据120。HDR'数据120随后可由逆量化单元122逆量化。随后,可将逆向色彩转换过程124应用于逆量化的HDR'数据。逆向色彩转换处理124可为色彩转换处理114的逆向。举例来说,逆向色彩转换过程124可将HDR'数据从YCrCb格式转换回到RGB格式。接下来,将逆向传递函数126应用于数据以加回由传递函数112压实以再创建线性RGB数据128的动态范围。
现将更详细地论述图5中所描绘的技术。一般来说,将传递函数应用于数据(例如,HDR/WCG视频数据)以压实数据的动态范围。所述压实允许用较少位来表示数据。在一个实例中,传递函数可为一维(1D)非线性函数且可反映终端用户显示器的电光传递函数(EOTF)的逆向(例如,针对Rec.709中的SDR所指定)。在另一实例中,传递函数可粗略估计HVS对亮度变化的感知,例如HDR的SMPTE-2084中所指定的PQ传递函数。OETF的逆向过程为EOTF(电光传递函数),其将代码层级映射回明度。图7展示用以压实某些色彩容器(colorcontainer)的动态范围的非线性传递函数的若干实例。传递函数还可分别应用于每一R、G及B分量。
由ITU-R建议BT.1886指定的参考EOTF可由以下方程式指定:
L=a(max[(V+b),0])γ
其中:
L:以cd/m2计的屏幕明度
LW:用于白色的屏幕明度
LB:用于黑色的屏幕明度
V:输入视频信号层级(正规化的,在V=0时为黑色到在V=1时为白色)。对于根据建议ITU-R BT.709掌握的内容,10位数字代码值“D”根据以下方程式映射成V值:V=(D-64)/876
γ幂函数的指数,γ=2.404
a:用户增益的变量(传统“对比度”控制)
b:用于用户黑场电平提升的变量(传统“亮度”控制)
以上变量a和b通过对以下方程式求解而导出,以使得V=1得到
L=LW且V=0得到L=LB
LB=a·bγ
Lw=a·(1+b)γ
为了更高效地支持更高动态范围数据,SMPTE最近已标准化称作SMPTE ST-2084的新传递函数。ST2084的规范如下定义EOTF应用。将TF应用于正规化的线性R、G、B值,从而产生R'G'B'的非线性表示。ST2084通过NORM=10000定义正规化,其与10000尼特(cd/m2)的峰值亮度相关联。
R'=PQ_TF(max(0,min(R/NORM,1)))
G'=PQ_TF(max(0,min(G/NORM,1)))
B'=PQ_TF(max(0,min(B/NORM,1)))
其中
通常,EOTF经定义为具有浮点精确性的函数,由此在应用所谓的OETF的逆向TF的情况下不会向具有所述非线性的信号引入误差。ST2084中指定的逆向TF(OETF)经定义为inversePQ函数:
R=10000*inversePQ_TF(R')
G=10000*inversePQ_TF(G')
B=10000*inversePQ_TF(B')
其中
应注意,EOTF和OETF为有效研究和标准化的主题,且用于一些视频译码系统中的TF可不同于ST2084。
在本发明的上下文中,术语“信号值”或“色彩值”可用于描述对应于图像元素的特定色彩分量(例如R、G、B或Y)的值的明度层级。信号值通常表示线性光级(明度值)。术语“代码层级”或“数字代码值”可指代图像信号值的数字表示。通常,这种数字表示为非线性信号值的表示。EOTF表示提供给显示装置(例如吸收装置32)的非线性信号值与由显示装置产生的线性色彩值之间的关系。
RGB数据通常用作输入色彩空间,因为RGB为通常由图像捕捉传感器产生的数据类型。然而,RGB色彩空间在其分量当中具有高冗余,且对于紧密表示来说并非最优。为了实现更紧密和更稳固表示,RGB分量通常转换成(例如执行色彩变换)适合于压缩的更不相关的色彩空间,例如YCbCr。YCbCr色彩空间在不同的较不相关分量中分离呈明度(Y)形式的亮度和色彩信息(CrCb)。在此上下文中,稳固表示可指代以受限位率压缩时具有抗丢包和抗误码的较高层级的特征的色彩空间。
在色彩变换后,目标色彩空间中的输入数据仍可以高位深度(例如浮点精确性)表示。高位深度数据可例如使用量化过程来转换成目标位深度。某些研究展示,10至12位的精确性结合PQ传递足以向16个f光圈的HDR数据提供低于最小可辨差异(Just-NoticeableDifference;JND)的畸变。一般来说,JND是必须变化以使差异(例如通过HVS)可辨的某物(例如视频数据)的量。以10位精确性表示的数据可进一步利用大部分最先进视频译码解决方案来译码。这种量化为有损译码的元素并且为引入到经转换数据的不精确性的来源。
下一代HDR/WCG视频应用可用在HDR和CG的不同参数下捕捉的视频数据来操作。不同配置的实例可为对具有至多1000尼特或至多10,000尼特的峰值亮度的HDR视频内容的捕捉。不同色域的实例可包含BT.709、BT.2020以及SMPTE指定的P3或其它。
可利用并有所有其它当前使用的色域的单个色彩空间,例如目标色彩容器。这类目标色彩容器的一个实例为BT.2020。对单个目标色彩容器的支持可简化HDR/WCG系统的标准化、实施和部署,这是由于减少数目的操作点(例如色彩容器、色彩空间、色彩转换算法等的数目)和/或减少数目的必需算法应由解码器(例如视频解码器30)支持。
在这种系统的一个实例中,利用不同于目标色彩容器(例如,BT.2020)的固有色域(例如,P3或BT.709)捕捉的内容可在处理之前(例如,在视频编码之前)转换成目标容器。
以下是这类转换的若干实例:
从BT.709到BT.2020色彩容器的RGB转换:
R2020=0.627404078626*R709+0.329282097415*G709+0.043313797587*B709
G2020=0.069097233123*R709+0.919541035593*G709+0.011361189924*B709
B2020=0.016391587664*R709+0.088013255546*G709+0.895595009604*B709
从P3到BT.2020色彩容器的RGB转换:
R2020=0.753832826496*RP3+0.198597635641*GP3+0.047569409186*BP3
G2020=0.045744636411*RP3+0.941777687331*GP3+0.012478735611*BP3
B2020=-0.001210377285*RP3+0.017601107390*GP3+0.983608137835*BP3
对于现代视频译码系统,通常使用的色彩空间为YCbCr,如ITU-R BT.709中所指定。BT.709标准中的YCbCr色彩空间指定从R'G'B'到Y'CbCr(非恒定明度表示)的以下转换过程:
Y'=0.2126*R'+0.7152*G'+0.0722*B'
Cb=(B^'-Y^')/1.8556
Cr=(R^'-Y^')/1.5748
以上还可以使用以下避免Cb分量和Cr分量的除法的近似转换来实施:
Y'=0.212600*R'+0.715200*G'+0.072200*B'
Cb=-0.114572*R'-0.385428*G'+0.500000*B'
Cr=0.500000*R'-0.454153*G'-0.045847*B'
在所述转换期间,在P3或BT.709色域中捕捉的信号的动态范围可在BT.2020表示中减小。由于数据是以浮点精确性表示的,所以不存在损失;然而,当与色彩转换(例如,以下方程式3中展示的从RGB到YCbCr的转换)和量化(以下方程式4中的实例)组合时,动态范围减小导致输入数据的量化误差增加。
Y'=0.2627*R'+0.6780*G'+0.0593*B';
DY′=(Round((1<<(BitDepthY-8))*(219*Y′+16)))
DCb=(Round((1<<(BitDepthCr-8))*(224*Cb+128)))
DCr=(Round((1<<(BitDepthCb-8))*(224*Cr+128)))
其中
Round(x)=Sign(x)*Floor(Abs(x)+0.5)
如果x<0,那么Sign(x)=-1;如果x=0,那么Sign(x)=0;如果x>0,那么Sign(x)=1
Floor(x)小于或等于x的最大整数
如果x>=0,那么Abs(x)=x;如果x<0,那么Abs(x)=-x
Clip1Y(x)=Clip3(0,(1<<BitDepthY)-1,x)
Clip1C(x)=Clip3(0,(1<<BitDepthC)-1,x)
如果z<x,那么Clip3(x,y,z)=x;如果z>y,那么Clip3(x,y,z)=y;否则Clip3(x,y,z)=z
在以上方程式中,方程式DY'为经量化Y'分量,DCb为经量化Cb且DCr为经量化Cr分量。术语<<表示逐位右移。BitDepthY、BitDepthCr和BitDepthCb分别为经量化分量的所需位深度。
以上还可以使用以下避免Cb分量和Cr分量的除法的近似转换来实施:
Y'=0.262700*R'+0.678000*G'+0.059300*B'
Cb=-0.139630*R'-0.360370*G'+0.500000*B'
Cr=0.500000*R'-0.459786*G'-0.040214*B'
另外,在现实的译码系统中,对具有减小的动态范围的信号进行译码可导致经译码色度分量显著的精确性损失且将被观看者观测为译码伪影,例如色彩失配和/或色彩渗透。
通过高速数字物理接口将未经压缩视频信号从解码器(例如,源装置,例如客户端装置14)传信到例如显示器或TV的终端消费装置(例如,吸收装置32)。消费电子产品装置(例如数字电视(DTV)、数字有线、卫星或地面机顶盒(STB))和相关外围装置(包含(但不限于)DVD播放器/记录器)和其它相关源或吸收器利用未经压缩数字接口的协议、要求和建议在由消费电子协会(CTA)R4.8DTV接口小组委员会CTA-861产生的规范中定义。所定义的协议、要求和建议包含:视频格式和波形;比色和量化;压缩和未经压缩以及线性脉码调制(L-PCM)音频的输送;辅助数据的载送;以及视频电子标准协会(VESA)增强的扩展显示识别数据标准(E-EDID)的实施,其由吸收器使用以声明显示能力和特征。
CTA 861-G规范可包含用于载送更大量的动态(在时间上变化的)元数据的扩展信息帧(InfoFrame)数据结构,其可用于可适用于终端装置(例如具有从例如解码器或接收器的视频信号源提供的信息的显示器或TV)的智能处理、引导映射、显示调适和色量变换。用2字节编号识别扩展信息帧应用的类型。当扩展信息帧类型代码设置为0x0001、0x0002、0x0003或0x0004时,扩展信息帧将载送HDR动态元数据。HDR动态元数据扩展信息帧含有HDR动态元数据,所述HDR动态元数据可载送于经压缩视频位流的补充增强信息(SEI)消息中,所述经压缩视频位流例如HEVC、AVC或VP8/VP9/VP10位流,或其它位流。
如果源装置(例如客户端装置14)支持HDR动态元数据扩展信息帧类型(如由相关扩展信息帧类型指示)的发射且如果源装置确定吸收装置(例如吸收装置32)能够接收所述信息,那么源装置可将根据HDR元数据类型的规则编码的视频与HDR动态元数据扩展信息帧一起发送。源装置不应将含有扩展信息帧类型0x0001、0x0002、0x0003或0x004的HDR动态元数据扩展信息帧发送到未指示支持接收装置的HDR动态元数据数据块中的扩展信息帧类型的吸收装置。
经由扩展显示识别数据(EDID)进行吸收装置与源装置之间的通信。存储在吸收装置中的这类数据描述DTV(显示器)能够接收和再现的视频格式。根据源装置的请求经由接口将信息供应到源装置。源装置随后选择其输出格式,考虑到原始视频流的格式和吸收装置所支持的格式。
显示能力的参数在若干指定数据块中在接收器和源之间传送,所述数据块例如比色数据块、HDR静态元数据块、HDR动态元数据数据块和其它块。
比色数据块指示支持特定扩展比色标准和目前为止相关的色域,例如BT.2020或DCI-P3。HDR数据块通过例如显示器的EOTF的特征的参数(BT.1886、ST 2084或其它)、内容的动力范围的所需参数(例如显示器上的内容的最优再现所需的内容最小/最大明度或所需的内容最大帧平均明度)来指示接收器的HDR能力。HDR动态元数据数据块指示支持的HDR动态元数据类型的类型和版本。
比色数据块(CDB)和HDR静态元数据数据块中描述的显示能力指示吸收装置的HDR/WCG能力的某些参数。CDB中指定公认的比色法(也就是表示格式或色彩容器),例如BT.2020或DCI-P3。然而,在HDR静态元数据数据块中定义呈所需最小/最大内容明度形式的显示HDR能力。
通过以上块转送的信息允许源装置将经解码未经压缩信号转换为所述吸收装置可理解的格式。转换过程可包含内容的HDR色调映射(以符合所需最大明度层级)和/或色彩容器转换(以符合所支持的比色格式),或HDR动态元数据类型和参数实体的选择,其将允许吸收装置进行信号自适应以符合其能力。
CRI SEI消息可存在问题。可在对经解码样本进行解量化、滤波和增加取样或执行经解码样本的色彩空间转换之后应用分析CRI SEI消息(例如利用查找表)的过程。如在HEVC中所定义,视频解码器30可能不了解CRI SEI将应用于处理链的哪一点。
CRI SEI消息的规范包含指示SEI消息的用途的语法元素color_remap_id。然而,所述语义并未指定具有不同ID的并行或依序CRI SEI消息的处理以及这些并行或依序CRISEI消息是否可经载送和/或应用。
处理器33可应用CRI SEI消息35以使解码器的输出适应于特定显示器。即,CRISEI可用于与目标显示的显示调适。显示器可由其峰值亮度和色域以及其它特征定义。然而,CRI SEI不指示目标显示的所述特征中的一些,尤其峰值亮度。CRI SEI指示输出的容器(即,像素值的含义),但不指示所述输出的既定用途,并且具体来说,不指示所述输出为哪一类型的显示。
CRI SEI消息还可用于指定色量变换,使得视频在应用CRI SEI消息之后适合于显示在具有特定特征(例如某一色域、峰值亮度或色量)的装置中。CRI SEI消息内部的当前信令可仅含有指示视频在应用CRI SEI中指定的处理之后的色彩元的语法元素。色彩元仅描述视频数据内容将如何解译,并且不描述所述内容的特征或所述内容将表示于具有某些特征的显示中的适合程度。本发明从所述内容或显示的原色分离所述容器的色彩元的信令。另外,本发明允许描述当前CRI SEI消息既定用于的目标显示特征(例如目标显示特征、峰值明度等),使得当存在超过一个CRI SEI消息时,特定显示器可选择最接近于其自身特征的CRI SEI消息。
本发明的技术描述视频后处理器31和/或处理器33产生和使用用于显示调适的CRI SEI消息信令的方法。如DVB和ATSC的应用标准可修改或进一步指定SEI的方面以便使所述SEI更适用于其使用情况。本发明从所述应用标准的视角考虑使用CRI SEI消息信令的方法。
视频后处理器31和/或处理器33可使用color_remap_id的一或多个位(color_remap_id空间中的码字)指示与CRI SEI消息相关联的目标显示的色彩元或色域。视频后处理器31和/或处理器33也可使用这些位指示目标显示,针对所述针对,适合使用CRI SEI消息处理内容。
在一些实施例中,视频后处理器31和/或处理器33可使用color_remap_id的一或多个位指示与CRI SEI消息相关联的目标显示的色彩元或色域,或如下目标显示,针对所述目标显示,适合使用CRI SEI消息处理内容。视频后处理器31和/或处理器33还可基于color_remap_id的位或从color_remap_id导出表示确定SEI消息的子集(例如,经传信CRISEI消息的集合的子集),使得color_remap_id的值(或其表示)或其位指示子集中的CRI消息中所指定的处理适合于特定目标显示。
CRI SEI消息对于目标显示的适合性可定义为吸收装置32的显示的一或多个特征与由CRI SEI消息的语法元素(包含color_remap_id)所描述的特征的类似性(或匹配)。举例来说,显示色域/显示量可接近由color_remap_id所指示的色域,且显示的传递函数可与由color_remap_transfer_function所指示的传递函数相同。这可指示CRI消息与目标显示兼容。
视频后处理器31和/或处理器33可产生用于解码器侧解译的color_remap_id语法元素,使得color_remap_id的一或多个位指示目标显示的色彩元或色域且color_remap_id的一些其它位用于识别CRI消息的其它参数(例如色彩变换的传递特征或参数)的差异。视频后处理器31和/或处理器33还可产生color_remap_id语法元素,使得color_remap_id的一或多个位指示目标显示的色彩元或色域且color_remap_id的一些其它位用于识别不同CRI消息的应用序列,例如具有color_remap_id的较低值的SEI消息可在具有color_remap_id的较高值的CRI消息之前应用于经解码样本。
视频后处理器31和/或处理器33可用表格显示目标显示色域的参数且使得color_remap_id的一或多个位与目标色域的所述参数相关联。目标色域的参数可例如以x、y、z色彩空间中的原色形式表现。
color_remap_id的语义可变化,使得所述语法元素还传达消息直接应用于经解码样本或在一定程度的处理之后应用于样本的信息。
在这类技术的一实例中,当color_remap_id等于0时,视频后处理器31和/或处理器33可在YCbCr域中应用解码器样本。当color_remap_id等于1时,视频后处理器31和/或处理器33可在从YCbCr色彩变换到RGB之后应用经解码样本。
在另一实例中,视频后处理器31和/或处理器33可从color_remap_id值得出到CRISEI消息的输入。举例来说,视频后处理器31可根据color_remap_id语法元素值确定输入色彩系数。举例来说,当color_remap_id为偶数时,输入处于YCbCr中,且当color_remap_id为奇数时,输入处于GBR中。应注意,在这个实施例中,color_remap_id的位0(最低有效位)可用于指示CRI的输入域。
在一个实例中,color_remap_id值为以目标显示的峰值明度的尼特(cd/m2)计的值。color_remap_id的有效值可限于50与10000之间。在另一实例中,color_remap_id值以100尼特的梯级指示峰值明度且限于1与100之间。
在另一实例中,视频后处理器31可如下使用color_remap_id语法元素确定重新映射之后的目标最大明度(Tml)(以cd/m2计):
Tml=100*ceil((color_remap_id+1)/2)
Tml的最大值可经限定,因此不考虑超过显示中合理的明度或传递函数能够指示的明度的目标最大明度。
CRI SEI消息的信令可授权用于目标显示的CRI SEI的存留,使得接收器(例如,吸收装置32和处理器33)可依赖于元数据以进行位流的显示调适。
在一实例中,规范可规定如果具有特定目标显示的CRI SEI消息存在于一随机存取点(RAP),那么特定目标显示也可存在于之后的RAP中。“目标显示”可通过语法元素color_remap_id、color_remap_primaries和color_remap_transfer_function的值确定。在另一实施例中,目标显示可通过其它语法元素的值确定。
上文所描述的实例可能以若干方式组合。举例来说,在旨在用于DVB(TS101 154)的以下文本中,使用PQ10的HEVC HDR UHDTV位流含有可在建议ITU-T H.265/ISO/IEC23008-2第D.3.32条中指定的色彩重新映射信息SEI消息。如果位流中存在CRI SEI消息,视频后处理器31可在每一HEVC DVB_RAP下发射位流。此外,视频后处理器31可将语法元素color_remap_video_signal_info_present_flag设置成“1”,使得存在color_remap_full_range_flag、color_remap_primaries、color_remap_transfer_function、color_remap_matrix_coefficients。视频后处理器31可将color_remap_primaries设置成“1”或“9”。视频后处理器31可将color_remap_matrix_coefficients设置成“0”、“1”或“9”。视频后处理器31可将color_remap_transfer_function设置成“1”、“14”或“16”。视频后处理器31可将color_remap_input_bit_depth和color_remap_bit_depth设置成“8”、“10”或“12”。视频后处理器21可仅在HEVC DVB_RAP下改变语法元素color_remap_full_range_flag、color_remap_primaries、color_remap_transfer_function、color_remap_matrix_coefficients、color_remap_input_bit_depth和color_remap_output_bit_depth中的任一者。视频后处理器31可将color_remap_id设置成小于“256”。视频后处理器31可通过color_remap_id语法元素值确定输入色彩系数,使得当color_remap_id为偶数时,输入处于YCbCr中,且当color_remap_id为奇数时,输入处于GBR中。
当在HEVC DVB_RAP图片中存在用于特定目标显示的色彩重新映射信息SEI消息时,视频后处理器31可至少针对每一后续HEVC DVB_RAP包含用于相同目标显示的CRI SEI消息。“目标显示”通过语法元素color_remap_id、color_remap_primaries和color_remap_transfer_function的值确定。
在一些实例中,视频后处理器31可遮挡用于语法元素color_remap_id的码字的指配的所述语法元素的固定表示的一些位。下文给出关于ue(v)码字解译的表格。当位串被“读取”为整数时,那么将所述整数减去一得到codeNum的值。
位串 codeNum
1 0
0 1 0 1
0 1 1 2
0 0 1 0 0 3
0 0 1 0 1 4
0 0 1 1 0 5
0 0 1 1 1 6
0 0 0 1 0 0 0 7
0 0 0 1 0 0 1 8
0 0 0 1 0 1 0 9
... ...
将ColorRemapId设为与经传信color_remap_id相关联的代码号,且表示为32位整数。下文给出位图表示:
31 30 29 28 27 26 25 24 23 22 21 20 19 18 17 16
15 14 13 12 11 10 9 8 7 6 5 4 3 2 1 0
由于ITU-T|ISO/IEC保留值256到511(包含端值)和231到232-2(包含端值),这保留将固定到0的位8和31。剩余位可用于指示SEI消息的用途。下表提供所述位的解译。
上表仅为针对内容和显示的ColorRemapId和各种特征所描述的映射的一个实例。应理解,所述表格的其它配置(包含内容或显示的其它特征、一或多个特征的更多位、某些位和其解译的不同映射等)亦属于本发明。
在一个实例中,仅包含目标峰值明度、三维计算机图形(TDCG)和发射控制协议(TCP)的参数集合的子集经传信,且对剩余位无明确约束。当接收器(例如,ATSC接收器、DVB接收器、吸收装置32或处理器33)接收具有一或多个SEI消息的位流时,接收器解析color_remap_id且基于显示器/接收器的能力选择一或多个SEI消息的子集并将SEI消息的子集转发到显示器/接收器,其中显示器的能力可由显示器使用反馈消息播发、经预定或由其它装置传达到接收器,一或多个SEI消息的子集的选择通过解析语法元素color_remap_id或变量ColorRemapId来执行且基于ColorRemapId和相关联特征的位确定适合于显示器/接收器的SEI消息的子集。
在一个实例中,接收器(例如,吸收装置32或处理器33)必须仅解析ColorRemapId的位的子集以确定与CRI SEI消息相关联的特征。其它位的值与目标显示特征无关。在另一实例中,接收器仅针对不包含在CRI SEI消息中的特征(例如,TDCG、TPL)执行ColorRemapId的位的关联。
在另一实例中,适合于显示的SEI消息的子集的确定通过解析ColorRemapId的位以及在CRI SEI消息中传信的一或多个语法元素而进行。举例来说,仅处理域、TDCG和TPL与ColorRemapId中的位相关联,且适合性通过解析ColorRemapId以及CRI中的一或多个语法元素(例如color_remap_full_range_flag、color_remap_primaries、color_remap_transfer_function和color_remap_matrix_coefficients)来确定。
在一些实例中,CRI SEI消息中的其它参数也可为colour_remap_id中的经指配位;例如colour_remap_full_range_flag、colour_remap_primaries、colour_remap_transfer_function和colour_remap_matrix_coefficients,colour_remap_input_bit_depth和colour_remap_output_bit_depth。
图8为说明视频编码器20的实例的框图。视频编码器20可在已由视频预处理器19处理的目标色彩容器中在视频切片内执行视频块的帧内译码和帧间译码。帧内译码依赖于空间预测来减小或去除给定视频帧或图片内的视频的空间冗余。帧间译码依赖于时间预测来减少或去除视频序列的邻近帧或图片内的视频的时间冗余。帧内模式(I模式)可指代若干基于空间的译码模式中的任一者。例如单向预测(P模式)或双向预测(B模式)的帧间模式可指代若干基于时间的译码模式中的任一者。
在图8的实例中,视频预处理器19可与视频编码器20集成于单个装置中。视频预处理器19可实施为各种适合编码器电路中的任一者,例如一或多个微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑、软件、硬件、固件或其任何组合。当部分以软件实施所述技术时,装置可将用于所述软件的指令存储于适合非暂时性计算机可读媒体中并使用一或多个处理器以硬件执行所述指令来执行本发明的技术。如上文所论述,在其它实例中,视频预处理器19可分别为与视频编码器20分离的装置。
如图8中所示,视频编码器20接收待编码视频帧内的当前视频块。在图7的实例中,视频编码器20包含模式选择单元40、视频数据存储器41、经解码图片缓冲器64、求和器50、变换处理单元52、量化单元54和熵编码单元56。模式选择单元40又包含运动补偿单元44、运动估计单元42、帧内预测处理单元46和分割单元48。为了视频块重构,视频编码器20还包含逆量化单元58、逆变换处理单元60及求和器62。还可包含解块滤波器(图7中未示)以对块边界进行滤波,以从经重构的视频去除成块性假影。需要时,解块滤波器通常将对求和器62的输出进行滤波。除了解块滤波器之外,还可使用额外滤波器(环路内或环路后)。为简洁起见未展示这些滤波器,但需要时,这些滤波器可对求和器50的输出进行滤波(作为环路内滤波器)。
视频数据存储器41可存储待由视频编码器20的组件编码的视频数据。可(例如)从视频源18获得存储在视频数据存储器41中的视频数据。经解码图片缓冲器64可为存储供视频编码器20用于编码视频数据(例如以帧内或帧间译码模式)的参考视频数据的参考图片存储器。视频数据存储器41和经解码图片缓冲器64可通过各种存储器装置中的任一者形成,例如动态随机存取存储器(DRAM),包含同步DRAM(SDRAM)、磁阻式RAM(MRAM)、电阻式RAM(RRAM)或其它类型的存储器装置。视频数据存储器41和经解码图片缓冲器64可由相同存储器装置或独立存储器装置提供。在各种实例中,视频数据存储器41可与视频编码器20的其它组件一起在芯片上,或相对于那些组件在芯片外。
在编码过程期间,视频编码器20接收待译码的视频帧或切片。所述帧或切片可划分成多个视频块。运动估计单元42和运动补偿单元44相对于一或多个参考帧中的一或多个块执行所接收视频块的帧间预测性译码以提供时间预测。帧内预测处理单元46可替代地相对于与待译码块相同的帧或切片中的一或多个相邻块执行对所接收视频块的帧内预测性译码以提供空间预测。视频编码器20可执行例如多个译码遍次,以针对每一视频数据块选择适当的译码模式。
此外,分割单元48可基于先前译码遍次中的先前分割方案的评估将视频数据块分割成子块。举例来说,分割单元48可在最初将帧或切片分割成LCU,并且基于速率失真分析(例如,速率失真优化)将LCU中的每一者分割成子CU。模式选择单元40可进一步产生指示将LCU分割成子CU的四叉树数据结构。四叉树的叶节点CU可包含一或多个PU和一或多个TU。
模式选择单元40可例如基于误差结果选择框内或框间译码模式中的一者,且将所得经帧内或帧间译码块提供到求和器50以产生残余块数据并提供到求和器62以重构用作参考帧的经编码块。模式选择单元40还将语法元素(例如,运动向量、帧内模式指示符、分割信息和其它这类语法信息)提供到熵编码单元56。
运动估计单元42及运动补偿单元44可高度集成,但出于概念目的分别加以说明。运动估计单元42执行的运动估计为产生运动向量的过程,所述过程估计视频块的运动。举例来说,运动向量可指示当前视频帧或图片内的视频块的PU相对于参考图片(或其它经译码单元)内的预测性块相对于当前图片(或其它经译码单元)内正被译码的当前块的位移。预测性块为被发现就像素差而言与待译码的块密切匹配的块,其可通过绝对差总和(SAD)、平方差总和(SSD)或其它差异度量来确定。在一些实例中,视频编码器20可计算存储在经解码图片缓冲器64中的参考图片的子整数像素位置的值。举例来说,视频编码器20可内插参考图片的四分之一像素位置、八分之一像素位置或其它分数像素位置的值。因此,运动估计单元42可相对于整数像素位置及分数像素位置执行运动搜索并且输出具有分数像素精度的运动向量。
运动估计单元42通过对帧间译码切片中的视频块的PU的位置与参考图片的预测性块的位置来计算PU的运动向量。参考图片可选自第一参考图片列表(列表0)或第二参考图片列表(列表1),所述列表中的每一者识别存储在经解码图片缓冲器64中的一或多个参考图片。运动估计单元42将计算出的运动向量发送到熵编码单元56及运动补偿单元44。
运动补偿单元44执行的运动补偿可涉及基于由运动估计单元42确定的运动向量来获取或产生预测性块。同样,在一些实例中,运动估计单元42与运动补偿单元44可在功能上集成。在接收到当前视频块的PU的运动向量后,运动补偿单元44可在参考图片列表中的一者中定位所述运动向量指向的预测性块。求和器50通过从正被译码的当前视频块的像素值减去预测性块的像素值从而形成像素差值来形成残余视频块,如下文所论述。一般来说,运动估计单元42相对于明度分量执行运动估计,且运动补偿单元44将基于明度分量计算出的运动向量用于色度分量和明度分量两者。模式选择单元40还可产生与视频块和视频切片相关联的语法元素以供视频解码器30在对视频切片的视频块进行解码时使用。
作为如上文所描述由运动估计单元42及运动补偿单元44执行的帧间预测的替代方案,帧内预测单元46可对当前块进行帧内预测。具体来说,帧内预测处理单元46可确定用来对当前块进行编码的帧内预测模式。在一些实例中,帧内预测处理单元46可(例如)在独立编码编次期间使用各种帧内预测模式对当前块进行编码,且帧内预测处理单元46(或在一些实例中,模式选择单元40)可从所测试模式中选择适当帧内预测模式来使用。
举例来说,帧内预测处理单元46可使用速率失真分析计算用于各种所测试的帧内预测模式的速率失真值,并从所述所测试的模式当中选择具有最优速率失真特征的帧内预测模式。速率失真分析一般确定经编码块与经编码以产生所述经编码块的原始未经编码块之间的失真(或误差)的量,以及用于产生经编码块的位速率(即,位数目)。帧内预测处理单元46可根据用于各种经编码块的失真及速率计算比率,以确定哪个帧内预测模式对于所述块展现最优速率失真值。
在选择用于块的帧内预测模式之后,帧内预测处理单元46可将指示块的所选帧内预测模式的信息提供到熵编码单元56。熵编码单元56可对指示所选帧内预测模式的信息进行编码。视频编码器20可在所发射的位流中包含配置数据,所述配置数据可包含多个帧内预测模式索引表和多个经修改的帧内预测模式索引表(也被称作码字映射表)、编码各种块的上下文的定义,以及用于所述上下文中的每一者的最可能帧内预测模式、帧内预测模式索引表和经修改帧内预测模式索引表的指示。
视频编码器20通过从正被译码的原始视频块减去来自模式选择单元40的预测数据而形成残余视频块。求和器50表示可执行这种减法运算的一或多个组件。变换处理单元52将例如离散余弦变换(DCT)或概念上类似变换的变换应用于残余块,从而产生包括残余变换系数值的视频块。变换处理单元52可执行概念上类似于DCT的其它变换。还可使用小波变换、整数变换、子带变换或其它类型的变换。在任何情况下,变换处理单元52对残余块应用所述变换,从而产生残余变换系数块。所述变换可将残余信息从像素值域转换到变换域,例如,频域。变换处理单元52可将所得变换系数发送到量化单元54。
量化单元54对变换系数进行量化以进一步减少位速率。量化过程可减小与系数中的一些或全部相关联的位深度。可通过调整量化参数来修改量化的程度。在一些实例中,量化单元54随后可执行对包含经量化变换系数的矩阵的扫描。或者,熵编码单元56可执行扫描。
在量化之后,熵编码单元56对经量化变换系数进行熵译码。举例来说,熵编码单元56可执行上下文自适应可变长度译码(CAVLC)、上下文自适应二进制算术译码(CABAC)、基于语法的上下文自适应二进制算术译码(SBAC)、概率区间分割熵(PIPE)译码或另一熵译码技术。在基于上下文的熵译码的情况下,上下文可基于相邻块。在由熵译码单元56进行熵译码之后,可将经编码位流发射到另一装置(例如,视频解码器30),或者将所述经编码位流存档以用于稍后发射或检索。
逆量化单元58及逆变换处理单元60分别应用逆量化及逆变换以在像素域中重构残余块,例如以供稍后用作参考块。运动补偿单元44可通过将残余块添加到经解码图片缓冲器64的帧中的一者的预测性块来计算参考块。运动补偿单元44还可将一或多个内插滤波器应用于经重构残余块以计算供用于运动估计的子整数像素值。求和器62将经重构残余块与由运动补偿单元44所产生的运动补偿预测块相加,以产生经重构视频块以供存储在经解码图片缓冲器64中。经重构视频块可由运动估计单元42和运动补偿单元44用作参考块以对后续视频帧中的块进行帧间译码。
图9为说明根据本发明的技术的视频解码器30的实例的框图。具体来说,视频解码器30可将视频数据解码到目标色彩容器中,所述目标色彩容器随后可由视频后处理器31处理,如上文所描述。在图8的实例中,视频解码器30包含熵解码单元70、视频数据存储器71、运动补偿单元72、帧内预测处理单元74、逆量化单元76、逆变换处理单元78、经解码图片缓冲器82和求和器80。在一些实例中,视频解码器30可执行一般与关于视频编码器20(图8)描述的编码遍次互逆的解码遍次。运动补偿单元72可基于从熵解码单元70接收的运动向量产生预测数据,而帧内预测单元74可基于从熵解码单元70接收的帧内预测模式指示符产生预测数据。
在图8的实例中,视频后处理器31可与视频解码器30集成于单个装置中。视频后处理器31可实施为各种适合编码器电路中的任一者,例如一或多个微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑、软件、硬件、固件或其任何组合。当部分以软件实施所述技术时,装置可将用于所述软件的指令存储于适合非暂时性计算机可读媒体中并使用一或多个处理器以硬件执行所述指令,从而执行本发明的技术。如上文所论述,在其它实例中,视频后处理器31可分别为与视频解码器30分离的装置。
视频数据存储器71可存储待由视频解码器30的组件解码的视频数据,例如经编码视频位流。举例来说,存储在视频数据存储器71中的视频数据可经由视频数据的有线或无线网络通信或通过存取实体数据存储媒体而从计算机可读媒体16,例如从本地视频源(例如相机)获得。视频数据存储器71可形成存储来自经编码视频位流的经编码视频数据的经译码图片缓冲器(CPB)。经解码图片缓冲器82可为存储供视频解码器30用于解码视频数据(例如以帧内或帧间译码模式)的参考视频数据的参考图片存储器。视频数据存储器71和经解码图片缓冲器82可由多种存储器装置中的任一者形成,例如动态随机存取存储器(DRAM),包含同步DRAM(SDRAM)、磁阻式RAM(MRAM)、电阻式RAM(RRAM)或其它类型的存储器装置。视频数据存储器71和经解码图片缓冲器82可由相同存储器装置或独立存储器装置提供。在各种实例中,视频数据存储器71可与视频解码器30的其它组件一起在芯片上,或相对于那些组件在芯片外。
在解码过程期间,视频解码器30从视频编码器20接收表示经编码视频切片的视频块的经编码视频位流和相关联的语法元素。视频解码器30的熵解码单元70对位流进行熵解码以产生经量化系数、运动向量或帧内预测模式指示符和其它语法元素。熵解码单元70将运动向量及其它语法元素转发到运动补偿单元72。视频解码器30可接收在视频切片层级及/或视频块层级处的语法元素。
当视频切片经译码为经帧内译码(I)切片时,帧内预测处理单元74可基于经传信帧内预测模式及来自当前帧或图片的先前经解码块的数据产生用于当前视频切片的视频块的预测数据。当视频帧经译码为经帧间译码(即,B或P)切片时,运动补偿单元72基于从熵解码单元70接收的运动向量和其它语法元素产生用于当前视频切片的视频块的预测性块。预测性块可从参考图片列表中的一者内的参考图片中的一者中产生。视频解码器30可基于存储在经解码图片缓冲器82中的参考图片,使用默认构建技术来构建参考图片列表:列表0和列表1。运动补偿单元72通过解析运动向量和其它语法元素来确定用于当前视频切片的视频块的预测信息,且使用所述预测信息来产生用于正被解码的当前视频块的预测性块。举例来说,运动补偿单元72使用一些所接收语法元素来确定用于对视频切片的视频块进行译码的预测模式(例如,帧内或帧间预测)、帧间预测切片类型(例如,B切片或P切片)、用于切片的参考图片列表中的一或多者的构建信息、用于切片的每一经帧间编码视频块的运动向量、用于切片的每一经帧间译码视频块的帧间预测状态和其它信息,以解码当前视频切片中的视频块。
运动补偿单元72也可基于内插滤波器执行内插。运动补偿单元72可使用如由视频编码器20在视频块的编码期间使用的内插滤波器来计算参考块的子整数像素的经内插值。在这种情况下,运动补偿单元72可根据所接收语法元素确定供视频编码器20使用的内插滤波器并使用所述内插滤波器产生预测性块。
逆量化单元76将在位流中提供且由熵解码单元70解码的经量化变换系数逆量化,即解量化。逆量化过程可包含使用由视频解码器30针对视频切片中的每一视频块计算以确定应应用的量化程度及同样的逆量化程度的量化参数QPY。逆变换处理单元78将逆变换,例如逆DCT、逆整数变换或概念类似的逆变换过程应用于变换系数,以便在像素域中产生残余块。
在运动补偿单元72基于运动向量及其它语法元素产生当前视频块的预测性块之后,视频解码器30通过将来自逆变换处理单元78的残余块与由运动补偿单元72产生的对应预测性块求和来形成经解码视频块。求和器80表示执行这种求和运算的一或多个组件。需要时,还可应用解块滤波器以对经解码块进行滤波以便去除成块效应假影。还可使用其它环路滤波器(在译码环路中或在译码环路之后)以使像素转变平滑或以其它方式改进视频质量。随后将给定帧或图片中的经解码视频块存储在经解码图片缓冲器82中,经解码图片缓冲器82存储用于后续运动补偿的参考图片。经解码图片缓冲器82还存储经解码视频以用于稍后呈现在显示装置(例如图1的吸收装置32)上。
根据本发明的一或多种技术,包含视频后处理器31的视频解码器30的组件可经配置以执行本文中所描述的技术中的任一者。举例来说,视频后处理器31可针对一或多个显示能力的第一集合确定一或多个重新映射参数的第一集合。视频后处理器31随后可在第一补充增强信息(SEI)消息中对一或多个显示能力的第一集合和一或多个重新映射参数的第一集合进行译码。视频后处理器31还可针对一或多个显示能力的第二集合确定用于视频数据的一或多个重新映射参数的第二集合,并在第二SEI消息中对一或多个显示能力的第二集合和一或多个重新映射参数的第二集合进行译码。视频后处理器31随后可在位流34中向吸收装置32发送第一SEI消息、第二SEI消息和视频数据。
在一些实例中,第一SEI消息和第二SEI消息可分别为CRI SEI消息。此外,第一和第二SEI消息中所指示的一或多个显示能力可包含一或多个色彩元、一或多个色域、处理域、峰值明度或传递函数。
图10为说明可实施本发明的技术的吸收装置32的实例的框图。在图10的实例中,吸收装置32可包含处理器33、显示装置36和视频接口38。在其它实例中,吸收装置32可包含更多组件(例如电源或视频存储器),或更少组件。
处理器33可实施为各种适合编码器电路中的任一者,例如一或多个微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑、软件、硬件、固件或其任何组合。当部分以软件实施所述技术时,装置可将用于所述软件的指令存储于适合非暂时性计算机可读媒体中并使用一或多个处理器以硬件执行所述指令,从而执行本发明的技术。如上文所论述,在其它实例中,处理器33可为与吸收装置32分离的装置。
显示装置36可包含能够向用户显示视频数据的任何结构。显示装置36的实例包含液晶显示器(LCD)、点阵式显示器(dot matrix display)、发光二极管(LED)显示器、有机发光二极管(OLED)显示器、电子墨水屏(e-ink)或能够向吸收装置32的用户输出可见信息的类似单色或彩色显示器。
吸收装置32的视频接口38可通过在一或多个网路上发射和/或接收网路信号而经由一或多个有线和/或无线网路与外部装置(例如,客户端装置14)通信。视频接口38的实例包含网络接口卡(例如,以太网卡)、光收发器、射频收发器、GPS接收器或任何其它类型的可发送和/或接收信息的装置。视频接口38的其它实例可包含短波无线电、蜂窝数据无线电、无线网络无线电以及通用串行总线(USB)控制器。
根据本本发明的一或多种技术,吸收装置32的组件(包含处理器33)可经配置以执行本文中所描述的技术中的任一者。举例来说,处理器33可在位流中接收视频数据和一组一或多个补充增强信息(SEI)消息。每一SEI消息可包含对一或多个显示能力的集合的指示和对一或多个重新映射参数的集合的指示。针对一组一或多个SEI消息中的每一SEI消息,处理器33可将相应SEI消息中所指示的一或多个显示能力的相应集合与用于吸收装置32的一或多个显示能力的目标集合进行比较,以确定一或多个显示能力的相应集合与一或多个显示能力的目标集合的兼容性。响应于确定由一组一或多个SEI消息中的第一SEI消息所指示的一或多个显示能力的第一集合与用于吸收装置的一或多个显示能力的目标集合兼容,处理器33可使用由第一SEI消息所指示的一或多个重新映射参数的相应集合调适视频数据。
在一组一或多个SEI消息包括仅单个SEI消息的实例中,处理器33可确定单个SEI消息中的一或多个显示能力的集合是否与一或多个显示能力的目标集合兼容。如果单个SEI消息中的一或多个显示能力的集合与一或多个显示能力的目标集合兼容,那么处理器33可使用所述单个SEI消息中的重新映射信息调适视频数据。反之,如果单个SEI消息中的一或多个显示能力的集合不与一或多个显示能力的目标集合兼容,那么处理器33可避免调适视频数据或调整重新映射信息,使得视频数据可根据目标显示参数来显示。
在一组一或多个SEI消息包括多个SEI消息的实例中,处理器33可分析相应SEI消息中的一或多个显示能力的每一集合并选择与一或多个显示能力的目标集合兼容的SEI消息。处理器33随后可使用由所选SEI消息所指示的一或多个重新映射参数的相应集合调适视频数据。
在一些实例中,一组一或多个SEI消息中的每一SEI消息包括用于将视频数据从第一色彩空间映射到第二色彩空间的色彩重新映射信息(CRI)SEI消息。此外,每一SEI消息中所指示的一或多个显示能力可包含一或多个色彩元、一或多个色域、处理域、峰值明度或传递函数。
在一些实例中,在调适视频数据时,处理器33可基于由第一SEI消息所指示的一或多个重新映射参数的相应集合执行显示调适。
在一些情况下,在确定由第一SEI消息所指示的一或多个显示能力的第一集合与用于吸收装置32的一或多个显示能力的目标集合兼容时,处理器33可基于一或多个显示能力的第一集合与一或多个显示能力的目标集合的类似性来确定一或多个显示能力的第一集合与一或多个显示能力的目标集合的兼容性。在其它情况下,处理器33可基于一或多个显示能力的第一集合与一或多个显示能力的目标集合的匹配来确定一或多个显示能力的第一集合与一或多个显示能力的目标集合的兼容性。
图11为说明根据本发明的技术的吸收装置的实例技术的流程图,所述吸收装置经配置以从源装置接收CRI SEI消息。图11的方法可由吸收装置32,且具体地说吸收装置32的处理器33执行。
举例来说,处理器33可在位流中接收视频数据(102)和一组一或多个补充增强信息(SEI)消息(104)。每一SEI消息可包含对一或多个显示能力的集合的指示和对一或多个重新映射参数的集合的指示。针对一组一或多个SEI消息中的每一SEI消息,处理器33可将相应SEI消息中所指示的一或多个显示能力的相应集合与用于吸收装置的一或多个显示能力的目标集合进行比较,以确定一或多个显示能力的相应集合与一或多个显示能力的目标集合的兼容性(106)。响应于确定由一组一或多个SEI消息中的第一SEI消息所指示的一或多个显示能力的第一集合与用于吸收装置的一或多个显示能力的目标集合兼容,处理器33可使用由第一SEI消息所指示的一或多个重新映射参数的相应集合调适视频数据(108)。
在一组一或多个SEI消息包括仅单个SEI消息的实例中,处理器33可确定单个SEI消息中的一或多个显示能力的集合是否与一或多个显示能力的目标集合兼容。如果单个SEI消息中的一或多个显示能力的集合与一或多个显示能力的目标集合兼容,那么处理器33可使用所述单个SEI消息中的重新映射信息调适视频数据。反之,如果单个SEI消息中的一或多个显示能力的集合不与一或多个显示能力的目标集合兼容,那么处理器33可避免调适视频数据或调整重新映射信息,使得视频数据可根据目标显示参数来显示。
在一组一或多个SEI消息包括多个SEI消息的实例中,处理器33可分析相应SEI消息中的一或多个显示能力的每一集合并选择与一或多个显示能力的目标集合兼容的SEI消息。处理器33随后可使用由所选SEI消息所指示的一或多个重新映射参数的相应集合调适视频数据。
在一些实例中,一组一或多个SEI消息中的每一SEI消息包括用于将视频数据从第一色彩空间映射到第二色彩空间的色彩重新映射信息(CRI)SEI消息。此外,每一SEI消息中所指示的一或多个显示能力可包含一或多个色彩元、一或多个色域、处理域、峰值明度或传递函数。
在一些实例中,在调适视频数据时,处理器33可基于由第一SEI消息所指示的一或多个重新映射参数的相应集合执行显示调适。
在一些情况下,在确定由第一SEI消息所指示的一或多个显示能力的第一集合与用于吸收装置32的一或多个显示能力的目标集合兼容时,处理器33可基于一或多个显示能力的第一集合与一或多个显示能力的目标集合的类似性来确定一或多个显示能力的第一集合与一或多个显示能力的目标集合的兼容性。在其它情况下,处理器33可基于一或多个显示能力的第一集合与一或多个显示能力的目标集合的匹配来确定一或多个显示能力的第一集合与一或多个显示能力的目标集合的兼容性。
图12为说明根据本发明的技术的源装置的实例技术的流程图,所述源装置经配置以向吸收装置发送CRI SEI消息。图12的方法可由客户端装置14,且具体地说客户端装置14的视频后处理器31执行。
根据本发明的一或多种技术,包含视频后处理器31的视频解码器30的组件可经配置以执行本文中所描述的技术中的任一者。举例来说,视频后处理器31可针对一或多个显示能力的第一集合确定一或多个重新映射参数的第一集合(112)。视频后处理器31随后可在第一补充增强信息(SEI)消息中对一或多个显示能力的第一集合和一或多个重新映射参数的第一集合进行译码(114)。视频后处理器31还可针对一或多个显示能力的第二集合确定用于视频数据的一或多个重新映射参数的第二集合(116),并在第二SEI消息中对一或多个显示能力的第二集合和一或多个重新映射参数的第二集合进行译码(118)。视频后处理器31随后可在位流34中向吸收装置32发送第一SEI消息、第二SEI消息和视频数据(120)。
在一些实例中,第一SEI消息和第二SEI消息可分别为用于将视频数据从第一色彩空间映射到第二色彩空间的CRI SEI消息。此外,第一和第二SEI消息中所指示的一或多个显示能力可包含一或多个色彩元、一或多个色域、处理域、峰值明度或传递函数。
应认识到,取决于实例,本文中所描述的技术中的任一者的某些动作或事件可用不同顺序来执行,可添加、合并或全部省略所述动作或事件(例如,实践所述技术未必需要所有所描述动作或事件)。此外,在某些实例中,可同时(例如,通过多线程处理、中断处理或多个处理器)而非顺序地执行动作或事件。
在一或多个实例中,所描述功能可用硬件、软件、固件或其任何组合实施。如果在软件中实施,那么所述功能可作为一或多个指令或代码存储在计算机可读媒体上或经由计算机可读媒体发射,并且由基于硬件的处理单元执行。计算机可读媒体可包含计算机可读存储媒体,其对应于例如数据存储媒体或通信媒体的有形媒体,通信媒体包含有助于例如根据通信协议将计算机程序从一处传送到另一处的任何媒体。以这种方式,计算机可读媒体一般可对应于(1)非暂时性的有形计算机可读存储媒体,或(2)通信媒体,如信号或载波。数据存储媒体可为可由一或多个计算机或者一或多个处理器存取以检索用于实施本发明中描述的技术的指令、代码和/或数据结构的任何可用媒体。计算机程序产品可包含计算机可读媒体。
借助于实例而非限制,这类计算机可读存储媒体可包含RAM、ROM、EEPROM、CD-ROM或其它光盘存储装置、磁盘存储装置或其它磁性存储装置、闪存存储器,或可用以存储呈指令或数据结构形式的所需程序代码且可由计算机存取的任何其它媒体。此外,适当地将任何连接称作计算机可读媒体。举例来说,如果使用同轴电缆、光纤电缆、双绞线、数字订户线(DSL)或例如红外线、无线电和微波的无线技术从网站、服务器或其它远程源发射指令,那么同轴电缆、光纤电缆、双绞线、DSL或例如红外线、无线电和微波的无线技术包含在媒体的定义中。然而,应理解,计算机可读存储媒体及数据存储媒体并不包含连接、载波、信号或其它暂时性媒体,而是实际上针对非暂时性的有形存储媒体。如本文中所使用,磁盘和光盘包含压缩光盘(CD)、激光光盘、光学光盘、数字多功能光盘(DVD)、软性磁盘及蓝光光盘,其中磁盘通常以磁性方式再现数据,而光盘用激光以光学方式再现数据。以上各者的组合也应包含于计算机可读媒体的范围内。
指令可由一或多个处理器执行,所述一或多个处理器例如一或多个数字信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、现场可编程逻辑阵列(FPGA)或其它等效的集成或离散逻辑电路。因此,如本文中所使用的术语“处理器”可指代上述结构或适合于实施本文中所描述的技术的任何其它结构中的任一者。另外,在一些方面中,本文中所描述的功能性可在经配置以用于编码和解码的专用硬件和/或软件模块内提供,或并入在组合编解码器中。此外,所述技术可完全实施于一或多个电路或逻辑元件中。
本发明的技术可实施于中广泛多种装置或设备中,包含无线手持机、集成电路(IC)或IC集合(例如,芯片组)。本发明中描述各种组件、模块或单元以强调经配置以执行所公开的技术的装置的功能方面,但未必需要由不同硬件单元实现。确切地说,如上文所描述,各种单元可结合适合软件和/或固件组合在编解码器硬件单元中,或由互操作硬件单元的集合来提供,所述硬件单元包含如上文所描述的一或多个处理器。
已描述了本发明的各种实例。涵盖所描述的系统、操作或功能的任何组合。所述及其它实例属于所附权利要求书的范围内。

Claims (30)

1.一种通过吸收装置处理视频数据的方法,所述方法包括:
在位流中接收所述视频数据;
在所述位流中接收一组一或多个补充增强信息SEI消息,其中每一SEI消息包括对一或多个显示能力的集合的指示和对一或多个重新映射参数的集合的指示;
针对所述一组一或多个SEI消息中的每一SEI消息,将所述相应SEI消息中所指示的一或多个显示能力的所述相应集合与用于所述吸收装置的一或多个显示能力的目标集合进行比较,以确定一或多个显示能力的所述相应集合与一或多个显示能力的所述目标集合的兼容性;和
响应于确定由所述一组一或多个SEI消息中的第一SEI消息所指示的一或多个显示能力的第一集合与用于所述吸收装置的一或多个显示能力的所述目标集合兼容,使用由所述第一SEI消息所指示的一或多个重新映射参数的相应集合调适所述视频数据。
2.根据权利要求1所述的方法,其中所述一组一或多个SEI消息中的每一SEI消息包括用于将所述视频数据从第一色彩空间映射到第二色彩空间的色彩重新映射信息CRI SEI消息。
3.根据权利要求1所述的方法,其中使用由所述第一SEI消息所指示的一或多个重新映射参数的所述相应集合调适所述视频数据包括:
基于由所述第一SEI消息所指示的一或多个重新映射参数的所述相应集合执行显示调适。
4.根据权利要求1所述的方法,其中由所述第一SEI消息所指示的一或多个显示能力的所述第一集合包括以下中的一或多者:
一或多个色彩元,
一或多个色域,
处理域,
峰值明度,或
传递函数。
5.根据权利要求1所述的方法,其中确定由所述第一SEI消息所指示的一或多个显示能力的所述第一集合与用于所述吸收装置的一或多个显示能力的所述目标集合兼容包括:
基于一或多个显示能力的所述第一集合与一或多个显示能力的所述目标集合的类似性确定一或多个显示能力的所述第一集合与一或多个显示能力的所述目标集合的所述兼容性。
6.根据权利要求1所述的方法,其中确定由所述第一SEI消息所指示的一或多个显示能力的所述第一集合与用于所述吸收装置的一或多个显示能力的所述目标集合兼容包括:
基于一或多个显示能力的所述第一集合与一或多个显示能力的所述目标集合的匹配确定一或多个显示能力的所述第一集合与一或多个显示能力的所述目标集合的所述兼容性。
7.根据权利要求1所述的方法,其进一步包括:
在无线通信装置的接收器处接收所述视频数据;
将所述视频数据存储在所述无线通信装置的存储器中;和
在所述无线通信装置的一或多个处理器上处理所述视频数据。
8.根据权利要求7所述的方法,其中所述无线通信装置包括电话手持机,且其中在所述无线通信装置的所述接收器处接收所述视频数据包括根据无线通信标准解调包括所述视频数据的信号。
9.根据权利要求1所述的方法,其中所述一组一或多个SEI消息包括一组两个SEI消息。
10.根据权利要求1所述的方法,其中一或多个显示能力的所述第一集合以ColorRemapId语法元素中的一或多个码字的形式传信,且其中由所述第一SEI消息所指示的一或多个重新映射参数的所述相应集合在color_remap_id语法元素中传信。
11.一种用于处理视频数据的吸收装置,所述吸收装置包括:
用于存储视频数据的存储器;和
一或多个处理器,其经配置以:
在位流中接收所述视频数据;
在所述位流中接收一组一或多个补充增强信息SEI消息,其中每一SEI消息包括对一或多个显示能力的集合的指示和对一或多个重新映射参数的集合的指示;
针对所述一组一或多个SEI消息中的每一SEI消息,将所述相应SEI消息中所指示的一或多个显示能力的所述相应集合与用于所述吸收装置的一或多个显示能力的目标集合进行比较,以确定一或多个显示能力的所述相应集合与一或多个显示能力的所述目标集合的兼容性;和
响应于确定由所述一组一或多个SEI消息中的第一SEI消息所指示的一或多个显示能力的第一集合与用于所述吸收装置的一或多个显示能力的所述目标集合兼容,使用由所述第一SEI消息所指示的一或多个重新映射参数的相应集合调适所述视频数据。
12.根据权利要求11所述的吸收装置,其中所述一组一或多个SEI消息中的每一SEI消息包括用于将所述视频数据从第一色彩空间映射到第二色彩空间的色彩重新映射信息CRISEI消息。
13.根据权利要求11所述的吸收装置,其中经配置以使用由所述第一SEI消息所指示的一或多个重新映射参数的所述相应集合调适所述视频数据的所述一或多个处理器包括经配置以进行以下操作的所述一或多个处理器:
基于由所述第一SEI消息所指示的一或多个重新映射参数的所述相应集合执行显示调适。
14.根据权利要求11所述的吸收装置,其中由所述第一SEI消息所指示的一或多个显示能力的所述第一集合包括以下中的一或多者:
一或多个色彩元,
一或多个色域,
处理域,
峰值明度,或
传递函数。
15.根据权利要求11所述的吸收装置,其中经配置以确定由所述第一SEI消息所指示的一或多个显示能力的所述第一集合与用于所述吸收装置的一或多个显示能力的所述目标集合兼容的所述一或多个处理器包括经配置以进行以下操作的所述一或多个处理器:
基于一或多个显示能力的所述第一集合与一或多个显示能力的所述目标集合的类似性确定一或多个显示能力的所述第一集合与一或多个显示能力的所述目标集合的所述兼容性。
16.根据权利要求11所述的吸收装置,其中经配置以确定由所述第一SEI消息所指示的一或多个显示能力的所述第一集合与用于所述吸收装置的一或多个显示能力的所述目标集合兼容的所述一或多个处理器包括经配置以进行以下操作的所述一或多个处理器:
基于一或多个显示能力的所述第一集合与一或多个显示能力的所述目标集合的匹配确定一或多个显示能力的所述第一集合与一或多个显示能力的所述目标集合的所述兼容性。
17.根据权利要求11所述的吸收装置,其中所述吸收装置包括无线通信装置,其进一步包括经配置以接收经编码视频数据的接收器。
18.根据权利要求17所述的吸收装置,其中所述无线通信装置包括电话手持机,且其中所述接收器经配置以根据无线通信标准来解调包括所述经编码视频数据的信号。
19.根据权利要求11所述的吸收装置,其中所述一组一或多个SEI消息包括一组两个SEI消息。
20.一种非暂时性计算机可读存储媒体,其存储有在由吸收装置的一或多个处理器执行时使得所述一或多个处理器进行以下操作的指令:
在位流中接收视频数据;
在所述位流中接收一组一或多个补充增强信息SEI消息,其中每一SEI消息包括对一或多个显示能力的集合的指示和对一或多个重新映射参数的集合的指示;
针对所述一组一或多个SEI消息中的每一SEI消息,将所述相应SEI消息中所指示的一或多个显示能力的所述相应集合与用于所述吸收装置的一或多个显示能力的目标集合进行比较,以确定一或多个显示能力的所述相应集合与一或多个显示能力的所述目标集合的兼容性;和
响应于确定由所述一组一或多个SEI消息中的第一SEI消息所指示的一或多个显示能力的第一集合与用于所述吸收装置的一或多个显示能力的所述目标集合兼容,使用由所述第一SEI消息所指示的一或多个重新映射参数的相应集合调适所述视频数据。
21.根据权利要求20所述的非暂时性计算机可读存储媒体,其中所述一组一或多个SEI消息中的每一SEI消息包括用于将所述视频数据从第一色彩空间映射到第二色彩空间的色彩重新映射信息CRI SEI消息。
22.根据权利要求20所述的非暂时性计算机可读存储媒体,其中使得所述一或多个处理器使用由所述第一SEI消息所指示的一或多个重新映射参数的所述相应集合解码所述视频数据的所述指令包括在执行时使得所述一或多个处理器进行以下操作的指令:
基于由所述第一SEI消息所指示的一或多个重新映射参数的所述相应集合执行显示调适。
23.根据权利要求20所述的非暂时性计算机可读存储媒体,其中由所述第一SEI消息所指示的一或多个显示能力的所述第一集合包括以下中的一或多者:
一或多个色彩元,
一或多个色域,
处理域,
峰值明度,或
传递函数。
24.根据权利要求20所述的非暂时性计算机可读存储媒体,其中使得所述一或多个处理器确定由所述第一SEI消息所指示的一或多个显示能力的所述第一集合与用于所述吸收装置的一或多个显示能力的所述目标集合兼容的所述指令包括在执行时使得所述一或多个处理器进行以下操作的指令:
基于一或多个显示能力的所述第一集合与一或多个显示能力的所述目标集合的类似性确定一或多个显示能力的所述第一集合与一或多个显示能力的所述目标集合的所述兼容性。
25.根据权利要求20所述的非暂时性计算机可读存储媒体,其中使得所述一或多个处理器确定由所述第一SEI消息所指示的一或多个显示能力的所述第一集合与用于所述吸收装置的一或多个显示能力的所述目标集合兼容的所述指令包括在执行时使得所述一或多个处理器进行以下操作的指令:
基于一或多个显示能力的所述第一集合与一或多个显示能力的所述目标集合的匹配确定一或多个显示能力的所述第一集合与一或多个显示能力的所述目标集合的所述兼容性。
26.根据权利要求20所述的非暂时性计算机可读存储媒体,其中所述一组一或多个SEI消息包括一组两个SEI消息。
27.一种通过源装置处理视频数据的方法,所述方法包括:
针对一或多个显示能力的第一集合确定用于所述视频数据的一或多个重新映射参数的第一集合;
在第一补充增强信息SEI消息中对一或多个显示能力的所述第一集合和一或多个重新映射参数的所述第一集合进行译码;和
在位流中向吸收装置发送所述第一SEI消息和所述视频数据。
28.根据权利要求27所述的方法,其中第一SEI消息和所述第二SEI消息各自包括用于将所述视频数据从第一色彩空间映射到第二色彩空间的色彩重新映射信息CRISEI消息。
29.根据权利要求27所述的方法,其中由所述第一SEI消息所指示的一或多个显示能力的所述第一集合包括以下中的一或多者:
一或多个色彩元,
一或多个色域,
处理域,
峰值明度,或
传递函数。
30.根据权利要求27所述的方法,其进一步包括:
针对一或多个显示能力的第二集合确定用于所述视频数据的一或多个重新映射参数的第二集合;
在第二SEI消息中对一或多个显示能力的所述第二集合和一或多个重新映射参数的所述第二集合进行译码;和
在所述位流中向所述吸收装置发送所述第二SEI消息与所述第一SEI消息以及所述视频数据。
CN201780053813.9A 2016-09-02 2017-09-01 在补充增强信息消息中传信色彩重新映射信息的目标显示参数 Pending CN109691111A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201662383356P 2016-09-02 2016-09-02
US62/383,356 2016-09-02
US15/693,146 US10334277B2 (en) 2016-09-02 2017-08-31 Signaling target display parameters of color remapping information supplemental enhancement information messages
US15/693,146 2017-08-31
PCT/US2017/049929 WO2018045328A1 (en) 2016-09-02 2017-09-01 Signaling target display parameters of color remapping information in supplemental enhancement information messages

Publications (1)

Publication Number Publication Date
CN109691111A true CN109691111A (zh) 2019-04-26

Family

ID=61281115

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780053813.9A Pending CN109691111A (zh) 2016-09-02 2017-09-01 在补充增强信息消息中传信色彩重新映射信息的目标显示参数

Country Status (4)

Country Link
US (1) US10334277B2 (zh)
EP (1) EP3476127A1 (zh)
CN (1) CN109691111A (zh)
WO (1) WO2018045328A1 (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102459734B1 (ko) * 2017-08-30 2022-10-28 삼성전자 주식회사 영상처리장치 및 그 제어방법
US10609424B2 (en) * 2018-03-09 2020-03-31 Dolby Laboratories Licensing Corporation Single-layer progressive coding for supporting multi-capability HDR composition
US10652512B1 (en) * 2018-11-20 2020-05-12 Qualcomm Incorporated Enhancement of high dynamic range content
KR20200095651A (ko) * 2019-02-01 2020-08-11 삼성전자주식회사 고 동적 범위 콘텐트를 재생하는 전자 장치 및 그 방법
CN111161683B (zh) * 2020-01-03 2021-05-18 京东方科技集团股份有限公司 图像处理方法、图像处理器和显示装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102044130B1 (ko) * 2007-04-12 2019-11-12 돌비 인터네셔널 에이비 비디오 인코딩 및 디코딩의 타일링
JP6214235B2 (ja) * 2012-07-02 2017-10-18 キヤノン株式会社 ファイル生成方法、ファイル生成装置、及びプログラム
US9749627B2 (en) * 2013-04-08 2017-08-29 Microsoft Technology Licensing, Llc Control data for motion-constrained tile set
US9264683B2 (en) * 2013-09-03 2016-02-16 Sony Corporation Decoding device and decoding method, encoding device, and encoding method
JP6202330B2 (ja) * 2013-10-15 2017-09-27 ソニー株式会社 復号装置および復号方法、並びに符号化装置および符号化方法
US10129558B2 (en) * 2015-09-21 2018-11-13 Qualcomm Incorporated Supplement enhancement information (SEI) messages for high dynamic range and wide color gamut video coding

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
A. K. RAMASUBRAMONIAN等: "Clarifications on the semantics of CRI SEI message and its usage for HDR/WCG video compression (JCTVC-V0064)", 《JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11 22ND MEETING: GENEVA, CH, 15–21 OCT. 2015》 *
D. RUSANOVSKYY等: "Usage of CRI for guided mapping (dynamic range adaptation) (JCTVC-X0060)", 《JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11 24TH MEETING: GENEVA, CH, 26 MAY – 1 JUNE 2016》 *
RAJAN JOSHI等: "ISO/IEC DIS 23008-2(3rd edition)", 《JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11 21ST MEETING: WARSAW, PL, 19 JUNE – 26 JUNE 2015》 *
RAYMOND YEUNG等: "Indication of SMPTE 2094-10 metadata in HEVC (JCTVC-X0042)", 《JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11 24TH MEETING: GENEVA, CH, 26 MAY – 1 JUNE 2016》 *

Also Published As

Publication number Publication date
EP3476127A1 (en) 2019-05-01
WO2018045328A1 (en) 2018-03-08
US10334277B2 (en) 2019-06-25
US20180070107A1 (en) 2018-03-08

Similar Documents

Publication Publication Date Title
CN107950028B (zh) 用于处理视频数据的方法和设备
CN109643531B (zh) 用于具有反馈信道的色域自适应的方法和装置
US10200701B2 (en) HDR and WCG coding architecture with SDR backwards compatibility in a single bitstream for video coding
CN107736024B (zh) 用于视频处理的方法和设备
CN109155848A (zh) 用于高动态范围及宽色域视频译码的环路内样本处理
CN107439013A (zh) 用于高动态范围和宽色域视频译码的动态范围调整
CN108028944A (zh) 使用核心视频标准的高动态范围hdr视频译码的视频解码器符合性
CN109983772A (zh) 用于发信号给及约束具有动态元数据的高动态范围(hdr)视频系统的系统及方法
EP3459255A1 (en) Methods and systems for generating and processing content color volume messages for video
CN109691111A (zh) 在补充增强信息消息中传信色彩重新映射信息的目标显示参数
CN108028936A (zh) 视频译码中成分的范围调整的固定点实施
CN109479150B (zh) 用于显示器调适的色彩重映射信息sei消息发信号
CN106233729B (zh) 解码视频数据的方法、装置及编码视频数据的方法、装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20190426