CN105659603B - 编码及解码视频数据的方法、装置及计算机可读存储媒体 - Google Patents

编码及解码视频数据的方法、装置及计算机可读存储媒体 Download PDF

Info

Publication number
CN105659603B
CN105659603B CN201480054053.XA CN201480054053A CN105659603B CN 105659603 B CN105659603 B CN 105659603B CN 201480054053 A CN201480054053 A CN 201480054053A CN 105659603 B CN105659603 B CN 105659603B
Authority
CN
China
Prior art keywords
value
parameter
bit depth
offset
signaled
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201480054053.XA
Other languages
English (en)
Other versions
CN105659603A (zh
Inventor
濮伟
陈建乐
马尔塔·卡切维奇
金佑植
霍埃尔·索赖·罗哈斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of CN105659603A publication Critical patent/CN105659603A/zh
Application granted granted Critical
Publication of CN105659603B publication Critical patent/CN105659603B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

在一个实例中,一种用于译码视频数据的装置包含:存储器,其经配置以存储视频数据;及视频译码器,其经配置以译码表示是否针对所述视频数据启用高位深度的语法元素的值,且在所述语法元素的所述值指示启用所述高位深度时:译码表示所述视频数据的一或多个参数的所述高位深度的语法元素的值;译码所述参数的值以使得所述参数的所述值表示基于表示所述高位深度的所述语法元素的所述值的位深度;及至少部分基于所述参数的所述值而译码所述视频数据。

Description

编码及解码视频数据的方法、装置及计算机可读存储媒体
本申请案主张2013年10月3日申请的美国临时申请案第61/886,230号及2013年10月17日申请的美国临时申请案第61/892,198号的权益,所述申请案中的每一者的全部内容以引用的方式并入本文中。
技术领域
本发明涉及视频译码。
背景技术
数字视频能力可并入到广泛范围的装置中,包含数字电视、数字直播系统、无线广播系统、个人数字助理(PDA)、膝上型或桌上型计算机、平板计算机、电子图书阅读器、数码相机、数字记录装置、数字媒体播放器、视频游戏装置、视频游戏控制台、蜂窝式或卫星无线电电话、所谓的“智能电话”、视频电话会议装置、视频流式传输装置及其类似者。数字视频装置实施视频译码技术,例如由MPEG-2、MPEG-4、ITU-T H.263或ITU-T H.264/MPEG-4第10部分高级视频译码(AVC)所界定的标准、目前正在开发的高效率视频译码(HEVC)标准及这些标准的扩展中所描述的视频译码技术。视频装置可通过实施此类视频译码技术而更有效率地传输、接收、编码、解码及/或存储数字视频信息。
视频译码技术包含空间(图片内)预测及/或时间(图片间)预测以减少或移除视频序列中固有的冗余。对于基于块的视频译码来说,视频切片(即,视频帧或视频帧的一部分)可以分割成视频块,视频块还可被称作树块、译码单元(CU)及/或译码节点。使用相对于同一图片中的相邻块中的参考样本的空间预测对图片的经帧内译码(I)切片中的视频块进行编码。图片的经帧间编码(P或B)切片中的视频块可使用相对于同一图片中的相邻块中的参考样本的空间预测或相对于其它参考图片中的参考样本的时间预测。图片可被称为帧,且参考图片可被称为参考帧。
空间或时间预测导致对块的预测块进行译码。残差数据表示待译码的原始块与预测块之间的像素差。经帧间译码块是根据指向形成预测块的参考样本块的运动向量及指示经译码块与预测块之间的差的残差数据编码的。经帧内译码块是根据帧内译码模式及残差数据来编码。为了实现进一步压缩,可以将残差数据从像素域变换到变换域,从而产生残差变换系数,接着可以对残差变换系数进行量化。可扫描最初布置为二维阵列的经量化变换系数,以便产生变换系数的一维向量,且可应用熵译码以实现更多压缩。
发明内容
一般来说,本发明描述用于高精度显式经加权预测的技术。这些技术可以用于高效率视频译码(HEVC)的范围扩展,或对其它视频译码标准的扩展。
在一个实例中,一种解码视频数据的方法包含解码表示是否针对视频数据启用高位深度的语法元素的值,在所述语法元素的所述值指示启用所述高位深度时:解码表示所述视频数据的一或多个参数的所述高位深度的语法元素的值;解码所述参数的值以使得所述参数的所述值具有基于表示所述高位深度的所述语法元素的所述值的位深度;及至少部分基于所述参数的所述值而解码所述视频数据。
在另一实例中,一种编码视频数据的方法包含确定针对视频数据启用高位深度,在确定启用所述高位深度之后:编码指示启用所述高位深度的语法元素的值;编码表示所述视频数据的一或多个参数的所述高位深度的语法元素的值;编码所述参数的值以使得所述参数的所述值具有基于所述高位深度的位深度;及至少部分基于所述参数的所述值而编码所述视频数据。
在另一实例中,一种用于译码视频数据的装置包含:存储器,其经配置以存储视频数据;及视频译码器,其经配置以:译码表示是否针对所述视频数据启用高位深度的语法元素的值,且在所述语法元素的所述值指示启用所述高位深度时:译码表示所述视频数据的一或多个参数的所述高位深度的语法元素的值;译码所述参数的值以使得所述参数的所述值具有基于表示所述高位深度的所述语法元素的所述值的位深度;及至少部分基于所述参数的所述值而译码所述视频数据。
在另一实例中,一种用于译码视频数据的装置包含:用于译码表示是否针对所述视频数据启用高位深度的语法元素的值的装置,用于在所述语法元素的所述值指示启用所述高位深度时译码表示所述视频数据的一或多个参数的所述高位深度的语法元素的值的装置;用于在所述语法元素的所述值指示启用所述高位深度时译码所述参数的值以使得所述参数的所述值具有基于表示所述高位深度的所述语法元素的所述值的位深度的装置;及用于在所述语法元素的所述值指示启用所述高位深度时至少部分基于所述参数的所述值而译码所述视频数据的装置。
在另一实例中,一种计算机可读存储媒体(例如,非暂时性计算机可读存储媒体)在上面存储有指令,所述指令在被执行时致使处理器:译码表示是否针对所述视频数据启用高位深度的语法元素的值,在所述语法元素的所述值指示启用所述高位深度时:译码表示所述视频数据的一或多个参数的所述高位深度的语法元素的值;译码所述参数的值以使得所述参数的所述值具有基于表示所述高位深度的所述语法元素的所述值的位深度;及至少部分基于所述参数的所述值而译码所述视频数据。
附图及以下描述中陈述一或多个实例的细节。其它特征、目标和优点将从所述描述和图式以及权利要求书而显而易见。
附图说明
图1是说明可利用用于高精度显式经加权预测的技术的实例视频编码和解码系统的框图。
图2是说明可实施用于高精度显式经加权预测的技术的视频编码器的实例的框图。
图3是说明可实施用于高精度显式经加权预测的技术的视频解码器的实例的框图。
图4是说明根据本发明的技术的用于编码当前块的实例方法的流程图。
图5是说明根据本发明的技术用于解码当前视频数据块的实例方法的流程图。
具体实施方式
一般来说,本发明的技术涉及高精度显式经加权预测。例如,这些技术可用于高效率视频译码(HEVC)范围扩展中。在ITU-T H.265(系列H:视听及多媒体系统(SERIES H:AUDIOVISUAL AND MULTIMEDIA SYSTEMS),移动视频的视听服务译码的基础结构,“高效率视频译码(High Efficiency Video Coding)”,2013年4月(下文称为“H.265”))中描述了HEVC。已经提出HEVC的各种扩展。一个此类扩展是在以下文献中描述的HEVC范围扩展:高效率视频译码(HEVC)范围扩展文本规范:草案4(High Efficiency Video Coding(HEVC)Range Extensions text specification:Draft 4),“JCTVC-N1005_v3”,2013年8月(下文称为“JCTVC N1005”)。
H.265指定主要规格版本I,其描述8位及10位编解码器。与H.265中的显式经加权预测相关的参数受限于8位编解码器。然而,如针对HEVC范围扩展所提出的,输入视频可高达16位,其使得8位显式经加权预测参数不够用。本发明描述可用于使显式经加权预测参数的位深度匹配于输入视频的位深度的增强的显式经加权预测技术。
JCTVC-N1005的部分7.3.6.3指定如下表1中所展示的经加权预测参数的语法。可在切片标头中发信号通知在表1中形成预测权重表(pred_weight_table)的部分的经加权预测参数。
表1
在部分7.4.7.3中,JCTVC-N1005如下界定表1的语法元素的语义:
luma_log2_weight_denom是所有明度加权因子的分母的以2为底的对数。luma_log2_weight_denom的值将在0到7的范围内(包括0和7)。
delta_chroma_log2_weight_denom是所有色度加权因子的分母的以2为底的对数的差。
将变量ChromaLog2WeightDenom导出为等于luma_log2_weight_denom+delta_chroma_log2_weight_denom,且值将在0到7的范围内(包括0和7)。
luma_weight_l0_flag[i]等于1指定使用RefPicList0[i]的列表0预测的明度分量的加权因子是存在的。luma_weight_l0_flag[i]等于0指定这些加权因子不存在。
chroma_weight_l0_flag[i]等于1指定使用RefPicList0[i]的列表0预测的色度预测值的加权因子是存在的。chroma_weight_l0_flag[i]等于0指定这些加权因子不存在。在chroma_weight_l0_flag[i]不存在时,推断其等于0。
delta_luma_weight_l0[i]是应用到使用RefPicList0[i]的列表0预测的明度预测值的加权因子的差。
将变量LumaWeightL0[i]导出为等于(1<<luma_log2_weight_denom)+delta_luma_weight_l0[i]。在luma_weight_l0_flag[i]等于1时,delta_luma_weight_l0[i]的所述值将在-128到127的范围内(包括-128和127)。在luma_weight_l0_flag[i]等于0时,推断LumaWeightL0[i]等于2luma_log2_weight_denom
luma_offset_l0[i]是应用到使用RefPicList0[i]的列表0预测的明度预测值的相加性偏移。luma_offset_l0[i]的值将在-128到127的范围内(包括-128和127)。在luma_weight_l0_flag[i]等于0时,推断luma_offset_l0[i]等于0。
delta_chroma_weight_l0[i][j]是应用到使用RefPicList0[i]的列表0预测的色度预测值的加权因子的差,其中j对于Cb等于0且j对于Cr等于1。
将变量ChromaWeightL0[i][j]导出为等于(1<<ChromaLog2WeightDenom)+delta_chroma_weight_l0[i][j]。在chroma_weight_l0_flag[i]等于1时,delta_chroma_weight_l0[i][j]的值将在-128到127的范围内(包括-128和127)。在chroma_weight_l0_flag[i]等于0时,推断ChromaWeightL0[i][j]等于2ChromaLog2WeightDenom
delta_chroma_offset_l0[i][j]是应用到使用RefPicList0[i]的列表0预测的色度预测值的相加性偏移的差,其中j对于Cb等于0且j对于Cr等于1。
如下导出变量ChromaOffsetL0[i][j]:
ChromaOffsetL0[i][j]=Clip3(-128,127,(delta_chroma_offset_l0[i][j]-((128*ChromaWeightL0[i][j])>>ChromaLog2WeightDenom)+128))(7-50)
delta_chroma_offset_l0[i][j]的值将在-512到511的范围内(包括-512和511)。在chroma_weight_l0_flag[i]等于0时,推断ChromaOffsetL0[i][j]等于0。
luma_weight_l1_flag[i]、chroma_weight_l1_flag[i]、delta_luma_weight_l1[i]、luma_offset_l1[i]、delta_chroma_weight_l1[i][j]及delta_chroma_offset_l1[i][j]分别具有与luma_weight_l0_flag[i]、chroma_weight_l0_flag[i]、delta_luma_weight_l0[i]、luma_offset_l0[i]、delta_chroma_weight_l0[i][j]及delta_chroma_offset_l0[i][j]相同的语义,其中l0、L0、列表0及List0分别被l1、L1、列表1及List1取代。
将变量sumWeightL0Flags导出为等于luma_weight_l0_flag[i]+2*chroma_weight_l0_flag[i]的和,其中i=0..num_ref_idx_l0_active_minus1。
在slice_type等于B时,将变量sumWeightL1Flags导出为等于luma_weight_l1_flag[i]+2*chroma_weight_l1_flag[i]的和,其中i=0..num_ref_idx_l1_active_minus1。
对于位流符合性,JCTVC-N1005需要在slice_type等于P时,sumWeightL0Flags将小于或等于24,且在slice_type等于B时,sumWeightL0Flags及sumWeightL1Flags的和将小于或等于24。
JCTVC-N1005的部分8.5.3.3.4.3将显式经加权样本预测过程指定为:
对此过程的输入是:
-指定明度预测块的宽度及高度的两个变量nPbW及nPbH,
-两个(nPbW)×(nPbH)阵列predSamplesL0及predSamplesL1,
-预测列表利用旗标predFlagL0及predFlagL1,
-参考索引refIdxL0及refIdxL1,
-指定色彩分量索引的变量cIdx,
-样本的位深度bitDepth。
此过程的输出是预测样本值的(nPbW)×(nPbH)阵列predSamples。
变量shift1设定成等于Max(2,14-bitDepth)。
如下导出变量log2Wd、o0、o1及w0、w1:
-如果cIdx对于明度样本等于0,那么以下适用:
log2Wd=luma_log2_weight_denom+shift1 (8-243)
w0=LumaWeightL0[refIdxL0] (8-244)
w1=LumaWeightL1[refIdxL1] (8-245)
o0=luma_offset_l0[refIdxL0]*(1<<(bitDepth-8)) (8-246)
o1=luma_offset_l1[refIdxL1]*(1<<(bitDepth-8)) (8-247)
-否则(cIdx对于色度样本不等于0),以下适用:
log2Wd=ChromaLog2WeightDenom+shift1 (8-248)
w0=ChromaWeightL0[refIdxL0][cIdx-1] (8-249)
w1=ChromaWeightL1[refIdxL1][cIdx-1] (8-250)
o0=ChromaOffsetL0[refIdxL0][cIdx-1]*(1<<(bitDepth-8)) (8-251)
o1=ChromaOffsetL1[refIdxL1][cIdx-1]*(1<<(bitDepth-8)) (8-252)
如下导出具有x=0..nPbW-1及y=0..nPbH-1的预测样本predSamples[x][y]:
-如果predFlagL0等于1且predFlagL1等于0,那么如下导出预测样本值:
if(log2Wd>=1)
predSamples[x][y]=Clip3(0,(1<<bitDepth)-1,
((predSamplesL0[x][y]*w0+2log2Wd-1)>>log2Wd)+o0)(8-253)
else
predSamples[x][y]=Clip3(0,(1<<bitDepth)-1,predSamplesL0[x][y]*w0+o0)
-否则,如果predFlagL0等于0且predFlagL1等于1,那么如下导出预测样本值:
if(log2Wd>=1)
predSamples[x][y]=Clip3(0,(1<<bitDepth)-1,
((predSamplesL1[x][y]*w1+2log2Wd-1)>>log2Wd)+o1)(8-254)
else
predSamples[x][y]=Clip3(0,(1<<bitDepth)-1,predSamplesL1[x][y]*w1+o1)
-否则(predFlagL0等于1且predFlagL1等于1),如下导出预测样本值:
predSamples[x][y]=Clip3(0,(1<<bitDepth)-1,
(predSamplesL0[x][y]*w0+predSamplesL1[x][y]*w1+
((o0+o1+1)<<log2Wd))>>(log2Wd+1)) (8-255)
本发明描述可提高JCTVC-N1005的显式经加权预测的技术。举例来说,可实施本发明的技术以用于高精度显式经加权预测。高精度显式经加权预测可提高高位深度输入视频的译码效率。根据这些技术,视频译码器(例如,视频编码器或视频解码器)可自适应地根据输入数据的位深度而应用右移以保证使用16位乘法没有溢出。此外,本发明的技术可包含发信号通知指示是否使用高精度显式经加权预测的语法元素(例如旗标)的值。
图1为说明可利用用于高精度显式经加权预测的技术的实例视频编码及解码系统10的框图。如图1中所示,系统10包含源装置12,所述源装置12提供经编码视频数据以在稍后时间由目的地装置14解码。具体来说,源装置12经由计算机可读媒体16将视频数据提供给目的地装置14。源装置12及目的地装置14可包括广泛范围的装置中的任一者,包含桌上型计算机、笔记型(即,膝上型)计算机、平板计算机、机顶盒、例如所谓的“智能”电话等电话手持机、平板计算机、电视、相机、显示装置、数字媒体播放器、视频游戏控制台、视频流式传输装置或其类似者。在一些情况下,源装置12和目的地装置14可能经装备以用于无线通信。
目的地装置14可经由计算机可读媒体16接收待解码的经编码视频数据。计算机可读媒体16可包括能够将经编码视频数据从源装置12移动到目的地装置14的任何类型的媒体或装置。在一个实例中,计算机可读媒体16可包括使得源装置12能够实时将经编码视频数据直接传输到目的地装置14的通信媒体。经编码视频数据可根据通信标准(例如,无线通信协议)来调制,且被传输到目的地装置14。通信媒体可包括任何无线或有线通信媒体,例如射频(RF)频谱或一或多个物理传输线路。通信媒体可形成基于包的网络(例如,局域网、广域网或全球网络,例如因特网)的部分。通信媒体可包含路由器、交换器、基站或可用于促进从源装置12到目的地装置14的通信的任何其它装备。
在一些实例中,经编码数据可以从输出接口22输出到存储装置。类似地,可以通过输入接口从存储装置存取经编码数据。存储装置可包含多种分布式或本地存取的数据存储媒体中的任一者,例如硬盘驱动器、蓝光光盘、DVD、CD-ROM、快闪存储器、易失性或非易失性存储器或任何其它用于存储经编码视频数据的合适的数字存储媒体。在另一实例中,存储装置可以对应于文件服务器或可存储由源装置12产生的经编码视频的另一中间存储装置。目的地装置14可经由流式传输或下载从存储装置存取经存储的视频数据。文件服务器可以是能够存储经编码视频数据并且将所述经编码视频数据传输到目的地装置14的任何类型的服务器。实例文件服务器包含网络服务器(例如,用于网站)、FTP服务器、网络附接存储(NAS)装置或本地磁盘驱动器。目的地装置14可以通过任何标准数据连接(包含因特网连接)来存取经编码视频数据。此可包含无线通道(例如,Wi-Fi连接)、有线连接(例如,DSL、缆线调制解调器,等等),或适合于存取存储于文件服务器上的经编码视频数据的以上两者的组合。经编码视频数据从存储装置的传输可能是流式传输、下载传输或两者的组合。
本发明的技术不必限于无线应用或环境。所述技术可以应用于支持多种多媒体应用中的任一者的视频译码,例如空中协议电视广播、有线电视传输、卫星电视传输、因特网流式视频传输(例如,动态自适应HTTP流式传输(DASH))、经编码到数据存储媒体上的数字视频,存储在数据存储媒体上的数字视频的解码,或其它应用。在一些实例中,系统10可经配置以支持单向或双向视频传输,以支持例如视频流式传输、视频回放、视频广播和/或视频电话等应用。
在图1的实例中,源装置12包含视频源18、视频编码器20及输出接口22。目的地装置14包含输入接口28、视频解码器30和显示装置32。根据本发明,源装置12的视频编码器20可经配置以应用用于高精度显式经加权预测的技术。在其它实例中,源装置和目的地装置可包含其它组件或布置。举例来说,源装置12可从外部视频源18(例如外部相机)接收视频数据。同样,目的地装置14可以与外部显示装置介接,而非包含集成显示装置。
图1的所说明的系统10只是一个实例。用于高精度显式经加权预测的技术可由任何数字视频编码和/或解码装置执行。尽管本发明的技术一般通过视频编码装置来执行,但是所述技术还可通过视频编码器/解码器(通常被称作“编码解码器”)来执行。此外,本发明的技术还可通过视频预处理器来执行。源装置12及目的地装置14仅为源装置12在其中产生经译码视频数据以供传输到目的地装置14的此些译码装置的实例。在一些实例中,装置12、14可以实质上对称的方式操作,使得装置12、14中的每一者包含视频编码及解码组件。因此,系统10可支持视频装置12、14之间的单向或双向视频传播以例如用于视频流式传输、视频回放、视频广播或视频电话。
源装置12的视频源18可包含视频俘获装置,例如视频摄像机、含有先前所俘获视频的视频存档及/或用于从视频内容提供者接收视频的视频馈送接口。作为另一替代方案,视频源18可产生基于计算机图形的数据作为源视频,或实况视频、所存档视频与计算机产生的视频的组合。在一些情况下,如果视频源18是摄像机,则源装置12及目的地装置14可形成所谓的相机电话或视频电话。然而,如上文所提及,本发明中所描述的技术一般来说可适用于视频译码,且可应用于无线及/或有线应用。在每一种情况下,可由视频编码器20编码所俘获、经预先俘获或计算机产生的视频。经编码视频信息可接着通过输出接口22输出到计算机可读媒体16上。
计算机可读媒体16可包含瞬时媒体,例如无线广播或有线网络传输,或存储媒体(也就是说,非暂时性存储媒体),例如硬盘、快闪驱动器、压缩光盘、数字视频光盘、蓝光光盘或其它计算机可读媒体。在一些实例中,网络服务器(未图示)可例如经由网络传输从源装置12接收经编码视频数据且将经编码视频数据提供给目的地装置14。类似地,媒体生产设施(例如光盘冲压设施)的计算装置可以从源装置12接收经编码视频数据并且生产容纳经编码视频数据的光盘。因此,在各种实例中,计算机可读媒体16可以理解为包含各种形式的一或多个计算机可读媒体。
目的地装置14的输入接口28从计算机可读媒体16接收信息。计算机可读媒体16的信息可包含由视频编码器20界定的语法信息,所述语法信息还供视频解码器30使用,所述语法信息包含描述块及其它经译码单元(例如,GOP)的特性及/或处理的语法元素。显示装置32将经解码视频数据显示给用户,且可包括多种显示装置中的任一者,例如阴极射线管(CRT)、液晶显示器(LCD)、等离子显示器、有机发光二极管(OLED)显示器或另一类型的显示装置。
视频编码器20和视频解码器30可以根据视频译码标准(例如目前正在开发的高效率视频译码(HEVC)标准)来操作,并且可以符合HEVC测试模型(HM)。或者,视频编码器20和视频解码器30可以根据其它专有或业界标准来操作,所述标准例如是ITU-T H.264标准,也被称为MPEG-4,第10部分,高级视频译码(AVC),或此类标准的扩展。然而,本发明的技术不限于任何特定译码标准。视频译码标准的其它实例包含MPEG-2及ITU-T H.263。虽然在图1中未展示,但在一些方面中,视频编码器20及视频解码器30可各自与音频编码器及解码器集成,且可包含适当的MUX-DEMUX单元或其它硬件及软件,以处置对共同数据流或单独数据流中的音频及视频两者的编码。如果适用的话,MUX-DEMUX单元可符合ITU H.223多路复用器协议,或例如用户数据报协议(UDP)等其它协议。
ITU-T H.264/MPEG-4(AVC)标准是由ITU-T视频译码专家组(VCEG)连同ISO/IEC移动图片专家组(MPEG)一起制定以作为被称为联合视频小组(JVT)的集体伙伴关系的产品。在一些方面中,本发明中所描述的技术可应用于通常符合H.264标准的装置。H.264标准描述于ITU-T研究组的日期为2005年3月的“ITU-T推荐H.264,用于通用视听服务的高级视频译码”(ITU-T Recommendation H.264,Advanced Video Coding for genericaudiovisual services)中,所述标准在本文中可被称作H.264标准或H.264规范或H.264/AVC标准或规范。联合视频小组(JVT)不断致力于对H.264/MPEG-4AVC的扩展。
视频编码器20及视频解码器30各自可实施为多种合适的编码器电路中的任一者,例如一或多个微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑、软件、硬件、固件或其任何组合。当部分地用软件实施所述技术时,装置可将用于软件的指令存储在合适的非暂时性计算机可读媒体中且使用一或多个处理器用硬件执行所述指令以执行本发明的技术。视频编码器20及视频解码器30中的每一者可包含在一或多个编码器或解码器中,所述编码器或解码器中的任一者可集成为相应装置中的组合编码器/解码器(CODEC)的部分。
JCT-VC不断在开发HEVC标准。HEVC标准化努力是基于被称作HEVC测试模型(HM)的视频译码装置的演进模型。HM假设视频译码装置根据(例如)ITU-T H.264/AVC相对于现有装置的若干额外能力。举例来说,虽然H.264提供了九种帧内预测编码模式,但是HM可提供多达三十三种帧内预测编码模式。
一般来说,HM的工作模型描述视频帧或图片可以分成包含亮度及色度样本两者的一连串树块或最大译码单元(LCU)(还被称作“译码树单元”)。位流内的语法数据可以界定最大译码单元(LCU,其在像素数目方面为最大译码单元)的大小。切片包含呈译码次序的多个连续树块。视频帧或图片可以被分割成一或多个切片。每一树块可以根据四叉树分裂成译码单元(CU)。一般来说,四叉树数据结构包含每个CU一个节点,其中一个根节点对应于所述树块。如果CU分裂成四个子CU,那么对应于CU的节点包含四个叶节点,其中叶节点中的每一者对应于所述子CU中的一者。
四叉树数据结构的每一节点可以提供相对应的CU的语法数据。举例来说,四叉树中的一节点可包含一分裂旗标,其指示对应于所述节点的所述CU是否分裂成子CU。CU的语法元素可以递归地界定,且可以取决于CU是否分裂成子CU。如果CU不进一步分裂,那么将其称为叶CU。在本发明中,叶CU的子CU也将被称作叶CU,即使不存在原始叶CU的显式分裂时也是如此。举例来说,如果16×16大小的CU不进一步分裂,那么这四个8×8子CU将也被称作叶CU,虽然16×16CU从未分裂。
CU具有类似于H.264标准的宏块的目的,但是CU并不具有大小区别。举例来说,树块可以分裂成四个子节点(还被称作子CU),并且每一子节点又可以是父节点并且可以分裂成另外四个子节点。最终的未分裂子节点(被称作四叉树的叶节点)包括译码节点,还称为叶CU。与经译码位流相关联的语法数据可以界定树块可以分裂的最大次数,被称作最大CU深度,并且还可界定译码节点的最小大小。因此,位流还可界定最小译码单元(SCU)。本发明使用术语“块”来指代在HEVC的情况下的CU、PU或TU或在其它标准的情况下的类似数据结构(例如,H.264/AVC中的宏块及其子块)中的任一者。
CU包含译码节点以及与所述译码节点相关联的预测单元(PU)及变换单元(TU)。CU的大小对应于译码节点的大小并且形状必须是正方形。CU的大小可以在从8×8像素直到具有最大64×64像素或更大的树块的大小的范围内。每一CU可含有一或多个PU及一或多个TU。举例来说,与CU相关联的语法数据可描述将CU分割成一或多个PU。分割模式可以在CU被跳过或经直接模式编码、帧内预测模式编码或帧间预测模式编码之间有区别。PU可分割成非正方形形状。举例来说,与CU相关联的语法数据还可描述CU根据四叉树被分割为一或多个TU。TU可以是正方形或非正方形(例如,矩形)形状。
HEVC标准允许根据TU的变换,TU可针对不同CU而有所不同。TU的大小通常是基于针对经分割LCU界定的给定CU内的PU的大小而设置,但是情况可能并不总是如此。TU通常与PU大小相同或小于PU。在一些实例中,对应于CU的残差样本可以使用被称为“残差四叉树”(RQT)的四叉树结构而细分成较小单元。RQT的叶节点可被称为变换单元(TU)。可以变换与TU相关联的像素差值以产生变换系数,可以将所述变换系数量化。
叶CU可包含一或多个预测单元(PU)。一般来说,PU表示对应于相对应的CU的全部或一部分的空间区域,并且可包含用于检索PU的参考样本的数据。此外,PU包含与预测有关的数据。举例来说,当PU经帧内模式编码时,用于PU的数据可以包含在残差四叉树(RQT)中,残差四叉树可包含描述用于对应于PU的TU的帧内预测模式的数据。作为另一实例,当PU经帧间模式编码时,PU可包含界定PU的一或多个运动向量的数据。界定PU的运动向量的数据可描述(例如)运动向量的水平分量、运动向量的垂直分量、运动向量的分辨率(例如,四分之一像素精度或八分之一像素精度)、运动向量指向的参考帧,和/或运动向量的参考图片列表(例如,列表0、列表1或列表C)。
具有一或多个PU的叶CU还可包含一或多个变换单元(TU)。变换单元可以使用RQT(还称为TU四叉树结构)来指定,如上文所论述。举例来说,分裂旗标可以指示叶CU是否分裂成四个变换单元。接着,每一变换单元可以进一步分裂成其它的子TU。当TU未经进一步分裂时,其可被称作叶TU。总体上,对于帧内译码,所有属于一个叶CU的叶TU共用相同的帧内预测模式。也就是说,一般应用相同帧内预测模式来计算叶CU的所有TU的预测值。对于帧内译码,视频编码器可以使用帧内预测模式针对每一叶TU计算残差值,作为CU的对应于TU的部分与原始块之间的差。TU不必限于PU的大小。因此,TU可大于或小于PU。对于帧内译码,PU可以与相同CU的相对应的叶TU位于同一地点。在一些实例中,叶TU的最大大小可以对应于对应叶CU的大小。
此外,叶CU的TU还可与相应四叉树数据结构(被称作残差四叉树(RQT))相关联。也就是说,叶CU可包含指示叶CU如何分割成TU的四叉树。TU四叉树的根节点一般对应于叶CU,而CU四叉树的根节点一般对应于树块(或LCU)。未经分裂的RQT的TU被称作叶TU。一般来说,除非以其它方式提及,否则本发明分别使用术语CU及TU来指叶CU及叶TU。
视频序列通常包含一系列视频帧或图片。图片群组(GOP)一般包括一系列一或多个视频图片。GOP可包含GOP的标头、图片中的一或多者的标头或其它处的语法数据,其描述GOP中所包含的图片的数目。图片的每一切片可包含描述用于相应切片的编码模式的切片语法数据。视频编码器20通常对个别视频切片内的视频块操作以便编码视频数据。视频块可以对应于CU内的译码节点。视频块可以具有固定或变化的大小,并且根据指定译码标准可以有不同大小。
作为实例,HM支持各种PU大小的预测。假设特定CU的大小是2N×2N,那么HM支持2N×2N或N×N的PU大小的帧内预测,及2N×2N、2N×N、N×2N或N×N的对称PU大小的帧间预测。HM还支持用于2N×nU、2N×nD、nL×2N及nR×2N的PU大小的帧间预测的不对称分割。在不对称分割中,不分割CU的一个方向,而将另一方向分割成25%及75%。CU的对应于25%分区的部分由“n”继之以“上”、“下”、“左”或“右”的指示来指示。因此,例如,“2N×nU”是指经水平分割的2N×2N CU,其中顶部为2N×0.5NPU,而底部为2N×1.5N PU。
在本发明中,“N×N”与“N乘N”可以可互换地使用,以在垂直和水平尺寸方面指代视频块的像素尺寸,例如16×16像素或16乘16像素。一般来说,16×16块将在垂直方向上具有16个像素(y=16),并且在水平方向上具有16个像素(x=16)。同样地,N×N块一般在垂直方向上具有N个像素,且在水平方向上具有N个像素,其中N表示非负整数值。块中的像素可按行及列布置。此外,块不需要一定在水平方向与垂直方向上具有相同数目的像素。举例来说,块可包括N×M像素,其中M未必等于N。
在使用CU的PU进行帧内预测或帧间预测译码之后,视频编码器20可以计算CU的TU的残差数据。PU可包括描述产生空间域(还被称作像素域)中的预测性像素数据的方法或模式的语法数据且TU可包括在对残差视频数据应用变换(例如,离散余弦变换(DCT)、整数变换、小波变换或概念上类似的变换)之后的变换域中的系数。残差数据可以对应于未经编码图片的像素与对应于PU的预测值之间的像素差。视频编码器20可以形成包含用于CU的残差数据的TU,并且接着变换TU以产生用于CU的变换系数。
在进行用于产生变换系数的任何变换之后,视频编码器20可执行变换系数的量化。量化一般是指变换系数经量化以可能减少用于表示系数的数据量从而提供进一步压缩的过程。量化过程可减少与系数中的一些系数或全部相关联的位深度。举例来说,可在量化期间将n位值向下舍入到m位值,其中n大于m。
在量化之后,视频编码器可以扫描变换系数,从包含经量化变换系数的二维矩阵产生一维向量。扫描可以经设计以将较高能量(并且因此较低频率)的系数放置在阵列前面,并且将较低能量(并且因此较高频率)的系数放置在阵列的后面。在一些实例中,视频编码器20可利用预先界定的扫描次序来扫描经量化的变换系数以产生可被熵编码的串行化向量。在其它实例中,视频编码器20可以执行自适应扫描。在扫描经量化变换系数以形成一维向量之后,视频编码器20可例如根据上下文自适应可变长度译码(CAVLC)、上下文自适应二进制算术译码(CABAC)、基于语法的上下文自适应二进制算术译码(SBAC)、概率区间分割熵(PIPE)译码或另一熵编码方法对所述一维向量进行熵编码。视频编码器还20可对与经编码视频数据相关联的语法元素进行熵编码以供视频解码器30在对视频数据解码时使用。
为了执行CABAC,视频编码器20可以向待传输的符号指派上下文模型内的上下文。上下文可涉及(例如)符号的相邻值是否为非零。了执行CAVLC,视频编码器20可针对待传输的符号选择可变长度码。可建构VLC中的码字以使得相对较短代码对应于更有可能的符号,而较长代码对应于不太可能的符号。(例如)与对待传输的每一符号使用等长度码字的情形相比较,以此方式,使用VLC可实现位节省。概率确定可基于指派给符号的上下文。
根据本发明的技术,视频编码器20及视频解码器30可经配置以执行高精度显式经加权预测。举例来说,视频编码器20及视频解码器30可经配置以根据上文所论述的表1的语法元素的某些经修改的语义来译码视频数据。作为实例,经修改的语义可包含以下展示的语义中的任一者或全部。在以下语法元素的语义中,带下划线的文本表示相对于JCTVC-N1005中阐述的语义的差异。
luma_log2_weight_denom是所有明度加权因子的分母的以2为底的对数。luma_log2_weight_denom的值将在0到bitDepth-1的范围内(包括0和bitDepth-1)。
delta_chroma_log2_weight_denom是所有色度加权因子的分母的以2为底的对数的差。
将变量ChromaLog2WeightDenom导出为等于luma_log2_weight_denom+delta_chroma_log2_weight_denom,且值将在0到bitDepth-1的范围内(包括0和bitDepth-1)。
delta_luma_weight_l0[i]是应用到使用RefPicList0[i]的列表0预测的明度预测值的加权因子的差。
将变量LumaWeightL0[i]导出为等于(1<<luma_log2_weight_denom)+delta_luma_weight_l0[i]。在luma_weight_l0_flag[i]等于1时,delta_luma_weight_l0[i]的值将在-2bitDepth-1到2bitDepth-1-1的范围内(包括-2bitDepth-1和2bitDepth-1-1)。在luma_weight_l0_flag[i]等于0时,推断LumaWeightL0[i]等于2luma_log2_weight_denom
luma_offset_l0[i]是应用到使用RefPicList0[i]的列表0预测的明度预测值的相加性偏移。luma_offset_l0[i]的值将在-2bitDepth-1到2bitDepth-1-1的范围内(包括-2bitDepth -1和2bitDepth-1-1)。在luma_weight_l0_flag[i]等于0时,推断luma_offset_l0[i]等于0。
delta_chroma_weight_l0[i][j]是应用到使用RefPicList0[i]的列表0预测的色度预测值的加权因子的差,其中j对于Cb等于0且j对于Cr等于1。
将变量ChromaWeightL0[i][j]导出为等于(1<<ChromaLog2WeightDenom)+delta_chroma_weight_l0[i][j]。在chroma_weight_l0_flag[i]等于1时,delta_chroma_weight_l0[i][j]的值将在-2bitDepth-1到2bitDepth-1-1的范围内(包括-2bitDepth-1和2bitDepth-1-1)。在chroma_weight_l0_flag[i]等于0时,推断ChromaWeightL0[i][j]等于2ChromaLog2WeightDenom。
delta_chroma_offset_l0[i][j]是应用到使用RefPicList0[i]的列表0预测的色度预测值的相加性偏移的差,其中j对于Cb等于0且j对于Cr等于1。
如下导出变量ChromaOffsetL0[i][j]:
ChromaOffsetL0[i][j]=Clip3(-2bitDepth-1,2bitDepth-1-1,(delta_chroma_offset_l0[i][j]-((2bitDepth-1 *ChromaWeightL0[i][j])>>ChromaLog2WeightDenom)+2bitDepth-1 ))(7-50)
delta_chroma_offset_l0[i][j]的值将在-2bitDepth+1到2bitDepth+1-1的范围内(包括-2bitDepth+1和2bitDepth+1-1)。在chroma_weight_l0_flag[i]等于0时,推断ChromaOffsetL0[i][j]等于0。
delta_luma_weight_l1[i]、luma_offset_l1[i]、delta_chroma_weight_l1[i][j]及delta_chroma_offset_l1[i][j]分别具有与delta_luma_weight_l0[i]、luma_offset_l0[i]、delta_chroma_weight_l0[i][j]及delta_chroma_offset_l0[i][j]相同的语义,其中l0、L0、列表0及List0分别被l1、L1、列表1及List1取代。
另外或在替代方案中,视频编码器20及视频解码器30可经配置以实施高精度显式经加权样本预测过程,如下文所描述。以下论述中的带下划线的文本表示相对于JCTVC-N1005的改变。从JCTVC-N1005的提议的去除不一定在以下论述中强调,但可通过将此论述与以上呈现的JCTVC-N1005的论述进行比较而观察到。
如下导出变量log2Wd、o0、o1及w0、w1:
-如果cIdx对于明度样本等于0,那么以下适用:
log2Wd=luma_log2_weight_denom+shift1 (8-243)
w0=LumaWeightL0[refIdxL0] (8-244)
w1=LumaWeightL1[refIdxL1] (8-245)
o0=luma_offset_l0[refIdxL0] (8-246')
o1=luma_offset_l1[refIdxL1] (8-247')
-否则(cIdx对于色度样本不等于0),以下适用:
log2Wd=ChromaLog2WeightDenom+shift1 (8-248)
w0=ChromaWeightL0[refIdxL0][cIdx-1] (8-249)
w1=ChromaWeightL1[refIdxL1][cIdx-1] (8-250)
o0=ChromaOffsetL0[refIdxL0][cIdx-1] (8-251')
o1=ChromaOffsetL1[refIdxL1][cIdx-1] (8-252')
JCTVC-N1005如下指定公式(8-246)、(8-247)、(8-251)及(8-252):
o0=luma_offset_l0[refIdxL0]*(1<<(bitDepth-8)) (8-246)
o1=luma_offset_l1[refIdxL1]*(1<<(bitDepth-8)) (8-247)
o0=ChromaOffsetL0[refIdxL0][cIdx-1]*(1<<(bitDepth-8)) (8-251)
o1=ChromaOffsetL1[refIdxL1][cIdx-1]*(1<<(bitDepth-8)) (8-252)
通过比较可看出,在本发明的公式(8-246')、(8-247')、(8-251')及(8-252')中,可不乘以(1<<(bitDepth-8))而计算变量o0及o1,如JCTVC-N1005中所指定。类似地,可在不计算(1<<(位深度-8))的情况下计算变量o0及o1,其中“<<”表示逐位左移运算符。
视频编码器20及视频解码器30可经配置以例如针对图片序列译码指示是否启用高精度经加权预测的数据。例如,视频编码器20及视频解码器30可经配置以译码序列参数集(SPS)的语法元素,其中所述语法元素的值指示是否针对视频数据启用高精度经加权预测(即,高位深度)。下表2呈现可以用于指示是否启用高精度经加权预测的此类数据的语法。根据图2的实例,视频编码器20及视频解码器30可译码指示是否在SPS RBSP语法中使用高精度经加权预测的旗标。所述旗标还可在其它高级语法主体中发信号通知,例如视频参数集(VPS)、图片参数集(PPS)、切片标头、块标头或类似者。在表2的实例中,带下划线的文本表示相对于HEVC及JCTVC-N1005的语法的添加部分。
表2
可如下界定use_high_precision_weighted_prediction_flag的语义:
use_high_precision_weighted_prediction_flag等于1指定使用本发明中的高精度显式经加权预测。use_high_precision_weighted_prediction_flag等于0指定不使用本发明中的高精度显式经加权预测且使用HEVC范围扩展草案(根据JCTVC-N1005)。在未呈现时,推断其为0。
如可在表2的实例中看出,如果明度(luma或‘Y’)的位深度大于10或如果色度(chroma或‘C’)的位深度大于10,那么序列参数集可包含use_high_precision_weighted_prediction_flag语法元素,其可指示是否使用高精度经加权预测(即,高位深度)。因此,经加权预测过程的“高位深度”可对应于大于十个(10)位的位深度。
此外,视频编码器20及视频解码器30可经配置以根据对JCTVC-N1005的以下修改而操作。在JCTVC-N1005的部分8.5.3.3.4.3中,shift1设定成等于Max(2,14-bitDepth)。在最差情况下,predSamples[x][y]可高达:bitDepth(输入位深度)+shift1+1(来自内插的缩放)+1(来自内插的正负号位)。
下表3列出最差情况样本位深度,其经修改以适应本发明的技术(其中带下划线的文本表示对JCTVC-N1005中描述的语法的修改):
表3
于是,在最差情况中,在上文描述的公式(8-253)中,将不另外使用16位乘法实施predSamplesL0[x][y]*w0。然而,根据本发明的技术,w0可被限于Min(bitDepth,16- shift1-2)(位)。
在另一实例中,视频编码器20及视频解码器30可经配置以使用具有经扩展的精度的偏移参数,但使用具有与JCTVC-N1005中相同的精度的加权参数。即,仅可根据上文描述的各种实例改变luma_offset_l0、luma_offset_l1、delta_chroma_offset_l0及delta_chroma_offset_l1的语义,而其它语法元素的语义可相对于JCTVC-N1005保持不变。因此,视频编码器20及视频解码器30可使用具有经扩展的精度的一或多个偏移参数(例如,luma_offset_l0、luma_offset_l1、delta_chroma_offset l0及delta_chroma_offset_l1中的一或多者)及具有JCTVC-N1005中界定的精度的加权参数来译码视频数据。
偏移参数(例如luma_offset_l0、luma_offset_l1、delta_chroma_offset_l0及delta_chroma_offset_l1)可用于将块的预测样本偏移特定量。在全局或区域改变相对于一组参考样本(例如,参考图片或参考图片的一部分)发生在当前图片中时,此偏移可为有益的。例如,如果例如在场景淡入或淡出或突然闪光(例如雷击)期间,照明相对于参考图片在当前图片中全局或区域地增加或减小,那么将偏移引入到参考图片的明度值中的样本可为有益的,而非尝试识别不同参考图片。引入偏移可减小当前图片的块的残差值,其可减小视频数据的位速率。
虽然JCTVC-N1005包含此类偏移的固定范围的可能的值(即,用于发信号通知此类偏移的固定位深度),但本发明的技术允许动态地调整此类偏移的位深度。即,视频编码器20可发信号通知表示偏移参数的位深度的一或多个值以及是否启用高位深度(即,是否启用高精度经加权预测过程)。类似地,视频解码器30可使用表示位深度的发信号通知的值来正确地解码位流。更具体来说,视频解码器30可确定位流的哪些位应用于偏移参数及所述位何时开始应用于后续的不同语法元素。例如,如果位深度是8位,且视频解码器30已解码偏移参数的8位,那么视频解码器30可确定后续位应用于不同语法元素,且不应用于偏移参数。
允许偏移参数的比JCTVC-N1005中指定的此类参数的位深度更高的位深度可产生某些优点。例如,在输入视频数据具有相对高的位深度时可提高译码效率(即,包含在位流中的位的数目)。然而,在输入视频数据具有相对低的位深度时或在用于偏移参数的位的数目不产生显著译码增益时(如由例如速率-失真度量所展示),视频编码器20可停用高位深度。
视频编码器20和视频解码器30可在适用时各自实施为多种合适的编码器或解码器电路中的任一者,例如一或多个微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑电路、软件、硬件、固件或其任何组合。视频编码器20和视频解码器30中的每一者可包含在一或多个编码器或解码器中,所述编码器或解码器中的任一者可集成为组合视频编码器/解码器(CODEC)的部分。包含视频编码器20和/或视频解码器30的装置可包括集成电路、微处理器和/或无线通信装置(例如,蜂窝式电话)。
图2是说明可实施用于高精度显式经加权预测的技术的视频编码器20的实例的框图。视频编码器20可执行视频切片内的视频块的帧内译码及帧间译码。帧内译码依赖于空间预测来减少或去除给定视频帧或图片内的视频中的空间冗余。帧间译码依赖于时间预测来减少或去除视频序列的邻接帧或图片内的视频中的时间冗余。帧内模式(I模式)可以指若干基于空间的译码模式中的任一者。例如单向预测(P模式)或双向预测(B模式)等帧间模式可以指若干基于时间的译码模式中的任一者。
如图2中所示,视频编码器20接收待编码视频帧内的当前视频块。在图2的实例中,视频编码器20包含模式选择单元40、参考图片存储器64、求和器50、变换处理单元52、量化单元54及熵编码单元56。模式选择单元40又包含运动补偿单元44、运动估计单元42、帧内预测单元46及分割单元48。为了视频块重构,视频编码器20还包含反量化单元58、反变换单元60,及求和器62。还可包含解块滤波器(图2中未图示)以便对块边界进行滤波,以从经重构视频移除成块性假影。必要时,解块滤波器通常将对求和器62的输出进行滤波。除解块滤波器之外,还可使用额外滤波器(环路内或环路后)。为简洁起见未展示此类滤波器,但是必要时,这些滤波器可以对求和器50的输出进行滤波(作为环路内滤波器)。
在编码过程期间,视频编码器20接收待译码的视频帧或切片。所述帧或切片可被划分成多个视频块。运动估计单元42及运动补偿单元44相对于一或多个参考帧中的一或多个块执行所接收视频块的帧间预测译码以提供时间预测。帧内预测单元46可替代地相对于与待译码块相同的帧或切片中的一或多个相邻块执行对所接收的视频块的帧内预测译码以提供空间预测。视频编码器20可以执行多个译码遍次,例如,以便为每一视频数据块选择一种适当的译码模式。
此外,分割单元48可以基于前述译码遍次中的前述分割方案的评估将视频数据块分割成子块。举例来说,分割单元48最初可以将帧或切片分割成LCU,并且基于速率失真分析(例如,速率失真优化)将LCU中的每一者分割成子CU。模式选择单元40可以进一步产生指示LCU划分成子CU的四叉树数据结构。四叉树的叶节点CU可包含一或多个PU和一或多个TU。
模式选择单元40可以基于错误结果选择译码模式中的一者(帧内或帧间),并且将所得的经帧内译码或经帧间译码块提供到求和器50以便产生残差块数据,并且提供到求和器62以便重构经编码块用作参考帧。模式选择单元40还将语法元素(例如,运动向量、帧内模式指示符、分割信息及其它此类语法信息)提供到熵编码单元56。
运动估计单元42与运动补偿单元44可高度集成,但出于概念目的分开加以说明。由运动估计单元42执行的运动估计是产生运动向量的过程,所述过程估计视频块的运动。举例来说,运动向量可以指示当前视频帧或图片内的视频块的PU相对于参考帧(或其它经译码单元)内的预测块相对于当前帧(或其它经译码单元)内正经译码的当前块的移位。预测块是被发现在像素差方面与待译码块紧密匹配的块,像素差可通过绝对差总和(SAD)、平方差总和(SSD)或其它差异度量来确定。在一些实例中,视频编码器20可计算存储于参考图片存储器64中的参考图片的子整数像素位置的值。举例来说,视频编码器20可以内插参考图片的四分之一像素位置、八分之一像素位置或其它分数像素位置的值。因此,运动估计单元42可相对于全像素位置和分数像素位置执行运动搜索并且输出具有分数像素精度的运动向量。
运动估计单元42通过比较PU的位置与参考图片的预测块的位置来计算经帧间译码切片中的视频块的PU的运动向量。参考图片可选自第一参考图片列表(列表0)或第二参考图片列表(列表1),所述参考图片列表中的每一者识别存储在参考图片存储器64中的一或多个参考图片。运动估计单元42将计算出来的运动向量发送到熵编码单元56及运动补偿单元44。
由运动补偿单元44执行的运动补偿可以涉及基于由运动估计单元42确定的运动向量提取或产生预测块。同样,在一些实例中,运动估计单元42与运动补偿单元44可以在功能上集成。在接收到当前视频块的PU的运动向量后,运动补偿单元44便可以在参考图片列表中的一者中定位所述运动向量指向的预测块。求和器50通过从经译码的当前视频块的像素值减去预测块的像素值从而形成像素差值来形成残差视频块,如下文所论述。一般来说,运动估计单元42相对于亮度分量执行运动估计,并且运动补偿单元44对于色度分量及亮度分量两者使用基于亮度分量计算的运动向量。模式选择单元40还可产生与视频块和视频切片相关联的供视频解码器30在对视频切片的视频块进行解码时使用的语法元素。
运动补偿单元44可进一步经配置以在运动补偿期间将偏移应用到预测样本。举例来说,模式选择单元40可致使运动补偿单元44将偏移应用到参考块的明度及/或色度样本(或整个参考图片),其可提高从当前图片的参考块或参考图片的预测。根据本发明的技术,模式选择单元40可选择常规的位深度或相对高的位深度的偏移。在所述偏移是高位深度的时,视频编码器20可编码指示启用高位深度的语法元素(例如,序列参数集SPS))的值。
作为实例,视频编码器20可经配置以将偏移应用到一或多个参考图片的明度预测数据。如果当前图片是单向预测的图片(即,P图片),那么视频编码器20可将偏移应用到参考图片列表0中的一或多个参考图片。视频编码器20可发信号通知表示将应用到参考图片列表0中的一或多个参考图片的偏移的参数的值。即,视频编码器20可发信号通知luma_offset_l0[i]的值,其中i在参考图片列表0中的所有参考图片的范围内。类似地,如果当前图片是B图片,那么视频编码器20可发信号通知参考图片列表0及参考图片列表1两者中的参考图片的偏移参数的值,其中参考图片列表0的参考图片的偏移参数可对应于luma_offset_l0[i],且参考图片列表1的参考图片的偏移参数可对应于luma_offset_l1[i]。
类似地,视频编码器20可编码色度样本的偏移参数的值。例如,视频编码器20可编码delta_chroma_offset_l0[i][j]参数的值,并且,如果当前图片是B图片,那么编码delta_chroma_offset_l1[i][j]参数的值。再者,“l0”表示参考图片列表0,而“l1”表示参考图片列表1,且‘i’在相应的参考图片列表中的图片的范围内。这些参数的变量‘j’表示基于背景索引“cIdx”的值,即,cIdx-1。cIdx值对于明度样本可为零(0)且对于色度样本为非零。
视频编码器20可发信号通知预测权重表(pred_weight_table)中的luma_offset_l0[i]、luma_offset_l1[i]、delta_chroma_offset_l0[i][j]及delta_chroma_offset_l1[i][j]参数的值,其可形成切片标头的部分。
因此,运动补偿单元44可根据如上文相对于图1所论述的公式(8-246')、(8-247')、(8-251')及(8-252')而计算变量o0及o1的值。运动补偿单元44可将偏移应用到从相应的参考图片确定的参考块。因此,在视频编码器20形成并编码残差块时,求和器50可将残差块计算为当前未经译码的块与由运动补偿单元44形成的参考块之间的逐像素(或逐样本)差异(其中运动补偿单元44可已将偏移应用到所述参考块)。如上文所论述,模式选择单元40可致使运动补偿单元44尝试偏移的各种值且选择产生最佳速率-失真特性的偏移参数的值。此外,在启用高位深度时,模式选择单元40可在由高位深度界定的范围内尝试偏移参数的值。
作为如上文所描述由运动估计单元42和运动补偿单元44执行的帧间预测的替代方案,帧内预测单元46可以对当前块进行帧内预测。明确地说,帧内预测单元46可以确定用来编码当前块的帧内预测模式。在一些实例中,帧内预测单元46可(例如)在单独编码回合期间使用各种帧内预测模式对当前块进行编码,且帧内预测单元46(在一些实例中,或为模式选择单元40)可从所测试的模式中选择将使用的适当的帧内预测模式。
举例来说,帧内预测单元46可以使用速率失真分析计算针对各种经测试帧内预测模式的速率失真值,并且从所述经测试模式当中选择具有最佳速率失真特性的帧内预测模式。速率失真分析一般确定经编码块与经编码以产生所述经编码块的原始的未经编码块之间的失真(或误差)的量,以及用于产生经编码块的位速率(也就是说,位数目)。帧内预测单元46可以根据用于各种经编码块的失真及速率计算比率,以确定哪种帧内预测模式对于所述块展现最佳速率失真值。
在选择了用于块的帧内预测模式之后,帧内预测单元46可将指示用于所述块的选定帧内预测模式的信息提供给熵编码单元56。熵编码单元56可以对指示所选帧内预测模式的信息进行编码。视频编码器20可在所传输的位流中包含配置数据,所述配置数据可包含多个帧内预测模式索引表及多个修改的帧内预测模式索引表(还被称作码字映射表)、编码用于各种块的上下文的界定,及用于所述上下文中的每一者的最可能的帧内预测模式、帧内预测模式索引表及修改的帧内预测模式索引表的指示。
视频编码器20通过从经译码的原始视频块减去来自模式选择单元40的预测数据形成残差视频块。求和器50表示执行此减法运算的一或多个组件。变换处理单元52将例如离散余弦变换(DCT)或概念上类似的变换等变换应用于残差块,从而产生包括残差变换系数值的视频块。变换处理单元52可以执行概念上类似于DCT的其它变换。还可使用小波变换、整数变换、子频带变换或其它类型的变换。
在任何情况下,变换处理单元52向残差块应用所述变换,从而产生残差变换系数的块。所述变换可将残差信息从像素值域转换到变换域(例如,频域)。变换处理单元52可将所得变换系数发送到量化单元54。量化单元54将变换系数量化以进一步减小位速率。量化过程可以减少与系数中的一些或全部相关联的位深度。量化过程也可被称作“缩放”过程,且因此经量化的变换系数也可被称作“经缩放的变换系数”。量化(或缩放)的程度可通过调整量化参数来修改。在一些实例中,熵编码单元56可接着执行对包含经量化的变换系数的矩阵的扫描。
在量化之后,熵编码单元56对经量化的变换系数进行熵译码。举例来说,熵编码单元56可以执行上下文自适应可变长度译码(CAVLC)、上下文自适应二进制算术译码(CABAC)、基于语法的上下文自适应二进制算术译码(SBAC)、概率区间划分熵(PIPE)译码或另一熵译码技术。在基于上下文的熵译码的情况下,上下文可以基于相邻块。在熵编码单元56的熵译码之后,可以将经编码位流传输到另一装置(例如视频解码器30),或者将所述视频存档用于以后传输或检索。
反量化单元58及反变换单元60分别应用反量化及反变换以在像素域中重构残差块,例如以供稍后用作参考块。运动补偿单元44可以通过将残差块添加到参考图片存储器64的帧中的一者的预测块中来计算参考块。运动补偿单元44还可将一或多个内插滤波器应用于经重新构造的残差块以计算子整数像素值以用于运动估计。求和器62将经重构的残差块添加到由运动补偿单元44产生的经运动补偿的预测块以产生经重构参考块以供存储在参考图片存储器64中。经重构视频块可由运动估计单元42及运动补偿单元44用作参考块以对后续视频帧中的块进行帧间译码。
以此方式,图2的视频编码器20表示视频编码器的实例,其经配置以编码表示是否针对视频数据启用高位深度的语法元素的值,且在所述语法元素的所述值指示启用所述高位深度时:编码表示所述视频数据的一或多个参数的位深度的语法元素的值;编码所述参数的值以使得所述参数的所述值具有基于表示所述位深度的所述语法元素的所述值的位深度;及至少部分基于所述参数的所述值而编码所述视频数据。
图3是说明可实施用于高精度显式经加权预测的技术的视频解码器30的实例的框图。在图3的实例中,视频解码器30包含熵解码单元70、运动补偿单元72、帧内预测单元74、反量化单元76、反变换单元78、参考图片存储器82及求和器80。视频解码器30在一些实例中可执行一般与关于来自图2的视频编码器20所描述的编码回合互逆的解码回合。运动补偿单元72可基于从熵解码单元70接收的运动向量产生预测数据,而帧内预测单元74可基于从熵解码单元70接收的帧内预测模式指示符产生预测数据。
在解码过程期间,视频解码器30从视频编码器20接收表示经解码视频切片和相关联的语法元素的视频块的经编码视频位流。视频解码器30的熵解码单元70熵解码位流以产生经量化的系数、运动向量或帧内预测模式指示符及其它语法元素。熵解码单元70将运动向量及其它语法元素转发到运动补偿单元72。视频解码器30可以接收在视频切片层级和/或视频块层级处的语法元素。
当视频切片经译码为经帧内译码(I)切片时,帧内预测单元74可以基于用信号发送的帧内预测模式和来自当前图片的先前经解码块的数据产生用于当前视频切片的视频块的预测数据。在视频帧被译码为经帧间译码(即,B、P或GPB)切片时,运动补偿单元72基于运动向量及从熵解码单元70接收的其它语法元素而产生用于当前视频切片的视频块的预测块。可以从参考图片列表中的一者内的参考图片中的一者产生预测块。视频解码器30可基于存储于参考图片存储器82中的参考图片使用默认建构技术来建构参考帧列表:列表0及列表1。
运动补偿单元72通过解析运动向量及其它语法元素来确定用于当前视频切片的视频块的预测信息,并且使用所述预测信息产生用于正被解码的当前视频块的预测块。举例来说,运动补偿单元72使用所接收的语法元素中的一些语法元素来确定用于对视频切片的视频块进行译码的预测模式(例如,帧内预测或帧间预测)、帧间预测切片类型(例如,B切片、P切片或GPB切片)、用于切片的参考图片列表中的一或多者的建构信息、用于切片的每一经帧间编码视频块的运动向量、用于切片的每一经帧间译码视频块的帧间预测状态,及用以对当前视频切片中的视频块进行解码的其它信息。
运动补偿单元72还可基于内插滤波器执行内插。运动补偿单元72可使用由视频编码器20在编码视频块期间使用的内插滤波器来计算参考块的子整数像素的内插值。在此情况下,运动补偿单元72可根据所接收的语法信息元素而确定由视频编码器20使用的内插滤波器且使用所述内插滤波器来产生预测块。
根据本发明的技术,视频解码器30可解码SPS的语法元素以确定是否针对视频数据启用高位深度。在启用高位深度时,视频解码器30可解码具有基于发信号通知的位深度值的位深度的偏移参数的值。即,SPS可发信号通知是否启用高位深度,并且在启用高位深度时,发信号通知明度及/或色度偏移参数的位深度。
假设SPS指示启用高位深度(例如,位深度对于明度及/或色度偏移参数大于10),视频解码器30可进一步解码偏移参数的值。视频解码器30可解码包含预测权重表(pred_weight_table)(例如表1)的切片的切片标头,所述预测权重表可发信号通知偏移参数的值。具体来说,视频解码器30可使用发信号通知的位深度值(例如,根据上表2发信号通知)解码偏移参数的值。例如,视频解码器30可使用发信号通知的位深度来确定应用于偏移参数的位流的部分,这与切片标头的后续语法元素形成对比。
在解码偏移参数的值之后,视频解码器30可使用所述偏移参数计算明度及/或色度样本的偏移变量的值。所述偏移变量可例如为如上文所论述的变量o0及o1。视频解码器30可使用如上文相对于图1所论述的公式(8-246')、(8-247')、(8-251')及(8-252')计算变量o0及o1的值。随后,运动补偿单元72可将这些偏移应用到相应的参考样本以产生经预测块。即,运动补偿单元72可将偏移值o0应用到来自参考图片列表0中的参考图片的参考样本且将偏移值o1应用到来自参考图片列表1中的参考图片的参考样本。根据本发明的技术,视频解码器30可在不计算(1<<(位深度-8))且将此值乘以发信号通知的偏移参数的值的情况下计算变量o0及o1的值,这与JCTVC-N1005的技术相反。
反量化单元76将在位流中提供且由熵解码单元70解码的经量化变换系数反量化,即,解量化。反量化过程可包含使用视频解码器30针对视频切片中的每一视频块计算以确定应该应用的量化程度和同样反量化程度的量化参数QPY
反变换单元78对变换系数应用反变换,例如反DCT、反整数变换或概念上类似的反变换过程,以便产生像素域中的残差块。
在运动补偿单元72基于运动向量和其它语法元素产生当前视频块的预测块(其可包含使用可具有较高的位深度的偏移将参考样本偏移,如上文所论述)之后,视频解码器30通过对来自反变换模块78的残差块与由运动补偿单元72产生的对应预测块求和而形成经解码视频块。求和器80表示可执行此求和运算的组件。必要时,还可应用解块滤波器以对经解码块进行滤波以便移除成块性假影。还可使用其它环路滤波器(在译码环路中或在译码环路之后)来使像素转变变平滑或者以其它方式改善视频质量。接着将给定帧或图片中的经解码视频块存储在参考图片存储器82中,参考图片存储器82存储参考图片用于后续运动补偿。参考图片存储器82还存储经解码视频用于以后在显示装置(例如图1的显示装置32)上呈现。
以此方式,图3的视频解码器30表示视频解码器的实例,其经配置以解码表示是否针对视频数据启用高位深度的语法元素的值,且在所述语法元素的所述值指示启用所述高位深度时:解码表示所述视频数据的一或多个参数的位深度的语法元素的值;解码所述参数的值以使得所述参数的所述值具有基于表示所述位深度的所述语法元素的所述值的位深度;及至少部分基于所述参数的所述值而解码所述视频数据。
图4为说明用于对当前块进行编码的实例方法的流程图。当前块可包括当前CU或当前CU的一部分。尽管是相对于视频编码器20(图1及2)描述的,但应理解,其它装置可经配置以执行与图4的方法类似的方法。
在此实例中,视频编码器20起初确定加权参数(150)及偏移参数(154)。加权及/或偏移参数可具有相对高的位深度,例如超过十个(10)位的位深度。因此,视频编码器20可发信号通知(例如,在SPS的语法元素(例如use_high_precision_weighted_prediction_flag)中)是否启用高位深度(154)。此外,视频编码器20可发信号通知表示加权及/或偏移参数的位深度的值以及所述参数自身的值(156)。例如,视频编码器20可编码luma_offset_l0[i]参数、luma_offset_l1[i]参数、delta_chroma_offset_l0[i][j]参数及delta_chroma_offset_l1[i][j]参数的值。
视频编码器20接着可识别当前块的参考块(158)。例如,运动估计单元42可针对参考图片中的匹配块执行运动搜索。用作参考块的匹配块可为展现例如通过SAD、SSD、MAD、MSD或其它此类误差度量测得的最低误差值的块。运动补偿单元44接着可使用加权及偏移参数修改参考块的样本(160)。举例来说,运动补偿单元44可根据公式(8-246')、(8-247')、(8-251')及(8-252')计算变量o0及o1的值,且因此不计算(1<<(bitDepth-8))。再者,加权及/或偏移参数可具有相对高的位深度。因此,运动补偿单元44可例如使用具有超过十个位的偏移参数将参考块的样本偏移。在一些实例中,所述偏移参数可为十六位值。视频编码器20可使用经修改的参考块作为当前块的经预测块。
视频编码器20接着可计算当前块的残差块(例如)以产生变换单元(TU)(162)。为计算所述残差块,视频编码器20可计算原始未经译码的块与当前块的经预测块之间的差。视频编码器20接着可变换及量化所述残差块的系数(164)。接下来,视频编码器20可扫描所述残差块的经量化变换系数(166)。在扫描期间或在扫描之后,视频编码器20可对系数进行熵编码(168)。例如,视频编码器20可使用CAVLC或CABAC编码所述系数。视频编码器20接着可输出块的经熵译码的数据(170)。
以此方式,图4的方法表示用于编码视频数据的方法的实例,其包含确定是否针对视频数据启用高位深度,且在确定启用高位深度之后:编码表示所述视频数据的一或多个参数的位深度的语法元素的值;编码所述参数的值以使得所述参数的所述值具有基于表示所述位深度的位深度;及至少部分基于所述参数的所述值而编码所述视频数据。
图5为说明用于对当前视频数据块进行解码的实例方法的流程图。当前块可包括当前CU或当前CU的一部分。尽管是关于视频解码器30(图1及3)描述的,但应理解,其它装置可经配置以执行与图5的方法类似的方法。
起初,视频解码器30可解码表示是否针对视频数据启用高位深度且因此是否执行高精度显式经加权预测的语法元素的值(200)。假设启用高位深度,视频解码器30可解码表示位深度及加权及/或偏移参数的值(202)。例如,视频解码器30可解码luma_offset_l0[i]参数、luma_offset_l1[i]参数、delta_chroma_offset_l0[i][j]参数及delta_chroma_offset_l1[i][j]参数的值。可例如根据如上文所描述的表1将此些值解码为切片标头的部分。
视频解码器30接着可识别当前块的参考块(204)。例如,视频解码器30可例如使用合并模式或高级运动向量预测(AMVP)模式解码当前块的运动参数。所述运动参数可识别参考图片列表、到参考图片列表中的索引、运动向量差值及/或一组候选运动向量预测符的运动向量预测符中的一或多者。视频解码器30接着可使用加权及偏移参数修改参考块的样本(206)。举例来说,运动补偿单元72可根据公式(8-246')、(8-247')、(8-251')及(8-252')计算变量o0及o1的值,且因此不计算(1<<(bitDepth-8))。再者,加权及/或偏移参数可具有相对高的位深度。因此,运动补偿单元72可例如使用具有超过十个位的偏移参数将参考块的样本偏移。在一些实例中,所述偏移参数可为十六位值。视频解码器30可使用经修改的参考块作为当前块的经预测块。
视频解码器30还可接收当前块的经熵译码的数据,例如对应于当前块的残差块的系数的经熵译码的数据(208)。视频解码器30可对经熵译码的数据进行熵解码以重现所述残差块的系数(210)。视频解码器30接着可对重现的系数进行反扫描(212)以产生经量化变换系数的块。视频解码器30接着可对所述系数进行反量化及反变换以产生残差块(214)。视频解码器30可最终通过组合经预测块及残差块而解码当前块(216)。
以此方式,图5的方法表示用于解码视频数据的方法的实例,其包含解码表示是否针对视频数据启用高位深度的语法元素的值,在所述语法元素的所述值指示启用所述高位深度时:解码表示所述视频数据的一或多个参数的位深度的语法元素的值;解码所述参数的值以使得所述参数的所述值具有基于表示所述位深度的所述语法元素的所述值的位深度;及至少部分基于所述参数的所述值而解码所述视频数据。
应认识到,取决于实例,本文中所描述的技术中的任一者的某些动作或事件可用不同顺序执行、可添加、合并或全部省略(例如,实践所述技术并不需要所有的所描述动作或事件)。此外,在某些实例中,可例如通过多线程处理、中断处理或多个处理器同时而非依序执行动作或事件。
在一或多个实例中,所描述的功能可以用硬件、软件、固件或其任何组合来实施。如果以软件实施,则所述功能可作为一或多个指令或代码在计算机可读媒体上存储或传输,且由基于硬件的处理单元执行。计算机可读媒体可包含计算机可读存储媒体,其对应于有形媒体,例如数据存储媒体,或包含任何促进将计算机程序从一处传送到另一处的媒体(例如,根据通信协议)的通信媒体。以此方式,计算机可读媒体一般可对应于(1)非暂时性的有形计算机可读存储媒体或(2)例如信号或载波等通信媒体。数据存储媒体可为可由一或多个计算机或一或多个处理器存取以检索用于实施本发明中描述的技术的指令、代码及/或数据结构的任何可用媒体。计算机程序产品可以包含计算机可读媒体。
举例来说且并非限制,所述计算机可读媒体可包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储装置、磁盘存储装置或其它磁性存储装置,快闪存储器,或可用于存储呈指令或数据结构的形式的所要程序代码且可由计算机存取的任何其它媒体。同样,任何连接可恰当地称为计算机可读媒体。举例来说,如果使用同轴电缆、光纤缆线、双绞线、数字订户线(DSL)或例如红外线、无线电和微波等无线技术从网站、服务器或其它远程源传输指令,那么同轴电缆、光纤缆线、双绞线、DSL或例如红外线、无线电和微波等无线技术包含在媒体的定义中。然而,应理解,所述计算机可读存储媒体和数据存储媒体并不包含连接、载波、信号或其它暂时性媒体,而是实际上针对非暂时性的有形存储媒体。如本文所使用,磁盘及光盘包含压缩光盘(CD)、激光光盘、光学光盘、数字多功能光盘(DVD)、软性磁盘及蓝光光盘,其中磁盘通常以磁性方式重现数据,而光盘使用激光以光学方式重现数据。上述各者的组合也应包含在计算机可读媒体的范围内。
指令可以由一或多个处理器执行,所述一或多个处理器例如是一或多个数字信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、现场可编程逻辑阵列(FPGA)或其它等效的集成或离散逻辑电路。因此,如本文中所使用的术语“处理器”可指上述结构或适合于实施本文中所描述的技术的任一其它结构中的任一者。另外,在一些方面中,本文中所描述的功能性可以在经配置用于编码和解码的专用硬件和/或软件模块内提供,或者并入在组合编解码器中。并且,可将所述技术完全实施于一或多个电路或逻辑元件中。
本发明的技术可实施于广泛多种装置或设备中,包含无线手持机、集成电路(IC)或IC组(例如,芯片组)。本发明中描述各种组件、模块或单元是为了强调经配置以执行所揭示技术的装置的功能方面,但不必需要通过不同硬件单元实现。实际上,如上文所描述,各种单元可以结合合适的软件及/或固件组合在编码解码器硬件单元中,或者通过互操作硬件单元的集合来提供,所述硬件单元包含如上文所描述的一或多个处理器。
已描述各种实例。这些及其它实例在所附权利要求书的范围内。

Claims (40)

1.一种解码视频数据的方法,所述方法包括:
解码表示是否针对视频数据启用具有发信号通知的位深度的经加权预测的语法元素的值;
在所述语法元素的所述值指示启用具有所述发信号通知的位深度的所述经加权预测时:
解码表示所述视频数据的一或多个参数的所述发信号通知的位深度的语法元素的值,其中所述一或多个参数包括各自表示应用到明度预测值以用于第一参考图片列表预测的加性偏移的参数的第一列表或各自表示应用到明度预测值以用于第二参考图片列表预测的加性偏移的参数的第二列表;
解码所述参数的值以使得所述参数的所述值表示基于表示所述发信号通知的位深度的所述语法元素的所述值的位深度;及
至少部分基于所述参数的所述值而解码所述视频数据,其中解码所述视频数据包括,在针对明度样本执行经加权预测过程时:
将所述经加权预测过程中使用的第一变量的值计算为等于所述第一参数列表的所述参数中的一者的值,而不计算(1<<(所述发信号通知的位深度-8));及
将所述经加权预测过程中使用的第二变量的值计算为等于所述第二参数列表的所述参数中的一者的值,而不计算(1<<(所述发信号通知的位深度-8))。
2.根据权利要求1所述的方法,其中解码表示是否启用具有所述发信号通知的位深度的所述经加权预测的所述语法元素的所述值包括解码所述视频数据的图片序列的序列参数集SPS的语法元素的值。
3.根据权利要求1所述的方法,其中解码所述第一参数列表的所述参数中的所述一者或luma_offset_l0[i]参数的值包括解码在-2自乘到(所述发信号通知的位深度-1)到2自乘到(所述发信号通知的位深度-1)-1且包括-2自乘到(所述发信号通知的位深度-1)和2自乘到(所述发信号通知的位深度-1)的范围内的值。
4.根据权利要求1所述的方法,其中所述一或多个经加权预测参数进一步包括delta_chroma_offset_l0[i][j]参数或delta_chroma_offset_l1[i][j]参数。
5.根据权利要求4所述的方法,其中解码所述delta_chroma_offset_l0[i][j]参数或所述delta_chroma_offset_l1[i][j]参数的值包括解码在-2自乘到(所述发信号通知的位深度+1)到2自乘到(所述发信号通知的位深度+1)-1且包括-2自乘到(所述发信号通知的位深度+1)和2自乘到(所述发信号通知的位深度+1)-的范围内的值。
6.根据权利要求4所述的方法,其进一步包括:
根据以下公式导出ChromaOffsetL0[i][j]变量的值:Clip3(-2自乘到(所述发信号通知的位深度-1),2自乘到(所述发信号通知的位深度-1)-1,(delta_chroma_offset_l0[i][j]-((2自乘到(所述发信号通知的位深度-1)*ChromaWeightL0[i][j])>>ChromaLog2WeightDenom)+2自乘到(所述发信号通知的位深度-1)));及
根据以下公式导出ChromaOffsetL1[i][j]变量的值:Clip3(-2自乘到(所述发信号通知的位深度-1),2自乘到(所述发信号通知的位深度-1)-1,(delta_chroma_offset_l1[i][j]-((2自乘到(所述发信号通知的位深度-1)*ChromaWeightL1[i][j])>>ChromaLog2WeightDenom)+2自乘到(所述发信号通知的位深度-1)))。
7.根据权利要求6所述的方法,其中解码所述视频数据包括,在针对色度样本执行经加权预测过程时:
将在所述经加权预测过程中使用的变量o0的值计算为等于ChromaOffsetL0[refIdxL0][cIdx-1]变量,而不计算(1<<(所述发信号通知的位深度-8));
将在所述经加权预测过程中使用的变量o1的值计算为等于ChromaOffsetL1[refIdxL1][cIdx-1]变量,而不计算(1<<(所述发信号通知的位深度-8))。
8.根据权利要求1所述的方法,其中所述一或多个参数包括luma_offset_l0[i]参数、luma_offset_l1[i]参数、delta_chroma_offset_l0[i][j]参数及delta_chroma_offset_l1[i][j]参数。
9.根据权利要求1所述的方法,其中解码所述视频数据包括根据所述发信号通知的位深度自适应地执行右移操作。
10.根据权利要求1所述的方法,其中表示是否启用具有所述发信号通知的位深度的所述经加权预测的所述语法元素包括use_high_precision_weighted_prediction_flag。
11.根据权利要求1所述的方法,其中所述视频数据符合高效率视频译码HEVC,其中所述第一参数列表包括luma_offset_l0,其中所述第二参数列表包括luma_offset_l1,其中所述第一变量包括o0,其中计算所述o0的所述值包括将o0的所述值计算为等于luma_offset_l0[refIdxL0],其中所述第二变量包括o1,且其中计算o1的所述值包括将o1的所述值计算为等于luma_offset_l1[refIdxL1]。
12.一种编码视频数据的方法,所述方法包括:
确定针对视频数据启用具有发信号通知的位深度的经加权预测;
在确定启用具有所述发信号通知的位深度的所述经加权预测之后:
编码指示启用具有所述发信号通知的位深度的所述经加权预测的语法元素的值;
编码表示所述视频数据的一或多个参数的所述发信号通知的位深度的语法元素的值,其中所述一或多个参数包括各自表示应用到明度预测值以用于第一参考图片列表预测的加性偏移的参数的第一列表或各自表示应用到明度预测值以用于第二参考图片列表预测的加性偏移的参数的第二列表;
编码所述参数的值以使得所述参数的所述值表示基于所述发信号通知的位深度的位深度;及
至少部分基于所述参数的所述值而编码所述视频数据,其中编码所述视频数据包括,在针对明度样本执行经加权预测过程时:
将所述经加权预测过程中使用的第一变量的值计算为等于所述第一参数列表的所述参数中的一者的值,而不计算(1<<(所述发信号通知的位深度-8));及
将所述经加权预测过程中使用的第二变量的值计算为等于所述第二参数列表的所述参数中的一者的值,而不计算(1<<(所述发信号通知的位深度-8))。
13.根据权利要求12所述的方法,其中编码指示启用具有所述发信号通知的位深度的所述经加权预测的所述语法元素的所述值包括编码所述视频数据的图片序列的序列参数集SPS的语法元素的值。
14.根据权利要求12所述的方法,其中编码所述第一参数列表的所述参数中的所述一者或所述第二参数列表的所述参数中的所述一者的值包括编码在-2自乘到(所述发信号通知的位深度-1)到2自乘到(所述发信号通知的位深度-1)-1且包括-2自乘到(所述发信号通知的位深度-1)和2自乘到(所述发信号通知的位深度-1)的范围内的值。
15.根据权利要求12所述的方法,
其中所述一或多个经加权预测参数包括delta_chroma_offset_l0[i][j]参数或delta_chroma_offset_l1[i][j]参数,且
其中编码所述delta_chroma_offset_l0[i][j]参数或所述delta_chroma_offset_l1[i][j]参数的值包括编码在-2自乘到(所述发信号通知的位深度+1)到2自乘到(所述发信号通知的位深度+1)-1且包括-2自乘到(所述发信号通知的位深度+1)和2自乘到(所述发信号通知的位深度+1)-1的范围内的值。
16.根据权利要求15所述的方法,其中编码所述视频数据包括,在针对色度样本执行经加权预测过程时:
从所述delta_chroma_offset_l0[i][j]参数计算ChromaOffsetL0[refIdxL0][cIdx-1]变量的值;
将在所述经加权预测过程中使用的变量o0的值计算为等于所述ChromaOffsetL0[refIdxL0][cIdx-1]变量,而不计算(1<<(所述发信号通知的位深度-8));
从所述delta_chroma_offset_l1[i][j]参数计算ChromaOffsetL1[refIdxL1][cIdx-1]变量的值;及
将在所述经加权预测过程中使用的变量o1的值计算为等于所述ChromaOffsetL1[refIdxL1][cIdx-1]变量,而不计算(1<<(所述发信号通知的位深度-8))。
17.根据权利要求12所述的方法,其中所述一或多个参数包括luma_offset_l0[i]参数、luma_offset_l1[i]参数、delta_chroma_offset_l0[i][j]参数及delta_chroma_offset_l1[i][j]参数。
18.根据权利要求12所述的方法,其中表示是否启用具有所述发信号通知的位深度的所述经加权预测的所述语法元素包括use_high_precision_weighted_prediction_flag。
19.根据权利要求12所述的方法,其中所述视频数据符合高效率视频译码HEVC,其中所述第一参数列表包括luma_offset_l0,其中所述第二参数列表包括luma_offset_l1,其中所述第一变量包括o0,其中计算所述o0的所述值包括将o0的所述值计算为等于luma_offset_l0[refIdxL0],其中所述第二变量包括o1,且其中计算o1的所述值包括将o1的所述值计算为等于luma_offset_l1[refIdxL1]。
20.一种用于译码视频数据的装置,所述装置包括:
存储器,其经配置以存储视频数据;及
视频译码器,其经配置以:
译码表示是否针对所述视频数据启用具有发信号通知的位深度的经加权预测的语法元素的值,且在所述语法元素的所述值指示启用具有所述发信号通知的位深度的所述经加权预测时:
译码表示所述视频数据的一或多个参数的所述发信号通知的位深度的语法元素的值,其中所述一或多个参数包括各自表示应用到明度预测值以用于第一参考图片列表预测的加性偏移的参数的第一列表或各自表示应用到明度预测值以用于第二参考图片列表预测的加性偏移的参数的第二列表,
译码所述参数的值以使得所述参数的所述值表示基于表示所述发信号通知的位深度的所述语法元素的所述值的位深度,及
至少部分基于所述参数的所述值而译码所述视频数据,其中所述视频译码器进一步经配置以在针对明度样本执行经加权预测过程时:
将所述经加权预测过程中使用的第一变量的值计算为等于所述第一参数列表的所述参数中的一者的值,而不计算(1<<(所述发信号通知的位深度-8)),及
将所述经加权预测过程中使用的第二变量的值计算为等于所述第二参数列表的所述参数中的一者的值,而不计算(1<<(所述发信号通知的位深度-8))。
21.根据权利要求20所述的装置,其中所述视频译码器经配置以在所述视频数据的图片序列的序列参数集SPS中译码表示是否启用具有所述发信号通知的位深度的所述经加权预测的所述语法元素的所述值。
22.根据权利要求20所述的装置,其中所述视频译码器经配置以在-2自乘到(所述发信号通知的位深度-1)到2自乘到(所述发信号通知的位深度-1)-1且包括-2自乘到(所述发信号通知的位深度-1)和2自乘到(所述发信号通知的位深度-1)的范围内译码所述第一参数列表的所述参数中的所述一者或所述第二参数列表的所述参数中的所述一者的值。
23.根据权利要求20所述的装置,其中所述一或多个经加权预测参数包括delta_chroma_offset_l0[i][j]参数或delta_chroma_offset_l1[i][j]参数,且其中所述视频译码器经配置以将所述delta_chroma_offset_l0[i][j]参数或所述delta_chroma_offset_l1[i][j]参数的值译码为在-2自乘到(所述发信号通知的位深度+1)到2自乘到(所述发信号通知的位深度+1)-1且包括-2自乘到(所述发信号通知的位深度+1)和2自乘到(所述发信号通知的位深度+1)-1的范围内的值。
24.根据权利要求23所述的装置,其中所述视频译码器经配置以在针对色度样本执行经加权预测过程时:从所述delta_chroma_offset_l0[i][j]参数计算ChromaOffsetL0[refIdxL0][cIdx-1]变量的值;将在经加权预测过程中使用的变量o0的值计算为等于所述ChromaOffsetL0[refIdxL0][cIdx-1]变量,而不计算(1<<(所述发信号通知的位深度-8));从所述delta_chroma_offset_l1[i][j]参数计算ChromaOffsetL1[refIdxL1][cIdx-1]变量的值;及将在所述经加权预测过程中使用的变量o1的值计算为等于所述ChromaOffsetL1[refIdxL1][cIdx-1]变量,而不计算(1<<(所述发信号通知的位深度-8))。
25.根据权利要求20所述的装置,其中所述一或多个参数包括luma_offset_l0[i]参数、luma_offset_l1[i]参数、delta_chroma_offset_l0[i][j]参数及delta_chroma_offset_l1[i][j]参数。
26.根据权利要求20所述的装置,其中所述视频译码器包括视频解码器。
27.根据权利要求20所述的装置,其中所述视频译码器包括视频编码器。
28.根据权利要求20所述的装置,其中表示是否启用具有所述发信号通知的位深度的所述经加权预测的所述语法元素包括use_high_precision_weighted_prediction_flag。
29.根据权利要求20所述的装置,其中所述装置包括以下各者中的至少一者:
集成电路;
微处理器;及
无线通信装置。
30.根据权利要求20所述的装置,其中所述视频数据符合高效率视频译码HEVC,其中所述第一参数列表包括luma_offset_l0,其中所述第二参数列表包括luma_offset_l1,其中所述第一变量包括o0,其中所述视频译码器经配置以将o0的所述值计算为等于luma_offset_l0[refIdxL0],其中所述第二变量包括o1,且其中所述视频译码器经配置以将o1的所述值计算为等于luma_offset_l1[refIdxL1]。
31.一种用于译码视频数据的装置,所述装置包括:
用于译码表示是否针对视频数据启用具有发信号通知的位深度的经加权预测的语法元素的值的装置;
用于在所述语法元素的所述值指示启用具有所述发信号通知的位深度的所述经加权预测时译码表示所述视频数据的一或多个参数的所述发信号通知的位深度的语法元素的值的装置,其中所述一或多个参数包括各自表示应用到明度预测值以用于第一参考图片列表预测的加性偏移的参数的第一列表或各自表示应用到明度预测值以用于第二参考图片列表预测的加性偏移的参数的第二列表;
用于在所述语法元素的所述值指示启用具有所述发信号通知的位深度的所述经加权预测时译码所述参数的值以使得所述参数的所述值表示基于表示所述发信号通知的位深度的所述语法元素的所述值的位深度的装置;及
用于在所述语法元素的所述值指示启用具有所述发信号通知的位深度的所述经加权预测时至少部分基于所述参数的所述值而译码所述视频数据的装置,其中所述用于译码所述视频数据的装置包括:
用于将所述经加权预测过程中使用的第一变量的值计算为等于所述第一参数列表的所述参数中的一者的值而不计算(1<<(所述发信号通知的位深度-8))的装置;及
用于将所述经加权预测过程中使用的第二变量的值计算为等于所述第二参数列表的所述参数中的一者的值而不计算(1<<(所述发信号通知的位深度-8))的装置。
32.根据权利要求31所述的装置,其中所述视频数据符合高效率视频译码HEVC,其中所述第一参数列表包括luma_offset_l0,其中所述第二参数列表包括luma_offset_l1,其中所述第一变量包括o0,其中所述用于计算o0的所述值的装置包括用于将o0的所述值计算为等于luma_offset_l0[refIdxL0]的装置,其中所述第二变量包括o1,且其中所述用于计算o1的所述值的装置包括用于将o1的所述值计算为等于luma_offset_l1[refIdxL1]的装置。
33.一种计算机可读存储媒体,其具有存储于其上的指令,所述指令在被执行时致使处理器:
译码表示是否针对视频数据启用具有发信号通知的位深度的经加权预测的语法元素的值;
在所述语法元素的所述值指示启用具有所述发信号通知的位深度的所述经加权预测时:
译码表示所述视频数据的一或多个参数的所述发信号通知的位深度的语法元素的值,其中所述一或多个参数包括各自表示应用到明度预测值以用于第一参考图片列表预测的加性偏移的参数的第一列表或各自表示应用到明度预测值以用于第二参考图片列表预测的加性偏移的参数的第二列表;
译码所述参数的值以使得所述参数的所述值表示基于表示所述发信号通知的位深度的所述语法元素的所述值的位深度;及
至少部分基于所述参数的所述值而译码所述视频数据,其中所述致使所述处理器译码所述视频数据的指令包括在针对明度样本执行经加权预测过程时致使所述处理器进行以下操作的指令:
将所述经加权预测过程中使用的第一变量的值计算为等于所述第一参数列表的所述参数中的一者的值,而不计算(1<<(所述发信号通知的位深度-8));及
将所述经加权预测过程中使用的第二变量的值计算为等于所述第二参数列表的所述参数中的一者的值,而不计算(1<<(所述发信号通知的位深度-8))。
34.根据权利要求33所述的计算机可读媒体,其中所述致使所述处理器译码指示启用具有所述发信号通知的位深度的所述经加权预测的所述语法元素的所述值的指令包括致使所述处理器译码所述视频数据的图片序列的序列参数集SPS的语法元素的值的指令。
35.根据权利要求33所述的计算机可读媒体,其中所述致使所述处理器译码所述第一参数列表的所述参数中的所述一者或所述第二参数列表的所述参数中的所述一者的值的指令包括致使所述处理器进行以下操作的指令:译码在-2自乘到(所述发信号通知的位深度-1)到2自乘到(所述发信号通知的位深度-1)-1且包括-2自乘到(所述发信号通知的位深度-1)和2自乘到(所述发信号通知的位深度-1)的范围内的值。
36.根据权利要求33所述的计算机可读媒体,其中所述一或多个经加权预测参数包括delta_chroma_offset_l0[i][j]参数或delta_chroma_offset_l1[i][j]参数,且其中所述致使所述处理器译码所述delta_chroma_offset_l0[i][j]参数或所述delta_chroma_offset_l1[i][j]参数的值的指令包括致使所述处理器进行以下操作的指令:译码在-2自乘到(所述发信号通知的位深度+1)到2自乘到(所述发信号通知的位深度+1)-1且包括-2自乘到(所述发信号通知的位深度+1)和2自乘到(所述发信号通知的位深度+1)-1的范围内的值。
37.根据权利要求36所述的计算机可读媒体,其中所述致使所述处理器译码所述视频数据的指令包括在针对色度样本执行高精度经加权预测过程时致使所述处理器进行以下操作的指令:
从所述delta_chroma_offset_l0[i][j]参数计算ChromaOffsetL0[refIdxL0][cIdx-1]变量的值;
将在所述高精度经加权预测过程中使用的变量o0的值计算为等于所述ChromaOffsetL0[refIdxL0][cIdx-1]变量,而不计算(1<<(所述发信号通知的位深度-8));
从所述delta_chroma_offset_l1[i][j]参数计算ChromaOffsetL1[refIdxL1][cIdx-1]变量的值;及
将在所述高精度经加权预测过程中使用的变量o1的值计算为等于所述ChromaOffsetL1[refIdxL1][cIdx-1]变量,而不计算(1<<(所述发信号通知的位深度-8))。
38.根据权利要求33所述的计算机可读存储媒体,其中所述一或多个参数包括luma_offset_l0[i]参数、luma_offset_l1[i]参数、delta_chroma_offset_l0[i][j]参数及delta_chroma_offset_l1[i][j]参数。
39.根据权利要求33所述的计算机可读存储媒体,其中表示是否启用具有所述发信号通知的位深度的所述经加权预测的所述语法元素包括use_high_precision_weighted_prediction_flag。
40.根据权利要求33所述的计算机可读存储媒体,其中所述视频数据符合高效率视频译码HEVC,其中所述第一参数列表包括luma_offset_l0,其中所述第二参数列表包括luma_offset_l1,其中所述第一变量包括o0,其中所述致使所述处理器计算所述o0的所述值的指令包括致使所述处理器将o0的所述值计算为等于luma_offset_l0[refIdxL0]的指令,其中所述第二变量包括o1,且其中致使所述处理器计算o1的所述值的指令包括致使所述处理器将o1的所述值计算为等于luma_offset_l1[refIdxL1]的指令。
CN201480054053.XA 2013-10-03 2014-10-02 编码及解码视频数据的方法、装置及计算机可读存储媒体 Active CN105659603B (zh)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201361886230P 2013-10-03 2013-10-03
US61/886,230 2013-10-03
US201361892198P 2013-10-17 2013-10-17
US61/892,198 2013-10-17
US14/504,097 2014-10-01
US14/504,097 US9497473B2 (en) 2013-10-03 2014-10-01 High precision explicit weighted prediction for video coding
PCT/US2014/058822 WO2015051118A1 (en) 2013-10-03 2014-10-02 High precision explicit weighted prediction for video coding

Publications (2)

Publication Number Publication Date
CN105659603A CN105659603A (zh) 2016-06-08
CN105659603B true CN105659603B (zh) 2018-09-14

Family

ID=52776930

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201480054053.XA Active CN105659603B (zh) 2013-10-03 2014-10-02 编码及解码视频数据的方法、装置及计算机可读存储媒体

Country Status (10)

Country Link
US (1) US9497473B2 (zh)
EP (1) EP3053340B1 (zh)
JP (1) JP6151446B2 (zh)
KR (1) KR101772350B1 (zh)
CN (1) CN105659603B (zh)
BR (1) BR112016007360B1 (zh)
CA (1) CA2925130C (zh)
ES (1) ES2649532T3 (zh)
HU (1) HUE036681T2 (zh)
WO (1) WO2015051118A1 (zh)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104079941B (zh) * 2013-03-27 2017-08-25 中兴通讯股份有限公司 一种深度信息编解码方法、装置及视频处理播放设备
WO2015069734A1 (en) * 2013-11-05 2015-05-14 Arris Enterprises, Inc. Bit depth variable for high precision data in weighted prediction syntax and semantics
WO2015069729A1 (en) * 2013-11-05 2015-05-14 Arris Enterprises, Inc. Simplified processing of weighted prediction syntax and semantics using a bit depth variable for high precision data
US10250904B2 (en) * 2015-05-05 2019-04-02 Avago Technologies International Sales Pte. Limited Apparatus and method for overlapped motion compensation for video coding
CN108353185B (zh) 2015-08-28 2022-09-13 株式会社Kt 用于处理视频信号的方法和设备
US10602187B2 (en) * 2015-11-30 2020-03-24 Intel Corporation Efficient, compatible, and scalable intra video/image coding using wavelets and HEVC coding
EP3854079A1 (en) * 2018-09-21 2021-07-28 InterDigital VC Holdings, Inc. Method and apparatus for video encoding and decoding using bi-prediction
MX2021009323A (es) * 2019-06-24 2021-09-08 Huawei Tech Co Ltd Calculo de distancia de muestra para modo de division geometrica.
US11496774B2 (en) * 2019-08-27 2022-11-08 Tencent America LLC Header syntax for QT/BT/TT size
WO2021047631A1 (en) * 2019-09-13 2021-03-18 Beijing Bytedance Network Technology Co., Ltd. Derivation of collocated motion vectors
EP4029261A4 (en) * 2019-10-07 2022-11-23 Huawei Technologies Co., Ltd. METHOD AND APPARATUS FOR ADAPTIVE WEIGHTING PREDICTION PARAMETER PRECISION ADJUSTMENT FOR HARMONIZING NON-RECTANGULAR FUSION MODE AND WEIGHTED PREDICTION
EP4078965A4 (en) * 2020-01-12 2023-04-05 Huawei Technologies Co., Ltd. METHOD AND APPARATUS FOR HARMONIZING A WEIGHTED PREDICTION
CA3167876A1 (en) * 2020-01-13 2021-07-22 Lg Electronics Inc. Method and device for weighted prediction for image/video coding
JP7410317B2 (ja) 2020-02-19 2024-01-09 バイトダンス インコーポレイテッド ビットストリームの一般制約情報における予測重みのシグナリング
WO2022126033A1 (en) * 2020-12-29 2022-06-16 Innopeak Technology, Inc. Method and apparatus for extended precision weighted prediction for vvc high bit depth coding

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101822059A (zh) * 2007-10-15 2010-09-01 汤姆森许可贸易公司 可缩放视频的层间残差预测的方法和设备

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100612849B1 (ko) * 2003-07-18 2006-08-14 삼성전자주식회사 영상 부호화 및 복호화 장치 및 방법
JP4561508B2 (ja) * 2005-07-08 2010-10-13 ソニー株式会社 画像処理装置、画像処理方法およびそのプログラム
US7956930B2 (en) * 2006-01-06 2011-06-07 Microsoft Corporation Resampling and picture resizing operations for multi-resolution video coding and decoding
CN102388611B (zh) * 2009-02-11 2015-08-19 汤姆森特许公司 使用色调映射和反色调映射的比特深度可分级视频编码和解码的方法和装置
US8711930B2 (en) * 2009-07-09 2014-04-29 Qualcomm Incorporated Non-zero rounding and prediction mode selection techniques in video encoding
US9154796B2 (en) * 2011-11-04 2015-10-06 Qualcomm Incorporated Intra-mode video coding
TWI521946B (zh) * 2012-12-21 2016-02-11 杜比實驗室特許公司 在高位元深度視訊的可適性編碼中,高精度升取樣

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101822059A (zh) * 2007-10-15 2010-09-01 汤姆森许可贸易公司 可缩放视频的层间残差预测的方法和设备

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Improvement of Implicit Weighted Prediction;Wei-Jung Chien et al.;《Joint Collaborative Team on Video Coding (JCT-VC)of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11 9th Meeting: Geneva, CH, 27 April-7 May 2012》;20120507;全文 *
Range Extensions Draft 4;FLYNN D ET AL;《JOINT COLLABORATIVE TEAM ON VIDEO CODING OF ISO/IEC JTC1/SC29/WG11 AND ITU-T SG.16》;20130802;全文 *

Also Published As

Publication number Publication date
EP3053340A1 (en) 2016-08-10
WO2015051118A1 (en) 2015-04-09
CN105659603A (zh) 2016-06-08
KR20160068808A (ko) 2016-06-15
CA2925130A1 (en) 2015-04-09
EP3053340B1 (en) 2017-09-13
BR112016007360B1 (pt) 2023-04-11
US20150098503A1 (en) 2015-04-09
CA2925130C (en) 2019-02-12
ES2649532T3 (es) 2018-01-12
US9497473B2 (en) 2016-11-15
JP6151446B2 (ja) 2017-06-21
HUE036681T2 (hu) 2018-07-30
JP2016538749A (ja) 2016-12-08
KR101772350B1 (ko) 2017-08-28
BR112016007360A2 (pt) 2017-08-01

Similar Documents

Publication Publication Date Title
CN105659603B (zh) 编码及解码视频数据的方法、装置及计算机可读存储媒体
CN112740681B (zh) 自适应多重变换译码
CN107211124B (zh) 用于译码视频数据的方法、装置和计算机可读存储媒体
CN105723707B (zh) 用于视频译码的色彩残差预测
CN105474645B (zh) 对视频数据进行解码的方法、对视频数据进行编码的方法、视频解码装置及视频编码装置
CN104704833B (zh) 多视图或3维视频译码中的高级视图间残差预测
CN105493507B (zh) 用于帧内块复制的残余预测
CN104521237B (zh) 用于可缩放视频译码及3d视频译码的多假设运动补偿
CN104737537B (zh) 用于译码数字视频的设备、解码视频的方法、编码视频的方法及计算机可读存储媒体
CN103891293B (zh) 用于色度分量的自适应环路滤波的方法及设备
CN107690803B (zh) 用于高动态范围及广色域视频译码的自适应常量照度方法
CN105637866B (zh) 自适应色彩分量间残差预测
CN106105206B (zh) 用于使用置零系数的低复杂度正变换的系统和方法
CN105284113B (zh) 分量间滤波
CN103959775B (zh) 一种视频数据编解码的方法及设备
CN104126301B (zh) 在视频译码中使用码簿对环路滤波器参数进行译码
CN103959777B (zh) 视频译码中的与自适应环路滤波器合并的样本自适应偏移
CN104221381B (zh) 用于视频译码的波前并行处理的方法、装置及计算机可读存储媒体
CN104303501B (zh) 用于视频译码的量化矩阵和解块滤波器
CN103947207B (zh) 用于图片分割方案的统一设计
CN103563378B (zh) 存储器高效的上下文建模
CN105794211B (zh) 一种编解码视频数据的方法、装置及可读存储媒体
CN104365106B (zh) 发信用于视频译码的长期参考图片的数据
CN105075258B (zh) 针对具有不同纵横比的空间可缩放性的层间参考图片建构
CN104604224B (zh) 可缩放视频译码中的变换基底调整

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant