CN104170381A - 在高效率视频译码及其扩展中的运动矢量译码及双向预测 - Google Patents
在高效率视频译码及其扩展中的运动矢量译码及双向预测 Download PDFInfo
- Publication number
- CN104170381A CN104170381A CN201380014234.5A CN201380014234A CN104170381A CN 104170381 A CN104170381 A CN 104170381A CN 201380014234 A CN201380014234 A CN 201380014234A CN 104170381 A CN104170381 A CN 104170381A
- Authority
- CN
- China
- Prior art keywords
- motion vector
- current
- reference picture
- video
- predicted value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/597—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/137—Motion inside a coding unit, e.g. average field, frame or block difference
- H04N19/139—Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/513—Processing of motion vectors
- H04N19/517—Processing of motion vectors by encoding
- H04N19/52—Processing of motion vectors by encoding by predictive encoding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/105—Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
Abstract
在一个实例中,一种装置包括视频译码器(例如,视频编码器或视频解码器),所述视频译码器经配置以确定视频数据块将根据高效率视频译码HEVC的三维扩展而译码,且基于所述块将根据HEVC的所述三维扩展而译码的所述确定,禁用将时间运动矢量预测用于译码所述块。所述视频译码器可经进一步配置以在所述块包含经双向预测块(B块)时,确定所述B块参考第一参考图片列表及第二参考图片列表中的预定对图片,且基于所述B块参考所述预定对的所述确定,在计算所述块的预测性块时对来自所述对图片的贡献相等地进行加权。
Description
本申请案主张以下美国临时专利申请案的权利,所述申请案中的每一者的全部内容特此以引用的方式并入:
2012年3月16日申请的美国临时申请案第61/611,959号;
2012年4月16日申请的美国临时申请案第61/624,990号;
2012年6月11日申请的美国临时申请案第61/658,344号;及
2012年6月22日申请的美国临时申请案第61/663,484号。
技术领域
本发明是关于视频译码。
背景技术
可将数字视频能力并入到广泛范围的装置中,所述装置包括数字电视、数字直播系统、无线广播系统、个人数字助理(PDA)、便携式计算机或台式计算机、平板计算机、电子书阅读器、数字相机、数字记录装置、数字媒体播放器、视频游戏装置、视频游戏控制台、蜂窝或卫星无线电话、所谓的“智能手机”、视频电话会议装置、视频流式处理装置,及其类似者。数字视频装置实施视频译码技术,诸如在以下各者中所描述的技术:由MPEG-2、MPEG-4、ITU-T H.263、ITU-T H.264/MPEG-4第10部分(高级视频译码(AVC))所定义的标准、目前在开发中的高效率视频译码(HEVC)标准,及这些标准的扩展,诸如可缩放视频译码(SVC)及多视图视频译码(MVC)。HEVC的工作草案(WD)的版本6可得自http://phenix.int-evry.fr/jct/doc_end_user/documents/8_San%20Jose/wg 11/JCTVC-H1003-v21.zip。视频装置可通过实施这些视频译码技术而更有效地传输、接收、编码、解码及/或存储数字视频信息。
视频译码技术包括空间(图片内)预测及/或时间(图片间)预测,以缩减或移除视频序列中所固有的冗余。对于基于块的视频译码,可将视频切片(例如,视频帧或视频帧的部分)分割为多个视频块,所述视频块也可被称为树块、译码单元(CU)及/或译码节点。图片的经帧内译码(I)切片中的视频块是相对于同一图片中的相邻块中的参考样本使用空间预测而编码。图片的经帧间译码(P或B)切片中的视频块可相对于同一图片中的相邻块中的参考样本使用空间预测,或相对于其它参考图片中的参考样本使用时间预测。图片可被称为帧,且参考图片可被称为参考帧。
空间或时间预测产生待译码的块的预测性块。残余数据表示在待译码的原始块与预测性块之间的像素差。根据运动矢量及残余数据来编码经帧间译码块,所述运动矢量指向形成预测性块的参考样本的块,所述残余数据指示在经译码块与预测性块之间的差。根据帧内译码模式及残余数据来编码帧内译码块。为了进一步压缩,可将残余数据从像素域变换到变换域,从而产生接着可量化的残余变换系数。可扫描最初以二维阵列而排列的经量化变换系数,以便产生变换系数的一维矢量,且可应用熵译码以实现甚至更大程度的压缩。
发明内容
一般而言,本发明描述用于译码运动矢量且用于在高效率视频译码(HEVC)及其扩展(诸如,多视图或三维视频(3DV)扩展)中执行双向预测的技术。本发明的技术可支持与在基础编解码器设计中的多视图视频编解码器及/或3D视频代码的较佳前向兼容性。
在一个实例中,一种解码视频数据的方法包括:确定视频数据的当前块的当前运动矢量的第一类型;确定所述当前块的相邻块的候选运动矢量预测值的第二类型;在所述第一类型不同于所述第二类型时将表示所述候选运动矢量预测值是否可用的变量设置为指示所述候选运动矢量预测值不可用的值;及至少部分地基于所述变量的所述值而解码所述当前运动矢量。
在另一实例中,一种编码视频数据的方法包括:确定视频数据的当前块的当前运动矢量的第一类型;确定所述当前块的相邻块的候选运动矢量预测值的第二类型;在所述第一类型不同于所述第二类型时将表示所述候选运动矢量预测值是否可用的变量设置为指示所述候选运动矢量预测值不可用的值;及至少部分地基于所述变量的所述值而编码所述当前运动矢量。
在另一实例中,一种用于解码视频数据的装置包括经配置以执行以下操作的视频解码器:确定视频数据的当前块的当前运动矢量的第一类型;确定所述当前块的相邻块的候选运动矢量预测值的第二类型;在所述第一类型不同于所述第二类型时将表示所述候选运动矢量预测值是否可用的变量设置为指示所述候选运动矢量预测值不可用的值;及至少部分地基于所述变量的所述值而解码所述当前运动矢量。
在另一实例中,一种用于编码视频数据的装置包括经配置以执行以下操作的视频编码器:确定视频数据的当前块的当前运动矢量的第一类型;确定所述当前块的相邻块的候选运动矢量预测值的第二类型;在所述第一类型不同于所述第二类型时将表示所述候选运动矢量预测值是否可用的变量设置为指示所述候选运动矢量预测值不可用的值;及至少部分地基于所述变量的所述值而编码所述当前运动矢量。
在另一实例中,一种用于解码视频数据的装置包括:用于确定视频数据的当前块的当前运动矢量的第一类型的装置;用于确定所述当前块的相邻块的候选运动矢量预测值的第二类型的装置;用于在所述第一类型不同于所述第二类型时将表示所述候选运动矢量预测值是否可用的变量设置为指示所述候选运动矢量预测值不可用的值的装置;及用于至少部分地基于所述变量的所述值而解码所述当前运动矢量的装置。
在另一实例中,一种用于编码视频数据的装置包括:用于确定视频数据的当前块的当前运动矢量的第一类型的装置;用于确定所述当前块的相邻块的候选运动矢量预测值的第二类型的装置;用于在所述第一类型不同于所述第二类型时将表示所述候选运动矢量预测值是否可用的变量设置为指示所述候选运动矢量预测值不可用的值的装置;及用于至少部分地基于所述变量的所述值而编码所述当前运动矢量的装置。
在另一实例中,一种计算机可读存储媒体(例如,非暂时性计算机可读存储媒体)在其上存储有指令,所述指令在执行时使处理器执行以下操作:确定视频数据的当前块的当前运动矢量的第一类型;确定所述当前块的相邻块的候选运动矢量预测值的第二类型;在所述第一类型不同于所述第二类型时将表示所述候选运动矢量预测值是否可用的变量设置为指示所述候选运动矢量预测值不可用的值;及至少部分地基于所述变量的所述值而解码所述当前运动矢量。
在另一实例中,一种计算机可读存储媒体(例如,非暂时性计算机可读存储媒体)在其上存储有指令,所述指令在执行时使处理器执行以下操作:确定视频数据的当前块的当前运动矢量的第一类型;确定所述当前块的相邻块的候选运动矢量预测值的第二类型;在所述第一类型不同于所述第二类型时将表示所述候选运动矢量预测值是否可用的变量设置为指示所述候选运动矢量预测值不可用的值;及至少部分地基于所述变量的所述值而编码所述当前运动矢量。
在随附图式及以下描述中阐述一或多个实例的细节。其它特征、目标及优点将从所述描述及所述图式以及从权利要求书显而易见。
附图说明
图1为说明实例视频编码及解码系统的框图,所述系统可利用用于译码运动矢量且用于在高效率视频译码(HEVC)及其扩展(诸如,多视图或三维视频(3DV)扩展)中执行双向预测的技术。
图2为说明视频编码器的实例的框图,所述视频编码器可实施用于译码运动矢量且用于在HEVC及其扩展(诸如,多视图或3DV扩展)中执行双向预测的技术。
图3为说明视频解码器30的实例的框图,视频解码器30可实施用于译码运动矢量且用于在HEVC及其扩展(诸如,多视图或3DV扩展)中执行双向预测的技术。
图4为说明实例MVC预测样式的概念图。
图5为说明根据本发明的技术的用于编码当前块的实例方法的流程图。
图6为说明根据本发明的技术的用于解码视频数据的当前块的实例方法的流程图。
具体实施方式
一般而言,本发明描述用于译码多视图视频译码(MVC)数据的技术。当前,动画专家组(MPEG)正基于即将到来的高效率视频译码(HEVC)标准来开发三维视频(3DV)标准。标准化努力的部分也包括基于HEVC的多视图视频编解码器的标准化。在二维视频译码中,视频数据(即,图片的序列)是逐图片地(未必以显示顺序)译码。视频译码装置将每一图片划分为多个块,且个别地译码每一块。基于块的预测模式包括也称为帧内预测的空间预测及也称为帧间预测的时间预测。
对于诸如基于HEVC的3DV的三维视频数据,块也可被视图间预测。即,可从另一视图的图片预测块,其中每一视图一般对应于相应相机位置。如此,在基于HEVC的3DV中,可启用基于来自不同视图的经重建视图分量的视图间预测。本发明使用术语“视图分量”来指特定视图的经编码图片。即,视图分量可包含在特定时间(依据显示顺序或输出顺序)的特定视图的经编码图片。视图分量(或视图分量的切片)可具有图片顺序计数(POC)值,所述值一般指示视图分量的显示顺序(或输出顺序)。
在时间帧间预测或视图间预测中,视频译码装置可译码指示一或多个运动矢量(时间帧间预测)及/或一或多个位移矢量(视图间预测)的数据。在一些实例中,用一个运动矢量或一个位移矢量译码的块被称为P块,而用两个运动矢量或两个位移矢量译码的块被称为双向预测性块或B块。适用于运动矢量的技术也一般适用于位移矢量,且因此,本发明主要描述运动矢量译码技术。然而,应理解,这些技术也适用于位移矢量,且同样地,关于位移矢量所描述的技术也适用于运动矢量,除非另有指示。
一般而言,指示运动矢量或位移矢量可参考的参考图片的数据存储在参考图片列表中。因此,运动矢量数据(或位移矢量数据)可不仅包括运动矢量的x分量及y分量的数据,而且包括参考图片列表的条目的指示,这个指示被称为参考图片索引。视频译码装置可构造多个参考图片列表。举例来说,视频译码装置可构造第一参考图片列表(列表0或RefPicList0)以存储POC值早于当前图片的参考图片的数据,且构造第二参考图片列表(列表1或RefPicList1)以存储POC值晚于当前图片的参考图片的数据。此外,应注意,图片的显示或输出顺序未必与译码顺序值(例如,帧号码或“frame_num”值)相同。因此,图片可以不同于图片被显示(或捕获)的顺序的顺序而译码。
通常,针对B图片的第一参考图片列表或第二参考图片列表的参考图片列表构造包括两个步骤:参考图片列表初始化及参考图片列表重排(修改)。参考图片列表初始化为显式机制,其基于POC(图片顺序计数,其与图片的显示顺序对齐)值的顺序将参考图片存储器(也称为经解码图片缓冲器)中的参考图片放到列表中。参考图片列表重排机制可将在参考图片列表初始化期间放在列表中的图片的位置修改为任何新位置,或将参考图片存储器中的任何参考图片放在任何位置,甚至在所述图片不属于初始化列表的情况下也如此。一些图片在参考图片列表重排(修改)之后可放在列表中的另一位置。然而,如果图片的位置超出列表的活动参考图片的数目,那么图片不被视为最终参考图片列表的条目。可针对每一列表在切片标头中发信活动参考图片的数目。在参考图片列表被构造(例如,RefPicList0及RefPicList1,如果可用)之后,参考索引可用以识别在任何参考图片列表中的图片。
如上文所提到,运动矢量数据也可包括水平分量(或x分量)及垂直分量(或y分量)。因此,运动矢量可定义为<x,y>。视频译码装置可相对于运动矢量预测值译码运动矢量,而非直接地译码运动矢量的x分量及y分量。在各种实例中,运动矢量预测值可选自当前块的空间相邻者、时间上分离的图片的同置块(即,先前经译码图片中的同置块),或在同一时间例项的另一视图中的图片的同置块。时间上分离的图片的运动矢量预测值被称为时间运动矢量预测值(TMVP)。
为了确定当前块(例如,HEVC中的当前译码单元(CU)的当前预测单元(PU))的TMVP,视频译码装置可首先识别同置图片。术语“同置”图片是指包括特定同置块的图片。同置块也可包括在“同置分区”中,如HEVC的WD6中所指示。如果当前图片为B切片,那么可在当前图片的切片的切片标头中发信collocated_from_l0_flag,以指示同置图片是来自RefPicList0还是RefPicList1。在参考图片列表被识别之后,视频译码装置可使用在切片标头中发信的collocated_ref_idx,以在参考图片列表中识别同置图片。接着通过检查同置图片来识别同置PU。可将含有当前PU的CU的右下PU的运动矢量或含有这个PU的CU的中心PU内的右下PU的运动矢量视为当前PU的TMVP。当通过以上进程所识别的运动矢量用以针对AMVP或合并模式产生运动候选者时,其可基于时间位置(由参考图片的POC值反映)而缩放。根据本发明的技术,如下文所描述,TMVP可来自同一视图或来自不同视图。
在HEVC中,图片参数集(PPS)包括标志enable_temporal_mvp_flag。当temporal_id等于0的特定图片参考具有等于0的enable_temporal_mvp_flag的PPS时,DPB中的所有参考图片可标记为“不用于时间运动矢量预测”,且来自在解码顺序上处于那个特定图片之前的图片的运动矢量在解码特定图片或在解码顺序上处于所述特定图片之后的图片时将不会用作时间运动矢量预测值。
在H.264/AVC或HEVC中,对于P切片,当允许加权预测时,通过将weighted_pred_flag设置为1,显式地发信预测权重。语法元素weighted_pred_flag是在切片标头中发信且其语义如下:
在一些实例中,weighted_pred_flag等于0可指定,不应将加权预测应用于P切片。weighted_pred_flag等于1指定,应将加权预测应用于P切片。
对于B切片,当启用加权预测时,通过将weighted_bipred_idc设置为非零,可显式地发信或隐式地导出预测权重。语法也可在切片标头中发信且其语义如下:
在一些实例中,weighted_bipred_idc等于0指定,将默认加权预测应用于B切片。在一些实例中,weighted_bipred_idc等于1指定,将显式加权预测应用于B切片。在一些实例中,weighted_bipred_idc等于2指定,应将隐式加权预测应用于B切片。weighted_bipred_idc的值可在0到2(包括0及2)的范围内。
当weighted_bipred_idc等于1时,可通过计算POC距离基于两个参考帧的时间距离而导出权重。
当前HEVC设计可能会阻碍未来扩展(诸如,多视图或3DV扩展)的开发,尤其在这些扩展的开发者想要提供仅进行高级别语法改变的能力时。举例来说,如果待用于TMVP的参考图片来自不同视图,那么其可具有与当前图片相同的POC。用于运动矢量缩放的HEVC的当前设计可能不能够准确地识别在这种情形下用于TMVP的参考图片。当隐式加权预测应用于B切片且一个参考图片来自不同视图时,计算预测权重的进程可遇到问题,这是因为所述进程仅基于POC距离而设计。
本发明的技术可解决这些问题。一般而言,本发明提供用于在HEVC设计上仅改变高级别语法以支持MVC或3DV的技术。解决方案中的一些用于HEVC基础规范,且由此用于前向兼容性目的。视频译码器(诸如,视频编码器或视频解码器)可经配置以单独地或以任何组合实施本发明的各种技术中的任一者或全部。下文更详细地描述各种技术。
作为一个实例,视频译码器可经配置以执行以下操作:确定视频数据的当前块的当前运动矢量的第一类型;确定当前块的相邻块的候选运动矢量预测值的第二类型;在第一类型不同于第二类型时将表示候选运动矢量预测值是否可用的变量设置为指示候选运动矢量预测值不可用的值;及至少部分地基于变量的所述值而译码当前运动矢量。不同类型的运动矢量可包含(例如)视差运动矢量及时间运动矢量。
多种技术中的任一者可用以确定运动矢量的类型。举例来说,视频编码器可基于在当前图片与运动矢量所参考的参考图片之间的POC值的比较而确定所述运动矢量的类型(例如,时间对视差)。如果POC值不同,那么视频译码器可确定运动矢量为时间运动矢量。另一方面,如果POC值相同,那么视频译码器可确定运动矢量为视差运动矢量。
作为另一实例,视频译码器可比较当前图片及运动矢量所参考的参考图片出现的层(例如,视图或可缩放性层)。如果当前图片及参考图片出现于同一层中,那么视频译码器可确定运动矢量为时间运动矢量。另一方面,如果当前图片及参考图片出现于不同的层中,那么视频译码器可确定运动矢量为视差运动矢量。
作为又一实例,视频译码器可确定运动矢量所参考的参考图片为长期参考图片还是短期参考图片。如果参考图片为短期参考图片,那么视频译码器可确定运动矢量为视差运动矢量。然而,如果参考图片为长期参考图片,那么视频译码器可确定运动矢量为时间运动矢量。
此外,根据本发明的某些技术,在当前运动矢量具有不同于候选运动矢量预测值的类型时,视频译码器可经配置以确定候选运动矢量预测值不可用。举例来说,视频译码器可将指示候选运动矢量预测值是否可用作当前运动矢量的预测值的“可用”标志(或变量)设置为在当前运动矢量与候选运动矢量预测值之间的类型不同时指示候选运动矢量预测值不可用的值。
图1为说明实例视频编码及解码系统10的框图,所述系统10可利用用于译码运动矢量且用于在HEVC及其扩展(诸如,多视图或3DV扩展)中执行双向预测的技术。如图1中所展示,系统10包括源装置12,源装置12提供待在稍后时间由目的地装置14解码的经编码视频数据。详言之,源装置12经由计算机可读媒体16将视频数据提供到目的地装置14。源装置12及目的地装置14可包含广泛范围的装置中的任一者,所述装置包括台式计算机、笔记本(即,便携式)计算机、平板计算机、机顶盒、诸如所谓的“智能”手机的电话手机、所谓的“智能”垫、电视、相机、显示装置、数字媒体播放器、视频游戏控制台、视频流式处理装置,或其类似者。在一些状况下,可配备源装置12及目的地装置14以用于无线通信。
目的地装置14可经由计算机可读媒体16接收待解码的经编码视频数据。计算机可读媒体16可包含能够将经编码视频数据从源装置12移动到目的地装置14的任何类型的媒体或装置。在一个实例中,计算机可读媒体16可包含通信媒体,使得源装置12能够实时地将经编码视频数据直接传输到目的地装置14。可根据通信标准(诸如,无线通信协议)来调制经编码视频数据,且将经编码视频数据传输到目的地装置14。通信媒体可包含任何无线或有线通信媒体,诸如射频(RF)频谱或一或多个物理传输线。通信媒体可形成诸如局域网、广域网或全局网络(诸如,因特网)的基于数据包的网络的部分。通信媒体可包括路由器、交换机、基站,或可用以促进从源装置12到目的地装置14的通信的任何其它设备。
在一些实例中,可将经编码数据从输出接口22输出到存储装置。类似地,可由输入接口从存储装置访问经编码数据。存储装置可包括多种分布式或本地访问式数据存储媒体中的任一者,诸如硬盘驱动器、蓝光光盘、DVD、CD-ROM、闪速存储器、易失性或非易失性存储器,或用于存储经编码视频数据的任何其它合适的数字存储媒体。在另一实例中,存储装置可对应于文件服务器,或可存储由源装置12所产生的经编码视频的另一中间存储装置。目的地装置14可经由流式处理或下载从存储装置访问所存储视频数据。文件服务器可为能够存储经编码视频数据且将那个经编码视频数据传输到目的地装置14的任何类型的服务器。实例文件服务器包括web服务器(例如,用于网站)、FTP服务器、网络连接存储(NAS)装置,或本地磁盘驱动器。目的地装置14可经由任何标准数据连接(包括因特网连接)访问经编码视频数据。这种数据连接可包括适合于访问存储在文件服务器上的经编码视频数据的无线信道(例如,Wi-Fi连接)、有线连接(例如,DSL、电缆调制解调器等等),或两者的组合。经编码视频数据从存储装置的传输可为流式处理传输、下载传输,或其组合。
本发明的技术未必限于无线应用或设置。所述技术可应用于支持诸如以下应用的多种多媒体应用中的任一者的视频译码:空中电视广播、有线电视传输、卫星电视传输、诸如HTTP动态自适应流式处理(DASH)的因特网流式处理视频传输、经编码到数据存储媒体上的数字视频、存储在数据存储媒体上的数字视频的解码,或其它应用。在一些实例中,系统10可经配置以支持单向或双向视频传输,以支持诸如视频流式处理、视频播放、视频广播及/或视频电话的应用。
在图1的实例中,源装置12包括视频源18、视频编码器20及输出接口22。目的地装置14包括输入接口28、视频解码器30及显示装置32。根据本发明,源装置12的视频编码器20可经配置以应用用于译码运动矢量且用于在HEVC及其扩展(诸如,多视图或3DV扩展)中执行双向预测的技术。在其它实例中,源装置及目的地装置可包括其它组件或排列。举例来说,源装置12可从外部视频源18(诸如,外部相机)接收视频数据。同样地,目的地装置14可与外部显示装置界接,而非包括整合式显示装置。
图1的所说明系统10仅为一个实例。用于译码运动矢量且用于在HEVC及其扩展(诸如,多视图或3DV扩展)中执行双向预测的技术可由任何数字视频编码及/或解码装置执行。尽管一般由视频编码装置执行本发明的技术,但也可由通常称为“编解码器(CODEC)”的视频编码器/解码器执行所述技术。此外,也可由视频预处理器执行本发明的技术。源装置12及目的地装置14仅为这些译码装置的实例,其中源装置12产生经译码视频数据以供传输到目的地装置14。在一些实例中,装置12、14可以大体上对称的方式操作,使得装置12、14中的每一者包括视频编码及解码组件。因此,系统10可支持视频装置12、14之间的单向或双向视频传输,(例如)以用于视频流式处理、视频播放、视频广播或视频电话。
源装置12的视频源18可包括诸如视频相机的视频捕获装置、含有先前捕获的视频的视频存档,及/或从视频内容提供者接收视频的视频馈送接口。作为另一替代例,视频源18可产生基于计算机图形的数据作为源视频,或实况视频、经存档视频与计算机产生的视频的组合。在一些状况下,如果视频源18为视频相机,那么源装置12及目的地装置14可形成所谓的相机电话或视频电话。然而,如上文所提及,本发明中所描述的技术一般可适用于视频译码,且可应用于无线及/或有线应用。在每一状况下,可由视频编码器20编码所捕获、预捕获或计算机产生的视频。经编码视频信息可接着由输出接口22输出到计算机可读媒体16上。
计算机可读媒体16可包括:暂时性媒体,诸如无线广播或有线网络传输;或存储媒体(即,非暂时性存储媒体),诸如硬盘、闪存驱动器、压缩光盘、数字视频光盘、蓝光光盘或其它计算机可读媒体。在一些实例中,网络服务器(未图示)可从源装置12接收经编码视频数据,且(例如)经由网络传输将经编码视频数据提供到目的地装置14。类似地,媒体生产设施(诸如,光盘压印设施)的计算装置可从源装置12接收经编码视频数据且产生含有经编码视频数据的光盘。因此,在各种实例中,可将计算机可读媒体16理解为包括各种形式的一或多个计算机可读媒体。
目的地装置14的输入接口28从计算机可读媒体16接收信息。计算机可读媒体16的信息可包括由视频编码器20所定义的语法信息(其也由视频解码器30使用),所述语法信息包括描述块及其它经译码单元(例如,GOP)的特性及/或处理的语法元素。显示装置32向用户显示经解码视频数据,且可包含多种显示装置中的任一者,诸如阴极射线管(CRT)、液晶显示器(LCD)、等离子显示器、有机发光二极管(OLED)显示器,或另一类型的显示装置。
视频编码器20及视频解码器30可根据诸如目前在开发中的高效率视频译码(HEVC)标准的视频译码标准而操作,且可符合HEVC测试模型(HM)。同样地,视频编码器20及视频解码器30可根据HEVC标准的扩展(例如,多视图扩展或三维视频(3DV)扩展)而配置。替代地,视频编码器20及视频解码器30可根据诸如ITU-T H.264标准(替代地称为MPEG-4第10部分(高级视频译码(AVC)))的其它专有或工业标准或这些标准的扩展而操作。然而,本发明的技术不限于任何特定译码标准。视频译码标准的其它实例包括MPEG-2及ITU-T H.263。尽管图1中未图示,但在一些方面,视频编码器20及视频解码器30可各自与音频编码器及解码器整合,且可包括适当的MUX-DEMUX单元或其它硬件及软件,以处置通用数据流或单独数据流中的音频及视频两者的编码。在适用时,MUX-DEMUX单元可符合ITU H.223多路复用器协议,或诸如用户数据报协议(UDP)的其它协议。
ITU-T H.264/MPEG-4(AVC)标准由ITU-T视频译码专家组(VCEG)连同ISO/IEC动画专家组(MPEG)一起阐明为称为联合视频小组(JVT)的集体合作的产品。在一些方面,本发明中所描述的技术可应用于一般符合H.264标准的装置。H.264标准由ITU-T研究组且在日期为2005年3月描述在ITU-T国际标准H.264(用于一般视听服务的高级视频译码)中,其在本文中可称为H.264标准或H.264规范,或H.264/AVC标准或规范。联合视频小组(JVT)继续致力于对H.264/MPEG-4AVC的扩展。
可将视频编码器20及视频解码器30各自实施为多种合适的编码器电路中的任一者,诸如一或多个微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑、软件、硬件、固件或其任何组合。当所述技术部分地以软件予以实施时,装置可将用于软件的指令存储在合适的非暂时性计算机可读媒体中,且使用一或多个处理器在硬件中执行所述指令以执行本发明的技术。视频编码器20及视频解码器30中的每一者可包括在一或多个编码器或解码器中,其中的任一者可整合为相应装置中的组合式编码器/解码器(编解码器)的部分。
JCT-VC正致力于HEVC标准的开发。HEVC标准化努力是基于视频译码装置的演进模型,其被称为HEVC测试模型(HM)。HM推测视频译码装置相对于根据(例如)ITU-TH.264/AVC的现有装置的若干额外能力。举例来说,H.264提供九个帧内预测编码模式,而HM可提供多达三十三个帧内预测编码模式。
一般而言,HM的工作模型描述,视频帧或图片可划分为包括亮度样本及色度样本两者的树块或最大译码单元(LCU)的序列。位流内的语法数据可定义LCU的大小,LCU为就像素的数目而言的最大译码单元。切片包括按译码顺序的数个连续树块。可将视频帧或图片分割为一或多个切片。每一树块可根据四叉树拆分为多个译码单元(CU)。一般而言,四叉树数据结构每CU包括一个节点,其中根节点对应于树块。如果CU拆分为四个子CU,那么对应于所述CU的节点包括四个叶节点,所述叶节点中的每一者对应于子CU中的一者。
四叉树数据结构的每一节点可提供对应CU的语法数据。举例来说,四叉树中的节点可包括拆分标志,其指示对应于所述节点的CU是否拆分为多个子CU。CU的语法元素可被递归地定义,且可取决于CU是否拆分为多个子CU。如果CU并不进一步拆分,那么其被称为叶CU。在本发明中,叶CU的四个子CU也将被称为叶CU,即使不存在原始叶CU的显式拆分也如此。举例来说,如果16×16大小的CU并不进一步拆分,那么尽管16×16CU决不拆分,但四个8×8子CU也将被称为叶CU。
除CU不具有大小区别以外,CU具有与H.264标准的宏块类似的目的。举例来说,树块可拆分为四个子节点(也称为子CU),且每一子节点又可为父节点且拆分为另外四个子节点。称为四叉树的叶节点的最终未拆分子节点包含译码节点,所述译码节点也被称为叶CU。与经译码位流相关联的语法数据可定义可拆分树块的最大次数(称为最大CU深度),且也可定义译码节点的最小大小。因此,位流也可定义最小译码单元(SCU)。本发明使用术语“块”来指在HEVC的上下文中的CU、PU或TU中的任一者,或在其它标准的上下文中的类似数据结构(例如,在H.264/AVC中的宏块及其子块)。
CU包括译码节点及与所述译码节点相关联的预测单元(PU)及变换单元(TU)。CU的大小对应于译码节点的大小,且形状必须为正方形。CU的大小的范围可从8×8像素直到具有最大64×64像素或大于64×64像素的树块的大小。每一CU可含有一或多个PU及一或多个TU。与CU相关联的语法数据可描述(例如)CU成为一或多个PU的分割。分割模式可取决于CU被跳过或直接模式编码、被帧内预测模式编码还是被帧间预测模式编码而不同。PU的形状可分割为非正方形。与CU相关联的语法数据也可描述(例如)CU根据四叉树而成为一或多个TU的分割。TU的形状可为正方形或非正方形(例如,矩形)。
HEVC标准允许根据TU的变换,所述变换对于不同CU可不同。通常基于针对经分割LCU所定义的给定CU内的PU的大小而设置TU大小,但可能并非总是如此状况。TU通常具有与PU相同的大小,或小于PU。在一些实例中,可使用称为“残余四叉树”(RQT)的四叉树结构将对应于CU的残余样本再分为较小单元。RQT的叶节点可被称为变换单元(TU)。可变换与TU相关联的像素差值以产生可量化的变换系数。
叶CU可包括一或多个预测单元(PU)。一般而言,PU表示对应于对应CU的全部或部分的空间区域,且可包括用于检索PU的参考样本的数据。此外,PU包括与预测有关的数据。举例来说,当PU被帧内模式编码时,PU的数据可包括在残余四叉树(RQT)中,残余四叉树可包括描述对应于PU的TU的帧内预测模式的数据。作为另一实例,当PU被帧间模式编码时,PU可包括定义所述PU的一或多个运动矢量的数据。定义PU的运动矢量的数据可描述(例如)运动矢量的水平分量、运动矢量的垂直分量、运动矢量的分辨率(例如,四分之一像素精度或八分之一像素精度)、运动矢量所指向的参考图片,及/或运动矢量的参考图片列表(例如,列表0、列表1,或列表C)。
具有一或多个PU的叶CU也可包括一或多个变换单元(TU)。可使用RQT(也称为TU四叉树结构)指定变换单元,如上文所论述。举例来说,拆分标志可指示叶CU是否拆分为四个变换单元。接着,每一变换单元可进一步拆分为其它子TU。当TU并不进一步拆分时,其可被称为叶TU。一般而言,对于帧内译码,属于叶CU的所有叶TU共享相同帧内预测模式。即,一般应用相同帧内预测模式以计算叶CU的所有TU的预测值。对于帧内译码,视频编码器20可使用帧内预测模式将每一叶TU的残余值计算为在对应于TU的CU的部分与原始块之间的差。TU未必限于PU的大小。因此,TU可大于或小于PU。对于帧内译码,PU可与同一CU的对应叶TU同置。在一些实例中,叶TU的最大大小可对应于对应叶CU的大小。
此外,叶CU的TU也可与称为残余四叉树(RQT)的相应四叉树数据结构相关联。即,叶CU可包括指示叶CU分割为TU的方式的四叉树。TU四叉树的根节点一般对应于叶CU,而CU四叉树的根节点一般对应于树块(或LCU)。RQT的不拆分的TU被称为叶TU。一般而言,除非另有指示,否则本发明分别使用术语CU及TU来指叶CU及叶TU。
视频序列通常包括一系列视频帧或图片。图片组(GOP)一般包含一系列一或多个视频图片。GOP可在GOP的标头、图片中的一或多者的标头中或在其它位置包括语法数据,所述语法数据描述包括在GOP中的图片的数目。图片的每一切片可包括描述所述相应切片的编码模式的切片语法数据。视频编码器20通常对个别视频切片内的视频块操作,以便编码视频数据。视频块可对应于CU内的译码节点。视频块可具有固定或变化的大小,且可根据所指定的译码标准而在大小上不同。
作为实例,HM支持以各种PU大小进行预测。假设特定CU的大小为2N×2N,那么HM支持以2N×2N或N×N的PU大小进行帧内预测,及以2N×2N、2N×N、N×2N或N×N的对称PU大小进行帧间预测。HM也支持以2N×nU、2N×nD、nL×2N及nR×2N的PU大小进行帧间预测的非对称分割。在非对称分割中,CU的一个方向未分割,而另一方向分割为25%及75%。CU的对应于25%分区的部分是由“n”后跟着“上”、“下”、“左”或“右”的指示进行指示。因此,举例来说,“2N×nU”是指被水平分割的2N×2NCU,其中2N×0.5N PU是在顶部且2N×1.5N PU是在底部。
在本发明中,“N×N”及“N乘N”可互换地使用以依据垂直维度及水平维度而指视频块的像素尺寸,例如,16×16像素或16乘16像素。一般而言,16×16块在垂直方向上将具有16个像素(y=16),且在水平方向上将具有16个像素(x=16)。同样地,N×N块一般在垂直方向上具有N个像素且在水平方向上具有N个像素,其中N表示非负整数值。可以行及列来排列块中的像素。此外,块未必需要在水平方向上及在垂直方向上具有相同数目个像素。举例来说,块可包含N×M个像素,其中M未必等于N。
视频编码器20及视频解码器30可经配置以单独地或以任何组合执行本发明的各种技术中的一或多者。举例来说,根据本发明的某些技术,视频编码器20及视频解码器30可经配置以执行与多视图视频译码(MVC)或三维视频(3DV)译码(例如,作为H.264/AVC或HEVC的扩展)有关的各种技术。在一些例子中,可使用对基础标准的高级别语法(HLS)改变来实现视频译码标准的MVC及/或3DV扩展。举例来说,可重新定义或以不同方式使用某些现有译码结构以实现仅HLS扩展,而非引入新译码结构。
作为实例,为了根据MVC及3DV扩展译码视频数据,视频编码器20及视频解码器30可经配置以执行层间或视图间预测。即,视频编码器20及视频解码器30可经配置以使用先前经译码视图的先前经译码图片的数据来预测当前视图中的当前图片的块。通常,先前经译码图片(即,视图间参考图片)及当前图片具有相同的图片顺序计数(POC)值,使得视图间参考图片及当前图片出现于同一访问单元中,且同样地,具有大体上相同的输出顺序(或显示顺序)。
视频编码器20及视频解码器30可经配置以利用视差运动矢量来使用视图间预测译码当前图片的当前块。因此,在一些实例中,视差运动矢量可据称为包含如下运动矢量:对于包括使用所述运动矢量所预测的当前块的当前图片,当前POC值等于由所述运动矢量所参考的参考图片的POC值。因此,视频编码器20及视频解码器30可经配置以在由运动矢量所预测的块的POC值等于运动矢量所参考的参考图片的POC值时,确定所述运动矢量为视差运动矢量。类似地,视频编码器20及视频解码器30可经配置以在由运动矢量所预测的块的POC不等于运动矢量所参考的参考图片的POC值时,确定所述运动矢量包含时间运动矢量。
另外或替代地,视频编码器20及视频解码器30可经配置以在包括使用运动矢量所预测的当前块的当前图片处于不同于由运动矢量所参考的参考图片的层中时,确定所述运动矢量包含视差运动矢量。类似地,视频编码器20及视频解码器30可经配置以在包括使用运动矢量所预测的当前块的当前图片处于与由运动矢量所参考的参考图片相同的层中时,确定所述运动矢量包含时间运动矢量。
作为又一实例,HEVC区分长期参考图片与短期参考图片。在HEVC的技术中,与短期参考图片相比,长期图片存储在经解码图片缓冲器(DPB)中的时间较长。另外,语法元素用以指示参考图片为长期参考图片还是短期参考图片。在一些实例中,在MVC及3DV中,长期参考图片可代替地对应于时间参考图片(即,与正译码的当前图片相同的层或视图的图片),而短期参考图片可代替地对应于视图间参考图片(即,与正译码的当前图片不同的层或视图的图片)。因此,长期及短期参考图片的使用也可提供参考图片为时间参考图片还是视图间参考图片的指示。同样地,参考长期参考图片的运动矢量可包含时间运动矢量,而参考短期参考图片的运动矢量可包含视差运动矢量。
根据本发明的某些技术,视频编码器20及视频解码器30可经配置以禁用不同类型的运动矢量作为彼此的运动矢量预测值的使用。举例来说,如果当前运动矢量为时间运动矢量,那么视频编码器20及视频解码器30可经配置以不将视差运动矢量用作运动矢量预测值来预测时间运动矢量。同样地,如果当前运动矢量为视差运动矢量,那么视频编码器20及视频解码器30可经配置以不将时间运动矢量用作运动矢量预测值来预测视差运动矢量。
视频编码器20及视频解码器30可经配置以执行各种模式的运动矢量预测。在一个实例(合并模式)中,视频编码器20及视频解码器30可经配置以译码合并标志,其表示从多个相邻块中的哪一者继承运动参数,诸如参考图片所选自的参考图片列表、指示参考列表中的参考图片的参考索引、水平运动矢量分量及垂直运动矢量分量。
在另一实例(高级运动矢量预测(AMVP))中,视频编码器20及视频解码器30可经配置以译码以下各者的指示:参考图片所选自的参考图片列表、指示参考图片列表中的参考图片的参考索引、运动矢量差值,及表示运动矢量预测值所选自的相邻块的AMVP索引。
在合并模式及/或AMVP模式或其它此类运动矢量译码模式中,视频编码器20及视频解码器30可经配置以不使用来自相邻块的运动信息,所述相邻块使用不同于当前块的运动矢量的类型的运动矢量。即,视频编码器20及视频解码器30可经配置以执行以下操作:确定当前运动矢量的第一类型;确定候选运动矢量预测值的第二类型;及如果第一类型与第二类型不相同,那么禁用候选运动矢量预测值作为当前运动矢量的运动矢量预测值的使用。
为了禁用候选运动矢量预测值,视频编码器20及视频解码器30可设置表示候选运动矢量预测值是否可用作当前运动矢量的运动矢量预测值的变量。视频编码器20及视频解码器30可设置这个变量的值以指示候选运动矢量预测值不可用,甚至在候选运动矢量预测值先前已基于指示候选运动矢量预测值可用的其它条件而视为可用时也如此。举例来说,如下文更详细地所解释,视频编码器20及视频解码器30可使变量与候选运动矢量预测值相关联,其中所述变量的值指示候选运动矢量预测值是否可用作当前运动矢量的运动矢量预测值。
详言之,视频编码器20可经配置以确定可用以预测当前运动矢量的运动矢量预测值的集合。视频解码器30也可经配置以构造这个集合,或替代地,视频编码器20可发信可用的运动矢量预测值的集合。在任何状况下,视频编码器20及视频解码器30可确定可用运动矢量预测值的集合,且选择运动矢量预测值的集合中的一者作为实际运动矢量预测值来用以译码当前运动矢量。
在AMVP模式中,视频编码器20可计算在当前运动矢量与运动矢量预测值之间的运动矢量差值,且译码运动矢量差值。同样地,视频解码器30可组合运动矢量差值与所确定的运动矢量预测值,以重建当前运动矢量(即,视频数据的当前块(例如,当前PU)的运动矢量)。在合并模式中,实际运动矢量预测值可用作当前运动矢量。因此,在合并模式中,视频编码器20及视频解码器30可将运动矢量差值视为零值。
根据本发明的某些技术,视频编码器20及视频解码器30可经配置以执行以下操作:基于候选运动矢量预测值(其中的任一者或全部先前可能已基于其它准则而确定为可用)的列表中的一或多个候选运动矢量预测值是否具有不同于当前运动矢量的类型,确定所述一或多个候选运动矢量预测值是否不可用于预测当前运动矢量。视频编码器20及视频解码器30可经进一步配置以执行以下操作:(例如)通过将不可用候选运动矢量预测值的可用标志(或变量)设置为指示不可用候选运动矢量预测值不可用的值,禁用使用经确定为不可用的那些候选运动矢量预测值的运动矢量预测。
另外或替代地,在从可用候选运动矢量预测值的集合选择运动矢量预测值之后,视频编码器20及视频解码器30可经配置以确定选定运动矢量预测值是否为视差运动矢量(即,选定运动矢量预测值是否参考视图间参考图片)。如果选定运动矢量预测值为视差运动矢量,那么视频编码器20及视频解码器30可在译码当前运动矢量时禁用运动矢量预测值的缩放。即,假设当前运动矢量及运动矢量预测值皆为视差运动矢量(即,参考视图间参考图片),那么在当前图片与视图间参考图片之间的POC值的差将为零(因为视图间参考图片一般出现于与正译码的当前图片相同的访问单元内),且因此,缩放为不必要的。此外,根据本发明的技术,尝试缩放运动矢量预测值可引起误差,所述误差可通过禁用缩放而避免。
在一些实例中,在HEVC的MVC或3DV扩展中,对于任何活动PPS,始终将enable_temporal_mvp_flag设置为0。即,视频编码器20可经配置以将HEVC的MVC或3DV扩展中的活动PPS的enable_temporal_mvp_flag设置为0。同样地,视频解码器30可经配置以解码enable_temporal_mvp_flag,或在解码符合HEVC的MVC或3DV扩展的位流时推断enable_temporal_mvp_flag的值为0。
在一些实例中,在HEVC的MVC或3DV扩展中,在仅具有高级别语法(HLS)改变的配置文件中,视频编码器20及视频解码器30以同置图片决不对应于来自不同视图的参考图片的方式设置collocated_ref_idx的值。此外,视频编码器20及视频解码器30可经配置以译码表示HEVC的MVC或3DV扩展的指示的数据,使得利用低级别改变的配置文件能够具有同置图片的更大灵活性。
在一些实例中,视频编码器20及视频解码器30可经配置以在切片标头中译码表示对根据HEVC译码的切片的指示的数据,以在TMVP期间显式地禁用经识别同置图片的运动矢量的缩放。这个同置图片可标记为“不用于时间运动矢量预测”。
在一些实例中,在HEVC中,当相邻块的运动矢量具有不同于当前参考索引的参考索引,且也具有不同于当前参考图片的图片顺序计数(POC)值的POC值时,视频编码器20及视频解码器30可在高级运动矢量预测期间禁用运动矢量缩放。视频编码器20及视频解码器30可经配置以可在切片标头、适配参数集(APS)、图片参数集(PPS)、序列参数集(SPS)、视频参数集(VPS)或其它数据结构中译码表示指示的数据,以发信禁用AMVP是开启还是关闭。
在一些实例中,在HEVC中,视频编码器20及视频解码器30可在来自空间相邻块的运动矢量及待预测的运动矢量中的一者且仅一者是来自具有与当前图片相同的POC值的图片时,将来自空间相邻块的这个运动矢量确定为不可用。这些技术可适用于AMVP及合并模式中的任一者或两者。替代地,这些技术可仅适用于AMVP及合并模式的时间运动矢量预测(TMVP)方面。视频编码器20及视频解码器30可在切片标头、APS、SPS、PPS或VPS中译码表示对启用或禁用这种技术的指示的数据。
在HEVC的一些实例中,当待预测的运动矢量的参考索引指向时间参考图片(来自同一视图/层)时,参考索引指向来自不同视图/层的图片的运动矢量可被视为不可用作运动矢量预测值。这种情形可适用于AMVP及合并模式两者。替代地,这种情形可仅适用于AMVP及合并模式的TMVP部分。
在一些实例中,在HEVC中,视频编码器20及视频解码器30可译码表示对每一参考图片集(RPS)子集的指示的数据,以在来自特定RPS子集的任何同置图片在TMVP期间被识别为同置图片时,发信所述同置图片是否将用于运动矢量缩放。RPS子集中的每一图片可标记为“不用于时间运动矢量预测”。
在一些实例中,在HEVC中,视频编码器20及视频解码器30可译码表示对每一RPS子集的指示的数据,以在这个运动矢量及待预测的运动矢量属于具有相同指示的RPS子集时,发信从特定RPS子集中的图片的任何空间相邻运动矢量预测在AMVP期间是否将被视为不可用。
在一些实例中,在HEVC中,视频编码器20及视频解码器30可译码表示B切片的新类型的隐式加权预测的数据,使得对于RefPicList0及RefPicList1中的某些参考图片对,如果对中的参考图片中的任一者用于PU的加权双向预测,那么用于两个参考图片的权重可相同。对于来自RefPicList0及RefPiclist1的图片的其它组合,HEVC或H.264/AVC中的当前隐式加权预测可适用。视频编码器20及视频解码器30可在切片标头中译码表示哪些组合被启用或禁用的数据。
在一些实例中,视频编码器20及视频解码器30可经配置以不使用视差运动矢量来预测正常(即,时间)运动矢量,且不使用时间运动矢量来预测视差运动矢量。此外,视频编码器20及视频解码器30可经配置以不缩放视差运动矢量。在一些实例中,在当前PU的一个或两个参考图片为视图间参考图片,且隐式加权预测模式开启时,用于当前PU的这两个参考图片的权重可设置为相同(例如,1/2、1/2)。
在一些实例中,作为RPS子集的性质的导出,对于RefPicSetLtCurr、RefPicSetLtFoll、RefPicSetStCurrBefore、RefPicSetStCurrAfter及RefPicSetStFoll的每一RPS子集,视频译码器可将RefTypeIdc导出为等于0。包括在RPS子集中的每一图片可具有设置为等于RPS子集的RefTypeIdc的RefPicTypeIdc。作为这种情形在HEVC的可能MVC扩展中的实例使用,InterView RPS子集可设置为具有等于1的RefTypeIdc。
本发明定义函数RefPicTypeFunc(pic),所述函数将传递到所述函数的参考图片“pic”的RefPicTypeIdc值作为自变量而返回。这个函数可作为解码进程的部分(例如)由视频编码器20在解码先前经编码视频数据以用作参考视频数据时或由视频解码器30在视频解码进程期间执行。
本发明也提供用于运动矢量预测值候选者的导出进程的技术。除习知HEVC的过程以外或作为所述过程的替代例,诸如视频编码器20及视频解码器30的视频译码器也可使用以下过程导出运动矢量mvLXA及可用性标志availableFlagLXA。当对于从(xA0,yA0)到(xA1,yA1)的(xAk,yAk)(其中yA1=yA0-MinPuSize),availableFlagLXA等于0时,以下内容可重复地适用,直到availableFlagLXA等于1为止(其中在这个实例中,呈格式#-###的数字是指即将到来的HEVC标准的特定章节):
●如果覆盖亮度位置(xAk,yAk)的预测单元可用,那么PredMode并非MODE_INTRA,predFlagLX[xAk][yAk]等于1,availableFlagLXA设置为等于1,运动矢量mvLXA设置为等于运动矢量mvLX[xAk][yAk],refIdxA设置为等于refIdxLX[xAk][yAk],ListA设置为等于LX。
●否则,如果覆盖亮度位置(xAk,yAk)的预测单元可用,那么PredMode并非MODE_INTRA,predFlagLY[xAk][yAk](其中Y=!X)等于1,availableFlagLXA设置为等于1,运动矢量mvLXA设置为等于运动矢量mvLY[xAk][yAk],refIdxA设置为等于refIdxLY[xAk][yAk],ListA设置为等于LY。
●如果availableFlagLXA等于1,且RefPicTypeFunc(RefPicListListA(refIdxA))不等于RefPicTypeFunc(RefPicListLX(refIdxLX)),那么availableFlagLXA设置为0。
●当availableFlagLXA等于1,且RefPicTypeFunc(RefPicListListA(refIdxA))及RefPicTypeFunc(RefPicListLX(refIdxLX))皆等于0时,mvLXA可如下文所指定而导出:
tx=(16384+(Abs(td)>>1))/td (8-136)
DistScaleFactor=Clip3(-4096,4095,(tb*tx+32)>>6) (8-137)
mvLXA=Clip3(-8192,8191.75,Sign(DistScaleFactor*mvLXA)*((Abs(DistScaleFactor*mvLXA)+127)>>8)) (8-138)
其中td及tb可导出为:
td=Clip3(-128,127,PicOrderCntVal-PicOrderCnt(RefPicListListA(refIdxA)))
(8-139)
tb=Clip3(-128,127,PicOrderCntVal-PicOrderCnt(RefPicListLX(refIdxLX)))
(8-140)
●当availableFlagLXA等于1,且RefPicTypeFunc(RefPicListListA(refIdxA))及RefPicTypeFunc(RefPicListLX(refIdxLX))皆等于非零值时,mvLAX设置为mvLXA而不缩放。
除习知HEVC的过程以外或作为所述过程的替代例,诸如视频编码器20及视频解码器30的视频译码器也可使用以下过程导出运动矢量mvLXB及可用性标志availableFlagLXB。当isScaledFlagLX等于0时,availableFlagLXB可设置为等于0,且对于从(xB0,yB0)到(xB2,yB2)的(XBk,yBk)(其中xB0=xP+nPSW,xB1=xB0-MinPuSize且xB2=xP-MinPuSize)时,以下内容可重复地适用,直到availableFlagLXB等于1为止:
●如果覆盖亮度位置(xBk,yBk)的预测单元可用,那么PredMode并非MODE_INTRA,predFlagLX[xBk][yBk]等于1,availableFlagLXB设置为等于1,运动矢量mvLXB设置为等于运动矢量mvLX[xBk][yBk],refIdxB设置为等于refIdxLX[xBk][yBk],ListB设置为等于LX。
●否则,如果覆盖亮度位置(xBk,yBk)的预测单元可用,那么PredMode并非MODE_INTRA,predFlagLY[xBk][yBk](其中Y=!X)等于1,availableFlagLXB设置为等于1,运动矢量mvLXB设置为等于运动矢量mvLY[xBk][yBk],refIdxB设置为等于refIdxLY[xBk][yBk],ListB设置为等于LY。
●如果availableFlagLXA等于1,且RefPicTypeFunc(RefPicListListB(refIdxB))不等于RefPicTypeFunc(RefPicListLX(refIdxLX)),那么availableFlagLXB设置为0。
●当availableFlagLXB等于1且RefPicTypeFunc(RefPicListListA(refIdxA))及RefPicTypeFunc(RefPicListLX(refIdxLX))皆等于0,且PicOrderCnt(RefPicListListB(refIdxB))不等于PicOrderCnt(RefPicListLX(refIdxLX))时,mvLXB可如下文所指定而导出。
tx=(16384+(Abs(td)>>1))/td (8-144)
DistScaleFactor=Clip3(-4096,4095,(tb*tx+32)>>6) (8-145)
mvLXB=Clip3(-8192,8191.75,Sign(DistScaleFactor*mvLXA)*((Abs(DistScaleFactor*mvLXA)+127)>>8)) (8-146)
其中td及tb可导出为
td=Clip3(-128,127,PicOrderCntVal-PicOrderCnt(RefPicListListB(refIdxB)))
(8-147)
tb=Clip3(-128,127,PicOrderCntVal-PicOrderCnt(RefPicListLX(refIdxLX)))
(8-148)
●当availableFlagLXB等于1,且RefPicTypeFunc(RefPicListListB(refIdxB))及RefPicTypeFunc(RefPicListLX(refIdxLX))皆等于非零值时,mvLAX设置为mvLXA而不缩放。
诸如视频编码器20及视频解码器30的视频译码器可根据本发明的技术导出时间亮度运动矢量预测值。举例来说,视频译码器可如下导出变量mvLXCol及availableFlagLXCol:
●如果以下条件中的一者成立,那么mvLXCol的两个分量可设置为等于0,且availableFlagLXCol可设置为等于0:
○colPu是以帧内预测模式而译码。
○colPu标记为“不可用”。
○colPic标记为“不用于时间运动矢量预测”。
○enable_temporal_mvp_flag等于0。
●否则,可如下导出运动矢量mvCol、参考索引refIdxCol及参考列表标识符listCol。
○如果PredFlagL0[xPCol][yPCol]等于0,那么mvCol、refIdxCol及listCol可分别设置为等于MvL1[xPCol][yPCol]、RefIdxL1[xPCol][yPCol]及L1。
○否则(PredFlagL0[xPCol][yPCol]等于1),以下内容可适用:
■如果PredFlagL1[xPCol][yPCol]等于0,那么mvCol、refIdxCol及listCol可分别设置为等于MvL0[xPCol][yPCol]、RefIdxL0[xPCol][yPCol]及L0。
■否则(PredFlagL1[xPCol][yPCol]等于1),可进行以下指派。
●如果每一参考图片列表中的每一图片pic的PicOrderCnt(pic)小于或等于PicOrderCntVal,那么mvCol、refIdxCol及listCol可分别设置为等于MvLX[xPCol][yPCol]、RefIdxLX[xPCol][yPCol]及LX,其中X为调用这种进程时X的值。
●否则(至少一个参考图片列表中的至少一个图片pic的PicOrderCnt(pic)大于PicOrderCntVal),mvCol、refIdxCol及listCol可分别设置为等于MvLN[xPCol][yPCol]、RefIdxLN[xPCol][yPCol]及LN,其中N为collocated_from_l0_flag的值。
且变量availableFlagLXCol可设置为等于1,且以下情形可适用:
■如果RefPicTypeFunc(RefPicListLX(refIdxLX))不等于RefPicTypeFunc(listCol(refIdxCol)),那么availableFlagLXCol设置为等于0。注意,listCol(refIdxCol)返回时间运动矢量的参考图片。
○如果availableFlagLXCol为1且RefPicTypeFunc(RefPicListLX(refIdxLX))及RefPicTypeFunc(listCol(refIdxCol))皆等于非零值,或PicOrderCnt(colPic)-RefPicOrderCnt(colPic,refIdxCol,listCol)等于PicOrderCntVal-PicOrderCnt(RefPicListLX(refIdxLX)),
■那么mvLXCol=mvCol (8-153)
○否则,如果RefPicTypeFunc(RefPicListLX(refIdxLX))及RefPicTypeFunc(listCol(refIdxCol))皆等于0,那么mvLXCol可如下文所指定导出为运动矢量mvCol的缩放版本:
tx=(16384+(Abs(td)>>1))/td (8-154)
DistScaleFactor=Clip3(-4096,4095,(tb*tx+32)>>6) (8-155)
mvLXCol=Clip3(-8192,8191.75,Sign(DistScaleFactor*mvCol)*((Abs(DistScaleFactor*mvCol)+127)>>8)) (8-156)
其中td及tb可导出为:
td=Clip3(-128,127,PicOrderCnt(colPic)-RefPicOrderCnt(colPic,refIdxCol,listCol)) (8-157)
tb=Clip3(-128,127,PicOrderCntVal-PicOrderCnt(RefPicListLX(refIdxLX)))
(8-158)
可针对隐式加权预测而导出本文所描述的变量。
本发明也提供用于视频编码器20及视频解码器30可经配置以执行的加权样本预测进程的技术。对进程的输入可包括:
●位置(xB,yB),其指定相对于当前译码单元的左上样本的当前预测单元的左上样本,
●这个预测单元的宽度nPSW及高度nPSH,
●两个(nPSW)×(nPSH)阵列predSamplesL0及predSamplesL1,
●预测列表利用标志predFlagL0及predFlagL1,
●参考索引refIdxL0及refIdxL1,
●运动矢量mvL0及mvL1,
●色度分量的位深度bitDepth。
这种进程的输出可包括:
●预测样本值的(nPSW)×(nPSH)阵列predSamples。
在一个实例中,如下导出变量shift1、shift2、offset1及offset2:
●变量shift1设置为等于14-bitDepth,且变量shift2设置为等于15-bitDepth,
●变量offset1设置为等于1<<(shift1-1),且变量offset2设置为等于1<<(shift2-1)。
在P切片中,如果predFlagL0的值等于1,那么以下内容可适用:
●如果weighted_pred_flag等于0,那么调用如子条款8.5.2.2.3.1中所描述的默认加权样本预测进程,其中输入及输出与这个子条款中所描述的进程相同。
●否则(weighted_pred_flag等于1),调用如子条款8.5.2.2.3.2中所描述的显式加权样本预测进程,其中输入及输出与这个子条款中所描述的进程相同。
●在B切片中,如果predFlagL0或predFlagL1等于1,那么以下内容可适用:
●如果weighted_bipred_idc等于0,那么调用如子条款8.5.2.2.3.1中所描述的默认加权样本预测进程,其中输入及输出与这个子条款中所描述的进程相同。
●否则,如果weighted_bipred_idc等于1且如果predFlagL0或predFlagL1等于1,那么调用如子条款8.5.2.2.3.2中所描述的显式加权样本预测进程,其中输入及输出与这个子条款中所描述的进程相同。
●否则(weighted_bipred_idc等于2),以下内容可适用:
○如果predFlagL0等于1且predFlagL1等于1,且RefPicTypeFunc(RefPicListL0(refIdxL0))及RefPicTypeFunc(RefPicListL1(refIdxL1))两者等于0,那么调用如当前HEVC工作草案的子条款8.5.2.2.3.2中所描述的隐式加权样本预测进程,其中输入及输出与这个子条款中所描述的进程相同。
○否则(predFlagL0或predFlagL1等于1但并非皆等于1),调用如子条款8.5.2.2.3.1中所描述的默认加权样本预测进程,其中输入及输出与这个子条款中所描述的进程相同。
本发明也提供用于默认加权样本预测进程的技术。对这种进程的输入及从这种进程的输出可与上文针对加权样本预测进程所描述的输入及输出相同。取决于predFlagL0及predFlagL1的值,可如下导出预测样本predSamples[x,y],其中x=0..(nPSW)-1且y=0..(nPSH)-1:
●如果predFlagL0等于1且predFlagL1等于0,
○那么predSamples[x,y]=Clip3(0,(1<<bitDepth)-1,(predSamplesL0[x,y]+offset1)>>shift1) (8-211)
●否则,如果predFlagL0等于0且predFlagL1等于1,
○那么predSamples[x,y]=Clip3(0,(1<<bitDepth)-1,(predSamplesL1[x,y]+offset1)>>shift1) (8-212)
●否则(predFlagL0及predFlagL1两者等于1),如果RefPicOrderCnt(currPic,refIdxL0,L0)等于RefPicOrderCnt(currPic,refIdxL1,L1)且mvL0等于mvL1,且RefPicTypeFunc(RefPicListL0(refIdxL0))及RefPicTypeFunc(RefPicListL1(refIdxL1))两者等于0,
○那么predSamples[x,y]=Clip3(0,(1<<bitDepth)-1,(predSamplesL0[x,y]+offset1)>>shift1) (8-213)
●否则,
○predSamples[x,y]=Clip3(0,(1<<bitDepth)-1,(predSamplesL0[x,y]+predSamplesL1[x,y]+offset2)>>shift2) (8-214)
在另一实例中,可如下执行加权预测。可执行新类型的隐式加权,其可对应于修改的隐式加权预测。以下改变可在图片参数集RBSP语义中进行:
weighted_bipred_idc等于0可指定,将默认加权预测应用于B切片。weighted_bipred_idc等于1可指定,将显式加权预测应用于B切片。weighted_bipred_idc等于2可指定,应将隐式加权预测应用于B切片。weighted_bipred_idc等于3可指定,将受约束隐式加权预测应用于B切片。weighted_bipred_idc的值可在0到3(包括0及3)的范围内。
在一些实例中,本发明的技术可包括(例如)在解码进程期间执行的以下加权样本预测进程。对加权样本预测进程的输入可包括:
●位置(xB,yB),其指定相对于当前译码单元的左上样本的当前预测单元的左上样本,
●这个预测单元的宽度nPSW及高度nPSH,
●两个(nPSW)×(nPSH)阵列predSamplesL0及predSamplesL1,
●预测列表利用标志predFlagL0及predFlagL1,
●参考索引refIdxL0及refIdxL1,
●运动矢量mvL0及mvL1,
●色度分量的位深度bitDepth。
这种进程的输出可包括:
●预测样本值的(nPSW)×(nPSH)阵列predSamples。
可如下导出变量shift1、shift2、offset1及offset2:
●变量shift1设置为等于14-bitDepth,且变量shift2设置为等于15-bitDepth,
●变量offset1设置为等于1<<(shift1-1),且变量offset2设置为等于1<<(shift2-1)。
在P切片中,如果predFlagL0的值等于1,那么以下内容可适用:
●如果weighted_pred_flag等于0,那么可调用如当前HEVC工作草案的子条款8.5.2.2.3.1中所描述的默认加权样本预测进程,其中输入及输出与这个子条款(例如,子条款4.2.2)中所描述的进程相同。
●否则(weighted_pred_flag等于1),可调用如当前HEVC工作草案的子条款8.5.2.2.3.2中所描述的显式加权样本预测进程,其中输入及输出与这个子条款(例如,子条款4.2.2)中所描述的进程相同。
在B切片中,如果predFlagL0或predFlagL1等于1,那么以下内容可适用:
●如果weighted_bipred_idc等于0,那么可调用如当前HEVC工作草案的子条款8.5.2.2.3.1中所描述的默认加权样本预测进程用,其中输入及输出与这个子条款(例如,子条款4.2.2)中所描述的进程相同。
●否则,如果weighted_bipred_idc等于1且如果predFlagL0或predFlagL1等于1,那么可调用如当前HEVC工作草案的子条款8.5.2.2.3.2中所描述的显式加权样本预测进程,其中输入及输出与这个子条款(例如,子条款4.2.2)中所描述的进程相同。
●否则,如果weighted_bipred_idc等于2,那么以下内容可适用:
○如果predFlagL0等于1且predFlagL1等于1,那么可调用如当前HEVC工作草案的子条款8.5.2.2.3.2中所描述的隐式加权样本预测进程,其中输入及输出与这个子条款(例如,子条款4.2.2)中所描述的进程相同。
○否则(predFlagL0或predFlagL1等于1但并不皆等于1),可调用如当前HEVC工作草案的子条款8.5.2.2.3.1中所描述的默认加权样本预测进程,其中输入及输与这个子条款(例如,子条款4.2.2)中所描述的进程相同。
●否则(weighted_bipred_idc等于3),以下内容可适用:
○如果predFlagL0等于1且predFlagL1等于1,且RefPicTypeFunc(RefPicListL0(refIdxL0))及RefPicTypeFunc(RefPicListL1(refIdxL1))两者等于0,那么可调用如当前HEVC工作草案的子条款8.5.2.2.3.2中所描述的隐式加权样本预测进程,其中输入及输出与这个子条款(例如,子条款4.2.2)中所描述的进程相同。
○否则(predFlagL0或predFlagL1等于1但并不皆等于1),可调用如当前HEVC工作草案的子条款8.5.2.2.3.1中所描述的默认加权样本预测进程,其中输入及输出与这个子条款(例如,子条款4.2.2)中所描述的进程相同。
在一些实例中,视频编码器20及视频解码器30可经配置以译码标志,以禁用正针对AMVP缩放的空间相邻块的缩放。下文的表1提供这个标志的实例序列参数集RBSP语法:
表1
seq_parameter_set_rbsp(){ | 描述符 |
profile_idc | u(8) |
reserved_zero_8bits/*等于0*/ | u(8) |
level_idc | u(8) |
seq_parameter_set_id | ue(v) |
… | |
disable_spatial_mv_poc_scaling_flag | u(1) |
… | |
一般而言,表2的序列参数集的语义保持与当前HEVC工作草案情况下的语义相同。然而,表2引入禁用空间MV POC缩放标志。下文提供这个添加元素的语义的各种实例:
在这个实例中,disable_spatial_mv_poc_scaling_flag等于0指示,在目标运动矢量对应于具有不同参考索引或不同POC的图片时,空间运动矢量将基于POC而缩放。在这个实例中,disable_spatial_mv_poc_scaling_flag等于1指示,在空间运动矢量的参考索引不同于目标运动矢量时,这个运动矢量被视为不可用。注意,目标运动矢量为待在AMVP下预测的运动矢量。
替代地,disable_spatial_mv_poc_scaling_flag等于1可指示,在空间运动矢量的参考索引不同于目标运动矢量的参考索引且这个运动矢量的参考图片的POC不同于目标运动矢量的参考图片的POC时,这个运动矢量被视为不可用。
替代地,disable_spatial_mv_poc_scaling_flag可添加在PPS、APS或切片标头中,以指示特定PPS、APS或切片标头可适用于的图片的相同功能性。
在又一实例中,视频编码器20及视频解码器30可经配置以在多视图或3DV上下文下在SPS中译码标志,以禁用视图间运动矢量(例如,视差运动矢量)用于时间运动矢量预测(TMVP)的使用。下文的表2提供与本发明的某些技术一致的实例序列参数集原始字节序列有效负载(RBSP)语法:
表2
seq_parameter_set_rbsp(){ | 描述符 |
profile_idc | u(8) |
reserved_zero_8bits/*等于0*/ | u(8) |
level_idc | u(8) |
seq_parameter_set_id | ue(v) |
… | |
bit_equal_one | u(1) |
… | |
disable_inter_view_as_tmvp_flag | u(1) |
… | |
if(sps_extension_flag2) | |
while(more_rbsp_data()) | |
sps_extension_data_flag2 | u(1) |
rbsp_trailing_bits() | |
} |
一般而言,表2的序列参数集的语义保持与当前HEVC工作草案情况下的语义相同。然而,表2引入bit_equal_one、disable_inter_view_as_tmvp_flag、sps_extension_flag及_sps_extension_data_flag2。下文提供这些添加元素的实例语义:
在这个实例中,disable_inter_view_as_tmvp_flag等于1指示,对于经译码视频序列中的所有切片,视图间(仅)参考图片决不选择为TMVP模式的同置图片。注意,这种情形暗示对collocated_ref_idx的约束(即,collocated_ref_idx可以同置图片决不对应于来自不同视图的参考图片的方式设置)。
在这个实例中,disable_inter_view_as_tmvp_flag等于0指示,视图间(仅)参考图片可选择为TMVP模式的同置图片。
在一些实例中,除当前HEVC工作草案的元素中的任一者以外或在其替代例中,序列参数集也可包括上文所描述的表1及2中的任一者或两者的元素。
可将当前语法作为用于MVC/3DV扩展的扩展位的部分而发信。替代地,语法元素可在其它位置发信,所述位置可含有用于多视图/3DV序列的序列级别信息(诸如,子集序列参数集(SPS))或甚至可能地较高级别语法表(诸如,视频参数集)。替代地,可能不将以上语法元素(disable_inter_view_as_tmvp_flag)发信,但位流可始终符合disable_inter_view_as_tmvp_flag等于1时的状况。这种情形可通过如下操作而实现:以collocated_ref_idx决不对应于视图间参考图片的方式选择collocated_ref_idx。
另外,图片参数集(PPS)语法可根据本发明的技术而修改。举例来说,语法元素“weighted_bipred_idc”可在PPS中发信。用于这个语法元素的语义可如下:weighted_bipred_idc等于0可指定,将默认加权预测应用于B切片。weighted_bipred_idc等于1可指定,将显式加权预测应用于B切片。weighted_bipred_idc等于2可指定,应将隐式加权预测应用于B切片。weighted_bipred_idc等于3可指定,将受约束隐式加权预测应用于B切片。weighted_bipred_idc的值可在0到3(包括0及3)的范围内。
下文的表3提供与本发明的某些技术一致的用于切片标头的实例语法表:
表3
一般而言,表3的切片标头的语义保持与HEVC情况下的语义相同。然而,表3引入poc_sacling_tmvp_disabled标志及约束隐式表。下文提供这些添加元素的语义(其中约束隐式表的实例关于下文的表4及5而描述):
poc_scaling_tmvp_disabled_flag等于1可指示,不缩放从TMVP所导出的运动矢量。这个标志等于0可指示,可如在TMVP的当前设计中来缩放从TMVP所导出的运动矢量。
如上文所提到,(例如)根据下文的表4或表5,切片标头可包括约束隐式表。
表4
const_implicit_table(){ | 描述符 |
for(i=0;i<=num_ref_idx_lc_active_minus 1;i++) | |
implicit_disabled_pic_flag[i] | u(1) |
} |
表5提供约束隐式表的替代实例:
表5
const_implicit_table(){ | 描述符 |
for(i=0;i<=num_ref_idx_l0_active_minus 1;i++) | |
implicit_disabled_pic_l0_flag[i] | u(1) |
for(i=0;i<=num_ref_idx_l1_active_minus 1;i++) | |
implicit_disabled_pic_l1_flag[i] | |
} |
下文提供表4及5中的语法元素的语义:
implicit_disabled_pic_flag[i]等于1可指示,在隐式加权预测中,如果使用组合式参考图片列表中对应于参考索引i的参考图片,那么将在隐式加权预测期间用于这个参考图片及另一参考图片的权重皆设置为0.5,意谓无加权预测。
implicit_disabled_pic_l0_flag[i]等于1可指示,在隐式加权预测中,如果使用RefPicList0中对应于参考索引i的参考图片,那么将在隐式加权预测期间用于这个参考图片及另一参考图片的权重皆设置为0.5,意谓无加权预测。
implicit_disabled_pic_l1_flag[i]等于1可指示,在隐式加权预测中,如果使用RefPicList1中对应于参考索引i的参考图片,那么将在加权预测期间用于这个参考图片及另一参考图片的权重皆设置为0.5,意谓无加权预测。
替代地,可直接发信将受约束而不能隐式加权预测的图片的参考索引值。
替代地,作为RPS发信号的部分,可直接发信将受约束而不能进行隐式加权预测的图片。
替代地,在MVC或3DV编解码器中,含有视图间(仅)参考图片的RPS子集可始终设置为受约束隐式加权预测图片。
受约束隐式加权预测图片为使得满足以下情形的图片:在用于隐式预测时,这个图片及双向预测对的另一图片的权重皆为0.5。
替代地,视频编码器20及视频解码器30可经配置以针对每一RPS子集在PPS或SPS或切片标头中译码指示RPS子集中的所有图片是否为受约束隐式加权预测图片的标志。
作为另一实例,视频编码器20及视频解码器30可经配置以在SPS中译码refPicType。表6提供这个SPS的语法的实例集合:
表6
seq_parameter_set_rbsp(){ | 描述符 |
profile_idc | u(8) |
reserved_zero_8bits/*等于0*/ | u(8) |
level_idc | u(8) |
seq_parameter_set_id | ue(v) |
… | |
numAdditionalRPSSubSets | ue(v) |
for(i=0;i<numAdditionalRPSSubSets;i++) | |
ref_type_flag[i] | u(1) |
… | |
rbsp_trailing_bits() | |
} |
一般而言,表6的序列参数集的语义保持与当前HEVC工作草案情况下的语义相同。然而,表6引入numAdditionalRPSSubSets及for()循环内的ref_type_flag[i]。下文提供这些添加元素的实例语义:
在这个实例中,numAdditionalRPSSubSets指定除短期参考图片的RPS子集及长期参考图片的RPS子集以外的额外RPS子集。
在这个实例中,ref_type_flag[i]指定用于额外RPS子集i的任何图片的标志。对于含有短期参考图片的RPS子集及含有长期参考图片的RPS子集,这个标志可推断为等于0。
RefTypeIdc可设置为RPS子集的ref_type_flag。
替代地,视频编码器20及视频解码器30无需译码这个标志,且可针对视图间RPS子集将这个标志推断为值1。
替代地,如果运动矢量的参考图片具有与当前图片相同的POC,那么视频编码器20及视频解码器30可将参考图片的RefTypeIdc的值导出为1,且否则导出为0。
其它实例可类似于上文的第一实例(或其它实例),其中具有以下添加。在下文的实例中,如果运动矢量mv的参考索引指向时间参考图片,那么RefPicTypeFuncMV(mv)返回0,且如果运动矢量mv的参考索引指向不同视图/层中的图片,那么RefPicTypeFuncMV(mv)返回1。替代地,如果pic为短期参考图片,那么RefPicTypeFunc(pic)返回0,且如果pic为长期图片,那么RefPicTypeFunc(pic)返回1。如果运动矢量mv的参考索引指向短期参考图片,那么RefPicTypeFuncMV(mv)返回0,且如果运动矢量mv的参考索引指向长期参考图片,那么RefPicTypeFuncMV(mv)返回1。另外,针对AMVP修改以下进程。
用于亮度运动矢量预测的导出进程
对这种进程的输入为
-亮度位置(xP,yP),其指定相对于当前图片的左上样本的当前预测单元的左上亮度样本,
-指定用于亮度的预测单元的宽度nPSW及高度nPSH的变量。
-当前预测单元分区的参考索引refIdxLX(其中X为0或1)。
这种进程的输出为
-运动矢量mvLX的预测mvpLX(其中X为0或1)。
用以下有序步骤导出运动矢量预测值mvpLX。
1.调用子条款8.5.2.1.6中用于来自相邻预测单元分区的运动矢量预测值候选者的导出进程,其中亮度位置(xP,yP)、预测单元的宽度nPSW及高度nPSH以及refIdxLX(其中X分别为0或1)作为输入,且可用性标志availableFlagLXN及运动矢量mvLXN(其中N由A、B替换)作为输出。
2.如果RefPicTypeFuncMV(mvLXA)不等于RefPicTypeFuncMV(mvpLX),那么availableFlagLXA设置为等于0,如果RefPicTypeFuncMV(mvLXB)不等于RefPicTypeFuncMV(mvpLX),那么availableFlagLXB设置为等于0。
3.如果availableFlagLXA及availableFlagLXB两者等于1且mvLXA不等于mvLXB,那么availableFlagLXCol设置为等于0,否则,调用子条款5中用于时间亮度运动矢量预测的导出进程,其中亮度位置(xP,yP)、预测单元的宽度nPSW及高度nPSH以及refIdxLX(其中X分别为0或1)作为输入,且输出为可用性标志availableFlagLXCol及时间运动矢量预测值mvLXCol。
4.如下构造运动矢量预测值候选者列表mvpListLX。
1.mvLXA,在availableFlagLXA等于1的情况下
2.mvLXB,在availableFlagLXB等于1的情况下,
3.mvLXCol,在availableFlagLXCol等于1的情况下,
5.当mvLXA及mvLXB具有相同值时,将mvLXB从列表移除。将变量numMVPCandLX设置为mvpListLX内的元素的数目,且将maxNumMVPCand设置为2。
6.如下修改运动矢量预测值列表。
-如果numMVPCandLX小于2,那么以下内容适用。
mvpListLX[numMVPCandLX][0]=0 (8-133)
mvpListLX[numMVPCandLX][1]=0 (8-134)
numMVPCandLX=numMVPCandLX+1 (8-135)
-否则(numMVPCandLX等于或大于2),idx大于1的所有运动矢量预测值候选者mvpListLX[idx]从列表移除。
7.mvpListLX[mvp_1X_flag[xP,yP][的运动矢量指派给mvpLX。
另外,以下修改可适用于TMVP。当在TMVP期间检查每一参考图片的POC值而非检查每一图片时,进行以下修改:仅检查RefPicTypeFunc()等于0的图片。当在一个替代例中,RefPicTypeFunc()针对短期参考图片返回0时,这意谓仅短期参考图片被检查。
可由视频编码器20及视频解码器30实施的一个详细实施如下:
用于时间亮度运动矢量预测的导出进程
对这种进程的输入为
-亮度位置(xP,yP),其指定相对于当前图片的左上样本的当前预测单元的左上亮度样本,
-指定用于亮度的预测单元的宽度nPSW及高度nPSH的变量,
-当前预测单元分区的参考索引refIdxLX(其中X为0或1)。
这种进程的输出为
-运动矢量预测mvLXCol,
-可用性标志availableFlagLXCol。
函数RefPicOrderCnt(picX,refIdx,LX)返回来自图片picX的参考图片列表LX的具有索引refIdx的参考图片的图片顺序计数PicOrderCntVal,且指定如下。
RefPicOrderCnt(picX,refIdx,LX)=PicOrderCnt(图片picX的RefPicListLX(refIdx))
(8-141)
取决于slice_type、collocated_from_l0_flag及collocated_ref_idx的值,指定含有同置分区的图片的变量colPic如下导出。
-如果slice_type等于B且collocated_from_l0_flag等于0,那么变量colPic指定如通过RefPicList1[collocated_ref_idx]所指定的含有同置分区的图片。
-否则(slice_type等于B且collocated_from_l0_flag等于1或slice_type等于P),变量colPic指定如由RefPicList0[collocated_ref_idx]所指定的含有同置分区的图片。
用以下有序步骤导出变量colPu及其位置(xPCol,yPCol):
1.如下导出变量colPu
yPRb=yP+nPSH (8-149)
-如果(yP>>Log2CtbSize)等于(yPRb>>Log2CtbSize),那么当前预测单元的右下亮度位置的水平分量由下式定义
xPRb=xP+nPSW (8-150)
且变量colPu设置为覆盖colPic内部的由((xPRb>>4)<<4,(yPRb>>4)<<4)所给出的经修改位置的预测单元。
-否则((yP>>Log2CtbSize)不等于(yPRb>>Log2CtbSize)),colPu标记为“不可用”。
2.当colPu以帧内预测模式而译码或colPu标记为“不可用”时,以下内容适用。
-当前预测单元的中央亮度位置由下式定义
xPCtr=(xP+(nPSW>>1) (8-151)
yPCtr=(yP+(nPSH>>1) (8-152)
-变量colPu设置为覆盖colPic内部的由((xPCtr>>4)<<4,(yPCtr>>4)<<4)所给出的经修改位置的预测单元。
3.(xPCol,yPCol)设置为等于相对于colPic的左上亮度样本的colPu的左上亮度样本。
函数LongTermRefPic(picX,refIdx,LX)定义如下。如果来自图片picX的参考图片列表LX的具有索引refIdx的参考图片在picX为当前图片时标记为“用于长期参考”,那么LongTermRefPic(picX,refIdx,LX)返回1;否则LongTermRefPic(picX,refIdx,LX)返回0。
如下导出变量mvLXCol及availableFlagLXCol。
-如果以下条件中的一者成立,那么mvLXCol的两个分量设置为等于0,且availableFlagLXCol设置为等于0。
-colPu以帧内预测模式而译码。
-colPu标记为“不可用”。
-pic_temporal_mvp_enable_flag等于0。
-否则,如下导出运动矢量mvCol、参考索引refIdxCol及参考列表标识符listCol。
-如果PredFlagL0[xPCol][yPCol]等于0,那么mvCol、refIdxCol及listCol分别设置为等于MvL1[xPCol][yPCol]、RefIdxL1[xPCol][yPCol]及L1。
-否则(PredFlagL0[xPCol][yPCol]等于1),以下内容适用。
-如果PredFlagL1[xPCol][yPCol]等于0,那么mvCol、refIdxCol及listCol分别设置为等于MvL0[xPCol][yPCol]、RefIdxL0[xPCol][yPCol]及L0。
-否则(PredFlagL1[xPCol][yPCol]等于1),进行以下指派。
-如果每一参考图片列表中的RefPicTypeFunc(pic)等于0的每一图片pic(或,在一个替代例中,“每一短期图片pic”)的PicOrderCnt(pic)小于或等于PicOrderCntVal,那么mvCol、refIdxCol及listCol分别设置为等于MvLX[xPCol][yPCol]、RefIdxLX[xPCol][yPCol]及LX,其中X为调用这种进程时X的值。
-否则(至少一个参考图片列表中的至少一个图片pic的PicOrderCnt(pic)大于PicOrderCntVal),mvCol、refIdxCol及listCol分别设置为等于MvLN[xPCol][yPCol]、RefIdxLN[xPCol][yPCol]及LN,其中N为collocated_from_l0_flag的值。
…
在使用CU的PU进行帧内预测性或帧间预测性译码之后,视频编码器20可计算CU的TU的残余数据。PU可包含描述在空间域(也称为像素域)中产生预测性像素数据的方法或模式的语法数据,且TU可包含在对残余视频数据应用变换之后在变换域中的系数,所述变换例如离散余弦变换(DCT)、整数变换、小波变换,或概念上类似的变换。残余数据可对应于未经编码图片的像素与对应于PU的预测值之间的像素差。视频编码器20可形成包括CU的残余数据的TU,且接着变换所述TU以产生CU的变换系数。
在应用任何变换以产生变换系数之后,视频编码器20可执行变换系数的量化。量化一般是指将变换系数量化以可能地缩减用以表示所述系数的数据的量从而提供进一步压缩的进程。量化进程可缩减与系数中的一些或全部相关联的位深度。举例来说,n位值可在量化期间降值舍位至m位值,其中n大于m。
在量化之后,视频编码器可扫描变换系数,从而从包括经量化变换系数的二维矩阵产生一维矢量。扫描可经设计以将较高能量(及因此较低频率)系数放置在阵列前部,且将较低能量(及因此较高频率)系数放置在阵列后部。在一些实例中,视频编码器20可利用预定义扫描顺序来扫描经量化变换系数,以产生可经熵编码的系列化矢量。在其它实例中,视频编码器20可执行自适应扫描。在扫描经量化变换系数以形成一维矢量之后,视频编码器20可(例如)根据上下文自适应可变长度译码(CAVLC)、上下文自适应二进制算术译码(CABAC)、基于语法的上下文自适应二进制算术译码(SBAC)、概率区间分割熵(PIPE)译码或另一熵编码方法而熵编码所述一维矢量。视频编码器20也可熵编码与经编码视频数据相关联的语法元素,以供视频解码器30用于解码视频数据。
为了执行CABAC,视频编码器20可将上下文模型内的上下文指派给待传输的符号。所述上下文可与(例如)符号的相邻值是否为非零相关。为了执行CAVLC,视频编码器20可针对待传输的符号选择可变长度码。可将VLC中的码字构造成使得相对较短码对应于更有可能的符号,而较长码对应于较不可能的符号。如此,与(例如)针对待传输的每一符号使用相等长度码字相比较,使用VLC可实现位节省。概率确定可基于指派给符号的上下文。
视频编码器20可(例如)在帧标头、块标头、切片标头或GOP标头中进一步将语法数据(诸如,基于块的语法数据、基于帧的语法数据及基于GOP的语法数据)发送到视频解码器30。GOP语法数据可描述相应GOP中的帧的数目,且帧语法数据可指示用以编码对应帧的编码/预测模式。
可将视频编码器20及视频解码器30各自实施为多种合适的编码器或解码器电路中的任一者(在适用时),诸如一或多个微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑电路、软件、硬件、固件,或其任何组合。视频编码器20及视频解码器30中的每一者可包括在一或多个编码器或解码器中,其中的任一者可整合为组合式视频编码器/解码器(编解码器)的部分。包括视频编码器20及/或视频解码器30的装置可包含集成电路、微处理器,及/或无线通信装置(诸如,蜂窝电话)。
如此,视频编码器20及视频解码器30表示视频译码器(例如,视频编码器或视频解码器)的实例,所述视频译码器经配置以执行以下操作:确定视频数据的当前块的当前运动矢量的第一类型;确定当前块的相邻块的候选运动矢量预测值的第二类型;在第一类型不同于第二类型时将表示候选运动矢量预测值是否可用的变量设置为指示候选运动矢量预测值不可用的值;及至少部分地基于所述变量的值而译码当前运动矢量。另外,当第一类型包含视差运动矢量,第二类型包含视差运动矢量,且候选运动矢量预测值用以预测当前运动矢量时,视频译码器可经配置以在不缩放候选运动矢量预测值的情况下译码当前运动矢量。
图2为说明视频编码器20的实例的框图,视频编码器20可实施用于译码运动矢量且用于在HEVC及其扩展(诸如,多视图或3DV扩展)中执行双向预测的技术。视频编码器20可执行视频切片内的视频块的帧内译码及帧间译码。帧内译码依赖于空间预测以缩减或移除给定视频帧或图片内的视频的空间冗余。帧间译码依赖于时间预测以缩减或移除视频序列的邻近帧或图片内的视频的时间冗余。帧内模式(I模式)可指若干基于空间的译码模式中的任一者。帧间模式(诸如,单向预测(P模式)或双向预测(B模式))可指若干基于时间的译码模式中的任一者。
如图2中所展示,视频编码器20接收待编码的视频帧内的当前视频块。在图2的实例中,视频编码器20包括模式选择单元40、参考图片存储器64、求和器50、变换处理单元52、量化单元54及熵编码单元56。模式选择单元40又包括运动补偿单元44、运动估计单元42、帧内预测单元46及分割单元48。为了实现视频块重建,视频编码器20也包括反量化单元58、反变换单元60及求和器62。也可包括去块滤波器(图2中未图示)以对块边界进行滤波,从而从经重建视频移除块假象。在需要时,去块滤波器将通常对求和器62的输出进行滤波。除去块滤波器以外,也可使用额外滤波器(环路内或环路后)。为简洁起见而未展示这些滤波器,但在需要时这些滤波器可对求和器50的输出进行滤波(作为循环内滤波器)。
在编码进程期间,视频编码器20接收待译码的视频帧或切片。可将帧或切片划分为多个视频块。运动估计单元42及运动补偿单元44相对于一或多个参考帧中的一或多个块执行所接收视频块的帧间预测性译码,以提供时间预测。帧内预测单元46可替代地相对于与待译码的所接收视频块相同的帧或切片中的一或多个相邻块而执行所述块的帧内预测性译码,以提供空间预测。视频编码器20可执行多个译码遍次,(例如)以针对视频数据的每一块选择适当译码模式。
此外,分割单元48可基于先前译码遍次中的先前分割方案的评估而将视频数据的块分割为多个子块。举例来说,分割单元48可最初将帧或切片分割为多个LCU,且基于速率-失真分析(例如,速率-失真优化)将所述LCU中的每一者分割为多个子CU。模式选择单元40可进一步产生指示LCU至子CU的分割的四叉树数据结构。四叉树的叶节点CU可包括一或多个PU及一或多个TU。
模式选择单元40可(例如)基于误差结果而选择译码模式(帧内或帧间)中的一者,且将所得经帧内或帧间译码块提供到求和器50以产生残余块数据,且提供到求和器62以重建经编码块以用作参考帧。模式选择单元40也将语法元素(诸如,运动矢量、帧内模式指示符、分割信息及其它此类语法信息)提供到熵编码单元56。
运动估计单元42及运动补偿单元44可高度整合,但为概念性目的而单独说明。由运动估计单元42所执行的运动估计为产生运动矢量的进程,所述运动矢量估计视频块的运动。举例来说,运动矢量可指示视频块的PU在当前视频帧或图片内相对于在参考帧(或其它经译码单元)内的预测性块(其关于在当前帧(或其它经译码单元)内正译码的当前块)的位移。预测性块为被发现就像素差而言紧密地匹配待译码的块的块,所述像素差可通过绝对差总和(SAD)、平方差总和(SSD)或其它差指标而确定。在一些实例中,视频编码器20可计算存储在参考图片存储器64中的参考图片的子整数像素位置的值。举例来说,视频编码器20可内插参考图片的四分之一像素位置、八分之一像素位置或其它小数像素位置的值。因此,运动估计单元42可执行相对于全像素位置及小数像素位置的运动搜索,且以小数像素精度输出运动矢量。
运动估计单元42通过比较经帧间译码切片中的视频块的PU的位置与参考图片的预测性块的位置而计算所述PU的运动矢量。参考图片可从第一参考图片列表(列表0)或第二参考图片列表(列表1)选择,所述列表中的每一者识别存储在参考图片存储器64中的一或多个参考图片。运动估计单元42将计算出的运动矢量发送到熵编码单元56及运动补偿单元44。
由运动补偿单元44所执行的运动补偿可涉及基于由运动估计单元42所确定的运动矢量而提取或产生预测性块。此外,在一些实例中,运动估计单元42及运动补偿单元44可在功能上整合。在接收到当前视频块的PU的运动矢量后,运动补偿单元44即可将运动矢量所指向的预测性块定位在参考图片列表中的一者中。求和器50通过从正译码的当前视频块的像素值中减去预测性块的像素值来形成残余视频块,从而形成像素差值,如下文所论述。一般而言,运动估计单元42相对于亮度分量而执行运动估计,且运动补偿单元44将基于所述亮度分量所计算的运动矢量用于色度分量及亮度分量两者。模式选择单元40也可产生与视频块及视频切片相关联的语法元素,以供视频解码器30用于解码视频切片的视频块。
根据本发明的技术,当模式选择单元40推选使用运动估计单元42及运动补偿单元44来帧间预测视频数据的块(例如,PU)时,视频编码器20可(例如)使用AMVP或合并模式进一步编码运动矢量。举例来说,熵编码单元56可从模式选择单元40接收运动矢量,且编码所述运动矢量。熵编码单元56可通过选择供检索运动矢量预测值的相邻块及计算运动矢量与运动矢量预测值之间的差(例如,水平运动矢量差及垂直运动矢量差)来使用AMVP熵编码所述运动矢量,接着熵编码表示所述差的一或多个语法元素。
根据本发明的技术,当候选运动矢量预测值具有不同于当前运动矢量的类型时,熵编码单元56可将所述候选运动矢量预测值设置为不可用于AMVP(或合并模式)中来预测所述当前运动矢量。甚至在不同进程基于其它准则确定候选运动矢量可用之后,如此将候选运动矢量预测值设置为不可用仍可得以执行。举例来说,如果候选运动矢量预测值为视差运动矢量且当前运动矢量为时间运动矢量,那么熵编码单元56可将候选运动矢量预测值设置为不可用作当前运动矢量的预测值。同样地,如果候选运动矢量预测值为时间运动矢量且当前运动矢量为视差运动矢量,那么熵编码单元56可将候选运动矢量预测值设置为不可用作当前运动矢量的预测值。
熵编码单元56可使用一或多种各种技术来确定正编码的运动矢量及运动矢量预测值为相同类型的运动矢量还是不同类型的运动矢量。在一些实例中,熵编码单元56可确定正编码的运动矢量及候选运动矢量预测值是否参考具有不同于正编码的当前图片的POC值的参考图片。如果运动矢量或候选运动矢量预测值中的一者参考具有不同于正编码的当前图片的POC值的参考图片,且另一者参考具有与正编码的当前图片相同的POC值的参考图片,那么熵编码单元56可确定运动矢量及候选运动矢量预测值为不同类型的运动矢量。详言之,可将参考具有与正编码的当前图片相同的POC值的参考图片的运动矢量视为视差运动矢量,而可将参考具有不同于当前图片的POC值的参考图片的运动矢量视为时间运动矢量。
作为另一实例,熵编码单元56可确定当前运动矢量参考包括正编码的当前图片的当前层或不同层中的参考图片。同样地,熵编码单元56可确定候选运动矢量预测值参考当前层或不同层中的参考图片。如果当前运动矢量及候选运动矢量预测值两者参考当前层中的参考图片或不同层中的参考图片,那么熵编码单元56可确定当前运动矢量及候选运动矢量预测值为相同类型的运动矢量。详言之,如果当前运动矢量及候选运动矢量预测值参考一或多个不同层中的参考图片,那么当前运动矢量及候选运动矢量预测值可包含视差运动矢量。如果当前运动矢量及候选运动矢量预测值参考当前层中的参考图片,那么当前运动矢量及候选运动矢量预测值可包含时间运动矢量。如果当前运动矢量及候选运动矢量预测值中的一者参考当前层中的参考图片,且另一者参考不同层中的参考图片,那么熵编码单元56可确定当前运动矢量及候选运动矢量预测值为不同类型的运动矢量。
作为又一实例,熵编码单元56可确定当前运动矢量参考长期参考图片还是短期参考图片,且同样地,候选运动矢量预测值参考长期参考图片还是短期参考图片。如果当前运动矢量及候选运动矢量预测值两者参考相同类型的参考图片(即,皆参考长期参考图片或皆参考短期参考图片),那么熵编码单元56可确定当前运动矢量及候选运动矢量预测值为相同类型的运动矢量。另一方面,如果当前运动矢量及候选运动矢量预测值中的一者参考长期参考图片,且另一者参考短期参考图片,那么熵编码单元56可确定当前运动矢量及候选运动矢量预测值为不同类型的运动矢量。参考长期参考图片的运动矢量可包含时间运动矢量,而参考短期参考图片的运动矢量可包含视差运动矢量。
如上文所论述,熵编码单元56可确定具有不同于当前运动矢量的类型的候选运动矢量不可用作当前运动矢量的运动矢量预测值。因此,熵编码单元56可从当前运动矢量的候选运动矢量预测值的列表移除这些候选运动矢量预测值,或省略将这个候选运动矢量预测值添加到候选运动矢量预测值的列表。详言之,熵编码单元56可设置与候选运动矢量预测值相关联的变量的值,以指示候选运动矢量预测值是否可用作当前运动矢量的运动矢量预测值。此外,熵编码单元56可经配置以选择具有与当前运动矢量相同的类型的候选运动矢量预测值来编码当前运动矢量,例如,对于所述运动矢量,与候选运动矢量预测值相关联的变量具有指示所述候选运动矢量预测值可用作当前运动矢量的运动矢量预测值的值。熵编码单元56可使用诸如高级运动矢量预测值(AMVP)或合并模式的各种运动矢量编码模式来编码当前运动矢量。
一般而言,在运动矢量预测值参考不同于由当前运动矢量所参考的参考图片的参考图片时(例如,在参考图片的POC值不同时),熵编码单元56可缩放所使用的运动矢量预测值以预测当前运动矢量。更特别地,熵编码单元56可基于参考图片的POC值之间的差而缩放时间运动矢量预测值。然而,当使用为视差运动矢量的运动矢量预测值预测也为视差运动矢量的运动矢量时,熵编码单元56可禁用运动矢量预测值缩放。
熵编码单元56可通过计算运动矢量与运动矢量预测值(例如,具有与正译码的运动矢量相同的类型的运动矢量预测值)之间的运动矢量差值而编码运动矢量。一般而言,运动矢量可由水平分量(或x分量)及垂直分量(或y分量)定义。熵编码单元56可将MVDx(运动矢量差的x分量)计算为正编码的运动矢量的x分量与运动矢量预测值的x分量之间的差。同样地,熵编码单元56可将MVDy(运动矢量差的y分量)计算为正编码的运动矢量的y分量与运动矢量预测值的y分量之间的差。在运动矢量为时间运动矢量的状况下,熵编码单元56可相对于运动矢量预测值的缩放版本计算运动矢量差值(MVDx及MVDy)(基于由正编码的运动矢量与运动矢量预测值所参考的参考图片之间的POC差)。熵编码单元56可接着(例如)使用CABAC熵编码MVDx及MVDy。
作为由运动估计单元42及运动补偿单元44所执行的帧间预测(如上文所描述)的替代例,帧内预测单元46可帧内预测当前块。详言之,帧内预测单元46可确定待用以编码当前块的帧内预测模式。在一些实例中,帧内预测单元46可(例如)在单独编码遍次期间使用各种帧内预测模式来编码当前块,且帧内预测单元46(或在一些实例中,模式选择单元40)可从所测试的模式选择待使用的适当帧内预测模式。
举例来说,帧内预测单元46可使用针对各种经测试的帧内预测模式的速率-失真分析而计算速率-失真值,且在经测试模式当中选择具有最佳速率-失真特性的帧内预测模式。速率-失真分析一般确定经编码块与原始未经编码块之间的失真(或误差)的量以及用以产生经编码块的位速率(即,位的数目),所述原始未经编码块经编码以产生所述经编码块。帧内预测单元46可从各种经编码块的失真及速率计算比率,以确定哪一帧内预测模式展现块的最佳速率-失真值。
在为块选择帧内预测模式之后,帧内预测单元46可将指示块的选定帧内预测模式的信息提供到熵编码单元56。熵编码单元56可编码指示选定帧内预测模式的信息。视频编码器20可在所传输的位流配置数据中包括各种块的编码上下文的定义及待用于所述上下文中的每一者的最有可能的帧内预测模式、帧内预测模式索引表及经修改的帧内预测模式索引表的指示,所述位流配置数据可包括多个帧内预测模式索引表及多个经修改的帧内预测模式索引表(也称为码字映射表)。
视频编码器20通过从正译码的原始视频块减去来自模式选择单元40的预测数据而形成残余视频块。求和器50表示执行这种减去运算的(多个)组件。变换处理单元52将变换(诸如,离散余弦变换(DCT)或概念上类似的变换)应用于残余块,从而产生包含残余变换系数值的视频块。变换处理单元52可执行概念上类似于DCT的其它变换。也可使用小波变换、整数变换、子带变换或其它类型的变换。
在任何状况下,变换处理单元52将变换应用于残余块,从而产生残余变换系数的块。变换可将残余信息从像素值域转换到变换域(诸如,频域)。变换处理单元52可将所得变换系数发送到量化单元54。量化单元54量化变换系数以进一步缩减位速率。量化进程可缩减与系数中的一些或全部相关联的位深度。可通过调整量化参数来修改量化程度。在一些实例中,量化单元54可接着执行包括经量化变换系数的矩阵的扫描。替代地,熵编码单元56可执行所述扫描。
在量化之后,熵编码单元56熵译码经量化变换系数。举例来说,熵编码单元56可执行上下文自适应可变长度译码(CAVLC)、上下文自适应二进制算术译码(CABAC)、基于语法的上下文自适应二进制算术译码(SBAC)、概率区间分割熵(PIPE)译码或另一熵译码技术。在基于上下文的熵译码的状况下,上下文可基于相邻块。在由熵编码单元56熵译码之后,可将经编码位流传输到另一装置(例如,视频解码器30)或加以存档以供稍后传输或检索。
反量化单元58及反变换单元60分别应用反量化及反变换,以在像素域中重建残余块(例如)以供稍后用作参考块。运动补偿单元44可通过将残余块加到参考图片存储器64的帧中的一者的预测性块而计算参考块。运动补偿单元44也可将一或多个内插滤波器应用于经重建残余块,以计算用于运动估计中的子整数像素值。求和器62将经重建残余块加到由运动补偿单元44所产生的运动补偿预测块,以产生经重建视频块以供存储在参考图片存储器64中。经重建视频块可由运动估计单元42及运动补偿单元44用作参考块,以帧间译码后续视频帧中的块。
如此,图2的视频编码器20表示视频编码器的实例,所述视频编码器经配置以执行以下操作:确定视频数据的当前块的当前运动矢量的第一类型;确定当前块的相邻块的候选运动矢量预测值的第二类型;在第一类型不同于第二类型时将表示候选运动矢量预测值是否可用的变量设置为指示候选运动矢量预测值不可用的值;及至少部分地基于所述变量的值而编码当前运动矢量。另外,当第一类型包含视差运动矢量,第二类型包含视差运动矢量,且候选运动矢量预测值用以预测当前运动矢量时,视频编码器可经配置以在不缩放候选运动矢量预测值的情况下译码当前运动矢量。
图3为说明视频解码器30的实例的框图,视频解码器30可实施用于译码运动矢量且用于在HEVC及其扩展(诸如,多视图或3DV扩展)中执行双向预测的技术。在图3的实例中,视频解码器30包括熵解码单元70、运动补偿单元72、帧内预测单元74、反量化单元76、反变换单元78、参考图片存储器82及求和器80。在一些实例中,视频解码器30可执行与关于视频编码器20(图2)所描述的编码遍次大体上互逆的解码遍次。运动补偿单元72可基于从熵解码单元70所接收的运动矢量产生预测数据,而帧内预测单元74可基于从熵解码单元70所接收的帧内预测模式指示符产生预测数据。
在解码进程期间,视频解码器30从视频编码器20接收表示经编码视频切片的视频块及相关联的语法元素的经编码视频位流。视频解码器30的熵解码单元70熵解码位流,以产生经量化系数、运动矢量或帧内预测模式指示符,及其它语法元素。熵解码单元70将运动矢量及其它语法元素转发到运动补偿单元72。视频解码器30可在视频切片级别及/或视频块级别处接收语法元素。
当视频切片经译码为经帧内译码(I)切片时,帧内预测单元74可基于发信的帧内预测模式及来自当前帧或图片的先前经解码块的数据而产生当前视频切片的视频块的预测数据。当视频帧经译码为经帧间译码(即,B、P或GPB)切片时,运动补偿单元72基于从熵解码单元70所接收的运动矢量及其它语法元素而产生当前视频切片的视频块的预测性块。预测性块可从参考图片列表中的一者内的参考图片中的一者产生。视频解码器30可基于存储在参考图片存储器82中的参考图片使用默认构造技术来构造参考帧列表(列表0及列表1)。
运动补偿单元72通过分析运动矢量及其它语法元素而确定当前视频切片的视频块的预测信息,且使用所述预测信息来产生正解码的当前视频块的预测性块。举例来说,运动补偿单元72使用所接收语法元素中的一些来确定用以译码视频切片的视频块的预测模式(例如,帧内预测或帧间预测)、帧间预测切片类型(例如,B切片、P切片或GPB切片)、切片的参考图片列表中的一或多者的构造信息、切片的每一经帧间编码视频块的运动矢量、切片的每一经帧间译码视频块的帧间预测状态,及用以解码当前视频切片中的视频块的其它信息。
熵解码单元70可熵解码经P及B译码块的运动矢量。举例来说,熵解码单元70可使用AMVP或合并模式来解码运动矢量。详言之,根据本发明的技术,熵解码单元70可避免使用具有不同于正解码的当前运动矢量的类型的候选运动矢量预测值来解码当前运动矢量。举例来说,在当前运动矢量包含视差运动矢量时,熵解码单元70可使用也为视差运动矢量的运动矢量预测值来解码当前运动矢量。同样地,当使用包含视差运动矢量的运动矢量预测值解码当前运动矢量时,熵解码单元70可禁用缩放。作为另一实例,在当前运动矢量包含时间运动矢量时,熵解码单元70可使用也为时间运动矢量的运动矢量预测值来解码当前运动矢量。
根据本发明的技术,当候选运动矢量预测值具有不同于当前运动矢量的类型时,熵解码单元70可将所述候选运动矢量预测值设置为不可用于AMVP(或合并模式)中来预测所述当前运动矢量。举例来说,如果候选运动矢量预测值为视差运动矢量且当前运动矢量为时间运动矢量,那么熵解码单元70可将候选运动矢量预测值设置为不可用作当前运动矢量的预测值。同样地,如果候选运动矢量预测值为时间运动矢量且当前运动矢量为视差运动矢量,那么熵解码单元70可将候选运动矢量预测值设置为不可用作当前运动矢量的预测值。
熵解码单元70可使用一或多种各种技术来确定正解码的运动矢量及运动矢量预测值为相同类型的运动矢量还是不同类型的运动矢量。在一些实例中,熵解码单元70可确定正解码的运动矢量及候选运动矢量预测值是否参考具有不同于正解码的当前图片的POC值的参考图片。如果运动矢量或候选运动矢量预测值中的一者参考具有不同于正解码的当前图片的POC值的参考图片,且另一者参考具有与正解码的当前图片相同的POC值的参考图片,那么熵解码单元70可确定运动矢量及候选运动矢量预测值为不同类型的运动矢量。详言之,可将参考具有与正解码的当前图片相同的POC值的参考图片的运动矢量视为视差运动矢量,而可将参考具有不同于当前图片的POC值的参考图片的运动矢量视为时间运动矢量。
作为另一实例,熵解码单元70可确定当前运动矢量参考包括正解码的当前图片的当前层还是不同层中的参考图片。同样地,熵解码单元70可确定候选运动矢量预测值参考当前层还是不同层中的参考图片。如果当前运动矢量及候选运动矢量预测值两者参考当前层中的参考图片或不同层中的参考图片,那么熵解码单元70可确定当前运动矢量及候选运动矢量预测值为相同类型的运动矢量。详言之,如果当前运动矢量及候选运动矢量预测值参考一或多个不同层中的参考图片,那么当前运动矢量及候选运动矢量预测值可包含视差运动矢量。如果当前运动矢量及候选运动矢量预测值参考当前层中的参考图片,那么当前运动矢量及候选运动矢量预测值可包含时间运动矢量。如果当前运动矢量及候选运动矢量预测值中的一者参考当前层中的参考图片,且另一者参考不同层中的参考图片,那么熵解码单元70可确定当前运动矢量及候选运动矢量预测值为不同类型的运动矢量。
作为又一实例,熵解码单元70可确定当前运动矢量参考长期参考图片还是短期参考图片,且同样地,候选运动矢量预测值参考长期参考图片还是短期参考图片。如果当前运动矢量及候选运动矢量预测值两者参考相同类型的参考图片(即,皆参考长期参考图片或皆参考短期参考图片),那么熵解码单元70可确定当前运动矢量及候选运动矢量预测值为相同类型的运动矢量。另一方面,如果当前运动矢量及候选运动矢量预测值中的一者参考长期参考图片,且另一者参考短期参考图片,那么熵解码单元70可确定当前运动矢量及候选运动矢量预测值为不同类型的运动矢量。参考长期参考图片的运动矢量可包含时间运动矢量,而参考短期参考图片的运动矢量可包含视差运动矢量。
如上文所论述,熵解码单元70可确定具有不同于当前运动矢量的类型的候选运动矢量不可用作当前运动矢量的运动矢量预测值。因此,熵解码单元70可从当前运动矢量的候选运动矢量预测值的列表移除这些候选运动矢量预测值,或省略将这个候选运动矢量预测值添加到候选运动矢量预测值的列表。基于候选运动矢量预测值是否具有与当前运动矢量相同的类型,熵解码单元70也可设置与候选运动矢量预测值相关联的变量,所述变量指示候选运动矢量是否可用作当前运动矢量的运动矢量预测值。此外,熵解码单元70可经配置以选择具有与当前运动矢量相同的类型的候选运动矢量预测值来解码当前运动矢量,即,候选运动矢量预测值是否具有相关联的变量值,所述变量值指示候选运动矢量预测值可用作正解码的当前运动矢量的运动矢量预测值。熵解码单元70可使用诸如高级运动矢量预测值(AMVP)或合并模式的各种运动矢量解码模式来解码当前运动矢量。
为了解码当前运动矢量,熵解码单元70可选择多个候选运动矢量预测值中的一者(例如,如由语法数据所指示,或根据隐式选择进程)。当选定运动矢量预测值为时间运动矢量时,熵解码单元70可基于运动矢量预测值所参考的参考图片与当前运动矢量所参考的参考图片之间的POC差而缩放选定运动矢量预测值。熵解码单元70也可解码表示MVDx值(即,运动矢量差的水平或x分量)及MVDy值(即,运动矢量差的垂直或y分量)的语法元素。熵解码单元70也可将MVDx值加到选定(及可能缩放的)运动矢量预测值的x分量以重现当前运动矢量的x分量,且将MVDy值加到选定(及可能缩放的)运动矢量预测值的y分量以重现当前运动矢量的y分量。熵解码单元70可将经重现(即,经解码)运动矢量提供到运动补偿单元72。
运动补偿单元72可使用经解码运动矢量从先前解码图片(例如,从参考图片存储器82)检索数据。运动补偿单元72也可基于内插滤波器执行内插。运动补偿单元72可在视频块的编码期间使用如由视频编码器20所使用的内插滤波器,以计算参考块的子整数像素的内插值。在这种状况下,运动补偿单元72可从所接收语法元素确定由视频编码器20所使用的内插滤波器,且使用所述内插滤波器来产生预测性块。
反量化单元76反量化(即,去量化)在位流中提供且由熵解码单元70解码的经量化变换系数。反量化进程可包括针对视频切片中的每一视频块使用由视频解码器30计算的量化参数QPY,以确定量化程度且同样地确定应该应用的反量化的程度。反变换单元78将反变换(例如,反DCT、反整数变换或概念上类似的反变换进程)应用于变换系数,以便在像素域中产生残余块。
在运动补偿单元72基于运动矢量及其它语法元素产生当前视频块的预测性块之后,视频解码器30通过对以下两者求和而形成经解码视频块:来自反变换单元78的残余块,及由运动补偿单元72所产生的对应预测性块。求和器90表示执行这种求和运算的(多个)组件。在需要时,也可应用去块滤波器而对经解码块进行滤波,以便移除块假象。其它环路滤波器(译码环路中或译码环路之后)也可用以使像素转变平滑,或以其它方式改善视频质量。接着将给定帧或图片中的经解码视频块存储在参考图片存储器82中,参考图片存储器82存储用于后续运动补偿的参考图片。参考图片存储器82也存储经解码视频以供稍后在显示装置(诸如,图1的显示装置32)上呈现。
视频解码器30可经配置以根据本发明的一或多种技术执行解码进程。在一些实例中,对于每一图片PIC,当implicit_disabled_pic_flag[i]或implicit_disabled_pic_1X_flag[i]对应于图片PIC时,标志ConsImplicitFlag导出为等于implicit_disabled_pic_flag[i]或implicit_disabled_pic_1X_flag[i](其中X针对RefPicList0等于0或针对RefPicList1等于1)。替代地,当整个RPS子集指示为针对隐式加权预测受约束时,这个RPS子集的每一图片具有等于1的ConsImplicitFlag,否则,这个RPS子集的每一图片可具有等于0的ConsImplicitFlag。
作为一个实例,视频解码器30可经配置以执行加权样本预测进程。对这种进程的输入可包括:
-位置(xB,yB),其指定相对于当前译码单元的左上样本的当前预测单元的左上样本,
-这个预测单元的宽度nPSW及高度nPSH,
-两个(nPSW)×(nPSH)阵列predSamplesL0及predSamplesL1,
-预测列表利用标志predFlagL0及predFlagL1,
-参考索引refIdxL0及refIdxL1,
-运动矢量mvL0及mvL1,
-色度分量的位深度bitDepth。
这种进程的输出可包括:
-预测样本值的(nPSW)×(nPSH)阵列predSamples。
视频解码器30可如下导出变量shift1、shift2、offset1及offset2:
-变量shift1可设置为等于(14-bitDepth),且变量shift2可设置为等于(15-bitDepth),
-变量offset1可设置为等于1<<(shift1-1),且变量offset2可设置为等于1<<(shift2-1)。
在P切片中,如果predFlagL0的值等于1,那么以下内容可适用:
-如果weighted_pred_flag等于0,那么可调用如HEVC的WD6的子条款8.5.2.2.3.1中所描述的默认加权样本预测进程,其中输入及输出与这个子条款中所描述的进程相同。
-否则(weighted_pred_flag等于1),可调用如HEVC的WD6的子条款8.5.2.2.3.2中所描述的显式加权样本预测进程,其中输入及输出与这个子条款中所描述的进程相同。
在B切片中,如果predFlagL0或predFlagL1等于1,那么以下内容可适用:
-如果weighted_bipred_idc等于0,那么可调用如HEVC的WD6的子条款8.5.2.2.3.1中所描述的默认加权样本预测进程,其中输入及输出与这个子条款中所描述的进程相同。
-否则,如果weighted_bipred_idc等于1且如果predFlagL0或predFlagL1等于1,那么可调用如HEVC的WD6的子条款8.5.2.2.3.2中所描述的显式加权样本预测进程,其中输入及输出与这个子条款中所描述的进程相同。
-否则,如果weighted_bipred_idc等于2,那么以下内容可适用:
-如果predFlagL0等于1且predFlagL1等于1,那么可调用如HEVC的WD6的子条款8.5.2.2.3.2中所描述的隐式加权样本预测进程,其中输入及输出与这个子条款中所描述的进程相同。
-否则(predFlagL0或predFlagL1等于1但并非皆等于1),可调用如HEVC的WD6的子条款8.5.2.2.3.1中所描述的默认加权样本预测进程,其中输入及输出与这个子条款中所描述的进程相同。
-否则(weighted_bipred_idc等于3),以下内容可适用:
-如果predFlagL0等于1且predFlagL1等于1,且ConsImplicitFlag(RefPicListL0(refIdxL0))及ConsImplicitFlag(RefPicListL1(refIdxL1))皆等于1,那么可调用如HEVC的WD6的子条款8.5.2.2.3.2中所描述的隐式加权样本预测进程,其中输入及输出与这个子条款中所描述的进程相同。
-否则(predFlagL0或predFlagL1等于1但并非皆等于1),可调用如HEVC的WD6的子条款8.5.2.2.3.1中所描述的默认加权样本预测进程,其中输入及输出与这个子条款中所描述的进程相同。
替代地,在weighted_bipred_idc等于2时的隐式方法可直接改变为上文针对等于3的weighted_bipred_idc所指定的方法。
如此,图3的视频解码器30表示视频解码器的实例,所述视频解码器经配置以执行以下操作:确定视频数据的当前块的当前运动矢量的第一类型;确定当前块的相邻块的候选运动矢量预测值的第二类型;在第一类型不同于第二类型时将表示候选运动矢量预测值是否可用的变量设置为指示候选运动矢量预测值不可用的值;及至少部分地基于所述变量的值而解码当前运动矢量。另外,当第一类型包含视差运动矢量,第二类型包含视差运动矢量,且候选运动矢量预测值用以预测当前运动矢量时,视频解码器可经配置以在不缩放候选运动矢量预测值的情况下译码当前运动矢量。
图4为说明实例MVC预测样式的概念图。在图4的实例中,说明了八个视图(具有视图ID“S0”到“S7”),且针对每一视图说明十二个时间位置(“T0”到“T11”)。即,图4中的每一行对应于视图,而每一列指示时间位置。
尽管MVC具有可由H.264/AVC解码器解码的所谓的基础视图,且立体视图对可也由MVC支持,但MVC的优点在于:其可支持使用两个以上视图作为3D视频输入且解码由多个视图所表示的这个3D视频的实例。具有MVC解码器的客户端的呈现器可预期具有多个视图的3D视频内容。
使用包括字母的有阴影块在图4中的每一行与每一列的相交处指示图4中的帧,从而指定对应帧被帧内译码(即,I帧),还是在一个方向上被帧间译码(即,作为P帧)或在多个方向上被帧间译码(即,作为B帧)。一般而言,由箭头来指示预测,其中箭头指向的帧使用箭头出发的对象以用于预测参考。举例来说,从视图S0的在时间位置T0处的I帧预测视图S2的在时间位置T0处的P帧。
如同单视图视频编码,多视图视频译码视频序列的帧可关于在不同时间位置处的帧而预测性编码。举例来说,视图S0的在时间位置T1处的b帧具有从视图S0的在时间位置T0处的I帧指向到所述b帧的箭头,从而指示从I帧预测b帧。然而,另外,在多视图视频编码的上下文中,帧可被视图间预测。即,视图分量可使用其它视图中的视图分量以用于参考。举例来说,在MVC中,视图间预测实现为如同另一视图中的视图分量为帧间预测参考。可能的视图间参考是在序列参数集(SPS)MVC扩展中发信且可通过参考图片列表构造进程而修改,这种情形实现帧间预测或视图间预测参考的灵活排序。
在H.264/AVC的MVC扩展中,作为实例,通过视差运动补偿(其使用H.264/AVC运动补偿的语法)来支持视图间预测,但允许不同视图中的图片用作参考图片。两个视图的译码可由MVC支持,其一般被称为立体视图。MVC的优点中的一者在于:MVC编码器可采取两个以上视图作为3D视频输入,且MVC解码器可解码此类多视图表示。因此,具有MVC解码器的呈现装置可预期具有两个以上视图的3D视频内容。
在MVC中,允许同一访问单元(即,具有同一时间例项)中的图片当中的视图间预测。一般而言,访问单元为包括在通用时间例项的所有视图分量(例如,所有NAL单元)的数据单元。因此,在MVC中,准许在同一访问单元中的图片当中的视图间预测。当译码非基础视图中的一者中的图片时,如果所述图片在不同视图中但具有同一时间例项(例如,相同的POC值,且由此,在同一访问单元中),那么可将所述图片添加到参考图片列表中。可将视图间预测参考图片放在参考图片列表的任何位置中,正如任何帧间预测参考图片一样。
图4提供视图间预测的各种实例。在图4的实例中,将视图S1的帧说明为从视图S1的在不同时间位置处的帧进行预测以及从视图S0及S2的在相同时间位置处的帧进行视图间预测。举例来说,从视图S1的在时间位置T0及T2处的B帧中的每一者以及视图S0及S2的在时间位置T1处的b帧预测视图S1的在时间位置T1处的b帧。
在图4的实例中,大写字母“B”及小写字母“b”意欲指示帧之间的不同层次关系,而非不同编码方法。一般而言,与小写字母“b”帧相比,大写字母“B”帧在预测层次中相对较高。图4也使用不同程度的阴影说明预测层次的变化,其中与具有较少阴影(即,相对较浅)的那些帧相比,较大量阴影(即,相对较暗)帧在预测层次中较高。举例来说,用全阴影说明图4中的所有I帧,而P帧具有稍微较浅的阴影,且B帧(及小写字母b帧)相对于彼此具有各种程度的阴影,但始终浅于P帧及I帧的阴影。
一般而言,预测层次与视图顺序索引有关,这是因为在预测层次中相对较高的帧应在解码在层次中相对较低的帧之前解码,使得在层次中相对较高的那些帧可在解码在层次中相对较低的帧期间用作参考帧。视图顺序索引为指示访问单元中的视图分量的解码顺序的索引。在如H.264/AVC(MVC修正)的Annex H中所指定的SPS MVC扩展中暗示视图顺序索引。在SPS中,对于每一索引i,发信对应view_id。在一些实例中,视图分量的解码应遵循视图顺序索引的递升顺序。如果所有视图得以呈现,那么视图顺序索引呈从0到num_views_minus_1的连续顺序。
如此,用作参考帧的帧可在解码参考所述参考帧编码的帧之前解码。视图顺序索引为指示访问单元中的视图分量的解码顺序的索引。对于每一视图顺序索引i,发信对应view_id。视图分量的解码遵循视图顺序索引的递升顺序。如果所有视图得以呈现,那么视图顺序索引的集合可包含从零到比视图的全部数目小一的连续排序的集合。
对于在层次的相等级别处的某些帧,解码顺序可能相对于彼此无关紧要。举例来说,视图S0的在时间位置T0处的I帧用作视图S2的在时间位置T0处的P帧的参考帧,所述P帧又用作视图S4的在时间位置T0处的P帧的参考帧。因此,视图S0的在时间位置T0处的I帧应在视图S2的在时间位置T0处的P帧之前解码,所述P帧应在视图S4的在时间位置T0处的P帧之前解码。然而,在视图S1与S3之间,解码顺序无关紧要,这是因为视图S1及S3并不依赖于彼此而预测,而是仅从在预测层次中较高的视图预测。此外,视图S1可在视图S4之前解码,只要视图S1在视图S0及S2之后解码即可。
如此,层次排序可用以描述视图S0到S7。令表示法SA>SB意谓视图SA应在视图SB之前解码。在图4的实例中,使用这种表示法S0>S2>S4>S6>S7。又,关于图4的实例,S0>S1,S2>S1,S2>S3,S4>S3,S4>S5且S6>S5。不违反这些要求的视图的任何解码顺序是可能的。因此,在仅具有某些限制的情况下,许多不同的解码顺序是可能的。
图5为说明根据本发明的技术的用于编码当前块的实例方法的流程图。当前块可包含当前CU或当前CU的部分(例如,当前PU)。尽管关于视频编码器20(图1及图2)而描述,但应理解,其它装置可经配置以执行类似于图5的方法的方法。
在这个实例中,视频编码器20最初预测当前块(150)。举例来说,视频编码器20可计算当前块的一或多个预测单元(PU)。在这个实例中,假设视频编码器20帧间预测当前块。举例来说,运动估计单元42可通过执行先前经译码图片(例如,视图间图片及时间图片)的运动搜索而计算当前块的运动矢量。因此,运动估计单元42可产生时间运动矢量或视差运动矢量,以编码当前块。
视频编码器20可接着编码运动矢量。详言之,熵编码单元56可确定候选运动矢量预测值的列表(152)。举例来说,熵编码单元56可选择一或多个相邻块的运动矢量作为候选运动矢量预测值。视频编码器20可基于除运动矢量的类型以外的准则确定列表中的候选运动矢量预测值中的每一者可用。熵编码单元56可接着确定候选运动矢量的列表中的任一者是否具有不同于当前运动矢量的类型。熵编码单元56可接着从候选运动矢量预测值的列表移除具有不同于当前运动矢量的类型的类型的候选运动矢量预测值(154)。详言之,熵编码单元56可基于候选运动矢量预测值是否具有不同于正编码的当前运动矢量预测值的类型的类型而设置变量,所述变量指示候选运动矢量预测值是否可用作运动矢量预测值。如此,甚至在候选运动矢量先前基于其它准则确定为可用时,视频编码器20仍可基于具有不同于当前运动矢量的类型而将变量设置为指示候选运动矢量预测值不可用的值。
如上文所论述,熵编码单元56可使用多种不同方法中的一者确定候选运动矢量预测值是否具有与当前运动矢量相同的类型。举例来说,熵编码单元56可确定候选运动矢量预测值参考具有与正编码的当前图片相同的POC值的参考图片还是具有不同于正编码的当前图片的POC值的参考图片,且确定由当前运动矢量所参考的参考图片具有与正编码的当前图片相同的POC值,还是具有不同于正编码的当前图片的POC值。作为另一实例,熵编码单元56可确定候选运动矢量预测值及当前运动矢量皆参考与正编码的当前图片相同的层中的参考图片,还是不同于包括正编码的当前图片的层的一或多个不同层中的参考图片。作为又一实例,熵编码单元56可确定候选运动矢量预测值及当前运动矢量皆参考长期参考图片还是短期参考图片。
在形成候选运动矢量预测值的列表,使得所有候选运动矢量预测值具有与当前运动矢量相同的类型之后,熵编码单元56选择候选运动矢量预测值中的一者用作当前运动矢量的运动矢量预测值(156)。详言之,熵编码单元56选择候选运动矢量预测值中的一者,对于所述候选运动矢量预测值,所述变量指示候选运动矢量预测值是否可用作当前运动矢量的运动矢量预测值。在必要时,(例如)如果选定运动矢量预测值为参考如下参考图片的时间运动矢量,那么熵编码单元56可缩放选定运动矢量预测值:所述参考图片的POC值不同于当前运动矢量所参考的参考图片的POC值。如果选定运动矢量为视差运动矢量,那么熵编码单元56可禁用运动矢量预测值缩放。熵编码单元56接着计算当前运动矢量与选定(及可能缩放的)运动矢量预测值之间的差(158)。
视频编码器20可接着计算当前块的残余块,(例如)以产生变换单元(TU)(160)。为了计算残余块,视频编码器20可计算原始未经编码块与当前块的经预测块之间的差。视频编码器20可接着变换及量化残余块的系数(162)。接下来,视频编码器20可扫描残余块的经量化变换系数(164)。在扫描期间或在扫描之后,视频编码器20可熵编码所述系数(166)。举例来说,视频编码器20可使用CAVLC或CABAC编码所述系数。视频编码器20可接着输出块的经熵译码数据(168)。
如此,图5的方法表示一种方法的实例,所述方法包括:确定视频数据的当前块的当前运动矢量的第一类型;确定当前块的相邻块的候选运动矢量预测值的第二类型;在第一类型不同于第二类型时将表示候选运动矢量预测值是否可用的变量设置为指示候选运动矢量预测值不可用的值;及至少部分地基于所述变量的值而编码当前运动矢量。
图6为说明根据本发明的技术的用于解码视频数据的当前块的实例方法的流程图。当前块可包含当前CU或当前CU的部分(例如,PU)。尽管关于视频解码器30(图1及图3)而描述,但应理解,其它装置可经配置以执行类似于图6的方法的方法。
最初,视频解码器30接收当前块的变换系数及运动矢量差值的数据(200)。熵解码单元70熵解码系数及运动矢量差值的数据(202)。熵解码单元70可接着确定候选运动矢量预测值的列表(204)。举例来说,熵解码单元70可选择一或多个相邻块的运动矢量作为候选运动矢量预测值。视频解码器30可基于除运动矢量的类型以外的准则确定列表中的候选运动矢量预测值中的每一者可用。熵解码单元70可接着确定候选运动矢量的列表中的任一者是否具有不同于当前运动矢量的类型。熵解码单元70可接着从候选运动矢量预测值的列表移除具有不同于当前运动矢量的类型的类型的候选运动矢量预测值(206)。详言之,熵解码单元70基于候选运动矢量预测值是否具有不同于正编码的当前运动矢量预测值的类型的类型而设置变量,所述变量指示候选运动矢量预测值是否可用作运动矢量预测值。如此,甚至在候选运动矢量先前基于其它准则确定为可用时,视频解码器30仍可基于具有不同于当前运动矢量的类型而将变量设置为指示候选运动矢量预测值不可用的值。
如上文所论述,熵解码单元70可使用多种不同方法中的一者确定候选运动矢量预测值是否具有与当前运动矢量相同的类型。举例来说,熵解码单元70可确定候选运动矢量预测值参考具有与正解码的当前图片相同的POC值的参考图片还是具有不同于正解码的当前图片的POC值的参考图片,且确定当前运动矢量也参考具有与正解码的当前图片相同的POC值的参考图片还是具有不同于正解码的当前图片的POC值的参考图片。作为另一实例,熵编码单元56可确定候选运动矢量预测值及当前运动矢量皆参考与正编码的当前图片相同的层中的参考图片,还是不同于包括正编码的当前图片的层的一或多个不同层中的参考图片。作为又一实例,熵编码单元56可确定候选运动矢量预测值及当前运动矢量皆参考长期参考图片还是短期参考图片。
熵解码单元70接着选择候选运动矢量预测值中可用(即,具有指示候选运动矢量可用作当前运动矢量的运动矢量预测值的变量值)作当前运动矢量的运动矢量预测值的一者(208)。在一些实例中,熵解码单元70根据隐式预定义进程选择运动矢量预测值,而在其它实例中,熵解码单元70解码指示将选择候选运动矢量的列表中的哪一者的语法元素。熵解码单元70接着以数学方式组合经解码运动矢量差值与运动矢量预测值,以重现当前运动矢量(210)。举例来说,熵解码单元70可将运动矢量差的x分量(MVDx)加到选定运动矢量预测值的x分量,且将运动矢量差的y分量(MVDy)加到选定运动矢量预测值的y分量。
视频解码器30可使用经解码运动矢量预测当前块(212)。视频解码器30可接着反向扫描经重现系数(214),以创建经量化变换系数的块。视频解码器30可接着反量化及反变换系数以产生残余块(216)。视频解码器30可最终通过组合经预测块与残余块而解码当前块(218)。
如此,图6的方法表示一种方法的实例,所述方法包括:确定视频数据的当前块的当前运动矢量的第一类型;确定当前块的相邻块的候选运动矢量预测值的第二类型;在第一类型不同于第二类型时将表示候选运动矢量预测值是否可用的变量设置为指示候选运动矢量预测值不可用的值;及至少部分地基于所述变量的值而解码当前运动矢量。
应认识到,取决于实例,本文中所描述的技术中的任一者的某些动作或事件可以不同序列执行、可被添加、合并或完全省去(例如,对于实践所述技术而言,并非所有所描述动作或事件是必要的)。此外,在某些实例中,可(例如)经由多线程处理、中断处理或多个处理器同时而非顺序地执行动作或事件。
在一或多个实例中,所描述功能可以硬件、软件、固件或其任何组合予以实施。如果以软件予以实施,那么所述功能可作为一或多个指令或代码而存储在计算机可读媒体上或经由计算机可读媒体而传输,且由基于硬件的处理单元执行。计算机可读媒体可包括计算机可读存储媒体(其对应于诸如数据存储媒体的有形媒体)或通信媒体,通信媒体包括(例如)根据通信协议促进计算机程式从一处传送到另一处的任何媒体。如此,计算机可读媒体一般可对应于(1)非暂时性的有形计算机可读存储媒体,或(2)诸如信号或载波的通信媒体。数据存储媒体可为可由一或多个计算机或一或多个处理器访问以检索指令、代码及/或数据结构以用于实施本发明中所描述的技术的任何可用媒体。计算机程序产品可包括计算机可读媒体。
作为实例而非限制,这些计算机可读存储媒体可包含RAM、ROM、EEPROM、CD-ROM或其它光盘存储装置、磁盘存储装置或其它磁性存储装置,闪速存储器,或可用以存储呈指令或数据结构的形式的所要代码且可由计算机访问的任何其它媒体。又,将任何连接适当地称为计算机可读媒体。举例来说,如果使用同轴电缆、光纤电缆、双绞线、数字用户线(DSL)或诸如红外线、无线电及微波的无线技术而从网站、服务器或其它远程源传输指令,那么同轴电缆、光纤电缆、双绞线、DSL或诸如红外线、无线电及微波的无线技术包括在媒体的定义中。然而,应理解,计算机可读存储媒体及数据存储媒体不包括连接、载波、信号或其它暂时性媒体,而代替地有关于非暂时性有形存储媒体。如本文所使用,磁盘及光盘包括压缩光盘(CD)、激光光盘、光学光盘、数字多功能光盘(DVD)、软盘及蓝光光盘,其中磁盘通常以磁性方式重现数据,而光盘用激光以光学方式重现数据。以上各者的组合也应包括在计算机可读媒体的范围内。
可由诸如一或多个数字信号处理器(DSP)、一般用途微处理器、专用集成电路(ASIC)、现场可编程逻辑阵列(FPGA)或其它等效集成或离散逻辑电路的一或多个处理器执行指令。因此,如本文所使用,术语“处理器”可指前述结构或适合于实施本文所描述的技术的任何其它结构中的任一者。另外,在一些方面,可将本文所描述的功能性提供于经配置以用于编码及解码的专用硬件及/或软件模块内,或并入于组合式编解码器中。又,可将所述技术完全实施于一或多个电路或逻辑元件中。
本发明的技术可实施于各种各样的装置或仪器中,所述装置或仪器包括无线手机、集成电路(IC)或IC集合(例如,芯片集)。在本发明中描述各种组件、模块或单元以强调经配置以执行所揭示技术的装置的功能方面,但未必需要通过不同硬件单元而实现。更确切地,如上文所描述,各种单元可组合于编解码器硬件单元中,或通过交互操作的硬件单元(包括如上文所描述的一或多个处理器)的集合结合合适软件及/或固件而提供。
已描述各种实例。这些及其它实例是在所附权利要求书的范围内。
Claims (55)
1.一种解码视频数据的方法,所述方法包含:
确定视频数据的当前块的当前运动矢量的第一类型;
确定所述当前块的相邻块的候选运动矢量预测值的第二类型;
在所述第一类型不同于所述第二类型时将表示所述候选运动矢量预测值是否可用的变量设置为指示所述候选运动矢量预测值不可用的值;及
至少部分地基于所述变量的所述值而解码所述当前运动矢量。
2.根据权利要求1所述的方法,其中在所述第一类型包含视差运动矢量,所述第二类型包含视差运动矢量,且所述候选运动矢量预测值用以预测所述当前运动矢量时,解码所述当前运动矢量包含在不缩放所述候选运动矢量预测值的情况下解码所述当前运动矢量。
3.根据权利要求1所述的方法,
其中确定所述当前运动矢量的所述第一类型包含基于第一参考图片子集确定所述第一类型,由所述当前运动矢量所参考的第一参考图片属于所述第一参考图片子集,且
其中确定所述候选运动矢量的所述第二类型包含基于第二参考图片子集确定所述第二类型,由所述候选运动矢量预测值所参考的第二参考图片属于所述第二参考图片子集。
4.根据权利要求2所述的方法,其中所述当前块包括在当前层的图片内,且其中在所述第一参考图片包括在所述当前层中且所述第二参考图片包括在除所述当前层以外的层中时,确定所述第二类型包含确定所述第二类型不同于所述第一类型。
5.根据权利要求2所述的方法,其中所述当前块包括在当前层的图片内,且其中在所述第二参考图片包括在所述当前层中且所述第一参考图片包括在除所述当前层以外的层中时,确定所述第二类型包含确定所述第二类型不同于所述第一类型。
6.根据权利要求1所述的方法,其进一步包含在设置所述变量之前,基于除所述第一类型是否不同于所述第二类型以外的准则确定所述候选运动矢量可用。
7.根据权利要求1所述的方法,
其中所述当前运动矢量的所述第一类型表示由所述当前运动矢量所参考的第一参考图片的当前参考图片顺序计数POC值是否与包括所述当前块的当前图片的当前POC值相同,且
其中所述候选运动矢量预测值的所述第二类型表示由所述候选运动矢量预测值所参考的第二参考图片的候选参考POC值是否与所述当前POC值相同。
8.根据权利要求7所述的方法,其进一步包含解码指示以下情形的信息:在所述当前参考POC值及所述候选参考POC值中的至少一者与所述当前POC值相同时,将包括所述候选运动矢量预测值的相邻块设置为不可用于参考。
9.根据权利要求8所述的方法,其中解码所述当前运动矢量包含:在由所述当前运动矢量所参考的第一参考图片的类型不同于由所述候选运动矢量预测值所参考的第二参考图片的类型时,在不缩放所述候选运动矢量预测值的情况下解码所述当前运动矢量。
10.根据权利要求1所述的方法,其中解码所述当前运动矢量包含使用高级运动矢量预测AMVP模式及合并模式中的至少一者解码所述当前运动矢量,所述方法进一步包含:在使用AMVP解码所述运动矢量时且在所述变量指示所述候选运动矢量预测值不可用时,避免将所述运动矢量预测值添加至所述当前运动矢量的AMVP候选者列表中,及在使用合并模式解码所述运动矢量时且在所述变量指示所述候选运动矢量预测值不可用时,避免将所述运动矢量预测值添加至所述当前运动矢量的合并候选者列表中。
11.根据权利要求1所述的方法,其进一步包含解码指示以下情形的数据:对于所述视频数据的经解码视频序列中的所有切片,是否决不将视图间参考选择为时间运动矢量预测TMVP模式的同置图片。
12.根据权利要求11所述的方法,其中解码所述数据包含解码disable_inter_view_as_tmvp_flag。
13.根据权利要求11所述的方法,其中解码所述数据包含用以下各者中的至少一者解码所述数据:用于多视图视频解码MVC扩展的扩展位、用于三维视频3DV扩展的扩展位、子集序列参数集SPS,及视频参数集VPS。
14.根据权利要求1所述的方法,其进一步包含确定包括所述当前运动矢量所参考的参考图片的参考图片集RPS子集的类型,其中确定所述当前运动矢量的所述第一类型包含确定所述第一类型等于所述RPS子集的所述类型。
15.一种编码视频数据的方法,所述方法包含:
确定视频数据的当前块的当前运动矢量的第一类型;
确定所述当前块的相邻块的候选运动矢量预测值的第二类型;
在所述第一类型不同于所述第二类型时将表示所述候选运动矢量预测值是否可用的变量设置为指示所述候选运动矢量预测值不可用的值;及
至少部分地基于所述变量的所述值而编码所述当前运动矢量。
16.根据权利要求15所述的方法,其中在所述第一类型包含视差运动矢量,所述第二类型包含视差运动矢量,且所述候选运动矢量预测值用以预测所述当前运动矢量时,编码所述当前运动矢量包含在不缩放所述候选运动矢量预测值的情况下编码所述当前运动矢量。
17.根据权利要求15所述的方法,
其中确定所述当前运动矢量的所述第一类型包含基于第一参考图片子集确定所述第一类型,由所述当前运动矢量所参考的第一参考图片属于所述第一参考图片子集,且
其中确定所述候选运动矢量的所述第二类型包含基于第二参考图片子集确定所述第二类型,由所述候选运动矢量预测值所参考的第二参考图片属于所述第二参考图片子集。
18.根据权利要求17所述的方法,其中所述当前块包括在当前层的图片内,且其中在所述第一参考图片包括在所述当前层中且所述第二参考图片包括在除所述当前层以外的层中时,确定所述第二类型包含确定所述第二类型不同于所述第一类型。
19.根据权利要求17所述的方法,其中所述当前块包括在当前层的图片内,且其中在所述第二参考图片包括在所述当前层中且所述第一参考图片包括在除所述当前层以外的层中时,确定所述第二类型包含确定所述第二类型不同于所述第一类型。
20.根据权利要求15所述的方法,其进一步包含在设置所述变量之前,基于除所述第一类型是否不同于所述第二类型以外的准则确定所述候选运动矢量可用。
21.根据权利要求15所述的方法,
其中所述当前运动矢量的所述第一类型表示由所述当前运动矢量所参考的第一参考图片的当前参考图片顺序计数POC值是否与包括所述当前块的当前图片的当前POC值相同,且
其中所述候选运动矢量预测值的所述第二类型表示由所述候选运动矢量预测值所参考的第二参考图片的候选参考POC值是否与所述当前POC值相同。
22.根据权利要求21所述的方法,其进一步包含编码指示以下情形的信息:在所述当前参考POC值及所述候选参考POC值中的至少一者与所述当前POC值相同时,将包括所述候选运动矢量预测值的相邻块设置为不可用于参考。
23.根据权利要求22所述的方法,其中编码所述当前运动矢量包含:在由所述当前运动矢量所参考的第一参考图片的类型不同于由所述候选运动矢量预测值所参考的第二参考图片的类型时,在不缩放所述候选运动矢量预测值的情况下编码所述当前运动矢量。
24.根据权利要求15所述的方法,其中编码所述当前运动矢量包含使用高级运动矢量预测AMVP模式及合并模式中的至少一者编码所述当前运动矢量,所述方法进一步包含:在使用AMVP编码所述运动矢量时且在所述变量指示所述候选运动矢量预测值不可用时,避免将所述运动矢量预测值添加至所述当前运动矢量的AMVP候选者列表中,及在使用合并模式编码所述运动矢量时且在所述变量指示所述候选运动矢量预测值不可用时,避免将所述运动矢量预测值添加至所述当前运动矢量的合并候选者列表中。
25.根据权利要求15所述的方法,其进一步包含编码指示以下情形的数据:对于所述视频数据的经编码视频序列中的所有切片,是否决不将视图间参考选择为时间运动矢量预测TMVP模式的同置图片。
26.根据权利要求25所述的方法,其中编码所述数据包含编码disable_inter_view_as_tmvp_flag。
27.根据权利要求25所述的方法,其中编码所述数据包含用以下各者中的至少一者编码所述数据:用于多视图视频编码MVC扩展的扩展位、用于三维视频3DV扩展的扩展位、子集序列参数集SPS,及视频参数集VPS。
28.根据权利要求15所述的方法,其进一步包含确定包括所述当前运动矢量所参考的参考图片的参考图片集RPS子集的类型,其中确定所述当前运动矢量的所述第一类型包含确定所述第一类型等于所述RPS子集的所述类型。
29.一种用于解码视频数据的装置,所述装置包含经配置以执行以下操作的视频解码器:确定视频数据的当前块的当前运动矢量的第一类型;确定所述当前块的相邻块的候选运动矢量预测值的第二类型;在所述第一类型不同于所述第二类型时将表示所述候选运动矢量预测值是否可用的变量设置为指示所述候选运动矢量预测值不可用的值;及至少部分地基于所述变量的所述值而解码所述当前运动矢量。
30.根据权利要求29所述的装置,其中在所述第一类型包含视差运动矢量,所述第二类型包含视差运动矢量,且所述候选运动矢量预测值用以预测所述当前运动矢量时,所述视频解码器经配置以在不缩放所述候选运动矢量预测值的情况下解码所述当前运动矢量。
31.根据权利要求29所述的装置,其中所述视频解码器经配置以基于第一参考图片子集确定所述当前运动矢量的所述第一类型,由所述当前运动矢量所参考的第一参考图片属于所述第一参考图片子集,且其中所述视频解码器经配置以基于第二参考图片子集确定所述第二类型,由所述候选运动矢量预测值所参考的第二参考图片属于所述第二参考图片子集。
32.根据权利要求29所述的装置,其中所述视频解码器经进一步配置以在设置所述变量之前,基于除所述第一类型是否不同于所述第二类型以外的准则确定所述候选运动矢量可用。
33.根据权利要求29所述的装置,
其中所述当前运动矢量的所述第一类型表示由所述当前运动矢量所参考的第一参考图片的当前参考图片POC值是否与包括所述当前块的当前图片的当前POC值相同,且
其中所述候选运动矢量预测值的所述第二类型表示由所述候选运动矢量预测值所参考的第二参考图片的候选参考POC值是否与所述当前POC值相同。
34.根据权利要求33所述的装置,其中所述视频解码器经进一步配置以解码指示以下情形的信息:在所述当前参考POC值及所述候选参考POC值中的至少一者与所述当前POC值相同时,将所述相邻块设置为不可用于参考。
35.根据权利要求29所述的装置,其中为了解码所述当前运动矢量,所述视频解码器经配置以使用高级运动矢量预测AMVP模式及合并模式中的至少一者解码所述当前运动矢量,其中在使用AMVP解码所述运动矢量时且在所述变量指示所述候选运动矢量预测值不可用时,所述视频解码器经配置以避免将所述运动矢量预测值添加至所述当前运动矢量的AMVP候选者列表中,及在使用合并模式解码所述运动矢量时且在所述变量指示所述候选运动矢量预测值不可用时,所述视频解码器经配置以避免将所述运动矢量预测值添加至所述当前运动矢量的合并候选者列表中。
36.根据权利要求29所述的装置,其中所述视频解码器经配置以解码指示以下情形的数据:对于所述视频数据的经解码视频序列中的所有切片,是否决不将视图间参考选择为时间运动矢量预测TMVP模式的同置图片。
37.根据权利要求36所述的装置,其中所述数据包含disable_inter_view_as_tmvp_flag。
38.根据权利要求29所述的装置,其中所述视频解码器经配置以确定包括所述当前运动矢量所参考的参考图片的参考图片集RPS子集的类型,其中为了确定所述当前运动矢量的所述第一类型,所述视频解码器经配置以确定所述第一类型等于所述RPS子集的所述类型。
39.根据权利要求29所述的装置,其中所述视频解码器包含经配置以执行以下操作的视频解码器:解码所述当前运动矢量;解码所述当前块的残余数据;至少部分地基于所述当前运动矢量而形成所述当前块的经预测数据;及组合所述经预测数据与所述残余数据以重建所述当前块。
40.根据权利要求29所述的装置,其中所述视频解码器包含经配置以执行以下操作的视频编码器:编码所述当前运动矢量;至少部分地基于所述当前运动矢量而形成所述当前块的经预测数据;基于所述当前块与所述经预测数据之间的差而计算所述当前块的残余数据;及编码所述残余数据。
41.根据权利要求29所述的装置,其中所述装置包含以下各者中的至少一者:
集成电路;
微处理器;及
无线通信装置,其包括所述视频解码器。
42.一种用于编码视频数据的装置,所述装置包含经配置以执行以下操作的视频编码器:确定视频数据的当前块的当前运动矢量的第一类型;确定所述当前块的相邻块的候选运动矢量预测值的第二类型;在所述第一类型不同于所述第二类型时将表示所述候选运动矢量预测值是否可用的变量设置为指示所述候选运动矢量预测值不可用的值;及至少部分地基于所述变量的所述值而编码所述当前运动矢量。
43.根据权利要求42所述的装置,其中在所述第一类型包含视差运动矢量,所述第二类型包含视差运动矢量,且所述候选运动矢量预测值用以预测所述当前运动矢量时,所述视频编码器经配置以在不缩放所述候选运动矢量预测值的情况下编码所述当前运动矢量。
44.根据权利要求42所述的装置,其中所述视频编码器经配置以基于第一参考图片子集确定所述当前运动矢量的所述第一类型,由所述当前运动矢量所参考的第一参考图片属于所述第一参考图片子集,且其中所述视频编码器经配置以基于第二参考图片子集确定所述第二类型,由所述候选运动矢量预测值所参考的第二参考图片属于所述第二参考图片子集。
45.根据权利要求42所述的装置,其中所述视频编码器经进一步配置以在设置所述变量之前,基于除所述第一类型是否不同于所述第二类型以外的准则确定所述候选运动矢量可用。
46.根据权利要求42所述的装置,
其中所述当前运动矢量的所述第一类型表示由所述当前运动矢量所参考的第一参考图片的当前参考POC值是否与包括所述当前块的当前图片的当前POC值相同,且
其中所述候选运动矢量预测值的所述第二类型表示由所述候选运动矢量预测值所参考的第二参考图片的候选参考POC值是否与所述当前POC值相同。
47.根据权利要求46所述的装置,其中所述视频编码器经进一步配置以编码指示以下情形的信息:在所述当前参考POC值及所述候选参考POC值中的至少一者与所述当前POC值相同时,将所述相邻块设置为不可用于参考。
48.根据权利要求42所述的装置,其中为了编码所述当前运动矢量,所述视频编码器经配置以使用高级运动矢量预测AMVP模式及合并模式中的至少一者编码所述当前运动矢量,其中在使用AMVP编码所述运动矢量时且在所述变量指示所述候选运动矢量预测值不可用时,所述视频编码器经配置以避免将所述运动矢量预测值添加至所述当前运动矢量的AMVP候选者列表中,及在使用合并模式编码所述运动矢量时且在所述变量指示所述候选运动矢量预测值不可用时,所述视频编码器经配置以避免将所述运动矢量预测值添加至所述当前运动矢量的合并候选者列表中。
49.根据权利要求42所述的装置,其中所述视频编码器经配置以编码指示以下情形的数据:对于所述视频数据的经编码视频序列中的所有切片,是否决不将视图间参考选择为时间运动矢量预测TMVP模式的同置图片。
50.根据权利要求49所述的装置,其中所述数据包含disable_inter_view_as_tmvp_flag。
51.根据权利要求42所述的装置,其中所述视频编码器经配置以确定包括所述当前运动矢量所参考的参考图片的参考图片集RPS子集的类型,其中为了确定所述当前运动矢量的所述第一类型,所述视频编码器经配置以确定所述第一类型等于所述RPS子集的所述类型。
52.根据权利要求42所述的装置,其中所述视频编码器包含经配置以执行以下操作的视频解码器:解码所述当前运动矢量;解码所述当前块的残余数据;至少部分地基于所述当前运动矢量而形成所述当前块的经预测数据;及组合所述经预测数据与所述残余数据以重建所述当前块。
53.根据权利要求42所述的装置,其中所述视频编码器包含经配置以执行以下操作的视频编码器:编码所述当前运动矢量;至少部分地基于所述当前运动矢量而形成所述当前块的经预测数据;基于所述当前块与所述经预测数据之间的差而计算所述当前块的残余数据;及编码所述残余数据。
54.一种用于编码视频数据的装置,所述装置包含:
用于确定视频数据的当前块的当前运动矢量的第一类型的装置;
用于确定所述当前块的相邻块的候选运动矢量预测值的第二类型的装置;
用于在所述第一类型不同于所述第二类型时将表示所述候选运动矢量预测值是否可用的变量设置为指示所述候选运动矢量预测值不可用的值的装置;及
用于至少部分地基于所述变量的所述值而编码所述当前运动矢量的装置。
55.一种计算机可读存储媒体,其上存储有在执行时使处理器执行以下操作的指令:
确定视频数据的当前块的当前运动矢量的第一类型;
确定所述当前块的相邻块的候选运动矢量预测值的第二类型;
在所述第一类型不同于所述第二类型时将表示所述候选运动矢量预测值是否可用的变量设置为指示所述候选运动矢量预测值不可用的值;及
至少部分地基于所述变量的所述值而解码所述当前运动矢量。
Applications Claiming Priority (11)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201261611959P | 2012-03-16 | 2012-03-16 | |
US61/611,959 | 2012-03-16 | ||
US201261624990P | 2012-04-16 | 2012-04-16 | |
US61/624,990 | 2012-04-16 | ||
US201261658344P | 2012-06-11 | 2012-06-11 | |
US61/658,344 | 2012-06-11 | ||
US201261663484P | 2012-06-22 | 2012-06-22 | |
US61/663,484 | 2012-06-22 | ||
US13/801,350 US9503720B2 (en) | 2012-03-16 | 2013-03-13 | Motion vector coding and bi-prediction in HEVC and its extensions |
US13/801,350 | 2013-03-13 | ||
PCT/US2013/031536 WO2013138631A1 (en) | 2012-03-16 | 2013-03-14 | Motion vector coding and bi-prediction in hevc and its extensions |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104170381A true CN104170381A (zh) | 2014-11-26 |
CN104170381B CN104170381B (zh) | 2017-12-08 |
Family
ID=49157626
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201380014234.5A Active CN104170381B (zh) | 2012-03-16 | 2013-03-14 | 在高效率视频译码及其扩展中的运动矢量译码及双向预测 |
Country Status (16)
Country | Link |
---|---|
US (1) | US9503720B2 (zh) |
EP (1) | EP2826247A1 (zh) |
JP (1) | JP6215295B2 (zh) |
KR (1) | KR101812381B1 (zh) |
CN (1) | CN104170381B (zh) |
AU (1) | AU2013232041C1 (zh) |
CA (1) | CA2865849C (zh) |
HK (1) | HK1200047A1 (zh) |
IL (1) | IL234159A (zh) |
MY (1) | MY168175A (zh) |
PH (1) | PH12014501923B1 (zh) |
RU (1) | RU2624560C2 (zh) |
SG (1) | SG11201405071UA (zh) |
TW (1) | TWI538489B (zh) |
WO (1) | WO2013138631A1 (zh) |
ZA (1) | ZA201407270B (zh) |
Cited By (48)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109076236A (zh) * | 2016-05-13 | 2018-12-21 | 高通股份有限公司 | 用于视频译码的运动矢量预测的合并候选项 |
CN109089119A (zh) * | 2017-06-13 | 2018-12-25 | 浙江大学 | 一种运动矢量预测的方法及设备 |
CN109691098A (zh) * | 2016-09-30 | 2019-04-26 | 华为技术有限公司 | 视频编码方法、解码方法及终端 |
CN109792538A (zh) * | 2016-08-26 | 2019-05-21 | 高通股份有限公司 | 用于局部照明补偿和跨分量线性模型预测的参数推导程序的统一 |
CN109891890A (zh) * | 2016-09-07 | 2019-06-14 | 高通股份有限公司 | 视频译码中基于子pu的双向运动补偿 |
CN110326296A (zh) * | 2017-01-03 | 2019-10-11 | 交互数字Vc控股公司 | 用于对运动信息进行编码和解码的方法和装置 |
CN110572671A (zh) * | 2018-06-05 | 2019-12-13 | 北京字节跳动网络技术有限公司 | 成对平均Merge候选与帧内块复制的交互 |
CN110622508A (zh) * | 2017-05-10 | 2019-12-27 | 华为技术有限公司 | 视频压缩中的双向预测 |
CN110719488A (zh) * | 2018-07-13 | 2020-01-21 | 腾讯美国有限责任公司 | 视频解码的方法和装置、计算机设备及存储介质 |
CN111052746A (zh) * | 2017-07-25 | 2020-04-21 | 交互数字Vc控股公司 | 用于编码和解码全向视频的方法和装置 |
CN111108751A (zh) * | 2017-09-18 | 2020-05-05 | 交互数字Vc控股公司 | 适应于全向视频的运动矢量预测量的方法和装置 |
CN112075078A (zh) * | 2018-02-28 | 2020-12-11 | 弗劳恩霍夫应用研究促进协会 | 合成式预测及限制性合并 |
WO2020253841A1 (zh) * | 2019-06-21 | 2020-12-24 | 杭州海康威视数字技术股份有限公司 | 预测模式的解码、编码方法及装置 |
CN112640451A (zh) * | 2018-09-12 | 2021-04-09 | 高通股份有限公司 | 矢量预测器列表生成 |
CN112771870A (zh) * | 2018-10-24 | 2021-05-07 | 华为技术有限公司 | 视频解码器和方法 |
CN112771871A (zh) * | 2018-10-04 | 2021-05-07 | 高通股份有限公司 | 时空运动矢量预测的简化 |
CN112913249A (zh) * | 2018-10-22 | 2021-06-04 | 北京字节跳动网络技术有限公司 | 广义双向预测索引的简化编解码 |
CN113039787A (zh) * | 2018-11-27 | 2021-06-25 | 高通股份有限公司 | 解码器侧运动矢量细化 |
CN113056920A (zh) * | 2018-11-22 | 2021-06-29 | 北京字节跳动网络技术有限公司 | 基于子块的帧间预测的协调方法 |
CN113170097A (zh) * | 2018-11-20 | 2021-07-23 | 北京字节跳动网络技术有限公司 | 视频编解码模式的编解码和解码 |
CN113228675A (zh) * | 2018-12-21 | 2021-08-06 | 北京字节跳动网络技术有限公司 | 视频处理中的运动矢量比特深度 |
CN113302918A (zh) * | 2019-01-15 | 2021-08-24 | 北京字节跳动网络技术有限公司 | 视频编解码中的加权预测 |
CN113545065A (zh) * | 2019-03-06 | 2021-10-22 | 北京字节跳动网络技术有限公司 | 转换后的单向预测候选的使用 |
CN113574893A (zh) * | 2019-03-11 | 2021-10-29 | 瑞典爱立信有限公司 | 运动细化和加权预测 |
CN113615186A (zh) * | 2018-12-21 | 2021-11-05 | Vid拓展公司 | 对称运动矢量差译码 |
CN113711609A (zh) * | 2019-04-19 | 2021-11-26 | 北京字节跳动网络技术有限公司 | 利用光流的预测细化过程中的增量运动矢量 |
CN113826386A (zh) * | 2019-05-11 | 2021-12-21 | 北京字节跳动网络技术有限公司 | 视频处理中编解码工具的选择性使用 |
CN114175655A (zh) * | 2019-07-27 | 2022-03-11 | 北京字节跳动网络技术有限公司 | 根据参考图片类型使用工具的限制 |
CN114287135A (zh) * | 2019-08-23 | 2022-04-05 | 北京字节跳动网络技术有限公司 | 参考图片重采样中的剪切 |
CN114402591A (zh) * | 2019-09-13 | 2022-04-26 | 北京字节跳动网络技术有限公司 | 并置运动矢量的推导 |
CN114641992A (zh) * | 2019-10-23 | 2022-06-17 | 北京字节跳动网络技术有限公司 | 参考图片重采样的信令 |
US11477463B2 (en) | 2018-06-21 | 2022-10-18 | Beijing Bytedance Network Technology Co., Ltd. | Component-dependent sub-block dividing |
CN115244927A (zh) * | 2020-01-13 | 2022-10-25 | Lg电子株式会社 | 图像/视频编码系统中的帧间预测方法和设备 |
US11616945B2 (en) | 2018-09-24 | 2023-03-28 | Beijing Bytedance Network Technology Co., Ltd. | Simplified history based motion vector prediction |
US11778175B2 (en) | 2019-10-23 | 2023-10-03 | Beijing Bytedance Network Technology Co., Ltd | Calculation for multiple coding tools |
US11792421B2 (en) | 2018-11-10 | 2023-10-17 | Beijing Bytedance Network Technology Co., Ltd | Rounding in pairwise average candidate calculations |
CN116915982A (zh) * | 2019-02-20 | 2023-10-20 | 北京达佳互联信息技术有限公司 | 用于视频解码的方法、电子设备、存储介质和程序产品 |
CN117041594A (zh) * | 2018-12-30 | 2023-11-10 | 北京达佳互联信息技术有限公司 | 用于对视频进行编码的方法、设备、存储介质和程序产品 |
RU2810728C2 (ru) * | 2019-06-21 | 2023-12-28 | Ханчжоу Хиквижн Диджитал Текнолоджи Ко., Лтд. | Способы декодирования или кодирования режима предсказания, аппарат для декодирования или кодирования и носитель данных |
US11871025B2 (en) | 2019-08-13 | 2024-01-09 | Beijing Bytedance Network Technology Co., Ltd | Motion precision in sub-block based inter prediction |
US11924463B2 (en) | 2019-04-19 | 2024-03-05 | Beijing Bytedance Network Technology Co., Ltd | Gradient calculation in different motion vector refinements |
US11956449B2 (en) | 2018-11-12 | 2024-04-09 | Beijing Bytedance Network Technology Co., Ltd. | Simplification of combined inter-intra prediction |
US11968377B2 (en) | 2018-06-21 | 2024-04-23 | Beijing Bytedance Network Technology Co., Ltd | Unified constrains for the merge affine mode and the non-merge affine mode |
US11997303B2 (en) | 2019-04-02 | 2024-05-28 | Beijing Bytedance Network Technology Co., Ltd | Bidirectional optical flow based video coding and decoding |
US12034964B2 (en) | 2019-02-14 | 2024-07-09 | Beijing Bytedance Network Technology Co., Ltd | Selective application of decoder side refining tools |
US12041267B2 (en) | 2018-10-22 | 2024-07-16 | Beijing Bytedance Network Technology Co., Ltd. | Multi-iteration motion vector refinement |
US12069248B2 (en) | 2018-10-23 | 2024-08-20 | Beijing Bytedance Technology Network Co., Ltd. | Video processing using local illumination compensation |
US12081767B2 (en) | 2019-02-03 | 2024-09-03 | Beijing Bytedance Network Technology Co., Ltd | Interaction between MV precisions and MV difference coding |
Families Citing this family (75)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120082228A1 (en) * | 2010-10-01 | 2012-04-05 | Yeping Su | Nested entropy encoding |
US10104391B2 (en) | 2010-10-01 | 2018-10-16 | Dolby International Ab | System for nested entropy encoding |
US9247249B2 (en) | 2011-04-20 | 2016-01-26 | Qualcomm Incorporated | Motion vector prediction in video coding |
HUE066386T2 (hu) * | 2011-05-31 | 2024-07-28 | Jvckenwood Corp | Mozgókép-kódoló eszköz, mozgókép-kódoló eljárás és mozgókép-kódoló program, valamint mozgókép-dekódoló eszköz, mozgókép-dekódoló eljárás és mozgókép-dekódoló program |
CN107483925B (zh) * | 2011-09-09 | 2020-06-19 | 株式会社Kt | 用于解码视频信号的方法 |
GB2561487B (en) * | 2011-10-18 | 2019-01-02 | Kt Corp | Method for encoding image, method for decoding image, image encoder, and image decoder |
US10200709B2 (en) | 2012-03-16 | 2019-02-05 | Qualcomm Incorporated | High-level syntax extensions for high efficiency video coding |
JP2013207755A (ja) * | 2012-03-29 | 2013-10-07 | Sony Corp | 画像処理装置および方法 |
EP3796651A1 (en) | 2012-05-09 | 2021-03-24 | Sun Patent Trust | Method of performing motion vector prediction, encoding and decoding methods, and apparatuses thereof |
US9420286B2 (en) | 2012-06-15 | 2016-08-16 | Qualcomm Incorporated | Temporal motion vector prediction in HEVC and its extensions |
RU2621621C2 (ru) * | 2012-07-18 | 2017-06-06 | Сони Корпорейшн | Способ и устройство обработки изображения |
US20140056356A1 (en) * | 2012-08-21 | 2014-02-27 | Motorola Mobility Llc | Method and apparatus for efficient signaling of weighted prediction in advanced coding schemes |
US9392268B2 (en) | 2012-09-28 | 2016-07-12 | Qualcomm Incorporated | Using base layer motion information |
US10136143B2 (en) | 2012-12-07 | 2018-11-20 | Qualcomm Incorporated | Advanced residual prediction in scalable and multi-view video coding |
CN105103563B (zh) * | 2013-04-08 | 2019-05-21 | 寰发股份有限公司 | 关于缩放列表数据信令的方法和装置 |
US10075735B2 (en) * | 2013-07-14 | 2018-09-11 | Sharp Kabushiki Kaisha | Video parameter set signaling |
WO2015009092A1 (ko) * | 2013-07-18 | 2015-01-22 | 엘지전자 주식회사 | 비디오 신호 처리 방법 및 장치 |
FR3011429A1 (fr) * | 2013-09-27 | 2015-04-03 | Orange | Codage et decodage video par heritage d'un champ de vecteurs de mouvement |
US9648333B2 (en) * | 2013-10-11 | 2017-05-09 | Vid Scale, Inc. | High level syntax for HEVC extensions |
KR102275639B1 (ko) | 2013-10-14 | 2021-07-08 | 마이크로소프트 테크놀로지 라이센싱, 엘엘씨 | 비디오 및 영상 코딩 및 디코딩에 대한 기본 색상 인덱스 맵 모드의 특징 |
KR102257269B1 (ko) | 2013-10-14 | 2021-05-26 | 마이크로소프트 테크놀로지 라이센싱, 엘엘씨 | 비디오 및 이미지 코딩 및 디코딩을 위한 인트라 블록 카피 예측 모드의 피쳐 |
CN105659602B (zh) | 2013-10-14 | 2019-10-08 | 微软技术许可有限责任公司 | 用于视频和图像编码的帧内块复制预测模式的编码器侧选项 |
US10432963B2 (en) | 2013-11-05 | 2019-10-01 | Arris Enterprises Llc | Bit depth variable for high precision data in weighted prediction syntax and semantics |
TWI538487B (zh) * | 2013-12-05 | 2016-06-11 | 財團法人工業技術研究院 | 螢幕視訊之預測編碼的方法與系統 |
EP3091741B1 (en) * | 2014-01-02 | 2021-10-27 | Intellectual Discovery Co., Ltd. | Method for decoding multi-view video |
US10469863B2 (en) | 2014-01-03 | 2019-11-05 | Microsoft Technology Licensing, Llc | Block vector prediction in video and image coding/decoding |
US10390034B2 (en) | 2014-01-03 | 2019-08-20 | Microsoft Technology Licensing, Llc | Innovations in block vector prediction and estimation of reconstructed sample values within an overlap area |
US11284103B2 (en) | 2014-01-17 | 2022-03-22 | Microsoft Technology Licensing, Llc | Intra block copy prediction with asymmetric partitions and encoder-side search patterns, search ranges and approaches to partitioning |
US10542274B2 (en) | 2014-02-21 | 2020-01-21 | Microsoft Technology Licensing, Llc | Dictionary encoding and decoding of screen content |
US10368091B2 (en) | 2014-03-04 | 2019-07-30 | Microsoft Technology Licensing, Llc | Block flipping and skip mode in intra block copy prediction |
CN106105190B (zh) * | 2014-03-13 | 2018-11-13 | 高通股份有限公司 | 用于3d-hevc的简化高级残余预测 |
WO2015192353A1 (en) | 2014-06-19 | 2015-12-23 | Microsoft Technology Licensing, Llc | Unified intra block copy and inter prediction modes |
WO2016008161A1 (en) * | 2014-07-18 | 2016-01-21 | Mediatek Singapore Pte. Ltd. | Temporal derived bi-directional motion vector predictor |
EP3202150B1 (en) | 2014-09-30 | 2021-07-21 | Microsoft Technology Licensing, LLC | Rules for intra-picture prediction modes when wavefront parallel processing is enabled |
WO2016056834A1 (ko) * | 2014-10-07 | 2016-04-14 | 삼성전자 주식회사 | 인터-레이어 예측을 이용한 멀티 레이어 영상 부호화 또는 복호화 방법 및 장치 |
KR20170065502A (ko) * | 2014-10-08 | 2017-06-13 | 엘지전자 주식회사 | 3d 비디오 부호화/복호화 방법 및 장치 |
US9591325B2 (en) | 2015-01-27 | 2017-03-07 | Microsoft Technology Licensing, Llc | Special case handling for merged chroma blocks in intra block copy prediction mode |
CN106664405B (zh) | 2015-06-09 | 2020-06-09 | 微软技术许可有限责任公司 | 用调色板模式对经逸出编码的像素的稳健编码/解码 |
CN105163116B (zh) | 2015-08-29 | 2018-07-31 | 华为技术有限公司 | 图像预测的方法及设备 |
EP3355578B1 (en) * | 2015-09-24 | 2020-12-09 | LG Electronics Inc. | Motion vector predictor derivation and candidate list construction |
US11032550B2 (en) * | 2016-02-25 | 2021-06-08 | Mediatek Inc. | Method and apparatus of video coding |
US11638027B2 (en) | 2016-08-08 | 2023-04-25 | Hfi Innovation, Inc. | Pattern-based motion vector derivation for video coding |
US20180054613A1 (en) * | 2016-08-22 | 2018-02-22 | Mediatek Inc. | Video encoding method and apparatus with in-loop filtering process not applied to reconstructed blocks located at image content discontinuity edge and associated video decoding method and apparatus |
US12063387B2 (en) | 2017-01-05 | 2024-08-13 | Hfi Innovation Inc. | Decoder-side motion vector restoration for video coding |
US10986349B2 (en) | 2017-12-29 | 2021-04-20 | Microsoft Technology Licensing, Llc | Constraints on locations of reference blocks for intra block copy prediction |
WO2019137735A1 (en) * | 2018-01-15 | 2019-07-18 | Telefonaktiebolaget Lm Ericsson (Publ) | Restricted overlapped block motion compensation |
WO2019204386A1 (en) * | 2018-04-20 | 2019-10-24 | Huawei Technologies Co., Ltd. | Line buffer for spatial motion vector predictor candidates |
US10469869B1 (en) * | 2018-06-01 | 2019-11-05 | Tencent America LLC | Method and apparatus for video coding |
WO2020003278A1 (en) | 2018-06-29 | 2020-01-02 | Beijing Bytedance Network Technology Co., Ltd. | Update of look up table: fifo, constrained fifo |
JP7460617B2 (ja) | 2018-06-29 | 2024-04-02 | 北京字節跳動網絡技術有限公司 | Lut更新条件 |
EP3797516A1 (en) * | 2018-06-29 | 2021-03-31 | Beijing Bytedance Network Technology Co. Ltd. | Interaction between lut and amvp |
CN110662057B (zh) | 2018-06-29 | 2022-06-21 | 北京字节跳动网络技术有限公司 | 视频处理方法、装置、设备以及存储比特流的方法 |
EP3791588A1 (en) | 2018-06-29 | 2021-03-17 | Beijing Bytedance Network Technology Co. Ltd. | Checking order of motion candidates in lut |
KR20210024502A (ko) | 2018-06-29 | 2021-03-05 | 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 | Hmvp 후보를 병합/amvp에 추가할 때의 부분/풀 프루닝 |
TWI723444B (zh) | 2018-06-29 | 2021-04-01 | 大陸商北京字節跳動網絡技術有限公司 | 使用一個或多個查找表來按順序存儲先前編碼的運動信息並使用它們來編碼後面的塊的概念 |
CN110662056B (zh) | 2018-06-29 | 2022-06-07 | 北京字节跳动网络技术有限公司 | 哪个查找表需要更新或不更新 |
EP4307679A3 (en) | 2018-07-02 | 2024-06-19 | Beijing Bytedance Network Technology Co., Ltd. | Luts with intra prediction modes and intra mode prediction from non-adjacent blocks |
KR20230143620A (ko) * | 2018-07-06 | 2023-10-12 | 미쓰비시덴키 가부시키가이샤 | 동화상 복호 방법, 동화상 복호 장치, 동화상 부호화 방법 및 동화상 부호화 장치 |
CN118200609A (zh) | 2018-07-18 | 2024-06-14 | 北京达佳互联信息技术有限公司 | 使用基于历史的运动向量预测进行视频解码的方法和装置 |
CN112534808A (zh) | 2018-08-10 | 2021-03-19 | 华为技术有限公司 | 视频处理方法、视频处理装置、编码器、解码器、介质和计算机程序 |
CN113242432B (zh) * | 2018-08-29 | 2022-01-25 | 北京达佳互联信息技术有限公司 | 视频解码的方法、计算设备和存储介质 |
TW202025760A (zh) | 2018-09-12 | 2020-07-01 | 大陸商北京字節跳動網絡技術有限公司 | 要檢查多少個hmvp候選 |
EP3855748A4 (en) * | 2018-09-21 | 2022-06-01 | Sharp Kabushiki Kaisha | PICTURE DECODING APPARATUS AND PICTURE CODING APPARATUS |
CN118175301A (zh) * | 2018-10-08 | 2024-06-11 | Lg电子株式会社 | 图像解码方法、图像编码方法、存储介质和发送方法 |
WO2020084552A1 (en) | 2018-10-24 | 2020-04-30 | Beijing Bytedance Network Technology Co., Ltd. | Motion candidate derivation based on spatial neighboring block in sub-block motion vector prediction |
WO2020139032A1 (ko) * | 2018-12-28 | 2020-07-02 | 한국전자통신연구원 | 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체 |
CN113273186A (zh) | 2019-01-10 | 2021-08-17 | 北京字节跳动网络技术有限公司 | Lut更新的调用 |
CN113383554B (zh) | 2019-01-13 | 2022-12-16 | 北京字节跳动网络技术有限公司 | LUT和共享Merge列表之间的交互 |
CN113302937B (zh) | 2019-01-16 | 2024-08-02 | 北京字节跳动网络技术有限公司 | 运动候选推导 |
CN113615193B (zh) | 2019-03-22 | 2024-06-25 | 北京字节跳动网络技术有限公司 | Merge列表构建和其他工具之间的交互 |
CN113411605B (zh) | 2019-06-21 | 2022-05-31 | 杭州海康威视数字技术股份有限公司 | 一种编解码方法、装置及其设备 |
US11336900B2 (en) * | 2019-06-26 | 2022-05-17 | Qualcomm Incorporated | Combined inter and intra prediction mode for video coding |
CN114342377A (zh) * | 2019-07-05 | 2022-04-12 | Lg电子株式会社 | 用于执行双向预测的图像编码/解码方法和设备及发送比特流的方法 |
KR102614946B1 (ko) * | 2019-08-22 | 2023-12-15 | 엘지전자 주식회사 | 가중 예측을 수행하는 영상 부호화/복호화 방법, 장치 및 비트스트림을 전송하는 방법 |
WO2023200255A1 (ko) * | 2022-04-12 | 2023-10-19 | 엘지전자 주식회사 | Amvp(advanced motion vector prediction)-merge 모드에 기반한 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장하는 기록 매체 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101248670A (zh) * | 2005-09-22 | 2008-08-20 | 三星电子株式会社 | 估计视差矢量的方法以及使用该视差矢量估计方法对多视角运动图像编码和解码的方法和设备 |
CN101496407A (zh) * | 2006-07-06 | 2009-07-29 | 汤姆逊许可证公司 | 用于针对多视角视频编码和解码解耦合帧号和/或图像顺序计数(poc)的方法和装置 |
Family Cites Families (41)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004023458A (ja) | 2002-06-17 | 2004-01-22 | Toshiba Corp | 動画像符号化/復号化方法及び装置 |
US7023921B2 (en) * | 2002-08-06 | 2006-04-04 | Motorola, Inc. | Method and apparatus for determining block match quality |
US20050013498A1 (en) * | 2003-07-18 | 2005-01-20 | Microsoft Corporation | Coding of motion vector information |
US8064520B2 (en) * | 2003-09-07 | 2011-11-22 | Microsoft Corporation | Advanced bi-directional predictive coding of interlaced video |
KR100584603B1 (ko) | 2004-08-03 | 2006-05-30 | 학교법인 대양학원 | 다시점 영상의 다이렉트 모드 움직임 예측 방법 및 장치 |
US20070014346A1 (en) | 2005-07-13 | 2007-01-18 | Nokia Corporation | Coding dependency indication in scalable video coding |
KR100789753B1 (ko) | 2005-07-18 | 2008-01-02 | 한국전자통신연구원 | 시간 및 시점간 참조영상 버퍼를 활용한 예측부호화/복호화장치 및 그 방법 |
US8644386B2 (en) | 2005-09-22 | 2014-02-04 | Samsung Electronics Co., Ltd. | Method of estimating disparity vector, and method and apparatus for encoding and decoding multi-view moving picture using the disparity vector estimation method |
KR101276720B1 (ko) | 2005-09-29 | 2013-06-19 | 삼성전자주식회사 | 카메라 파라미터를 이용하여 시차 벡터를 예측하는 방법,그 방법을 이용하여 다시점 영상을 부호화 및 복호화하는장치 및 이를 수행하기 위한 프로그램이 기록된 기록 매체 |
ZA200805337B (en) | 2006-01-09 | 2009-11-25 | Thomson Licensing | Method and apparatus for providing reduced resolution update mode for multiview video coding |
KR100943914B1 (ko) | 2006-01-12 | 2010-03-03 | 엘지전자 주식회사 | 다시점 비디오의 처리 방법 및 장치 |
KR100934674B1 (ko) | 2006-03-30 | 2009-12-31 | 엘지전자 주식회사 | 비디오 신호를 디코딩/인코딩하기 위한 방법 및 장치 |
MX357910B (es) | 2006-07-06 | 2018-07-30 | Thomson Licensing | Método y aparato para desacoplar el número de cuadro y/o la cuenta del orden de imagen (poc) para la codificación y decodificación de video de múltiples vistas. |
CN101491096B (zh) | 2006-07-12 | 2012-05-30 | Lg电子株式会社 | 信号处理方法及其装置 |
WO2008020734A1 (en) | 2006-08-18 | 2008-02-21 | Gwangju Institute Of Science And Technology | A method and apparatus for encoding or decoding frames of different views in multiview video using global disparity |
WO2008048515A2 (en) | 2006-10-13 | 2008-04-24 | Thomson Licensing | Method for reference picture management involving multiview video coding |
CA2666452C (en) | 2006-10-16 | 2014-12-16 | Nokia Corporation | System and method for implementing efficient decoded buffer management in multi-view video coding |
US20100027615A1 (en) | 2006-10-24 | 2010-02-04 | Purvin Bibhas Pandit | Picture identification for multi-view video coding |
US8355438B2 (en) | 2006-10-30 | 2013-01-15 | Nippon Telegraph And Telephone Corporation | Predicted reference information generating method, video encoding and decoding methods, apparatuses therefor, programs therefor, and storage media which store the programs |
JP5023739B2 (ja) | 2007-02-28 | 2012-09-12 | ソニー株式会社 | 画像情報符号化装置及び符号化方法 |
WO2008108566A1 (en) | 2007-03-02 | 2008-09-12 | Lg Electronics Inc. | A method and an apparatus for decoding/encoding a video signal |
US20080240242A1 (en) * | 2007-03-27 | 2008-10-02 | Nokia Corporation | Method and system for motion vector predictions |
KR102139535B1 (ko) | 2007-10-16 | 2020-07-30 | 엘지전자 주식회사 | 비디오 신호 처리 방법 및 장치 |
KR101385884B1 (ko) | 2008-01-30 | 2014-04-16 | 고려대학교 산학협력단 | 다시점 동영상의 부호화 및 복호화 방법 및 장치 |
EP2266318B1 (en) | 2008-03-19 | 2020-04-22 | Nokia Technologies Oy | Combined motion vector and reference index prediction for video coding |
US9973739B2 (en) | 2008-10-17 | 2018-05-15 | Nokia Technologies Oy | Sharing of motion vector in 3D video coding |
KR101590511B1 (ko) | 2009-01-23 | 2016-02-02 | 에스케이텔레콤 주식회사 | 움직임 벡터 부호화/복호화 장치 및 방법과 그를 이용한 영상 부호화/복호화 장치 및 방법 |
WO2010086500A1 (en) | 2009-01-28 | 2010-08-05 | Nokia Corporation | Method and apparatus for video coding and decoding |
US20100246683A1 (en) | 2009-03-27 | 2010-09-30 | Jennifer Lois Harmon Webb | Error Resilience in Video Decoding |
US9060176B2 (en) | 2009-10-01 | 2015-06-16 | Ntt Docomo, Inc. | Motion vector prediction in video coding |
KR101768207B1 (ko) | 2010-01-19 | 2017-08-16 | 삼성전자주식회사 | 축소된 예측 움직임 벡터의 후보들에 기초해 움직임 벡터를 부호화, 복호화하는 방법 및 장치 |
US20120189060A1 (en) | 2011-01-20 | 2012-07-26 | Industry-Academic Cooperation Foundation, Yonsei University | Apparatus and method for encoding and decoding motion information and disparity information |
US9749657B2 (en) | 2011-01-21 | 2017-08-29 | Sharp Kabushiki Kaisha | Buffer compression for motion vector competition |
KR20120095610A (ko) | 2011-02-21 | 2012-08-29 | 삼성전자주식회사 | 다시점 비디오의 부호화 방법 및 장치, 그 복호화 방법 및 장치 |
WO2012124121A1 (ja) | 2011-03-17 | 2012-09-20 | 富士通株式会社 | 動画像復号方法、動画像符号化方法、動画像復号装置及び動画像復号プログラム |
KR20120118780A (ko) | 2011-04-19 | 2012-10-29 | 삼성전자주식회사 | 다시점 비디오의 움직임 벡터 부호화 방법 및 장치, 그 복호화 방법 및 장치 |
US9247249B2 (en) | 2011-04-20 | 2016-01-26 | Qualcomm Incorporated | Motion vector prediction in video coding |
JP2013034171A (ja) * | 2011-06-30 | 2013-02-14 | Sony Corp | 画像処理装置および方法 |
JP2014524706A (ja) | 2011-08-19 | 2014-09-22 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | 動きベクトル処理 |
CA2846425A1 (en) | 2011-08-30 | 2013-03-07 | Nokia Corporation | An apparatus, a method and a computer program for video coding and decoding |
US10200709B2 (en) | 2012-03-16 | 2019-02-05 | Qualcomm Incorporated | High-level syntax extensions for high efficiency video coding |
-
2013
- 2013-03-13 US US13/801,350 patent/US9503720B2/en active Active
- 2013-03-14 JP JP2015500627A patent/JP6215295B2/ja not_active Expired - Fee Related
- 2013-03-14 SG SG11201405071UA patent/SG11201405071UA/en unknown
- 2013-03-14 AU AU2013232041A patent/AU2013232041C1/en not_active Ceased
- 2013-03-14 CA CA2865849A patent/CA2865849C/en not_active Expired - Fee Related
- 2013-03-14 WO PCT/US2013/031536 patent/WO2013138631A1/en active Application Filing
- 2013-03-14 RU RU2014141677A patent/RU2624560C2/ru not_active IP Right Cessation
- 2013-03-14 KR KR1020147028727A patent/KR101812381B1/ko active IP Right Grant
- 2013-03-14 MY MYPI2014702274A patent/MY168175A/en unknown
- 2013-03-14 EP EP13713299.9A patent/EP2826247A1/en not_active Ceased
- 2013-03-14 CN CN201380014234.5A patent/CN104170381B/zh active Active
- 2013-03-15 TW TW102109363A patent/TWI538489B/zh not_active IP Right Cessation
-
2014
- 2014-08-17 IL IL234159A patent/IL234159A/en active IP Right Grant
- 2014-08-27 PH PH12014501923A patent/PH12014501923B1/en unknown
- 2014-10-07 ZA ZA2014/07270A patent/ZA201407270B/en unknown
-
2015
- 2015-01-15 HK HK15100451.5A patent/HK1200047A1/zh unknown
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101248670A (zh) * | 2005-09-22 | 2008-08-20 | 三星电子株式会社 | 估计视差矢量的方法以及使用该视差矢量估计方法对多视角运动图像编码和解码的方法和设备 |
CN101496407A (zh) * | 2006-07-06 | 2009-07-29 | 汤姆逊许可证公司 | 用于针对多视角视频编码和解码解耦合帧号和/或图像顺序计数(poc)的方法和装置 |
Non-Patent Citations (2)
Title |
---|
YOSHITOMO TAKAHASHI ET AL: "《 Descriptions of 3D Video Coding Proposal (HEVC-Compatible Category) by SONY 》", 《98,MPEG MEETING:28-11-2011-2-12-2011;GENEVA;(MOTION PICTURE EXPERT GROUP OR ISO/IEC JTC1/SC29/WG11》 * |
YOSHITOMO TAKAHASHI ET AL: "《3D-HEVC-CE3 resu1ts on motion parameter prediction by Sony》", 《99.MPEGMEETING;SAN JOSA CR;(MOTION PICTURE GROUP OR ISO/IEC JTC1/SC29/WG11,NO.M23639》 * |
Cited By (110)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109076236A (zh) * | 2016-05-13 | 2018-12-21 | 高通股份有限公司 | 用于视频译码的运动矢量预测的合并候选项 |
CN109076236B (zh) * | 2016-05-13 | 2022-09-02 | 高通股份有限公司 | 用于视频译码的运动矢量预测的合并候选项 |
CN109792538B (zh) * | 2016-08-26 | 2021-11-26 | 高通股份有限公司 | 用于对视频数据进行译码的方法和装置 |
CN109792538A (zh) * | 2016-08-26 | 2019-05-21 | 高通股份有限公司 | 用于局部照明补偿和跨分量线性模型预测的参数推导程序的统一 |
CN109891890B (zh) * | 2016-09-07 | 2023-06-16 | 高通股份有限公司 | 用于解码视频数据的方法、编码视频数据的方法及相关设备 |
CN109891890A (zh) * | 2016-09-07 | 2019-06-14 | 高通股份有限公司 | 视频译码中基于子pu的双向运动补偿 |
CN109691098A (zh) * | 2016-09-30 | 2019-04-26 | 华为技术有限公司 | 视频编码方法、解码方法及终端 |
US11558623B2 (en) | 2016-09-30 | 2023-01-17 | Huawei Technologies Co., Ltd. | Bidirectional inter prediction method and terminal based on motion vector difference reduction |
US10841589B2 (en) | 2016-09-30 | 2020-11-17 | Huawei Technologies Co., Ltd. | Bidirectional inter prediction method and terminal based on motion vector difference reduction |
CN110326296B (zh) * | 2017-01-03 | 2023-05-23 | 交互数字麦迪逊专利控股公司 | 用于对运动信息进行编码和解码的方法和装置 |
CN110326296A (zh) * | 2017-01-03 | 2019-10-11 | 交互数字Vc控股公司 | 用于对运动信息进行编码和解码的方法和装置 |
CN110622508A (zh) * | 2017-05-10 | 2019-12-27 | 华为技术有限公司 | 视频压缩中的双向预测 |
CN109089119A (zh) * | 2017-06-13 | 2018-12-25 | 浙江大学 | 一种运动矢量预测的方法及设备 |
US11202077B2 (en) | 2017-06-13 | 2021-12-14 | Huawei Technologies Co., Ltd. | Motion vector prediction method and device |
CN111052746A (zh) * | 2017-07-25 | 2020-04-21 | 交互数字Vc控股公司 | 用于编码和解码全向视频的方法和装置 |
CN111052746B (zh) * | 2017-07-25 | 2024-03-01 | 交互数字麦迪逊专利控股公司 | 用于编码和解码全向视频的方法和装置 |
US11653014B2 (en) | 2017-07-25 | 2023-05-16 | Interdigital Madison Patent Holdings, Sas | Method and apparatus for encoding and decoding an omnidirectional video |
CN111108751A (zh) * | 2017-09-18 | 2020-05-05 | 交互数字Vc控股公司 | 适应于全向视频的运动矢量预测量的方法和装置 |
CN111108751B (zh) * | 2017-09-18 | 2024-04-16 | 交互数字Vc控股公司 | 适应于全向视频的运动矢量预测量的方法和装置 |
CN112075078B (zh) * | 2018-02-28 | 2024-03-15 | 弗劳恩霍夫应用研究促进协会 | 合成式预测及限制性合并 |
CN112075078A (zh) * | 2018-02-28 | 2020-12-11 | 弗劳恩霍夫应用研究促进协会 | 合成式预测及限制性合并 |
US11509915B2 (en) | 2018-06-05 | 2022-11-22 | Beijing Bytedance Network Technology Co., Ltd. | Interaction between IBC and ATMVP |
US11831884B2 (en) | 2018-06-05 | 2023-11-28 | Beijing Bytedance Network Technology Co., Ltd | Interaction between IBC and BIO |
US11973962B2 (en) | 2018-06-05 | 2024-04-30 | Beijing Bytedance Network Technology Co., Ltd | Interaction between IBC and affine |
US11523123B2 (en) | 2018-06-05 | 2022-12-06 | Beijing Bytedance Network Technology Co., Ltd. | Interaction between IBC and ATMVP |
CN110572671B (zh) * | 2018-06-05 | 2022-11-25 | 北京字节跳动网络技术有限公司 | 成对平均merge候选与帧内块复制的交互 |
CN110572671A (zh) * | 2018-06-05 | 2019-12-13 | 北京字节跳动网络技术有限公司 | 成对平均Merge候选与帧内块复制的交互 |
US11477463B2 (en) | 2018-06-21 | 2022-10-18 | Beijing Bytedance Network Technology Co., Ltd. | Component-dependent sub-block dividing |
US11895306B2 (en) | 2018-06-21 | 2024-02-06 | Beijing Bytedance Network Technology Co., Ltd | Component-dependent sub-block dividing |
US11968377B2 (en) | 2018-06-21 | 2024-04-23 | Beijing Bytedance Network Technology Co., Ltd | Unified constrains for the merge affine mode and the non-merge affine mode |
US11659192B2 (en) | 2018-06-21 | 2023-05-23 | Beijing Bytedance Network Technology Co., Ltd | Sub-block MV inheritance between color components |
CN110719488B (zh) * | 2018-07-13 | 2022-03-25 | 腾讯美国有限责任公司 | 视频解码的方法和装置、计算机设备及存储介质 |
CN110719488A (zh) * | 2018-07-13 | 2020-01-21 | 腾讯美国有限责任公司 | 视频解码的方法和装置、计算机设备及存储介质 |
CN112640451A (zh) * | 2018-09-12 | 2021-04-09 | 高通股份有限公司 | 矢量预测器列表生成 |
US11616945B2 (en) | 2018-09-24 | 2023-03-28 | Beijing Bytedance Network Technology Co., Ltd. | Simplified history based motion vector prediction |
CN112771871A (zh) * | 2018-10-04 | 2021-05-07 | 高通股份有限公司 | 时空运动矢量预测的简化 |
CN112913249A (zh) * | 2018-10-22 | 2021-06-04 | 北京字节跳动网络技术有限公司 | 广义双向预测索引的简化编解码 |
CN112913249B (zh) * | 2018-10-22 | 2022-11-08 | 北京字节跳动网络技术有限公司 | 广义双向预测索引的简化编解码 |
US12041267B2 (en) | 2018-10-22 | 2024-07-16 | Beijing Bytedance Network Technology Co., Ltd. | Multi-iteration motion vector refinement |
US12069248B2 (en) | 2018-10-23 | 2024-08-20 | Beijing Bytedance Technology Network Co., Ltd. | Video processing using local illumination compensation |
CN112771870B (zh) * | 2018-10-24 | 2023-11-10 | 华为技术有限公司 | 视频解码器和方法 |
CN112771870A (zh) * | 2018-10-24 | 2021-05-07 | 华为技术有限公司 | 视频解码器和方法 |
US11765383B2 (en) | 2018-10-24 | 2023-09-19 | Huawei Technologies Co., Ltd. | Video decoder and methods |
US11792421B2 (en) | 2018-11-10 | 2023-10-17 | Beijing Bytedance Network Technology Co., Ltd | Rounding in pairwise average candidate calculations |
US11956449B2 (en) | 2018-11-12 | 2024-04-09 | Beijing Bytedance Network Technology Co., Ltd. | Simplification of combined inter-intra prediction |
CN113170097B (zh) * | 2018-11-20 | 2024-04-09 | 北京字节跳动网络技术有限公司 | 视频编解码模式的编解码和解码 |
CN113170097A (zh) * | 2018-11-20 | 2021-07-23 | 北京字节跳动网络技术有限公司 | 视频编解码模式的编解码和解码 |
CN113056916A (zh) * | 2018-11-22 | 2021-06-29 | 北京字节跳动网络技术有限公司 | 基于子块的运动候选的选择和信令 |
CN113056915B (zh) * | 2018-11-22 | 2024-03-26 | 北京字节跳动网络技术有限公司 | 在基于子块的时域运动矢量预测模式中使用并置块 |
CN113056916B (zh) * | 2018-11-22 | 2024-06-11 | 北京字节跳动网络技术有限公司 | 基于子块的运动候选的选择和信令 |
US12069239B2 (en) | 2018-11-22 | 2024-08-20 | Beijing Bytedance Network Technology Co., Ltd | Sub-block based motion candidate selection and signaling |
CN113056920B (zh) * | 2018-11-22 | 2024-05-24 | 北京字节跳动网络技术有限公司 | 基于子块的帧间预测的协调方法 |
CN113056920A (zh) * | 2018-11-22 | 2021-06-29 | 北京字节跳动网络技术有限公司 | 基于子块的帧间预测的协调方法 |
CN113056915A (zh) * | 2018-11-22 | 2021-06-29 | 北京字节跳动网络技术有限公司 | 在基于子块的时域运动矢量预测模式中使用并置块 |
CN113039787A (zh) * | 2018-11-27 | 2021-06-25 | 高通股份有限公司 | 解码器侧运动矢量细化 |
CN113228675A (zh) * | 2018-12-21 | 2021-08-06 | 北京字节跳动网络技术有限公司 | 视频处理中的运动矢量比特深度 |
US12095998B2 (en) | 2018-12-21 | 2024-09-17 | Vid Scale, Inc. | Symmetric motion vector difference coding |
CN113615186B (zh) * | 2018-12-21 | 2024-05-10 | Vid拓展公司 | 对称运动矢量差译码 |
US11843798B2 (en) | 2018-12-21 | 2023-12-12 | Beijing Bytedance Network Technology Co., Ltd | Motion vector range based on motion vector precision |
CN113615186A (zh) * | 2018-12-21 | 2021-11-05 | Vid拓展公司 | 对称运动矢量差译码 |
CN117041594A (zh) * | 2018-12-30 | 2023-11-10 | 北京达佳互联信息技术有限公司 | 用于对视频进行编码的方法、设备、存储介质和程序产品 |
CN117041594B (zh) * | 2018-12-30 | 2024-05-14 | 北京达佳互联信息技术有限公司 | 用于对视频进行编码的方法、设备、存储介质和程序产品 |
CN113302918A (zh) * | 2019-01-15 | 2021-08-24 | 北京字节跳动网络技术有限公司 | 视频编解码中的加权预测 |
US12088837B2 (en) | 2019-01-15 | 2024-09-10 | Beijing Bytedance Network Technology Co., Ltd. | Weighted prediction in video coding |
US12081767B2 (en) | 2019-02-03 | 2024-09-03 | Beijing Bytedance Network Technology Co., Ltd | Interaction between MV precisions and MV difference coding |
US12034964B2 (en) | 2019-02-14 | 2024-07-09 | Beijing Bytedance Network Technology Co., Ltd | Selective application of decoder side refining tools |
CN117119181A (zh) * | 2019-02-20 | 2023-11-24 | 北京达佳互联信息技术有限公司 | 用于视频编码和视频解码的方法、计算设备和存储介质 |
CN116915982A (zh) * | 2019-02-20 | 2023-10-20 | 北京达佳互联信息技术有限公司 | 用于视频解码的方法、电子设备、存储介质和程序产品 |
CN116915982B (zh) * | 2019-02-20 | 2024-03-26 | 北京达佳互联信息技术有限公司 | 用于视频解码的方法、电子设备、存储介质和程序产品 |
CN117119181B (zh) * | 2019-02-20 | 2024-03-26 | 北京达佳互联信息技术有限公司 | 用于视频编码和视频解码的方法、计算设备和存储介质 |
US11930165B2 (en) | 2019-03-06 | 2024-03-12 | Beijing Bytedance Network Technology Co., Ltd | Size dependent inter coding |
CN113545065A (zh) * | 2019-03-06 | 2021-10-22 | 北京字节跳动网络技术有限公司 | 转换后的单向预测候选的使用 |
CN113545065B (zh) * | 2019-03-06 | 2023-12-12 | 北京字节跳动网络技术有限公司 | 转换后的单向预测候选的使用 |
CN113574893B (zh) * | 2019-03-11 | 2024-04-16 | 瑞典爱立信有限公司 | 运动细化和加权预测 |
CN113574893A (zh) * | 2019-03-11 | 2021-10-29 | 瑞典爱立信有限公司 | 运动细化和加权预测 |
US11997303B2 (en) | 2019-04-02 | 2024-05-28 | Beijing Bytedance Network Technology Co., Ltd | Bidirectional optical flow based video coding and decoding |
US11924463B2 (en) | 2019-04-19 | 2024-03-05 | Beijing Bytedance Network Technology Co., Ltd | Gradient calculation in different motion vector refinements |
CN113711609B (zh) * | 2019-04-19 | 2023-12-01 | 北京字节跳动网络技术有限公司 | 利用光流的预测细化过程中的增量运动矢量 |
CN113711609A (zh) * | 2019-04-19 | 2021-11-26 | 北京字节跳动网络技术有限公司 | 利用光流的预测细化过程中的增量运动矢量 |
CN113826386A (zh) * | 2019-05-11 | 2021-12-21 | 北京字节跳动网络技术有限公司 | 视频处理中编解码工具的选择性使用 |
CN113826386B (zh) * | 2019-05-11 | 2023-10-24 | 北京字节跳动网络技术有限公司 | 视频处理中编解码工具的选择性使用 |
CN113411592A (zh) * | 2019-06-21 | 2021-09-17 | 杭州海康威视数字技术股份有限公司 | 预测模式的解码、编码方法及装置 |
RU2810728C2 (ru) * | 2019-06-21 | 2023-12-28 | Ханчжоу Хиквижн Диджитал Текнолоджи Ко., Лтд. | Способы декодирования или кодирования режима предсказания, аппарат для декодирования или кодирования и носитель данных |
WO2020253841A1 (zh) * | 2019-06-21 | 2020-12-24 | 杭州海康威视数字技术股份有限公司 | 预测模式的解码、编码方法及装置 |
WO2020253845A1 (zh) * | 2019-06-21 | 2020-12-24 | 杭州海康威视数字技术股份有限公司 | 预测模式的解码、编码方法及装置 |
CN113347436A (zh) * | 2019-06-21 | 2021-09-03 | 杭州海康威视数字技术股份有限公司 | 预测模式的解码、编码方法及装置 |
CN113347434A (zh) * | 2019-06-21 | 2021-09-03 | 杭州海康威视数字技术股份有限公司 | 预测模式的解码、编码方法及装置 |
CN113411592B (zh) * | 2019-06-21 | 2022-03-29 | 杭州海康威视数字技术股份有限公司 | 预测模式的解码、编码方法及装置 |
CN113382260B (zh) * | 2019-06-21 | 2022-03-29 | 杭州海康威视数字技术股份有限公司 | 预测模式的解码、编码方法及装置 |
CN113411590A (zh) * | 2019-06-21 | 2021-09-17 | 杭州海康威视数字技术股份有限公司 | 预测模式的解码、编码方法及装置 |
RU2821332C2 (ru) * | 2019-06-21 | 2024-06-21 | Ханчжоу Хиквижн Диджитал Текнолоджи Ко., Лтд. | Способы декодирования или кодирования режима предсказания, аппарат для декодирования или кодирования и носитель данных |
CN113411590B (zh) * | 2019-06-21 | 2022-03-08 | 杭州海康威视数字技术股份有限公司 | 预测模式的解码、编码方法及装置 |
CN113347436B (zh) * | 2019-06-21 | 2022-03-08 | 杭州海康威视数字技术股份有限公司 | 预测模式的解码、编码方法及装置 |
CN113382260A (zh) * | 2019-06-21 | 2021-09-10 | 杭州海康威视数字技术股份有限公司 | 预测模式的解码、编码方法及装置 |
CN114175655A (zh) * | 2019-07-27 | 2022-03-11 | 北京字节跳动网络技术有限公司 | 根据参考图片类型使用工具的限制 |
US12041225B2 (en) | 2019-07-27 | 2024-07-16 | Beijing Bytedance Network Technology Co., Ltd. | Restrictions of usage of tools according to reference picture types |
CN114175655B (zh) * | 2019-07-27 | 2024-01-02 | 北京字节跳动网络技术有限公司 | 根据参考图片类型使用工具的限制 |
US11871025B2 (en) | 2019-08-13 | 2024-01-09 | Beijing Bytedance Network Technology Co., Ltd | Motion precision in sub-block based inter prediction |
US11800090B2 (en) | 2019-08-23 | 2023-10-24 | Beijing Bytedance Network Technology Co., Ltd | Clipping in reference picture resampling |
CN114287135A (zh) * | 2019-08-23 | 2022-04-05 | 北京字节跳动网络技术有限公司 | 参考图片重采样中的剪切 |
CN114402591B (zh) * | 2019-09-13 | 2024-08-02 | 北京字节跳动网络技术有限公司 | 并置运动矢量的推导 |
US12063348B2 (en) | 2019-09-13 | 2024-08-13 | Beijing Bytedance Network Technology Co., Ltd | Weighted sample bi-prediction in video coding |
CN114402591A (zh) * | 2019-09-13 | 2022-04-26 | 北京字节跳动网络技术有限公司 | 并置运动矢量的推导 |
CN114402610A (zh) * | 2019-09-13 | 2022-04-26 | 北京字节跳动网络技术有限公司 | 视频编解码中的加权样点双向预测 |
US11778175B2 (en) | 2019-10-23 | 2023-10-03 | Beijing Bytedance Network Technology Co., Ltd | Calculation for multiple coding tools |
CN114641992A (zh) * | 2019-10-23 | 2022-06-17 | 北京字节跳动网络技术有限公司 | 参考图片重采样的信令 |
US11706409B2 (en) | 2019-10-23 | 2023-07-18 | Beijing Bytedance Network Technology Co., Ltd | Signaling for reference picture resampling |
CN114641992B (zh) * | 2019-10-23 | 2024-04-05 | 北京字节跳动网络技术有限公司 | 参考图片重采样的信令 |
CN115244927A (zh) * | 2020-01-13 | 2022-10-25 | Lg电子株式会社 | 图像/视频编码系统中的帧间预测方法和设备 |
US12126810B2 (en) | 2023-01-16 | 2024-10-22 | Huawei Technologies Co., Ltd. | Bidirectional inter prediction method and terminal based on motion vector difference reduction |
Also Published As
Publication number | Publication date |
---|---|
AU2013232041A1 (en) | 2014-09-25 |
CA2865849A1 (en) | 2013-09-19 |
HK1200047A1 (zh) | 2015-07-31 |
MY168175A (en) | 2018-10-11 |
AU2013232041C1 (en) | 2018-05-17 |
PH12014501923A1 (en) | 2014-11-24 |
US20130243093A1 (en) | 2013-09-19 |
ZA201407270B (en) | 2017-08-30 |
KR20140147102A (ko) | 2014-12-29 |
IL234159A (en) | 2017-07-31 |
CN104170381B (zh) | 2017-12-08 |
TWI538489B (zh) | 2016-06-11 |
AU2013232041B2 (en) | 2017-10-05 |
TW201352008A (zh) | 2013-12-16 |
PH12014501923B1 (en) | 2014-11-24 |
KR101812381B1 (ko) | 2017-12-26 |
JP6215295B2 (ja) | 2017-10-18 |
EP2826247A1 (en) | 2015-01-21 |
CA2865849C (en) | 2020-05-26 |
US9503720B2 (en) | 2016-11-22 |
SG11201405071UA (en) | 2014-09-26 |
WO2013138631A1 (en) | 2013-09-19 |
RU2014141677A (ru) | 2016-05-10 |
JP2015514342A (ja) | 2015-05-18 |
RU2624560C2 (ru) | 2017-07-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104170381A (zh) | 在高效率视频译码及其扩展中的运动矢量译码及双向预测 | |
CN105379288B (zh) | 处理对视频译码的照明补偿 | |
KR101722890B1 (ko) | 텍스처 코딩을 위한 더욱 정확한 어드밴스드 잔차 예측 (arp) | |
CN110089116B (zh) | 通过光照补偿和整数运动向量限制进行编码优化 | |
CN104838656B (zh) | 解码与编码视频数据的方法、视频译码器以及计算机可读存储媒体 | |
CN104322070B (zh) | 用于高效率视频译码的高级别语法扩展 | |
CN104335586B (zh) | 运动向量舍入 | |
CN104904217B (zh) | 用于视频译码扩展的时间运动向量预测 | |
CN104170380A (zh) | 视频译码中的视差矢量预测 | |
CN104838657A (zh) | 可缩放及多视角视频译码中的高级残差预测 | |
CN103975597A (zh) | 纹理及深度视图分量当中的内部视图运动预测 | |
EA035270B1 (ru) | Способ и устройство кодирования видеоданных | |
CN104335589A (zh) | 用于视频译码的视图间预测的视差向量产生 | |
KR102294260B1 (ko) | 3차원 (3d) hevc 또는 다른 3d 코딩에서 서브 예측 유닛 (서브 pu) 모션 파라미터 상속 (mpi) 제어 | |
JP2017528984A (ja) | 統合されたイントラブロックコピーおよびインター予測 | |
CN105556969A (zh) | 视频译码中使用视差向量的块识别 | |
CN104769949A (zh) | 用于视差向量导出的图片的选择 | |
CN104126302A (zh) | 产生额外合并候选者 | |
CN104041047A (zh) | 在使用深度的3d视频译码中的多重假设差异向量构建 | |
CN104704833A (zh) | 多视图或3维视频译码中的高级视图间残差预测 | |
CN104025602A (zh) | 三维视频译码中用信号通知视图合成预测支持 | |
CN104685883A (zh) | 用于3d视频的经视图间预测运动向量 | |
CN105580374B (zh) | 一种对多层视频数据进行编解码的方法、视频解码设备及存储媒体 | |
CN104365106A (zh) | 发信用于视频译码的长期参考图片的数据 | |
CN104838658A (zh) | 具有不对称空间分辨率的纹理和深度视图分量当中的内部视图运动预测 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 1200047 Country of ref document: HK |
|
GR01 | Patent grant | ||
GR01 | Patent grant | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: GR Ref document number: 1200047 Country of ref document: HK |