CN104838656A - 视频译码扩展中的时间运动向量预测 - Google Patents

视频译码扩展中的时间运动向量预测 Download PDF

Info

Publication number
CN104838656A
CN104838656A CN201380036235.XA CN201380036235A CN104838656A CN 104838656 A CN104838656 A CN 104838656A CN 201380036235 A CN201380036235 A CN 201380036235A CN 104838656 A CN104838656 A CN 104838656A
Authority
CN
China
Prior art keywords
reference picture
picture
current
same position
type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201380036235.XA
Other languages
English (en)
Other versions
CN104838656B (zh
Inventor
陈颖
瓦迪姆·谢廖金
马尔塔·卡切维奇
张莉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of CN104838656A publication Critical patent/CN104838656A/zh
Application granted granted Critical
Publication of CN104838656B publication Critical patent/CN104838656B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

第一参考索引值指示第一参考图片的在与当前图片的当前预测单元PU相关联的参考图片列表内的位置。相同位置图片的相同位置PU的参考索引指示第二参考图片的在与所述相同位置图片的所述相同位置PU相关联的参考图片列表内的位置。在所述第一参考图片及所述第二参考图片属于不同参考图片类型时,视频译码器将时间合并候选者的参考索引设定为第二参考索引值。所述第二参考索引值不同于所述第一参考索引值。

Description

视频译码扩展中的时间运动向量预测
本申请案主张以下各者的权益:
2012年7月9日申请的第61/669,575号美国临时专利申请案,
2012年7月20日申请的第61/673,982号美国临时专利申请案,
2012年8月29日申请的第61/694,623号美国临时专利申请案,
2012年10月1日申请的第61/708,508号美国临时专利申请案,及
2012年12月31日申请的第61/747,807号美国临时专利申请案,所述申请案中的每一者的整个内容以引用的方式并入本文中。
技术领域
本发明涉及视频译码(即,视频数据的编码及/或解码)。
背景技术
数字视频能力可以并入到多种多样的装置中,包含数字电视、数字直播系统、无线广播系统、个人数字助理(PDA)、膝上型或桌上型计算机、平板计算机、电子书阅读器、数码相机、数字记录装置、数字媒体播放器、视频游戏装置、视频游戏控制台、蜂窝式或卫星无线电电话(所谓的“智能电话”)、视频电话会议装置、视频流式传输装置及其类似者。数字视频装置实施视频压缩技术,例如描述于以下各者中的那些技术:由MPEG-2、MPEG-4、ITU-T H.263、ITU-T H.264/MPEG-4第10部分高级视频译码(AVC)定义的标准、高效率视频译码(HEVC)标准,及此些标准的扩展。视频装置可通过实施此类视频压缩技术来更有效率地发射、接收、编码、解码及/或存储数字视频信息。
视频压缩技术执行空间(图片内)预测和/或时间(图片间)预测来减少或移除视频序列中固有的冗余。对于基于块的视频译码,可将视频切片(即,视频帧或视频帧的一部分)分割成视频块。使用相对于同一图片中的相邻块中的参考样本的空间预测对图片的经帧内译码(I)切片中的视频块进行编码。图片的经帧间译码(P或B)切片中的视频块可使用相对于同一图片中的相邻块中的参考样本的空间预测或相对于其它参考图片中的参考样本的时间预测。图片可被称作帧,且参考图片可被称作参考帧。
空间或时间预测导致对块的预测块进行译码。残余数据表示待译码的原始块与预测块之间的像素差。经帧间译码块是根据指向形成预测块的参考样本块的运动向量及指示经译码块与预测块之间的差的残余数据编码的。经帧内译码块是根据帧内译码模式及残余数据来编码。为了实现进一步压缩,可以将残余数据从像素域变换到变换域,从而产生残余系数,接着可以对残余系数进行量化。可扫描最初布置为二维阵列的经量化的系数,以便产生系数的一维向量,且可应用熵译码以实现更多压缩。
可例如从多个观点编码视图来产生多视图译码位流。已经开发或在开发中的一些三维(3D)视频标准利用多视图译码方面。举例来说,不同视图可发射左眼及右眼视图以支持3D视频,或不同视图可用以产生复合3D再现。或者,一些3D视频译码过程可应用所谓的多视图加深度译码。在多视图加深度译码中,3D视频位流可不仅含有纹理视图分量而且含有深度视图分量。举例来说,每一视图可包括一个纹理视图分量及一个深度视图分量。
发明内容
一般来说,本发明描述用以支持视频编解码器(例如,高效率视频译码(HEVC)及HEVC的扩展)中的更高效时间运动向量预测(TMVP)的技术。另外,本发明描述用以改进HEVC扩展中的运动预测的译码效率的技术。在一些情况下,与当前视频单元相关联的参考图片列表中的初始参考图片及由当前视频单元的时间运动向量预测子(TMVP)的参考索引指示的参考图片属于不同参考图片类型。在此些情况下,视频译码器可将时间合并候选者的参考索引设定为指示除参考图片列表的初始位置之外的参考图片列表中的位置的值。时间合并候选者的参考索引指示与当前视频单元相关联的参考图片列表中的位置。
在一个实例中,本发明描述一种解码视频数据的方法,其中第一参考索引值指示第一参考图片的在与当前图片的当前预测单元(PU)相关联的参考图片列表内的位置,其中相同位置图片的相同位置PU的参考索引指示第二参考图片的在与所述相同位置图片的所述相同位置PU相关联的参考图片列表内的位置,且所述方法包括:在所述第一参考图片及所述第二参考图片属于不同参考图片类型时,将时间合并候选者的参考索引设定为第二参考索引值,所述第二参考索引值不同于所述第一参考索引值;从包含所述时间合并候选者的合并候选者列表中的多个合并候选者当中确定选定的合并候选者;至少部分基于由所述选定的合并候选者指定的运动信息确定当前PU的预测性块;及至少部分基于所述当前PU的所述预测性块产生经重建构样本块。
在另一实例中,本发明描述一种编码视频数据的方法,其中第一参考索引值指示第一参考图片的在与当前图片的当前预测单元PU相关联的参考图片列表内的位置,其中相同位置图片的相同位置PU的参考索引指示第二参考图片的在与所述相同位置图片的所述相同位置PU相关联的参考图片列表内的位置,且其中所述方法包括:在所述第一参考图片及所述第二参考图片属于不同参考图片类型时,将时间合并候选者的参考索引设定为第二参考索引值,所述第二参考索引值不同于所述第一参考索引值;从包含所述时间合并候选者的合并候选者列表中的多个合并候选者当中确定选定的合并候选者;及产生包含识别在所述合并候选者列表内的所述选定的合并候选者的数据的位流。
在另一实例中,本发明描述一种包括一或多个处理器的视频译码器,其中第一参考索引值指示第一参考图片的在与当前图片的当前预测单元PU相关联的参考图片列表内的位置,其中相同位置图片的相同位置PU的参考索引指示第二参考图片的在与所述相同位置图片的所述相同位置PU相关联的参考图片列表内的位置,及其中所述一或多个处理器经配置以使得在所述第一参考图片及所述第二参考图片属于不同参考图片类型时,所述一或多个处理器将所述当前PU的合并候选者列表中的时间合并候选者的参考索引设定为第二参考索引值,所述第二参考索引值不同于所述第一参考索引值。
在另一实例中,本发明描述一种视频译码器,其包括:用于在第一参考图片及第二参考图片属于不同参考图片类型时将当前预测单元PU的合并候选者列表的时间合并候选者的参考索引设定为第一参考索引值的装置,其中第二参考索引值指示所述第一参考图片的在与所述当前PU相关联的参考图片列表内的位置,所述第二参考索引值不同于所述第一参考索引值,且其中相同位置图片的相同位置PU的参考索引指示所述第二参考图片的在与所述相同位置PU相关联的参考图片列表内的位置。
在另一实例中,本发明描述一种存储指令的计算机可读存储媒体,所述指令在执行时配置视频译码器以在第一参考图片及第二参考图片属于不同参考图片类型时将当前预测单元PU的合并候选者列表的时间合并候选者的参考索引设定为第一参考索引值,其中第二参考索引值指示所述第一参考图片的在与所述当前PU相关联的参考图片列表内的位置,所述第二参考索引值不同于所述第一参考索引值,且其中相同位置图片的相同位置PU的参考索引指示所述第二参考图片的在与所述相同位置PU相关联的参考图片列表内的位置。
在附图和下文描述中阐述本发明的一或多个实例的细节。将从描述、图式及权利要求书显而易见其它特征、目标及优势。
附图说明
图1是说明可以利用本发明中描述的技术的实例视频编码系统的框图。
图2是说明相对于当前预测单元(PU)的实例空间运动向量相邻者的概念图。
图3是说明实例多视图译码解码次序的概念图。
图4是说明用于多视图译码的实例预测结构的概念图。
图5是说明经视图间预测的运动向量候选者的实例导出过程的概念图。
图6是说明合并模式中的时间运动向量与视差运动向量之间的预测的概念图。
图7是说明可实施本发明中描述的技术的实例视频编码器的框图。
图8是说明可实施本发明中描述的技术的实例视频解码器的框图。
图9是说明根据本发明的一或多个技术的视频解码器的实例操作的流程图。
图10是说明根据本发明的一或多个技术的视频编码器的实例操作的流程图。
图11是说明根据本发明的一或多个实例技术的视频编码器的实例操作的流程图。
图12是说明根据本发明的一或多个实例技术的视频解码器的实例操作的流程图。
具体实施方式
在高效率视频译码(HEVC)中,在视频译码器(例如,视频编码器或视频解码器)开始译码当前图片的当前切片时,视频译码器可产生当前切片的一或多个参考图片列表。参考图片列表中的每一者包含参考图片的列表。参考图片中的数据可用以预测当前切片中的数据。在本发明中,如果PU在切片中,那么切片的参考图片列表与预测单元(PU)相关联。与PU相关联的参考图片列表在本文中也可被称为PU的参考图片列表。此外,当前图片的每一PU可具有一或多个运动向量、一或多个参考索引及一或多个预测方向指示符。PU的运动向量、参考索引及预测方向指示符可统称为PU的运动信息。PU的参考索引可指示参考图片的在参考图片列表内的位置。PU的运动向量可指示PU的预测块与参考图片中的位置之间的空间移位。
在一些实例中,可使用合并/跳过模式或高级运动向量预测(AMVP)模式用信号发出PU的运动信息。在视频编码器使用合并模式用信号发出当前PU的运动信息时,视频编码器可产生包含一或多个合并候选者的合并候选者列表。合并候选者中的每一者指定空间运动向量预测子或时间运动向量预测子(即,TMVP)的运动信息。空间运动向量预测子可为当前图片(即,包含当前PU的图片)中的PU。TMVP可为时间参考图片(即,在不同于当前图片的时间实例处出现的图片)中的PU。指定TMVP的运动信息的合并候选者可被称为“时间合并候选者”。
在产生合并候选者列表之后,视频编码器可选择合并候选者中的一者,且在位流中包含指示选定的合并候选者的在合并候选者列表内的位置的语法元素。在视频解码器解码当前PU时,视频解码器可产生相同合并候选者列表。此外,视频解码器可从位流获得语法元素,且使用语法元素来确定合并候选者列表中的选定的合并候选者。视频解码器接着可使用由选定的合并候选者指示的运动信息作为当前PU的运动信息。
在HEVC中,时间合并候选者的参考索引总是被设定成0。因此,时间合并候选者的参考索引总是指示与当前PU相关联的参考图片列表中的第一参考图片。此外,如果TMVP的参考索引指示除与当前PU相关联的参考图片列表中的第一参考图片之外的图片,那么时间合并候选者可指定TMVP的运动向量的经按比例缩放版本。视频译码器可基于与当前PU相关联的参考图片列表中的第一参考图片与由TMVP的参考索引指示的参考图片之间的时间距离产生TMVP的运动向量的经按比例缩放版本。
在HEVC的多视图及3维视频(3DV)译码扩展(即,MV-HEVC及3D-HEVC)中,位流可包含多个视图。视图中的每一者可表示来自不同检视视角的场景。此外,MV-HEVC及3D-HEVC支持视图间预测。在视图间预测中,当前图片的切片的参考图片列表可包含相关联于与当前图片相同的时间实例但与不同于当前图片的视图相关联的一或多个参考图片。相关联于与当前图片相同的时间实例但与不同于当前图片的视图相关联的参考图片可被称为“视差参考图片”或“视图间参考图片”。相对比地,相关联于与当前图片相同的视图但与不同于当前图片的时间实例相关联的参考图片可被称为“时间参考图片”。视差参考图片及时间参考图片据称属于不同“类型”的参考图片(即,不同“参考图片类型”)。
PU的参考索引可指示视差参考图片的在参考图片列表中的位置。与指示视差参考图片的在参考图片列表中的位置的参考索引相关联的运动向量可被称为“视差运动向量”。同样,PU的参考索引可指示时间参考图片的在参考图片列表中的位置。与指示时间参考图片的在参考图片列表中的位置的参考索引相关联的运动向量可被称为“时间运动向量”。
如上文所提及,合并候选者清单可包含时间合并候选者。时间合并候选者可基于TMVP的运动信息指定运动信息。在MV-HEVC及3D-HEVC中,TMVP自身可具有视差运动向量及/或时间运动向量。如果TMVP的运动向量为视差运动向量,且与当前PU相关联的参考图片列表中的第一参考图片为时间参考图片,那么视频译码器不会按比例缩放TMVP的运动向量。因此,如果TMVP的运动向量为视差运动向量,且与当前PU相关联的参考图片列表中的第一参考图片为时间参考图片,那么基于TMVP的时间合并候选者指定参考索引等于0,且指定未按比例缩放的运动向量。因此,视频译码器可使用此时间合并候选者的运动向量作为时间运动向量,尽管此运动向量原先为视差运动向量。
类似地,如果TMVP的运动向量为时间运动向量,且与当前PU相关联的参考图片列表的第一参考图片为视差运动向量,那么视频译码器不会按比例缩放TMVP的运动向量。而是,视频译码器可产生指定参考索引等于0及TMVP的未按比例缩放的运动向量的时间合并候选者。视频译码器可使用时间合并候选者的运动向量作为视差运动向量,尽管此运动向量原先为时间运动向量。使用时间运动向量作为视差运动向量及使用视差运动向量作为时间运动向量可导致显著的不准确性。因此,在其中由TMVP指示的参考图片及与当前PU相关联的对应参考图片列表的第一参考图片属于不同参考图片类型的情形中,视频译码器不大可能使用所得时间合并候选者。此情形可降低译码效率,且增加位流的大小。
本发明的一或多个技术可解决此问题。举例来说,与当前视频单元相关联的参考图片列表中的初始参考图片可表示为RF0。在此实例中,当前视频单元的时间运动向量预测子(TMVP)的参考索引可表示为RF1。在RF0及RF1属于相同参考图片类型时,视频译码器可将时间合并候选者的参考索引设定为默认值(例如,0)。否则,如果RF0及RF1属于不同参考图片类型,那么视频译码器可将时间合并候选者的参考索引设定为除默认值之外的值。举例来说,在RF0及RF1属于不同参考图片类型时,视频译码器可将当前视频单元(例如,当前PU)的合并候选者列表中的时间合并候选者的参考索引设定为非默认值。时间合并候选者的参考索引指示与当前视频单元相关联的参考图片列表中的位置。
因为视频译码器并不总是将时间合并候选者的参考索引设定为默认值(例如,0),所以时间合并候选者可指示参考图片列表中的其它参考图片。此情形可增加由时间合并候选者指定的运动信息的使用将产生比由其它合并候选者指定的运动信息更佳的速率/失真值的概率。因此,本发明的技术可增加译码效率,且降低位流大小。
图1是说明可以利用本发明的技术的实例视频译码系统10的框图。如本文所使用,术语“视频译码器”一般是指视频编码器及视频解码器两者。在本发明中,术语“视频译码”或“译码”一般可指视频编码或视频解码。
如图1中所示,视频译码系统10包含源装置12和目的地装置14。源装置12产生经编码的视频数据。因此,源装置12可以被称为视频编码装置或视频编码设备。目的地装置14可以对由源装置12所产生的经编码的视频数据进行解码。因此,目的地装置14可以被称为视频解码装置或视频解码设备。源装置12以及目的地装置14可以是视频译码装置或视频译码设备的实例。
源装置12及目的地装置14可包括广泛范围的装置,包含桌上型计算机、行动计算装置、笔记型(例如,膝上型)计算机、平板计算机、机顶盒、例如所谓的“智能”电话等电话手持机、电视、相机、显示装置、数字媒体播放器、视频游戏控制台、车载计算机(in-car computer)或其类似者。
目的地装置14可以经由信道16从源装置12接收经编码的视频数据。信道16可以包括能够将经编码的视频数据从源装置12移动到目的地装置14的一或多个媒体或装置。在一个实例中,信道16可以包括使得源装置12能够实时地将经编码的视频数据直接发射到目的地装置14的一或多个通信媒体。在此实例中,源装置12可以根据例如无线通信协议等通信标准调制经编码的视频数据,并且可以将经调制的视频数据发射到目的地装置14。一或多个通信媒体可以包含无线通信媒体和/或有线通信媒体,例如射频(RF)频谱或一或多个物理传输线。一或多个通信媒体可以形成基于数据包的网络的一部分,基于数据包的网络例如局域网、广域网或全球网络(例如,因特网)。一或多个通信媒体可包含路由器、交换器、基站或促进从源装置12到目的地装置14的通信的其它设备。
在另一实例中,信道16可以包含存储由源装置12产生的经编码的视频数据的存储媒体。在此实例中,目的地装置14可以例如经由磁盘存取或卡存取来存取存储媒体。存储媒体可以包含多种本地存取的数据存储媒体,例如蓝光光盘、DVD、CD-ROM、快闪存储器或用于存储经编码的视频数据的其它合适数字存储媒体。
在另一实例中,信道16可以包含存储由源装置12产生的经编码的视频数据的文件服务器或另一中间存储装置。在此实例中,目的地装置14可以经由流式传输或下载来存取存储于文件服务器或其它中间存储装置处的经编码的视频数据。文件服务器可以是能够存储经编码的视频数据并且将经编码的视频数据发射到目的地装置14的类型的服务器。实例文件服务器包含网络服务器(例如,用于网站)、文件传输协议(FTP)服务器、网络附接存储(NAS)装置及本地磁盘驱动器。
目的地装置14可以通过标准数据连接(例如因特网连接)来存取经编码的视频数据。数据连接的实例类型可包含适合于存取存储于文件服务器上的经编码视频数据的无线信道(例如,Wi-Fi连接)、有线连接(例如,DSL、缆线调制解调器等)或两者的组合。经编码的视频数据从文件服务器的传输可为流式传输、下载传输或两者的组合。
本发明的技术不限于无线应用或设置。所述技术可以应用于视频译码以支持多种多媒体应用,例如空中电视广播、有线电视发射、卫星电视发射、流式视频发射(例如,经由因特网)、编码视频数据以存储于数据存储媒体上、解码存储于数据存储媒体上的视频数据,或其它应用。在一些实例中,视频译码系统10可经配置以支持单向或双向视频传输以支持例如视频流式传输、视频重放、视频广播和/或视频电话等应用。
图1仅为实例,且本发明的技术可适用于未必包含编码装置与解码装置之间的任何数据通信的视频译码设定(例如,视频编码或视频解码)。在其它实例中,数据可从本地存储器检索、在网络上流式传输,等。视频编码装置可以对数据进行编码并且将数据存储到存储器,和/或视频解码装置可以从存储器检索数据并且对数据进行解码。在许多实例中,通过并不彼此通信而是简单地编码数据到存储器及/或从存储器检索数据且解码数据的装置执行编码及解码。
在图1的实例中,源装置12包含视频源18、视频编码器20以及输出接口22。在一些情况下,输出接口22可以包含调制器/解调器(调制解调器)和/或发射器。视频源18可以包含视频俘获装置(例如,摄像机)、含有先前俘获的视频数据的视频存档、用以从视频内容提供者接收视频数据的视频馈入接口、和/或用于产生视频数据的计算机图形系统,或视频数据的此些源的组合。
视频编码器20可以对来自视频源18的视频数据进行编码。在一些实例中,源装置12经由输出接口22将经编码的视频数据直接发射到目的地装置14。在其它实例中,经编码的视频数据还可以存储到存储媒体或文件服务器上以供稍后由目的地装置14存取以用于解码和/或重放。
在图1的实例中,目的地装置14包含输入接口28、视频解码器30以及显示装置32。在一些实例中,输入接口28包含接收器和/或调制解调器。输入接口28可以在信道16上接收经编码的视频数据。显示装置32可以与目的地装置14集成在一起或可以在目的地装置14的外部。一般来说,显示装置32显示经解码的视频数据。显示装置32可以包括多种显示装置,例如液晶显示器(LCD)、等离子显示器、有机发光二极管(OLED)显示器或另一类型的显示装置。
视频编码器20以及视频解码器30各自可以实施为例如以下各者的多种合适电路中的任一者:一或多个微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑、硬件或其任何组合。当部分地以软件实施技术时,装置可将软件的指令存储于合适的非暂时性计算机可读存储媒体中且可使用一或多个处理器以硬件执行指令从而执行本发明的技术。可将前述内容中的任一者(包含硬件、软件、硬件与软件的组合等)视为一或多个处理器。视频编码器20及视频解码器30中的每一者可包含在一或多个编码器或解码器中,所述编码器或解码器中的任一者可集成为相应装置中的组合编码器/解码器(CODEC)的部分。
本发明通常可指视频编码器20将某些信息“发信号”到另一装置(例如视频解码器30)。术语“发信号”可以大体上是指对用以对经压缩的视频数据进行解码的语法元素和/或其它数据的通信。此传达可实时或接近实时地发生。或者,此传达可在一时间跨度内发生,例如可在编码时在经编码位流中将语法元素存储到计算机可读存储媒体(例如,可经由文件服务器或流式传输服务器远程存取的存储媒体或可在本地存取的存储装置)时发生,所述语法元素接着可在被存储到此媒体之后的任何时间由解码装置检索。
在一些实例中,视频编码器20及视频解码器30根据视频压缩标准而操作,例如ISO/IEC MPEG-4视觉及ITU-T H.264(也称为ISO/IEC MPEG-4AVC),包含其可缩放视频译码(SVC)扩展、多视图视频译码(MVC)扩展及基于MVC的3DV扩展。在一些情况下,符合基于MVC的3DV的任何法定位流始终含有顺应MVC配置文件(例如,立体声高配置文件)的子位流。此外,正在致力于产生H.264/AVC的三维视频(3DV)译码扩展,即基于AVC的3DV。在其它实例中,视频编码器20及视频解码器30可根据ITU-T H.261、ISO/IEC MPEG-1Visual、ITU-T H.262或ISO/IEC MPEG-2Visual、ITU-T H.263、ISO/IECMPEG-4Visual及ITU-T H.264、ISO/IEC Visual或另一视频译码规范操作。
在图1的实例中,视频编码器20及视频解码器30可根据由ITU-T视频译码专家组(VCEG)及ISO/IEC动画专家组(MPEG)的视频译码联合合作小组(JCT-VC)开发的高效率视频译码(HEVC)标准操作。被称作“HEVC工作草案7”的HEVC标准的草案描述于Bross等人的“高效率视频译码(HEVC)文本规范草案7”(ITU-T SG16WP3及ISO/IECJTC1/SC29/WG11的视频译码联合合作小组(JCT-VC),瑞士日内瓦第9次会议,2012年4月到5月)中,所述草案到2013年7月8日为止可从http://phenix.int-evry.fr/jct/doc_end_user/documents/9_Geneva/wg11/JCTVC-I1003-v5.zip获得。被称作“HEVC工作草案8”的HEVC标准的另一草案描述于Bross等人的“高效率视频译码(HEVC)文本规范草案8”中(ITU-T SG16WP3及ISO/IEC JTC1/SC29/WG11的视频译码联合合作小组(JCT-VC),中国上海第10次会议,2012年10月),所述草案到2013年7月8日为止可从http://phenix.int-evry.fr/jct/doc_end_user/documents/11_Shanghai/wg11/JCTVC-K1003-v13.zip获得。被称作“HEVC工作草案9”的HEVC标准的另一草案描述于Bross等人的“高效率视频译码(HEVC)文本规范草案9”(ITU-T SG16WP3及ISO/IEC JTC1/SC29/WG11的视频译码联合合作小组(JCT-VC),瑞典斯德哥尔摩第11次会议,2012年7月)中,所述草案到2013年7月8日为止可从http://phenix.int-evry.fr/jct/doc_end_user/documents/10_Stockholm/wg11/JCTVC-J1003-v8.zip获得。
此外,正在致力于产生用于HEVC的SVC扩展。HEVC的SVC扩展可被称为SHEVC。另外,VCEG及MPEG的3D视频译码联合合作小组(JCT-3C)正在基于HEVC开发3DV标准,其中标准化工作的部分包含基于HEVC的多视图编解码器(“MV-HEVC”)及基于HEVC的3DV译码的另一部分(“3D-HEVC”)的标准化。HEVC的3DV扩展可被称为基于HEVC的3DV或3D-HEVC。3D-HEVC至少部分基于Schwarz等人的“Fraunhofer HHI的3D视频译码技术提案的描述(HEVC兼容配置A)(Descriptionof 3D Video Coding Technology Proposal by Fraunhofer HHI(HEVC compatibleconfiguration A))”(ISO/IEC JTC1/SC29/WG11,Doc.MPEG11/M22570,瑞士日内瓦,2011年11月/12月)及Schwarz等人的“Fraunhofer HHI的3D视频译码技术提案的描述(HEVC兼容配置B)(Description of 3D Video Coding Technology Proposal by Fraunhofer HHI(HEVC compatible configuration B))”(ISO/IEC JTC 1/SC29/WG11,Doc.MPEG11/M22571,瑞士日内瓦,2011年11月/12月)中所提出的解决方案。在本文中被称为3D-HTM的3D-HEVC的参考软件描述可在Schwarz等人的“基于HEVC的3D视频译码的研究中的测试模型(Test Model under Consideration for HEVC based 3D videocoding)”(ISO/IEC JTC1/SC29/WG11 MPEG2011/N12559,美国圣何塞,2012年2月)处获得。参考软件(亦即HTM版本3.0)到2013年7月8日为止可从https://hevc.hhi.fraunhofer.de/svn/svn_3DVCSoftware/tags/HTM-3.0/获得。或者,3D-HEVC的3D-HTM的软件到2013年7月8日为止可从https://hevc.hhi.fraunhofer.de/svn/svn_HEVCSoftware/trunk/获得。
在HEVC及其它视频译码标准中,视频序列通常包含一连串图片。图片也可被称作“帧”。图片可以包含三个样本阵列,表示为SL、SCb以及SCr。SL是明度样本的二维阵列(即,块)。SCb是Cb色度样本的二维阵列。SCr是Cr色度样本的二维阵列。色度样本在本文中还可以被称为“色度”样本。在其它情况下,图片可为单色的且可仅包含明度样本阵列。样本可为像素域值。
为了产生图片的经编码的表示,视频编码器20可以产生一组译码树单元(CTU)。CTU中的每一者可包括明度样本的译码树型块、色度样本的两个对应的译码树型块,以及用以对译码树型块的样本进行译码的语法结构。译码树型块可以是样本的NxN块。CTU也可以被称为“树型块”或“最大译码单元”(LCU)。HEVC的CTU可以广泛地类似于例如H.264/AVC等其它视频译码标准的宏块。然而,CTU未必限于特定大小,并且可以包含一或多个译码单元(CU)。切片可包含按光栅扫描次序连续排序的整数数目的CTU。
本发明可使用术语“视频单元”或“视频块”来指代一或多个样本块及用于译码所述一或多个样本块的样本的语法结构。实例类型的视频单元可包含CTU、CU、PU、变换单元(TU)、宏块、宏块分割区等。
为了产生经译码的CTU,视频编码器20可以对CTU的译码树型块递归地执行四分树分割,以将译码树型块划分为译码块,因此命名为“译码树单元”。译码块是样本的NxN块。CU可包括具有明度样本阵列、Cb样本阵列和Cr样本阵列的图片的明度样本的译码块,以及色度样本的两个对应的译码块,以及用以对译码块的样本进行译码的语法结构。视频编码器20可以将CU的译码块分割成一或多个预测块。预测块可以是应用相同预测的样本的矩形(即,正方形或非正方形)块。CU的预测单元(PU)可包括图片的明度样本的预测块,图片的色度样本的两个对应的预测块,以及用以对预测块样本进行预测的语法结构。视频编码器20可以产生用于CU的每个PU的明度预测块、Cb预测块以及Cr预测块的预测性明度块、Cb块以及Cr块。
视频编码器20可以使用帧内预测或帧间预测来产生用于PU的预测性块。如果视频编码器20使用帧内预测产生PU的预测性块,那么视频编码器20可以基于与PU相关联的图片的经解码的样本来产生PU的预测性块。
如果视频编码器20使用帧间预测产生PU的预测性块,那么视频编码器20可以基于不同于与PU相关联的图片的一或多个图片的经解码的样本来产生PU的预测性块。帧间预测可以是单向帧间预测(即,单向预测)或双向帧间预测(即,双向预测)。为了执行单向预测或双向预测,视频编码器20可以产生用于当前切片的第一参考图片列表(RefPicList0)以及第二参考图片列表(RefPicList1)。参考图片列表中的每一者可以包含一或多个参考图片。当使用单向预测时,视频编码器20可以搜索RefPicList0以及RefPicList1中的任一者或两者中的参考图片,以确定参考图片内的参考位置。此外,当使用单向预测时,视频编码器20可以至少部分基于对应于参考位置的样本产生用于PU的预测性块。此外,在使用单向预测时,视频编码器20可产生指示PU的预测块与参考位置之间的空间移位的单一运动向量。为了指示PU的预测块与参考位置之间的空间移位,运动向量可以包含指定PU的预测块与参考位置之间的水平移位的水平分量并且可以包含指定PU的预测块与参考位置之间的垂直移位的垂直分量。
在使用双向预测来编码PU时,视频编码器20可确定RefPicList0中的参考图片中的第一参考位置及RefPicList1中的参考图片中的第二参考位置。视频编码器20接着可至少部分基于对应于第一及第二参考位置的样本产生PU的预测性块。此外,当使用双向预测对PU进行编码时,视频编码器20可以产生指示PU的预测块与第一参考位置之间的空间移位的第一运动向量,以及指示PU的预测块与第二参考位置之间的空间移位的第二运动向量。
在视频编码器20产生CU的一或多个PU的预测性明度、Cb及Cr块之后,视频编码器20可产生CU的明度残余块。CU的明度残余块中的每个样本指示CU的预测性明度块中的一者中的明度样本与CU的原始明度译码块中对应的样本之间的差异。另外,视频编码器20可以为CU产生Cb残余块。CU的Cb残余块中的每一样本可以指示CU的预测性Cb块中的一者中的Cb样本与CU的原始Cb译码块中的对应样本之间的差异。视频编码器20还可以为CU产Cr残余块。CU的Cr残余块中的每一样本可以指示CU的预测性Cr块中的一者中的Cr样本与CU的原始Cr译码块中的对应样本之间的差异。
此外,视频编码器20可使用四分树分割将CU的明度、Cb及Cr残余块分解成一或多个明度、Cb及Cr变换块。变换块可以是应用相同变换的样本的矩形块。CU的变换单元(TU)可包括明度样本的变换块、色度样本的两个对应变换块及用以对变换块样本进行变换的语法结构。因此,CU的每个TU可以与明度变换块、Cb变换块以及Cr变换块相关联。与TU相关联的明度变换块可以是CU的明度残余块的子块。Cb变换块可以是CU的Cb残余块的子块。Cr变换块可以是CU的Cr残余块的子块。
视频编码器20将一或多个变换应用到TU的明度变换块以产生TU的明度系数块。系数块可以是变换系数的二维阵列。变换系数可以是标量。视频编码器20可以将一或多个变换应用到TU的Cb变换块从而为TU产生Cb系数块。视频编码器20可以将一或多个变换应用到TU的Cr变换块从而为TU产生Cr系数块。
在产生系数块(例如,明度系数块、Cb系数块或Cr系数块)之后,视频编码器20可以量化系数块。量化大体上是指对变换系数进行量化以可能减少用以表示变换系数的数据的量从而提供进一步压缩的过程。此外,视频编码器20可将变换系数反量化且对变换系数应用反变换以便重建构图片的CU的TU的变换块。视频编码器20可使用CU的TU的经重建构变换块以及CU的PU的预测性块以重建构CU的译码块。通过重建构图片的每一CU的译码块,视频编码器20可以重建构所述图片。视频编码器20可将经重建构图片存储在经解码图片缓冲器(DPB)中。视频编码器20可以使用DPB中的经重建构图片来用于帧间预测及帧内预测。
在视频编码器20量化系数块之后,视频编码器20可以对指示经量化变换系数的语法元素进行熵编码。例如,视频编码器20可以对指示经量化变换系数的语法元素执行上下文自适应二进制算术译码(CABAC)。视频编码器20可以在位流中输出经熵编码语法元素。
视频编码器20可输出包含形成经译码图片及相关联数据的表示的位序列的位流。位流可包括一连串网络抽象层(NAL)单元。所述NAL单元中的每一者包含NAL单元标头且封装原始字节序列有效负载(RBSP)。NAL单元标头可包含指示NAL单元类型代码的语法元素。由NAL单元的NAL单元标头指定的所述NAL单元类型代码指示NAL单元的类型。RBSP可为含有封装在NAL单元内的整数数目个字节的语法结构。在一些情况下,RBSP包含零个位。
不同类型的NAL单元可封装不同类型的RBSP。举例来说,第一类型的NAL单元可封装用于图片参数集(PPS)的RBSP,第二类型的NAL单元可封装用于经译码切片的RBSP,第三类型的NAL单元可封装用于补充增强信息(SEI)的RBSP,等等。PPS为可含有适用于零或多个完整经译码图片的语法元素的语法结构。封装用于视频译码数据的RBSP(与用于参数集及SEI消息的RBSP相比)的NAL单元可被称为视频译码层(VCL)NAL单元。封装经译码切片的NAL单元可在本文中被称为经译码切片NAL单元。用于经译码切片的RBSP可包含切片标头及切片数据。
视频解码器30可以接收位流。另外,视频解码器30可剖析位流以从位流获得语法元素。视频解码器30可至少部分基于从位流获得的语法元素重建构视频数据的图片。用以重建构视频数据的过程大体上可以与由视频编码器20执行的过程互逆。举例来说,视频解码器30可使用PU的运动向量,以确定当前CU的PU的预测性块。视频解码器30可使用PU的一或多个运动向量来产生PU的预测性块。
另外,视频解码器30可以反量化与当前CU的TU相关联的系数块。视频解码器30可以对系数块执行反变换以重建构与当前CU的TU相关联的变换块。通过将用于当前CU的PU的预测性块的样本增加到当前CU的TU的变换块的对应的样本上,视频解码器30可以重建构当前CU的译码块。通过重建构用于图片的每一CU的译码块,视频解码器30可以重建构所述图片。视频解码器30可将经解码图片存储在经解码图片缓冲器中以用于输出且/或用于解码其它图片。
在视频译码器(例如,视频编码器20或视频解码器30)开始处理当前图片时,视频译码器可确定当前图片的五个参考图片集(RPS)子集:RefPicSetStCurrBefore、RefPicSetStCurrAfter、RefPicSetFollBefore、RefPicSetLtFoll、RefPicSetLtCurr及RefPicSetLtFoll。RefPicSetStCurrBefore可包含按输出次序在当前图片之前出现且用于由当前图片参考的短期参考图片。RefPicSetStFollBefore可包含按输出次序在当前图片之前出现且不用于由当前图片参考的短期参考图片。RefPicStCurrAfter可包含按输出次序在当前图片之后出现且用于由当前图片参考的短期参考图片。RefPicSetStFollAfter可包含按输出次序在当前图片之后出现且不用于由当前图片参考的短期参考图片。RefPicSetLtCurr可包含用于由当前图片参考的长期参考图片。RefPicSetLtFoll可包含不用于由当前图片参考的长期参考图片。视频编码器20可在切片标头中包含视频解码器30可用以确定RefPicSetStCurrBefore、RefPicSetStCurrAfter、RefPicSetFollBefore、RefPicSetLtCurr及RefPicSetLtFoll的语法元素(例如,delta_poc_s0_minus1语法元素、used_by_curr_pic_s0_flag语法元素、delta_poc_s1_minus1语法元素、used_by_curr_pic_s1_flag语法元素、delta_poc_lsb_lt语法元素等)。
如上文所指示,在视频译码器(例如,视频编码器20或视频解码器30)开始译码图片的当前切片时,视频译码器可初始化第一参考图片列表,所述第一参考图片列表可被称为“列表0”或“RefPicList0”。此外,如果当前切片为B切片,那么视频译码器可初始化第二参考图片列表,所述第二参考图片列表可被称为“列表1”或“RefPicList1”。参考图片列表初始化可为基于参考图片的图片次序计数(“POC”)值将参考图片存储器(即,经解码的图片缓冲器)中的参考图片放入到列表中的显式机制。图片的POC值可与图片的显示次序对准。
举例来说,为了产生RefPicList0,视频译码器(例如,视频编码器或视频解码器)可产生RefPicList0的初始版本。在RefPicList0的初始版本中,首先列出RefPicSetStCurrBefore中的参考图片,后跟着RefPicSetStCurrAfter中的参考图片,后跟着RefPicSetLtCurr中的参考图片(如果可用的话)。在RefPicList0的初始版本中,首先按到当前图片的图片次序计数(POC)距离的升序将具有较早输出次序的短期图片(即,RefPicSetStCurrBefore中的参考图片)插入到RefPicList0中,接着按到当前图片的POC距离的升序将具有较晚输出次序的短期图片(即,RefPicSetStCurrAfter中的参考图片)插入到RefPicList0中,且最后在结束时插入长期图片(即,RefPicSetLtCurr中的参考图片)。POC距离为图片的POC值之间的差。POC为与每一图片相关联的变量,所述变量指示按输出次序相关联的图片相对于相同经译码视频序列中的其它图片的输出次序位置的位置。
类似地,为了产生RefPicList1,视频译码器可产生RefPicList1的初始版本。在RefPicList1的初始版本中,首先列出RefPicSetStCurrAfter中的参考图片,后跟着RefPictSetStCurrBefore中的参考图片,后跟着RefPicSetLtCurr中的参考图片。在RefPicList1的初始版本中,首先按到当前图片的图片次序计数(POC)距离的升序将具有较早输出次序的短期图片(即,RefPicSetStCurrAfter中的参考图片)插入到RefPicList1中,接着按到当前图片的POC距离的升序将具有较晚输出次序的短期图片(即,RefPicSetStCurrBefore中的参考图片)插入到RefPicList1中,且最后在结束时插入长期图片(即,RefPicSetLtCurr中的参考图片)。以此方式,参考图片列表初始化基于以下三个RPS子集产生默认列表0及列表1(如果切片为B切片):RefPicSetStCurrBefore、RefPicSetStCurrAfter及RefPicSetLtCurr。
在视频译码器已初始化参考图片列表(例如,RefPicList0或RefPicList1)之后,视频译码器可修改所述参考图片列表中的参考图片的次序。换句话说,视频译码器可执行参考图片列表修改(RPLM)过程。举例来说,通常B图片的第一或第二参考图片列表的参考图片列表建构包含两个步骤:参考图片列表初始化及参考图片列表重排(修改)。
视频译码器可以任何次序修改参考图片的次序,包含其中一个特定参考图片可出现在参考图片列表中的一个以上位置中的情况。举例来说,参考图片列表重排机制可将在参考图片列表初始化期间被放入参考图片列表中的图片的位置修改为任何新的位置。此外,参考图片列表重排机制可将参考图片存储器中的任何参考图片放入参考图片列表的任何位置中,即使参考图片不在参考图片列表的初始版本中。在参考图片列表重排(修改)之后,可将一些图片放入参考图片列表中的最远位置中。然而,如果参考图片的位置超过列表的作用中参考图片的数目,那么视频译码器不会将参考图片视为参考图片列表的最终版本的项。视频编码器20可在切片标头中用信号发出每一参考图片列表的作用中参考图片的数目。在视频译码器建构参考图片列表(例如,RefPicList0或RefPicList1)之后,到参考图片列表的参考索引可用以识别包含于参考图片列表中的任何参考图片。在本发明中,识别RefPicList0中的位置的参考索引可被称为RefPicList0参考索引,且识别RefPicList1中的位置的参考索引可被称为RefPicList1参考索引。
视频编码器20可以使用合并模式或高级运动向量预测(AMVP)模式用信号发出PU的运动信息。换句话说,在HEVC中,存在用于预测运动参数的两个模式,一个是合并模式且另一个是AMVP。PU的运动信息可以包含PU的运动向量以及PU的参考索引。当视频编码器20使用合并模式用信号发出当前PU的运动信息时,视频编码器20产生合并候选者列表。换句话说,视频编码器20可执行合并候选者列表建构过程。合并候选者列表包含一组合并候选者。合并候选者列表可包含指示在空间上或在时间上与当前PU相邻的PU的运动信息的合并候选者。也就是说,在合并模式中,建构运动参数(例如,参考索引、运动向量等)的候选者列表,其中候选者可来自空间及时间相邻块。
此外,在合并模式中,视频编码器20可从所述合并候选者列表选择一合并候选者且可使用由选定的合并候选者指示的运动信息作为当前PU的运动信息。视频编码器20可用信号发出选定的合并候选者在合并候选者列表中的位置。举例来说,视频编码器20可通过将索引发射到合并候选者列表中而用信号发出选定的运动向量参数。视频解码器30可从位流获得进入合并候选者列表的索引(即,候选者列表索引)。另外,视频解码器30可产生相同合并候选者列表,且可基于选定的合并候选者的位置的指示确定选定的合并候选者。接着,视频解码器30可以使用选定的合并候选者的运动信息以产生用于当前PU的预测性块。也就是说,视频解码器30可至少部分基于候选者列表索引确定合并候选者列表中的选定的合并候选者,其中选定的合并候选者指定当前PU的运动向量。以此方式,在解码器侧处,一旦索引被解码,索引所指向的对应块的所有运动参数将由当前PU继承。
跳过模式类似于合并模式。在跳过模式中,视频编码器20及视频解码器30以视频编码器20及视频解码器30在合并模式中使用合并候选者列表相同的方式产生并使用合并候选者列表。然而,在视频编码器20使用跳过模式用信号发出当前PU的运动信息时,视频编码器20不用信号发出用于当前PU的任何残余数据。因此,视频解码器30可使用由合并候选者列表中的选定的合并候选者的运动信息指示的参考块作为PU的预测性块。
AMVP模式类似于合并模式,类似之处在于视频编码器20产生候选者列表并且从候选者列表选择候选者。AMVP候选者列表中的候选者可被称为运动向量预测子(MVP)候选者。然而,当视频编码器20使用AMVP模式用信号发出当前PU的运动信息时,除用信号发出候选者列表中的选定的MVP候选者的位置之外,视频编码器20可以用信号发出当前PU的运动向量差(MVD)以及参考索引。当前PU的MVD可指示当前PU的运动向量与从AMVP候选者列表选定的候选者的运动向量之间的差。在单向预测中,视频编码器20可以用信号发出当前PU的一个MVD以及一个参考索引。在中,视频编码器20可用信号发出当前PU的两个MVD及两个参考索引。
此外,在使用AMVP模式用信号发出当前PU的运动信息时,视频编码器30可从所述位流获得当前PU的MVD及候选者列表索引。视频解码器30可产生相同的AMVP候选者列表且可基于AMVP候选者列表中的选定的MVP候选者的位置的指示来确定选定的候选者。视频解码器30可通过将MVD添加到由选定的MVP候选者指示的运动向量来恢复当前PU的运动向量。也就是说,视频解码器30可至少部分基于由选定的MVP候选者指示的运动向量及MVD来确定当前PU的运动向量。视频解码器30接着可使用当前PU的所恢复的一或多个运动向量来产生当前PU的预测性块。
如上文所指示,用于合并模式或AMVP的候选者列表可包含基于在空间上与当前PU相邻的PU的候选者。本发明可将此类PU称为在空间上相邻的PU或空间运动向量相邻者。图2是说明相对于当前PU 40的实例空间运动向量相邻者的概念图。也就是说,在图2中描绘PU 40与PU 40的在空间上相邻的PU之间的实例关系。在图2的实例中,在空间上相邻的PU可为覆盖指示为A0、A1、B0、B1及B2的位置的PU。在PU的预测块包含一位置时,PU可覆盖所述位置。
关于图2的实例,明度位置(xP,yP)可相对于当前图片的左上方明度样本指定PU 40的左上方明度样本。此外,变量nPSW及nPSH可分别表示PU 40的明度样本中的宽度及高度。相对于当前图片的左上方样本的PU N的左上方明度样本是(xN,yN),其中N表示覆盖位置A0、A1、B0、B1或B2的PU。对于覆盖位置A0、A1、B0、B1或B2的PU,可分别将(xN,yN)定义为(xP-1,yP+nPSH)、(xP-1,yP+nPSH-1)、(xP+nPSW,yP-1)、(xP+nPSW-1,yP-1)或(xP-1,yP-1)。
如上文所指示,合并候选者列表或AMVP候选者列表可包含指定在时间上与当前PU相邻的PU的运动信息的候选者。本发明可使用术语“时间合并候选者”来指代指定在时间上与当前PU相邻的PU的运动信息的合并候选者。类似地,本发明可使用术语“时间MVP候选者”来指代指定在时间上与当前PU相邻的PU的运动信息的在AMVP候选者列表中的MVP候选者。本发明可使用术语“时间运动向量预测子”或“TMVP”来指代在时间上与当前PU相邻且其运动信息由时间合并候选者或时间MVP候选者指定的PU。
为了确定TMVP,视频译码器首先可识别包含与当前PU位于相同位置的PU的参考图片。换句话说,视频译码器可识别相同位置图片。如果当前图片的当前切片是B切片(即,允许包含经双向帧间预测的PU的切片),那么视频编码器20可在切片标头中用信号发出指示相同位置图片是否来自RefPicList0或RefPicList1的语法元素(例如,collocated_from_l0_flag)。换句话说,如果当前切片(即,含有当前PU的切片)在B切片中,且当前切片的切片标头中的collocated_from_l0_flag语法元素指示相同位置参考图片在RefPicList1中,那么相同位置参考图片可为在由切片标头的collocated_ref_idx语法元素指示的位置处的RefPicList1中的参考图片。否则,如果当前切片为P切片或当前切片为B切片,且当前切片的切片标头中的collocated_from_l0_flag语法元素指示相同位置参考图片在RefPicList0中,那么相同位置参考图片可为在由切片标头的collocated_ref_idx语法元素指示的位置处的RefPicList0中的参考图片。在视频译码器识别参考图片列表之后,视频译码器可使用另一语法元素(例如,collocated_ref_idx),可在切片标头中用信号发出所述另一语法元素,以识别所识别的参考图片列表中的图片(即,相同位置图片)。
视频译码器可通过检查相同位置图片来识别相同位置PU。使用含有此PU的CU的右下方PU的运动或含有相同位置PU的CU的中心PU内的右下方PU的运动。含有相同位置PU的CU的右下方PU可为覆盖直接在所述PU的预测块的右下方样本的右下方的位置的PU。换句话说,TMVP可为在相同位置图片中且覆盖与当前PU的右下角位于相同位置的位置的PU,或TMVP可为在相同位置图片中且覆盖与当前PU的中心位于相同位置的位置的PU。因此,相同位置PU可为覆盖相同位置图片的相同位置区的中心块的PU,或覆盖相同位置图片的相同位置区的右下方块的PU,所述相同位置区与当前PU位于相同位置。
视频译码器可使用由上文过程识别的运动向量(即,识别的TMVP的运动向量)来产生用于合并模式的合并候选者或用于AMVP模式的MVP候选者。此外,在识别的TMVP的运动向量用以产生合并候选者或MVP候选者时,视频译码器可基于当前图片的时间位置(由POC值反映)及相同位置图片的时间位置按比例缩放运动向量。举例来说,与在当前图片及相同位置图片的POC值之间的差较小时相比,视频译码器可在当前图片及相同位置图片的POC值之间的差较大时使运动向量的量值增加较大的量。
在HEVC中,SPS可包含sps_temporal_mvp_enable_flag语法元素,且在sps_temporal_mvp_enable_flag语法元素等于1时,切片标头可包含pic_temporal_mvp_enable_flag语法元素。在对于特定图片来说,封装切片标头的NAL单元的pic_temporal_mvp_enable_flag语法元素及temporal_id语法元素两者等于0时,来自按解码次序在特定图片之前的图片的运动向量不可在解码特定图片或按解码次序在特定图片之后的图片时用作TMVP。NAL单元的temporal_id语法元素可指定NAL单元的时间识别符。
在多视图译码中,可存在来自不同视角的同一场景的多个视图。术语“存取单元”用于指对应于相同时间实例的图片集合。因此,视频数据可概念化为随时间过去而出现的一系列存取单元。“视图分量”可为单个存取单元中的视图的经译码表示。在本发明中,“视图”可指与相同视图识别符相关联的一连串视图分量。
图3是说明实例多视图解码次序的概念图。多视图解码次序也可被称作位流次序。在图3的实例中,每一正方形对应于视图分量。正方形的列对应于存取单元。每一存取单元可经定义为含有时间实例的所有视图的经译码图片。正方形的行对应于视图。在图3的实例中,存取单元被标记为T0...T8,且视图被标记为S0...S7。因为存取单元的每一视图分量是在下一存取单元的任何视图分量之前解码的,所以图3的解码次序可被称为时间优先译码。存取单元的解码次序可不等同于输出或显示次序。
多视图译码支持视图间预测。视图间预测类似于用于H.264/AVC、HEVC或其它视频译码标准中的帧间预测,且可使用相同的语法元素。然而,在视频译码器对当前视频单元(例如宏块)执行视图间预测时,视频译码器可使用在与当前视频单元相同的存取单元中但在不同视图中的图片作为参考图片。相对比地,常规的帧间预测仅使用不同存取单元中的图片作为参考图片。
图4是说明用于多视图译码的实例预测结构的概念图。图4的多视图预测结构包含时间及视图间预测。在图4的实例中,每一正方形对应于视图分量。标记为“I”的正方形为经帧内预测视图分量。标记为“P”的正方形为经单向帧间预测的视图分量。标记为“B”及“b”的正方形为经双向帧间预测的视图分量。标记为“b”的正方形可使用标记为“B”的正方形作为参考图片。从第一正方形指向第二正方形的箭头指示第一正方形在帧间预测中可用作第二正方形的参考图片。如由图4中的垂直箭头所指示,相同存取单元的不同视图中的视图分量可用作参考图片。使用存取单元的一个视图分量作为相同存取单元的另一视图分量的参考图片可被称为视图间预测。
在H.264/AVC的MVC扩展中,由视差运动补偿支持视图间预测,所述视差运动补偿使用H.264/AVC运动补偿的语法,但允许将不同视图中的图片用作参考图片。也可由H.264/AVC的MVC扩展支持两个视图的译码。H.264/AVC的MVC扩展的优势中的一者为MVC编码器可将两个以上视图取作3D视频输入,且MVC解码器可解码此多视图表示。因此,具有MVC解码器的任何渲染器可期望具有两个以上视图的3D视频内容。
在H.264/AVC的MVC扩展中,在相同存取单元(即,具有相同时间实例)中的图片当中允许视图间预测。在译码非基础视图中的图片时,如果图片在不同视图中但在与视频译码器当前在译码的图片相同的时间实例(即存取单元)内,那么视频译码器(例如视频编码器20或视频解码器30)可将图片添加到参考图片列表(例如,RefPicList0或RefPicList1)中。类似其它帧间预测参考图片,视频译码器可在参考图片列表的任何位置处插入视图间预测参考图片。如果视频解码器(例如,视频解码器30)可解码视图中的图片而不参考任何其它视图中的图片,那么视图可被称为“基础视图”。
3D-HEVC提供同一场景的来自不同视角的多个视图。3D-HEVC的标准化工作的一部分包含基于HEVC的多视图视频编解码器的标准化。在基于HEVC的3DV(即,3D-HEVC)中,启用基于来自不同视图的经重建构视图分量的视图间预测。为了进一步改进译码效率,在用于3D-HEVC的参考软件的一些版本中已采纳两个新的译码工具(亦即,视图间运动预测及视图间残余预测)。因此,与H.264/AVC中的MVC一样,3D-HEVC支持视图间运动预测。
在3D-HEVC中,视图间运动预测类似于用于标准HEVC中的运动补偿,且可利用相同或类似的语法元素。合并模式及AMVP模式为实例运动预测技术。在视频译码器对PU执行视图间运动预测时,视频译码器可使用在与PU相同的存取单元中但在不同视图中的图片作为运动信息的源。相对比地,常规运动补偿仅使用不同存取单元中的图片作为参考图片。因此,在3D-HEVC中,相依视图中的块的运动参数可基于相同存取单元的其它视图中的已经译码的运动参数进行预测或推断。
视频译码器可在使用合并模式或AMVP模式用信号发出当前PU的运动信息时产生候选者列表(例如,合并候选者列表或AMVP候选者列表)。为了实施3D-HEVC中的视图间运动预测,候选者列表可包含合并候选者清单及AMVP候选者清单中的经视图间预测的运动向量候选者。视频译码器可以与候选者列表中的其它候选者相同的方式使用经视图间预测的运动向量候选者。经视图间预测的运动向量候选者指定视差参考图片的PU(即,参考PU)的运动信息。视差参考图片可在与当前PU相同的存取单元中,但在不同于当前PU的视图中。为了确定视差参考图片中的参考PU,视频译码器可执行视差向量建构过程以确定当前PU的视差向量。当前PU的视差向量可指示当前PU的预测块与视差参考图片内的位置之间的水平空间移位。参考PU可为覆盖由视差向量指示的位置的视差参考图片的PU。
此外,在3D-HEVC中,如在基本HEVC说明书中,合并候选者列表可包含时间合并候选者。同样,在3D-HEVC中,如在基本HEVC说明书中,AMVP候选者列表可包含时间MVP候选者。如在基本HEVC说明书中,时间合并候选者及时间MVP候选者可指定TMVP的运动向量。在3D-HEVC中,时间合并候选者及时间MVP候选者可总是具有等于0的参考索引。本发明可将由时间合并候选者的参考索引指示的参考图片称作用于时间合并候选者的目标参考图片。类似地,本发明可将由时间MVP候选者的参考索引指示的参考图片称作用于时间MVP候选者的目标参考图片。
由TMVP的参考索引指示的参考图片及用于时间合并候选者的目标参考图片可属于不同参考图片类型。因此,相同位置图片中的TMVP所指向的参考图片及用于时间合并候选者的目标参考图片(在HEVC中,其参考索引总是等于0)的参考图片类型可不同。举例来说,参考图片中的一者可为视图间参考图片(类型设定成视差),且其它参考图片可为时间参考图片(类型设定成时间)。本发明可使用术语“视差参考图片”来表示相关联于与当前图片相同的时间实例但与不同于当前图片的视图相关联的参考图片。此外,本发明可使用术语“时间参考图片”来表示相关联于与当前图片相同的视图但与不同于当前图片的不同时间实例相关联的参考图片。
在较具体实例中,TMVP的参考索引所指向的参考图片可为时间参考图片,且用于时间合并候选者的目标参考图片可为视差参考图片,或反过来。在用于3D-HEVC的测试模型软件的一些版本(即,3D-HTM软件)中,视频译码器可将用于时间合并候选者的目标参考图片设定为0或等于左侧相邻PU的参考索引的值。因此,用于时间合并候选者的参考索引可不等于0。
如上文所提及,视频编码器20可使用跳过模式或合并模式(即,跳过/合并模式)用信号发出PU的运动信息。在跳过/合并模式中,视频译码器(例如,视频编码器20或视频解码器30)可产生用于当前PU的MVP候选者的列表。此外,在MV-HEVC及3D-HEVC中,视频译码器可包含确定当前PU的视差向量,如本发明中其它地方所描述。基于视差向量,视频译码器可确定经视图间预测的运动向量。如果此类经视图间预测的运动向量为可用的,那么视频译码器可将经视图间预测的运动向量添加到合并候选者列表作为新的运动向量候选者(即,合并候选者)。此经视图间预测的运动向量(如果可用的话)为时间运动向量。
为了确定供跳过/合并模式使用的经视图间预测的运动向量,视频译码器可使用当前PU的视差向量来定位与当前PU相同的存取单元的参考视图中的当前PU/CU的对应块。此外,如果不帧内译码对应块,不视图间预测对应块,且对应块的参考块具有等于当前PU的参考图片列表(即,当前切片的参考图片列表)中的参考图片的值的POC值,那么视频译码器可基于POC值转换对应块的参考索引。也就是说,视频译码器可确定具有与由对应块的参考索引指示的参考图片相同的POC值的参考图片的在与当前PU相关联的参考图片列表中的位置。视频译码器可设定经视图间预测的运动向量候选者的参考索引以指示所确定的位置。
在转换对应块的参考索引之后,视频译码器接着可在合并候选者列表中包含对应块的运动信息作为经视图间预测的运动向量。对应块的运动信息可包含对应块的预测方向、参考索引及运动向量。
图5是说明经视图间预测的运动向量候选者的实例导出过程的概念图。在图5的实例中,视图V0包含图片50、52、54及56。视图V1包含图片58、60、62及64。视频译码器可为当前译码图片62,因此图片62可被称为“当前图片62”。当前图片62包含当前PU 66。当前PU 66可在当前图片62的当前切片中。图片58可在用于当前图片62的当前切片的RefPicList0(即,List0)的位置0(即,Ref0)处。图片62可在RefPicList1(即,List1)的位置0(即,Ref0)处,且图片64可在RefPicList1的位置1处。
此外,在图5的实例中,视频译码器可确定用于当前PU 66的视差向量。视频译码器接着可至少部分基于用于当前PU 66的视差向量确定图片52中的对应块68。图片52及当前图片62与相同时间实例(即,时间实例T1)相关联。在图5的实例中,双向帧间预测对应块68。因此,对应块68具有两个运动向量:RefPicList0运动向量70及RefPicList1运动向量72。RefPicList0运动向量70指示图片50中的位置。RefPicList1运动向量72指示图片56中的位置。因此,在当前PU 66的合并候选者列表或AMVP候选者列表中的经视图间预测的运动向量候选者可指定RefPicList0运动向量74及RefPicList1运动向量76。RefPicList0运动向量74可具有等于RefPicList0运动向量70的水平分量和垂直分量的水平分量和垂直分量。RefPicList1运动向量76可具有等于RefPicList1运动向量72的水平分量和垂直分量的水平分量和垂直分量。此外,经视图间预测的运动向量候选者可指定指示用于图片58的当前PU的RefPicList0中的位置的RefPicList0参考索引,因为图片58具有与图片50(即,由对应块68的RefPicList0参考索引指示的图片)相同的POC值。经视图间预测的运动向量候选者可指定指示用于图片64的当前PU的RefPicList1中的位置的RefPicList1参考索引,因为图片64具有与图片56(即,由对应块68的RefPicList1参考索引指示的图片)相同的POC值。
如果帧内预测由当前PU的视差向量指示的对应PU,不帧间预测对应PU或对应PU的参考索引参考具有不匹配与当前PU相关联的对应参考图片列表中的任何参考图片的POC值的POC值的参考图片,那么视频译码器可确定经视图间预测的运动向量候选者不可用,视频译码器可确定经视图间预测的运动向量候选者不可用。如果视频译码器确定经视图间预测的运动向量候选者不可用,那么视频译码器可将当前PU的视差向量转换成视图间视差运动向量。视频译码器接着可在其中视频译码器将添加经视图间预测的运动向量的位置处将视图间视差运动向量添加到合并候选者列表。
在HEVC标准中,对于预测单元(PU)来说存在分别称为合并(跳过认为是合并的特殊状况)及高级运动向量预测(AMVP)模式的两个帧间预测模式。在AMVP或合并模式中,对于多个运动向量预测子维持运动向量(MV)候选者列表。通过从MV候选者列表中选取一个候选者而产生当前PU的运动向量以及在合并模式中的参考索引。
MV候选者列表含有所述合并模式最高5个候选者及用于AMVP模式的仅2个候选者。合并候选者可含有对应于参考图片列表(列表0及列表1)及参考索引两者的运动向量。如果由合并索引识别合并候选者,那么确定用于预测当前块的参考图片以及相关联的运动向量。然而,在来自列表0或列表1的每一可能预测方向的AMVP模式下,需要将参考索引以及MVP索引明确地用信号发出到MV候选者列表,因为AMVP候选者仅含有运动向量。在AMVP模式中,可进一步优化所预测的运动向量。
对于这些两个帧间译码模式,用于当前PU的参考索引在用AMVP姨妈的情况下被明确地用信号发出。然而,用于当前PU的参考索引在用合并译码的情况下被导出为合并候选者的部分。为简单起见,在AMVP模式中用信号发出或经导出为合并候选者列表的部分的参考索引被称作目标参考索引。在HEVC中,用于TMVP合并候选者的目标参考索引可总是被设定成0。
在AMVP模式中,如果目标参考索引对应于时间运动向量,那么视频译码器可使用当前PU的视差向量来确定不同视图中的对应块。此外,如果目标参考索引对应于时间运动向量,那么视频译码器可通过检查对应块中的运动向量找到经视图间预测的运动向量。换句话说,如果目标参考索引对应于时间运动向量,那么通过检查由视差向量定位的当前PU的对应块中的运动向量而找到经视图间预测的运动向量。
此外,在AMVP模式中,如果目标参考索引对应于视差运动向量,那么视频译码器不导出经视图间预测的运动向量。而是,视频译码器可将当前PU的视差向量转换成视图间视差运动向量。视频译码器可包含AMVP候选者列表中的视图间视差运动向量。因此,如果经视图间预测的运动向量不可用,那么将视差向量转换成视图间视差运动向量,所述视图间视差运动向量在其可用时被添加到相同位置中的AMVP或合并候选者列表中,作为经视图间预测的运动向量。
在跳过/合并模式中,视频译码器可总是在合并候选者列表中的所有空间及时间合并候选者之前插入经视图间预测的运动向量(如果可用的话)。如果经视图间预测的运动向量不可用,那么视频译码器可在相同位置中(即,在合并候选者列表中的所有空间及时间合并候选者之前)插入视图间视差运动向量(如果可用的话)。在3D-HEVC的测试模型的一些版本(即,3D-HTM软件)中,如果经视图间预测的运动向量或视图间视差运动向量不同于AMVP候选者列表中的所有空间候选者,那么经视图间预测的运动向量或视图间视差运动向量跟随AMVP候选者列表中的所有有效空间候选者。
可实施H.264/AVC的MVC扩展以使得H.264/AVC的MVC扩展实现“仅HLS”要求。仅HLS要求保证仅存在H.264/AVC的MVC扩展中的高层级语法(HLS)改变。因此,并未重新设计H.264/AVC中的宏块层级中的模块。而是,可在H.264/AVC的MVC扩展中充分重用H.264/AVC中的宏块层级中的每一模块。如果多回路解码是可接受的,那么有可能MV-HEVC、3D-HEVC及SHEVC可满足“仅HLS”要求。举例来说,在MV-HEVC中,应保证其仅存在HLS改变,以使得可不需要重新设计HEVC中的CU/PU层级中的模块,且所述模块可充分重用于MV-HEVC。在3D-HEVC中,可包含及支持包含纹理及深度视图两者的HEVC中的CU/PU层级中的工具的新的译码工具。
在一些情况下,为了实现视图间预测,最小及基本HLS改变是出于以下目的:
●图片识别:参考图片列表建构及标记需要能够识别特定视图中的图片。
HLS改变不足以满足H.264/MVC中的“仅HLS”要求,进行其它约束、假设以使得低层级译码模块从未遇到例如处理零运动相关按比例缩放的情形。此些约束、修改及假设可包含:
●如果相同位置图片为视图间(仅)参考图片,那么停用时间直接模式。
●将视图间(仅)参考图片视为非短期的:与空间直接相关。视图间(仅)参考图片可为用于视图间预测的当前图片的参考图片列表中的参考图片。
●停用内隐加权预测。
为了满足可能HEVC扩展中所需的“仅HLS”,可能HEVC扩展中的修改可仅在高层级中。因此,不对切片标头下的语法元素进行修改,且对于可能HEVC扩展不存在CU层级解码过程改变。举例来说,HEVC扩展规范的运动向量预测应恰好与HEVC基本规范中的运动向量预测相同。HLS改变可为扩展规范的规范性解码器改变,然而,从视图的基本规范点来看,此些改变未必要为已知的,且可具有信息性。
为了启用例如有效视图间预测等功能性,可需要HEVC扩展及基本规范中的两种修改。基本规范改变(此举不会影响基本HEVC解码器的典型解码过程或译码效率,但目标在于启用扩展规范中的功能性)被称作挂钩。在大多数状况下,“仅HLS”要求必须通过基本规范中的挂钩及扩展规范中的HLS改变两者来满足。如果并未良好地定义基本规范中的挂钩,那么某些所要功能性可不在扩展规范中启用或可需要扩展规范提供相当大的修改。在仅HLS SVC中,可将可能在向上取样及/或滤波之后的基层表示放入到当前层的当前图片的参考图片列表中。此图片可被称作层间参考图片。
在一些情况下,本发明可将运动向量描述为由参考索引及运动向量自身的x及y值两者组成。如上文所指示,参考索引可为到参考图片的指针。等效地,本发明可将对应于参考索引的参考图片称作运动向量所参考的参考图片。如果运动向量参考相同视图中的参考图片,那么运动向量可被称作时间运动向量。如果运动向量参考不同视图的参考图片,那么运动向量可被称作视差运动向量。
时间运动向量可为短期时间运动向量(简单地说,短期运动向量)或长期时间运动向量(简单地说,长期运动向量)。举例来说,如果运动向量参考短期参考图片,那么运动向量为短期的。类似地,如果运动向量参考长期参考图片,那么运动向量为长期的。除非以其它方式提到,视差运动向量及长期运动向量遍及本发明属于不同类别。本发明可将短期及长期参考图片共同地称作时间参考图片。类似地,视差运动向量可由SVC的上下文中的层间运动向量替换。本发明可使用术语“层间运动向量”来指代不同层的层表示(可能向上取样及经滤波)。
陈等人的“AHG10:用于基于长期参考图片的HEVC多视图/3DV扩展的运动相关挂钩(AHG10:Motion Related Hooks for HEVC Multiview/3DV Extension Based onLong-Term Reference Pictures)”(ITU-T SG16 WP3及ISO/IEC JTC1/SC29/WG11的视频译码联合合作小组(JCT-VC),第10次会议,瑞典斯德哥尔摩,2012年7月,文件JCTVC-J0121(下文中为“文件JCTVC-J0121”))提出了对应于视图间(仅)参考图片的运动向量在被视为长期时不用以在合并或AMVP期间预测时间运动向量,包含在使用TMVP候选者时的情形。在JCTVC-J0121及HEVC基本规范中,不进行预测意味着运动向量被认为是不可用的,且可不用以被放入到合并或AMVP候选者列表中。
陈等人的“AHG10:关于用于HEVC扩展的视频参数集(AHG10:On Video ParameterSet for HEVC Extensions)”(ITU-T SG16 WP3及ISO/IEC JTC1/SC29/WG11的视频译码联合合作小组(JCT-VC),第10次会议,瑞典斯德哥尔摩,2012年7月,文件JCTVC-J0124(下文中为“文件JCTVC-J0124”))提出各种方法。文件JCTVC-J0124中描述的方法中的一者更为先进,其方式为视图间运动向量可由视图索引或层索引识别。结果,进一步约束运动向量的预测以使得仅在相同视图内部的时间运动向量或参考相同视图的视图间运动向量内启用运动向量的预测。此外,甚至在相同视图内,约束预测以使得仅在属于长期或短期的相同类别的相同视图内启用预测。另外,将视图间参考图片标记为不同类型的参考图片(非时间参考图片)。此外,文件JCTVC-J0124定义函数AddPicId(),以传回额外图片识别作为高层级解码过程的部分。在一些实例中,AddPicId()的传回值为多视图上下文中的视图次序索引。视图次序索引指示基于与视图相关联的相机位置的视图的排序中的视图的位置。在其它实例中,AddPicId()的传回值为通用层ID(layer_id),例如,reserved_one_5bits的值减1,其中reserved_one_5bits如HEVC工作草案7中所指定。
陈等人的“AHG12:用于HEVC多视图/3DV扩展中的时间运动向量预测及加权预测的挂钩(AHG 12:Hooks for Temporal Motion Vector Prediction and Weighted Prediction inHEVC Multiview/3DV Extension)”(ITU-T SG16 WP3及ISO/IEC JTC1/SC29/WG11的视频译码联合合作小组(JCT-VC),第9次会议,瑞士日内瓦,2012年4月到5月,文件JCTVC-I0353(下文中为“文件JCTVC-I0353”))提出了HEVC基本规范中所指示(例如,用于视图间(仅)参考)的新类型的运动向量。如果仅存在一个视图间参考,那么此状况等效于上文在JCTVC-J0124中所提及的解决方案。然而,在多个视图间参考是可能的时,不可能分辨两个视图间运动向量是否参考相同视图。
用于使用TMVP的HEVC工作草案7中所描述的系统可存在若干问题。举例来说,在使用合并模式用信号发出当前PU的运动信息时,视频译码器可产生指定TMVP的运动信息的时间合并候选者(即,不同于当前PU的存取单元中的参考图片的相同位置PU)。在HEVC工作草案7中,时间合并候选者的参考索引总是设定为等于0。换句话说,时间合并候选者的参考索引总是为RefPicList0或RefPicList1中的第一参考图片。因此,在合并模式中,HEVC工作草案7仅允许来自TMVP的合并候选者的参考索引为零。
如果TMVP指示除当前PU的RefPicList0或RefPicList1中的第一参考图片之外的运动向量的参考图片,那么视频译码器可基于与当前PU相关联的RefPicList0或RefPicList1中的第一参考图片与由相同位置PU针对运动向量指示的参考图片之间的时间距离按比例缩放运动向量。也就是说,如果运动向量对应于不与RefPicListX(其中X为0或1)中的第一参考图片相同的参考图片,那么基于时间距离按比例缩放运动向量。
然而,如果TMVP的RefPicListX(其中X为0或1)运动向量为视差运动向量(即,指示在与含有TMVP的图片相同的存取单元中但在不同于含有TMVP的图片的视图中的图片中的位置的运动向量),且在当前PU的RefPicListX的位置0处的参考图片为时间参考图片(即,不同于当前存取单元的存取单元中的图片),那么视频译码器不会按比例缩放视差运动向量。而是,视频译码器可使用视差运动向量如同视差运动向量为时间运动向量一样。如果TMVP的RefPicListX运动向量为时间运动向量(即,指示在不同于含有TMVP的图片的存取单元中的图片中的位置的运动向量),且在当前PU的RefPicListX的位置0处的参考图片为视差参考图片(即,在不同视图中但在与当前图片相同的存取单元中的图片),那么视频译码器不会按比例缩放时间运动向量。而是,视频译码器可使用时间运动向量作为视差运动向量。
在文件JCTVC-J0124中所提出的解决方案中,仍将TMVP合并候选者(即,来自TMVP的合并候选者)的参考索引设定成0。然而,在出现上文的两个情形中的任一者时(即,在参考图片列表的位置0处的参考图片为时间参考图片,且TMVP的运动向量为视差运动向量,或在参考图片列表的位置0处的参考图片为视差参考图片,且TMVP的运动向量为时间运动向量),视频译码器可将时间合并候选者视为不可用的。
图6是说明合并模式中的时间运动向量与视差运动向量之间的预测的概念图。如图6的实例中所说明,视图1包含图片80、81及82。视图2包含图片83、84及85。图片80及83具有等于0的POC值,图片81及84具有等于1的POC值,且图片82及85具有等于2的POC值。视频译码器当前在译码图片84。也就是说,图片84为当前图片。箭头86表示时间运动向量(即,指示在与当前图片相同的视图中但在不同时间实例中的图片中的位置的运动向量)。此外,在图6的实例中,图片85可为用于图片84的当前PU的相同位置图片。图片85中的TMVP具有视差运动向量(即,指示在不同于图片85的视图中的图片中的位置的运动向量)。在图6的实例中,TMVP的视差向量指示图片82中的位置。
本发明的技术可解决上文针对合并模式所描述的问题中的一或多者。根据本发明的第一实例技术,在具有等于0的参考索引的RefPicListX中的图片的参考图片类型及由TMVP的运动向量参考的图片的参考图片类型相同时,视频译码器可将时间合并候选者的RefPicListX的最终参考索引设定为0。举例来说,如果TMVP的RefPicListX运动向量指示视差参考图片中的位置,且当前PU的RefPicListX中的第一参考图片为视差参考图片,那么视频译码器可将时间合并候选者的RefPicListX参考索引设定为0。在另一实例中,如果TMVP的RefPicListX运动向量指示时间参考图片中的位置,且当前PU的RefPicListX中的第一参考图片为时间参考图片,那么视频译码器可将时间合并候选者的RefPicListX参考索引设定为0。
否则,在本发明的第一实例技术中,视频译码器可如下改变时间合并候选者的RefPicListX的最终参考索引。如果RefPicListX[0]的参考图片类型(即,当前PU的RefPicListX中的第一参考图片)为时间,且TMVP的RefPicListX运动向量指示视差参考图片,那么视频译码器可将RefPicListX参考索引设定为属于视差的参考图片类型的当前PU的RefPicListX中的第一项。换句话说,如果当前PU的RefPicListX中的第一参考图片为时间参考图片,那么视频译码器可设定时间合并候选者的RefPicListX参考索引以使得时间合并候选者的RefPicListX参考索引指示当前PU的RefPicListX中的第一时间参考图片。举例来说,如果当前PU的RefPicListX中的第一时间参考图片为当前PU的RefPicListX中的第二参考图片,那么视频译码器可将时间合并候选者的RefPicListX参考索引设定为1(即,2-1)。
此外,在本发明的第一实例技术中,如果RefPicListX[0]的参考图片类型为视差,且TMVP的RefPicListX运动向量指示时间参考图片,那么视频译码器可将参考索引设定为属于时间的参考图片类型的RefPicListX中的第一项。换句话说,如果当前PU的RefPicListX中的第一参考图片为时间参考图片,那么视频译码器可设定时间合并候选者的RefPicListX参考索引以使得时间合并候选者的RefPicListX参考索引指示当前PU的RefPicListX中的第一时间参考图片。举例来说,如果当前PU的RefPicListX中的第一时间参考图片为当前PU的RefPicListX中的第三参考图片,那么视频译码器可将时间合并候选者的RefPicListX参考索引设定为2(即,3-1)。
以此方式,在第一参考图片及第二参考图片属于不同参考图片类型时,视频编码器20可将时间合并候选者的参考索引设定为非零值。第一参考图片可为与当前视频单元(例如,PU)相关联的参考图片列表中的初始参考图片。第二参考图片可由用于当前视频单元的TMVP的参考索引指示。时间合并候选者的参考索引指示与当前视频单元相关联的参考图片列表中的位置。此外,视频编码器20可从包含时间合并候选者的合并候选者列表中的多个合并候选者当中确定选定的合并候选者。视频编码器20可产生包含识别合并候选者列表中的选定的合并候选者的数据(例如,merge_idx语法元素)的位流。
类似地,在第一参考图片及第二参考图片属于不同参考图片类型时,视频解码器30可将时间合并候选者的参考索引设定为非零值。第一参考图片可为与当前视频单元相关联的参考图片列表中的初始参考图片。第二参考图片可由用于当前视频单元的TMVP的参考索引指示。时间合并候选者的参考索引指示与当前视频单元相关联的参考图片列表中的位置。此外,视频解码器30可从包含时间合并候选者的合并候选者列表中的多个合并候选者当中确定选定的合并候选者。视频解码器30可至少部分基于由选定的合并候选者指定的运动信息确定当前视频单元的预测性块。另外,视频解码器30可至少部分基于当前视频单元的预测性块产生经重建构样本块(例如,经重建构译码块)。
在一个替代方案中,视差运动向量可表示/替换为长期运动向量,且视图间(仅)参考可表示/替换为长期参考,且时间参考/运动向量可由时间短期参考/运动向量表示/替换。举例来说,如果当前PU的RefPicListX中的第一参考图片为短期参考图片,且TMVP的RefPicListX运动向量为短期运动向量,那么视频译码器可将时间合并候选者的RefPicListX参考索引设定为0。同样,如果当前PU的RefPicListX中的第一参考图片为长期参考图片,且TMVP的RefPicListX运动向量为长期运动向量,那么视频译码器可将时间合并候选者的RefPicListX参考索引设定为0。然而,如果当前PU的RefPicListX中的第一参考图片为短期参考图片,且TMVP的RefPicListX运动向量为长期运动向量,那么视频译码器可将时间合并候选者的RefPicListX参考索引设定为非零值。举例来说,视频译码器可将时间合并候选者的RefPicListX参考索引设定为当前PU的RefPicListX中的第一长期参考图片。类似地,如果当前PU的RefPicListX中的第一参考图片为长期参考图片,且TMVP的RefPicListX运动向量为短期运动向量,那么视频译码器可将时间合并候选者的RefPicListX参考索引设定为非零值。举例来说,视频译码器可将时间合并候选者的RefPicListX参考索引设定为当前PU的RefPicListX中的第一短期参考图片。
在另一个替代方案中,在切片标头中用信号发出时间参考图片(“T_ref_idx”)的参考索引(“ref_idx”)及视图间参考(仅)图片(“D_ref_idx”)的ref_idx。如果RefPicListX[0]的参考图片类型为时间,那么将最终参考索引设定成D_ref_idx。否则,如果RefPicListX[0]的参考图片类型为视差,那么将最终参考索引设定成T_ref_idx。
根据本发明的第二实例技术,在当前PU的RefPicListX的初始参考图片及由TMVP的RefPicListX运动向量参考的参考图片两者为时间短期参考图片时,视频译码器可将时间合并候选者的最终RefPicListX参考索引设定为0。RefPicListX的初始参考图片为具有等于0的参考索引的RefPicListX(即,RefPicListX[0])中的参考图片。
否则,视频译码器可如下改变时间合并候选者的最终RefPicListX参考索引。首先,由TMVP的RefPicListX运动向量参考的参考图片的AddPicId可表示为TargetAddPicId。如上文所指示,在一些实例中,参考图片的AddPicId可在多视图上下文中为参考图片的视图次序索引。在一些实例中,参考图片的AddPicId可为参考图片的通用层识别符(layer_id)。举例来说,参考图片的AddPicId可为与参考图片相关联的NAL单元的NAL单元标头中所指定的reserved_one_5bits_minus1语法元素的值。
如果RefPicListX[0]的类型为时间,那么视频译码器可检查除当前PU的RefPicListX的初始参考图片之外的在当前PU的RefPicListX中的每一参考图片。在视频译码器检查当前PU的RefPicListX的位置j中的参考图片时,视频译码器可确定AddPicId(RefPicListX[j]等于TargetAddPicId。如上文所指示,AddPicId()为传回额外图片识别的函数。如果AddPicId(RefPicListX[j])等于TargetAddPicId,那么视频译码器可将时间合并候选者的RefPicListX运动向量的最终参考索引设定为j。换句话说,视频译码器可针对从1到num_ref_idx_1X_active_minus1(包含1及num_ref_idx_1X_active_minus1)的每一j执行以下动作:如果AddPicId(RefPicListX[j])等于TargetAddPicId,那么视频译码器可将最终参考索引设定为j,且将其传回。num_ref_idx_1X_active_minus1可指示当前PU的RefPicListX中的作用中参考图片的数目。如果在检查RefPicListX[j]中的每一参考图片(从j=1到j=num_ref_idx_1X_active_minus1)之后不传回最终参考索引,那么视频译码器可确定时间合并候选者的运动向量不可用。
此外,在本发明的第二实例技术中,如果RefPicListX[0]的参考图片类型不为时间,且TMVP的RefPicListX运动向量为时间运动向量,那么视频译码器可检查除当前PU的RefPicListX的初始参考图片之外的在RefPicListX中的每一参考图片。在视频译码器检查在当前PU的RefPicListX的位置j(即,RefPicListX[j])处的参考图片时,视频译码器可确定RefPicListX[j]是否为时间参考图片。如果RefPicListX[j]为时间参考图片,那么视频译码器可将时间合并候选者的最终RefPicListX参考索引设定为j,且停止检查当前PU的RefPicListX中的参考图片。换句话说,对于从1到num_ref_idx_1X_active_minus1(包含1及num_ref_idx_1X_active_minus1)的j,如果RefPicListX[j]为时间参考图片,那么将最终参考索引设定为j,且将其传回。如果在检查RefPicListX[j]中的每一参考图片(从j=1到j=num_ref_idx_1X_active_minus1)之后不传回最终参考索引,那么视频译码器可确定时间合并候选者的运动向量不可用。
在替代实例中,如果当前PU的RefPicListX中的初始参考图片的参考图片类型不为时间,且TMVP的RefPicListX运动向量为时间运动向量,那么视频译码器可检查除当前PU的RefPicListX的初始参考图片之外的在当前PU的RefPicListX中的每一参考图片。在视频译码器检查在当前PU的RefPicListX的位置j(即,RefPicListX[j])处的参考图片时,视频译码器可确定RefPicListX[j]的POC值是否等于TMVP的RefPicListX运动向量所参考的参考图片的POC值。如果是,那么视频译码器可将时间合并候选者的最终RefPicListX参考索引设定为j,且停止检查当前PU的RefPicListX中的参考图片。因此,如果RefPicListX[0]的参考图片类型不为时间,且TMVP的RefPicListX运动向量为时间运动向量,那么对于从1到num_ref_idx_1X_active_minus1的j(包含1及num_ref_idx_1X_active_minus1),如果RefPicListX[j]的POC值等于运动向量所参考的图片的POC值,那么将最终参考索引设定为j,且将其传回。
在一些实例中,在检查除当前PU的RefPicListX的初始参考图片之外的在当前PU的RefPicListX中的每一参考图片之后,视频译码器确定当前PU的RefPicListX中的参考图片不等于TMVP的RefPicListX运动向量所参考的参考图片的POC值,且如果当前PU的RefPicListX中的最后参考图片为时间参考图片,那么视频译码器可将时间合并候选者的最终RefPicListX参考索引设定为j。因此,在一个替代方案中,如果先前段落中描述的回路并未成功地传回,那么对于从1到num_ref_idx_1X_active_minus1的j(包含1及num_ref_idx_1X_active_minus1),如果RefPicListX[j]为时间参考图片,那么将最终参考索引设定为j,且将其传回。
此外,根据本发明的第二实例技术,如果当前PU的RefPicListX中的初始参考图片不为时间参考图片,且TMVP的RefPicListX运动向量为时间运动向量,那么由TMVP的RefPicListX运动向量参考的参考图片的AddPicId可表示为TargetAddPicId。此外,视频译码器可检查除当前PU的RefPicListX的初始参考图片之外的在当前PU的RefPicListX中的每一参考图片。在视频译码器检查在当前PU的RefPicListX的位置j处的参考图片时,视频译码器可确定参考图片的AddPicId是否等于TargetAddPicId。如果参考图片的AddPicId等于TargetAddPicId,那么视频译码器可将时间合并候选者的最终RefPicListX参考索引设定为j,且可停止检查当前PU的RefPicListX中的参考图片。如果在检查除当前PU的RefPicListX的初始参考图片之外的在当前PU的RefPicListX中的每一参考图片之后,视频译码器确定参考图片中无一者具有等于TargetAddPicId的AddPicId,那么视频译码器可确定时间合并候选者不可用。
因此,如果RefPicListX[0]的类型不为时间,且运动向量不为时间,那么由运动向量参考的图片的AddPicId可表示为TargetAddPicId。对于从0到num_ref_idx_1X_active_minus1的j(包含0及num_ref_idx_1X_active_minus1),如果AddPicId(RefPicListX[j])等于TargetAddPicId,那么将最终参考索引设定为j,且将其传回。如果又未传回,那么运动向量被视为不可用的。
在一个替代实例中,在当前PU的RefPicListX中的初始参考图片不为时间参考图片,且TMVP的RefPicListX运动向量不为时间运动向量时,由TMVP的RefPicListX运动向量参考的参考图片的AddPicId可表示为TargetAddPicId。此外,在此实例中,如果当前PU的RefPicListX的初始参考图片的AddPicId等于TargetAddPicId,那么视频译码器可将时间合并候选者的最终RefPicListX参考索引设定为0,且将其传回。否则,视频译码器可将时间合并候选者的最终RefPicListX参考索引设定为0,且基于当前PU的RefPicListX的初始参考图片的AddPicId之间的差按比例缩放时间合并候选者的RefPicListX运动向量。
因此,在先前段落的实例中,在RefPicListX[0]的类型不为时间,且运动向量不为时间时,将由运动向量参考的图片的AddPicId表示为TargetAddPicId。如果AddPicId(RefPicListX[0])等于TargetAddPicId,那么将最终参考索引设定为0,且将其传回。否则,将最终参考索引设定为0,且基于AddPicId的差按比例缩放运动向量。在一个实例中,视频译码器可如下按比例缩放运动向量(“mv”):mv=mv*(AddPicId(RefPicListX[0])-AddPicId(当前图片))/(TargetAddPicId-AddPicId(相同位置图片))。
在本发明的另一实例技术中,视频编码器20可用信号发出将用于时间合并候选者的目标参考索引。目标参考索引的发信号可处于各种层级。举例来说,视频编码器20可在切片层级处用信号发出目标参考索引。举例来说,在此实例中,视频编码器20可在切片标头中用信号发出目标参考索引。在另一实例中,视频编码器20可在PU层级处用信号发出目标参考索引。举例来说,在此实例中,视频编码器20可在prediction_unit语法结构中用信号发出目标参考索引。根据本发明的此实例技术,可用于时间合并候选者的参考帧的数目可单独地受限制。举例来说,视频译码器可仅使用参考图片列表中的前两个帧以用于时间合并候选者。此方法的第一优势可为针对TMVP参考索引发信号所耗费的二进位的数目可小于一般状况下的数目(例如,在具有两个参考帧的先前实例中),仅使用指示参考索引0或参考索引1的一位。第二优势可为如果TMVP参考索引为预先已知的,那么视频译码器可预先针对整个帧或帧的部分预先导出TMVP候选者,且可能性的有限数目可用于此预先计算(在其可最高为两个变体的先前实例中)。
在各种情形下,如果从图片B参考图片A以及图片A及图片B的运动向量具有相同POC,那么其可以考虑运动向量不为时间运动向量。
如上文所指示,TMVP可为相同位置PU的运动向量,且目标参考索引为合并/跳过候选者列表或AMVP候选者列表中的时间合并候选者的参考索引。目标参考索引可总是等于0。本发明的技术中的至少一些的目标为在视频译码器使用合并模式中的TMVP,且目标参考索引总是等于0时的状况。因此,在TMVP参考具有不同于由等于0的参考索引所识别的当前PU的参考图片(即,参考图片列表的初始或第一参考图片)的参考图片类型(例如,时间或视图间)的参考图片时,视频译码器可改变时间合并候选者的目标参考索引。本发明可将其中TMVP参考具有不同于由等于0的参考索引识别的当前PU的参考图片的类型(例如,时间或视图间)的参考图片的条件表示为“参考类型不匹配条件”。
在以上实例中,视频译码器可识别具有相同参考图片类型的两个不同图片(例如,通过其是否为两个长期参考图片或两个短期图片,其是否为两个视图间参考图片,或其中的每一者是否具有与其所参考的图片相同的POC值)。目标参考索引甚至在被修改之后可仅为0及一个特定值C,所述特定值C对于整个切片来说是固定的。假定0对应于类型0(长期或视图间),C为对应于参考图片列表中的对应于类型1(短期或时间)的第一项的参考索引。假定0对应于类型1(短期或时间),C为对应于参考图片列表中的对应于类型0(长期或视图间)的第一项的参考索引。在参考类型不匹配条件为真时,视频译码器可将最终参考索引改变为C。
基于HEVC的多视图(即,MV-HEVC)及3D-HEVC中的运动相关技术的一些设计具有若干额外问题。举例来说,在3D-HTM的一些版本中,时间合并候选者的目标参考索引(TIdx)可由来自左相邻PU的可不等于零的参考索引确定。如果TMVP的运动向量为视差运动向量,且TIdx对应于时间参考图片,那么视频译码器不会按比例缩放视差运动向量。相反,如果TMVP的运动向量为时间运动向量,且TIdx对应于视图间参考图片,那么视频译码器不会按比例缩放时间运动向量。在这些两个状况下,视频译码器可将时间合并候选者视为不可用的。AMVP模式中可观测到相同问题,其中TIdx表示当前CU/PU的经解码的参考索引。
在用于MV-HEVC及3D-HEVC的运动相关技术的一些设计的另一实例问题中,一旦识别视差运动向量,便终止视差向量导出过程。然而,第一可用视差运动向量的准确性可能不足。在另一实例问题中,跳过/合并模式的视图间候选者导出过程总是偏好经视图间预测的运动向量。此情形可能并不适合于将可能使用视图间预测的具有高运动的区。在另一实例问题中,视图间候选者的固定位置(即,在AMVP或合并候选者列表中的所有空间候选者之后或之前)无法适应于局部特性。
本发明提供用于进一步改进MV-HEVC及/或3DV译码中的运动预测的译码效率的各种方法。举例来说,在时间合并候选者的目标参考索引(由空间相邻块导出)对应于具有不同于TMVP所指向的参考图片的参考图片类型的参考图片时,视频译码器可将时间合并候选者修改为对应于具有与TMVP的参考图片的类型相同的参考图片类型(例如,时间或视图间)的图片。举例来说,在参考图片为时间参考图片,且TMVP所指向的参考图片为视图间参考图片时,视频译码器可将时间合并候选者修改为对应于具有与TMVP的参考图片的类型相同的参考图片类型的图片的参考索引值。
根据本发明的另一实例技术,在合并/跳过模式中,甚至在经视图间预测的运动向量可用时,视频译码器可不将经视图间预测的运动向量添加到合并候选者列表。而是,视频译码器可替代地将视差向量转换为视图间视差运动向量。视频译码器可将视图间视差运动向量添加到合并候选者列表中。视频译码器可基于空间相邻块的信息确定是否将经视图间预测的运动向量或视图间视差运动向量添加到合并候选者列表。
此外,根据本发明的另一实例技术,视频译码器可在视差向量导出过程期间从相邻块收集多个可用视差运动向量。视频译码器可使用多个视差运动向量的平均数(例如,中值)或平均值作为导出的视差向量。根据本发明的另一实例技术,视频译码器可在合并/跳过模式中基于空间相邻块的信息在第一可用空间合并候选者之前或之后将经视图间预测的运动向量或视图间视差运动向量插入到合并候选者列表中。
图7是说明可以实施本发明的技术的实例视频编码器20的框图。图7是出于解释的目的而提供,并且不应被视为将技术限制为本发明中所大致例示及描述者。出于解释的目的,本发明在HEVC译码的上下文中描述视频编码器20。然而,本发明的技术可以适用于其它译码标准或方法。
在图7的实例中,视频编码器20包含预测处理单元100、残余产生单元102、变换处理单元104、量化单元106、反量化单元108、反变换处理单元110、重建构单元112、滤波器单元114、经解码的图片缓冲器116以及熵编码单元118。预测处理单元100包含帧间预测处理单元120以及帧内预测处理单元126。帧间预测处理单元120包含运动估计单元122以及运动补偿单元124。在其它实例中,视频编码器20可以包含更多、更少或不同的功能组件。
视频编码器20可以接收视频数据。视频编码器20可对视频数据的图片的切片中每一CTU进行编码。CTU中的每一者可以与图片的大小相等的明度译码树型块(CTB)以及对应的CTB相关联。作为对CTU进行编码的一部分,预测处理单元100可以执行四分树分割以将CTU的CTB划分为逐渐更小的块。所述更小的块可以是CU的译码块。例如,预测处理单元100将与CTU相关联的CTB分割成四个大小相等的子块,将子块中的一或多者分割成四个大小相等的子子块等。
视频编码器20可对CTU的CU进行编码以产生CU的经编码表示(即,经译码CU)。作为对CU进行编码的一部分,预测处理单元100可以在CU的一或多个PU当中分割与CU相关联的译码块。因此,每个PU可以与明度预测块以及对应的色度预测块相关联。视频编码器20以及视频解码器30可以支持具有各种大小的PU。CU的大小可指CU的明度译码块的大小并且PU的大小可指PU的明度预测块的大小。假定特定CU的大小是2Nx2N,那么视频编码器20以及视频解码器30可以支持用于帧内预测的2Nx2N或NxN的PU大小,以及用于帧间预测的2Nx2N、2NxN、Nx2N、NxN或类似大小的对称PU大小。视频编码器20以及视频解码器30还可以支持用于帧间预测的2NxnU、2NxnD、nLx2N以及nRx2N的PU大小的非对称分割。
帧间预测处理单元120可以通过对CU的每个PU执行帧间预测产生用于PU的预测性数据。PU的预测性数据可以包含PU的预测性块以及PU的运动信息。取决于PU是在I切片中、P切片中或B切片中,帧间预测处理单元120可以对CU的PU执行不同操作。在I切片中,所有PU都是经帧内预测。因此,如果PU是在I切片中,那么帧间预测处理单元120并不对PU执行帧间预测。
P切片中的PU可经帧内预测或经单向帧间预测。举例来说,如果PU是在P切片中,那么运动估计单元122可以对PU的参考区搜索参考图片列表(例如,“RefPicList0”)中的参考图片。PU的参考区可以是在参考图片内含有最紧密地对应于PU的预测块的样本块的区。运动估计单元122可产生指示含有PU的参考区的参考图片的RefPicList0中的位置的参考索引(即,RefPicList0参考索引)。另外,运动估计单元122可产生指示PU的预测块及与参考区相关联的参考位置之间的空间移位的运动向量(即,RefPicList0运动向量)。举例来说,运动向量可以是提供从当前经解码的图片中的坐标到参考图片中的坐标的偏移的二维向量。运动估计单元122可将参考索引及运动向量输出为PU的运动信息。基于由PU的运动向量指示的参考位置处的实际样本或经内插样本,运动补偿单元124可以产生PU的预测性块。
B切片中的PU可经帧内预测,经单向帧间预测或经双向帧间预测。因此,如果PU是在B切片中,那么运动估计单元122可以对PU执行单向预测或双向预测。为了对PU执行单向预测,运动估计单元122可以搜索RefPicList0的参考图片,或PU的参考区的第二参考图片列表(“RefPicList1”)。运动估计单元122可以将指示含有参考区的参考图片的RefPicList0或RefPicList1中的位置的参考索引、指示PU的预测块与相关联于参考区的参考位置之间的空间移位的运动向量以及指示参考图片是在RefPicList0中或在RefPicList1中的一或多个预测方向指示符输出为PU的运动信息。运动补偿单元124可以至少部分基于由PU的运动向量指示的参考位置处的实际样本或经内插样本来产生PU的预测性块。
为了对PU执行双向帧间预测,运动估计单元122可以在RefPicList0中的参考图片内搜索PU的参考区,并且还可以在RefPicList1中的参考图片内搜索PU的另一参考区。运动估计单元122可产生指示含有参考区的参考图片的RefPicList0及RefPicList1中的的参考索引(即,RefPicList0参考索引及RefPicList1参考索引)。另外,运动估计单元122可产生指示与参考区相关联的参考位置与PU的样本块之间的空间位移的运动向量(即,RefPicList0运动向量及RefPicList1运动向量)。PU的运动信息可包含PU的参考索引及运动向量。运动补偿单元124可至少部分基于在由PU的运动向量指示的参考位置处的实际或内插样本产生PU的预测性块。
帧内预测处理单元126可通过对PU执行帧内预测而产生PU的预测性数据。PU的预测性数据可以包含PU的预测性块以及各种语法元素。帧内预测处理单元126可以对I切片、P切片以及B切片中的PU执行帧内预测。
为了对PU执行帧内预测,帧内预测处理单元126可使用多个帧内预测模式产生PU的预测性数据的多个集合。帧内预测处理单元126可基于相邻PU的样本产生PU的预测性块。假定对于PU、CU及CTU采用从左到右、从上到下的编码次序,相邻PU可以在所述PU的上方、右上方、左上方或左方。不同帧内预测模式可与相邻样本的不同集合相关联。帧内预测处理单元126可使用各种数目的帧内预测模式。在一些实例中,帧内预测模式的数目可以取决于PU的预测块的大小。
预测处理单元100可以从用于PU的由帧间预测处理单元120产生的预测性数据或用于PU的由帧内预测处理单元126产生的预测性数据当中选择用于CU的PU的预测性数据。在一些实例中,预测处理单元100基于预测性数据的集合的速率/失真量度选择用于CU的PU的预测性数据。选定的预测性数据的预测性块在本文中可以被称为选定的预测性块。
残余产生单元102可基于CU的明度、Cb及Cr译码块以及CU的PU的选定预测性明度、Cb及Cr块产生CU的明度、Cb及Cr残余块。举例来说,残余产生单元102可产生CU的残余块以使得残余块中的每一样本具有等于CU的译码块中的样本与CU的PU的对应选定的预测性块中的对应样本之间的差的值。
变换处理单元104可以执行四分树分割以将与CU相关联的残余块分割成与CU的TU相关联的变换块。因此,TU可以与明度变换块以及两个对应色度变换块相关联。CU的TU的明度变换块以及色度变换块的大小和位置可以或可不基于CU的PU的预测块的大小和位置。
变换处理单元104可以通过将一或多个变换应用到TU的变换块而产生用于CU的每一TU的系数块。变换处理单元104可以将各种变换应用到与TU相关联的变换块。例如,变换处理单元104可以将离散余弦变换(DCT)、定向变换或概念上类似的变换应用于变换块。在一些实例中,变换处理单元104并不将变换应用于变换块。在此类实例中,变换块可以处理为系数块。
量化单元106可以量化系数块中的变换系数。量化过程可减少与变换系数中的一些或全部相关联的位深度。举例来说,可在量化期间将n位变换系数向下舍入到m位变换系数,其中n大于m。量化单元106可以基于与CU相关联的量化参数(QP)值而量化与CU的TU相关联的系数块。视频编码器20可以通过调整与CU相关联的QP值来调整应用于与CU相关联的系数块的量化的程度。量化可能使得信息丢失,因此经量化的变换系数可以具有比原始变换系数更低的精度。
反量化单元108以及反变换处理单元110可以分别将反量化以及反变换应用于系数块,以从系数块重建构残余块。重建构单元112可将经重建构残余块的样本添加到来自由预测处理单元100产生的一或多个预测性块的对应样本,以产生与TU相关联的经重建构变换块。通过以此方式重建构用于CU的每一TU的变换块,视频编码器20可以重建构CU的译码块。
滤波器单元114可以执行一或多个解块操作以减少与CU相关联的译码块中的成块假影。经解码的图片缓冲器116可以在滤波器单元114对经重建构的译码块执行一或多个解块操作之后存储经重建构的译码块。帧间预测处理单元120可使用含有经重建构译码块的参考图片来对其它图片的PU执行帧间预测。另外,帧内预测处理单元126可以使用经解码的图片缓冲器116中的经重建构的译码块以对处于与CU相同的图片中的其它PU执行帧内预测。
熵编码单元118可以从视频编码器20的其它功能组件接收数据。例如,熵编码单元118可以从量化单元106接收系数块,并且可以从预测处理单元100接收语法元素。熵编码单元118可以对一些此类数据执行一或多个熵编码操作以产生经熵编码的数据。例如,熵编码单元118可以对数据执行上下文自适应可变长度译码(CAVLC)操作、CABAC操作、可变到可变(V2V)长度译码操作、基于语法的上下文自适应二进制算术译码(SBAC)操作、概率区间分割熵(PIPE)译码操作、指数哥伦布编码操作或另一类型的熵编码操作。视频编码器20可以输出包含由熵编码单元118产生的经熵编码的数据的位流。例如,位流可以包含表示用于CU的RQT的数据。位流也可包含未经熵编码的语法元素。
图8是说明可实施本发明中描述的技术的实例视频解码器30的框图。图8是出于解释的目的而提供,并且不将技术限制为本发明中所大致例示和描述者。出于解释的目的,本发明在HEVC译码的上下文中描述视频解码器30。然而,本发明的技术可以适用于其它译码标准或方法。
在图8的实例中,视频解码器30包含熵解码单元150、预测处理单元152、反量化单元154、反变换处理单元156、重建构单元158、滤波器单元160以及经解码的图片缓冲器162。预测处理单元152包含运动补偿单元164以及帧内预测处理单元166。在其它实例中,视频解码器30可以包含更多、更少或不同的功能组件。
熵解码单元150可接收NAL单元,且剖析NAL单元以从位流获得语法元素。熵解码单元150可以对NAL单元中的经熵编码的语法元素进行熵解码。预测处理单元152、反量化单元154、反变换处理单元156、重建构单元158及滤波器单元160可基于从位流获得的语法元素产生经解码的视频数据。
位流的NAL单元可以包含经译码的切片NAL单元。作为对位流进行编码的一部分,熵解码单元150可以从经译码的切片NAL单元提取语法元素并且对所述语法元素进行熵解码。经译码的切片中的每一者可以包含切片标头以及切片数据。切片标头可含有关于切片的语法元素。切片标头中的语法元素可以包含识别与含有所述切片的图片相关联的PPS的语法元素。
除了从位流获得语法元素之外,视频解码器30可对CU执行重建构操作。为了对CU执行重建构操作,视频解码器30可对CU的每一TU执行重建构操作。通过对CU的每一TU执行重建构操作,视频解码器30可以重建构CU的残余块。
作为对CU的TU执行重建构操作的一部分,反量化单元154可反量化(即,解量化)与TU相关联的系数块。反量化单元154可使用与TU的CU相关联的QP值来确定量化的程度,及同样反量化单元154将应用的反量化的程度。
在反量化单元154反量化系数块之后,反变换处理单元156可将一或多个反变换应用于系数块以便产生与TU相关联的残余块。举例来说,反变换处理单元156可以将反DCT、反整数变换、反卡忽南-拉维(Karhunen-Loeve)变换(KLT)、反旋转变换、反定向变换或另一反变换应用于系数块。
如果使用帧内预测对PU进行编码,则帧内预测处理单元166可以执行帧内预测以产生用于PU的预测性块。帧内预测处理单元166可以使用帧内预测模式,以基于空间上相邻的PU的预测块产生用于PU的预测性明度块、Cb块以及Cr块。帧内预测处理单元166可以基于从位流解码的一或多个语法元素来确定用于PU的帧内预测模式。
预测处理单元152可以基于从位流获得的语法元素建构第一参考图片列表(RefPicList0)以及第二参考图片列表(RefPicList1)。此外,如果使用帧间预测对PU进行编码,则熵解码单元150可以提取用于PU的运动信息。运动补偿单元164可以基于PU的运动信息确定用于PU的一或多个参考区。运动补偿单元164可以基于在用于PU的一或多个参考块处的样本产生用于PU的预测性明度块、Cb块以及Cr块。
重建构单元158可在适当时使用与CU的TU相关联的明度、Cb及Cr变换块及CU的PU的预测性明度、Cb及Cr块(即,帧内预测数据或帧间预测数据)来重建构CU的明度、Cb及Cr译码块。举例来说,重建构单元158可以将明度变换块、Cb变换块以及Cr变换块的样本添加到预测性明度块、Cb块以及Cr块的对应样本以重建构CU的明度译码块、Cb译码块以及Cr译码块。
滤波器单元160可执行解块操作以减少与CU的明度、Cb及Cr译码块相关联的成块假影。视频解码器30可以在经解码的图片缓冲器162中存储CU的明度译码块、Cb译码块以及Cr译码块。经解码的图片缓冲器162可提供参考图片以用于后续运动补偿、帧内预测及在例如图1的显示装置32等显示装置上的呈现。举例来说,视频解码器30可基于经解码的图片缓冲器162中的明度、Cb及Cr块对其它CU的PU执行帧内预测或帧间预测操作。以此方式,视频解码器30可从位流获得明度系数块的变换系数层级,反量化变换系数层级,对变换系数层级应用变换以产生变换块、至少部分基于变换块而产生译码块,且输出译码块以用于显示。
根据本发明的第一实例技术,在与当前视频单元相关联的参考图片列表中的初始参考图片及由当前视频单元的TMVP的参考索引指示的参考图片属于不同参考图片类型时,视频译码器可将时间合并候选者的参考索引设定为非零值(即,指示除参考图片列表的第一位置之外的在参考图片列表中的位置的值)。时间合并候选者的参考索引指示与当前视频单元相关联的参考图片列表中的位置。
此外,根据本发明的第一实例技术,视图间参考图片被视为长期的。在TMVP导出是在合并模式下时,视频译码器可改变最终参考索引。在合并模式下将变量mergeTMVP设定成1,且在AMVP模式下将其设定成0。换句话说,mergeTMVP等于1指示合并模式,且mergeTMVP等于0指示AMVP模式。举例来说,考虑两个参考图片,一个参考图片为RefPicListX[0],且另一个参考图片为TMVP的RefPicListX运动向量所参考的图片。如果两个参考图片中的一者为短期且另一者为长期,那么视频译码器可在当前PU的RefPicListX中执行搜索直到满足RefPicListX[i]的项i及TMVP的RefPicListX运动向量所参考的图片皆为短期或皆为长期为止。
为了实施本发明的第一实例技术,可对HEVC工作草案7作出各种改变。遍及指示各种HEVC工作草案的改变的本发明的部分,以粗体及下划线展示的文本指示添加的文本。此外,遍及指示各种HEVC工作草案的改变的本发明的部分,以删除线展示的文本指示删除的文本。为了实施本发明的第一实例技术,可对HEVC工作草案7的§8.5.2.1.1作出以下改变。以下文本中未图示的HEVC工作草案7的§8.5.2.1.1的部分可保持与HEVC工作草案7中的部分相同。
8.5.2.1.1用于合并模式的明度运动向量的导出过程
此过程仅在PredMode等于MODE_SKIP或PredMode等于MODE_INTER及merge_flag[xP][yP]等于1时被调用,其中(xP,yP)指定相对于当前图片的左上方明度样本的当前预测单元的左上方明度样本。
这个过程的输入是
-当前译码单元的左上方明度样本相对于当前图片的左上方明度样本的明度位置(xC,yC),
-当前预测单元的左上方明度样本相对于当前图片的左上方明度样本的明度位置(xP,yP),
-指定当前译码单元的大小的变量nCS,
-指定用于明度的预测单元的宽度及高度的变量nPSW及nPSH,
-指定在当前译码单元内的当前预测单元的索引的变量PartIdx。
这个过程的输出是
-明度运动向量mvL0及mvL1,
-参考索引refIdxL0及refIdxL1,
-预测列表利用旗标predFlagL0及predFlagL1。
如下导出变量singleMCLFlag。
-如果log2_paralle1_merge_leve1_minus2大于0,且nCS等于8,那么将singleMCLFlag设定成1。
-否则,将singleMCLFlag设定成0。
在singleMCLFlag等于1时,将xP设定成等于xC,将yP设定成等于yC,且将nPSW及nPSH两者设定成等于nCS。
注意-在singleMCLFlag等于1时,当前译码单元的所有预测单元共享单个合并候选者列表,所述单个合并候选者列表等同于2Nx2N预测单元的合并候选者列表。
导出运动向量mvL0及mvL1、参考索引refIdxL0及refIdxL1以及预测利用旗标predFlagL0及predFlagL1,如由以下顺序的步骤指定:
1.使用明度位置(xP,yP)、变量singleMCLFlag、预测单元的宽度及高度nPSW及nPSH以及分割索引PartIdx作为输入来调用子条款8.5.2.1.2中的从相邻预测单元分割区的针对合并候选者的导出过程,且将输出指派给可用性旗标availableFlagN、参考索引refIdxL0N及refIdxL1N、预测列表利用旗标predFlagL0N及predFlagL1N以及运动向量mvL0N及mvL1N,其中N由A0、A1、B0、B1或B2替换。
2.时间合并候选者的参考索引经导出为等于0,且将mergeTMVP设定成1
3....
如§8.5.2.1.1的改变中所示,在用于合并模式的明度运动向量的导出过程期间将mergeTMVP变量设定成1。因此,mergeTMVP变量指示视频译码器正使用合并模式。
此外,根据本发明的第一实例技术,可对HEVC工作草案7的§8.5.2.1.7作出以下改变。
8.5.2.1.7用于时间明度运动向量预测的导出过程
到这个过程的输入是
-指定相对于当前图片的左上方样本的当前预测单元的左上方明度样本的明度位置(xP,yP),
-指定用于明度的预测单元的宽度及高度的变量nPSW及nPSH,
-当前预测单元分割区的参考索引refIdxLX(其中X为0或1)。
这个过程的输出是
-运动向量预测mvLXCol,
-可用性旗标availableFlagLXCol。
函数RefPicOrderCnt(picX,refIdx,LX)传回来自图片picX的参考图片列表LX的具有索引refIdx的参考图片的图片次序计数PicOrderCntVal,且如下指定。
RefPicOrderCnt(picX,refIdx,LX)=PicOrderCnt(图片picX的RefPicListX[refIdx])
(8-141)
取决于slice_type、collocated_from_l0_flag及collocated_ref_idx的值,如下导出指定含有相同位置分割区的图片的变量colPic。
-如果slice_type等于B,且collocated_from_l0_flag等于0,那么变量colPic指定含有相同位置分割区的图片,如由RefPicList1[collocated_ref_idx]所指定。
-否则(slice_type等于B,且collocated_from_l0_flag等于1或slice_type等于P),变量colPic指定含有相同位置分割区的图片,如由RefPicList0[collocated_ref_idx]所指定。
在以下顺序的步骤中导出变量colPu及其位置(xPCol,yPCol):
1.如下导出变量colPu
yPRb=yP+nPSH(8-139)
-如果(yP>>Log2CtbSize)等于(yPRb>>Log2CtbSize),那么当前预测单元的右下方明度位置的水平分量由下式定义
xPRb=xP+nPSW(8-140)
且将变量colPu设定为覆盖colPic内部的由((xPRb>>4)<<4,(yPRb>>4)<<4)给定的经修改的位置的预测单元。
-否则((yP>>Log2CtbSize)不等于(yPRb>>Log2CtbSize)),将colPu标记为“不可用”。
2.在colPu在帧内预测模式中经译码或colPu被标记为“不可用”时,以下情形适用。
-当前预测单元的中心明度位置由下式定义
xPCtr=(xP+(nPSW>>1)   (8-141)
yPCtr=(yP+(nPSH>>1)   (8-142)
-将变量colPu设定为覆盖colPic内部的由((xPCtr>>4)<<4,(yPCtr>>4)<<4)给定的经修改的位置的预测单元。
3.将(xPCol,yPCol)设定为等于相对于colPic的左上方明度样本的colPu的左上方明度样本。
如下定义函数LongTermRefPic(picX,refIdx,LX)。如果来自图片picX的参考图片列表LX的具有索引refIdx的参考图片被标记为“用于长期参考”,那么在picX为当前图片时,LongTermRefPic(picX,refIdx,LX)传回1;否则LongTermRefPic(picX,refIdx,LX)传回0。
如果mergeTMVP为1(在合并模式下),那么以下情形适用,且可改变refIdxLX的 值。
-如果RefPicListX[0]为长期参考图片,且LongTermRefPic(colPic,refIdxCol, listCol)等于0,那么对于从1到num ref idx lX active minus1的i(包含1及 num ref idx lX active minus1),以下情形适用
-如果RefPicListX[i]为短期参考图片,那么将refIdxLX设定成i,终止回路。
-如果RefPicListX[0]为短期参考图片,且LongTermRefPic(colPic,refIdxCol, listCol)等于1,那么对于从1到num ref idx lX active minus1的i(包含1及 num_ref_idx_lX_active_minus1),以下情形适用
-如果RefPicListX[i]为长期参考图片,那么将refIdxLX设定成i,终止回路。
如下导出变量mvLXCol及availableFlagLXCol。
-如果以下条件中的一或多者为真,那么将mvLXCol的两个分量设定为等于0,且将availableFlagLXCol设定为等于0。
-在帧内预测模式中译码colPu。
-将colPu标记为“不可用”。
-pic_temporal_mvp_enable_flag等于0。
-否则,如下导出运动向量mvCol、参考索引refIdxCol及参考列表识别符listCol。
-如果PredFlagL0[xPCol][yPCol]等于0,那么分别将mvCol、refIdxCol及listCol设定为等于MvL1[xPCol][yPCol]、RefIdxL1[xPCol][yPCol]及L1。
-否则(PredFlagL0[xPCol][yPCol]等于1),以下情形适用。
-如果PredFlagL1[xPCol][yPCol]等于0,那么分别将mvCol、refIdxCol及listCol设定为等于MvL0[xPCol][yPCol]、RefIdxL0[xPCol][yPCol]及L0。
-否则(PredFlagL1[xPCol][yPCol]等于1),进行以下指派。
-如果每一参考图片列表中的每一图片pic的PicOrderCnt(pic)小于或等于PicOrderCntVal,那么分别将mvCol、refIdxCol及listCol设定为等于MvLX[xPCol][yPCol]、RefIdxLX[xPCol][yPCol]及LX,其中X为这个过程所调用的X的值。
-否则(至少一个参考图片列表中的至少一个图片pic的PicOrderCnt(pic)大于PicOrderCntVal,且分别将mvCol、refIdxCol及listCol设定为等于MvLN[xPCol][yPCol]、RefIdxLN[xPCol][yPCol]及LN,其中N为collocated_from_l0_flag的值。
-如果以下条件中的一者为真,那么将变量availableFlagLXCol设定为等于0:
-RefPicListX[refIdxLX]为长期参考图片,且LongTermRefPic(colPic,refIdxCol,listCol)等于0;
-RefPicListX[refIdxLX]为短期参考图片,且LongTermRefPic(colPic,refIdxCol,listCol)等于1;
-否则,将变量availableFlagLXCol设定为等于1,且以下情形适用。
如果RefPicListX[refIdxLX]为长期参考图片,或LongTermRefPic(colPic,refIdxCol,listCol)等于1,或PicOrderCnt(colPic)-RefPicOrderCnt(colPic,refIdxCol,listCol)等于PicOrderCntVal-PicOrderCnt(RefPicListX[refIdxLX]),那么
mvLXCol=mvCol   (8-143)
-否则,mvLXCol经导出为运动向量mvCol的经按比例缩放版本,如下文所指定
tx=(16384+(Abs(td)>>1))/td   (8-144)
-DistScaleFactor=Clip3(-4096,4095,(tb*tx+32)>>6)(8-145)
mvLXCol=Clip3(-8192,8191.75,Sign(DistScaleFactor*mvCol)*((Abs(DistScaleFactor*mvCol)+127)>>8))   (8-146)
其中td及tb经导出为
td=Clip3(-128,127,PicOrderCnt(colPic)-RefPicOrderCnt(colPic,refIdxCol,listCol))(8-147)
tb=Clip3(-128,127,PicOrderCntVal-PicOrderCnt(RefPicListX[refIdxLX]))(8-148)
如上文所示的对HEVC工作草案7的章节8.5.2.1.7的改变中所指示,RefPicListX[0]指示当前PU的RefPicListX中的第一参考图片。此外,LongTermRefPic(colPic,refIdxCol,listCol)指示在位置refIdxCol处的相同位置图片(即,colPic)的参考图片列表(即,listCol)中的参考图片是否为长期参考图片。
因此,如果当前PU的RefPicListX中的第一参考图片为长期参考图片,且由相同位置图片中的TMVP的RefPicListX参考索引指示的参考图片不为长期参考图片(即,LongTermRefPic(colPic,refIdxCol,listCol)等于0),那么视频译码器可将时间合并候选者的RefPicListX参考索引(即,refIdxLX)设定为当前PU的RefPicListX中的第一短期参考图片。如果当前PU的RefPicListX中的第一参考图片为短期参考图片,且由相同位置图片中的TMVP的RefPicListX参考索引指示的参考图片不为长期参考图片(即,LongTermRefPic(colPic,refIdxCol,listCol)等于1),那么视频译码器可将时间合并候选者的RefPicListX参考索引(即,refIdxLX)设定为当前PU的RefPicListX中的第一长期参考图片。
如上文所描述,视频译码器可根据本发明的第二实例技术确定当前PU的RefPicListX的初始参考图片及由TMVP的RefPicListX运动向量参考的参考图片两者是否皆为时间短期参考图片。如果是,那么视频译码器可将时间合并候选者的RefPicListX参考索引设定为0。否则,视频译码器可将时间合并候选者的RefPicListX参考索引设定为非零值。
在本发明的第二实例技术中,可由不同维度识别视图间图片。在本发明的第二实例技术中,AddPicId可用以识别每一图片所属于的层/视图。举例来说,考虑两个参考图片,一个参考图片为RefPicListX[0],且另一个参考图片为TMVP的RefPicListX运动向量所参考的图片picT。在此实例中,PicT为目标图片,且如果RefPicListX中的第i项具有与不同于RefPicListX[0]的AddPicId的PicT相同的AddPicId,那么将i设定为最终参考索引。在多个项满足请求时,视频译码器可将最小索引设定为时间合并候选者的最终RefPicListX参考索引。
根据本发明的第二实例技术,HEVC工作草案7的章节8.5.2.1.1可如下改变。
8.5.2.1.1用于合并模式的明度运动向量的导出过程
此过程仅在PredMode等于MODE_SKIP或PredMode等于MODE_INTER及merge_flag[xP][yP]等于1时被调用,其中(xP,yP)指定相对于当前图片的左上方明度样本的当前预测单元的左上方明度样本。
这个过程的输入是
-当前译码单元的左上方明度样本相对于当前图片的左上方明度样本的明度位置(xC,yC),
-当前预测单元的左上方明度样本相对于当前图片的左上方明度样本的明度位置(xP,yP),
-指定当前译码单元的大小的变量nCS,
-指定用于明度的预测单元的宽度及高度的变量nPSW及nPSH,
-指定在当前译码单元内的当前预测单元的索引的变量PartIdx。
这个过程的输出是
-明度运动向量mvL0及mvL1,
-参考索引refIdxL0及refIdxL1,
-预测列表利用旗标predFlagL0及predFlagL1。
如下导出变量singleMCLFlag。
-如果log2_parallel_merge_level_minus2大于0,且nCS等于8,那么将singleMCLFlag设定成1。
-否则,将singleMCLFlag设定成0。
在singleMCLFlag等于1时,将xP设定成等于xC,将yP设定成等于yC,且将nPSW及nPSH两者设定成等于nCS。
注意-在singleMCLFlag等于1时,当前译码单元的所有预测单元共享单个合并候选者列表,所述单个合并候选者列表等同于2Nx2N预测单元的合并候选者列表。
导出运动向量mvL0及mvL1、参考索引refIdxL0及refIdxL1以及预测利用旗标predFlagL0及predFlagL1,如由以下顺序的步骤指定:
1.使用明度位置(xP,yP)、变量singleMCLFlag、预测单元的宽度及高度nPSW及nPSH以及分割索引PartIdx作为输入来调用子条款8.5.2.1.2中的从相邻预测单元分割区的针对合并候选者的导出过程,且将输出指派给可用性旗标availableFlagN、参考索引refIdxL0N及refIdxL1N、预测列表利用旗标predFlagL0N及predFlagL1N以及运动向量mvL0N及mvL1N,其中N由A0、A1、B0、B1或B2替换。
2.时间合并候选者的参考索引经导出为等于0,且将mergeTMVP设定成1
3. ...
如§8.5.2.1.1的改变中所示,在用于合并模式的明度运动向量的导出过程期间将mergeTMVP变量设定成1。因此,mergeTMVP变量指示视频译码器正使用合并模式。
根据本发明的第二实例技术,HEVC工作草案7的章节8.5.2.1.7可如下修改:
8.5.2.1.7用于时间明度运动向量预测的导出过程
到这个过程的输入是
-指定相对于当前图片的左上方样本的当前预测单元的左上方明度样本的明度位置(xP,yP),
-指定用于明度的预测单元的宽度及高度的变量nPSW及nPSH,
-当前预测单元分割区的参考索引refIdxLX(其中X为0或1)。
这个过程的输出是
-运动向量预测mvLXCol,
-可用性旗标availableFlagLXCol。
函数RefPicOrderCnt(picX,refIdx,LX)传回来自图片picX的参考图片列表LX的具有索引refIdx的参考图片的图片次序计数PicOrderCntVal,且如下指定。
RefPicOrderCnt(picX,refIdx,LX)=PicOrderCnt(图片picX的RefPicListX[refIdx])(8 141)
取决于slice_type、collocated_from_l0_flag及collocated_ref_idx的值,如下导出指定含有相同位置分割区的图片的变量colPic。
-如果slice_type等于B,且collocated_from_l0_flag等于0,那么变量colPic指定含有相同位置分割区的图片,如由RefPicList1[collocated_ref_idx]所指定。
-否则(slice_type等于B,且collocated_from_l0_flag等于1或slice_type等于P),变量colPic指定含有相同位置分割区的图片,如由RefPicList0[collocated_ref_idx]所指定。
在以下顺序的步骤中导出变量colPu及其位置(xPCol,yPCol):
1.如下导出变量colPu
yPRb=yP+nPSH    (8-139)
-如果(yP>>Log2CtbSize)等于(yPRb>>Log2CtbSize),那么当前预测单元的右下方明度位置的水平分量由下式定义
xPRb=xP+nPSW    (8-140)
且将变量colPu设定为覆盖colPic内部的由((xPRb>>4)<<4,(yPRb>>4)<<4)给定的经修改的位置的预测单元。
-否则((yP>>Log2CtbSize)不等于(yPRb>>Log2CtbSize)),将colPu标记为“不可用”。
2.在colPu在帧内预测模式中经译码或colPu被标记为“不可用”时,以下情形适用。
-当前预测单元的中心明度位置由下式定义
xPCtr=(xP+(nPSW>>1)    (8-141)
yPCtr=(yP+(nPSH>>1)    (8-142)
-将变量colPu设定为覆盖colPic内部的由((xPCtr>>4)<<4,(yPCtr>>4)<<4)给定的经修改的位置的预测单元。
3.将(xPCol,yPCol)设定为等于相对于colPic的左上方明度样本的colPu的左上方明度样本。
如下定义函数LongTermRefPic(picX,refIdx,LX)。如果来自图片picX的参考图片列表LX的具有索引refIdx的参考图片被标记为“用于长期参考”,那么在picX为当前图片时,LongTermRefPic(picX,refIdx,LX)传回1;否则LongTermRefPic(picX,refIdx,LX)传回0。
AddPicId(picX,refIdx,LX)传回AddPicId(pic),其中pic为来自图片picX的参考图片列表LX的具有索引refIdx的参考图片。将currpic表示为当前图片。
如果mergeTMVP为1(在合并模式下),那么以下情形适用,且可改变refIdxLX的 值。
-如果AddPicId(RefPicListX[0])不等于AddPicId(colPic,refIdxCol,listCol),
-如果AddPicId(RefPicListX[0])等于AddPicId(currPic),那么对于从1到 num ref idx lX active minus1的i(包含1及num ref idx lX active minus1),以 下情形适用
如果AddPicId(RefPicListX[i])等于AddPicId(colPic,refIdxCol, listCol),那么将refIdxLX设定成i,终止回路。
-否则,如果AddPicId(colPic,refIdxCol,listCol)等于AddPicId(currPic), 那么对于从1到num_ref_idx_lX_active_minus1的i(包含1及 num ref idx lX active minus1),以下情形适用
如果AddPicId(RefPicListX[i])等于AddPicId(currPic),那么将refIdxLX 设定成i,终止回路。
-否则(AddPicId(colPic,refIdxCol,listCol)不等于AddPicId(currPic),且 AddPicId(RefPicListX[0]不等于AddPicId(currPic)),什么都不做。
如果AddPicId(RefPicListX[i])等于AddPicId(colPic,refIdxCol, listCol),那么将refIdxLX设定成i,终止回路。
或者,在refIdxLX仍为0时,可基于AddPicId距离按比例缩放运动向 量。缩放因数为(AddPicId(RefPicListX[0])-AddPicId (currPic))/(AddPicId(colPic,refIdxCol,listCol)-AddPicId(colPic))
-如果AddPicId(RefPicListX[0]等于AddPicId(colPic,refIdxCol,listCol)
-如果AddPicId(RefPicListX[0])等于AddPicId(currPic),那么什么都不做。
-如果AddPicId(RefPicListX[0])不等于AddPicId(currPic),那么什么都不做。
●或者,如果AddPicId(colPic)不等于AddPicId(currPid),那么可基于 AddPicId距离按比例缩放运动向量。The scaling factor is  (AddPicId(RefPicListX[0])-AddPicId(currPic))/(AddPicId(colPic,refIdxCol, listCol)-AddPicId(colPic)).
如下导出变量mvLXCol及availableFlagLXCol。
-如果以下条件中的一或多者为真,那么将mvLXCol的两个分量设定为等于0,且将availableFlagLXCol设定为等于0。
-在帧内预测模式中译码colPu。
-将colPu标记为“不可用”。
-pic_temporal_mvp_enable_flag等于0。
-否则,如下导出运动向量mvCol、参考索引refIdxCol及参考列表识别符listCol。
-如果PredFlagL0[xPCol][yPCol]等于0,那么分别将mvCol、refIdxCol及listCol设定为等于MvL1[xPCol][yPCol]、RefIdxL1[xPCol][yPCol]及L1。
-否则(PredFlagL0[xPCol][yPCol]等于1),以下情形适用。
-如果PredFlagL1[xPCol][yPCol]等于0,那么分别将mvCol、refIdxCol及listCol设定为等于MvL0[xPCol][yPCol]、RefIdxL0[xPCol][yPCol]及L0。
-否则(PredFlagLl[xPCol][yPCol]等于1),进行以下指派。
-如果每一参考图片列表中的每一图片pic的PicOrderCnt(pic)小于或等于PicOrderCntVal,那么分别将mvCol、refIdxCol及listCol设定为等于MvLX[xPCol][yPCol]、RefIdxLX[xPCol][yPCol]及LX,其中X为这个过程所调用的X的值。
-否则(至少一个参考图片列表中的至少一个图片pic的PicOrderCnt(pic)大于PicOrderCntVal,且分别将mvCol、refIdxCol及listCol设定为等于MvLN[xPCol][yPCol]、RefIdxLN[xPCol][yPCol]及LN,其中N为collocated_from_l0_flag的值。
-如果以下条件中的一者为真,那么将变量availableFlagLXCol设定为等于0。
-AddPicId(RefPicListX[refIdxLX])不等于AddPicId(colPic,refIdxCol,listCol);
-RefPicListX[refIdxLX]为短期参考图片,且LongTermRefPic(colPic,refIdxCol,listCol)等于1;
-RefPicListX[refIdxLX]为长期参考图片,且LongTermRefPic(colPic,refIdxCol,listCol)等于0;
-否则,将变量availableFlagLXCol设定为等于1,且以下情形适用。
-如果RefPicListX[refIdxLX]为长期参考图片,或LongTermRefPic(colPic,refIdxCol,listCol)等于1,或PicOrderCnt(colPic)-RefPicOrderCnt(colPic,refIdxCol,listCol)等于PicOrderCntVal-PicOrderCnt(RefPicListX[refIdxLX]),那么
mvLXCol=mvCol    (8-143)
-否则,mvLXCol经导出为运动向量mvCol的经按比例缩放版本,如下文所指定
tx=(16384+(Abs(td)>>1))/td    (8-144)
-DistScaleFactor=Clip3(-4096,4095,(tb*tx+32)>>6)(8-145)
mvLXCol=Clip3(-8192,8191.75,Sign(DistScaleFactor*mvCol)*((Abs(DistScaleFactor*mvCol)+127)>>8))    (8-146)
其中td及tb经导出为
td=Clip3(-128,127,PicOrderCnt(colPic)-
RefPicOrderCnt(colPic,refIdxCol,listCol)) (8-147)
tb=Clip3(-128,127,PicOrderCntVal-PicOrderCnt(RefPicListX[refIdxLX]))(8-148)
本发明的第三实例技术类似于上文所描述的第一及第二实例技术。然而,第三实例技术在短期及长期参考图片之间有区别。举例来说,考虑两个参考图片。参考图片中的一者为RefPicListX[0],且另一参考图片为图片picT(即,TMVP的RefPicListX运动向量所参考的图片)。在picT的额外图片识别符(即,AddPicId(PicT))不同于RefPicListX[0]的额外图片识别符或RefPicListX[0]及picT两者皆为时间参考图片但RefPicListX[0]及picT中的仅一者为短期参考图片时,RefPicListX中的第i项具有与picT相同的AddPicId,且其皆为短期时间参考图片或皆为长期时间参考图片,或皆为非时间参考图片,视频译码器可将最终参考索引设定为i。在当前PU的RefPicListX中的多个项满足请求时,视频译码器可将最小索引设定为时间合并候选者的最终RefPicListX参考索引。
在本发明的第四实例技术中,视频译码器可在切片标头中用信号发出时间参考图片的ref_idx(T_ref_idx_lx)及视图间参考(仅)图片的ref_idx(D_ref_idx_lx)。如果RefPicListX[0]的参考图片类型为时间,那么视频译码器可将时间合并候选者的最终RefPicListX参考索引设定为D_ref_idx_lx。如果RefPicListX[0]的参考图片类型为视差,那么视频译码器可将时间合并候选者的最终RefPicListX参考索引设定为T_ref_idx_lx。
或者,在一些实例中,视频译码器可如下导出T_ref_idx_lX及D_ref_idx_lX,其中如果RefPicListX可用,那么两个X等于0及1。对于从0到num_ref_idx_lX_active_minus1的每一j(包含1及num_ref_idx_lX_active_minus1),以下情形适用:如果RefPicListX[j]为时间参考图片,那么将T_ref_idx_lX设定成j,且将其传回。对于从0到num_ref_idx_lX_active_minus1的每一j(包含1及num_ref_idx_lX_active_minus1),以下情形适用:如果RefPicListX[j]不为时间参考图片,那么将T_ref_idx_lX设定成j,且将其传回。在一个实例中,视频译码器可通过检查RefPicListX[j]的标记状态(例如,长期、短期或皆不)确定RefPicListX[j]是否为时间参考图片。在另一实例中,视频译码器可通过检查识别图片的参考图片类型的基本规范中的挂钩确定RefPicListX[j]是否为时间参考图片。在另一实例中,视频译码器可通过比较当前图片的POC值与RefPicListX[j]确定RefPicListX[j]是否为时间参考图片。
在本发明的第四实例技术中,可如下修改HEVC工作草案7的章节8.5.2.1.1:
8.5.2.1.1  用于合并模式的明度运动向量的导出过程
此过程仅在PredMode等于MODE_SKIP或PredMode等于MODE_INTER及merge_flag[xP][yP]等于1时被调用,其中(xP,yP)指定相对于当前图片的左上方明度样本的当前预测单元的左上方明度样本。
这个过程的输入是
-当前译码单元的左上方明度样本相对于当前图片的左上方明度样本的明度位置(xC,yC),
-当前预测单元的左上方明度样本相对于当前图片的左上方明度样本的明度位置(xP,yP),
-指定当前译码单元的大小的变量nCS,
-指定用于明度的预测单元的宽度及高度的变量nPSW及nPSH,
-指定在当前译码单元内的当前预测单元的索引的变量PartIdx。
这个过程的输出是
-明度运动向量mvL0及mvL1,
-参考索引refIdxL0及refIdxL1,
-预测列表利用旗标predFlagL0及predFlagL1。
如下导出变量singleMCLFlag。
-如果log2_parallel_merge_level_minus2大于0,且nCS等于8,那么将singleMCLFlag设定成1。
-否则,将singleMCLFlag设定成0。
在singleMCLFlag等于1时,将xP设定成等于xC,将yP设定成等于yC,且将nPSW及nPSH两者设定成等于nCS。
注意-在singleMCLFlag等于1时,当前译码单元的所有预测单元共享单个合并候选者列表,所述单个合并候选者列表等同于2Nx2N预测单元的合并候选者列表。
导出运动向量mvL0及mvL1、参考索引refIdxL0及refIdxL1以及预测利用旗标predFlagL0及predFlagL1,如由以下顺序的步骤指定:
1.使用明度位置(xP,yP)、变量singleMCLFlag、预测单元的宽度及高度nPSW及nPSH以及分割索引PartIdx作为输入来调用子条款8.5.2.1.2中的从相邻预测单元分割区的针对合并候选者的导出过程,且将输出指派给可用性旗标availableFlagN、参考索引refIdxL0N及refIdxL1N、预测列表利用旗标predFlagL0N及predFlagL1N以及运动向量mvL0N及mvL1N,其中N由A0、A1、B0、B1或B2替换。
2.时间合并候选者的参考索引经导出为等于0,且将mergeTMVP设定成1
3. ...
如§8.5.2.1.1的改变中所示,在用于合并模式的明度运动向量的导出过程期间将mergeTMVP变量设定成1。因此,mergeTMVP变量指示视频译码器正使用合并模式。
此外,根据本发明的第四实例技术,HEVC工作草案7的章节8.5.2.1.7可如下修改:
8.5.2.1.7用于时间明度运动向量预测的导出过程
到这个过程的输入是
-指定相对于当前图片的左上方样本的当前预测单元的左上方明度样本的明度位置(xP,yP),
-指定用于明度的预测单元的宽度及高度的变量nPSW及nPSH,
-当前预测单元分割区的参考索引refIdxLX(其中X为0或1)。
这个过程的输出是
-运动向量预测mvLXCol,
-可用性旗标availableFlagLXCol。
函数RefPicOrderCnt(picX,refIdx,LX)传回来自图片picX的参考图片列表LX的具有索引refIdx的参考图片的图片次序计数PicOrderCntVal,且如下指定。
RefPicOrderCnt(picX,refIdx,LX)=PicOrderCnt(图片picX的RefPicListX[refIdx])(8 141)
取决于slice_type、collocated_from_l0_flag及collocated_ref_idx的值,如下导出指定含有相同位置分割区的图片的变量colPic。
-如果slice_type等于B,且collocated_from_l0_flag等于0,那么变量colPic指定含有相同位置分割区的图片,如由RefPicList1[collocated_ref_idx]所指定。
-否则(slice_type等于B,且collocated_from_l0_flag等于1或slice_type等于P),变量colPic指定含有相同位置分割区的图片,如由RefPicList0[collocated_ref_idx]所指定。
在以下顺序的步骤中导出变量colPu及其位置(xPCol,yPCol):
1.如下导出变量colPu
yPRb=yP+nPSH    (8-139)
-如果(yP>>Log2CtbSize)等于(yPRb>>Log2CtbSize),那么当前预测单元的右下方明度位置的水平分量由下式定义
xPRb=xP+nPSW    (8-140)
且将变量colPu设定为覆盖colPic内部的由((xPRb>>4)<<4,(yPRb>>4)<<4)给定的经修改的位置的预测单元。
-否则((yP>>Log2CtbSize)不等于(yPRb>>Log2CtbSize)),将colPu标记为“不可用”。
2.在colPu在帧内预测模式中经译码或colPu被标记为“不可用”时,以下情形适用。
-当前预测单元的中心明度位置由下式定义
xPCtr=(xP+(nPSW>>1)    (8-141)
yPCtr=(yP+(nPSH>>1)    (8-142)
-将变量colPu设定为覆盖colPic内部的由((xPCtr>>4)<<4,(yPCtr>>4)<<4)给定的经修改的位置的预测单元。
3.将(xPCol,yPCol)设定为等于相对于colPic的左上方明度样本的colPu的左上方明度样本。
如下定义函数LongTermRefPic(picX,refIdx,LX)。如果来自图片picX的参考图片列表LX的具有索引refIdx的参考图片被标记为“用于长期参考”,那么在picX为当前图片时,LongTermRefPic(picX,refIdx,LX)传回1;否则LongTermRefPic(picX,refIdx,LX)传回0。
如果mergeTMVP为1(在合并模式下),那么以下情形适用,且可改变refIdxLX的 值。
-如果LongTermRefPic(colPic,refIdxCol,listCol)等于0,那么将refIdxLX设定 成T ref idx lX
-否则,将refIdxLX设定成D ref idx lX。
...
在上文所示的章节8.5.2.1.7的经修改的版本的替代版本中,最后显示的行是“否则,将refIdxLX设定成I,将refIdxLX设定成D_ref_idx_lX。”
如章节8.5.2.1.7的经修改的版本中所指示,如果针对合并模式执行用于时间明度运动向量预测的导出过程(即,mergeTMVP等于1),那么视频译码器可确定LongTermRefPic(colPic,refIdxCol,listCol)是否等于0。colPic指示相同位置图片。refIdxCol指示相同位置图片中的TMVP的参考索引。listCol指示refIdxCol所参考的参考图片列表。因此,LongTermRefPic(colPic,refIdxCol,listCol)等于0指示colPic中的TMVP的由RefPicListX参考索引(其中X等于listCol)指示的参考图片不为长期参考图片(即,短期参考图片)。如果是,那么视频译码器将refIdxLX(即,时间合并候选者的RefPicListX参考索引)设定为T_ref_idx_lX。否则,视频译码器将refIdxLX设定为D_ref_idx_lX。
本发明的第五实例技术类似于上文所描述的第三实例技术。然而,在第五实例技术中,视频编码器20可在切片标头中用信号发出tmvp_merge_temporal_flag语法元素。tmvp_merge_temporal_flag语法元素等于0指示来自TMVP合并候选者的目标参考索引等于T_ref_idx_lx。tmvp_merge_temporal_flag语法元素等于1指示时间合并候选者的RefPicListX参考索引(即,目标合并TMVP参考索引)等于D_ref_idx_lx。在不存在tmvp_merge_temporal_flag语法元素时,视频解码器30可推断tmvp_merge_temporal_flag语法元素等于0,且时间合并候选者的RefPicListX参考索引等于0。T_ref_idx_lx及D_ref_idx_lx中的至少一者等于0。
在第五实例技术中,可如下修改HEVC工作草案7的章节8.5.2.1.1:
用于合并模式的明度运动向量的导出过程
此过程仅在PredMode等于MODE_SKIP或PredMode等于MODE_INTER及merge_flag[xP][yP]等于1时被调用,其中(xP,yP)指定相对于当前图片的左上方明度样本的当前预测单元的左上方明度样本。
这个过程的输入是
-当前译码单元的左上方明度样本相对于当前图片的左上方明度样本的明度位置(xC,yC),
-当前预测单元的左上方明度样本相对于当前图片的左上方明度样本的明度位置(xP,yP),
-指定当前译码单元的大小的变量nCS,
-指定用于明度的预测单元的宽度及高度的变量nPSW及nPSH,
-指定在当前译码单元内的当前预测单元的索引的变量PartIdx。
这个过程的输出是
-明度运动向量mvL0及mvL1,
-参考索引refIdxL0及refIdxL1,
-预测列表利用旗标predFlagL0及predFlagL1。
如下导出变量singleMCLFlag。
-如果log2parallel_merge_level_minus2大于0,且nCS等于8,那么将singleMCLFlag设定成1。
-否则,将singleMCLFlag设定成0。
在singleMCLFlag等于1时,将xP设定成等于xC,将yP设定成等于yC,且将nPSW及nPSH两者设定成等于nCS。
注意-在singleMCLFlag等于1时,当前译码单元的所有预测单元共享单个合并候选者列表,所述单个合并候选者列表等同于2Nx2N预测单元的合并候选者列表。
导出运动向量mvL0及mvL1、参考索引refIdxL0及refIdxL1以及预测利用旗标predFlagL0及predFlagL1,如由以下顺序的步骤指定:
1.使用明度位置(xP,yP)、变量singleMCLFlag、预测单元的宽度及高度nPSW及nPSH以及分割索引PartIdx作为输入来调用子条款8.5.2.1.2中的从相邻预测单元分割区的针对合并候选者的导出过程,且将输出指派给可用性旗标availableFlagN、参考索引refIdxL0N及refIdxL1N、预测列表利用旗标predFlagL0N及predFlagL1N以及运动向量mvL0N及mvL1N,其中N由A0、A1、B0、B1或B2替换。
时间合并候选者的参考索引在tmvp_merge_temporal_flag为0时经导出为等于 T_ref_idx_lx,且在tmvp_merge_temporal_flag为1时经导出为等于T_ref_idx_lx。
在本发明的第六实例技术中,启用额外目标参考索引。在以上实例中,所有短期参考图片仍朝向具有等于0的参考索引的参考图片按比例缩放,如在当前HEVC规范中。然而,对于所有长期参考图片,视频译码器导出新的参考索引(ref_idx N,其在下文描述中被称为refIdxL0A及refIdxL1A),以使得参考长期参考图片的运动向量可用以形成合并候选者。一般来说,在当前PU的RefPicListX中的第一参考图片为短期参考图片(即,参考索引等于0表示短期参考图片)时,新添加的目标参考索引用以表示长期参考图片。然而,在当前PU的RefPicListX中的第一参考图片为长期参考图片(即,参考索引等于0表示长期参考图片)时,视频译码器可使用新添加的目标参考索引来表示视图间参考图片。类似于当前HEVC规范,如果目标参考索引对应于长期参考图片,那么相同位置块中的运动向量在被视为可用的情况下并不按比例缩放。
HEVC工作草案7的章节8.3.5描述在解码之前标记参考图片。根据本发明的第六实例技术,HEVC工作草案的章节8.3.5可用以下文本替换:
8.3.5用于TMVP的额外目标参考索引的导出过程
在当前切片为P或B切片时调用这个过程。导出额外目标参考索引refIdxL0A及refIdxL1A。
将变量refIdxL0A及refIdxL1A皆设定为-1。
以下情形适用于导出refIdxL0A。
在切片为B切片时,以下情形适用于导出refIdxL1A。
此外,在本发明的第六实例技术中,在时间运动向量预测期间,在当前模式为合并模式时,目标参考索引0可改变为refIdxLXA(其中X等于0或1)。refIdxLXA可表示非零参考索引值。不改变AMVP模式。
HEVC工作草案7的章节8.5.2.1.1描述用于合并模式的明度运动向量的导出过程。在本发明的第六实例技术中,可如下修改HEVC工作草案7的章节8.5.2.1.1:
8.5.2.1.1用于合并模式的明度运动向量的导出过程
此过程仅在PredMode[xC][yC]等于MODE_SKIP或PredMode[xC][yC]等于MODE_INTER及merge_flag[xP][yP]等于1时被调用,其中(xP,yP)指定相对于当前图片的左上方明度样本的当前明度预测块的左上方样本。
这个过程的输入是
-当前明度译码块的左上方样本相对于当前图片的左上方明度样本的明度位置(xC,yC),
-当前明度预测块的左上方样本相对于当前图片的左上方明度样本的明度位置(xP,yP),
-指定当前明度译码块的大小的变量nCS,
-指定明度预测块的宽度及高度的变量nPbW及nPbH,
-指定在当前译码单元内的当前预测单元的索引的变量partIdx。
这个过程的输出是
-明度运动向量mvL0及mvL1,
-参考索引refIdxL0及refIdxL1,
-预测列表利用旗标predFlagL0及predFlagL1。
如下导出变量singleMCLFlag。
-如果log2_parallel_merge_level_minus2大于0,且nCS等于8,那么将singleMCLFlag设定成1。
-否则,将singleMCLFlag设定成0。
在singleMCLFlag等于1时,将xP设定成等于xC,将yP设定成等于yC,且将nPbW及nPbH两者设定成等于nCS。
注意-在singleMCLFlag等于1时,当前译码单元的所有预测单元共享单个合并候选者列表,所述单个合并候选者列表等同于2Nx2N预测单元的合并候选者列表。
导出运动向量mvL0及mvL1、参考索引refIdxL0及refIdxL1以及预测利用旗标predFlagL0及predFlagL1,如由以下顺序的步骤指定:
1.使用明度译码块位置(xC,yC)、译码块大小nCS、明度预测块位置(xP,yP)、变量singleMCLFlag、明度预测块的宽度及高度nPbW及nPbH以及分割区索引partIdx作为输入来调用子条款8.5.2.1.2中的从相邻预测单元分割区的针对合并候选者的导出过程,且将输出指派给可用性旗标availableFlagN、参考索引refIdxL0N及refIdxL1N、预测列表利用旗标predFlagL0N及predFlagL1N以及运动向量mvL0N及mvL1N,其中N由A0、A1、B0、B1或B2替换。
2.将时间合并候选者的参考索引refIdxLX(其中X为0或1)设定为等于0。
3.使用明度位置(xP,yP)、明度预测块的宽度及高度nPbW及nPbH、refIdxLX以及等于1的mergeTMVP作为输入来调用子条款8.5.3.1.7中的时间明度运动向量预测的导出过程,且其中输出为可用性旗标availableFlagLXCol及时间运动向量mvLXCol。如下文所指定导出变量availableFlagCol及predFlagLXCol(其中X分别为0或1)。
4. ...
...
因此,在上文所示的章节8.5.2.1.1的经修改的版本中,使用等于1的mergeTMVP变量来调用章节8.5.3.1.7的时间明度运动向量预测过程。根据第六实例技术修改的章节8.5.3.1.7的版本描述于本发明的其它地方。
HEVC工作草案7的章节8.5.3.1.5描述用于AMVP模式的明度运动向量预测的导出过程。根据本发明的第六实例技术,HEVC工作草案7的章节8.5.3.1.5可如下改变:
8.5.3.1.5用于明度运动向量预测的导出过程
到这个过程的输入是
-当前明度译码块的左上方样本相对于当前图片的左上方明度样本的明度位置(xC,yC),
-指定当前明度译码块的大小的变量nCS,
-指定相对于当前图片的左上方明度样本的当前明度预测块的左上方样本的明度位置(xP,yP),
-指定明度预测块的宽度及高度的变量nPbW及nPbH,
-当前预测单元分割区的参考索引refIdxLX(其中X为0或1),
-指定在当前译码单元内的当前预测单元的索引的变量partIdx。
这个过程的输出是
-运动向量mvLX的预测mvpLX(其中X为0或1)。
在以下顺序的步骤中导出运动向量预测子mvpLX。
1.使用明度译码块位置(xC,yC)、译码块大小nCS、明度预测块位置(xP,yP)、明度预测块的宽度及高度nPbW及nPbH、refIdxLX(其中X分别为0或1)及分割区索引partIdx作为输入来调用子条款8.5.3.1.6中的从相邻预测单元分割区的针对运动向量预测子候选者的导出过程,且其中使用可用性旗标availableFlagLXN及运动向量mvLXN作为输出,其中N由A、B替换。
2.如果availableFlagLXA及availableFlagLXB两者皆等于1,且mvLXA不等于mvLXB,那么将availableFlagLXCol设定为等于0,否则,使用明度位置(xP,yP)、明度预测块的宽度及高度nPbW及nPbH、refIdxLX(其中X分别为0或1)以及等 于0的mergeTMVP作为输入来调用子条款8.5.3.1.7中的时间明度运动向量预测的导出过程,且其中输出为可用性旗标availableFlagLXCol及时间运动向量预测子mvLXCol。
...
因此,在上文所示的章节8.5.2.1.5的经修改的版本中,使用等于0的mergeTMVP变量来调用章节8.5.3.1.7的时间明度运动向量预测过程。根据第六实例技术修改的章节8.5.3.1.7的版本描述于本发明的其它地方。
HEVC工作草案7的章节8.5.3.1.7描述用于时间明度运动向量预测的导出过程。根据本发明的第六实例技术,HEVC工作草案7的章节8.5.3.1.7可如下改变:
8.5.3.1.7用于时间明度运动向量预测的导出过程
到这个过程的输入是
-指定相对于当前图片的左上方明度样本的当前明度预测块的左上方样本的明度位置(xP,yP),
-指定明度预测块的宽度及高度的变量nPbW及nPbH,
-参考索引refIdxLX(其中X为0或1)。
-变量mergeTMVP。
这个过程的输出是
-运动向量预测mvLXCol,
-可用性旗标availableFlagLXCol。
函数RefPicOrderCnt(picX,refIdx,LX)传回来自图片picX的参考图片列表LX的具有索引refIdx的参考图片的图片次序计数PicOrderCntVal,且如下指定。
RefPicOrderCnt(picX,refIdx,LX)=PicOrderCnt(图片picX的RefPicListX[refIdx])(8141)
取决于slice_type、collocated_from_l0_flag及collocated_ref_idx的值,如下导出指定含有相同位置分割区的图片的变量colPic。
-如果slice_type等于B,且collocated_from_l0_flag等于0,那么变量colPic指定含有相同位置分割区的图片,如由RefPicList1[collocated_ref_idx]所指定。
-否则(slice_type等于B,且collocated_from_l0_flag等于1或slice_type等于P),变量colPic指定含有相同位置分割区的图片,如由RefPicList0[collocated_ref_idx]所指定。
在以下顺序的步骤中导出变量colPb及其位置(xPCol,yPCol):
1.如下导出变量colPb
yPRb=yP+nPbH  (8-151)
-如果(yP>>Log2CtbSizeY)等于(yPRb>>Log2CtbSizeY),那么当前明度预测块的右下方明度位置的水平分量由下式定义
xPRb=xP+nPbW  (8-152)
且将变量colPb设定为覆盖colPic内部的由((xPRb>>4)<<4,(yPRb>>4)<<4)给定的经修改的位置的明度预测块。
-否则((yP>>Log2CtbSizeY)不等于(yPRb>>Log2CtbSizeY)),将colPb标记为“不可用”。
2.在帧内预测模式中译码colPb或将colPb标记为“不可用”时,以下情形适用。
-当前预测块的中心明度位置由下式定义
xPCtr=(xP+(nPbW>>1)  (8-153)
yPCtr=(yP+(nPbH>>1)  (8-154)
-将变量colPb设定为覆盖colPic内部的由((xPCtr>>4)<<4,(yPCtr>>4)<<4)给定的经修改的位置的明度预测块。
3.将(xPCol,yPCol)设定为等于相对于colPic的左上方明度样本的colPb的左上方样本。
如果所有以下条件为真,那么将refIdxLX设定成refIdxLXA。
-mergeTMVP等于1。
-LongTermRefPic(currPic,refIdxLX,ListX)不等于LongTermRefPic(colPic, refIdxCol,listCol)。
-refIdxLXA大于0。
如下导出变量mvLXCol及availableFlagLXCol。
-如果以下条件中的一或多者为真,那么将mvLXCol的两个分量设定为等于0,且将availableFlagLXCol设定为等于0。
-在帧内预测模式中译码colPb。
-将colPb标记为“不可用”。
-slice_temporal_mvp_enable_flag等于0。
-LongTermRefPic(currPic,refIdxLX,ListX)不等于LongTermRefPic(colPic,refIdxCol,listCol)。
-否则,如下导出运动向量mvCol、参考索引refIdxCol及参考列表识别符listCol。
-如果PredFlagL0[xPCol][yPCol]等于0,那么分别将mvCol、refIdxCol及listCol设定为等于MvL1[xPCol][yPCol]、RefIdxL1[xPCol][yPCol]及L1。
-否则(PredFlagL0[xPCol][yPCol]等于1),以下情形适用。
-如果PredFlagL1[xPCol][yPCol]等于0,那么分别将mvCol、refIdxCol及listCol设定为等于MvL0[xPCol][yPCol]、RefIdxL0[xPCol][yPCol]及L0。
-否则(PredFlagL1[xPCol][yPCol]等于1),进行以下指派。
-如果每一参考图片列表中的每一图片pic的PicOrderCnt(pic)小于或等于PicOrderCntVal,那么分别将mvCol、refIdxCol及listCol设定为等于MvLX[xPCol][yPCol]、RefIdxLX[xPCol][yPCol]及LX,其中X为这个过程所调用的X的值。
-否则(至少一个参考图片列表中的至少一个图片pic的PicOrderCnt(pic)大于PicOrderCntVal,且分别将mvCol、refIdxCol及listCol设定为等于MvLN[xPCol][yPCol]、RefIdxLN[xPCol][yPCol]及LN,其中N为collocated_from_l0_flag的值。
且将变量availableFlagLXCol设定为等于1,且以下情形适用。
-如果RefPicListX[refIdxLX]为长期参考图片,或PicOrderCnt(colPic)-RefPicOrderCnt(colPic,refIdxCol,listCol)等于PicOrderCntVal-PicOrderCnt(RefPicListX[refIdxLX]),
mvLXCol=mvCol  (8-155)
-否则,mvLXCol经导出为运动向量mvCol的经按比例缩放版本,如下文所指定
tx=(16384+(Abs(td)>>1))/td  (8-156)
distScaleFactor=Clip3(-4096,4095,(tb*tx+32)>>6)  (8-157)
mvLXCol=Clip3(-32768,32767,Sign2(distScaleFactor*mvCol)*((Abs(distScaleFactor*mvCol)+127)>>8))(8-158)
其中td及tb经导出为
td=Clip3(-128,127,PicOrderCnt(colPic)-
RefPicOrderCnt(colPic,refIdxCol,listCol))  (8-159)
tb=Clip3(-128,127,PicOrderCntVal-
PicOrderCnt(RefPicListX[refIdxLX]))  (8-160)
在上文所示的章节8.5.3.1.7的经修改的版本中,refIdxLX为时间合并候选者的RefPicListX参考索引。refIdxLXA指示...
本发明的第七实例技术类似于上文所描述的第六实例技术。然而,第七实例技术遵循HEVC工作草案9。在第七实例技术中,refIdxLXA(其中X等于0或1)可被导出(如第六实例技术中)或以其它方式用信号发出/设定。
HEVC工作草案9的章节8.5.3.1.7描述用于时间明度运动向量预测的导出过程。在第七实例技术中,可如下修改HEVC工作草案9的章节8.5.3.1.7:
8.5.3.1.7用于时间明度运动向量预测的导出过程
到这个过程的输入是
-指定相对于当前图片的左上方明度样本的当前明度预测块的左上方样本的明度位置(xP,yP),
-指定明度预测块的宽度及高度的变量nPbW及nPbH,
-变量mergeTMVP,
-参考索引refIdxLX(其中X为0或1)。
这个过程的输出是
-运动向量预测mvLXCol,
-可用性旗标availableFlagLXCol。
变量currPb指定在明度位置(xP,yP)处的当前明度预测块。
如下导出变量mvLXCol及availableFlagLXCol。
-如果slice_temporal_mvp_enable_flag等于0,那么将mvLXCol的两个分量设定为等于0,且将availableFlagLXCol设定为等于0。
-否则,以下顺序的步骤适用。
1.取决于slice_type、collocated_from_l0_flag及collocated_ref_idx的值,如下导出指定含有相同位置分割区的图片的变量colPic。
-如果slice_type等于B,且collocated_from_l0_flag等于0,那么变量colPic指定含有相同位置分割区的图片,如由RefPicListl[collocated_ref_idx]所指定。
-否则(slice_type等于B,且collocated_from_l0_flag等于1或slice_type等于P),变量colPic指定含有相同位置分割区的图片,如由RefPicList0[collocated_ref_idx]所指定。
2.如下导出右下方相同位置运动向量
xPRb=xP+nPbW  (8-162)
yPRb=yP+nPbH  (8-163)
-如果(yP>>Log2CtbSizeY)等于(yPRb>>Log2CtbSizeY),且xPRb小于pic_width_in_luma_samples,那么以下情形适用。
-变量colPb指定覆盖在由colPic指定的相同位置图片内部的由((xPRb>>4)<<4,(yPRb>>4)<<4)给定的经修改的位置的明度预测块。
-将明度位置(xPCol,yPCol)设定为等于相对于由colPic指定的相同位置图片的左上方明度样本的由colPb指定的相同位置明度预测块的左上方样本。
-使用currPb、colPic、colPb、(xPCol,yPCol)、mergeTMVP及refIdxLX作为输入来调用如子条款8.5.3.1.8中所指定的相同位置运动向量的导出过程,且将输出指派给mvLXCol及availableFlagLXCol。
-否则,将mvLXCol的两个分量设定为等于0,且将availableFlagLXCol设定为等于0。
3.在availableFlagLXCol等于0时,如下导出中心相同位置运动向量。
xPCtr=xP+(nPbW>>1)  (8-164)
yPCtr=yP+(nPbH>>1)  (8-165)
-变量colPb指定覆盖colPic内部的由((xPCtr>>4)<<4,(yPCtr>>4)<<4)给定的经修改的位置的明度预测块。
-将明度位置(xPCol,yPCol)设定为等于相对于由colPic指定的相同位置图片的左上方明度样本的由colPb指定的相同位置明度预测块的左上方样本。
-使用currPb、colPic、colPb、(xPCol,yPCol)、mergeTMVP及refIdxLX作为输入来调用如子条款8.5.3.1.8中所指定的相同位置运动向量的导出过程,且将输出指派给mvLXCol及availableFlagLXCol。
在章节8.5.3.1.7的经修改的版本中,时间明度运动向量预测的导出过程接收mergeTMVP变量作为输入。如果针对合并模式调用章节8.5.3.1.7的导出过程,那么mergeTMVP变量可等于1,且如果针对AMVP模式调用章节8.5.3.1.7的导出过程,那么mergeTMVP变量可等于0。在章节8.5.3.1.7的经修改的版本中,将mergeTMVP变量作为输入提供到章节8.5.3.1.8的导出过程。
HEVC工作草案9的章节8.5.3.1.8描述用于相同位置运动向量的导出过程。根据第七实例技术,可如下修改HEVC工作草案9的章节8.5.3.1.8。
8.5.3.1.8用于相同位置运动向量的导出过程
到这个过程的输入是
-指定当前预测块的currPb,
-指定相同位置图片的colPic,
-指定由colPic指定的相同位置图片内部的相同位置预测块的colPb,
-指定相对于由colPic指定的相同位置图片的左上方明度样本的由colPb指定的相同位置明度预测块的左上方样本的明度位置(xPCol,yPCol),
-变量mergeTMVP,
-参考索引refIdxLX(其中X为0或1)。
这个过程的输出是
-运动向量预测mvLXCol,
-可用性旗标availableFlagLXCol。
变量currPic指定当前图片。
分别将阵列predFlagLXCol[x][y]、mvLXCol[x][y]及refIdxLXCol[x][y]设定为等于由colPic指定的相同位置图片的对应阵列PredFlagLX[x][y]、MvLX[x][y]及RefIdxLX[x][y],其中X为这个过程所调用的X的值。
如下导出变量mvLXCol及availableFlagLXCol。
-如果在帧内预测模式中译码colPb,那么将mvLXCol的两个分量设定为等于0,且将availableFlagLXCol设定为等于0。
-否则,如下导出运动向量mvCol、参考索引refIdxCol及参考列表识别符listCol。
-如果predFlagL0Col[xPCol][yPCol]等于0,那么分别将mvCol、refIdxCol及listCol设定为等于mvLlCol[xPCol][yPCol]、refIdxLlCol[xPCol][yPCol]及L1。
-否则如果predFlagL0Col[xPCol][yPCol]等于1,且predFlagLlCol[xPCol][yPCol]等于0,那么分别将mvCol、refIdxCol及listCol设定为等于mvL0Col[xPCol][yPCol]、refIdxL0Col[xPCol][yPCol]及L0。
-否则(predFlagL0Col[xPCol][yPCol]等于1,且predFlagLlCol[xPCol][yPCol]等于1),进行以下指派。
-如果对于当前切片的每一参考图片列表中的每一图片pic,DiffPicOrderCnt(currPic,pic)小于或等于0,那么分别将mvCol、refIdxCol及listCol设定为等于mvLXCol[xPCol][yPCol]、refIdxLXCol[xPCol][yPCol]及LX,其中X为这个过程所调用的X的值。
-否则,分别将mvCol、refIdxCol及listCol设定为等于mvLNCol[xPCol][yPCol]、refIdxLNCol[xPCol][yPCol]及LN,其中N为collocated_from_l0_flag的值。
且如下导出mvLXCol及availableFlagLXCol。
-在LongTermRefPic(currPic,currPb,refIdxLX,LX)不等于LongTermRefPic(colPic,colPb,refIdxCol,listCol)时,以下情形适用
-如果refIdxLXA大于0且mergeTMVP等于1,那么将refIdxLX设定等于refIdxLXA,且将availableFlagLXCol设定为等于1。
-否则,将mvLXCol的两个分量设定为等于0,且将availableFlagLXCol设定为等于0。
-在将变量availableFlagLXCol设定为等于1时,将refPicListCol[refIdxCol]设定成具有含有图片colPic中的预测块currPb的切片的参考图片列表listCol中的参考索引refIdxCol的图片,且以下情形适用。
colPocDiff=DiffPicOrderCnt(colPic,refPicListCol[refIdxCol])(8-166)
currPocDiff=DiffPicOrderCnt(currPic,RefPicListX[refIdxLX])(8-167)
-如果RefPicListX[refIdxLX]为长期参考图片,或colPocDiff等于currPocDiff,那么mvLXCol经导出为:
mvLXCol=mvCol  (8-168)
-否则,mvLXCol经导出为运动向量mvCol的经按比例缩放版本,如下文所指定。
tx=(16384+(Abs(td)>>1))/td  (8-169)
distScaleFactor=Clip3(-4096,4095,(tb*tx+32)>>6)  (8-170)
mvLXCol=Clip3(-32768,32767,Sign(distScaleFactor*mvCol)*((Abs(distScaleFactor*mvCol)+127)>>8))  (8-171)
其中td及tb经导出为
td=Clip3(-128,127,colPocDiff)  (8-172)
tb=Clip3(-128,127,currPocDiff)  (8-173)
在上文所示的章节8.5.3.1.8的经修改的版本中,refIdxLX指示时间合并或MVP候选者的RefPicListX参考索引。此外,在章节8.5.3.1.8的经修改的版本中,视频译码器可确定由RefPicListX参考索引指示的参考图片及由TMVP的RefPicListX参考索引指示的参考图片是否不都是长期参考图片或不都是短期参考图片。也就是说,视频译码器可确定LongTermRefPic(currPic,currPb,refIdxLX,LX)是否不等于LongTermRefPic(colPic,colPb,refIdxCol,listCol)。如果是,那么视频译码器可在refIdxLXA大于0及mergeTMVP等于0的情况下将时间合并或MVP候选者的RefPicListX参考索引设定为refIdxLXA。否则,视频译码器可将时间合并或MVP候选者的两个运动向量分量设定为0。
第八实例技术可提供对第七实例技术的额外可能改进。如果目标TMVP参考图片及相同位置参考图片的参考图片类型不同,那么应用第八实例技术。存在用以导出运动信息(即,右下方及中心)的两个相同位置子块。如果TMVP导出是不可能的,那么用于运动信息导出的子块可从右下方切换到中心。然而,在应用上文方法时,零TMVP参考索引可用另一者替换。结果,视频译码器可总是能够导出TMVP。这意味着可总是使用具有可用运动信息的右下方块,且到中心子块的切换可不发生,即使视频译码器可使用中心子块导出用于零参考索引的TMVP。
额外可能改进可为在针对导出具有零参考索引的TMVP的可能性检查右下方及中心块之后应用上文描述的方法(改变TMVP参考索引)。如果视频译码器未能导出TMVP,那么视频译码器可将TMVP的参考索引改变为非零值。对于非零参考索引,视频译码器可从右下方或中心子块导出TMVP,或视频译码器可应用切换机制。如果从中心子块导出具有非零参考索引的TMVP,那么此版本具有对HEVC的一些版本的较少改变,因为可能并不需要回到右下方块及重复TMVP导出过程。可在HEVC工作草案9的章节8.5.3.1.7的以下经修改的版本中实施后一解决方案。
8.5.3.1.7用于时间明度运动向量预测的导出过程
到这个过程的输入是
-指定相对于当前图片的左上方明度样本的当前明度预测块的左上方样本的明度位置(xP,yP),
-指定明度预测块的宽度及高度的变量nPbW及nPbH,
-变量mergeTMVPFlag,
-参考索引refIdxLX(其中X为0或1)。
8.5.3.1.7用于时间明度运动向量预测的导出过程
到这个过程的输入是
-指定相对于当前图片的左上方明度样本的当前明度预测块的左上方样本的明度位置(xP,yP),
-指定明度预测块的宽度及高度的变量nPbW及nPbH,
-变量mergeTMVP,
-参考索引refIdxLX(其中X为0或1)。
这个过程的输出是
-运动向量预测mvLXCol,
-可用性旗标availableFlagLXCol。
变量currPb指定在明度位置(xP,yP)处的当前明度预测块。
如下导出变量mvLXCol及availableFlagLXCol。
-如果slice_temporal_mvp_enable_flag等于0,那么将mvLXCol的两个分量设定为等于0,且将availableFlagLXCol设定为等于0。
-否则,以下顺序的步骤适用。
1.取决于slice_type、collocated_from_l0_flag及collocated_ref_idx的值,如下导出指定含有相同位置分割区的图片的变量colPic。
-如果slice_type等于B,且collocated_from_l0_flag等于0,那么变量colPic指定含有相同位置分割区的图片,如由RefPicListl[collocated_ref_idx]所指定。
-否则(slice_type等于B,且collocated_from_l0_flag等于1或slice_type等于P),变量colPic指定含有相同位置分割区的图片,如由RefPicList0[collocated_ref_idx]所指定。
2.如下导出右下方相同位置运动向量
xPRb=xP+nPbW   (8-162)
yPRb=yP+nPbH   (8-163)
-如果(yP>>Log2CtbSizeY)等于(yPRb>>Log2CtbSizeY),且xPRb小于pic_width_in_luma_samples,那么以下情形适用。
-变量colPb指定覆盖在由colPic指定的相同位置图片内部的由((xPRb>>4)<<4,(yPRb>>4)<<4)给定的经修改的位置的明度预测块。
-将明度位置(xPCol,yPCol)设定为等于相对于由colPic指定的相同位置图片的左上方明度样本的由colPb指定的相同位置明度预测块的左上方样本。
-使用currPb、colPic、colPb、(xPCol,yPCol)、等于零的 mergeTMVPFlag及refIdxLX作为输入来调用如在子条款8.5.3.1.8中指定的相同位置运动向量的导出过程,且将输出指派给mvLXCol及availableFlagLXCol。
-否则,将mvLXCol的两个分量设定为等于0,且将availableFlagLXCol设定为等于0。
3.在availableFlagLXCol等于0时,如下导出中心相同位置运动向量。
xPCtr=xP+(nPbW>>1)   (8-164)
yPCtr=yP+(nPbH>>1)   (8-165)
-变量colPb指定覆盖colPic内部的由((xPCtr>>4)<<4,(yPCtr>>4)<<4)给定的经修改的位置的明度预测块。
-将明度位置(xPCol,yPCol)设定为等于相对于由colPic指定的相同位置图片的左上方明度样本的由colPb指定的相同位置明度预测块的左上方样本。
-使用currPb、colPic、colPb、(xPCol,yPCol)、等于mergeTMVP的 mergeTMVPFlag及refIdxLX作为输入来调用如在子条款8.5.3.1.8中指定的相同位置运动向量的导出过程,且将输出指派给mvLXCol及availableFlagLXCol。
此外,HEVC工作草案9的章节8.5.3.1.8(用于相同位置运动向量的导出过程)可与章节8.5.3.1.8(如关于第七实例技术所示)相同,但其中对于“mergeTMVP”的每一次出现,用“mergeTMVPFlag”替换“mergeTMVP”。
本发明的第九实例技术类似于上文所描述的第八实例技术。然而,在第九实例技术中,用于具有右下方块的非零参考索引的TMVP导出可在运动信息对于中心块来说不可用的情况下进行。
在第九实例技术中,可如下修改HEVC工作草案9的章节8.5.3.1.7:
8.5.3.1.7用于时间明度运动向量预测的导出过程
到这个过程的输入是
-指定相对于当前图片的左上方明度样本的当前明度预测块的左上方样本的明度位置(xP,yP),
-指定明度预测块的宽度及高度的变量nPbW及nPbH,
-变量mergeTMVP,
-参考索引refIdxLX(其中x为0或1)。
这个过程的输出是
-运动向量预测mvLXCol,
-可用性旗标availableFlagLXCol。
变量currPb指定在明度位置(xP,yP)处的当前明度预测块。
如下导出变量mvLXCol及availableFlagLXCol。
-如果slice_temporal_mvp_enable_flag等于0,那么将mvLXCol的两个分量设定为等于0,且将availableFlagLXCol设定为等于0。
-否则,以下顺序的步骤适用。
1.取决于slice_type、collocated_from_l0_flag及collocated_ref_idx的值,如下导出指定含有相同位置分割区的图片的变量colPic。
-如果slice_type等于B,且collocated_from_l0_flag等于0,那么变量colPic指定含有相同位置分割区的图片,如由RefPicListl[collocated_ref_idx]所指定。
-否则(slice_type等于B,且collocated_from_l0_flag等于1或slice_type等于P),变量colPic指定含有相同位置分割区的图片,如由RefPicList0[collocated_ref_idx]所指定。
2.如下导出右下方相同位置运动向量
xPRb=xP+nPbW   (8-162)
yPRb=yP+nPbH   (8-163)
-如果(yP>>Log2CtbSizeY)等于(yPRb>>Log2CtbSizeY),且xPRb小于pic_width_in_luma_samples,那么以下情形适用。
-变量colPb指定覆盖在由colPic指定的相同位置图片内部的由((xPRb>>4)<<4,(yPRb>>4)<<4)给定的经修改的位置的明度预测块。
-将明度位置(xPCol,yPCol)设定为等于相对于由colPic指定的相同位置图片的左上方明度样本的由colPb指定的相同位置明度预测块的左上方样本。
-xPCtr=xP+(nPbW>>1)
yPCtr=yP+(nPbH>>1)
变量colCtr指定覆盖colPic内部的由((xPCtr>>4)<<4,(yPCtr >>4)<<4)给定的经修改的位置的明度预测块。
-使用currPb、colPic、colPb、(xPCol,yPCol)、等于 mergeTMVP*(!predFlagL0Col[xColCtr][yColCtr]&&!predFlagLlCol[xC olCtr][yColCtr])的mergeTMVPFlag及refIdxLX作为输入来调用如子条款
8.5.3.1.8中指定的相同位置运动向量的导出过程,且将输出指派给mvLXCol及availableFlagLXCol。
-否则,将mvLXCol的两个分量设定为等于0,且将availableFlagLXCol设定为等于0。
3.在availableFlagLXCol等于0时,如下导出中心相同位置运动向量。
xPCtr=xP+(nPbW>>1)   (8-164)
yPCtr=yP+(nPbH>>1)   (8-165)
-变量colPb指定覆盖colPic内部的由((xPCtr>>4)<<4,(yPCtr>>4)<<4)给定的经修改的位置的明度预测块。
-将明度位置(xPCol,yPCol)设定为等于相对于由colPic指定的相同位置图
片的左上方明度样本的由colPb指定的相同位置明度预测块的左上方样本。
-使用currPb、colPic、colPb、(xPCol,yPCol)、等于mergeTMVP的 mergeTMVPFlag及refIdxLX作为输入来调用如在子条款8.5.3.1.8中指定的相同位置运动向量的导出过程,且将输出指派给mvLXCol及availableFlagLXCol。
第十实例技术类似于上文所描述的第八实例技术。然而,在第十实例技术中,如果视频译码器在第一检查中确定右下方块或中心块因不同类型的参考图片而不可用,那么视频译码器可检查右下方块或中心块两次。在第十实例技术中,HEVC工作草案9的章节8.5.3.1.7可以以下方式中的一者进行修改:
8.5.3.1.7用于时间明度运动向量预测的导出过程
到这个过程的输入是
-指定相对于当前图片的左上方明度样本的当前明度预测块的左上方样本的明度位置(xP,yP),
-指定明度预测块的宽度及高度的变量nPbW及nPbH,
-变量mergeTMVPFlag,
-参考索引refIdxLX(其中X为0或1)。
8.5.3.1.7用于时间明度运动向量预测的导出过程
到这个过程的输入是
-指定相对于当前图片的左上方明度样本的当前明度预测块的左上方样本的明度位置(xP,yP),
-指定明度预测块的宽度及高度的变量nPbW及nPbH,
-变量mergeTMVP,
-参考索引refIdxLX(其中X为0或1)。
这个过程的输出是
-运动向量预测mvLXCol,
-可用性旗标availableFlagLXCol。
变量currPb指定在明度位置(xP,yP)处的当前明度预测块。
如下导出变量mvLXCol及availableFlagLXCol。
-如果slice_temporal_mvp_enable_flag等于0,那么将mvLXCol的两个分量设定为等于0,且将availableFlagLXCol设定为等于0。
-否则,以下顺序的步骤适用。
-将变量numLoop设定成0。
-在numLoop小于2及availableFlagLXCol等于1时,以下步骤依序迭代地适用。
1.取决于slice_type、collocated_from_l0_flag及collocated_ref_idx的值,如下导出指定含有相同位置分割区的图片的变量colPic。
-如果slice_type等于B,且collocated_from_l0_flag等于0,那么变量colPic指定含有相同位置分割区的图片,如由RefPicListl[collocated_ref_idx]所指定。
-否则(slice_type等于B,且collocated_from_l0_flag等于1或slice_type等于P),变量colPic指定含有相同位置分割区的图片,如由RefPicList0[collocated_ref_idx]所指定。
2.如下导出右下方相同位置运动向量
xPRb=xP+nPbW   (8-162)
yPRb=yP+nPbH   (8-163)
-如果(yP>>Log2CtbSizeY)等于(yPRb>>Log2CtbSizeY),且xPRb小于pic_width_in_luma_samples,那么以下情形适用。
-变量colPb指定覆盖在由colPic指定的相同位置图片内部的由((xPRb>>4)<<4,(yPRb>>4)<<4)给定的经修改的位置的明度预测块。
-将明度位置(xPCol,yPCol)设定为等于相对于由colPic指定的相同位置图片的左上方明度样本的由colPb指定的相同位置明度预测块的左上方样本。
-使用currPb、colPic、colPb、(xPCol,yPCol)、等于(numLoop与mergeTMVP)的mergeTMVPFlag及refIdxLX作为输入来调用如在子条款8.5.3.1.8中指定的相同位置运动向量的导出过程,且将输出指派给mvLXCol及availableFlagLXCol。
-否则,将mvLXCol的两个分量设定为等于0,且将availableFlagLXCol设定为等于0。
3.在availableFlagLXCol等于0时,如下导出中心相同位置运动向量。
xPCtr=xP+(nPbW>>1)   (8-164)
yPCtr=yP+(nPbH>>1)   (8-165)
-变量colPb指定覆盖colPic内部的由((xPCtr>>4)<<4,(yPCtr>>4)<<4)给定的经修改的位置的明度预测块。
-将明度位置(xPCol,yPCol)设定为等于相对于由colPic指定的相同位置图片的左上方明度样本的由colPb指定的相同位置明度预测块的左上方样本。
-使用currPb、colPic、colPb、(xPCol,yPCol)、等于(numLoop与mergeTMVP)的mergeTMVPFlag及refIdxLX作为输入来调用如在子条款8.5.3.1.8中指定的相同位置运动向量的导出过程,且将输出指派给mvLXCol及availableFlagLXCol。
在上文所示的章节8.5.3.1.7的经修改的版本中,如果mergeTMVP为1及numLoop为1,那么(numLoop与mergeTMVP)传回1,否则,(numLoop与mergeTMVP)传回0。
或者,变量“mergeTMVP”可用“mergeTMVPFlag”替换。此外,在第十实例技术中,章节8.5.3.1.8可与上文所描述的第七实例技术的章节8.5.3.1.8的版本相同。然而,在第十实例技术的章节8.5.3.1.8的版本中,对于“mergeTMVP”的每一次出现,用“mergeTMVPFlag”替换变量“mergeTMVP”。
根据本发明的一些实例技术,视频译码器可从当前PU的空间相邻块导出时间合并候选者的目标参考索引。此外,在时间合并候选者的目标参考索引对应于具有不同于TMVP所指向的参考图片的参考图片类型(例如,时间或视图间)的参考图片时,视频译码器可修改时间合并候选者以指示对应于具有与TMVP的参考图片的类型相同的类型的图片的参考索引值。
根据此些技术,对于给定参考图片列表X(其中X等于0或1),目标参考索引在被修改之后可为一个特定值C或特定值D,所述特定值C或特定值D对于整个切片来说是固定的。C为对应于参考图片列表中的对应于长期(或视图间)参考图片的第一项的参考索引。D为对应于参考图片列表中的对应于短期(或时间)参考图片的第一项的参考索引。C或D等于0。
此外,目标参考索引可表示为“TarIdx_LX”,且TMVP所指向的参考图片可表示为“coRefPic”。在以下各者中的一者为真时,视频译码器可改变TarIdx_LX:
●如果RefPicListX[TarIdx_LX]为时间参考图片及coRefPic为相同位置图片的视图间参考图片。
●如果RefPicListX[TarIdx_LX]为视图间参考图片及coRefPic为相同位置图片的时间参考图片。
在一些实例中,如果上文条件中的一者为真,且如果coRefPic为视图间参考图片,那么视频译码器可将TarIdx_LX设定为C。如果上文条件中的一者为真,且如果coRefPic为时间参考图片,那么视频译码器可将TarIdX_LX设定为D。在上文条件皆不为真时,视频译码器不改变TarIdX_LX。或者,在上文过程中,由“长期参考”替换“视图间参考”,且由“短期参考”替换“时间参考”。
在一个替代实例中,如果RefPicPicX[TarIdx_LX]及coRefPic两者皆为视图间参考图片(即,视差参考图片),那么视频译码器可基于每一视图的AddPicId按比例缩放运动向量。如果AddPicId(RefPicListX[TarIdx_LX])等于TargetAddPicId,那么视频译码器可使TarIdx_LX不变,且将其传回。否则,视频译码器可将目标参考索引设定为TarIdx_LX,且基于AddPicId的差按比例缩放运动向量。在一个实例中,视频译码器可如下确定TMVP的运动向量(表示为“mv”):
mv=mv*(AddPicId(RefPicListX[TarIdx_LX])-AddPicId(当前图片))/(AddPicId(coRefPic)-AddPicId(相同位置图片)),
其中AddPicId可为视图的视图识别符或层识别符。
在另一个替代实例中,视频译码器可在以下条件中的一者为真时改变TarIdx LX:
●如果RefPicListX[TarIdx_LX]为时间参考图片及coRefPic为相同位置图片的视图间参考图片。
●如果RefPicListX[TarIdx_LX]为视图间参考图片及coRefPic为相同位置图片的时间参考图片。
在此实例中,在上文条件皆为真时,视频译码器不改变TarIdx_LX。然而,如果coRefPic为视图间参考图片,那么视频译码器可将TarIdx_LX设定为C。在coRefPic为时间参考图片时,视频译码器可将TarIdx_LX设定为参考索引TIdx,其满足以下情况:RefPicListX[Tidx]的POC值等于coRefPic的值。如果不存在此TIdx,那么视频译码器可将TarIdX_LX设定为D。或者,如果不存在此TIdx,那么视频译码器可将时间合并候选者视为在listX方向上不可用的。
另一实例替代方案类似于先前两个替代实例。然而,在此实例中,视频译码器将D设定为一个预定义时间参考索引。可在切片标头、图片参数集、序列参数集、视频参数集或另一种类型的参数集中用信号发出预定义的值。
此外,可将上文所描述的程序应用于AMVP模式。也就是说,视频译码器可在AMVP模式中使用用于时间MVP候选者的自适应目标参考索引。在将程序应用于AMVP模式时,视频译码器可将TIdx_LX初始化为经解码的参考索引,且视频译码器可将RefPicListX设定为等于当前CU/PU的经解码的参考图片列表。
如上文所提及,在本发明的一些实例技术中,视频译码器在跳过/合并模式内不将经视图间预测的运动向量添加到合并候选者列表,甚至是在经视图间预测的运动向量可用时。而是,根据此些技术,视频译码器可基于空间相邻块的信息确定是否将经视图间预测的运动向量或视图间视差运动向量添加到合并候选者列表。如果视频译码器确定将视图间视差运动向量添加到合并候选者列表,那么视频译码器可将视差向量转换成视图间视差运动向量,且将视图间视差运动向量添加到合并候选者列表中。
根据此些技术,视频译码器可执行合并模式中的自适应视图间候选者选择。举例来说,视图间候选者可为经视图间预测的运动向量或视图间视差运动向量。在经视图间预测的运动向量及视图间视差运动向量两者皆可用时,视频译码器可如下基于所述类型的空间/时间合并候选者(例如,A0、B0、A1、B1、B2及TMVP,如HEVC基本规范中所定义)的频率确定经视图间预测的运动向量及视图间视差运动向量中的哪一者被添加到合并候选者列表。如果存在指向时间参考图片的K个运动向量,且K小于预定义阈值N,那么将视图间视差运动向量添加到合并候选者列表。否则,视频译码器可将经视图间预测的运动向量添加到合并候选者列表。可将N设定成例如1、2、3、4等。或者,如果时间运动向量的数目小于空间合并候选者中的视差运动向量的数目,那么视频译码器可将视图间视差运动向量添加到合并候选者列表。否则,视频译码器可将经视图间预测的运动向量添加到合并候选者列表。
在替代实例中,在经视图间预测的运动向量及视图间视差运动向量两者皆可用时,视频译码器可基于空间/时间合并候选者的运动复杂性确定经视图间预测的运动向量及视图间视差运动向量中的哪一者被添加到合并候选者列表。举例来说,如果运动复杂性大于给定阈值,那么视频译码器可将视图间视差运动向量添加到合并候选者列表。否则,视频译码器可将经视图间预测的运动向量添加到合并候选者列表。在一些实例中,运动复杂性可由运动向量的水平及垂直值的平方和定义。在其它实例中,运动复杂性可由运动向量的水平及垂直值的绝对值的和定义。在另一实例中,在经视图间预测的运动向量及视图间视差运动向量两者皆可用时,视频译码器可将经视图间预测的运动向量及视图间视差运动向量两者添加到合并候选者列表。
如上文所指示,视频译码器可根据本发明的一些实例技术在视差向量导出过程期间从相邻块收集多个可用视差运动向量。视频译码器可使用视差运动向量的平均数(例如,中值)或平均值作为导出的视差向量。在一些实例中,多个可用视差运动向量可为来自空间/时间相邻块的所有可用的视差运动向量。或者,多个可用视差运动向量可为来自空间/时间相邻块的前N个可用视差运动向量,其中N可为2、3、4、5及6。
多个视差运动向量的平均数(例如,中值)被定义为其水平/垂直值为视差运动向量的水平/垂直值的平均数的向量。在一个替代方案中,将平均数视差向量的垂直值设定成0。在另一个替代方案中,视频译码器可将平均数视差运动向量设定为多个视差运动向量当中的具有等于多个视差向量的水平值的平均值的水平值的视差向量。在存在具有等于中值的相同水平值的两个或两个以上视差运动向量时,视频译码器可使用第一可用视差运动向量作为最终视差向量。
在一个实例中,视差运动向量可为相邻块所使用的运动向量,且视差运动向量可指向视图间参考图片。在替代实例中,视频译码器还可将当前PU的空间或时间相邻PU在视图间运动预测中使用的隐式视差向量视为视差运动向量。如果使用视图间运动预测译码当前PU的在空间上或在时间上相邻的PU,那么在空间上或在时间上相邻的PU的视差向量为隐式视差向量。
根据本发明的另一实例技术,视频译码器可在合并模式中使用自适应视图间候选者位置。举例来说,在合并/跳过模式中,视频译码器可基于空间相邻块的信息确定是否在第一可用空间合并候选者之前或之后的位置处将视图间候选者插入到合并候选者列表中。视图间候选者可为经视图间预测的运动向量或视图间视差运动向量。也就是说,视图间候选者进入到合并候选者列表中可基于空间相邻块的运动信息。
假设空间相邻块的K个运动向量(例如,A0、B0、A1、B1、B2)指向时间参考图片,且J个运动向量指向视图间参考图片。如果K小于J,且视图间候选者还指向时间参考图片(添加经视图间预测的运动向量),或如果K大于J,且视图间候选者指向视图间参考图片(添加视图间视差向量),那么视频译码器可在合并候选者列表中的第M个空间合并候选者之后插入合并候选者。在各种实例中,M可为1、2、3、4等。
在替代实例中,如果以下条件中的一者为真,那么视频译码器可在第一可用空间合并候选者之后插入视图间候选者。
●第一可用空间合并候选者的运动向量指向时间参考图片,且视图间候选者指向视图间参考图片。
●第一可用空间合并候选者的运动向量指向视图间参考图片,且视图间候选者指向时间参考图片。
在上文条件皆不为真时,视频译码器可在所有空间合并候选者之前插入视图间候选者。
图9是说明根据本发明的一或多个技术的视频解码器30的实例操作的流程图。在图9的实例中,第一参考索引值指示第一参考图片的在与当前图片的当前PU相关联的参考图片列表内的位置。在一些实例中,第一参考索引值等于0。相同位置图片的相同位置PU的参考索引指示第二参考图片的在与相同位置图片的相同位置PU相关联的参考图片列表内的位置。
在图9的实例中,视频解码器30可确定第一参考图片及第二参考图片所述属于不同参考图片类型(200)。在一个实例中,第一参考图片的参考图片类型可为以下两者中的一者:时间参考图片类型或视差参考图片类型。在此实例中,第二参考图片的参考图片类型可为时间参考图片类型及视差参考图片类型中的一者。在另一实例中,第一参考图片的参考图片类型为短期参考图片类型或长期参考图片类型中的一者。在此实例中,第二参考图片的参考图片类型为短期参考图片类型及长期参考图片类型中的一者。如果参考图片在当前图片的RefPicSetStCurrBefore或RefPicSetStCurrAfter参考图片子集(或在一些实例中,RefPicSetStFollBefore或RefPicSetStFollAfter参考图片子集)中,那么参考图片可属于短期参考图片类型。如果参考图片在当前图片的RefPicSetLtCurr参考图片子集(或在一些实例中,RefPicSetLtFoll参考图片子集)中,那么参考图片可属于长期参考图片类型。
在第一参考图片及第二参考图片属于不同参考图片类型(200的“是”)时,视频解码器30可将时间合并候选者的参考索引设定为第二参考索引值(202)。第二参考索引值可不同于第一参考索引值。第二参考索引值可指示第三参考图片的在与当前图片相关联的参考图片列表内的位置。在一些实例中,第三参考图片及第二参考图片属于相同参考图片类型。然而,在第一参考图片及第二参考图片属于相同参考图片类型时,时间合并候选者的参考索引可保持等于第一参考索引值。此外,在一些实例中,在切片标头中用信号发出第二参考索引值。
在一些实例中,在第一参考图片属于时间参考图片类型,且第二参考图片属于视差参考图片类型时,视频解码器30设定时间合并候选者的参考索引以使得时间合并候选者的参考索引指示视差参考图片的参考图片列表中的最早位置。此外,在一些实例中,在第一参考图片属于视差参考图片类型,且第二参考图片属于时间参考图片类型时,视频解码器30可设定时间合并候选者的参考索引以使得时间合并候选者的参考索引指示时间参考图片的参考图片列表中的最早位置。
如上文所指示,在一些实例中,第一参考图片及第二参考图片中的任一者或两者可为短期参考图片或长期参考图片。在一些此类实例中,在第一参考图片及第二参考图片属于不同参考图片类型时,视频解码器30可设定时间合并候选者的参考索引以使得时间合并候选者的参考索引指示参考图片列表中的含有属于与第二参考图片相同的参考图片类型的参考图片的最早位置。
此外,视频解码器30可从包含时间合并候选者的合并候选者列表中的多个合并候选者当中确定选定的合并候选者(204)。在一些实例中,视频解码器30可从位流获得指示选定的合并候选者的合并候选者列表中的位置的语法元素。视频解码器30可至少部分基于由选定的合并候选者指定的运动信息确定当前视频单元的预测性块(206)。另外,视频解码器30可至少部分基于当前视频单元的预测性块产生经重建构样本块(208)。
图10为说明根据本发明的一或多个技术的视频编码器20的实例操作的流程图。在图10的实例中,第一参考索引值指示第一参考图片的在与当前图片的当前PU相关联的参考图片列表内的位置。在一些实例中,第一参考索引值等于0。相同位置图片的相同位置PU的参考索引指示第二参考图片的在与相同位置图片的相同位置PU相关联的参考图片列表内的位置。
此外,在图10的实例中,视频编码器20可确定第一参考图片及第二参考图片是否属于不同参考图片类型(250)。在一个实例中,第一参考图片的参考图片类型可为以下两者中的一者:时间参考图片类型或视差参考图片类型。在此实例中第二参考图片的参考图片类型可为以下两者中的一者:时间参考图片类型及视差参考图片类型。在另一实例中,第一参考图片的参考图片类型为以下两者中的一者:短期参考图片类型一长期参考图片类型。在此实例中第二参考图片的参考图片类型为以下两者中的一者:短期参考图片类型及长期参考图片类型。
在第一参考图片及第二参考图片属于不同参考图片类型(250的“是”)时,视频编码器20可将时间合并候选者的参考索引设定为第二参考索引值(252)。第二参考索引值可不同于第一参考索引值。第二参考索引值可指示第三参考图片的在与当前图片相关联的参考图片列表内的位置。在一些实例中,第三参考图片及第二参考图片属于相同参考图片类型。然而,在第一参考图片及第二参考图片属于相同参考图片类型时,时间合并候选者的参考索引可保持等于第一参考索引值。此外,在一些实例中,在切片标头中用信号发出第二参考索引值。
在一些实例中,在第一参考图片属于时间参考图片类型,且第二参考图片属于视差参考图片类型时,视频编码器20设定时间合并候选者的参考索引以使得时间合并候选者的参考索引指示视差参考图片的参考图片列表中的最早位置。此外,在一些实例中,在第一参考图片属于视差参考图片类型,且第二参考图片属于时间参考图片类型时,视频编码器20可设定时间合并候选者的参考索引以使得时间合并候选者的参考索引指示时间参考图片的参考图片列表中的最早位置。
如上文所指示,在一些实例中,第一参考图片及第二参考图片中的任一者或两者可为短期参考图片或长期参考图片。在一些此类实例中,在第一参考图片及第二参考图片属于不同参考图片类型时,视频编码器20可设定时间合并候选者的参考索引以使得时间合并候选者的参考索引指示参考图片列表中的含有属于与第二参考图片相同的参考图片类型的参考图片的最早位置。
另一方面,在一些实例中,在第一参考图片及第二参考图片不属于不同参考图片类型(250的“否”)时或在将时间合并候选者的参考索引设定为第二参考索引值之后,视频编码器20可从包含时间合并候选者的合并候选者列表中的多个合并候选者当中确定选定的合并候选者(254)。在一些实例中,视频编码器20可基于速率/失真分析来确定选定的合并候选者。此外,视频编码器20可产生包含识别合并候选者列表中的选定的合并候选者的数据的位流(256)。
图11是说明根据本发明的一或多个实例技术的视频编码器20的实例操作的流程图。在图11的实例中,视频编码器20可接收视频数据(300)。视频编码器20可对视频数据的每一图片执行在框302中的动作。在图11的实例中,视频编码器20可确定当前图片的参考图片子集(304)。视频编码器20可对当前图片的每一P或B切片执行在框306中的动作。举例来说,视频编码器20可产生当前切片的一或多个参考图片列表(308)。视频编码器20可对当前切片的每一CU执行在框310中的动作。此外,视频编码器20可对当前CU的每一PU执行在框312中的动作。在图11的实例中,视频编码器20可产生当前PU的合并候选者列表的空间合并候选者(314)。另外,视频编码器20可产生当前PU的合并候选者列表的时间合并候选者(316)。视频编码器20可根据本发明的技术中的一者产生时间合并候选者。此外,视频编码器20可产生当前CU的其它语法结构(318)。视频编码器20可产生包含视频数据的经编码表示的位流(320)。视频数据的经编码表示可包含指示PU的合并候选者清单中的选定的合并候选者的语法元素。
图12是说明根据本发明的一或多个实例技术的视频解码器30的实例操作的流程图。在图12的实例中,视频解码器30可接收包含视频数据的经编码表示的位流(350)。视频解码器30可对视频数据的每一图片执行在框352中的动作。在图12的实例中,视频解码器30可确定当前图片的参考图片子集(354)。视频解码器30可对当前图片的每一P或B切片执行在框356中的动作。举例来说,视频解码器30可产生当前切片的一或多个参考图片列表(358)。视频解码器30可对当前切片的每一CU执行在框360中的动作。此外,视频解码器30可对当前CU的每一PU执行在框362中的动作。在图12的实例中,视频解码器30可产生当前PU的合并候选者列表的空间合并候选者(364)。另外,视频解码器30可产生当前PU的合并候选者列表的时间合并候选者(366)。视频解码器30可根据本发明的技术中的一者产生时间合并候选者。此外,视频解码器30可重建构当前CU的译码块(368)。在一些情况下,视频解码器30可使用由合并候选者列表中的选定的合并候选者指定的运动信息来重建构当前CU的译码块。通过重建构每一图片的每一切片的CU的译码块,视频解码器30可重建构视频数据。视频解码器30可输出视频数据(370)。
在一或多个实例中,所描述的功能可以用硬件、软件、固件或其任何组合来实施。如果用软件实施,那么所述功能可以作为一或多个指令或代码在计算机可读媒体上存储或发射,并且由基于硬件的处理单元来执行。计算机可读媒体可包含计算机可读存储媒体,其对应于有形媒体,例如数据存储媒体,或包括任何促进将计算机程序从一处传送到另一处的媒体(例如,根据通信协议)的通信媒体。以此方式,计算机可读媒体通常可对应于(1)为非暂时性的有形计算机可读存储媒体或(2)例如信号或载波等通信媒体。数据存储媒体可为可由一或多个计算机或一或多个处理器存取以检索用于实施本发明中描述的技术的指令、代码及/或数据结构的任何可用媒体。计算机程序产品可以包含计算机可读媒体。
借助于实例而非限制,此类计算机可读存储媒体可包含RAM、ROM、EEPROM、CD-ROM或其它光盘存储装置、磁盘存储装置或其它磁性存储装置、快闪存储器或任何其它可用来存储指令或数据结构的形式的期望程序代码并且可由计算机存取的媒体。同样,任何连接可恰当地称为计算机可读媒体。举例来说,如果使用同轴电缆、光纤缆线、双绞线、数字订户线(DSL)或例如红外线、无线电和微波等无线技术从网站、服务器或其它远程源传输指令,那么同轴电缆、光纤缆线、双绞线、DSL或例如红外线、无线电和微波等无线技术包括在媒体的定义中。然而,应理解,计算机可读存储媒体和数据存储媒体并不包含连接、载波、信号或其它暂时性媒体,而是实际上针对于非暂时性有形存储媒体。如本文所使用,磁盘及光盘包含压缩光盘(CD)、激光光盘、光学光盘、数字多功能光盘(DVD)、软性磁盘及蓝光光盘,其中磁盘通常以磁性方式复制数据,而光盘使用激光以光学方式复制数据。上文的组合也应包含在计算机可读媒体的范围内。
指令可以由一或多个处理器执行,所述一或多个处理器例如是一或多个数字信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、现场可编程逻辑阵列(FPGA)或其它等效的集成或离散逻辑电路。因此,如本文中所使用的术语“处理器”可指上述结构或适合于实施本文中所描述的技术的任一其它结构中的任一者。另外,在一些方面中,本文中所描述的功能性可以在经配置用于编码和解码的专用硬件和/或软件模块内提供,或者并入在组合编解码器中。并且,可将所述技术完全实施于一或多个电路或逻辑元件中。
本发明的技术可实施于广泛多种装置或设备中,包含无线手持机、集成电路(IC)或一组IC(例如,芯片组)。本发明中描述各种组件、模块或单元是为了强调经配置以执行所揭示技术的装置的功能方面,但未必需要通过不同硬件单元实现。实际上,如上文所描述,各种单元可以结合合适的软件及/或固件组合在编码解码器硬件单元中,或者通过互操作硬件单元的集合来提供,所述硬件单元包含如上文所描述的一或多个处理器。
已描述各种实例。这些及其它实例在所附权利要求书的范围内。

Claims (38)

1.一种解码视频数据的方法,其中:
第一参考索引值指示第一参考图片的在与当前图片的当前预测单元PU相关联的参考图片列表内的位置,
相同位置图片的相同位置PU的参考索引指示第二参考图片的在与所述相同位置图片的所述相同位置PU相关联的参考图片列表内的位置,且
所述方法包括:
在所述第一参考图片及所述第二参考图片属于不同参考图片类型时,将时间合并候选者的参考索引设定为第二参考索引值,所述第二参考索引值不同于所述第一参考索引值;
从包含所述时间合并候选者的合并候选者列表中的多个合并候选者当中确定选定的合并候选者;
至少部分基于由所述选定的合并候选者指定的运动信息确定所述当前PU的预测性块;及
至少部分基于所述当前PU的所述预测性块产生经重建构样本块。
2.根据权利要求1所述的方法,其中在所述第一参考图片及所述第二参考图片属于相同参考图片类型时,所述时间合并候选者的所述参考索引仍然等于所述第一参考索引值。
3.根据权利要求1所述的方法,其中所述第一参考索引值等于0。
4.根据权利要求1所述的方法,其中:
所述第二参考索引值指示第三参考图片的在与所述当前图片的所述当前PU相关联的所述参考图片列表内的位置,且
所述第三参考图片及所述第二参考图片属于相同参考图片类型。
5.根据权利要求4所述的方法,其中所述第三参考图片为在与所述当前图片的所述当前PU相关联的所述参考图片列表内的属于与所述第二参考图片相同的参考图片类型的最早参考图片。
6.根据权利要求4所述的方法,其中在切片标头中用信号发出所述第二参考索引值。
7.根据权利要求1所述的方法,其中:
所述第一参考图片的参考图片类型为以下两者中的一者:短期参考图片类型及长期参考图片类型,且
所述第二参考图片的参考图片类型为以下两者中的一者:所述短期参考图片类型及所述长期参考图片类型。
8.根据权利要求1所述的方法,其中:
所述第一参考图片的参考图片类型为以下两者中的一者:时间参考图片类型及视差参考图片类型,且
所述第二参考图片的参考图片类型为以下两者中的一者:所述时间参考图片类型及所述视差参考图片类型。
9.根据权利要求1所述的方法,其中所述相同位置PU为覆盖所述相同位置图片的相同位置区的中心块的PU,或覆盖所述相同位置图片的所述相同位置区的右下方块的PU,所述相同位置区与所述当前PU位于相同位置。
10.根据权利要求1所述的方法,其中所述相同位置图片与不同于所述当前图片的时间实例相关联。
11.一种编码视频数据的方法,其中:
第一参考索引值指示第一参考图片的在与当前图片的当前预测单元PU相关联的参考图片列表内的位置,
相同位置图片的相同位置PU的参考索引指示第二参考图片的在与所述相同位置图片的所述相同位置PU相关联的参考图片列表内的位置,且
所述方法包括:
在所述第一参考图片及所述第二参考图片属于不同参考图片类型时,将时间合并候选者的参考索引设定为第二参考索引值,所述第二参考索引值不同于所述第一参考索引值;
从包含所述时间合并候选者的合并候选者列表中的多个合并候选者当中确定选定的合并候选者;及
产生包含识别在所述合并候选者列表内的所述选定的合并候选者的数据的位流。
12.根据权利要求11所述的方法,其中在所述第一参考图片及所述第二参考图片属于相同参考图片类型时,所述时间合并候选者的所述参考索引仍然等于所述第一参考索引值。
13.根据权利要求11所述的方法,其中所述第一参考索引值等于0。
14.根据权利要求11所述的方法,其中:
所述第二参考索引值指示第三参考图片的在与所述当前图片的所述当前PU相关联的所述参考图片列表内的位置,且
所述第三参考图片及所述第二参考图片属于相同参考图片类型。
15.根据权利要求14所述的方法,其中所述第三参考图片为在与所述当前图片的所述当前PU相关联的所述参考图片列表内的属于与所述第二参考图片相同的参考图片类型的最早参考图片。
16.根据权利要求14所述的方法,其进一步包括在切片标头中用信号发出所述第二参考索引值。
17.根据权利要求11所述的方法,其中:
所述第一参考图片的参考图片类型为以下两者中的一者:短期参考图片类型及长期参考图片类型,且
所述第二参考图片的参考图片类型为以下两者中的一者:所述短期参考图片类型及所述长期参考图片类型。
18.根据权利要求11所述的方法,其中:
所述第一参考图片的参考图片类型为以下两者中的一者:时间参考图片类型及视差参考图片类型,且
所述第二参考图片的参考图片类型为以下两者中的一者:所述时间参考图片类型及所述视差参考图片类型。
19.根据权利要求11所述的方法,其中所述相同位置PU为覆盖所述相同位置图片的相同位置区的中心块的PU,或覆盖所述相同位置图片的所述相同位置区的右下方块的PU,所述相同位置区与所述当前PU位于相同位置。
20.根据权利要求11所述的方法,其中所述相同位置图片与不同于所述当前图片的时间实例相关联。
21.一种包括一或多个处理器的视频译码器,
其中第一参考索引值指示第一参考图片的在与当前图片的当前预测单元PU相关联的参考图片列表内的位置,
其中相同位置图片的相同位置PU的参考索引指示第二参考图片的在与所述相同位置图片的所述相同位置PU相关联的参考图片列表内的位置,且
其中所述一或多个处理器经配置以使得在所述第一参考图片及所述第二参考图片属于不同参考图片类型时,所述一或多个处理器将所述当前PU的合并候选者列表中的时间合并候选者的参考索引设定为第二参考索引值,所述第二参考索引值不同于所述第一参考索引值。
22.根据权利要求21所述的视频译码器,其中在所述第一参考图片及所述第二参考图片属于相同参考图片类型时,所述时间合并候选者的所述参考索引仍然等于所述第一参考索引值。
23.根据权利要求21所述的视频译码器,其中所述第一参考索引值等于0。
24.根据权利要求21所述的视频译码器,其中:
所述第二参考索引值指示第三参考图片的在与所述当前图片的所述当前PU相关联的所述参考图片列表内的位置,且
所述第三参考图片及所述第二参考图片属于相同参考图片类型。
25.根据权利要求24所述的视频译码器,其中所述第三参考图片为在与所述当前图片的所述当前PU相关联的所述参考图片列表内的属于与所述第二参考图片相同的参考图片类型的最早参考图片。
26.根据权利要求24所述的视频译码器,其中在切片标头中用信号发出所述第二参考索引值。
27.根据权利要求21所述的视频译码器,其中:
所述第一参考图片的参考图片类型为以下两者中的一者:短期参考图片类型及长期参考图片类型,且
所述第二参考图片的参考图片类型为以下两者中的一者:所述短期参考图片类型及所述长期参考图片类型。
28.根据权利要求21所述的视频译码器,其中:
所述第一参考图片的参考图片类型为以下两者中的一者:时间参考图片类型及视差参考图片类型,且
所述第二参考图片的参考图片类型为以下两者中的一者:所述时间参考图片类型及所述视差参考图片类型。
29.根据权利要求21所述的视频译码器,其中所述相同位置PU为覆盖所述相同位置图片的相同位置区的中心块的PU,或覆盖所述相同位置图片的所述相同位置区的右下方块的PU,所述相同位置区与所述当前PU位于相同位置。
30.根据权利要求21所述的视频译码器,其中所述相同位置图片与不同于所述当前图片的时间实例相关联。
31.根据权利要求21所述的视频译码器,其中所述一或多个处理器经配置以编码视频数据。
32.根据权利要求31所述的视频译码器,其中所述一或多个处理器经配置以:
从包含所述时间合并候选者的合并候选者列表中的多个合并候选者当中确定选定的合并候选者;及
产生包含识别在所述合并候选者列表内的所述选定的合并候选者的数据的位流。
33.根据权利要求21所述的视频译码器,其中所述一或多个处理器经配置以解码视频数据。
34.根据权利要求33所述的视频译码器,其中所述一或多个处理器经配置以:
从包含所述时间合并候选者的合并候选者列表中的多个合并候选者当中确定选定的合并候选者;
至少部分基于由所述选定的合并候选者指定的运动信息确定所述当前PU的预测性块;及
至少部分基于所述当前PU的所述预测性块产生经重建构样本块。
35.一种视频译码器,其包括:
用于在第一参考图片及第二参考图片属于不同参考图片类型时将当前预测单元PU的合并候选者列表的时间合并候选者的参考索引设定为第一参考索引值的构件,
其中第二参考索引值指示所述第一参考图片的在与所述当前PU相关联的参考图片列表内的位置,所述第二参考索引值不同于所述第一参考索引值,且
其中相同位置图片的相同位置PU的参考索引指示所述第二参考图片的在与所述相同位置PU相关联的参考图片列表内的位置。
36.根据权利要求35所述的视频译码器,其中在所述第一参考图片及所述第二参考图片属于相同参考图片类型时,所述时间合并候选者的所述参考索引仍然等于所述第一参考索引值。
37.一种存储指令的计算机可读存储媒体,所述指令在执行时配置视频译码器以在第一参考图片及第二参考图片属于不同参考图片类型时将当前预测单元PU的合并候选者列表的时间合并候选者的参考索引设定为第一参考索引值,
其中第二参考索引值指示所述第一参考图片的在与所述当前PU相关联的参考图片列表内的位置,所述第二参考索引值不同于所述第一参考索引值,且
其中相同位置图片的相同位置PU的参考索引指示所述第二参考图片的在与所述相同位置PU相关联的参考图片列表内的位置。
38.根据权利要求37所述的计算机可读存储媒体,其中在所述第一参考图片及所述第二参考图片属于相同参考图片类型时,所述时间合并候选者的所述参考索引仍然等于所述第一参考索引值。
CN201380036235.XA 2012-07-09 2013-07-09 解码与编码视频数据的方法、视频译码器以及计算机可读存储媒体 Active CN104838656B (zh)

Applications Claiming Priority (13)

Application Number Priority Date Filing Date Title
US201261669575P 2012-07-09 2012-07-09
US61/669,575 2012-07-09
US201261673982P 2012-07-20 2012-07-20
US61/673,982 2012-07-20
US201261694623P 2012-08-29 2012-08-29
US61/694,623 2012-08-29
US201261708508P 2012-10-01 2012-10-01
US61/708,508 2012-10-01
US201261747807P 2012-12-31 2012-12-31
US61/747,807 2012-12-31
US13/937,130 US9325990B2 (en) 2012-07-09 2013-07-08 Temporal motion vector prediction in video coding extensions
US13/937,130 2013-07-08
PCT/US2013/049751 WO2014011652A2 (en) 2012-07-09 2013-07-09 Temporal motion vector prediction in video coding extensions

Publications (2)

Publication Number Publication Date
CN104838656A true CN104838656A (zh) 2015-08-12
CN104838656B CN104838656B (zh) 2018-04-17

Family

ID=49913981

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201380036235.XA Active CN104838656B (zh) 2012-07-09 2013-07-09 解码与编码视频数据的方法、视频译码器以及计算机可读存储媒体

Country Status (5)

Country Link
US (1) US9325990B2 (zh)
EP (1) EP2870767B1 (zh)
JP (1) JP6321003B2 (zh)
CN (1) CN104838656B (zh)
WO (1) WO2014011652A2 (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109089119A (zh) * 2017-06-13 2018-12-25 浙江大学 一种运动矢量预测的方法及设备
TWI674795B (zh) * 2017-05-10 2019-10-11 聯發科技股份有限公司 用於視訊編解碼的重新排序運動向量預測候選集的方法及裝置
CN110677658A (zh) * 2018-07-01 2020-01-10 北京字节跳动网络技术有限公司 基于优先级的非相邻Merge设计
CN110809164A (zh) * 2018-08-04 2020-02-18 北京字节跳动网络技术有限公司 Bio中的mv精度
WO2020094073A1 (en) * 2018-11-06 2020-05-14 Beijing Bytedance Network Technology Co., Ltd. Ordered motion candidate list generation using geometric partitioning mode
CN112352424A (zh) * 2018-07-02 2021-02-09 华为技术有限公司 用于运动矢量预测的方法和装置
US11109055B2 (en) 2018-08-04 2021-08-31 Beijing Bytedance Network Technology Co., Ltd. MVD precision for affine
US11778170B2 (en) 2018-10-06 2023-10-03 Beijing Bytedance Network Technology Co., Ltd Temporal gradient calculations in bio

Families Citing this family (48)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102139535B1 (ko) * 2007-10-16 2020-07-30 엘지전자 주식회사 비디오 신호 처리 방법 및 장치
PL231159B1 (pl) 2011-09-09 2019-01-31 Kt Corp Sposób uzyskiwania czasowego predykcyjnego wektora ruchu i urządzenie do stosowania tego sposobu
IN2014CN02377A (zh) 2011-09-29 2015-06-19 Sharp Kk
CN103828364B (zh) * 2011-09-29 2018-06-12 夏普株式会社 图像解码装置、图像解码方法及图像编码装置
WO2013156678A1 (en) * 2012-04-16 2013-10-24 Nokia Corporation An apparatus, a method and a computer program for video coding and decoding
WO2014005280A1 (en) * 2012-07-03 2014-01-09 Mediatek Singapore Pte. Ltd. Method and apparatus to improve and simplify inter-view motion vector prediction and disparity vector prediction
EP2878125A4 (en) * 2012-07-27 2016-10-12 Hfi Innovation Inc CONSTRAINED DISPARITY VECTOR DERIVATION METHOD IN 3D VIDEO CODING
US9491461B2 (en) * 2012-09-27 2016-11-08 Qualcomm Incorporated Scalable extensions to HEVC and temporal motion vector prediction
US10075728B2 (en) * 2012-10-01 2018-09-11 Inria Institut National De Recherche En Informatique Et En Automatique Method and device for motion information prediction refinement
CN102883163B (zh) * 2012-10-08 2014-05-28 华为技术有限公司 用于运动矢量预测的运动矢量列表建立的方法、装置
US9674542B2 (en) * 2013-01-02 2017-06-06 Qualcomm Incorporated Motion vector prediction for video coding
EP3490259B1 (en) * 2013-04-02 2021-10-13 InterDigital Madison Patent Holdings, SAS Enhanced temporal motion vector prediction for scalable video coding
MX344186B (es) * 2013-04-12 2016-12-08 Ericsson Telefon Ab L M Construccion de listas de imagenes de referencia entre capas.
US10419776B2 (en) * 2013-07-09 2019-09-17 Sony Corporation High level syntax improvement on inter-layer prediction for SHVC/MV-HEVC
WO2015008464A1 (en) * 2013-07-14 2015-01-22 Sharp Kabushiki Kaisha Video parameter set signaling
US10284862B2 (en) * 2013-07-14 2019-05-07 Sharp Kabushiki Kaisha Signaling indications and constraints
KR20150026927A (ko) * 2013-09-03 2015-03-11 주식회사 케이티 스케일러블 비디오 신호 인코딩/디코딩 방법 및 장치
JP2017513426A (ja) * 2014-03-14 2017-05-25 サムスン エレクトロニクス カンパニー リミテッド 類型情報を利用した、マルチレイヤビデオ符号化方法及びマルチレイヤビデオ復号方法
WO2015143603A1 (en) * 2014-03-24 2015-10-01 Mediatek Singapore Pte. Ltd. An improved method for temporal motion vector prediction in video coding
KR20170065502A (ko) * 2014-10-08 2017-06-13 엘지전자 주식회사 3d 비디오 부호화/복호화 방법 및 장치
US11477477B2 (en) * 2015-01-26 2022-10-18 Qualcomm Incorporated Sub-prediction unit based advanced temporal motion vector prediction
US20170374361A1 (en) * 2015-01-28 2017-12-28 Beamr Imaging Ltd. Method and System Of Controlling A Video Content System
WO2016143972A1 (ko) * 2015-03-11 2016-09-15 엘지전자(주) 비디오 신호의 인코딩/디코딩 방법 및 장치
US11330284B2 (en) 2015-03-27 2022-05-10 Qualcomm Incorporated Deriving motion information for sub-blocks in video coding
KR20230091200A (ko) * 2015-12-14 2023-06-22 파나소닉 인텔렉츄얼 프로퍼티 코포레이션 오브 아메리카 삼차원 데이터 부호화 방법, 삼차원 데이터 복호 방법, 삼차원 데이터 부호화 장치 및 삼차원 데이터 복호 장치
CN116567226A (zh) * 2016-08-11 2023-08-08 Lx 半导体科技有限公司 图像编码/解码设备和图像数据的发送设备
US10778976B2 (en) * 2016-09-28 2020-09-15 Sharp Kabushiki Kaisha Image decoding apparatus and image coding apparatus
CN117221574A (zh) * 2016-10-04 2023-12-12 英迪股份有限公司 图像解码方法、图像编码方法以及发送比特流的方法
US10582209B2 (en) * 2017-03-30 2020-03-03 Mediatek Inc. Sub-prediction unit temporal motion vector prediction (sub-PU TMVP) for video coding
EP3410717A1 (en) * 2017-05-31 2018-12-05 Thomson Licensing Methods and apparatus for candidate list pruning
US10911769B2 (en) 2017-06-23 2021-02-02 Qualcomm Incorporated Motion-based priority for the construction of candidate lists in video coding
CN110419217B (zh) 2018-04-02 2023-09-26 深圳市大疆创新科技有限公司 用于图像处理的方法和图像处理装置
KR20210008105A (ko) 2018-05-30 2021-01-20 디지털인사이트 주식회사 영상 부호화/복호화 방법 및 장치
US10469869B1 (en) * 2018-06-01 2019-11-05 Tencent America LLC Method and apparatus for video coding
MX2021002951A (es) * 2018-09-12 2021-07-15 Huawei Tech Co Ltd Un codificador de video, un decodificador de video y metodos correspondientes.
WO2020084554A1 (en) 2018-10-24 2020-04-30 Beijing Bytedance Network Technology Co., Ltd. Searching based motion candidate derivation for sub-block motion vector prediction
US10917636B2 (en) * 2018-12-03 2021-02-09 Tencent America LLC Method and apparatus for video coding
CN116582666A (zh) 2018-12-13 2023-08-11 Jvc建伍株式会社 图像解码装置和方法、以及图像编码装置和方法
JP6933235B2 (ja) * 2018-12-13 2021-09-08 株式会社Jvcケンウッド 画像復号装置、画像復号方法、及び画像復号プログラム
CN113498609B (zh) * 2018-12-31 2023-06-20 北京达佳互联信息技术有限公司 用于视频编解码的依赖图片分辨率的配置
WO2020177704A1 (en) * 2019-03-04 2020-09-10 Beijing Bytedance Network Technology Co., Ltd. In-loop filtering in video processing
CN109842811B (zh) * 2019-04-03 2021-01-19 腾讯科技(深圳)有限公司 一种在视频中植入推送信息的方法、装置及电子设备
US11039150B2 (en) * 2019-04-19 2021-06-15 Tencent America LLC Method and apparatus for video coding
CN114402591A (zh) 2019-09-13 2022-04-26 北京字节跳动网络技术有限公司 并置运动矢量的推导
CA3152464C (en) * 2019-09-24 2024-05-14 Xiang Ma Methods and systems to signal inter-layer enabled syntax element in video coding
CN114600462A (zh) * 2019-10-25 2022-06-07 夏普株式会社 用于在视频编码中发送信号通知图片信息的系统和方法
EP4115605A4 (en) * 2020-03-30 2023-11-15 ByteDance Inc. CONSTRAINTS ON COLLOCATED IMAGES IN VIDEO CODING
US20230388485A1 (en) * 2022-05-26 2023-11-30 Tencent America LLC Subblock based motion vector predictor displacement vector reordering using template matching

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102131094A (zh) * 2010-01-18 2011-07-20 联发科技股份有限公司 运动预测方法
CN102223543A (zh) * 2011-06-13 2011-10-19 四川虹微技术有限公司 参考像素读取存储系统
US20120128060A1 (en) * 2010-11-23 2012-05-24 Mediatek Inc. Method and Apparatus of Spatial Motion Vector Prediction
US20120134415A1 (en) * 2010-11-29 2012-05-31 Mediatek Inc. Method and Apparatus of Extended Motion Vector Predictor

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004006586A1 (ja) * 2002-07-02 2004-01-15 Matsushita Electric Industrial Co., Ltd. 画像符号化方法および画像復号化方法
KR101120648B1 (ko) * 2006-10-16 2012-03-23 노키아 코포레이션 멀티뷰 비디오 코딩에서 효율적인 디코딩된 버퍼 관리를 구현하기 위한 시스템 및 방법
US9049455B2 (en) * 2010-12-28 2015-06-02 Panasonic Intellectual Property Corporation Of America Image coding method of coding a current picture with prediction using one or both of a first reference picture list including a first current reference picture for a current block and a second reference picture list including a second current reference picture for the current block
US9635382B2 (en) 2011-01-07 2017-04-25 Texas Instruments Incorporated Method, system and computer program product for determining a motion vector
US9924188B2 (en) * 2011-01-07 2018-03-20 Lg Electronics Inc. Method for encoding and decoding image information to determine reference index in skip mode or merge mode and device using same
US9560352B2 (en) * 2011-01-28 2017-01-31 Sun Patent Trust Image coding method and image decoding method
US9485517B2 (en) 2011-04-20 2016-11-01 Qualcomm Incorporated Motion vector prediction with motion vectors from multiple views in multi-view video coding
US9866859B2 (en) * 2011-06-14 2018-01-09 Texas Instruments Incorporated Inter-prediction candidate index coding independent of inter-prediction candidate list construction in video coding
AU2012269583B2 (en) 2011-06-15 2015-11-26 Hfi Innovation Inc. Method and apparatus of motion and disparity vector prediction and compensation for 3D video coding
WO2013001749A1 (ja) * 2011-06-29 2013-01-03 パナソニック株式会社 画像符号化方法、画像復号方法、画像符号化装置、画像復号装置および画像符号化復号装置
US20130114717A1 (en) 2011-11-07 2013-05-09 Qualcomm Incorporated Generating additional merge candidates
US20130343459A1 (en) * 2012-06-22 2013-12-26 Nokia Corporation Method and apparatus for video coding

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102131094A (zh) * 2010-01-18 2011-07-20 联发科技股份有限公司 运动预测方法
US20120128060A1 (en) * 2010-11-23 2012-05-24 Mediatek Inc. Method and Apparatus of Spatial Motion Vector Prediction
US20120134415A1 (en) * 2010-11-29 2012-05-31 Mediatek Inc. Method and Apparatus of Extended Motion Vector Predictor
CN102223543A (zh) * 2011-06-13 2011-10-19 四川虹微技术有限公司 参考像素读取存储系统

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI674795B (zh) * 2017-05-10 2019-10-11 聯發科技股份有限公司 用於視訊編解碼的重新排序運動向量預測候選集的方法及裝置
US10701393B2 (en) 2017-05-10 2020-06-30 Mediatek Inc. Method and apparatus of reordering motion vector prediction candidate set for video coding
US11202077B2 (en) 2017-06-13 2021-12-14 Huawei Technologies Co., Ltd. Motion vector prediction method and device
CN109089119A (zh) * 2017-06-13 2018-12-25 浙江大学 一种运动矢量预测的方法及设备
CN110677658A (zh) * 2018-07-01 2020-01-10 北京字节跳动网络技术有限公司 基于优先级的非相邻Merge设计
US11595683B2 (en) 2018-07-01 2023-02-28 Beijing Bytedance Network Technology Co., Ltd. Priority-based non-adjacent merge design
CN110677658B (zh) * 2018-07-01 2022-07-12 北京字节跳动网络技术有限公司 基于优先级的非相邻Merge设计
US11936900B2 (en) 2018-07-02 2024-03-19 Huawei Technologies Co., Ltd. Method and apparatus for motion vector prediction
CN112352424A (zh) * 2018-07-02 2021-02-09 华为技术有限公司 用于运动矢量预测的方法和装置
US11109055B2 (en) 2018-08-04 2021-08-31 Beijing Bytedance Network Technology Co., Ltd. MVD precision for affine
US11330288B2 (en) 2018-08-04 2022-05-10 Beijing Bytedance Network Technology Co., Ltd. Constraints for usage of updated motion information
CN110809164B (zh) * 2018-08-04 2022-06-28 北京字节跳动网络技术有限公司 Bio中的mv精度
US11470341B2 (en) 2018-08-04 2022-10-11 Beijing Bytedance Network Technology Co., Ltd. Interaction between different DMVD models
CN110809164A (zh) * 2018-08-04 2020-02-18 北京字节跳动网络技术有限公司 Bio中的mv精度
US11451819B2 (en) 2018-08-04 2022-09-20 Beijing Bytedance Network Technology Co., Ltd. Clipping of updated MV or derived MV
US11778170B2 (en) 2018-10-06 2023-10-03 Beijing Bytedance Network Technology Co., Ltd Temporal gradient calculations in bio
WO2020094075A1 (en) * 2018-11-06 2020-05-14 Beijing Bytedance Network Technology Co., Ltd. Multiple merge lists and orders for inter prediction with geometric partitioning
US11431973B2 (en) 2018-11-06 2022-08-30 Beijing Bytedance Network Technology Co., Ltd. Motion candidates for inter prediction
US11665344B2 (en) 2018-11-06 2023-05-30 Beijing Bytedance Network Technology Co., Ltd. Multiple merge lists and orders for inter prediction with geometric partitioning
US11265541B2 (en) 2018-11-06 2022-03-01 Beijing Bytedance Network Technology Co., Ltd. Position dependent storage of motion information
WO2020094073A1 (en) * 2018-11-06 2020-05-14 Beijing Bytedance Network Technology Co., Ltd. Ordered motion candidate list generation using geometric partitioning mode

Also Published As

Publication number Publication date
WO2014011652A3 (en) 2015-02-05
US20140016701A1 (en) 2014-01-16
EP2870767C0 (en) 2023-08-16
US9325990B2 (en) 2016-04-26
JP2015527817A (ja) 2015-09-17
WO2014011652A2 (en) 2014-01-16
EP2870767B1 (en) 2023-08-16
CN104838656B (zh) 2018-04-17
JP6321003B2 (ja) 2018-05-09
EP2870767A2 (en) 2015-05-13

Similar Documents

Publication Publication Date Title
CN104838656B (zh) 解码与编码视频数据的方法、视频译码器以及计算机可读存储媒体
CN104904218B (zh) 视差矢量推导
CN104170381B (zh) 在高效率视频译码及其扩展中的运动矢量译码及双向预测
CN105580372B (zh) 用于3d视频译码的组合式双向预测合并候选者
CN105874799B (zh) 用于3d视频译码的基于块的高级残差预测
CN104904217B (zh) 用于视频译码扩展的时间运动向量预测
CN104322070B (zh) 用于高效率视频译码的高级别语法扩展
TWI526027B (zh) 視訊寫碼中之運動向量預測
CN105009586B (zh) 多视图或3维视频译码中的视图间残余预测
CN104769949B (zh) 用于视差向量导出的图片的选择的方法和装置
CN105379282B (zh) 用于纹理译码的先进残余预测(arp)的方法和设备
CN104584558B (zh) 用于3d视频的视图间预测的运动向量
CN105052145A (zh) 剖析三维视频译码中的语法元素
CN105393538A (zh) 用于3d-hevc的简化高级运动预测
CN105794209B (zh) 用于译码深度块的方法和装置
CN106105212A (zh) 简化的子预测单元(sub‑pu)运动参数继承(mpi)
CN104350749A (zh) 深度图估计的推导
CN105379288A (zh) 处理对视频译码的照明补偿
CN105075267A (zh) 在视频译码中停用用于参考图片列表的视图间预测
CN105230022A (zh) 使用基于相邻者的视差向量导出的用于3d视频译码的并行经导出视差向量
CN104365105A (zh) 视频译码中的外部图片
CN104335589A (zh) 用于视频译码的视图间预测的视差向量产生
CN104041047A (zh) 在使用深度的3d视频译码中的多重假设差异向量构建
CN105122812A (zh) 用于三维(3d)视频译码的高级合并模式
CN104365103A (zh) 视频译码中的视差向量选择

Legal Events

Date Code Title Description
PB01 Publication
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant