CN103797799B - 用于视频译码的运动向量确定 - Google Patents

用于视频译码的运动向量确定 Download PDF

Info

Publication number
CN103797799B
CN103797799B CN201280045175.3A CN201280045175A CN103797799B CN 103797799 B CN103797799 B CN 103797799B CN 201280045175 A CN201280045175 A CN 201280045175A CN 103797799 B CN103797799 B CN 103797799B
Authority
CN
China
Prior art keywords
current
candidate
candidate list
source position
video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201280045175.3A
Other languages
English (en)
Other versions
CN103797799A (zh
Inventor
翔林·王
郑云非
瓦迪姆·谢廖金
马尔塔·卡切维奇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of CN103797799A publication Critical patent/CN103797799A/zh
Application granted granted Critical
Publication of CN103797799B publication Critical patent/CN103797799B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/436Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation using parallelised computational arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

对于属于译码单元CU的每一预测单元PU,视频译码器产生候选列表。所述视频译码器产生所述候选列表以使得在不使用属于所述CU的所述PU中的任一者的运动信息的情况下,产生基于至少一个其它PU的运动信息而产生的所述候选列表中的每一候选。在产生用于PU的所述候选列表之后,所述视频译码器基于由所述PU的运动信息指示的一个或一个以上参考块产生用于所述PU的预测视频块。所述PU的所述运动信息可基于由用于所述PU的所述候选列表中的选定候选指示的运动信息来确定。

Description

用于视频译码的运动向量确定
本申请案主张2011年9月17日申请的第61/535,964号美国临时申请案、2011年11月29日申请的第61/564,764号美国临时申请案及2011年11月29日申请的第61/564,799号美国临时申请案的权利,所述申请案中的每一者的全部内容以引用的方式并入本文中。
技术领域
本发明涉及视频译码,且更确切地说,涉及视频数据的帧间预测。
背景技术
数字视频能力可并入到各种各样的装置中,包含数字电视、数字直播系统、无线广播系统、个人数字助理(PDA)、膝上型或桌上型计算机、数字相机、数字记录装置、数字媒体播放器、视频游戏装置、视频游戏控制台、蜂窝式或卫星无线电电话、视频电话会议装置等。数字视频装置实施视频压缩技术(例如由MPEG-2、MPEG-4、ITU-T H.263、ITU-T H.264/MPEG-4第10部分(高级视频译码(AVC))定义的标准,目前处于开发下的高效视频译码(HEVC)标准,以及所述标准的扩展部分中所描述的视频压缩技术)以更有效地发射、接收及存储数字视频信息。
视频压缩技术执行空间(帧内图片)预测和/或时间(帧间图片)预测以减少或移除视频序列中所固有的冗余。对于基于块的视频译码,可将视频切片分割成视频块,所述视频块还可被称作树块、译码单元(CU)及/或译码节点。图片的经帧内译码(I)的切片中的视频块相对于同一图片中的相邻块中的参考样本使用空间预测而编码。图片的经帧间译码(P或B)的切片中的视频块可相对于同一图片中的相邻块中的参考样本使用空间预测或相对于其它参考图片中的参考样本使用时间预测。图片可称作帧,且参考图片可称作参考帧。
发明内容
一般来说,本发明描述用于编码及解码视频数据的技术。视频译码器根据合并模式或高级运动向量预测(AMVP)过程产生用于当前译码单元(CU)的每一预测单元(PU)的候选列表。所述视频译码器产生所述候选列表以使得在不使用属于所述当前CU的任何其它PU的运动信息的情况下,产生基于至少一个其它PU的运动信息而产生的在所述候选列表中的每一候选。基于其它PU的运动信息产生的所述候选可包含指示其它PU的运动信息的原始候选及指示从一个或一个以上其它PU的运动信息导出的运动信息的候选。在产生用于PU的所述候选列表之后,所述视频译码器可基于由所述PU的运动信息指示的一个或一个以上参考块产生用于所述PU的预测视频块。所述PU的所述运动信息可基于由用于所述PU的所述候选列表中的一个或一个以上选定候选指示的运动向量来确定。因为用于当前CU的PU的候选列表中的候选不使用当前CU的任何其它PU的运动信息来产生,所以视频译码器可并行地产生用于当前CU的PU中的一者或一者以上的候选列表。
本发明描述一种用于对视频数据译码的方法。所述方法包括:对于属于当前CU的多个PU中的每一PU,产生用于所述PU的候选列表以使得在不使用属于所述当前CU的任何其它PU的运动信息的情况下,产生基于至少一个其它PU的运动信息产生的在所述候选列表中的每一候选。另外,所述方法包括:对于属于所述当前CU的每一PU,基于由所述PU的运动信息指示的参考块产生用于所述PU的预测视频块,所述PU的所述运动信息可基于由用于所述PU的所述候选列表中的选定候选指示的运动向量来确定。
另外,本发明描述一种视频译码装置,其包括一个或一个以上处理器,所述处理器经配置以:对于属于当前CU的多个PU中的每一PU,产生用于所述PU的候选列表以使得在不使用属于所述当前CU的所述PU中的任一者的运动信息的情况下,产生基于至少一个其它PU的运动信息产生的在所述候选列表中的每一候选。所述一个或一个以上处理器经进一步配置以:对于属于所述当前CU的每一PU,基于由所述PU的运动信息指示的参考块产生用于所述PU的预测视频块,所述PU的所述运动信息可基于由用于所述PU的所述候选列表中的选定候选指示的运动向量来确定。
另外,本发明描述一种视频译码装置,其包括用于对于属于当前CU的多个PU中的每一PU,产生用于所述PU的候选列表以使得在不使用属于所述当前CU的所述PU中的任一者的运动信息的情况下产生基于至少一个其它PU的运动信息产生的在所述候选列表中的每一候选的装置。另外,所述视频译码装置包括用于对于属于所述当前CU的每一PU,基于由所述PU的运动信息指示的参考块产生用于所述PU的预测视频块的装置,所述PU的所述运动信息可基于由用于所述PU的所述候选列表中的选定候选指示的运动向量来确定。
另外,本发明描述一种计算机程序产品,其包括存储指令的一个或一个以上计算机可读存储媒体,所述指令在执行时配置一个或一个以上处理器以:对于属于当前CU的多个PU中的每一PU,产生用于所述PU的候选列表以使得在不使用属于所述当前CU的所述PU中的任一者的运动信息的情况下,产生基于至少一个其它PU的运动信息产生的在所述候选列表中的每一候选。所述指令还配置所述一个或一个以上处理器以:对于属于所述当前CU的每一PU,基于由所述PU的运动信息指示的参考块产生用于所述PU的预测视频块,所述PU的所述运动信息可基于由用于所述PU的所述候选列表中的选定候选指示的运动向量来确定。
一个或一个以上实例的细节陈述于附图及以下描述中。其它特征、目标及优势将从描述及附图和从权利要求书中显而易见。
附图说明
图1为说明可利用本发明的技术的实例视频译码系统的框图。
图2为说明可经配置以实施本发明的技术的实例视频编码器的框图。
图3为说明可经配置以实施本发明的技术的实例视频解码器的框图。
图4为说明帧间预测模块的实例配置的框图。
图5为说明实例合并操作的流程图。
图6为说明实例高级运动向量预测(AMVP)操作的流程图。
图7为说明由视频解码器执行的实例运动补偿操作的流程图。
图8A为说明译码单元(CU)及与CU相关联的实例源位置的概念图。
图8B为说明CU及与CU相关联的实例替代源位置的概念图。
图9A为说明在经2NxN分割的CU左边的实例参考索引源位置的概念图。
图9B为说明在经Nx2N分割的CU左边的实例参考索引源位置的概念图。
图9C为说明在经2NxN分割的CU上方的实例参考索引源位置的概念图。
图9D为说明在经Nx2N分割的CU上方的实例参考索引源位置的概念图。
图9E为说明在经NxN分割的CU左边的实例参考索引源位置的概念图。
图9F为说明在经NxN分割的CU上方的实例参考索引源位置的概念图。
图10A为说明在经2NxN分割的CU左边的实例参考索引源位置的概念图。
图10B为说明在经Nx2N分割的CU左边的实例参考索引源位置的概念图。
图10C为说明在经2NxN分割的CU上方的实例参考索引源位置的概念图。
图10D为说明在经Nx2N分割的CU上方的实例参考索引源位置的概念图。
图10E为说明在经NxN分割的CU左边的实例参考索引源位置的概念图。
图10F为说明在经NxN分割的CU 600上方的实例参考索引源位置的概念图。
图11为说明用以产生用于PU的时间候选的实例操作的流程图。
图12为说明用以产生用于PU的候选列表的第一实例操作的流程图。
图13为说明用以产生用于PU的候选列表的第二实例操作的流程图。
图14A为说明与实例经Nx2N分割的CU的左PU相关联的实例空间候选源位置的概念图。
图14B为说明与经2NxN分割的CU的下PU相关联的实例空间候选源位置的概念图。
图15A到15D为说明与经NxN分割的CU的PU相关联的实例空间候选源位置的概念图。
具体实施方式
视频编码器可执行帧间预测以减少图片之间的时间冗余。如下文所描述,译码单元(CU)可具有多个预测单元(PU)。换句话说,多个PU可属于CU。当视频编码器执行帧间预测时,视频编码器可用信号发出用于PU的运动信息。PU的运动信息可包含参考图片索引、运动向量及预测方向指示符。运动向量可指示PU的视频块与PU的参考块之间的位移。PU的参考块可为类似于PU的视频块的参考图片的部分。参考块可在由参考图片索引及预测方向指示符指示的参考图片中。
为了减少表示PU的运动信息所需的位的数目,视频编码器可根据合并模式或高级运动向量预测(AMVP)过程产生用于PU中的每一者的候选列表。用于PU的候选列表中的每一候选可指示运动信息。由候选列表中的候选中的一些所指示的运动信息可基于其它PU的运动信息。举例来说,候选列表可包含“原始”候选,其指示涵盖指定空间或时间候选位置的PU的运动信息。此外,在一些实例中,候选列表可包含通过组合来自不同原始候选的部分运动向量而产生的候选。此外,候选列表可包含并非基于其它PU的运动信息产生的“人工”候选,例如指示具有零量值的运动向量的候选。
根据本发明的技术,视频编码器可产生用于CU的每一PU的候选列表以使得在不使用属于CU的任何其它PU的运动信息的情况下,产生基于至少一个其它PU的运动信息产生的在候选列表中的每一候选。因为候选列表中的候选不使用相同CU的任何其它PU的运动信息来产生,所以视频编码器可能够并行地产生候选列表。并行地产生候选列表可促进视频编码器的实施。在一些情况下,并行地产生候选列表可快于连续地产生候选列表。
在产生用于CU的PU的候选列表之后,视频编码器可从候选列表中选择候选,且在位流中输出候选索引。候选索引可指示候选列表中的选定候选的位置。视频编码器还可基于由PU的运动信息指示的参考块产生用于PU的预测视频块。PU的运动信息可基于由选定候选指示的运动信息来确定。举例来说,在合并模式中,PU的运动信息可与由选定候选指示的运动信息相同。在AMVP模式中,PU的运动信息可基于PU的运动向量差及由选定候选指示的运动信息来确定。视频编码器可基于CU的PU的预测视频块及用于CU的原始视频块产生用于CU的一个或一个以上残余视频块。视频编码器接着可对一个或一个以上残余视频块编码及在位流中输出所述一个或一个以上残余视频块。
视频解码器可产生用于CU的PU中的每一者的候选列表。根据本发明的技术,视频解码器可对于PU中的每一者产生用于PU的候选列表以使得在不使用属于CU的任何其它PU的运动信息的情况下,产生基于至少一个其它PU的运动信息产生的在候选列表中的每一候选。由视频解码器产生以用于PU的候选列表可与由视频编码器产生以用于PU的候选列表相同。因为视频解码器可在不使用CU的任何其它PU的运动信息的情况下产生候选列表中的候选中的每一者,所以视频解码器可能够并行地产生候选列表。
位流可包含识别PU的候选列表中的选定候选的数据。视频解码器可基于由PU的候选列表中的选定候选指示的运动信息确定PU的运动信息。视频解码器可基于PU的运动信息识别用于PU的一个或一个以上参考块。在识别PU的一个或一个以上参考块之后,视频解码器可基于PU的一个或一个以上参考块产生用于PU的预测视频块。视频解码器可基于用于CU的PU的预测视频块及用于CU的一个或一个以上残余视频块重建构用于CU的视频块。
因此,本发明的技术可使得视频译码器(即,视频编码器或视频解码器)能够:对于属于当前CU的多个PU中的每一PU,产生用于所述PU的候选列表以使得在不使用属于所述当前CU的任何其它PU的运动信息的情况下,产生基于至少一个其它PU的运动信息产生的在所述候选列表中的每一候选。视频译码器可对于属于所述当前CU的每一PU,基于由所述PU的运动信息指示的参考块产生用于所述PU的预测视频块,所述PU的所述运动信息可基于由用于所述PU的所述候选列表中的选定候选指示的运动向量来确定。
为了解释容易起见,本发明可将位置或视频块描述为具有与CU或PU的各种空间关系。此描述可解释为意谓位置或视频块具有与同CU或PU相关联的视频块的各种空间关系。此外,本发明可将视频译码器当前正译码的PU称作当前PU。本发明可将视频译码器当前正译码的CU称作当前CU。本发明可将视频译码器当前正译码的图片称作当前图片。
附图说明若干实例。附图中由参考数字指示的元件对应于以下描述中由类似参考数字指示的元件。在本发明中,具有以序数词(例如,“第一”、“第二”、“第三”等)开始的名称的元件不一定暗示元件具有特定次序。而是,此些序数词仅用以指代相同或类似类型的不同元件。
图1为说明可利用本发明的技术的实例视频译码系统10的框图。如本文中描述所使用,术语“视频译码器”通常指代视频编码器及视频解码器两者。在本发明中,术语“视频译码”或“译码”通常可指代视频编码及视频解码。
如图1中所示,视频译码系统10包含源装置12及目的地装置14。源装置12产生经编码的视频数据。因此,源装置12可被称作视频编码装置。目的地装置14可对由源装置12产生的经编码的视频数据解码。因此,目的地装置14可被称作视频解码装置。源装置12及目的地装置14可为视频译码装置的实例。
源装置12及目的地装置14可包括各种各样的装置,包括桌上型计算机、移动计算装置、笔记本(例如,膝上型)计算机、平板计算机、机顶盒、电话手持机(例如,所谓的“智能”电话)、电视、相机、显示装置、数字媒体播放器、视频游戏控制台、车载计算机等。在一些实例下,源装置12及目的地装置14可经配备以用于无线通信。
目的地装置14可经由信道16从源装置12接收经编码的视频数据。信道16可包括能够将经编码的视频数据从源装置12移动到目的地装置14的类型的媒体或装置。在一个实例中,信道16可包括通信媒体,其使得源装置12能够实时地将经编码的视频数据直接发射到目的地装置14。在此实例中,源装置12可根据通信标准(例如,无线通信协议)调制经编码的视频数据,且可将经调制的视频数据发射到目的地装置14。通信媒体可包括无线或有线通信媒体,例如射频(RF)频谱或一个或一个以上物理传输线。通信媒体可形成例如局域网、广域网或例如因特网等全球网络等基于包的网络的部分。通信媒体可包含促进从源装置12到目的地装置14的通信的路由器、交换器、基站或其它设备。
在另一实例中,信道16可对应于存储由源装置12产生的经编码的视频数据的存储媒体。在此实例中,目的地装置14可经由磁盘存取或卡存取来存取存储媒体。存储媒体可包含多种本地存取的数据存储媒体,例如蓝光光盘、DVD、CD-ROM、闪存存储器或用于存储经编码的视频数据的其它合适数字存储媒体。在另一实例中,信道16可包含文件服务器或存储由源装置12产生的经编码的视频的另一中间存储装置。在此实例中,目的地装置14可经由流式传输或下载存取存储于文件服务器或其它中间存储装置处的经编码的视频数据。文件服务器可为能够存储经编码的视频数据且将经编码的视频数据发射到目的地装置14的类型的服务器。实例文件服务器包括网页服务器(例如,用于网站)、文件传送协议(FTP)服务器、网络附接存储(NAS)装置及本地磁盘驱动器。目的地装置14可经由包含因特网连接的标准数据连接存取经编码的视频数据。数据连接的实例类型可包含适用于存取存储于文件服务器上的经编码的视频数据的无线信道(例如,Wi-Fi连接)、有线连接(例如,DSL、电缆调制解调器等)或两者的组合。经编码的视频数据从文件服务器的发射可为流式传输发射、下载发射或两者的组合。
本发明的技术不限于无线应用或设定。所述技术可应用于支持例如以下各者的多种多媒体应用中的任一者的视频译码:空中电视广播、有线电视发射、卫星电视发射、流式传输视频发射(例如,经由因特网)、对数字视频编码以用于存储于数据存储媒体上、对存储于数据存储媒体上的数字视频解码,或其它应用。在一些实例中,视频译码系统10可经配置以支持单向或双向视频发射以支持例如视频流式传输、视频播放、视频广播及/或视频电话等应用。
在图1的实例中,源装置12包含视频源18、视频编码器20及输出接口22。在一些状况下,输出接口22可包含调制器/解调器(调制解调器)及/或发射器。在源装置12中,视频源18可包含源,例如视频俘获装置(例如,摄像机)、含有先前所俘获的视频数据的视频存档、用以从视频内容提供者接收视频数据的视频馈入接口,及/或用于产生视频数据的计算机图形系统,或此些源的组合。
视频编码器20可对所俘获的、预先俘获的或计算机产生的视频数据编码。经编码的视频数据可经由源装置12的输出接口22直接发射到目的地装置14。经编码的视频数据还可存储于存储媒体或文件服务器上以供稍后由目的地装置14存取以进行解码及/或播放。
在图1的实例中,目的地装置14包含输入接口28、视频解码器30及显示装置32。在一些状况下,输入接口28可包含接收器及/或调制解调器。目的地装置14的输入接口28经由信道16接收经编码的视频数据。经编码的视频数据可包含由视频编码器20产生的表示视频数据的多种语法元素。此些语法元素可包含于发射于通信媒体上、存储于存储媒体上或存储于文件服务器中的经编码的视频数据内。
显示装置32可与目的地装置14集成或可在目的地装置14外部。在一些实例中,目的地装置14可包含集成显示装置且还可经配置以与外部显示装置介接。在其它实例中,目的地装置14可为显示装置。一般来说,显示装置32向用户显示经解码的视频数据。显示装置32可包括多种显示装置中的任一者,例如液晶显示器(LCD)、等离子体显示器、有机发光二级管(OLED)显示器或另一类型的显示装置。视频编码器20及视频解码器30可根据例如当前在开发中的高效视频译码(HEVC)标准等视频压缩标准而操作,且可符合HEVC测试模型(HM)。被称作“HEVC工作草案7”或“WD7”的即将到来的HEVC标准的新近草案描述于Bross等人的文件JCTVC-I1003_d54“高效视频译码(HEVC)文本规范草案7”(ITU-T SG16WP3及ISO/IEC JTC1/SC29/WG11的视频译码联合协作小组(JCT-VC),第9次会议:瑞士,日内瓦,2012年5月)中,所述文件自2012年7月19日起可从http://phenix.int-evry.fr/ict/doc_end_user/documents/9_Geneva/wgl1/JCTVC-I1003-v6.zip下载得到,所述文件的全部内容以引用的方式并入本文中。或者,视频编码器20和视频解码器30可根据其它专有或工业标准(例如,ITU-T H.264标准,或者称为MPEG-4第10部分,高级视频译码(AVC))或此些标准的扩展而操作。然而,本发明的技术不限于任何特定译码标准或技术。视频压缩标准及技术的其它实例包含MPEG-2、ITU-T H.263及专有或开源压缩格式,例如VP8及相关格式。
尽管未在图1的实例中展示,但视频编码器20及视频解码器30可各自与音频编码器及解码器集成,且可包含适当的MUX-DEMUX单元或其它硬件及软件,以处理对共同数据流或单独数据流中的音频与视频两者的编码。如果适用,那么在一些实例中,MUX-DEMUX单元可符合ITU H.223多路复用器协议或例如用户数据报协议(UDP)等其它协议。
再次,图1仅为一实例,且本发明的技术可适用于不一定包含编码装置与解码装置之间的任何数据通信的视频译码设定(例如,视频编码或视频解码)。在其它实例中,数据可从本地存储器检索,通过网络流式传输等。编码装置可对数据编码且将其存储到存储器,及/或解码装置可从存储器检索数据且对数据解码。在许多实例中,编码及解码是由彼此不通信而是仅将数据编码到存储器及/或从存储器检索数据及对数据解码的装置来执行。
视频编码器20及视频解码器30各自可经实施为例如一个或一个以上微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑、硬件或其任何组合的多种合适电路中的任一者。当技术是部分以软件来实施时,装置可将用于软件的指令存储于合适的非暂时性计算机可读存储媒体中,且可使用一个或一个以上处理器执行硬件中的指令以执行本发明的技术。视频编码器20及视频解码器30中的每一者可包含于一个或一个以上编码器或解码器中,其中任一者可集成为相应装置中的组合式编码器/解码器(CODEC)的部分。
如上文简要地提及,视频编码器20对视频数据编码。视频数据可包括一个或一个以上图片。图片中的每一者为形成视频的部分的静态图像。在一些情况下,图片可被称作视频“帧”。当视频编码器20对视频数据编码时,视频编码器20可产生位流。位元可包含形成视频数据的经译码的表示的位序列。位流可包含经译码的图片及相关联的数据。经译码的图片为图片的经译码的表示。
为了产生位流,视频编码器20可对视频数据中的每一图片执行编码操作。当视频编码器20对图片执行编码操作时,视频编码器20可产生一系列经译码的图片及相关联的数据。相关联的数据可包含序列参数集、图片参数集、适配参数集及其它语法结构。序列参数集(SPS)可含有适用于零个或零个以上图片序列的参数。图片参数集(PPS)可含有适用于零个或零个以上图片的参数。适配参数集(APS)可含有适用于零个或零个以上图片的参数。APS中的参数可为比PPS中的参数更可能改变的参数。
为了产生经译码的图片,视频编码器20可将图片分割成相等大小的视频块。视频块可为样本的二维阵列。视频块中的每一者与树块相关联。在一些情况下,树块可被称作最大译码单元(LCU)。HEVC的树块可宽泛地类似于先前标准(例如,H.264/AVC)的宏块。然而,树块不一定限于特定大小且可包含一个或一个以上译码单元(CU)。视频编码器20可使用四分树分割来将树块的视频块分割成与CU相关联的视频块,因此命名为“树块”。
在一些实例中,视频编码器20可将图片分割成多个切片。切片中的每一者可包含整数个CU。在一些情况下,切片包括整数个树块。在其它情况下,切片的边界可在树块内。
作为对图片执行编码操作的部分,视频编码器20可对图片的每一切片执行编码操作。当视频编码器20对切片执行编码操作时,视频编码器20可产生与切片相关联的经编码的数据。与切片相关联的经编码的数据可被称作“经译码的切片”。
为了产生经译码的切片,视频编码器20可对切片中的每一树块执行编码操作。当视频编码器20对树块执行编码操作时,视频编码器20可产生经译码的树块。经译码的树块可包括表示树块的经编码的版本的数据。
当视频编码器20产生经译码的切片时,视频编码器20可根据光栅扫描次序对切片中的树块(其在此状况下表示最大译码单元)执行编码操作(即,编码)。换句话说,视频编码器20可按从左到右横跨切片中的树块的最顶列而进行接着从左到右横跨树块的下一列而进行等等直到视频编码器20已对切片中的树块中的每一者编码为止的次序对切片的树块编码。
作为根据光栅扫描次序对树块编码的结果,可已对在给定树块上方及左边的树块编码,但尚未对给定树块下方及右边的树块编码。因此,视频编码器20可能够在对给定树块编码时存取通过对在给定树块上方及左边的树块编码而产生的信息。然而,视频编码器20可不能够在对给定树块编码时存取通过对在给定树块下方及右边的树块编码而产生的信息。
为了产生经译码的树块,视频编码器20可对树块的视频块递归地执行四分树分割以将视频块划分成逐渐变小的视频块。较小的视频块中的每一者可与不同CU相关联。举例来说,视频编码器20可将树块的视频块分割成四个相等大小的子块,将子块中的一者或一者以上分割成四个相等大小的子子块(sub-sub-block)等等。经分割的CU可为视频块经分割成与其它CU相关联的视频块的CU。未经分割的CU可为视频块未分割成与其它CU相关联的视频块的CU。
位流中的一个或一个以上语法元素可指示视频编码器20可分割树块的视频块的最大次数。CU的视频块的形状可为正方形。CU的视频块的大小(即,CU的大小)可从8x8像素变化直到最大为64x64像素或更大的树块的视频块的大小(即,树块的大小)。
视频编码器20可根据z扫描次序对树块的每一CU执行编码操作(即,编码)。换句话说,视频编码器20可按彼次序对左上CU、右上CU、左下CU及接着右下CU编码。当视频编码器20对经分割的CU执行编码操作时,视频编码器20可根据z扫描次序对与经分割的CU的视频块的子块相关联的CU编码。换句话说,视频编码器20可按彼次序对与左上子块相关联的CU、与右上子块相关联的CU、与左下子块相关联的CU及接着与右下子块相关联的CU编码。
作为根据z扫描次序对树块的CU编码的结果,可已对在给定CU上方、左上方、右上方、左边及左下方的CU编码。尚未对在给定CU下方或右边的CU编码。因此,视频编码器20可能够在对给定CU编码时存取通过对与给定CU相邻的一些CU编码而产生的信息。然而,视频编码器20可不能够在对给定CU编码时存取通过对与给定CU相邻的其它CU编码而产生的信息。
当视频编码器20对未经分割的CU编码时,视频编码器20可产生用于CU的一个或一个以上预测单元(PU)。CU的PU中的每一者可与CU的视频块内的不同视频块相关联。视频编码器20可产生用于CU的每一PU的预测视频块。PU的预测视频块可为样本块。视频编码器20可使用帧内预测或帧间预测产生用于PU的预测视频块。
当视频编码器20使用帧内预测产生PU的预测视频块时,视频编码器20可基于与PU相关联的图片的经解码的样本产生PU的预测视频块。如果视频编码器20使用帧内预测产生CU的PU的预测视频块,那么CU为经帧内预测的CU。当视频编码器20使用帧间预测产生PU的预测视频块时,视频编码器20可基于除了与PU相关联的图片之外的一个或一个以上图片的经解码的样本产生PU的预测视频块。如果视频编码器20使用帧间预测产生CU的PU的预测视频块,那么CU为经帧间预测的CU。
此外,当视频编码器20使用框间预测产生用于PU的预测视频块时,视频编码器20可产生用于PU的运动信息。用于PU的运动信息可指示PU的一个或一个以上参考块。PU的每一参考块可为参考图片内的视频块。参考图片可为除了与PU相关联的图片之外的图片。在一些情况下,PU的参考块还可被称作PU的“参考样本”。视频编码器20可基于PU的参考块产生用于PU的预测视频块。
在视频编码器20产生用于CU的一个或一个以上PU的预测视频块之后,视频编码器20可基于用于CU的PU的预测视频块产生用于CU的残余数据。用于CU的残余数据可指示用于CU的PU的预测视频块中的样本与CU的原始视频块之间的差异。
此外,作为对未经分割的CU执行编码操作的部分,视频编码器20可对CU的残余数据执行递归四分树分割,以将CU的残余数据分割成与CU的变换单元(TU)相关联的残余数据的一个或一个以上块(即,残余视频块)。CU的每一TU可与不同残余视频块相关联。
视频编码器20可将一个或一个以上变换应用于与TU相关联的残余视频块以产生与TU相关联的变换系数块(即,变换系数的块)。概念上,变换系数块可为变换系数的二维(2D)矩阵。
在产生变换系数块之后,视频编码器20可对变换系数块执行量化过程。量化通常是指将变换系数量化以可能地减少用于表示变换系数的数据量从而提供进一步压缩的过程。量化过程可减少与变换系数中的一些或全部相关联的位深度。举例来说,在量化期间,可将n位变换系数向下舍入到m位变换系数,其中n大于m。
视频编码器20可将每一CU与量化参数(QP)值相关联。与CU相关联的QP值可确定视频编码器20如何量化与CU相关联的变换系数块。视频编码器20可通过调整与CU相关联的QP值来调整应用于与CU相关联的变换系数块的量化程度。
在视频编码器20量化变换系数块之后,视频编码器20可产生表示经量化的变换系数块中的变换系数的语法元素集合。视频编码器20可将熵编码操作(例如,上下文自适应二进制算术译码(CABAC)操作)应用于这些语法元素中的一些。
由视频编码器20产生的位流可包含一系列网络抽象层(NAL)单元。NAL单元中的每一者可为语法结构,其含有在含有数据的NAL单元及字节中的数据类型的指示。举例来说,NAL单元可含有表示序列参数集、图片参数集、经译码的切片、补充增强信息(SEI)、存取单元定界符、填充符数据(filler data)或另一类型的数据的数据。NAL单元中的数据可包含各种语法结构。
视频解码器30可接收由视频编码器20产生的位流。位流可包含由视频编码器20编码的视频数据的经译码的表示。当视频解码器30接收到位流时,视频解码器30可对位流执行剖析操作。当视频解码器30执行剖析操作时,视频解码器30可从位流提取语法元素。视频解码器30可基于从位流提取的语法元素重建构视频数据的图片。基于语法元素重建构视频数据的过程通常可与由视频编码器20执行以产生语法元素的过程互逆。
在视频解码器30提取与CU相关联的语法元素之后,视频解码器30可基于语法元素产生用于CU的PU的预测视频块。另外,视频解码器30可反量化与CU的TU相关联的变换系数块。视频解码器30可对变换系数块执行反变换以重建构与CU的TU相关联的残余视频块。在产生预测视频块及重建构残余视频块之后,视频解码器30可基于预测视频块及残余视频块重建构CU的视频块。以此方式,视频解码器30可基于位流中的语法元素重建构CU的视频块。
如上文简要地描述,视频编码器20可使用帧间预测产生用于CU的PU的预测视频块及运动信息。在许多情况下,给定PU的运动信息可能与一个或一个以上附近PU(即,视频块在空间上或时间上在给定PU的视频块附近的PU)的运动信息相同或类似。因为附近PU经常具有类似运动信息,所以视频编码器20可参考附近PU的运动信息对给定PU的运动信息编码。参考附近PU的运动信息对给定PU的运动信息编码可减少位流中指示给定PU的运动信息所需要的位的数目。
视频编码器20可以各种方式参考附近PU的运动信息对给定PU的运动信息编码。举例来说,视频编码器20可指示给定PU的运动信息与附近PU的运动信息相同。本发明可使用片语“合并模式”指代指示给定PU的运动信息与附近PU的运动信息相同或可从附近PU的运动信息导出。在另一实例中,视频编码器20可计算用于给定PU的运动向量差(MVD)。MVD指示给定PU的运动向量与附近PU的运动向量之间的差。在此实例中,视频编码器20可在给定PU的运动信息中包含MVD而非给定PU的运动向量。位流中可需要比给定PU的运动向量少的位来表示MVD。本发明可使用片语“高级运动向量预测”(AMVP)模式指代以此方式用信号发出给定PU的运动信息。
为了使用合并模式或AMVP模式用信号发出给定PU的运动信息,视频编码器20可产生用于给定PU的候选列表。候选列表可包含一个或一个以上候选。用于给定PU的候选列表中的候选中的每一者可指定运动信息。由候选指示的运动信息可包含运动向量、参考图片索引及预测方向指示符。候选列表中的候选可包含基于(例如,指示、从……导出等)除了给定PU之外的PU的运动信息的候选,条件是其它PU不属于与给定PU相关联的CU。
在产生用于PU的候选列表之后,视频编码器20可从用于PU的候选列表中选择候选中的一者。视频编码器20可输出用于PU的候选索引。候选索引可识别选定候选在候选列表中的位置。
此外,视频编码器20可基于由PU的运动信息指示的参考块产生用于PU的预测视频块。PU的运动信息可基于由用于PU的候选列表中的选定候选指示的运动信息来确定。举例来说,在合并模式中,PU的运动信息可与由选定候选指示的运动信息相同。在AMVP模式中,PU的运动信息可基于PU的运动向量差及由选定候选指示的运动信息来确定。视频编码器20可处理用于PU的预测视频块,如上文所描述。
当视频解码器30接收位流时,视频解码器30可产生用于CU的PU中的每一者的候选列表。由视频解码器30产生以用于PU的候选列表可与由视频编码器20产生以用于PU的候选列表相同。从位流剖析的语法可指示PU的候选列表中的选定候选的位置。在产生用于PU的所述候选列表之后,视频解码器30可基于由所述PU的运动信息指示的一个或一个以上参考块产生用于所述PU的预测视频块。视频解码器30可基于由用于PU的候选列表中的选定候选指示的运动信息来确定PU的运动信息。视频解码器30可基于用于PU的预测视频块及用于CU的残余视频块重建构用于CU的视频块。
虽然参考第二PU的运动信息对第一PU的运动信息编码可减少位流中指示第一PU的运动信息所需要的位的数目,但这样做可防止视频编码器20直到视频编码器20已对第二PU的运动信息编码以后方对第一PU的运动信息编码。因此,视频编码器20可不能够并行地对第一及第二PU的运动信息编码。并行地对多个PU的运动信息编码的能力可增加视频编码器20的吞吐量。
同样,参考第二PU的运动信息对第一PU的运动信息编码可防止视频解码器30直到视频解码器30已确定第二PU的运动信息以后方确定第一PU的运动信息。因此,视频解码器30可不能够并行地产生用于第一及第二PU的预测块。并行地对多个PU的运动信息解码的能力可增加视频解码器30的吞吐量。
根据本发明的技术,视频编码器20及视频解码器30可产生用于CU的每一PU的候选列表以使得在不使用相同CU的任何其它PU的运动信息的情况下,产生基于至少一个其它PU的运动信息产生的在用于PU的候选列表中的每一候选。因为不使用相同CU的任何其它PU的运动信息产生候选,所以视频编码器20可并行地对CU的多个PU的运动信息编码。因为不使用相同CU的任何其它PU的运动信息产生候选,所以视频解码器30可并行地对CU的多个PU的运动信息解码。这可增加视频编码器20可对视频数据编码及视频解码器30可对视频数据解码的速度。
以此方式,视频译码器(例如,视频编码器20或视频解码器30)可对于属于当前CU的多个PU中的每一PU,产生用于所述PU的候选列表以使得在不使用属于所述当前CU的任何其它PU的运动信息的情况下,产生基于至少一个其它PU的运动信息产生的在所述候选列表中的每一候选。视频译码器可对于属于所述当前CU的每一PU,基于由所述PU的运动信息指示的参考块产生用于所述PU的预测视频块,所述PU的所述运动信息可基于由用于所述PU的所述候选列表中的选定候选指示的运动向量来确定。
图2为说明可经配置以实施本发明的技术的实例视频编码器20的框图。出于解释的目的提供图2,且其不应被视为限制如本发明中宽泛地例示及描述的技术。出于解释的目的,本发明在HEVC译码的上下文中描述视频编码器20。然而,本发明的技术可适用于其它译码标准或方法。
在图2的实例中,视频编码器20包含多个功能组件。视频编码器20的功能组件包含预测模块100、残余产生模块102、变换模块104、量化模块106、反量化模块108、反变换模块110、重建构模块112、滤波器模块113、经解码的图片缓冲器114及熵编码模块116。预测模块100包含帧间预测模块121、运动估计模块122、运动补偿模块124及帧内预测模块126。在其它实例中,视频编码器20可包含更多、更少或不同功能组件。此外,运动估计模块122及运动补偿模块124可高度集成,但在图2的实例中出于解释的目的而分开表示。
视频编码器20可接收视频数据。视频编码器20可从各种源接收视频数据。举例来说,视频编码器20可从视频源18(图1)或另一源接收视频数据。视频数据可表示一系列图片。为了对视频数据编码,视频编码器20可对图片中的每一者执行编码操作。作为对图片执行编码操作的部分,视频编码器20可对图片的每一切片执行编码操作。作为对切片执行编码操作的部分,视频编码器20可对切片中的树块执行编码操作。
作为对树块执行编码操作的部分,预测模块100可对树块的视频块执行四分树分割以将视频块划分成逐渐变小的视频块。较小的视频块中的每一者可与不同CU相关联。举例来说,预测模块100可将树块的视频块分割成四个相等大小的子块,将子块中的一者或一者以上分割成四个相等大小的子子块等等。
与CU相关联的视频块的大小可从8x8样本变化直到最大为64x64样本或更大的树块的大小。在本发明中,“NxN”及“N乘N”可互换地使用以指视频块在垂直和水平尺寸方面的样本尺寸(例如,16x16样本或16乘16样本)。一般来说,16x16视频块在垂直方向上具有十六个样本(y=16)且在水平方向上具有十六个样本(x=16)。同样,NxN块通常在垂直方向上具有N个样本且在水平方向上具有N个样本,其中N表示非负整数值。
此外,作为对树块执行编码操作的部分,预测模块100可产生用于树块的层次型四分树数据结构。举例来说,树块可对应于四分树数据结构的根节点。如果预测模块100将树块的视频块分割成四个子块,那么根节点具有四分树数据结构中的四个子节点。子节点中的每一者对应于与子块中的一者相关联的CU。如果预测模块100将子块中的一者分割成四个子子块,那么对应于与子块相关联的CU的节点可具有四个子节点,所述子节点中的每一者对应于与子子块中的一者相关联的CU。
四分树数据结构的每一节点可含有用于对应树块或CU的语法数据(例如,语法元素)。举例来说,四分树中的节点可包含分裂旗标,其指示对应于所述节点的CU的视频块是否分割(即,分裂)为四个子块。用于CU的语法元素可递归地定义,且可取决于CU的视频块是否分裂为子块。视频块未被分割的CU可对应于四分树数据结构中的叶节点。经译码的树块可包含基于用于对应树块的四分树数据结构的数据。
视频编码器20可对树块的每一未经分割的CU执行编码操作。当视频编码器20对未经分割的CU执行编码操作时,视频编码器20产生表示未经分割的CU的经编码的表示的数据。
作为对CU执行编码操作的部分,预测模块100可在CU的一个或一个以上PU当中分割CU的视频块。视频编码器20及视频解码器30可支持各种PU大小。假设特定CU的大小为2Nx2N,视频编码器20及视频解码器30可支持用于帧内预测的2Nx2N或NxN的PU大小,及用于帧间预测的2Nx2N、2NxN、Nx2N、NxN或类似的对称PU大小。视频编码器20及视频解码器30还可支持用于帧间预测的2NxnU、2NxnD、nLx2N及nRx2N的PU大小的非对称分割。在一些实例中,预测模块100可执行几何分割以沿着并不以直角与CU的视频块的侧相交的边界在CU的PU当中分割CU的视频块。
帧间预测模块121可对CU的每一PU执行帧间预测。帧间预测可提供时间压缩。为了对PU执行帧间预测,运动估计模块122可产生用于PU的运动信息。运动补偿模块124可基于除了与CU相关联的图片(即,参考图片)之外的图片的运动信息及经解码的样本产生用于PU的预测视频块。
切片可为I切片、P切片或B切片。运动估计模块122及运动补偿模块124可取决于PU是在I切片、P切片还是B切片中而执行用于CU的PU的不同操作。在I切片中,帧内预测所有PU。因此,如果PU在I切片中,那么运动估计模块122及运动补偿模块124不对PU执行帧间预测。
如果PU在P切片中,那么含有PU的图片与被称作“列表0”的参考图片列表相关联。列表0中的参考图片中的每一者含有可用于帧间预测其它图片的样本。当运动估计模块122执行关于P切片中的PU的运动估计操作时,运动估计模块122可在列表0中的参考图片中搜索用于PU的参考块。PU的参考块可为最紧密地对应于PU的视频块中的样本的样本集合,例如样本块。运动估计模块122可使用多种量度来确定参考图片中的样本集合对应于PU的视频块中的样本的紧密程度。举例来说,运动估计模块122可由绝对差总和(SAD)、平方差总和(SSD)或其它不同量度确定参考图片中的样本集合对应于PU的视频块中的样本的紧密程度。
在识别P切片中的PU的参考块之后,运动估计模块122可产生指示含有参考块的在列表0中的参考图片的参考索引及指示PU与参考块之间的空间位移的运动向量。在各种实例中,运动估计模块122可产生不同程度的精度的运动向量。举例来说,运动估计模块122可产生在四分之一样本精度、八分之一样本精度或其它分数样本精度处的运动向量。在分数样本精度的状况下,可从参考图片中的整数位置样本值内插参考块值。运动估计模块122可输出参考索引及运动向量作为PU的运动信息。运动补偿模块124可基于由PU的运动信息识别的参考块产生PU的预测视频块。
如果PU在B切片中,那么含有PU的图片可与被称作“列表0”及“列表1”的两个参考图片列表相关联。在一些实例中,含有B切片的图片可与列表组合(其为列表0及列表1的组合)相关联。
此外,如果PU在B切片中,那么运动估计模块122可执行用于PU的单向预测或双向预测。当运动估计模块122执行用于PU的单向预测时,运动估计模块122可在列表0或列表1的参考图片中搜索用于PU的参考块。运动估计模块122接着可产生指示含有参考块的在列表0或列表1中的参考图片的参考索引及指示在PU与参考块之间的空间位移的运动向量。运动估计模块122可输出参考索引、预测方向指示符及运动向量作为PU的运动信息。预测方向指示符可指示参考索引指示在列表0还是列表1中的参考图片。运动补偿模块124可基于由PU的运动信息指示的参考块产生PU的预测视频块。
运动估计模块122执行用于PU的双向预测,运动估计模块122可在列表0中的参考图片中搜索用于PU的参考块,且还可在列表1中的参考图片中搜索用于PU的另一参考块。运动估计模块122接着可产生指示含有参考块的在列表0及列表1中的参考图片的参考索引及指示参考块与PU之间的空间位移的运动向量。运动估计模块122可输出PU的参考索引及运动向量作为PU的运动信息。运动补偿模块124可基于由PU的运动信息指示的参考块产生PU的预测视频块。
在一些情况下,运动估计模块122不将用于PU的运动信息的完整集合输出到熵编码模块116。而是,运动估计模块122可参考另一PU的运动信息用信号发出PU的运动信息。举例来说,运动估计模块122可确定PU的运动信息充分类似于相邻PU的运动信息。在此实例中,运动估计模块122可在与PU相关联的语法结构中指示一值,所述值向视频解码器30指示PU具有与相邻PU相同的运动信息或具有可从相邻PU导出的运动信息。在另一实例中,运动估计模块122可在与PU相关联的语法结构中识别与相邻PU相关联的运动候选及运动向量差(MVD)。运动向量差指示PU的运动向量与所指示的运动候选的运动向量之间的差。视频解码器30可使用所指示的运动候选的运动向量及运动向量差来确定PU的运动向量。通过在用信号发出第二PU的运动信息时参考与第一PU相关联的运动候选的运动信息,视频编码器20可能够使用较少的位用信号发出第二PU的运动信息。
如下文关于图4到6及图8A到15D所描述,帧间预测模块121可产生用于CU的每一PU的候选列表。帧间预测模块121可产生每一候选列表以使得在不使用属于CU的PU中的任一者的运动信息的情况下,产生基于至少一个其它PU的运动信息而产生的在所述候选列表中的每一候选。因此,帧间预测模块121可能够并行地产生用于CU的两个或两个以上PU的候选列表。因为帧间预测模块121可能够并行地产生用于CU的两个或两个以上PU的候选列表,所以帧间预测模块121可能够并行地产生用于CU的PU中的两者或两者以上的预测视频块。此外,通过以此方式产生用于CU的每一PU的候选列表,视频编码器20可使得视频解码器(例如,视频解码器30)能够并行地产生用于CU的两个或两个以上PU的候选列表及并行地产生用于CU的两个或两个以上PU的预测视频块。
作为对CU执行编码操作的部分,帧内预测模块126可对CU的PU执行帧内预测。帧内预测可提供空间压缩。当帧内预测模块126对PU执行帧内预测时,帧内预测模块126可基于相同图片中的其它PU的经解码的样本产生用于PU的预测数据。用于PU的预测数据可包含预测视频块及各种语法数据。帧内预测模块126可对在I切片、P切片及B切片中的PU执行帧内预测。
为了对PU执行帧内预测,帧内预测模块126可使用多个帧内预测模式产生用于PU的预测数据的多个集合。当帧内预测模块126使用帧内预测模式产生用于PU的预测数据集合时,帧内预测模块126可使样本在与帧内预测模式相关联的方向及/或梯度上从相邻PU的视频块延伸越过PU的视频块。假设用于PU、CU及树块的从左到右、从上到下的编码次序,相邻PU可在PU的上方、右上方、左上方或左边。帧内预测模块126可使用各种数目个帧内预测模式,例如33个方向帧内预测模式。在一些实例中,帧内预测模式的数目可取决于PU的大小。
预测模块100可从PU的由运动补偿模块124产生的预测数据或PU的由帧内预测模块126产生的预测数据当中选择用于PU的预测数据。在一些实例中,预测模块100基于预测数据集合的速率/失真量度选择用于PU的预测数据。
如果预测模块100选择由帧内预测模块126产生的预测数据,那么预测模块100可用信号发出用以产生用于PU的预测数据的帧内预测模式,即选定帧内预测模式。预测模块100可以各种方式用信号发出选定帧内预测模式。举例来说,有可能选定帧内预测模式与相邻PU的帧内预测模式相同。换句话说,相邻PU的帧内预测模式可为用于当前PU的最有可能模式。因此,预测模块100可产生语法元素以指示选定帧内预测模式与相邻PU的帧内预测模式相同。
在预测模块100选择用于CU的PU的预测数据之后,残余产生模块102可通过从CU的视频块减去CU的PU的预测视频块而产生用于CU的残余数据。CU的残余数据可包含2D残余视频块,其对应于CU的视频块中的样本的不同样本分量。举例来说,残余数据可包含残余视频块,其对应于CU的PU的预测视频块中的样本辉度分量与CU的原始视频块中的样本辉度分量之间的差。另外,CU的残余数据可包含残余视频块,其对应于CU的PU的预测视频块中的样本色度分量与CU的原始视频块中的样本色度分量之间的差。
预测模块100可执行四分树分割以将CU的残余视频块分割成子块。每一未经划分的残余视频块可与CU的不同TU相关联。与CU的TU相关联的残余视频块的大小及位置可或可不基于与CU的PU相关联的视频块的大小及位置。被称作“残余四分树”(RQT)的四分树结构可包含与残余视频块中的每一者相关联的节点。CU的TU可对应于RQT的叶节点。
变换模块104可通过将一个或一个以上变换应用于与TU相关联的残余视频块而产生用于CU的每一TU的一个或一个以上变换系数块。变换系数块中的每一者可为变换系数的2D矩阵。变换模块104可将各种变换应用于与TU相关联的残余视频块。举例来说,变换模块104可将离散余弦变换(DCT)、方向变换或概念上类似的变换应用于与TU相关联的残余视频块。
在变换模块104产生与TU相关联的变换系数块之后,量化模块106可量化变换系数块中的变换系数。量化模块106可基于与CU相关联的QP值量化与CU的TU相关联的变换系数块。
视频编码器20可以各种方式将QP值与CU相关联。举例来说,视频编码器20可对与CU相关联的树块执行速率失真分析。在速率失真分析中,视频编码器20可通过多次对树块执行编码操作而产生树块的多个经译码的表示。视频编码器20可在视频编码器20产生树块的不同经编码的表示时将不同QP值与CU相关联。视频编码器20可在给定QP值与呈具有最低速率及失真量度的树块的经译码的表示的CU相关联时用信号发出给定QP值与CU相关联。
反量化模块108及反变换模块110可分别将反量化及反变换应用于变换系数块,以从变换系数块重建构残余视频块。重建构模块112可将经重建构的残余视频块与来自由预测模块100产生的一个或一个以上预测视频块的对应样本相加,以产生与TU相关联的经重建构的视频块。通过以此方式重建构用于CU的每一TU的视频块,视频编码器20可重建构CU的视频块。
在重建构模块112重建构CU的视频块之后,滤波器模块113可执行解块操作以减少与CU相关联的视频块中的成块假影。在执行一个或一个以上解块操作之后,滤波器模块113可将CU的经重建构的视频块存储于经解码的图片缓冲器114中。运动估计模块122及运动补偿模块124可使用含有经重建构的视频块的参考图片来对后续图片的PU执行帧间预测。另外,帧内预测模块126可使用经解码的图片缓冲器114中经重建构的视频块来对与CU相同的图片中的其它PU执行帧内预测。
熵编码模块116可从视频编码器20的其它功能组件接收数据。举例来说,熵编码模块116可从量化模块106接收变换系数块,且可从预测模块100接收语法元素。当熵编码模块116接收数据时,熵编码模块116可执行一个或一个以上熵编码操作以产生经熵编码的数据。举例来说,视频编码器20可对数据执行上下文自适应可变长度译码(CAVLC)操作、CABAC操作、变-变(V2V)长度译码操作、基于语法的上下文自适应二进制算术译码(SBAC)操作、概率区间分割熵(PIPE)译码操作或另一类型的熵编码操作。熵编码模块116可输出包含经熵编码的数据的位流。
作为对数据执行熵编码操作的部分,熵编码模块116可选择上下文模型。如果熵编码模块116正执行CABAC操作,那么上下文模型可指示对具有特定值的特定二进制值的概率的估计。在CABAC的上下文中,术语“二进制值”用以指代语法元素的二进制化版本的位。
图3为说明可经配置以实施本发明的技术的实例视频解码器30的框图。出于解释的目的提供图3,且其不限制如本发明中宽泛地例示及描述的技术。出于解释的目的,本发明在HEVC译码的上下文中描述视频解码器30。然而,本发明的技术可适用于其它译码标准或方法。
在图3的实例中,视频解码器30包含多个功能组件。视频解码器30的功能组件包含熵解码模块150、预测模块152、反量化模块154、反变换模块156、重建构模块158、滤波器模块159及经解码的图片缓冲器160。预测模块152包含运动补偿模块162及帧内预测模块164。在一些实例中,视频解码器30可执行一般与关于图2的视频编码器20所描述的编码遍次互逆的解码遍次。在其它实例中,视频解码器30可包含更多、更少或不同功能组件。
视频解码器30可接收包括经编码的视频数据的位流。位流可包含多个语法元素。当视频解码器30接收位流时,熵解码模块150可对位流执行剖析操作。作为对位流执行剖析操作的结果,熵解码模块150可从位流中提取语法元素。作为执行剖析操作的部分,熵解码模块150可对位流中的经熵编码的语法元素熵解码。预测模块152、反量化模块154、反变换模块156、重建构模块158及滤波器模块159可执行重建构操作,所述重建构操作基于从位流中提取的语法元素产生经解码的视频数据。
如上文所论述,位流可包括一系列NAL单元。位流的NAL单元可包含序列参数集NAL单元、图片参数集NAL单元、SEI NAL单元等。作为对位流执行剖析操作的部分,熵解码模块150可执行剖析操作,所述剖析操作从序列参数集NAL提取序列参数集且对所述序列参数集熵解码,从图片参数集NAL单元提取图片参数集且对所述图片参数集熵解码,从SEI NAL单元提取SEI数据且对所述SEI数据熵解码等等。
另外,位流的NAL单元可包含经译码的切片NAL单元。作为对位流执行剖析操作的部分,熵解码模块150可执行剖析操作,所述剖析操作从经译码的切片NAL单元提取经译码的切片且对所述经译码的切片熵解码。经译码的切片中的每一者可包括切片标头及切片数据。切片标头可含有与切片有关的语法元素。切片标头中的语法元素可包含识别与含有切片的图片相关联的图片参数集的语法元素。熵解码模块150可对经译码的切片标头中的语法元素执行熵解码操作(例如,CAB AC解码操作)以恢复切片标头。
作为从经译码的切片NAL单元提取切片数据的部分,熵解码模块150可执行剖析操作,所述剖析操作从切片数据中的经译码的CU提取语法元素。经提取的语法元素可包含与变换系数块相关联的语法元素。熵解码模块150接着可对语法元素中的一些执行CAB AC解码操作。
在熵解码模块150对未经分割的CU执行剖析操作之后,视频解码器30可对未经分割的CU执行重建构操作。为了对未经分割的CU执行重建构操作,视频解码器30可对CU的每一TU执行重建构操作。通过执行用于CU的每一TU的重建构操作,视频解码器30可重建构与CU相关联的残余视频块。
作为对TU执行重建构操作的部分,反量化模块154可反量化(即,解量化)与TU相关联的变换系数块。反量化模块154可以类似于针对HEVC所提出或由H.264解码标准定义的反量化过程的方式反量化变换系数块。反量化模块154可使用变换系数块的CU的由视频编码器20计算的量化参数QP,以确定量化程度及同样反量化模块154所应用的反量化程度。
在反量化模块154反量化变换系数块之后,反变换模块156可产生用于与变换系数块相关联的TU的残余视频块。反变换模块156可将反变换应用于变换系数块以便产生用于TU的残余视频块。举例来说,反变换模块156可将反DCT、反整数变换、反卡-洛变换(KLT)、反旋转变换、反方向变换或另一反变换应用于变换系数块。
在一些实例中,反变换模块156可基于来自视频编码器20的发信确定应用于变换系数块的反变换。在此些实例中,反变换模块156可基于与变换系数块相关联的树块的四分树的根节点处的用信号发出的变换确定反变换。在其它实例中,反变换模块156可从一个或一个以上译码特性(例如,块大小、译码模式等)推断反变换。在一些实例中,反变换模块156可应用级联反变换。
如果使用帧间预测来对CU的PU编码,那么运动补偿模块162可产生用于PU的候选列表。根据本发明的技术,运动补偿模块162可产生用于PU的候选列表以使得在不使用属于相同CU的其它PU的运动信息的情况下,产生基于至少一个其它PU的运动信息产生的在候选列表中的每一候选。位流可包含识别选定候选在PU的候选列表中的位置的数据。在产生用于PU的所述候选列表之后,运动补偿模块162可基于由所述PU的运动信息指示的一个或一个以上参考块产生用于所述PU的预测视频块。PU的参考块可在不同于PU的时间图片中。运动补偿模块162可基于由PU的候选列表中的选定候选指示的运动信息来确定PU的运动信息。
在一些实例中,运动补偿模块162可通过基于内插滤波器执行内插来细化PU的预测视频块。待用于具有子样本精度的运动补偿的内插滤波器的识别符可包含在语法元素中。运动补偿模块162可使用如由视频编码器20在PU的预测视频块的产生期间所使用的相同内插滤波器来计算参考块的子整数样本的内插值。运动补偿模块162可根据所接收的语法信息来确定由视频编码器20使用的内插滤波器且使用所述内插滤波器来产生预测视频块。
如果使用帧内预测来对PU编码,那么帧内预测模块164可执行帧内预测以产生用于PU的预测视频块。举例来说,帧内预测模块164可基于位流中的语法元素确定用于PU的帧内预测模式。位流可包含帧内预测模块164可用以确定PU的帧内预测模式的语法元素。
在一些情况下,语法元素可指示帧内预测模块164将使用另一PU的帧内预测模式来确定当前PU的帧内预测模式。举例来说,可有可能当前PU的帧内预测模式与相邻PU的帧内预测模式相同。换句话说,相邻PU的帧内预测模式可为用于当前PU的最有可能模式。因此,在此实例中,位流可包含小语法元素,其指示PU的帧内预测模式与相邻PU的帧内预测模式相同。帧内预测模块164接着可使用帧内预测模式基于空间上相邻的PU的视频块产生用于PU的预测数据(例如,预测样本)。
重建构模块158可在适当时使用与CU的TU相关联的残余视频块及CU的PU的预测视频块(即,帧内预测数据或帧间预测数据)来重建构CU的视频块。因此,视频解码器30可基于位流中的语法元素产生预测视频块及残余视频块,且可基于预测视频块及残余视频块产生视频块。
在重建构模块158重建构CU的视频块之后,滤波器模块159可执行解块操作以减少与CU相关联的成块假影。在滤波器模块159执行解块操作以减少与CU相关联的成块假影之后,视频解码器30可将CU的视频块存储于经解码的图片缓冲器160中。经解码的图片缓冲器160可提供参考图片以用于后续运动补偿、帧内预测及呈现在显示装置(例如,图1的显示装置32)上。举例来说,视频解码器30可基于经解码的图片缓冲器160中的视频块对其它CU的PU执行帧内预测或帧间预测操作。
图4为说明帧间预测模块121的实例配置的概念图。帧间预测模块121可根据多个分割模式将当前CU分割成PU。举例来说,帧间预测模块121可根据2Nx2N、2NxN、Nx2N及NxN分割模式将当前CU分割成PU。
帧间预测模块121可对PU中的每一者执行整数运动估计(IME)且接着执行分数运动估计(FME)。当帧间预测模块121对PU执行IME时,帧间预测模块121可在一个或一个以上参考图片中搜索用于PU的参考块。在找到用于PU的参考块之后,帧间预测模块121可产生运动向量,所述运动向量以整数精度指示PU与用于PU的参考块之间的空间位移。当帧间预测模块121对PU执行FME时,帧间预测模块121可细化通过对PU执行IME而产生的运动向量。通过对PU执行FME而产生的运动向量可具有子整数精度(例如,1/2像素精度、1/4像素精度等)。在产生用于PU的运动向量之后,帧间预测模块121可使用用于PU的运动向量产生用于PU的预测视频块。
在帧间预测模块121使用AMVP模式用信号发出PU的运动信息的一些实例中,帧间预测模块121可产生用于PU的候选列表。候选列表可包含基于其它PU的运动信息产生的一个或一个以上候选。举例来说,候选列表可包含指示其它PU的运动信息的原始候选及/或指示从一个或一个以上其它PU的运动信息导出的运动信息的候选。在产生用于PU的候选列表之后,帧间预测模块121可从候选列表中选择候选,且产生用于PU的运动向量差(MVD)。用于PU的MVD可指示由选定候选所指示的运动向量与使用IME及FME产生以用于PU的运动向量之间的差。在此些实例中,帧间预测模块121可输出候选索引,所述候选索引识别选定候选在候选列表中的位置。帧间预测模块121还可输出PU的MVD。下文详细描述的图6说明实例AMVP操作。
除了通过对PU执行IME及FME而产生用于PU的运动信息之外,帧间预测模块121可对PU中的每一者执行合并操作。当帧间预测模块121对PU执行合并操作时,帧间预测模块121可产生用于PU的候选列表。用于PU的候选列表可包含一个或一个以上原始候选。候选列表中的原始候选可包含一个或一个以上空间候选及时间候选。空间候选可指示当前图片中的其它PU的运动信息。时间候选可基于除了当前图片之外的图片的搭配的PU的运动信息。时间候选还可被称作时间运动向量预测子(TMVP)。
在产生候选列表之后,帧间预测模块121可从候选列表中选择候选中的一者。帧间预测模块121接着可基于由PU的运动信息指示的参考块产生用于PU的预测视频块。在合并模式中,PU的运动信息可与由选定候选指示的运动信息相同。下文所描述的图5为说明实例合并操作的流程图。
在基于IME及FME产生用于PU的预测视频块之后及在基于合并操作产生用于PU的预测视频块之后,帧间预测模块121可选择由FME操作产生预测视频块或由合并操作产生的预测视频块。在一些实例中,帧间预测模块121可基于由FME操作产生的预测视频块及由合并操作产生的预测视频块的速率/失真分析选择用于PU的预测视频块。
在帧间预测模块121已选择通过根据分割模式中的每一者分割当前CU而产生的用于PU的预测视频块之后,帧间预测模块121可选择用于当前CU的分割模式。在一些实例中,帧间预测模块121可基于通过根据分割模式中的每一者分割当前CU而产生的用于PU的选定预测视频块的速率/失真分析选择用于当前CU的分割模式。帧间预测模块121可输出与属于选定分割模式的PU相关联的预测视频块到残余产生模块102。帧间预测模块121可输出指示属于选定分割模式的PU的运动信息的语法元素到熵编码模块116。
在图4的实例中,帧间预测模块121包含IME模块180A到180N(统称为“IME模块180”)、FME模块182A到182N(统称为“FME模块182”)、合并模块184A到184N(统称为“合并模块184”)、PU模式决定模块186A到186N(统称为“PU模式决定模块186”)及CU模式决定模块188。
IME模块180、FME模块182及合并模块184可对当前CU的PU执行IME操作、FME操作及合并操作。图4的实例将帧间预测模块121说明为包含用于CU的每一分割模式的每一PU的单独IME模块180、FME模块182及合并模块184。在其它实例中,帧间预测模块121不包含用于CU的每一分割模式的每一PU的单独IME模块180、FME模块182及合并模块184。
如图4的实例中所说明,IME模块180A、FME模块182A及合并模块184A可对通过根据2Nx2N分割模式分割CU而产生的PU执行IME操作、FME操作及合并操作。PU模式决定模块186A可选择由IME模块180A、FME模块182A及合并模块184A产生的预测视频块中的一者。
IME模块180B、FME模块182B及合并模块184B可对通过根据Nx2N分割模式分割CU而产生的左PU执行IME操作、FME操作及合并操作。PU模式决定模块186B可选择由IME模块180B、FME模块182B及合并模块184B产生的预测视频块中的一者。
IME模块180C、FME模块182C及合并模块184C可对通过根据Nx2N分割模式分割CU而产生的右PU执行IME操作、FME操作及合并操作。PU模式决定模块186C可选择由IME模块180C、FME模块182C及合并模块184C产生的预测视频块中的一者。
IME模块180N、FME模块182N及合并模块184可对通过根据NxN分割模式分割CU而产生的右下PU执行IME操作、FME操作及合并操作。PU模式决定模块186N可选择由IME模块180N、FME模块182N及合并模块184N产生的预测视频块中的一者。
在PU模式决定模块186选择用于当前CU的PU的预测视频块之后,CU模式决定模块188选择用于当前CU的分割模式,且输出属于选定分割模式的PU的预测视频块及运动信息。
图5为说明实例合并操作200的流程图。例如视频编码器20等视频编码器可执行合并操作200。在其它实例中,视频编码器可执行除了合并操作200之外的合并操作。举例来说,在其它实例中,视频编码器可执行其中视频编码器执行多于、少于或不同于合并操作200的步骤的合并操作。在其它实例中,视频编码器可按不同次序或并行地执行合并操作200的步骤。编码器还可对以跳过模式编码的PU执行合并操作200。
在视频编码器开始合并操作200之后,视频编码器可产生用于当前PU的候选列表(202)。视频编码器可以各种方式产生用于当前PU的候选列表。举例来说,视频编码器可根据下文关于图8A 到15D 所描述的实例技术中的一者产生用于当前PU的候选列表。
如上文简要地论述,用于当前PU的候选列表可包含时间候选。时间候选可指示搭配的PU的运动信息。搭配的PU可在空间上与当前PU搭配,但在参考图片中而不是在当前图片中。本发明可将包含搭配的PU的参考图片称作相关参考图片。本发明可将相关参考图片的参考图片索引称作相关参考图片索引。如上文所描述,当前图片可与一个或一个以上参考图片列表(例如,列表0、列表1等)相关联。参考图片索引可通过指示参考图片在参考图片列表中的一者中的位置来指示参考图片。在一些实例中,当前图片可与组合的参考图片列表相关联。
在一些常规视频编码器中,相关参考图片索引为涵盖与当前PU相关联的参考索引源位置的PU的参考图片索引。在此些常规视频编码器中,与当前PU相关联的参考索引源位置紧靠在当前PU的左边或紧靠在当前PU的上方。在本发明中,如果与PU相关联视频块包含特定位置,那么PU可“涵盖”特定位置。在此些常规视频编码器中,如果参考索引源位置不可用,那么视频编码器可使用参考图片索引零。
然而,可存在与当前PU相关联的参考索引源位置在当前CU内的情况。在此类情况下,涵盖与当前PU相关联的参考索引源位置的PU可在此PU在当前CU上方或左边的情况下被视为可用。然而,视频编码器可需要存取当前CU的另一PU的运动信息以便确定含有搭配的PU的参考图片。因此,此些常规视频编码器可使用属于当前CU的PU的运动信息(即,参考图片索引)来产生用于当前PU的时间候选。换句话说,此些常规视频编码器可使用属于当前CU的PU的运动信息产生时间候选。因此,视频编码器可不能够并行地产生用于当前PU及涵盖与当前PU相关联的参考索引源位置的PU的候选列表。
根据本发明的技术,视频编码器可在不参考任何其它PU的参考图片索引的情况下显式地设定相关参考图片索引。这可使得视频编码器能够并行地产生用于当前PU及当前CU的其它PU的候选列表。因为视频编码器显式地设定相关参考图片索引,所以相关参考图片索引不基于当前CU的任何其它PU的运动信息。在视频编码器显式地设定相关参考图片索引的一些实例中,视频编码器可总是将相关参考图片索引设定为固定预定义的默认参考图片索引,例如0。以此方式,视频编码器可基于由默认参考图片索引指示的参考帧中的搭配的PU的运动信息产生时间候选,且可包含当前CU的候选列表中的时间候选。
在视频编码器显式地设定相关参考图片索引的实例中,视频编码器可显式地用信号发出语法结构(例如,图片标头、切片标头、APS或另一语法结构)中的相关参考图片索引。在此实例中,视频编码器可用信号发出用于每一LCU、CU、PU、TU或另一类型的子块的相关参考图片索引。举例来说,视频编码器可用信号通知用于CU的每一PU的相关参考图片索引等于“1”。
在例如下文参看图9A到9F及图10A到10F所描述的实例等一些实例中,可隐式地而非显式地设定相关参考图片索引。在此些实例中,视频编码器可使用由涵盖当前CU之外的位置的PU的参考图片索引所指示的参考图片中的PU的运动信息来产生用于当前CU的PU的候选列表中每一时间候选,即使此些位置并不严格邻近于当前PU(即,当前CU的PU)仍如此。
在产生用于当前PU的候选列表之后,视频编码器可产生与候选列表中的候选相关联的预测视频块(204)。视频编码器可通过基于所指示的候选的运动信息确定当前PU的运动信息及接着基于由当前PU的运动信息所指示的一个或一个以上参考块产生预测视频块而产生与候选相关联的预测视频块。视频编码器接着可从候选列表中选择候选中的一者(206)。视频编码器可以各种方式选择候选。举例来说,视频编码器可基于对与候选相关联的预测视频块中的每一者的速率/失真分析来选择候选中的一者。
在选择候选之后,视频编码器可输出候选索引(208)。候选索引可指示候选列表中的选定候选的位置。在一些实例中,候选索引可表示为“merge_idx”。
图6为说明实例AMVP操作210的流程图。例如视频编码器20等视频编码器可执行AMVP操作210。图6仅为AMVP操作的一个实例。
在视频编码器开始AMVP操作210之后,视频编码器可产生用于当前PU的一个或一个以上运动向量(211)。视频编码器可执行整数运动估计及分数运动估计以产生用于当前PU的运动向量。如上文所描述,当前图片可与两个参考图片列表(列表0及列表1)相关联。如果单向预测当前PU,那么视频编码器可产生用于当前PU的列表0运动向量或列表1运动向量。列表0运动向量可指示当前PU的视频块与列表0中的参考图片中的参考块之间的空间位移。列表1运动向量可指示当前PU的视频块与列表1中的参考图片中的参考块之间的空间位移。如果双向预测当前PU,那么视频编码器可产生用于当前PU的列表0运动向量及列表1运动向量。在产生用于当前PU的一个或一个以上运动向量之后,视频编码器可产生用于当前PU的预测视频块(212)。视频编码器可基于由用于当前PU的一个或一个以上运动向量所指示的一个或一个以上参考块产生用于当前PU的预测视频块。
另外,视频编码器可产生用于当前PU的候选列表(213)。在不使用属于当前CU的任何其它PU的运动信息的情况下产生基于至少一个其它PU的运动信息产生的在候选列表中的每一候选。视频译码器可以各种方式产生用于当前PU的候选列表。举例来说,视频编码器可根据下文关于图8A 到15D 所描述的实例技术中的一者或一者以上产生用于当前PU的候选列表。在一些实例中,当视频编码器在AMVP操作210中产生候选列表时,候选列表可限于两个候选。作为对比,当视频编码器在合并操作中产生候选列表时,候选列表可包含更多的候选(例如,五个候选)。
在产生用于当前PU的候选列表之后,视频编码器可产生用于候选列表中的每一候选的一个或一个以上运动向量差(MVD)(214)。视频编码器可通过确定由候选所指示的运动向量与当前PU的对应运动向量之间的差产生用于候选的运动向量差。
如果单向预测当前PU,那么视频编码器可产生用于每一候选的单一MVD。如果双向预测当前PU,那么视频编码器可产生用于每一候选的两个MVD。第一MVD可指示候选的运动向量与当前PU的列表0运动向量之间的差。第二MVD可指示候选的运动向量与当前PU的列表1运动向量之间的差。
视频编码器可从候选列表中选择候选中的一者或一者以上(215)。视频编码器可以各种方式选择一个或一个以上候选。举例来说,视频编码器可基于表示用于候选的运动向量差所需要的位的数目选择候选中的一者。
在选择一个或一个以上候选之后,视频编码器可输出用于当前PU的一个或一个以上参考图片索引、一个或一个以上候选索引及用于一个或一个以上选定候选的一个或一个以上运动向量差(216)。
在当前图片与两个参考图片列表(列表0及列表1)相关联且单向预测当前PU的情况下,视频编码器可输出用于列表0的参考图片索引(“ref_idx_l0”)或用于列表1的参考图片索引(“ref_idx_l1”)。视频编码器还可输出指示用于当前PU的列表0运动向量的选定候选在候选列表中的位置的候选索引(“mvp_l0_flag”)。或者,视频编码器可输出指示用于当前PU的列表1运动向量的选定候选在候选列表中的位置的候选索引(“mvp_l1_flag”)。视频编码器还可输出用于当前PU的列表0运动向量或列表1运动向量的MVD。
在当前图片与两个参考图片列表(列表0及列表1)相关联且双向预测当前PU的情况下,视频编码器可输出用于列表0的参考图片索引(“ref_idx_l0”)及用于列表1的参考图片索引(“ref_idx_l1”)。视频编码器还可输出指示用于当前PU的列表0运动向量的选定候选在候选列表中的位置的候选索引(“mvp_l0_flag”)。另外,视频编码器可输出指示用于当前PU的列表1运动向量的选定候选在候选列表中的位置的候选索引(“mvp_l1_flag”)。视频编码器还可输出用于当前PU的列表0运动向量的MVD及用于当前PU的列表1运动向量的MVD。
图7为说明由视频解码器(例如,视频解码器30)执行的实例运动补偿操作220的流程图。图7仅为一个实例运动补偿操作。
当视频解码器执行运动补偿操作220时,视频解码器可接收用于当前PU的选定候选的指示(222)。举例来说,视频解码器可接收指示选定候选在当前PU的候选列表内的位置的候选索引。
如果使用AMVP模式来对当前PU的运动信息编码且双向预测当前PU,那么视频解码器可接收第一候选索引及第二候选索引。第一候选索引指示用于当前PU的列表0运动向量的选定候选在候选列表中的位置。第二候选索引指示用于当前PU的列表1运动向量的选定候选在候选列表中的位置。
另外,视频解码器可产生用于当前PU的候选列表(224)。根据本发明的技术,视频解码器可产生候选列表以使得在不使用属于当前CU的任何其它PU的运动信息的情况下,产生基于至少一个其它PU的运动信息产生的在候选列表中的每一候选。视频解码器可以各种方式产生用于当前PU的此候选列表。举例来说,视频解码器可使用下文关于图8A 到15D 所描述的技术来产生用于当前PU的候选列表。当视频解码器产生用于候选列表的时间候选时,视频解码器可显式地或隐式地设定识别包含搭配的PU的参考图片的参考图片索引,如上文关于图5所描述。
在一些实例中,视频译码器(例如,视频编码器或视频解码器)可基于PU大小、PU形状、PU索引、关于相邻视频块的信息及/或其它信息调适用于CU的候选列表的大小。关于相邻视频块的信息可包含相邻视频块的预测模式、相邻视频块的运动向量、相邻视频块的运动向量差、相邻视频块的参考图片索引、相邻视频块的预测方向、相邻视频块的变换系数及/或关于相邻视频块的其它信息。举例来说,对于具有2NxN模式的CU,位于第一PU内的用于第二PU的原始候选可从候选列表中移除。结果,在此状况下,用于第二PU的候选列表的大小可小于用于第一PU的候选列表的大小。
在一些实例中,视频译码器可基于PU大小、PU形状、PU索引、关于相邻视频块的信息及/或其它信息调适用于PU的候选列表的次序。关于相邻视频块的信息可包含相邻视频块的预测模式、相邻视频块的运动向量、相邻视频块的运动向量差、相邻视频块的参考图片索引、相邻视频块的预测方向、相邻视频块的变换系数及/或关于相邻视频块的其它信息。举例来说,当基于在当前CU之外的PU的运动信息产生合并候选列表时,可针对每一PU调整候选列表中的候选的次序。对于位于更远离PU处的所述候选,其在列表中的次序可相对于更靠近于PU的候选下降。结果,尽管相同候选集合用以形成用于每一PU的候选列表,但对于CU中的每一PU,候选在列表的次序可归因于相对于所述候选的不同PU位置而不同。
在产生用于当前PU的候选列表之后,视频解码器可基于由用于当前PU的候选列表中的一个或一个以上选定候选指示的运动向量确定当前PU的运动信息(225)。举例来说,如果使用合并模式来对当前PU的运动信息编码,那么当前PU的运动信息可与由选定候选所指示的运动信息相同。如果使用AMVP模式来对当前PU的运动信息编码,那么视频解码器可使用由一个或一个以上选定候选所指示的一个或一个以上运动向量及位流中所指示的一个或一个以上MVD来重建构当前PU的一个或一个以上运动向量。当前PU的参考图片索引及预测方向指示符可与一个或一个以上选定候选的参考图片索引及预测方向指示符相同。
在确定当前PU的运动信息之后,视频解码器可基于由当前PU的运动信息所指示的一个或一个以上参考块产生用于当前PU的预测视频块(226)。
在图8A及8B中,CU的所有PU共享单一合并候选列表,所述合并候选列表可与2Nx2NPU的合并候选列表相同。因此,在图8A及8B中,视频译码器可产生由当前CU的所有PU共享的合并候选列表。以此方式,当前CU可根据除了2Nx2N分割模式之外的选定分割模式(例如,2NxN、Nx2N、NxN等)分割成多个PU,且PU中的每一者的运动信息可基于由合并候选列表中的选定候选所指示的运动信息来确定。视频译码器可以与在2Nx2N模式中分割CU的情况相同的方式产生用于多个PU的共享合并列表。换句话说,合并候选列表与将在已根据2Nx2N分割模式分割当前CU的情况下产生的候选列表相同。此方案的一个优点可为对于每一CU,可仅产生一个合并列表,而不管CU具有多少PU。另外,基于此方式,可并行地进行用于相同CU中的不同PU的运动估计。在此实例中,由CU的所有PU共享的合并列表可以与根据2Nx2N分割模式分割CU的情况相同的方式来产生。图8A及8B为在不使用当前CU的PU的运动信息的情况下产生合并候选列表及由当前CU的所有PU共享相同合并候选列表的实例。
图8A为说明CU 250及与CU 250相关联的实例源位置252A到252E的概念图。本发明可将源位置252A到252E统称为源位置252。源位置252A位于CU 250的左边。源位置252B位于CU 250上方。源位置252C位于CU 250的右上方。源位置252D位于CU 250的左下方。源位置252E位于CU 250的左上方。源位置252中的每一者在CU 250之外。
CU 250可包含一个或一个以上PU。视频译码器可基于涵盖源位置252的PU的运动信息产生用于CU 250的PU中的每一者的运动候选。以此方式,视频译码器可产生用于CU250的PU的候选列表以使得在不使用属于CU 250的任何其它PU的运动信息的情况下,产生基于至少一个其它PU的运动信息产生的每一候选。以此方式产生用于CU 250的PU的候选列表可使得视频译码器能够并行地产生CU 250的多个PU的候选列表。
图8B为说明CU 260及与CU 260相关联的实例源位置262A到262G的概念图。本发明可将源位置262A到262G统称为源位置262。图8B的实例类似于图8A的实例,除了CU 260与七个源位置相关联,而非如图8A中所示的五个源位置。在图8B的实例中,视频译码器可基于涵盖源位置262的一个或一个以上PU的运动信息产生用于CU 260的每一PU的候选列表。
图9A为说明在经2NxN分割的CU 300左边的实例参考索引源位置的概念图。PU 302及PU 304属于CU 300。在图9A的实例中,参考索引源位置306与PU 302相关联。参考索引源位置308与PU 304相关联。
图9B为说明在Nx2N CU 340左边的实例参考索引源位置的概念图。PU 342及PU344属于CU 340。在图9B的实例中,参考索引源位置348与PU 342及PU 344两者相关联。
图9C为说明在经2NxN分割的CU 320上方的实例参考索引源位置的概念图。PU 322及PU 324属于CU 320。在图9C的实例中,参考索引源位置328与PU 322及PU 324相关联。
图9D为说明在Nx2N CU 360上方的实例参考索引源位置的概念图。PU 362及PU364属于CU 360。在图9D的实例中,参考索引源位置366与PU 362相关联。参考索引源位置368与PU 364相关联。
图9E为说明在实例经NxN分割的CU 400左边的实例参考索引源位置的概念图。CU400分割成PU 402、404、406及408。参考索引源位置410与PU 402及PU 404相关联。参考索引源位置412与PU 406及PU 408相关联。
图9F为说明在经NxN分割的CU 420上方的实例参考索引源位置的概念图。CU 420分割成PU 422、424、426及428。参考索引源位置430与PU 422及PU 426相关联。参考索引源位置432与PU 426及PU 428相关联。
如图9A到9F的实例中所说明,如果与当前PU相关联的原始参考索引源位置在当前CU内,那么根据本发明的技术且替代使用原始参考索引源位置,视频译码器可识别对应于与当前PU相关联的原始参考索引源位置的在当前CU之外的位置。在当前CU之外的位置可基于位置在空间上以相同方式相对于当前PU而定位的准则对应于在当前CU之内的原始参考索引源位置(例如,两者皆在当前PU的左下方、左边、左上方、上方或右上方)。视频译码器可推断相关参考图片索引等于涵盖当前CU之外的对应位置的PU的参考图片索引。以此方式,译码器可在不使用当前CU之内的任何其它PU的运动信息的情况下确定相关参考图片索引。
如图9C的实例中所说明,紧靠在PU 324上方的位置326在CU 320内。视频译码器可使用涵盖CU 320之外的对应位置(即,参考索引源位置328)的PU的参考图片索引,而非使用涵盖位置326的PU的参考图片索引。类似地,在图9B的实例中,紧靠在PU 344的左边的位置346在CU 340内。视频译码器可使用涵盖CU 340之外的对应位置(即,参考索引源位置348)的PU的参考图片索引,而非使用涵盖位置346的PU的参考图片索引。在一些实例中,当前CU之外的对应位置在空间上以与当前CU之内的原始位置相同的方式相对于当前PU而定位。
因此,响应于确定与当前PU相关联的参考索引源位置在当前CU内,视频译码器可识别在当前CU之外的对应位置。视频译码器接着可基于由涵盖当前CU之外的对应位置的PU所指示的参考图片中的搭配的PU的运动信息产生时间候选。视频译码器接着可包含用于当前CU的候选列表中的时间候选。
图10A为说明在经2NxN分割的CU 500左边的实例参考索引源位置的概念图。PU502及PU 504属于CU 500。图10B为说明在经Nx2N分割的CU 520左边的实例参考索引源位置的概念图。PU 522及PU 524属于CU 520。图10C为说明在经2NxN分割的CU 540上方的实例参考索引源位置的概念图。PU 542及PU 544属于CU 540。图10D为说明在经Nx2N分割的CU 560上方的实例参考索引源位置的概念图。PU 562及PU 564属于CU 560。图10E为说明在经NxN分割的CU 580左边的实例参考索引源位置的概念图。CU 580分割成PU 582、584、586及588。图10F为说明在经NxN分割的CU 600上方的实例参考索引源位置的概念图。CU 600分割成PU602、604、606及608。
图10A到10F类似于图9A到9F之处在于视频译码器可经配置以从涵盖与当前PU相关联的参考索引源位置的PU确定用于当前PU的相关参考图片索引。然而,不同于图9A到9F的实例,CU的每一PU与相同参考索引源位置相关联。换句话说,用于CU中的所有PU的参考图片索引可从CU之外的单一相邻块导出。
举例来说,在图10A的实例中,PU 502及504两者与在CU 500左边的参考索引源位置506相关联。作为对比,在图9A的实例中,PU 302及304与参考索引源位置306及308相关联。类似地,在图10D的实例中,PU 562及PU 564两者与在CU 560上方的单一参考索引源位置566相关联。在图10E的实例中,PU 582、584、586及588与位于CU 580左边的单一参考索引源位置590相关联。在图10F的实例中,PU 602、604、606及608与位于CU 600上方的单一参考索引源位置610相关联。
在其它实例中,视频译码器可从空间上位于CU之外的任何其它PU确定CU的每一PU的时间候选的参考图片索引。举例来说,视频译码器可从位于CU左边、位于CU上方、位于CU左上方、位于CU右上方或位于CU左下方的PU确定CU的每一PU的时间候选的参考图片索引。使用当前CU之外的单一或多个源位置来对当前CU之内的信息译码可适用于当前CU或其它类型的块或在不同层级处。
图11为说明用以产生用于PU的时间候选的实例操作700的流程图。视频译码器(例如,视频编码器20或视频解码器30)可执行操作700。图11仅为产生用于PU的时间候选的操作的一个实例。
在视频译码器开始操作700之后,视频译码器可确定涵盖与当前PU相关联的参考索引源位置的PU是否可用(702)。本发明可将涵盖参考索引源位置的PU称作参考索引源PU。参考索引源PU可出于各种原因而不可用。举例来说,参考索引源PU可在参考索引源PU不在当前图片内的情况下不可用。在另一实例中,参考索引源PU可在参考索引源PU经帧内预测的情况下不可用。在另一实例中,参考索引源PU可在参考索引源PU在不同于当前PU的切片中的情况下不可用。
响应于确定用于当前PU的参考索引源PU可用(702的“是”),视频译码器可产生时间候选,所述时间候选指示由参考索引源PU的参考图片索引所指示的参考图片中的搭配的PU的运动信息(704)。举例来说,在图9C的实例中,涵盖位置328的PU可为用于PU 324的参考索引源PU。在此情况下,视频译码器可产生用于PU 324的时间候选,所述时间候选指示由涵盖位置328的PU的参考图片索引所指示的参考图片中的搭配的PU的运动信息。
响应于确定用于当前PU的参考索引源PU不可用(702的“否”),视频译码器可在空间上与当前CU相邻的PU当中搜索可用PU(706)。如果视频译码器未找到可用PU(708的“否”),那么视频译码器可产生时间候选,所述时间候选指示由默认参考图片索引所指示的参考图片中的搭配的PU的运动信息(710)。举例来说,如果视频译码器未找到可用PU,那么视频译码器可从由等于0、1或默认选择的另一数字的参考图片索引所指示的参考图片中的搭配的PU产生用于当前PU的时间候选。
另一方面,如果视频译码器找到可用PU(708的“是”),那么视频译码器可产生时间候选,所述时间候选指示由可用PU的参考图片索引所指示的参考图片中的搭配的PU的运动信息(712)。举例来说,如果可用PU的参考图片索引等于1,那么视频译码器可产生时间候选,所述时间候选指示由参考图片索引1所指示的参考图片中的搭配的PU的运动信息。
在另一实例中,如果参考索引源PU不可用,那么视频译码器可产生时间候选,所述时间候选指示由默认参考图片索引所指示的参考图片中的搭配的PU的运动信息。在此实例中,默认参考图片索引可为默认值(例如,零)或可在图片参数集、切片标头、APS或另一语法结构中用信号发出。
因此,在图11的实例中,视频译码器可响应于确定参考索引源PU不可用而搜索空间上与当前CU相邻的可用PU。视频译码器接着可基于由可用PU的参考图片索引所指示的参考图片中的搭配的PU的运动信息产生时间候选。视频译码器可包含用于当前PU的候选列表中的时间候选。
图12为说明用以产生用于PU的候选列表的实例操作800的流程图。视频译码器(例如,视频编码器20或视频解码器30)可执行操作800。图12仅为产生用于PU的候选列表的操作的一个实例。
在视频译码器开始操作800之后,视频译码器可基于空间上与当前PU相邻且在当前CU之外的PU的运动信息产生空间候选(802)。以此方式,从候选列表排除在当前CU内的候选。举例来说,对于经NxN分割的CU的右上PU,左候选(L)及左下候选(BL)被从其候选列表中排除。对于经NxN分割的CU的左下PU,上方候选(A)及右上候选(RA)被从候选列表中排除。对于经NxN分割的CU的右下PU,三个候选(包含左候选(L)、上方候选(A)及左上候选(LA))被从候选列表中排除。
视频译码器接着可将空间候选添加到用于当前PU的候选列表(804)。另外,视频译码器可产生时间候选,所述时间候选指示参考图片中的搭配的PU的运动信息(806)。视频译码器接着可将时间候选添加到用于当前PU的候选列表(808)。
视频译码器可在当前PU的运动信息在合并模式中用信号发出时执行操作800。视频译码器还可在当前PU的运动信息在AMVP模式中用信号发出时执行操作800或类似操作。在当前CU在AMVP模式中用信号发出的实例中,候选列表中的候选可为AMVP候选。
以此方式,视频译码器可基于空间上与当前PU相邻且在当前CU之外的PU的运动信息产生空间候选。视频译码器接着可包含用于当前PU的候选列表中的空间候选。
图13为说明用以产生用于PU的候选列表的实例操作850的流程图。视频译码器(例如,视频编码器20或视频解码器30)可执行操作850。图13仅为产生用于PU的候选列表的操作的一个实例。
在视频译码器开始操作850之后,视频译码器可基于空间上与当前CU相邻的PU的运动信息产生用于当前PU的空间候选(852)。视频译码器接着可将空间候选添加到用于当前PU的候选列表(854)。在图13的实例中,视频译码器可用在当前CU之外的对应空间候选源位置替换与当前PU相邻但在当前CU内的空间候选源位置。因此,图13中由视频译码器使用以产生空间候选的位置移动到(即,用……替换)在当前CU之外的对应位置。在当前CU之外的对应位置可位于任何相邻块位置处:在当前CU的左边、上方、左上方、右上方、左下方。因此,替代从候选列表移除依附候选(如上文关于图12所描述),候选可采自位于当前CU之外的相邻CU。如下文所描述,图14A、14B、15A、15B、15C及15D说明根据操作850由视频译码器使用以产生空间候选的空间候选源位置。
在一些实例中,如果与当前PU相邻的空间候选源位置不在当前CU内且对应PU(即,涵盖空间候选源位置的PU)不可用,那么视频译码器可执行在相邻PU当中的搜索过程以找到可用PU。如果视频译码器能够找到可用PU,那么视频译码器可基于可用PU的运动信息产生空间候选。或者,如果与当前PU相邻的空间候选源位置不在当前CU内且对应PU(即,涵盖空间候选源位置的PU)不可用,那么视频译码器可产生具有默认值(例如,零)的空间候选。默认值可在PPS、切片标头、APS或另一类型的标头中用信号发出。
另外,视频译码器可产生用于当前PU的时间候选(856)。视频译码器接着可将时间候选添加到用于当前PU的候选列表(858)。
视频译码器可在当前PU的运动信息在合并模式中用信号发出时执行操作850。视频译码器还可在当前PU的运动信息在AMVP模式中用信号发出时执行操作850或类似操作。在当前CU在AMVP模式中用信号发出的实例中,候选列表中的候选可为AMVP候选。
在图13的实例中,用于当前CU的空间候选源位置的集合最初可包含在当前PU左下方的第一空间候选源位置、在当前PU左边的第二空间候选源位置、在当前PU左上方的第三空间候选源位置、在当前PU上方的第四空间候选源位置及在当前PU右上方的第五空间候选源位置。视频译码器可用在当前CU之外的对应空间候选源位置替换在当前CU内的空间候选源位置中的任一者。视频译码器接着可基于涵盖空间候选源位置的PU的运动信息产生空间候选,且包含用于当前PU的候选列表中的空间候选。
图14A为说明与实例经Nx2N分割的CU 900的右PU相关联的实例空间候选源位置的概念图。PU 902及PU 904属于CU 900。视频译码器可基于涵盖空间候选源位置906、908、910、914及918的PU的运动信息产生用于PU 904的空间候选。空间候选源位置906位于PU904的左上方。空间候选源位置908位于PU 904上方。空间候选源位置910位于PU 904的右上方。空间候选源位置914位于PU 904的左下方。位置916空间上位于PU 904的左边。然而,视频译码器可使用涵盖空间候选源位置918的PU的运动信息来产生用于PU 904的空间候选,而非使用涵盖位置916的PU(即,PU 902)的运动信息来产生用于PU 904的空间候选。空间候选源位置918空间上在CU 900的左边。
图14B为说明与经2NxN分割的CU 920的下PU相关联的实例空间候选源位置的概念图。PU 922及PU 924属于CU 920。视频译码器可基于空间上在PU 922左上方、上方、右上方、左边及左下方的空间候选源位置产生用于PU 922的空间候选。因为PU 922的位置在CU 920内,所以此些空间候选源位置中无一者在CU 920内。因此,不需要视频译码器“移动”与PU922相关联的空间候选源位置中的任一者以产生基于在CU 920之外的PU的运动信息的用于PU 922的空间候选。
视频译码器可基于空间候选源位置926、928、932、934及936产生用于PU 924 的空间候选。空间候选源位置928位于PU 924的右上方。空间候选源位置932空间上位于PU 924的左下方。空间候选源位置934空间上位于PU 924的左边。空间候选源位置936空间上位于PU 924的左上方。
位置938空间上位于PU 924上方。然而,位置938位于CU 920内。因此,视频译码器可基于涵盖空间候选源位置926的PU的运动信息来产生用于PU 924的空间运动候选,而非使用涵盖位置938的PU(即,PU 922)的运动信息来产生用于PU 924的空间运动候选。
图15A到15D为说明与经NxN分割的CU 950的PU相关联的空间候选源位置的概念图。PU 952、954、956及958属于CU 950。图15A为说明与PU 952相关联的实例空间候选源位置的概念图。如图15A的实例中所说明,视频译码器可基于涵盖空间候选源位置960、962、964、966及968的PU的运动信息产生用于PU 952的空间运动候选。空间候选源位置960、962、964、966或968中无一者位于CU 950内。因此,不需要视频译码器“移动”与PU 952相关联的空间候选源位置中的任一者以产生用于PU 952的运动候选。
图15B为说明与PU 954相关联的实例空间候选源位置的概念图。如图15B的实例中所说明,视频译码器可基于涵盖空间候选源位置980、982、984、986及988的PU的运动信息产生用于PU 954的空间运动候选。空间候选源位置980、982及984位于CU 950之外。位置990空间上在PU 954的左边。位置992空间上在PU 954的左下方。然而,位置990及992在CU 950内。因此,替代基于涵盖位置990及992的PU(即,PU 952及956)的运动信息产生空间运动候选,视频译码器可基于涵盖CU 950之外的对应位置(即,空间候选源位置986及988)的PU的运动信息产生用于PU 954的空间运动候选。空间候选源位置986及988在PU 950之外。
图15C为说明与PU 956相关联的实例空间候选源位置的概念图。如图15C的实例中所说明,视频译码器可基于涵盖空间候选源位置1000、1002、1004、1006及1008的PU的运动信息产生用于PU 956的空间运动候选。空间候选源位置1000、1002、1004、1006及1008为在CU 950之外的位置。位置1010空间上在PU 956上方。位置1012空间上在PU 956的右上方。然而,位置1010及1012在CU 950内。因此,替代基于涵盖位置990及992的PU(即,PU 952及954)的运动信息产生空间运动候选,视频译码器可基于涵盖CU 950之外的对应位置(即,空间候选源位置1000及1002)的PU的运动信息产生用于PU 954的空间运动候选。
图15D为说明与PU 958相关联的实例空间候选源位置的概念图。如图15D的实例中所说明,视频译码器可基于涵盖空间候选源位置1020、1022、1024、1026及1028的PU的运动信息产生空间运动候选。空间候选源位置1020、1022、1024、1026及1028为在CU 950之外的位置。位置1030空间上在PU 956上方。位置1032空间上在PU 956的左上方。位置1034空间上在PU 958的左边。然而,位置1030、1032及1034在CU 950内。因此,替代基于涵盖位置1030、1032及1034的PU(即,PU 954、952及956)的运动信息产生空间运动候选,视频译码器可基于涵盖CU 950之外的对应位置(即,空间候选源位置1020、1028及1026)的PU的运动信息产生用于PU 954的空间运动候选。
图14A、14B及图15A到15D展示根据Nx2N、2NxN及NxN分割模式分割的CU。然而,关于其它分割模式可应用类似概念。
在一个或一个以上实例中,所描述的功能可以硬件、软件、固件或其任何组合来实施。如果以软件实施,那么功能可作为一个或一个以上指令或代码存储在计算机可读媒体上或经由计算机可读媒体传输,且由基于硬件的处理单元执行。计算机可读媒体可包含对应于例如数据存储媒体等有形媒体的计算机可读存储媒体,或包含促进计算机程序例如根据通信协议从一处传送到另一处的任何媒体的通信媒体。以此方式,计算机可读媒体通常可对应于(1)非暂时性的有形计算机可读存储媒体,或(2)例如信号或载波等通信媒体。数据存储媒体可以是可由一个或一个以上计算机或一个或一个以上处理器存取以检索用于实施本发明中所述的技术的指令、代码及/或数据结构的任何可用媒体。计算机程序产品可包含计算机可读媒体。
举例来说且并非限制,此类计算机可读存储媒体可包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储装置、磁盘存储装置或其它磁性存储装置、快闪存储器或可用来以指令或数据结构的形式存储所要程序代码且可由计算机存取的任何其它媒体。而且,可恰当地将任何连接称作计算机可读媒体。举例来说,如果使用同轴电缆、光缆、双绞线、数字订户线(DSL)或例如红外线、无线电及微波等无线技术从网站、服务器或其它远程源传输指令,那么同轴电缆、光缆、双绞线、DSL或例如红外线、无线电及微波等无线技术包含于媒体的定义中。然而,应理解,计算机可读存储媒体和数据存储媒体不包含连接、载波、信号或其它暂态媒体,而是改为针对非暂态、有形的存储媒体。如本文中所使用,磁盘和光盘包含压缩光盘(CD)、激光光盘、光学光盘、数字多功能光盘(DVD)、软磁盘和蓝光光盘,其中磁盘通常磁性地复制数据,而光盘使用激光光学地复制数据。上文的组合也应包含在计算机可读媒体的范围内。
指令可由一个或一个以上处理器来执行,例如一个或一个以上数字信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、现场可编程逻辑阵列(FPGA),或其它等效的集成或离散的逻辑电路。因此,如本文中所使用的术语“处理器”可指上述结构或适合于实施本文中所描述的技术的任一其它结构中的任一者。另外,在一些方面中,本文描述的功能性可提供于经配置以用于编码和解码的专用硬件和/或软件模块内,或并入在组合式编解码器中。并且,可将所述技术完全实施于一个或一个以上电路或逻辑元件中。
本发明的技术可实施在各种各样的装置或设备中,包含无线手持机、集成电路(IC)或IC的集合(例如,芯片集)。本发明中描述了各种组件、模块或单元以强调经配置以执行所揭示技术的装置的功能方面,但不一定要求通过不同硬件单元来实现。而是,如上所述,各种单元可在编解码器硬件单元中组合或由互操作硬件单元(包含如上所述的一个或一个以上处理器)的集合结合合适软件和/或固件来提供。
已描述了各种实例。这些及其它实例属于所附权利要求书的范围内。

Claims (62)

1.一种用于对视频数据解码的方法,所述方法包括:对于属于当前图片的当前译码单元CU的多个预测单元PU中的每一PU,
产生用于所述PU的候选列表,其中用于所述PU的候选列表的产生仅使用当前CU外部的源位置,其中所述PU的候选列表包括一个或多个空间候选,所述源位置包括以下的至少一者:在当前图片中当前CU上方的源位置,在当前图片中当前CU右上方的源位置,在当前图片中当前CU左上方的源位置,在当前图片中当前CU左方的源位置,以及在当前图片中当前CU左下方的源位置;
至少部分基于由用于所述PU的所述候选列表中的选定候选指示的运动信息确定所述PU的运动向量;及
使用所述PU的所述运动向量识别所述PU的参考样品。
2.根据权利要求1所述的方法,其中产生用于所述PU的所述候选列表包括与产生用于所述PU中的另一者的候选列表并行地产生用于所述PU的所述候选列表。
3.根据权利要求1所述的方法,其中产生所述候选列表包括产生由所述当前CU的所有所述PU共享的合并候选列表。
4.根据权利要求3所述的方法,其中产生所述合并候选列表包括基于在所述当前CU之外的PU的运动信息产生所述合并候选列表。
5.根据权利要求4所述的方法,其中所述当前CU根据除了2Nx2N分割模式之外的选定分割模式被分割成所述多个PU,所述方法包括基于由所述合并候选列表中的选定候选所指示的运动信息来确定所述PU中的每一者的所述运动信息,且所述合并候选列表与在所述当前CU已根据所述2Nx2N分割模式分割的情况下将会产生的候选列表相同。
6.根据权利要求1所述的方法,其中产生所述候选列表包括:
基于由默认参考图片索引所指示的参考帧中的搭配的PU的运动信息产生时间候选;及
将所述时间候选包含在所述PU的所述候选列表中。
7.根据权利要求1所述的方法,其中产生所述候选列表包括基于由涵盖所述当前CU之外的位置的PU的参考图片索引所指示的参考图片中的PU的运动信息产生所述候选列表中的每一时间候选。
8.根据权利要求7所述的方法,其中对于所述多个PU中的每一各自的PU产生所述各自PU的候选列表包括:
响应于确定与所述各自PU相关联的参考索引源位置在所述当前CU内,识别在所述当前CU之外的对应位置;
基于由涵盖所述当前CU之外的所述对应位置的PU所指示的参考图片中的搭配的PU的运动信息产生时间候选;及
将所述时间候选包含在所述各自PU的所述候选列表中。
9.根据权利要求1所述的方法,其中对于所述多个PU中的每一各自的PU,产生所述各自PU的候选列表包括:
响应于确定参考索引源PU不可用,搜索空间上与所述当前CU相邻的可用PU,所述参考索引源PU涵盖与所述各自PU相关联的参考索引源位置;
基于由所述可用PU的参考图片索引所指示的参考图片中的搭配的PU的运动信息产生时间候选;及
将所述时间候选包含在用于所述各自PU的所述候选列表中。
10.根据权利要求1所述的方法,其中对于所述多个PU中的每一各自的PU,产生所述各自PU的候选列表包括:
基于空间上与所述各自PU相邻且在所述当前CU之外的PU的运动信息产生所述一个或一个以上空间候选;及
将所述一个或一个以上空间候选包含在所述各自PU的所述候选列表中。
11.根据权利要求1所述的方法,
其中,对于所述多个PU中的每一各自的PU,空间候选源位置集合包含在所述各自PU左下方的第一空间候选源位置、在所述各自PU左边的第二空间候选源位置、在所述各自PU左上方的第三空间候选源位置、在所述各自PU上方的第四空间候选源位置及在所述各自PU右上方的第五空间候选源位置,及
其中对于所述各自PU产生所述候选列表包括:
用在所述当前CU之外的对应空间候选源位置替换在所述当前CU内的所述空间候选源位置中的任一者;
基于涵盖所述空间候选源位置的PU的运动信息产生所述一个或一个以上空间候选;及
将所述一个或一个以上空间候选包含在所述候选列表中。
12.根据权利要求1所述的方法,其进一步包括基于所述PU的所述预测视频块产生用于所述当前CU的经重建构的视频块。
13.根据权利要求12所述的方法,其进一步包括对于所述多个PU中的每一各自的PU,基于由用于所述PU的所述候选列表中的所述选定候选所指示的运动向量识别所述PU的所述参考块。
14.根据权利要求12所述的方法,其中对于所述多个PU中的至少一个PU,所述方法进一步包括:
接收用于所述PU的运动向量差MVD;
基于所述MVD及由用于所述PU的所述候选列表中的所述选定候选所指示的运动向量确定所述PU的运动向量;及
基于所述PU的所述运动向量识别所述PU的所述参考块。
15.一种视频解码装置,其包括:
存储器,其经配置以存储视频数据;以及
一个或一个以上处理器,其经配置以使得对于属于所述视频数据的当前图片的当前译码单元CU的多个预测单元PU中的每一PU,所述一个或一个以上处理器进行以下操作:
产生用于所述PU的候选列表,其中所述PU的候选列表的产生仅使用当前CU外部的源位置,其中用于所述PU的所述候选列表包含一个或一个以上空间候选,所述源位置包括以下的至少一者:在当前图片中当前CU上方的源位置,在当前图片中当前CU右上方的源位置,在当前图片中当前CU左上方的源位置,在当前图片中当前CU左方的源位置,以及在当前图片中当前CU左下方的源位置;
至少部分基于由用于所述PU的所述候选列表中的选定候选指示的运动信息确定所述PU的运动向量;及
使用所述PU的所述运动向量识别参考样品。
16.根据权利要求15所述的视频解码装置,其中所述一个或一个以上处理器经配置以与产生用于所述PU中的另一者的候选列表并行地产生用于所述PU的所述候选列表。
17.根据权利要求15所述的视频解码装置,其中所述一个或一个以上处理器经配置以产生由所述当前CU的所有所述PU共享的合并候选列表。
18.根据权利要求17所述的视频解码装置,其中所述一个或一个以上处理器经配置以基于在所述当前CU之外的PU的运动信息产生所述合并候选列表。
19.根据权利要求18所述的视频解码装置,其中所述当前CU根据除了2Nx2N分割模式之外的选定分割模式被分割成所述多个PU,所述一个或一个以上处理器经配置以基于由所述合并候选列表中的选定候选所指示的运动信息来确定所述PU中的每一者的所述运动信息,且所述合并候选列表与在所述当前CU已根据所述2Nx2N分割模式分割的情况下将会产生的候选列表相同。
20.根据权利要求15所述的视频解码装置,其中所述一个或一个以上处理器经配置以:
基于由默认参考图片索引所指示的参考帧中的搭配的PU的运动信息产生时间候选;及
将所述时间候选包含在所述PU的所述候选列表中。
21.根据权利要求15所述的视频解码装置,其中所述一个或一个以上处理器经配置以基于由涵盖所述当前CU之外的位置的PU的参考图片索引所指示的参考图片中的PU的运动信息产生所述候选列表中的每一时间候选。
22.根据权利要求21所述的视频解码装置,其中所述一个或一个以上处理器经配置以:
响应于确定与所述PU相关联的参考索引源位置在所述当前CU内,识别在所述当前CU之外的对应位置;
基于由涵盖所述当前CU之外的所述对应位置的PU所指示的参考图片中的搭配的PU的运动信息产生时间候选;及
将所述时间候选包含在所述候选列表中。
23.根据权利要求15所述的视频解码装置,其中所述CU为当前CU,且所述一个或一个以上处理器经配置以:
响应于确定参考索引源PU不可用,搜索空间上与所述当前CU相邻的可用PU,所述参考索引源PU涵盖与所述当前PU相关联的参考索引源位置;
基于由所述可用PU的参考图片索引所指示的参考图片中的搭配的PU的运动信息产生时间候选;及
将所述时间候选包含在用于所述当前CU的所述候选列表中。
24.根据权利要求15所述的视频解码装置,其中所述一个或一个以上处理器经配置以:
基于空间上与所述PU相邻且在所述当前CU之外的PU的运动信息产生所述一个或一个以上空间候选;及
将所述一个或一个以上空间候选包含在所述候选列表中。
25.根据权利要求15所述的视频解码装置,
其中,对于所述多个PU中的每一各自的PU,空间候选源位置集合包含在所述PU左下方的第一空间候选源位置、在所述PU左边的第二空间候选源位置、在所述PU左上方的第三空间候选源位置、在所述PU上方的第四空间候选源位置及在所述PU右上方的第五空间候选源位置,及
其中所述一个或一个以上处理器经配置以:
用在所述当前CU之外的对应空间候选源位置替换在所述当前CU内的所述空间候选源位置中的任一者;
基于涵盖所述空间候选源位置的PU的运动信息产生所述一个或一个以上空间候选;及
将所述一个或一个以上空间候选包含在所述候选列表中。
26.根据权利要求15所述的视频解码装置,其中视频译码装置经配置以基于所述PU的所述参考样品产生用于所述当前CU的经重建构的视频块。
27.根据权利要求26所述的视频解码装置,其中产生所述候选列表作为使用合并模式帧间预测模式的部分。
28.根据权利要求26所述的视频解码装置,其中产生所述候选列表作为高级运动向量预测帧间预测模式的部分。
29.根据权利要求15所述的视频解码装置,其中所述视频译码装置为移动计算装置。
30.一种视频解码装置,其包括:
对于属于当前图片的当前译码单元CU的多个预测单元PU中的每一PU:
用于产生用于所述PU的候选列表,其中用于所述PU的候选列表的产生仅使用当前CU外部的源位置,其中所述PU的候选列表包括一个或多个空间候选,所述源位置包括以下的至少一者:在当前图片中当前CU上方的源位置,在当前图片中当前CU右上方的源位置,在当前图片中当前CU左上方的源位置,在当前图片中当前CU左方的源位置,以及在当前图片中当前CU左下方的源位置用于至少部分基于由用于所述PU的所述候选列表中的选定候选指示的运动信息确定所述PU的运动向量的装置;及
用于使用所述PU的所述运动向量识别所述PU的参考样品的装置。
31.根据权利要求30所述的视频解码装置,其包括用于并行地产生用于所述PU中的两者或两者以上的所述候选列表的装置。
32.根据权利要求30所述的视频解码装置,其包括用于产生由所述当前CU的所有所述PU共享的合并候选列表的装置。
33.一种用于对视频数据编码的方法,所述方法包括:对于属于当前图片的当前译码单元CU的多个预测单元PU中的每一PU,
产生用于所述PU的候选列表,其中用于所述PU的候选列表的产生仅使用当前CU外部的源位置,其中所述PU的候选列表包括一个或多个空间候选,所述源位置包括以下的至少一者:在当前图片中当前CU上方的源位置,在当前图片中当前CU右上方的源位置,在当前图片中当前CU左上方的源位置,在当前图片中当前CU左方的源位置,以及在当前图片中当前CU左下方的源位置;以及
至少部分基于由用于所述PU的所选定的候选的运动信息识别所述PU的参考样品。
34.根据权利要求33所述的方法,其中产生用于所述PU的所述候选列表包括与产生用于所述PU中的另一者的候选列表并行地产生用于所述PU的所述候选列表。
35.根据权利要求33所述的方法,其中产生所述候选列表包括产生由所述当前CU的所有所述PU共享的合并候选列表。
36.根据权利要求35所述的方法,其中产生所述合并候选列表包括基于在所述当前CU之外的PU的运动信息产生所述合并候选列表。
37.根据权利要求36所述的方法,其中所述当前CU根据除了2Nx2N分割模式之外的选定分割模式被分割成所述多个PU,所述PU中的每一者的所述运动信息是基于由所述合并候选列表中的选定候选所指示的运动信息,且所述合并候选列表与在所述当前CU已根据所述2Nx2N分割模式分割的情况下将会产生的候选列表相同。
38.根据权利要求33所述的方法,其中产生所述候选列表包括:
基于由默认参考图片索引所指示的参考帧中的搭配的PU的运动信息产生时间候选;及
将所述时间候选包含在所述PU的所述候选列表中。
39.根据权利要求33所述的方法,其中产生所述候选列表包括基于由涵盖所述当前CU之外的位置的PU的参考图片索引所指示的参考图片中的PU的运动信息产生所述候选列表中的每一时间候选。
40.根据权利要求39所述的方法,其中,对于所述多个PU中的每一各自的PU产生所述各自PU的所述候选列表包括:
响应于确定与所述PU相关联的参考索引源位置在所述当前CU内,识别在所述当前CU之外的对应位置;
基于由涵盖所述当前CU之外的所述对应位置的PU所指示的参考图片中的搭配的PU的运动信息产生时间候选;及
将所述时间候选包含在所述候选列表中。
41.根据权利要求33所述的方法,其中,对于所述多个PU中的每一各自的PU产生所述各自PU的所述候选列表包括:
响应于确定参考索引源PU不可用,搜索空间上与所述当前CU相邻的可用PU,所述参考索引源PU为涵盖与所述各自PU相关联的参考索引源位置的PU;
基于由所述可用PU的参考图片索引所指示的参考图片中的搭配的PU的运动信息产生时间候选;及
将所述时间候选包含在所述各自PU的所述候选列表中。
42.根据权利要求33所述的方法,其中,对于所述多个PU中的每一各自的PU产生所述各自PU的所述候选列表包括:
基于空间上与所述各自PU相邻且在所述当前CU之外的PU的运动信息产生所述一个或一个以上空间候选;及
将所述一个或一个以上空间候选包含在所述各自PU的所述候选列表中。
43.根据权利要求33所述的方法,
其中,对于所述多个PU中的每一各自的PU空间候选源位置集合包含在所述各自PU左下方的第一空间候选源位置、在所述各自PU左边的第二空间候选源位置、在所述各自PU左上方的第三空间候选源位置、在所述各自PU上方的第四空间候选源位置及在所述各自PU右上方的第五空间候选源位置,及
其中产生所述各自PU的所述候选列表包括:
用在所述当前CU之外的对应空间候选源位置替换在所述当前CU内的所述空间候选源位置中的任一者;
基于涵盖所述空间候选源位置的PU的运动信息产生所述一个或一个以上空间候选;及
将所述一个或一个以上空间候选包含在所述候选列表中。
44.根据权利要求33所述的方法,其中产生所述候选列表作为使用合并模式帧间预测模式的部分。
45.根据权利要求33所述的方法,其中产生所述候选列表作为高级运动向量预测帧间预测模式的部分。
46.一种视频编码装置,其包括:
存储器,其经配置以存储视频数据;以及
一个或一个以上处理器,所述处理器经配置以:对于属于所述视频数据的当前图片的当前译码单元CU的多个预测单元PU中的每一PU,
产生用于所述PU的候选列表,其中所述PU的候选列表的产生仅使用当前CU外部的源位置,其中用于所述PU的所述候选列表包含一个或一个以上空间候选,所述源位置包括以下的至少一者:在当前图片中当前CU上方的源位置,在当前图片中当前CU右上方的源位置,在当前图片中当前CU左上方的源位置,在当前图片中当前CU左方的源位置,以及在当前图片中当前CU左下方的源位置;以及
至少部分基于由用于所述PU的所选定的候选的运动信息识别所述PU的参考样品。
47.根据权利要求46所述的视频编码装置,其中所述一个或一个以上处理器经配置以并行地产生用于所述PU中的两者或两者以上的所述候选列表。
48.根据权利要求46所述的视频编码装置,其中所述一个或一个以上处理器经配置以产生由所述当前CU的所有所述PU共享的合并候选列表。
49.根据权利要求48所述的视频编码装置,其中所述一个或一个以上处理器经配置以基于在所述当前CU之外的PU的运动信息产生所述合并候选列表。
50.根据权利要求49所述的视频编码装置,其中所述当前CU根据除了2Nx2N分割模式之外的选定分割模式被分割成所述多个PU,且所述PU中的每一者的所述运动信息可基于由所述合并候选列表中的选定候选所指示的运动信息来确定,其中所述合并候选列表与在所述当前CU已根据所述2Nx2N分割模式分割的情况下将会产生的候选列表相同。
51.根据权利要求46所述的视频编码装置,其中所述一个或一个以上处理器经配置以:
基于由默认参考图片索引所指示的参考帧中的搭配的PU的运动信息产生时间候选;及
将所述时间候选包含在当前PU的所述候选列表中,所述当前PU为属于所述当前CU的所述PU中的一者。
52.根据权利要求46所述的视频编码装置,其中所述一个或一个以上处理器经配置以基于由涵盖所述当前CU之外的位置的PU的参考图片索引所指示的参考图片中的PU的运动信息产生所述候选列表中的每一时间候选。
53.根据权利要求52所述的视频编码装置,其中所述一个或一个以上处理器经配置以:
响应于确定与当前PU相关联的参考索引源位置在所述当前CU内,识别在所述当前CU之外的对应位置,所述当前PU为属于所述当前CU的所述PU中的一者;
基于由涵盖所述当前CU之外的所述对应位置的PU所指示的参考图片中的搭配的PU的运动信息产生时间候选;及
将所述时间候选包含在用于所述当前CU的所述候选列表中。
54.根据权利要求46所述的视频编码装置,其中所述一个或一个以上处理器经配置以:
响应于确定参考索引源PU不可用,搜索空间上与所述当前CU相邻的可用PU,所述参考索引源PU为涵盖与当前PU相关联的参考索引源位置的PU,所述当前PU为属于所述当前CU的所述PU中的一者;
基于由所述可用PU的参考图片索引所指示的参考图片中的搭配的PU的运动信息产生时间候选;及
将所述时间候选包含在用于所述当前CU的所述候选列表中。
55.根据权利要求46所述的视频编码装置,其中所述一个或一个以上处理器经配置以:
基于空间上与当前PU相邻且在所述当前CU之外的PU的运动信息产生所述一个或一个以上空间候选,所述当前PU为属于所述当前CU的所述PU中的一者;及
将所述一个或一个以上空间候选包含在用于所述当前PU的所述候选列表中。
56.根据权利要求46所述的视频编码装置,
其中空间候选源位置集合包含在所述PU左下方的第一空间候选源位置、在所述PU左边的第二空间候选源位置、在所述PU左上方的第三空间候选源位置、在所述PU上方的第四空间候选源位置及在所述PU右上方的第五空间候选源位置,及
其中所述一个或一个以上处理器经配置以:
用在所述当前CU之外的对应空间候选源位置替换在所述当前CU内的所述空间候选源位置中的任一者;
基于涵盖所述空间候选源位置的PU的运动信息产生所述一个或一个以上空间候选;及
将所述一个或一个以上空间候选包含在用于所述PU的所述候选列表中。
57.根据权利要求46所述的视频编码装置,其中产生所述候选列表作为使用合并模式帧间预测模式的部分。
58.根据权利要求46所述的视频编码装置,其中产生所述候选列表作为高级运动向量预测帧间预测模式的部分。
59.根据权利要求46所述的视频编码装置,其中所述视频译码装置为移动计算装置。
60.一种视频编码装置,其包括:
对于属于当前图片的当前译码单元CU的多个预测单元PU中的每一PU:
用于产生用于所述PU的候选列表的装置,其中用于所述PU的候选列表的产生仅使用当前CU外部的源位置,其中所述PU的候选列表包括一个或多个空间候选,所述源位置包括以下的至少一者:在当前图片中当前CU上方的源位置,在当前图片中当前CU右上方的源位置,在当前图片中当前CU左上方的源位置,在当前图片中当前CU左方的源位置,以及在当前图片中当前CU左下方的源位置;及
用于至少部分基于用于所述PU的所选定的候选的运动信息识别所述PU的参考样品的装置。
61.根据权利要求60所述的视频编码装置,其包括用于并行地产生用于所述PU中的两者或两者以上的所述候选列表的装置。
62.根据权利要求60所述的视频编码装置,其包括用于产生由所述当前CU的所有所述PU共享的合并候选列表的装置。
CN201280045175.3A 2011-09-17 2012-08-15 用于视频译码的运动向量确定 Active CN103797799B (zh)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
US201161535964P 2011-09-17 2011-09-17
US61/535,964 2011-09-17
US201161564764P 2011-11-29 2011-11-29
US201161564799P 2011-11-29 2011-11-29
US61/564,799 2011-11-29
US61/564,764 2011-11-29
US13/585,423 2012-08-14
US13/585,423 US9736489B2 (en) 2011-09-17 2012-08-14 Motion vector determination for video coding
PCT/US2012/050918 WO2013039639A1 (en) 2011-09-17 2012-08-15 Motion vector determination for video coding

Publications (2)

Publication Number Publication Date
CN103797799A CN103797799A (zh) 2014-05-14
CN103797799B true CN103797799B (zh) 2017-06-30

Family

ID=47880652

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201280045175.3A Active CN103797799B (zh) 2011-09-17 2012-08-15 用于视频译码的运动向量确定

Country Status (20)

Country Link
US (1) US9736489B2 (zh)
EP (1) EP2756674B1 (zh)
JP (1) JP6092222B2 (zh)
KR (2) KR101858885B1 (zh)
CN (1) CN103797799B (zh)
AU (1) AU2012309042B2 (zh)
BR (1) BR112014006185B1 (zh)
CA (1) CA2847849C (zh)
DK (1) DK2756674T3 (zh)
ES (1) ES2742026T3 (zh)
HU (1) HUE044692T2 (zh)
IL (1) IL231148A (zh)
MY (1) MY186970A (zh)
PL (1) PL2756674T3 (zh)
PT (1) PT2756674T (zh)
RU (1) RU2591645C2 (zh)
SG (2) SG11201400207QA (zh)
SI (1) SI2756674T1 (zh)
WO (1) WO2013039639A1 (zh)
ZA (1) ZA201402834B (zh)

Families Citing this family (49)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101279573B1 (ko) 2008-10-31 2013-06-27 에스케이텔레콤 주식회사 움직임 벡터 부호화 방법 및 장치와 그를 이용한 영상 부호화/복호화 방법 및 장치
WO2013006386A1 (en) * 2011-07-01 2013-01-10 General Instrument Corporation Motion vector prediction design simplification
WO2013051209A1 (ja) 2011-10-05 2013-04-11 パナソニック株式会社 画像符号化方法、画像符号化装置、画像復号方法、画像復号装置、および、画像符号化復号装置
JP2013118627A (ja) * 2011-10-31 2013-06-13 Jvc Kenwood Corp 動画像復号装置、動画像復号方法、動画像復号プログラム、受信装置、受信方法及び受信プログラム
CN107580223B (zh) 2011-11-08 2020-12-08 株式会社Kt 利用解码装置对视频信号进行解码的方法
CN109996082B (zh) * 2011-11-08 2022-01-25 韩国电子通信研究院 用于共享候选者列表的方法和装置
CN107659813B (zh) 2011-12-23 2020-04-17 韩国电子通信研究院 图像解码方法、图像编码方法和记录介质
JP5835208B2 (ja) * 2011-12-28 2015-12-24 株式会社Jvcケンウッド 動画像符号化装置、動画像符号化方法、及び動画像符号化プログラム、並びに、送信装置、送信方法、及び送信プログラム
US11317101B2 (en) 2012-06-12 2022-04-26 Google Inc. Inter frame candidate selection for a video encoder
CN108156463B (zh) * 2012-08-29 2022-07-01 Vid拓展公司 用于可分级视频编码的运动矢量预测的方法和装置
US9491459B2 (en) * 2012-09-27 2016-11-08 Qualcomm Incorporated Base layer merge and AMVP modes for video coding
CN102883163B (zh) 2012-10-08 2014-05-28 华为技术有限公司 用于运动矢量预测的运动矢量列表建立的方法、装置
US9485515B2 (en) 2013-08-23 2016-11-01 Google Inc. Video coding using reference motion vectors
US9503746B2 (en) 2012-10-08 2016-11-22 Google Inc. Determine reference motion vectors
JP5983430B2 (ja) * 2013-01-25 2016-08-31 富士通株式会社 動画像符号化装置、動画像符号化方法及び動画像復号装置ならびに動画像復号方法
CN103237213B (zh) * 2013-04-08 2016-03-30 华为技术有限公司 视频编码方法和视频解码方法及相关装置
KR102179383B1 (ko) * 2013-08-09 2020-11-16 삼성전자주식회사 병합 모드 결정 방법 및 장치
US9426465B2 (en) * 2013-08-20 2016-08-23 Qualcomm Incorporated Sub-PU level advanced residual prediction
US10313682B2 (en) * 2013-08-26 2019-06-04 Qualcomm Incorporated Determining regions when performing intra block copying
US9667996B2 (en) 2013-09-26 2017-05-30 Qualcomm Incorporated Sub-prediction unit (PU) based temporal motion vector prediction in HEVC and sub-PU design in 3D-HEVC
US9762927B2 (en) * 2013-09-26 2017-09-12 Qualcomm Incorporated Sub-prediction unit (PU) based temporal motion vector prediction in HEVC and sub-PU design in 3D-HEVC
US10212441B2 (en) * 2014-02-12 2019-02-19 Chips & Media, Inc. Method and apparatus for processing video
US11477477B2 (en) * 2015-01-26 2022-10-18 Qualcomm Incorporated Sub-prediction unit based advanced temporal motion vector prediction
US20180249176A1 (en) * 2015-03-11 2018-08-30 Lg Electronics Inc. Method and apparatus for encoding and decoding video signal
WO2017036414A1 (en) * 2015-09-02 2017-03-09 Mediatek Inc. Method and apparatus of decoder side motion derivation for video coding
WO2017220163A1 (en) * 2016-06-24 2017-12-28 Huawei Technologies Co., Ltd. Devices and methods for video coding using segmentation based partitioning of video coding blocks
ES2886431T3 (es) * 2016-09-30 2021-12-20 Huawei Tech Co Ltd Método de codificación de vídeo, método de decodificación de video y terminal
US20190246101A1 (en) * 2016-10-10 2019-08-08 Samsung Electronics Co., Ltd. Method and device for encoding or decoding image by means of block map
CN111279695B (zh) * 2017-10-26 2024-03-29 韩国电子通信研究院 用于基于非对称子块的图像编码/解码的方法及装置
US10587885B2 (en) * 2018-06-04 2020-03-10 Tencent America LLC Method and apparatus for merge mode with additional middle candidates in video coding
TWI746994B (zh) * 2018-06-19 2021-11-21 大陸商北京字節跳動網絡技術有限公司 用於不同參考列表的不同精確度
CN117676163A (zh) 2018-07-06 2024-03-08 寰发股份有限公司 解码器的视频解码方法及装置
WO2020015706A1 (en) 2018-07-18 2020-01-23 Mediatek Inc. Method and apparatus of motion compensation bandwidth reduction for video coding system utilizing multi-hypothesis
US11051010B2 (en) 2018-07-18 2021-06-29 Mediatek Inc. Merge candidates with multiple hypothesis
CN112585972B (zh) * 2018-08-17 2024-02-09 寰发股份有限公司 视频编解码的帧间预测方法及装置
US10924731B2 (en) * 2018-08-28 2021-02-16 Tencent America LLC Complexity constraints on merge candidates list construction
RU2757209C1 (ru) 2018-08-29 2021-10-12 Бейджинг Дацзя Интернет Информейшн Текнолоджи Ко., Лтд. Способы и устройства для кодирования видео с использованием вектора движения временного предсказания на основе субблоков
TWI815967B (zh) 2018-09-19 2023-09-21 大陸商北京字節跳動網絡技術有限公司 仿射模式編解碼的模式相關自適應調整運動矢量分辨率
CN112840653B (zh) * 2018-10-06 2023-12-26 寰发股份有限公司 视频编解码中共享合并候选列表区域的方法和装置
WO2020094051A1 (en) * 2018-11-06 2020-05-14 Beijing Bytedance Network Technology Co., Ltd. Signaling of side information for inter prediction with geometric partitioning
EP3847814A4 (en) * 2018-11-06 2021-07-14 Beijing Bytedance Network Technology Co. Ltd. POSITION DEPENDENT STORAGE, MOVEMENT INFORMATION
CN117880493A (zh) 2018-11-13 2024-04-12 北京字节跳动网络技术有限公司 用于空域运动候选列表的构建方法
CN117880495A (zh) * 2018-12-03 2024-04-12 北京字节跳动网络技术有限公司 候选的最大数量的指示方法
US11172214B2 (en) * 2018-12-21 2021-11-09 Qualcomm Incorporated Derivation of processing area for parallel processing in video coding
CN113170166B (zh) 2018-12-30 2023-06-09 北京字节跳动网络技术有限公司 具有几何分割的帧间预测在视频处理中有条件的应用
WO2020164627A1 (en) 2019-02-17 2020-08-20 Beijing Bytedance Network Technology Co., Ltd. Motion candidate list construction for intra block copy mode
US10904558B2 (en) * 2019-04-26 2021-01-26 Tencent America LLC Method and apparatus for motion compensation for 360 video coding
CN114902663A (zh) * 2019-12-30 2022-08-12 鸿颖创新有限公司 用于编码视频数据的设备和方法
WO2023198135A1 (en) * 2022-04-12 2023-10-19 Beijing Bytedance Network Technology Co., Ltd. Method, apparatus, and medium for video processing

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101765016A (zh) * 2008-12-22 2010-06-30 联发科技股份有限公司 视频译码方法

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2003208086B2 (en) 2002-02-01 2007-11-15 Godo Kaisha Ip Bridge 1 Moving picture coding method and moving picture decoding method
US8204109B2 (en) 2003-03-28 2012-06-19 Etiip Holdings Inc. Overcomplete basis transform-based motion residual frame coding method and apparatus for video compression
RU2395174C1 (ru) 2006-03-30 2010-07-20 ЭлДжи ЭЛЕКТРОНИКС ИНК. Способ и устройство для декодирования/кодирования сигнала видео
WO2007114612A1 (en) 2006-03-30 2007-10-11 Lg Electronics Inc. A method and apparatus for decoding/encoding a video signal
US8432968B2 (en) 2007-10-15 2013-04-30 Qualcomm Incorporated Scalable video coding techniques for scalable bitdepths
KR102231772B1 (ko) 2007-10-16 2021-03-23 엘지전자 주식회사 비디오 신호 처리 방법 및 장치
KR20110008653A (ko) 2009-07-20 2011-01-27 삼성전자주식회사 움직임 벡터 예측 방법과 이를 이용한 영상 부호화/복호화 장치 및 방법
TWI566586B (zh) 2009-10-20 2017-01-11 湯姆生特許公司 一序列形象的現時區塊之寫碼方法和重建方法
US9877033B2 (en) 2009-12-21 2018-01-23 Qualcomm Incorporated Temporal and spatial video block reordering in a decoder to improve cache hits
KR101522850B1 (ko) 2010-01-14 2015-05-26 삼성전자주식회사 움직임 벡터를 부호화, 복호화하는 방법 및 장치
WO2011110039A1 (en) 2010-03-12 2011-09-15 Mediatek Singapore Pte. Ltd. Motion prediction methods
US8837592B2 (en) 2010-04-14 2014-09-16 Mediatek Inc. Method for performing local motion vector derivation during video coding of a coding unit, and associated apparatus
EP2388999B1 (en) 2010-05-17 2021-02-24 Lg Electronics Inc. New intra prediction modes
US9510009B2 (en) 2010-05-20 2016-11-29 Thomson Licensing Methods and apparatus for adaptive motion vector candidate ordering for video encoding and decoding
PL3457689T3 (pl) 2010-05-25 2020-12-28 Lg Electronics Inc. Nowy tryb predykcji planarnej
US8908755B2 (en) 2010-07-16 2014-12-09 Sony Corporation Multi-parameter motion for efficient prediction in video compression
CN107454424B (zh) * 2010-10-28 2020-07-28 韩国电子通信研究院 视频解码设备和视频解码方法
US8824558B2 (en) * 2010-11-23 2014-09-02 Mediatek Inc. Method and apparatus of spatial motion vector prediction
US8755437B2 (en) * 2011-03-17 2014-06-17 Mediatek Inc. Method and apparatus for derivation of spatial motion vector candidate and motion vector prediction candidate
US9143795B2 (en) * 2011-04-11 2015-09-22 Texas Instruments Incorporated Parallel motion estimation in video coding
US9247266B2 (en) * 2011-04-18 2016-01-26 Texas Instruments Incorporated Temporal motion data candidate derivation in video coding
US20120287999A1 (en) * 2011-05-11 2012-11-15 Microsoft Corporation Syntax element prediction in error correction
US20130003829A1 (en) * 2011-07-01 2013-01-03 Kiran Misra System for initializing an arithmetic coder
WO2013006386A1 (en) 2011-07-01 2013-01-10 General Instrument Corporation Motion vector prediction design simplification
CN103931196B (zh) 2011-09-09 2017-05-17 Lg电子株式会社 帧间预测方法及其装置
US20130177083A1 (en) 2012-01-05 2013-07-11 Qualcomm Incorporated Motion vector candidate index signaling in video coding

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101765016A (zh) * 2008-12-22 2010-06-30 联发科技股份有限公司 视频译码方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Improved Advanced Motion Vector Prediction;Jian-Liang Lin,等;《Joint Collaborative Team on Video Coding (JCT-VC)》;20110128;2.1、2.2、2.3、2.4节,附图1-4 *

Also Published As

Publication number Publication date
BR112014006185A2 (pt) 2017-04-11
US20130070854A1 (en) 2013-03-21
KR101858885B1 (ko) 2018-05-16
PL2756674T3 (pl) 2019-10-31
CA2847849A1 (en) 2013-03-21
WO2013039639A1 (en) 2013-03-21
EP2756674B1 (en) 2019-05-15
EP2756674A1 (en) 2014-07-23
IL231148A0 (en) 2014-04-30
KR20140064974A (ko) 2014-05-28
DK2756674T3 (da) 2019-08-19
JP6092222B2 (ja) 2017-03-08
PT2756674T (pt) 2019-09-04
SG10201601796SA (en) 2016-04-28
AU2012309042B2 (en) 2015-09-17
ZA201402834B (en) 2021-05-26
HUE044692T2 (hu) 2019-11-28
AU2012309042A1 (en) 2014-03-27
RU2591645C2 (ru) 2016-07-20
CA2847849C (en) 2017-03-14
SI2756674T1 (sl) 2019-08-30
IL231148A (en) 2016-07-31
SG11201400207QA (en) 2014-05-29
CN103797799A (zh) 2014-05-14
ES2742026T3 (es) 2020-02-12
US9736489B2 (en) 2017-08-15
RU2014115340A (ru) 2015-10-27
KR20160082265A (ko) 2016-07-08
JP2014526840A (ja) 2014-10-06
MY186970A (en) 2021-08-26
BR112014006185B1 (pt) 2022-05-31

Similar Documents

Publication Publication Date Title
CN103797799B (zh) 用于视频译码的运动向量确定
CN107211156B (zh) 一种译码视频数据的方法、装置及计算机可读存储媒体
CN104335586B (zh) 运动向量舍入
CN105580365B (zh) 处理视频数据的方法、装置及存储媒体
CN104126302B (zh) 产生额外合并候选者
CN105580364B (zh) 一种处理视频数据的方法,装置及计算机可读存储媒体
CN104980762B (zh) 用于对视频数据进行编码和解码的方法及装置
CN105393536B (zh) 使用位移向量从预测性块的帧内预测
CN103621095B (zh) 用于视频译码中的帧内预测的边界像素填补
CN103141100B (zh) 用于视频译码的帧内平滑滤波器
CN105027571B (zh) 三维视频译码中导出的视差向量
CN104396243B (zh) 用于视频压缩的自适应上取样滤波器
CN110301135A (zh) 在视频解码器处导出运动向量信息
CN106797477A (zh) 用于帧内bc和帧间预测统一的amvp和合并候选者列表导出
CN109716774A (zh) 用于视频译码的可变数目的帧内模式
CN106576171A (zh) 统一帧内块复制和帧间预测
CN108141605A (zh) 帧内块复制合并模式及不可用帧内块复制参考区域的填充
CN107211157A (zh) 用于视频译码的重叠运动补偿
CN105874797A (zh) 从预测性块的帧内预测
CN106797479A (zh) 对于并行处理的帧内块复制预测限制
CN105556969A (zh) 视频译码中使用视差向量的块识别
CN105637870A (zh) 使用不对称运动分割的视频译码技术
CN105519116A (zh) 产生用于增强层中的运动预测的经调适运动向量候选者列表的可缩放hevc装置和方法
CN105393538A (zh) 用于3d-hevc的简化高级运动预测
CN103999465A (zh) 自适应性重叠块运动补偿

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1193283

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant