CN105359532A - 帧内运动补偿延伸 - Google Patents

帧内运动补偿延伸 Download PDF

Info

Publication number
CN105359532A
CN105359532A CN201480038532.2A CN201480038532A CN105359532A CN 105359532 A CN105359532 A CN 105359532A CN 201480038532 A CN201480038532 A CN 201480038532A CN 105359532 A CN105359532 A CN 105359532A
Authority
CN
China
Prior art keywords
offset vector
video
current block
component
decoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201480038532.2A
Other languages
English (en)
Inventor
庞超
霍埃尔·索赖罗哈斯
马尔塔·卡切维奇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of CN105359532A publication Critical patent/CN105359532A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/523Motion estimation or motion compensation with sub-pixel accuracy
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

一种包括一或多个处理器的视频译码器确定视频数据的当前块是使用帧内运动补偿IMC模式编码,其中所述当前块在视频帧中;确定所述视频数据的所述当前块的第一色彩分量的偏移向量;在所述视频帧中使用所述偏移向量来定位所述第一色彩分量的参考块;响应于所述偏移向量指向视频数据的所述当前块的第二色彩分量的子像素位置来修改所述偏移向量以产生经修改偏移向量;在所述视频帧中使用所述经修改偏移向量来定位所述第二色彩分量的参考块;以及基于所述第一色彩分量的所述参考块和所述第二色彩分量的所述参考块来译码所述当前块。

Description

帧内运动补偿延伸
本申请案主张以下各者的权利:
2013年7月12日申请的美国临时申请案第61/845,832号;和
2013年7月16日申请的美国临时申请案第61/846,976号,
所述申请案中的每一者的全部内容在此以引用的方式并入。
技术领域
本发明涉及视频译码,且更明确地说,涉及基于其它视频块的对视频块的预测。
背景技术
数字视频能力可并入到广泛范围的装置中,所述装置包含数字电视、数字直播系统、无线广播系统、个人数字助理(PDA)、膝上型或台式计算机、平板型计算机、电子书读取器、数码相机、数字记录装置、数字媒体播放器、视频游戏装置、视频游戏控制台、蜂窝式或卫星无线电电话、所谓的“智能型电话”、视频电传会议装置、视频流式传输装置和其类似者。数字视频装置实施视频压缩技术,例如描述于由MPEG-2、MPEG-4、ITU-TH.263、ITU-TH.264/MPEG-4第10部分(先进视频译码(AVC))定义的标准、目前在开发中的高效率视频译码(HEVC)标准和这些标准的延伸中的视频压缩技术。视频装置可通过实施这些视频压缩技术来较有效率地发射、接收、编码、解码和/或存储数字视频信息。
视频压缩技术执行空间(图片内)预测和/或时间(图片间)预测以减小或去除视频序列中所固有的冗余。对于基于块的视频译码,可将视频切片(即,视频帧或视频帧的一部分)分割成视频块(其也可称为树型块)、译码单元(CU)和/或译码节点。可使用相对于同一图片中的相邻块中的参考样本的空间预测来编码图片的帧内译码(I)切片中的视频块。图片的帧间译码(P或B)切片中的视频块可使用相对于同一图片中的相邻块中的参考样本的空间预测或相对于其它参考图片中的参考样本的时间预测。图片可被称为帧,且参考图片可被称为参考帧。
空间或时间预测引起用于待译码的块的预测性块。残余数据表示待译码的原始块与预测性块之间的像素差。根据指向形成预测性块的参考样本的块的运动向量和指示经译码块与预测性块之间的差的残余数据来编码帧间译码块。根据帧内译码模式和残余数据来编码帧内译码块。为进行进一步压缩,可将残余数据从像素域变换到变换域,从而引起残余变换系数,可接着量化所述残余变换系数。可扫描最初布置成二维阵列的经量化的变换系数以便产生变换系数的一维向量,且可应用熵译码以达成甚至更多压缩。
发明内容
本发明介绍与帧内模式补偿(IMC)译码有关的技术。在IMC译码中,视频编码器在与正译码的块相同的帧或图片中搜索预测性块(如在帧内预测模式中),但视频编码器搜索较宽广的搜索区而并非仅相邻的行和列(如在帧间预测模式中)。视频解码器通过定位由视频编码器确定的相同预测性块来解码所述块。
根据一个实例,一种解码视频数据的方法包含:确定所述视频数据的当前块是使用帧内运动补偿(IMC)模式编码,其中所述当前块在视频帧中;确定所述视频数据的当前块的第一色彩分量的偏移向量;在所述视频帧中使用所述偏移向量来定位所述第一色彩分量的参考块;响应于所述偏移向量指向视频数据的当前块的第二色彩分量的子像素位置来修改所述偏移向量以产生经修改偏移向量;在所述视频帧中使用所述经修改偏移向量来定位所述第二色彩分量的参考块;和基于所述第一色彩分量的参考块和所述第二色彩分量的参考块来解码所述当前块。
根据另一实例,一种编码视频数据的方法包含:确定视频数据的当前块将使用帧内运动补偿(IMC)模式编码;确定所述视频数据的当前块的第一色彩分量的偏移向量;在所述视频帧中使用所述偏移向量来定位所述第一色彩分量的参考块;响应于所述偏移向量指向视频数据的当前块的第二色彩分量的子像素位置来修改所述偏移向量以产生经修改偏移向量;在所述视频帧中使用所述经修改偏移向量来定位所述第二色彩分量的参考块;和产生供包含于视频数据的经编码位流中的识别所述偏移向量的一或多个语法元素。
根据另一实例,一种执行视频译码的设备包含:存储器,其存储视频数据;和包括一或多个处理器的视频译码器,所述一或多个处理器经配置以:确定所述视频数据的当前块是使用帧内运动补偿(IMC)模式编码,其中所述当前块在视频帧中;确定所述视频数据的当前块的第一色彩分量的偏移向量;在所述视频帧中使用所述偏移向量来定位所述第一色彩分量的参考块;响应于所述偏移向量指向视频数据的当前块的第二色彩分量的子像素位置来修改所述偏移向量以产生经修改偏移向量;在所述视频帧中使用所述经修改偏移向量来定位所述第二色彩分量的参考块;和基于所述第一色彩分量的参考块和所述第二色彩分量的参考块来译码所述当前块。
根据另一实例,一种执行视频译码的设备包含:用于确定所述视频数据的当前块是使用帧内运动补偿(IMC)模式编码的装置,其中所述当前块在视频帧中;用于确定所述视频数据的当前块的第一色彩分量的偏移向量的装置;用于在所述视频帧中使用所述偏移向量来定位所述第一色彩分量的参考块的装置;用于响应于所述偏移向量指向视频数据的当前块的第二色彩分量的子像素位置来修改所述偏移向量以产生经修改偏移向量的装置;用于在所述视频帧中使用所述经修改偏移向量来定位所述第二色彩分量的参考块的装置;和用于基于所述第一色彩分量的参考块和所述第二色彩分量的参考块来译码所述当前块的装置。
根据另一实例,一种计算机可读媒体存储指令,所述指令在由一或多个处理器执行时使所述一或多个处理器:确定所述视频数据的当前块是使用帧内运动补偿(IMC)模式编码,其中所述当前块在视频帧中;确定所述视频数据的当前块的第一色彩分量的偏移向量;在所述视频帧中使用所述偏移向量来定位所述第一色彩分量的参考块;响应于所述偏移向量指向视频数据的当前块的第二色彩分量的子像素位置来修改所述偏移向量以产生经修改偏移向量;在所述视频帧中使用所述经修改偏移向量来定位所述第二色彩分量的参考块;和基于所述第一色彩分量的参考块和所述第二色彩分量的参考块来译码所述当前块。
一或多个实例的细节陈述于随附图式和以下描述中。其它特征、目标和优势将从所述描述和所述图式以及从权利要求书显而易见。
附图说明
图1为说明可利用本发明中所描述的技术的实例视频编码和解码系统的框图。
图2A到2C为说明视频数据的不同样本格式的概念图。
图3为说明根据4:2:0样本格式而被格式化的16×16译码单元的概念图。
图4为说明根据4:2:2样本格式而被格式化的16×16译码单元的概念图。
图5展示帧内运动补偿(IMC)模式的概念说明。
图6为说明可实施本发明中所描述的技术的实例视频编码器的框图。
图7为说明可实施本发明中所描述的技术的实例视频解码器的框图。
图8为展示根据本发明的技术的译码视频数据的方法的实例的流程图。
具体实施方式
各种视频译码标准(包含新近开发的高效率视频译码(HEVC)标准)包含用于视频块的预测性译码模式,其中当前正译码的块是基于视频数据的业已译码块加以预测。在帧内预测模式中,当前块是基于在与所述当前块相同的图片中的一或多个先前译码的相邻块加以预测,而在帧间预测模式中,当前块是基于不同图片中的业已译码块加以预测。在帧间预测模式中,有时将确定待用作预测性块的先前译码帧的块的过程称为运动估计,运动估计大体由视频编码器执行,且有时将识别和检索预测性块的过程称为运动补偿,运动补偿由视频编码器与视频解码器两者执行。
视频编码器通常通过使用多个译码情境译码视频且识别产生所要速率-失真取舍的译码情境来确定如何译码视频数据序列。当针对特定视频块来测试帧内预测译码情境时,视频编码器通常测试相邻像素行(即,紧接于正译码的块上面的像素行)且测试相邻像素列(即,紧接于正译码的块左边的像素列)。相比之下,当测试帧间预测情境时,视频编码器通常在大得多的搜索区中识别候选预测性块,其中所述搜索区对应于在视频数据的先前译码帧中的视频块。
然而,已发现,对于某些类型的视频图像(例如,包含文字、符号或重复性图案的视频图像)来说,可通过使用帧内运动补偿(IMC)模式来达成关于帧内预测和帧间预测的译码增益,所述IMC模式有时也称为帧内块复制(IBC)模式。在本发明中,术语IMC模式与IBC模式可互换。例如,最初使用术语IMC模式,但后来IMC模式被修改为IBC模式。在IMC模式中,视频编码器在与正译码的块相同的帧或图片中搜索预测性块(如在帧内预测模式中),但视频编码器搜索较宽广的搜索区而并非仅相邻的行和列(如在帧间预测模式中)。
在IMC模式中,视频编码器可确定偏移向量(有时也称为运动向量或块向量),以用于识别在与正预测的块相同的帧或图片内的预测性块。举例来说,所述偏移向量包含x分量和y分量,其中x分量识别正预测的视频块与预测性块之间的水平位移,且其中y分量识别正预测的视频块与预测性块之间的垂直位移。视频编码器在经编码位流中发信所确定的偏移向量使得视频解码器在解码所述经编码位流时可识别由视频编码器选择的预测性块。
本发明介绍可改善IMC译码的性能和/或简化利用IMC译码模式的系统的系统设计的技术。根据一种技术,用以发信运动向量的分量(例如,x分量或y分量)的码字的长度可取决于用于IMC译码模式的搜索区域的大小和/或包含正预测的块的译码树型单元的大小。以此方式,固定长度的码字可用以发信偏移向量的分量,但固定长度的码字的长度可取决于情境。举例来说,固定长度的码字的长度可针对x分量和y分量而不同。通过在一些译码情境中使用较小固定长度的码字,可减少与发信IMC译码模式的偏移向量相关联的位附加项。
根据本发明的技术的另一方面,视频译码器可确定正以IMC模式译码的视频数据块的偏移向量(例如,用于第一色彩分量),且如果所述偏移向量指向子像素位置(例如,用于第一色彩分量抑或第二色彩分量),那么可修改所述偏移向量以指向整数像素位置或指向较不精确的子像素位置。如下文将予以更详细解释,针对第一色彩分量所确定的偏移向量在被用以定位用于第二色彩分量的预测性块之前可能需要加以缩放。即使原始偏移向量指向第一色彩分量的整数像素位置,经缩放的偏移向量仍可指向第二色彩分量的子像素位置。在其它实例中,经缩放的偏移向量可针对第二偏移向量指向精度比偏移向量针对第一色彩分量所指向高的像素位置。
根据本发明的技术,偏移向量和/或经修改偏移向量可经舍位以指向整数像素位置或指向较不精确的像素位置。指向整数像素位置可消除需要执行内插滤波,而指向较不精确的子像素位置可相对于被用于较精确的子像素位置的内插滤波器来降低内插滤波器的复杂度。避免内插滤波或使用较不复杂的内插滤波器可潜在地降低用于实施IMC译码模式的总复杂度(即,存储器使用、操作数目等)。
根据本发明的技术的另一方面,可将用于IMC译码模式的最大译码单元(CU)大小设定到小于最大CTU大小的大小。因此,可仅针对大小与用于IMC译码的最大CU大小相同或小于用于IMC译码的最大CU大小的CU来执行IMC译码。在一些实施方案中,具有小于最大CTU大小的用于IMC译码的最大CU大小可为编码器侧优化使得通过针对大于用于IMC译码的最大CU大小的视频数据块而不评估IMC译码情境来增加编码视频数据的速度。在此实施方案中,用于IMC译码的最大CU大小可能无需发信到视频解码器或无需由视频解码器来确定。在其它实施方案中,视频编码器可明确地抑或隐含地将用于IMC译码的最大CU大小发信到视频解码器。
根据本发明的技术的另一方面,用于每一CU的运动向量译码方法可取决于CU大小、CU位置和CTU大小中的一或多者。如本发明中所使用,运动向量译码方法可参考用以译码运动向量的码字的长度,但其也可参考运动向量是使用固定长度码还是可变长度码译码,或参考用于译码运动向量的某种其它方法。CU位置可指代CU在视频数据帧内的位置,但CU位置也可指代CU在CTU内的位置。举例来说,与位于CTU顶部的CU相比,位于CTU的右下角中的CU可潜在地需要较长运动向量以识别预测性块。因此,用以译码右下CTU的运动向量的码字可长于用以译码定位于CTU顶部的CTU的运动向量的码字。根据此方面,具有不同大小或位于不同位置或处于不同CTU大小的CU的码长可为不同的。应注意,mv译码中的其它过程也可取决于CU大小、CU位置也和/或CTU大小(例如,算术码的码类型或上下文模型)。
图1为说明可利用本发明中所描述的技术的实例视频编码和解码系统10的框图。如图1中所示,系统10包含源装置12,所述源装置产生稍后待由目的地装置14解码的经编码视频数据。源装置12和目的地装置14可包括广泛范围的装置中的任一者,包含台式计算机、笔记型(即,膝上型)计算机、平板型计算机、机顶盒、电话手机(例如,所谓“智能型”电话)、所谓“智能型”板、电视、摄影机、显示装置、数字媒体播放器、视频游戏控制台、视频流式传输装置或其类似者。在一些状况下,源装置12和目的地装置14可经装备以进行无线通信。
目的地装置14可经由链路16来接收待解码的经编码视频数据。链路16可包括能够将经编码视频数据从源装置12移到目的地装置14的任何类型的媒体或装置。在一个实例中,链路16可包括用以使源装置12能够将经编码视频数据直接实时传输到目的地装置14的通信媒体。可根据通信标准(例如,无线通信协议)来调制经编码视频数据,且将经编码视频数据传输到目的地装置14。通信媒体可包括任何无线或有线通信媒体(例如,射频(RF)频谱或一或多个物理传输线)。通信媒体可形成基于封包的网络(例如,局域网、广域网或例如因特网的全球网络)的部分。通信媒体可包含路由器、交换器、基站,或可对促进从源装置12到目的地装置14的通信有用的任何其它装备。
替代地,可将经编码数据从输出接口22输出到存储装置17。类似地,可通过输入接口从存储装置17来存取经编码数据。存储装置17可包含多种分散式或本机存取的数据存储媒体(例如,硬盘、蓝光光盘、DVD、CD-ROM、快闪存储器、易失性或非易失性存储器,或用于存储经编码视频数据的任何其它合适数字存储媒体)中的任一者。在另外的实例中,存储装置17可对应于可保持由源装置12产生的经编码视频的文件服务器或另一中间存储装置。目的地装置14可经由流式传输或下载从存储装置17存取所存储的视频数据。文件服务器可为能够存储经编码视频数据且将彼经编码视频数据传输到目的地装置14的任何类型的服务器。实例文件服务器包含网络服务器(例如,用于网站)、FTP服务器、网络附加存储(NAS)装置或本地磁盘机。目的地装置14可通过任何标准数据连接(包含因特网连接)来存取经编码视频数据。此数据连接可包含适合于存取存储于文件服务器上的经编码视频数据的无线信道(例如,Wi-Fi连接)、有线连接(例如,DSL、缆线调制解调器等),或两者的组合。经编码视频数据从存储装置17的传输可为流式传输传输、下载传输或两者的组合。
本发明的技术未必限于无线应用或设定。所述技术可应用于支持多种多媒体应用(例如,(例如)经由因特网的空中电视广播、有线电视传输、卫星电视传输、流式传输视频传输)中的任一者的视频译码、供存储于数据存储媒体上的数字视频的编码、存储于数据存储媒体上的数字视频的解码或其它应用。在一些实例中,系统10可经配置成支持单向或双向视频传输以支持例如视频流式传输、视频播放、视频广播和/或视频电话的应用。
在图1的实例中,源装置12包含视频源18、视频编码器20和输出接口22。在一些状况下,输出接口22可包含调制器/解调器(调制解调器)和/或发射器。在源装置12中,视频源18可包含例如视频俘获装置(例如,摄像机、含有先前俘获的视频的视频封存档、用以从视频内容提供者接收视频的视频馈入接口)的源,和/或用于产生计算机图形数据以作为源视频的计算机图形系统的源,或这些源的组合。作为一个实例,如果视频源18为摄像机,那么源装置12与目的地装置14可形成所谓的摄影机电话或视频电话。然而,本发明中所描述的技术一般来说可适用于视频译码,且可应用于无线和/或有线应用。
经俘获、经预先俘获或经计算机产生的视频可由视频编码器20来编码。可经由源装置12的输出接口22将经编码视频数据直接传输到目的地装置14。也可(或替代地)将经编码视频数据存储到存储装置17上以供稍后由目的地装置14或其它装置存取以用于解码和/或播放。
目的地装置14包含输入接口28、视频解码器30和显示装置32。在一些状况下,输入接口28可包含接收器和/或调制解调器。目的地装置14的输入接口28经由链路16来接收经编码视频数据。经由链路16传达或在存储装置17上提供的经编码视频数据可包含由视频编码器20产生的多种语法元素,其供视频解码器(例如,视频解码器30)用于解码所述视频数据。可将这些语法元素与在通信媒体上传输、存储于存储媒体上或存储于文件服务器上的经编码视频数据包含在一起。
显示装置32可与目的地装置14集成或在目的地装置14外部。在一些实例中,目的地装置14可包含集成式显示装置且也经配置以与外部显示装置建立接口连接。在其它实例中,目的地装置14可为显示装置。一般来说,显示装置32向用户显示经解码视频数据,且可包括多种显示装置中的任一者(例如,液晶显示器(LCD)、等离子显示器、有机发光二极管(OLED)显示器或另一类型的显示装置)。
视频编码器20和视频解码器30可根据视频压缩标准(例如,高效率视频译码(HEVC)标准)进行操作,且可遵照HEVC测试模型(HM)。HEVC标准的工作草案(称为“HEVC工作草案10”或“HEVCWD10”)描述于布罗斯(Bross)等人的“编辑提议的对HEVC版本1的校正(Editors'proposedcorrectionstoHEVCversion1)”(ITU-TSG16WP3与ISO/IECJTC1/SC29/WG11的视频译码联合协作小组(JCT-VC),第13次会议,2013年4月,韩国仁川)中。本发明中所描述的技术也可根据当前正在开发中的HEVC标准延伸来操作。
替代地或另外,视频编码器20和视频解码器30可根据其它专有或工业标准(例如,ITU-TH.264标准,替代地称作MPEG-4第10部分先进视频译码(AVC))或这些标准的延伸而操作。然而,本发明的技术并不限于任何特定编码标准。视频压缩标准的其它实例包含MPEG-2和ITU-TH.263。
虽然未展示于图1中,但在一些方面中,视频编码器20和视频解码器30可各自与音频编码器和解码器集成,且可包含适当MUX-DEMUX单元或其它硬件和软件以处置共同数据流或分开的数据流中的音频与视频两者的编码。如果适用,那么在一些实例中,MUX-DEMUX单元可遵照ITUH.223多路复用器协议或例如用户数据报协议(UDP)的其它协议。
视频编码器20和视频解码器30可各自实施为多种合适编码器电路中的任一者(例如,一或多个微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑、软件、硬件、固件或其任何组合)。当所述技术部分地在软件中实施时,装置可将用于软件的指令存储于合适的非暂时性计算机可读媒体中,且在硬件中使用一或多个处理器来执行所述指令以执行本发明的技术。视频编码器20和视频解码器30中的每一者可包含于一或多个编码器或解码器中,所述一或多个编码器或解码器中的任一者可经集成为相应装置中的组合式编码器/解码器(编解码器(CODEC))的部分。
JCT-VC开发了HEVC标准。HEVC标准化努力是基于视频译码装置的演进模型(称为HEVC测试模型(HM))。HM根据(例如)ITU-TH.264/AVC假设视频译码装置相对于现有装置的若干额外能力。举例来说,H.264提供九个帧内预测编码模式,而HM可提供多达三十三个帧内预测编码模式。
一般来说,HM的工作模型描述视频帧或图片可划分成包含亮度样本与色度样本两者的树型块或最大译码单元(LCU)序列。树型块具有与H.264标准的宏块的目的类似的目的。切片包含按译码次序的诸多连续树型块。视频帧或图片可分割成一或多个切片。每一树型块可根据四分树而分裂成若干译码单元(CU)。举例来说,树型块(作为四分树的根节点)可分裂成四个子节点,且每一子节点可又为父节点且分裂成另外四个子节点。最后未分裂的子节点(作为四分树的叶节点)包括译码节点(即,经译码视频块)。与经译码位流相关联的语法数据可定义树型块可分裂的最大次数,且也可定义译码节点的最小大小。
在HEVC中,CU被定义为基本译码单元。在HEVC中,帧首先划分成诸多方形单元(称作CTU(译码树型单元))。假设CTU大小为2N×2N。每一CTU可划分成4个N×NCU,且每一CU可进一步划分成4个(N/2)×(N/2)单元。块分裂可以相同方式而继续直到其达到预定义的最大分裂水平或所允许的最小CU大小。CTU的大小、进一步将CTU分裂成CU的水平和CU的最小大小在编码配置中加以定义,且将被发送到视频解码器30或可为视频编码器20与视频解码器30两者所知。
CU包含译码节点和与所述译码节点相关联的若干预测单元(PU)和变换单元(TU)。CU的大小对应于译码节点的大小,且形状必须为正方形。CU的大小可在从8×8像素直到具有最大64×64像素或大于64×64像素的树型块大小的范围内。每一CU可含有一或多个PU和一或多个TU。与CU相关联的语法数据可描述(例如)CU到一或多个PU的分割。分割模式可在CU经跳过或直接模式编码、经帧内预测模式编码抑或经帧间预测模式编码之间而不同。PU的形状可分割成非正方形。与CU相关联的语法数据也可描述(例如)CU根据四分树到一或多个TU的分割。TU的形状可为正方形或非正方形。
HEVC标准允许根据TU进行变换,所述变换对于不同CU来说可为不同的。通常基于在针对已分割LCU所定义的给定CU内的PU的大小来对TU设定大小,尽管可能并非总是此状况。TU通常为与PU相同的大小或小于PU。在一些实例中,可使用已知为“残余四分树”(RQT)的四分树结构将对应于CU的残余样本再分成若干较小单元。可将RQT的叶节点称为变换单元(TU)。与TU相关联的像素差值可经变换以产生可加以量化的变换系数。
一般来说,PU包含与预测过程有关的数据。举例来说,当将所述PU以帧内模式编码时,所述PU可包含描述所述PU的帧内预测模式的数据。作为另一实例,当将所述PU以帧间模式编码时,所述PU可包含定义所述PU的运动向量的数据。定义PU的运动向量的数据可描述(例如)运动向量的水平分量、运动向量的垂直分量、运动向量的分辨率(例如,四分之一像素精度或八分之一像素精度)、运动向量所指向的参考图片,和/或运动向量的参考图片列表(例如,列表0、列表1或列表C)。
一般来说,TU被用于变换过程和量化过程。具有一或多个PU的给定CU也可包含一或多个变换单元(TU)。在预测之后,视频编码器20可计算对应于PU的残余值。所述残余值包括像素差值,所述像素差值可经变换成使用TU加以量化和扫描以产生串行化变换系数以用于熵译码的变换系数。本发明通常使用术语“视频块”来指代CU的译码节点。在一些特定状况下,本发明也可使用术语“视频块”来指代包含译码节点和若干PU和TU的树型块(即,LCU或CU)。
视频序列通常包含一系列视频帧或图片。图片群组(GOP)大体包括一系列视频图片中的一或多者。GOP可包含在GOP的标头、图片中的一或多者的标头或别处的语法数据,所述语法数据描述包含于GOP中的图片的数目。图片的每一切片可包含描述用于所述相应切片的编码模式的切片语法数据。视频编码器20通常对个别视频切片内的视频块进行操作以便编码视频数据。视频块可对应于CU内的译码节点。视频块可具有固定或变化的大小,且可根据指定的译码标准而在大小方面不同。
作为实例,HM支持以各种PU大小进行的预测。假定特定CU的大小为2N×2N,那么HM支持以2N×2N或N×N的PU大小进行的帧内预测,和以2N×2N、2N×N、N×2N或N×N的对称PU大小进行的帧间预测。HM也支持以2N×nU、2N×nD、nL×2N和nR×2N的PU大小进行的帧间预测的不对称分割。在不对称分割中,CU的一个方向未分割,而另一方向分割成25%和75%。CU的对应于25%分割的部分由“n”继之以“上(Up)”、“下(Down)”、“左(Left)”或“右(Right)”的指示来指示。因此,举例来说,“2N×nU”指代水平上以顶部的2N×0.5NPU和底部的2N×1.5NPU分割的2N×2NCU。
在本发明中,“N×N”与“N乘N”可互换地使用以指代视频块在垂直维度与水平维度方面的像素尺寸,例如,16×16像素或16乘16像素。一般来说,16×16块在垂直方向上将具有16个像素(y=16)且在水平方向上将具有16个像素(x=16)。同样地,N×N块大体在垂直方向上具有N个像素且在水平方向上具有N个像素,其中N表示非负整数值。可按行和列来布置块中的像素。此外,块未必需要在水平方向上与在垂直方向上具有相同数目个像素。举例来说,块可包括N×M像素,其中M未必等于N。
因此,根据HEVC,CU可包含一或多个预测单元(PU)和/或一或多个变换单元(TU)。本发明也使用术语“块”、“分区”或“部分”来指代CU、PU或TU中的任一者。一般来说,“部分”可指代视频帧的任何子集。另外,本发明通常使用术语“视频块”来指代CU的译码节点。在一些特定状况下,本发明也可使用术语“视频块”来指代包含译码节点和若干PU和TU的树型块(即,LCU或CU)。因此,视频块可对应于CU内的译码节点且视频块可具有固定或变化的大小,且可根据指定的译码标准而在大小方面不同。
视频采样格式(其也可称为色度格式)可相对于CU中所包含的亮度样本的数目来定义CU中所包含的色度样本的数目。取决于色度分量的视频采样格式,U分量和V分量的大小(就样本数目来说)可与Y分量的大小相同或不同。在HEVC标准中,相对于亮度分量来定义被称作chroma_format_idc的值以指示色度分量的不同采样格式。在HEVC中,在SPS中发信chroma_format_idc。表1说明chroma_format_idc的值与关联的色度格式之间的关系。
chroma_format_idc 色度格式 SubWidthC SubHeightC
0 单色 - -
1 4:2:0 2 2
2 4:2:2 2 1
3 4:4:4 1 1
表1:HEVC中所定义的不同色度格式
在表1中,变量SubWidthC和SubHeightC可用以指示亮度分量的样本数目与每一色度分量的样本数目之间的水平采样速率比和垂直采样速率比。在表1中所描述的色度格式中,两个色度分量具有相同的采样速率。因此,在4:2:0采样中,两个色度阵列中的每一者具有亮度阵列的一半高度和一半宽度,而在4:2:2采样中,两个色度阵列中的每一者具有亮度阵列的相同高度和一半宽度。在4:4:4采样中,两个色度阵列中的每一者可具有与亮度阵列相同的高度和宽度,或在一些例子中,三个色平面可皆被分开地处理为单色采样图片。
在表1的实例中,对于4:2:0格式来说,亮度分量的采样速率针对水平方向与垂直方向两者而为色度分量的采样速率的两倍。结果,对于根据4:2:0格式而被格式化的译码单元来说,亮度分量的样本阵列的宽度和高度为色度分量的每一样本阵列的宽度和高度的两倍。类似地,对于根据4:2:2格式而被格式化的译码单元来说,亮度分量的样本阵列的宽度为每一色度分量的样本阵列的宽度的两倍,但亮度分量的样本阵列的高度等于每一色度分量的样本阵列的高度。对于根据4:4:4格式而被格式化的译码单元来说,亮度分量的样本阵列具有与每一色度分量的样本阵列相同的宽度和高度。应注意,除YUV色空间之外,还可根据RGB空间色彩来定义视频数据。以此方式,本文中所描述的色度格式可适用于YUV抑或RGB色空间。RGB色度格式通常经采样使得红色样本的数目、绿色样本的数目和蓝色样本的数目相等。因此,如本文中所使用的术语“4:4:4色度格式”可指代YUV色空间抑或RGB色空间,其中对于所有色彩分量来说样本的数目是相等的。
图2A到2C为说明视频数据的不同样本格式的概念图。图2A为说明4:2:0样本格式的概念图。如图2A中所说明,对于4:2:0样本格式来说,色度分量为亮度分量的大小的四分之一。因此,对于根据4:2:0样本格式而被格式化的CU来说,针对色度分量的每一样本而存在四个亮度样本。图2B为说明4:2:2样本格式的概念图。如图2B中所说明,对于4:2:2样本格式来说,色度分量为亮度分量的大小的一半。因此,对于根据4:2:2样本格式而被格式化的CU来说,针对色度分量的每一样本而存在两个亮度样本。图2C为说明4:4:4样本格式的概念图。如图2C中所说明,对于4:4:4样本格式来说,色度分量为与亮度分量相同的大小。因此,对于根据4:4:4样本格式而被格式化的CU来说,针对色度分量的每一样本而存在一个亮度样本。
图3为说明根据4:2:0样本格式而被格式化的16×16译码单元的实例的概念图。图3说明色度样本相对于CU内的亮度样本的相对位置。如上文所描述,CU通常根据水平亮度样本和垂直亮度样本的数目加以定义。因此,如图3中所说明,根据4:2:0样本格式而被格式化的16×16CU包含亮度分量的16×16样本和每一色度分量的8×8样本。另外,如上文所描述,CU可分割成较小CU。举例来说,图3中所说明的CU可分割成四个8×8CU,其中每一8×8CU包含亮度分量的8×8样本和每一色度分量的4×4样本。
图4为说明根据4:2:2样本格式而被格式化的16×16译码单元的实例的概念图。图4说明色度样本相对于CU内的亮度样本的相对位置。如上文所描述,CU通常根据水平亮度样本和垂直亮度样本的数目加以定义。因此,如图4中所说明,根据4:2:2样本格式而被格式化的16×16CU包含亮度分量的16×16样本和每一色度分量的8×16样本。另外,如上文所描述,CU可分割成较小CU。举例来说,图4中所说明的CU可分割成四个8×8CU,其中每一CU包含亮度分量的8×8样本和每一色度分量的4×8样本。
在使用CU的PU进行帧内预测性或帧间预测性译码之后,视频编码器20可计算CU的TU的残余数据。PU可包括空间域(也称为像素域)中的像素数据,且TU可包括在将变换(例如,离散余弦变换(DCT)、整数变换、小波变换或概念上类似的变换)应用于残余视频数据之后的变换域中的系数。所述残余数据可对应于未经编码图片的像素与对应于PU的预测值之间的像素差。视频编码器20可形成包含CU的残余数据的TU,且接着变换所述TU以产生CU的变换系数。
在进行任何变换以产生变换系数之后,视频编码器20可执行对所述变换系数的量化。量化大体指将变换系数量化以可能地减少用以表示所述系数的数据的量从而提供进一步压缩的过程。量化过程可减小与所述系数中的一些或所有相关联的位深度。举例来说,可在量化期间将n位值降值舍位到m位值,其中n大于m。
在一些实例中,视频编码器20可利用预定义扫描次序来扫描经量化的变换系数以产生可加以熵编码的串行化向量。在其它实例中,视频编码器20可执行自适应性扫描。在扫描所述经量化的变换系数以形成一维向量之后,视频编码器20可熵编码所述一维向量(例如,根据上下文自适应性可变长度译码(CAVLC)、上下文自适应性二进制算术译码(CABAC)、基于语法的上下文自适应性二进制算术译码(SBAC)、概率间隔分割熵(PIPE)译码或另一熵编码方法)。视频编码器20也可熵编码与经编码视频数据相关联的语法元素以供由视频解码器30用于解码视频数据。
为执行CABAC,视频编码器20可将上下文模型内的上下文指派给待传输的符号。所述上下文可能涉及(例如)符号的相邻值是否为非零。为执行CAVLC,视频编码器20可选择用于待传输的符号的可变长度码。可将VLC中的码字构建成使得相对较短码对应于更有可能的符号,而较长码对应于较不可能的符号。以此方式,相对于(例如)针对待传输的每一符号使用相等长度码字,使用VLC可达成位节省。概率确定可基于指派给符号的上下文而进行。
根据本发明的一个实例技术,视频解码器30可使用IMC模式来解码视频数据的当前块。视频解码器30可针对视频数据的当前块来确定用以发信偏移向量的分量的码字的长度且基于所述码字的长度来译码所述偏移向量。正译码的偏移向量的分量可为x分量或y分量,且用以发信一个分量的码字的长度可不同于用以发信x分量和y分量中的另一者的第二码字的长度。
举例来说,视频解码器30可通过基于用以针对视频数据的当前块执行IMC的搜索区域的大小确定码字的长度来确定用以发信偏移向量的分量的码字的长度。举例来说,可基于以下各者中的一或多者来确定区域的大小:当前块的像素与搜索区域的顶边界之间的距离、当前块的像素与搜索区域的左边界之间的距离、当前块的像素与搜索区域的右边界之间的距离。
另外或替代地,视频解码器30可基于以下各者中的一或多者、基于当前块的大小来确定用以发信偏移向量的分量的码字的长度:包括当前块的译码树型单元的大小、当前块在译码树型单元(CTU)中的位置或当前块在视频数据帧中的位置。
根据本发明的另一实例技术,视频解码器30可使用IMC模式来解码视频数据的当前块。视频解码器30可针对视频数据的当前块来确定偏移向量(例如,当前块的亮度分量的偏移向量,视频编码器20针对所述偏移向量来发信视频解码器30所用来确定所述偏移向量的信息),且响应于所述偏移向量指向子像素位置(例如,响应于所述偏移向量指向色度样本内的子像素位置)来修改所述偏移向量以产生用于定位当前块的色度分量的参考块的经修改偏移向量。举例来说,经修改偏移向量可指向整数像素位置或指向为精度低于子像素位置的位置的像素位置。
根据本发明的另一实例技术,视频解码器30可针对视频数据的当前块来确定最大CTU大小。视频解码器30可针对视频数据的当前块来确定用于IMC模式的最大CU大小。用于IMC模式的最大CU大小可小于最大CTU大小。视频解码器30可基于用于IMC模式的最大CU大小来译码视频数据的当前块。举例来说,基于用于IMC模式的最大CU大小来译码视频数据的当前块可包含以下各者中的一或多者:响应于视频数据的当前块的大小大于用于IMC模式的最大CU大小而在IMC模式中不译码视频数据的当前块;或响应于视频数据的当前块的大小小于或等于用于IMC模式的最大CU大小而在IMC模式中译码视频数据的当前块。举例来说,用于IMC模式的最大CU大小可在经编码视频位流中加以发信或基于业已译码的视频数据的统计加以确定。
根据本发明的另一实例技术,视频解码器30可使用IMC模式来译码视频数据的当前块。基于当前块的大小、当前块的位置和包括当前块的CTU的大小中的一或多者,视频解码器30可针对视频数据的当前块来确定用于译码偏移向量的译码方法且基于所确定的译码方法来译码所述偏移向量。举例来说,用于译码偏移向量的译码方法可包含固定长度译码、可变长度译码、算术译码和基于上下文的译码中的一者或以上各者的组合。举例来说,当前块的位置可为在CTU内的位置或在视频数据帧内的位置。
图5展示帧内运动补偿(IMC)模式的概念说明。如上文所注释,IMC模式与帧内块复制(IBC)模式相同。举例来说,视频编码器20和视频解码器30可经配置以使用IMC模式来编码和解码视频数据块。许多应用(例如,远程台式计算机、远程游戏、无线显示器、汽车信息娱乐片、云计算等)在人们日常生活中正变得常规化,且可通过使用IMC模式来改善在译码此内容时的译码效率。图1的系统10可表示经配置以执行这些应用中的任一者的装置。这些应用中的视频内容常常为从然内容、文字、人工图形等的组合。在视频帧的文字和人工图形区域中,常常存在重复的型样(例如,字符、图示、符号等)。如上文所介绍,IMC为使得能够去除此种冗余且潜在地改善如JCT-VCM0350中所报告的帧内译码效率的专用技术。如图5中所说明,对于使用IMC的译码单元(CU)来说,从同一帧中的业已重构建的区域获得预测信号。最后,编码偏移向量(其指示从当前CU移位的预测信号的位置)连同残余信号。
例如,图5说明根据根据本发明的技术的用于从同一图片内的视频数据的预测性块来帧内预测视频数据块的模式(例如,根据根据本发明的技术的帧内MC模式)的用于预测当前图片103内的视频数据的当前块102的实例技术。图5说明当前图片103内的视频数据的预测性块104。视频译码器(例如,视频编码器20和/或视频解码器30)可根据根据本发明的技术的帧内MC模式来使用预测性视频块104以预测当前视频块102。
视频编码器20从视频数据的先前重构建的块的集合来选择预测性视频块104以用于预测当前视频块102。视频编码器20通过以下步骤来重构建视频数据块:反量化和反变换也包含于经编码视频位流中的视频数据,且对所得残余块与用以预测视频数据的经重构建块的预测性块求和。在图5的实例中,图片103内的预期区域108(其也可称为“预期区”或“光栅区”)包含先前重构建的视频块的集合。视频编码器20可以多种方式来定义图片103内的预期区域108,如下文予以更详细描述。视频编码器20可基于对预测和译码当前视频块102的相对效率和准确度的分析(基于预期区域108内的各种视频块)而从预期区域108中的视频块的中来选择待预测当前视频块102的预测性视频块104。
视频编码器20确定二维向量106,所述二维向量表示预测性视频块104相对于当前视频块102的位置或位移。二维向量106(其为偏移向量的实例)包含水平位移分量112和垂直位移分量110,所述水平位移分量和所述垂直位移分量分别表示预测性视频块104相对于当前视频块102的水平位移和垂直位移。视频编码器20可包含识别或定义经编码视频位流中的二维向量106(例如,定义水平位移分量112和垂直位移分量110)的一或多个语法元素。视频解码器30可解码所述一或多个语法元素以确定二维向量106,且使用所确定的向量来识别用于当前视频块102的预测性视频块104。
在一些实例中,二维向量106的分辨率可为整数像素(例如,被约束为具有整数像素分辨率)。在这些实例中,水平位移分量112和垂直位移分量110的分辨率将为整数像素。在这些实例中,视频编码器20和视频解码器30无需内插预测性视频块104的像素值以确定用于当前视频块102的预测值。
在其它实例中,水平位移分量112和垂直位移分量110中的一者或两者的分辨率可为子像素。举例来说,分量112和110中的一者可具有整数像素分辨率,而另一者具有子像素分辨率。在一些实例中,水平位移分量112与垂直位移分量110两者的分辨率可为子像素,但水平位移分量112与垂直位移分量110可具有不同分辨率。
在一些实例中,视频译码器(例如,视频编码器20和/或视频解码器30)基于特定水平(例如,块水平、切片水平或图片水平调适)来调适水平位移分量112和垂直位移分量110的分辨率。举例来说,视频编码器20可在切片层级处(例如,在切片标头中)发信旗标,所述旗标指示水平位移分量112和垂直位移分量110的分辨率是否为整数像素分辨率。如果旗标指示水平位移分量112和垂直位移分量110的分辨率非为整数像素分辨率,那么视频解码器30可推断分辨率为子像素分辨率。在一些实例中,可针对视频数据的每一切片或其它单元来传输一或多个语法元素(其未必为旗标)以指示水平位移分量112和/或垂直位移分量110的集体或个别分辨率。
在再其它实例中,代替旗标或语法元素,视频编码器20可从分辨率上下文信息来设定水平位移分量112和/或垂直位移分量110的分辨率,且视频解码器30可从分辨率上下文信息来推断水平位移分量112和/或垂直位移分量110的分辨率。作为实例,对于包含当前视频块102的图片或图片序列来说,分辨率上下文信息可包含色空间(例如,YUV、RGB或其类似者)、特定色彩格式(例如,4:4:4、4:2:2、4:2:0或其类似者)、帧大小、帧速率或量化参数(QP)。在至少一些实例中,视频译码器可基于与先前译码的帧或图片有关的信息来确定水平位移分量112和/或垂直位移分量110的分辨率。以此方式,水平位移分量112的分辨率和垂直位移分量110的分辨率可加以预定义、发信,可从其它辅助信息(例如,分辨率上下文信息)加以推断,或可基于业已译码的帧。
当前视频块102可为CU或CU的PU。在一些实例中,视频译码器(例如,视频编码器20和/或视频解码器30)可将根据IMC加以预测的CU分裂成诸多PU。在这些实例中,视频译码器可针对所述CU的PU中的每一者来确定相应(例如,不同)二维向量106。举例来说,视频译码器可将2N×2NCU分裂成两个2N×NPU、两个N×2NPU或四个N×NPU。作为其它实例,视频译码器可将2N×2NCU分裂成((N/2)×N+(3N/2)×N)PU、((3N/2)×N+(N/2)×N)PU、(N×(N/2)+N×(3N/2))PU、(N×(3N/2)+N×(N/2))PU、四个(N/2)×2NPU或四个2N×(N/2)PU。在一些实例中,视频译码器可使用2N×2NPU来预测2N×2NCU。
当前视频块102包含亮度视频块(例如,亮度分量)和对应于所述亮度视频块的色度视频块(例如,色度分量)。在一些实例中,视频编码器20可仅将定义亮度视频块的二维向量106的一或多个语法元素编码到经编码视频位流中。在这些实例中,视频解码器30可基于针对亮度块所发信的二维向量来导出对应于所述亮度块的一或多个色度块中的每一者的二维向量106。在本发明中所描述的技术中,在所述一或多个色度块的二维向量的导出中,如果亮度块的二维向量指向色度样本内的子像素位置,那么视频解码器30可修改亮度块的二维向量。
取决于色彩格式(例如,色彩采样格式或色度采样格式),视频译码器可相对于亮度视频块来向下采样对应的色度视频块。色彩格式4:4:4不包含向下采样,其意味着色度块在水平方向和垂直方向上包含与亮度块相同数目的样本。色彩格式4:2:2在水平方向上被向下采样,其意味着在水平方向上色度块中的样本相对于亮度块而少一半。色彩格式4:2:0在水平方向和垂直方向上被向下采样,其意味着在水平方向和垂直方向上色度块中的样本相对于亮度块而少一半。
在视频译码器基于对应的亮度块的向量106来确定色度视频块的向量106的实例中,视频译码器可能需要修改亮度向量。举例来说,如果亮度向量106具有整数分辨率(其中水平位移分量112和/或垂直位移分量110为像素的奇数数目且色彩格式为4:2:2或4:2:0),那么经转换的亮度向量可能不指向对应的色度块中的整数像素位置。在这些实例中,视频译码器可缩放亮度向量以供用作用以预测对应的色度块的色度向量。
图5展示正以IMC模式译码的当前CU。可从搜索区域获得用于当前CU的预测性块。搜索区域包含来自与当前CU相同的帧的业已译码块。假定(例如)正以光栅扫描次序(即,左-右和顶-底)译码帧,所述帧的业已译码块对应于位于当前CU的左边和上面的块,如图5中所示。在一些实例中,搜索区域可包含帧中的所有业已译码块,而在其它实例中,搜索区域可包含少于全部的业已译码块。图5中的偏移向量(有时称为运动向量或预测向量)识别当前CU的左上像素与预测性块(在图5中被标记为预测信号)的左上像素之间的差。因此,当当前CU以IMC模式译码时,通过在经编码视频位流中发信偏移向量,视频解码器可识别用于当前CU的预测性块。
根据本发明的技术的各种方面,用于IMC的运动向量(称为偏移向量)为2D向量(Vx,Vy),其中Vx指示水平方向(即,x方向)上的位移且Vy指示垂直方向(即,y方向)上的位移。可取决于CTU大小来编码偏移向量分量Vi(i可为x或y)。举例来说,Vi的码长和/或二值化方法可针对不同CTU大小而不同。举例来说,如果CTU大小为64×64,那么可使用6位固定长度码。其它方面,如果CTU大小为32×32,那么可使用5位固定长度码。
此外,偏移向量的译码也可取决于搜索区域面积。不同搜索区域大小或形状可导致用于偏移向量的不同译码方法。举例来说,偏移向量的译码可取决于搜索区域的长度和宽度中的一者或两者。举例来说,搜索区域的大小可对应于当前块的像素与搜索区域的顶边界、搜索区域的左边界和/或搜索区域的右边界之间的距离。举例来说,搜索区域的大小可取决于在切片或帧内的块位置。举例来说,位于帧左上处的块可具有小于位于帧右下处的块的搜索区域。
另外,以上相依性可延伸到仅一个偏移向量分量(即,仅x分量或仅y分量)或延伸到两个偏移向量分量。又,两个分量可具有不同二值化。例如,水平MV可具有6位固定长度码,而垂直MV可具有5位固定长度码,因为搜索区含有左CTU,但可能不前往上面的CTU(以便需要用于上面数据的行缓冲器)。
根据本发明的技术的其它方面,偏移向量分量Vi(i可为x或y)的分辨率可为整数像素分辨率或子像素分辨率。当子像素分辨率被用于某一色彩分量(例如,Y/U/V、R/G/B)的偏移向量时,使用内插滤波器以在子像素位置处产生值。
根据所述技术的这些方面,对于任何色彩分量来说(例如,对于亮度或色度块来说),当对应的偏移向量的分辨率为子像素时,可将所述偏移向量的分辨率转换到整数像素位置或较不精确的子像素位置。在整数像素位置的状况下,可无需内插滤波器,而在较不精确的子像素位置的状况下,可使用较简单的内插滤波器(例如,与针对较高精度的子像素位置所需的内插滤波器相比而较简单)。根据本发明,整数像素位置为精度小于半像素位置的位置。半像素位置为精度小于四分之一像素位置的位置,等等。
举例来说,在4:2:0状况下,当亮度MV(即,亮度偏移向量)为奇数数目(例如,x和/或y分量为奇数数目)时,那么色度MV(即,色度偏移向量)具有子像素精度且需要内插滤波器。然而,在本发明中所描述的技术中,色度MV(即,色度偏移向量)将被舍位到整数字置以避免使用内插滤波器。偏移向量可经升值舍位或降值舍位。换句话说,视频编码器20可将当前块的亮度块的偏移向量发信到视频解码器30。视频解码器30可确定将此偏移向量(曾经被缩放或其它方面)用作当前块的色度块的偏移向量是否将导致所述偏移向量指向包含当前块的当前图片的色度样本内的子像素位置。如果所述偏移向量指向色度样本内的子像素位置,那么视频解码器30可修改所述偏移向量以产生指向色度样本中的整数像素位置或色度样本中的精度低于子像素位置的位置的经修改偏移向量。此方法在提供类似性能时可能需要较少存储器频宽和较少数目的操作(无滤波)。
根据本发明的技术的各种方面,用于IMC的最大CU大小可不同于CTU大小。例如,当CTU大小为64×64时,可将用于IMC的最大CU大小可被设定到16×16。在一些实例中,此限制可适用于视频编码器20与视频解码器30两者,或仅适用于视频编码器20。
当将此种技术应用于视频编码器20与视频解码器30两者时,用于IMC的最大CU大小可取决于CTU大小或从先前帧收集的统计。此外,可在各种层级处(例如,图片参数集(PPS)、序列参数集(SPS)、LCU标头或在某一其它层级处)在位流中发信最大CU大小信息。当将此技术应用于视频编码器20与视频解码器30两者时,可将大于所限制的CU大小的CU默认地设定到非帧内MCCU,且可能不需要额外发信。
图6为说明可实施本发明中所描述的技术的实例视频编码器20的框图。视频编码器20可经配置以将视频输出到后处理实体27。后处理实体27希望表示可处理来自视频编码器20的经编码视频数据的视频物理的实例(例如,MANE或编接/编辑装置)。在一些例子中,后处理实体27可为网络实体的实例。在一些视频编码系统中,后处理实体27与视频编码器20可为分开的装置的部分,而在其它例子中,可由包括视频编码器20的同一装置来执行关于后处理实体27所描述的功能性。在一些实例中,后处理实体27为图1的存储装置17的实例。
视频编码器20可执行视频切片内的视频块的帧内译码、帧间译码和IMC译码。帧内译码依赖于空间预测以减小或去除给定视频帧或图片内的视频中的空间冗余。帧间译码依赖于时间预测以减小或去除视频序列的邻近帧或图片内的视频中的时间冗余。帧内模式(I模式)可指代若干基于空间的压缩模式中的任一者。帧间模式(例如,单向预测(P模式)或双向预测(B模式))可指代若干基于时间的压缩模式中的任一者。如上文所描述,IMC译码模式可从视频数据帧去除空间冗余,但不同于传统的帧内模式,IMC译码模式可用以在帧内的较大搜索区中定位预测性块且参考具有偏移向量的预测性块,而非依赖于帧内预测译码模式。
在图6的实例中,视频编码器20包含视频数据存储器33、分割单元35、预测处理单元41、滤波单元63、解码图片缓冲器64、求和器50、变换处理单元52、量化单元54和熵编码单元56。预测处理单元41包含运动估计单元42、运动补偿单元44和帧内预测处理单元46。为达成视频块重构建,视频编码器20也包含反量化单元58、反变换处理单元60和求和器62。滤波器单元63希望表示一或多个回路滤波器(例如,解块滤波器、自适应性回路滤波器(ALF)和样本自适应性偏移(SAO)滤波器)。虽然图6中将滤波器单元63展示为回路中滤波器,但在其它配置中,可将滤波器单元63实施为回路后滤波器。
视频数据存储器33可存储待由视频编码器20的组件编码的视频数据。举例来说,可从视频源18获得存储于视频数据存储器33中的视频数据。解码图片缓冲器64可为存储供由视频编码器20用于编码视频数据(例如,在帧内译码模式、帧间译码模式或IMC译码模式中)的参考视频数据的参考图片存储器。视频数据存储器33和解码图片缓冲器64可由多种存储器装置中的任一者形成,例如动态随机存取存储器(DRAM)(包含同步DRAM(SDRAM))、磁阻RAM(MRAM)、电阻式RAM(RRAM)或其它类型的存储器装置。可由同一存储器装置或分开的存储器装置来提供视频数据存储器33和解码图片缓冲器64。在各种实例中,视频数据存储器33可与视频编码器20的其它组件一起在芯片上,或相对于那些组件而在芯片外。
如图6中所示,视频编码器20接收视频数据且将视频数据存储于视频数据存储器33中。分割单元35将数据分割成视频块。此分割也可包含分割成切片、瓦片或其它较大单元以及视频块分割(例如,根据LCU和CU的四分树结构)。视频编码器20大体说明编码在待编码的视频切片内的视频块的组件。所述切片可划分成多个视频块(和可能地划分成被称为瓦片的视频块集合)。预测处理单元41可基于错误结果(例如,译码速率和失真水平)而针对当前视频块来选择多个可能译码模式中的一者(例如,多个帧内译码模式中的一者、多个帧间译码模式中的一者或多个IMC译码模式中的一者)。预测处理单元41可将所得帧内译码块、帧间译码块或IMC译码块提供到求和器50以产生残余块数据和提供到求和器62以重构建供用作参考图片的经编码块。
预测处理单元41内的帧内预测处理单元46可相对于在与待译码的当前块相同的帧或切片中的一或多个相邻块来执行当前视频块的帧内预测性译码以提供空间压缩。预测处理单元41内的运动估计单元42和运动补偿单元44可相对于在一或多个参考图片中的一或多个预测性块来执行当前视频块的帧间预测性译码以提供时间压缩。预测处理单元41内的运动估计单元42和运动补偿单元44也可相对于在同一图片中的一或多个预测性块来执行当前视频块的IMC译码以提供空间压缩。
运动估计单元42可经配置以根据视频序列的预定型样来确定用于视频切片的帧间预测模式或IMC模式。预定型样可将序列中的视频切片指定为P切片、B切片或GPB切片。运动估计单元42和运动补偿单元44可高度集成,但为概念目的而分开地予以说明。由运动估计单元42执行的运动估计为产生运动向量的过程,运动向量估计视频块的运动。运动向量(例如)可指示当前视频帧或图片内的视频块的PU相对于参考图片内的预测性块的位移。在IMC译码的状况下,运动向量(其可在IMC中称为偏移向量)可指示当前视频帧或图片内的视频块的PU相对于当前视频帧内的预测性块的位移。
预测性块为被发现与待译码的视频块的PU在像素差方面紧密匹配的块,可通过绝对差的和(SAD)、平方差的和(SSD)或其它差度量来确定像素差。在一些实例中,视频编码器20可计算存储于解码图片缓冲器64中的参考图片的子整数像素位置的值。举例来说,视频编码器20可内插参考图片的四分之一像素位置、八分之一像素位置或其它分率像素位置的值。因此,运动估计单元42可关于全像素位置和分率像素位置来执行运动搜索且输出具有分率像素精度的运动向量。
运动估计单元42通过比较PU的位置与参考图片的预测性块的位置来计算帧间译码切片中的视频块的PU的运动向量。可从第一参考图片列表(列表0)或第二参考图片列表(列表1)选择参考图片,所述列表中的每一者识别存储于解码图片缓冲器64中的一或多个参考图片。运动估计单元42将所计算的运动向量发送到熵编码单元56和运动补偿单元44。
根据本发明的一些技术,当使用IMC模式来译码视频块时,运动估计单元42可确定所述视频块的亮度分量的运动向量或偏移向量,且基于所述亮度分量的偏移向量来确定所述视频块的色度分量的偏移向量。在另一实例中,当使用IMC模式来译码视频块时,运动估计单元42可确定所述视频块的色度分量的运动向量或偏移向量,且基于所述色度分量的偏移向量来确定所述视频块的亮度分量的偏移向量。因此,视频编码器20可在位流中仅发信一个偏移向量,可从所述一个偏移向量来确定视频块的色度分量与亮度分量两者的偏移向量。
由运动补偿单元44执行的运动补偿可涉及基于通过运动估计确定的运动向量来提取或产生预测性块,从而可能执行到子像素精度的内插。内插滤波可从已知的像素样本产生额外像素样本,因此潜在地增加可用以译码视频块的候选预测性块的数目。在接收到当前视频块的PU的运动向量后,运动补偿单元44即可在参考图片列表中的一者中或在IMC译码的状况下在正译码的图片内定位所述运动向量所指向的预测性块。视频编码器20通过从正译码的当前视频块的像素值减去预测性块的像素值来形成残余视频块,从而形成像素差值。像素差值形成块的残余数据,且可包含亮度差分量与色度差分量两者。求和器50表示执行此减法运算的(多个)组件。运动补偿单元44也可产生与视频块和视频切片相关联的语法元素以供由视频解码器30用于解码视频切片的视频块。
帧内预测处理单元46可帧内预测当前块,以作为由运动估计单元42和运动补偿单元44执行的帧间预测和IMC的替代,如上文所描述。明确地说,帧内预测处理单元46可确定待用以编码当前块的帧内预测模式。在一些实例中,帧内预测处理单元46可(例如)在分开的编码遍次期间使用各种帧内预测模式来编码当前块,且帧内预测处理单元46(或在一些实例中,模式选择单元40)可从所测试的模式选择待使用的适当帧内预测模式。举例来说,帧内预测处理单元46可使用针对各种所测试的帧内预测模式的速率-失真分析来计算速率-失真值,且在所测试的模式的中选择具有最佳速率-失真特性的帧内预测模式。速率-失真分析大体确定经编码块与经编码以产生经编码块的原始的未经编码块之间的失真(或误差)的量,以及用以产生经编码块的位率(即,位数目)。帧内预测处理单元46可从各种经编码块的失真和速率来计算比率以确定哪一帧内预测模式展现块的最佳速率-失真值。
在任何状况下,在选择用于一块的帧内预测模式之后,帧内预测处理单元46可将指示用于所述块的所选帧内预测模式的信息提供到熵编码单元56。熵编码单元56可根据本发明的技术来熵编码指示所选帧内预测模式的信息。视频编码器20可在所传输的位流中包含以下各者:配置数据,其可包含多个帧内预测模式索引表和多个经修改的帧内预测模式索引表(也称为码字映射表);各种块的编码上下文的定义;和待用于所述上下文中的每一者的最有可能的帧内预测模式、帧内预测模式索引表和经修改的帧内预测模式索引表的指示。
在预测处理单元41经由帧间预测、帧内预测或IMC来产生用于当前视频块的预测性块之后,视频编码器20通过从当前视频块减去预测性块来形成残余视频块。残余块中的残余视频数据可包含于一或多个TU中且应用到变换处理单元52。变换处理单元52使用变换(例如,离散余弦变换(DCT)或概念上类似的变换)来将残余视频数据变换成残余变换系数。变换处理单元52可将残余视频数据从像素域转换到变换域(例如,频域)。
变换处理单元52可将所得的变换系数发送到量化单元54。量化单元54量化所述变换系数以进一步减小位率。所述量化过程可减小与所述系数中的一些或所有相关联的位深度。可通过调整量化参数来修改量化程度。在一些实例中,量化单元54可接着执行对包含经量化的变换系数的矩阵的扫描。替代地,熵编码单元56可执行所述扫描。
在量化之后,熵编码单元56熵编码经量化的变换系数。举例来说,熵编码单元56可执行上下文自适应性可变长度译码(CAVLC)、上下文从使用性二进制算术译码(CABAC)、基于语法的上下文自适应性二进制算术译码(SBAC)、概率间隔分割熵(PIPE)译码或另一熵编码方法或技术。在由熵编码单元56进行熵编码之后,可将经编码位流传输到视频解码器30,或存档以供稍后传输或由视频解码器30检索。熵编码单元56也可熵编码正译码的当前视频切片的运动向量和其它语法元素。
反量化单元58和反变换处理单元60分别应用反量化和反变换,以在像素域中重构建残余块供稍后用作参考图片的参考块。运动补偿单元44可通过将残余块与在参考图片列表中的一者内的参考图片中的一者的预测性块相加来计算参考块。运动补偿单元44也可将一或多个内插滤波器应用于经重构建的残余块,以计算供用于运动估计中的子整数像素值。内插滤波可从已知的像素样本产生额外像素样本,因此潜在地增加可用以译码视频块的候选预测性块的数目。求和器62将经重构建的残余块与由运动补偿单元44产生的经运动补偿的预测块相加以产生供存储于解码图片缓冲器64中的参考块。可由运动估计单元42和运动补偿单元44将所述参考块用作参考块以帧间预测一随后视频帧或图片中的块。
以此方式,图6的视频编码器20表示经配置以执行以下步骤的视频编码器的实例:使用IMC模式来译码视频数据的当前块;针对视频数据的当前块来确定用以发信偏移向量的分量的码字的长度;和基于所述码字的长度来译码所述偏移向量。举例来说,视频编码器20可基于用以针对视频数据的当前块执行IMC的搜索区域的大小和/或基于包含当前块的CTU的大小来确定用以发信所述分量的码字的长度。
视频编码器20也表示经配置以执行以下步骤的视频编码器的实例:使用IMC模式来译码视频数据的当前块;针对视频数据的当前块来确定当前块的亮度分量的偏移向量;和响应于所述偏移向量指向包含当前块的当前图片的色度样本内的子像素位置来修改所述偏移向量以产生当前块的色度块的经修改偏移向量。举例来说,经修改偏移向量可指向色度样本中的整数像素位置或指向色度样本中的为精度低于子像素位置的位置的像素位置。
视频编码器20也表示经配置以执行以下步骤的视频编码器的实例:针对视频数据的当前块来确定最大CTU大小且针对视频数据的当前块来确定用于IMC模式的最大CU大小,使得用于IMC模式的最大CU大小系小于最大CTU大小;和基于用于IMC模式的最大CU大小来译码视频数据的当前块。在一些实施方案中,视频编码器20可将用于IMC模式的最大CU大小的指示发信到视频解码器,而在其它配置中,视频编码器20可不将用于IMC模式的最大CU大小的指示发信到视频解码器。
视频编码器20也表示经配置以执行以下步骤的视频编码器的实例:使用IMC模式来译码视频数据的当前块;基于当前块的大小、当前块的位置和包括当前块的译码树型单元(CTU)的大小中的一或多者而针对视频数据的当前块来确定用于译码偏移向量的译码方法;和基于所述译码方法来译码所述偏移向量。举例来说,所述译码方法可为固定长度译码、可变长度译码、算术译码、基于上下文的译码或用于译码视频数据的任何其它类型的译码方法中的任一者。当前块的位置可指代在CTU内的位置或可指代当前块在视频数据帧内的位置。
图7为说明可实施本发明中所描述的技术的实例视频解码器30的框图。在图7的实例中,视频解码器30包含视频数据存储器78、熵解码单元80、预测处理单元81、反量化单元86、反变换处理单元88、求和器90、滤波器单元91和解码图片缓冲器92。预测处理单元81包含运动补偿单元82和帧内预测处理单元84。在一些实例中,视频解码器30可执行大体与关于来自图6的视频编码器20所描述的编码遍次互逆的解码遍次。
在解码过程期间,视频解码器30从视频编码器20接收视频数据(例如,表示经编码视频切片的视频块和关联的语法元素的经编码视频位流)。视频解码器30可从网络实体29接收视频数据且将所述视频数据存储于视频数据存储器78中。视频数据存储器78可存储待由视频解码器30的组件解码的视频数据(例如,经编码视频位流)。举例来说,可经由视频数据的有线或无线网络通信而从存储装置17(例如,从例如摄影机的局部视频源)或通过存取物理数据存储媒体来获得存储于视频数据存储器78中的视频数据。视频数据存储器78可形成存储来自经编码视频位流的经编码视频数据的译码图片缓冲器。因此,虽然在图7中加以分开地展示,但可由同一存储器装置或分开的存储器装置来提供视频数据存储器78和解码图片缓冲器92。视频数据存储器78和解码图片缓冲器92可由多种存储器装置中的任一者形成,例如动态随机存取存储器(DRAM)(包含同步DRAM(SDRAM))、磁阻RAM(MRAM)、电阻性RAM(RRAM)或其它类型的存储器装置。在各种实例中,视频数据存储器78可与视频解码器30的其它组件一起在芯片上,或相对于那些组件而在芯片外。
举例来说,网络实体29可为经配置以实施上文所描述的技术中的一或多者的服务器、MANE、视频编辑器/编接器或其它此装置。网络实体29可包含或可不包含视频编码器(例如,视频编码器20)。可在网络实体29将经编码视频位流传输到视频解码器30之前由网络实体29来实施本发明中所描述的一些技术。在一些视频解码系统中,网络实体29和视频解码器30可为分开的装置的部分,而在其它例子中,可通过包括视频解码器30的同一装置来执行关于网络实体29所描述的功能性。在一些状况下,网络实体29可为图1的存储装置17的实例。
视频解码器30的熵解码单元80熵解码位流以产生经量化的系数、运动向量和其它语法元素。熵解码单元80将运动向量和其它语法元素转递到预测处理单元81。视频解码器30可在视频切片层级和/或视频块层级处接收语法元素。
当视频切片经译码为帧内译码(I)切片时,预测处理单元81的帧内预测处理单元84可基于所发信的帧内预测模式和来自当前帧或图片的先前解码块的数据而产生当前视频切片的视频块的预测数据。当视频帧经译码为帧间译码(即,B、P或GPB)切片时或当块经IMC译码时,预测处理单元81的运动补偿单元82基于从熵解码单元80接收的运动向量和其它语法元素来产生用于当前视频切片的视频块的预测性块。为达成帧间预测,可从参考图片列表中的一者内的参考图片中的一者来产生所述预测性块。视频解码器30可基于存储于解码图片缓冲器92中的参考图片使用默认构建技术来构建参考帧列表(列表0和列表1)。为达成IMC译码,可从与正预测的块相同的图片来产生预测性块。
运动补偿单元82通过剖析运动向量和其它语法元素来确定当前视频切片的视频块的预测信息,且使用所述预测信息来产生用于正经解码的当前视频块的预测性块。举例来说,运动补偿单元82使用一些所接收的语法元素来确定用以译码视频切片的视频块的预测模式(例如,帧内预测或帧间预测)、帧间预测切片类型(例如,B切片、P切片或GPB切片)、切片的参考图片列表中的一或多者的构建信息、切片的每一帧间编码视频块的运动向量、切片的每一帧间译码视频块的帧间预测状态,和用以解码当前视频切片中的视频块的其它信息。
运动补偿单元82也可基于内插滤波器执行内插。运动补偿单元82可使用如由视频编码器20在视频块的编码期间使用的内插滤波器,以计算参考块的子整数像素的内插值。在此状况下,运动补偿单元82可从接收的语法元素来确定由视频编码器20使用的内插滤波器且使用所述内插滤波器来产生预测性块。
根据本发明的一些技术,当使用IMC模式来译码视频块时,运动补偿单元82可确定所述视频块的亮度分量的运动向量或偏移向量,且基于所述亮度分量的运动向量来确定所述视频块的色度分量的运动向量。在另一实例中,当使用IMC模式来译码视频块时,运动补偿单元82可确定所述视频块的色度分量的运动向量或偏移向量,且基于所述色度分量的运动向量来确定所述视频块的亮度分量的运动向量。因此,视频解码器30可在位流中仅接收一个偏移向量,可从所述一个偏移向量来确定视频块的色度分量与亮度分量两者的偏移向量。
当使用IMC模式来解码视频块时,举例来说,运动补偿单元82可修改亮度分量的运动向量(称为IMC模式的偏移向量)以确定色度分量的偏移向量。举例来说,运动补偿单元82可基于视频块的采样格式和基于偏移向量所指向的子像素位置的精度来修改亮度块的偏移向量的x分量和y分量中的一者或两者。举例来说,如果视频块是使用4:2:2采样格式译码,那么运动补偿单元82可仅修改亮度偏移向量的x分量而非y分量以确定色度分量的偏移向量。如可从图4所见,在4:2:2采样格式中,色度块和亮度块在垂直方向上具有相同数目的样本,因此使对y分量的修改变得潜在地不需要。运动补偿单元82可仅在当亮度偏移向量被用于定位色度预测性块时的情况下才修改所述亮度偏移向量,所述亮度偏移向量指向无色度样本的位置(例如,在包含当前块的当前图片的色度样本中的子像素位置处)。如果亮度偏移向量在被用以定位色度预测性块时指向其中存在色度样本的位置,那么运动补偿单元82可不修改所述亮度偏移向量。
在另一实例中,如果视频块是使用4:2:0采样格式译码,那么运动补偿单元82可修改亮度偏移向量的x分量和y分量中的任一者或两者以确定色度分量的偏移向量。如可从图3所见,在4:2:0采样格式中,色度块和亮度块在垂直方向与水平方向两者上具有不同数目的样本。运动补偿单元82可仅在当亮度偏移向量被用于定位色度预测性块时的情况下才修改所述亮度偏移向量,所述亮度偏移向量指向无色度样本的位置(例如,在包含当前块的当前图片的色度样本中的子像素位置处)。如果亮度偏移向量在被用以定位色度预测性块时指向其中存在色度样本的位置,那么运动补偿单元82可不修改所述亮度偏移向量。
运动补偿单元82可修改亮度偏移向量以产生经修改运动向量(也称为经修改偏移向量)。运动补偿单元82可修改亮度偏移向量,所述亮度偏移向量在被用以定位色度预测性块时指向子像素位置使得用于色度块的经修改偏移向量指向较低分辨率的子像素位置或指向整数像素位置。作为一个实例,指向1/8像素位置的亮度偏移向量可经修改以指向1/4像素位置,指向1/4像素位置的亮度偏移向量可经修改以指向1/2像素位置等。在其它实例中,运动补偿单元82可修改亮度偏移向量使得经修改偏移向量总是指向整数像素位置以用于定位色度参考块。修改亮度偏移向量以指向较低分辨率的子像素位置或指向整数像素位置可消除需要某种内插滤波和/或降低任何所需的内插滤波的复杂度。
参看图3和4且假定左上样本被定位于位置(0,0)处,视频块具有位于奇数与偶数x两种位置和奇数与偶数y两种位置处的亮度样本。在4:4:4采样格式中,视频块也具有位于奇数与偶数x两种位置和奇数与偶数y两种位置处的色度样本。因此,对于4:4:4采样格式来说,运动补偿单元可将同一偏移向量用于定位亮度预测性块与色度预测性块两者。对于4:2:2采样格式来说,如图4中所示,视频块具有位于奇数与偶数y两种位置处但仅位于偶数x位置处的色度样本。因此,对于4:2:2采样格式来说,如果亮度偏移向量指向奇数x位置,那么运动补偿单元82可修改所述亮度偏移向量的x分量以产生一指向偶数x位置的经修改偏移向量使得可将所述经修改偏移向量用于定位当前块的色度块的参考色度块而无需内插。举例来说,运动补偿单元82可通过升值舍位抑或降值舍位到最近的偶数x位置来修改x分量(即,改变x分量使得其指向最近的左x位置抑或最近的右x位置)。如果亮度偏移向量业已指向偶数x位置,那么不必进行修改。
对于4:2:0采样格式来说,如图3中所示,视频块具有仅位于偶数y位置处和仅位于偶数x位置处的色度样本。因此,对于4:2:0采样格式来说,如果亮度偏移向量指向奇数x位置或奇数y位置,那么运动补偿单元82可修改所述亮度偏移向量的x分量或y分量以产生指向偶数x位置的经修改偏移向量使得可将所述经修改偏移向量用于定位当前块的色度块的参考色度块而无需内插。举例来说,运动补偿单元82可通过升值舍位抑或降值舍位到最近的偶数x位置来修改x分量(即,改变x分量使得其指向最近的左x位置抑或最近的右x位置)。举例来说,运动补偿单元82可通过升值舍位抑或降值舍位到最近的偶数y位置来修改y分量(即,改变y分量使得其指向最近的上y位置抑或最近之下y位置)。如果亮度偏移向量业已指向偶数x位置和偶数y位置,那么不必进行修改。
反量化单元86将位流中所提供且由熵解码单元80解码的经量化的变换系数反量化(即,解量化)。反量化过程可包含针对视频切片中的每一视频块而使用由视频编码器20计算的量化参数,以确定量化程度和(同样)应应用的反量化的程度。反变换处理单元88将反变换(例如,反DCT、反整数变换或概念上类似的反变换过程)应用于变换系数以便在像素域中产生残余块。
在运动补偿单元82基于运动向量和其它语法元素而产生用于当前视频块的预测性块之后,视频解码器30通过对来自反变换处理单元88的残余块与由运动补偿单元82产生的对应预测性块求和而形成经解码视频块。求和器90表示执行此加法运算的(多个)组件。如果想要,也可使用回路滤波器(在译码回路中抑或在译码回路之后)来使像素转变平滑,或在其它方面改善视频质量。滤波器单元91希望表示一或多个回路滤波器(例如,解块滤波器、自适应性回路滤波器(ALF)和样本自适应性偏移(SAO)滤波器)。虽然图7中将滤波器单元91展示为回路中滤波器,但在其它配置中,可将滤波器单元91实施为回路后滤波器。给定帧或图片中的经解码视频块接着被存储于解码图片缓冲器92中,所述解码图片缓冲器存储用于随后的运动补偿的参考图片。解码图片缓冲器92可为也存储供稍后呈现于显示装置(例如,图1的显示装置32)上的经解码视频的存储器的部分,或可与此存储器分开。
以此方式,图7的视频解码器30表示经配置以执行以下步骤的视频解码器的实例:使用IMC模式来译码视频数据的当前块;针对视频数据的当前块来确定用以发信偏移向量的分量的码字的长度;和基于所述码字的长度来译码所述偏移向量。举例来说,视频解码器30可解码当前块和接收码字。举例来说,偏移向量的分量可为x分量或y分量。根据本发明的技术的一个方面,用于x分量的码字的长度可不同于用于y分量的码字的长度。
举例来说,视频解码器30可通过基于用以针对视频数据的当前块执行IMC的搜索区域的大小确定码字的长度来确定用以发信偏移向量的分量的码字的长度。举例来说,搜索区域的大小可包含:当前块的像素与搜索区域的顶边界之间的距离、当前块的像素与搜索区域的左边界之间的距离,和/或当前块的像素与搜索区域的右边界之间的距离。替代地或另外,视频解码器30可通过以下步骤来确定用以发信偏移向量的分量的码字的长度:基于包括当前块的译码树型单元的大小来确定码字的长度、基于当前块在CTU中的位置来确定码字的长度、基于当前块在视频数据帧中的位置来确定码字的长度,和/或基于当前块的大小来确定码字的长度。
视频解码器30也表示经配置以执行以下步骤的视频解码器的实例:使用IMC模式来译码视频数据的当前块;针对视频数据的当前块来确定偏移向量;和响应于所述偏移向量指向子像素位置来修改所述偏移向量以产生经修改偏移向量。举例来说,所述经修改偏移向量可指向整数像素位置或指向较低精度的子像素位置。
视频解码器30也表示经配置以执行以下步骤的视频解码器的实例:针对视频数据的当前块来确定最大CTU大小且针对视频数据的当前块来确定用于IMC模式的最大CU大小,使得用于IMC模式的最大CU大小系小于最大CTU大小。视频解码器30可基于用于IMC模式的最大CU大小来译码视频数据的当前块。举例来说,视频解码器30可经配置以响应于视频数据的当前块的大小大于用于IMC模式的最大CU大小而在IMC模式中不译码视频数据的当前块和/或响应于视频数据的当前块的大小小于或等于用于IMC模式的最大CU大小而在IMC模式中译码视频数据的当前块。举例来说,视频解码器30可在视频数据中接收发信用于IMC模式的最大CU大小的语法元素。替代地,视频解码器30可基于业已译码的视频数据的统计来确定用于IMC模式的最大CU大小。
视频解码器30也表示经配置以执行以下步骤的视频解码器的实例:使用IMC模式来译码视频数据的当前块;基于当前块的大小、当前块的位置和包括当前块的译码树型单元(CTU)的大小中的一或多者而针对视频数据的当前块来确定用于译码偏移向量的译码方法;和基于所述译码方法来译码所述偏移向量。举例来说,所述译码方法可为固定长度译码、可变长度译码、算术译码、基于上下文的译码或用于译码视频数据的任何其它类型的译码方法中的任一者。当前块的位置可指在CTU内的位置或可指代当前块在视频数据帧内的位置。
图8为展示根据本发明的技术的译码(例如,编码或解码)视频数据的方法的实例的流程图。将参考一般视频译码器来描述图8的技术。举例来说,虽然也可由其它类型的视频编码器和解码器来执行所述技术,但一般视频译码器可对应于上文所描述的视频编码器20或视频解码器30。举例来说,可通过视频解码器来执行图8的技术以作为产生供显示的经解码视频的部分。举例来说,可通过视频编码器来执行图8的技术以作为编码视频数据的部分。举例来说,视频编码器可解码经编码视频数据以产生供用于编码其它帧的参考帧。
根据图8的技术,视频译码器确定视频帧中的视频数据的当前块是使用IMC模式译码(180)。举例来说,当前块可以4:4:4采样格式、4:2:0采样格式或4:2:2采样格式译码。举例来说,视频解码器可通过在经编码位流中接收指示当前块的译码模式的语法元素来确定当前块是使用IMC模式译码。举例来说,视频编码器可确定当前块应使用IMC模式译码以作为测试多个模式以确定待用以编码当前块的译码模式的部分。
根据图8的实例,视频译码器确定视频数据的当前块的第一色彩分量的偏移向量(182)。举例来说,视频解码器可基于在经编码位流中所接收的语法元素来确定偏移向量,而视频编码器可确定所述偏移向量以作为搜索待用以编码当前块的参考块的部分。举例来说,第一色彩分量可为亮度分量抑或色度分量。视频译码器在视频帧中使用所述偏移向量来定位第一色彩分量的参考块(184)。
根据图8的实例,视频译码器响应于所述偏移向量指向子像素位置来修改所述偏移向量以产生经修改偏移向量(186)。视频译码器可修改所述偏移向量以指向整数像素位置或指向为精度低于子像素位置的位置的位置。就此来说,修改偏移向量可包含并非仅仅缩放偏移向量。举例来说,视频译码器可缩放所述偏移向量,且响应于经缩放偏移向量指向子像素位置,也可舍位所述偏移向量以指向较不精确的子像素位置或指向整数像素位置。响应于偏移向量指向色度参考块的子像素位置,视频译码器可修改所述偏移向量以产生指向色度参考块的整数像素位置的经修改偏移向量。在当前块是使用4:2:2采样格式译码的一些实例中,视频译码器可通过修改偏移向量的x分量来修改所述偏移向量以产生经修改偏移向量。在当前块是使用4:2:0采样格式译码的一些实例中,视频译码器可通过修改偏移向量的x分量、y分量或x分量与y分量两者来修改所述偏移向量以产生经修改偏移向量。
视频译码器在视频数据帧中使用经修改偏移向量来定位第二色彩分量的参考块(188)。在一些实例中,视频译码器可确定当前块的亮度分量的偏移向量,且使用经修改偏移向量来定位色度参考块。
视频译码器可执行图8的技术以作为译码视频数据的当前块的部分。举例来说,视频编码器可通过产生供包含于视频数据的经编码位流中的识别偏移向量的一或多个语法元素来译码视频数据的当前块。举例来说,视频解码器可通过基于第一色彩分量的参考块和第二色彩分量的参考块解码当前块来译码当前块。
在一或多个实例中,所描述的功能可以硬件、软件、固件或其任何组合来实施。如果以软件中实施,那么功能可作为一或多个指令或代码而存储于计算机可读媒体上或经由计算机可读媒体而传输,且由基于硬件的处理单元执行。计算机可读媒体可包含计算机可读存储媒体(其对应于例如数据存储媒体的有形媒体)或通信媒体,通信媒体包含(例如)根据通信协议促进计算机程序从一处传送到另一处的任何媒体。以此方式,计算机可读媒体大体可对应于(1)非暂时性的有形计算机可读存储媒体,或(2)例如信号或载波的通信媒体。数据存储媒体可为可由一或多个计算机或一或多个处理器存取以检索指令、代码和/或数据结构以用于实施本发明中所描述的技术的任何可用媒体。计算机程序产品可包含计算机可读媒体。
通过实例而非限制,这些计算机可读存储媒体可包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储装置、磁盘存储装置或其它磁性存储装、快闪存储器,或可用以存储呈指令或数据结构的形式的所要程序代码且可由计算机存取的任何其它媒体。又,将任何连接适当地称为计算机可读媒体。举例来说,如果使用同轴电缆、光缆、双绞线、数字用户线(DSL)或无线技术(例如,红外线、无线电和微波)而从网站、服务器或其它远程源传输指令,那么同轴电缆、光缆、双绞线、DSL或无线技术(例如,红外线、无线电和微波)包含于媒体的定义中。然而,应理解,计算机可读存储媒体和数据存储媒体不包含连接、载波、信号或其它暂时性媒体,而是有关非暂时性有形存储媒体。如本文中所使用,磁盘和光盘包含压缩光盘(CD)、激光光盘、光学光盘、数字影音光盘(DVD)、软盘和蓝光光盘,其中磁盘通常以磁性方式再生数据,而光盘通过激光以光学方式再生数据。以上各物的组合也应包含于计算机可读媒体的范围内。
可由例如一或多个数字信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、现场可编程逻辑阵列(FPGA)或其它等效集成或离散逻辑电路的一或多个处理器来执行指令。因此,如本文中所使用的术语“处理器”可指上述结构或适于实施本文中所描述的技术的任何其它结构中的任一者。另外,在一些方面中,可将本文中所描述的功能性提供于经配置用于编码和解码的专用硬件和/或软件模块内,或并入于组合式编解码器中。又,所述技术可完全实施于一或多个电路或逻辑元件中。
本发明的技术可以广泛多种装置或设备予以实施,所述装置或设备包含无线手机、集成电路(IC)或IC集合(例如,芯片集)。在本发明中描述各种组件、模块或单元以强调经配置以执行所揭示技术的装置的功能方面,但未必需要由不同硬件单元予以实现。相反地,如上文所描述,可将各种单元组合于编解码器硬件单元中,或由互操作性硬件单元(包含如上文所描述的一或多个处理器)的集合而结合合适软件和/或固件来提供所述单元。
已描述各种实例。这些和其它实例在以下权利要求书的范围内。

Claims (55)

1.一种解码视频数据的方法,所述方法包括:
确定所述视频数据的当前块是使用帧内运动补偿IMC模式编码,其中所述当前块在视频帧中;
确定所述视频数据的所述当前块的第一色彩分量的偏移向量;
在所述视频帧中使用所述偏移向量来定位所述第一色彩分量的参考块;
响应于所述偏移向量指向视频数据的所述当前块的第二色彩分量的子像素位置来修改所述偏移向量以产生经修改偏移向量;
在所述视频帧中使用所述经修改偏移向量来定位所述第二色彩分量的参考块;以及,
基于所述第一色彩分量的所述参考块和所述第二色彩分量的所述参考块来解码所述当前块。
2.根据权利要求1所述的方法,其中所述第一色彩分量包括所述当前块的亮度分量且所述第二色彩分量包括所述当前块的色度分量。
3.根据权利要求1所述的方法,其中所述经修改偏移向量指向整数像素位置。
4.根据权利要求1所述的方法,其中所述经修改偏移向量指向精度低于所述子像素位置的位置的像素位置。
5.根据权利要求1所述的方法,其中所述当前块是使用4:2:0采样格式译码。
6.根据权利要求1所述的方法,其中所述当前块是使用4:2:2采样格式译码。
7.根据权利要求1所述的方法,其中
修改所述偏移向量包括响应于所述偏移向量指向色度样本阵列的子像素位置来修改所述偏移向量以产生指向所述色度样本阵列的整数像素位置的经修改偏移向量。
8.根据权利要求1所述的方法,其中所述偏移向量包括x分量和y分量,且其中所述当前块是使用4:2:2采样格式译码,且其中修改所述偏移向量以产生所述经修改偏移向量包括修改所述x分量。
9.根据权利要求1所述的方法,其中所述偏移向量包括x分量和y分量,且其中所述当前块是使用4:2:0采样格式译码,且其中修改所述偏移向量以产生所述经修改偏移向量包括修改所述y分量。
10.根据权利要求9所述的方法,其中修改所述偏移向量以产生所述经修改偏移向量进一步包括修改所述x分量。
11.一种编码视频数据的方法,所述方法包括:
确定视频数据的当前块将使用帧内运动补偿IMC模式编码;
确定所述视频数据的所述当前块的第一色彩分量的偏移向量;
在所述视频帧中使用所述偏移向量来定位所述第一色彩分量的参考块;
响应于所述偏移向量指向视频数据的所述当前块的第二色彩分量的子像素位置来修改所述偏移向量以产生经修改偏移向量;
在所述视频帧中使用所述经修改偏移向量来定位所述第二色彩分量的参考块;以及,
产生供包含于视频数据的经编码位流中的识别所述偏移向量的一或多个语法元素。
12.根据权利要求11所述的方法,其中所述第一色彩分量包括所述当前块的亮度分量且所述第二色彩分量包括所述当前块的色度分量。
13.根据权利要求11所述的方法,其中所述经修改偏移向量指向整数像素位置。
14.根据权利要求11所述的方法,其中所述经修改偏移向量指向精度低于所述子像素位置的位置的像素位置。
15.根据权利要求11所述的方法,其中所述当前块是使用4:2:0采样格式译码。
16.根据权利要求11所述的方法,其中所述当前块是使用4:2:2采样格式译码。
17.根据权利要求11所述的方法,其中
修改所述偏移向量包括响应于所述偏移向量指向色度样本阵列的子像素位置来修改所述偏移向量以产生指向所述色度样本阵列的整数像素位置的经修改偏移向量。
18.根据权利要求11所述的方法,其中所述偏移向量包括x分量和y分量,且其中所述当前块是使用4:2:2采样格式译码,且其中修改所述偏移向量以产生所述经修改偏移向量包括修改所述偏移向量的所述x分量。
19.根据权利要求11所述的方法,其中所述偏移向量包括x分量和y分量,且其中所述当前块是使用4:2:0采样格式译码,且其中修改所述偏移向量以产生所述经修改偏移向量包括修改所述偏移向量的所述y分量。
20.根据权利要求19所述的方法,其中修改所述偏移向量以产生所述经修改偏移向量进一步包括修改所述偏移向量的所述x分量。
21.一种执行视频译码的设备,所述设备包括:
存储器,其存储视频数据;以及
视频译码器,其包括一或多个处理器,所述一或多个处理器经配置以:
确定所述视频数据的当前块是使用帧内运动补偿IMC模式编码,其中所述当前块在视频帧中;
确定所述视频数据的所述当前块的第一色彩分量的偏移向量;
在所述视频帧中使用所述偏移向量来定位所述第一色彩分量的参考块;
响应于所述偏移向量指向视频数据的所述当前块的第二色彩分量的子像素位置来修改所述偏移向量以产生经修改偏移向量;
在所述视频帧中使用所述经修改偏移向量来定位所述第二色彩分量的参考块;以及,
基于所述第一色彩分量的所述参考块和所述第二色彩分量的所述参考块来译码所述当前块。
22.根据权利要求21所述的设备,其中所述第一色彩分量包括所述当前块的亮度分量且所述第二色彩分量包括所述当前块的色度分量。
23.根据权利要求21所述的设备,其中所述经修改偏移向量指向整数像素位置。
24.根据权利要求21所述的设备,其中所述经修改偏移向量指向精度低于所述子像素位置的位置的像素位置。
25.根据权利要求21所述的设备,其中所述当前块是使用4:2:0采样格式译码。
26.根据权利要求21所述的设备,其中所述当前块是使用4:2:2采样格式译码。
27.根据权利要求21所述的设备,其中所述视频译码器通过响应于所述偏移向量指向色度样本阵列的子像素位置来修改所述偏移向量以产生指向所述色度样本阵列的整数像素位置的经修改偏移向量来修改所述偏移向量。
28.根据权利要求21所述的设备,其中所述偏移向量包括x分量和y分量,且其中所述当前块是使用4:2:2采样格式译码,且其中所述视频译码器通过修改所述x分量来修改所述偏移向量以产生所述经修改偏移向量。
29.根据权利要求21所述的设备,其中所述偏移向量包括x分量和y分量,且其中所述当前块是使用4:2:0采样格式译码,且其中所述视频译码器通过修改所述y分量来修改所述偏移向量以产生所述经修改偏移向量。
30.根据权利要求29所述的设备,其中修改所述偏移向量以产生所述经修改偏移向量进一步包括修改所述x分量。
31.根据权利要求21所述的设备,其中所述视频译码器包括视频解码器,且其中所述视频译码器经进一步配置以通过基于所述第一色彩分量的所述参考块和所述第二色彩分量的所述参考块解码所述当前块来基于所述第一色彩分量的所述参考块和所述第二色彩分量的所述参考块而译码所述当前块。
32.根据权利要求21所述的设备,其中所述视频译码器包括视频编码器,且其中所述视频译码器经进一步配置以通过产生供包含于视频数据的经编码位流中的识别所述偏移向量的一或多个语法元素来基于所述参考块而译码所述当前块。
33.根据权利要求29所述的设备,其中所述设备包括以下各者中的至少一者:
集成电路;
微处理器;以及
无线通信装置。
34.一种执行视频译码的设备,所述设备包括:
用于确定所述视频数据的当前块是使用帧内运动补偿IMC模式编码的装置,其中所述当前块在视频帧中;
用于确定所述视频数据的所述当前块的第一色彩分量的偏移向量的装置;
用于在所述视频帧中使用所述偏移向量来定位所述第一色彩分量的参考块的装置;
用于响应于所述偏移向量指向视频数据的所述当前块的第二色彩分量的子像素位置来修改所述偏移向量以产生经修改偏移向量的装置;
用于在所述视频帧中使用所述经修改偏移向量来定位所述第二色彩分量的参考块的装置;以及,
用于基于所述第一色彩分量的所述参考块和所述第二色彩分量的所述参考块来译码所述当前块的装置。
35.根据权利要求34所述的设备,其中所述第一色彩分量包括所述当前块的亮度分量且所述第二色彩分量包括所述当前块的色度分量。
36.根据权利要求34所述的设备,其中所述经修改偏移向量指向整数像素位置。
37.根据权利要求34所述的设备,其中所述经修改偏移向量指向精度低于所述子像素位置的位置的像素位置。
38.根据权利要求34所述的设备,其中所述当前块是使用4:2:0采样格式译码。
39.根据权利要求34所述的设备,其中所述当前块是使用4:2:2采样格式译码。
40.根据权利要求34所述的设备,其中所述用于修改所述偏移向量的装置包括用于响应于所述偏移向量指向色度样本阵列的子像素位置来修改所述偏移向量以产生指向所述色度样本阵列的整数像素位置的经修改偏移向量的装置。
41.根据权利要求34所述的设备,其中所述偏移向量包括x分量和y分量,且其中所述当前块是使用4:2:2采样格式译码,且其中修改所述偏移向量以产生所述经修改偏移向量包括修改所述x分量。
42.根据权利要求34所述的设备,其中所述偏移向量包括x分量和y分量,且其中所述当前块是使用4:2:0采样格式译码,且其中所述用于修改所述偏移向量以产生所述经修改偏移向量的装置包括用于修改所述y分量的装置。
43.根据权利要求42所述的设备,其中所述用于修改所述偏移向量以产生所述经修改偏移向量的装置进一步包括用于修改所述x分量的装置。
44.根据权利要求34所述的设备,其中所述设备包括视频解码器,且其中所述视频解码器经进一步配置以通过基于所述第一色彩分量的所述参考块和所述第二色彩分量的所述参考块解码所述当前块来基于所述第一色彩分量的所述参考块和所述第二色彩分量的所述参考块而译码所述当前块。
45.根据权利要求34所述的设备,其中所述设备包括视频编码器,且其中所述视频编码器经进一步配置以通过产生供包含于视频数据的经编码位流中的识别所述偏移向量的一或多个语法元素来基于所述参考块而译码所述当前块。
46.一种存储指令的计算机可读媒体,所述指令在由一或多个处理器执行时使所述一或多个处理器:
确定所述视频数据的当前块是使用帧内运动补偿IMC模式编码,其中所述当前块在视频帧中;
确定所述视频数据的所述当前块的第一色彩分量的偏移向量;
在所述视频帧中使用所述偏移向量来定位所述第一色彩分量的参考块;
响应于所述偏移向量指向视频数据的所述当前块的第二色彩分量的子像素位置来修改所述偏移向量以产生经修改偏移向量;
在所述视频帧中使用所述经修改偏移向量来定位所述第二色彩分量的参考块;以及,
基于所述第一色彩分量的所述参考块和所述第二色彩分量的所述参考块来译码所述当前块。
47.根据权利要求46所述的计算机可读存储媒体,其中所述第一色彩分量包括所述当前块的亮度分量且所述第二色彩分量包括所述当前块的色度分量。
48.根据权利要求46所述的计算机可读存储媒体,其中所述经修改偏移向量指向整数像素位置。
49.根据权利要求46所述的计算机可读存储媒体,其中所述经修改偏移向量指向精度低于所述子像素位置的位置的像素位置。
50.根据权利要求46所述的计算机可读存储媒体,其中所述当前块是使用4:2:0采样格式译码。
51.根据权利要求46所述的计算机可读存储媒体,其中所述当前块是使用4:2:2采样格式译码。
52.根据权利要求46所述的计算机可读存储媒体,其中所述一或多个处理器通过响应于所述偏移向量指向色度样本阵列的子像素位置来修改所述偏移向量以产生指向所述色度样本阵列的整数像素位置的经修改偏移向量来修改所述偏移向量。
53.根据权利要求46所述的计算机可读存储媒体,其中所述偏移向量包括x分量和y分量,且其中所述当前块是使用4:2:2采样格式译码,且其中所述一或多个处理器通过修改所述x分量来修改所述偏移向量以产生所述经修改偏移向量。
54.根据权利要求53所述的计算机可读存储媒体,其中所述偏移向量包括x分量和y分量,且其中所述当前块是使用4:2:0采样格式译码,且其中所述一或多个处理器通过修改所述y分量来修改所述偏移向量以产生所述经修改偏移向量。
55.根据权利要求54所述的计算机可读存储媒体,其中所述一或多个处理器通过修改所述x分量来进一步修改所述偏移向量以产生所述经修改偏移向量。
CN201480038532.2A 2013-07-12 2014-07-11 帧内运动补偿延伸 Pending CN105359532A (zh)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201361845832P 2013-07-12 2013-07-12
US61/845,832 2013-07-12
US201361846976P 2013-07-16 2013-07-16
US61/846,976 2013-07-16
US14/328,498 US20150016533A1 (en) 2013-07-12 2014-07-10 Intra motion compensation extensions
US14/328,498 2014-07-10
PCT/US2014/046354 WO2015006692A1 (en) 2013-07-12 2014-07-11 Intra motion compensation extensions

Publications (1)

Publication Number Publication Date
CN105359532A true CN105359532A (zh) 2016-02-24

Family

ID=52277087

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201480038532.2A Pending CN105359532A (zh) 2013-07-12 2014-07-11 帧内运动补偿延伸

Country Status (8)

Country Link
US (1) US20150016533A1 (zh)
EP (1) EP3020194A1 (zh)
JP (1) JP2016527789A (zh)
KR (1) KR20160031496A (zh)
CN (1) CN105359532A (zh)
CA (1) CA2913804A1 (zh)
TW (1) TW201517599A (zh)
WO (1) WO2015006692A1 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109691106A (zh) * 2016-09-16 2019-04-26 高通股份有限公司 时间运动向量预测符的偏移向量识别
CN113196777A (zh) * 2018-12-17 2021-07-30 北京字节跳动网络技术有限公司 用于运动补偿的参考像素填充
CN113785588A (zh) * 2019-04-12 2021-12-10 北京字节跳动网络技术有限公司 基于矩阵的帧内预测的色度编解码模式确定
CN114342385A (zh) * 2019-09-18 2022-04-12 高通股份有限公司 基于缩放比率和色度采样类型的色度的子像素运动向量校正
US11943444B2 (en) 2019-05-31 2024-03-26 Beijing Bytedance Network Technology Co., Ltd. Restricted upsampling process in matrix-based intra prediction

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10015515B2 (en) 2013-06-21 2018-07-03 Qualcomm Incorporated Intra prediction from a predictive block
CA2925183C (en) 2013-10-14 2020-03-10 Microsoft Technology Licensing, Llc Features of base color index map mode for video and image coding and decoding
EP3058736B1 (en) 2013-10-14 2019-02-27 Microsoft Technology Licensing, LLC Encoder-side options for intra block copy prediction mode for video and image coding
KR102257269B1 (ko) 2013-10-14 2021-05-26 마이크로소프트 테크놀로지 라이센싱, 엘엘씨 비디오 및 이미지 코딩 및 디코딩을 위한 인트라 블록 카피 예측 모드의 피쳐
JP6355744B2 (ja) 2014-01-03 2018-07-11 マイクロソフト テクノロジー ライセンシング,エルエルシー ビデオ及び画像符号化/デコーディングにおけるブロックベクトル予測
US9883197B2 (en) 2014-01-09 2018-01-30 Qualcomm Incorporated Intra prediction of chroma blocks using the same vector
US11284103B2 (en) 2014-01-17 2022-03-22 Microsoft Technology Licensing, Llc Intra block copy prediction with asymmetric partitions and encoder-side search patterns, search ranges and approaches to partitioning
US10542274B2 (en) 2014-02-21 2020-01-21 Microsoft Technology Licensing, Llc Dictionary encoding and decoding of screen content
US10432928B2 (en) 2014-03-21 2019-10-01 Qualcomm Incorporated Using a current picture as a reference for video coding
EP3158734A4 (en) 2014-06-19 2017-04-26 Microsoft Technology Licensing, LLC Unified intra block copy and inter prediction modes
CN105392008B (zh) * 2014-08-22 2018-09-25 中兴通讯股份有限公司 一种预测编、解码方法和相应的编、解码器和电子设备
CA2959682C (en) * 2014-09-30 2022-12-06 Microsoft Technology Licensing, Llc Rules for intra-picture prediction modes when wavefront parallel processing is enabled
KR102390073B1 (ko) * 2015-06-08 2022-04-25 브이아이디 스케일, 인크. 스크린 콘텐츠 코딩을 위한 인트라 블록 카피 모드
WO2016197314A1 (en) 2015-06-09 2016-12-15 Microsoft Technology Licensing, Llc Robust encoding/decoding of escape-coded pixels in palette mode
US10404992B2 (en) * 2015-07-27 2019-09-03 Qualcomm Incorporated Methods and systems of restricting bi-prediction in video coding
US10805635B1 (en) * 2016-03-22 2020-10-13 NGCodec Inc. Apparatus and method for coding tree unit bit size limit management
EP3301915A1 (en) * 2016-09-30 2018-04-04 Thomson Licensing Method and apparatus for omnidirectional video coding with adaptive intra most probable modes
US10897617B2 (en) * 2018-07-24 2021-01-19 Qualcomm Incorporated Rounding of motion vectors for adaptive motion vector difference resolution and increased motion vector storage precision in video coding
US11265579B2 (en) * 2018-08-01 2022-03-01 Comcast Cable Communications, Llc Systems, methods, and apparatuses for video processing

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120170650A1 (en) * 2011-01-05 2012-07-05 Qualcomm Incorporated Low complexity interpolation filtering with adaptive tap size

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120170650A1 (en) * 2011-01-05 2012-07-05 Qualcomm Incorporated Low complexity interpolation filtering with adaptive tap size

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
G. BJONTEGAARD ET.AL: "Simplified chroma interpolation", 《VIDEO CODING EXPERTS GROUP OF ITU-T SG.16》 *
ITU-T RECOMMENDATION H.261: "H.261,Video Codec for Audiovisual Services at p x 64 kbit/s", 《H.261,VIDEO CODEC FOR AUDIOVISUAL SERVICES AT P X 64 KBIT/S》 *
YU ET.AL: "New Intra Prediction using Intra-Macroblock Motion Compensation", 《JOINT VIDEO TEAM OF ISO/IEC JTC1/SC29/WG11 AND ITU-T SG.16》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109691106A (zh) * 2016-09-16 2019-04-26 高通股份有限公司 时间运动向量预测符的偏移向量识别
CN109691106B (zh) * 2016-09-16 2023-07-14 高通股份有限公司 一种对视频数据进行编解码的方法、装置及计算机可读存储介质
CN113196777A (zh) * 2018-12-17 2021-07-30 北京字节跳动网络技术有限公司 用于运动补偿的参考像素填充
CN113196777B (zh) * 2018-12-17 2024-04-19 北京字节跳动网络技术有限公司 用于运动补偿的参考像素填充
CN113785588A (zh) * 2019-04-12 2021-12-10 北京字节跳动网络技术有限公司 基于矩阵的帧内预测的色度编解码模式确定
CN113785588B (zh) * 2019-04-12 2023-11-24 北京字节跳动网络技术有限公司 基于矩阵的帧内预测的色度编解码模式确定
US11831877B2 (en) 2019-04-12 2023-11-28 Beijing Bytedance Network Technology Co., Ltd Calculation in matrix-based intra prediction
US11943444B2 (en) 2019-05-31 2024-03-26 Beijing Bytedance Network Technology Co., Ltd. Restricted upsampling process in matrix-based intra prediction
CN114342385A (zh) * 2019-09-18 2022-04-12 高通股份有限公司 基于缩放比率和色度采样类型的色度的子像素运动向量校正

Also Published As

Publication number Publication date
US20150016533A1 (en) 2015-01-15
TW201517599A (zh) 2015-05-01
EP3020194A1 (en) 2016-05-18
KR20160031496A (ko) 2016-03-22
CA2913804A1 (en) 2015-01-15
JP2016527789A (ja) 2016-09-08
WO2015006692A1 (en) 2015-01-15

Similar Documents

Publication Publication Date Title
CN105359532A (zh) 帧内运动补偿延伸
CN106797477B (zh) 用于解码及编码视频数据的方法和设备
CN103141100B (zh) 用于视频译码的帧内平滑滤波器
CN103190147B (zh) 用于视频译码的语法元素的联合译码方法及设备
CN104041029B (zh) 确定在视频译码中用于译码变换系数数据的上下文
TW201717624A (zh) 幀內預測及幀內模式寫碼
CN107660341A (zh) 切片级帧内块复制及其它视频译码改进
TW201717632A (zh) 幀內預測及幀內模式寫碼
CN106664425A (zh) 视频译码中的跨分量预测
CN104737537A (zh) 用于可缩放视频译码的加权预测模式
TW201717623A (zh) 幀內預測及幀內模式寫碼
CN104509113A (zh) 视频压缩中的变换跳过模式
TW202115977A (zh) 用於視訊編碼的跨分量自我調整迴路濾波
CN104137546A (zh) 用信号发送用于视频译码的量化矩阵
CN104221381A (zh) 用于视频译码的波前并行处理
CN103563378A (zh) 存储器高效的上下文建模
CN104221380A (zh) 用于并行运动估计的共同空间候选块
CN105723707A (zh) 用于视频译码的色彩残差预测
CN104704833A (zh) 多视图或3维视频译码中的高级视图间残差预测
CN103959785A (zh) 在视频译码中用于色度分量的变换单位分割
CN103959775A (zh) 帧内模式视频译码
CN106105204A (zh) 在颜色空间变换译码中修改位深度
CN105379266A (zh) 停用帧内预测滤波
CN103339939A (zh) 具有自适应分接头大小的低复杂性内插滤波
CN104718752A (zh) 在可缩放视频译码中减少取样相位信息的发信

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20160224