CN105874797A - 从预测性块的帧内预测 - Google Patents

从预测性块的帧内预测 Download PDF

Info

Publication number
CN105874797A
CN105874797A CN201580003703.2A CN201580003703A CN105874797A CN 105874797 A CN105874797 A CN 105874797A CN 201580003703 A CN201580003703 A CN 201580003703A CN 105874797 A CN105874797 A CN 105874797A
Authority
CN
China
Prior art keywords
block
vector
reference block
decoding unit
video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201580003703.2A
Other languages
English (en)
Other versions
CN105874797B (zh
Inventor
陈颖
庞超
张莉
霍埃尔·索莱·罗哈斯
马尔塔·卡切维奇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of CN105874797A publication Critical patent/CN105874797A/zh
Application granted granted Critical
Publication of CN105874797B publication Critical patent/CN105874797B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/154Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

一种用于译码视频数据的装置,所述装置包括:存储器,其经配置以存储视频数据;以及视频译码器,其包括一或多个处理器,所述处理器经配置以:确定使用块副本内模式来译码的所述视频数据的图片的译码单元;为所述译码单元的第一色度块确定向量;使用所述向量来定位第一色度参考块,其中所述第一色度参考块在所述图片中;基于所述第一色度参考块来预测所述第一色度块;使用所述向量来定位第二色度参考块,其中所述第二色度参考块在所述图片中;以及基于所述第二色度参考块来预测所述译码单元的第二色度块。

Description

从预测性块的帧内预测
本申请案主张以下美国临时申请案中的每一者的权益,其中的每一者的整个内容以引用的方式并入本文中:
2014年1月9日申请的第61/925,647号美国临时申请案;
2014年1月10日申请的第61/926,224号美国临时申请案。
技术领域
本发明涉及视频译码,并且更确切地说,涉及视频块的基于其它视频块的预测。
背景技术
数字视频能力可并入到多种多样的装置中,包含数字电视、数字直播系统、无线广播系统、个人数字助理(PDA)、膝上型或桌上型计算机、平板计算机、电子书阅读器、数码相机、数字记录装置、数字媒体播放器、视频游戏装置、视频游戏控制台、蜂窝式或卫星无线电电话(所谓的“智能电话”)、视频电话会议装置、视频串流装置等。数字视频装置实施视频压缩技术,例如在由MPEG-2、MPEG-4、ITU-T H.263、ITU-TH.264/MPEG-4第10部分高级视频译码(AVC)定义的标准、目前正在开发的高效率视频译码(HEVC)标准以及此类标准的扩展中所描述的视频压缩技术。视频装置可通过实施此类视频压缩技术来更有效率地发射、接收、编码、解码和/或存储数字视频信息。
视频压缩技术执行空间(图片内)预测和/或时间(图片间)预测来减少或去除视频序列中固有的冗余。对于基于块的视频译码来说,视频切片(即,视频帧或视频帧的一部分)可分割成视频块,视频块也可称作树块、译码单元(CU)和/或译码节点。使用关于同一图片中的相邻块中的参考样本的空间预测来编码图片的经帧内译码(I)切片中的视频块。图片的经帧间译码(P或B)切片中的视频块可使用相对于同一图片中的相邻块中的参考样本的空间预测或相对于其它参考图片中的参考样本的时间预测。图片可被称作帧,且参考图片可被称作参考帧。
空间或时间预测导致待译码块的预测性块。残差数据表示待译码原始块与预测性块之间的像素差。经帧间译码块是根据指向形成预测性块的参考样本块的运动向量和指示经译码块与预测性块之间的差的残差数据而编码的。根据帧内译码模式和残差数据来编码经帧内译码块。为了进一步压缩,可将残差数据从像素域变换到变换域,从而产生残差变换系数,可接着量化所述残差变换系数。可扫描一开始按二维阵列排列的经量化变换系数,以便产生变换系数的一维向量,且可应用熵译码以实现更多压缩。
发明内容
一般来说,本发明描述用于对包含用于从同一图片内的视频数据的预测性块对视频数据块进行帧内预测的模式的视频数据进行译码的技术,可被称为IntraBC或IntraMC模式。
在一实例中,一种解码视频数据的方法包含:确定使用块副本内模式来译码视频数据的图片的译码单元;从与所述译码单元相关联的多个向量确定用于所述译码单元的第一色度块的向量;使用所述向量来定位第一色度参考块,其中所述第一色度参考块位于所述图片中;基于所述第一色度参考块预测所述第一色度块;使用所述向量来定位第二色度参考块,其中所述第二色度参考块位于所述图片中;以及基于所述第二色度参考块预测所述译码单元的第二色度块。
在另一实例中,一种编码视频数据的方法包含:从与译码单元相关联的多个向量确定用于图片的译码单元的第一色度块的向量;使用所述向量定位第一色度参考块,其中所述第一色度参考块位于所述图片中;基于所述第一色度参考块预测所述第一色度块;使用所述向量来定位第二色度参考块,其中所述第二色度参考块位于所述图片中;基于所述第二色度参考块预测所述译码单元的第二色度块;以及产生使用块副本内模式来译码所述图片的译码单元的指示以及用于所述译码单元的每一明度块的向量的指示,以用于包含在所述经编码视频数据中。
在另一实例中,一种用于译码视频数据的设备包含:用于从与译码单元相关联的多个向量确定使用块副本内模式来译码所述视频数据的图片的译码单元的装置;用于确定用于所述译码单元的第一色度块的向量的装置;用于使用所述向量来定位第一色度参考块的装置,其中所述第一色度参考块位于所述图片中;用于基于所述第一色度参考块预测所述第一色度块的装置;用于使用所述向量来定位第二色度参考块的装置,其中所述第二色度参考块位于所述图片中;以及用于基于所述第二色度参考块预测所述译码单元的第二色度块的装置。
一种用于译码视频数据的装置,所述装置包括:存储器,其经配置以存储视频数据;以及视频译码器,其包括一或多个处理器,所述处理器经配置以:从与译码单元相关联的多个向量确定使用块副本内模式来译码视频数据的图片的译码单元;确定用于译码单元的第一色度块的向量;使用所述向量来定位第一色度参考块,其中所述第一色度参考块位于所述图片中;基于所述第一色度参考块预测第一色度块;使用所述向量来定位第二色度参考块,其中所述第二色度参考块位于所述图片中;以及基于所述第二色度参考块来预测所述译码单元的第二色度块。
在另一实例中,一种存储指令的计算机可读存储媒体,所述指令在由一个或一个以上处理器执行时,致使所述一或多个处理器:从与译码单元相关联的多个向量确定使用块副本内模式来译码所述视频数据的图片的译码单元;确定用于所述译码单元的第一色度块的向量;使用所述向量来定位第一色度参考块,其中所述第一色度参考块位于所述图片中;基于所述第一色度参考块预测所述第一色度块;使用所述向量来定位第二色度参考块,其中所述第二色度参考块位于所述图片中;以及基于所述第二色度参考块预测所述译码单元的第二色度块。
附图及以下描述中陈述一或多个实例的细节。其它特征、目标和优点将从所述描述和图式以及权利要求书而显而易见。
附图说明
图1是说明可利用本发明中描述的技术的实例视频编码和解码系统的框图。
图2是说明根据本发明的技术用于预测当前图片内的当前视频数据块的当前图片内的实例预测性视频数据块的概念图。
图3是说明用于定义可从其选择预测性视频数据块的既定区的实例技术的概念图。
图4是当前视频数据块以及可从其导出当前视频数据块的候选预测性向量的相邻视频数据块的实例的概念图。
图5A展示合并模式的空间相邻运动向量候选者的实例。
图5B展示高级运动向量预测(AMVP)模式的空间相邻运动向量候选者的实例。
图6是说明可实施本发明中描述的技术的实例视频编码器的框图。
图7是说明可实施本发明中描述的技术的实例视频解码器的框图。
图8是说明根据本发明的技术的用于编码视频数据的实例方法的流程图。
图9是说明根据本发明的技术的用于解码视频数据的实例方法的流程图。
具体实施方式
视频序列一般表示为图片序列。通常,使用基于块的译码技术来译码个别图片中的每一者。也就是说,将每一图片划分成块,且个别地译码所述块中的每一者。译码视频数据块一般涉及形成块的预测值及译码残差值,也就是说,原始块与预测值之间的差。具体来说,原始视频数据块包含像素值矩阵,且预测值包含经预测像素值矩阵。残差值对应于原始块的像素值与经预测像素值之间的逐像素差。
用于视频数据块的预测技术一般分类为帧内预测或帧间预测。帧内预测或空间预测大体上涉及从作为经先前译码块的部分的相邻像素值预测块。帧间预测或时间预测大体上涉及从经先前译码图片(例如,帧或切片)的像素值预测块。
许多应用(例如远程桌面、远程游戏、无线显示器、车用信息娱乐、云计算等)在日常生活中正变得常规。这些应用中的视频内容通常是自然内容、文本、人工图形和其它内容的组合。在文本和人工图形区中,常常存在重复模式(例如字符、图标、符号或类似物)。
从同一图片内的预测性视频数据块对视频数据块的帧内预测可被称为块副本内(IntraBC)或帧内运动补偿(IntraMC),是可使视频译码器能够移除此冗余且改善帧内译码效率的技术。在一些视频译码技术中,视频译码器可使用直接在上方或下方或者直接与同一图片中的当前视频数据块水平地成一条线的先前经重构视频数据块用于当前视频块的预测。换句话说,如果将图片或视频数据帧强加于2-D栅格,那么每一视频数据块将占据x值和y值的唯一范围。因此,一些视频译码器可基于同一图片中共享同一组x值(即,与当前视频块垂直地成一条线)或同一组y值(即,与当前视频块水平地成一条线)的经先前译码的视频数据块而预测当前视频数据块。
视频译码器从同一帧(即,同一图片)内不一定直接在当前视频数据块上方或左边(或直接在右边或下方)的先前经重构视频数据块预测当前视频块可为有利的。通过在预测性集合中包含更多视频块,视频译码器可实现当前视频块的较准确预测,进而增加译码效率。
一般来说,本发明描述用于对包含用于从同一图片内的预测性视频数据块对视频数据块的帧内预测的模式的视频数据进行译码技术,可被称为IntraBC或IntraMC模式。本发明的IntraBC或IntraMC技术可包含识别当前视频数据块的预测性视频数据块。举例来说,所述预测性视频数据块可对应于与所述当前视频数据块相同的图片内的经重构视频数据块。所述预测性视频数据块可来自图片内的既定区内,例如当前视频数据块的上方、右上方、左上方和/或左边的区。所述预测性视频数据块不限于在当前视频块正上方或正左方,且因此用以相对于所述当前块识别所述预测块得向量不一定是一维向量。实际上,为了识别或确定预测性视频数据块,视频译码器可对定义包含相对于当前视频数据块的水平位移分量和垂直位移分量的二维向量的一或多个语法元素进行译码。所述二维向量可被称为块向量、偏移向量或运动向量,且可例如用以相对于所述当前块的左上方隅角识别预测性块。
如下文将更详细地解释,被称作译码单元的视频数据块可包含多个预测单元。可分别预测每一预测单元。因此,对于每一预测单元,可在位流中发信号通知块向量,且视频解码器可使用块向量来预测所述预测单元的明度分量和所述预测单元的两个色度分量。取决于视频数据的色度子取样格式,视频解码器可按比例缩放块向量,以便预测所述预测单元的两个色度分量。不会重复用于预测色度分量的块向量的按比例缩放多次,以辅助可读性。应理解,当预测色度分量时,可发生用于预测色度分量的块向量的此按比例缩放,但在预测色度分量的每个例子中,块向量的此按比例缩放可能是不必要的。
根据现有技术,可使用不同块向量来识别译码单元的每一预测单元的参考块。举例来说,译码单元的第一预测单元的第一块向量可用以识别第一预测单元的明度分量的明度参考块(即,明度样本的预测块),且用以识别第一预测单元的两个色度分量的色度参考块(即,色度样本的两个对应色度块)。译码单元的第二预测单元的第二块向量可用于识别第二预测单元的明度分量的明度参考块(即,明度样本的预测块),且用以识别第二预测单元的两个色度分量的色度参考块(即色度样本的两个对应色度块),等等。
然而,根据本发明的技术,可使用不同块向量来预测译码单元的预测单元的明度分量,而可使用同一块向量来预测译码单元的预测单元的两个或两个以上色度分量。举例来说,如上,译码单元的第一预测单元的第一块向量可用于识别第一预测单元的明度分量的明度参考块(即,明度样本的预测块),妾用以识别第一预测单元的两个色度分量的色度参考块(即,色度样本的两个对应色度块)。然而,对于第二预测单元的两个色度分量,并非使用所述第二块向量(如在以上实例中),而是使用同一第一块向量来识别色度参考块。所述第二块向量可仍用以识别第二预测单元的明度分量的明度参考块。
更具体地说,本发明描述用以用在图片或切片内预测的块来支持块的译码的技术。所提出的技术可例如结合新兴的HEVC范围扩展(RCEx)使用,其可支持高位深度(例如超过8位)和高色度取样格式(例如,包含4:4:4和4:2:2)。本发明的技术还可应用于屏幕内容译码。
如本文所使用,术语“视频译码器”一般是指视频编码器和视频解码器两者。在本发明中,术语“视频译码”或“译码”可一般地指代视频编码或视频解码。因此,除非另外说明,否则应假定,参考译码所描述的技术可由视频编码器或视频解码器执行。在本申请案的一些部分中,可参考视频解码或参考视频解码器来描述某些技术。然而,不应假定此类技术不适用于视频编码或不可由视频编码器执行。举例来说,此类技术可作为确定如何编码视频数据的一部分而执行,或可作为视频编码器中的视频解码环的一部分而执行。
如本发明中所使用,术语当前块是指当前正译码的块,与已经译码或尚未译码的块相反。类似地,当前译码单元、预测单元或变换单元是指当前正译码的译码单元、预测单元或变换单元。
图1是说明可实施本文所描述的技术中的一或多者的实例视频编码和解码系统的框图。如图1中所展示系统10包含源装置12,其提供将由目的地装置14解码的经编码视频数据。明确地说,源装置12经由计算机可读媒体16将视频数据提供到目的地装置14。源装置12和目的地装置14可包括多种多样的装置中的任一者,包含桌上型计算机、笔记型(即,膝上型)计算机、平板计算机、机顶盒、电话手持机(例如所谓的“智能”电话)、所谓的“智能”平板计算机、电视机、相机、显示装置、数字媒体播放器、视频游戏控制台、视频流式传输装置等。在一些情况下,可装备源装置12和目的地装置14以用于无线通信。
目的地装置14可经由计算机可读媒体16接收待解码的经编码视频数据。计算机可读媒体16可包括能够将经编码的视频数据从源装置12移动到目的地装置14的任一类型的媒体或装置。在一个实例中,计算机可读媒体16可包括通信媒体以使源装置12能够实时地将经编码的视频数据直接发射到目的地装置14。可根据通信标准(例如,无线通信协议)来调制经编码的视频数据,并将其发射到目的地装置14。通信媒体可包括任何无线或有线通信媒体,例如射频(RF)频谱或一或多个物理传输线。通信媒体可形成基于分组的网络(例如,局域网、广域网或全球网络,例如因特网)的部分。通信媒体可包含路由器、交换器、基站或任何其它可用于促进从源装置12到目的地装置14的通信的设备。
在一些实例中,计算机可读媒体16可包括存储装置,且源装置可经由输出接口22将经编码视频数据输出到存储装置。类似地,可通过输入接口28从存储装置存取经编码数据。所述存储装置可包含多种分散式或本地存取式数据存储媒体中的任一者,例如用于存储经编码视频数据的硬盘驱动器、蓝光光盘、DVD、CD-ROM、快闪存储器、易失性或非易失性存储器,或任何其它合适的数字存储媒体。举例来说,媒体生产设施(例如光盘冲压设施)的计算装置可从源装置12接收经编码视频数据,且生产含有所述经编码视频数据的光盘。因此,在各种实例中,计算机可读媒体16可理解为包含各种形式的一或多个计算机可读媒体。在另一实例中,存储装置可对应于可存储由源装置12产生的经编码视频的文件服务器或另一中间存储装置。目的地装置14可经由流式传输或下载从存储装置存取所存储的视频数据。文件服务器可为能够存储经编码视频数据且将经编码视频数据发射到目的地装置14的任何类型的服务器。实例文件服务器包含网络服务器(例如,用于网站)、FTP服务器、网络附接式存储(NAS)装置或本地磁盘驱动器。目的地装置14可以通过任何标准数据连接(包含因特网连接)来存取经编码视频数据。这可包含无线信道(例如,Wi-Fi连接)、有线连接(例如,DSL、电缆调制解调器等),或适合于存取存储在文件服务器上的经编码视频数据的两者的组合。经编码视频数据从存储装置的发射可能是流式传输发射、下载发射或其组合。
本发明的技术未必限于无线应用或设定。所述技术可应用于视频译码以支持多种多媒体应用中的任一者,例如空中协议电视广播、有线电视发射、卫星电视发射、因特网流式视频发射(例如,经由HTTP的动态自适应流式传输(DASH))、经编码到数据存储媒体上的数字视频、存储在数据存储媒体上的数字视频的解码或其它应用。在一些实例中,系统10可经配置以支持单向或双向视频传输,以支持例如视频流式传输、视频重放、视频广播和/或视频电话等应用。
图1仅为实例,且本发明的技术可适用于未必包含编码装置与解码装置之间的任何数据通信的视频译码设定(例如,视频编码或视频解码)。在其它实例中,可从本地存储器检索数据、在网络上流式传输数据,等等。视频编码装置可对数据进行编码并且将数据存储到存储器,和/或视频解码装置可从存储器检索数据并且对所述数据进行解码。在许多实例中,由并不彼此通信而是仅将数据编码到存储器和/或从存储器检索数据且解码所述数据的装置执行编码和解码。
在图1的实例中,源装置12包含视频源18、视频编码器20和输出接口22。目的地装置14包含输入接口28、视频解码器30和显示装置32。在其它实例中,源装置和目的地装置可包含其它组件或布置。举例来说,源装置12可从外部视频源18(例如外部相机)接收视频数据。同样,目的地装置14可与外部显示装置32介接,而不是包含集成显示装置32。
图1的所说明的系统10只是一个实例。任何数字视频编码和/或解码装置可执行本文所描述的技术。尽管本发明的技术一般通过视频编码装置来执行,但所述技术还可通过视频编码器/解码器(通常被称作“编码解码器”)来执行。此外,本发明的技术还可由视频预处理器执行。源装置12和目的地装置14仅为源装置12产生经译码视频数据用于发射到目的地装置14的此类译码装置的实例。在一些实例中,装置12、14可以实质上对称的方式操作,使得装置12、14中的每一者包含视频编码和解码组件。因此,系统10可支持视频装置12、14之间的单向或双向视频传输以例如用于视频流式传输、视频重放、视频广播或视频电话。
源装置12的视频源18可包含视频捕获装置,例如摄像机、含有先前所捕获视频的视频存档和/或用于从视频内容提供者接收视频的视频馈送接口。作为另一替代方案,视频源18可产生基于计算机图形的数据作为源视频,或直播视频、存档视频与计算机产生的视频的组合。在一些情况下,如果视频源18是摄像机,那么源装置12和目的地装置14可形成所谓的摄像机电话或视频电话。然而,如上文所提到,本发明中所描述的技术可大体上适用于视频译码,且可应用于无线和/或有线应用。在每一情况下,可由视频编码器20编码所捕获、经预先捕获或计算机产生的视频。经编码视频信息可接着通过输出接口22输出到计算机可读媒体16上。在一些实例中,输出接口22可包含调制器/解调器(调制解调器)和/或发射器。
目的地装置14的输入接口28从计算机可读媒体16接收信息。在一些实例中,输入接口28包含接收器和/或调制解调器。计算机可读媒体16的信息可包含经编码视频位流,其可包含经编码视频数据和由视频编码器20界定的其它语法信息,所述语法信息由视频解码器30使用且描述块和例如切片、图片、图片群组(GOP)或视频数据等其它经译码单元的特性和/或处理。显示装置32将经解码视频数据显示给用户,且可包括多种显示装置中的任一者,例如阴极射线管(CRT)、液晶显示器(LCD)、等离子显示器、有机发光二极管(OLED)显示器或另一类型的显示装置。
视频编码器20和视频解码器30各自可实施为多种合适的编码器电路中的任一者,例如一个或一个以上微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑、软件、硬件、固件或其任何组合。当部分地用软件实施所述技术时,装置可将用于软件的指令存储在合适的非暂时性计算机可读媒体中且在硬件中使用一或多个处理器执行所述指令以执行本发明的技术。视频编码器20和视频解码器30中的每一者可包含在一或多个编码器或解码器中,所述编码器或解码器中的任一者可集成为相应装置中的组合式编码器/解码器(CODEC)的部分。尽管图1中未图示,但在一些方面中,视频编码器20和视频解码器30可各自与音频编码器和解码器集成,且可包含适当的多路复用器-多路分用器单元或其它硬件和软件,以处置共同数据流或单独数据流中的音频和视频两者的编码。如果适用,那么多路复用器-多路分用器单元可符合ITU H.223多路复用器协议,或例如用户数据报协议(UDP)等其它协议。
本发明通常可指视频编码器20将某些信息“发信号通知”到另一装置,例如视频解码器30。术语“发信号通知”通常可指用于解码经压缩视频数据的语法元素和/或其它数据的传送。此传送可实时或几乎实时发生。或者,可在一时间跨度内发生此通信,例如当在编码时,以经编码位流将语法元素存储到计算机可读存储媒体时,可发生此通信,接着在存储到此媒体之后可由解码装置在任何时间检索所述语法元素。
出于说明的目的,在本发明中将视频编码器20和视频解码器30描述为经配置以根据一或多个视频译码标准来操作。然而,本发明的技术不一定限于任何特定译码标准,且可应用于多种不同译码标准。
视频编码器20和视频解码器30可根据例如当前在开发的高效视频译码(HEVC)标准等视频译码标准(包含任何扩展、修改或添加)而操作,且可符合HEVC测试模型(HM)。或者,视频编码器20和视频解码器30可根据其它专属或行业标准来操作,所述标准例如ITU-T H.264标准,替代地被称为MPEG-4第10部分高级视频译码(AVC),或这些标准的扩展。然而,本发明的技术不限于任何特定译码标准。视频译码标准的其它实例包含MPEG-2和ITU-T H.263。
其它专有或行业标准的实例包含ITU-T H.261、ISO/IEC MPEG-1 Visual、ITU-TH.262或ISO/IEC MPEG-2 Visual、ITU-T H.263、ISO/IEC MPEG-4 Visual及ITU-TH.264(也被称作ISO/IEC MPEG-4 AVC),所述标准包含其可缩放视频译码(SVC)及多视图视频译码(MVC)扩展,或此些标准的扩展、修改或添加。此外,正在致力于产生H.264/AVC的三维视频(3DV)译码扩展,即基于AVC的3DV。换句话说,实例视频译码标准包含ITU-T H.261、ISO/IEC MPEG-1视觉、ITU-T H.262或ISO/IEC MPEG-2视觉、ITU-T H.263、ISO/IEC MPEG-4视觉和ITU-T H.264(也称为ISO/IEC MPEG-4 AVC),包含其可缩放视频译码(SVC)和多视图视频译码(MVC)扩展。ITU-T研究组在2005年3月在ITU-T推荐H.264“用于通用音视频服务的高级视频译码(Advanced Video Coding forgeneric audiovisual services)”中描述了H.264标准,其在本文中可被称作H.264标准或H.264规范或H.264/AVC标准或规范。联合视频小组(JVT)继续致力于对H.264/MPEG-4AVC的扩展。MVC的最近联合草案描述于“用于通用视听服务的高级视频译码(Advancedvideo coding for generic audiovisual services)”(ITU-T推荐H.264,2010年3月)中。
此外,存在一种新的视频译码标准,即高效率视频译码(HEVC),其由ITU-T视频译码专家组(VCEG)及ISO/IEC动画专家组(MPEG)的视频译码联合合作小组(JCT-VC)进行开发。在图1的实例中,视频编码器20和视频解码器30可根据HEVC操作。布洛斯等人的“高效率视频译码(HEVC)文本规范草案10(用于FDIS和最后呼叫)(High EfficiencyVideo Coding(HEVC)text specification draft 10(for FDIS&Last Call))”(ITU-T SG 16 WP3和ISO/IEC JTC1/SC 29/WG 11的视频译码联合合作小组(JCT-VC)第12次会议,瑞士日内瓦,2013年1月14-23日,文献JCTVC-L1003_v34)是HEVC的最近草案,其从2013年10月17日起从http://phenix.int-evry.fr/jct/doc_end_user/documents/12_Geneva/wg11/JCTVC-L1003-v34.zip可用(下文为“JCTVC-L1003-v34”),其整个内容以引用的方式并入本文。JCTVC-L1003-v34中定义的HEVC的版本可被称为HEVC版本1或“HEVC v1”。McCann等人的“高效视频译码(HEVC)测试模型12(HM 12)编码器描述”,文献JCTVC-N1002,可从以下地址获得:http://phenix.int-evry.fr/jct/doc_end_user/current_document.php?id=8143,其整个内容以引用的方式并入,是HEVC的最新编码器描述。
支持3D服务的HEVC的两个扩展已经在由ITU-T视频编码专家组(VCEG)和ISO/IEC运动图片专家组(MPEG)的3D视频译码联合合作小组(JCT-3V)开发。所述两个扩展分别名为MV-HEVC和3D-HEVC。在图1的实例中,视频编码器20和视频解码器30可根据MV-HEVC和/或3D-HEVC操作。
MV-HEVC支持多个(纹理)视图的译码而无需改变块层级设计。泰克等人的“MV-HEVC草案文本5(MV-HEVC Draft Text 5)”(ITU-T SG 16 WP 3和ISO/IEC JTC1/SC29/WG 11的3D视频译码扩展开发的联合合作小组,文献编号JCT3V-E1004-v6)是MV-HEVC的最近草案,其从http://phenix.it-sudparis.eu/jct2/doc_end_user/documents/5_Vienna/wg11/JCT3V-E1004-v6.zip可用,其整个内容以引用的方式并入本文。
3D-HEVC对多视图视频加深度格式进行译码,且包含除了HEVC译码模块外还建构的新译码工具。新引入的译码工具适用于纹理译码和深度译码两者。泰克等人的“3D-JEVC草案文本1(3D-JEVC Draft Text 1)”(ITU-T SG 16 WP 3和ISO/IEC JTC1/SC29/WG 11的3D视频译码扩展开发的联合合作小组,第5次会议,奥地利维也纳,2013年7月27日到8月2日,文献编号JCT3V-E1001-v3)是3D-HEVC的最近草案,其从http://phenix.it-sudparis.eu/jct2/doc_end_user/documents/5_Vienna/wg11/JCT3V-E1001-v3.zip可用,其整个内容以引用的方式并入本文。用于3D-HEVC的最近软件3D-HTM可从以下链接下载:[3D-HTM版本8.0]:https://hevc.hhi.fraunhofer.de/svn/svn_3DVCSoftware/tags/HTM-8.0/。最近软件描述,张等人的“3D-HEVC测试模型5(3D-HEVC Test Model 5)”(ITU-T SG 16 WP 3和ISO/IEC JTC1/SC 29/WG 11的3D视频译码扩展开发联合合作小组第5次会议,奥地利维也纳,2013年7月27日到8月2日,文献编号JCT3V-E1005,其整个内容以引用的方式并入本文)从http://phenix.it-sudparis.eu/jct2/doc_end_user/current_document.php?id=1360可用。
HEVC标准的额外开发和扩展包含HEVC范围扩展。HEVC范围扩展的实例在弗林(Flynn)等人的“高效视频译码(HEVC)范围扩展文本规范:草案4(High Efficiency VideoCoding(HEVC)Range Extensions text specification:Draft 4)”(ITU-T SG 16 WP 3和ISO/IEC JTC1/SC 29/WG 11的视频译码联合合作小组(JCT-VC),文献JCTVC-N1005_v3,第13次会议,韩国仁川,2013年4月18到26日)中描述,其以全文引用的方式并入本文中且在http://phenix.int-evry.fr/jct/doc_end_user/current_document.php?id=8139可用。
HEVC标准的额外开发和扩展包含屏幕内容译码(SCC)扩展。
在HEVC和其它视频译码规范中,视频序列通常包含一系列图片。图片也可被称作“帧”。图片可包含三个样本阵列,表示为SL、SCb以及SCr。SL是明度样本的二维阵列(即,块)。SCb是Cb色度样本的二维阵列。SCr是Cr色度样本的二维阵列。色度(chrominance)样本在本文中还可被称为“色度(chroma)”样本。在其它情况下,图片可为单色的且可仅包含明度样本阵列。
HEVC标准化努力是基于被称作HEVC测试模型(HM)的视频译码装置的演进模型。HM假设视频译码装置根据(例如)ITU-T H.264/AVC相对于现有装置的若干额外能力。举例来说,尽管H.264提供了九个帧内预测编码模式,但HM可提供多达三十三种帧内预测编码模式。
一般来说,HM的工作模型描述视频编码器20可将视频帧或图片划分为译码树单元(CTU)序列,也被称作最大译码单元(LCU)或树块。CTU中的每一者可包括明度样本的译码树块、色度样本的两个对应的译码树块,以及用以对译码树块的样本进行译码的语法结构。在单色图片或包括单独的颜色平面的图片中,CTU可包括单个译码树块及用于对所述译码树块的样本进行译码的语法结构。
位流内的语法数据可定义CTU(就像素数目来说的最大译码单元)的大小。CTU可为样本的NxN块。HEVC的CTU可大体上类似于其它视频译码标准(例如,H.264/AVC)的宏块。然而,CTU未必限于特定大小,并且可包含一或多个译码单元(CU)。
视频帧或图片可被分割成一或多个切片。切片包含呈译码或扫描次序的多个连续CTU。每一CTU可根据四叉树而分裂成译码单元(CU)。CU可为样本的NxN块。一般来说,四叉树数据结构包含每个CU一个节点,其中一个根节点对应于所述树块。如果一个CU分裂成四个子CU,那么对应于CU的节点包含四个叶节点,其中的每一者对应于所述子CU中的一者。CU或子CU(也可被称作CU)可包括具有明度样本阵列、Cb样本阵列和Cr样本阵列的图片的明度样本的译码块以及色度样本的两个对应译码块,以及用以对译码块的样本进行译码的语法结构。在单色图片或包括单独的颜色平面的图片中,CU可包括单个译码块及用于对所述单个译码块的样本进行译码的语法结构。
四分树数据结构的每一节点可提供用于对应CU的语法数据。举例来说,四叉树中的节点可包含分裂旗标,其表明对应于所述节点的所述CU是否分裂成子CU。用于CU的语法元素可以递归地来定义,且可取决于CU是否分裂成数个子CU。如果CU不进一步分裂,那么将其称为叶CU。在本发明中,叶CU的四个子CU也可被称作叶CU,即使不存在原始叶CU的明确分裂时也是如此。举例来说,如果16×16大小的CU未进一步分裂,那么这四个8×8子CU也可被称作叶CU,虽然16×16CU从未分裂。与经译码位流相关联的语法数据可定义树块可分裂的最大次数,被称作最大CU深度,且还可定义译码节点的最小大小。因此,位流还可定义最小译码单元(SCU)。
CU包含译码节点和与所述译码节点相关联的预测单元(PU)和变换单元(TU)。CU的大小对应于译码节点的大小并且形状必须是正方形。CU的大小可介于8×8个像素至多达具有最大64×64个像素或更大的树块大小的范围内。一般来说,视频编码器20和视频解码器30以一种模式(例如,帧内预测或帧间预测)对每一CU进行译码。
每一CU可含有一或多个PU和一或多个TU。举例来说,与CU相关联的语法数据可描述将CU分割成一或多个PU。分割模式可在CU被跳过或经直接模式编码、经帧内预测模式编码或经帧间预测模式编码之间有所不同。PU可分割为非正方形(例如,矩形)形状。举例来说,与CU相关联的语法数据还可描述根据四叉树将CU分割成一或多个TU。TU可为正方形或非正方形(例如,矩形)形状。
CU的PU和TU可包括图片的明度样本的预测块、图片的色度样本的两个对应的预测块,以及用以对预测块样本进行预测的语法结构。视频编码器20可产生CU的每一PU的预测性明度、Cb和Cr块。在单色图片或包括单独的色彩平面的图片中,PU可包括单个预测块,以及用以对所述单个预测块进行预测的语法结构。
视频编码器20和视频解码器30可支持具有各种大小的PU。假定特定CU的大小为2Nx2N,那么视频编码器20和视频解码器30可支持2Nx2N或NxN的PU大小的帧内预测,以及2Nx2N、2NxN、Nx2N或NxN的对称PU大小的帧间预测。视频编码器20和视频解码器30还可支持2NxnU、2NxnD、nLx2N和nRx2N的PU大小的帧间预测的不对称分割。在不对称分割中,不分割CU的一个方向,但是将另一方向分割成25%和75%。CU的对应于25%分区的部分由“n”接以“上”、“下”、“左”或“右”的指示来指示。因此,例如,“2NxnU”是指水平分割的2N×2N CU,具有2Nx0.5N PU在顶部,且2Nx1.5N PU在底部。在HEVC中,最小PU大小为8x4和4x8。
在本发明中,“N×N”与“N乘N”可互换地使用以指就竖直和水平尺寸来说的视频块的像素尺寸,例如,16×16像素或16乘16像素。一般来说,16x16块在垂直方向上具有16个像素(y=16),且在水平方向上具有16个像素(x=16)。同样,NxN块总体上在垂直方向上具有N个像素,并且在水平方向上具有N个像素,其中N表示非负整数值。块中的像素可布置成行和列。此外,块未必需要在水平方向上与在竖直方向上具有相同数目个像素。举例来说,块可包括NxM个像素,其中M未必等于N。
一般来说,PU表示对应于相对应的CU的全部或一部分的空间区域,并且可包含用于检索PU的参考样本的数据。此外,PU包含与预测有关的数据。举例来说,当PU经帧内模式编码时,PU的数据可描述用于对应于所述PU的预测块的帧内预测模式。
作为另一实例,当PU经帧间模式编码时,PU可包含定义PU的一或多个运动向量的数据。定义PU的运动向量的数据可描述例如运动向量的水平分量、运动向量的垂直分量、运动向量的分辨率(例如,四分之一像素精度或八分之一像素精度)。PU还可包含识别运动向量指向的参考图片的数据,例如到包含所述参考图片的参考图片列表中的索引。
帧间预测可为单向的(即,单向预测)或双向的(即,双向预测)。为了执行单向预测或双向预测,视频编码器20和视频解码器可产生当前图片的第一参考图片列表(RefPicList0)和第二参考图片列表(RefPicList1)。参考图片列表中的每一者可包含一或多个参考图片。在构造参考图片列表(即RefPicList0和RefPicList1,如果可用)之后,可使用到参考图片列表的参考索引来识别参考图片列表中包含的任何参考图片。
参考图片可为在时间上(例如显示、次序)的先前图片、未来图片,或从两个或两个以上先前编码图片的预测的组合。视频译码器(例如,视频编码器20和视频解码器30)使用图片次序计数(POC)以识别图片的时间次序。视频译码器还使用图片的POC值用于参考图片列表构造和运动向量按比例缩放。视频编码器20或视频解码器30可将参考图片存储在参考图片存储器中,例如参考图片存储器368(图6)和参考图片存储器396(图7)。
在当前视频块(例如PU)是根据本发明的技术使用IntraBC译码时,界定块的二维向量(其可被称为块向量、偏移向量、运动向量或位移向量)的数据可描述例如向量的水平分量、向量的垂直分量、向量的分辨率(例如,四分之一像素精度或八分之一像素精度)。然而,根据本发明的技术使用IntraBC预测的PU的数据不需要识别运动向量指向的参考图片,因为参考块在与当前视频块相同的帧或图片内。
在视频编码器20产生CU的一或多个PU的预测性明度、Cb和Cr块之后,视频编码器20可产生CU的明度残差块。CU的明度残差块中的每一样本指示CU的PU的预测性明度块中的明度样本与CU的原始明度译码块中的对应样本之间的差。另外,视频编码器20可产生CU的Cb残差块。CU的Cb残差块中的每一样本可指示CU的PU的预测性Cb块中的Cb样本与CU的原始Cb译码块中的对应样本之间的差。视频编码器20还可产生CU的Cr残差块。CU的Cr残差块中的每一样本可指示CU的PU的预测性Cr块中的Cr样本与CU的原始Cr译码块中的对应样本之间的差。
具有一或多个PU的叶CU还可包含一或多个变换单元(TU)。CU的TU可包括明度样本的变换块、色度样本的两个对应的变换块,以及用以对变换块样本进行变换的语法结构。视频编码器20可变换与TU相关联的残差块内的像素差值以产生可经量化的变换系数。视频编码器20可例如将离散余弦变换(DCT)、整数变换、小波变换或概念上相似的变换应用于残差视频数据。
TU可使用RQT(还被称作TU四叉树结构)来指定,如上文所论述。举例来说,分裂旗标可指示叶CU是否分裂成四个变换单元。接着,每一变换单元可进一步分裂成更多个子TU。当TU未进一步分裂时,其可被称作叶TU。TU未必限于PU的大小。因此,TU可大于或小于PU。对于帧内译码,PU可与同一CU的对应叶TU并置。在一些实例中,叶TU的最大大小可对应于对应叶CU的大小。一般来说,除非另有提及,否则本发明分别使用术语CU和TU来指叶CU和叶TU。
本发明可使用术语“视频单元”、“视频块”或“视频数据块”来指代样本的任何一或多个块以及用以如本文中所描述对所述样本的一或多个块的样本进行译码的语法结构。实例类型的视频块可包含HEVC的上下文中的CTU、CU、PU或TU,或其它标准的上下文中的类似数据结构(例如H.264/AVC中的宏块或其宏块分区)。
在任何用于产生变换系数的变换之后,视频编码器20可执行变换系数的量化。量化大体上指代对变换系数进行量化以可能减少用以表示所述系数的数据的量从而提供进一步压缩的过程。量化过程可减小与系数中的一些或全部相关联的位深度。举例来说,n位值可在量化期间被下舍入到m位值,其中n大于m。
在量化之后,视频编码器可扫描变换系数,从包含经量化变换系数的二维矩阵产生一维向量。扫描可经设计以将较高能量(并且因此较低频率)的系数放置在阵列的前面,并且将较低能量(并且因此较高频率)的系数放置在阵列的背面。在一些实例中,视频编码器20可利用预定义扫描次序来扫描经量化的变换系数以产生可被熵编码的串行化向量。在其它实例中,视频编码器20可执行自适应扫描。在扫描经量化变换系数以形成一维向量之后,视频编码器20可例如根据上下文自适应可变长度译码(CAVLC)、上下文自适应二进制算术译码(CABAC)、基于语法的上下文自适应二进制算术译码(SBAC)、概率区间分割熵(PIPE)译码或另一熵编码方法熵编码一维向量。视频编码器还20也可对与经编码视频数据相关联的语法元素进行熵编码以供视频解码器30在解码视频数据时使用。
为了执行CABAC,视频编码器20可向待发射的符号指派上下文模型内的上下文。上下文可涉及(例如)符号的相邻值是否为非零。为了执行CAVLC,视频编码器20可选择用于待发射的符号的可变长度码。VLC中的码字可经构造使得相对较短码对应于更有可能符号,而较长码对应于不太可能符号。以此方式,使用VLC可例如实现优于针对待发射的每一符号使用等长度码字的位节省。概率确定可基于指派给符号的上下文。
另外,视频编码器20可例如通过对残差数据进行逆量化和逆变换来解码经编码图片,且将残差数据与预测数据进行组合。以此方式,视频编码器20可模拟由视频解码器30执行的解码过程。因此,视频编码器20和视频解码器30两者具有对大体上相同的经解码视频数据(例如图片或来自图片的块)的存取权,以用于图片内、图片间或IntraBC预测。
视频编码器20可输出经编码视频位流,其包含形成经译码图片与包含语法元素的相关联数据的表示的位序列。位流可包括一连串网络抽象层(NAL)单元。NAL单元中的每一者可包含NAL单元标头,且可包封原始字节序列有效负载(RBSP)。NAL单元标头可包含指示NAL单元类型码的语法元素。由NAL单元的NAL单元标头指定的所述NAL单元类型代码指示NAL单元的类型。RBSP可包括含有囊封在NAL单元内的整数数目个字节的语法结构。在一些情况下,RBSP包含零个位。
不同类型的NAL单元可包封不同类型的RBSP。举例来说,第一类型的NAL单元可包封参数集的RBSP、第二类型的NAL单元可包封经译码切片的RBSP、第三类型的NAL单元可包封补充增强信息(SEI)的RBSP,等等。包封视频译码数据的RBSP(与参数集和SEI消息的RBSP相对)的NAL单元可被称为视频编码层(VCL)NAL单元。包封经译码切片的NAL单元可在本文中被称作经译码切片NAL单元。用于经译码切片的RBSP可包含切片标头和切片数据。
除经编码视频数据之外,视频编码器20可在经编码视频位流中包含告知视频解码器如何对特定视频数据块或其分组进行解码的语法元素。视频编码器20可以多种语法结构包含语法元素,例如取决于其参考的视频结构(例如,序列、图片、切片、块)的类型以及其值可改变的频繁程度。举例来说,视频编码器20可在例如视频参数集(VPS)、序列参数集(SPS)或图片参数集(PPS)等参数集中包含语法元素。作为其它实例,视频编码器20可包含SEI消息中的语法元素以及切片标头。
一般来说,视频解码器30可执行与由视频编码器执行的编码过程相反的解码过程。举例来说,视频解码器30可使用由视频编码器用来对经量化视频数据进行熵编码的熵编码技术的逆过程来执行熵解码。视频解码器30可进一步使用由视频编码器20采用的量化技术的逆过程来逆量化视频数据,且可执行由视频编码器20使用的变换的逆过程来产生经量化的变换系数。视频解码器30可接着将所得残差块应用于邻近参考视频数据(帧内预测)、来自另一图片的预测性块(帧间预测)或来自同一图片的预测性块(IntraBC)以产生用于最终显示的视频块。视频解码器30可经配置、经指令、经控制或经引导以基于由视频编码器20提供的语法元素与由视频解码器30接收的位流中的经编码视频数据来执行由视频编码器20执行的各种过程的相反过程。
每一图片可包括明度分量和一或多个色度分量。因此,本文所描述的基于块的编码和解码操作可相等地适用于包含明度或色度像素值或与其相关联的块,例如CU、PU和TU。
IntraMC(也被称作IntraBC)是使得能够移除图片内冗余且改善帧内译码效率的专用技术,如布德甲维等人的“AHG8:使用帧内运动补偿的视频译码(AHG8:Video codingusing Intra motion compensation)”(文献:JCTVC-M0350,ITU-T SG 16 WP 3和ISO/IECJTC 1/SC 29/WG 11的视频译码联合合作小组(JCT-VC),第13次会议,韩国仁川,2013年4月18到26日(下文为“JCT-VC M0350”))中报告。JCT-VC M0350以全文引用的方式并入本文中,且可从http://phenix.int-evry.fr/jct/doc_end_user/current_document.php?id=7601下载。根据JCT-VC M0350,IntraMC包含对:(1)一维偏移或位移向量(此处也被称为块向量、运动向量或“MV”),其指示预测信号(例如,同一帧或图片内的块)从当前视频块(例如,CU)移位的位置,连同(2)残差信号一起进行译码。对于CU或使用IntraMC的其它块,从同一图片中的已经重构区获得预测信号。
图2是说明根据本发明用于根据用于从同一图片内的视频数据的预测性块对视频数据块的帧内预测的模式(例如,根据本发明的技术根据IntraBC模式)预测当前图片103内的当前视频数据块102的实例技术的概念图。图2说明当前图片103内的预测性视频数据块104。视频译码器(例如视频编码器20和/或视频解码器30)可依据根据本发明的技术的IntraBC模式,使用预测性视频块104来预测当前视频块102。
视频编码器20从一组先前经重构的视频数据块选择用于预测当前视频块102的预测性视频块104。视频编码器20通过逆量化和逆变换也包含在经编码视频位流中的视频数据且将所得残差块与用以预测经重构视频数据块的预测性块求和来重构视频数据块。在图2的实例中,图片103内的既定区108也可被称作“既定区域”或“光栅区域”,包含先前经重构视频块的集合。视频编码器20可以多种方式定义图片103内的既定区108,如下文更详细描述。视频编码器20可根据基于既定区108内的各种视频块预测和译码当前视频块102的相对效率和准确性的分析,从既定区108中的视频块当中选择预测性视频块104来预测当前视频块102。
视频编码器20确定表示预测性视频块104相对于当前视频块102的位置或位移的二维向量106。二维块向量106包含水平位移分量112和垂直位移分量110,其分别表示预测性视频块104相对于当前视频块102的水平和垂直位移。视频编码器20可包含识别或限定经编码视频位流中的例如定义水平位移分量112和垂直位移分量110的二维块向量106的一或多个语法元素。视频解码器30可解码所述一或多个语法元素以确定二维块向量106,且使用所确定的向量来识别用于当前视频块102的预测性视频块104。
在一些实例中,二维块向量106的分辨率可为整数像素,例如约束为具有整数像素分辨率。在此些实例中,水平位移分量112和垂直位移分量110的分辨率可为整数像素。在此些实例中,视频编码器20和视频解码器30不需要内插预测性视频块104的像素值来确定用于当前视频块102的预测符。
在其它实例中,水平位移分量112和垂直位移分量110中的一者或两者的分辨率可为子像素。举例来说,分量112和114中的一者可具有整数像素分辨率,而另一者具有子像素分辨率。在一些实例中,水平位移分量112和垂直位移分量110两者的分辨率可为子像素,但水平位移分量112和垂直位移分量110可具有不同分辨率。
在一些实例中,视频译码器(例如,视频编码器20和/或视频解码器30)基于特定层级来适应水平位移分量112和垂直位移分量110的分辨率,例如块层级、切片层级或图片层级适应。举例来说,视频编码器20可例如在切片标头中在切片层级发信号通知指示水平位移分量112和垂直位移分量110的分辨率是整数像素分辨率还是非整数像素分辨率的旗标。如果所述旗标指示水平位移分量112和垂直位移分量110的分辨率不是整数像素分辨率,那么视频解码器30可推断分辨率是子像素分辨率。在一些实例中,不一定是旗标的一或多个语法元素可针对每一切片或其它视频数据单元发射,以指示水平位移分量112和/或垂直位移分量110的共同或个别分辨率。
在又其它实例中,代替于旗标或语法元素,视频编码器20可基于分辨率上下文信息而设定且视频解码器30可从分辨率上下文信息推断水平位移分量112和/或垂直位移分量110的分辨率。分辨率背景信息可包含例如包含当前视频块102的图片或图片序列的色彩空间(例如YUV、RGB等)、特定色彩格式(例如4:4:4、4:2:2、4:2:0等)、帧大小、帧速率或量化参数(QP)。在至少一些实例中,视频译码器可基于与经先前译码帧或图片相关的信息确定水平位移分量112和/或垂直位移分量110的分辨率。以此方式,水平位移分量112的分辨率和垂直位移分量110的分辨率可预定义、发信号通知、可从其它辅助信息(例如,分辨率上下文信息)推断,或可基于已经译码的帧。
当前视频块102可为CU,或CU的PU。在一些实例中,视频译码器(例如,视频编码器20和/或视频解码器30)可将根据IntraBC预测的CU分裂为若干PU。在此些实例中,视频译码器可确定CU的PU中的每一者的相应(例如,不同)二维向量106。举例来说,视频译码器可将2Nx2N CU分裂为两个2NxN PU、两个Nx2N PU,或四个NxN PU。作为其它实例,视频译码器可将2Nx2N CU分裂为((N/2)xN+(3N/2)xN)PU、((3N/2)xN+(N/2)xN)PU、(Nx(N/2)+Nx(3N/2))PU、(Nx(3N/2)+Nx(N/2))PU、四个(N/2)x2N PU或四个2Nx(N/2)PU。在一些实例中,视频译码器可使用2Nx2N PU来预测2Nx2N CU。
当前视频块102可为明度视频块,或对应于明度视频块的色度视频块。在一些实例中,视频编码器20可仅将定义明度视频块的二维向量106的一或多个语法元素编码到经编码视频位流中。在此些实例中,视频解码器30可基于针对明度块用信号表示的二维向量导出对应于所述明度块的一或多个色度块中的每一者的二维向量106。
取决于颜色格式,例如颜色取样格式或色度取样格式,视频译码器可相对于明度视频块下取样对应色度视频块。颜色格式4:4:4不包含下取样,意味着色度块在水平和垂直方向中包含与明度块相同数目的样本。颜色格式4:2:2在水平方向上下取样,意味着在色度块中在水平方向上相对于明度块存在二分之一多的样本。颜色格式4:2:0在水平和垂直方向中下取样,意味着在色度块中在水平和垂直方向中相对于明度块存在二分之一多的样本。
在其中视频译码器基于对应明度块的向量106确定色度视频块的向量106的实例中,视频译码器可需要修改明度向量。举例来说,如果明度向量106具有整数分辨率,其中水平位移分量112和/或垂直位移分量110为奇数数目的像素,且颜色格式是4:2:2或4:2:0,那么经转换明度向量可不指向对应色度块中的整数像素位置。在此些实例中,视频译码器可按比例缩放明度向量以用作色度向量来预测对应色度块。在一些实例中,视频编码器20可定义既定区108,或按比例缩放经转换向量,使得用于预测色度块的经转换明度向量106将不指向未经重构或经环路内滤波的预测性色度块。在本发明中,如果未明确提到色度块的向量的按比例缩放,那么应假定此类按比例缩放未发生。即使本发明中所描述的实例中未明确描述,色度块的向量的按比例缩放也可能发生(但可能不是每种情况下必需的)。
图3是说明用于定义既定区的实例技术的概念图,视频编码器20可从所述既定区选择视频数据的预测性块来预测当前视频数据块。在图3说明的实例中,视频编码器20在预测且编码当前视频数据块122。视频编码器20选择既定区128内的视频数据的预测性块124来预测当前视频块122。视频编码器20确定指示预测性视频块124相对于当前视频块122的位移的二维向量126,其包含水平位移分量132和垂直位移分量130。视频编码器20在经编码视频位流中编码界定二维向量126的一或多个语法元素。
在一些实例中,视频编码器20定义既定区128,例如定义既定区的大小(例如高度、宽度或其它尺寸),使得可降低尤其在视频解码器30处的实施方案和处理复杂性。在这样做时,视频编码器20可限制二维向量126的大小,例如限制垂直位移分量130和/或水平位移分量132的大小。在一些实例中,视频编码器20可限制既定区128,以促进视频编码器20和视频解码器30对视频数据的并行处理。在一些实例中,视频编码器20可限制既定区128以促进预测性视频块的使用而无需环路内滤波,例如去块和样本自适应偏移(SAO)滤波,且不会不恰当地加重视频译码器的存储器要求或延迟此环路内滤波的应用。
如图3中所说明,当前视频块122在当前LCU 134内。图3还说明当前LCU的左相邻(左)LCU 136。图3中说明左LCU 136,因为图片的视频块通常在光栅扫描次序中从左上到右下编码。在其中图片的视频块以不同次序译码的实例中,以下关于左LCU 136的论述可应用于当前LCU 134的不同相邻LCU。
在一些实例中,视频编码器20可限制既定区128以使得所获取预测性视频块124与当前视频块122在同一LCU内,即当前LCU 134内。将既定区128限制于当前LCU134可促进视频译码器对LCU的并行处理,因为视频译码器的处理单元在对当前LCU的块进行译码时将不需要来自另一LCU的信息。
在其中既定区128限于当前LCU 134的一些实例中,二维向量126可在当前视频块122是当前LCU 134的最顶部块的情况下限于水平向量,且在当前视频块122是当前LCU 134的最左边块的情况下限于垂直向量。在此些实例中,视频编码器20可对界定二维向量126的水平位移分量132的一或多个语法元素进行编码,且不需要对界定二维向量126的在当前视频块122是当前LCU 134的最顶部块的情况下将为零的垂直位移分量130的一或多个语法元素进行编码。类似地,视频编码器20可对界定二维向量126的垂直位移分量130的一或多个语法元素进行编码,且不需要对界定二维向量126的在当前视频块122是当前LCU 134的最左边块的情况下将为零的水平位移分量132的一或多个语法元素进行编码。类似地,如果既定区128限于当前LCU 134且当前视频块122是当前LCU 134的左上单元,那么二维向量126的水平分量130和垂直分量132必须为零。在其中遇到此情形的一些实例中,视频编码器20可不执行IntraBC,且不需要用于IntraBC的单个任何语法元素,例如指示二维向量126的语法元素,或指示当前视频块122是否是根据IntraBC预测的任何旗标。
用以在既定区限于当前LCU且当前视频块在当前LCU中的某些位置内时减少用于IntraBC的信令的这些技术也可应用于限于一维运动向量的IntraBC技术,例如JCT-VCM0350中同样提出的那些技术。举例来说,如果垂直运动向量受限于在当前LCU内且当前单元是最顶部单元,那么不需要发信号通知所述运动是垂直的还是水平的。
在一些实例中,视频编码器20可将既定区128限制为在当前LCU 134内,且是一或多个相邻LCU(例如,如图3中所示的左LCU 136)中的经重构区域的一部分。以此方式,视频编码器20限制二维向量126,使得除当前LCU 134中的经重构块之外,它们可仅参考一或多个相邻LCU(例如左LCU 136)的经重构区域中的块,如图3中所说明。
在一些实例中,视频编码器20基于当前LCU 134的大小来限制既定区128的大小。举例来说,如图3中所示,视频编码器20可基于当前LCU 134的高度(或上垂直限制)来限制既定区128的高度138,使得既定区128并不垂直延伸超过当前LCU 134和左LCU136。LCU(或CTB)的大小可在经编码视频位流中由视频编码器20向视频解码器30发信号通知,例如经由切片标头、参数集或SEI消息,且因此还可向视频解码器30有效地发信号通知基于LCU大小的对既定区的限制。在一些实例中,视频编码器20基于像素的整数数目来限制大小,例如既定区128的当前视频块122的高度138或左侧的宽度140。举例来说,视频编码器20可将当前视频块122左侧的宽度140限制为像素的整数数目,例如64,其可对应于LCU 134和136的宽度。
视频编码器20可限制既定区128包含经重构视频块而无环路内滤波,例如去块和样本自适应偏移(SAO)滤波。以此方式,视频编码器20可限制用于IntraBC的二维向量,使得它们除当前LCU 134之外还可仅参考不执行环路内滤波的例如左LCU 136等相邻LCU的经重构区域中的块。视频编码器20可增加既定区128的大小,但此些增加可延迟环路内滤波,并且进一步延迟既定区中的视频块的处理,或在环路内滤波之前需要额外存储器来存储样本。因此,视频编码器20可例如如本文中所描述限制既定区128以实现预测准确性与效率之间的平衡。
图4是当前视频数据块260以及可从其导出当前视频数据块的候选预测性向量的相邻视频数据块262、264、266的概念图实例。在一些实例中,类似于用于帧间预测的合并模式或高级运动向量预测(AMVP)模式,视频译码器可基于用以使用IntraBC预测相邻视频块(例如,PU)的二维向量确定当前视频块(例如,PU)的预测性二维向量。图4中说明的相邻块包含左相邻块262、上(顶部)相邻块264和左上方(左上)相邻块266。图4中说明的相邻块是一个实例。在其它实例中,视频译码器可考虑更多、更少和/或不同相邻块的向量,例如可根据用于帧间预测的合并和AMVP模式考虑的任何相邻块。
预测符可为来自相邻块中的选定一者的二维运动向量的水平和/或垂直位移分量。在一些实例中,预测符始终来自特定相邻单元,例如顶部相邻单元或左边相邻单元。在一些实例中,相邻块中的哪一者提供当前PU的预测性二维运动向量是基于PU的索引和/或PU形状而确定。在一些实例中,预测符可为来自多个相邻单元的二维块向量的水平和/或垂直分量的函数(例如平均或中值)。
一般来说,如果相邻块无法提供预测性二维向量,那么预测性二维向量(或候选预测性二维向量)可设定成零或默认二维向量。在一些实例中,相邻块的向量可仅当相邻视频块是根据IntraBC预测时可用作当前视频块的预测性向量。换句话说,不以IntraMC模式译码的相邻块可视为不可用于当前视频块的块向量预测。举例来说,当预测符始终来自左相邻块且左相邻块是以IntraMC模式预测时,将其二维向量用作预测性二维向量。当预测符始终来自左相邻块且左相邻块不是以IntraMC模式预测时,视频译码器可使用零向量或默认向量作为当前视频块的预测性二维向量。
在一些实例中,视频译码器可在相邻视频块的二维向量不在与当前视频块(例如,CU或PU)相同的LCU或其它较大或最大译码单元中的情况下,将其视为不可用于当前视频块的二维向量的预测。在一些实例中,如果当前视频块(例如,PU或CU)的当前二维向量是当前CU或LCU中的第一者,那么当前视频块的预测性二维向量可设定成零或默认二维向量。如果上相邻CU和当前CU不在同一LCU中,那么有可能上相邻CU被视为不可用。如果左相邻CU和当前CU不在同一LCU中,那么也可能左相邻CU被视为不可用。
在一些实例中,以类似于用于帧间预测的合并模式和AMVP模式的方式,视频编码器20和视频解码器30可构造包含若干相邻块的块向量的当前视频块的一组候选预测性向量。在此些实例中,视频编码器20可对发信号通知哪一候选者用以提供当前视频块的预测性二维向量的索引进行编码,且视频解码器30可对其进行解码。在一些实例中,视频译码器可基于例如来自不同相邻块的不同候选者向量分别确定预测性二维向量的水平位移分量和垂直位移分量。在此些实例中,视频译码器可将相应索引译码为候选者列表水平和垂直位移分量。
作为一个实例,对于根据IntraBC模式译码的当前CU,为了对其块向量进行译码,视频译码器检查左相邻和顶部相邻CU。如果其中任一者都不可用,例如根据IntraBC译码,那么视频译码器可确定当前CU的预测性二维向量是零向量(对于水平分量和垂直分量两者)。如果相邻CU中的仅一者可用,例如以IntraBC译码,那么视频译码器使用用于可用相邻CU的预测的向量作为当前CU的当前二维向量的预测性二维向量。如果两个相邻CU都可用,例如以IntraBC译码,且其二维向量相同,那么将此二维向量用作预测性二维向量。如果两个相邻都可用,例如以IntraBC译码,且其块向量不同,那么视频译码器可对旗标或其它语法元素进行译码以指示来自顶部相邻CU的块向量或来自左相邻CU的块向量是否用作当前CU的预测性二维向量。
在另一实例中,视频译码器可定义两个或两个以上默认块向量,其可来自(作为非限制性实例)集合(-w,0)、(-2w,0)、(-8,0)、(0,0)、(0,8)、(0,-h)、(0,-2h),其中w和h是当前视频块(例如CU)的宽度和高度,且第一分量是水平位移,且第二分量是垂直位移。如果左相邻CU和上部相邻CU两者可用,那么视频译码器可使用其向量作为当前CU的第一和第二预测性二维向量。如果其中的一者不可用,那么视频译码器可使用默认预测性向量替代候选预测性向量列表中的不可用预测性向量。如果其两者都不可用,那么视频译码器可使用可相同或不同的两个默认预测性向量来代替候选预测性向量列表中的不可用预测性向量。用候选者列表中的默认向量代替不可用预测性向量的优点是用于预测符之间的选择的旗标也可包含在经编码视频位流中,使得视频解码器30不需要有条件地剖析此旗标。尽管本文相对于包含从两个相邻块导出的两个预测性向量的候选者列表描述实例,但如果块/向量可用,那么在其它实例中,视频译码器可考虑更多或更少的相邻块,且在候选者列表中包含更多或更少的预测性二维向量。
在一些实例中,对于每一LCU中的第一视频块和用于IntraBC的对应二维向量,视频译码器可使用与LCU内的其它块和相关联向量不同的导出过程来确定其预测性二维向量。举例来说,视频译码器(例如,视频编码器20和/或视频解码器30)可确定LCU中的第一视频块和用于IntraBC的对应二维向量的预测性二维向量是默认二维向量。默认二维向量可为(-w,0),其中w是当前视频块(例如,CU)的宽度。在其它实例中,默认二维向量可为(-2w,0)、(-8,0)、(0,0)、(0,8)、(0,-h)、(0,-2h),其中w和h是当前视频块(例如CU)的宽度和高度。在其它实例中,视频译码器(例如视频编码器20和/或视频解码器30)可导出第一视频块的预测性二维向量以及用于LCU中的IntraBC的对应二维向量。在一些实例中,视频译码器可针对具有不同大小或在LCU中的不同位置处的视频块(例如,CU)以不同方式导出LCU中使用IntraBC译码的第一视频块的预测性二维向量,或换句话说可基于视频块大小或在LCU中的位置以不同方式导出LCU中使用IntraBC译码的第一视频块的预测性二维向量。
在一些实例中,视频译码器可选择用以确定当前视频块的二维向量的水平分量和垂直分量的方法,可基于旗标、语法元素或基于其它信息(例如特定颜色空间(例如,YUV、RGB或类似物)、特定色彩格式(例如,4:2:0、4:4:4或类似物)、帧大小、帧速率或量化参数(QP),或基于经先前译码帧)。
在一些实例中,视频编码器20可对旗标(例如,IntraMC_flag或IntraBC_flag)进行编码,以向视频解码器30指示视频块(例如,CU)是否是使用用于基于同一图片中的预测性视频块来预测当前视频块的模式编码的,所述模式可被称为IntraMC或IntraBC模式。所述旗标可为1位旗标,其值指示一或多个CU或其它块或单元是否是使用例如如本文中所描述的IntraMC或IntraBC模式来编码。视频译码器可对每一视频块(例如,CU或PU)的旗标的值进行译码,或可对多个视频块中的每一者对旗标的值进行译码,例如在切片内或在帧或图片或图片序列内。视频译码器可在(作为实例)切片标头、参数集(例如,PPS)或SEI消息中对所述旗标进行译码。
视频译码器可在旁路模式下对旗标进行译码,或对具有上下文的旗标进行算术编码,例如CABAC编码。在一些实例中,视频译码器可对具有不取决于相邻视频块的单个固定上下文的旗标进行算术译码,例如CABAC编码。在其它实例中,视频译码器可对具有从相邻视频块导出的上下文的旗标进行算术译码,例如CABAC编码。
参看图4,当视频译码器使用CABAC上下文对用于当前视频块260的旗标进行译码时,所述上下文的值可从相邻视频块导出,例如顶部(上方)相邻视频块264、左上(左上方)相邻视频块266或左相邻视频块262。当相邻视频块(例如顶部相邻视频块264)与当前视频块在同一LCU内时,视频译码器可将所述相邻视频块视为可用于导出当前视频块的上下文,且当相邻视频块在当前LCU之外时,将其视为不可用。
作为一实例,对于当前视频块,视频译码器可导出上下文值=(顶部IntraMC_flag==0)?0:1+(左IntraMC_flag==0)?0:1。在一些实例中,视频译码器可始终从相邻视频块262、264、266中的特定一者(例如,左相邻视频块262)导出当前视频块260的上下文,且当前视频块的上下文值是(左IntraMC_flag==0)?0:1。在一些实例中,视频译码器使用取决于视频块(例如,CU)的大小的上下文值对旗标进行译码。在一些实例中,具有不同大小的视频块具有不同上下文值。换句话说,每一视频块(例如,CU)大小可与相应的唯一上下文值相关联。在一些实例中,具有不同预定义大小的若干视频块(例如,CU)共享相同上下文值,且具有其它大小的视频块使用一或多个不同上下文值。换句话说,视频译码器可使多个上下文值中的每一者与可能的视频块(例如,CU)大小的相应集合或范围相关联。
在一些实例中,视频译码器(例如,视频编码器20和/或视频解码器30)可基于一元码对用于IntraBC的二维向量的水平位移分量和垂直位移分量(例如,图2中的二维向量106的水平位移分量112和垂直位移分量110)进行译码。在其它实例中,视频译码器可基于指数哥伦布或莱斯-哥伦布码对水平位移分量和垂直位移分量进行译码。
在一些实例中,水平和垂直位移分量可仅指示当前视频块上方和左边的区,且视频译码器可不需要保持或译码这些值的正负号位。在一些实例中,视频译码器可构造参考帧,使得当前视频块上方和左边的区域可表示相对于当前视频块的正方向。在此些实例中,如果仅当前视频块上方和/或左边的视频块被视为候选预测性视频块,那么视频译码器可不需要保持或译码正负号位,因为可预定义水平位移分量和垂直位移分量的全部值表示正(或负)值且指示当前视频块上方和/或左边的视频块。
在一些实例中,这些二维向量的最大大小(或例如残差二维向量等一或多个二维向量之间的差)可较小,例如由于如上文所论述的既定区和/或管线约束的定义。在此些实例中,视频编码器20可以截断值来使这些二维块向量二进制化。在一些实例中,视频编码器20可在熵编码所述二维向量时,例如在对所述二维向量的水平位移分量和垂直位移分量进行编码时,采用截断一元、截断指数哥伦布或截断哥伦布-莱斯码。
视频编码器20在本文所描述的各种截断编码方案中的任一者中可使用的截断值可为常数,例如基于LCU大小。在一些实例中,所述截断值可对于水平位移分量和垂直位移分量为相同的。在其它实例中,所述截断值可对于水平位移分量和垂直位移分量为不同的。
作为一个说明性实例,如果LCU的大小是64,例如64x64,且二维向量的垂直分量限于在LCU内,例如如上文相对于图3所描述,那么所述截断可对于二维向量的水平分量等于63,且对于二维向量的垂直分量等于63-MinCUSize。在一些实例中,所述截断值可自适应地取决于当前视频块在LCU内的位置。举例来说,如果二维向量的垂直分量限于在LCU内,那么视频编码器可将向量二进制化截断为当前视频块的顶部位置与LCU的顶部位置之间的差。
视频编码器20可使用旁路模式对二维向量的水平分量和垂直分量的二进制化进行熵编码,或可例如用CABAC上下文对所述二进制化进行算术编码。举例来说,视频编码器20将针对预测性视频块的搜索限制于既定区,例如如图3中所说明,二维向量(MV)的分量的分布可不以零为中心。举例来说,MV_x趋向于为负,因为当前视频块(例如,CU)右边的像素(同一行中)尚未经编码/经重构。类似地,MV_y趋向于为负,因为当前视频块(例如,CU)下方的像素(同一列中)尚未经编码/经重构。
旁路模式可针对0和1假定相等概率。对于正负号,这意味着旁路模式假定为正或负的相等概率。因为二维向量的分量并不具有为正或负的相等概率,所以视频编码器20可用上下文(例如,以除0.5外的初始概率)对正负号进行算术编码,例如CABAC编码。
视频编码器20可如何对二维向量的水平分量(MV_x)进行编码的一个实例如下。尽管相对于MV_x来描述,但所述技术也可应用于对二维向量的垂直分量(MV_y)或表示当前向量与预测性向量之间的差的残差二维向量的水平或垂直分量(例如,mvd_x和mvd_y)进行编码。
MV_x可由正负号值和二进制化串(对于abs(MV_x))b0b1…表示。第一二进位b0指示是否abs(Mv_x)>0(b0=1)或不大于0(b0=0)。视频编码器20可使用具有上下文的CABAC对第一二进位b0进行编码。用于Mv_x和Mv_y的b0可具有单独的上下文,或可共享同一上下文。在一些实例中,IntraBC的MV译码中的第i二进位与帧间运动补偿的块向量译码中的第i二进位共享相同上下文。在一些实例中,IntraBC的MV译码和帧间运动补偿的块向量译码中的第i二进位并不共享上下文。
随后的二进位b1b2…表示abs(MV_x)-1的值,且视频编码器20可在旁路模式中使用具有参数3的指数哥伦布码对这些二进位进行编码。I在一些实例中,视频编码器20使用其它阶的指数哥伦布码,例如1、2、4、5。在一些实例中,b1表示是否abs(MV_x)=1(b1=1)或不等于1(b1=0)。在一些实例中,视频编码器20可以绕过模式或以CABAC上下文对b1进行编码。
在一些实例中,b2b3…表示abs(MV_x)-2的值,且视频编码器20可使用具有参数3的指数哥伦布码或在旁路模式中使用其它阶的指数哥伦布码对这些二进位进行编码。最后二进位可指示MV_x的正负号,且视频编码器20可在旁路模式中对此二进位进行编码而无需任何上下文。在其它实例中,视频编码器20可以一或多个上下文对使用CABAC编码的正负号二进位进行编码。用于MV_x和MV_y的正负号二进位可具有单独的上下文,或它们有可能共享相同上下文。
在一些实例中,视频译码器(例如,视频编码器20和/或视频解码器30)可将IntraBC模式的应用以及旗标、向量分量或其它语法的任何相关联译码限制于某一大小(即,满足某一大小准则)的视频块。所述大小准则可为最大块大小和/或最小块大小(例如,IntraMC_MaxSize和IntraMC_MinSize)中的一者或两者。视频编码器20可例如使用旗标或其它语法元素在经编码视频位流中向视频解码器30指示所述一或多个大小准则,或视频译码器可基于例如特定色彩空间(例如,YUV、RGB等)、特定色彩格式(例如,4:2:0、4:4:4或类似物)、帧大小、帧速率、量化参数(QP)等其它信息或基于经先前译码帧隐式地确定所述大小准则。举例来说,针对小大小的IntraBC可能对系统的存储器带宽要求具有影响,且视频译码器可应用最小块大小准则来将IntraBC限制于高于大小阈值的块。
图5A和5B示出分成两个PU(即PU0和PU1)的CU的实例。图5A和5B示出用于HEVC AMVP和合并的空间邻近者导出的说明图像。空间相邻者可用于块向量译码,例如用于为帧内BC AMVP模式或帧内BC合并模式确定候选者。视频编码器20和/或视频解码器30可从相邻块为特定PU(PU0)导出空间MV候选者,如图5A和5B中示出,但从所述块产生所述候选者的方法可针对合并和AMVP模式而不同。在合并模式中,视频编码器20和/或视频解码器30可使用图5A中所示的排序导出至多达四个空间MV候选者。次序如下:左(0)、上方(1)、右上方(2)、左下方(3)和左上方(4),如图5A中示出。
在AMVP模式中,将相邻块划分成两个群组:由块0和1组成的左侧群组,以及由块2、3和4组成的上方群组,如图5B中示出。对于每一群组,如发信号通知的参考索引所指示的参考同一参考图片的相邻块中的潜在候选者具有最高待选优先级,以形成所述群组的最终候选者。可有可能所有相邻块均不含有指向相同参考图片的块向量。因此,如果无法找到此类候选者,那么可按比例缩放第一可用候选者以形成最终候选者,因此可补偿时间距离差异。
用于帧内BC的当前技术可具有一些潜在问题。在一个实例中,当色度取样格式不是4:4:4(即,是4:2:0或4:2:2)时,色度运动补偿块大小可小至2×2,且因此小于如基础HEVC规范中所支持的最小块大小。当存取参考块时,视频译码器通常读取预定义存储块单元(例如4x2、8x2)中的块。因此,如果块大小小于预定义存储块单元,那么存取不可用于补偿中的额外像素,因此降低存储器存取效率。
作为潜在问题的另一实例,仅按比例缩放色度分量的明度块向量可导致指向当前CU或PU内的区的块向量。作为另一实例,帧内BC的现有实施方案中并不很好地支持块向量预测的AMVP方式。
本发明引入可改进帧内BC预测的技术。根据本发明的一个技术,当经译码视频数据具有色度取样格式4:2:0,视频解码器30可使用与用以预测对应明度分量的块向量不同的块向量来预测色度分量。举例来说,用于第一明度分量和其对应的第一色度分量的块向量可相同,但用于第二色度分量的块向量可与用于其对应的第二明度分量的块向量不相同。实际上,用于第二色度分量的块向量可与用于第一明度分量的块向量相同。
视频解码器30可从用于明度的块向量导出用于色度的块向量。举例来说,对于分成四个N×N PU的2N×2N CU,对于当前CU中的四个PU/TU,视频编码器20可以译码次序发信号通知四个BV,即BV1、BV2、BV3和BV4。根据本发明的技术,视频解码器30可使用四个BV来对当前CU的明度分量进行帧内BC预测,且导出单个块向量来对整个CU的多个色度块进行IntraBC预测。因此,含有四个PU/TU的CU可针对多个PU的色度块共享一个共用块向量(表示为BVc)。
视频解码器30可从四个明度块向量产生共用色度块向量,将明度块向量转化为色度块向量,如在HEVC版本1中进行,或在针对色度分量的运动补偿之前,直接使用明度块向量作为色度块向量。视频解码器30可通过以下方法之一来导出明度块向量BVL
1.视频解码器30在BV1、BV2、BV3、BV4当中选择最小块向量BVL,并将BVL转换为BVc,例如通过按比例缩放。出于阐释的目的,以以下可能方式中的一者,将块向量定义为小于其它BVb
a.如果BVa的水平分量(BVa[0])小于BVb的水平分量
b.如果BVa的水平分量的绝对值(表示为|x|,对于值a)小于BVb的绝对值
c.如果|BVa[0]|+|BVa[1]小于|BVb[0]|+|BVb[1]|
d.如果BVa的垂直分量(BVa[1])小于BVb的垂直分量
2.类似于上述最小块向量选择,视频解码器30可在四个块向量当中选择最大块向量,其中一个向量的各种定义中的一者小于其它定义。如上文所定义。
3.视频解码器30可通过对四个明度块向量的水平分量和垂直分量求平均以导出明度块向量BVL来确定平均块向量,其中添加+2/-2的舍入在求平均期间可或可不适用。可按比例缩放BVL以确定共用色度块向量。
4.视频解码器30可从BV1、BV2、BV3和BV4选择一个块向量作为BVL。举例来说,所选择的块向量可为所述四个中的固定一者,例如始终为BV1,始终为BV2等,或可在位流中明确地发信号通知。
根据本发明的另一技术,当经译码视频数据具有4:2:2的色度取样格式时,视频解码器30可针对色度适用与用于明度的BV不同的BV。实际上,视频解码器30可从用于明度的BV导出用于色度的BV。举例来说,IntraBC可扩展到PU/TU,且假设PU/TU对于2N×2N CU为N×N,那么对于当前CU中的两个PU/TU,存在两个BV,即译码次序中的BV1和BV2。类似于上文所述的技术,对于整个CU的色度块,可从当前PU的两个PU/TU的两个块向量产生最小向量、最大向量或平均向量。
根据本发明的一个技术,对于用四个N×N帧内BC PU/TU译码的2N×2N CU,当色度取样格式不是4:4:4时,视频解码器30可用从N×N PU/TU的块向量产生得单个块向量来预测色度分量。然而,视频解码器30可仍使用四个单独块向量来预测PU的明度分量。举例来说,对于分成四个N×N PU得2N×2N CU,视频编码器20可发信号通知四个单独块向量,CU的每一PU一个。视频解码器30可解码那四个单独块向量,并使用所述四个单独块向量来预测四个PU的明度分量。然而,对于四个PU的色度分量,视频解码器30可选择四个块向量中的一者,并使用一个块向量来预测CU的PU中的一个以上的色度分量。在一些情况下,视频解码器30可使用一个块向量来预测CU的所有四个PU的色度分量。
在另一实例中,对于用四个N×N帧内BC PU/TU译码的2N×2N CU,当色度取样格式不是4:4:4时,视频解码器30可用从N×N PU/TU的块向量产生的两个块向量来预测色度分量。所述两个块向量中的每一者可用于预测一个N/2xN块或N×N/2块。换句话说,所述两个块向量中的每一者可用于预测CU的四个PU中的两个。视频解码器30可检查CU的PU的四个块向量中的至少一者,且取决于这些块向量导出两个明度块向量。更具体地说,例如,比较所述四个块向量,且可选择具有比任何其它对更接近的距离的两相邻块向量。
在一个实例中,计算dis(BV0,BV1)、dis(BV0,BV2)、dis(BV1,BV3)和dis(BV2,BV3)。(1)最小的一个对应于可组合到2NxN或Nx2N块的一对。举例来说,如果dis(BV0,BV1)最小,那么将顶部的两个N×N块组合为一个2NxN块。其余的块自动变为另一2NxN块。(2)最大的一个对应于不可组合到2NxN或Nx2N块的一对。举例来说,如果dis(BV0,BV1)最大,那么将左侧的两个N×N块组合为一个2NxN块。其余的块自动变为另一2NxN块。(3)对于每一组合的2NxN块,处理所述两个块向量,并导出单个明度块向量。(4)对于两块向量BVa和BVb,两个块向量的距离可仅被定义为(BVa[0]-BVb[0])的绝对值加(BVa[1]-BVb[1]的绝对值。或者,还可应用返回非负值的其它距离定义。
根据本发明的另一技术,当根据4:2:0或4:2:2格式来译码视频数据时,视频解码器30可从四个N×N PU/TU的四个块向量导出一个运动。在一个实例中,视频解码器30可为右下块(即右下PU)导出块向量,并使用此块向量来预测CU的四个PU。通过选择右下PU的块向量,可确保所述块向量并不指向CU的另一PU。
在其它实例中,视频解码器30可选择左下块的块向量,选择右上块、左上块为产生此CU的色度块的块向量的唯一块。
根据本发明的另一技术,当根据4:2:2格式来译码视频数据时,可从两个块向量导出一个块向量。在此实施方案中,对于分成四个N×N PU得2N×2N CU,视频解码器30可使用相同块向量来预测CU的四个PU中的两个。在一个实例中,视频解码器30可使用右上块(即右上PU)的块向量来预测右上PU和左上PU两者。在此实例中,视频解码器30可使用右下块(即右下PU)的块向量来预测左下PU和右下PU。在另一实例中,视频解码器30可使用左上块的块向量来预测CU的顶部两个色度块,且使用左下块的块向量来预测底部两个色度块。
当根据4:2:0or 4:2:2格式来译码视频数据时,且当将2N×2N CU分成2NxN或Nx2NIntraBC PU/TU时,视频解码器30可用不同块向量来预测PU/TU的色度块。根据本发明的另一技术,视频解码器30可从所述两个明度块向量导出一个块向量,并使用所述一个块向量来预测整个CU的两者色度块。在一实例中,视频解码器30可选择右块(当用Nx2N译码时)的块向量或底部块(当用2NxN译码时)的块向量,作为CU的色度块的块向量。在另一实例中,视频解码器30可选择左块(当用Nx2N译码时)的块向量或顶部块(当用2NxN译码时)的块向量,作为用于预测CU的色度块的块向量。
不管视频解码器30如何从明度PU(将所导出的块向量表示为dBV)导出块向量,以形成最终色度块向量,视频解码器30可剪切所导出的明度块向量,以产生法定块向量。在一个实例中,视频解码器30可以色度块向量不指向同一PU/TU内的像素的方式来执行所述剪切。在另一实例中,视频解码器30可以色度块向量不指向同一CU内的像素的方式来执行所述剪切。
对于将2N×2N CU分成四个N×N PU的情况,视频解码器30可执行水平剪切操作和垂直剪切操作。视频解码器30可如下应用水平剪切:
水平剪切:max(-leftW-(CUx%ctbW),dBV[0]),其中
1.leftW可为定值,例如64,或当前CTU的宽度,或在位流中(例如,在高级语法中,例如视频参数集、序列参数集和图片参数集合中)发射任何其它值。
2.CUx是当前CU的左上像素的水平坐标。
3.ctbW是CTB的宽度
垂直剪切:max(-CUy%ctbH,dBV[1]),其中
1.CUy是当前CU的左上像素的垂直坐标。
2.ctbH是CTB的高度。
根据一些实例,视频解码器30可例如在2N×2N CU分成Nx2N PU时,仅执行水平剪切,或在2N×2N CU分成2NxN PU时仅执行垂直剪切。在实例中,如上文所描述,当来自两个N×N块的两个块向量将为Nx2N块组合时,视频解码器30可仅应用水平剪切。在实例中,如上文所描述,当来自两个N×N块的两个块向量将为2NxN块组合时,视频解码器30可仅应用垂直剪切。
在一些实施方案中,上述各种过程仅可针对某些CU大小而实施。举例来说,视频解码器30可仅使用单个块向量来预测针对CU大小的多个色度块等于8×8或更小。本文所述的技术可例如仅针对不大于预定义大小(例如32×32、16×16或8×8)的CU大小而应用。此大小可为预定义的,或者,可在sps/pps/切片层级发信号通知。
图6是说明可实施本发明中描述的技术的实例视频编码器的框图。视频编码器20可执行视频切片内的视频块的帧内和帧间译码。帧内译码依靠空间预测来减小或去除给定视频帧或图片内的视频的空间冗余。帧间译码依靠时间或视图间预测来减少或去除视频序列的邻近帧或图片内的视频中的冗余。帧内模式(I模式)可指若干基于空间的压缩模式中的任一者。例如单向预测(P模式)或双向预测(B模式)的帧间模式可包含若干基于时间的压缩模式中的任一者。视频编码器20还可经配置以利用用于从同一图片内的视频数据的预测性块对视频数据块的帧内预测的模式,例如如本文中所描述的IntraBC或IntraMC模式。
在图6的实例中,视频编码器20包含视频数据存储器334、分割单元335、预测处理单元341、既定区存储器364、滤波器处理单元366、参考图片存储器368、求和器350、变换处理单元352、量化处理单元354和熵编码单元356。预测处理单元341包含运动估计单元342、运动补偿单元344、帧内预测处理单元346和块副本内(IntraBC)单元348,且。为了视频块重构,视频编码器20还包含逆量化处理单元358、逆变换处理单元360和求和器362。
在各种实例中,可为视频编码器20的单元分派任务以执行本发明的技术。并且,在一些实例中,本发明的技术可在视频编码器20的单元中的一或多者当中进行划分。举例来说,IntraBC单元348可单独或与视频编码器的其它单元组合地执行本发明的技术,所述其它单元例如运动估计单元342、运动补偿单元344、帧内预测处理单元346、既定区存储器364和熵编码单元356。
视频数据存储器334可存储待由视频编码器20的组件编码的视频数据。可(例如)从视频源18获得存储在视频数据存储器334中的视频数据。既定区存储器364可为存储参考视频数据以供视频编码器20例如在帧内或帧间译码模式中编码视频数据的参考块存储器。视频数据存储器334和既定区存储器364可由多种存储器装置中的任一者形成,例如包含同步DRAM(SDRAM)的动态随机存取存储器(DRAM)、磁阻式RAM(MRAM)、电阻式RAM(RRAM)或其它类型的存储器装置。视频数据存储器334和既定区存储器364可由同一存储器装置或单独的存储器装置提供。在各种实例中,视频数据存储器334可与视频编码器20的其它组件一起在芯片上,或相对于所述组件在芯片外。
分割单元335将来自视频数据存储器334的数据分割为视频块。此分割还可包含分割成切片、瓦片或其它较大单元,以及例如根据LCU和CU的四叉树结构的视频块分割。视频编码器20通常说明编码待编码的视频切片内的视频块的组件。所述切片可分成多个视频块(并且可能分成被称作瓦片的视频块集合)。
预测处理单元341可根据本发明中描述的技术,基于误差结果(例如,译码速率和失真水平)选择多种可能的译码模式中的一者,例如多种帧内译码模式中的一者、多种帧间译码模式中的一者或IntraBC模式用于当前视频块。预测处理单元341可将所得预测性块提供到求和器250以产生残差块数据,且提供到求和器262以重构当前块以用于预测其它视频块,例如作为参考图片。
预测处理单元341内的帧内预测处理单元346可相对于与待译码当前块在相同帧或切片中的一或多个相邻块执行当前视频块的帧内预测性译码,以提供空间压缩。预测处理单元341内的运动估计单元342及运动补偿单元344相对于一或多个参考图片中的一或多个预测性块执行当前视频块的帧间预测性译码,以例如提供时间压缩。
运动估计单元342可经配置以根据视频序列的预定图案来确定用于视频切片的帧间预测模式。运动估计单元342与运动补偿单元344可高度集成,但出于概念目的单独地加以说明。运动估计单元342所执行的运动估计是产生运动向量的过程,所述过程估计视频块的运动。举例来说,运动向量可指示当前视频帧或图片内的视频块的PU相对于参考图片内的预测性块的位移。类似地,根据本发明的技术的用于IntraBC的二维向量指示当前视频帧或图片内的视频块的PU相对于同一帧或图片内的预测性块的位移。IntraBC单元348可以类似于运动估计单元342确定运动向量以用于帧间预测的方式确定用于IntraBC译码的二维向量(例如,块向量或运动向量),或可利用运动估计单元342来确定所述二维向量。
例如由运动估计单元342和/或用于帧间预测或IntraBC预测的IntraBC单元识别的预测性块是被发现在像素差方面接近地匹配待译码视频块的PU的块,其可通过绝对差总和(SAD)、平方差总和(SSD)或其它差异度量确定。在一些实例中,视频编码器20可计算存储在参考图片存储器368中的参考图片或存储在既定区存储器364中的当前图片的既定区的子整数像素位置的值。举例来说,视频编码器20可内插四分之一像素位置、八分之一像素位置或参考图片的其它分数像素位置的值。因此,运动估计单元342和/或IntraBC单元348可相对于全像素位置和分数像素位置执行对预测性块的搜索,且输出具有分数像素精度的向量。
运动估计单元342通过将PU的位置与参考图片的预测性块的位置进行比较,来计算经帧间译码切片中的视频块的PU的运动向量。参考图片可选自第一参考图片列表(列表0或RefPicList0)或第二参考图片列表(列表1或RefPicList1),其中的每一者识别存储在参考图片存储器368中的一或多个参考图片。运动估计单元342将所计算的运动向量发送到熵编码单元356和运动补偿单元344。
通过运动补偿单元344执行的运动补偿可涉及基于通过运动估计(可能执行对子像素精度的内插)确定的运动向量获取或产生预测性块。在接收到当前视频块的PU的运动向量后,运动补偿单元344可在参考图片列表中的一者中定位所述运动向量指向的预测性块。
在一些实例中,IntraBC单元348可以类似于上文相对于运动估计单元342和运动补偿单元344描述的方式产生二维向量且获取预测性块,但其中所述预测性块与当前块在同一图片或帧中。在其它实例中,IntraBC单元348可完全或部分地使用运动估计单元342和运动补偿单元344,根据本文所描述的技术执行用于IntraBC预测的此些功能。在任一情况下,对于IntraBC,预测性块可为被发现在像素差方面接近地匹配待译码块的块,其可通过绝对差总和(SAD)、平方差总和(SSD)或其它差异度量来确定,且块的识别可包含用于子整数像素位置的值的计算。
无论预测性视频块是来自根据IntraBC预测的同一图片还是根据帧间预测的不同图片,视频编码器20都可通过从正译码的当前视频块的像素值减去预测性块的像素值而形成像素差值来形成残差视频块。像素差值形成所述块的残差数据,且可包含明度和色度差分量两者。求和器250表示执行此减法运算的一或多个组件。IntraBC单元348和/或运动补偿单元344还可产生与视频块和视频切片相关联的语法元素以供视频解码器30在解码视频切片的视频块时使用。所述语法元素可包含例如界定用以识别预测性块的向量的语法元素、指示预测模式的任何旗标或相对于本发明的技术描述的任何其它语法。
帧内预测处理单元346可对当前块进行帧内预测,作为对由运动估计单元342和运动补偿单元344执行的帧间预测或由IntraBC单元348执行的IntraBC预测的替代方案,如上文所描述。明确地说,帧内预测处理单元346可确定用以编码当前块的帧内预测模式。在一些实例中,帧内预测处理单元346可(例如)在单独的编码编次期间,使用各种帧内预测模式对当前视频块进行编码,且帧内预测处理单元346(或在一些实例中,预测处理单元341)可从被测模式中选择适当的帧内预测模式来使用。举例来说,帧内预测处理单元346可使用速率-失真分析来计算用于各种被测帧内预测模式的速率-失真值,且从所述被测模式当中选择具有最佳速率-失真特性的帧内预测模式。速率失真分析通常确定经编码块与经编码以产生所述经编码块的原始的未经编码块之间的失真(或误差)的量,以及用于产生经编码块的位速率(也就是说,位数目)。帧内预测处理单元346可根据用于各种经编码块的失真和速率计算比率,以确定哪个帧内预测模式对于所述块展现最佳速率失真值。
在任何情况下,在选择用于块的帧内预测模式之后,帧内预测处理单元346可将指示块的选定帧内预测模式的信息提供到熵编码单元356。熵编码单元356可根据本发明的技术对指示选定帧内预测模式的信息进行编码。视频编码器20在所发射的位流中可包含配置数据,其可包含多个帧内预测模式索引表和多个经修改的帧内预测模式索引表(也称为码字映射表),对用于各种块的上下文进行编码的定义,以及对最可能帧内预测模式、帧内预测模式索引表和经修改的帧内预测模式索引表的指示以用于所述上下文中的每一者。
在预测处理单元341经由帧间预测、帧内预测或IntraBC预测产生当前视频块的预测性块之后,视频编码器20例如经由求和器350通过从当前视频块减去预测性块而形成残差视频块。残差块中的残差视频数据可包含在一或多个TU中,并应用到变换处理单元352。变换处理单元352使用例如离散余弦变换(DCT)或概念上类似变换的变换将残差视频数据变换成残差变换系数。变换处理单元352可将残差视频数据从像素域转换到变换域,例如频域。
变换处理单元352可将所得变换系数发送到量化处理单元354。量化处理单元354量化所述变换系数以进一步减小位速率。量化过程可减小与系数中的一些或全部相关联的位深度。可通过调整量化参数来修改量化程度。在一些实例中,量化处理单元354可接着执行对包含经量化变换系数的矩阵的扫描。或者,熵编码单元356可执行所述扫描。
在量化之后,熵编码单元356对经量化的变换系数进行熵编码。举例来说,熵编码单元356可执行上下文自适应可变长度译码(CAVLC)、上下文自适应二进制算术译码(CABAC)、基于语法的上下文自适应二进制算术译码(SBAC)、概率区间分割熵(PIPE)译码或另一熵译码方法或技术。熵编码单元356可执行本文针对二进制化和编码语法元素(包含向量分量、旗标和其它语法元素)以用于根据IntraBC模式的预测的所描述技术中的任一者。在由熵编码单元356进行熵编码之后,可将经编码视频位流发射到视频解码器30,或经存档以供稍后发射或供视频解码器30检索。
逆量化处理单元358和逆变换处理单元360分别应用逆量化和逆变换,以在像素域中重构残差块供稍后用作用于其它视频块的预测的参考块。运动补偿单元344和/或IntraBC单元348可通过将残差块加到参考图片列表中的一者内的参考图片中的一者的预测性块来计算参考块。运动补偿单元344和/或IntraBC单元348也可将一或多个内插滤波器应用于经重构残差块,以计算用于运动估计的子整数像素值。
求和器362将经重构残差块相加到由运动补偿单元344和/或IntraBC单元348产生的经运动补偿的预测块以产生经重构视频块。既定区存储器364根据如本文中所描述的视频编码器20对当前视频块的IntraBC(例如,IntraBC单元348)的既定区的定义来存储经重构视频块。既定区存储器364可存储尚未由滤波器处理单元366环路内滤波的经重构视频块。求和器362可与既定区存储器364并行地将经重构视频块提供到滤波器处理单元366,或既定区存储器364可在不再需要用于IntraBC的既定区时将经重构视频块释放到滤波器处理单元366。在任一情况下,IntraBC单元348可搜索既定区存储器364中的经重构视频块,以寻找与当前视频块在同一图片内的预测性视频块来预测当前视频块。
滤波器处理单元366可对经重构视频块执行环路内滤波。环路内滤波可包含去块滤波以对块边界进行滤波,以从经重构视频去除成块假影。环路内滤波还可包含SAO滤波以改进经重构视频。其中一些可经环路内滤波的经重构块可存储在参考图片存储器368中作为参考图片。参考图片可包含可由运动估计单元342和运动补偿单元344用作预测性块,以对后续视频帧或图片中的块进行帧间预测。
以此方式,视频编码器20可经配置以实施本发明的实例技术以用于例如根据IntraBC模式从同一图片内的视频数据预测块对视频数据块的帧内预测。举例来说,视频编码器20可为经配置以执行对视频数据进行编码的方法的视频编码器的实例,包含用于从同一图片内的视频数据的预测性块对视频数据块的帧内预测的模式,所述方法包括从与当前视频数据块在同一图片内的一组经先前编码的视频数据块来选择用于当前视频数据块的预测性视频数据块。所述方法进一步包括确定二维向量,其中所述二维向量具有水平位移分量和垂直位移分量,其中所述水平位移分量表示预测性视频数据块与当前视频数据块之间的水平位移,且所述垂直位移分量表示预测性视频数据块与当前视频数据块之间的垂直位移。所述方法进一步包括基于当前视频数据块和预测性视频数据块确定残差块,且在经编码视频位流中编码定义所述二维向量的水平位移分量和垂直位移分量的一或多个语法元素和所述残差块。
视频编码器20也可为包括经配置以存储经编码视频位流的存储器和一或多个处理器的视频编码器的实例。所述一或多个处理器经配置以从与当前视频数据块在同一图片内的一组经先前编码的视频数据块选择用于当前视频数据块的预测性视频数据块。所述一或多个处理器进一步经配置以确定二维向量,其中所述二维向量具有水平位移分量和垂直位移分量,其中所述水平位移分量表示预测性视频数据块与当前视频数据块之间的水平位移,且所述垂直位移分量表示预测性视频数据块与当前视频数据块之间的垂直位移。所述一或多个处理器进一步经配置以基于当前视频数据块和预测性视频数据块确定残差块,且在经编码视频位流中对定义所述二维向量的水平和垂直位移分量的一或多个语法元素和所述残差块进行编码。
图7是说明可实施本发明中描述的技术的实例视频解码器的框图。在图7的实例中,视频解码器30包含视频数据存储器378、熵解码单元380、预测处理单元381、逆量化处理单元386、逆变换处理单元388、求和器390、既定区存储器392、滤波器处理单元394和参考图片存储器396。预测处理单元381包含运动补偿单元382、帧内预测处理单元384和块副本内(IntraBC)单元385。在一些实例中,视频解码器30可执行一般与关于来自图6的视频编码器20描述的编码遍次互逆的解码遍次。
在各种实例中,可给视频解码器30的单元分派任务以执行本发明的技术。并且,在一些实例中,可在视频解码器30的单元中的一或多者当中划分本发明的技术。举例来说,IntraBC单元385可单独或与视频解码器30的其它单元组合地执行本发明的技术,所述其它单元例如运动补偿单元382、帧内预测处理单元384、既定区存储器392和熵解码单元380。
在解码过程期间,视频解码器30从视频编码器接收表示经编码视频切片的视频块和相关联语法元素的经编码视频位流。视频数据存储器378可存储待由视频解码器30的组件解码的视频数据,例如经编码视频位流。存储在视频数据存储器378中的视频数据可例如从计算机可读媒体16获得,例如经由视频数据的有线或无线网络通信从本地视频源(例如相机)或通过存取物理数据存储媒体而获得。视频数据存储器378可形成存储来自经编码视频位流的经编码视频数据的经译码图片缓冲器(CPB)。既定区存储器392可为存储参考视频数据以供视频解码器30例如在帧内译码模式中编码视频数据的参考块存储器。视频数据存储器378和既定区存储器392可由多种存储器装置中的任一者形成,例如DRAM,包含SDRAM、MRAM、RRAM或其它类型的存储器装置。视频数据存储器378和既定区存储器392可由同一存储器装置或单独的存储器装置提供。在各种实例中,视频数据存储器378可与视频解码器30的其它组件一起在芯片上,或相对于那些组件在芯片外。
视频解码器30的熵解码单元380对位流进行熵解码以产生经量化系数、用于帧间预测的运动向量、用于IntraBC预测的二维向量以及本文所描述的其它语法元素。熵解码单元380可执行本文所描述的用于二进制化和编码语法元素(包含向量分量、旗标和其它语法元素)以用于根据IntraBC模式的预测的技术中的任一者的逆过程。熵解码单元380将向量和其它语法元素转发到预测处理单元381。视频解码器30可接收序列层级、图片层级、视频切片层级和/或视频块层级的语法元素。
当视频切片经译码为经帧内译码(I)切片时,预测处理单元381的帧内预测处理单元384可基于发信号通知的帧内预测模式和来自当前帧或图片的先前经解码块的数据产生用于当前视频切片的视频块的预测数据。当视频帧经译码为经帧间译码(即,B或P)切片时,预测处理单元381的运动补偿单元382基于从熵解码单元280接收到的运动向量和其它语法元素产生用于当前视频切片的视频块的预测性块。可从参考图片列表中的一者内的参考图片中的一者产生预测性块。视频解码器30可使用默认构造技术或基于存储在参考图片存储器396中的参考图片的任何其它技术来构造参考帧列表RefPicList0和RefPicList1。当视频块是根据本文所描述的IntraBC模式经译码时,预测处理单元381的IntraBC单元385基于从熵解码单元380接收的二维向量和其它语法元素产生当前视频块的预测性块。所述预测性块可在由视频编码器20界定的与当前视频块在同一图片内的既定区内,且从既定区存储器392检索。
运动补偿单元382和IntraBC单元385通过剖析向量和其它语法元素确定当前视频切片的视频块的预测信息,且使用所述预测信息来产生正被解码的当前视频块的预测性块。举例来说,运动补偿单元282使用所接收语法元素中的一些语法元素来确定用于译码视频切片的视频块的预测模式(例如,帧内预测或帧间预测)、帧间预测切片类型(例如,B切片或P切片)、切片的参考图片列表中的一或多者的构造信息、切片的每一经帧间编码的视频块的运动向量、切片的每一经帧间译码的视频块的帧间预测状态,及用以解码当前视频切片中的视频块的其它信息。类似地,IntraBC单元385可使用所接收语法元素中的一些语法元素(例如,旗标)确定当前视频块是使用IntraBC模式预测、指示图片的哪些视频块在既定区内且应存储在既定区存储器中的用于既定区存储器392的构造信息、切片的每一经IntraBC预测视频块的二维向量、切片的每一经IntraBC预测视频块的IntraBC预测状态,以及用以解码当前视频切片中的视频块的其它信息。
运动补偿单元382和IntraBC单元385还可基于内插滤波器执行内插。运动补偿单元382和IntraBC单元385可在视频块的编码期间使用如由视频编码器20使用的内插滤波器来计算用于预测性块的子整数像素的内插值。在此情况下,运动补偿单元382和IntraBC单元385可从所接收的语法元素确定由视频编码器20使用的内插滤波器,且使用所述内插滤波器产生预测性块。
逆量化处理单元386将在位流中提供且由熵解码单元380解码的经量化变换系数逆量化,即去量化。逆量化过程可包含使用视频编码器20针对视频切片中的每一视频块计算以确定应应用的量化程度和同样逆量化程度的量化参数。逆变换处理单元388对变换系数应用逆变换,例如逆DCT、逆整数变换或概念上类似的逆变换过程,以便产生像素域中的残差块。
在运动补偿单元382或IntraBC单元385基于所述向量和其它语法元素产生当前视频块的预测性块之后,视频解码器30通过将来自逆变换处理单元388的残差块与由运动补偿单元382和IntraBC单元385产生的对应预测性块求和而形成经解码视频块。求和器390表示执行此求和运算以产生经重构视频块的组件。
既定区存储器392根据如本文中所描述用于视频编码器20对当前视频块的IntraBC的既定区的定义存储经重构视频块。既定区存储器392可存储尚未由滤波器处理单元394环路内滤波的经重构视频块。求和器390可与既定区存储器392并行地将经重构视频块提供到滤波器处理单元394,或当不再需要IntraBC的既定区时,既定区存储器392可将经重构视频块释放到滤波器处理单元394。在任一情况下,IntraBC单元385从既定区存储器392检索当前视频块的预测性视频块。
滤波器处理单元394可对经重构视频块执行环路内滤波。环路内滤波可包含去块滤波以对块边界进行滤波,以从经重构视频去除成块假影。环路内滤波还可包含SAO滤波以改进经重构视频。其中一些可经环路内滤波的经重构块可存储在参考图片存储器368中作为参考图片。参考图片可包含可由运动补偿单元382用作预测性块以对后续视频帧或图片中的块进行帧间预测的经重构块。参考图片存储器396还存储经解码视频用于以后在显示装置(例如图1的显示装置32)上呈现。
以此方式,视频解码器30可经配置以实施用于基于同一图片内的预测性视频数据块对当前视频数据块进行帧内预测的本发明的实例技术。举例来说,视频解码器30可为经配置以执行对视频数据进行解码的方法的视频解码器的实例,包含用于从同一图片内的预测性视频数据块对视频数据块的帧内预测的模式,所述方法包括在经编码视频位流中接收界定二维向量的水平位移分量和垂直位移分量的一或多个语法元素和当前视频数据块的残差块,且对所述一或多个语法元素进行解码。所述方法进一步包括基于界定所述二维向量的水平位移分量和垂直位移分量的经解码语法元素确定当前视频数据块的预测性视频数据块,其中所述预测性视频数据块是与当前视频数据块在同一图片内的经重构视频数据块,以及基于预测性视频数据块和残差块重构当前视频数据块。
视频解码器30也可为包括经配置以存储对视频数据进行编码的经编码视频位流的存储器和一或多个处理器的视频解码器的实例。视频解码器的所述一或多个处理器可经配置以对所述一或多个语法元素进行解码,基于界定所述二维向量的水平位移分量和垂直位移分量的经解码语法元素确定当前视频数据块的预测性视频数据块,其中所述预测性视频数据块是与当前视频数据块在同一图片内的经重构视频数据块,以及基于预测性视频数据块和所述残差块重构当前视频数据块。
图8是说明用于根据本发明中描述的技术对视频数据进行编码的实例方法的流程图。将参考视频编码器(例如视频编码器20)来描述图8的技术。视频编码器20从与译码单元相关联的多个向量为图片的CU的第一色度块确定向量(402)。视频编码器20使用所述向量来定位第一色度参考块(404)。第一色度参考块可与所述CU在同一图片中。视频编码器20基于第一色度参考块来预测第一色度块(406)。视频编码器20使用所述向量来定位第二色度参考块(408)。第二色度参考块可与所述CU在同一图片中。视频编码器20基于所述第二色度参考块来预测译码单元的第二色度块(410)。
视频编码器20产生使用块副本内模式来译码图片的CU的指示以及所述CU的每一明度块的向量的指示,以包含在经编码视频数据中(412)。如上文所阐释,视频编码器20可使用单独块向量来预测明度分量中的每一者,但使用从用以预测明度分量得单独块向量确定的共用块向量来预测CU的色度分量。因此,视频编码器20可在经编码视频数据中包含CU的每一明度分量的单独块向量的指示。
图9是说明用于根据本发明中描述的技术对视频数据进行解码的实例方法的流程图。将参考视频解码器(例如视频解码器30)来描述图9的技术。视频解码器30确定使用块副本内模式来译码视频数据的图片的CU(420)。视频解码器30从与译码单元相关联的多个向量为CU的第一色度块确定向量(422)。视频解码器30使用所述向量来定位第一色度参考块(424)。第一色度参考块与所述CU在同一图片中。视频解码器30基于第一色度参考块来预测第一色度块(426)。视频解码器30使用所述向量来定位第二色度参考块(428)。第二色度参考块与所述CU在同一图片中。视频解码器30基于所述第二色度参考块来预测CU的第二色度块(430)。
所述CU可例如包含两个或两个以上PU,其中第一色度块对应于第一PU,且第二色度块对应于第二PU。视频解码器30可通过获得第一PU的向量来为第二色度块确定向量。
在一实例中,CU可包含两个或两个以上PU,其中每一PU具有相关联向量。视频解码器30可使用与第一预测单元相关联的向量来定位第一明度参考块。第一明度参考块可对应于第一PU。视频解码器30可使用与第二PU相关联的向量来定位第二明度参考块。第二参考明度块可对应于第二PU。视频解码器30可使用与第一PU相关联的向量来定位第一色度参考块,且使用与第一PU相关联的向量来定位第二色度参考块。
在一个实例中,当CU的色度取样格式是4:2:0时,第一色度块可为CU的右下块。第二色度块可为CU的右上块,且视频解码器30可使用向量来定位第三参考块。第三参考块可在所述图片中。视频解码器30可基于第一参考块来预测第三色度块。第三色度块可为CU的左上块。视频解码器30可使用所述向量来定位第四参考块,且基于第二参考块来预测CU的第四色度块。第四参考块可在所述图片中,且第四色度块可为CU的左下块。
在一实例中,CU的色度取样格式可为4:2:2。第一色度块可为右上块,且第二色度块可为CU的左上块。视频解码器30可为CU的第三色度块确定第二向量,且使用所述第二向量来定位第三参考块。第三参考块可在所述图片中。视频解码器30可使用第三参考块作为第三色度块的预测符。视频解码器30可使用所述向量来定位第四参考块。第四参考块可在所述图片中。视频解码器30可使用第四参考块作为CU的第四色度块的预测符。
将认识到,取决于实例,本文中所描述的技术中的任一者的某些动作或事件可以不同序列执行、可添加、合并或全部省略(例如,实践所述技术并不需要所有的所描述动作或事件)。此外,在某些实例中,可例如经由多线程处理、中断处理或多个处理器同时而非依序执行动作或事件。
在一或多个实例中,所描述功能可在硬件、软件、固件或其任何组合中实施。如果以软件实施,那么所述功能可作为一或多个指令或代码在计算机可读媒体上存储或传输,并且由基于硬件的处理单元来执行。计算机可读媒体可包含计算机可读存储媒体,所述计算机可读存储媒体对应于有形媒体,例如数据存储媒体或包含(例如)根据通信协议促进计算机程序从一位置传送至另一位置的任何媒体的通信媒体。以此方式,计算机可读媒体大体可对应于(1)为非暂时性的有形计算机可读存储媒体,或(2)通信媒体,例如,信号或载波。数据存储媒体可为可由一或多个计算机或一个或多个处理器存取以检索用于实施本发明中描述的技术的指令、代码和/或数据结构的任何可用媒体。计算机程序产品可包含计算机可读媒体。
借助于实例而非限制,此类计算机可读存储媒体可包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储装置、磁盘存储装置或其它磁性存储装置、快闪存储器或可用来存储指令或数据结构的形式的期望程序代码并且可由计算机存取的任何其它媒体。并且,可恰当地将任何连接称作计算机可读媒体。举例来说,如果使用同轴缆线、光纤缆线、双绞线、数字订户线(DSL)或例如红外线、无线电和微波等无线技术从网站、服务器或其它远程源传输指令,那么同轴缆线、光纤缆线、双绞线、DSL或例如红外线、无线电和微波等无线技术包含在媒体的定义中。然而,应理解,所述计算机可读存储媒体和数据存储媒体并不包含连接、载波、信号或其它暂时性媒体,而是实际上针对非暂时性的有形存储媒体。如本文中所使用,磁盘和光盘包含压缩光盘(CD)、激光光盘、光学光盘、数字多功能光盘(DVD)、软性磁盘和蓝光光盘,其中磁盘通常以磁性方式再现数据,而光盘利用激光以光学方式再现数据。以上的组合也应包含在计算机可读媒体的范围内。
可由例如一或多个数字信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、现场可编程逻辑阵列(FPGA)或其它等效集成或离散逻辑电路等一或多个处理器来执行指令。因此,如本文中所使用的术语“处理器”可指代上述结构或适合于实施本文中所描述的技术的任何其它结构中的任一者。另外,在一些方面中,本文中所描述的功能性可在经配置以用于编码和解码的专用硬件和/或软件模块内提供,或者并入在组合式编解码器中。并且,可将所述技术完全实施于一或多个电路或逻辑元件中。
本发明的技术可在各种各样的装置或设备中实施,所述装置或设备包含无线手持机、集成电路(IC)或一组IC(例如,芯片组)。本发明中描述各种组件、模块或单元是为了强调经配置以执行所揭示的技术的装置的功能方面,但未必需要通过不同硬件单元实现。实际上,如上文所描述,各种单元可以结合合适的软件和/或固件组合在编码解码器硬件单元中,或者通过互操作硬件单元的集合来提供,所述硬件单元包含如上文所描述的一或多个处理器。
已描述了各种实例。这些和其它实例在所附权利要求书的范围内。

Claims (43)

1.一种解码视频数据的方法,所述方法包括:
确定使用块副本内模式来译码所述视频数据的图片的译码单元;
从与所述译码单元相关联的多个向量确定用于所述译码单元的第一色度块的向量;
使用所述向量来定位第一色度参考块,其中所述第一色度参考块在所述图片中;
基于所述第一色度参考块来预测所述第一色度块;
使用曾用以定位所述第一色度参考块的所述相同向量,为所述相同译码单元的第二色度块定位第二色度参考块,其中所述第二色度参考块在所述图片中,且不同于所述第一色度参考块;以及
基于所述第二色度参考块来预测所述译码单元的所述第二色度块。
2.根据权利要求1所述的方法,其中所述译码单元包括两个或两个以上预测单元,其中所述第一色度块对应于所述译码单元的第一预测单元,且所述第二色度块对应于所述译码单元的第二预测单元,且其中为所述译码单元的所述第一色度块确定所述向量包括为所述第一预测单元获得向量。
3.根据权利要求1所述的方法,其中所述译码单元包括两个或两个以上预测单元,其中每一预测单元具有相关联向量,所述方法进一步包括:
使用与所述译码单元的第一预测单元相关联的所述向量来定位第一明度参考块;
使用与所述译码单元的所述第二预测单元相关联的所述向量来定位第二明度参考块;
使用与所述第一预测单元相关联的所述向量来定位所述第一色度参考块;以及;
使用与所述第一预测单元相关联的所述向量来定位所述第二色度参考块。
4.根据权利要求1所述的方法,其中所述译码单元的色度取样格式是4:2:0,且其中从所述多个向量确定的所述向量与所述译码单元的右下块相关联。
5.根据权利要求4所述的方法,其中所述第二色度块是所述译码单元的右上块,所述方法进一步包括:
使用所述向量来定位第三参考块,其中所述第三参考块在所述图片中;
基于所述第一参考块来预测第三色度块,其中所述第三色度块是所述译码单元的左上块;
使用所述向量来定位第四参考块,其中所述第四参考块在所述图片中;
基于所述第二参考块来预测所述译码单元的第四色度块,其中所述第四色度块是所述译码单元的左下块。
6.根据权利要求1所述的方法,其中所述译码单元的色度取样格式是4:2:2,且其中所述第一色度块是所述译码单元的右上块,且所述第二色度块是所述译码单元的左上块。
7.根据权利要求6所述的方法,其进一步包含:
为所述译码单元的第三色度块确定第二向量;
使用所述第二向量来定位第三参考块,其中所述第三参考块在所述图片中;
使用所述第三参考块作为所述第三色度块的预测符;
使用所述向量来定位第四参考块,其中所述第四参考块在所述图片中;
使用所述第四参考块作为所述译码单元的第四色度块的预测符。
8.根据权利要求1所述的方法,其中所述译码单元包括残差数据。
9.一种编码视频数据的方法,所述方法包含:
从与译码单元相关联的多个向量确定用于图片的译码单元的第一色度块的向量;
使用所述向量来定位第一色度参考块,其中所述第一色度参考块在所述图片中;
基于所述第一色度参考块来预测所述第一色度块;
使用曾用以定位所述第一色度参考块的所述相同向量,为所述相同译码单元的第二色度块定位第二色度参考块,其中所述第二色度参考块在所述图片中,且不同于所述第一色度参考块;
基于所述第二色度参考块来预测所述译码单元的所述第二色度块;以及
产生使用块副本内模式来译码所述图片的所述译码单元的指示以及用于所述译码单元的每一明度块的向量的指示,以包含在所述经编码视频数据中。
10.根据权利要求9所述的方法,其中所述译码单元包括两个或两个以上预测单元,且其中所述第一色度块对应于第一预测单元,且所述第二色度块对应于第二预测单元,且其中为所述译码单元的所述第二色度块确定所述向量包括为所述第一预测单元获得向量。
11.根据权利要求9所述的方法,其中所述译码单元包括两个或两个以上预测单元,其中每一预测单元具有相关联向量,所述方法进一步包括:
使用与所述第一预测单元相关联的所述向量来定位第一明度参考块;
使用与所述第二预测单元相关联的所述向量来定位第二明度参考块;
使用与所述第一预测单元相关联的所述向量来定位所述第一色度参考块;以及
使用与所述第一预测单元相关联的所述向量来定位所述第二色度参考块。
12.根据权利要求9所述的方法,其中所述译码单元的色度取样格式是4:2:0,且其中从所述多个向量确定的所述向量与所述译码单元的右下块相关联。
13.根据权利要求12所述的方法,其中所述第二色度块是所述译码单元的右上块,所述方法进一步包括:
使用所述向量来定位第三参考块,其中所述第三参考块在所述图片中;
基于所述第一参考块来预测第三色度块,其中所述第三色度块是所述译码单元的左上块;
使用所述向量来定位第四参考块,其中所述第四参考块在所述图片中;以及
基于所述第二参考块来预测所述译码单元的第四色度块,其中所述第四色度块是所述译码单元的左下块。
14.根据权利要求9所述的方法,其中所述译码单元的色度取样格式是4:2:2,且其中所述第一色度块是所述译码单元的右上块,且所述第二色度块是所述译码单元的左上块。
15.根据权利要求14所述的方法,其进一步包括:
为所述译码单元的第三色度块确定第二向量;
使用所述第二向量来定位第三参考块,其中所述第三参考块在所述图片中;
使用所述第三参考块作为所述第三色度块的预测符;
使用所述向量来定位第四参考块,其中所述第四参考块在所述图片中;以及
使用所述第四参考块作为所述译码单元的第四色度块的预测符。
16.根据权利要求9所述的方法,其中所述译码单元包括残差数据。
17.一种用于译码视频数据的装置,所述装置包括:
存储器,其经配置以存储视频数据;
视频译码器,其包括一或多个处理器,所述一或多个处理器经配置以:
从与译码单元相关联的多个向量确定使用块副本内模式来译码所述视频数据的图片的译码单元;
为所述译码单元的第一色度块确定向量;
使用所述向量来定位第一色度参考块,其中所述第一色度参考块在所述图片中;
基于所述第一色度参考块来预测所述第一色度块;
使用曾用以定位所述第一色度参考块的所述相同向量,为所述相同译码单元的第二色度块定位第二色度参考块,其中所述第二色度参考块在所述图片中,且不同于所述第一色度参考块;以及
基于所述第二色度参考块来预测所述译码单元的第二色度块。
18.根据权利要求17所述的装置,其中所述译码单元包括两个或两个以上预测单元,
且其中所述第一色度块对应于第一预测单元,且所述第二色度块对应于第二预测单元,且其中为所述译码单元的所述第二色度块确定所述向量包括为所述第一预测单元获得向量。
19.根据权利要求17所述的装置,其中所述译码单元包括两个或两个以上预测单元,
其中每一预测单元具有相关联向量,且其中所述一或多个处理器进一步经配置以:
使用与所述第一预测单元相关联的所述向量来定位第一明度参考块;
使用与所述第二预测单元相关联的所述向量来定位第二明度参考块;
使用与所述第一预测单元相关联的所述向量来定位所述第一色度参考块;以及
使用与所述第一预测单元相关联的所述向量来定位所述第二色度参考块。
20.根据权利要求17所述的装置,其中所述译码单元的色度取样格式是4:2:0,且其中从所述多个向量确定的所述向量与所述译码单元的右下块相关联。
21.根据权利要求20所述的装置,其中所述第二色度块是所述译码单元的右上块,且其中所述一或多个处理器进一步经配置以:
使用所述向量来定位第三参考块,其中所述第三参考块在所述图片中;
基于所述第一参考块来预测第三色度块,其中所述第三色度块是所述译码单元的左上块;
使用所述向量来定位第四参考块,其中所述第四参考块在所述图片中;以及
基于所述第二参考块来预测所述译码单元的第四色度块,其中所述第四色度块是所述译码单元的左下块。
22.根据权利要求17所述的装置,其中所述译码单元的色度取样格式是4:2:2,且其中所述第一色度块是所述译码单元的右上块,且所述第二色度块是所述译码单元的左上块。
23.根据权利要求22所述的装置,其中所述一个或一个以上处理器进一步经配置以:
为所述译码单元的第三色度块确定第二向量;
使用所述第二向量来定位第三参考块,其中所述第三参考块在所述图片中;
使用所述第三参考块作为所述第三色度块的预测符;
使用所述向量来定位第四参考块,其中所述第四参考块在所述图片中;以及
使用所述第四参考块作为所述译码单元的第四色度块的预测符。
24.根据权利要求17所述的装置,其中所述译码单元包括残差数据。
25.根据权利要求17所述的装置,其中所述装置包括以下各项中的一者:
微处理器;
集成电路IC;以及
无线通信装置,其包括所述视频编码器。
26.根据权利要求17所述的装置,其中所述视频译码器包括视频编码器。
27.根据权利要求17所述的装置,其中所述视频译码器包括视频解码器。
28.一种用于译码视频数据的设备,所述设备包括:
用于从与译码单元相关联的多个向量确定使用块副本内模式来译码所述视频数据的图片的译码单元的装置;
用于为所述译码单元的第一色度块确定向量的装置;
用于使用曾用以定位所述第一色度参考块的所述相同向量来为所述相同译码单元的第二色度块定位第二色度参考块的装置,其中所述第二色度参考块在所述图片中,且不同于所述第一色度参考块;
用于基于所述第一色度参考块来预测所述第一色度块的装置;
用于使用所述向量来定位第二色度参考块的装置,其中所述第二色度参考块在所述图片中;以及
用于基于所述第二色度参考块来预测所述译码单元的第二色度块的装置。
29.根据权利要求28所述的设备,其中所述译码单元包括两个或两个以上预测单元,
且其中所述第一色度块对应于第一预测单元,且所述第二色度块对应于第二预测单元,且其中所述用于为所述译码单元的所述第二色度块确定所述向量的装置包括用于为所述第一预测单元获得向量的装置。
30.根据权利要求28所述的设备,其中所述译码单元包括两个或两个以上预测单元,
其中每一预测单元具有相关联向量,所述设备进一步包括:
用于使用与所述第一预测单元相关联的所述向量来定位第一明度参考块的装置;
用于使用与所述第二预测单元相关联的所述向量来定位第二明度参考块的装置;
用于使用与所述第一预测单元相关联的所述向量来定位所述第一色度参考块的装置;以及
用于使用与所述第一预测单元相关联的所述向量来定位所述第二色度参考块的装置。
31.根据权利要求28所述的设备,其中所述译码单元的色度取样格式是4:2:0,且其中从所述多个向量确定的所述向量与所述译码单元的右下块相关联。
32.根据权利要求31所述的设备,其中所述第二色度块是所述译码单元的右上块,所述设备进一步包括:
用于使用所述向量来定位第三参考块的装置,其中所述第三参考块在所述图片中;
用于基于所述第一参考块来预测第三色度块,其中所述第三色度块是所述译码单元的左上块;
用于使用所述向量来定位第四参考块的装置,其中所述第四参考块在所述图片中;以及
用于基于所述第二参考块来预测所述译码单元的第四色度块的装置,其中所述第四色度块是所述译码单元的左下块。
33.根据权利要求28所述的设备,其中所述译码单元的色度取样格式是4:2:2,且其中所述第一色度块是所述译码单元的右上块,且所述第二色度块是所述译码单元的左上块。
34.根据权利要求33所述的设备,其进一步包括:
用于为所述译码单元的第三色度块确定第二向量的装置;
用于使用所述第二向量来定位第三参考块的装置,其中所述第三参考块在所述图片中;
用于使用所述第三参考块作为所述第三色度块的预测符的装置;
用于使用所述向量来定位第四参考块的装置,其中所述第四参考块在所述图片中;以及
用于使用所述第四参考块作为所述译码单元的第四色度块的预测符的装置。
35.根据权利要求28所述的设备,其中所述译码单元包括残差数据。
36.一种存储指令的计算机可读存储媒体,所述指令在由一或多个处理器执行时致使所述一或多个处理器:
从与译码单元相关联的多个向量确定使用块副本内模式来译码所述视频数据的图片的译码单元;
为所述译码单元的第一色度块确定向量;
使用曾用以定位所述第一色度参考块的所述相同向量来为所述相同译码单元的第二色度块定位第二色度参考块,其中所述第二色度参考块在所述图片中,且不同于所述第一色度参考块;
基于所述第一色度参考块来预测所述第一色度块;
使用所述向量来定位第二色度参考块,其中所述第二色度参考块在所述图片中;
以及
基于所述第二色度参考块来预测所述译码单元的第二色度块。
37.根据权利要求36所述的计算机可读存储媒体,其中所述译码单元包括两个或两个以上预测单元,且其中所述第一色度块对应于第一预测单元,且所述第二色度块对应于第二预测单元,且其中为所述译码单元的所述第二色度块确定所述向量包括为所述第一预测单元获得向量。
38.根据权利要求36所述的计算机可读存储媒体,其中所述译码单元包括两个或两个以上预测单元,其中每一预测单元具有相关联向量,且其中所述计算机可读存储媒体存储在被所述一或多个处理器执行时致使所述一或多个处理器进行以下操作的进一步指令:
使用与所述第一预测单元相关联的所述向量来定位第一明度参考块;
使用与所述第二预测单元相关联的所述向量来定位第二明度参考块;
使用与所述第一预测单元相关联的所述向量来定位所述第一色度参考块;以及
使用与所述第一预测单元相关联的所述向量来定位所述第二色度参考块。
39.根据权利要求36所述的计算机可读存储媒体,其中所述译码单元的色度取样格式是4:2:0,且其中从所述多个向量确定的所述向量与所述译码单元的右下块相关联。
40.根据权利要求39所述的计算机可读存储媒体,其中所述第二色度块是所述译码单元的右上块,且其中所述计算机可读存储媒体存储在被所述一或多个处理器执行时致使所述一或多个处理器进行以下操作的进一步指令:
使用所述向量来定位第三参考块,其中所述第三参考块在所述图片中;
基于所述第一参考块来预测第三色度块,其中所述第三色度块是所述译码单元的左上块;
使用所述向量来定位第四参考块,其中所述第四参考块在所述图片中;以及
基于所述第二参考块来预测所述译码单元的第四色度块,其中所述第四色度块是所述译码单元的左下块。
41.根据权利要求36所述的计算机可读存储媒体,其中所述译码单元的色度取样格式是4:2:2,且其中所述第一色度块是右上块,且所述第二色度块是所述译码单元的左上块。
42.根据权利要求41所述的计算机可读存储媒体,其存储在由所述一或多个处理器执行时致使所述一或多个处理器进行以下操作的进一步指令:
为所述译码单元的第三色度块确定第二向量;
使用所述第二向量来定位第三参考块,其中所述第三参考块在所述图片中;
使用所述第三参考块作为所述第三色度块的预测符;
使用所述向量来定位第四参考块,其中所述第四参考块在所述图片中;以及
使用所述第四参考块作为所述译码单元的第四色度块的预测符。
43.根据权利要求36所述的计算机可读存储媒体,其中所述译码单元包括残差数据。
CN201580003703.2A 2014-01-09 2015-01-09 视频数据的编解码方法、装置、设备和存储媒体 Expired - Fee Related CN105874797B (zh)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201461925647P 2014-01-09 2014-01-09
US61/925,647 2014-01-09
US201461926224P 2014-01-10 2014-01-10
US61/926,224 2014-01-10
US14/592,819 US9883197B2 (en) 2014-01-09 2015-01-08 Intra prediction of chroma blocks using the same vector
US14/592,819 2015-01-08
PCT/US2015/010783 WO2015106078A1 (en) 2014-01-09 2015-01-09 Intra prediction from a predictive block

Publications (2)

Publication Number Publication Date
CN105874797A true CN105874797A (zh) 2016-08-17
CN105874797B CN105874797B (zh) 2018-12-14

Family

ID=53496198

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201580003703.2A Expired - Fee Related CN105874797B (zh) 2014-01-09 2015-01-09 视频数据的编解码方法、装置、设备和存储媒体

Country Status (7)

Country Link
US (1) US9883197B2 (zh)
EP (1) EP3092802B1 (zh)
JP (1) JP2017508345A (zh)
KR (1) KR20160106616A (zh)
CN (1) CN105874797B (zh)
BR (1) BR112016015954A2 (zh)
WO (1) WO2015106078A1 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107786874A (zh) * 2016-08-24 2018-03-09 浙江大学 双向的帧内方向性预测方法和装置
CN109964482A (zh) * 2016-12-01 2019-07-02 高通股份有限公司 视频译码中的双边滤波器使用的指示
CN111492659A (zh) * 2018-02-05 2020-08-04 腾讯美国有限责任公司 视频编码的方法和装置
CN113366844A (zh) * 2019-02-02 2021-09-07 北京字节跳动网络技术有限公司 用于视频编解码中的帧内块复制的缓冲区中的数据存储
CN113508583A (zh) * 2019-03-04 2021-10-15 Lg 电子株式会社 基于帧内块编译的视频或图像编译

Families Citing this family (62)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20120140181A (ko) 2011-06-20 2012-12-28 한국전자통신연구원 화면내 예측 블록 경계 필터링을 이용한 부호화/복호화 방법 및 그 장치
US10015515B2 (en) 2013-06-21 2018-07-03 Qualcomm Incorporated Intra prediction from a predictive block
AU2013403224B2 (en) 2013-10-14 2018-10-18 Microsoft Technology Licensing, Llc Features of intra block copy prediction mode for video and image coding and decoding
CN105659602B (zh) 2013-10-14 2019-10-08 微软技术许可有限责任公司 用于视频和图像编码的帧内块复制预测模式的编码器侧选项
KR102275639B1 (ko) 2013-10-14 2021-07-08 마이크로소프트 테크놀로지 라이센싱, 엘엘씨 비디오 및 영상 코딩 및 디코딩에 대한 기본 색상 인덱스 맵 모드의 특징
CN105594211B (zh) * 2013-11-27 2019-03-15 寰发股份有限公司 用于图片的包括帧内区块复制模式的编码模式的发送方法
US10390034B2 (en) 2014-01-03 2019-08-20 Microsoft Technology Licensing, Llc Innovations in block vector prediction and estimation of reconstructed sample values within an overlap area
WO2015100726A1 (en) * 2014-01-03 2015-07-09 Microsoft Corporation Block vector prediction in video and image coding/decoding
US11284103B2 (en) 2014-01-17 2022-03-22 Microsoft Technology Licensing, Llc Intra block copy prediction with asymmetric partitions and encoder-side search patterns, search ranges and approaches to partitioning
US10542274B2 (en) 2014-02-21 2020-01-21 Microsoft Technology Licensing, Llc Dictionary encoding and decoding of screen content
AU2014385769B2 (en) 2014-03-04 2018-12-06 Microsoft Technology Licensing, Llc Block flipping and skip mode in intra block copy prediction
KR102319384B1 (ko) * 2014-03-31 2021-10-29 인텔렉추얼디스커버리 주식회사 템플릿 매칭 기반의 화면 내 픽쳐 부호화 및 복호화 방법 및 장치
JP6341756B2 (ja) * 2014-05-26 2018-06-13 キヤノン株式会社 画像処理装置、画像処理装置の制御方法
EP3158753B1 (en) 2014-06-19 2021-12-08 VID SCALE, Inc. Intra block copy coding with block vector derivation
KR102311815B1 (ko) 2014-06-19 2021-10-13 마이크로소프트 테크놀로지 라이센싱, 엘엘씨 통합된 인트라 블록 카피 및 인터 예측 모드
KR101748620B1 (ko) * 2014-06-20 2017-07-04 성균관대학교산학협력단 영상의 부호화/복호화 방법 및 이를 이용하는 장치
WO2015194913A1 (ko) * 2014-06-20 2015-12-23 성균관대학교 산학협력단 영상의 부호화/복호화 방법 및 이를 이용하는 장치
WO2016004850A1 (en) * 2014-07-07 2016-01-14 Mediatek Singapore Pte. Ltd. Method of intra block copy search and compensation range
US10412387B2 (en) 2014-08-22 2019-09-10 Qualcomm Incorporated Unified intra-block copy and inter-prediction
JP2017535145A (ja) 2014-09-30 2017-11-24 マイクロソフト テクノロジー ライセンシング,エルエルシー 波面並列処理が可能にされた場合のピクチャ内予測モードに関する規則
US9918105B2 (en) 2014-10-07 2018-03-13 Qualcomm Incorporated Intra BC and inter unification
US9591325B2 (en) * 2015-01-27 2017-03-07 Microsoft Technology Licensing, Llc Special case handling for merged chroma blocks in intra block copy prediction mode
US20160345018A1 (en) * 2015-05-19 2016-11-24 Microsoft Technology Licensing, Llc Video encoding and decoding
WO2016197314A1 (en) 2015-06-09 2016-12-15 Microsoft Technology Licensing, Llc Robust encoding/decoding of escape-coded pixels in palette mode
CN113473120A (zh) * 2015-06-11 2021-10-01 英迪股份有限公司 使用自适应去块滤波编码和解码图像的方法及其装置
WO2017139937A1 (en) * 2016-02-18 2017-08-24 Mediatek Singapore Pte. Ltd. Advanced linear model prediction for chroma coding
RU2710667C1 (ru) * 2016-05-28 2019-12-30 МедиаТек Инк. Способ и устройство привязки к текущему изображению для кодирования видео
US10999602B2 (en) 2016-12-23 2021-05-04 Apple Inc. Sphere projected motion estimation/compensation and mode decision
US11259046B2 (en) 2017-02-15 2022-02-22 Apple Inc. Processing of equirectangular object data to compensate for distortion by spherical projections
US10924747B2 (en) 2017-02-27 2021-02-16 Apple Inc. Video coding techniques for multi-view video
US11093752B2 (en) 2017-06-02 2021-08-17 Apple Inc. Object tracking in multi-view video
US10754242B2 (en) 2017-06-30 2020-08-25 Apple Inc. Adaptive resolution and projection format in multi-direction video
US20190005709A1 (en) * 2017-06-30 2019-01-03 Apple Inc. Techniques for Correction of Visual Artifacts in Multi-View Images
US10986349B2 (en) 2017-12-29 2021-04-20 Microsoft Technology Licensing, Llc Constraints on locations of reference blocks for intra block copy prediction
JP2019129371A (ja) * 2018-01-23 2019-08-01 富士通株式会社 動画像符号化装置、動画像符号化方法、動画像復号装置、動画像復号方法、及び動画像符号化用コンピュータプログラムならびに動画像復号用コンピュータプログラム
US11012715B2 (en) * 2018-02-08 2021-05-18 Qualcomm Incorporated Intra block copy for video coding
US10638137B2 (en) * 2018-03-07 2020-04-28 Tencent America LLC Method and apparatus for video coding
US10462483B1 (en) * 2018-04-26 2019-10-29 Tencent America LLC Method and apparatus for video coding
US10448025B1 (en) * 2018-05-11 2019-10-15 Tencent America LLC Method and apparatus for video coding
WO2020016795A2 (en) * 2018-07-17 2020-01-23 Beijing Bytedance Network Technology Co., Ltd. Block size restrictions for visual media coding
US11265579B2 (en) * 2018-08-01 2022-03-01 Comcast Cable Communications, Llc Systems, methods, and apparatuses for video processing
CN110933411B (zh) 2018-09-19 2023-12-12 北京字节跳动网络技术有限公司 用于帧内编码的邻近的相邻块的选择
US11140404B2 (en) * 2018-10-11 2021-10-05 Tencent America LLC Method and apparatus for video coding
US20200169757A1 (en) * 2018-11-23 2020-05-28 Mediatek Inc. Signaling For Multi-Reference Line Prediction And Multi-Hypothesis Prediction
CN113170181B (zh) 2018-11-29 2023-12-08 北京字节跳动网络技术有限公司 块内拷贝模式中的仿射继承方法
EP3896969A4 (en) * 2018-12-12 2022-09-14 Wilus Institute of Standards and Technology Inc. VIDEO SIGNAL PROCESSING METHOD AND APPARATUS USING AN ACTUAL IMAGE REFERENCE
WO2020156549A1 (en) 2019-02-02 2020-08-06 Beijing Bytedance Network Technology Co., Ltd. Buffer access methods for intra block copy in video coding
US11051035B2 (en) * 2019-02-08 2021-06-29 Qualcomm Incorporated Processing of illegal motion vectors for intra block copy mode in video coding
EP3915265A4 (en) 2019-03-01 2022-06-22 Beijing Bytedance Network Technology Co., Ltd. DIRECTION-BASED PREDICTION FOR INTRA BLOCK COPY IN VIDEO CODING
CN113508581B (zh) 2019-03-04 2023-11-14 北京字节跳动网络技术有限公司 视频编解码中的帧内块复制中的实施方式方面
US11012686B2 (en) * 2019-03-08 2021-05-18 Tencent America LLC Unified block vector prediction for intra picture block compensation
US20220182633A1 (en) * 2019-03-15 2022-06-09 Mediatek Inc. Method and Apparatus of Latency Reduction for Chroma Residue Scaling
US11070816B2 (en) 2019-06-18 2021-07-20 Tencent America LLC Conversion of decoded block vector for intra picture block compensation
US20220358685A1 (en) * 2019-06-24 2022-11-10 Nippon Telegraph And Telephone Corporation Image encoding method and image decoding method
KR20230170800A (ko) 2019-07-06 2023-12-19 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 비디오 코딩에서 인트라 블록 카피를 위한 가상 예측 버퍼
BR112022000358A2 (pt) 2019-07-10 2022-05-10 Beijing Bytedance Network Tech Co Ltd Método e aparelho para processar dados de vídeo e meios de armazenamento e gravação não transitórios legíveis por computador
EP3981146A4 (en) 2019-07-11 2022-08-03 Beijing Bytedance Network Technology Co., Ltd. BITSTREAM CONFORMITY RESTRICTIONS FOR INTRA-BLOCK COPY IN VIDEO ENCODING
MX2022001244A (es) 2019-08-06 2022-02-22 Beijing Bytedance Network Tech Co Ltd Restricción de tamaño basada en formato de color.
CN114342365A (zh) 2019-09-02 2022-04-12 北京字节跳动网络技术有限公司 基于色彩格式的视频区分割
WO2021047544A1 (en) 2019-09-09 2021-03-18 Beijing Bytedance Network Technology Co., Ltd. Intra block copy coding and decoding
JP7332795B2 (ja) 2019-09-21 2023-08-23 北京字節跳動網絡技術有限公司 クロマ・イントラモードのベースとなるサイズ制約
WO2023200241A1 (ko) * 2022-04-12 2023-10-19 한국전자통신연구원 화면내 블록 복사를 이용한 비디오 부호화/복호화를 위한 방법 및 장치

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101326831A (zh) * 2005-10-18 2008-12-17 高通股份有限公司 用于视频编码的选择性去块滤波技术
CN102137257A (zh) * 2011-03-01 2011-07-27 北京声迅电子有限公司 基于tms320dm642芯片的嵌入式h.264编码方法
CN102792698A (zh) * 2010-02-18 2012-11-21 高通股份有限公司 用于运动内插法的色度高精度运动滤波
US20130230105A1 (en) * 2010-09-07 2013-09-05 Sk Telecom Co., Ltd. Intra-prediction encoding/decoding apparatus and method for omitting the transmission of prediction mode information using characteristics of reference pixels

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100255754B1 (ko) 1997-08-30 2000-05-01 전주범 이진 형상 신호 부호화 방법
US6091777A (en) 1997-09-18 2000-07-18 Cubic Video Technologies, Inc. Continuously adaptive digital video compression system and method for a web streamer
US5987180A (en) 1997-09-26 1999-11-16 Sarnoff Corporation Multiple component compression encoder motion search method and apparatus
US6665344B1 (en) 1998-06-29 2003-12-16 Zenith Electronics Corporation Downconverting decoder for interlaced pictures
US7110459B2 (en) 2002-04-10 2006-09-19 Microsoft Corporation Approximate bicubic filter
KR100896279B1 (ko) 2005-04-15 2009-05-07 엘지전자 주식회사 영상 신호의 스케일러블 인코딩 및 디코딩 방법
KR100727969B1 (ko) 2005-08-27 2007-06-14 삼성전자주식회사 영상의 부호화 및 복호화 장치와, 그 방법, 및 이를수행하기 위한 프로그램이 기록된 기록 매체
WO2007093629A1 (en) 2006-02-17 2007-08-23 Thomson Licensing Process for coding images using intra prediction mode
US20080031333A1 (en) 2006-08-02 2008-02-07 Xinghai Billy Li Motion compensation module and methods for use therewith
US8259804B2 (en) 2007-01-03 2012-09-04 International Business Machines Corporation Method and system for signal prediction in predictive coding
KR101408698B1 (ko) 2007-07-31 2014-06-18 삼성전자주식회사 가중치 예측을 이용한 영상 부호화, 복호화 방법 및 장치
KR101452859B1 (ko) 2009-08-13 2014-10-23 삼성전자주식회사 움직임 벡터를 부호화 및 복호화하는 방법 및 장치
KR101441905B1 (ko) 2009-11-18 2014-09-24 에스케이텔레콤 주식회사 후보 예측 움직임 벡터 집합 선택을 이용한 움직임 벡터 부호화/복호화 방법 및 장치와 그를 이용한 영상 부호화/복호화 방법 및 장치
ES2659189T3 (es) 2010-04-13 2018-03-14 Ge Video Compression, Llc Herencia en subdivisión de árbol múltiple de matriz de muestras
US8548062B2 (en) 2010-07-16 2013-10-01 Sharp Laboratories Of America, Inc. System for low resolution power reduction with deblocking flag
ES2586946T3 (es) 2010-07-30 2016-10-19 Deutsche Telekom Ag Método y aparato para evaluar la calidad de una secuencia de vídeo mediante la sincronización temporal del flujo de bits encriptado de un codificador de vídeo con la secuencia de vídeo procesada obtenida por un descodificador de vídeo exterior
CN103283231B (zh) 2011-01-12 2018-04-27 西门子公司 在视频编码器中参考图像的压缩和解压缩
US8711248B2 (en) 2011-02-25 2014-04-29 Microsoft Corporation Global alignment for high-dynamic range image generation
GB2495990A (en) 2011-10-28 2013-05-01 Canon Kk Motion compensated image coding with omission of coding mode cost calculation for a motion predictor in a set.
WO2013077659A1 (ko) 2011-11-24 2013-05-30 에스케이텔레콤 주식회사 모션 벡터의 예측 부호화/복호화 방법 및 장치
US10015515B2 (en) 2013-06-21 2018-07-03 Qualcomm Incorporated Intra prediction from a predictive block
US20150016533A1 (en) 2013-07-12 2015-01-15 Qualcomm Incorporated Intra motion compensation extensions
CN105594211B (zh) * 2013-11-27 2019-03-15 寰发股份有限公司 用于图片的包括帧内区块复制模式的编码模式的发送方法
US20150271515A1 (en) 2014-01-10 2015-09-24 Qualcomm Incorporated Block vector coding for intra block copy in video coding

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101326831A (zh) * 2005-10-18 2008-12-17 高通股份有限公司 用于视频编码的选择性去块滤波技术
CN102792698A (zh) * 2010-02-18 2012-11-21 高通股份有限公司 用于运动内插法的色度高精度运动滤波
US20130230105A1 (en) * 2010-09-07 2013-09-05 Sk Telecom Co., Ltd. Intra-prediction encoding/decoding apparatus and method for omitting the transmission of prediction mode information using characteristics of reference pixels
CN102137257A (zh) * 2011-03-01 2011-07-27 北京声迅电子有限公司 基于tms320dm642芯片的嵌入式h.264编码方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
M. NACCARI等: "HEVC Range extensions test model 5 encoder description", 《JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG16 WP3 AND ISO/IEC JTC1/SC29/WG11 15TH MEETING: GENEVA》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107786874A (zh) * 2016-08-24 2018-03-09 浙江大学 双向的帧内方向性预测方法和装置
CN109964482A (zh) * 2016-12-01 2019-07-02 高通股份有限公司 视频译码中的双边滤波器使用的指示
CN109964482B (zh) * 2016-12-01 2021-07-02 高通股份有限公司 视频译码中指示双边滤波器使用的方法
CN111492659A (zh) * 2018-02-05 2020-08-04 腾讯美国有限责任公司 视频编码的方法和装置
CN111492659B (zh) * 2018-02-05 2023-08-08 腾讯美国有限责任公司 视频解码的方法和装置、及存储介质
CN113366844A (zh) * 2019-02-02 2021-09-07 北京字节跳动网络技术有限公司 用于视频编解码中的帧内块复制的缓冲区中的数据存储
CN113508583A (zh) * 2019-03-04 2021-10-15 Lg 电子株式会社 基于帧内块编译的视频或图像编译

Also Published As

Publication number Publication date
US20150195559A1 (en) 2015-07-09
KR20160106616A (ko) 2016-09-12
CN105874797B (zh) 2018-12-14
EP3092802B1 (en) 2020-08-12
US9883197B2 (en) 2018-01-30
JP2017508345A (ja) 2017-03-23
BR112016015954A2 (pt) 2017-08-08
EP3092802A1 (en) 2016-11-16
WO2015106078A1 (en) 2015-07-16

Similar Documents

Publication Publication Date Title
CN105874797B (zh) 视频数据的编解码方法、装置、设备和存储媒体
CN105393536B (zh) 使用位移向量从预测性块的帧内预测
CN106797477B (zh) 用于解码及编码视频数据的方法和设备
CN103828374B (zh) 参考图片信令和经解码图片缓冲器管理
CN105580365B (zh) 处理视频数据的方法、装置及存储媒体
CN104704833B (zh) 多视图或3维视频译码中的高级视图间残差预测
CN103797799B (zh) 用于视频译码的运动向量确定
CN104396250B (zh) 用于3d视频译码的深度图的帧内译码的方法和装置
CN110024403A (zh) 用于视频译码的仿射运动模型的运动向量生成
CN103975595B (zh) 用于视频译码的分段参数集
CN107592972A (zh) 用于视频数据中特定图片内的帧间译码的搜索区域确定
CN109891890A (zh) 视频译码中基于子pu的双向运动补偿
CN105103560A (zh) 用于仅高级语法可缩放视频译码的层间参考图片限制
CN106664425A (zh) 视频译码中的跨分量预测
CN106416245A (zh) 用于块内复制的系统和方法
CN106464885A (zh) 块自适应颜色空间转换译码
CN105580364A (zh) Hevc中的基于子预测单元(pu)的时间运动向量预测和3d-hevc中的子pu设计
CN106576171A (zh) 统一帧内块复制和帧间预测
CN106105216A (zh) 用于3d视频译码的受约束深度帧内模式译码
CN105637878A (zh) 在视频译码中用于基于子解码图片缓冲器(sub-dpb)的dpb操作的传信
CN105814896A (zh) 3d视频译码中的大型块和深度建模模式(dmm)
CN104025602A (zh) 三维视频译码中用信号通知视图合成预测支持
CN104335586A (zh) 运动向量舍入
CN104904213A (zh) 可缩放及多视角视频译码中的高级残差预测
CN104685883A (zh) 用于3d视频的经视图间预测运动向量

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20181214

Termination date: 20220109