CN103262540A - 通过帧内模式预测而用于帧内编码的改进的多个预测器集合 - Google Patents

通过帧内模式预测而用于帧内编码的改进的多个预测器集合 Download PDF

Info

Publication number
CN103262540A
CN103262540A CN2011800468853A CN201180046885A CN103262540A CN 103262540 A CN103262540 A CN 103262540A CN 2011800468853 A CN2011800468853 A CN 2011800468853A CN 201180046885 A CN201180046885 A CN 201180046885A CN 103262540 A CN103262540 A CN 103262540A
Authority
CN
China
Prior art keywords
group
frame
mode
frame mode
internal schema
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2011800468853A
Other languages
English (en)
Other versions
CN103262540B (zh
Inventor
刘凌志
李贵春
凌南
郑建铧
张成雄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Publication of CN103262540A publication Critical patent/CN103262540A/zh
Application granted granted Critical
Publication of CN103262540B publication Critical patent/CN103262540B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • H04N19/198Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters including smoothing of a sequence of encoding parameters, e.g. by averaging, by choice of the maximum, minimum or median value
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

一种设备,其包含编解码器,用于预测相关块的帧内模式,预测的依据是所述相关块的多个相邻块所用的多个模式的多个组编号以及多个对应的组索引,其中如果所预测的帧内模式并不匹配实际帧内模式,则对应于所述相关块的所述实际帧内模式的组编号进行编码并发送。还揭示一种网络部件,其包含:处理器,用于预测相关块的帧内模式,预测依据的是所述相关块的两个相邻块所用的两个模式的最小组编号和最小组索引;以及发射器,用于在实际帧内模式不匹配所预测的帧内模式的情况下,发送用于所述相关块的所述实际帧内模式的组编号的编码位。

Description

通过帧内模式预测而用于帧内编码的改进的多个预测器集合
相关申请案的交叉参考
本发明要求2010年9月30日由刘灵智(Lingzhi Liu)等人递交的发明名称为“通过帧内模式预测而用于帧内编码的改进的多个预测器集合(Improved Multiple Predictor Set Intra Coding with Intra Mode Prediction)”的第61/388,485号美国临时专利申请案的在先申请优先权,并且要求2011年9月28日由刘灵智(Lingzhi Liu)等人递交的发明名称为“通过帧内模式预测而用于帧内编码的改进的多个预测器集合(Improved MultiplePredictor Set For Intra Coding with Intra Mode Prediction)”的第13/247,555号美国非临时专利申请案的在先申请优先权,这两个申请案均以全文引入的方式并入本文本中。
关于由联邦政府资助的研发的声明
不适用。
参考缩微胶片附录
不适用。
技术领域
背景技术
例如,当数据将要在带宽容量受限的通信网络中流过或以其他方式传送时,需要对大量的视频数据进行描述,即使在影片相对短小的情况下也是如此。因此,视频数据通常要先压缩然后在现代电信网络中传送。视频压缩装置常常在源处使用软件和/或硬件,以对视频数据进行编码然后传输,从而减少用来表示数字视频图像所需的数据量。接着,压缩数据在目的地处由视频解压装置接收,该视频解压装置用于对视频数据进行解码。由于网络资源受限,因此需要能提高压缩率但大体上不会降低图像质量的改进压缩/解压技术。
发明内容
在一项实施例中,本发明包括一种设备,所述设备包含编解码器,用于预测相关块的帧内模式,预测依据的是所述相关块的多个相邻块所用的多个模式的多个组编号(group number)以及多个对应的组索引(groupindex),其中如果所预测的帧内模式并不匹配实际帧内模式,则对对应于相关块的实际帧内模式的组编号进行编码并发送。
在另一项实施例中,本发明包括一种网络部件,所述网络部件包含:处理器,用于预测相关块的帧内模式,预测依据的是所述相关块的两个相邻块所用的两个模式的最小组编号和最小组索引;以及发射器,用于在实际帧内模式不匹配所预测的帧内模式的情况下,发送用于所述相关块的实际帧内模式的组编号的编码位。
在另一项实施例中,本发明包括一种网络部件,所述网络部件包含:接收器,用于在实际帧内模式不匹配所预测的帧内模式的情况下,接收用于相关块的所述实际帧内模式的组编号的编码位;以及处理器,用于对组编号进行解码,并且使用所解码的组编号来识别实际帧内模式,依据的是所预测的帧内模式以及帧内模式的多个组编号与多个对应的组之间的映射。
在另一项实施例中,本发明包括一种由至少一个编解码器部件实施的方法,所述方法包含:获得相关块的两个相邻块所用的两个帧内模式的最小组编号;获得相关块的所述两个相邻块的所述两个帧内模式的最小组索引编号;将最小组编号和最小组索引编号映射到用于相关块的所预测的帧内模式;确定所预测的帧内模式是否匹配用于相关块的实际帧内模式;以及如果所预测的帧内模式不匹配实际帧内模式,则发送实际帧内模式的编码组编号。
从结合附图和权利要求书进行的以下详细描述中将更清楚地理解这些和其他特征。
附图说明
为了更完整地理解本发明,现在参考以下结合附图和详细描述进行的简要描述,其中相同参考标号表示相同部分。
图1是在多个预测器集合中的帧内模式的一项实施例的示意图。
图2是帧内模式预测方案的一项实施例的示意图。
图3是帧内模式的使用百分比的一项实施例的曲线图。
图4是帧内模式预测方法的一项实施例的流程图。
图5是发射器/接收器单元的一项实施例的示意图。
图6是通用计算机系统的一项实施例的示意图。
具体实施方式
首先应理解,尽管下文提供一项或多项实施例的说明性实施方案,但所揭示的系统和/或方法可使用任何数目的技术来实施,无论该技术是当前已知还是现有的。本发明决不应限于下文所说明的说明性实施方案、附图和技术,包括本文所说明并描述的示例性设计和实施方案,而是可在所附权利要求书的范围以及其等效物的完整范围内进行修改。
通常,视频媒体涉及相对较快地连续显示一系列静态图像或帧,从而让观察者感觉到运动。每个帧可包含多个图像元素或像素,每个图像元素或像素可表示帧中的单个参考点。在数字处理期间,每个像素可被分配一个整数值(例如,0、1、......或255),所述整数值表示对应参考点处的图像质量或特征,例如,亮度或色度。通常,单个帧内的像素组(宏块)可大体上与相同帧内的其他宏块相关,这样,一些宏块的像素值可能仅略有不同和/或显示出重复的纹理。现代视频压缩方法使用各种技术来利用这些空间相关性(spatial correlation),这些技术共同可称为帧内预测。帧内预测可减少同一帧中相邻和/或邻近宏块(本文中也称为块)之间的空间冗余,从而在没有大幅度降低图像质量的情况下对视频数据进行压缩。各种传统视频/图像编码标准描述了不同的帧内预测形式,所述标准例如,国际电信联盟(ITU)电信标准化部门(ITU-T)H.264(以下称为H.264)和国际标准化组织(ISO)/国际电工委员会(IEC)活动图像专家组(MPEG)4Visual,这两者均以全文引入的方式并入本文本中。
实际上,帧内预测可由视频编码器/解码器(编解码器)实施,以根据一个或多个先前编码/解码的邻近块插入预测块,从而形成近似的当前块。因此,编码器和解码器可独立地插入预测块,从而使得大部分的帧和/或图像能够通过相对少量的参考块的通信进行重构,所述参考块例如,位于帧的左上角(并从此处延伸)的块。然而,单独的帧内预测并不为现代视频再现质量足够的图像,因此,残余消息等纠错消息可在编码器与解码器之间传送,以纠正预测块与当前块之间的差异。例如,编码器可从当前块中减去预测块,从而得到残余块,接着所述残余块可进行变换、量化以及扫描,然后被编码成编码数据流。接收编码数据流之后,解码器可将重构的残余块添加到单独产生的预测块上,以重新创建当前块。虽然重新创建的当前块可能是原始当前块的缺陷版本,例如,归因于帧内编码压缩的损耗性质,但是它们的差异可能很小,人眼几乎无法察觉。因此,可得到大量的位节约(bit saving),而不会显著降低重构图像的质量。
残余块可包含预测块与当前块之间的差异,因此,例如,在预测块与当前块相同和/或近乎相同的区域,残余块的许多离散值,例如,像素数据,可包含零和/或接近零的系数。此外,残余块的变换、量化和/或扫描可从数据流中移除许多零和/或接近零的系数,从而引起对视频数据的进一步压缩。因此,对原始图像进行更精确的预测便可得到编码效率。为了利用这些编码效率,传统视频/图像编码标准可提高预测精确性,方式为在帧内预测期间使用多个预测模式,例如,每个预测模式可产生唯一的纹理。编码器可针对每个当前块选择预测最精确的预测模式,因此,与其他使用较少预测模式的编码器相比,可进行更精确的预测(平均来说)。例如,最近的研究表明,与使用较少预测模式的惯例相比,例如,H.264,其仅使用9个帧内预测模式,使用36个帧内预测模式的惯例可更精确地预测复杂的纹理。帧内预测模式在本文中也互换地称为帧内模式、预测模式,以及预测器。然而,在独立产生预测块时,编码器和解码器必须使用相同的预测模式,因而在某些情况下,编码器可能需要在数据流的开销中传送所选的预测模式,例如,在所选的预测模式不匹配所预测的预测模式的情况下。因此,例如,就所传输的位而言,在帧内预测期间增加预测模式的数目可导致开销量更大,从而减少(或在某些情况下消除)因预测精确性提高而实现的位节约。
例如,使用直流(DC)预测模式等单个预测模式的编解码器可能不需要任何附加位(overhead bit)来传送预测模式,这是因为预测模式保持不变,因此为解码器已知。或者,使用9个可能的预测模式(例如,模式零、模式一、......、模式八)的编解码器可能需要四个附加位,以将所选的预测模式直接传送到编码器。同样,使用36个可能的预测模式的编解码器可能需要六个附加位,以将所选的预测模式直接传送到编码器。每块四个(或六个)附加位可在整个帧和/或帧的序列上构成大量的开销,并且可能显著降低编码效率。因此,在某些情况下,因预测精确性提高而得到的位节约可部分地(或完全地)由传送额外的预测模式组合所需的额外开销抵消。
为了减少与预测模式组合增加相关的位成本,现代视频编解码器可尝试基于一个或多个邻近块的预测模式来预测当前块的预测模式。例如,如果位于预测块正上方的邻近块具有垂直预测模式,则编解码器可预测出对应于当前块的预测模式可能也是垂直的。此外,如果所选的预测模式匹配所预测的预测模式,则编解码器(例如,编码器)可清除标志。否则,编解码器可设置标志。重要的是,只有预测不正确,才对所选的预测模式进行编码。因此,在预测正确时,可仅传输一个附加位,例如,一个标志位,从而造成两个位的附加位节约,例如,与预测模式的直接传送相比。或者,在预测不正确时,可传输四个附加位,例如,一个标志位和三个指示正确预测模式的位,从而造成一个位的附加位成本,例如,与预测模式的直接传送相比。因此,如果预测正确,则对预测模式进行预测可导致开销节约,而如果预测不正确,则增加开销成本。
利用9个可能的预测模式的编解码器经常,例如,多半能正确地预测出所选的预测模式,因此,上述单层预测方法往往在减少开销成本方面相对有效。另一方面,编解码器正确地预测出所选的预测模式的总体概率会随着额外预测模式的使用而降低,因此,编码效率可相应地受损和/或降低。例如,使用36个预测模式组合(例如,模式一、模式二、......、模式三十六)的编解码器在其他情况不变时,不太可能正确地预测出所选的预测模式,例如,这是因为正确答案与不正确答案的比率与可能的预测模式数目成比例降低。
对于亮度块,H.264针对4x4和8x8块引进共9个帧内模式。9个预测器包括8个定向模式和1个非定向模式,所述非定向模式为帧内DC模式。最新的视频编码技术使用更多的帧内模式,以提高预测精确性。在视频编码联合协作小组(JCT-VC)正在考虑的测试模型(TMuC)中,该JCT-VC致力于下一代国际视频编码标准,当前最佳的帧内预测具有达到34个模式(33个定向模式和1个DC模式)。如上所述,这使得对纹理复杂的块进行预测的精确性更高,但是位流中需要更多的位来表示预测模式。
本文揭示一种用于提高帧内预测精确性的系统和方法,所述系统和方法可降低位速率,而且提高视频压缩系统中的编码效率。因此,预测模式(本文也称为预测器)可分成多个组。在编码和解码过程中,当前块所用的帧内模式可根据相邻块而更精确地预测出,因此,节约了表示帧内模式的位。每个预测模式可由组编号或该组中的组索引或索引编号来表示,根据需要可传输所述编号,而非传输帧内模式编号。基于组编号和组索引(或索引编号),当前块的预测模式可依据在空间上编码的相邻块来进行预测。此方案可节约用于对预测模式编码的位。该方案可用于TMuC中的34个模式,所述模式可分成四组,如下所述。
图1示出多个预测器集合中的帧内模式100的一项实施例。帧内模式100可包含约36个预测模式,所述预测模式可包括TMuC预测模式。帧内模式100可包含定向模式和非定向模式,这些模式可用于帧内预测。帧内模式100可分成约4组(G0、G1、G2和G3),其中每组可包含约9个预测模式。每组可由组编号(例如,从0到3)表示,并且一组中的每个预测模式可由组索引或索引编号(例如,从0到8)表示。第一组(G0)可包含与H.264/高级视频编码(AVC)相同的预测器。其余的组(G1、G2和G3)的获取方式可为,使第一组(G0)旋转预定的角度,例如,图1中的π/32。非预测模式可包含G0中的DC或帧内DC模式(索引编号为2)、G1中的平面模式(索引编号为34),以及G2中的双向模式(索引编号为35)。使用更多的非定向模式可使帧内预测更精确。
以上每个预测模式可由指定的组编号和组索引(或索引编号)识别。表1示出分配给每个预测模式的组编号和组索引(或索引编号)的一项实施例。行对应于4个组,其中每行表示一个组编号(例如,从0到3)。列对应于每个组中的9个预测模式,其中每列表示组索引或索引编号(例如,从0到8)。表1中的条目对应于不同的预测模式,并且表示帧内模式编号。组编号(行编号)和组索引或索引编号(列编号)可用于表示对应的帧内模式编号。例如,模式编号0可由组编号0和索引编号0来表示,模式编号31可由组编号3和索引编号8来表示。
Figure BDA00002979288200071
Figure BDA00002979288200081
表1:用于多个帧内模式的组编号和组索引。
如上所述,随着所用的帧内模式(或预测器)数目增加,提高对帧内模式的预测效率变得更加重要或有利。图2示出TMuC(例如,TMuC0.7)中使用的一种帧内预测方法。具体而言,用于对当前块进行编码/解码的帧内模式被预测为一个最小值,即,用于对相关块上方的第一块进行编码/解码的第一帧内模式编号与用于对相关块左边的第二块进行编码/解码的第二帧内模式编号之间的最小值。在第一块(位于相关块的上方)和第二块(位于相关块的左边)中的任一者都不可用的情况下,可将用于相关块的帧内模式设置为DC模式。此种帧内模式预测方法可表示为:
PredCurrentMode=Min(AboveIntraMode,LeftIntraMode),
其中PredCurrentMode是针对相关块所预测的帧内模式,AboveIntraMode是用于第一(顶部)块的第一帧内模式,且LeftIntraMode是用于第二(左边)块的第二帧内模式。此方法的不利之处在于:如果所预测的帧内模式并非用来对块(例如,在编码器处)进行编码的实际帧内模式,那么用于编码的实际帧内模式编号应包括在位流中而被发送到解码器。编码器可基于所预测的帧内模式是否匹配实际使用的帧内模式来确定是否将帧内模式编号发送到解码器。在模式的数目较大时,例如,在TMuC中,在位流中发送帧内模式编号可能会增加开销(例如,宽带使用)。
图2还示出改进的帧内预测方法的一项实施例,所述方法可用于TMuC等中,以基于所预测的模式的组编号和组索引(或索引编号)来减少开销。在所预测的帧内模式并不匹配用于相关块的实际帧内模式的情况下,可发送对应于用于编码的实际帧内模式编号的组编号和组索引,而不是发送实际帧内模式编号。在顶部块和左边块中的任一者都不可用的情况下,可将用于相关块的帧内模式设置为DC模式,与上述当前使用的方法类似。平均而言,组编号中的总位数可能比帧内模式编号中的总位数小。随着更多的帧内模式用于帧内预测,可进一步提高所传输的位流中的这种节约。
具体而言,用于相关块的帧内模式的组编号被预测为一个最小值,即,用于相关块上方的顶部块的帧内模式的第一组编号与用于相关块的左边块的帧内模式的第二组编号之间的最小值。类似地,用于相关块的帧内模式的组索引或索引编号被预测为一个最小值,即,用于顶部块的帧内模式的第一索引编号与用于左边块的帧内模式的第二索引编号之间的最小值。所指示的组编号和组索引(或索引编号)接着可用于获得帧内模式编号,例如,使用表1或类似的映射数据结构来获得。此帧内模式预测方法可表示为:
PredCurrentMode=ModeTable[Min(AboveGroup,LeftGroup),Min(AboveIdx,LeftIdx)],
其中AboveGroup是用于顶部块的帧内模式的组编号,LeftGroup是用于左边块的帧内模式的组编号,AboveIdx是用于顶部块的帧内模式的索引编号,且LeftInx是用于左边块的帧内模式的索引编号。
在上文所揭示的方法中,对应于用于相关块(例如,位于编码器处)的实际帧内模式的当前组编号CurrentGroup可被预测为:
PredCurrentGroup=Min(AboveGroup,LeftGroup)。
预测结果可对应于以下两种情况中的一种:
1)如果CurrentGroup等于PredCurrentGroup,则设置为“1”的一个位可进行编码并且在位流中发送(从编码器发送到解码器)。这可表明CurrentGroup匹配PredCurrentGroup,其中无需为解码器指出所预测的帧内模式,因为解码器可成功地预测出块的实际帧内模式。
2)如果CurrentGroup不等于PredCurrentGroup,则设置为“0”的一个位可首先进行编码。这可表明CurrentGroup不匹配PredCurrentGroup,因此组编号(而不是帧内模式编号)应进行编码并且在位流中向解码器指出。在某些实施例中,索引编号也可进行编码并在位流中指出。然而,将索引编号与组编号一起发送可能会增加开销。为了对用于块的实际帧内模式的当前组编号CurrentGroup进行编码,可实施以下公式:
CurrentGroup=CurrentGroup>PredCurrentGroup?CurrentGroup-1:CurrentGroup。
结果可编码在位流中。
如图1的情况所述,针对36个预测模式(在TMuC中)可存在4个组。如果在编码器侧CurrentGroup不等于PredCurrentGroup,则“0”值位可首先进行编码,以指示不匹配。接着,编码器可对CurrentGroup进行编码,依据的是:
CurrentGroup=CurrentGroup>PredCurrentGroup?CurrentGroup-1:CurrentGroup。
因此,如果CurrentGroup=0,则在位“0”之后,设置为“1”的位可在位流中进行编码。如果CurrentGroup=1或2,则两个位“00”或“01”可分别进行编码。在解码器侧,解码器可首先对“0”位进行解码,并且如果所解码的下一位是“1”,则解码器可得到CurrentGroup=0。否则,如果所解码的下一位是“0”,则解码器还可对位流中的一个以上位进行解码。如果“0”位之后的一个以上解码位是“0”,则解码器可得到CurrentGroup=1。否则,如果“0”位之后的一个以上解码位是“1”,则解码器可得到CurrentGroup=2。随后,解码器可对CurrentGroup值进行解码,依据的是以下方程式:
CurrentGroup=CurrentGroup>=PredCurrentGroup?CurrentGroup+1:CurrentGroup。
这种编码/解码方案不会增加编码器/解码器中的实施复杂性,并且可在未实质改变TMuC中的当前预测方法的情况下实施。
在TMuC,例如,TMuC0.7中,可针对每个预测单元(PU)或预测块执行两轮率失真(R-D)成本搜索。例如,使用哈达玛变换,第一轮可计算出用于定向帧内模式集合的原始(实际)块与预测块之间的绝对误差和(SAD)。SAD值最低的所测试的定向模式可被选作估计出的最佳定向帧内模式,并且可与基本预测模式集合中的预测器进行比较(预测器集合可根据PU大小而变化),方式为在第二轮中使用实际R-D成本计算。为了更好地利用上述所揭示的帧内模式预测方法(使用组编号和组索引),可在第二轮R-D搜索中计算额外的帧内模式。例如,针对4x4PU,可将帧内模式34(平面模式)添加到第二轮R-D搜索。由于相同组中的帧内模式可具有用于语法(例如,4x4、8x8、16x16和32x32PU)的不同位长度,因此,如果最佳定向模式既不属于G0也不属于G1,则G0和G1中的相同索引编号内的预测模式可与所估计的最佳定向模式一起计算。
表2示出使用两轮R-D成本搜索和所揭示的帧内预测方法(基于组编号和组索引)的测试结果。测试结果表明多个分辨率级别(级别B、C、D和E)的平均编码增益如下:帧内高效率帧内配置测试时为约0.6%,且帧内低复杂性配置测试时为约0.7%。结果表明,通过所揭示的方法,分辨率较高的序列的编码增益得以提高,因为有更多的预测单元可供选择,并且更多的方向可用于帧内预测。例如,对于1080P分辨率序列(级别B),所揭示的方法可产生约0.6%和0.7%的平均编码增益。对于720P序列(级别E),可实现0.8%和0.9%的编码增益。
Figure BDA00002979288200111
Figure BDA00002979288200121
表2:使用所揭示方法的帧内模式的编码增益。
图3示出基于所揭示方法的帧内模式的使用百分比的一项实施例。在测试所述方法期间,收集所编码的帧内预测模式编号的数据。图3示出的曲线图表明1080P序列上所有所编码的帧内预测器中每个帧内预测器(帧内模式)的平均使用百分比。表3也示出所有所编码的帧内预测器的平均使用百分比。在所有针对亮度的帧内模式中,使用约6.7%的综合平面模式(模式34)(Y BD率)。图3中,平面模式被标记为平面。此使用百分比比其他模式高,模式0、1和2除外。这可表明,例如,针对多数情况和/或PU而言,可能有必要在帧内预测中使用平面模式。
模式编号 0 1 2 3 4 5 6 7 8 9 10 11
百分比 14.6% 13.8% 12.6% 4.1% 3.4% 4.3% 3.0% 4.0% 5.7% 1.6% 1.5% 2.5%
模式编号 12 13 14 15 16 17 18 19 20 21 22 23
百分比 1.7% 1.2% 1.7% 1.8% 3.6% 0.5% 0.5% 0.3% 0.5% 1.5% 1.1% 0.6%
模式编号 24 25 26 27 28 29 30 31 32 33 34
百分比 0.4% 0.4% 0.5% 0.5% 0.6% 1.2% 1.6% 1.2% 0.4% 0.3% 6.7%
表3:用于每个帧内模式编号的使用百分比(1080P序列)。
图4示出帧内模式预测方法400的一项实施例的流程图,该方法基于组编号和组索引。帧内模式预测方法400可用于提高所发送的帧内模式(从编码器发送到解码器)的编码增益,从而减少位流过载的情况。例如,方法400可在编码器处实施。方法400可在块402处开始,其中方法400可确定相关块上方的块以及相关块左边的块是否都可用。如果块402中的条件为真,则方法400可前进到块406。否则,方法400可前进到块404。在块404处,用于相关块的所预测的模式可设置为DC,例如,在相关块上方的块和/或左边的块不可用的情况下。或者,在块406处,可获得用于相关块上方的块和左边的块的实际模式的最小组编号。在块408处,可获得用于相关块上方的块和左边的块的实际模式的最小组索引。在块410处,所预测的模式可设置为对应于最小组编号和最小组索引的帧内模式。例如,可使用类似于表1的映射表或任何数据结构来实施映射。
接着,在块412处,方法400可确定所预测的组编号是否匹配相关块的实际组编号。如果块412中的条件为真,则方法400可前进到块414。否则,方法400可前进到块416。在块414处,可在位流中发送设置为“1”的一个位。这可向解码器指出,所预测的组编号匹配相关块的实际组编号。在这种情况下,可能无需向解码器指定所预测的组编号,因为解码器能够成功地预测出相关块的帧内模式。随后,方法400可前进到422。或者,在块416处,可在位流中发送设置为“0”的一个位。这可向解码器指出,位流中的后续位指定用于相关块的实际组编号。在块418处,用于实际模式的组编号可编码成一个或两个位,如上所述。在块420处,所编码的组编号可发送到位流中。例如,使用上述公式来对CurrentGroup进行编码,如果CurrentGroup是G0,则一个位可设置为“1”,或者如果CurrentGroup是G1,则两个位可设置为“00”,如果CurrentGroup是G2,则可设置为“01”。随后,方法400可前进到422。在其他实施例中,不同于上述的位值可用于对组编号进行编码。
接着,在块422处,方法400可确定所预测的索引编号是否匹配用于相关块的实际索引编号。如果块422中的条件为真,则方法400可前进到块424。否则,方法400可前进到块426。在块424处,可在位流中发送设置为“1”的一个位。这可向解码器指出,所预测的索引编号匹配用于相关块的实际索引编号。在这种情况下,可能无需向解码器指定所预测的组编号,因为解码器能够成功地预测出相关块的帧内模式。随后,方法400可结束。或者,在块426处,可在位流中发送设置为“0”的一个位。这可向解码器指出,位流中的后续位指定用于相关块的实际索引编号。在块428处,用于实际模式的索引编号可编码成三个位,如上所述。在块420处,所编码的组编号可发送到位流中。例如,使用上述公式来对CurrentIndex进行编码,如果CurrentGroup是0,则三个位可设置为“000”。随后,方法400可结束。在其他实施例中,不同于上述的位值可用于对索引编号进行编码。
图5示出发射器/接收器单元500的一项实施例,该单元可位于、耦接到本文所述的任一编解码器(编码器/解码器)或者网络或系统内任何其他部件,或成为其一部分。。发射器/接收器单元500可以是如本文所述的用于处理图像的任何装置。例如,发射器/接收器单元500可对应于或可位于图像发射器和/或接收器处的媒体控制器中。发射器/接收器单元500可包含:多个输入端口510和/或接收器单元512,用于从其他编解码器接收数据;逻辑单元或处理器520,用来处理图像并且确定将数据发送到哪些编解码器;以及多个输出端口530和/或发射器单元532,用于将数据传输到其他编解码器。逻辑单元或处理器520可用于实施本文所述的任一方案,包括帧内模式预测方法400,并且可使用硬件、软件或这两者来实施。
上述方案可在任何通用网络部件上实施,例如计算机或特定网络部件,其具有足够的处理能力、存储资源和网络吞吐能力来处理其上的必要工作量。图6示出典型的通用网络部件或计算机系统600,其适用于实施本文所揭示的节点的一项或多项实施例。通用网络部件或计算机系统600包括处理器602(可称为中央处理器单元或CPU),所述处理器与包括以下项的存储装置通信:辅助存储器604、只读存储器(ROM)606、随机存取存储器(RAM)608、输入/输出(I/O)装置610,以及网络连接装置612。处理器可作为一个或多个CPU芯片实施,或者可为一个或多个专用集成电路(ASIC)和/或数字信号处理器(DSP)的一部分。
辅助存储器604通常包含一个或多个磁盘驱动器或磁带驱动器,用于数据的非易失性存储,且在RAM608的大小不足以保存所有工作数据的情况下用作溢流数据存储器。辅助存储器604可用于存储程序,当选择执行这些程序时,所述程序将加载到RAM608中。ROM606用于存储在执行程序期间读取的指令,且可能存储所读取的数据。ROM606是非易失性存储装置,其存储容量相对于辅助存储器的较大存储容量而言通常较小。RAM608用于存储易失性数据,还可能用于存储指令。访问ROM606和RAM608通常比访问辅助存储器604要快。
本文揭示至少一项实施例,且所属领域的技术人员作出的对所述实施例和/或所述实施例的特征的变化、组合和/或修改在本发明的范围内。因组合、合并和/或省略所述实施例的特征而得到的替代实施例也在本发明的范围内。在明确说明数值范围或限制的情况下,此类表达范围或限制应被理解为包括在明确说明的范围或限制内具有相同大小的迭代范围或限制(例如,从约为1到约为10包括2、3、4等;大于0.10包括0.11、0.12、0.13等)。例如,只要揭示具有下限R1和上限Ru的数值范围,则特别揭示落入所述范围内的任何数字。具体而言,特别揭示所述范围内的以下数字:R=R1+k*(Ru-R1),其中k是从1%到100%以1%增量递增的变量,即,k是1%、2%、3%、4%、5%、......、50%、51%、52%、......、95%、96%、97%、98%、99%或100%。此外,还特别揭示由如上文所定义的两个R数字界定的任何数值范围。相对于权利要求的任何元素使用术语“任选地”意味着需要所述元素,或者并不需要所述元素,这两种替代方案均在所述权利要求的范围内。应将使用“包含”、“包括”和“具有”等范围较大的术语理解为支持“由......组成”、“基本上由......组成”以及“大体上由......组成”等范围较窄的术语。因此,保护范围不受上文所述的描述限制,而是由所附权利要求界定,所述范围包括所附权利要求的标的物的所有均等物。每一和每条权利要求作为进一步揭示内容并入说明书中,且权利要求书是本发明的实施例。本发明中对参考的论述并不是承认其为现有技术,尤其是公开日期在本申请案的在先申请优先权日期之后的任何参考。本发明中所引用的所有专利、专利申请案和公开案的揭示内容以引入的方式并入本文本中,其提供补充本发明的示例性、程序性或其他细节。
虽然本发明中已提供若干实施例,但应理解,在不脱离本发明的精神或范围的情况下,所揭示的系统和方法可以许多其他具体形式来实施。本发明的实例应被视为说明性而非限制性的,且本发明不限于本文所给出的细节。例如,各种元件或部件可在另一系统中组合或合并,或者某些特征可省略或不实施。
此外,在不脱离本发明的范围的情况下,各种实施例中描述和说明为离散或单独的技术、系统、子系统和方法可与其他系统、模块、技术或方法进行组合或合并。展示或讨论为彼此耦接或直接耦接或通信的其他项也可以电气方式、机械方式或其他方式通过一些接口、装置或中间部件间接地耦接或通信。其他变化、替代和更改实例可由所属领域的技术人员确定,且可在不脱离本文所揭示的精神和范围的情况下作出。

Claims (26)

1.一种设备,其包含:
编解码器,用于预测相关块的帧内模式,所述预测依据的是所述相关块的多个相邻块所用的多个模式的多个组编号和多个对应的组索引,
其中如果所预测的帧内模式不匹配实际帧内模式,则对对应于所述相关块的所述实际帧内模式的组编号进行编码并发送。
2.根据权利要求1所述的设备,其中所述所预测的帧内模式是分散在多个组中的多个帧内模式中的一者,其中每个所述组被分配不同的组编号,而且每个所述组中的每个所述帧内模式被分配不同的组索引。
3.根据权利要求2所述的设备,其中存在约四个组,每个组包含约9个帧内模式。
4.根据权利要求2所述的设备,其中所述四个组中的所述帧内模式包括约34个正在考虑的测试模型(TMuC)组。
5.根据权利要求2所述的设备,其中所述四个组中的所述帧内模式包括多个定向和非定向帧内模式。
6.根据权利要求5所述的设备,其中所述非定向帧内模式包括DC模式、平面模式和双向模式中的至少一者。
7.根据权利要求1所述的设备,其中所述所预测的帧内模式对应于所述组编号和所述组索引的最小值。
8.根据权利要求1所述的设备,其中所述相邻块包含所述相关块左边的块以及所述相关块上方的块。
9.根据权利要求1所述的设备,其中如果所述所预测的帧内模式匹配所述实际帧内模式,则所述组编号并不进行编码并发送。
10.一种网络部件,其包含:
处理器,用于预测相关块的帧内模式,所述预测依据的是所述相关块的两个相邻块所使用的两个模式的最小组编号和最小组索引;以及
发射器,用于在实际帧内模式不匹配所预测的帧内模式的情况下,发送用于所述相关块的所述实际帧内模式的组编号的编码位。
11.根据权利要求10所述的网络部件,其中所述帧内模式使用以下方程式来预测:
PredCurrentMode=ModeTable[Min(AboveGroup,LeftGroup),Min(AboveIdx,LeftIdx)],
其中AboveGroup为所述相关块上方的顶部块的第一帧内模式的组编号,LeftGroup为所述相关块的左边块的第二帧内模式的索引编号,AboveIdx是所述第一帧内模式的索引编号,且LeftInx是所述第二帧内模式的索引编号。
12.根据权利要求10所述的网络部件,其中所述实际帧内模式的所述组编号使用以下方程式进行编码:
CurrentGroup=CurrentGroup>PredCurrentGroup?CurrentGroup-1:CurrentGroup,
其中CurrentGroup是所述实际帧内模式的所述组编号,且PredCurrentGroup是所述所预测的帧内模式。
13.根据权利要求10所述的网络部件,其中针对每个相关块执行两轮率失真(R-D)成本搜索,并且其中在第二轮所述R-D搜索中考虑将一个或多个额外的帧内模式与TMuC实施方案比较。
14.根据权利要求13所述的网络部件,其中平面模式是在所述第二轮R-D搜索中针对4x4相关块考虑的一个额外帧内模式。
15.一种网络部件,其包含:
接收器,用于在实际帧内模式不匹配所预测的帧内模式的情况下,接收用于相关块的所述实际帧内模式的组编号的编码位;以及
处理器,用于对所述组编号进行解码,并且使用所解码的组编号来识别所述实际帧内模式,依据的是所预测的帧内模式以及多个帧内模式的多个组编号与多个对应的组之间的映射。
16.根据权利要求15所述的网络部件,其中所述实际帧内模式的所述组编号使用以下方程式进行解码:
CurrentGroup=CurrentGroup>=PredCurrentGroup?CurrentGroup+1:CurrentGroup,
其中CurrentGroup是所述实际帧内模式的所述组编号,且PredCurrentGroup是所述所预测的帧内模式。
17.根据权利要求15所述的网络部件,其中所述所预测的帧内模式依据的是所述相关块的两个相邻块所用的两个模式的最小组编号和最小组索引。
18.根据权利要求15所述的网络部件,其中针对每个相关块执行两轮R-D成本搜索,并且其中在第二轮所述R-D搜索中考虑将一个或多个额外的帧内模式与TMuC实施方案比较。
19.根据权利要求15所述的网络部件,其中平面模式是在所述第二轮R-D搜索中针对4x4相关块考虑的一个额外帧内模式。
20.一种由至少一个编解码器部件实施的方法,其包含:
获得相关块的两个相邻块所用的两个帧内模式的最小组编号;
获得用于相关块的所述两个相邻块的所述两个帧内模式的最小组索引编号;
将所述最小组编号和所述最小组索引编号映射到用于所述相关块的所预测的帧内模式;
确定所述所预测的帧内模式是否匹配用于所述相关块的实际帧内模式;以及
如果所述所预测的帧内模式不匹配所述实际帧内模式,则发送所述实际帧内模式的编码组编号。
21.根据权利要求20所述的方法,其中如果所述相邻块不可用,则将DC帧内模式的组编号和组索引编号用于所述两个相邻块中的任一者。
22.根据权利要求20所述方法,其中如果所述实际帧内模式匹配所述所预测的帧内模式,则仅发送一个位,所述位设置成指出所述实际帧内模式匹配所述所预测的帧内模式。
23.根据权利要求20所述方法,其中如果所述实际帧内模式和所述所预测的帧内模式不匹配,则发送一个位,所述位设置成指出所述实际帧内模式与所述所预测的帧内模式不匹配,并且其中在发送所述实际帧内模式的所述编码组编号之前,发送设置位。
24.根据权利要求23所述的方法,其中使用一个设置位或两个设置位来发送所述编码组编号。
25.根据权利要求20所述的方法,其中对所述实际帧内模式的所述组编号进行编码并发送而不是发送实际帧内模式编号,将编码增益效率提高约0.6%、约0.7%、约0.8%或约0.9%。
26.根据权利要求20所述的方法,其中对所述发送的组编号进行解码并不显著增加解码器的复杂性。
CN201180046885.3A 2010-09-30 2011-09-30 通过帧内模式预测而用于帧内编码的改进的多个预测器集合 Active CN103262540B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US38848510P 2010-09-30 2010-09-30
US61/388,485 2010-09-30
US13/247,555 US9204155B2 (en) 2010-09-30 2011-09-28 Multiple predictor set for intra coding with intra mode prediction
US13/247,555 2011-09-28
PCT/CN2011/080404 WO2012041245A1 (en) 2010-09-30 2011-09-30 Improved Multiple Predictor Set For Intra Coding with Intra Mode Prediction

Publications (2)

Publication Number Publication Date
CN103262540A true CN103262540A (zh) 2013-08-21
CN103262540B CN103262540B (zh) 2016-11-30

Family

ID=

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111770231A (zh) * 2020-06-05 2020-10-13 厦门亿联网络技术股份有限公司 一种dect基站、手柄及通信系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040213348A1 (en) * 2003-04-22 2004-10-28 Samsung Electronics Co., Ltd. Apparatus and method for determining 4X4 intra luminance prediction mode
CN1674680A (zh) * 2005-03-31 2005-09-28 华中科技大学 一种增强型帧内预测模式编码方法
CN101043632A (zh) * 2006-06-05 2007-09-26 华为技术有限公司 一种图像编解码方法及系统
CN101500161A (zh) * 2008-01-31 2009-08-05 华为技术有限公司 基于自适应块变换的帧内预测方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040213348A1 (en) * 2003-04-22 2004-10-28 Samsung Electronics Co., Ltd. Apparatus and method for determining 4X4 intra luminance prediction mode
CN1674680A (zh) * 2005-03-31 2005-09-28 华中科技大学 一种增强型帧内预测模式编码方法
CN101043632A (zh) * 2006-06-05 2007-09-26 华为技术有限公司 一种图像编解码方法及系统
CN101500161A (zh) * 2008-01-31 2009-08-05 华为技术有限公司 基于自适应块变换的帧内预测方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
TAKESHI ET AL: "Adaptive Multidirectional Intra Prediction", 《ITU-TELECOMMUNICATIONS STANDARDIZAGION SECTOR VIDEO CODING EXPERTS GROUP(VCEG)》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111770231A (zh) * 2020-06-05 2020-10-13 厦门亿联网络技术股份有限公司 一种dect基站、手柄及通信系统
CN111770231B (zh) * 2020-06-05 2021-04-02 厦门亿联网络技术股份有限公司 一种dect基站、手柄及通信系统

Also Published As

Publication number Publication date
US20120082221A1 (en) 2012-04-05
WO2012041245A1 (en) 2012-04-05
US9204155B2 (en) 2015-12-01

Similar Documents

Publication Publication Date Title
CN104041035B (zh) 用于复合视频的无损编码及相关信号表示方法
CN103650496B (zh) 用于在hevc中编码的基于像素的帧内预测
CN101292538B (zh) 使用可缩放的视频编码的多视图视频编码
CN103609124B (zh) 用于非正方形预测单元的依赖于模式的帧内平滑滤波器的表映射方法
CN103428497B (zh) 用于增强层视频编码的适应性量化
CN101228794B (zh) 针对加权预测的可分级视频编码方法及设备
CN109804630A (zh) 对视频数据编码执行运动补偿的系统以及方法
CN103260018B (zh) 帧内图像预测编解码方法及视频编解码器
CN106170092A (zh) 用于无损编码的快速编码方法
KR20200110442A (ko) 다중 부호 비트 숨기기 및 잔차 부호 예측을 조화시키기 위한 방법 및 장치
CN102577379A (zh) 用于视频编码和译码中的嵌入量化参数调节的方法和装置
CN102413353B (zh) 立体视频编码过程的多视点视频和深度图的码率分配方法
CN104247422A (zh) 用于改进帧内预测的新的角度表
CN105721878A (zh) Hevc视频编解码中执行帧内预测的图像处理装置及方法
CN103096055A (zh) 一种图像信号帧内预测及解码的方法和装置
WO2020103800A1 (zh) 视频解码方法和视频解码器
TWI650992B (zh) 視訊編碼方法
CN101204094A (zh) 可缩放地编码和解码视频信号的方法
CN104995916A (zh) 视频数据解码方法和视频数据解码设备
KR20120008436A (ko) 계층적 가변 블록 변환이 가능한 부호화 방법 및 장치 그리고 복호화 방법 및 장치
US20150110170A1 (en) Method and Apparatus for Simplified Depth Coding with Extended Prediction Modes
WO2014166338A1 (en) Method and apparatus for prediction value derivation in intra coding
CN103957412A (zh) 一种针对屏幕视频帧间残差的基础色索引映射算法
CN115314710A (zh) 编码方法、解码方法、编码器、解码器以及存储介质
JP2022521933A (ja) 符号化方法、復号化方法、デコーダ、エンコーダー及び記憶媒体

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CB03 Change of inventor or designer information
CB03 Change of inventor or designer information

Inventor after: Liu Lingzhi

Inventor after: Li Guichun

Inventor after: Lin Nan

Inventor after: Zheng Jianhua

Inventor after: Zhang Chenxiong

Inventor before: Liu Lingzhi

Inventor before: Li Guichun

Inventor before: Ling Nan

Inventor before: Zheng Jianhua

Inventor before: Zhang Chengxiong