CN103379321B - 视频图像分量的预测方法和装置 - Google Patents

视频图像分量的预测方法和装置 Download PDF

Info

Publication number
CN103379321B
CN103379321B CN201210111020.7A CN201210111020A CN103379321B CN 103379321 B CN103379321 B CN 103379321B CN 201210111020 A CN201210111020 A CN 201210111020A CN 103379321 B CN103379321 B CN 103379321B
Authority
CN
China
Prior art keywords
value
parameter
alpha
image block
numerical value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210111020.7A
Other languages
English (en)
Other versions
CN103379321A (zh
Inventor
杨海涛
张星宇
區子廉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201210111020.7A priority Critical patent/CN103379321B/zh
Priority to PCT/CN2012/081613 priority patent/WO2013155817A1/zh
Publication of CN103379321A publication Critical patent/CN103379321A/zh
Application granted granted Critical
Publication of CN103379321B publication Critical patent/CN103379321B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明实施例提供了一种视频图像分量的预测方法和装置。方法包括:获取图像块的亮度分量值;基于应用模板内采样点的亮度分量值和色度分量值,通过线性回归技术得到第一数值a3,对第一数值a3进行补偿后改变数值精度以获取第一参数alpha和第三参数k;基于第一参数alpha和第三参数k获取线性模型的第二参数beta;基于图像块的亮度分量值、第一参数alpha、第三参数k和第二参数beta,通过线性模型获取图像块的色度分量的预测值。该技术方案通过改进视频图像分量预测时使用的线性模型中的参数,从而实现提高编码性能,同时降低使用该预测方法的装置的复杂度。

Description

视频图像分量的预测方法和装置
技术领域
本发明涉及视频领域,并且更具体地,涉及视频图像分量的预测方法和装置。
背景技术
现有视频图像编解码技术中包括帧内编码技术与帧间编码技术。帧内编码指仅利用当前编码图像中的空间相关性对图像内容进行压缩编码的技术。帧间编码指利用当前编码图像与已编码图像的时间相关性对当前图像进行压缩编码的技术。为提高图像的帧内编码效率,国际视频编码标准,例如H.264/AVC(Advanced Video Coding,先进视频编码)中引入帧内预测技术来去除当前编码图像块与邻近已编码图像块的空间信息冗余。因此,与之前的帧内编码技术不同,仅需要对预测差值信号而非原始图像信号进行空间变换与熵编码,从而提高帧内编码效率。
然而,相关的帧内预测技术中硬件实现的复杂度高,增加了各方面的成本。
发明内容
本发明实施例提供一种视频图像分量的预测方法和装置,能够降低实现帧内预测技术的装置的复杂度。
一方面,提供了一种视频图像分量的预测方法,包括:获取图像块的亮度分量值;基于应用模板内采样点的亮度分量值和色度分量值,通过线性回归技术得到第一数值a3,对第一数值a3进行补偿后改变数值精度以获取第一参数alpha和第三参数k,其中第三参数k是第一参数alpha的归一化参数,第一数值a3归一化后的值或第一参数alpha归一化后的值是线性模型中指示线性关系的斜率;基于第一参数alpha和第三参数k获取线性模型的第二参数beta,第二参数beta是线性模型中指示线性关系的纵轴截距;基于图像块亮度分量值、第一参数alpha、第三参数k和第二参数beta,通过线性模型获取图像块的色度分量的预测值。
另一方面,提供了一种视频图像分量的预测装置,包括:第一获取模块,用于获取图像块亮度分量值,应用模板为线性模型参数计算中采用的邻近采样点的集合;第二获取模块,用于基于应用模板内采样点的亮度分量值和色度分量值,通过线性回归技术得到第一数值a3,对第一数值a3进行补偿后改变数值精度以获取第一参数alpha和第三参数k,其中第三参数k是第一参数alpha的归一化参数,第一数值a3归一化后的值或第一参数alpha归一化后的值是线性模型中指示线性关系的斜率;第三获取模块,用于基于第一参数alpha和第三参数k获取线性模型的第二参数beta,第二参数beta是线性模型中指示线性关系的纵轴截距;第四获取模块,用于基于第一获取模块获取的图像块亮度分量值、第二获取模块获取第一参数alpha、第三参数k和第三获取模块获取的第二参数beta,通过线性模型获取图像块的色度分量的预测值。
另一方面,提供了一种视频图像分量的预测方法,包括:获取图像块亮度分量值;基于应用模板内采样点的亮度分量值和色度分量值,通过线性回归技术得到第一数值a3以获取第一参数alpha和第三参数k,其中第三参数k是第一参数alpha的归一化参数,第一数值a3归一化后的值或第一参数alpha归一化后的值是线性模型中指示线性关系的斜率,应用模板为线性模型参数计算中采用的图像块的邻近的采样点的集合,且当图像块的左上角为坐标原点时,在图像块上方的最左侧的邻近采样点距离坐标原点在水平方向上有偏移,或在图像块左侧的最上方的邻近采样点距离坐标原点在垂直方向上有偏移,并且两个方向上的偏移不同时为0;基于第一参数alpha和第三参数k获取线性模型的第二参数beta,第二参数beta是线性模型中指示线性关系的纵轴截距;基于图像块亮度分量值、第一参数alpha、第三参数k和第二参数beta,通过线性模型获取图像块的色度分量的预测值。
另一方面,提供了一种视频图像分量的预测装置,包括:第一获取模块,用于获取图像块亮度分量值;第二获取模块,用于基于应用模板内采样点的亮度分量值和色度分量值,通过线性回归技术得到第一数值a3以获取第一参数alpha和第三参数k,其中第三参数k是第一参数alpha的归一化参数,第一数值a3归一化后的值或第一参数alpha归一化后的值是线性模型中指示线性关系的斜率,应用模板为线性模型参数计算中采用的图像块的邻近的采样点的集合,且当图像块的左上角为坐标原点时,在图像块上方的最左侧的邻近采样点距离坐标原点在水平方向上有偏移,或在图像块左侧的最上方的邻近采样点距离坐标原点在垂直方向上有偏移,并且两个方向上的偏移不同时为0;第三获取模块,用于基于第一参数alpha和第三参数k获取线性模型的第二参数beta,第二参数beta是线性模型中指示线性关系的纵轴截距;第四获取模块,用于基于第一获取模块获取的图像块亮度分量值、第二获取模块获取的第一参数alpha、第三参数k和第三获取模块获取的第二参数beta,通过线性模型获取图像块的色度分量的预测值。
通过改进视频图像分量预测时使用的线性模型中的参数,从而实现提高编码性能,同时降低使用该预测方法的装置的复杂度。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图作简单地介绍,显而易见地,下面所描述的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1A至图1C是视频图像采样格式的示意图。
图2A和图2B是LM模式使用的L型模板的示意图。
图3是本发明实施例的视频图像分量的预测方法的示意流程图。
图4是本发明实施例的视频图像分量的预测方法的示意流程图。
图5是本发明另一实施例的视频图像分量的预测方法的示意流程图。
图6A和图6B是本发明实施例的适用场景的示意图。
图7是本发明实施例的视频图像分量的预测方法的示意框图。
图8是本发明另一实施例的视频图像分量的预测方法的示意框图。
图9A至图9D是本发明实施例的改进的应用模板的示意图。
图10是本发明实施例的视频图像分量的预测装置的示意框图。
图11是本发明实施例的视频图像分量的另一预测装置的示意框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都应属于本发明保护的范围。
视频图像信号通常包括一个亮度分量与两个色度分量。亮度分量通常使用符号Y表示,色度分量通常使用符号U、V表示。常用的亮度分量和色度分量分开表示的采样格式也称为YUV格式,YUV格式包括以下几种,分别如图1A至图1C所示,其中图中的叉表示亮度分量采样点,圈表示色度分量采样点。
4:4:4格式:如图1A所示,表示色度分量没有下采样;
4:2:2格式:如图1B所示,表示色度分量相对于亮度分量进行2:1的水平下采样,没有竖直下采样。对于每两个U采样点或V采样点,每个扫描行都包含四个Y采样点;
4:2:0格式:如图1C所示,表示色度分量相对于亮度分量进行2:1的水平下采样和2:1的竖直下采样。
在视频图像采用YUV4:2:0格式的情况下,若图像块的亮度分量为(2*nS)×(2*nS)大小的图像块,则对应的图像块的色度分量为nS×nS大小的图像块,其中nS为图像块的边长。因此,图像块的色度分量在本专利说明文档中也称为色度分量图像块,或简称为色度图像块。出于简洁,下面将以4:2:0格式为例解释本发明方案技术,本发明实施例的技术方案同样适用其他采样格式。
在帧内预测编码方面,引入了一种新的预测模式,即LM模式。该LM模式是指基于线性模型用采样点亮度分量的值计算色度分量的预测值的帧内预测模式,其中线性模型的参数通常由当前的图像块正上方与正左侧邻近的采样点计算得到。图像块的色度分量也可以称为色度分量图像块或色度图像块,图像块的亮度分量也可以称为亮度分量图像块或亮度图像块。当前的图像块也可称为当前块,是图像采样处理的基本单位。在LM模式中,该当前块使用的邻近采样点的集合称为应用模板。当采用当前块的正上方和正左侧领近的采样点时,采样点构成L型,此时的应用模板也称为L型模板。为了说明方便,下面以L型模板示例进行说明。
图2A和图2B是LM模式使用的L型模板的示意图。其中,以加黑的较大方框分别用于突出指示亮度图像块21和对应的色度图像块22,圆形指示下采样的采样点对应的亮度分量重采样的值pY'23,或待预测的色度图像块22邻近采样点的色度分量值p 25,加黑的小方框用于突出指示对应的亮度分量的重建值recSampleL24。图2A示出了(2*nS)×(2*nS)大小的亮度图像块21,对于4:2:0格式的视频图像来说,一个(2*nS)×(2*nS)大小的亮度分量相应的色度分量的大小为nS×nS,如图2B的22所示。
当使用LM模式时,色度分量图像块的预测值predSamples,将由对应的亮度分量的值通过线性模型按照(1.1)式计算得到:
predSamples[x,y]=α·pY'[x,y]+β 公式(1.1)
pY'[x,y]=(recSamplesL[2x,2y]+recSamplesL[2x,2y+1])>>1,with x=-1,..,nS-1;y=0,...,nS-1 公式(1.2)
pY'[x,y]=(recSamplesL[2x-1,2y+1]+2*recSamplesL[2x,2y+1]+recSamplesL[2x+1,2y+1]+2)>>2,with x=0,..,nS-1;y=-1 公式(1.3)
其中,[x,y]表示色度分量图像块中采样点的位置坐标,x表示水平方向,y为竖直方向,可选图2A中(2*nS)×(2*nS)大小的亮度图像块内左上角像素点作为坐标原点。当选取的原点和定义的x或y不同时,则描述采样方向时也会有相应的不同。参数α是线性模型中指示线性关系的斜率的理论值,参数β是线性模型中指示线性关系的纵轴截距的理论值。
所以,如图2A所示,此处需先对亮度分量进行下采样,使得每一个色度分量采样点有一个亮度分量的值与之对应,再用式(1.1)进行预测,下采样的方法如式(1.2)和式(1.3)。参数α和参数β是由当前色度分量图像块正上方和正左侧邻近采样点的亮度分量值和色度分量值计算得到。
参数α和参数β的计算表达如式(1.4)和(1.5):
式(1.4)和(1.5)中的I表示L型模板中采样点的总数;LC表示L型模板中所有采样点色度分量值和亮度分量值的乘积的和;C表示L型模板中所有采样点色度分量值的和;L表示L型模板中所有采样点亮度分量值的和;LL表示L型模板中所有采样点亮度分量值的平方的和。
在相关技术中,为降低硬件实现复杂度,当前HEVC方案中参数α和参数β的计算都使用整数操作运算,将浮点数放大变为整数的运算结果中,放大了的α称为alpha,利用alpha计算得到的β称为beta,如式(1.6)所示。变量k表示alpha的归一化参数。将alpha,k和beta的值用于式(1.1)表示的线性模型中,即可得到预测表达式(1.7)
b e t a = C - ( a l p h a · L ) > > k I - - - ( 1.6 )
predSamples[x,y]=(alpha·pY'[x,y])>>k+beta (1.7)
参数alpha和参数beta在上下文中分别称为第一参数和第二参数,它们是由一组相邻采样点的亮度分量重建值及色度分量重建值求出。即当前块的亮度分量重建值和色度分量原始值间的线性相关性,将由邻近采样点的亮度分量重建值和色度分量重建值间的线性相关性来近似表示。参数k在上下文中称为第三参数,是第一参数alpha的归一化参数。其中alpha归一化后的值近似表示线性关系的斜率α,beta近似表示线性关系的纵轴截距β。
然而,相关技术的LM模式中alpha精度降低操作中引入条件判断,而条件判断不利于硬件实现。相关技术中,式(1.3)中得到的alpha最大有效位宽可为16个比特或更多。在现有HEVC中,alpha精度降低操作需要有条件判断。即,当alpha的数值在[-(1<<6),(1<<6)-1],也就是[-26,26-1]的区间内时,保持alpha的数值不变;当alpha的数值超出此区间时,仅保持前6个比特(bit)数值不变,而将其余低位比特数值置0。若alpha为正数,所述前6个比特指对二进制表示的alpha的数值从高位往低位方向第一个非0bit开始的连续6个比特;若alpha为负数,则所述前6个比特指对二进制表示的alpha的数值从高位往低位方向第一个非1比特开始的连续6个比特。
此外,邻近采样点的色度分量重建值存在量化误差,所以计算得到的alpha的实际精确度有限,此时若alpha的数值位宽超过alpha精确度,则会因使用额外比特来表示alpha造成浪费,因为这些额外使用的比特并不会提高LM模式的预测精度。
本发明实施例提供了一种视频分量的预测方法,能够提高编码速度,同时方便硬件实现。
当前色度分量图像块大小记作nS;当前色度分量图像块邻近的色度分量采样点的值记作p[x,y];与当前色度分量图像块对应的亮度分量图像块内所有亮度分量采样点的值记作recSamplesL[x,y],其中x,y=0,…,nS-1;与当前色度分量图像块邻近的色度分量采样点对应的亮度分量图像块邻近的亮度分量采样点的值记作recSamplesL[x,y],其中x,y==-2…2nS-1;色度采样点在编解码器处理过程中的位宽记作BitDepthC;当前色度分量图像块内采样点色度分量的预测值记作predSamples[x,y].
上述输入的采样点的值均为在本流程之前的解码操作重建得到。因为本发明文档中以方形块为例说明专利技术,所以色度分量图像块大小为nS表示当前色度分量图像块包含nS×nS个采样点。
图3是根据本发明实施例的视频图像分量的预测方法30的示意流程图。预测方法30包括以下内容。
S31,获取图像块亮度分量值。
S32,基于应用模板内采样点的亮度分量值和色度分量值,通过线性回归技术,得到第一数值a3,对所述第一数值a3进行补偿后改变数值精度以获取第一参数alpha和第三参数k,其中所述第三参数k是第一参数alpha的归一化参数,所述第一数值a3归一化后的值或第一参数alpha归一化后的值是所述线性模型中指示线性关系的斜率,所述应用模板为所述线性模型参数计算中采用的所述图像块的邻近的采样点的集合。
S33,基于所述第一参数alpha和所述第三参数k获取所述线性模型的第二参数beta,所述第二参数beta是所述线性模型中指示线性关系的纵轴截距。
S34,基于所述图像块亮度分量值、所述第一参数alpha、所述第三参数k和所述第二参数beta,通过所述线性模型获取所述图像块的色度分量的预测值。
本发明实施例通过改进视频图像分量预测时使用的线性模型中的参数,从而实现提高编码性能,同时降低使用该预测方法的装置的复杂度。
作为不同的实施方式,可选地,对所述第一数值a3进行补偿,将补偿后得到的二进制数值的最低整数B位置零,并将所述最低整数B位置零后得到的数值与第三数值C相加以获取第二数值a4。
可选地,基于以下公式获取第二数值a4,
a4=[((a3+offset)>>B)<<B]+C,其中offset为补偿值。
可选地,当补偿值offset和第三数值C同为0时,基于以下公式获取第二数值a4,
a4=((a3)>>B)<<B。
可选地,对所述第一数值a3进行补偿,将补偿后得到的二进制数值与第四数值D进行按位逻辑操作以获取第二数值a4,其中所述第四数值D满足与所述补偿后得到的二进制数值进行按位逻辑操作后得到的二进制数值的最低整数B位为0。
可选地,基于以下公式获取第二数值a4,
a4=(a3+offset)&(~(2B-1))+C,其中D=~(2B-1)。
可选地,当所述补偿值offset和第三数值C同为0时,基于以下公式获取第二数值a4,a4=(a3)&(~(2B-1))。
可选地,对所述第一数值a3进行补偿,将补偿后得到的数值进行缩放以获取第二数值a4。
可选地,基于以下公式获取第二数值a4,
a4=(a3+offset)*Sc,其中Sc表示缩放系数。
可选地,所述缩放系数Sc的数值为2的整数B次幂时,基于以下公式获取第二数值a4,a4=(a3+offset)<<B。
可选地,所述补偿值offset为0时,基于以下公式获取第二数值a4,a4=a3<<B。
可选地,所述方法还包括基于所述第二数值a4,获取以预定的位宽alpha_depth表达的所述第一参数alpha和第三参数k。
可选地,当所述第三数值C为0,且所述整数B大于或等于(alpha_depth-1)时,所述第一参数alpha和所述第三参数k通过以下公式获取:
alpha=a4>>(n2–alpha_depth),
k=S–(n2–alpha_depth),其中所述第四参数S是所述第一数值a3的归一化参数,n2为第二数值a4的二进制表达中,除符号位外有效比特的数目。
可选地,所述补偿值offset为缺省值或基于所述第一数值a3的值确定的值,或所述第三数值C为缺省值或基于所述第一数值a3的值确定的值,且所述整数B,所述第三数值C,和所述补偿值offset不能同时为0。
可选地,所述应用模板为所述线性模型参数计算中采用的所述图像块的邻近的采样点的集合,且当所述图像块的左上角为坐标原点时,在所述图像块上方的最左侧的所述邻近采样点距离所述坐标原点在水平方向上有偏移,或在所述图像块左侧的最上方的所述邻近采样点距离所述坐标原点在垂直方向上有偏移,并且两个方向上的偏移不同时为0。
可选地,在水平方向上的所述图像块使用的邻近采样点为连续的采样点或在垂直方向上所述图像块使用的邻近采样点为连续的采样点。
可选的,在水平方向上的所述图像块使用的图像块上方的最左侧的所述邻近采样点距离所述坐标原点在水平方向上偏移为0,1,2,nS/4,或者nS/2个采样点,其中nS为所述图像块的色度分量在水平方向的大小;或在垂直方向上的所述图像块使用的图像块左侧的最上方的所述邻近采样点距离所述坐标原点在垂直方向上偏移为0,1,2,nS/4,或者nS/2个采样点,其中nS为所述图像块的色度分量在垂直方向的大小。
图4是根据本发明实施例的视频图像分量的预测方法40的示意流程图。预测方法40使用的参数定义如下。
nS指示当前色度分量图像块大小的边长;p[x,y]指示当前色度分量图像块邻近的色度分量采样点的值;recSamplesL[x,y]指示与当前色度分量图像块对应的亮度分量图像块内所有亮度分量采样点的值,其中x,y=0,…,nS-1;recSamplesL[x,y]指示与当前色度分量图像块邻近的色度分量采样点对应的亮度分量图像块邻近的亮度分量采样点的值,其中x,y=-2…2nS-1;BitDepthC指示色度采样点在编解码器处理过程中的位宽;predSamples[x,y]指示当前色度分量图像块内采样点色度分量的预测值。
上述输入的采样点的值均为在本方法之前的解码操作重建得到。因为本发明实施例中以方形块为例说明专利技术方案,所以色度分量图像块大小的边长为nS,表示当前色度分量图像块包含nS×nS个采样点。
S41,对当前亮度分量图像块内所有采样点以及当前亮度分量图像块外邻近的采样点的值进行重采样操作,得到色度分量采样点对应的亮度分量值pY’[x,y],其中[x,y]表示采样点坐标,可选图像块内左上角采样点作为坐标原点。当坐标原点不同时,相应的采样的坐标也相应变化。
重采样方法与视频图像信号的采样格式有关。重采样的目的是获取色度分量采样点位置的亮度分量值。一种可实施的用于YUV4:2:0格式的重采样方式,计算方法如下:
pY’[x,y]=(recSamplesL[2x-1,2y+1]+2*recSamplesL[2x,2y+1]+recSamplesL[2x+1,2y+1]+2)>>2,其中x=0..nS-1,y=-1 (2.1)
pY’[x,y]=(recSamplesL[2x,2y]+recSamplesL[2x,2y+1])>>1,其中x=-1..nS-1,y=0..nS-1 (2.2)
除上述重采样方法外,还可采用其它重采样方法。如式(2.1.1)和式(2.2.1)给出另一种下采样方法。
pY’[x,y]=(recSamplesL[2x-1,2y+1]+2*recSamplesL[2x,2y+1]+recSamplesL[2x+1,2y+1]+2)>>2,其中x=0..nS-1,y=-1 (2.1.1)
pY’[x,y]=(recSamplesL[2x,2y]+recSamplesL[2x,2y+1]+recSamplesL[2x+1,2y]+recSamplesL[2x+1,2y+1])>>2,withx=-1..nS-1,y=0..nS-1(2.2.1)
或者如式(2.1.2)和式(2.2.2)也是另一种下采样方法。
pY’[x,y]=(recSamplesL[2x-1,2y+1]+2*recSamplesL[2x,2y+1]+recSamplesL[2x+1,2y+1]+2)>>2,其中x=0..nS-1,y=-1 (2.1.2)
pY’[x,y]=(recSamplesL[2x-1,2y]+recSamplesL[2x-1,2y+1]+recSamplesL[2x,2y]+recSamplesL[2x,2y+1]+recSamplesL[2x+1,2y]+recSamplesL[2x+1,2y+1])>>2,其中x=-1..nS-1,y=0..nS-1 (2.2.2)
S42,使用线性回归技术,计算线性模型参数α放大2S倍后的近似值a3,可以用整数运算代替浮点运算,采用加法,移位和乘法等操作实现。其中a3在上下文中也称为第一数值,a3归一化后的值同样也可以近似为上述线性模型中指示线性关系的斜率α,S是第一数值a3的归一化参数。第一数值a3的基本计算原理如下:
式(2.3)给出α的表达式,其中A1表示该表达式中的分子,A2表示该表达式中的分母;I表示LM模式中用到的相邻采样点的总点数;变量L、LC、LL和C的定义如式(2.4)到式(2.7)所示。
&alpha; = I &CenterDot; L C - C &CenterDot; L I &CenterDot; L L - L 2 = A 1 A 2 - - - ( 2.3 )
L = ( &Sigma; y = 0 n S - 1 p Y &prime; &lsqb; - 1 , y &rsqb; + &Sigma; x = 0 n S - 1 p Y &prime; &lsqb; x , - 1 &rsqb; ) - - - ( 2.4 )
C = ( &Sigma; y = 0 n S - 1 p &lsqb; - 1 , y &rsqb; + &Sigma; x = 0 n S - 1 p &lsqb; x , - 1 &rsqb; ) - - - ( 2.5 )
L L = ( &Sigma; y = 0 n S - 1 p Y &prime; &lsqb; - 1 , y &rsqb; 2 + &Sigma; x = 0 n S - 1 p Y &prime; &lsqb; x , - 1 &rsqb; 2 ) - - - ( 2.6 )
L C = ( &Sigma; y = 0 n S - 1 p Y &prime; &lsqb; - 1 , y &rsqb; * p &lsqb; - 1 , y &rsqb; + &Sigma; x = 0 n S - 1 p Y &prime; &lsqb; x , - 1 &rsqb; * p &lsqb; x , - 1 &rsqb; ) - - - ( 2.7 )
式(2.8)表示将α的数值放大2S倍得到的α'的表达式;
&alpha; &prime; = a &CenterDot; ( 1 < < S ) = A 1 A 2 &CenterDot; ( 1 < < S ) - - - ( 2.8 )
则α'的整数运算的方法如式(2.9):
&alpha; &prime; &ap; ( A 1 > > r A 1 ) &CenterDot; 2 r A 1 ( A 2 > > r A 2 ) &CenterDot; 2 r A 2 &CenterDot; 2 S = 2 n t a b l e &CenterDot; ( A 1 > > r A 1 ) &CenterDot; 2 r A 1 + S ( A 2 > > r A 2 ) &CenterDot; 2 r A 2 + n t a b l e &ap; 2 n t a b l e ( A 2 > > r A 2 ) &CenterDot; ( A 1 > > r A 1 ) &CenterDot; 2 r A 1 + S - ( r A 2 + n t a b l e ) - - - ( 2.9 )
式(2.9)中,为对分子A1的二进制表达进行右移的位数,为对分母A2的二进制表达进行右移的位数,ntable为一个中间变量。其中的值可以通过查表的方式近似取得。最后,α'的数值被限制在区间内得到a3,如式(2.10)所示。对α'的数值进行区间限制可以避免实际应用中不合理的数值结果的出现。
a 3 = C l i p 3 ( - 2 S + n l , 2 S + n l - 1 , &alpha; &prime; ) - - - ( 2.10 )
以上计算原理在实际应用中一种可能的实现方式如下所示。在这个具体的实现方式中,S=13,nl=2。
其中nS为一个以2为底的整数次幂;操作abs(x)表示取输入x的绝对值,操作Floor(x)表示取比x小的最大整数;操作Clip3(a,b,x)指的是将变量x的值限制在区间[a,b]之内,如式(2.11)所示;操作Max(x,y)表示取输入x和y中值较大的一个,如式(2.12)所示;变量lmDiv可按a2s的值索引查表得出。
C l i p 3 ( x , y , z ) = x ; z < x y ; z > y z ; o t h e r w i s e - - - ( 2.11 )
M a x ( x , y ) = x ; x > = y y ; x < y - - - ( 2.12 )
一个示意性的a2s和lmDiv的值的对应表如表1所示。
表1
a2s 1 2 3 4 5 6 7 8 9 10 11 12 13
lmDiv 32768 16384 10923 8192 6554 5461 4681 4096 3641 3277 2979 2731 2521
a2s 14 15 16 17 18 19 20 21 22 23 24 25 26
lmDiv 2341 2185 2048 1928 1820 1725 1638 1560 1489 1425 1365 1311 1260
a2s 27 28 29 30 31 32 33 34 35 36 37 38 39
lmDiv 1214 1170 1130 1092 1057 1024 993 964 936 910 886 862 840
a2s 40 41 42 43 44 45 46 47 48 49 50 51 52
lmDiv 819 799 780 762 745 728 712 697 683 669 655 643 630
a2s 53 54 55 56 57 58 59 60 61 62 63 64
lmDiv 618 607 596 585 575 565 555 546 537 529 520 512
线性回归技术是公知技术,除上述整数计算a3的方法外,还可采用其它的计算方法。步骤S41和S42可以沿用相关技术中的计算方法。
S43,对第一数值a3进行补偿等操作以获取第二数值a4。
将a3的数值加上一个补偿值(offset)后,并将补偿后的数值的二进制表达的最低B个比特置零后再加上数值C,得到a4。该步骤中,将补偿后的数值的二进制表达的最低B个比特置零可以提高编码速度同时还可以提高编码效率。a4在上下文中也称为第二数值,C在上下文中称为第三数值,如式(2.13)所示。
a4=[((a3+offset)>>B)<<B]+C (2.13)
操作X>>Y表示将二进制表示的数值X向右移动Y个比特,向右移出的bit被丢弃;操作X<<Y表示将二进制表示的数值X向左移动Y个比特,向左移入的bit置0。
式(2.13)中,Offset或C的值可以为一个常数或者根据a3的值自适应地选择,比如式(2.13.1)。上述常数可为0,也可为正数或者负数,当常数不为0时,可以校正编码性能。整数B,第三数值C和补偿值offset不能同时为0。
作为一种优选的实现方式,当offset和C同为0时,式(2.13)可以变形为以下公式,基于以下公式获取第二数值a4,
a4=((a3)>>B)<<B (2.13.2)。
可选的,作为另一种替代实施方式,对第一数值a3进行补偿,将补偿后得到的二进制数值与特定数值进行按位逻辑操作以获取第二数值a4,该特定数值在上下文中称为第四数值D且满足与补偿后得到的二进制数值进行按位逻辑操作后得到的二进制数值的最低整数B位置0。式(2.13)是一种具体的逻辑实现方式,其中用逻辑“位与”操作实现,如式(2.14)所示:
a4=(a3+offset)&(~(2B-1))+C; (2.14)
式(2.14)中,符号“&”表示“按位逻辑与”操作,D=~(2B-1),Offset或C的值可以为一个常数或者根据a3的值自适应地选择,参考式(2.13.1)。上述常数可为0,也可为正数或者负数,当上述常数不为0时,可以校正编码性能。整数B,第三数值C和补偿值offset不能同时为0。
其中,~X表示对数值X的二进制表示中的每一个二进制符号进行取反操作;X&Y表示对二进制表示的数值X与数值Y中对应的二进制符号进行逻辑“与”操作。硬件易于实现式(2.14)的方法,从而降低了上述预测方法中使用的装置的硬件的复杂度。
作为一种实现方式,当offset和C同为0时,式(2.14)可以变形为以下公式,基于以下公式获取第二数值a4,
a4=(a3)&(~(2B-1)) (2.14.1)。
实现对a3修改的方法不限于式(2.13)和式(2.14),还有其它可实现的方法。
S44,对a4进行精度改变操作,使alpha的值可以用预定的位宽alpha_depth表达,并获取k。
相关技术中,当a4的数值在[-(1<<alpha_depth),(1<<alpha_depth)-1]区间内时,保持a4的数值不变并将其赋值给alpha;当a4的数值超出上述区间时,仅保持a4的二进制表达中第n2个比特到第(n2-alpha_depth+1)个比特(即从第n2个比特起往低位方向连续alpha_depth个比特)的数值不变,而将第(n2-alpha_depth)到第1个比特的数值置0。其中,第n2个比特的意义是除符号位以外,二进制表达a4的数值所需要的比特数,以参数n2表示;一个数的二进制表达中最低位为第1个比特。
S44中实施方式的示例如式(2.15)到式(2.18):
n1=CountLeadingZerosOnes(a4); (2.15)
n2=15-n1; (2.16)
alpha=a4>>Max(0,n2–alpha_depth) (2.17)
k=S–Max(0,n2–alpha_depth) (2.18)
式(2.15)中CountLeadingZerosOnes(a4)操作的意义是,当a4为正数或者0时,返回a4的二进制表达中,从高位往低位的方向出现第一个非0比特前、连续出现0的比特的数目;当a4为负数时,返回a4的二进制表达中,从高位往低位的方向出现第一个非1比特前连续出现1的比特的数目;n2为第二数值a4的二进制表达中,除符号位外有效比特的数目,例如,当a4=26时,则n2=7;当a4=-26时,则n2=6。变量k表示对alpha的值归一化的系数。
由于在步骤S43中a4的二进制数值的最低B位置0,有利提高预测的运算速度,同时可以改善编码性能。
特别的,作为本发明实施例的实施方式,当a4的数值的二进制表达中最低B位全部置0,即C=0且B大于或等于(alpha_depth-1)时,alpha和变量k可由式(2.19)和(2.20)计算得到。
alpha=a4>>n2–alpha_depth (2.19)
k=S–(n2–alpha_depth) (2.20)
与(2.17)和(2.18)比较,(2.19)与(2.20)中去除了(n2–alpha_depth)和0的大小关系判断,降低了上述预测方法中使用的装置的硬件的复杂度,可以节省成本,同时提高预测的运算速度。
在实际应用中,优选的实施方式有B=alpha_depth-1;或者B=alpha_delpth;或者B=alpha_delpth+1。如当alpha_delpth=6时,B=5,6,7都是较好的选择。
S45,计算beta的值,并将alpha、k和beta的数值代入线性模型得到当前色度图像块的预测值predSamples[x,y],如式(2.25)和(2.26)所示.其中操作Clip1C(x)=Clip3(0,(1<<BitDepthC)-1,x)。此代入线性模型的计算为公知技术。
beta=(C–((alpha*L)>>k)+(1<<(k1–1)))>>k1 (2.25)
predSamples[x,y]=Clip1C(((pY’[x,y]*alpha)>>k)+beta),其中x,y=0..nS-1 (2.26)
本发明实施例通过对相关技术中的alpha进行修改,降低邻近采样点重建值的量化误差对线性模型的影响,同时可去除alpha精度降低操作中的条件判断。对alpha数值进行修改的方法是将alpha加上一个补偿值后,把最低若干个比特设置为指定的常数。
上述技术方案通过改进获取相关预测技术中的线性模型的参数的方法,从而降低预测技术中使用的装置的硬件复杂度,节省成本的同时提高了预测处理速度和编码性能。
图5是本发明另一实施例的视频图像分量的预测方法50的示意流程图。
S51.对当前亮度分量图像块内所有采样点以及当前亮度分量图像块外邻近的采样点的值进行重采样操作。该步骤同预测方法40的Step41相同或相似。
S52,使用线性回归技术,计算线性模型参数alpha放大2S(也可以表达为1<<S)倍后的值a3。预测方法50的步骤S52与预测方法40的步骤S41相同2或相似。
线性回归技术是公知技术,并可用整数运算代替浮点运算,采用加法,移位,和乘法等操作实现。举例来说,若将alpha的最高精度保持在(1<<B)/(1<<13)级别,则S=(13-B)。利用整数计算a3的基本原理同预测方法40的S42中的式(2.3)到式(2.10)。
此基本原理在实际应用中一种可能的实现方式如下所示。在这个具体的实现方式中,S=13-B,nl=2。
其中nS为一个以2为底的整数次幂;操作abs(x)表示取输入x的绝对值,操作Floor(x)表示取比x小的最大整数;操作Clip3(a,b,x)指的是将变量x的值限制在区间[a,b]之内,如式(2.11)所示;操作Max(x,y)表示取输入x和y中值较大的一个,如式(2.12)所示;变量lmDiv可按a2s的值通过查表得出。一个示意性的a2s和lmDiv的值的对应表参见表1。
线性回归技术是公知技术,除上述将alpha的最高精度保持在(1<<B)/(1<<13)级别计算a3的整数计算步骤外,还可采用其它的计算方法。步骤S51和S52可以沿用相关技术中的计算方法。
S53,对第一数值a3进行补偿等操作以获取第二数值a4。
预测方法50的步骤S53可以代替预测方法40的步骤S43。该步骤S53指的是将a3数值加上一个补偿值offset后,对(a3+offset)的值乘以一个伸缩系数Sc。如式(2.27)所示:
a4=(a3+offset)*Sc; (2.27)
式(2.27)中,Offset的值可以为一个常数,或者根据a3的值自适应地选择,参见式(2.13.1)。上述常数可为0,也可为正数或者负数,当上述常数不为0时,可以校正编码性能。
作为一种实现方式,当Sc=2B时,a4还可以有如下表达方式如(2.28)所示:
a4=(a3+offset)<<B (2.28)
该方法中,将补偿后的数值的二进制表达的最低B个比特置零可以提高编码速度同时还可以提高编码效率。
当offset为0时,作为一种优选的实现方式,a4还可以有如下表达方式:
a4=a3<<B (2.28.1)
S54,对a4进行精度改变操作,使alpha的值可以用预定的位宽alpha_depth表达,并获取第三参数k。
预测方法50的步骤S54与预测方法40的步骤S45相同或相似。当a4的数值在[-(1<<alpha_depth),(1<<alpha_depth)-1]区间内时,保持a4的数值不变并将其赋值给alpha;当a4的数值超出上述区间时,仅保持a4的二进制表达中第n2个bit到第(n2-alpha_depth+1)个bit(即从第n2个bit起往低位方向连续alpha_depth个bit)的数值不变,而将第(n2-6)到第1个bit的数值置0。其中,第n2个bit的意义是除符号位以外,二进制表达a4的数值所需要的bit数;一个数的二进制表达中最低位为第1个bit。
与本实施例S42中可能的实施方式对应的一种可用的S44的实施方式如式(2.15)到式(2.18)所示。由于在步骤S43中a4的二进制数值的最低B位置0,有利提高预测的运算速度。
特别的,作为本发明实施例的实现方式,当Sc=2B且B大于或等于(alpha_depth-1)时,alpha和变量k可由式(2.19)和(2.20)计算得到。
与(2.17)和(2.18)比较,(2.19)与(2.20)中去除了(n2–alpha_depth)和0的大小关系判断,降低了上述预测方法中使用的装置的硬件的复杂度,可以节省成本,同时提高预测的运算速度。
在实际应用中,优选的实施方式有B=alpha_depth-1;或者B=alpha_delpth;或者B=alpha_delpth+1。如当alpha_delpth=6时,B=5,6,7都是较好的选择。
S55,计算beta的值,并将alpha、k和beta代入线性模型得到当前色度图像块的预测值predSamples[x,y],如式(2.25)和(2.26)所示。此代入线性模型的计算为公知技术。预测方法50的步骤S55与预测方法40的步骤S45相同,
本发明实施例案通过对相关技术中alpha进行修改,降低邻近采样点重建值的量化误差对线性模型的影响,同时可去除alpha精度降低操作中的条件判断。对alpha数值进行修改的方法是将alpha加上一个补偿值后,对补偿后的数值进行一个缩放操作。
上述技术方案通过改进获取相关预测技术中的线性模型的参数的方法,从而降低预测技术中使用的装置的硬件复杂度,节省成本的同时提高了预测处理速度和编码性能。
现有LM模式使用的L型模板仅包括当前块正上方邻近的N个点和正左侧邻近的N个点,如图2A和图2B所示。通常,此L型模板都非常有效。例如,图6A中图像块包括两个物体,它们具有不同的色度分量(灰色区域和白色区域分别代表两个物体)。在L型模板中,有多个采样点分别与当前块内的部分采样点属于同一物体。这种情况下由L型模板中的采样点推导出的亮度分量和色度分量的相关性与当前块内各分量间的相关性十分相似。所以当前块内采样点的色度分量值,可较为准确的由亮度分量值基于前述计算得到的线性关系进行预测。然而,如果当前块中的两个物体分布的情况如图6B所示(灰色区域和白色区域分别代表具有不同色度分量的两个物体),即L型模板中没有采样点与白色区域中的采样点归属于同一个物体,此时计算得到的参数alpha和参数beta将无法表示白色区域亮度分量和色度分量间的相关性,因此利用这种情况下推导出的线性关系无法准确预测白色区域采样点的色度分量值。为了解决上述问题,本发明实施例提供了以下的预测方法。
图7是本发明实施例的视频图像分量的预测方法70的示意框图。
S71,获取图像块亮度分量值。
S72,基于应用模板内采样点的亮度分量值和色度分量值,通过线性回归技术得到第一数值a3以获取第一参数alpha和第三参数k,其中所述第三参数k是第一参数alpha的归一化参数,所述第一数值a3归一化后的值或第一参数alpha归一化后的值是所述线性模型中指示线性关系的斜率α,所述应用模板为线性模型参数计算中采用的所述图像块的邻近的采样点的集合,且当所述图像块的左上角为坐标原点时,在所述图像块上方的最左侧的所述邻近采样点距离所述坐标原点在水平方向上有偏移,或在所述图像块左侧的最上方的所述邻近采样点距离所述坐标原点在垂直方向上有偏移,并且两个方向上的偏移不同时为0。
S73,基于所述第一参数alpha和所述第三参数k获取所述线性模型的第二参数beta,所述第二参数beta是所述线性模型中指示线性关系的纵轴截距β。
S74,基于所述图像块的亮度分量值、所述第一参数alpha、所述第三参数k和所述第二参数beta,通过所述线性模型获取所述图像块的色度分量的预测值。
上述技术方案通过改进相关预测技术中的线性模型的应用模板,从而提高特定场景的预测精度。
作为不同的实施方式,可选地,在水平方向上的所述图像块使用的邻近采样点为连续的采样点或在垂直方向上所述图像块使用的邻近采样点为连续的采样点。
可选地,在水平方向上的所述图像块使用的图像块上方的最左侧的所述邻近采样点距离所述坐标原点在水平方向上偏移为0,1,2,nS/4,或者nS/2个采样点,其中nS为所述图像块的色度分量在水平方向的大小;或在垂直方向上的所述图像块使用的图像块左侧的最上方的所述邻近采样点距离所述坐标原点在垂直方向上偏移为0,1,2,nS/4,或者nS/2个采样点,其中nS为所述图像块的色度分量在垂直方向的大小。
可选地,基于线性回归技术得到第一数值a3,对所述第一数值a3进行补偿后改变数值精度以获取第一参数alpha和第三参数k。
可选地,对所述第一数值a3进行补偿,将补偿后得到的二进制数值的最低整数B位置零,并将所述最低整数B位置零后得到的数值与第三数值C相加以获取第二数值a4。
可选地,基于以下公式获取第二数值a4,
a4=[((a3+offset)>>B)<<B]+C,其中offset为补偿值。
可选地,当补偿值offset和第三数值C同为0时,基于以下公式获取第二数值a4,a4=((a3)>>B)<<B。
可选地,对所述第一数值a3进行补偿,将补偿后得到的二进制数值与第四数值D进行按位逻辑操作以获取第二数值a4,其中所述第四数值D满足与所述补偿后得到的二进制数值进行按位逻辑操作后得到的二进制数值的最低整数B位为0。
可选地,基于以下公式获取第二数值a4,
a4=(a3+offset)&(~(2B-1))+C,其中D=~(2B-1)。符号“&”表示“按位逻辑与”操作。
可选地,当所述补偿值offset和第三数值C同为0时,基于以下公式获取第二数值a4,a4=(a3)&(~(2B-1))。
可选地,对所述第一数值a3进行补偿,将补偿后得到的数值进行缩放以获取第二数值a4。
可选地,基于以下公式获取第二数值a4,
a4=(a3+offset)*Sc,其中Sc表示缩放系数。
可选地,所述缩放系数Sc的数值为2的整数B次幂时,基于以下公式获取第二数值a4,a4=(a3+offset)<<B。
可选地,所述补偿值offset为0时,基于以下公式获取第二数值a4,a4=a3<<B。
可选地,所述方法还包括基于所述第二数值a4,获取以预定的位宽alpha_depth表达的所述第一参数alpha和第三参数k。
可选地,当所述第三数值C为0,且所述整数B大于或等于(alpha_depth-1)时,所述第一参数alpha和所述第三参数k通过以下公式获取:
alpha=a4>>(n2–alpha_depth),
k=S–(n2–alpha_depth),其中所述第四参数S是所述第一数值a3的归一化参数,n2为第二数值a4的二进制表达中,除符号位外有效比特的数目。
可选地,所述补偿值offset为缺省值或基于所述第一数值a3的值确定的值,或所述第三数值C为缺省值或基于所述第一数值a3的值确定的值,且所述整数B,所述第三数值C,和所述补偿值offset不能同时为0。
图8是本发明另一实施例的视频图像分量的预测方法80的示意框图。
S81,对当前亮度分量图像块内所有采样点以及当前亮度分量图像块外邻近的采样点的值进行重采样操作,得到色度分量采样点对应的亮度分量值pY’[x,y],其中[x,y]表示色度分量采样点的坐标,可选色度图像块内左上角采样点作为坐标原点。
此步骤中,与前述预测方法30、40和50不同之处在于该方法使用的应用模板。此处仍以L型模板为例说明本发明实施例的改进的应用模板,示意图如图9A至图9D。
重采样方法与视频图像信号的采样格式有关。重采样的目的是获取色度分量采样点位置的亮度分量值。相关技术中,一种可实施的用于YUV4:2:0格式的重采样方式,计算方法如下:
pY’[x,y]=(recSamplesL[2x-1,2y+1]+2*recSamplesL[2x,2y+1]+recSamplesL[2x+1,2y+1]+2)>>2,其中{(x,y)|x=Dx,...,nS+Dx-1;y=-1}(2.30)
pY’[x,y]=(recSamplesL[2x,2y]+recSamplesL[2x,2y+1])>>1,其中{(x,y)|x,y=0,...,nS-1}(2.31)
pY’[x,y]=(recSamplesL[2x,2y]+recSamplesL[2x,2y+1])>>1,其中{(x,y)|x=-1;y=Dy,...,nS+Dy-1}(2.32)
除上述重采样方法外,还可采用其它重采样方法。如式(2.30.1),(2.31.1)和式(2.32.1)给出另一种实施方式:
pY’[x,y]=(recSamplesL[2x-1,2y+1]+2*recSamplesL[2x,2y+1]+recSamplesL[2x+1,2y+1]+2)>>2,其中{(x,y)|x=Dx,...,nS+Dx-1;y=-1}(2.30.1)
pY’[x,y]=(recSamplesL[2x-1,2y]+recSamplesL[2x-1,2y+1]+recSamplesL[2x,2y]+recSamplesL[2x,2y+1]+recSamplesL[2x+1,2y]+recSamplesL[2x+1,2y+1])>>2,其中{(x,y)|x,y=0,...,nS-1}(2.31.1)
pY’[x,y]=(recSamplesL[2x-1,2y]+recSamplesL[2x-1,2y+1]+recSamplesL[2x,2y]+recSamplesL[2x,2y+1]+recSamplesL[2x+1,2y]+recSamplesL[2x+1,2y+1])>>2,其中{(x,y)|x=-1;y=Dy,...,nS+Dy-1}(2.32.1)
在式(2.30)到式(2.32)中,{(x,y)|x=Dx,...,nS+Dx-1;y=-1}表示当前色度分量图像块上方邻近的采样点,并且最左侧的采样点距离原点在水平方向上的距离有Dx个像素的偏移,且{Dx=0,±1,±2,...,±(2*nS)}。当Dx>0时,当前色度块的上方及右上方的部分采样点将被用于计算;当Dx<0时,当前色度块的上方及上方的左边部分采样点将被用于计算。{(x,y)|x=-1;y=Dy,...,nS+Dy-1}表示当前色度分量图像块左侧邻近的采样点,并且最上方的采样点距离原点在垂直方向上的距离有Dy个像素的偏移。{Dy=0,±1,±2,...,±(2*nS)}当Dy>0时,当前色度块的左侧及左下方的部分采样点将被用于计算;当Dy<0时,当前色度块的左侧及左侧上方的部分采样点将被用于计算。{(x,y)|x,y=0,...,nS-1}表示当前色度分量图像块内采样点,Rec'L[x,y]表示色度分量采样点的亮度分量值。两个方向上的偏移不同时为0
上述色度分量采样点{(x,y)|x=Dx,...,nS+Dx-1;y=-1}和{(x,y)|x=-1;y=Dy,...,nS+Dy-1}构成改进的LM模式的应用模板。该改进的应用模板内所有采样点的亮度分量值与色度分量值将用于计算线性模型中的参数alpha和beta。当Dx>0且Dy>0时,LM模式的应用模板如图9A所示;当Dx>0且Dy=0时,LM模式的应用模板如图9B所示;当Dx>0且Dy=0时,LM模式的应用模板如图9C所示;当Dx<0且Dy>0时,LM模式的应用模板如图9D。在实际应用中,优选的实施方式有以下几种组合:
Dx=1,Dy=1;
Dx=nS/4,Dy=nS/4;
Dx=0,Dy=1;
Dx=0,Dy=2;
Dx=0,Dy=nS/4;
Dx=0,Dy=nS/2;
改进的LM模式的应用模板还有其他形式,此处出于简洁不再一一列举。
S82,使用线性回归技术,计算线性模型参数alpha放大2S(即1<<S)倍后的近似值a3,并用整数运算代替浮点运算,采用加法,移位,和乘法等操作实现。线性回归技术是公知技术,式(2.33)到(2.37)给出一种可能的实施方法计算这一过程中的中间变量L,C,LL,LC。从这些中间变量到得到a3的计算步骤可如预测方法40和50中的式(2.3)到(2.10),也还可采用其它相关技术中的计算步骤。
k3=Max(0,BitDepthC+log2(nS)–14) (2.33)
L = ( &Sigma; y = D y n S + D y - 1 p Y &prime; &lsqb; - 1 , y &rsqb; + &Sigma; x = D x n S + D x - 1 p Y &prime; &lsqb; x , - 1 &rsqb; ) > > k 3 - - - ( 2.34 )
C = ( &Sigma; y = D y n S + D y - 1 p &lsqb; - 1 , y &rsqb; + &Sigma; x = D x n S + D x - 1 p &lsqb; x , - 1 &rsqb; ) > > k 3 - - - ( 2.35 )
L L = ( &Sigma; y = D y n S + D y - 1 p Y &prime; &lsqb; - 1 , y &rsqb; 2 + &Sigma; x = D x n S + D x - 1 p Y &prime; &lsqb; x , - 1 &rsqb; 2 ) > > k 3 - - - ( 2.36 )
L C = ( &Sigma; y = D y n S + D y - 1 p Y &prime; &lsqb; - 1 , y &rsqb; * p &lsqb; - 1 , y &rsqb; + &Sigma; x = D x n S + D x - 1 p Y &prime; &lsqb; x , - 1 &rsqb; * p &lsqb; x , - 1 &rsqb; ) > > k 3 - - - ( 2.37 )
本发明实施例针对当前块中物体边缘位置多样性的情况,将LM模式的应用模板中的左侧模板或上方模板的位置做一定距离的偏移,使得在图3.b所示的当前块内边缘延伸超出上方模板或者左侧模板的情况下提高LM模式的预测准确度。
S83,降低相关技术中alpha的精度,或者限制用于计算beta和计算预测值的alpha的最大有效位宽为alpha_depth。一种可能的实施方式如预测方法40中S43、S44或预测方法中S53、S54。当预测方法采用上述降低相关技术中alpha的步骤时,去除了(n2–alpha_depth)和0的大小关系判断,降低了上述预测方法中使用的装置的硬件的复杂度,可以节省成本,同时提高预测的运算速度,进一步地还可以针对如图6B例举的特定场景,提高预测的精确度。如果只为了提高预测的精确度,可以沿用相关技术,此步骤亦可省略。
S84,计算beta的值,并将alpha和beta代入线性模型得到当前色度图像块的预测值predSamples[x,y]。如式(2.25)和(2.26)所示。此代入线性模型的计算为公知技术。
可选地,作为一种实现方式,当预测方法30、40或50对应的步骤S31、S41或S51中采用预测方法70或80中的应用模板时,过程与预测方法70或80相同。此时,预测方法30、40、50、70或80在P>=(alpha_depth-1)时可简化固定alpha最大有效比特位深的操作,去除了条件判断,有利于硬件实现。此外方便通过用BD-Bitrate的客观衡量方式比较预测方法的效果。
举例来说,表2、表3和表4分别给出了预测方法40或50在HEVC参考软件HM5.0上实现的结果。表内的数字为负,则说明预测方法40或50有增益。
当B=5时,预测方法40或50实现的结果如下表2所示。
表2
当B=6时,预测方法40或50实现的结果如下表3所示。
表3
当B=7时,预测方法40或50实现的结果如下表4所示。
表4
表5,表6,表7,表8分别给出预测方法80在HEVC参考软件HM5.0上实现的结果。表内的数字为负,则说明预测方法80的方法有增益。
当Dx=nS/4,Dy=nS/4时,预测方法80实现的结果如下表5所示。
表5
当Dx=0,Dy=1时,预测方法80实现的结果如下表6所示。
表6
当Dx=0,Dy=2时,预测方法80实现的结果如下表7所示。
表7
当Dx=0,Dy=nS/4时,预测方法80实现的结果如下表8所示
表8
图10是本发明实施例的视频图像分量的预测装置100的示意框图。装置100可以实现预测方法30、40、50,包括第一获取模块101、第二获取模块102、第三获取模块103和第四获取模块104。
第一获取模块,用于获取图像块亮度分量值。
第二获取模块,用于基于应用模板内采样点的亮度分量值和色度分量值,通过线性回归技术得到第一数值a3,对所述第一数值a3进行补偿后改变数值精度以获取第一参数alpha和第三参数k,其中所述第三参数k是第一参数alpha的归一化参数,所述第一数值a3归一化后的值或第一参数alpha归一化后的值是所述线性模型中指示线性关系的斜率,所述应用模板为线性模型参数计算中采用的所述图像块的邻近的采样点的集合,且当所述图像块的左上角为坐标原点时,在所述图像块上方的最左侧的所述邻近采样点距离所述坐标原点在水平方向上有偏移,或在所述图像块左侧的最上方的所述邻近采样点距离所述坐标原点在垂直方向上有偏移,并且两个方向上的偏移不同时为0。
第三获取模块,用于基于所述第一参数alpha和所述第三参数k获取所述线性模型的第二参数beta,所述第二参数beta是所述线性模型中指示线性关系的纵轴截距。
第四获取模块,用于基于所述第一获取模块获取的所述图像块亮度分量值、所述第二获取模块获取所述第一参数alpha、所述第三参数k和所述第三获取模块获取的所述第二参数beta,通过所述线性模型获取所述图像块的色度分量的预测值。
本发明实施例通过改进视频图像分量预测时使用的线性模型中的参数,从而实现提高编码性能,同时降低使用该预测方法的装置的复杂度。
作为不同的实施例,可选地,其中所述第二获取模块还可以所述第二获取模块具体用于对所述第一数值a3进行补偿,将补偿后得到的二进制数值的最低整数B位置零,并将所述最低整数B位置零后得到的数值与第三数值C相加以获取第二数值a4。
可选地,所述第二获取模块具体基于以下公式获取第二数值a4,
a4=[((a3+offset)>>B)<<B]+C,其中offset为补偿值。
可选地,当补偿值offset和第三数值C同为0时,所述第二获取模块具体基于以下公式获取第二数值a4,a4=((a3)>>B)<<B。
可选地,所述第二获取模块具体用于对所述第一数值a3进行补偿,将补偿后得到的二进制数值与第四数值D进行按位逻辑操作以获取第二数值a4,其中所述第四数值D满足与所述补偿后得到的二进制数值进行按位逻辑操作后得到的二进制数值的最低整数B位为0。
可选地,所述第二获取模块具体基于以下公式获取第二数值a4,a4=(a3+offset)&(~(2B-1))+C,其中D=~(2B-1)。符号“&”表示“按位逻辑与”操作。
可选地,当所述补偿值offset和第三数值C同为0时,所述第二获取模块具体基于以下公式获取第二数值a4,a4=(a3)&(~(2B-1))。
可选地,所述第二获取模块具体用于对所述第一数值a3进行补偿,将补偿后得到的数值进行缩放以获取第二数值a4。
可选地,所述第二获取模块具体基于以下公式获取第二数值a4,a4=(a3+offset)*Sc,其中Sc表示缩放系数。
可选地,当所述缩放系数Sc的数值为2的整数B次幂时,所述第二获取模块具体基于以下公式获取第二数值a4,a4=(a3+offset)<<B。
可选地,所述补偿值offset为0时,所述第二获取模块具体基于以下公式获取第二数值a4,a4=a3<<B。
所述第二获取模块还具体用于基于所述第二数值a4,获取以预定的位宽alpha_depth表达的所述第一参数alpha和第三参数k。
可选地,所述第二获取模块具体当所述第三数值C为0,且所述整数B大于或等于(alpha_depth-1)时,通过以下公式获取所述第一参数alpha和所述第三参数k:
alpha=a4>>(n2–alpha_depth),
k=S–(n2–alpha_depth),其中所述第四参数S是所述第一数值a3的归一化参数,n2为第二数值a4的二进制表达中,除符号位外有效比特的数目。
可选地,所述第二获取模块使用的所述补偿值offset为缺省值或基于所述第一数值a3的值确定的值,或所述第三数值C为缺省值或基于所述第一数值a3的值确定的值,且所述整数B,所述第三数值C,和所述补偿值offset不能同时为0。
可选地,所述第二获取模块使用的所述应用模板为所述线性模型参数计算中采用的所述图像块的邻近的采样点的集合,且当所述图像块的左上角为坐标原点时,在所述图像块上方的最左侧的所述邻近采样点距离所述坐标原点在水平方向上有偏移,或在所述图像块左侧的最上方的所述邻近采样点距离所述坐标原点在垂直方向上有偏移,并且两个方向上的偏移不同时为0。
可选地,所述第二获取模块使用的所述应用模块中,在水平方向上的所述图像块使用的邻近采样点为连续的采样点或在垂直方向上所述图像块使用的邻近采样点为连续的采样点。
可选地,所述第二获取模块使用的应用模板中,在水平方向上的所述图像块使用的图像块上方的最左侧的所述邻近采样点距离所述坐标原点在水平方向上偏移为0,1,2,nS/4,或者nS/2个采样点,其中nS为所述图像块的色度分量在水平方向的大小;或
在垂直方向上的所述图像块使用的图像块左侧的最上方的所述邻近采样点距离所述坐标原点在垂直方向上偏移为0,1,2,nS/4,或者nS/2个采样点,其中nS为所述图像块的色度分量在垂直方向的大小。
本发明实施例通过改进视频图像分量预测时使用的线性模型中的参数,从而实现提高编码速度,降低使用该预测方法的装置的复杂度,提高了编码性能,还能够提高特定场景的预测精度。
图11是本发明实施例的视频图像分量的另一预测装置110的示意框图。装置110可以实现预测方法70和80,包括第一获取模块111、第二获取模块112、第三获取模块113和第四获取模块114。
第一获取模块,用于获取图像块亮度分量值。第二获取模块,用于基于应用模板内采样点的亮度分量值和色度分量值,通过线性回归技术得到第一数值a3以获取第一参数alpha和第三参数k,其中所述第三参数k是第一参数alpha的归一化参数,所述第一数值a3归一化后的值或第一参数alpha归一化后的值是所述线性模型中指示线性关系的斜率α,所述应用模板为线性模型参数计算中采用的所述图像块的邻近的采样点的集合,且当所述图像块的左上角为坐标原点时,在所述图像块上方的最左侧的所述邻近采样点距离所述坐标原点在水平方向上有偏移,或在所述图像块左侧的最上方的所述邻近采样点距离所述坐标原点在垂直方向上有偏移,并且两个方向上的偏移不同时为0。
第三获取模块,用于基于所述第一参数alpha和所述第三参数k获取所述线性模型的第二参数beta,所述第二参数beta是所述线性模型中指示线性关系的纵轴截距β;
第四获取模块,用于基于所述第一获取模块获取的所述图像块的亮度分量值、所述第二获取模块获取的所述第一参数alpha、所述第三参数k和所述第三获取模块获取的所述第二参数beta,通过所述线性模型获取所述图像块的色度分量的预测值。
上述技术方案通过改进相关预测技术中的线性模型的应用模板,从而提高特定场景的预测精度。
作为不同的实施例,可选地,所述第二获取模块使用的应用模板中,在水平方向上的所述图像块使用的邻近采样点为连续的采样点或在垂直方向上所述图像块使用的邻近采样点为连续的采样点。
可选地,所述第二获取模块使用的应用模板中,在水平方向上的所述图像块使用的图像块上方的最左侧的所述邻近采样点距离所述坐标原点在水平方向上偏移为0,1,2,nS/4,或者nS/2个采样点,其中nS为所述图像块的色度分量在水平方向的大小;或在垂直方向上的所述图像块使用的图像块左侧的最上方的所述邻近采样点距离所述坐标原点在垂直方向上偏移为0,1,2,nS/4,或者nS/2个采样点,其中nS为所述图像块的色度分量在垂直方向的大小。
可选地,所述第二获取模块具体用于基于线性回归技术得到第一数值a3,对所述第一数值a3进行补偿后改变数值精度以获取第一参数alpha和第三参数k。
可选地,所述第二获取模块进一步具体用于对所述第一数值a3进行补偿,将补偿后得到的二进制数值的最低整数B位置零,并将所述最低整数B位置零后得到的数值与第三数值C相加以获取第二数值a4。
可选地,所述第二获取模块具体基于以下公式获取第二数值a4,
a4=[((a3+offset)>>B)<<B]+C,其中offset为补偿值。
可选地,当补偿值offset和第三数值C同为0时,所述第二获取模块具体基于以下公式获取第二数值a4,
a4=((a3)>>B)<<B。
可选地,所述第二获取模块进一步具体用于对所述第一数值a3进行补偿,将补偿后得到的二进制数值与第四数值D进行按位逻辑操作以获取第二数值a4,其中所述第四数值D满足与所述补偿后得到的二进制数值进行按位逻辑操作后得到的二进制数值的最低整数B位为0。
可选地,所述第二获取模块具体基于以下公式获取第二数值a4,
a4=(a3+offset)&(~(2B-1))+C,其中D=~(2B-1)。
可选地,当所述补偿值offset和第三数值C同为0时,所述第二获取模块具体基于以下公式获取第二数值a4,
a4=(a3)&(~(2B-1))。
可选地,所述第二获取模块进一步具体用于对所述第一数值a3进行补偿,将补偿后得到的数值进行缩放以获取第二数值a4。
可选地,所述第二获取模块具体基于以下公式获取第二数值a4,
a4=(a3+offset)*Sc,其中Sc表示缩放系数。
可选地,所述缩放系数Sc的数值为2的整数B次幂时,所述第二获取模块具体基于以下公式获取第二数值a4,a4=(a3+offset)<<B。
可选地,所述补偿值offset为0时,所述第二获取模块具体基于以下公式获取第二数值a4,a4=a3<<B。
可选地,所述第二获取模块还具体用于基于所述第二数值a4,获取以预定的位宽alpha_depth表达的所述第一参数alpha和第三参数k。
可选地,当所述第三数值C为0,且所述整数B大于或等于(alpha_depth-1)时,所述第二获取模块具体通过以下公式获取所述第一参数alpha和所述第三参数k:
alpha=a4>>(n2–alpha_depth),
k=S–(n2–alpha_depth),
其中所述第四参数S是所述第一数值a3的归一化参数,n2为第二数值a4的二进制表达中,除符号位外有效比特的数目。
可选地,所述第二获取模块获取的所述补偿值offset为缺省值或基于所述第一数值a3的值确定的值,或所述第三数值C为缺省值或基于所述第一数值a3的值确定的值,且所述整数B,所述第三数值C,和所述补偿值offset不能同时为0。
本发明实施例通过改进改进相关预测技术中的线性模型的应用模板,从而实现提高特定场景的预测精度,同时还提高了编码速度,降低了使用该预测方法的装置的复杂度,提高了编码性能。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (34)

1.一种视频图像分量的预测方法,其特征在于,包括:
获取图像块亮度分量值;
基于应用模板内采样点的亮度分量值和色度分量值,通过线性回归技术得到第一数值a3以获取第一参数alpha和第三参数k,其中所述第三参数k是第一参数alpha的归一化参数,所述第一数值a3归一化后的值或第一参数alpha归一化后的值是所述线性模型中指示线性关系的斜率,所述应用模板为线性模型参数计算中采用的所述图像块的邻近的采样点的集合,且当所述图像块的左上角为坐标原点时,在所述图像块上方的最左侧的所述邻近采样点距离所述坐标原点在水平方向上有偏移,或在所述图像块左侧的最上方的所述邻近采样点距离所述坐标原点在垂直方向上有偏移,并且两个方向上的偏移不同时为0;
基于所述第一参数alpha和所述第三参数k获取所述线性模型的第二参数beta,所述第二参数beta是所述线性模型中指示线性关系的纵轴截距;
基于所述图像块亮度分量值、所述第一参数alpha、所述第三参数k和所述第二参数beta,通过所述线性模型获取所述图像块的色度分量的预测值。
2.根据权利要求1所述的方法,其特征在于:
在水平方向上的所述图像块使用的邻近采样点为连续的采样点或在垂直方向上所述图像块使用的邻近采样点为连续的采样点。
3.根据权利要求1所述的方法,其特征在于:
在水平方向上的所述图像块使用的图像块上方的最左侧的所述邻近采样点距离所述坐标原点在水平方向上偏移为0,1,2,nS/4,或者nS/2个采样点,其中nS为所述图像块的色度分量在水平方向的大小;或
在垂直方向上的所述图像块使用的图像块左侧的最上方的所述邻近采样点距离所述坐标原点在垂直方向上偏移为0,1,2,nS/4,或者nS/2个采样点,其中nS为所述图像块的色度分量在垂直方向的大小。
4.根据权利要求1所述的方法,其特征在于,所述基于线性回归技术得到第一数值a3以获取第一参数alpha和第三参数k包括:
基于线性回归技术得到第一数值a3,对所述第一数值a3进行补偿后改变数值精度以获取第一参数alpha和第三参数k。
5.根据权利要求4所述的方法,其特征在于,所述对所述第一数值a3进行补偿后改变数值精度以获取第一参数alpha和第三参数k包括:
对所述第一数值a3进行补偿,将补偿后得到的二进制数值的最低整数B位置零,并将所述最低整数B位置零后得到的数值与第三数值C相加以获取第二数值a4。
6.根据权利要求5所述的方法,其特征在于,所述获取第二数值a4具体包括:
基于以下公式获取第二数值a4,
a4=[((a3+offset)>>B)<<B]+C,
其中offset为补偿值。
7.根据权利要求6所述的方法,其特征在于,所述获取第二数值a4具体包括:
当补偿值offset和第三数值C同为0时,基于以下公式获取第二数值a4,
a4=((a3)>>B)<<B。
8.根据权利要求5所述的方法,其特征在于,所述对所述第一数值a3进行补偿后改变数值精度以获取第一参数alpha和第三参数k包括:
对所述第一数值a3进行补偿,将补偿后得到的二进制数值与第四数值D进行按位逻辑操作以获取第二数值a4,其中所述第四数值D满足与所述补偿后得到的二进制数值进行按位逻辑操作后得到的二进制数值的最低整数B位为0。
9.根据权利要求8所述的方法,其特征在于,所述获取第二数值a4具体包括:
基于以下公式获取第二数值a4,
a4=(a3+offset)&(~(2B-1))+C,
其中D=~(2B-1)。
10.根据权利要求9所述的方法,其特征在于,所述获取第二数值a4具体包括:
当所述补偿值offset和第三数值C同为0时,基于以下公式获取第二数值a4,
a4=(a3)&(~(2B-1))。
11.根据权利要求4所述的方法,其特征在于,对所述第一数值a3进行补偿后改变数值精度以获取第一参数alpha和第三参数k,包括:
对所述第一数值a3进行补偿,将补偿后得到的数值进行缩放以获取第二数值a4。
12.根据权利要求11所述的方法,其特征在于,所述获取第二数值a4具体包括:
基于以下公式获取第二数值a4,
a4=(a3+offset)*Sc,
其中Sc表示缩放系数。
13.根据权利要求12所述的方法,其特征在于,所述获取第二数值a4具体包括:
所述缩放系数Sc的数值为2的整数B次幂时,基于以下公式获取第二数值a4,
a4=(a3+offset)<<B。
14.根据权利要求13所述的方法,其特征在于,所述补偿值offset为0时,所述获取第二数值a4具体包括:
所述补偿值offset为0时,基于以下公式获取第二数值a4,
a4=a3<<B。
15.根据权利要求5至10中任一所述的方法,其特征在于,所述方法还包括:
基于所述第二数值a4,获取以预定的位宽alpha_depth表达的所述第一参数alpha和第三参数k。
16.根据权利要求15所述的方法,其特征在于,所述基于所述第二数值a4,获取以预定的位宽alpha_depth表达的第一参数alpha和第三参数k具体包括:
当所述第三数值C为0,且所述整数B大于或等于alpha_depth-1时,所述第一参数alpha和所述第三参数k通过以下公式获取:
alpha=a4>>(n2–alpha_depth),
k=S–(n2–alpha_depth),
其中S是所述第一数值a3的归一化参数,n2为第二数值a4的二进制表达中,除符号位外有效比特的数目。
17.根据权利要求6或8所述的方法,其特征在于:
所述补偿值offset为缺省值或基于所述第一数值a3的值确定的值,或所述第三数值C为缺省值或基于所述第一数值a3的值确定的值,且所述整数B,所述第三数值C,和所述补偿值offset不能同时为0。
18.一种视频图像分量的预测装置,其特征在于,包括:
第一获取模块,用于获取图像块亮度分量值;
第二获取模块,用于基于应用模板内采样点的亮度分量值和色度分量值,通过线性回归技术得到第一数值a3以获取第一参数alpha和第三参数k,其中所述第三参数k是第一参数alpha的归一化参数,所述第一数值a3归一化后的值或第一参数alpha归一化后的值是所述线性模型中指示线性关系的斜率,所述应用模板为线性模型参数计算中采用的所述图像块的邻近的采样点的集合,且当所述图像块的左上角为坐标原点时,在所述图像块上方的最左侧的所述邻近采样点距离所述坐标原点在水平方向上有偏移,或在所述图像块左侧的最上方的所述邻近采样点距离所述坐标原点在垂直方向上有偏移,并且两个方向上的偏移不同时为0;
第三获取模块,用于基于所述第一参数alpha和所述第三参数k获取所述线性模型的第二参数beta,所述第二参数beta是所述线性模型中指示线性关系的纵轴截距;
第四获取模块,用于基于所述第一获取模块获取的所述图像块亮度分量值、所述第二获取模块获取的所述第一参数alpha、所述第三参数k和所述第三获取模块获取的所述第二参数beta,通过所述线性模型获取所述图像块的色度分量的预测值。
19.根据权利要求18所述的装置,其特征在于:
所述第一获取模块使用的应用模板中,在水平方向上的所述图像块使用的邻近采样点为连续的采样点或在垂直方向上所述图像块使用的邻近采样点为连续的采样点。
20.根据权利要求18所述的装置,其特征在于:
所述第二获取模块使用的应用模板中,在水平方向上的所述图像块使用的图像块上方的最左侧的所述邻近采样点距离所述坐标原点在水平方向上偏移为0,1,2,nS/4,或者nS/2个采样点,其中nS为所述图像块的色度分量在水平方向的大小;或
在垂直方向上的所述图像块使用的图像块左侧的最上方的所述邻近采样点距离所述坐标原点在垂直方向上偏移为0,1,2,nS/4,或者nS/2个采样点,其中nS为所述图像块的色度分量在垂直方向的大小。
21.根据权利要求18所述的装置,其特征在于:
所述第二获取模块具体用于基于线性回归技术得到第一数值a3,对所述第一数值a3进行补偿后改变数值精度以获取第一参数alpha和第三参数k。
22.根据权利要求21所述的装置,其特征在于,:
所述第二获取模块进一步具体用于对所述第一数值a3进行补偿,将补偿后得到的二进制数值的最低整数B位置零,并将所述最低整数B位置零后得到的数值与第三数值C相加以获取第二数值a4。
23.根据权利要求22所述的装置,其特征在于:
所述第二获取模块具体基于以下公式获取第二数值a4,
a4=[((a3+offset)>>B)<<B]+C,
其中offset为补偿值。
24.根据权利要求23所述的装置,其特征在于:
当补偿值offset和第三数值C同为0时,所述第二获取模块具体基于以下公式获取第二数值a4,
a4=((a3)>>B)<<B。
25.根据权利要求22所述的装置,其特征在于:
所述第二获取模块进一步具体用于对所述第一数值a3进行补偿,将补偿后得到的二进制数值与第四数值D进行按位逻辑操作以获取第二数值a4,其中所述第四数值D满足与所述补偿后得到的二进制数值进行按位逻辑操作后得到的二进制数值的最低整数B位为0。
26.根据权利要求25所述的装置,其特征在于:
所述第二获取模块具体基于以下公式获取第二数值a4,
a4=(a3+offset)&(~(2B-1))+C,
其中D=~(2B-1)。
27.根据权利要求26所述的装置,其特征在于:
当所述补偿值offset和第三数值C同为0时,所述第二获取模块具体基于以下公式获取第二数值a4,
a4=(a3)&(~(2B-1))。
28.根据权利要求21所述的装置,其特征在于:
所述第二获取模块进一步具体用于对所述第一数值a3进行补偿,将补偿后得到的数值进行缩放以获取第二数值a4。
29.根据权利要求28所述的预测装置,其特征在于:
所述第二获取模块具体基于以下公式获取第二数值a4,
a4=(a3+offset)*Sc,
其中Sc表示缩放系数。
30.根据权利要求29所述的装置,其特征在于:
所述缩放系数Sc的数值为2的整数B次幂时,所述第二获取模块具体基于以下公式获取第二数值a4,
a4=(a3+offset)<<B。
31.根据权利要求30所述的装置,其特征在于:
所述补偿值offset为0时,所述第二获取模块具体基于以下公式获取第二数值a4,
a4=a3<<B。
32.根据权利要求22至27中任一所述的装置,其特征在于:
所述第二获取模块还具体用于基于所述第二数值a4,获取以预定的位宽alpha_depth表达的所述第一参数alpha和第三参数k。
33.根据权利要求32所述的装置,:
当所述第三数值C为0,且所述整数B大于或等于alpha_depth-1时,所述第二获取模块具体通过以下公式获取所述第一参数alpha和所述第三参数k:
alpha=a4>>(n2–alpha_depth),
k=S–(n2–alpha_depth),
其中S是所述第一数值a3的归一化参数,n2为第二数值a4的二进制表达中,除符号位外有效比特的数目。
34.根据权利要求23或25所述的装置,其特征在于:
所述第二获取模块获取的所述补偿值offset为缺省值或基于所述第一数值a3的值确定的值,或所述第三数值C为缺省值或基于所述第一数值a3的值确定的值,且所述整数B,所述第三数值C,和所述补偿值offset不能同时为0。
CN201210111020.7A 2012-04-16 2012-04-16 视频图像分量的预测方法和装置 Active CN103379321B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201210111020.7A CN103379321B (zh) 2012-04-16 2012-04-16 视频图像分量的预测方法和装置
PCT/CN2012/081613 WO2013155817A1 (zh) 2012-04-16 2012-09-19 视频图像分量的预测方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210111020.7A CN103379321B (zh) 2012-04-16 2012-04-16 视频图像分量的预测方法和装置

Publications (2)

Publication Number Publication Date
CN103379321A CN103379321A (zh) 2013-10-30
CN103379321B true CN103379321B (zh) 2017-02-01

Family

ID=49382860

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210111020.7A Active CN103379321B (zh) 2012-04-16 2012-04-16 视频图像分量的预测方法和装置

Country Status (2)

Country Link
CN (1) CN103379321B (zh)
WO (1) WO2013155817A1 (zh)

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9998742B2 (en) * 2015-01-27 2018-06-12 Qualcomm Incorporated Adaptive cross component residual prediction
CN107534779B (zh) * 2015-04-30 2020-04-28 华为技术有限公司 一种图像采样方法及装置
CN107852512A (zh) * 2015-06-07 2018-03-27 夏普株式会社 基于亮度转换函数或视频色彩分量值的优化视频编码的系统及方法
CN105306944B (zh) * 2015-11-30 2018-07-06 哈尔滨工业大学 混合视频编码标准中色度分量预测方法
WO2017139937A1 (en) * 2016-02-18 2017-08-24 Mediatek Singapore Pte. Ltd. Advanced linear model prediction for chroma coding
CN118714296A (zh) 2016-10-04 2024-09-27 Lx 半导体科技有限公司 图像编码/解码方法和图像数据的发送方法
US10880570B2 (en) * 2016-10-05 2020-12-29 Qualcomm Incorporated Systems and methods of adaptively determining template size for illumination compensation
CN107454469B (zh) * 2017-07-21 2019-11-22 北京奇艺世纪科技有限公司 一种视频图像处理方法及装置
CN107580222B (zh) * 2017-08-01 2020-02-14 北京交通大学 一种基于线性模型预测的图像或视频编码方法
RU2684585C1 (ru) * 2017-12-18 2019-04-09 Публичное акционерное общество "Ростовский оптико-механический завод" Способ комплексирования полутоновых телевизионных и тепловизионных изображений
GB2571313B (en) 2018-02-23 2022-09-21 Canon Kk New sample sets and new down-sampling schemes for linear component sample prediction
MX2021001569A (es) * 2018-08-09 2021-04-28 Guangdong Oppo Mobile Telecommunications Corp Ltd Metodo y dispositivo de prediccion de componente de imagen de video, y medio de almacenamiento de computadora.
IL280695B1 (en) 2018-08-09 2024-10-01 Guangdong Oppo Mobile Telecommunications Corp Ltd Method and apparatus for predicting a video image component and storage medium in a computer
CN110944180B (zh) * 2018-09-21 2023-04-28 华为技术有限公司 色度块预测方法及装置
WO2020057506A1 (zh) * 2018-09-21 2020-03-26 华为技术有限公司 色度块预测方法及装置
CN112313950B (zh) * 2018-09-21 2023-06-02 Oppo广东移动通信有限公司 视频图像分量的预测方法、装置及计算机存储介质
KR20210070368A (ko) 2018-10-12 2021-06-14 광동 오포 모바일 텔레커뮤니케이션즈 코포레이션 리미티드 비디오 이미지 요소 예측 방법 및 장치, 컴퓨터 저장 매체
EP3861728A4 (en) 2018-11-06 2022-04-06 Beijing Bytedance Network Technology Co., Ltd. COMPLEXITY REDUCTION IN A DERIVATION OF PARAMETERS FOR AN INTRA PREDICTION
CN113170122B (zh) 2018-12-01 2023-06-27 北京字节跳动网络技术有限公司 帧内预测的参数推导
CA3121671C (en) 2018-12-07 2024-06-18 Beijing Bytedance Network Technology Co., Ltd. Context-based intra prediction
AU2020226565C1 (en) 2019-02-22 2024-01-11 Beijing Bytedance Network Technology Co., Ltd. Neighbouring sample selection for intra prediction
CA3128769C (en) 2019-02-24 2023-01-24 Beijing Bytedance Network Technology Co., Ltd. Parameter derivation for intra prediction
CN117880494A (zh) 2019-03-24 2024-04-12 北京字节跳动网络技术有限公司 用于帧内预测的参数推导的条件
WO2020258052A1 (zh) * 2019-06-25 2020-12-30 Oppo广东移动通信有限公司 图像分量预测方法、装置及计算机存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011126348A2 (en) * 2010-04-09 2011-10-13 Lg Electronics Inc. Method and apparatus for processing video data
CN103096055A (zh) * 2011-11-04 2013-05-08 华为技术有限公司 一种图像信号帧内预测及解码的方法和装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3356516B2 (ja) * 1993-12-28 2002-12-16 シャープ株式会社 動画像符号化装置
AU2003284958A1 (en) * 2003-01-10 2004-08-10 Thomson Licensing S.A. Fast mode decision making for interframe encoding
EP1727371A1 (en) * 2005-05-27 2006-11-29 Thomson Licensing Method for controlling the encoder output bit rate in a block-based video encoder, and corresponding video encoder apparatus
US9008174B2 (en) * 2008-01-10 2015-04-14 Thomson Licensing Methods and apparatus for illumination compensation of intra-predicted video
CN101247525B (zh) * 2008-03-24 2010-06-02 北京邮电大学 一种提高图像帧内编码速率的方法
CN102209243B (zh) * 2011-05-27 2012-10-24 山东大学 基于线性模型的深度图帧内预测方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011126348A2 (en) * 2010-04-09 2011-10-13 Lg Electronics Inc. Method and apparatus for processing video data
CN103096055A (zh) * 2011-11-04 2013-05-08 华为技术有限公司 一种图像信号帧内预测及解码的方法和装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CE6.a.4: Chroma intra prediction by reconstructed luma samples;Jianle Chen.et al;《Joint Collaborative Team on Video Coding (JCT-VC-E266)of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11》;20110523;8 *
Chroma intra prediction by reconstructed luma samples;Jianle Chen.et al;《Joint Collaborative Team on Video Coding (JCT-VC-C206)of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11》;20101015;1-7 *

Also Published As

Publication number Publication date
WO2013155817A1 (zh) 2013-10-24
CN103379321A (zh) 2013-10-30

Similar Documents

Publication Publication Date Title
CN103379321B (zh) 视频图像分量的预测方法和装置
CN100380974C (zh) 用于视频解块的方法和设备
CN1926875B (zh) 运动补偿方法
CN103188493B (zh) 图像编码装置及图像编码方法
CN103096055B (zh) 一种图像信号帧内预测及解码的方法和装置
CN103404137B (zh) 有效的样本自适应补偿的方法和装置
CN102088589B (zh) 基于双向的局部和全局运动估计的帧率转换
CN103037214A (zh) 视频压缩方法
CN108712648B (zh) 一种深度视频快速帧内编码方法
JPH07154784A (ja) 分類されたベクトルの量子化による映像信号のチャネルエラー訂正方法
CN102934441A (zh) 新的平面预测模式
CN102598687B (zh) 计算视频图像中的模糊的方法和装置
EP1608180A1 (en) Method and apparatus for sub-pixel motion estimation which reduces bit precision
CN107046644A (zh) 运动图像编码装置以及运动图像解码装置
US9883200B2 (en) Method of acquiring neighboring disparity vectors for multi-texture and multi-depth video
CN106791768B (zh) 一种基于图割优化的深度图帧率提升方法
CN103067704A (zh) 一种基于编码单元层次提前跳过的视频编码方法和系统
CN101710985B (zh) 一种用于图像编码的图像亮度补偿方法
CN101765011B (zh) 缩放运动估计的方法和装置
CN102685505B (zh) 帧内预测的方法和预测装置
CN101877790B (zh) 一种面向全景视频编码的快速全局运动估计方法
CN101938649A (zh) 译码设备、译码控制设备、译码方法和程序
CN102377993A (zh) 帧内预测模式选择方法和系统
CN106331700A (zh) 参考图像编码和解码的方法、编码设备和解码设备
CN102592130B (zh) 一种针对水下显微视频的目标识别系统及其视频编码方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant