CN109587481A - 视频编码方法及设备 - Google Patents

视频编码方法及设备 Download PDF

Info

Publication number
CN109587481A
CN109587481A CN201811261700.0A CN201811261700A CN109587481A CN 109587481 A CN109587481 A CN 109587481A CN 201811261700 A CN201811261700 A CN 201811261700A CN 109587481 A CN109587481 A CN 109587481A
Authority
CN
China
Prior art keywords
image block
prediction mode
final
value
pixel component
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811261700.0A
Other languages
English (en)
Other versions
CN109587481B (zh
Inventor
岳庆冬
田林海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu huaiye Information Technology Co.,Ltd.
Original Assignee
Xian Cresun Innovation Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xian Cresun Innovation Technology Co Ltd filed Critical Xian Cresun Innovation Technology Co Ltd
Priority to CN201811261700.0A priority Critical patent/CN109587481B/zh
Publication of CN109587481A publication Critical patent/CN109587481A/zh
Application granted granted Critical
Publication of CN109587481B publication Critical patent/CN109587481B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/179Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scene or a shot
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/182Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明涉及一种视频编码方法及设备,包括将视频图像帧划分为多个固定大小的图像块;在多种预测方式中针对每个图像块选择至少一种预测方式作为所述每个图像块的预选预测方式;根据所述每个图像块的预选预测方式确定所述每个图像块的最终预测方式和最终预测值;将所述每个图像块的最终预测方式和所述最终预测值进行编码形成比特流。本发明通过多种预测方式中选取至少一种预测方式作为每个图像块的预选预测方式,根据预选的预测方式对每个图像块进行预测获取预测值,根据预测值获取最终预测方式和预测残差。该编码方法无需轮询每种预测方式,减少了大量的计算,进一步提高视频图像的编码压缩率。

Description

视频编码方法及设备
技术领域
本发明涉及一种压缩技术领域,特别涉及一种视频编码方法及设备。
背景技术
近年来,随着科学技术的发展,视频压缩编码技术已经广泛地使用 在各式不同的装置上,包括现今各式消费类电子产品、手提式个人通讯 装置、无线的或有线的网络通信产品、宽带网络、以及多媒体应用。视 频压缩编码技术变得尤为重要,并形成多个的视频编码标准。例如有H.26x 所表示的ITU-T(国际电气通信联盟电气通信标准化部门)标准和MPEG-x所表示的ISO/IEC标准。
视频图像之所以能被压缩编码,是因为图像数据中存在着冗余。图 像数据的冗余主要表现为:图像中相邻像素间的相关性引起的空间冗余; 图像序列中不同帧之间存在相关性引起的时间冗余;不同彩色平面或频 谱带的相关性引起的频谱冗余。压缩编码的目的就是通过去除这些数据 冗余来减少表示图像数据所需的比特数。
视频图像的压缩编码技术主要由四个部分组成,包含:预测模块、 量化模块、码控模块和熵编码模块。其中预测模块作为一个重要的模块, 是利用相邻像素间存在的空间冗余度,根据邻近像素信息对当前像素值 进行预测。随着视频图像数据的不断增加,如何使视频图像数据的理论 熵达到最小,提高压缩编码的效率成为亟待解决的问题。
发明内容
因此,为解决现有技术存在的技术缺陷和不足,本发明提出一种视频 编码方法及设备。
具体地,本发明一个实施例提出的一种视频编码方法,包括:
将视频图像帧划分为多个固定大小的图像块;
在多种预测方式中针对每个图像块选择至少一种预测方式作为所述每 个图像块的预选预测方式;
根据所述每个图像块的预选预测方式确定所述每个图像块的最终预测 方式和最终预测值;
将所述每个图像块的最终预测方式和所述最终预测值进行编码形成比 特流。
在本发明的一个实施例中,在多种预测方式中针对每个图像块选择至 少一种预测方式作为所述每个图像块的预选预测方式,包括:
选取多种预测方式;
计算所述每个图像块的梯度值;
根据所述每个图像块的梯度值在所述多种预测方式中选取至少一种预 测方式作为所述每个图像块的预选预测方式。
在本发明的一个实施例中,所述每个图像块的梯度值满足:
其中,Grad为梯度值,M*N为每个图像块中的像素分量数量,p为每 个图像块中的像素分量值,i为每个图像块中的行像素分量的位置标识,j 为每个图像块中的列像素分量的位置标识。
在本发明的一个实施例中,根据所述每个图像块的预选预测方式确定 所述每个图像块的最终预测方式和最终预测值,包括:
若当前图像块的预选预测方式为多个,则获取所述当前图像块在每个 预选预测方式下对应的预测值,根据所述当前图像块的多个预测值确定所 述当前图像块的最终预测方式;
若当前图像块的预选预测方式为一个,则此预选预测方式为所述当前 图像块的最终预测方式;
其中,所述最终预测方式对应的预测值为所述最终预测值。
在本发明的另一个实施例提出的一种视频编码设备,包括:
选择器,所述选择器配置为将视频图像帧划分为多个固定大小的图像 块;
在多种预测方式中针对每个图像块选择至少一种预测方式作为所述每 个图像块的预选预测方式;
预测器,所述预测器配置为根据所述每个图像块的预选预测方式确定 所述每个图像块的最终预测方式和最终预测值;
编码器,所述编码器配置为将所述每个图像块的最终预测方式和所述 最终预测值进行编码形成比特流。
在本发明的一个实施例中,所述预测器进一步配置为:
选取多种预测方式;
计算所述每个图像块的梯度值;
根据所述每个图像块的梯度值在所述多种预测方式中选取至少一种预 测方式作为所述每个图像块的预选预测方式。
在本发明的一个实施例中,预测器进一步配置为:
若当前图像块的预选预测方式为多个,则获取所述当前图像块在每个 预选预测方式下对应的预测值,根据所述当前图像块的多个预测值确定所 述当前图像块的最终预测方式;
若当前图像块的预选预测方式为一个,则此预选预测方式为所述当前 图像块的最终预测方式;
其中,所述最终预测方式对应的预测值为所述最终预测值。。
基于此,本发明具备如下优点:
本发明在多种预测方式中选取至少一种预测方式作为每个图像块的预 选预测方式,根据预选的预测方式对每个图像块进行预测获取预测值,根 据预测值获取最终预测方式和预测残差。该编码方法无需轮询每种预测方 式,减少了大量的计算,进一步提高视频图像的编码压缩率。
通过以下参考附图的详细说明,本发明的其它方面和特征变得明显。 但是应当知道,该附图仅仅为解释的目的设计,而不是作为本发明的范围 的限定,这是因为其应当参考附加的权利要求。还应当知道,除非另外指 出,不必要依比例绘制附图,它们仅仅力图概念地说明此处描述的结构和 流程。
附图说明
下面将结合附图,对本发明的具体实施方式进行详细的说明。
图1为本发明实施例提供的一种视频编码方法流程示意图;
图2为本发明实施例提供的一种当前像素分量与周围像素分量的位置 示意图;
图3为本发明实施例提供的一种梯度值计算示意图;
图4为本发明实施例提供的一种采样方式示意图;
图5为本发明实施例提供的一种采样点预测方法示意图;
图6为本发明实施例提供的一种预测重建像素分量参考示意图;
图7为本发明实施例提供的另一种预测重建像素分量参考示意图;
图8为本发明实施例提供的一种视频编码设备的示意图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附 图对本发明的具体实施方式做详细的说明。
实施例一
请参见图1,图1为本发明实施例提供的一种视频编码方法流程示意图; 本实施例对本发明提供的一种视频编码方法进行详细描述,该方法包括如 下步骤:
步骤1、将视频图像帧划分为多个固定大小的图像块;
视频即为连续的图像帧序列。视频编码技术通常将图像帧划分成图像 块进行处理。图像帧可以划分为多个64×16规格的图像块,更或者是具 有更小或更大尺寸规格的图像块的图像块。
步骤2、在多种预测方式中针对每个图像块选择至少一种预测方式作为 所述每个图像块的预选预测方式;
选取多种预测方式;本实施例提供三种预测方式,但选取的预测方式 不限于此三种,可以根据需求选取多种。具体地,本实施例提供的三种预 测方式分别为基于多像素分量参考的预测方式、基于采样的预测方式和基 于纹理的预测方式。
计算所述每个图像块的梯度值,其中每个图像块的梯度值(Grad)计算公 式如下所示:
i为每个图像块中的行像素分量的位置标识,j为每个图像块中的列像 素分量的位置标识,P表示每个图像块中的像素分量值,ABS表示绝对值 运算,M*N表示每个图像块中的像素分量数量。当i的取值为0时,即代 表行位置标识为0的像素分量,即第一行像素分量,此时,设定Pi-1,j的取 值为P0j,同理,当j的取值为0时,即代表列位置标识为0的像素分量, 即第一列像素分量,此时,设定Pi,j-1的取值为Pi,0
根据所述每个图像块的梯度值在所述多种预测方式中选取一种预测方 式作为所述每个图像块的最终预测方式,具体为:获取每个图像块中像素 分量的深度,根据像素分量的深度可以得出每个图像块的梯度值范围。例 如像素分量的深度为9,像素分量的像素值范围为0~29-1,即0~511,则每 个图像块的梯度值范围为0~511。设计梯度范围分级,将梯度范围分为T 个级别,可以得出每个级别的跨度范围。优选地,梯度范围分级可以进行平均分级也可以根据需求进行非平均分级。梯度值的大小与图像纹理信息 相关,梯度值越大,图像纹理信息越复杂,梯度值越小,图像纹理信息越 简单。因此,每个级别对应一种图像纹理信息。根据图像纹理信息的复杂 度,可以选取针对图像块最优的预测方式。
优选地,设置阈值k1,0~k1梯度跨度范围为第一级别,k1~2dep-1梯 度跨度范围为第二级别,其中,dep为像素分量的深度。进一地,第一级别 对应简单图像纹理信息,第二级别对应复杂图像纹理信息。根据图像纹理 信息,以及本实施例提出的三种预测方式,可以得出当图像块的梯度值落 入第一级别时,可以选取适应于简单图像纹理信息的基于多像素分量参考 的预测方式和基于纹理的预测方式,当图像块的梯度值落入第二级别时,可以选取适应于复杂图像纹理信息的基于采样的预测方式。
步骤3、根据所述每个图像块的预选预测方式确定所述每个图像块的最 终预测方式和最终预测值;
根据步骤2中选取的预选预测方式,若当前图像块的预选预测方式为 多个,则获取所述当前图像块在每个预选预测方式下对应的预测值,根据 所述当前图像块的多个预测值确定所述当前图像块的最终预测方式;具体 为:利用预选预测方式分别对当前图像块进行预测,获取当前图像块在每 个预选预测方式下的预测残差作为预测值。计算当前图像块在每个预选预 测方式下的残差绝对值和(sum of absolute difference,简称SAD)以及残 差和(sum of difference,简称SD),如下式所示:
Res为当前图像块中像素分量的预测残差,ABS为取绝对值,M*N为 当前图像块中像素分量的数量。
最终根据SAD和SD的情况,分不同的图像场景配置权重系数a1和 a2,计算残差主观和(subjective difference,简称SUBD),如下式所示:
SUBD=a1×SAD+a2×SD
其中,若为连续多帧且具有传导效应的场景,如H246参考值压缩,选 取a2较大,a1较小;反之,选取a1较大,a2较小,优选地,a1+a2=1。
选取SUBD的最小值对应的预选预测方式作为当前图像块的最终预测 方式,采用该方式计算得到的预测残差为最终预测残差即最终预测值。
若当前图像块的预选预测方式为一个,则此预选预测方式为所述当前 图像块的最终预测方式,根据该最终预测方式计算当前图像块的最终预测 残差即最终预测值。
步骤4、将所述每个图像块的最终预测方式和所述最终预测值进行编码 形成比特流;
将每个图像块的最终预测方式的标志信息和每个图像块的最终预测值 即最终预测残差进行编码形成比特流。
本实施例通过在多种预测方式中选取至少一种预测方式作为每个图像 块的预选预测方式,根据预选的预测方式对每个图像块进行预测获取预测 值,根据预测值获取最终预测方式和预测残差。该编码方法无需轮询每种 预测方式,减少了大量的计算,进一步提高视频图像的编码压缩率。
本实施例根据多种预选预测方式选取出一种预测方式作为最终的预测 方式,可以较为精确地选取出当前图像块的最优预测方式,进一步降低视 频图像的理论熵。
实施例二
本实施例在上述实施例的基础上,对本发明提出的基于多像素分量参 考的预测方式进行详细描述。该方式包括如下内容:
S21、定义每个像素有K(K>1)种像素分量,分别为像素分量1、像素分 量2……像素分量K;在图像编码中,通常将每个像素的K种像素分量进 行分离处理,即在逻辑处理中每个图像默认为只包含一种像素分量,例如 像素有三种像素分量RGB,将像素中的三种像素分量分离,默认每个图像 中只包含R像素分量或只包含G像素分量或只包含B像素分量。每次编码 只编码图像中的R像素分量或G像素分量B像素分量,本实施例中将每个 像素中的各像素分量综合考虑进行编码。如无特殊说明,一般编码模式每 次编码只编码图像中的一种像素分量。
S22、对于图像块中的一种像素分量的某个当前像素分量,通过该像素 分量的周围像素分量,确定当前像素分量的N个纹理方向梯度值G1~GN;
优选地,当前像素分量的周围像素分量,可与当前像素分量相邻,也 可不相邻;如图2所示,图2为本发明实施例提供的一种当前像素分量与 周围像素分量的位置示意图;CUR代表当前像素分量,即周围像素分量可 以为GHIK,也可以为ABCDEFJ。
S23、将每个像素分量的N个纹理方向梯度值G1~GN(G1~GN既代表 纹理方向梯度值的大小,也代表纹理方向梯度值的方向)进行加权得到N个 纹理方向梯度值加权后的第一加权梯度值BG,加权公式如下:
BGi=w1*G1+w2*G2+…+wN*GN(i=1…K)
其中,w1、w2…wN为加权系数即第一加权系数;BG1为像素分量1 的第一加权梯度值,BG2为像素分量2的第一加权梯度值,依次类推,BGK 为像素分量K的第一加权梯度值。
优选地,根据每个像素分量与对应的计算纹理方向梯度值的像素分量 的位置关系,设置加权系数w1、w2…wN获得每个像素分量的第一加权梯 度值的最优值BGbst。
优选地,计算当前纹理方向梯度值的像素分量与当前像素分量距离越 近加权系数值越大,加权系数值的总和为1,具体为w1+w2+…+wN=1。
S24、将K种像素分量的第一加权梯度值的最优值BGbst进行加权,可 以得到第一加权梯度值的最优值加权后的第二加权梯度值BG",加权公式 如下:
BG"i=t1*BGbst1+t2*BGbst2+…+tK*BGbstK(i=1…K)
其中,t1、t2…tK为加权系数即第二加权系数;BGbst1为像素分量1 的第一加权梯度值的最优值,BGbst2为像素分量2的第一加权梯度值的最 优值,依次类推,BGbstK为像素分量K的第一加权梯度值的最优值,BG"1 为像素分量1的第二加权梯度值,BG"2为像素分量2的第二加权梯度值, 依次类推,BG"K为像素分量K的第二加权梯度值,确定出第二加权梯度 值BG"的最优值BG"bst。
优选地,根据每种像素分量与对应第一加权梯度值的最优值BGbst的 关系,设置加权系数t1、t2…tK获得每种当前像素分量的第二加权梯度值 的最优值BGbst。
优选地,当前像素分量下的第一加权梯度值的最优值BGbst加权系数 值最大,与当前像素分量距离逐渐增加的其它种类像素分量下的第一加权 梯度值的最优值BGbst加权系数值逐渐减小,加权系数值的总和为1,具体 为t1+t2+…+tk=1。
第二加权梯度值的最优值BG"bst的方向即为当前像素分量的最优参考 方向Dir。
S25、将当前像素分量的最优参考方向上所有可用的像素分量的像素值 进行加权,得到当前像素分量的参考值Ref,加权公式如下所示:
Refi=r1*cpt1+r2*cpt2+…+rN*cptN(i=1…K)
其中,r1、r2…rN为加权系数,即第三加权系数,可以相同也可以不 同;cpt1~cptN为当前像素分量的参考方向上N个可用的像素分量的像素 值;Ref1为像素分量1的参考值,Ref2为像素分量2的参考值,依次类推, RefK为像素分量K的参考值。
S26、将当前像素分量的像素值减去参考值,可以得到当前像素分量的 预测残差Dif;公式如下:
Difi=Curcpti-Refi(i=1…K)
其中,Curcpt1为像素分量1的像素值,Curcpt2为像素分量2的像素 值,依次类推,CurcptK为像素分量K的像素值;Dif1为像素分量1的预 测残差,Dif2为像素分量2的预测残差,依次类推,DifK为像素分量K的 预测残差。
S27、当前图像块中的其余像素分量,重复S22~S26,即得到当前图像 块中所有像素分量的预测残差。
优选地,多像素分量可以并行处理,也可以串行处理,具体应用规格 场景需要。
在一个实施例中以像素分量为Y、U、V三个像素分量为例说明,具体 步骤如下:
S31、定义每个像素有三个像素分量,分别为像素分量Y、像素分量U、 像素分量V;
S32、对于图像块中的一种像素分量,通过当前像素分量的周围像素分 量,确定当前像素分量的3个纹理方向梯度值G1、G2、G3;
优选地,对于像素分量Y、像素分量U、像素分量V,分别根据图3 所示,图3为本发明实施例提供的一种梯度值计算示意图;ABS(K-H)为 45度梯度值,ABS(K-G)为90度梯度值,ABS(K-F)为135度梯度值, ABS(K-J)为180度梯度值。其中,ABS为绝对值运算。
S33、对于像素分量Y、像素分量U、像素分量V的每一种像素分量, 加权步骤2中的3个纹理方向梯度值G1、G2、G3,例如为45度梯度值,90度梯度值,135度梯度值,得到每一种像素分量中的当前像素分量的第 一加权梯度值BG,求解当前像素分量的第一加权梯度值的最优值。
优选地,例如对于Y像素分量,45度梯度值上的像素H、90度梯度值 上的像素G与135度梯度值上的像素F与Y像素分量中的当前像素分量的 距离逐渐增大,因此,w1选取为0.5,w2选取为0.3,w3选取为0.2, BGbstY=0.5*G1+0.3*G2+0.2*G3。同理可以得出BGbstU和BGbstV。
S34、将3种像素分量的第一加权梯度值的最优梯度值进行加权得出第 一加权梯度值最优值加权后的第二加权梯度值BG",并选取出第二加权梯 度值的最优值BG"bst。加权计算如下:
BG"bstY=0.5*BGbstY+0.3*BGbstU+0.2*BGbstV
BG"bstU=0.3*BGbstY+0.4*BGbstU+0.3*BGbstV
BG"bstV=0.2*BGbstY+0.3*BGbstU+0.5*BGbstV
其中,BG"bstY为像素分量Y第二加权梯度值的最优值,BG"bstU为 像素分量U第二加权梯度值的最优值,BG"bstV为像素分量V第二加权梯 度值的最优值,BGbstY为像素分量Y第一加权梯度值的最优值,BGbstU 为像素分量U第一加权梯度值的最优值,BGbstV为像素分量V第一加权 梯度值的最优值。
上式中的系数选取规则为当前像素分量下的第一加权梯度值的最优值 BGbst加权系数值最大,与当前像素分量距离逐渐增加的其它种类像素分量 下的第一加权梯度值的最优值BGbst加权系数值逐渐减小,加权系数值的 总和为1。
其中,BG"bst的方向为当前像素分量的最优参考方向Dir,即DirY为 像素分量Y的最优参考方向,DirU为像素分量U的最优参考方向,DirV 为像素分量V的最优参考方向。
S35、将3种像素分量的最优参考方向上2个像素分量像素值进行加权, 得到3种像素分量的参考值Ref,加权公式如下所示:
RefY=r1*cpt1+r2*cpt2
RefU=r1*cpt1+r2*cpt2
RefV=r1*cpt1+r2*cpt2
其中,RefY为Y像素分量的参考值,RefU为U像素分量的参考值, RefV为V像素分量的参考值,cpt1、cpt2为每个参考方向的像素分量的像 素值。
优选地,对于任意当前像素分量,若为45度参考,那么参考值REF 为0.8*I+0.2E;若为90度参考,那么参考值为0.8*H+0.2C;若为135度参 考,那么参考值为0.8*G+0.2A;若为180度参考,那么参考值为0.8*K+0.2J, 像素分量的像素值离当前像素分量越近,配置系数越大。
S36、将当前像素分量像素值减去参考值,可以得到当前像素分量的预 测残差Dif,计算如下:
DifY=CurcptY-RefY
DifU=CurcptU-RefU
DifV=CurcptV-RefV
其中,CurcptY为像素分量Y的像素值,CurcptU为像素分量U的像素 值,CurcptV为像素分量V的像素值;DifY为像素分量Y的预测残差,DifU 为像素分量U的预测残差,DifV为像素分量V的预测残差。
进一步地,每个像素分量的预测残差即为每个像素分量的残差数据。
1、本发明通过每种像素分量的多方向梯度加权和同位置多像素分量的 方向加权,可以更加合理的确定当前像素分量的预测方向,当纹理复杂度 一般时,可以起到更好的预测方向纠偏效果。并且该方法,可以均衡同位 置各种像素分量间和同种像素分量相邻多像素分量间的纹理预测方向,减 少单个像素分量预测误判的可能性,最终进一步降低预测的理论极限熵。
2、本发明将多种像素分量并行处理,更利于实现预测方法的并行化处 理。相对于串行像素分量处理的时间长效率低,并行处理可以成倍提高处 理速度,利于预测算法的硬件实现。
实施例三
本实施例在上述实施例的基础上,对本发明提出的基于采样的预测方 式进行详细描述。该方式包括如下内容:
步骤1、获取当前图像块的大小
本实施例以当前图像块的大小为16*1个像素分量为例说明,其它不同 大小的当前图像块同理。当前图像块中的像素分量按照从0到15的序号从 左至右依次排列,每一个序号位置对应一个像素分量。
步骤2、定义采样方式
根据当前图像块中存在的纹理相关性,当前图像块中的像素距离越近, 当前图像块的纹理渐变的一致性概论越高,反之当前图像块中的像素距离 越远,当前图像块的纹理渐变的一致性概率越低,据此将当前图像块中的 像素分量进行非等距离采样,可以选取多种非等距离采样方式。
优选地,如图4所示,图4为本发明实施例提供的一种采样方式示意 图;本实施例将当前图像块中的16*1个像素进行非等距离采样,以采样1、 采样2和采样3三种非等距离采样方式举例说明,其它非等距离采样方式 同理,其中,
采样1是将当前图像块中序号为0、4、15对应位置的3个像素分量进 行采样;
采样2是将当前图像块中序号为0、5、10、15对应位置的4个像素分 量进行采样;
采样3是将当前图像块中序号为0、11、15对应位置的3个像素分量 进行采样。
步骤3、将步骤2中选取的多种非等距离采样方式进行处理获取预测残 差。
本实施例以一种非等距离采样方式的处理过程为例进行说明,其他种 类的等距离采样方式的处理过程相同。具体如下:
步骤31、如图5所示,图5为本发明实施例提供的一种采样点预测方 法示意图;对于采样1,将当前当前图像块正上方相邻当前图像块中处于采 样点45度的像素分量点、90度的像素分量点和135度的像素分量点与采样 点分别进行预测,即预测方式为135度预测、45度预测和90度预测,求解 三种角度预测方式下所有采样点的预测残差,可以将采样点与45度的像素 分量点、90度的像素分量点和135度的像素分量点分别相减获取预测残差, 分别计算每种预测方式下所有采样点的预测残差绝对值和,选取预测残差 绝对值和最小值对应的一种预测方式作为当前当前图像块采样点的预测方 式。
优选地,预测方式可以为135度预测、45度预测和90度预测的任意中 组合。
步骤32、获取步骤31中选取的预测方式下当前图像块采样点的预测残 差,对于非采样点,利用公式求解非采样点的预测残差,公式为:
Resi=(sample1-sample0)*(i+1)/(num+1)
其中,公式中的sample0和sample1为当前图像块中连续的采样点的像 素分量重建值,i为非采样点位置索引,i的取值为0~num-1的整数,num 为非采样点数量。
进一步地,像素分量重建值可以指的是已压缩编码当前图像块解码端 重建得到的像素分量值。
最终获取步骤31中选取的预测方式下的当前图像块所有像素分量的预 测残差,并计算当前图像块所有像素分量的残差绝对值和。
步骤33、重复步骤31~32,获取采样2以及采样3下的当前图像块所 有像素分量点的预测残差,并计算当前图像块所有像素分量的残差绝对值 和,选取当前图像块所有像素分量的残差绝对值和最小值对应的一种采样 方式作为当前图像块的采样方式,并采用该采样方式中确定的预测方式作 为当前图像块的预测方式。
步骤4、将当前图像块中的采样方式获取当前图像块所有像素分量点的 预测残差。
进一步地,当图像块的大小为8*2个像素分量时,即当前图像块有两 行八列像素分量,将第一行和第二行的像素分量按照从0到8的序号从左 至右依次排列,每一个序号位置对应每一行的一个像素分量。
按照步骤2~步骤4的方式获取当前图像块第一行像素分量的最终采样 方式以及最终预测残差,继续重复步骤2~步骤4获取当前图像块第二行像 素分量的最终采样方式以及最终预测残差,其中,第二行采样点的预测残 差,可以根据第二行采样点与当前图像块正上方相邻当前图像块中垂直位 置的点进行预测,也可以根据第二行采样点与当前图像块第一行中垂直位 置的点进行预测。
本实施例通过定义当前图像块的采样方式和像素分量预测的参考方 式,计算当前图像块的预测残差。与现有方法相比,当待压缩图像的纹 理较为复杂时,对处于当前图像的纹理边界处的当前图像块,根据纹理 的渐变原理,不依赖于当前图像块的周围当前图像块,而是通过当前图 像块自身的纹理特性获得预测残差,能够提高对复杂纹理区域求预测残 差值的精度,进一步降低理论极限熵,增大带宽压缩率。
实施例四
本实施例在上述实施例的基础上,对本发明提出的基于纹理的预测方 式进行详细描述。该方式包括如下内容:
步骤1、定义重建像素分量;
在当前图像块中定义当前像素分量为Cij,选取当前像素分量周围已编 码的K个重建像素分量,将已编码的K个重建像素分量进行编号,编号顺 序可指定,其中K≥1。
优选地,设定当前像素分量的序号为Cij,当前像素分量Cij左侧的重 建像素分量的序号,编号i从右至左依次递减进行排序,编号j从下到上依 次递减进行排序;当前像素分量Cij正上方的重建像素分量的序号,编号j 从下到上依次递减进行排序,编号i不变;当前像素分量Cij右侧的重建像 素分量的序号,编号i从左至右依次递减进行排序,编号j从下到上依次递 减进行排序,如图6所示,图6为本发明实施例提供的一种预测重建像素 分量参考示意图。
步骤2、计算第一权重;
步骤201、分别计算当前像素分量与已编码的K个重建像素分量的差 异度,计算得到K个差异度权重DIFij;
步骤202、已编码的K个重建像素分量位于当前像素分量的周围,根 据已编码的K个重建像素分量位置的不同,分别设置不同的权重值,共得 到K个位置权重POSij;
步骤203、根据第一权重计算公式分别计算每个重建像素分量权重,即 第一权重,第一权重计算公式为:
Wij=a*DIFij+b*POSij
其中,a和b为加权值,且满足a+b=1,标准情况为a=0.5,b=0.5,也 可灵活调整;DIF为所述差异度权重,即当前像素分量和周围重建像素分量 的差值;POS为所述位置权重,即当前像素分量和周围重建像素分量的空 间距离;ij为K个重建像素分量的索引,ij的取值为1~K的自然数,W为 第一权重。
步骤3、计算第二权重;
设定每个像素含有N个分量,可以得到K*N个权重。利用公式计算最 终每个重建像素分量的权重,即第二权重,计算公式为:
Mijn=p1*Wij1+p2*Wij2+p3*Wij3+...+pN*WijN
其中,p为分量加权值,n的取值为N,M为第二权重。
进一步地,对于pN的选取,满足p1+p2+…+pN=1,具体可平均分配, 也可根据经验值任意配置,根据经验值可以认定与当前重建像素分量越近 的重建像素分量权重越接近,pN的值可以根据重建像素分量与当前重建像 素分量的距离远近分配大小,距离越近pN的值越大,反之,pN的越小。
步骤4、计算预测残差;
步骤401、根据计算得到的第二权重Mijn,选取Mijn的最优值所对应 的重建像素分量为当前像素分量的参考像素;
优选地,最优值可以为Mijn中的最小值。
步骤402、将当前像素分量的像素值与参考像素的像素值求差,求解预 测残差。
在一个实施例中对基于纹理的预测方式举例说明,该方式包括如下步 骤:
步骤1、定义重建像素分量;
定义当前像素分量为Cij,选取当前像素分量Cij周围已编码的K个重 建像素分量,将已编码的K个重建像素分量进行编号,编号顺序可指定, 其中K≥1。
优选地,将已编码的K个重建像素分量进行编号,编号按顺序从上到 下,从左到右进行排序,序号从0到K-1进行排列。
本实施例选取当前像素分量Cij周围的17个重建像素分量为例说明, 其它不同数量的重建像素分量同理,17个重建像素分量,按顺序从上到下, 从左到右进行排序,序号从0到16进行排列,如图7所示,图7为本发明 实施例提供的另一种预测重建像素分量参考示意图。
步骤2、计算重建像素分量差异度权重的绝对值;
分别计算当前像素分量与已编码的K个重建像素分量的差异度,计算 得到K个差异度权重的绝对值ABS(DIFij),ABS为绝对值运算;
优选地,分别计算当前像素分量与已编码的17个重建像素分量的差异 度,计算得到17个差异度权重的绝对值ABS(DIFij);
步骤3、计算预测残差;
步骤301、根据计算得到的重建像素分量的差异度权重的绝对值 ABS(DIFij),选取差异度权重的绝对值ABS(DIFij)中的最小值,最小值所对 应的重建像素分量设定为当前像素分量的参考像素。
优选地,选取17个差异度权重的绝对值ABS(DIFij)中的最小值,最小 值所对应的重建像素分量即为当前像素分量的参考像素。
步骤302、将当前像素分量的像素值与参考像素的像素值求差,求解预 测残差。
本实施例通过计算重建像素分量的权重获得参考像素的方式,计算 当前预测像素分量的预测残差,与现有方法相比,当待压缩图像的人造 纹理较为简单时,通过定义不同的参考像素获得预测残差,所定义的参 考像素为图像中的原始像素,此种方式更容易提高当前预测像素分量的 准确率,能够进一步提高纹理区域预测残差的精度,进一步降低理论极 限熵,提高带宽压缩率。
实施例五
本实施例在上述实施例的基础上,对本发明提出的视频编码设备进行 详细描述,如图8所示,图8为本发明实施例提供的一种视频编码设备的 示意图;该设备包括:
选择器,所述选择器配置为将视频图像帧划分为多个固定大小的图像 块;
在多种预测方式中针对每个图像块选择至少一种预测方式作为所述每 个图像块的预选预测方式;
预测器,所述预测器配置为根据所述每个图像块的预选预测方式确定 所述每个图像块的最终预测方式和最终预测值;
编码器,所述编码器配置为将所述每个图像块的最终预测方式和所述 最终预测值进行编码形成比特流。
其中,所述预测器进一步配置为:选取多种预测方式;计算所述每个 图像块的梯度值;根据所述每个图像块的梯度值在所述多种预测方式中选 取至少一种预测方式作为所述每个图像块的预选预测方式。
其中,预测器进一步配置为:若当前图像块的预选预测方式为多个, 则获取所述当前图像块在每个预选预测方式下对应的预测值,根据所述当 前图像块的多个预测值确定所述当前图像块的最终预测方式;若当前图像 块的预选预测方式为一个,则此预选预测方式为所述当前图像块的最终预 测方式;其中,所述最终预测方式对应的预测值为所述最终预测值。
综上所述,本文中应用了具体个例对本发明进行了阐述,以上实施例 的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域 的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会 有改变之处,综上所述,本说明书内容不应理解为对本发明的限制,本发 明的保护范围应以所附的权利要求为准。

Claims (7)

1.一种视频编码方法,其特征在于,包括:
将视频图像帧划分为多个固定大小的图像块;
在多种预测方式中针对每个图像块选择至少一种预测方式作为所述每个图像块的预选预测方式;
根据所述每个图像块的预选预测方式确定所述每个图像块的最终预测方式和最终预测值;
将所述每个图像块的最终预测方式和所述最终预测值进行编码形成比特流。
2.根据权利要求1所述的方法,其特征在于,在多种预测方式中针对每个图像块选择至少一种预测方式作为所述每个图像块的预选预测方式,包括:
选取多种预测方式;
计算所述每个图像块的梯度值;
根据所述每个图像块的梯度值在所述多种预测方式中选取至少一种预测方式作为所述每个图像块的预选预测方式。
3.根据权利要求2所述的方法,其特征在于,所述每个图像块的梯度值满足:
其中,Grad为梯度值,M*N为每个图像块中的像素分量数量,p为每个图像块中的像素分量值,i为每个图像块中的行像素分量的位置标识,j为每个图像块中的列像素分量的位置标识。
4.根据权利要求1所述的方法,其特征在于,根据所述每个图像块的预选预测方式确定所述每个图像块的最终预测方式和最终预测值,包括:
若当前图像块的预选预测方式为多个,则获取所述当前图像块在每个预选预测方式下对应的预测值,根据所述当前图像块的多个预测值确定所述当前图像块的最终预测方式;
若当前图像块的预选预测方式为一个,则此预选预测方式为所述当前图像块的最终预测方式;
其中,所述最终预测方式对应的预测值为所述最终预测值。
5.一种视频编码设备,其特征在于,包括:
选择器,所述选择器配置为将视频图像帧划分为多个固定大小的图像块;
在多种预测方式中针对每个图像块选择至少一种预测方式作为所述每个图像块的预选预测方式;
预测器,所述预测器配置为根据所述每个图像块的预选预测方式确定所述每个图像块的最终预测方式和最终预测值;
编码器,所述编码器配置为将所述每个图像块的最终预测方式和所述最终预测值进行编码形成比特流。
6.根据权利要求5所述的设备,其特征在于,所述预测器进一步配置为:
选取多种预测方式;
计算所述每个图像块的梯度值;
根据所述每个图像块的梯度值在所述多种预测方式中选取至少一种预测方式作为所述每个图像块的预选预测方式。
7.根据权利要求5所述的设备,其特征在于,预测器进一步配置为:
若当前图像块的预选预测方式为多个,则获取所述当前图像块在每个预选预测方式下对应的预测值,根据所述当前图像块的多个预测值确定所述当前图像块的最终预测方式;
若当前图像块的预选预测方式为一个,则此预选预测方式为所述当前图像块的最终预测方式;
其中,所述最终预测方式对应的预测值为所述最终预测值。
CN201811261700.0A 2018-10-26 2018-10-26 视频编码方法及设备 Active CN109587481B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811261700.0A CN109587481B (zh) 2018-10-26 2018-10-26 视频编码方法及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811261700.0A CN109587481B (zh) 2018-10-26 2018-10-26 视频编码方法及设备

Publications (2)

Publication Number Publication Date
CN109587481A true CN109587481A (zh) 2019-04-05
CN109587481B CN109587481B (zh) 2020-07-10

Family

ID=65921016

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811261700.0A Active CN109587481B (zh) 2018-10-26 2018-10-26 视频编码方法及设备

Country Status (1)

Country Link
CN (1) CN109587481B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116506628A (zh) * 2023-06-27 2023-07-28 苇创微电子(上海)有限公司 一种基于像素块的编码预测器方法、编码系统及编码装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102595135A (zh) * 2012-02-24 2012-07-18 中国科学技术大学 一种可伸缩视频编码的方法及装置
CN103517069A (zh) * 2013-09-25 2014-01-15 北京航空航天大学 一种基于纹理分析的hevc帧内预测快速模式选择方法
US20140205015A1 (en) * 2011-08-25 2014-07-24 Telefonaktiebolaget L M Ericsson (Publ) Depth Map Encoding and Decoding
CN104796694A (zh) * 2015-04-30 2015-07-22 上海交通大学 基于视频纹理信息的优化帧内视频编码方法
CN107509076A (zh) * 2017-08-25 2017-12-22 中国软件与技术服务股份有限公司 一种面向超高清视频的编码优化方法
CN108259897A (zh) * 2018-01-23 2018-07-06 北京易智能科技有限公司 一种基于深度学习的帧内编码优化方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140205015A1 (en) * 2011-08-25 2014-07-24 Telefonaktiebolaget L M Ericsson (Publ) Depth Map Encoding and Decoding
CN102595135A (zh) * 2012-02-24 2012-07-18 中国科学技术大学 一种可伸缩视频编码的方法及装置
CN103517069A (zh) * 2013-09-25 2014-01-15 北京航空航天大学 一种基于纹理分析的hevc帧内预测快速模式选择方法
CN104796694A (zh) * 2015-04-30 2015-07-22 上海交通大学 基于视频纹理信息的优化帧内视频编码方法
CN107509076A (zh) * 2017-08-25 2017-12-22 中国软件与技术服务股份有限公司 一种面向超高清视频的编码优化方法
CN108259897A (zh) * 2018-01-23 2018-07-06 北京易智能科技有限公司 一种基于深度学习的帧内编码优化方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116506628A (zh) * 2023-06-27 2023-07-28 苇创微电子(上海)有限公司 一种基于像素块的编码预测器方法、编码系统及编码装置
CN116506628B (zh) * 2023-06-27 2023-10-24 苇创微电子(上海)有限公司 一种基于像素块的编码预测器方法、编码系统及编码装置

Also Published As

Publication number Publication date
CN109587481B (zh) 2020-07-10

Similar Documents

Publication Publication Date Title
ES2602326T3 (es) Selección de filtro para pre-procesamiento de vídeo en aplicaciones de vídeo
JP4084826B2 (ja) イメージ圧縮デバイス及びその方法
CN102934446A (zh) 确定图像编码单元和图像解码单元的帧内预测模式
CN103596004A (zh) Hevc中基于数学统计和分类训练的帧内预测方法及装置
CN113412617A (zh) 编码方法及其装置和解码方法及其装置
CN109587481A (zh) 视频编码方法及设备
CN109413421A (zh) 视频编码方法、设备以及视频解码方法、设备
CN104488268B (zh) 具有增加数量的可能编码模式的空间预测
CN109547788B (zh) 图像压缩方法、设备及图像传输系统
CN109474799B (zh) 基于视频监控的图像存储方法及其系统
CN109379599A (zh) 基于视频编码的复杂纹理预测方法
CN111107344A (zh) 视频图像的编码方法及装置
CN109561301B (zh) 一种视频压缩中的预测方法
CN109302607A (zh) 基于图像场景的多预测方法及其系统
CN109495739A (zh) 图像编码方法及其设备
CN109379592A (zh) 图像编码方法及其设备
CN109302605B (zh) 基于多核处理器的图像编码方法及设备
CN109547780A (zh) 图像编码方法及装置
CN109660793A (zh) 用于带宽压缩的预测方法
CN109561303B (zh) 一种基于视频压缩的预测方法
CN109510995A (zh) 一种基于视频压缩的预测方法
KR102244384B1 (ko) 적응적인 인트라 예측 모드 부호화 방법 및 장치, 그리고 복호화 방법 및 장치
CN109600612A (zh) 图像编码的方法及设备
CN109547792A (zh) 像素级多分量参考的自适应方向预测方法
CN111107353A (zh) 视频压缩方法及视频压缩器

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information
CB03 Change of inventor or designer information

Inventor after: Yang Jian

Inventor after: Ye Heng

Inventor after: Lu Hao

Inventor after: Hang Wei

Inventor after: Lu Xiaoyan

Inventor after: Yue Qingdong

Inventor after: Tian Linhai

Inventor before: Yue Qingdong

Inventor before: Tian Linhai

TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20200611

Address after: 213000 No. 11 Qingyang North Road, Tianning District, Changzhou, Jiangsu

Applicant after: Jiangsu huaiye Information Technology Co.,Ltd.

Address before: 710065 No. 86 Leading Times Square (Block B), No. 2, Building No. 1, Unit 22, Room 12202, No. 51, High-tech Road, Xi'an High-tech Zone, Shaanxi Province

Applicant before: XI'AN CREATION KEJI Co.,Ltd.

GR01 Patent grant
GR01 Patent grant