CN107222742B

CN107222742B - 基于时空域相关性的视频编码Merge模式快速选择方法及装置

Info

Publication number: CN107222742B
Application number: CN201710542455.XA
Authority: CN
Inventors: 张昊; 蒋冰玉
Original assignee: Central South University
Current assignee: Central South University
Priority date: 2017-07-05
Filing date: 2017-07-05
Publication date: 2019-07-26
Anticipated expiration: 2037-07-05
Also published as: CN107222742A

Abstract

本发明公开了一种基于时空域相关性的视频编码Merge模式快速选择方法及装置，该方法通过时域和空域的信息提前终止FRUC Merge模式，并且根据运动信息简化FRUC Merge的计算复杂度，在保证编码质量的同时，极大的减少了编码时间；本发明简单易用，结构简单，极大地提高了JEM的实用性。

Description

基于时空域相关性的视频编码Merge模式快速选择方法及装置

技术领域

本发明属于视频解码领域，特别涉及一种基于时空域相关性的视频编码Merge模式快速选择方法及装置。

背景技术

FRUC(Frame-Rate Up Conversion)是将任意两种不同帧率的视频显示格式进行转换的技术。除此之外FRUC还可以应用于低比特率视频编码(LBR)中。在视频编码领域的许多学者早已研究过FRUC技术，而最近，在新一代视频编码标准的制定中，FRUC被再次提出来，并应用在新的标准中。

2015年ITU-T VCEG和ISO/IEC MPEG成立了一个专家小组JVET，开始研究一种新的视频编码标准，其压缩率将显著地超越现有的HEVC标准。JEM作为当下热烈讨论的最新编码软件，在编码框架上还是沿用了HEVC的框架，包括帧内预测、帧间预测、变换、量化、熵编码、以及环路滤波等模块，但在每个模块内部，引入了以往没有的技术和工具。由于这些工具的加入，JEM即新一代编码标准的编码器在编码性能，比如压缩率和视频质量，有着一定的提升，但同时极大地增加了JEM的复杂度，使得实际应用较为困难。在新标准制定的会议上已经人提出关于JEM复杂度的问题，并建议采取相应的改进。

JEM编码器的帧间预测流程如下：步骤一：进行Affine Merge模式，计算AffineMerge模式的率失真代价，并将Affine Merge模式设为最优模式；步骤二：判断最优模式是否为2Nx2N Merge模式，计算2Nx2N Merge模式的率失真代价，若2Nx2N Merge模式的率失真代价小于当前最优模式的率失真代价，则将2Nx2N Merge模式为最优模式；步骤三：判断最优模式是否为FRUC Merge模式，计算FRUC Merge模式的率失真代价，若FRUC Merge模式的率失真代价小于当前最优模式的率失真代价，则将FRUC Merge模式为最优模式；步骤四：判断最优模式是否为2Nx2N模式，计算2Nx2N模式的率失真代价，若2Nx2N模式的率失真代价小于当前最优模式的率失真代价，则将2Nx2N模式为最优模式；第五步：进行水平、垂直、四叉树分割。

由上述步骤可知，在JEM中采用了一个新的帧间预测模式，FRUC Merge模式，它是基于FRUC技术的一种模式。在这个模式中，一个编码单元的编码信息并不传输，而是在解码端直接获得。在FRUC Merge模式中，只有当2Nx2N Merge的标志位为真时，才会进行FRUCMerge模式。FRUC Merge模式主要包括两个步骤：第一步，检查2Nx2N Merge模式的运动矢量候选列表，并选出具有最小匹配误差的候选MV(运动矢量)作为起始点。第二步，根据Bilateral(双边匹配)模式或者Template(模版匹配)模式围绕起始点进行局部搜索，具有最小匹配误差的MV即为整个CU(编码单元)的MV。

第二步中的Bilateral模式和Template模式的具体过程如下：

如图1所示，Bilateral模式搜索是在当前帧(Cur Pic)的前后两个的参考帧(Ref0、Ref1)中，沿当前编码单元的运动轨迹(Motion trajectory)，分别在两个不同的参考帧中找到最佳匹配的编码单元，由此获得一对运动向量(MV0、MV1)。假设运动轨迹是连续的，则运动矢量MV0和MV1将与当前图像和两个参考帧之间的时间距离TD0和TD1成正比。还有一种特殊情况，当当前帧在两个参考帧之间，并且从两参考帧到当前帧的时间距离相同时，Bilateral模式可获得基于镜像的双向MV。

如图2所示，Template模式是通过寻找当前编码块(Cur block)与当前帧(CurPic)和参考帧(Ref0)的模版(Template)之间的最佳匹配。

因为在进行FRUC Merge模式的第二步时会带来大量计算，且通过测试得知，JEM在LP(低延时)配置下，FRUC Merge模式时间占比为20％～30％，如何减少该模式不必要的使用和简化该算法，从而减少一定的编码时间，是急需解决的问题。

发明内容

本发明提供了一种基于时空域相关性的视频编码Merge模式快速选择方法及装置，其目的在于，通过时域和空域的信息提前终止FRUC Merge模式，并且根据运动信息简化FRUC Merge的计算复杂度，针对JEM编码器中的一个新工具FRUC，在保证编码质量的同时，减少编码时间，提高JEM的实用性。

一种基于时空域相关性的视频编码Merge模式快速选择方法，在JEM中，所有视频帧中的编码单元依次进行2Nx2N模式、2Nx2N Merge模式、Affine Merge模式和FRUC Merge模式，获得每个模式下编码单元的率失真代价，选择最小率失真代价对应的模式作为编码单元的编码模式；若当前视频帧中当前待编码的编码单元CU在2Nx2N Merge模式下的最优运动矢量MV_Best＝(0,0)且该编码单元CU的变换系数全0标志位CBF_Flag＝1，则当前待编码的编码单元CU不需进行FRUC Merge模式。

若当前视频帧不为B帧，则当前待编码的编码单元CU跳过FRUC Merge模式中的Bilateral模式，只进行FRUC Merge模式中的Template模式；

进一步地，若当前视频帧为B帧，在当前待编码的编码单元CU进行FRUC Merge模式中的Bilateral模式计算前，先计算当前待编码的编码单元CU的相邻编码单元的失真加权和Dist_Total以及相邻编码单元中选择FRUC Merge模式中的Bilateral模式的编码单元数量K_m，再判断是否满足：K_m＝0且Dist_Total>TH，若满足，则当前待编码的编码单元CU跳过FRUCMerge模式中的Bilateral模式，直接进行Template模式，否则，依次进行FRUC Merge模式中的Bilateral模式和Template模式；

Dist_Total＝Dist_L*α+Dist_A*β+Dist_AL*γ

其中，CU_x表示当前待编码的编码单元的相邻单元，x∈{Left、AboveLeft、Above、Col}，CU_Left、CU_AboveLeft、CU_Above、CU_Col分别代表当前待编码的编码单元的左邻块、左上邻块、上邻块以及同位块，所述同位块是指处于参考帧中，且位置和当前待编码的编码单元在当前帧中的位置一样的编码单元；f(Mode(CU_x)表示当前待编码的编码单元的相邻单元的模式标志，若属于Bilateral模式，取值为1，否则，取值为0；Dist_L、Dist_A、Dist_AL分别代表当前待编码的编码单元的的左邻块、上邻块、左上邻块所在当前模式的失真；α、β、γ分别为当前待编码的编码单元的的左邻块、上邻块、左上邻块的加权系数，取值范围为0-1；TH表示加权和阈值，取值在5500～7500之间。

进一步地，所述当前待编码的编码单元的的左邻块、上邻块、左上邻块的加权系数α、β、γ的取值分别为0.4，0.4，0.2。

进一步地，所述加权和阈值TH的取值为6000。

进一步地，编码单元CU在FRUC Merge模式中Bilateral模式下的率失真代价RDCost_Bi按照以下公式计算获得：

RDCost_Bi＝D+λR

其中，λ为拉格朗日乘子，R为编码单元在Bilateral模式下的比特数，D是编码单元在Bilateral模式下的失真，取值为SAD_t；

所述SAD_t是利用编码单元CU在2Nx2N模式下的最优运动矢量对对当前视频帧图像进行运动补偿，得到补偿图像Pic0、Pic1，并通过计算补偿图像Pic0、Pic1在编码单元CU范围内所有像素之间的绝对误差和。

一种基于时空域相关性的视频编码Merge模式快速选择装置，包括：

率失真代价计算单元，用于在JEM中，计算所有视频帧中的编码单元依次进行各种帧间预测模式的率失真代价；

所述帧间预测模式包括2Nx2N模式、2Nx2N Merge模式、Affine Merge模式和FRUCMerge模式；

选择单元，用于选择最小率失真代价对应的模式作为编码单元的编码模式；

跳过单元，对编码单元进行判断，若满足以下条件，则当前待编码的编码单元跳过FRUC Merge模式：

当前视频帧中当前待编码的编码单元CU在2Nx2N Merge模式下的最优运动矢量MV_Best＝(0,0)且该编码单元CU的变换系数全0标志位CBF_Flag＝1。

进一步地，按照以下规则对待编码的编码单元是否需要跳过FRUC Merge模式中的Bilateral模式进行判断：

若当前视频帧为B帧，在当前待编码的编码单元CU进行FRUC Merge模式中的Bilateral模式计算前，先计算当前待编码的编码单元CU的相邻编码单元的失真加权和Dist_Total以及相邻编码单元中选择FRUC Merge模式中的Bilateral模式的编码单元数量K_m，再判断是否满足：K_m＝0且Dist_Total>TH，若满足，则当前待编码的编码单元CU跳过FRUCMerge模式中的Bilateral模式，直接进行Template模式，否则，依次进行FRUC Merge模式中的Bilateral模式和Template模式；

Dist_Total＝Dist_L*α+Dist_A*β+Dist_AL*γ

进一步地，所述加权和阈值TH的取值为6000。

进一步地，所述率失真代价计算单元在FRUC Merge模式中Bilateral模式下计算编码单元的率失真代价RD Cost_Bi时按照以下公式计算获得：

RDCost_Bi＝D+λR

有益效果

本发明提供了一种基于时空域相关性的视频编码Merge模式快速选择方法及装置，该方法通过时域和空域的信息提前终止FRUC Merge模式，并且根据运动信息简化FRUCMerge的计算复杂度，在保证编码质量的同时，极大的减少了编码时间，具体体现在以下几点：

1.通过2Nx2N Merge模式的MV以及CBF标志，避免了进行不必要的FRUC Merge模式，由此减少了编码时间，提高了编码效率；

2.通过2Nx2N模式所获得的运动信息，简化了FRUC Merge的计算过程，降低了FRUCMerge的计算复杂度，节省了编码时间；

3.通过判断邻块的最优模式是否全不为Bilateral模式，从而避免了进行不必要的FRUC Merge中的Bilateral模式，进一步获得了较大的时间减少量；

通过大量的实验表明，本发明所述的编码效果明显优于现有技术，且本发明简单易用，结构简单，极大地提高了JEM的实用性。

附图说明

图1为Bilateral模式结构示意图；

图2为Template模式结构示意图；

图3为本发明的整体流程图。

具体实施方式

下面将结合附图和实施例对本发明做进一步地说明。

本发明所述方案的主要过程为，首先获取当前CU在2Nx2N Merge模式下的运动信息，利用该信息来判断是否有必要进行FRUC Merge模式。如果2Nx2N Merge模式已经足够匹配，则再进行FRUC Merge模式为多余，经过测试多个序列判断准确度达到95％以上。由于视频内容具有空间相关性，又通过测试发现FRUC Merge模式中Bilateral模式时间占比较大，所以通过空域邻块的模式信息来判断是否进行Bilateral模式。最后，通过2Nx2N模式获得的运动矢量来简化Bilateral模式中的计算。

如图3所示，一种基于时空域相关性的视频编码Merge模式快速选择方法，包括以下步骤：

步骤1：JEM中，首先是进行2Nx2N Merge模式、Affine Merge模式和FRUC Merge模式。

为了在FRUC Merge模式中获得2Nx2N模式的运动矢量，需要先于FRUC Merge模式执行2Nx2N模式。

在2Nx2N模式中，会进行全搜索的运动估计，由此可以获得2Nx2N模式下的最优运动矢量，其中，运动矢量包含水平位移分量MVx和垂直位移分量MVy。

且如果当前帧为B帧，会对前后两个参考帧进行搜索，因此会得到一对运动矢量，否则只有一个。

步骤2：在2Nx2N Merge模式中，会根据时域和空域构建一个2Nx2N Merge模式的运动矢量候选列表，在计算率失真代价时，会对该列表中的每一个MV进行计算，得到率失真代价最小的MV，作为当前待编码的编码单元CU的2Nx2N Merge的最优运动矢量MV_Best。

CBF_Flag为一个判断当前待编码的编码单元CU是否平滑的标志，即变换系数是否全为0，若CBF_Flag＝1则代表该CU较平滑，否则纹理较为复杂。若满足：

MV_Best＝(0，0)&&CBF_Flag＝1 (1)

则跳过FRUC Merge模式，即提前终止FRUC Merge模式，进入步骤9结束本算法直接进行后续模式；否则，进入步骤3；

步骤3：提取当前待编码的编码单元的相邻编码单元CU_Left、CU_AboveLeft、CU_Above、CU_Col，分别代表当前CU的左邻块、左上邻块、上邻块以及同位块。

由于CU_Left、CU_AboveLeft、CU_Above、CU_Col均已经完成编码，可以获得上述编码单元的最优模式Mode(CU_x)，x∈{Left、AboveLeft、Above、Col}。

Dist_Total＝Dist_L*α+Dist_A*β+Dist_AL*γ (4)

其中，λ为FRUC Merge模式中的Bilateral模式，K_m为上述邻块CU中为Bilateral模式的个数总和，Dist_L、Dist_A、Dist_AL分别代表左、上、左上邻块当前模式的失真，Dist_Total为上述邻块失真的加权和，经过大量测试得到α、β、γ的值分别为0.4，0.4，0.2时效果最佳。

若满足

K_m＝0&&Dist_Total＞TH (5)

(TH的取值在5500～7500之间，经测试得到为6000时效果最佳)，则提前终止FRUCMerge中的Bilateral模式，转到步骤8直接进行Template模式；否则进行步骤4；

步骤4：如果当前帧为B帧(双向预测帧)，则进行Bilateral模式的预处理并继续执行步骤5，否则执行步骤8；

步骤5：提取在2Nx2N模式中获得的一对最优运动矢量MV0、MV1；

步骤6：将当前待编码的编码单元CU投影到参考帧中得到CU′，根据最优运动矢量，对CU′进行运动位置补偿，具体公式如公式6、7所示：

其中，Pic0，Pic1代表补偿后的CU块，RefPic0、RefPic1代表当前待编码的编码单元CU在参考帧0和参考帧1上的投影，S_cu为CU的范围。

由公式8计算绝对误差和SAD

得到Pic0、Pic1在当前CU范围内像素之间的计算绝对误差和SAD_t。

步骤7：判断一个编码模式是否为最佳模式的主要依据是率失真代价RD Cost，如公式9所示。

RD Cost＝D+λR (9)

其中λ为拉格朗日乘子，R为当前预测模式下的比特数，D是当前预测模式下的失真。

在计算Bilateral模式的率失真代价RD Cost_Bi时，将公式8中得到的SAD_t带入到公式9中的D，避免了在计算RD Cost时需要进行运动搜索所带来的复杂计算。

步骤8：进行Template模式，在该模式中，有预先规定好的模版。分别对各个模版计算率失真代价RD Cost，选择RD Cost最小的一个作为Template模式的RD Cost_Temp。

步骤9：结束算法进行后续其他模式。

按照以下规则对待编码的编码单元是否需要跳过FRUC Merge模式中的Bilateral模式进行判断：

Dist_Total＝Dist_L*α+Dist_A*β+Dist_AL*γ

其中，CU_x表示当前待编码的编码单元的相邻单元，x∈{Left、AboveLeft、Above,ColJ,CU_Left、CU_AboveLeft、CU_Above、CU_Col分别代表当前待编码的编码单元的左邻块、左上邻块、上邻块以及同位块，所述同位块是指处于参考帧中，且位置和当前待编码的编码单元在当前帧中的位置一样的编码单元；f(Mode(CU_x)表示当前待编码的编码单元的相邻单元的模式标志，若属于Bilateral模式，取值为1，否则，取值为0；Dist_L、Dist_A、Dist_AL分别代表当前待编码的编码单元的的左邻块、上邻块、左上邻块所在当前模式的失真；α、β、γ分别为当前待编码的编码单元的的左邻块、上邻块、左上邻块的加权系数，取值范围为0-1；TH表示加权和阈值，取值在5500～7500之间。

在本装置中，所述当前待编码的编码单元的的左邻块、上邻块、左上邻块的加权系数α、β、γ的取值分别为0.4，0.4，0.2；所述加权和阈值TH的取值为6000。

所述率失真代价计算单元在FRUC Merge模式中Bilateral模式下计算编码单元的率失真代价RD Cost_Bi时按照以下公式计算获得：

RD Cost_Bi＝D+λR

为了验证本方案的有效性，利用本方案和其他传统的编码器对测试序列进行编码进行比对实验，具体如表1所示。

表1实验结果

表1中QP为量化参数，ΔBits％为与传统的编码器相比比特率变化百分比，ΔPSNR/dB为与传统的编码器相比峰值信噪比变化，TS/％为与传统的编码器相比所节省的时间百分比。ΔBDBR表示了在同样的客观质量下，传统编码器和改进的编码器的码率节省情况。ΔBDBR越小说明算法效果越好。

通过在实验仿真，利用本发明所提出的最佳方案时，平均时间减少TS/％为12.96％，ΔBDBR/％为0.52。该算法在保证了视频质量的同时，减少了一定的编码时间，提高了编码效率。

本文中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代，但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。

Claims

1.一种基于时空域相关性的视频编码Merge模式快速选择方法，在JEM中，所有视频帧中的编码单元依次进行2Nx2N模式、2Nx2N Merge模式、Affine Merge模式和FRUC Merge模式，获得每个模式下编码单元的率失真代价，选择最小率失真代价对应的模式作为编码单元的编码模式；其特征在于，若当前视频帧中当前待编码的编码单元CU在2Nx2N Merge模式下的最优运动矢量MV_Best＝(0，0)且该编码单元CU的变换系数全0标志位CBF_Flag＝1，则当前待编码的编码单元CU不需进行FRUC Merge模式；

若当前视频帧为B帧，在当前待编码的编码单元CU进行FRUC Merge模式中的Bilateral模式计算前，先计算当前待编码的编码单元CU的相邻编码单元的失真加权和Dist_Total以及相邻编码单元中选择FRUC Merge模式中的Bilateral模式的编码单元数量K_m，再判断是否满足：K_m＝0且Dist_Total＞TH，若满足，则当前待编码的编码单元CU跳过FRUC Merge模式中的Bilateral模式，直接进行Template模式，否则，依次进行FRUC Merge模式中的Bilateral模式和Template模式；

Dist_Total＝Dist_L*α+Dist_A*β+Dist_AL*γ

K_m＝∑f(Mode(CU_x))

2.根据权利要求1所述的方法，其特征在于，所述当前待编码的编码单元的的左邻块、上邻块、左上邻块的加权系数α、β、γ的取值分别为0.4，0.4，0.2。

3.根据权利要求1所述的方法，其特征在于，所述加权和阈值TH的取值为6000。

4.根据权利要求1所述的方法，其特征在于，编码单元CU在FRUC Merge模式中Bilateral模式下的率失真代价RD Cost_Bi按照以下公式计算获得：

RD Cost_Bi＝D+λR

5.一种基于时空域相关性的视频编码Merge模式快速选择装置，其特征在于，包括：

跳过单元，对编码单元进行判断，若满足以下条件，则当前待编码的编码单元跳过FRUCMerge模式：

当前视频帧中当前待编码的编码单元CU在2Nx2N Merge模式下的最优运动矢量MV_Best＝(0，0)且该编码单元CU的变换系数全0标志位CBF_Flag＝1；

若当前视频帧为B帧，在当前待编码的编码单元CU进行FRUC Merge模式中的Bilateral模式计算前，先计算当前待编码的编码单元CU的相邻编码单元的失真加权和Dist_Tota1以及相邻编码单元中选择FRUC Merge模式中的Bilateral模式的编码单元数量K_m，再判断是否满足：K_m＝0且Dist_Total＞TH，若满足，则当前待编码的编码单元CU跳过FRUC Merge模式中的Bilateral模式，直接进行Template模式，否则，依次进行FRUC Merge模式中的Bilateral模式和Template模式；

Dist_Total＝Dist_L*α+Dist_A*β+Dist_AL*γ

K_m＝∑f(Mode(CU_x))

6.根据权利要求5所述的装置，其特征在于，所述当前待编码的编码单元的的左邻块、上邻块、左上邻块的加权系数α、β、γ的取值分别为0.4，0.4，0.2。

7.根据权利要求5所述的装置，其特征在于，所述加权和阈值TH的取值为6000。

8.根据权利要求5所述的装置，其特征在于，所述率失真代价计算单元在FRUC Merge模式中Bilateral模式下计算编码单元的率失真代价RD Cost_Bi时按照以下公式计算获得：

RD Cost_Bi＝D+λR