CN106658024B

CN106658024B - 一种快速的视频编码方法

Info

Publication number: CN106658024B
Application number: CN201610915019.8A
Authority: CN
Inventors: 廖义; 王建伟; 李日
Original assignee: Hangzhou Dang Hong Polytron Technologies Inc
Current assignee: Hangzhou Dang Hong Polytron Technologies Inc
Priority date: 2016-10-20
Filing date: 2016-10-20
Publication date: 2019-07-16
Anticipated expiration: 2036-10-20
Also published as: CN106658024A

Abstract

本发明公开了一种快速的视频编码方法，所述方法包括以下步骤：步骤一：利用最优整像素点及周围整像素点的率失真代价，根据不同的帧类型和不同的QP(Quantization Parameter，量化参数)建立不同的失真函数，求取失真函数的极小值点；步骤二：在计算完极小值点后对最近1/2像素点和最优整像素点的率失真代价进行比较，纠正误差较大的极小值点；步骤三：根据极小值点的位置进行1/2或1/4像素搜索，从而获取更好的搜索精度，本发明可以在编码码率增加不多的情况下节省较多的时间。

Description

一种快速的视频编码方法

技术领域

本发明涉及一种快速的视频编码方法。

背景技术

随着多媒体信息技术的发展，视频越来越广泛地应用于录像资料存储、远程视频网络、视频直播、家庭影院等诸多领域。当前视频传输中最为重要的编码标准有MPEG-2、H.264、H.265、AVS和AVS+等，随着编码标准的不断改进，压缩效率也越来越高，但是随之而来的计算复杂度也越来越大。如何降低计算复杂度，提升编码速度是视频编码技术的一个关键问题。

视频图像数据有极强的相关性，一帧图像内部有很多邻近像素的数据是相似或相同的，这就是空域冗余，而视频中邻近帧之间的数据也存在很多相似或重复，这就是时域冗余，编码压缩就是将数据中的这些冗余信息去掉，帧内编码技术可以去除空域冗余，而帧间编码技术则可以去除时域冗余。

帧间编码利用邻近帧之间存在的相关性，将一帧图像分成若干个编码块，并设法搜索出每个块在邻近帧中对应的匹配块，计算出两者之间的空间位置的相对偏移量，得到的相对偏移量就是MV(Motion Vector，运动矢量)，而得到MV的过程被称为运动估计。由于搜索匹配块的次数多，运动估计的时间在编码过程中占据30％甚至更多，因此，如何优化运动估计算法是提升编码整体速度的一个关键技术。

运动估计主要包括整像素搜索和分像素搜索，下面以H.265编码标准为例分析整像素搜索和分像素搜索。

整像素搜索主要包括以下步骤：

1.在编码当前块时，利用空域和时域上相邻编码块的MV组成一个MV集合，从这个MV集合中寻找失真最小的MV做为当前编码块的初始MV，从而确定当前编码块在邻近帧中的整像素搜索起始点；

2.以整像素搜索起始点为中心，分别以步长为1，2，4，8，16，32，64进行菱形搜索，选择失真最小的点做为下一步的搜索中心点；

3.如果步骤2中计算出的搜索中心点与步骤1中的整像素搜索起始点距离大于步长3，则以步骤2中计算出的搜索中心点为起点，做步长为3的全遍历搜索；否则，进入步骤4；

4.跳回步骤2，直到最优整像素点出现在搜索中心位置才退出循环。

分像素搜索主要包括以下步骤：

1.以最优整像素点为中心，利用离散余弦变换插值滤波器进行插值得到该预测块中的1/2像素点，并比较最优整像素点和周围8个1/2像素点的率失真代价，选取率失真代价最小的点为最优1/2像素点；

2.以最优1/2像素点为中心，利用离散余弦变换插值滤波器进行插值得到该预测块中的1/4像素点，并比较最优1/2像素点和周围8个1/4像素点的率失真代价，选取率失真代价最小的点为最优1/4像素点；

分像素搜索能够在邻近帧中搜索出更加精确的匹配块，但是需要搜索的点数较多，复杂度较大，且分像素搜索时间在整个运动估计中占60％以上。

发明内容

本发明的目的在于克服现有技术中的不足而提供一种快速的视频编码方法。

为实现上述目的，一方面，本发明提供的一种快速的视频编码方法，包括如下步骤：

整像素搜索，寻找最优整像素点；

设定第一阈值，判断当前帧是否P帧且QP小于第一阈值，第一阈值的取值范围在[T₁，51]之间，其中T₁是一个为了平衡编码码率和编码时间的经验系数；

根据判断结果，利用最优整像素点及周围整像素点拟合为一个函数并求取函数的极小值点；

寻找极小值点对应坐标的最优分像素点。

优选地，在寻找极小值点对应坐标的最优1/2像素点和最优1/4像素点中的一种的步骤中，包括如下步骤：

寻找极小值点对应坐标的最近1/2像素点，判断最近1/2像素点的率失真代价是否小于最优整像素点的率失真代价；

当最近1/2像素点的率失真代价大于最优整像素点的率失真代价，重新搜索1/2像素点和1/4像素点，求取最优分像素点；

当最近1/2像素点的率失真代价小于最优整像素点的率失真代价，判断极小值点与最近1/2像素点的距离是否小于第二阈值，第二阈值的取值范围在[0，T₂]之间，T₂是一个为了平衡计算精确度和编码时间的经验系数；

当极小值点与最近1/2像素点的距离大于第二阈值，重新搜索1/4像素点，求取最优1/4像素点；

当极小值点与最近1/2像素点的距离小于第二阈值，选取最近1/2像素点为最优分像素点。

优选地，通过优化运动估计中分像素搜索算法提升编码效率，可应用于H.264、H.265、AVS和AVS+视频压缩标准。

根据本发明提供的一种快速的视频编码方法，首先，利用最优整像素点及周围整像素点的率失真代价，根据不同的帧类型和不同的QP建立不同的失真函数，求取失真函数的极小值点；其次，在计算完极小值点后对最近1/2像素点和最优整像素点的率失真代价进行比较，纠正误差较大的极小值点；最后，根据极小值点的位置进行1/2或1/4像素搜索，从而获取更好的搜索精度，减少了分像素的搜索时间，提升了编码速度，本发明可以在编码码率增加不多的情况下节省较多的时间。

本发明通过优化运动估计中分像素搜索算法提升编码效率，可应用于H.264、H.265、AVS和AVS+等视频压缩标准。

附图说明

图1是本发明一实施例的一种快速的视频编码方法的流程示意框图。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

下面详细描述本发明的实施例，所述实施例的示例在附图中示出，通过参考附图描述的实施例是示例性的，旨在用于解释本发明，而不能理解为对本发明的限制。

在本发明的描述中，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。

对于本领域的普通技术人员而言，可以根据具体情况理解上述术语在本发明中的具体含义。

本发明一实施例提供了一种快速的视频编码方法，包括如下步骤：

整像素搜索，寻找最优整像素点；

设定第一阈值，判断当前帧是否P帧且QP小于第一阈值，其中，第一阈值的取值范围在[27，51]之间；

寻找极小值点对应坐标的最优1/2像素点和最优1/4像素点中的一种。

当最近1/2像素点的率失真代价大于最优整像素点的率失真代价，重新搜索1/2像素点和1/4像素点，求取最优1/4像素点；

当最近1/2像素点的率失真代价小于最优整像素点的率失真代价，判断极小值点与最近1/2像素点的距离是否小于第二阈值，其中，第二阈值的取值范围在[0，0.25]之间；

具体地，如图1所示，

步骤1，整像素搜索，寻找最优整像素点；

步骤2，先判断当前帧类型是否为P帧且当前编码单元的QP是否小于第一阈值其中第一阈值为预先约定的经验数值，如果不是则利用最优整像素点(x₀，y₀，z₀)以及周围i个整像素点(x₁，y₁，z₁)、(x₂，y₂，z₂)、(x₃，y₃，z₃)...(x_i，y_i，z_i)拟合为一个M₁元N₁次函数F₁并求取函数F₁的极小值点，其中x₀，x₁，x₂，x₃...x_i分别代表各个整像素点的横坐标，y₀，y₁，y₂，y₃...y_i分别代表各个整像素点的纵坐标，z₀，z₁，z₂，z₃...z_i分别代表各个整像素点的率失真代价；如果是则利用最优整像素点(x₀，y₀，z₀)以及周围j个整像素点(x₁，y₁，z₁)、(x₂，y₂，z₂)、(x₃，y₃，z₃)...(x_j，y_j，z_j)拟合为一个M₂元N₂次函数F₂并求取函数F₂的极小值点；

步骤3，将步骤2中的极小值点对应的x、y坐标寻找最近的1/2像素点，判断该1/2像素点的率失真代价是否小于最优整像素点的率失真代价，如果不是，则重新做1/2像素搜索和1/4像素搜索，求取最优1/4像素点；如果是则进行步骤4；

步骤4，判断该极小值点与最近的1/2像素点的距离是否小于第二阈值其中第二阈值为预先约定的经验数值，如果不是，则做1/4像素搜索，求取最优1/4像素点；如果是则进行步骤5；

步骤5，选择步骤4中最近的1/2像素点为最优1/2像素点。

现有的免插值分像素搜索算法针对所有的帧类型(包括P帧和B帧)和所有的都采用固定的多点失真函数求取极小值。本发明对于B帧或者P帧中QP大于第一阈值的编码单元，利用最优整像素点(x₀，y₀，z₀)以及周围i个整像素点(x₁，y₁，z₁)、(x₂，y₂，z₂)、(x₃，y₃，z₃)...(x_i，y_i，z_i)拟合为一个M₁元N₁次函数F₁并求取函数F₁的极小值点，其中第一阈值为预先约定的经验值；对于P帧中QP小于第一阈值的编码单元，则利用最优整像素点(x₀，y₀，z₀)以及周围j个整像素点(x₁，y₁，z₁)、(x₂，y₂，z₂)、(x₃，y₃，z₃)...(x_j，y_j，z_j)拟合为一个M₂元N₂次函数F₂并求取函数F₂的极小值点，这样可以更灵活地平衡计算复杂度和搜索精度；

现有的免插值分像素搜索算法在求取极小值之后，对极小值点所对应的x、y坐标寻找最近的1/2或者1/4像素点作为最优分像素点，但是经过统计发现此方法求取的最优分像素点的率失真代价大于最优整像素点的率失真代价的概率达到10％甚至更高，这样求取的最优分像素点会造成较大的编码失真。本发明则在计算完极小值点后，对极小值点所对应的x、y坐标寻找最近的1/2或者1/4像素点作为候选分像素点，将其率失真代价与最优整像素点的率失真代价进行比较，如果候选分像素点的率失真代价大于最优整像素点的率失真代价，则说明该候选分像素点将会造成较大的编码失真，需再次进行1/2和1/4像素搜索；

现有的免插值分像素搜索算法在求取极小值之后，对极小值点所对应的x、y坐标寻找最近的1/2或者1/4像素点作为最优分像素点，这样也会导致求取的分像素点不够精确，会带来额外的码率增加。本发明则先判断极小值与最近1/2像素点的距离是否小于第二阈值，如果是，则直接判定该1/2像素点为最优分像素点；如果不是，，则以最近的1/4像素点为中心再搜索最优的1/4像素点，这样可以获得更好的搜索精度。

将本发明算法和现有免插值分像素搜索算法在x265测试模型上实现，并分别与x265原算法算法进行对比，分别测试IPPP和IBBBP编码结构。

在IPPP编码结构中，免插值分像素搜索算法会增加2.7％的编码码率，本发明虽然编码时间比免插值分像素搜索算法略多，但是编码码率只增加了1.0％，可以用较少的码率换取较快的编码速度；在IBBBP编码结构中，免插值分像素搜索算法会增加1.4％的编码码率，本发明的编码码率仅仅增加了0.9％，编码时间也能够得到合理的控制。，总体而言，本发明可以在编码码率增加不多的情况下节省较多的时间。

视频编码中运动估计的计算太过复杂，它在编码过程中占据1/3甚至更多的时间，根据本发明提供的一种快速的视频编码方法，通过优化运动估计中分像素搜索算法，减少运动估计的时间，提升整体编码速度。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。尽管上面已经示出和描述了本发明的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本发明的限制，本领域的普通技术人员在不脱离本发明的原理和宗旨的情况下在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims

1.一种快速的视频编码方法，其特征在于，包括如下步骤：

整像素搜索，寻找最优整像素点；

设定第一阈值，判断当前帧是否P帧且QP小于所述第一阈值，所述第一阈值的取值范围在[T₁，51]之间，其中所述T₁是一个为了平衡编码码率和编码时间的经验系数；

根据判断结果，利用最优整像素点及周围整像素点的率失真代价拟合为一个失真函数并求取所述失真函数的极小值点；

寻找所述极小值点对应坐标的最优分像素点。

2.根据权利要求1所述的一种快速的视频编码方法，其特征在于，所述分像素点包括1/2像素点和1/4像素点，在所述寻找所述极小值点对应坐标的最优分像素点的步骤中，包括如下步骤：

寻找所述极小值点对应坐标的最近1/2像素点，判断所述最近1/2像素点的率失真代价是否小于最优整像素点的率失真代价；

当所述最近1/2像素点的率失真代价大于所述最优整像素点的率失真代价，重新搜索1/2像素点和1/4像素点，求取最优分像素点；

当所述最近1/2像素点的率失真代价小于所述最优整像素点的率失真代价，判断所述极小值点与所述最近1/2像素点的距离是否小于第二阈值，所述第二阈值的取值范围在[0，T₂]之间，所述T₂是一个为了平衡计算精确度和编码时间的经验系数；

当所述极小值点与所述最近1/2像素点的距离大于所述第二阈值，重新搜索1/4像素点，求取最优1/4像素点；

当所述极小值点与所述最近1/2像素点的距离小于所述第二阈值，选取所述最近1/2像素点为最优分像素点。

3.如权利要求1所述的一种快速的视频编码方法，其特征在于，通过优化运动估计中分像素搜索算法提升编码效率，可应用于H.264、H.265、AVS和AVS+视频压缩标准。