CN113489986A

CN113489986A - 一种整像素运动估计方法、装置、电子设备及介质

Info

Publication number: CN113489986A
Application number: CN202110593270.8A
Authority: CN
Inventors: 向国庆; 朱玺仲; 张鹏; 张广耀; 宋磊; 贾惠柱
Original assignee: Hangzhou Boya Hongtu Video Technology Co ltd
Current assignee: Hangzhou Boya Hongtu Video Technology Co ltd
Priority date: 2021-05-28
Filing date: 2021-05-28
Publication date: 2021-10-08

Abstract

本申请提供一种整像素运动估计方法、装置、电子设备及存储介质。其中，所述方法包括：基于组合划分方式，将当前最大编码单元LCU划分为不重叠的多个第一类编码单元和多个第二类编码单元；将每个第二类编码单元再通过一次水平划分或垂直划分，分为两个第一类编码单元；对所有第一类编码单元进行运动估计，得到每个第一类编码单元对应的运动矢量；根据每个第二类编码单元划分得到的两个第一类编码单元的运动矢量，基于预设的继承方式得到所述第二类编码单元的运动矢量，相较于现有技术，本申请能够降低编码单元级别运动估计的带宽需求和复杂度，易于硬件实现。

Description

一种整像素运动估计方法、装置、电子设备及介质

技术领域

本申请涉及视频编解码技术领域，具体涉及一种整像素运动估计方法、装置、电子设备及存储介质。

背景技术

视频编解码技术的主要作用，是在可用的计算资源内，追求尽可能高的视频重建质量和尽可能高的压缩比。

运动估计(Motion Estimation,ME)是广泛应用于主流编码器中的一个非常重要的编码工具，其已经被证明在消除帧间冗余上具有较高的有效性。ME通过在参考帧上搜索当前预测单元(Prediction Unit,PU)的最优搜索点(Search Point)，从而获取通过两者位置的差别，即运动矢量(Motion Vector，MV)。ME可以进一步分为整像素运动估计(IntegerPixel Motion Estimation,IME)和分像素运动估计(Fractional Pixel MotionEstimation,FME)。

IME通过在一个预先定义好的搜索范围，即搜索窗(Search Window)内的整像素间进行搜索最优MV。为了获取较为精准的搜索结果，则需要搜索窗尽可能的大，但是这样会让IME由于需要遍历更多的搜索点，极大增加复杂度和带宽消耗。因此，有较多的快速IME方法被提了出来。

例如，AVS3(Advanced Video Coding，先进视频编码)标准中给出了一种分为三个阶段的跳点搜索方法。

第一个阶段，首先利用一个螺旋搜索对搜索的起始点进行一个微调得到SP1_0，之后以SP1_0为中心点，进行搜索半径为逐渐加大的菱形模式搜索(Diamond Search)，得到最优搜索点SP1_1。如果SP1_1距离初始搜索点距离较远，则进行第二阶段，否则认为是最优搜索点。

第二个阶段，在以SP1_1为中心，搜索范围(Search Range，SR)为边长的一个方形内，进行一定步长(Stride)的光栅模式搜索(Raster Search)，得到最优点SP2。

第三个阶段，以SP2为中心点，进行小范围的菱形模式搜索，获得最优点SP3，作为最终最优匹配点。

且由于AVS3标准中，引入了新的编码块划分机制，允许二叉树(BT，Binary Tree)，四叉树(QT，Quart Tree)和拓展四叉树(EQT，Extended Quart Tree)并存,大大增加了编码单元(Coding Unit，CU)的数量，一个CU在帧间预测模式下，将不再被分为多个PU，则上述的IME方法是按照CU级别进行的。

首先，AVS3编码器中的IME方法并不利于硬件实现，因为它具有分阶段收敛的特性，每个阶段搜索的起始点无法得知，导致其具有不规则的数据流。

其次，由于CU划分技术相较于上一代编码标准增加了例如EQT等更多灵活的划分方式。虽然不再对CU进行PU划分，但是需要进行运动估计的CU依然大幅增加。假设最大编码单元(Largest Coding Unit,LCU)尺寸为64x64，在AVS3标准给出的IPPP编码配置下可划分出约1549个CU，其中每一个CU都需要进行运动估计，其复杂度和带宽消耗巨大。对于硬件来说，则面临着延迟和硬件资源消耗之间的取舍。

发明内容

本申请的目的是提供一种整像素运动估计方法、装置、电子设备及存储介质，以降低CU级别运动估计的带宽需求和复杂度，易于硬件实现。

本申请第一方面提供一种整像素运动估计方法，包括：

基于组合划分方式，将当前最大编码单元LCU划分为不重叠的多个第一类编码单元和多个第二类编码单元，其中，所述组合划分方式包括第一类划分方式和第二类划分方式，第一类划分方式对应第一类编码单元，第二类划分方式对应第二类编码单元；

将每个第二类编码单元再通过一次水平划分或垂直划分，分为两个第一类编码单元；

对所有第一类编码单元进行运动估计，得到每个第一类编码单元对应的运动矢量；其中，所有第一类编码单元包括采用第一类划分方式划分得到的第一类编码单元，以及第二类编码单元划分得到的第一类编码单元；

根据每个第二类编码单元划分得到的两个第一类编码单元的运动矢量，基于预设的继承方式得到所述第二类编码单元的运动矢量。

本申请第二方面提供一种整像素运动估计装置，包括：

第一划分模块，用于基于组合划分方式，将当前最大编码单元LCU划分为不重叠的多个第一类编码单元和多个第二类编码单元，其中，所述组合划分方式包括第一类划分方式和第二类划分方式，第一类划分方式对应第一类编码单元，第二类划分方式对应第二类编码单元；

第二划分模块，用于将每个第二类编码单元再通过一次水平划分或垂直划分，分为两个第一类编码单元；

运动估计模块，用于对所有第一类编码单元进行运动估计，得到每个第一类编码单元对应的运动矢量；其中，所有第一类编码单元包括采用第一类划分方式划分得到的第一类编码单元，以及第二类编码单元划分得到的第一类编码单元；

继承模块，用于根据每个第二类编码单元划分得到的两个第一类编码单元的运动矢量，基于预设的继承方式得到所述第二类编码单元的运动矢量。

本申请第三方面提供一种电子设备，包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器运行所述计算机程序时执行以实现本申请第一方面所述的方法。

本申请第四方面提供一种计算机可读介质，其上存储有计算机可读指令，所述计算机可读指令可被处理器执行以实现本申请第一方面所述的方法。

相较于现有技术，本申请提供的整像素运动估计方法，基于组合划分方式，将当前最大编码单元LCU划分为不重叠的多个第一类编码单元和多个第二类编码单元；将每个第二类编码单元再通过一次水平划分或垂直划分，分为两个第一类编码单元；对所有第一类编码单元进行运动估计，得到每个第一类编码单元对应的运动矢量；根据每个第二类编码单元划分得到的两个第一类编码单元的运动矢量，基于预设的继承方式得到所述第二类编码单元的运动矢量，相较于现有技术，本申请对于第二类编码单元的运动矢量，采用已有的运动矢量进行其运动矢量继承，仅需计算相当于两个搜索点的代价，大大减少了其计算复杂度和硬件实现的资源，因此本申请能够降低CU级别运动估计的带宽需求和复杂度，易于硬件实现。

附图说明

通过阅读下文优选实施方式的详细描述，各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的，而并不认为是对本申请的限制。而且在整个附图中，用相同的参考符号表示相同的部件。在附图中：

图1示出了本申请提供的一种整像素运动估计方法的流程图；

图2示出了本申请提供的EQT CU划分为BT/QT CU的示意图；

图3示出了本申请提供的一种分层运动估计的结构示意图；

图4示出了本申请提供的一种整像素运动估计装置的示意图；

图5示出了本申请提供的一种电子设备的示意图；

图6示出了本申请提供的一种计算机可读存储介质的示意图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施方式。虽然附图中显示了本公开的示例性实施方式，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施方式所限制。相反，提供这些实施方式是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。

需要注意的是，除非另有说明，本申请使用的技术术语或者科学术语应当为本申请所属领域技术人员所理解的通常意义。

另外，术语“第一”和“第二”等是用于区别不同对象，而不是用于描述特定顺序。此外，术语“包括”和“具有”以及它们任何变形，意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元，而是可选地还包括没有列出的步骤或单元，或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。

为进一步说明本申请实施例的方案，下面将结合附图进行描述。可以理解的是，下面各实施例中，相同或相应的内容可以相互参考，为描述简便，后续不作赘述。

本申请实施例提供一种整像素运动估计方法及装置、一种电子设备以及计算机可读存储介质，下面结合附图进行说明。

请参考图1，其示出了本申请的一些实施方式所提供的一种整像素运动估计方法的流程图，该方法可应用于AVS3(Advanced Video Coding，先进视频编码)硬件编码器中。

如图1所示，上述整像素运动估计方法，可以包括以下步骤：

步骤S101：基于组合划分方式，将当前最大编码单元LCU划分为不重叠的多个第一类编码单元和多个第二类编码单元；

其中，组合划分方式包括第一类划分方式和第二类划分方式，第一类划分方式对应第一类编码单元，第二类划分方式对应第二类编码单元；

步骤S102：将每个第二类编码单元再通过一次水平划分或垂直划分，分为两个第一类编码单元；

步骤S103：对所有第一类编码单元进行运动估计，得到每个第一类编码单元对应的运动矢量；

其中，所有第一类编码单元包括采用第一类划分方式划分得到的第一类编码单元，以及第二类编码单元划分得到的第一类编码单元；

步骤S104：根据每个第二类编码单元划分得到的两个第一类编码单元的运动矢量，基于预设的继承方式得到所述第二类编码单元的运动矢量。

下面对上述各步骤进行详细介绍。

输入图像划分成若干个不重叠的处理单元，每个处理单元将进行类似的压缩操作。这个处理单元被称作CTU(Coding TreeUnit，编码树单元)，或者LCU(Large CodingUnit，最大编码单元)。LCU再往下，可以继续进行更加细粒度的划分，得到一个或多个基本编码的单元，称之为CU(Coding Unit，编码单元)。对待编码图像块LCU的划分，可以采用QT、BT、EQT等划分方式中的一种划分方式或多种划分方式的组合。

上述步骤S101中，第一类划分方式包括二叉树BT和/或四叉树QT，第二类划分方式为拓展四叉树EQT，第一编码单元为BT/QT CU，第二编码单元为EQT CU。

应理解，S101中的组合划分方式为最优划分方式，LCU被划分为各类CU之后，需要求各个CU的运动矢量。

当BT/QT CU的运动矢量产生之后，EQT CU运动矢量可以通过继承方式获得。对于任何EQT CU，均可通过一次水平或垂直的划分，分为两个BT/QT CU。如图2所示，一个EQT CU划分为BT/QT CU_A和BT/QT CU_B，其中图a为垂直划分方式，图b为水平划分方式。

因此，上述步骤S102中将每个第二类编码单元再通过一次水平划分或垂直划分，分为两个第一类编码单元。

应理解，S102之后，当前LCU被全部划分为了第一类编码单元，也就是BT/QT CU。

步骤S103可以实现为：采用分层运动估计方法对当前LCU进行运动估计，得到每个第一类编码单元对应的运动矢量，具体包括以下步骤：

设置一个搜索窗，以当前LCU对应位置，即运动矢量MV为(0,0)所对应的点为中心，以第一范围进行搜索；对搜索窗像素和编码单元原始像素进行第一比例的降采样，利用降采样图像对当前LCU进行全搜索运动估计，获取代价最小的两个运动矢量，记为第一MV和第二MV；

再设置三个搜索窗，分别以第一MV、第二MV和当前LCU的预测运动矢量所指向的点为中心，以第二范围进行搜索，对搜索窗像素和编码单元原始像素进行第二比例的降采样，利用降采样图像对当前LCU进行全搜索运动估计，三个搜索窗各选出最优MV，从三个最优MV中再选出一个最优MV，记为第三MV；

再设置一个搜索窗，以第三MV所指向的点为中心，以第三范围进行搜索，搜索窗像素和原始像素不进行降采样，在当前LCU上进行可变块运动估计，得到当前LCU内所有第一类编码单元对应的运动矢量。

示例性的，图3为本申请分层运动估计的结构示意图，LCU级BQ/QT CU的运动估计分为三层进行，即Lv2，Lv1，Lv0进行，其每一层的运动估计详细方式如下：

Lv2：一个搜索窗，以当前LCU对应位置，即MV为(0,0)所对应的点为中心，搜索范围为[-128,128]。对搜索窗像素和LCU原始像素进行16:1降采样，利用降采样图像对当前LCU进行全搜索运动估计。获取代价最小的两个运动矢量MV2_0和MV2_1。

Lv1：三个搜索窗，分别以MV2_0，MV2_1和当前LCU的预测运动矢量PMVLCU所指向的点为中心，搜索范围为[-28,28]。对搜索窗像素和LCU原始像素进行4:1降采样，利用降采样图像对当前LCU进行全搜索运动估计。三个搜索窗各选出最优MV，又从三个最优MV中选出一个最优的MV，记为MV1。

Lv0：一个搜索窗，以MV1所指向的点为中心，搜索范围为[-8,8]。搜索窗像素和原始像素不进行降采样，在图像块上进行可变块运动估计VBSME，产生一个LCU内所有从8x8到64x64所有BT/QT CU的MV。

上述分层运动估计方法，对Lv2层选取的最优MV数量，Lv1层搜索窗的数量或各层的搜索范围，可以进行微调，依然可以实现本方案。在Lv0运动估计上，本方案采用LCU级VBSME，可调整为较小的级别，如1/4LCU级VBSME。

步骤S104中，基于预设的继承方式得到所述第二类编码单元的运动矢量具体实现为：采用垂直方式划分第二类编码单元得到两个第一类编码单元，将位于左侧的第一类编码单元的运动矢量，作为所述第二类编码单元的运动矢量；采用水平方式划分第二类编码单元得到两个第一类编码单元，将位于上方的第一类编码单元的运动矢量，作为所述第二类编码单元的运动矢量。

具体的，对于任何一个EQT CU，按照EQT CU特性，分为包含的两个BT/QT CU，CU_A和CU_B，如图2所示，其对应的MV分别为MV_A和MV_B，本申请中，垂直方式继承的是位于左侧的BT/QTCU_A的MV，即MV_A；水平方式继承的是位于上方的BT/QTCU_A的MV，即MV_A。

因为通常编码一个CU，默认从左上角开始，如果继承CU_B的MV，则对于EQT CU来说，可能导致超出参考窗范围，因此直接使用CU_A的MV作为EQT CU的运动矢量。

应理解，本申请的上述整像素运动估计方法分为两个部分，分别为LCU级BT/QT CU的运动估计和EQT CU的运动矢量继承。

本申请提供了一种LCU级分层运动估计方法，通过两种方法生成LCU内所有不同类型CU的MV，有益效果分为以下三点：

首先，BT/QT CU采用分层运动估计方法获得MV，该方法具有规则的数据流，较大的搜索范围，通过降采样的方法降低SAD(Sum of Absolute Difference，误差绝对值和)计算的消耗，适合硬件实现，同时，在最后Lv0的搜索过程中，采用LCU级别的VBSME，极大复用了SAD计算的结果。

其次，由于VBSME在实现上的硬件资源正比于其所要搜索的块的数量，仅仅对于BT/QT CU而非所有CU采用VBSME，降低了VBSME的硬件实现代价。

最后，对于EQT CU的MV，采用已有的MV进行其MV继承，仅需计算相当于两个搜索点的代价，大大减少了其计算复杂度和硬件实现的资源。

综上，本申请的上述整像素运动估计方法易于硬件实现，解决了编码器中中IME的高复杂度，硬件资源和时延之间的平衡问题，且仅仅带来了较小的性能损失。

在上述的实施例中，提供了一种整像素运动估计方法，与之相对应的，本申请还提供一种整像素运动估计装置。请参考图4，其示出了本申请的一些实施方式所提供的一种整像素运动估计装置的示意图。由于装置实施例基本相似于方法实施例，所以描述得比较简单，相关之处参见方法实施例的部分说明即可。下述描述的装置实施例仅仅是示意性的。

如图4所示，所述整像素运动估计装置10包括：

第一划分模块101，用于基于组合划分方式，将当前最大编码单元LCU划分为不重叠的多个第一类编码单元和多个第二类编码单元，其中，所述组合划分方式包括第一类划分方式和第二类划分方式，第一类划分方式对应第一类编码单元，第二类划分方式对应第二类编码单元；

第二划分模块102，用于将每个第二类编码单元再通过一次水平划分或垂直划分，分为两个第一类编码单元；

运动估计模块103，用于对所有第一类编码单元进行运动估计，得到每个第一类编码单元对应的运动矢量；其中，所有第一类编码单元包括采用第一类划分方式划分得到的第一类编码单元，以及第二类编码单元划分得到的第一类编码单元；

继承模块104，用于根据每个第二类编码单元划分得到的两个第一类编码单元的运动矢量，基于预设的继承方式得到所述第二类编码单元的运动矢量。

根据本申请的一些实施方式中，第一类划分方式包括二叉树BT和/或四叉树QT，第二类划分方式为拓展四叉树EQT，第一编码单元为BT/QT CU，第二编码单元为EQT CU。

根据本申请的一些实施方式中，运动估计模块103，具体用于：

采用分层运动估计方法对当前LCU进行运动估计，得到每个第一类编码单元对应的运动矢量。

根据本申请的一些实施方式中，运动估计模块103，进一步用于：

所述采用分层运动估计方法对当前LCU进行运动估计，得到每个第一类编码单元对应的运动矢量，包括：

根据本申请的一些实施方式中，继承模块104，具体用于：

采用垂直方式划分第二类编码单元得到两个第一类编码单元，将位于左侧的第一类编码单元的运动矢量，作为所述第二类编码单元的运动矢量；或者，

采用水平方式划分第二类编码单元得到两个第一类编码单元，将位于上方的第一类编码单元的运动矢量，作为所述第二类编码单元的运动矢量。

本申请实施例提供的整像素运动估计装置，与本申请前述实施例提供的应用于整像素运动估计方法出于相同的发明构思，具有相同的有益效果。

本申请实施方式还提供一种与前述实施方式所提供的整像素运动估计方法对应的电子设备，例如手机、笔记本电脑、平板电脑、台式机电脑等，以执行上述整像素运动估计方法。

请参考图5，其示出了本申请的一些实施方式所提供的一种电子设备的示意图。如图5所示，所述电子设备20包括：处理器200，存储器201，总线202和通信接口203，所述处理器200、通信接口203和存储器201通过总线202连接；所述存储器201中存储有可在所述处理器200上运行的计算机程序，所述处理器200运行所述计算机程序时执行本申请前述任一实施方式所提供的整像素运动估计方法。

其中，存储器201可能包含高速随机存取存储器(RAM：Random Access Memory)，也可能还包括非不稳定的存储器(non-volatile memory)，例如至少一个磁盘存储器。通过至少一个通信接口203(可以是有线或者无线)实现该系统网元与至少一个其他网元之间的通信连接，可以使用互联网、广域网、本地网、城域网等。

总线202可以是ISA总线、PCI总线或EISA总线等。所述总线可以分为地址总线、数据总线、控制总线等。其中，存储器201用于存储程序，所述处理器200在接收到执行指令后，执行所述程序，前述本申请实施例任一实施方式揭示的所述整像素运动估计方法可以应用于处理器200中，或者由处理器200实现。

处理器200可能是一种集成电路芯片，具有信号的处理能力。在实现过程中，上述方法的各步骤可以通过处理器200中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器200可以是通用处理器，包括中央处理器(Central Processing Unit，简称CPU)、网络处理器(Network Processor，简称NP)等；还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器201，处理器200读取存储器201中的信息，结合其硬件完成上述方法的步骤。

本申请实施例提供的电子设备与本申请实施例提供的整像素运动估计方法出于相同的发明构思，具有与其采用、运行或实现的方法相同的有益效果。

本申请实施方式还提供一种与前述实施方式所提供的整像素运动估计方法对应的计算机可读存储介质，请参考图6，其示出的计算机可读存储介质为光盘30，其上存储有计算机程序(即程序产品)，所述计算机程序在被处理器运行时，会执行前述任意实施方式所提供的整像素运动估计方法。

需要说明的是，所述计算机可读存储介质的例子还可以包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他光学、磁性存储介质，在此不再一一赘述。

本申请的上述实施例提供的计算机可读存储介质与本申请实施例提供的整像素运动估计方法出于相同的发明构思，具有与其存储的应用程序所采用、运行或实现的方法相同的有益效果。

最后应说明的是：以上各实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述各实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的范围，其均应涵盖在本申请的权利要求和说明书的范围当中。

Claims

1.一种整像素运动估计方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，第一类划分方式包括二叉树BT和/或四叉树QT，第二类划分方式为拓展四叉树EQT，第一编码单元为BT/QT CU，第二编码单元为EQTCU。

3.根据权利要求1或2所述的方法，其特征在于，所述对所有第一类编码单元进行运动估计，得到每个第一类编码单元对应的运动矢量，包括：

4.根据权利要求3所述的方法，其特征在于，所述采用分层运动估计方法对当前LCU进行运动估计，得到每个第一类编码单元对应的运动矢量，包括：

5.根据权利要求3所述的方法，其特征在于，所述根据每个第二类编码单元划分得到的两个第一类编码单元的运动矢量，基于预设的继承方式得到所述第二类编码单元的运动矢量，包括：

6.一种整像素运动估计装置，其特征在于，包括：

7.根据权利要求6所述的装置，其特征在于，第一类划分方式包括二叉树BT和/或四叉树QT，第二类划分方式为拓展四叉树EQT，第一编码单元为BT/QT CU，第二编码单元为EQTCU。

8.根据权利要求6或7所述的装置，其特征在于，所述运动估计模块，具体用于：

9.一种电子设备，包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器运行所述计算机程序时执行以实现如权利要求1至5中任一项所述的方法。

10.一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序在被处理器运行时执行以实现如权利要求1至5中任一项所述的方法。