CN101742325A

CN101742325A - 一种视频编码的方法和编码器

Info

Publication number: CN101742325A
Application number: CN 200810226462
Authority: CN
Inventors: 王浩
Original assignee: Vimicro Corp
Current assignee: Vimicro Corp
Priority date: 2008-11-11
Filing date: 2008-11-11
Publication date: 2010-06-16

Abstract

本发明提供一种视频编码的方法和编码器，方法包括：步骤一，将待编码的画面分为关注区域和背景区域；步骤二，在编码过程中，为所述关注区域分配第一编码资源，为所述背景区域分配第二编码资源，所述第一编码资源多于所述第二编码资源。本发明能够优化视频编码的性能，降低搜索的计算复杂度，解决现有技术不能根据实际需要对图像的不同区域进行区别编码的技术问题。

Description

一种视频编码的方法和编码器

技术领域

本发明涉及视频处理技术，特别是涉及一种视频编码的方法和编码器。

背景技术

帧间预测编码是利用视频图像帧间的相关性，即时间相关性，来达到图像压缩的目的，其广泛用于普通电视、会议电视、视频电话、高清晰度电视的压缩编码。采用帧间预测编码不直接传送当前帧的像素值，而是传送x和其前一帧或后一帧的对应像素x′之间的差值，可以达到更高的数据压缩比。

具有运动补偿的帧间预测编码是视频压缩的关键技术之一，在实际实现时其经常采用的运动估值方法是块匹配法。它将图像划分为许多子块，并认为子块内所有像素的位移量是相同的，这意味着将每个子块视为一个“运动物体”。对于某一时间t，图像帧中的某一子块如果在另一时间t-t1的帧中可以找到若干与其十分相似的子块，则称其中最为相似的子块为匹配块，并认为该匹配块是时间t-t1的帧中相应子块位移的结果。位移矢量由两帧中相应子块的坐标决定。

现有的视频编码方案，在做帧间预测时，一般都在参考帧中找到一个搜索区域，将当前帧的宏块在该区域中进行运动搜索，找到最佳匹配位置。搜索区域的大小一般是固定的，例如±32像素。按照这样的参数配置的编码器，在对图象中每个宏块做运动搜索时，从参考帧中选取的搜索区域都是相同大小的。搜索区域越大，搜索时需要的计算量越大。据估算，运动搜索的计算量，约占视频编码计算量的50～80％，因此如何降低搜索的计算复杂度，已经成为优化视频编码性能的一个重要课题。

如图1所示，中心的M×N像素大小的矩形，表示当前帧中的一个宏块；外围的大矩形表示在参考帧中对应的运动搜索区域，其尺寸为宽M+2Rx像素，高N+2Ry像素。运动搜索一般是按SAD(Sum of Absolute Difference，残差绝对值求和)最小的准则寻找最佳匹配位置。SAD的计算公式如下：

SAD (x, y) = Σ_{m = 1}^{M} Σ_{n = 1}^{N} | f_{k} (m, n) - f_{k - 1} (m + x, n + y) |

上式中，fk表示当前帧的宏块，fk-1表示参考帧中的搜索区域。

在视频监控领域，经常会遇到的场景是：背景是静止的，只有前景一部分区域是运动的，例如ATM自动取款机中安装的监控摄像机，画面中只有操作者是运动的。如何针对这种普遍出现的应用情况，降低搜索的计算复杂度，优化视频编码的性能，是有待解决的一个重要问题。

发明内容

本发明实施例的目的是提供一种视频编码的方法和编码器，能够优化视频编码的性能，降低搜索的计算复杂度，解决现有技术不能根据实际需要对图像的不同区域进行区别编码的技术问题。

为了实现上述目的，一方面，提供了一种视频编码的方法，包括：

步骤一，将待编码的画面分为关注区域和背景区域；

步骤二，在编码过程中，为所述关注区域分配第一编码资源，为所述背景区域分配第二编码资源，所述第一编码资源多于所述第二编码资源。

优选地，上述的方法中，所述步骤二具体包括：在编码过程中，对所述关注区域的宏块采用第一搜索精度，对所述背景区域的宏块采用第二搜索精度，所述第一搜索精度高于所述第二搜索精度；和/或，对所述关注区域的宏块采用第一搜索范围，对所述背景区域的宏块采用第二搜索范围，所述第一搜索范围大于所述第二搜索范围。

优选地，上述的方法中，在所述步骤一之前，还包括：预留编码器的配置接口，通过所述配置接口修改所述关注区域和所述背景区域的范围，通过所述配置接口修改所述第一搜索精度、所述第二搜索精度、所述第一搜索范围和所述第二搜索范围。

优选地，上述的方法中，所述第一搜索精度为四分之一或二分之一像素，所述第二搜索精度为整像素。

优选地，上述的方法中，所述第一搜索范围为±32像素，所述第二搜索范围为±16像素。

本发明的另一个方面，提供一种视频编码的编码器，包括：

划分单元，用于：将待编码的画面分为关注区域和背景区域；

编码单元，用于：在编码过程中，对所述关注区域的宏块采用第一搜索精度，对所述背景区域的宏块采用第二搜索精度，所述第一搜索精度高于所述第二搜索精度；和/或，对所述关注区域的宏块采用第一搜索范围，对所述背景区域的宏块采用第二搜索范围，所述第一搜索范围大于所述第二搜索范围。

优选地，上述的编码器中，还包括：

配置接口，用于：修改所述关注区域和所述背景区域的范围，修改所述第一搜索精度、所述第二搜索精度、所述第一搜索范围和所述第二搜索范围

优选地，上述的编码器中，所述第一搜索精度为四分之一或二分之一像素，所述第二搜索精度为整像素。

优选地，上述的编码器中，所述第一搜索范围为±32像素，所述第二搜索范围为±16像素。

本发明实施例至少存在以下技术效果：

1)对背景区域选用较差的搜索精度，可以大大节省编码器的插值、匹配等运算量，降低功耗。

2)背景区域进行视频编码时，对于帧间运动估计选用较小的搜索范围。因为背景区域一般都处于静止，出现运动目标的概率较小，对这样的区域选用较小的搜索范围，可以大大节省编码器的运算量，降低功耗。另外，这样得到的运动向量值会集中分布于以0为中心的更小的范围，有利于节省熵编码后的码字长度。

3)采用本发明实施例的方法所编出来的视频码流，不需要修改解码器就可以顺利解码。

附图说明

图1为现有技术进行运动搜索的示意图；

图2为本发明实施例提供的方法的步骤流程图；

图3为本发明实施例提供的亚像素级运动搜索的示意图；

图4为本发明实施例提供的编码器的结构图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合附图对具体实施例进行详细描述。

图2为本发明实施例提供的方法的步骤流程图，如图所示，本发明实施例视频编码的方法包括：

步骤101，将待编码的画面分为关注区域和背景区域；

步骤102，在编码过程中，优先为所述关注区域分配资源(为所述关注区域分配第一编码资源，为所述背景区域分配第二编码资源，所述第一编码资源多于所述第二编码资源)。

其中步骤102可以具体包括两大部分。

第一部分：

所述步骤102具体包括：在编码过程中，对所述关注区域的宏块采用第一搜索精度，对所述背景区域的宏块采用第二搜索精度，所述第一搜索精度高于所述第二搜索精度。

实际上，很多视频编码已经支持到亚像素级运动估计，例如mpeg4，有的甚至支持到四分之一像素级的运动估计，例如H.264。图3显示了亚像素级运动搜索：图3中，*号表示整像素级的点，即参考图象中原始的点；#号表示亚像素级的点，即通过原始像点插值得到的点。运动搜索不仅在整像素级的点上进行匹配，也同样会在亚像素级的点上进行匹配，找到更佳的运动向量。

亚像素点的插值方法，依不同的视频编码标准而有不同，表1为亚像素点的插值表，典型的插值过程如下：

表1

＊A	#b	＊B
＊A	#b	＊B	#a	#e	#d
＊C	#c	＊D	#a	#e	#d

其中，大写字母表示整像素级的点，小写字母表示亚像素级的点。对于四分之一精度的插值，计算过程更为复杂，线性滤波器的阶数也更高。

本发明在背景区域进行视频编码时，帧间运动估计选用较差的搜索精度。对感兴趣的关注区域进行视频编码时，选用较高的搜索精度。背景区域选用较差的搜索精度，可以大大节省编码器的插值、匹配等运算量，降低功耗。另外，采用这种方案编出来的视频码流，不需要修改解码器就可以顺利解码。

第二部分：

步骤102可以包括：所述关注区域的宏块采用第一搜索范围，对所述背景区域的宏块采用第二搜索范围，所述第一搜索范围大于所述第二搜索范围。这是因为：

背景区域因为各种噪声的干扰，按SAD最小的准则找到的“最佳”匹配位置，已经不能反映场景中实际景物的运动情况。例如，在监控画面中，虽然背景中没有任何运动目标，但各个宏块在做运动搜索时却仍然得到了非零的运动向量。这些运动向量仍然需要进行熵编码，占用编码后的码字，从而增大视频编码文件的大小，或增加视频传输的码率。

本发明在背景区域进行视频编码时，对于帧间运动估计选用较小的搜索范围，感兴趣的关注区域进行视频编码时，选用较大的搜索范围。因为背景区域一般都处于静止，出现运动目标的概率较小，对这样的区域选用较小的搜索范围，可以大大节省编码器的运算量，降低功耗。另外，这样得到的运动向量值会集中分布于以0为中心的更小的范围，有利于节省熵编码后的码字长度。

此外，在所述步骤101之前，还包括：

预留编码器的配置接口，通过所述配置接口修改所述关注区域和所述背景区域的范围，通过所述配置接口修改所述第一搜索精度、所述第二搜索精度、所述第一搜索范围和所述第二搜索范围。所述第一搜索精度可选择为四分之一或二分之一像素，所述第二搜索精度为整像素。所述第一搜索范围可选择为±32像素，所述第二搜索范围为±16像素。

图4为本发明实施例提供的编码器的结构图。对应以上方法，本发明实施例还提供的视频编码的编码器如图4所示，包括：

划分单元201，用于：将待编码的画面分为关注区域和背景区域；

编码单元202，用于：在编码过程中，对所述关注区域的宏块采用第一搜索精度，对所述背景区域的宏块采用第二搜索精度，所述第一搜索精度高于所述第二搜索精度；和/或，对所述关注区域的宏块采用第一搜索范围，对所述背景区域的宏块采用第二搜索范围，所述第一搜索范围大于所述第二搜索范围。

还包括：配置接口单元203，用于：修改所述关注区域和所述背景区域的范围，修改所述第一搜索精度、所述第二搜索精度、所述第一搜索范围和所述第二搜索范围

因此，配置接口允许管理员对编码器进行相应的设置，包括感兴趣区域(关注区域)，背景区域的定义，感兴趣区域运动搜索精度和搜索范围的设定，背景区域运动搜索精度和搜索范围的设定，等等。

在编码器中，对一个宏块进行帧间预测时，先查找该宏块所属的区域类型，并根据该区域所设定的运动搜索精度，进行运动搜索的计算。例如，在某个实施例中，对感兴趣区域进行四分之一像素精度的运动搜索，而对背景区域则只进行整像素精度的运动搜索。

在编码器中，对一个宏块进行帧间预测时，可查找该宏块所属的区域类型，并根据该区域所设定的运动搜索范围的值，到参考帧中取出相应的搜索区域进行计算。

由上可知，本发明实施例至少存在以下优势：

以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种视频编码的方法，其特征在于，包括：

步骤一，将待编码的画面分为关注区域和背景区域；

2.根据权利要求1所述的方法，其特征在于，所述步骤二具体包括：

在编码过程中，对所述关注区域的宏块采用第一搜索精度，对所述背景区域的宏块采用第二搜索精度，所述第一搜索精度高于所述第二搜索精度；和/或，对所述关注区域的宏块采用第一搜索范围，对所述背景区域的宏块采用第二搜索范围，所述第一搜索范围大于所述第二搜索范围。

3.根据权利要求2所述的方法，其特征在于，在所述步骤一之前，还包括：

预留编码器的配置接口，通过所述配置接口修改所述关注区域和所述背景区域的范围，通过所述配置接口修改所述第一搜索精度、所述第二搜索精度、所述第一搜索范围和所述第二搜索范围。

4.根据权利要求2所述的方法，其特征在于，所述第一搜索精度为四分之一或二分之一像素，所述第二搜索精度为整像素。

5.根据权利要求2所述的方法，其特征在于，所述第一搜索范围为±32像素，所述第二搜索范围为±16像素。

6.一种视频编码的编码器，其特征在于，包括：

7.根据权利要求6所述的编码器，其特征在于，还包括：

8.根据权利要求6所述的编码器，其特征在于，所述第一搜索精度为四分之一或二分之一像素，所述第二搜索精度为整像素。

9.根据权利要求6所述的编码器，其特征在于，所述第一搜索范围为±32像素，所述第二搜索范围为±16像素。