CN101867799B

CN101867799B - 一种视频帧处理方法和视频编码器

Info

Publication number: CN101867799B
Application number: CN 200910082002
Authority: CN
Inventors: 周期律; 郭宗明; 姚凯
Original assignee: Peking University; Peking University Founder Group Co Ltd; Beijing Founder Electronics Co Ltd
Current assignee: Peking University; Peking University Founder Group Co Ltd; Beijing Founder Electronics Co Ltd
Priority date: 2009-04-17
Filing date: 2009-04-17
Publication date: 2011-11-16
Anticipated expiration: 2029-04-17
Also published as: CN101867799A

Abstract

本发明公开了一种视频处理方法和视频编码器，该方法包括：识别出视频帧中的脸部区域，并定位出该区域内的表情区域；为所述视频帧中的各编码宏块设置量化步长，使脸部区域内的编码宏块的量化步长小于非脸部区域内的编码宏块的量化步长、脸部区域到非脸部区域的过渡区域内的编码宏块的量化步长介于该两区域的编码宏块的量化步长之间，以及所述表情区域内的编码宏块的量化步长小于脸部区域内其他编码宏块的量化步长，并使根据设置的量化步长得到的编码后的码率不超出为所述视频帧预先分配的码率；根据设置的量化步长对各编码宏块进行编码处理。采用本发明，可以在网络视频应用中提高视频帧的显示效果，并且不需要增加额外的带宽资源。

Description

一种视频帧处理方法和视频编码器

技术领域

本发明涉及通信领域中的视频编码技术，尤其设计一种视频帧处理方法和视频编码器。

背景技术

近年来，随着网络的普及和技术的发展，网络视频互动系统占据了越来越大的市场。传统的网络视频互动系统中，由于受网络带宽有限的限制，系统采用的视频编码方式是CBR(Constants Bit Rate，固定码率)的编码方式，而传统的视频压缩标准通过标准的码率控制技术实现固定码率。

如果要提高视频帧的显示效果，按照传统的固定码率的视频编码方式需要为视频帧分配更多的编码资源，这样势必会增加网络系统开销，从而一方面会增加视频帧的传输时延，另一方面在网络带宽有限的情况下也会减少承载的用户数。

发明内容

本发明实施例提供了一种视频帧处理方法和视频编码器，以实现在不增加视频帧预分配的码率的前提下提高视频帧的显示效果。

本发明实施例提供的视频帧处理方法，包括：

识别出视频帧中的前景区域，并定位出该区域内的第一区域；

为所述视频帧中的各编码宏块设置量化步长，使前景区域内的编码宏块的量化步长小于非前景区域内的编码宏块的量化步长、前景区域到非前景区域的过渡区域内的编码宏块的量化步长介于该两区域的编码宏块的量化步长之间，以及所述第一区域内的编码宏块的量化步长小于前景区域内其他编码宏块的量化步长，并使根据设置的量化步长得到的编码后的码率不超出为所述视频帧预先分配的码率；

根据设置的量化步长对各编码宏块进行编码处理，如果当前编码宏块的量化步长减去与该编码宏块相邻的其他各编码宏块的量化步长的平均值所得到的差值，大于设定的量化步长区间的上限值，则将该区间的上限值设为当前编码宏块的量化步长；如果当前编码宏块的量化步长减去与该编码宏块相邻的其他各编码宏块的量化步长的平均值所得到的差值，小于设定的量化步长区间的下限值，则将该区间的下限值设为当前编码宏块的量化步长。

本发明实施例提供的视频编码器，包括：

前景识别模块，用于识别出视频帧中的前景区域；

区域划分模块，用于定位出所述前景区域内的第一区域；

量化步长设置模块，用于为所述视频帧中的各编码宏块设置量化步长，使前景区域内的编码宏块的量化步长小于非前景区域内的编码宏块的量化步长、前景区域到非前景区域的过渡区域内的编码宏块的量化步长介于该两区域的编码宏块的量化步长之间，以及所述第一区域内的编码宏块的量化步长小于前景区域内其他编码宏块的量化步长，并使根据设置的量化步长得到的编码后的码率不超出为所述视频帧预先分配的码率；

编码模块，用于根据设置的量化步长对各编码宏块进行编码处理，如果当前编码宏块的量化步长减去与该编码宏块相邻的其他各编码宏块的量化步长的平均值所得到的差值，大于设定的量化步长区间的上限值，则将该区间的上限值设为当前编码宏块的量化步长；如果当前编码宏块的量化步长减去与该编码宏块相邻的其他各编码宏块的量化步长的平均值所得到的差值，小于设定的量化步长区间的下限值，则将该区间的下限值设为当前编码宏块的量化步长。

本发明的上述实施例，通过在视频帧中划分出多个层次的区域，根据划分出的区域，为不同区域中的编码宏块设置不同的量化步长，使前景区域内的编码宏块的量化步长小于非前景区域内的编码宏块的量化步长、前景区域到非前景区域的过渡区域内的编码宏块的量化步长介于该两区域的编码宏块的量化步长之间，以及所述第一区域内的编码宏块的量化步长小于前景区域内其他编码宏块的量化步长，并使根据设置的量化步长得到的编码后的码率不超出为所述视频帧预先分配的码率。由于量化步长越小则相应分配的码率越大，因而画面失真率也就越小，这样，通过本发明实施例，在不增加视频帧的编码资源的前提下，提高接收方视频帧的显示质量，并通过渐变处理防止画面质量脱节现象的发生。对于网络视频业务，通常用户关心的是脸部的运动和表情，而脸部的运动和表情通常是通过眼睛和口所在区域的变化来表现的，因此，通过将脸部区域作为前景区域，以及将该区域内包括眼和口的表情区域作为第一区域，可以实现在网络视频应用中按照用户对视频画面内容的关系程度来分配编码资源以提高视频帧的显示效果，并且不需要增加额外的带宽资源。

附图说明

图1为本发明实施例提供的视频编码器的结构示意图；

图2为本发明实施例提供的视频帧处理流程示意图。

具体实施方式

对于网络视频业务，通常用户关心的是脸部的运动和表情，而脸部的运动和表情通常是通过眼睛和口所在区域的变化来表现的。针对这种情况，本发明实施例提供了一种视频帧的处理方法和视频编码器，采用该方法或视频编码器，可以对视频帧中的脸部区域中主要体现表情变化的区域、脸部的其他区域、脸部与非脸部区域的中间过渡区域以及非脸部区域，分别采用大小不同的量化步长进行视频编码，其量化步长按照上述区域的排序顺序递增，并使采用该方法得到的该视频帧编码后的码率不超过为该视频帧预先分配的码率，从而在不增加视频帧的编码资源的前提下，提高接收方视频帧的显示质量，并通过渐变处理来防止画面质量脱节现象的发生。

下面结合附图对本发明实施例进行详细描述。

本发明实施例提供了一种视频编码器100，视频编码器100从视频采集设备(如摄像头)接收视频数据后，经过视频编码器100的编码处理，输出适用于网络传输的视频数据。

参见图1，为本发明实施例提供的视频编码器100的结构示意图，视频编码器100主要包括：空间转换模块101、前景识别模块102、区域划分模块103、量化步长设置模块104和编码模块105。

视频采集设备采集到的视频数据通常为RGB模式，空间转换模块101接收到RGB模式的视频数据后，将其转换为YCrCb模式的视频数据(以下称视频帧10)，然后触发前景识别模块102；前景识别模块102对视频帧10进行前景划分处理，从而划分出作为前景区域的脸部区域以及作为背景区域的非脸部区域，然后触发区域划分模块103；区域划分模块103从识别出的脸部区域中定位出能够主要体现脸部表情变化的区域(以下称表情区域)、脸部的其他区域、脸部区域与非脸部区域的过渡区域以及其他非脸部区域，然后触发量化步长设置模块104；量化步长设置模块104为视频帧10中的各宏块(即符合H.264标准的16×16的编码宏块，以下同)设置量化步长，使脸部区域内的宏块的量化步长小于非脸部区域的宏块的量化步长、脸部区域到非脸部区域的过渡区域的编码宏块的量化步长介于该两区域的编码宏块的量化步长之间，以及使表情区域内的宏块的量化步长小于脸部区域内其他宏块的量化步长，并使根据设置的量化步长得到的编码后的码率不超出为视频帧10预先分配的码率；编码模块106根据设置的量化步长，对视频帧10中的各宏块进行视频编码处理，从而得到编码后的视频数据。

上述量化步长设置模块104可包括宏块分集子模块1041和量化步长设置子模块1042。其中，宏块分集子模块1041将视频帧10中的宏块划分为以下宏块集合：有像素落入表情区域内的宏块所组成的宏块集合L1、有像素落入脸部区域内但不属于L1的宏块所组成的宏块集合L2、有像素落入脸部区域外但与L2中的宏块相邻近的宏块所组成的宏块集合L3，以及由视频帧10中其余的宏块所组成的宏块集合L4；量化步长设置子模块1042分别为各宏块集合设置对应的量化步长，使各宏块集合对应的量化步长按照从L1到L4的顺序依次递增，并使根据设置的量化步长得到的编码后的码率不超出为所述视频帧预先分配的码率。

下面结合图2，对视频编码器100的视频编码流程进行详细描述：

步骤201、将输入的原始视频数据(或称视频帧)进行色彩空间转换处理。

由于视频采集设备采集到的视频数据通常为RGB模式，而采用H.264标准进行视频编码时要求视频帧的色彩模式为YCrCb，因此，对于RGB模式的视频帧需要进行色彩空间转换处理。空间转换模块101可采用常规方法进行转换从而得到YCrCb模式的视频帧10，比如，可按照以下转换公式进行转换：

[\begin{matrix} Y \\ Cb \\ Cr \\ 1 \end{matrix}] = [\begin{matrix} 0.2990 & 0.5870 & 0.1140 & 0 \\ - 0.1687 & - 0.3313 & 0.5000 & 128 \\ 0.5000 & - 0.4187 & - 0.0183 & 128 \\ 0 & 0 & 0 & 1 \end{matrix}] [\begin{matrix} R \\ G \\ B \\ 1 \end{matrix}]

步骤202、从视频帧10中识别出脸部区域和非脸部区域。

从视频帧中识别出脸部区域的方法有多种，本发明实施例中的前景识别模块102采用肤色相似度方法并结合二值化处理识别出脸部区域，该方法涉及的算法较为简单，因此对视频编码器的资源消耗较少、处理速度较快。如果视频帧中包括有多个人物头像，则通过该方法可识别出每个人物头像的脸部区域。

步骤203、从脸部区域中定位出表情区域。

由于脸部表情通常可由眼睛到口的脸部区域表现，所以本发明实施例中，区域划分模块103以脸部区域中的双眼和口的位置的最外延来界定出表情区域，即，取双眼位置的最左、最右和最上点，以及人口位置的最下点，以这些点界定出的矩形区域即为表情区域。当然，还可采用其他界定表情区域的方法，比如，以上述这些点界定的梯形区域作为表情区域，或者，将该梯形区域或上述矩形区域向双眼上部扩展一定高度，将眉毛包括在该区域内。相比之下，矩形的表情区域将使后续的计算处理更为简便。

步骤204、判断表情区域的像素点数量与视频帧10的像素点总数量的比值是否超过规定的比值，若是，则执行步骤208；否则，执行步骤205，即按照常规方式为视频帧10中的各宏块设置量化步长以及进行编码处理。

通常认为如果表情区域的像素点数量占视频帧的像素点总数量的比值超过70％(当然该比值也可以根据经验设为其他值)，则表明表情区域相对于其他区域较大，此时如果对不同区域的编码参数进行调整以及采用不同的编码参数对不同区域的宏块进行编码处理，则该视频帧在接收方的显示效果不会有明显改善，并且相比于采用传统的编码方式，有可能出现码率控制失败情况发生。因此，本发明实施例中的区域划分模块103将70％作为判断的阈值，区域划分模块103如果判断出表情区域的像素点数量与视频帧10的像素点总数量的比值超过70％，则可通知量化步长设置模块105按照传统的码率算法设置编码量化步长，以及由编码模块106根据量化步长设置模块105为视频帧10的所有宏块设置的量化步长进行编码处理。

在H.264视频编码标准下，在统计脸部表情区域的像素点数量时，可以以该标准中编码所使用的16×16的宏块大小来划分视频帧10，并将有像素点落在脸部表情区域内的所有宏块所组成的宏块集合记为宏块集合L1，然后计算宏块集合L1中所有宏块的像素点总数。当然也可以将像素点全部落入表情区域内的所有宏块组成宏块集合L1。

步骤205、根据划分出的脸部区域、表情区域以及非脸部区域，将视频帧10的所有宏块划分为4个宏块集合。其中，宏块分集子模块1041将有像素点落入表情区域的宏块所组出的集合记为L1，将有像素落入脸部区域之内但不属于集合L1的宏块所组成的集合记为L2，以集合L2中的宏块为基础向非脸部区域方向上扩展一圈或数圈所得到的宏块组成集合L3，将视频帧10中其余的宏块所组成的集合记为L4。

如果在前面步骤中已经划分出了宏块集合L1，则在该步骤中可不必再划分该宏块集合。

步骤206、分别为集合L1、L2、L3、L4中的宏块设置量化步长，使一个集合中的宏块具有相同的量化步长，不同集合的宏块具有不同的量化步长，设置的量化步长按照集合L1、L2、L3、L4的顺序递增，并保证视频帧10编码后的码率不超过预先为该视频帧分配的码率(根据H.264协议，在进行视频帧编码前需要预先为该视频帧分配码率)。

量化步长设置子模块1042设置量化步长时，可以在视频帧10的量化步长QP₀的基础上进行上下调整，从而使一个集合中的宏块采用相同的量化步长，各集合对应的量化步长按照L1、L2、L3、L4的顺序递增，相应的，编码率则按照集合L1、L2、L3、L4的顺序递减，并使根据调整后的量化步长进行视频编码后的码率不超出为该视频帧预先分配的码率。其中，量化步长QP₀是根据为视频帧10分配的总的编码率以及该视频帧总的宏块数量，并通过码率控制算法预测得到的，每个宏块的量化步长均为QP₀。调整后的集合L1、L2、L3、L4中的宏块的量化步长可以是：

{QP}_{mb} = \{\begin{matrix} {QP}_{0} - Δ_{1} & {MB}_{i} &Element; L_{1} \\ {QP}_{0} - Δ_{2} & {MB}_{i} &Element; L_{2} \\ {QP}_{0} & {MB}_{i} &Element; L_{3} \\ {QP}^{'} & {MB}_{i} &Element; L_{4} \end{matrix}

其中，QP_mb为宏块的量化步长，MB_i为第i个宏块，Δ(Δ＞0)是步长增量，其中，Δ₁＞Δ₂。QP′是这么来的：根据属于集合L1、L2、L3的所有宏块调整后的QP_mb计算出编码后的码率B，通过码率控制算法预测分配给视频帧10的码率为B_all，从B_all中减去B得到剩下可分配码率B_all-B，根据B_all-B预测集合L4中的宏块的量化步长，从而得到QP′。Δ的取值不能太大，因为如果取值太大，则会导致相邻宏块之间的QP_mb相差过大，而导致主观视觉效果变差，较佳地，Δ取值可为：Δ₁＝2，Δ₂＝l。

步骤207、编码模块105根据设置的量化步长对各宏块进行编码，得到压缩后的视频数据。

该步骤中，在为当前编码宏块进行编码处理时，为了进一步防止相邻宏块间的QP_mb相差过大，可在编码前，进一步根据当前编码宏块的相邻宏块的量化步长，对当前编码宏块的量化步长进行裁剪，以使当前编码宏块的量化步长与该编码宏块的各相邻宏块的平均量化步长的差值在设定的容忍度范围之内。较佳地，容忍度范围可设为[-3，3]。例如，如果当前编码宏块的量化步长QP在内(

为与当前编码宏块相邻的各宏块的平均量化步长)，则可不对当前编码宏块的量化步长进行裁剪；如果当前编码宏块的量化步长QP大于

则将QP裁剪为

如果当前编码宏块的量化步长QP小于

则将QP裁剪为

由于宏块的编码过程是从左上第一宏块至右下最后一个宏块，按从左到右，从上到下的顺序进行编码的，所以这里所说的相邻宏块是指当前编码宏块的左上、上方、右上和右边4个方向上的宏块，如当前编码宏块处于边界，则是指上述4个方向中存在的相邻宏块，如果当前宏块为第1个宏块，则将该宏块的量化步长初始化其上一帧的平均量化步长。

上述图2所示流程的步骤202中，采用肤色相似度方法并结合二值化处理识别出脸部区域的过程可以包括以下步骤：

步骤2071、对视频帧10内的每个像素点的色度分量Cr和Cb进行肤色相似度的计算，计算公式如下：

t (x, y) = \exp (\frac{Cb (x, y) * (Cb (x, y) * 299.4574 - Cr (x, y) * 12.1430) + Cr (x, y) * (- Cb (x, y) * 12.1430 + Cr (x, y) * 160.1301)}{(- 2) * (160.1301 * 288.4574 - 12.11630 * 12.1430)})

其中，Cb(x，y)和Cr(x，y)分别代表像素点(x，y)的色度分量Cr和Cb值。计算结果t在[0，1]内，而且越接近1表示该像素点的颜色越接近肤色。

步骤2072、通过皮肤相似度t的分布特征，找到用来分割前景和背景区域的最佳二值化域值。如，采用如下方式：

将[0，1]域分为L段(如L为10，则域值精度为0.1)，设n为视频帧10的像素点数和，n[k](k＜level)代表该帧像素中肤色相似度t值落在第k段分割中的像素点总和(如k＝1，n[k]代表该帧像素中肤色相似度t值落在[1.0，2.0)区间的像素点总和)，遍历每个L段，找到一个level域值，使得前景与背景的差异最大，即，使w0*wl*(u0-u1)2的值最大，其中代表前景像素点数占图像比例；

代表平均灰度；

代表背景像素点数占图像比例；

代表平均灰度。由此得到最佳域值level，将所有像素的t(x，y)值用level二值化：

\{\begin{matrix} 1 & t (x, y) > = level \\ 0 & t (x, y) < level \end{matrix},

以得到每个像素对应的肤色值g(x，y)，(x，y)代表像素坐标，

g (x, y) = \{\begin{matrix} 1 & t (x, y) > = level \\ 0 & t (x, y) < level \end{matrix},

g(x，y)＝l表示当前像素点所在区域为肤色区域，否则不是。

步骤2073、以标记为肤色的像素点(g(x，y)＝l)为基础，递归找到其8邻域连通区域，标记每个连通前景区域为候选前景区域，候选前景区域可能有多个。

步骤2074、根据人眼和人口的色度模板定位人眼人口的位置。人眼模板可以采用：

Eye (x, y) = \frac{1}{3} (Cb {(x, y)}^{2} + {(255 - Cr (x, y))}^{2} + \frac{Cb (x, y)}{Cr (x, y)}),

Cb(x，y)²，(255-Cr(x，y))²和

这些模板都需要被归一化到[0，255]的区间；人口模板可采用：

Mouth (x, y) = Cr {(x, y)}^{2} {(Cr {(x, y)}^{2} - η \frac{Cb (x, y)}{Cr (x, y)})}^{2},

Cr(x，y)²和

这些模板需要被归一化到[0，255]的区间。公式中的

其中n为候选前景区的像素点数，即n＝sum({(x，y)|g(x，y)＝1})，sum()表示集合中的元素个数。

步骤2075、去掉候选区域中没有定位出人脸和人口的候选区域，被去掉的区域可能是衣服或手臂所在区域，而剩下的前景候选区域为脸部区域。

上述图2所示的流程中，判断表情区域的像素点数量与视频帧10的像素点总数量的比值是否超过规定的比值的步骤是可选步骤，即，可以不需要进行该判断步骤，而是直接将视频帧10进行区域划分处理。

在本发明的另一实施例中，量化步长设置模块104设置视频帧10中各宏块的量化步长时，也可采用如下方式：

宏块分集子模块1041划分出宏块集合L1、L2、L3和L4后，量化步长设置子模块1042根据划分出的宏块集合，为权重更大的宏块分配更多的码率，然后根据各宏块分配到的码率计算各宏块的初始量化步长QP。分配的码率越大，QP计算出来越小，画面失真也就越小。码率分配可采用如下公式：

B_{i} = \{\begin{matrix} (B_{frame} - Σ_{k = 1}^{i - 1} B_{k}) / (N - i + 1) + Δ_{i} & {MB}_{i} &Element; L_{i} \\ (B_{frame} - Σ_{k = 1}^{i - 1} B_{k}) / (N - i + 1) + Δ_{2} & {MB}_{i} &Element; L_{2} \\ (B_{frame} - Σ_{k = 1}^{i - 1} B_{k}) / (N - i + 1) & {MB}_{i} &Element; L_{3} \\ (B_{frame} - Σ_{k = 1}^{i - 1} B_{k}) / (N - i + 1) - Δ_{3} & {MB}_{i} &Element; L_{4} \end{matrix}

其中，B_i表示编码第i个宏块给其分配的码率，B_frame表示为视频帧10预分配的码率，N为视频帧10中的宏块总数。Δ为码率增量，Δ_i＞0，且Δ₁＞Δ₂，并通过Δ₃的取值，使分配给视频帧10的码率不超过为其预分配的码率。

通过这种方式，一个宏块集合中各宏块的量化步长可能并不唯一，但可保证L1中各宏块的量化步长都不大于L2集合中的宏块的量化步长，L2中各宏块的量化步长都不大于L3集合中的宏块的量化步长，L3中各宏块的量化步长都不大于L4集合中的宏块的量化步长。还可通过进一步对量化步长的调整，使L1中各宏块的量化步长都小于于L2集合中的宏块的量化步长，L2中各宏块的量化步长都小于于L3集合中的宏块的量化步长，L3中各宏块的量化步长都小于于L4集合中的宏块的量化步长。

需要说明的是，以上实施例中，根据显示清晰度的要求，将视频帧划分出了4个层次的区域并相应将该帧中的宏块划分为4个集合，通过对不同集合的宏块采用不同的量化步长进行编码处理，从而达到视频图像从清晰度要求高的区域到清晰度要求低的区域进行清晰度渐变的显示效果。但本发明实施例并不仅限制为划分4个层次的区域，比如，为了提高渐变的效果，可设置更多层次的区域；或者，由于视频编码器运算能力的限制，可设置至少3个层次的区域，即包括表情区域、脸部区域中除表情区域以外的区域、非脸部区域。在实际应用中，可权衡视频帧的显示效果以及视频编码器的运算能力选择适合的区域层次划分方式。

还需要说明的是，上述实施例描述的是H.264协议下的视频编码处理过程，但本发明实施例并不仅限于在H.264协议下应用，对于遵守其他视频编码协议的视频编码处理过程，同样可使用本发明实施例所提供的技术方案，此时为适合其他视频编码协议的规定，上述实施例中涉及到的一些参数，如编码宏块大小，可适当调整。

综上所述，本发明实施例所提出的基于感兴趣区域(对于网络视频应用，感兴趣的区域通常为脸部区域以及脸部区域中的表情区域，但不排除将其他区域作为感兴趣的区域的可能性)的视频编码优化方法，在典型的视频互动系统中，以肤色检测算法为基础检测出候选的脸部感兴趣区域，再根据眼睛和口特征的定位来去掉不属于脸部的区域(如手臂等)，以眼睛及口的位置组成的矩形所包含的宏块集合为核心感兴趣区域，定义其周围邻域中的宏块集合为次要感兴趣区域，最后，针对核心感兴趣区域和次要感兴趣区域，调整相应的码率控制算法，以使得感兴趣区域的编码质量更高，同时，核心和次要感兴趣区域的使用使得感兴趣区域与背景区域之间完成渐变，不会出现因编码比特数变化过大而造成感兴趣区域和背景区域的画面质量脱节现象。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

Claims

1.一种视频帧处理方法，其特征在于，包括以下步骤：

2.如权利要求1所述的视频帧处理方法，其特征在于，为所述视频帧中的各编码宏块设置量化步长，包括：

将所述视频帧中的编码宏块至少划分为以下宏块集合：有像素落入所述第一区域内的编码宏块所组成的第一宏块集合、有像素落入前景区域内但不属于所述第一宏块集合的编码宏块所组成的第二宏块集合、有像素落入前景区域外但与所述第二宏块集合中的编码宏块相邻近的编码宏块所组成的第三宏块集合，以及由所述视频帧中其余的编码宏块所组成的第四宏块集合；

分别为各宏块集合设置对应的量化步长，使各宏块集合对应的量化步长按照从第一到第四宏块集合的顺序依次递增，并使根据设置的量化步长得到的编码后的码率不超出为所述视频帧预先分配的码率。

3.如权利要求2所述的视频帧处理方法，其特征在于，确定出第一宏块集合后，还包括：

计算第一宏块集合中编码宏块的像素点总数量与所述视频帧像素点总数量的比值；

分别为各宏块集合设置对应的量化步长，具体为：

当所述比值低于设定阈值时，分别为各宏块集合设置对应的量化步长。

4.如权利要求2或3所述的视频帧处理方法，其特征在于，分别为各宏块集合设置对应的量化步长，具体为：

在为所述视频帧预分配的量化步长QP0上减去大于零的第一量化步长增量，得到第一宏块集合对应的量化步长；

在QP0上减去数值小于第一量化步长增量但大于零的第二量化步长增量，得到第二宏块集合对应的量化步长；

将第三宏块集合对应的量化步长设为QP0；

根据设置的量化步长计算第一、第二、第三宏块集合中的编码宏块编码后的码率，从为所述视频帧预先分配的码率中减去该计算出的码率，根据得到的码率差值预测出第四宏块集合所对应的量化步长。

5.如权利要求2所述的视频帧处理方法，其特征在于，有像素落入第一区域外但与所述第二宏块集合中的编码宏块相邻近的编码宏块是指：以第二宏块集合中位于所在区域最外围的编码宏块为基础，向外扩展得到的一圈编码宏块。

6.如权利要求1所述的视频帧处理方法，其特征在于，所述前景区域为脸部区域，所述第一区域为脸部区域中包括眼睛和口的矩形区域。

7.一种视频编码器，其特征在于，包括：

前景识别模块，用于识别出视频帧中的前景区域；

区域划分模块，用于定位出所述前景区域内的第一区域；

8.如权利要求7所述的视频编码器，其特征在于，所述量化步长设置模块，包括：

宏块分集子模块，用于将所述视频帧中的编码宏块至少划分为以下宏块集合：有像素落入所述第一区域内的编码宏块所组成的第一宏块集合、有像素落入前景区域内但不属于所述第一宏块集合的编码宏块所组成的第二宏块集合、有像素落入前景区域外但与所述第二宏块集合中的编码宏块相邻近的编码宏块所组成的第三宏块集合，以及由所述视频帧中其余的编码宏块所组成的第四宏块集合；

量化步长设置子模块，用于分别为各宏块集合设置对应的量化步长，使各宏块集合对应的量化步长按照从第一到第四宏块集合的顺序依次递增，并使根据设置的量化步长得到的编码后的码率不超出为所述视频帧预先分配的码率。

9.如权利要求8所述的视频编码器，其特征在于，所述宏块分集子模块在划分出第一宏块集合后，进一步用于，计算第一宏块集合中编码宏块的像素点总数量与所述视频帧像素点总数量的比值；

所述量化步长设置子模块进一步用于，当所述比值低于设定阈值时，分别为各宏块集合设置对应的量化步长。

10.如权利要求8或9所述的视频编码器，其特征在于，所述量化步长设置子模块分别为各宏块集合设置对应的量化步长时：

将第三宏块集合对应的量化步长设为QP0；

11.如权利要求7所述的视频编码器，其特征在于，所述前景识别模块识别出的前景区域为脸部区域，所述区域划分模块定位出的第一区域为前景区域中包括眼睛和口的矩形区域。