CN1245841C

CN1245841C - 固定影像品质的视频压缩位率控制装置

Info

Publication number: CN1245841C
Application number: CN 03153184
Authority: CN
Inventors: 张永清; 陈家杰; 王登楷
Original assignee: Silicon Integrated Systems Corp
Current assignee: Silicon Integrated Systems Corp
Priority date: 2003-08-08
Filing date: 2003-08-08
Publication date: 2006-03-15
Anticipated expiration: 2023-08-08
Also published as: CN1581976A

Abstract

本发明是关于一种固定影像品质的视频压缩位率控制装置。根据本发明，先计算一组连续画面中即将被编码的目前画面的全部活动量，然后基于全部活动量以及该组连续画面中同型态的先前编码画面其活动量对复杂度之比，估计目前画面的复杂度，并且以此复杂度更新该组连续画面的瞬间复杂度和计算其瞬间位率，而根据画面复杂度、该组连续画面的瞬间复杂度及瞬间位率，分配目标位额度给目前画面。在画面编码之后，根据目前画面的全部活动量、实际消耗位数和实际所用量化步长的平均值，计算其活动量对复杂度之比。

Description

固定影像品质的视频压缩位率控制装置

技术领域

本发明涉及一种关于数据压缩的领域，特别是指一种适用于视频编码系统以执行可变位率控制的装置。

背景技术

众所周知，电子通讯世界正经历一次数字革命，以数字表示信息的主要优点在于能够几近无误地储存、再生、传收、处理及运用的数据位流(bitstream)。举例而言，NTSC的彩色视频影像每秒有29.97张画面，每张画面约480条可见扫瞄线，每条扫瞄线约需480点以红、绿、蓝三色呈现的像素(pixel)，但若每种色彩成分以8位编码，则所产生的位率(bitrate)每秒约168兆位(Mbits/s)，故各种视频格式其未经压缩处理的位率非常高而不经济，因此不适于多数的应用。

与计算机、电信网络、消费性产品整合的数字音频和视频，更加刺激信息革命的前进，而这革命的核心则是视、音频的数字压缩技术。许多的压缩标准，包含以压缩技术共通的精髓为基础的算法，如：ITU-T(前身是CCITT)建议书H.261和H.263，以及ISO/IEC的MPEG-1、MPEG-2和MPEG-4标准。MPEG的算法是由动态影像专家群组(Moving Picture Experts Group，MPEG)所发展出来，该动态影像专家群组是国际标准组织(International StandardsOrganization，ISO)及国际电子技术委员会(International ElectrotechnicalCommission，IEC)的联合技术委员会，致力于发展视、音频的压缩及多路传输的表现方式，这些标准规定了压缩位流的语法(syntax)以及解码的方法，但对于编码器所使用的算法而言，却为编码的新颖性与多样性保留了相当多的自由度。

根据MPEG，一连串的视频画面(picture)分成一序列的画面群组(group ofpicture，GOP)，其中每组GOP以I-画面开始，后面跟着P-画面和B-画面的安排，图1以显示的顺序说明一组典型的GOP。I-画面的编码毋须参考先前或将来的画面，P-画面则参考连串的视频画面中在时间上最接近的I-画面或P-画面来进行编码，而B-画面散布于I-画面和P-画面之间。并且利用先前的、将来的或两者兼具的紧邻I-画面和P-画面来编码。虽然好几张B-画面可以紧接着连续出现，但绝不能以B-画面预估其它的画面。

每张画面具有三种成分：亮度值(luminance，以Y表示)，红色差值(redcolor difference，以Cr表示)，以及蓝色差值(blue color difference，以Cb表示)。对于MPEG的4:2:0的格式而言，每一种Cr和Cb成分的取样点在水平与垂直方向只有Y成分的一半。请参阅图2，一张MPEG的画面其基本构成方块是大区块(macroblock，以MB表示)。以4:2:0的视频为例，每个MB包含一个Y成分16×16取样点的阵列，以及两个Cr和Cb成分8×8取样点的区块，其中Y成分16×16取样点的阵列实际上由4个8×8取样点的区块所组成。

编码器的作用在于决定何种画面编码型态以及何种预测模式为最佳。对每张I-画面，MB中的每个8×8方块均经过离散余弦转换(discrete cosinetransform，DCT)而形成8×8转换系数阵列，转换系数接着以一量化矩阵进行量化，然后用Z字形(zig-zag)扫瞄DCT系数的量化结果而得到一连串的DCT系数，并且此DCT系数序列以可变长度码(variable length code，VLC)进行编码。P-画面必须决定将每个MB以I型MB或P型MB进行编码，I型MB的编码以上述的方式进行，而对于每个P型MB，则需得到该MB以先前画面所做的预测，此预测是由一种移动向量(motion vector)获得，移动向量象征着目前画面中即将编码的MB及其在先前画面中的预估MB之间的变动，预估MB与目前MB间的预测误差则以DCT、量化、Z字形扫瞄以及VLC进行编码。

处理B-画面时，必须决定以下列何种MB模式来编码每个MB：I模式、F模式、B模式以及FB模式。I模式是以MB本身而不借助移动补偿来编码(如I型MB一般)；F模式为单向的向前预测编码，是以先前画面得到移动补偿的预估(如P型MB一般)；反之，B模式为单向的向后预测编码，是以后来的画面得到移动补偿的预估。特别是FB模式，为双向的预测编码，运用向前的和向后的移动补偿预估两者来做内插(interpolation)而得到FB模式的移动补偿预估。对F、B和FB模式而言，预测误差可以使用DCT、量化、Z字形扫瞄以及VLC进行编码。

视频编码器必须为整张画面选取量化步长以便在给定的位率下控制可见的失真，然而，以选取的量化步长编码一张画面所用的实际位数，必然是在真正编码之后才会得知，现实中并不存在一个逆转函数，能够在给定希望达到的量化步长下，事先决定一张画面所用的实际位数。编码器很重要的一点即为位率的控制。MPEG中重要的视频编码器限制：即每张画面所用位数变化的限制，特别是在固定位率运作的情形，这种限制是透过视频缓冲器检验(Video BufferVerifier，VBV)来施行。若对于每张画面而言，VBV的输入数据速率均相同，则视频可说是以固定位率(Constant Bitrate，CBR)编码；否则即为可变位率(Variable Bitrate，VBR)编码。VBV乃一种虚拟缓冲器并且是在解码器端的输入缓冲器模型，以固定位率而言，编码器分配给一张画面的位额度须使VBV缓冲器不会满溢或匮乏；而对可变位率，编码过的位流则是以特定的最大位率进入VBV缓冲器直到其饱和、直到再没有多的位输入为止，这可解释为进入VBV缓冲器的位率实际上是可变的且能达到上述的最大位率。以可变位率而言，则只要防止VBV匮乏即可。

可变位率控制的目的是尽可能的提高解码后视频的品质而还能维持输出位率在允许的范围内。和固定位率的方式不同，可变位率拥有较大的弹性来分配额外的位数给景物较复杂、变动较剧烈的画面，这种弹性可使重建的画面之间达到平均一致、流畅稳定的视觉品质。对于某些应用，例如数字电影，平稳的画面品质是最先考虑的，优于其它固定频宽的要求，这类的应用就该利用可变位率且固定影像品质的位率控制机制。不过，传统的位率控制方法却相当复杂，通常需进行好几次才能完成视频编码的处理。

由此可见，上述现有的视频位率控制装置仍存在有诸多的缺陷，而亟待加以进一步改进。

为了解决视频位率控制装置存在的问题，开发一种新颖的固定影像品质位率控制技术，可用于单次、实时的视频编码器，同时能提供一种适合施行于集成电路、以画面层级为基础的固定影像品质位率控制装置相关厂商莫不费尽心思来谋求解决之道，但长久以来一直未见适用的设计被发展完成，而一般产品又没有适切的结构能够解决上述问题，此显然是相关业者急欲解决的问题。

有鉴于上述现有的视频位率控制装置存在的缺陷，本发明人基于丰富的实务经验及专业知识，积极加以研究创新，经过不断的研究、设计，并经反复试作样品及改进后，终于创设出确具实用价值的本发明。

发明内容

本发明的主要目的在于，克服上述现有的视频位率控制装置存在的缺陷，而提供一种新型结构的视频压缩位率控制装置，所要解决的主要技术问题是使其每一张画面其目标位的分配，是基于先前画面的编码结果和对即将被编码的目前画面其预先分析的活动量，通过对目前画面的预先分析的活动量以及先前编码画面的实际复杂度的分析，估计出目前画面的复杂度，可以更精确地分配目标位额度给每张画面，以达到视频序列中不同画面之间稳定的视觉品质。

本发明的目的及解决其主要技术问题是采用以下的技术方案来实现的。依据本发明提出的一种固定影像品质的视频压缩位率控制装置，至少包含：一移动估算单元，接收一视频序列里的一组连续画面中即将被编码的一目前画面，以计算该目前画面的一全部活动量；一复杂度估计器，基于该目前画面的该全部活动量以及该组连续画面中一同型态的先前编码画面其活动量对复杂度之比，用来估计该目前画面的一复杂度；一目标位分派器，以该目前画面的该复杂度更新该组连续画面的一瞬间复杂度，并且基于该组连续画面的一既定参考位率、一参考复杂度及该瞬间复杂度来计算该组连续画面的一瞬间位率，而根据该目前画面的该复杂度、该组连续画面的该瞬间复杂度及该瞬间位率，分配一目标位额度给该目前画面；以及一参数更新器，根据该目前画面的该全部活动量、该目前画面的一实际消耗位数和编码该目前画面实际所用量化步长的平均值，计算该目前画面其活动量对复杂度之比；其中，该目前画面的该活动量对复杂度之比与该目前画面的该全部活动量成正比，而与该目前画面的该实际消耗位数以及该目前画面实际所用量化步长的该平均值成反比。

本发明还揭露一种目标位分派器，包括一瞬间位率计算器、一配额计算器以及一限度单元。瞬间位率计算器接收视频序列所包含的一组连续画面中即将被编码的目前画面的复杂度，且以该复杂度为基础，来更新此组连续画面的瞬间复杂度，并根据一函数来计算这组连续画面的瞬间位率，其中该函数取决于该组连续画面的既定参考位率、参考复杂度及瞬间复杂度。配额计算器则以目前画面的复杂度、这组连续画面的瞬间位率及瞬间复杂度为基础，将目标位额度分配给目前画面，而限度单元则用来将此目标位额度限制在既定的上限之下。

本发明的目的及解决其技术问题还可以采用以下的技术措施来进一步实现。

前述的视频压缩位率控制装置，至少包含一影像编码器，依上述目前画面的上述目标位额度而决定上述目前画面所使用的多个量化步长，所述多个量化步长是作为上述目前画面中的每一空间区域编码之用，该影像编码器根据所述多个量化步长编码上述目前画面，且将上述目前画面的上述实际消耗位数以及上述目前画面实际所用量化步长的上述平均值反馈给上述参数更新器。

前述的视频压缩位率控制装置，其中所述的复杂度估计器所估计得到的上述目前画面的上述复杂度，是依据一方程式：

C_{est} = K \times \frac{A}{ACR}

其中，C_est是上述目前画面预估的上述复杂度，K是一既定的加权值，其范围在0到1之间，A是上述目前画面的上述全部活动量，ACR是上述同型态的先前编码画面其活动量对复杂度之比。

前述的视频压缩位率控制装置，其中所述的参数更新器计算上述目前画面其活动量对复杂度之比，是依据：

ACR = \frac{A}{AQ \times UB}

其中，ACR代表上述目前画面其活动量对复杂度之比，A是上述目前画面的上述全部活动量，AQ是上述目前画面实际所用量化步长的上述平均值，UB是上述目前画面的上述实际消耗位数。

前述的视频压缩位率控制装置，其中所述的目标位分派器为上述一组连续画面中的三种型态：I-画面、P-画面及B-画面分别储存其复杂度C_I、复杂度C_P与复杂度C_B，并且取上述目前画面的上述复杂度来更新所述三种型态中同型态画面的复杂度。

前述的视频压缩位率控制装置，其中所述的目标位分派器至少包含：

一瞬间位率计算器，以上述目前画面的上述复杂度为基础，来更新上述一组连续画面的上述瞬间复杂度，并且根据一函数来计算上述一组连续画面的上述瞬间位率，其中该函数是取决于上述一组连续画面的上述既定参考位率、上述瞬间复杂度及上述参考复杂度；

一配额计算器，以上述目前画面的上述复杂度、上述一组连续画面的上述瞬间位率及上述瞬间复杂度为基础，来分配上述目标位额度；以及

一限度单元，用来将上述目标位额度限制在一既定上限之下。

前述的视频压缩位率控制装置，其中所述的瞬间位率计算器求得的上述一组连续画面的上述瞬间复杂度，是根据：

INST_C＝N_I×C_I+N_P×C_P+N_B×C_B

其中，INST_C代表上述瞬间复杂度，N_I、N_P和N_B分别是上述一组连续画面之中上述I-、P-及B-画面的数目。

前述的视频压缩位率控制装置，其中所述的瞬间位率计算器计算上述一组连续画面的上述瞬间位率，是根据：

INST_R = REF_R \cdot (1 + SF \cdot (\frac{INST_C}{REF_C} - 1))

其中，REF_R是上述一组连续画面的上述既定参考位率，SF是一缩放因子，其范围在0到1之间，INST_C、REF_C分别是上述一组连续画面的上述瞬间复杂度与上述参考复杂度，INST_R代表上述瞬间位率。

前述的视频压缩位率控制装置，其中所述的瞬间位率是限制在上述一组连续画面的一既定最大位率以及一既定最小位率的范围内。

前述的视频压缩位率控制装置，其中所述的一组连续画面的上述参考复杂度如下：

REF_C = REF_R \cdot \frac{N_{I} \cdot P P_{I} \cdot D Q_{I} + N_{P} \cdot P B_{P} \cdot D Q_{P} + N_{B} \cdot P B_{B} \cdot D Q_{B}}{N_{I} \cdot P B_{I} + N_{P} \cdot P B_{P} + N_{B} \cdot P B_{B}}

其中，PB_I、PB_P和PB_B用来规定上述一组连续画面之中上述I-、P-及B-画面间的编码位比例为PB_I∶PB_P∶PB_B，DQ_I、DQ_P和DQ_B分别是上述一组连续画面之中上述I-、P-及B-画面的目标量化步长，N_I、N_P和N_B分别是上述一组连续画面之中上述I-、P-及B-画面的数目。

本发明与现有技术相比具有明显的优点和有益效果。由以上技术方案可知，为了达到前述发明目的，本发明的主要技术内容如下：

关于一种固定影像品质的视频压缩位率控制装置，根据本发明，先计算一组连续画面中即将被编码的目前画面的全部活动量，然后基于全部活动量以及该组连续画面中同型态的先前编码画面其活动量对复杂度之比，估计目前画面的复杂度，并且以此复杂度更新该组连续画面的瞬间复杂度和计算其瞬间位率，而根据画面复杂度、该组连续画面的瞬间复杂度及瞬间位率，分配目标位额度给目前画面。在画面编码之后，根据目前画面的全部活动量、实际消耗位数和实际所用量化步长的平均值，计算其活动量对复杂度之比。

通过以上发明，改变了现有的视频位率控制装置存在的各种视频格式其未经压缩处理的位率非常高而不经济，及传统的位率控制方法相当复杂，通常需进行好几次才能完成视频编码的处理的缺陷，通过对目前画面的预先分析的活动量以及先前编码画面的实际复杂度的分析，估计出目前画面的复杂度，可以更精确地分配目标位额度给每张画面，以达到视频序列中不同画面之间平均一致、流畅稳定的视觉品质。

综上所述，本发明特殊结构的一种固定影像品质的视频压缩位率控制装置，具有上述诸多的优点及实用价值，且在同类产品中均未见有类似的结构设计公开发表或使用，其不论在结构上或功能上皆有较大的改进，且在技术上有较大的进步，并产生了好用及实用的效果，而确实具有增进的功效，从而更加适于实用，诚为一新颖、进步、实用的新设计。

上述说明仅是本发明技术方案的概述，为了能够更清楚了解本发明的技术手段，并可依照说明书的内容予以实施，以下以本发明的较佳实施例并配合附图详细说明如后。

本发明的具体实施方式由以下实施例及其附图详细给出。

附图说明

图1是以显示的顺序呈现典型的画面群组(GOP)；

图2是MPEG的大区块；

图3是本发明的视频压缩位率控制装置其较佳实施例的方块示意图；

图4是本发明的操作流程图；

图5是本发明的目标位分派器的方块示意图。

300、视频压缩位率控制装置 310、移动估算单元

312、信号线 320、复杂度估计器

330、目标位分派器 340、参数更新器

350、影像编码器 510、瞬间位率计算器

520、配额计算器 530、限度单元

P⁽ⁱ⁾、画面 A⁽ⁱ⁾、全部活动量

C_est ⁽ⁱ⁾、预估复杂度 ACR⁽ⁱ⁾、活动量对复杂度之比

EB、超用位量 TB⁽ⁱ⁾、目标位额度

AQ⁽ⁱ⁾、实际所用量化步长之平均值 UB⁽ⁱ⁾、实际消耗位数

CD、编码后的数据 INST_R、瞬间位率

INST_C、瞬间复杂度

具体实施方式

以下结合附图及较佳实施例，对依据本发明提出的一种固定影像品质的视频压缩位率控制装置其具体实施方式、结构、特征及其功效，详细说明如后。

请参阅图1、图2、图3、图4、图5所示，本发明一种固定影像品质的视频压缩位率控制装置，其主要包括：一移动估算单元、一复杂度估计器、一目标位分派器、一参数更新器。

一开始，预测用的I-画面和P-画面必须先在MPEG编码器内解码，利用计算原始画面及解码的画面间的均方根(root mean square)误差，可以得到解码画面其品质的客观量度。以均方根误差作为解码画面的失真度，则解码画面的复杂度(complex)-C定义如下：

C＝r×d

其中，r是编码该画面所需的位率，d是解码的画面的失真度。理论上，平均的量化步长(quantization step size)和失真度之间为一比例关系，故，画面的复杂度可定义成：

C \approx \frac{r \times q}{2}

其中，q是该画面的平均量化步长。在画面编码之后，将可得知位率(实际消耗位数)以及平均量化步长，而该画面的复杂度也因此获得。

画面的复杂度端视画面的本质及其编码的形式而定。先前技术利用最近编码画面的复杂度来表示目前画面的复杂度，并且为I-、P-及B-画面分别保持其复杂度以减轻不同编码形式的影响，倘若视频序列的画面其内容为平顺的变化，则此方式可达到相当不错的效果。然而，由于画面编码的目标位配额与其实际消耗位数之间不相符合，如果视频序列的内容大幅变动，上述方式并不适合用来达成一致的视觉品质。

根据本发明，目前画面的复杂度可以由预先分析目前画面的活动量(activity)以及先前编码画面的实际复杂度之比进行预估。活动量是一种在画面编码后其位率和品质的量度尝试，假设一整张画面的全部活动量A正比于复杂度C，则

A = k \times C \approx \frac{k}{2} \times r \times q = k^{'} \times r \times q

其中，k是比例常数。若k′为活动量对复杂度之比(activity-to-complexity ratio，ACR)，则全部活动量A还可以下列式子表示：

A＝ACR×r×q

根据本发明，可以从相同型态的先前编码画面来预估ACR。观念上，先在编码一张画面前计算其全部活动量A，然后，即将被编码的画面P⁽ⁱ⁾的复杂度C_est ⁽ⁱ⁾以如下方式估算：

C_{est}^{(i)} = \frac{A^{(i)}}{AC R^{(i - 1)}}

其中，A⁽ⁱ⁾是画面P⁽ⁱ⁾的全部活动量，ACR^(i-1)是同型态的先前编码画面其活动量对复杂度之比。以下，在符号或变量中的上标⁽ⁱ⁾表示该符号或变量是与即将被编码的目前画面有关；同理，在符号或变量中的上标^(i-1)则与先前编码画面相关。

估计的复杂度C_est ⁽ⁱ⁾可用来为合适型态的画面更新其复杂度，所以三种型态的画面其复杂度C_I、C_P和C_B将分别储存以利后续的处理。一组连续画面的瞬间复杂度(instantaneous complexity)也以如下方式更新：

INST_C＝N_I×C_I+N_P×C_P+N_B×C_B

其中，N_I、N_P和N_B分别是该组连续画面中I-、P-及B-画面的数目，而且此处所指的一组连续画面至少包含一组GOP。

为达到不同画面间的固定影像品质，同一组连续画面中三种型态I、P和B是以不同的量化步长来进行量化，故将I-、P-及B-画面的目标量化步长分别预设为DQ_I、DQ_P和DQ_B，若指定一个参考位率以及三种画面型态I、P、B之间的编码位比例给一组连续画面，则该组连续画面的参考复杂度，REF_C，如下：

REF_C = REF_R \cdot \frac{N_{I} \cdot P B_{I} \cdot D Q_{I} + N_{P} \cdot P B_{P} \cdot D Q_{P} + N_{P} \cdot P B_{B} \cdot D Q_{B}}{N_{I} \cdot P B_{I} + N_{P} \cdot P B_{P} + N_{B} \cdot P B_{B}}

其中，PB_I、PB_P和PB_B用来规定一组连续画面之中I-、P-及B-画面间的编码位比例为PB_I∶PB_P∶PB_B，而REF_R是这组连续画面的既定参考位率。I-、P-及B-画面间的编码位比例可以是既定的常数或从最近编码的画面计算而得。按照前述的式子，REF_C代表的是以参考位率REF_R和目标量化步长DQ_I、DQ_P及DQ_B编码一组连续画面的参考复杂度，如此，该组连续画面的瞬间位率可由下列式子计算而得：

INST_R = REF_R \cdot (1 + SF \cdot (\frac{INST_C}{REF_C} - 1))

其中，SF是一缩放因子，其范围在0到1之间。利用缩放因子SF可使瞬间位率INST_R随着瞬间复杂度INST_C平顺地变化，这样能在不同的画面间形成较佳的位率分布。倘若一组连续画面的最大、最小位率已根据参考位率事先决定，则其瞬间位率INST_R还须进一步地限制为：ER_min≤INST_R≤ER_max。

一旦瞬间复杂度INSTC和瞬间位率INST_R已经决定，则目前画面P⁽ⁱ⁾的目标位额度TB⁽ⁱ⁾为

T B^{(i)} = \frac{C_{est}^{(i)}}{INST_C} \times INST_R

由上式可知，目标位额度TB⁽ⁱ⁾是与复杂度C_est ⁽ⁱ⁾以及瞬间位率INST_R成正比，而与瞬间复杂度INST_C成反比。所有的MPEG-2数据位流均必须遵循MPEG-2标准的VBV规则，分配的目标额度必须受限以使VBV缓冲器不会满溢(overflow)或匮乏(underflow)。当目前画面的目标位额度决定好之后，便可利用许多不同型态的影像编码器，像是MPEG-2标准描述的测试原型5(Test Model 5)，根据目标位额度来完成画面的压缩。

目前画面在完成编码之后，其实际的复杂度将可得知，而目前画面的全部活动量和实际复杂度之间的关系是，ACR⁽ⁱ⁾可从以下计算得到

AC R^{(i)} = \frac{A^{(i)}}{A Q^{(i)} \times U B^{(i)}}

其中，ACR⁽ⁱ⁾与全部活动量A⁽ⁱ⁾成正比，而与目前画面的实际消耗位数UB⁽ⁱ⁾以及平均量化步长AQ⁽ⁱ⁾成反比。此ACR⁽ⁱ⁾可拿来预估下一张同型态的画面的复杂度。ACR⁽ⁱ⁾可以和ACR^(i-1)做线性结合来避免受到那些富含噪声画面的影响。

本发明的单次(single-pass)视频编码请参阅图3的较佳实施例并配合图4的操作流程图来解释。如图3所示，视频压缩位率控制装置300包括一移动估算单元310、一复杂度估计器320、一目标位分派器330、一参数更新器340以及一影像编码器350。移动估算单元310接收视频序列里的一组连续画面中即将被编码的目前画面P⁽ⁱ⁾，用来在执行移动估算的区块匹配时，计算此目前画面P⁽ⁱ⁾的全部活动量A⁽ⁱ⁾(步骤S410)。基于全部活动量A⁽ⁱ⁾以及这组连续画面中同型态的先前编码画面的ACR^(i-1)，复杂度估计器320可用来估计目前画面的复杂度C_est ⁽ⁱ⁾(步骤S420)。目标位分派器330以预估的复杂度C_est ⁽ⁱ⁾更新本组连续画面其瞬间复杂度INST_C，并且根据既定的参考位率REF_R、参考复杂度REF_C及瞬间复杂度INST_C来计算该组连续画面的瞬间位率INST_R(步骤S430)。

目标位分派器330接着以瞬间位率INST_R、复杂度C_est ⁽ⁱ⁾以及瞬间复杂度INST_C为基础将目标位额度TB⁽ⁱ⁾分配给目前画面P⁽ⁱ⁾(步骤S440)。因此，影像编码器350依目标位额度TB⁽ⁱ⁾而决定目前画面P⁽ⁱ⁾使用的所有量化步长，这些量化步长是作为画面P⁽ⁱ⁾中每一空间区域：大区块(MB)的编码的用。影像编码器350根据这些量化步长编码目前画面P⁽ⁱ⁾(步骤S450)。在目前画面编码完成后，影像编码器350将画面P⁽ⁱ⁾的实际消耗位数UB⁽ⁱ⁾以及实际所用量化步长的平均值AQ⁽ⁱ⁾回报给参数更新器340。然后以全部活动量A⁽ⁱ⁾、实际消耗位数UB⁽ⁱ⁾和实际所用量化步长的平均值AQ⁽ⁱ⁾为基础，参数更新器340为目前画面P⁽ⁱ⁾计算其活动量对复杂度之比ACR⁽ⁱ⁾(步骤S460)。

图3的较佳实施例可考虑以硬件以及/或是软件来实现。根据本发明，移动估算单元310和图3中的其它组件可以管线(pipeline)模式运作，在复杂度估计器320开始计算目前画面的复杂度之前，移动估算单元310必须先完成即将被编码的目前画面其全部活动量的计算以及移动向量的估算，并且，当移动估算单元310为下张画面作准备时，复杂度估计器320和其它组件仍正忙于完成所有与目前画面相关的运作。接下来将详细地描述较佳实施例中的每个组件。

移动估算单元310的主要目的之一为决定用何种预测模式来编码一张画面里的每个MB，如果必要的话，亦进行向前和向后的移动预测，还可从区块匹配运算中提取画面活动量的信息。首先，计算每个MB的自身活动量(intra-activity)，将一个MB中4个8×8亮度值区块的像素强度以Y_m，n，m＝0，...，7，n＝0，...，7来表示，并且每个8×8区块其平均值为 Y，则每个MB的内活动量IntraAct：

IntraAct = Σ_{k = 0}^{3} σ_{k}

其中

σ_{k} = \sqrt{Σ_{m = 0}^{7} Σ_{n = 0}^{7} {(Y_{m, n} - \overset{&OverBar;}{Y})}^{2}}

倘若需要较低的计算复杂度，可以相对 Y的绝对差值代替：

IntraAct = Σ_{k = 0}^{3} Δ_{k}

其中

Δ_{k} = Σ_{m = 0}^{7} Σ_{n = 0}^{7} | Y_{m, n} - \overset{&OverBar;}{Y} |

由于I-画面中的MB仅有一种模式：I模式，因此IntraAct即为I-画面的每个MB的活动量。

如果画面为P-或B-画面，则需进行移动估算。最常使用来发现最佳移动向量的技术是区块匹配。对非自身编码(nonintra coding)而言(如P-和B-画面)，利用将失真标准如变异数或失真绝对值和减至最低，来选择向前、向后、双向的预测或不需移动补偿。一旦P-或B-画面中每个MB的MB模式决定，在每个移动补偿的差值MB中4个8×8区块的变异数也可求得，移动补偿的差值MB是待处理MB和预估MB间像素对像素之差；失真绝对值和通常具有较佳的计算效率，因此可用来取代变异数。将4个8×8区块的变异数或失真绝对值和相加以求得非内编码画面中每个MB的相互活动量(inter-activity)，InterAct，然后把非内编码画面中每个MB的IntraAct及其InterAct拿来作比较，以判断InterAct是否较小，若是，则以InterAct作为该MB的活动量，并以相互模式(inter-mode)编码该MB；否则以IntraAct作为该MB的活动量，并以自身模式(intra-mode)编码该MB。最后，对目前的I-、P-或B-画面，将所有MB的活动量相加而得全部活动量A⁽ⁱ⁾，移动估算单元310再把全部活动量A⁽ⁱ⁾传送给复杂度估计器320以及参数更新器340。

接着，复杂度估计器320为某种型态的目前画面P⁽ⁱ⁾估算其复杂度，且依照三种画面型态，引进加权系数至预估的复杂度C_est ⁽ⁱ⁾因为B-画面绝不能被用来预估其它的画面，故可减少B-画面的加权系数以分配较少的位给B-画面而保留较多的位给I-和P-画面；一般而言，编码I-画面会产生最多的位，因此P-画面的加权系数又小于I-画面的加权系数。复杂度估计器320根据目前画面的型态更新复杂度C_I、C_P或C_B三者其中之一，目前画面P⁽ⁱ⁾的复杂度C_est ⁽ⁱ⁾以如下方式估算：

if(I-画面)

C_{est}^{(i)} = C_{I} = K_{I} \times \frac{A^{(i)}}{AC R_{I}^{(i - 1)}}

else if(P-画面)

C_{est}^{(i)} = C_{P} = K_{P} \times \frac{A^{(i)}}{AC R_{P}^{(i - 1)}}

else if(B-画面)

C_{est}^{(i)} = C_{B} = K_{B} \times \frac{A^{(i)}}{AC R_{B}^{(i - 1)}}

其中，ACR_I ^(i-1)、ACR_P ^(i-1)及ACR_B ^(i-1)是一组连续画面中，I、P和B型态的先前编码画面各自的活动量对复杂度之比。这些ACR_I ^(i-1)、ACR_P ^(i-1)和ACR_B ^(i-1)存放在参数更新器340之中，而复杂度估计器320会为适当型态的先前画面读取对应的活动量对复杂度之比。K_I、K_P及K_B分别是I-、P-和B-画面的加权系数，其范围一般是在0到1.0之间。至于I-画面，较佳实施例可以采用K_I＝1.0。

目标位分派器330可为一组连续画面中的三种型态：I-画面、P-画面及B-画面分别储存其复杂度C_I、复杂度C_P与复杂度C_B。当收到C_est ⁽ⁱ⁾时，视目前画面P⁽ⁱ⁾的型态，每次仅更新复杂度C_I、C_P、C_B三者其中之一，如下：

if(I-画面)

C_{I} = C_{est}^{(i)}

else if(P-画面)

C_{P} = C_{est}^{(i)}

else if(B-画面)

C_{B} = C_{est}^{(i)}

请参阅图5所示的较佳实施例，目标位分派器330是由瞬间位率计算器510、配额计算器520以及限度单元530所组成。瞬间位率计算器510为该组连续画面更新其瞬间复杂度INST_C，如下：

INST_C＝N_I×C_I+N_P×C_P+N_B×C_B

其中，N_I、N_P和N_B分别是一组连续画面中I-、P-及B-画面的数目。除了C_I、C_P和C_B之外，瞬间位率计算器510还存放了其它5个参数：这组连续画面的参考位率REF_R、最大位率ER_max、最小位率ER_min、参考复杂度REF_C以及缩放因子SF。一组连续画面之中I-、P-及B-画面间的编码位比例可以从最近编码的画面来求得，所以，参考复杂度REF_C是为：

REF_C = REF_R \cdot \frac{N_{I} \cdot P B_{I} \cdot D Q_{I} + N_{P} \cdot P B_{P} \cdot D Q_{P} + N_{B} \cdot P B_{B} \cdot D Q_{B}}{N_{I} \cdot P B_{I} + N_{P} \cdot P B_{P} + N_{B} \cdot P B_{B}}

其中，PB_I、PB_P和PB_B用来规定一组连续画面之中I-、P-及B-画面间的编码位比例为PB_I∶PB_P∶PB_B，DQ_I、DQ_P和DQ_B分别是这组连续画面之中I-、P-及B-画面的目标量化步长。一旦决定了瞬间复杂度和参考复杂度，瞬间位率计算器510即可以下列式子计算一组连续画面的瞬间位率INST_R：

INST_R = REF_R \cdot (1 + SF \cdot (\frac{INST_C}{REF_C} - 1))

其中，缩放因子SF的范围设定在0到1之间(例如0.8)，且瞬间位率INST_R最好限制在这组连续画面的最大、最小位率ER_max及ER_min之间。

配额计算器520接着分配目标位额度TBU⁽ⁱ⁾给目前画面P⁽ⁱ⁾，而目标位额度TB⁽ⁱ⁾是根据

T B^{(i)} = \frac{C_{est}^{(i)}}{INST_C} \times INST_R

但是，实际的消耗位数并不会和期望的位额度刚好相等，因此发展一种反馈策略来使画面实际消耗的位数接近于目标位额度，在较佳实施例中，编码至目前为止的超用位量，可由正在编码的目前画面摊还一部份：

TB⁽ⁱ⁾＝TB⁽ⁱ⁾-AR×EB

其中，EB是参数更新器340传来的超用位量，AR则是既定的摊还率，其范围一般是在0.05到0.2之间。按照前面的式子，目标位额度TB⁽ⁱ⁾是与目前画面的复杂度C_est ⁽ⁱ⁾以及一组连续画面的瞬间位率INST_R成正比，而与一组连续画面的瞬间复杂度INSTC成反比。限度单元530则能用来调整目标位额度TB⁽ⁱ⁾以符合VBV规范，因此事先定下了额度的上限(U_bound)及下限(L_bound)。就固定位率(CBR)的操作而言，分配给一张画面的目标位额度须使VBV缓冲器不会满溢或匮乏，所以限度单元530将目标位额度TB⁽ⁱ⁾限制在上、下限范围内：

if(TB⁽ⁱ⁾＞U_bound) then TB⁽ⁱ⁾＝U_bound

if(TB⁽ⁱ⁾＜L_bound) then TB⁽ⁱ⁾＝L_bound

若是可变位率(VBR)，则只要防止VBV匮乏即可，故：

if(TB⁽ⁱ⁾＞U_bound)then TB⁽ⁱ⁾＝U_bound

然后，目标位额度TB⁽ⁱ⁾会被传送到参数更新器340以及影像编码器350。

请参阅图3，影像编码器350透过信号线312从移动估算单元310接收画面数据以及每个MB的移动向量和MB模式。为了尽可能的使画面达到最佳品质，影像编码器350依据目标位额度TB⁽ⁱ⁾来决定目前画面的每个MB编码所用的量化步长，以这些数据为基础，影像编码器350开始对目前画面P⁽ⁱ⁾进行编码且输出编码后的数据CD。在目前画面P⁽ⁱ⁾编码之后，影像编码器350将所用的量化步长做平均并且计算实际消耗位数UB⁽ⁱ⁾，再回报目前画面的UB⁽ⁱ⁾以及实际所用量化步长的平均值AQ⁽ⁱ⁾给参数更新器340。

画面P⁽ⁱ⁾的目标位额度TB⁽ⁱ⁾以及实际消耗位数UB⁽ⁱ⁾间的差距，会由参数更新器340做累计以便在画面P⁽ⁱ⁾编码之后得到超用位量EB：

EB＝EB×(1-AR)+UB⁽ⁱ⁾-TB⁽ⁱ⁾

其中，AR是既定的摊还率。因此，活动量和实际复杂度之间的关系是，ACR⁽ⁱ⁾，可从以下计算得到

AC R^{(i)} = \frac{A^{(i)}}{A Q^{(i)} \times U B^{(i)}}

这个刚编码完成画面P⁽ⁱ⁾所属的ACR⁽ⁱ⁾可用来预估下一张同型态画面的复杂度。为使ACR⁽ⁱ⁾不会受到富含噪声画面的影响，较佳实施例利用了ACR⁽ⁱ⁾和ACR^(i-1)的线性组合，例如：

if(I-画面)

AC R_{I}^{(i)} = AC R_{I}^{(i - 1)} \times (1 - CW) + AC R^{(i)} \times CW

else if(P-画面)

AC R_{P}^{(i)} = AC R_{P}^{(i - 1)} \times (1 - CW) + AC R^{(i)} \times CW

else if(B-画面)

{ACR}_{B}^{(i)} = AC R_{B}^{(i - 1)} \times (1 - CW) + AC R^{(i)} \times CW

其中，CW是线性组合既定的加权系数。更新过的ACRI⁽ⁱ⁾、ACRP⁽ⁱ⁾及ACRB⁽ⁱ⁾会被传送到复杂度估计器320，以便为下一张适当型态的画面估算其复杂度，此外，超用位量EB则送至目标位分派器330作为位分配之用。

以上所述，仅是本发明的较佳实施例而已，并非对本发明作任何形式上的限制，凡是依据本发明的技术实质对以上的实施例所作的任何简单修改、等同变化与修饰，均仍属于本发明技术方案的范围内。

Claims

1.一种固定影像品质的视频压缩位率控制装置，其特征在于至少包含：一移动估算单元，接收一视频序列里的一组连续画面中即将被编码的一目前画面，以计算该目前画面的一全部活动量；

一复杂度估计器，基于该目前画面的该全部活动量以及该组连续画面中一同型态的先前编码画面其活动量对复杂度之比，用来估计该目前画面的一复杂度；

一目标位分派器，以该目前画面的该复杂度更新该组连续画面的一瞬间复杂度，并且基于该组连续画面的一既定参考位率、一参考复杂度及该瞬间复杂度来计算该组连续画面的一瞬间位率，而根据该目前画面的该复杂度、该组连续画面的该瞬间复杂度及该瞬间位率，分配一目标位额度给该目前画面；以及

一参数更新器，根据该目前画面的该全部活动量、该目前画面的一实际消耗位数和编码该目前画面实际所用量化步长的一平均值，计算该目前画面其活动量对复杂度之比；

其中，该目前画面的该活动量对复杂度之比与该目前画面的该全部活动量成正比，而与该目前画面的该实际消耗位数以及该目前画面实际所用量化步长的该平均值成反比。

2、根据权利要求1所述的视频压缩位率控制装置，其特征在于至少包含一影像编码器，依上述目前画面的上述目标位额度而决定上述目前画面所使用的多个量化步长，所述多个量化步长是作为上述目前画面中的每一空间区域编码之用，该影像编码器根据所述多个量化步长编码上述目前画面，且将上述目前画面的上述实际消耗位数以及上述目前画面实际所用量化步长的上述平均值反馈给上述参数更新器。

3、根据权利要求1所述的视频压缩位率控制装置，其特征在于所述的复杂度估计器所估计得到的上述目前画面的上述复杂度，是依据一方程式：

C_{est} = K \times \frac{A}{ACR}

4、根据权利要求2所述的视频压缩位率控制装置，其特征在于所述的参数更新器计算上述目前画面其活动量对复杂度之比，是依据：

ACR = \frac{A}{AQ \times UB}

5、根据权利要求1所述的视频压缩位率控制装置，其特征在于所述的目标位分派器为上述一组连续画面中的三种型态：I-画面、P-画面及B-画面分别储存其复杂度C_I、复杂度C_P与复杂度C_B，并且取上述目前画面的上述复杂度来更新所述三种型态中同型态画面的复杂度。

6、根据权利要求5所述的视频压缩位率控制装置，其特征在于所述的目标位分派器至少包含：

7、根据权利要求6所述的视频压缩位率控制装置，其特征在于所述的瞬间位率计算器求得的上述一组连续画面的上述瞬间复杂度，是根据：

INST_C＝N_I×C_I+N_P×C_P+N_B×C_B

8、根据权利要求6所述的视频压缩位率控制装置，其特征在于所述的瞬间位率计算器计算上述一组连续画面的上述瞬间位率，是根据：

INST_R = REF_R \cdot (1 + SF \cdot (\frac{INST_C}{REF_C} - 1))

9、根据权利要求8所述的视频压缩位率控制装置，其特征在于所述的瞬间位率是限制在上述一组连续画面的一既定最大位率以及一既定最小位率的范围内。

10、根据权利要求8所述的视频压缩位率控制装置，其特征在于所述的一组连续画面的上述参考复杂度如下：

REF_C = REF_R \cdot \frac{N_{I} \cdot P B_{I} \cdot D Q_{I} \cdot {+ N}_{P} {\cdot PB}_{P} \cdot {DQ}_{P} + N_{B} \cdot {PB}_{B} \cdot D Q_{B}}{N_{I} \cdot P B_{I} + N_{P} \cdot {PB}_{P} + N_{B} {\cdot PB}_{B}}

其中，PB_I、PB_P和PB_B用来规定上述一组连续画面之中上述I-、P-及B-画面间的编码位比例为PB_I：PB_P：PB_B，DQ_I、DQ_P和DQ_B分别是上述一组连续画面之中上述I-、P-及B-画面的目标量化步长，N_I、N_P和N_B分别是上述一组连续画面之中上述I-、P-及B-画面的数目。