CN106657855A

CN106657855A - 一种适用于无人机spi接口视频码率控制方法

Info

Publication number: CN106657855A
Application number: CN201611163788.3A
Authority: CN
Inventors: 王健; 张修飞; 辛向龙
Original assignee: Northwestern Polytechnical University
Current assignee: Northwestern Polytechnical University
Priority date: 2016-12-16
Filing date: 2016-12-16
Publication date: 2017-05-10

Abstract

本发明提供了一种适用于无人机SPI接口视频码率控制方法，涉及无人机领域，根据串行外设接口特性以及网络流媒体数据服务端处理机制，在输出端和视频传输复接接口之间划分一块内存作为缓冲区，通过实时调整量化因子、编码器的输入帧率和缓冲区占有率门限来控制输出码率，完成编码控制机制和数据处理缓冲机制，解决视频压缩数据恒定可控问题，满足无线信道预留带宽的目的。

Description

一种适用于无人机SPI接口视频码率控制方法

技术领域

本发明涉及无人机领域，尤其是一种视频码率控制方法。

背景技术

随着无人机在现代战争中应用越来越多，其在战场情报侦察、指挥和控制中也开始发挥重要作用。这些都需要无人机视频处理系统能够提供清晰可靠的视频图像。早期的无人机视频处理系统采用JPEG2000对采集到的视频进行压缩，虽然这种方法已经能够提供不错的图像质量，但缺点是压缩后的视频数据量较大，对带宽有限的无线传输信道造成巨大的压力。我们需要的无人机视频处理系统应能够尽可能以恒定码率输出数据到数据链复接设备，便于与机载任务数据以及其他遥测数据进行复接和处理。

近年来研究人员和技术人员也设计出了一些无人机视频处理系统，但是还没有很好的解决实时性问题和压缩编码数据按照信道带宽要求以恒定速率通过SPI接口传输的问题。由于无人机机载视频处理系统的压缩数据要与机载任务数据以及其他遥测数据进行复接，通过无线信道传输到地面指挥中心进行处理。因此，需要设计缓冲区码率控制机制，使视频处理系统尽可能以恒定码率输出数据到数据链复接设备，便于与机载任务数据以及其他遥测数据进行复接和处理。

发明内容

为了克服现有技术的不足，根据串行外设接口(Serial Peripheral Interface，SPI)接口特性以及网络流媒体数据服务端处理机制，本发明提出了一种适用于无人机SPI接口视频码率控制方法，以实际工程需求为背景，通过分析、研究在输出端和视频传输复接接口之间划分一块内存作为缓冲区，通过实时调整量化因子、编码器的输入帧率和缓冲区占有率门限来控制输出码率，完成编码控制机制和数据处理缓冲机制，解决视频压缩数据恒定可控问题，满足无线信道预留带宽的目的。

本发明的适用于实时应用的无人机SPI接口视频码率控制方法包括了以下步骤：

步骤1：缓冲区正常工作的要求为t时刻缓冲区内已缓存的视频流大小等于0～t时间段内流入缓冲区的视频流总量减去0～t时间段内流出缓冲区的视频流的总量，即满足式(1)

式(1)中，Buffer(t)表示t时刻缓冲区缓存视频数据的总量，Input_rate(t)表示t时刻已编码的视频流入SPI缓冲区的速度，即当前编码器的输出码率，Output_rate(t)表示t时刻视频流出SPI缓冲区的速度，即SPI接口的视频传输速度；

步骤2：根据目标码率计算初始量化参数

根据单位像素的平均目标比特数确定初始量化参数QP₀，其计算公式如下：

其中l1，l2，l3是预定的阈值，l1，l2，l3的设置参数表1：

表1

图像大小	l1	l2	l3
				QCIF	0.1	0.3	0.6
CIF	0.2	0.6	1.2
				大于CIF	0.6	1.4	2.4

表1中CIF为Common Intermediate Format，QCIF为Quarter CommonIntermediate Format，其中CIF和QCIF都是一种通用视频格式，CIF尺寸大小为352×288像素，QCIF尺寸大小为176×144像素；

公式(2)图像中每个像素点所占的比特数bpp由下式确定：

公式(3)中u(n_1,1)表示起始可用信道带宽，n_1，1表示第1个GOP的第1帧，F_r为编码时的帧率，单位为帧/秒，记为fps，width表示图像宽度，height表示图像高度，width和height单位均为像素；

GOP第一帧为I帧，其余均为P帧，对于图像组(Group of Picture，GOP)，起始量化参数由式(4)确定：

其中，表示除第1个I帧之外的第i个GOP的起始量化参数，QP_i-1(1)表示除第1个I帧之外的第(i-1)个GOP的起始量化参数，N_p(i-1)表示第(i-1)个GOP中P帧个数，TotalQPforPPicture(i-1)表示第(i-1)个GOP中所有P帧量化参数之和，N_gop是第i个GOP中的总帧数；

公式(4)的代入公式(5)，与QP_i-1(1)-2相比求出最大值，即可求出迭代后的QP_i(1)：

步骤3：根据目标缓冲区大小，确定当前P帧图像的目标比特数

在第i个GOP的第一个P帧编码完成后，目标缓冲区大小的起始值依照下式确定：

Tbl(n_i,2)＝B_c(n_i,2) (6)

其中Tbl(n_i,2)是第i个GOP的第一个P帧编码完成后，目标缓冲区大小的起始值，B_c(n_i,2)是第i个GOP的第一个P帧编码完成后实际缓冲区大小；

随后的P帧的目标缓冲区大小按照式(7)计算：

其中，Tbl(n_i,2)表示第i个GOP的第一个P帧编码完成后，目标缓冲区大小的起始值；Tbl(n_i,j)表示第i个GOP的第(j-1)个P帧编码完成后，目标缓冲区大小的值；Tbl(n_i,j+1)表示第i个GOP的第j个P帧编码完成后，目标缓冲区大小的值；N_p表示第i个GOP中P帧的总帧数；

第i个GOP的第j个P帧应分配的目标比特数取决于目标缓冲区大小、帧率、可用信道带宽和实际缓冲区大小，计算公式如下：

其中表示第i个GOP的第j个P帧应分配的目标比特数，u(n_i,j)表示第i个GOP的第j个P帧应分配的可用信道带宽，γ是常数，Tbl(n_i,j)表示第i个GOP的第j-1个P帧应分配的目标缓冲区大小，B_c(n_i,j)表示第i个GOP的第j-1个P帧应分配的实际缓冲区大小；

对于第i个GOP开始编码时，分配的比特数由式(9)计算：

其中T_r(n_i,0)表示第i个GOP分配的比特数，u(n_i,1)表示第i个GOP起始可用信道带宽，N_go_p表示第i个GOP中的总帧数，B_c(n_i-1,N_go_p)表示编码完第(i-1)个GOP后虚拟缓冲区实际大小；

根据公式(9)计算剩余可用比特数，当信道带宽随时间变化时，剩余比特数T_r(n_i,j)通过下式计算：

其中T_r(n_i,j)表示第i个GOP的第j个P帧的剩余比特数，T_r(n_i,j-1)表示第i个GOP的第(j-1)个P帧的剩余比特数，u(n_i,j-1)表示第i个GOP的第j-1个P帧应分配的可用信道带宽，A(n_i,j-1)表示第i个GOP的第j-1个P帧实际编码比特数；

当信道带宽恒定时，当前帧的剩余比特数通过下式计算：

T_r(n_i,j)＝T_r(n_i,j-1)-A(n_i,j-1) (11)

有公式(12)：

其中表示第i个GOP的第j个P帧的目标比特数，N_p,r(j-1)表示未编码的第(j-1)个P帧数目，当前P帧图像的目标比特数由和的加权组合计算得到：

其中β是0至1之间的任意常数；

为了满足假想的解码器HRD(Hypothetical Reference Decoder)要求，目标比特数作如下限制：

即L(n_i,j)<f(n_i,j)<U(n_i,j)，其中，f(n_i,j)表示目标比特数，U(n_i,j)和L(n_i,j)分别表示为保证缓冲区既不上溢又不下溢时，编码图像n所产生的比特数的上界和下界，其中，U(n_i,j)为比特数的上界，L(n_i,j)为比特数的下界；

步骤4：确定帧级量化参数QP

P帧量化参数的计算如下：

设定当前帧的量化参数QP_pc，当前帧为I帧或者是紧接I帧之后的第一个P帧时QP_pc＝QP₀；

否则，根据MADP_i＝a₁*MADP_i-1+a₂，a₁，a₂为预测模型的两个参数，初始值分别为a₁＝1，a₂＝0，MADP_i代表当前基本单元相应位置处的MAD，MADP_i-1代表前一帧相应位置处的MAD，用前一帧的实际平均绝对差MAD(Mean Absolute Difference)来预测当前帧的MAD，按照二次率失真模型，计算出当前帧的量化参数QP_pc，为了保证视频质量的连续性，相邻两帧量化参数的差值应不大于2，则量化参数作如下调整：

QP_pc＝min{QP_pp+2,max{QP_pp-2,QP_pc}} (15)

其中QP_pp为前一帧量化参数，由H.264标准可知，量化参数的取值范围为0～51，所有对量化参数作进一步的限制：

QP_pc＝min{51,max{1,QP_pc}} (16)

用式(16)求得的量化参数对当前帧的每个宏块执行率失真优化RDO(RateDistortion Optimized)，得出每个宏块的最佳编码模式，最后对模型参数进行更新；

步骤5：跳帧控制

比特数多少来表示运动复杂度作为跳帧衡量的标准，第i个P帧的运动复杂度C_i用下式来表示：

其中B_p,_i为第i个P帧根据(i-1)帧线性预测所得到的P帧比特数，B_p,_i＝α_iB_i-1，α_i初始值为1，B_i-1为已编码的第(i-1)帧的实际比特数，αi为相邻两帧分配比特的变化因子，B_j(j＝1,2,...,i)是已编帧的实际比特数，同时，在比特数分配完毕后，α_i将进行更新，更新公式为

判定相邻两帧图像是否发生场景切换的方法如下式所示：

其中：T_i为场景切换变化因子，对T_i设定一个阈值ε，阈值ε为0到1的常数；

当T_i＞ε时，判定该帧发生场景切换，由于发生场景切换时编码比特数会发生急增，容易超过缓冲区的上溢阈值ω，当缓冲器上溢，就判定P帧为跳帧，具体步骤如下：

采用GOP的结构为IPPPP...，即图像序列的第一帧为I帧，后面是连续的P帧，设定缓存容量的百分比为ω₁,ω₂,ω₃，且ω₁＜ω₂＜ω₃，同时设定图像的运动复杂度为a，b，c，且满足0<a<b<c<1，a、b和c均为固定值；ω_i为当前编码帧的缓冲区满度；

当ω_i＜ω₁则认为当前帧为静止图像，跳过此帧；

当ω₁＜ω_i＜ω₂时：若C_i＜a，则认为当前帧为静止图像，跳过此帧；若a<C_i＜b，则认为当前帧为运动缓慢图像，跳过此帧，若C_i＞b，则认为当前图像为运动剧烈图像，需要编码当前帧；

当ω₂＜ω_i＜ω₃时：若C_i＜b，则认为当前帧为静止图像，跳过此帧；若b<C_i＜c，则认为当前帧为运动缓慢图像，跳过此帧，若C_i＞c，则认为当前图像为运动剧烈图像，需要编码当前帧；

当ω_i＞ω₃时：若C_i＜c，则认为当前帧为静止图像，跳过此帧；若C_i＞c，则认为当前图像为运动剧烈图像，需要编码当前帧；

同时，当缓冲区满度ω_i超过90％以后，无论C_i的值为多少都将此帧判定为跳帧。

本发明的有益效果是由于采用一种适用于无人机SPI接口视频码率控制方法，在编码器的输出端和视频传输复接接口的之间划分一块内存作为缓冲区，通过实时调整量化因子、编码器的输入帧率和缓冲区占有率门限来控制输出码率，完成了编码控制机制和数据处理缓冲机制，解决了视频压缩数据恒定可控问题，满足无线信道预留带宽。

附图说明

图1为本发明码率控制流程图。

具体实施方式

下面结合附图和实施例对本发明进一步说明。

为了使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解，下面结合具体图示，进一步阐述本发明，为更清楚地表述本发明的内容，首先对一些术语加以说明：

(1)I帧：I帧称为帧内编码帧，I帧是一个能够完全记载这一帧全部图像数据的帧，即可单独解码。

(2)P帧：P帧称为前向预测帧，是根据与前一帧图像的比较，去掉与前帧相似的数据而构成的帧。

(3)GOP：即图像组(Group of Picture)，图像压缩一般是以GOP为一个单元的。一般情况下一个图像组(GOP)由15帧组成，包含I帧和B、P帧等三种编码类型，图像帧编码的顺序为：I PBB PBB…I PBB…，在实时多媒体通信等情况下，一般采用IPPP…IPPP…结构。

选取编码器编码帧率的范围是15～30，本发明为缓冲区设定占有率的门限即缓存容量的取值范围为下限为65％，上限为85％。

为防止缓冲区溢出，应该确保Buffer(t)的值不能超过缓冲区的容量上限。等式(1)中，Output_rate(t)是恒定的，则只能通过调节Input_rate(t)的大小确保缓冲区内t时刻的数据总量不超过缓冲区容量上限使缓冲区正常工作。Input_rate(t)是视频编码器的输出码率，在视频编码器的内部，通过实时调整量化参数、编码器的输入帧率和缓冲区占有率门限来控制输出码率。

步骤2：根据目标码率计算初始量化参数

其中l1，l2，l3是预定的阈值，l1，l2，l3的设置参数表1：

表1

图像大小	l1	l2	l3
				QCIF	0.1	0.3	0.6
CIF	0.2	0.6	1.2
				大于CIF	0.6	1.4	2.4

公式(2)图像中每个像素点所占的比特数bpp由下式确定：

要计算当前P帧的目标比特数，必须首先计算出当前GOP中P帧的目标缓冲区大小，而目标缓冲区大小的设置是根据第一个即时解码更新帧(IDR)和第一个存储帧的编码比特数以及平均图像复杂度来进行的。由于每个GOP的第一个P帧的量化参数已在GOP层码率控制中得到，此处只需要计算每个GOP中其他P帧的目标缓冲区大小。

Tbl(n_i,2)＝B_c(n_i,2) (6)

随后的P帧的目标缓冲区大小按照式(7)计算：

根据线性理论分析，第i个GOP的第j个P帧应分配的目标比特数取决于目标缓冲区大小、帧率、可用信道带宽和实际缓冲区大小，计算公式如下：

对于第i个GOP开始编码时，分配的比特数由式(9)计算：

其中T_r(n_i,0)表示第i个GOP分配的比特数，u(n_i,1)表示第i个GOP起始可用信道带宽，N_gop表示第i个GOP中的总帧数，B_c(n_i-1,N_gop)表示编码完第(i-1)个GOP后虚拟缓冲区实际大小；

当信道带宽恒定时，当前帧的剩余比特数通过下式计算：

T_r(n_i,j)＝T_r(n_i,j-1)-A(n_i,j-1) (11)

有公式(12)：

其中β是0至1之间的任意常数，本发明取为0.9；

步骤4：确定帧级量化参数QP

P帧量化参数的计算如下：

QP_pc＝min{QP_pp+2,max{QP_pp-2,QP_pc}} (15)

QP_pc＝min{51,max{1,QP_pc}} (16)

步骤5：跳帧控制

考虑到MAD值不能很好的表示运动复杂度的问题，并依据比特分布遵循以下的法则：高运动复杂度图像对应高比特数，低运动复杂度图像对应低比特数，以比特数多少来表示运动复杂度作为跳帧衡量的标准，第i个P帧的运动复杂度C_i用下式来表示：

其中B_p,_i为第i个P帧根据(i-1)帧线性预测所得到的P帧比特数，B_p,i＝α_iB_i-1，α_i初始值为1，B_i-1为已编码的第(i-1)帧的实际比特数，αi为相邻两帧分配比特的变化因子，B_j(j＝1,2,...,i)是已编帧的实际比特数，同时，在比特数分配完毕后，α_i进行更新，更新公式为

为了更好地对缓冲区的占有量进行控制，获得高质量的图像质量，将场景切换所带来的编码比特数急增的图像考虑进来，给出的判定相邻两帧图像是否发生场景切换的方法如下式所示：

当T_i＞ε时，就判定该帧发生场景切换，由于发生场景切换时编码比特数会发生急增，容易超过缓冲区的上溢阈值ω，所以为了防止缓冲器上溢，就判定该帧为跳帧。由于相邻两帧的相关性非常强，将场景切换的GOP的第1个P帧跳过，虽然这样做会丢失一些图像细节，导致图像质量略有下降，但是本发明能够更加有效的控制缓冲区的占有量，能够获取更稳定的图像质量。

具体步骤如下：

当ω_i＜ω₁则认为当前帧为静止图像，跳过此帧；

由于I帧和前面几个P帧对于运动补偿的估计比较重要，跳过这些帧容易影响到后面的帧，因此，本发明从第3个P帧，即第4帧开始；而对前3帧的处理方法是：对I帧不采取跳帧，对第1个和第2个P帧只有当缓冲器的占用量达到90％时才跳过。

Claims

1.一种适用于无人机SPI接口视频码率控制方法，其特征在于包括下述步骤：

B u f f e r (t) = {&Integral;}_{0}^{+ \infty} I n p u t_r a t e (t) d t - {&Integral;}_{0}^{+ \infty} O u t p u t_r a t e (t) d t - - - (1)

步骤2：根据目标码率计算初始量化参数

{QP}_{0} = \{\begin{matrix} 33 & b p p < l 1 \\ 29 & l 1 < b p p < l 2 \\ 24 & l 2 < b p p < l 3 \\ 19 & b p p > l 3 \end{matrix} - - - (2)

其中l1，l2，l3是预定的阈值，l1，l2，l3的设置参数表1：

表1

图像大小 l1 l2 l3 QCIF 0.1 0.3 0.6 CIF 0.2 0.6 1.2 大于CIF 0.6 1.4 2.4

表1中CIF为Common Intermediate Format，QCIF为Quarter Common IntermediateFormat，其中CIF和QCIF都是一种通用视频格式，CIF尺寸大小为352×288像素，QCIF尺寸大小为176×144像素；

公式(2)图像中每个像素点所占的比特数bpp由下式确定：

b p p = \frac{u (n_{1, 1})}{F_{r} \times w i d t h \times h e i g h t} - - - (3)

\overset{&OverBar;}{{QP}_{i}} (1) = m i n {{QP}_{i - 1} (1) + 2, \frac{T o t a l Q P f o r P P i c t u r e (i - 1)}{N_{p} (i - 1)} - m i n {2, \frac{N_{g o p}}{15}}} - - - (4)

{QP}_{i} (1) = m a x {{QP}_{i - 1} (1) - 2, \overset{&OverBar;}{{QP}_{i}} (1)} - - - (5)

Tbl(n_i,2)＝B_c(n_i,2) (6)

随后的P帧的目标缓冲区大小按照式(7)计算：

T b l (n_{i, j + 1}) = T b l (n_{i, j}) - \frac{T b l (n_{i, 2})}{N_{p} - 1} - - - (7)

\overset{&OverBar;}{f} (n_{i, j}) = \frac{u (n_{i, j})}{F_{r}} + γ (T b l (n_{i, j}) - B_{c} (n_{i, j})) - - - (8)

对于第i个GOP开始编码时，分配的比特数由式(9)计算：

T_{r} (n_{i, 0}) = \frac{u (n_{i, 1})}{F_{r}} \times N_{g o p} - B_{C} (n_{i - 1}, N_{g o p}) - - - (9)

T_{r} (n_{i, j}) = T_{r} (n_{i, j - 1}) + \frac{u (n_{i, j}) - u (n_{i, j - 1})}{F_{r}} (N_{g o p} - j) - A (n_{i, j - 1}) - - - (10)

当信道带宽恒定时，当前帧的剩余比特数通过下式计算：

T_r(n_i,j)＝T_r(n_i,j-1)-A(n_i,j-1) (11)

有公式(12)：

\hat{f} (n_{i, j}) = \frac{T_{r} (n_{i, j})}{N_{p, r} (j - 1)} - - - (12)

f (n_{i, j}) = β \times \hat{f} (n_{i, j}) + (1 - β) \times \overset{&OverBar;}{f} (n_{i, j}) - - - (13)

其中β是0至1之间的任意常数；

\begin{matrix} f (n_{i, j}) = \max {f (n_{i, j}), L (n_{i, j})} \\ f (n_{i, j}) = \min {f (n_{i, j}), U (n_{i, j})} \end{matrix} - - - (14)

步骤4：确定帧级量化参数QP

P帧量化参数的计算如下：

QP_pc＝min{QP_pp+2,max{QP_pp-2,QP_pc}} (15)

QP_pc＝min{51,max{1,QP_pc}} (16)

用式(16)求得的量化参数对当前帧的每个宏块执行率失真优化RDO(Rate DistortionOptimized)，得出每个宏块的最佳编码模式，最后对模型参数进行更新；

步骤5：跳帧控制

C_{i} = \frac{B_{p, i}}{\frac{1}{i - 1} Σ_{j = 1}^{i - 1} B_{j}} - - - (17)

其中B_p,i为第i个P帧根据(i-1)帧线性预测所得到的P帧比特数，B_p,i＝α_iB_i-1，α_i初始值为1，B_i-1为已编码的第(i-1)帧的实际比特数，α_i为相邻两帧分配比特的变化因子，B_j(j＝1,2,...,i)是已编帧的实际比特数，同时，在比特数分配完毕后，α_i将进行更新，更新公式为

α_{i + 1} = \frac{B_{i}}{B_{i - 1}} \cdot α_{i} - - - (18)

判定相邻两帧图像是否发生场景切换的方法如下式所示：

T_{i} = \frac{B_{p, i} - B_{i - 1}}{B_{i - 1}} - - - (19)

当ω_i＜ω₁则认为当前帧为静止图像，跳过此帧；