WO2013143286A1

WO2013143286A1 - 基于多描述视频编码、解码方法、装置及系统

Info

Publication number: WO2013143286A1
Application number: PCT/CN2012/084204
Authority: WO
Inventors: 赵耀; 白慧慧
Original assignee: 北京交通大学
Priority date: 2012-03-30
Filing date: 2012-11-07
Publication date: 2013-10-03
Also published as: CN102630012A; US20150078434A1; CN102630012B; US9538185B2

Abstract

一种基于多描述视频编解码方法、装置和系统编码方法，包括如下步骤：奇数帧偶数帧被分开来产生初始的描述并编码；利用不同描述间的宏块级的相关性产生不同模式的边信息并编码；信道传输。本发明可用于实时视频传输的场合。

Description

基于多描述视频编码、解码方法、装置及系统技术领域

本发明涉及视频编解码技术领域，尤其涉及一种基于多描述视频编码、解码方法、装置及系统。背景技术

近年来，随着因特网的爆炸式发展，视频传输的应用越来越广泛。然而，网络的拥塞、随机比特错误和数据包的丢失可能将导致视频压缩数据质量的严重下降，这就给视频传输带来了极大的挑战。特别是在需要实时视频传输的场合，反馈重传等技术由于延迟往往不能满足实时性需求。因此，急需开发一种视频编解码系统，它不仅要有高的压缩效率还要保证传输的鲁棒性。

多描述编码作为一种能在易错信道上提高传输的鲁棒性的技术，吸引了越来越多学者的研究。可以假设在信源和信宿之间存在着很多的信道，不可能所有的信道同时在一个视频帧出错，多描述编码是在这个假设的基础上提出来的。在编码端信源产生多个比特流 (称之为描述)，每个比特流具有同样的优先级，在多个信道上进行传输。在解码端，每一个描述都能被独立的解码，重建用户可接收质量的视频序列；随着接收到描述数量的增加，重建视频序列的质量也随之提高。本专利主要针对两信道的情况。在通常的两信道的情形下，接收到全部两路描述而产生的失真称为中心失真，接收到某一个描述而产生的失真称为单路失真。

多描述视频编码的基本思想是如何利用描述的冗余信息来提高传输的鲁棒性。因此，在多描述视频编码中需要一些必要的冗余，尽管这样会降低压缩效率。在过去的几年里，设计一个多描述编解码的方案的主要目标是在传输比特率和重建质量之间折中。经典的多描述编码方案是利用变换和量化。根据多描述标量量化的原贝¹ J，在" V. A. Vaishampayan and S. John, "Balanced interframe multiple description video compression," in Proceedings of the IEEE International Conference on Image Processing (ICIP '99), vol. 3, pp. 812—816, Kobe, Japan, October 1999"中设计了多描述视频编码方案。多描述相关性变换在 "A. R. Reibman, H. Jafarkhani, Y. Wang, M. T. Orchard, and R. Puri, "Multiple description coding for video using motion compensated prediction," in Proceedings of the IEEE International Conference on Image Processing (ICIP '99), vol. 3, pp. 837—841, Kobe. Japan, October 1999"中被用来设计运动补偿多描述视频编码。尽管上述方法取得了较好的实验结果，但是这些方案不能兼容与广泛应用的标准编解码器，如 H.26x禾卩 MPEG系列。为了解决这个问题，在" N. Conci and F. G. B. De Natale, "Multiple description video coding using coefficients ordering and interpolation," Signal Processing: Image Communication, vol. 22， no. 3， pp. 252—265, 2007，，中多描述视频编码通过应用 H.264/AVC标准中的先进的视频编码工具来引入描述间的冗余信息。此外，很多方案都是针对于某一种确定的标准编解码器而提出的，如 H.264/AVC。尤其是 "L. Peraldo, E. Baccaglini, E. Magli, G. Olmo, R. Ansari, Y. Yao, "Slice-level rate-distortion optimized multiple description coding for H.264/AVC," IEEE International Conference on Acoustics Speech and Signal Processing (ICASSP ，10), pp. 2330 - 2333, 2010."和" C. Lin, T.Tillo, Y. Zhao, B . Jeon, "Multiple description coding for H.264/AVC With redundancy allocation at macro block level," IEEE Trans, on Circuits and Systems for Video Technology, vol. 21 , No. 5, pp. 589-600, 2011"，为了提高性能，针对 H.264/AVC采用了片级和宏块级的的多描述视频编码方案。发明内容

本发明的目的是提供一种基于多描述视频编码、解码方法、装置及系统，其可解决多描述视频编码的兼容性问题。

为此，根据本发明的第一方面，提供了一种基于多描述视频编码方法，包括如下步骤：

奇数帧偶数帧被分开来产生初始的描述并编码；

利用不同描述间的宏块级的相关性产生不同模式的边信息并编码；信道传输。

优选地，所述奇数帧偶数帧被分开来产生初始的描述并编码，具体为奇偶帧分离，奇偶帧分别利用描述内相关性，采用标准编码算法编码。

优选地，所述标准编码算法为 H.264编码。

优选地，描述内的相关性 /?_into 赖于同一描述内的运动补偿的相关系数，是当前块和它的前一运动补偿块的相关系数，

^Cov(H ) ， ₁是在帧 _k丄中的运动补偿块，如果

Antra (¾ ' ¾-ΐ ) > ^Γ3，则块应用 Skip模式进行编码。

优选地，所述利用不同描述间的宏块级的相关性产生不同模式的边信息并编码，如果是使用奇数帧估计偶数帧，先计算出每一对宏块的相关系数， ¾， *) = ，公式中， ¾是偶数帧 k中的宏块，是估计出来

的帧 k中的宏块，和的协方差是 Cov(A, )，它们的方差依次是， D(Bl )；接下来，根据描述间宏块级相关系数，三种冗余的分配方法如下：

如果 _inte ( , O ，说明相关系数在单路重建中能很好的估计出丢失的偶数帧中的块；这种情况下，不用额外的插入冗余，该模式定义为 Mode l ;

如果7 < ^^0¾, ）≤7，则 MCI很难估计准确的运动矢量，因此，偶数帧中宏块的真实的运动矢量就被当做是重要的边信息，该模式定义为 Mode 2，在此运用双向运动估计在奇数帧中找到运动矢量；

如果 p_inier (B_k，B:)≤T₂，说明有一些很不规则的运动出现，更好的估计需要更多的边信息，在这种情况下，不仅需要 Mode 2中的运动矢量，相应的残差也被当做边信息，该模式定义为 Mode 3 ;

偶数帧估计奇数帧和上述奇数帧估计偶数帧对应。

根据本发明的第二方面，提供了一种基于多描述视频编码装置，包括：奇数帧偶数帧被分开来产生初始的描述并编码模块，用于将视频序列进行奇偶帧分离，奇偶帧分别进行描述内相关性计算然后再进行标准编码；

利用不同描述间的宏块级的相关性产生不同模式的边信息并编码模块，用于通过计算奇偶描述间相关性产生不同模式的边信息编码；

信道模块，用于编码后信号传输。

根据本发明的第三方面，提供了一种基于多描述视频解码方法，如果两个信道都正常工作，两路比特流就能解码成两路视频子序列，然后这两路视频子序列就能重构出中心视频序列；如果只有一个信道正常工作，单路解码器就会根据不同的模式来估计丢失的信息，在 Mode l中，用 MCI的方法能直接重建出丢失的帧，这里所运用的 MCI方法采用双向运动估计的，用 /来表示帧 Λ和帧 ₊₁之间的估计帧，用 5)来表示像素移动位置的运动矢量，为了避免重构图像中的空洞，可以计算出一个初步的重构帧来作为背景，

f(p) = ^ (f_k (p) + f_k p)) ' 而且，前向运动补偿和后向运动补偿分别对应帧

Λ₊₁和帧 Λ，

为了解决 MCI中重叠的问题，重叠像素的平均值被用来作为运动补偿，然后，这个初步的背景将会被 /( ）=^(Λ( - ^MV( )) + ₊₁( + ^MV( ))）得到的像素来代替，在 Mode 2和 Mode 3中，边信息如运动矢量和残差将被用于进一步提高重建的质量。

根据本发明的第四方面，提供了一种基于多描述视频解码装置，包括，标准解码器：用于解码；

利用边信息重构，用于重构出奇偶帧；

帧交织，用于奇偶帧交织。

根据本发明的第五方面，提供了一种基于多描述视频编解码系统，包括基于多描述视频编码装置和基于多描述视频解码装置。

通过描述内和描述间的冗余的有效分配来获得更好的比特率和传输鲁棒性。为了简单起见，在编码端奇数帧偶数帧被分开来产生初始的描述，这能保证和当前的编解码器的兼容性，如 H.26x或者 MPEG系列。然后，利用不同描述间的宏块级的相关性产生不同模式的边信息。在解码端，这些边信息有助于更好地估计丢失信息从而获得较好的解码重建质量。另外，为了保证较高的压缩效率，利用描述内宏块级相关性实现灵活的 Skip模式。附图说明

当结合附图考虑时，通过参照下面的详细描述，能够更完整更好地理解本发明以及容易得知其中许多伴随的优点，但此处所说明的附图用来提供对本发明的进一步理解，构成本发明的一部分，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定，其中：

图 1为根据本发明一个实施例的编码方法流程图；

图 2为根据本发明一个实施例的编码装置框图；

图 3为根据本发明一个实施例的系统框图；图 4a禾卩图 4b为" Mobile.qcif'序列效果图；

图 5a和图 5b为每帧的单路重建效果图；

图 6为" Paris.cif'序列效果图。具体实施方式

以下参照图 1-6对本发明的实施例进行说明。

为使上述目的、特征和优点能够更加明显易懂，下面结合附图和具体实施方式对本发明作进一步详细的说明。实施例 1

如图 1所示，一种基于多描述视频编码方法，包括如下步骤：

51、奇数帧偶数帧被分开来产生初始的描述并编码；

52、利用不同描述间的宏块级的相关性产生不同模式的边信息并编码；

53、信道传输。实施例 2

如图 2所示，一种基于多描述视频编码装置，包括：

奇数帧偶数帧被分开来产生初始的描述并编码模块 1，用于将视频序列进行奇偶帧分离，奇偶帧分别进行描述内相关性计算然后再进行标准编码；

利用不同描述间的宏块级的相关性产生不同模式的边信息并编码模块 2，用于通过计算奇偶描述间相关性产生不同模式的边信息编码；

信道模块 3，用于编码后信号传输。实施例 3

如图 3所示，一种基于多描述视频编解码系统：

第一步，奇偶帧分离

为简单起见，先奇偶帧分离 11，将原始的视频序列分成奇数帧和偶数帧子序列，使得每个子序列具有广泛的兼容性。在这里，两个视频子序列，也就是奇数帧和偶数帧可以被当做原始的描述。而且，原始视频序列能经过多次时域抽样来产生多描述。本专利主要针对两描述的情况。

第二步，边信息的产生

如果只收到奇数帧或者偶数帧，由于错误的估计和块的不规则运动，单路重建失真很严重。因此，为了更好的估计质量，描述间的宏块级相关性 21就会用来产生边信息。在此，以奇数帧为例。任务是在解码端用偶数帧来产生一些有用的边信息。一

首先，根据运动卜偿插值、法 (motion-compensated interpolation, 简称 MCI), 在编码端可以使用奇数帧估计偶数帧。处理过程和单路解码的过程类似。这个 MCI 方法具体将在第五步中说明。估计得到的重建帧的每一个宏块将要和真实的偶数帧对应位置上的宏块作比较。因此，能计算出每一对宏块的相关系数，用公式 (1)即可。

公式中，是偶数帧 &中的宏块，是估计出来的帧 &中的宏块。和的协方差是 O , )，它们的方差依次是 )( )， D(Bl ) o

接下来，根据描述间宏块级相关系数，三种冗余的分配方法如下：如果 _inteC¾, 说明相关系数在单路重建中能很好的估计出丢失的偶数帧中的块；这种情况下，不用额外的插入冗余，该模式定义为 Mode l ;

如果7 < ^^0¾, ）≤7，则 MCI很难估计准确的运动矢量。因此，偶数帧中宏块的真实的运动矢量就被当做是重要的边信息，该模式定义为 Mode 2，在此运用双向运动估计在奇数帧中找到运动矢量。

如果 p_inier (B_k，B:)≤T₂，说明有一些很不规则的运动出现，更好的估计需要更多的边信息。在这种情况下，不仅需要 Mode 2中的运动矢量，相应的残差也被当做边信息，该模式定义为 Mode 3.

边信息也会通过相应的信道被传输。

第三步，灵活的 Skip模式

在第二步中，引入的冗余可能影响压缩效率。因此，每个描述内部的冗余应该被有效的去除掉。本专利中提出了一种灵活的 Skip模式，这样能很好的利用描述内宏块级的相关性 12、 14。描述内的相关性 (标记为/ ?_intra )依赖于同一描述内的运动补偿的相关系数。因此， ^ 是当前块和它的前一运动补偿块的相关系数，

Antra \^Bk , ^Bk-1 ) - / = (²) ^是^在帧^?中的运动补偿块。

> Γ₃，则块 β_λ能应用 Skip模式进行编码。因此，灵活的 Skip 模式能够与描述内的相关系数相适应。相对于固定频率的 Skip模式，自适应的 Skip 模式能较好地保持帧间的时间相关性，如果描述中信息丢失，解码端能获得更好的错误掩盖方法。

第四步：标准编码

用当前标准的编解码器 13、 15每一个视频序列都能够编码成比特流。这里，选择 H.264编码器，很明显提出的方案具有广泛的兼容性。此外，在 Mode 3中出现的残差也能够用 H.264帧内编码进行压缩。

送入信道 31、 32传输。

第五步：解码端的视频重建

这里，要考虑解码的两种情况，即中心解码和单路解码。

先进行标准解码器 41、 42解码，再利用边信息重构 43、 44，及帧交织 51 恢复视频信号。如果两个信道都正常工作，两路比特流就能解码成两路视频子序列，然后这两路视频子序列就能重构出中心视频序列。由于描述内宏块级相关性的存在，自适应的 Skip模式就能抵消一部分冗余边信息的影响。因此，压缩效率不会随着冗余的增加而迅速下降。如果只有一个信道正常工作，单路解码器就会根据不同的模式来估计丢失的信息。在 Mode 1中，用 MCI的方法能直接重建出丢失的帧。这里所运用的 MCI 方法采用双向运动估计的。在重建帧内有可能会导致像素的重叠和空洞。用 /来表示帧 Λ和帧 / ₊₁之间的估计帧，用 5)来表示像素移动位置的运动矢量。为了避免重构图像中的空洞，可以计算出一个初步的重构帧来作为背景。

f(p) = (f_k (P) + f (P)) (3)

而且，前向运动补偿和后向运动补偿分别对应帧 Λ₊₁和帧 Λ。为了解决 MCi 中重叠的问题，重叠像素的平均值被用来作为运动补偿。然后，这个初步的背景将会被 (4)得到的像素来代替。

在 Mode 2和 Mode 3中，边信息如运动矢量和残差将被用于进一步提高重建的质量。实施例 4

两个标准视频序列" Mobile.qcif '和" Paris.cif '被用来测试所提出的系统。为了公平比较，对于所有比较的方案采用同样的实验设置，即在 H.264 JM软件中使用同样的编解码参数设置。并且对于丢失帧采用了同样的 MCI方法。这里的比特率为两路描述总的比特率，单路失真为两个单路解码器的平均 PSNR值。

图 4a禾卩图 4b给出了 "Mobile.qcif，序列在总比特率为 100kbps到 800kbps范围内所提出方案与其他方案的单路及中心重建质量比较。这里传统方案指的是未经过预处理直接进行奇偶帧分离的方案。由于使用了直接的奇偶帧分离，所以传统方案具有较差的单路重建质量，如图 4a所示。另外，参考方案指的是文献' Ή. Bai, Y. Zhao, C. Zhu, A. Wang, "Multiple description video coding using joint frame duplication/interpolation," Computing and Informatics, vol. 29, pp. 1267-1282. 2010"中提出的帧级冗余分配方案，从图 4b可以看到由于采用了帧级冗余分配，参考方案具有较差的中心重建质量。从图 4a和图 4b可以看到所提出方案无论单路重建或是中心重建都取得了较好的质量。这仅仅是考虑了全部视频平均的 PSNR值。实际上，所提出方案在某些帧取得了更多的改进。图 5a和图 5b给出了所提出方案与参考方案在总比特率为 400kbps情况下从 200到 300帧每一帧的 PSNR值。可以看到所提出方案在 290帧所提出方案相比参考方案取得了 10 10dB的增益。

图 6给出了 "Paris.cif '序列在总比特率为 400kbps到 1800kbps范围内的率失真性能. 从实验结果可以看出，所提出的方案相比参考方案单路重建质量有 0.5- 1.7 dB的提高，中心重建质量有 0.5- 1 dB的提高。

虽然以上描述了本发明的具体实施方式，但是，本领域的技术人员应当理解，这些具体实施方式仅是举例说明，本领域的技术人员在不脱离本发明的原理和实质的情况下，可以对上述方法和系统的细节进行各种省略、替换和改变。例如，合并上述方法步骤，从而按照实质相同的方法执行实质相同的功能以实现实质相同的结果则属于本发明的范围。因此，本发明的范围仅由所附权利要求书限定。

Claims

权利要求书

1. 一种基于多描述视频编码方法，其特征在于，包括如下步骤：奇数帧偶数帧被分开来产生初始的描述并编码；利用不同描述间的宏块级的相关性产生不同模式的边信息并编码；信道传输。

2. 如权利要求 1所述的基于多描述视频编码方法，其特征在于：所述奇数帧偶数帧被分开来产生初始的描述并编码，具体为奇偶帧分离，奇偶帧分别利用描述内相关性，采用标准编码算法编码。

3. 如权利要求 2所述的基于多描述视频编码方法，其特征在于：所述标准编码算法为 H.264编码。

4. 权利要求 2所述的基于多描述视频编码方法，其特征在于：描述内的相关性 ?_intra依赖于同一描述内的运动补偿的是当前块和它的前一运动补偿块的相关系数，， ^是在帧 k- i

中的运动补偿块，如果 ?_intra C¾, 则块 β_λ应用 Skip模式进行编码。

5. 如权利要求 1所述的基于多描述视频编码方法，其特征在于：所述利用不同描述间的宏块级的相关性产生不同模式的边信息并编码，如果是使用奇数帧估计偶数帧，先计算出每一对宏块的相关系数， P_iDtei (B_k , B; ) = ，

公式中，是偶数帧 k中的宏块，是估计出来的帧 k中的宏块，和的协方差是 Cov(B_k , B: ) ，它们的方差依次是 ) ( )， D (Bl )；接下来，根据描述间宏块级相关系数，三种冗余的分配方法如下：如果 _interC¾, 说明相关系数在单路重建中能很好的估计出丢失的偶数帧中的块；这种情况下，不用额外的插入冗余，该模式定义为 Mode 1；如果 r₂ < ?_intCT ( , ；)≤7，则 MCI很难估计准确的运动矢量，因此，偶数帧中宏块的真实的运动矢量就被当做是重要的边信息，该模式定义为 Mode 2，在此，运用双向运动估计在奇数帧中找到运动矢量；如果 A_nte 0¾,O≤7 ，说明有一些很不规则的运动出现，更好的估计需要更多的边信息，在这种情况下，不仅需要 Mode 2中的运动矢量，相应的残差也被当做边信息，该模式定义为 Mode 3 ; 偶数帧估计奇数帧和上述奇数帧估计偶数帧对应。

6. 一种基于多描述视频编码装置，其特征在于，包括：奇数帧偶数帧被分开来产生初始的描述并编码模块，用于将视频序列进行奇偶帧分离，奇偶帧分别进行描述内相关性计算然后再进行标准编码；利用不同描述间的宏块级的相关性产生不同模式的边信息并编码模块，用于通过计算奇偶描述间相关性产生不同模式的边信息编码；信道模块，用于编码后信号传输。

7. 一种基于多描述视频解码方法，其特征在于：如果两个信道都正常工作，两路比特流就能解码成两路视频子序列，然后，这两路视频子序列就能重构出中心视频序列；如果只有一个信道正常工作，单路解码器就会根据不同的模式来估计丢失的信息，在 Mode 1中，用 MCI的方法能直接重建出丢失的帧，这里，所运用的 MCi方法采用双向运动估计的，用 /来表示帧 Λ和帧 Λ₊₁之间的估计帧，用来表示像素移动位置的运动矢量，为了避免重构图像中的空洞，可以计算出一个初步的重构帧来作为背景，

f(p)=^(f_k(p) + f_k p)) ' 而且，前向运动补偿和后向运动补偿分别对应帧

Λ₊₁和帧 Λ，

8. 一种基于多描述视频解码装置，其特征在于，包括：标准解码器：用于解码；利用边信息重构，用于重构出奇偶帧；帧交织，用于奇偶帧交织。

9. 一种基于多描述视频编解码系统，其特征在于，包括权利要求 6所述的基于多描述视频编码装置和权利要求 8所述的基于多描述视频解码装置。