CN102724511A

CN102724511A - 云转码压缩系统和方法

Info

Publication number: CN102724511A
Application number: CN2012102224506A
Authority: CN
Inventors: 周洲; 柳畅
Original assignee: BEIJING HUAKONG SOFTWARE TECHNOLOGY CO LTD
Current assignee: BEIJING HUAKONG SOFTWARE TECHNOLOGY CO LTD
Priority date: 2012-06-28
Filing date: 2012-06-28
Publication date: 2012-10-10

Abstract

本发明提供一种云转码压缩系统，该系统的编解码模块由ICT及量化模块、帧内预测模块、熵编码模块、帧存模块、运动补偿模块、运动估值模块、环路滤波模块、反ICT及量化模块等8个模块组成，该系统还包括一个预测模式选择开关，用于选择帧内预测或者是帧间预测模式。本发明可使多种格式的音视频在无损画面质量的情况下实现：高度压缩转码、统一格式、降低码率。该方法的高度压缩特性可使用户极大节省存储空间，而统一了格式的音视频文件更加方便用户进行编辑和管理。

Description

云转码压缩系统和方法

技术领域

本发明属于数字音视频编解码领域，特别涉及一种云转码压缩系统（CCS系统）和方法。

背景技术

随着网络多媒体技术不断发展，各地多媒体产业的音视频系统也在不停的加紧建设，包括各类多媒体会议室，视频会议，教育监控平台，政法系统的数字监控、数字审讯、数字庭审系统，医院的手术示教及远程医疗等等行业应用，这些系统在增强信息建设、提高办公效率的同时，也出现了音视频数据存储空间越来越庞大，以及各系统形成多种编码格式（MPEG2/MPEG-4 AVC/H264等），无法统一管理，这为将来的运维管理和内容整合带来困扰。云转码压缩系统的主要创新在于提出了一批具体的优化技术，在较低的复杂度下实现了与国际标准相当的技术性能，但并未使用国际标准背后的大量复杂的专利。

云转码压缩系统采用我国具备自主知识产权的第二代信源编码标准，信源编码技术解决的重点问题是数字音视频海量数据（即初始数据、信源）的编码压缩问题，故也称数字音视频编解码技术。它是其后数字信息传输、存储、播放等环节的前提，因此是数字音视频产业的共性基础标准。云转码压缩所采用的是基于我国创新技术和部分公开技术的自主标准，编码效率比MPEG-2高2-3倍，与AVC相当，而且技术方案简洁，芯片实现复杂度低，达到了第二代标准的最高水平；而且，云转码压缩可以通过简洁的一站式许可政策，解决了AVC专利许可问题死结，是开放式制订的国家、国际标准，易于推广；此外，AVC仅是一个视频编码标准，而云转码压缩的技术标准是一套包含系统、视频、音频、媒体版权管理在内的完整标准体系，为数字音视频产业提供更全面的解决方案。综上所述，云转码压缩技术具备三大特点：即先进性、自主性和开放性。

发明内容：

本发明的目的是能实现多种格式视频的统一编码，降低了视频码率，缩减视频文件存储空间。

为了实现上述目的，本发明提供一种云转码压缩系统，可使多种格式的音视频在无损画面质量的情况下实现高度压缩转码、统一格式以及降低码率，该系统的编码模块由ICT（8x8整数变换）及量化模块（ICT/Q）、帧内预测模块、帧间预测模块，熵编码模块、环路滤波模块、反ICT及量化模块（Q^-1/ICT^-1）等6个模块组成，其中帧间预测模块包括帧存模块、运动补偿模块、运动估值模块，该系统还包括一个预测模式选择开关，用于选择帧内预测或者是帧间预测模式。

进一步地，本发明还提供一种云转码压缩方法，用于上述云转码压缩系统，该方法的编码步骤是1）计算预测残差数据；2）计算帧内或帧间预测数据；3）环路滤波。

本发明可使多种格式的音视频在无损画面质量的情况下实现：高度压缩转码、统一格式、降低码率。该方法的高度压缩特性可使用户极大节省存储空间，而统一了格式的音视频文件更加方便用户进行编辑和管理。

附图说明：

图1为本发明中的典型视频编码框架示意图；

图2为本发明中的优化后云转码压缩系统视频编码器框图；

图3为本发明解码时背景帧更新过程示意图；

图4为本发明解码时帧内预测过程规范图。

具体实施例：

云转码压缩系统的视频采用混合编码框架，如图1所示，包括变换、量化、熵编码、帧内预测、帧间预测、环路滤波等技术模块。

该云转码压缩系统经过优化后，模块数和复杂度降低，在较低的复杂度下实现了与国际标准相当的技术性能，该系统的视频编码器框图如图2所示，编码模块由ICT（8x8整数变换）及量化模块（ICT/Q）、帧内预测模块、帧间预测模块，熵编码模块、环路滤波模块、反ICT及量化模块（Q^-1/ICT^-1）等6个模块组成，其中帧间预测模块包括帧存模块、运动补偿模块、运动估值模块（图2中的方框内表示），S0是预测模式选择开关，用于选择帧内预测或者是帧间预测模式。本发明系统视频标准定义了I帧、P帧和B帧三种不同类型的图像，I帧中的宏块只进行帧内预测，P帧和B帧的宏块则需要进行帧内预测或帧间预测。

在该系统中对预测残差数据进行8×8整数变换（ICT）和量化，然后对量化系数进行zig-zag扫描（隔行编码块使用另一种扫描方式），得到一维排列的量化系数，最后对量化系数进行熵编码，形成比特流。本发明系统视频标准使用环路滤波模块对重建图像滤波，一方面可以消除方块效应，改善重建图像的主观质量；另一方面能够提高编码效率。滤波强度可以自适应调整。

本发明系统支持多种视频业务，考虑到不同业务之间的互操作性，系统中定义了档次（profile）和级别（level）。档次是AVS定义的语法、语义及算法的子集；级别是在某一档次下对语法元素和语法元素参数值的限定集合。为了满足高清晰度/标准清晰度数字电视广播、数字存储媒体等业务的需要，本发明系统视频标准定义了基准档次（Jizhun profile）和4个级别（4.0、4.2、6.0和6.2），支持的最大图像分辨率从720×576到1920×1080，最大比特率从10 Mbit/s到30 Mbit/s。AVS视频标准的变换和量化只需要加减法和移位操作，用16位精度即可完成。

整个编解码的过程主要分为3个部分，分别是计算预测残差数据、计算预测数据（帧内或帧间）和环路滤波。本发明的解码过程是根据解析过程提取出来的信息，进行计算，重构出视频序列里面各个帧的YCbCr分量的值，其中背景帧更新过程示意图如图3所示。

【计算预测残差数据】

在块数据中，用变长码表编码了经过了DCT变换和量化以后的run-level对。解码的过程相应的就是：

A) 利用变长码表，从码流中解析出run-level对；

B) 将run-level对重构成数组QuantCoeffArray；

C) QuantCoeffArray是QuantCoeffMatrix矩阵在编码时通过zig-zag scan得到的。所以接下来要对QuantCoeffArray进行逆扫描，得到QuantCoeffMatrix;

D) 对QuantCoeffMatrix矩阵进行反量化，得到CoeffMatrix;

E) 对CoeffMatrix矩阵进行反DCT变换，得到残差矩阵ResidueMatrix。

【计算帧内预测数据或帧间预测数据】

宏块有两大类预测模式：帧内预测和帧间预测。首先是帧内预测，AVS的帧内预测是以8x8的块为单位进行的。用图4来表示帧内预测的过程：帧内预测有两个步骤：

A) 根据被预测块周围已经解码的块的数据，构造r,c数组的内容；

B) 根据r，c数组的内容以及帧内预测模式，计算出预测样本矩阵PredMatrix的内容。

当前帧内预测块由其上边和左边的参考样本r[i]（i=0～16）和c[i]（i=0～16）来预测（r、c可表示亮度或色度参考样本），其中r[0]等于c[0]。如果帧内预测需要用到i大于16的上边和左边的参考样本，则r[i]=r[16]，c[i]=c[16]，（i>16）。帧内预测完成后得到一个8*8预测样本矩阵predMatrix。

设当前块所属的图像样本矩阵为I，I可表示亮度或色度矩阵。如果某个图像样本所在的块“不存在”或此样本尚未解码，则此样本‘不可用’；反之此样本‘可用’。设当前块左上角样本的坐标是(x0,y0)，其参考样本按以下规则获得：

—— 如果坐标为(x0+i-1, y0-1)（i=1～8）的样本‘可用’，则r[i]等于I[x0+i-1,y0-1]，r[i]‘可用’；否则r[i]‘不可用’；

—— 如果坐标为(x0+i-1, y0-1)（i=9～16）的样本‘可用’，则r[i]等于I[x0+i-1,y0-1] ，r[i]‘可用’；否则r[i]等于r[8], r[i]是否‘可用’由r[8]是否‘可用’决定；

—— 如果坐标为(x0-1, y0+i-1)（i=1～8）的样本‘可用’，则c[i]等于I[x0-1,y0+i-1] ，c[i]‘可用’；否则c[i]‘不可用’；

—— 如果坐标为(x0-1, y0+i-1)（i=9～16）的样本‘可用’，则c[i]等于I[x0-1,y0+i-1] ，c[i]‘可用’；否则c[i]等于c[8] ，c[i]是否‘可用’由c[8]是否‘可用’决定；

—— 如果坐标为(x0-1, y0-1)的样本‘可用’，则r[0]等于I[x0-1,y0-1] , r[0]‘可用’；否则

1) 如果r[1]‘可用’并且c[1]‘不可用’，则r[0]等于r[1]，r[0]‘可用’；否则

2) 如果c[1]‘可用’并且r[1]‘不可用’，则r[0]等于c[1]，r[0]‘可用’；否则r[0]‘不可用’。

在帧间预测的运动矢量和参考索引帧内，预测所需的另一个非常关键的信息就是运动矢量，对运动矢量的编码也使用了差分编码。在码流里面保存了运动矢量的残差。而运动矢量的预测值通过周围的块的相同方向的运动矢量值来进行预测。在运动矢量的预测或导出过程中，图像头里面的picture_distance作用很大。这个域标识了当前帧在视频序列里面是第几帧。通过这个信息，可以模拟物体的直线运动，从而准确的预测或导出运动矢量。

在计算运动矢量的过程中，跳过模式、直接模式、对称模式需要特别处理。运动矢量有两种来源：

a) 直接使用运动矢量预测值；

b) 对于双向预测模式，使用后向参考图像里，与当前块位置对应的那个块的运动矢量来推导当前块的前后向运动矢量。

对于对称模式，码流里面只包含了前向运动矢量的残差值，没有包含后向运动矢量的残差值。于是前向运动矢量可以通过残差值加上预测值得到。后向运动矢量可以通过模拟物体的直线运动，通过前向运动矢量预测出来。以上所说的运动矢量都是亮度块的运动矢量。色度块使用对应的亮度块的运动矢量。

【环路滤波】

环路滤波以宏块为单位。图像中每个宏块的滤波过程如下：对亮度和色度分别做环路滤波，首先从左到右对垂直边界滤波，然后从上到下对水平边界滤波。当前宏块的上边或者左边的样本值可能在以前的宏块环路滤波过程中已经被修改，当前宏块的环路滤波的输入为这些可能被修改的样本值，并且当前宏块环路滤波可能进一步修改这些样本值。当前宏块垂直边界滤波过程中修改的样本值作为水平边界滤波过程的输入。环路滤波可以分做两个步骤：

【1】推导各个块边界的边界强度Bs；

【2】根据边界强度Bs，使用边界两边的6个像素中的某些像素的线性组合来作为滤波后的像素值。如果Bs等于0，则不进行滤波。

本发明基于我国牵头制定的、技术先进的第二代信源编码标准AVS标准，对多种主流格式音视频文件进行解码、压缩、重新编码的操作，实现了多种格式视频的统一编码，降低了视频码率，缩减了视频文件存储空间。

本发明是基于windows平台运行的一种音视频转码压缩方法，可使多种格式的音视频在无损画面质量的情况下实现：高度压缩转码、统一格式、降低码率。该方法的高度压缩特性可使用户极大节省存储空间，而统一了格式的音视频文件更加方便用户进行编辑和管理。通过转码压缩，能够将视频文件码率降低，从而降低用户在带宽租用上的花费。该系统可广泛应用于多媒体会议、监控、数字庭审、视频会议、教育录播等行业的音视频系统。

Claims

1.一种云转码压缩系统，可使多种格式的音视频在无损画面质量的情况下实现高度压缩转码、统一格式以及降低码率，该系统的编码模块由ICT及量化模块、帧内预测模块、帧间预测模块，熵编码模块、环路滤波模块、反ICT及量化模块等6个模块组成，其中帧间预测模块包括帧存模块、运动补偿模块、运动估值模块，其特征在于，该系统还包括一个预测模式选择开关，用于选择帧内预测或者是帧间预测模式。

2. 根据权利要求1所述的压缩系统，其特征在于所述ICT及量化模块对预测

残差数据进行8×8整数变换和量化，然后对量化系数进行zig-zag扫描，得到一维排列的量化系数，最后对所述一维排列的量化系数进行熵编码，形成比特流。

3.根据权利要求1所述的压缩系统，其特征在于，所述帧内预测用于I帧图像中的宏块，P帧和B帧的宏块则进行所述帧内预测或所述帧间预测。

4.根据权利要求1-3之一所述的压缩系统，其特征在于所述帧内预测有两个步骤：

B) 根据所述r，c数组的内容以及帧内预测模式，计算出预测样本矩阵PredMatrix的内容。

5.根据权利要求1所述压缩系统，其特征在于，所述帧间预测所需的运动矢量的预测值通过周围的块的相同方向的运动矢量值来进行预测。

6.根据权利要求1所述压缩系统，其特征在于，所述环路滤波模块进行的滤波可以分做两个步骤：

A) 推导各个块边界的边界强度Bs；

B) 根据边界强度Bs，使用边界两边的6个像素中的某些像素的线性组合来作为滤波后的像素值；如果Bs等于0，则不进行滤波。

7.一种云转码压缩方法，用于如权利要求1-6之一所述的云转码压缩系统，其特征在于，所述方法的编解码步骤是1）计算预测残差数据；2）计算帧内或帧间预测数据；3）环路滤波。