CN104077505A

CN104077505A - 一种提高16Kbps码率音频数据压缩编码音质方法

Info

Publication number: CN104077505A
Application number: CN201410338191.2A
Authority: CN
Inventors: 周晓明; 王薇; 归成希; 张燕; 鲍杰
Original assignee: Suzhou BeeLinker Technology Co Ltd
Current assignee: Suzhou BeeLinker Technology Co Ltd
Priority date: 2014-07-16
Filing date: 2014-07-16
Publication date: 2014-10-01

Abstract

本发明公开了一种提高16Kbps码率音频数据压缩编码音质的方法。本方法是在G.726标准的基础上，添加了高码率部分，通过高码率部分和原码率部分的配合工作，旨在16Kbps码率的前提下，解决G.726标准音质较差的问题。本文提出的方法高码率部分采用4bit的量化电平数，可以产生更为准确的预测信号用于重建语音；低码率部分采用2bit的量化电平数，用于保持16Kbps码率的输出。本发明具有占用带宽少，节省存储空间和音质较好的特点，在语音传输和存储领域具有良好的应用前景。

Description

一种提高16Kbps码率音频数据压缩编码音质方法

技术领域

本发明涉及一种16Kbps码率音频数据编码的方法，具体涉及数字多媒体系统中，一种提高16Kbps码率音频数据压缩编码音质的方法。

背景技术

人类交流沟通最基本的方式就是语音，语音可以实现人与人之间的信息交换功能。随着现代信息技术的高速发展，语音信号处理方向中，新的方法和技术也层出不穷。由于数字语音信号的数据量相当大，如果不进行压缩编码，庞大的数据量会给语音信号的传输、存储带来很大的压力，很难达到实用化。因此，语音信号压缩编码技术成为当今多媒体娱乐、数字通信和广播等领域中一项十分关键的共性技术。越来越多的人投入到了语音数据压缩技术的研究中，并逐渐形成了一套国际地区的标准。

早在1972年，国际电报电话咨询委员会CCITT就推出了G.711编码标准。其采样率为8KHz，每个采样值使用8 bit非线性A律或者μ律进行编码，即64Kbps的PCM编码。为了进一步节省带宽，在八十年代初期，CCITT推出了G.721标准，即32Kbps码率ADPCM编码算法。八十年代末，又推出了G.723标准。该标准在G.721标准的基础上，形成了40Kbps、32Kbps和24Kbps码率ADPCM编码算法。1990年，国际电信联盟推出了G.726标准，其结合了G.721标准和G.723标准，并添加了16Kbps码率ADPCM编码算法。G.726标准在数字无绳电话、网络通信等领域得到了广泛的应用。

在无线多媒体传感器网络的应用领域，需要对环境中的音频数据进行采集传输。但由于节点的性能和功耗受到限制，需要数据尽可能的节省带宽和存储空间，即需要使用低码率来实现的同时保持较好的音质。16Kbps码率G.726编码具有占用带宽少，可充分利用系统容量的特点，在数字电路倍增设备中的语音编码传输方面得到了广泛的应用。但是采用G.726标准获得的语音质量不高，有明显的噪声，声音比较尖锐，远远达不到长途电话的音质。因此，提出一种音质较好的16Kbps码率G.726编码方法不仅能够提高通信的质量，而且对通信信道还具备扩容的功能，有一定的实际应用价值。

发明内容

本发明的目的在于，提供一种提高16Kbps码率音频数据压缩编码音质的方法，解决目前16Kbps码率G.726标准算法音质较差的问题。

为了达到上述目的，本方法的技术方案如下：

一种提高16Kbps码率音频数据压缩编码音质的方法，利用相邻语音信号之间幅度的相关性，预测出下一个语音信号样本的输入值；所述方法包括：

步骤1，将原始线性PCM语音信号分别与原码率和高码率部分的预测信号相减，计算出差分信号；

步骤2，使用原码率和高码率部分的自适应量化器，根据步骤1求出的差分信号进行自适应量化，分别求出2 bit和4 bit的量化电平数；一方面将2 bit的ADPCM码作为编码模块的输出，另一方面将量化电平送入逆自适应量化器；

步骤3，使用原码率和高码率部分的逆自适应量化器，根据步骤2求出的量化电平和定标因子，分别进行逆量化，得到量化后的差分信号；

步骤4，使用原码率和高码率部分的重建信号计算器，根据步骤3求出的量化后的差分信号和步骤5求出的预测信号，得出重建信号；

步骤5，使用原码率和高码率部分的自适应预测器，根据步骤3求出的量化后的差分信号和步骤4求出的重建信号，得出预测信号。

优选的，所述自适应量化器包括：LOG，把差分信号从线性域转换到对数域中；SUBTB，通过缩减标度因子给差分信号的对数形式定标；QUAN，量化对数域中的差分信号。

优选的，所述逆自适应量化器，包括：RECONST，在对数域中重建量化差分信号；ADDA，把定标因子加到量化差分信号的对数形式；ANTILOG，把量化差分信号从对数域转换到线性域。

优选的，所述自适应预测器和重建信号计算器，包括六阶零点系统和二阶极点系统，所述六阶零点系统包括：ADDC，用于获得量化差分信号和零点预测信号相加后的符号位；ADDB，根据预测信号和量化差分信号，得出重建信号；FLOATB，将重建信号的二进制补码转换成浮点数，FLOATA，把量化差分信号转换为浮点数，XOR，用来实现差值信号与差值延迟信号符号位的异或，TRIGB，是预测器触发模块：UPB，用来计算出六阶零点的预测器系数：FMULT，用于实现两个浮点数之间的乘法运算；所述二阶极点系统中包括UPA1和UPA2，用于完成二阶极点系数的更新。

优选的，所述乘法器采用分时复用的模式设计。

进一步优选的，所述乘法器的输入端count_FMULT用来进行计数，当计数到3的时候，开始分时复用乘法器，分时复用共8次后，count_FMULT信号变为11，预测信号计算完成。

本发明所述的提高16Kbps码率音频数据压缩编码音质的方法，利用相邻语音信号之间幅度的相关性，预测出下一个语音信号样本的输入值，故本设计中只需要传送实际输入信号样本和预测信号样本之间的差值，采用自适应量化技术对差分信号进行量化，可以减小量化电平数，进而减小传输码率；采用自适应技术动态的调整预测系数，从而保证预测器始终处于最佳预测状态。本方法分成了原码率和高码率两个部分，在G.726标准的基础上，添加高码率部分，将自适应预测器量化电平数改进为4 bit，从而向原码率重建信号计算器提供更准确的预测信号，用于重建语音，从而解决G.726标准音质较差的问题，获得较好的音质；输出来自原码率部分的自适应量化器，采用2 bit的量化电平数，从而保持16Kbps码率的输出；采用分时复用的模式设计乘法器，通过这种方式可以节省带宽，充分利用存储空间和达到长途电话音质的优点，在语音传输和存储领域具有良好的应用前景。

附图说明

图1为本发明所述的16Kbps码率音频数据压缩编码方法的结构框图；

图2为本发明所述的16Kbps码率音频数据压缩编码方法中自适应量化器结构框图；

图3为本发明所述的16Kbps码率音频数据压缩编码方法中逆自适应预测器结构框图；

图4为本发明所述的16Kbps码率音频数据压缩编码方法中自适应预测器和重建信号计算器结构框图；

图5为本发明所述的16Kbps码率音频数据压缩编码方法中乘法器复用的结构图。

具体实施方式

下面结合附图对本发明作进一步的描述。

附图1是一种16Kbps码率音频数据压缩编码方法的结构框图，本方法分成了高码率和低码率两个部分，高码率部分采用4 bit的量化电平产生更为准确的预测信号用于重建语音，而原码率部分采用2 bit的量化电平数，保证16Kbps码率的输出。其中差分信号可以表示为：，

，其中、分别是输入信号和预测信号；

量化电平可以表示为：

，其中，是定标因子，该量化电平一方面作为本方法的输出，另一方面作为逆自适应量化器的输入；

，其中是定标因子，该量化电平一方面作为本方法的输出，另一方面作为逆自适应量化器的输入；

于是，量化后的差分信号可以表示为：

预测信号可以表示为：

其中

上式中，短时平均值可以表示为：

长时平均值可以表示为：

单音检测单元可以表示为：

瞬变音检测单元可以表示为：

重建信号可以表示为：

附图2是一种16Kbps码率音频数据压缩编码方法中自适应量化器结构框图，作用是将差分信号量化成ADPCM码。其中LOG把差分信号从线性域转换到对数域中。首先，计算出、指数和尾数：

然后将4位的指数和7位的尾数合并在一起：

QUAN的功能是量化对数域中的差分信号。

SUBTB通过缩减标度因子给差分信号的对数形式定标。

附图3是一种16Kbps码率音频数据压缩编码方法中逆自适应量化器结构框图，其作用是将自适应量化器的输出进行逆量化，得到量化后的差分信号。ADDA把定标因子加到量化差分信号的对数形式。

ANTILOG把量化差分信号从对数域转换到线性域。首先取的符号位：

然后分别计算4位的指数和7位的尾数，并将指数转换为线性格式：

最后，加上符号位，得到量化后的差分信号：

RECONST是在对数域中重建量化差分信号。

附图4是一种16Kbps码率音频数据压缩编码方法中自适应预测器和重建信号计算器结构框图，其根据输入的量化差分信号，计算出语音信号的预测值。图中上半部分是六阶零点系统，其中ADDC用于获得量化差分信号和零点预测信号相加后的符号位。

再加上符号位扩展：

ADDB根据预测信号和量化差分信号，得出重建信号。

加上符号位的扩展：

FLOATB将重建信号的二进制补码转换成浮点数。首先计算出幅值：

然后计算指数：

最后计算尾数，并将符号位、指数和尾数整合在一起：

FLOATA把量化差分信号转换为浮点数。首先计算幅值：

然后计算指数：

最后计算尾数，并将符号位、指数和尾数整合在一起：

XOR用来实现差值信号与差值延迟信号符号位的异或。

TRIGB是预测器触发模块：

UPB用来计算出六阶零点的预测器系数：

FMULT用于实现两个浮点数之间的乘法运算。

计算指数和尾数：

将浮点格式分为符号位、指数和尾数：

再进行浮点乘法运算：

下半部分的二阶极点系统中，UPA1和UPA2用于完成二阶极点系数的更新。以UPA1为例：

LIMC完成对二阶极点系数的限定。

LIMD用于完成二阶极点系数的限定。

首先计算出上限值：

然后计算出下限值：

ACCUM将预测器输出相加后组成预测信号。

附图5是为一种16Kbps码率音频数据压缩编码方法中乘法器模块设计框图，为了节省面积，本发明将乘法器设计成了分时复用的方式。信号count_FMULT用来进行计数，当计数到3的时候，开始分时复用乘法器，分时复用共8次后，count_FMULT信号变为11，预测信号计算完成。通过这种方式，八个乘法器就可以变成一个。

上述实例只为说明本发明的技术构思及特点，其目的在于让熟悉此项技术的人是能够了解本发明的内容并据以实施，并不能以此限制本发明的保护范围。凡根据本发明精神实质所做的等效变换或修饰，都应涵盖在本发明的保护范围之内。

Claims

1.一种提高16Kbps码率音频数据压缩编码音质的方法，其特征在于，利用相邻语音信号之间幅度的相关性，预测出下一个语音信号样本的输入值；所述方法包括：

2.根据权利要求1所述的提高16Kbps码率音频数据压缩编码音质的方法，其特征在于：所述自适应量化器包括：

LOG，把差分信号从线性域转换到对数域中；

SUBTB，通过缩减标度因子给差分信号的对数形式定标；

QUAN，量化对数域中的差分信号。

3.根据权利要求1所述的提高16Kbps码率音频数据压缩编码音质的方法，其特征在于：所述逆自适应量化器，包括：

RECONST，在对数域中重建量化差分信号；

ADDA、把定标因子加到量化差分信号的对数形式；

ANTILOG，把量化差分信号从对数域转换到线性域。

4.根据权利要求1所述的提高16Kbps码率音频数据压缩编码音质的方法，其特征在于：所述自适应预测器和重建信号计算器，包括六阶零点系统和二阶极点系统，所述六阶零点系统包括：ADDC，用于获得量化差分信号和零点预测信号相加后的符号位；

ADDB，根据预测信号和量化差分信号，得出重建信号；

FLOATB，将重建信号的二进制补码转换成浮点数，

FLOATA，把量化差分信号转换为浮点数，

XOR，用来实现差值信号与差值延迟信号符号位的异或，

TRIGB，是预测器触发模块：

UPB，用来计算出六阶零点的预测器系数：

FMULT，用于实现两个浮点数之间的乘法运算；

所述二阶极点系统中包括UPA1和UPA2，用于完成二阶极点系数的更新。

5.根据权利要求1所述的提高16Kbps码率音频数据压缩编码音质的方法，其特征在于：所述乘法器采用分时复用的模式设计。

6.根据权利要求5所述的提高16Kbps码率音频数据压缩编码音质的方法，其特征在于：所述乘法器的输入端count_FMULT用来进行计数，当计数到3的时候，开始分时复用乘法器，分时复用共8次后，count_FMULT信号变为11，预测信号计算完成。