CN103165133A

CN103165133A - 一种最大相关系数的优化方法及其装置

Info

Publication number: CN103165133A
Application number: CN2011104153445A
Authority: CN
Inventors: 付宝玲; 高超; 李桂满
Original assignee: Leadcore Technology Co Ltd
Current assignee: Leadcore Technology Co Ltd
Priority date: 2011-12-13
Filing date: 2011-12-13
Publication date: 2013-06-19

Abstract

本发明实施例提供了一种最大相关系数的优化方法及其装置，针对语音压缩中相关系数计算的逐点进行乘累加的过程，本发明的方法包括：将当前子帧的N个采样点与前一帧的N个采样点，或将当前子帧的N个采样点与前一帧和当前帧的N个采样点，或将当前子帧的N个采样点与当前帧的N个采样点，采用隔点进行乘积，并将乘积的结果进行求和，其中N为自然数。本发明实施例是通过降低第一级粗化搜索的每次相关性计算过程中的求值点个数来降低N个采样点范围内的乘累加次数，从而降低运算量，达到性能优化的目的，即在语音质量允许的范围内通过损失一定的粗化搜索的精确度换取运算量较大的下降。

Description

一种最大相关系数的优化方法及其装置

技术领域

本发明涉及语音编解码领域，尤其涉及一种最大相关系数的优化方法及装置。

背景技术

码激励线性预测(CELP)由于其高效的编码效率和其较好的编码质量在窄带语音编码中得到了广泛应用，它利用线性预测提取声道参数，用一个包含许多典型激励矢量的码书作为激励参数，每次编码时都在这个码书中搜索一个矢量作为激励矢量，上述激励矢量包括两部分：一部分来自于过去的激励，即自适应码本；另一部分来自于更新的矢量，即固定码本，将上述激励矢量在码书中的序号编码传到解码端，解码端查表得到上述激励矢量然后通过合成滤波器合成语音。

通过对一些编码算法如增强型全速率(EFR)、自适应多速率(AMR)、国际电信联盟远程通信标准化组织(ITU-T)G729、ITU-T G723.1的研究和计算量统计，发现这些基于码激励线性预测编码(CELP)技术的编码器的运算量主要集中在LP系数到线谱对参数(LSP)系数的转换、自适应码本搜索和固定码本搜索三部分，而仅自适应码本搜索部分计算量就占了整个编码算法的约30％。通过对自适应码本搜索部分的算法进行分析，该部分中常采用了多级查询的方法，如：自适应码本搜索中基音延时搜索过程中应用该方法的基本原理是：首先按照一定的算法或者原则将查询的范围缩小到某一较小的区域内；然后再提高精度，缩小到更小的范围，在这个范围内再确定最终的值。

因为上述多级查询方法采用逐点计算，其运算量较大，这种音频处理的多级查询过程中的逐点计算的较大运算量影响了编解码的效率。

发明内容

本发明实施例提供了一种最大相关系数的优化方法及其装置，可以提高码激励线性预测编码技术的编码器的运算的效率。

本发明实施例提供了一种最大相关系数的优化方法，包括：

将当前子帧的N个采样点与前一帧的N个采样点，或将当前子帧的N个采样点与前一帧和当前帧的N个采样点，或将当前子帧的N个采样点与当前帧的N个采样点，采用隔点进行乘积，并将乘积的结果进行求和，其中N为自然数。

本发明实施例还提供了一种最大相关系数的优化装置，包括：

采样点获取单元，用于获取当前帧和前一帧的采样点；

计算单元，用于将当前子帧的N个采样点与前一帧的N个采样点，或将当前子帧的N个采样点与前一帧和当前帧的N个采样点，或将当前子帧的N个采样点与当前帧的N个采样点，采用隔点进行乘积，并将乘积的结果进行求和，其中N为自然数。

本发明实施例是通过降低第一级粗化搜索的每次相关性计算过程中的求值点个数来降低N个采样点范围内的乘累加次数，从而降低运算量，达到性能优化的目的，即在语音质量允许的范围内通过损失一定的粗化搜索的精确度换取运算量较大的下降。

附图说明

图1为本发明实施例中所提供方法的流程图；

图2为本发明实施例中算法修改前解码输出重构语音信号的时域仿真图；

图3为本发明实施例中算法修改后解码输出重构语音信号的时域仿真图；

图4为本发明实施例中算法修改前解码输出重构语音信号的频域仿真图；

图5为本发明实施例中算法修改后解码输出重构语音信号的频域仿真图。

具体实施方式

下面结合附图，对本发明实施例所提供的一种最大相关系数的优化方法进行详细的介绍。

现有的CELP过程中存在的自适应码本搜索算法的开环基音搜索过程中的第一级的算法公式为(以子帧长度N＝80为例进行说明)：

R (k) = Σ_{n = 0}^{n = 79} S_{w} (n) S_{w} (n - k),

k＝18，......143；(公式一)

将上述公式分解如下：

R(18)＝Sw(0)Sw(-18)+Sw(1)Sw(-17)+......+Sw(79)Sw(61)

R(19)＝Sw(0)Sw(-19)+Sw(1)Sw(-18)+......+Sw(79)Sw(60)

……

R(143)＝Sw(0)Sw(-143)+Sw(1)Sw(-142)+......+Sw(79)Sw(-64)

由公式(一)可见，每次相关性计算为当前子帧的80个采样点与前一帧或当前子帧的80个采样点逐点进行乘积，并将乘积的结果累加，每次计算进行80次乘和79次累加，因此完成全部的相关性计算总运算量为10080次乘和9954次累加。以8k采样率，20ms一帧为例，每帧分为两个子帧，因此每一帧乘累加过程需要加倍，因此现有的算法计算量较大，严重影响了音频编码的速率。

如图1所示，本发明实施例提供的一种最大相关系数的优化方法，包括：

102、将当前子帧的N个采样点与前一帧的N个采样点，或将当前子帧的N个采样点与前一帧和当前帧的N个采样点，或将当前子帧的N个采样点与当前帧的N个采样点，采用隔点进行乘积，

104、并将乘积的结果进行求和，其中N为自然数。

在本发明的一个实施例中，所述N以取80为例进行说明。

其中，前一帧和当前帧的N个采样点是指在前一帧和当前帧中总共提取N个采样点。

在本发明的一个实施例中，如果N取80，则可以将累加次数从80次降低到40次，即每次相关性计算采用隔点乘累加代替原方案中的逐点乘累加的过程，改进后的粗化搜索计算表达式如下：

R (k) = Σ_{n = 0}^{n = 39} S_{w} (2 n) S_{w} (2 n - k),

k＝18，......143；(公式2)

上述公式可以分解如下：

R(18)＝Sw(0)Sw(-18)+Sw(2)Sw(-16)+......+Sw(78)Sw(60)

R(19)＝Sw(0)Sw(-19)+Sw(2)Sw(-17)+......+Sw(78)Sw(59)

……

R(143)＝Sw(0)Sw(-143)+Sw(2)Sw(-141)+......+Sw(78)Sw(-65)

在上述分解式中，Sw后面括号内是正数，表示是当前子帧的采样点，如果是负数，则表示当前子帧之前的子帧的采样点。也就是说，在公式(2)中，Sw(2n)Sw(2n-k)表示采样点的乘积，如果Sw(2n-k)中的2n-k小于0，则Sw(2n)Sw(2n-k)为当前子帧与当前子帧之前的子帧的采样点的乘积，其中，当前子帧之前的子帧既可能也在当前帧中，也可能在前一帧中(由2n-k的具体数值及子帧长度决定)，如果Sw(2n-k)中的2n-k大于或等于0，则Sw(2n)Sw(2n-k)为当前子帧与当前子帧的采样点的乘积。

由公式(2)可见，每次相关性计算为当前子帧的80个采样点与当前子帧之前的子帧或当前子帧的80个采样点隔点进行乘积，并将乘积的结果累加，因此每次相关性计算为40次乘和39次累加，一个子帧的相关性计算完成需要进行5040次乘和4914次累加，较之原算法计算量下降约一半。

本发明实施例提供的方案和现有的方案相比，通过对上述改进前后开环基音搜索算法进行周期(cycles)数测试，结果显示，该段搜索算法运算量减少约50％，编码一帧运算量降低约7％。其仿真效果模拟图如图2至5所示，其中：

图2为本发明实施例中算法修改前解码输出重构语音信号的时域仿真图；图3为本发明实施例中算法修改后解码输出重构语音信号的时域仿真图；图4本发明实施例中算法修改前解码输出重构语音信号的频域仿真图；图5为本发明实施例中算法修改后解码输出重构语音信号的频域仿真图。

由上述解码输出重构语音信号的时域和频域对比上来看，可见，优化前后解码输出语音信号具有极其相似的语音特性。经主观视听，解码重构语音输出质量在优化前后无明显改变，均达到长话质量。

采样点获取单元，用于获取当前帧和前一帧的采样点；

其中，所述N的取值可以为80。

其中，所述计算单元根据公式k＝18，......143，进行隔点乘积，并将乘积的结果进行求和；其中，R(k)表示乘积求和的结果，Sw(2n)Sw(2n-k)表示采样点的乘积。

本发明实施例所提供的装置实施例是和方法完全对应的，在本装置实施例中未详细描述的部分，可以参照装置实施例中的描述。

以上是本发明实施例一个较佳的实施方式而已，任何人在熟悉本领域技术的前提下，在不背离本发明的精神和不超出本发明涉及的技术范围的前提下，可以对本发明描述的细节作各种补充和修改。本发明的保护范围不限于实施例所列举的范围，本发明的保护范围以权利要求为准。

Claims

1.一种最大相关系数的优化方法，其特征在于，包括：

2.如权利要求1所述的方法，其特征在于，所述N的取值为80。

3.如权利要求2所述的方法，其特征在于，所述采用隔点进行乘积，并将乘积的结果进行求和的步骤通过以下公式实现：

R (k) = Σ_{n = 0}^{n = 39} S_{w} (2 n) S_{w} (2 n - k),

k＝18，......143，

其中R(k)表示乘积求和的结果，Sw(2n)Sw(2n-k)表示采样点的乘积。

4.一种最大相关系数的优化装置，其特征在于，包括：

采样点获取单元，用于获取当前帧和前一帧的采样点；

5.如权利要求4所述的装置，其特征在于，所述N的取值为80。

6.如权利要求5所述的装置，其特征在于，所述计算单元根据公式

k＝18，......143，进行隔点乘积，并将乘积的结果进行求和；其中，R(k)表示乘积求和的结果，Sw(2n)Sw(2n-k)表示采样点的乘积。