CN109346093B

CN109346093B - 一种低速率声码器子带清浊音参数提取与量化的融合方法

Info

Publication number: CN109346093B
Application number: CN201811541115.6A
Authority: CN
Inventors: 李晔; 张鹏; 张�杰; 宫晓飞
Original assignee: Shandong Computer Science Center
Current assignee: Shandong Computer Science Center
Priority date: 2018-12-17
Filing date: 2018-12-17
Publication date: 2019-09-03
Anticipated expiration: 2038-12-17
Also published as: CN109346093A

Abstract

本公开公开了一种低速率声码器子带清浊音参数提取与量化的融合方法，该方法充分考虑了子带清浊音参数的统计和量化特性，采用在提取过程中不断进行失真比较和候选矢量淘汰的方法，减少需要搜索的候选矢量，尽快锁定目标矢量，进而提前结束分析和搜索过程。可以有效用于2400bps以下的低速率、超低速率语音编码算法中，实现减少低速率声码器算法复杂度、降低系统功耗的目的。

Description

一种低速率声码器子带清浊音参数提取与量化的融合方法

技术领域

本公开属于语音编码中低速率声码器的技术领域，涉及一种低速率声码器子带清浊音参数提取与量化的融合方法。

背景技术

本部分的陈述仅仅是提供了与本公开相关的背景技术信息，不必然构成在先技术。

随着计算机和通信技术的发展，低速率声码器在诸如卫星通信、保密通信、水声通信等领域的嵌入式产品中得到了广泛的应用。在这些应用场景中，为了增加通信容量，声码器的编码速率越来越低，算法越来越复杂，功耗也越来越高。

目前国内外的研究主要集中在2400bps以下速率高质量声码器上，低速率声码器中激励信号的合成非常重要，而多带激励信号合成是目前激励信号合成的重要手段，混合激励线性预测编码算法等均采用了多带激励模型。多带激励信号合成主要依靠于子带清浊音参数，目前低速率声码器中，如图1所示，子带清浊音参数的分析和量化过程如下：

(1)对输入语音信号样点按时间顺序分帧；

(2)每帧语音划分为5个子带，提取子带清浊音参数，表示为：bv₁,bv₂,bv₃,bv₄,bv₅，其中bv_i为BOOL值，1代表浊音，0代表清音；

(3)连续求取N个语音帧的子带清浊音参数，构成超级帧矢量：BV＝[bv_1,1,bv_1,2,bv_1,3,bv_1,4,bv_1,5；...；bv_N,1,bv_N,2,bv_N,3,bv_N,4,bv_N,5]；

(4)对超级帧子带清浊音矢量进行量化，将其量化索引值进行编码传输；

(5)解码端根据索引值搜索码本得到超级帧子带清浊音矢量

(6)根据超级帧子带清浊音矢量得到每个语音帧的子带清浊音参数送入激励信号合成端生成激励信号。

然而，现有的语音端点检测存在如下问题：

上述已有技术中，子带清浊音参数的分析和量化是串行完成的，即先求得所有帧的子带清浊音参数，组成超帧矢量后再进行量化。实际上，随着声码器速率的降低，用来量化各种参数的比特数越来越少，矢量量化的胞腔会越来越大，码本中矢量间的距离会越来越远，尤其是子带清浊音参数，其量化比特数通常是各参数中最少的。

如果能够在分析子带清浊音参数的同时进行量化搜索，并进行失真比较，往往可以提前定位目标矢量，进而提前结束分析和搜索过程。由于上述比较操作与参数的分析过程相比，运算量几乎可以忽略，因而会有效减少算法复杂度，降低系统功耗。而现有技术并未充分考虑或利用到这种子带清浊音参数分析和量化的融合方法，无法有效地减少算法的复杂度和降低系统功耗。

发明内容

针对现有技术中存在的不足，本公开的一个或多个实施例提供了一种低速率声码器子带清浊音参数提取与量化的融合方法，充分利用低速率声码器子带清浊音参数的统计和量化特性，融合其分析和量化过程，采用在分析过程中不断进行失真比较和候选矢量淘汰的方法，尽快锁定目标矢量，进而提前结束分析和搜索过程。有效实现减少低速率声码器算法复杂度、降低系统功耗的目的。

根据本公开的一个或多个实施例的一个方面，提供一种低速率声码器子带清浊音参数提取与量化的融合方法。

一种低速率声码器子带清浊音参数提取与量化的融合方法，该方法包括：

接收输入语音信号，并将其按时间顺序分帧；

将每个语音帧均划分为数量相同的若干子带，提取子带清浊音参数；

N个语音帧组成超级帧，令M为N加1的和除以2后向下取整的数，连续求取M个语音帧的子带清浊音参数，分别计算其与量化码本中候选矢量前M个子带清浊音参数间的失真值；令l＝M+1；

提取第l帧的子带清浊音参数，计算其与量化码本中候选矢量第l个子带清浊音参数间的失真值，用于更新M个语音帧的子带清浊音参数与量化码本中候选矢量前M个子带清浊音参数间的失真值，计算最小失真值，淘汰量化码本中与最小失真值距离大于预设值的其他失真值对应的候选矢量；

当量化码本中剩余候选矢量个数为1或是否已经提取到最后一帧时，将最小失真值对应的候选矢量的索引进行编码传输，否则令l＝l+1，返回上一步继续淘汰候选矢量；

解码端根据索引值搜索量化码本得到超级帧子带清浊音矢量；

根据超级帧子带清浊音矢量，得到每个语音帧的子带清浊音参数，输入激励信号合成端生成激励信号。

进一步地，在该方法中，将输入语音信号按时间顺序分帧，具体步骤包括：

将输入语音信号按8kHz频率进行采样，经过高通滤波去除工频干扰的语音样点，每160个语音样点构成一帧。

进一步地，在该方法中，将每个语音帧均划分为5个子带。

进一步地，在该方法中，按2400b/s混合激励的线性预测语音编码算法提取子带清浊音参数。

进一步地，在该方法中，所述量化码本据训练矢量集得到。

进一步地，在该方法中，将提取第M+1帧的子带清浊音参数与量化码本中候选矢量第M+1个子带清浊音参数间的失真值与M个语音帧的子带清浊音参数与量化码本中候选矢量前M个子带清浊音参数间的失真值求和，用于更新M个语音帧的子带清浊音参数与量化码本中候选矢量前M个子带清浊音参数间的失真值。

进一步地，在该方法中，M个语音帧的子带清浊音参数与量化码本中候选矢量前M个子带清浊音参数间的失真值的个数为量化码本中矢量的候选个数。

进一步地，在该方法中，所述量化码本中矢量的候选个数根据超级帧子带清浊音参数的量化比特数确定。

进一步地，在该方法中，淘汰码本矢量的预设值为子带清浊音参数计算量化失真时各个子带的加权系数之和与N-1的乘积。

进一步地，在该方法中，激励信号合成端生成激励信号的方法为：利用子带清浊音参数，结合基音周期参数、余量谱幅度参数进行激励信号合成。

本公开的有益效果：

本公开所述的一种低速率声码器子带清浊音参数提取与量化的融合方法，对低速率声码器中子带清浊音参数的提取和量化过程进行了融合。原有的技术对子带清浊音参数的提取和量化环节是分别进行的，本公开充分利用子带清浊音参数的统计和量化特性，融合其分析和量化过程，采用在提取过程中不断进行失真比较和候选矢量淘汰的方法，减少需要搜索的候选矢量，尽快锁定目标矢量，进而提前结束分析和搜索过程。本公开可以实现减少低速率声码器算法复杂度、降低系统功耗的目的。本方法可以有效减少低速率声码器算法的复杂度，降低其所嵌入系统的功耗。该方法最适合2400bps以下的低速率及超低速率的声码器算法。

附图说明

构成本申请的一部分的说明书附图用来提供对本申请的进一步理解，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。

图1是根据一个或多个实施例的传统的子带清浊音参数提取与量化流程图；

图2是根据一个或多个实施例的一种低速率声码器子带清浊音参数提取与量化的融合方法流程图。

具体实施方式：

下面将结合本公开的一个或多个实施例中的附图，对本公开的一个或多个实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本公开一部分实施例，而不是全部的实施例。基于本公开的一个或多个实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本公开保护的范围。

应该指出，以下详细说明都是例示性的，旨在对本申请提供进一步的说明。除非另有指明，本实施例使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。

需要注意的是，这里所使用的术语仅是为了描述具体实施方式，而非意图限制根据本申请的示例性实施方式。如在这里所使用的，除非上下文另外明确指出，否则单数形式也意图包括复数形式，此外，还应当理解的是，当在本说明书中使用术语“包含”和/或“包括”时，其指明存在特征、步骤、操作、器件、组件和/或它们的组合。

需要注意的是，附图中的流程图和框图示出了根据本公开的各种实施例的方法和系统的可能实现的体系架构、功能和操作。应当注意，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，所述模块、程序段、或代码的一部分可以包括一个或多个用于实现各个实施例中所规定的逻辑功能的可执行指令。也应当注意，在有些作为备选的实现中，方框中所标注的功能也可以按照不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，或者它们有时也可以按照相反的顺序执行，这取决于所涉及的功能。同样应当注意的是，流程图和/或框图中的每个方框、以及流程图和/或框图中的方框的组合，可以使用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以使用专用硬件与计算机指令的组合来实现。

在不冲突的情况下，本公开中的实施例及实施例中的特征可以相互组合，下面结合附图与实施例对本公开作进一步说明。

本公开的主要目的是充分利用低速率声码器子带清浊音参数的统计和量化特性，融合其分析和量化过程，采用在分析过程中不断进行失真比较和候选矢量淘汰的方法，尽快锁定目标矢量，进而提前结束分析和搜索过程。本公开可以实现减少低速率声码器算法复杂度、降低系统功耗的目的。

下面详细介绍具体技术方案：

步骤(1)：对输入语音信号样点按时间顺序分帧；

在本实施例中，对输入语音信号样点按时间顺序分帧的实施例是按8kHz频率采样、已经过高通滤波去除工频干扰的语音样点。每20ms，也就是160个语音样点构成一帧，但不限于此。

步骤(2)：每帧语音划分为5个子带，提取子带清浊音参数，表示为：bv₁,bv₂,bv₃,bv₄,bv₅；

在本实施例中，按美国政府2400b/s混合激励的线性预测(MELP)语音编码算法标准所描述的方法提取子带清浊音参数。

步骤(3)：N个语音帧组成超级帧，令其中wgt_i为子带清浊音参数计算量化失真时第i个子带的加权系数。

连续求取M个语音帧的子带清浊音参数，分别计算其与量化码本中候选矢量前M个子带清浊音参数间的失真值D_j,j＝1...K，K为量化码本中矢量的个数。令l＝M+1。

在本实施例中，若连续6个语音帧组成一个超级帧，加权系数的取值为wgt＝[16,8,4,2,1]，由此计算得到T＝31。

根据训练集，按帧提取子带清浊音参数，连续N帧子带清浊音参数组成超级矢量，离线训练，得到量化码本。

步骤(4)：提取第l帧的子带清浊音参数，计算其与量化码本中候选矢量第l个子带清浊音参数间的失真值P_j，更新D_j＝D_j+P_j，其中j＝1...K。求取K个失真值D_j中的最小值D_min，比较其他失真值与D_min间的距离D_j,min，若D_j,min>T·(N-l)，则淘汰其对应的码本矢量D_j，在下一轮候选矢量计算中不再考虑该矢量；

在本实施例中，设超帧子带清浊音参数的量化比特数为4，则量化码本尺寸K＝16，其中码本根据所有训练矢量集得到，根据训练矢量集得到码本的方法可以参考杨行峻等人著《语音信号数字处理》pp92-95中所述LBG方法。

步骤(5)：判断码本中剩余候选矢量的个数v，若v＝1或者l＝N，则将D_min所对应的候选矢量的索引进行编码传输，转至步骤(6)；否则，令l＝l+1，转至步骤(4)；

在本实施例中，判断当前剩余的候选矢量个数是否为1，或者是否已经提取到最后一帧，若满足结束条件，将索引值进行编码传输，否则继续下一帧；

步骤(6)：解码端根据索引值搜索码本得到超级帧子带清浊音矢量

在本实施例中，根据索引值，直接从所对应的码本中搜索得到其对应的超帧子带清浊音参数矢量；

步骤(7)：根据超级帧子带清浊音矢量得到每个语音帧的子带清浊音参数送入激励信号合成端生成激励信号。

在本实施例中，按美国政府2400b/s混合激励的线性预测(MELP)语音编码算法标准所描述的方法，利用子带清浊音参数，结合基音周期参数、余量谱幅度参数进行激励信号合成。

本公开充分利用子带清浊音参数的统计和量化特性，融合其分析和量化过程，采用在提取过程中不断进行失真比较和候选矢量淘汰的方法，减少需要搜索的候选矢量，尽快锁定目标矢量，进而提前结束分析和搜索过程。本公开可以实现减少低速率声码器算法复杂度、降低系统功耗的目的。

本公开的有益效果：

以上所述仅为本申请的优选实施例而已，并不用于限制本申请，对于本领域的技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。因此，本公开将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims

1.一种低速率声码器子带清浊音参数提取与量化的融合方法，其特征在于，该方法包括：

接收输入语音信号，并将其按时间顺序分帧；

2.如权利要求1所述的一种低速率声码器子带清浊音参数提取与量化的融合方法，其特征在于，在该方法中，将输入语音信号按时间顺序分帧，具体步骤包括：

3.如权利要求1所述的一种低速率声码器子带清浊音参数提取与量化的融合方法，其特征在于，在该方法中，将每个语音帧均划分为5个子带。

4.如权利要求1所述的一种低速率声码器子带清浊音参数提取与量化的融合方法，其特征在于，在该方法中，按2400b/s混合激励的线性预测语音编码算法提取子带清浊音参数。

5.如权利要求1所述的一种低速率声码器子带清浊音参数提取与量化的融合方法，其特征在于，在该方法中，所述量化码本据训练矢量集得到。

6.如权利要求1所述的一种低速率声码器子带清浊音参数提取与量化的融合方法，其特征在于，在该方法中，将提取第M+1帧的子带清浊音参数与量化码本中候选矢量第M+1个子带清浊音参数间的失真值与M个语音帧的子带清浊音参数与量化码本中候选矢量前M个子带清浊音参数间的失真值求和，用于更新M个语音帧的子带清浊音参数与量化码本中候选矢量前M个子带清浊音参数间的失真值。

7.如权利要求1所述的一种低速率声码器子带清浊音参数提取与量化的融合方法，其特征在于，在该方法中，M个语音帧的子带清浊音参数与量化码本中候选矢量前M个子带清浊音参数间的失真值的个数为量化码本中矢量的候选个数。

8.如权利要求7所述的一种低速率声码器子带清浊音参数提取与量化的融合方法，其特征在于，在该方法中，所述量化码本中矢量的候选个数根据超级帧子带清浊音参数的量化比特数确定。

9.如权利要求1所述的一种低速率声码器子带清浊音参数提取与量化的融合方法，其特征在于，在该方法中，淘汰码本矢量的预设值为子带清浊音参数计算量化失真时各个子带的加权系数之和与N-1的乘积。

10.如权利要求1所述的一种低速率声码器子带清浊音参数提取与量化的融合方法，其特征在于，在该方法中，激励信号合成端生成激励信号的方法为：利用子带清浊音参数，结合基音周期参数、余量谱幅度参数进行激励信号合成。