CN101141533A

CN101141533A - 用于提供具有扩展带宽的声音信号的方法和系统

Info

Publication number: CN101141533A
Application number: CNA2007101466102A
Authority: CN
Inventors: T·豪利克; B·伊塞尔; G·U·施密特
Original assignee: Harman Becker Automotive Systems GmbH
Current assignee: Nuance Communications Inc
Priority date: 2006-08-22
Filing date: 2007-08-22
Publication date: 2008-03-12
Anticipated expiration: 2027-08-22
Also published as: JP5150165B2; KR101433833B1; KR20080018132A; EP1892703A1; ATE446572T1; EP1892703B1; CA2596411A1; CN101141533B; JP2008052277A; DE602006009927D1

Abstract

本发明涉及用于提供具有扩展带宽的声音信号的方法，包括：自动地确定接收到的声音信号的当前带宽上限和当前带宽下限；自动地确定至少一个补偿信号以在预先定义的宽带带宽下限和当前带宽下限之间和/或在当前带宽上限和预先定义的宽带带宽上限之间补偿接收到的声音信号，其中预先定义的宽带带宽下限比当前带宽限制小，并且预先定义的宽带带宽上限大于当前带宽上限；自动地组合至少一个补偿信号和接收到的声音信号以获得具有扩展带宽的声音信号。

Description

用于提供具有扩展带宽的声音信号的方法和系统

技术领域

本发明涉及用于提供声音信号的方法和系统，特别涉及用于提供具有扩展带宽的语音信号的方法和系统。

背景技术

经由模拟或数字信号通路传输的声音信号通常会遭受到如下缺点的影响，即信号通路仅具有受限制的带宽，使得传输的声音信号与原始信号显著地不同。例如，在传统电话连接的情况下，使用8kHz的采样速率，产生4kHz的最大信号带宽。与音频CD的情况相比，语音和音频质量显著下降。

此外，许多种类的传输显示出附加的带宽限制。在模拟电话连接的情况下，仅300Hz和3.4kHz之间的频率被传输。结果，仅可得到3.1kHz的带宽。

原则上，可通过使用宽带数字编码和解码方法(所谓的宽带编解码)增加电话连接的带宽。然而，在这样的情况下，发射机和接收机都必须支持相应的编码和解码方法，这需要实现新的标准。

作为替换，可使用例如在以下文献中描述的用于带宽扩展的系统：P.Jax，Enhancement of Bandlimited SPeech Signals：Algorithms andTheoretical Bounds，Dissertation，Aachen，Germany，2002，或者E.Larsen，R.M.Aarts，Audio Bandwidth Extension，Wiley，Hoboken，NJ，USA，2004。这些系统将仅在接收机侧被实现，使得现有的电话连接不需要被改变。在这些系统中，对具有小带宽的输入信号的丢失的频率分量进行估计并将其加到输入信号中。

图6示出了这种最新的带宽扩展系统中的结构和相应信号流的一个实例。一般而言，低频率范围和高频率范围都被重新合成。

在框601中，数字形式的进入或接收到的声音信号x(n)由子采样和块提取进行处理以便获得信号矢量x(n)。此处，变量n表示时间。在该图中，假定进入信号x(n)已经通过增加采样速率而被转换成所需的带宽。在该转换步骤中，不会生成例如可通过使用适当的抗混叠或抗镜像滤波器元件而获得的附加频率分量。为了不改变传输的信号，带宽扩展仅在丢失的频率范围内执行。取决于传输方法，扩展涉及低频(例如0至300Hz)和/或高频(例如3400Hz至所需采样速率的一半)范围。

在框602中，从窄带信号中提取窄带谱包络，其中窄带信号受限于电话信道的带宽限制。通过非线性映射，从窄带包络中估计相应的宽带包络信号。映射基于例如码书对(参见J.Epps，W. H.Holmes，A NewTechnique for Wideband Enhancement of Coded Narrowband Speech，IEEE Workshop on Speech Coding，Conference proceedings，pages 174 to176June 1999)或神经网络(见J.-M.Valin R.Lefebvre，BandwidthExtension of Narrowband Speech for Low Bit-Rate Wideband Coding，IEEE Workshop on Speech Coding，Conference Proceedings，pages 130 to132，September 2000)。在这些方法中，使用需要大量处理器和存储器资源的训练方法来生成码书的条目或神经网络的权重。

此外，在框603中，从窄带信号中生成具有平坦谱包络的宽带激励信号。该激励信号与直接在声带后记录的信号相对应，即，激励信号包含关于发音(voicing)和音调的信息，但一般不包含关于形式和结构或谱组成(spectral shaping)的信息。因此，为了取回完整的信号(诸如语音信号)，激励信号必须用谱包络进行加权。为了生成激励信号，可使用诸如双线整形(two-ray rectifying)或方波整形(squaring)的非线性特性(参见U.Komagel，SPectral Widening of the ExcitationSignal for Telephone-Band SPeech Enhancement，IWAENC 01，ConferenceProceedings，pages 215 to 218，September 2001)。

为了带宽扩展，激励信号x_exc(n)在框604中使用包络进行谱着色。此后，在框606中使用带阻滤波器提取用于扩展的谱范围，而产生信号矢量y_ext(n)。带阻滤波器可在例如200至3700Hz的范围中有效。

接收到的信号的信号矢量x(n)在框605中经过互补的带通滤波器。然后，将信号分量y_ext(n)和y_tel(n)相加以获得具有扩展带宽的信号矢量y(n)。在框607中，不同的信号矢量被再次组合并且执行过采样从而产生信号y(n)。

发明内容

在这些现有技术系统中，元件和它们的参数被实现一次，然后保持不变。因此，所有进入的声音信号都以相同的方式被处理。有鉴于此，本发明的一个目的是提供更灵活的方法和设备来提供具有扩展带宽的声音信号。

该问题由如权利要求1所述的方法和如权利要求16所述的设备解决。

根据本发明，提供了一种用于提供具有扩展带宽的声音信号的方法，其包括：

(a)自动地确定接收到的声音信号的当前带宽上限和当前带宽下限。

(b)自动地确定至少一个补偿信号以在预先定义的宽带带宽下限和当前带宽下限之间和/或在当前带宽上限和预先定义的宽带带宽上限之间补偿接收到的声音信号，其中预先定义的宽带带宽下限比当前带宽限制小，并且预先定义的宽带带宽上限大于当前带宽上限。

(c)自动地组合至少一个补偿信号和接收到的声音信号以获得具有扩展带宽的声音信号。

通过确定接收到的声音信号的当前带宽上限和当前带宽下限并确定当前带宽限制和相应的预先定义的宽带带宽限制之间的补偿信号，根据本发明的方法允许使带宽扩展适应于实际接收到的声音信号。例如，在发射机使用ISDN电话时，与具有免提系统的移动电话的情况相比，使用了更宽的频率范围。因此，将仅在那些有必要的范围中扩展接收到的声音信号的带宽，以使结果信号的质量非常高。

以这种方式，一方面，即使接收到的信号仅覆盖非常窄的频率范围，也不会出现谱间隙。另一方面，在接收到覆盖相对宽的频率范围的信号时，在确定补偿信号时不会切去任何频率。

接收到的声音信号可以是数字信号或者可被数字化。在上述方法中，在步骤(a)至(c)之前，可进行将接收到的声音信号转换成预定采样速率的步骤。此外，在步骤(a)至(c)之前，可进行从声音信号(特别是转换的声音信号)中提取信号矢量的步骤。信号矢量可通过对声音信号进行子采样而获得并且可包括预先定义的数目的条目。然后，(在时间上)后续的信号矢量可重叠。信号矢量的使用简化了信号的进一步处理。

在步骤(a)至(c)之前，可进行确定接收到的声音信号的谱矢量的步骤。特别地，可以将窗口函数应用于接收到的声音信号的信号矢量。例如，可以使用Hann或Hamming窗口(参见K.D.Kammeyer，K.Kroschel，Digitale Signalverarbeitung，4^th Edition，Teubner，Stuttgart，Germany 1997)。信号矢量，特别是以这种方式加权的信号失量，可使用离散傅里叶变换而被变换到傅里叶域。结果矢量是短期的谱矢量。这允许在傅里叶域中进行进一步处理。

在上述方法中，步骤(b)可包括根据预定标准确定宽带带宽下限和宽带带宽上限之间的宽带谱包络信号和宽带激励信号，以使谱包络信号和激励信号的乘积与接收到的声音信号相对应。

这种分解成包络信号和激励信号的方法简化了当前带宽限制的确定并且增加了在确定补偿信号时的精确度。

步骤(a)可包括比较确定的宽带谱包络信号和接收到的声音信号的长期功率谱。经证实，长期功率谱是用于确定声音信号的当前带宽限制的适合的基础。

因此，如果当前带宽限制已经在步骤(a)中使用接收到的声音信号的宽带谱包络信号以这种方式确定，那么基于这些当前带宽限制在步骤(b)中确定补偿信号，并且包括包络信号的确定，使得能够通过再次比较(新)确定的包络信号和长期功率谱而重复地使当前带宽限制得到适应。换言之，在步骤(a)中确定当前带宽限制可使用特别是在之前的步骤中或之前的方法的重复中根据步骤(b)确定的谱包络信号。

特别地，如果接收到的声音信号已经被变换到傅里叶域，那么确定长期功率谱可包括，执行与声音信号相对应的子带信号的绝对值的平方的一阶递归平滑。特别地，这可以仅在已经在接收到的声音信号中检测到所需的信号(诸如语音信号)的情况下进行。

另外，长期功率谱可被标准化，特别是关于预定频率限制内的长期功率谱。

可替换地，长期功率谱可在时间域中被确定。这可通过确定自相关并执行LPC分析以获得相对应的预测系数来实现。

比较步骤可包括选择使如下条件得到满足的最小频率和最大频率：长期功率谱大于或等于确定的宽带谱包络信号的功率谱加上预定常数所得的结果。

这是确定带宽限制的特别简单和可靠的方式。预定常数可基于经验或理论数据进行选择。预定的常数可以是负数。

在上述方法中，确定宽带谱包络信号可包括根据预定标准从码书中选择包络信号。

通过使用码书，可减小用于确定包络信号所需的计算能力。原则上，在从码书中选择包络信号时可使用不同种类的标准。特别地，可使用诸如倒谱距离的预定距离标准，特别是在码书条目具有倒谱矢量的形式的情况下。

特别地，选择包络信号可包括均衡化接收到的声音信号以及根据预定距离标准，从码书中选择与均衡化的声音信号具有最小距离(特别是具有最小倒谱距离)的包络信号。

均衡化声音信号允许改变声音信号，使得与来自码书的包络信号的比较可以得到简化。特别地，接收到的声音信号可以以这样的方式被均衡化：使得结果信号显示出与用于训练码书的信号的长期功率谱相对应的长期功率谱。均衡化可被限制于接收到的声音信号的当前带宽上限和当前带宽下限之间的频率；在这些限制之外，信号可保持不变。特别地，均衡化接收到的声音信号可使用用于训练码书的信号的标准化的长期功率谱来执行，特别是使用标准化的长期功率谱除以接收到的声音信号本身的标准化的长期功率谱。

码书可包括相应包络信号的对，每一对包括宽带带宽下限和宽带带宽上限之间的宽带包络信号，以及大于宽带带宽下限的窄带带宽下限和小于宽带带宽上限的窄带带宽上限之间的相应窄带包络信号，并且选择包络信号可包括根据预定距离标准确定与均衡化的声音信号具有最小距离的窄带包络信号，以及选择该对的相应宽带包络信号。

以这种方式，可执行接收到的声音信号和码书的元素之间的简单比较，因为窄带信号通常更接近地匹配具有窄带宽的接收到的声音信号。

在使用倒谱距离来选择包络信号时，接收到的声音信号，特别是在其均衡化形式下，必须被变换到倒谱域。因此，选择包络信号的步骤可进一步包括以下步骤：确定接收到的声音信号的子带信号的绝对值的平方；确定时间域中的自相关，特别是通过对绝对值的平方的矢量执行反离散傅里叶变换；确定预测系数，特别是使用Levinson-Durbin算法，执行递归来获得倒谱系数。

为了从倒谱矢量中确定谱包络，该方法可进一步包括以下步骤：递归地将倒谱矢量变换成预测误差系数；通过添加预定数目的零来扩充预测误差滤波器矢量并随后执行离散傅里叶变换以获得逆谱；确定每个子带分量的倒数以获得谱包络矢量。

在上述方法中，可在选择包络信号的步骤之前提供正被适应于当前带宽下限和当前带宽上限的被适应的窄带码书包络信号。

这种对码书条目的适应允许改善从码书中选择相应的包络信号。特别地，如果接收到的声音信号显示出比码书的原始窄带包络信号宽的带宽，则这种适应将导致码书中的包络信号具有扩展的带宽。以这种方式，特别地，可更可靠地检测到摩擦音。

提供步骤可包括使用接收到的声音信号的长期功率谱处理宽带码书包络信号。

由于使用了接收到的声音信号的功率谱，所以可获得对声音信号的适合的适应。长期功率谱可被标准化；此外，接收到的声音信号的长期功率谱可除以用于训练码书的宽带信号的标准化的长期功率谱。宽带码书包络信号的处理可仅对当前带宽限制以外的频率执行；在带宽限制内，包络信号可保持不变。使用长期功率谱的处理可包括使用接收到的声音信号的长期功率谱对宽带码书包络信号矢量进行加权。

在上述方法中，确定宽带激励信号可以基于预测误差滤波和/或非线性特性来进行。以这种方式，可生成适合的激励信号。例如，在U.Kornagel，Spectral Widening of the Excitation Signal for Telephone-BandSpeech Enhancement中公开了可能的非线性特性。

在上述方法中，至少一个补偿信号可以基于确定的宽带谱包络和确定的宽带激励信号的乘积，并且步骤(c)可包括将当前带宽下限和当前带宽上限之间的接收到的声音信号和被限制在宽带带宽下限和当前带宽下限之间的频带中和/或被限制在当前带宽上限和宽带带宽上限之间的频带中的至少一个补偿信号相加。

因此，补偿信号基于使用包络信号来对激励信号进行谱着色的操作。通过加入仅在接收到的声音信号的当前带宽限制以外的补偿信号，可避免在具有扩展带宽的结果信号中出现非自然信号(artifact)。

步骤(c)还可包括使补偿信号和/或接收到的声音信号的功率得到适应。利用该步骤，可以维持接收到的声音信号的功率。

在上述方法中，至少一个步骤可在倒谱域中执行。特别地，如果码书的条目是倒谱矢量，那么这允许以更简单的方式执行该方法。

上述方法的步骤(a)至(c)可以以预定时间间隔重复。然后，对当前接收到的声音信号的重复的适应，会导致结果宽带信号的持久的高质量。

上述方法的步骤(a)至(c)可以仅在所需的信号分量(诸如语音活动)在接收到的声音信号中被检测到时进行重复。特别是在语音信号的情况下，接收到的声音信号的带宽的扩展是有利的。因此，将该方法限制于检测到的语音活动的情况，会减小所需的计算能力并避免由于不良适应而出现非自然信号。

本发明还提供了包括一个或多个计算机可读介质的计算机程序产品，其中的一个或多个计算机可读介质具有在计算机上被运行时执行上述方法的步骤的计算机可执行指令。

此外，提供了一种用于提供具有扩展带宽的声音信号的设备，该设备包括：

带宽确定装置，其用于自动地确定接收到的声音信号的当前带宽上限和当前带宽下限，

补偿信号装置，其用于自动地确定至少一个补偿信号以在预先定义的宽带带宽下限和当前带宽下限之间和/或在当前带宽上限和预先定义的宽带带宽上限之间补偿接收到的声音信号，其中预先定义的宽带带宽下限小于当前带宽限制，并且预先定义的宽带带宽上限大于当前带宽上限，以及

组合装置，其用于自动地组合至少一个补偿信号和接收到的声音信号以获得具有扩展带宽的声音信号。

与上述方法类似，这样的设备提供扩展接收到的声音信号的带宽的有利的方式。特别地，由于对接收到的声音信号的当前带宽上限和当前带宽下限的确定以及对补偿信号的相对应的确定，结果输出信号的质量与具有固定参数的带宽扩展系统的情况相比得到了提高。

补偿信号装置可包括用于根据预定标准确定宽带带宽下限和宽带带宽上限之间的宽带谱包络信号和宽带激励信号，使得谱包络信号和激励信号的乘积与接收到的声音信号相对应的装置。

带宽确定装置可被配置成比较确定的宽带谱包络信号和接收到的声音信号的长期功率谱。

带宽确定装置可被配置成选择使如下条件得到满足的最小频率和最大频率：长期功率谱大于或等于确定的宽带谱包络信号的功率谱加上预定常数所得的结果。

在上述设备中，用于确定宽带谱包络信号的装置可包括用于根据预定标准从码书中选择包络信号的装置。

用于选择包络信号的装置可被配置成均衡化接收到的声音信号，并根据预定距离标准从码书中选择与均衡化的声音信号具有最小距离(特别是具有最小倒谱距离)的包络信号。

在上述设备中，码书包括相应包络信号的对，每一对包括宽带带宽下限和宽带带宽上限之间的宽带包络信号，以及大于宽带带宽下限的窄带带宽下限和小于宽带带宽上限的窄带带宽上限之间的相应窄带包络信号，并且用于选择包络信号的装置可被配置成根据预定距离标准确定与均衡化的声音信号具有最小距离的窄带包络信号并选择该对中的相应宽带包络信号。

用于确定宽带谱包络信号的装置可包括用于提供正被适应于当前带宽下限和当前带宽上限的被适应的窄带码书包络信号的装置。

该用于提供的装置可被配置成使用接收到的声音信号的长期功率谱来处理宽带码书包络信号。

在上述设备中，用于确定宽带激励信号的装置可被配置成基于预测误差滤波和/或非线性特性来确定宽带激励信号。

至少一个补偿信号可以基于确定的宽带谱包络和确定的宽带激励信号的乘积，并且组合装置可被配置成将当前带宽下限和当前带宽上限之间的接收到的声音信号，和被限制在宽带带宽下限和当前带宽下限之间的频带中和/或被限制在当前带宽上限和宽带带宽上限之间的频带中的至少一个补偿信号相加。

在上述设备中，至少一个装置可被配置成在倒谱域中执行其功能的至少一部分。

上述设备的装置可被配置成以预定时间间隔重复执行它们各自的功能。

该设备还可包括所需信号检测器，特别是语音检测器，并且装置可被配置成仅在所需的信号分量在接收到的声音信号中被检测到时执行它们各自的功能。

附图说明

本发明的其它特征和优点将在下文中参照附图进行说明。

图1示出了用于提供具有扩展带宽的声音信号的设备的一个实例的结构；

图2是用于提供具有扩展带宽的声音信号的方法的一个实例的流程图；

图3示出了用于训练码书的标准化的长期功率谱的一个实例；

图4示出了码书条目的实例；

图5示出了当前带宽限制的确定；

图6示出了现有技术系统的结构。

具体实施方式

图1显示出用于提供具有扩展带宽的声音信号的设备中的信号流的结构。图2是示出可由与图1相对应的设备执行的用于提供具有扩展带宽的声音信号的方法的一个实例的流程图。有鉴于此，图1和2将在下面同时说明。

根据步骤201，经由电话线路接收诸如语音信号的声音信号。由于电话线路的受限制的带宽，期望进行带宽扩展以提高信号质量。因此，信号被扩充以便获得预定的更宽的带宽。可以理解的是，下面说明的方法可被用于独立于进入信号的类型和独立于传输线路的类型的带宽扩展，即，不需要是电话线路。

由框101接收的声音信号x(n)已经通过增加采样速率直到预定宽带带宽而被预处理。然而，以这种方式，没有生成附加频率分量。例如，这可通过使用适合的抗混叠或抗镜像滤波器来实现。优选地，这种带宽扩展仅对“丢失的”频率范围执行；在模拟电话线路的情况下，这些范围可以是0和300Hz之间以及3400Hz直到期望的采样速率的一半(例如直到3700Hz)。

从结果信号x(n)中，生成信号矢量x(n)(步骤202)，其中n表示时间变量。这可通过以每r个采样值为单位取采样值直到达到一定长度来实现。因此，具有N_ana个元素的信号矢量具有以下形式：

x(n)＝[X(nr)，x(nr-1)，...，x(nr-N_ana+1)]^T

应注意，在相邻的信号矢量之间可存在重叠。对于11.025kHz的所需的或最终的采样速率，我们可取以下值：

r＝64

N_ana＝256

此后(步骤203)，在信号矢量上执行乘窗(windowing)步骤以便获得乘窗信号矢量x_w(n)

x_w(n)＝Fx(n)

窗口矩阵F为对角矩阵的形式

该矩阵的元素可以与不同种类的窗口相对应地进行选择。典型的窗口为Hann或Hamming窗口。使用离散傅里叶变换将加权的信号矢量变换到傅里叶域：

X_w(n)＝DFT{x_w(n)}

结果短期谱矢量具有以下形式：

X_{w} (n) = {[X (e^{j Ω_{0}}, n), X (e^{j Ω_{1}}, n), . . ., X (e^{j Ω_{μ}}, n), . . ., X (e^{j Ω_{N_{DFT} - 1}}, n)]}^{T}

其中Ω_μ表示频率变量。

基于谱矢量，在框102中确定接收到的声音信号的长期功率谱(步骤204)。存在着不同的可能性来估计这样的长期功率谱。根据一个替换方案，一阶递归平滑在子带信号X(e^jΩ _μ，n)的绝对值的平方上执行：

优选地，将时间常数β_fre选择成接近1(0＜＜β_fre＜1)以便获得充分大的平均时间。

原则上，根据上面的等式的第一条线的递归平滑可被连续地执行。然而，为了避免任何非自然信号，可以仅在所需的信号分量出现在接收到的声音信号中时(例如检测到语音活动时)执行它。出于该目的，可提供例如下面的文献中描述的语音检测器：E.Hnsler，G. Schmidt，Acoustic Echo and Noise Control-A Practical Approach，Wiley，Hoboken，NJ，USA，2004。

为了简化进一步的处理，长期功率谱可被标准化为预先定义的频带内的长期功率：

{\hat{S}}_{xx, norm} (Ω_{μ}, n) = \frac{{\hat{S}}_{xx} (Ω_{μ}, n)}{Σ_{μ = μ_{l}}^{μ_{u}} {\hat{S}}_{xx} (Ω_{μ}, n)} .

频带限制Ω_μl和Ω_μu表示预先定义的频带的下限和上限。例如，该频带可与本方法将被用于的具有最小带宽的电话频带相对应，例如，限制可以是400Hz和3300Hz。优选地，限制与这样的频带相对应：小于或最多等于下述的码书在其内被训练的窄频带的频带；这些限制由Ω_l和Ω_u表示。

可替换地，为了确定频域中的长期功率谱，也可在时间域中执行估计。出于该目的，为大约10至20个采样周期的偏移量估计自相关。然后，可使用LPC(线性预测编码)分析来确定预测系数。长期功率谱经由离散傅里叶变换和除法而被获得。

在框103(步骤205)中，均衡化声音信号。均衡化在上面确定的谱矢量上执行：

X_eq(n)＝H_eq(n)X_w(n)

均衡化矩阵H_eq(n)为对角矩阵的形式

其具有条目

和

在以上等式中，

和

表示接收到的声音信号的当前带宽下限和当前带宽上限。因此，为了获得更新的均衡化的信号，取时刻(n-1)的带宽限制作为当前带宽限制。此外，

S_{\tilde{x} \tilde{x}, norm} (Ω_{μ}, n)

表示已经被用于训练码书的宽带信号的均衡化的长期功率谱。与上述接收到的声音信号的长期功率谱的情况相类似地执行这样的功率谱的标准化。图3显示出用于训练码书的这样的标准化的长期功率谱的一个实例。

均衡化被限制到最小值和最大值，例如被限制到：

H_eq，min＝-12dB

H_eq，max＝12dB

从上面的内容可以看出，仅在一个时间步长之前的当前带宽限制内均衡化声音信号。在这些带宽限制以外，不进行均衡化。

在下文中，将更详细地说明对宽带谱包络的确定。将使用码书确定与接收到的声音信号相对应的包络信号。使用的码书包括许多由相应的窄带和宽带包络信号组成的对。码书已经通过基于开始的长期功率谱(starting long-term power spectrum)，用大数据库训练而被获得(参见Y. Linde，A.Buzo，R.M.Gray，An Algorithm for Vector QuantizerDesign，IEEE Trans.Comm.，vol.COM-28，no.1，pages 84-95，Jan.1980)。

如图2所指示，在步骤206(框104)中使码书条目得到适应。特别地，使窄带码书条目c_i，s(n)得到适应。

这通过以码书的宽带条目开始来实现。如果宽带包络信号被提供为倒谱矢量c_i，b(n)，则确定相应的谱C_i，b(n)。基于这些宽带谱包络，通过与加权矩阵相乘来确定被适应的或最优化的窄带谱：

C_i，s(n)＝H_mod(n)C_i，b(n)

加权矩阵为对角矩阵的形式：

其具有条目

然后，从结果谱窄带包络中确定倒谱矢量。

从谱矢量到倒谱矢量的转换以及反向转换将在下文中关于步骤207进行说明，其中在步骤207中，确定宽带谱包络(框105)。

与声音信号匹配最好的来自码书的宽带谱包络，是通过将窄带码书条目与声音信号(在均衡后)的谱的谱包络进行比较来确定的。选择与声音信号谱具有最小距离的窄带码书条目。原则上，可使用不同的距离标准。倒谱距离在码书条目以倒谱矢量的形式提供时特别有用。

在已经选择了最优窄带码书条目时，相应的宽带码书条目就被确定为用于接收到的声音信号的最优宽带谱包络。由于如上所述使窄带码书条目得到了适应，所以可以以非常可靠的方式选择最优窄带包络。

将特别是接收到的声音信号的谱矢量转换成倒谱矢量，可以通过以下操作来实现：

1.确定每个子带信号X_eq(e^jΩ _μ，n)的绝对值的平方。

2.在该矢量上应用反离散傅里叶变换导致在时间域中对自相关进行估计。

3.通过使用Levinson-Durbin算法，可从自相关确定预测系数(具有大约10到20的数目)

4.通过执行关于该数目的递归，预测系数被用于确定倒谱系数。通常，该数目与预测系数数目(prediction order)的一又二分之一倍相对应。

宽带码书的最优倒谱矢量由c_opt，b(n)指定。结果宽带谱包络具有如下形式：

C_{opt, b} (n) = {[C_{opt, b} (e^{j Ω_{0}}, n), C_{opt, b} (e^{j Ω_{1}}, n), . . ., C_{opt . b} (e^{j Ω_{N_{DFT} - 1}}, n)]}^{T} .

将倒谱矢量转换成谱矢量，是通过以下操作实现的：

1.使用关于(如上所述的)数目的递归转换倒谱矢量以获得预测误差滤波器系数。

2.通过用预定数目的零扩充预测误差滤波器矢量并随后执行离散傅里叶变换，来获得逆谱。

3.通过确定每个子带分量的倒数，生成矢量C_opt，b(n)。必须分开处理除以零的情况，例如通过加上适合的常数。

图4示出了具有四对条目的码书的实例。在每个图中，显示出了相应的原始窄带包络和相应的被适应的窄带包络。已经为ISDN电话连接，基于大数据库获得了原始宽带和窄带码书条目。在该图中可以看出，在适应后，结果最优条目具有更高的上限频率。这允许改善对摩擦音的检测。

在步骤208(框103)中，生成与接收到的声音信号相对应的激励信号。宽带激励信号显示出平坦谱包络。其与直接在声带后记录的信号相对应。

为了确定宽带激励信号，首先，均衡化的短期谱X_eq(n)的谱包络以预测误差滤波器系数的形式被估计。在该谱矢量上应用反离散傅里叶变换允许确定相应的时间信号。此后，时间域中的矢量由预测误差滤波器滤波。相应的滤波器系数是已经在先前确定的那些。

然后，非线性特性，诸如双向整形或方波整形，被应用于滤波后的时域矢量。这生成了丢失的低频和高频信号分量。然后，傅里叶域中的变换提供扩展的激励信号X_exc(n)的谱。

可替换地，对激励信号的确定可在时间子带中执行，或者也可在傅里叶域中执行。该替换方案的实例可在如下文献中找到：B.Iser，GSchmidt，Bandwidth Extension of Telephony Speech，Eurasip Newsletter，Volume 16，Number 2，pages 2 to 24，June 2005。

在随后的步骤209(框107)中，宽带谱包络和激励信号被用于对激励信号进行谱着色。这可通过子带或傅里叶域中的乘法来实现。

{\tilde{Y}}_{ext} (n) = diag {C_{opt, b} (n)} X_{exc} (n) .

对角矩阵diag{C_opt，b(n)}具有如下形式：

由于在生成激励信号时的非线性或预测误差滤波，所以不需要维持声音信号的功率。因此，可执行功率适应：

Y_{ext} (n) = K (n) {\tilde{Y}}_{ext} (n) .

可选择校正因子K为

K (n) = \frac{Σ_{μ = μ_{l}}^{μ_{u}} {| X_{w} (e^{jΩ}, n) |}^{2}}{Σ_{μ = μ_{l}}^{μ_{u}} {\tilde{Y}}_{erw} {(e^{j Ω_{μ}}, n)}^{2}}

其中Ω_μl和Ω_μu表示与在上述长期功率谱的估计中相同的带宽限制。

在步骤210(框108)中，使当前带宽限制得到适应。根据一种可能性，通过以接收到的声音信号的谱和被减小预定常数的宽带谱包络的比较开始，来确定带宽限制：

{\tilde{Ω}}_{l} (n) = \min {Ω_{μ} &Element; {{| X_{w} (e^{j Ω_{μ}, n}) |}^{2} &GreaterEqual; | C_{opt, b} {(e^{j Ω_{μ}, n})}^{2} | + K_{C}}},

{\tilde{Ω}}_{u} (n) = \max {Ω_{μ} &Element; {{| X_{w} (e^{j Ω_{μ}, n}) |}^{2} &GreaterEqual; | C_{opt, b} {(e^{j Ω_{μ}, n})}^{2} | + K_{C}}} .

参数K_C可具有以下值：

K_C＝-12dB

在图5中，示出了用于确定带宽限制的一个实例。上面的中间限制值由降低的宽带谱包络和接收到的声音信号的谱之间的交点给出。

这些中间限制值可被递归地平滑以消除暂时的不良估计。在这种情况下，优选地，平滑仅在语音活动在当前信号帧中被检测到时执行。

然后，接收到的声音信号经过自适应带通滤波器以仅保持当前带宽限制内的分量(框109)以获得谱矢量Y_tel(n)。类似地，经过谱着色的激励信号穿过互补的自适应带阻滤波器(框110)以便获得矢量Y_ext(n)。

具有标准带宽的输出信号通过以将这两个谱矢量的相加开始，而被生成(步骤211)。

Y(n)＝Y_tel(n)+Y_ext(n)

这些矢量的分量被生成为：

Y_tel(n)＝G_tel(n)X_w(n)

Y_ext(n)＝G_ext(n)X_ext(n)

其中加权矩阵G_tel(n)和G_ext(n)为对角矩阵：

矩阵G_tel(n)的元素被确定为

互补的加权矩阵的权重被确定以便在相加时产生单位矩阵：

G_{ext} (e^{j Ω_{μ}}, n) = 1 - G_{tel} (e^{j Ω_{μ}}, n) .

可替换地，可以以更加平滑的方式实现带宽限制处的过渡。

然后，结果输出谱Y(n)经过反傅里叶变换而被变换到时间域：

y(n)＝IDFT{Y(n)}，

随后，对结果矢量进行乘窗。特别地，在使用上面指出的用于N_ana和r的值和Hann窗口时，可以再次使用窗口函数来获得乘窗的时域矢量：

y_w(n)＝Fy(n)

然后，结果时域矢量使用重叠相加(overlap add)方法(如K.D.Kammeyer，K.Kroschel，Digitale Signalverarbeitung中所述)而被组合以获得最终的输出信号y(n)。

在上述的方法的步骤中，可以使用更复杂的滤波器组系统来替换传统的离散傅里叶变换和反离散傅里叶变换(参见例如P.P.Vaidyanathan，Multirate Systems and Filter Banks，Prentice Hall，Englewood Cliffs，NJ，USA，1992)。

上述变型的其它的替换方案也是可能的。例如，在傅里叶域中执行的步骤也可在时间域中执行。此外，可在使窄带码书条目得到适应时执行对声音信号的均衡化。此外，可以扩充上述均衡化步骤。例如，如果在特定频率上检测到加强或衰减，则也可在带宽限制内对其进行调整。在这种情况下，输出矢量Y_tel(n)采用加权矩阵H_mod(n)进行修改。

除了上述用于估计宽带谱包络的码书分析之外，还可附加地使用所谓的线性映射(参见B.Iser，G. Schmidt，Bandwidth Extension ofTelephony SPeech)。

考虑到本说明书，本发明的其它改型和变型对本领域的技术人员而言将是显而易见的。因此，说明书应被解释为仅是示例性的，并且是为了向本领域的技术人员教导实现本发明的一般方式。可以理解的是，本文中显示和说明的本发明的形式应被视为当前优选的实施例。

Claims

1.用于提供具有扩展带宽的声音信号的方法，包括：

(a)自动地确定接收到的声音信号的当前带宽上限和当前带宽下限，

(b)自动地确定至少一个补偿信号以在预先定义的宽带带宽下限和当前带宽下限之间和/或在当前带宽上限和预先定义的宽带带宽上限之间补偿所述接收到的声音信号，其中所述预先定义的宽带带宽下限比当前带宽限制小，并且所述预先定义的宽带带宽上限大于所述当前带宽上限，

(c)自动地组合所述至少一个补偿信号和所述接收到的声音信号以获得具有扩展带宽的声音信号。

2.如权利要求1所述的方法，其中，步骤(b)包括根据预定标准确定宽带带宽下限和宽带带宽上限之间的宽带谱包络信号和宽带激励信号，以使谱包络信号和激励信号的乘积与所述接收到的声音信号相对应。

3.如权利要求2所述的方法，其中，步骤(a)包括比较确定的宽带谱包络信号和所述接收到的声音信号的长期功率谱。

4.如权利要求3所述的方法，其中，所述比较步骤包括选择使如下条件得到满足的最小频率和最大频率：所述长期功率谱大于或等于确定的宽带谱包络信号的功率谱加上预定常数所得的结果。

5.如权利要求2-4中的任一项所述的方法，其中，确定宽带谱包络信号包括根据预定标准从码书中选择包络信号。

6.如权利要求5所述的方法，其中，选择包络信号包括均衡化所述接收到的声音信号，以及根据预定距离标准，从所述码书中选择与均衡化的声音信号具有最小距离的包络信号，特别是从所述码书中选择与均衡化的声音信号具有最小倒谱距离的包络信号。

7.如权利要求6所述的方法，其中

所述码书包括相应包络信号的对，每一对包括宽带带宽下限和宽带带宽上限之间的宽带包络信号，以及大于所述宽带带宽下限的窄带带宽下限和小于所述宽带带宽上限的窄带带宽上限之间的相应窄带包络信号，并且

选择包络信号包括根据所述预定距离标准确定与所述均衡化的声音信号具有最小距离的窄带包络信号，以及选择该对的相应宽带包络信号。

8.如权利要求7所述的方法，其中，所述方法在所述选择包络信号的步骤之前包括，提供正被适应于当前带宽下限和当前带宽上限的被适应的窄带码书包络信号。

9.如权利要求8所述的方法，其中，所述提供步骤包括使用所述接收到的声音信号的长期功率谱处理宽带码书包络信号。

10.如权利要求2-9中的任一项所述的方法，其中，确定宽带激励信号是基于预测误差滤波和/或非线性特性来进行的。

11.如权利要求2-10中的任一项所述的方法，其中

所述至少一个补偿信号是基于确定的宽带谱包络和确定的宽带激励信号的乘积，并且步骤(c)包括将当前带宽下限和当前带宽上限之间的所述接收到的声音信号和被限制在宽带带宽下限和所述当前带宽下限之间的频带中和/或被限制在所述当前带宽上限和宽带带宽上限之间的频带中的所述至少一个补偿信号相加。

12.如前述权利要求中的任一项所述的方法，其中，至少一个所述步骤在倒谱域中被执行。

13.如前述权利要求中的任一项所述的方法，其中，步骤(a)至(c)以预定时间间隔被重复。

14.如前述权利要求中的任一项所述的方法，其中，仅在所需的信号分量，特别是语音活动在所述接收到的声音信号中被检测到时，重复步骤(a)至(c)。

15.包括一个或多个计算机可读介质的计算机程序产品，所述一个或多个计算机可读介质具有在计算机上被运行时执行前述权利要求中的任一项所述的方法的步骤的计算机可执行指令。

16.提供具有扩展带宽的声音信号的设备，包括：

补偿信号装置，其用于自动地确定至少一个补偿信号以在预先定义的宽带带宽下限和所述当前带宽下限之间和/或在所述当前带宽上限和预先定义的宽带带宽上限之间补偿所述接收到的声音信号，其中所述预先定义的宽带带宽下限小于当前带宽限制，并且所述预先定义的宽带带宽上限大于所述当前带宽上限，以及

组合装置，其用于自动地组合所述至少一个补偿信号和所述接收到的声音信号以获得具有扩展带宽的声音信号。

17.如权利要求16所述的设备，其中，所述补偿信号装置包括用于根据预定标准确定宽带带宽下限和宽带带宽上限之间的宽带谱包络信号和宽带激励信号，使得谱包络信号和激励信号的乘积与所述接收到的声音信号相对应的装置。

18.如权利要求17所述的设备，其中，所述带宽确定装置被配置成比较确定的宽带谱包络信号和所述接收到的声音信号的长期功率谱。

19.如权利要求18所述的设备，其中，所述带宽确定装置被配置成选择使如下条件得到满足的最小频率和最大频率：所述长期功率谱大于或等于确定的宽带谱包络信号的功率谱加上预定常数所得的结果。

20.如权利要求17-19中的任一项所述的设备，其中，所述用于确定宽带谱包络信号的装置包括用于根据预定标准从码书中选择包络信号的装置。

21.如权利要求20所述的设备，其中，所述用于选择包络信号的装置被配置成均衡化所述接收到的声音信号，并根据预定距离标准从所述码书中选择与均衡化的声音信号具有最小距离的包络信号，特别是从所述码书中选择与均衡化的声音信号具有最小倒谱距离的包络信号。

22.如权利要求21所述的设备，其中

所述用于选择包络信号的装置被配置成根据所述预定距离标准确定与均衡化的声音信号具有最小距离的窄带包络信号，并选择该对中的相应宽带包络信号。

23.如权利要求22所述的设备，其中，所述用于确定宽带谱包络信号的装置包括用于提供正被适应于所述当前带宽下限和所述当前带宽上限的被适应的窄带码书包络信号的装置。

24.如权利要求23所述的设备，其中，所述用于提供的装置被配置成使用所述接收到的声音信号的长期功率谱来处理宽带码书包络信号。

25.如权利要求17-24中的任一项所述的设备，其中，所述用于确定宽带激励信号的装置被配置成基于预测误差滤波和/或非线性特性来确定宽带激励信号。

26.如权利要求17-25中的任一项所述的设备，其中

所述至少一个补偿信号基于确定的宽带谱包络和确定的宽带激励信号的乘积，并且

所述组合装置被配置成将当前带宽下限和当前带宽上限之间的所述接收到的声音信号，和被限制在宽带带宽下限和当前带宽下限之间的频带中和/或被限制在当前带宽上限和宽带带宽上限之间的频带中的所述至少一个补偿信号相加。

27.如权利要求16-26中的任一项所述的设备，其中，至少一个所述装置被配置成在倒谱域中执行其功能的至少一部分。

28.如权利要求16-27中的任一项所述的设备，其中，所述装置被配置成以预定时间间隔重复执行它们各自的功能。

29.如权利要求16-28中的任一项所述的设备，还包括所需信号检测器，特别是语音检测器，并且其中，所述装置被配置成仅在所需的信号分量在所述接收到的声音信号中被检测到时执行它们各自的功能。