CN1455390A

CN1455390A - 估算声音编码器的谐波的装置和方法

Info

Publication number: CN1455390A
Application number: CN03124186A
Authority: CN
Inventors: 尹诚完; 崔龙洙; 尹大熙
Original assignee: LG Electronics Inc
Current assignee: Ericsson LG Co Ltd; Ericsson LG Enterprise Co Ltd
Priority date: 2002-04-30
Filing date: 2003-04-30
Publication date: 2003-11-12
Anticipated expiration: 2023-04-30
Also published as: CN1266671C; KR20030085354A; US20030204543A1; KR100446242B1

Abstract

本发明涉及一种估算谐波的方法和装置，其通过以多个基频为中心调整谐波间隔或从提取峰值来减少了计算量，并能够非常有效地应用于低传输速率的声音编码器中，从而减小了原始信号频谱和估算的谐波频谱之间的误差。

Description

估算声音编码器的谐波的装置和方法

技术领域

本发明涉及一种用于估算声音编码器中的谐波的装置和方法。

背景技术

随着通信技术的迅速发展，声音处理成为通信的重要手段。声音处理大致分为：声音编码、声音识别和声音变换。声音编码是最近多媒体环境中的显著技术之一。

由于多媒体和移动通信的发展，以前仅向特殊群体或人提供的服务现在也向公众提供了，而且很多服务呈几何增长。因此，到目前为止所使用的传输速率不能满足用户群。如果传输速率降低，而用户数量增加，则声音质量下降。在这种环境中，发展了声音编码器。

在使用移动通信网络和现在推广的数据网络的声音通信服务中，根据目的与应用，将使用不同的声音编码器。声音编码器通过麦克风接收人的声音，将对应于声音的频率分布、强度和波形转换为编码，发送编码，并合成编码。声音编码器用于移动终端、电话交换机、电视会议系统等。

用于多媒体通信和诸如基于IP的话音(VoIP)的声音存储系统的大多数低传输速率的声音编码器是编码激励线性预测(code-excitedlinear prediction)(CELP)编码器。现有的CELP编码器是用于4-13Kbps传输速率的时域编码器和用于4Kbps以下传输速率的频域编码器。

谐波编码器表示激励信号以基频的谐波分量的形式。因此，谐波编码器在无声的语音间隔中其合成的声音比表示由白噪声形式的激励信号的CELP编码器的声音较为不自然。

但是，在占据了大部分声音信号的声音间隔中，谐波编码器能够以比CELP编码器更低的速率编码声音信号。因此，谐波编码器能用作传输速率在4Kbps或以下的声音编码器。

发明内容

因此，本发明涉及一种估算声音编码器中谐波的装置和方法。在一个实施例中，本发明提供了一种估算声音编码器中谐波的装置和方法，所述方法使用Δ(Delta)调整技术来减少计算量。而且，本发明提供了一种估算声音编码器中谐波的装置和方法，其使用峰值提取和Δ(Delta)调整技术来减少计算。此外，本发明提供了一种估算声音编码器中谐波的装置和方法，其在实时地使用数字信号处理器(DSP)的实施中是非常有效的。进一步，本发明提供了一种估算声音编码器中谐波的装置和方法，其通过提供低传输速率声音编码器方面的必要技术来替代传统技术。

因此，本发明的实施例提供了一种估算声音编码器中谐波的方法，包括：将窗口频谱应用于输入信号，对产生的频谱的幅度N1进行快速傅立叶变换，并计算输入信号的频谱；将与谐波幅度成比例的窗口频谱应用于整数基音(pitch)候选频率，在产生的频谱的幅度N2上进行快速傅立叶变换，并计算合成的信号频谱；计算高频的调整值，在所述高频，得到的每个频段的输入信号频谱和合成信号频谱的误差能量在使用整数单元基音的谐波频率调整值的范围内最小；以及使用高频的调整值计算最大谐波幅度，在所述高频得到的各频段的误差能量最小。

在本发明的另一实施例中，声音编码器的谐波估算装置包括：谐波频率调整装置，用于使用整数单元基音来计算谐波频率调整值的范围，并使用属于该范围内的谐波频率调整值来选择使误差能量最小的频率调整值；以及谐波幅度估算装置，用于使用使误差能量最小的谐波频率调整值通过谐波来估算最大的谐波幅度，并通过谐波频率调整装置得到谐波频率调整值。

在本发明的另一实施例中，声音编码器中的谐波估算装置包括：计算装置，用于计算输入信号的输入信号频谱和合成的信号频谱，将窗口频谱应用于整数基音候选频率；提取装置，用于从各谐波频段提取峰值点，并计算各谐波频段的频率调整值的极限值；计算装置，用于使用得到的频率调整的极限值和峰值点的极限值，计算各频段得到的输入信号频谱和得到的合成信号频谱的误差能量；以及计算装置，用于计算使能量最小的谐波频率调整值和峰值点；以及装置，用于使用得到的谐波频率调整值和峰值点计算谐波幅度。

应该理解，对本发明的上述一般性描述和下述详细描述都是示例性和解释性的，仅作为对本发明的进一步解释，不会限制本发明的权利要求。

附图说明

附图说明了本发明的实施例，并与描述一起对本发明进行描述。其中：

图1是表示根据本发明第一个实施例的分数基音的谐波估算方法的框图；

图2是表示根据本发明第一个实施例的分数基音的谐波估算方法的流程图；

图3是表示根据本发明第二个实施例的使用Δ调整方法的谐波估算装置的框图；

图4是表示根据本发明第二个实施例的使用Δ调整方法的谐波估算装置的流程图；

图5是表示根据本发明第三个实施例的使用Δ调整方法和峰值提取的谐波估算装置的结构图；

图6是表示根据本发明第三个实施例的使用Δ调整方法和峰值提取的谐波估算装置的详细图；

图7是表示根据本发明第三个实施例的使用Δ调整方法和峰值提取的谐波估算装置的流程图；

图8表示仅使用Δ调整方法的情况下合成信号的频谱；以及

图9表示根据本发明的实施例使用Δ调整方法和峰值提取方法的情况下合成信号的频谱。

具体实施方式

以下将参照本发明的实施例进行描述，在附图中示出了其中的例子。以下将描述根据本发明的一种估算声音编码器中谐波的方法和装置。

谐波编码器包括：谐波估算装置和谐波合成器。设计所述谐波估算装置应考虑系统的性能和计算能力。频谱谐波估算影响计算量和声音质量。

而且，谐波估算装置需要对基音、幅度、相位等的许多计算量，并能够使用数字信号处理器(DSP)。通过时域的整数单元和频域的分数单元来寻找该基音。基于分数基音的谐波估算方法需要大量的计算，因为该谐波估算方法使用使输入信号频谱和合成信号频谱的误差能量最小的合成，通过分析来进行的。

另一方面，与CELP编码器相反，在谐波编码器中基音的包络线对于声音质量来说比基音的分辨率更为重要，以通过内插重放合成的信号。谐波估算方法包括离散傅立叶变换(DFT)和快速傅立叶变换(FFT)。如果使用基于离散傅立叶变换的谐波估算方法，则能够立即估算频谱谐波的幅度和相位，与基音周期无关。当基音的周期大时，在离散傅立叶变换中需要大量的计算。

在基于快速傅立叶变换的谐波估算方法中，可以使用在2个或3个基音周期波上进行FFT，并提取频谱的最高点，以观察频谱中谐波的峰峰值方法，或可使用相对简单的方法，例如以对应于基频的谐波的频率对频谱采样。另一方法是最小均方误差(MMSE)方法，其要求比上述方法更大的计算量，并有更高的性能。

基于DFT的方法用于诸如原型波形内插(PWI)的基音周期单元谐波编码器。基于FFT的方法在计算量方面具有优点，并用于诸如正弦变换编码器(STC)、改进的多波段激励(IMBE)和谐波矢量激励编码(HVXC)中的大部分方法。对于基于FFT的谐波估算，有一种MMSE方法，其在两个或更多的基音周期上进行FFT，以计算原始频谱X_W(m)和合成信号频谱X′_W(m，ω₀)，并计算使得到的原始频谱X_W和得到的合成信号频谱X′_W(m，ω₀)的误差能量E₁最小的谐波幅度A₁。

MMSE方法包括步骤：将窗口频谱W_R(n)应用于输入信号x(n)，通过幅度N1的FFT变换计算输入信号频谱X_W(m)，将窗口频谱W_R(n)应用于分数基音候选A，通过幅度N2的FFT变换计算合成的信号频谱X′_W(m，ω₀)，并计算使输入信号频谱X_W(m)和合成信号频谱X′_W(m，ω₀)的误差能量E₁(ω₀)最小的声音数据的第I个谐波幅度A₁(ω₀)。

以下将详细描述基于分数基音的谐波估算方法。图1是表示根据本发明第一个实施例的分数基音的谐波估算方法的框图。

参照图1，分数基音提取器100计算输入信号频谱X_W(m)和合成的信号频谱X′_W(m，ω₀)的误差能量E₁(ω₀)。换言之，分数基音提取器100计算m个分数基音候选A中的一个输入信号频谱X_W(m)的合成频谱X′_W(m，ω₀)，搜索使作为分数基音误差的和的误差能量E(ω₀)最小的最佳的分数基音候选频率，并选择基音的基频ω₀。

这里，输入信号的频谱X_W(m)是通过对信号X_W(n)的幅度N1信号进行FFT获得的信号，其中所述信号X_W(n)是将窗口频谱W_R(n)与输入信号X(n)相乘获得的。合成的信号频谱X′_W(m，ω₀)是使用存储的窗口频谱W_R(m)和幅度N2，通过在分数基音候选频率的幅度N2进行FFT获得的信号。谐波幅度估算器110选择使谐波幅度最大的值作为用于使分数基音提取器100得到的误差能量最小的频率ω₀最佳的谐波。

图2是表示根据本发明第一个实施例的分数基音的谐波估算方法的流程图。参照图2，通过将窗口频谱W_R(n)与输入信号X(n)相乘产生获得信号X_W(n)(S200)。对产生的信号X_W(n)进行幅度N1的FFT变换，并产生输入信号频谱X_W(m)(S201)。将产生的输入信号频谱X_W(m)用于谐波估算装置的输入。其中m可以大于或等于0，且小于或等于N1。

使用窗口频谱W_R(m)采用幅度N2来产生分数基音候选频率的合成信号的频谱X′_W(m，ω₀)(S202)。表达式1将合成的信号频谱X′_W(m，ω₀)计算如下：

表达式1：

X_{W}^{'} (m, ω_{0}) = A_{1} (ω_{0}) {| W}_{R} [\frac{N 2}{N 1} m - \frac{N 2}{2 π} ω_{0} l + 0.5] |

在表达式1中，A₁(ω₀)是谐波幅度。表达式1根据与谐波幅度A₁(ω₀)成比例的窗口频谱W_R(m，ω₀)表示合成的信号频谱X′_W(m，ω₀)。

窗口频谱X′_W(m，ω₀)是分析窗口W_R(n)的幅度N2(＞＞N1)的FFT频谱。分析窗口W_R(n)具有长度N_R，以包括两个或以上的基音周期P₀。算子[x]表示取实数x的整数部分的计算。

使用第1个谐波频段的起点a₁和终点b₁得到合成的信号频谱X′_W(m，ω₀)。通常使用汉明(Hamming)窗口或凯瑟(Kaiser)窗口作为分析窗口W_R(n)。在表达式2中，a₁和b₁表示如下：

表达式2

a_{l} = [\frac{N 1}{2 π} (l - 0.5) ω_{0} + 0.5]

b_{l} = [\frac{N 1}{2 π} (l + 0.5) ω_{0} + 0.5]

如果得到合成的信号频谱(S202)，则在全部频段得到了输入信号频谱和合成信号频谱的误差能量E₁(ω₀)(S203)。使用表达式3来获得：

表达式3：

E_{l} (ω_{0}) = Σ_{m = a_{l}}^{b_{l}} {| X_{W} (m) | - | X_{W}^{'} (m, ω_{0}) |}^{2}

其中1≤1≤L，

在表达式3中，ω₀是基频。X_W(m)中m的幅度范围是0≤m≤N1。而且，1表示谐波数。误差能量E₁(ω₀)是输入信号频谱X_W(m)的绝对值和合成信号频谱X′_W(m，ω₀)的绝对值之间差的平方从第1个谐波频段的起点a₁到该谐波频段终点b₁的累加的和。

当通过表达式3获得误差能量时(S203)，通过在M分数基音候选频率上重复步骤S202和步骤S203，选择使误差能量E₁(ω₀)最小的基音的基频ω₀(S204)。这时，为使误差能量最小，可根据A₁(ω₀)对表达式3进行偏微分

\frac{{&PartialD; E}_{l}}{{&PartialD; A}_{l .}} = 0

表达式4如下：

表达式4：

A_{l} = \frac{Σ_{m = a_{l}}^{b_{l}} | X_{W} (m) | {| W}_{R} [\frac{N 2}{N 1} m - \frac{N 2}{2 π} ω_{0} l + 0.5] |}{Σ_{m = a_{l}}^{b_{l}} | W_{R} [\frac{N 2}{N 1} m - \frac{N 2}{2 π} ω_{0} l + 0.5] |^{2}}

为提高由表达式4表示的谐波幅度A₁(ω₀)的可靠性，应该首先搜索一种精确的分数基音，其中如表达式5表示的输入信号频谱和合成信号频谱的误差能量在给出的全部频段内最小。

表达式5：

E (ω_{0}) = Σ_{l = 1}^{L} E_{l} (ω_{0}), ω_{0} (0) {\leq ω}_{0} {\leq ω}_{0} (M - 1)

其中M是要搜索的分数基音候选频率数(如10)。进行步骤204后，将表达式4应用于得到的ω₀，并得到最大谐波幅度A₁(ω′₀)(S205)。

第一个实施例是基于谐波分析方法的分数基音。在第一个实施例中，根据使用的基音的值，由固定的a₁和b₁表示谐波频段的MMSE，并搜索精确的分数单元基音。如果由于分配的位或计算量的限制，使编码器的基音搜索精度退化，则原始信号频谱和合成的信号频谱的谐波中心频率之间的误差随着它进入高频而增加。因此，表达式4的分子的相关性隐含下降，以使谐波分析性能大幅地下降。性能取决于输入信号基音的精度，且精确的基音搜索需要大量的计算。

另一方面，如果不将谐波估算应用于整个频段，并根据频段对每个谐波频段进行自适应地控制，从而消除了输入基音和计算方法的相关性，应用一种名为DELTA(Δ)调整方法来减少基音搜索的计算量。在这种Δ调整方法中，将每个谐波对应的谐波频率间隔向左或右调整Δ，所述谐波使用整数基音单元来计算使输入信号频谱和合成信号频谱的误差能量最小的Δ_I，并使用Δ_I得到最大谐波幅度。

以下参照图3和4描述Δ调整方法。图3是表示根据本发明第二个实施例的使用Δ调整方法的谐波估算装置的框图。参照图3，Δ调整器300计算使用整数单元基音的谐波频率调整值Δ_I的范围d_l，并选择使A_I(Δ)最大的Δ_I作为使用属于已得到的范围d_l的Δ_I的最佳的频率调整值。谐波幅度估算器310选择使谐波幅度最大的值作为用于频率调整值Δ_I的最佳的谐波，所述Δ_I使由Δ调整器300得到的误差能量最小。

图4是表示根据本发明第二个实施例的使用Δ调整方法的谐波估算装置的流程图。参照图4，窗口频谱W_R(n)乘以输入信号X_W(n)，产生新的输入信号X_W(n)(S400)。通过进行幅度N1的FFT变换产生的输入信号X_W(n)，并产生输入信号频谱X_W(m)(S401)。产生的输入信号频谱X_W(m)作为谐波估算装置的输入。幅度m大于或等于0，且小于或等于N1。

然后，在步骤S401后，通过表达式1使用幅度N2的窗口频谱W_R(m)，产生整数基音候选频率的合成信号频谱X′_W(m，ω₀)(S402)。通过表达式2获得合成信号频谱X′_W(m，ω₀)的第I个谐波频段的起点a₁和终点b₁。然后，在步骤S402后，使用整数单元基音得到谐波频率调整值Δ_I的极限值d_l(S403)，通过表达式6得到d_l。

表达式6：

d_{l} = \frac{α_{2} - α_{1}}{L - 1} ω_{0} (l - 1) + α_{2} ω_{0}

在表达6中，d_l表示谐波频率调整值Δ_I的范围，并且d_l的值与频率成比例，且在低频段小，在高频段大。

在步骤S403后，在得到的范围d_l中使用表达式7，在频率调整值的范围内得到使误差能量E_l(Δ_l)最小的Δ_l(S404)，表达式7如下：

表达式7：

E_{l} (Δ_{l}) = Σ_{m = a_{l}}^{b_{l}} {| X_{W} (m + Δ_{l}) | - | X_{W}^{'} (m, ω_{0}) |}^{2}

表达式7表示了X_W(m+Δ)的绝对值和X′_W(m，ω₀)的绝对值之间的差的平方从谐波频段的起点a₁到谐波频段的终点b₁的和。

Δ_l的范围从-d_I到d_I。将在步骤404得到的Δ_I应用于表达式8，并得到最大谐波幅度(S405)。表达式8如下：

表达式8：

A_{l} = \frac{Σ_{m = a_{l}}^{b_{l}} | X_{W} (m + Δ_{l}) | {| W}_{R} [\frac{N 2}{N 1} m - \frac{N 2}{2 π} ω_{0} l + 0.5] |}{Σ_{m = a_{l}}^{b_{l}} | W_{R} [\frac{N 2}{N 1} m - \frac{N 2}{2 π} ω_{0} l + 0.5] |^{2}}

第二个实施例的谐波幅度估算器310选择使谐波幅度最大的值作为最佳的用于频率调整值的谐波，所述频率调整值使由Δ调整器300通过输入信号频谱的绝对值与合成信号频谱的绝对值的差的平方得到的误差能量最小。

在Δ调整方法中的谐波估算方法中，使用整数基音来调整谐波间隔，并得到使误差能量最小的谐波幅度，从而能够减小在高频段产生的谐波估算误差。但是，由于基音的变化或类似原因，可能产生谐波估算误差。

为解决这一问题，使用了Δ调整和峰峰值的谐波估算方法。换言之，将每个谐波的峰值确定为谐波的代表值，并估算谐波。在全部频段，使用上述方法使原始信号频谱的谐波峰值和合成信号频谱的谐波峰值彼此重合，将表达式4的分子的相关性设置到大，从而在高频段使用Δ调整来最后估算谐波幅度。这将参照图5和图6进行描述。

图5是表示根据本发明第三个实施例的使用Δ调整方法和峰值提取的谐波估算装置的结构图。参照图5，使用Δ调整和峰值提取的谐波估算装置包括：峰值提取器500、Δ调整器510和谐波幅度估算器520。通过将窗口频谱W_R(n)应用于输入声音信号x(n)来产生输入信号频谱X_W(m)，并进行幅度N1的FFT变换。通过将窗口频谱W_R(m)应用于整数基音候选频率产生合成信号频谱X′_W(m，ω₀)，并进行幅度N2的FFT。

峰值提取器500从全部频段中提取峰值。换言之，峰值提取器500将全部频段分为一个谐波，并计算最大值作为每个谐波的代表值。在全部频段上，提取的峰值在原始信号频谱和合成的信号频谱的每个谐波重合。换言之，确定与谐波的峰值重合的峰值τpp定位在ω₀×I的±(1/2)ω₀的范围内的原始信号频谱X_W(m)的最大值，对应于合成信号频谱中的每个谐波峰值位置。

该Δ调整器510使用整个频段内最大值来计算频率调整值Δ_I的范围d_I，并选择使A_I(Δ)最大的Δ_I作为使用属于范围d_I的Δ_I的频率调整值。上述谐波频率调整的极限值如下得到：

谐波幅度估算器520选择使谐波幅度最大的值作为使用频率调整值Δ_I的最佳的谐波，所述Δ_I使Δ调整器510得出的误差最小。

图6是表示根据本发明第三个实施例的使用Δ调整方法和峰值提取的谐波估算装置的详细图。参照图6，使用Δ调整和峰值提取的谐波估算装置包括：窗口单元600、傅立叶变换器610、峰值和Δ调整器620、谐波频段频谱合成器630、合成器640、谐波波段误差能量提取器650、误差能量确定器660和谐波幅度估算器670。

窗口单元600将窗口频谱W_R(n)应用于输入声音信号x(n)，并产生X_W(n)。傅立叶变换器610在窗口单元600产生的X_W(n)上进行幅度N1的FFT，并产生输入信号频谱X_W(m)。峰值检取和Δ调整器620提取谐波的峰值τpp，并使用整数单元基音计算谐波频率调整值Δ_I的范围d_I。谐波频段频谱合成器630将窗口频谱W_R(m)应用于整数基音候选频率ω₀。，并产生具有幅度N2的合成信号频谱X′_W(m，ω₀)。

合成器640从峰值提取和Δ调整器620的输出减去谐波频谱合成器630的输出，并输出减法的结果。换言之，输出从X_w(m+πpp+Δ₁)-X′_W(m，ω₀)的计算结果。谐波频段误差能量提取器650使用从合成器640接收的谐波频率调整值Δ₁的范围d₁计算误差能量，并由峰值提取和Δ调整器620得到。

误差能量判定器660确定由谐波频段误差能量提取器650得到的误差能量Δ₁是否最小。如果误差能量判定器660判定的结果是在Δ₁得到的能量最小，则将误差能量最小的信息传送到谐波幅度估算器670。误差能量最小的信息可以是误差最小的Δ^* _I。

如果误差能量判定器660判定的结果在Δ^* _I得到的误差能量不是最小，则误差能量判定器660提取在得到的谐波频率调整Δ_I的范围内至少一个候选频率。然后，误差能量判定器660将提取的候选频率传送到峰值提取和Δ调整器620。然后，由于另一候选频率，将由峰值提取和Δ调整器620调整的输入信号频谱作为误差能量经由合成器640传送到谐波频段误差能量提取器650。误差能量判定器660判定传送的Δ₁是否使误差能量最小。谐波幅度估算器670从误差能量判定器660接收在Δ^* ₁的最小的误差能量，并使用得到的d₁和峰值τpp计算最终的谐波幅度A₁(Δ^* ₁)。这里1≤I≤L，

换言之，确定由每个谐波的峰值作为谐波的代表值，并使全部频段中每个原始信号频谱的谐波峰值与合成信号频谱的谐波峰值重合，从而表达式4中分子的相关性大。因此，在高频段使用Δ调整方法最终估算谐波幅度。

图7是表示根据本发明第三个实施例的使用Δ调整方法和峰值提取的谐波估算装置的流程图。参照图7，将窗口频谱W_R(n)应用于输入信号x(n)，并产生X_W(n)(S700)。通过幅度N1的FFT变换产生的X_W(n)，并产生输入信号频谱X_W(m)(S701)。将产生的输入信号频谱X_W(m)作为谐波估算装置的输入。幅度m大于或等于0，且小于或等于N1。

在步骤S701后，使用如表达式1所示幅度为N2的窗口频谱W_R(n)，产生整数音基候选的合成的信号频谱X′_W(m，ω₀)(S702)。使用表达式2获得合成信号频谱X′_W(m，ω₀)的第I个谐波频段的起点a₁和终点b₁。在步骤S702之后，提取在全部谐波频段的每个最大值(峰值＝τpp)(S703)。提取的最大值可以是τpp。

在步骤S703后，使用整数单位基音每个谐波频段的调整值Δ₁的极限值d₁(S704)如表达式9。

表达式9：

d_{l} = \frac{α}{L - 1} ω_{0} (l - 1)

在表达9中，d₁表示谐波频率调整值Δ₁的范围，范围为从-d_I到d_I，d₁的值与频率成比例，且在低频段小，在高频段大，且α是表示根据频段调整范围变化的常数，小于或等于0.5。

在步骤S704后，使用得到的谐波频率调整值的范围d₁和峰值τpp调整谐波频率，在频率调整值的范围内得到使由表达式10表示的误差能量最小的Δ₁。

表达式10：

E_{l} (Δ_{l}) = Σ_{m = a_{l}}^{b_{l}} {| X_{W} (m + Δ_{l} + τpp) | - | X_{W}^{'} (m, ω_{0}) |}^{2}

表达式10表示了X_W(m+Δ)的绝对值和X′_W(m，ω₀)的绝对值之间的差的平方从谐波频段的起点a₁到谐波频段的终点b₁的和，所述X′_W(m，ω₀)受到谐波频率调整值的影响。

将在步骤S705中表达式9得到的最小值d₁和表达式10得到的谐波调整Δ^* ₁应用于表达式11，并得到最终的谐波幅度(S706)。

表达式11：

A_{l} = \frac{Σ_{m = a_{l}}^{b_{l}} | X_{W} (m + Δ_{l} + τpp) | {| W}_{R} [\frac{N 2}{N 1} m - \frac{N 2}{2 π} ω_{0} l + 0.5] |}{Σ_{m = a_{l}}^{b_{l}} | W_{R} [\frac{N 2}{N 1} m - \frac{N 2}{2 π} ω_{0} l + 0.5] |^{2}}

这里，-d_l≤Δ≤d_l，

d_{l} = \frac{{αω}_{0}}{L - 1} (l - 1)

在表达式11中，常数α是表示根据频段调整范围变化的常数，小于或等于0.5，且由实验决定。

确定峰值τpp在对应于合成的信号频谱中的每个谐波峰值位置的ω₀×1的±(1/2)ω₀的范围内位于原始信号频谱的最大值，且得出与该值对应的使误差能量最小的Δ^* ₁。如表达式11所示，通过添加Δ值到输入信号频谱，并提取峰值进一步调整该值，可以更精确地得出最终的幅度A₁。

图8表示仅使用Δ调整方法的情况下合成信号的频谱。图9表示根据本发明实施例的使用Δ调整方法和峰值提取方法的情况下合成信号的频谱。使用Δ调整方法和峰值提取方法情况下的误差范围小于仅使用Δ调整方法的情况。

如上所述，根据本发明，提供了声音编码器中估算谐波的装置和方法，其使用峰值提取和Δ调整技术减少了计算量。声音编码器中估算谐波的装置和方法在使用数字信号处理器(DSP)的实时处理中是非常有效的，且DSP的计算量是重要的。根据本发明的声音编码器中估算谐波的装置和方法，通过提供低传输速率声音编码器的技术，能够替代传统技术。

对于本领域普通技术人中来说，本发明的各种修改与变化是显而易见的。因此，本发明所附的权利要求中包括本发明的修改与变化，其都落在所附权利要求及其等效的范围内。

Claims

1.一种谐波估算方法，包括：

将窗口频谱应用于输入信号，对产生的频谱进行预定幅度的快速傅立叶变换，并计算输入信号频谱；

使用与第一基频、谐波幅度和高频信号幅度成比例的窗口频谱，产生分数基音候选频率的合成的信号频谱；

计算每个频段的输入信号频谱和合成信号频谱的误差能量，并计算使误差能量最小的第二基频；以及

在所述第二基频计算最大谐波幅度。

2.根据权利要求1所述的方法，其中通过重复计算输入信号频谱和M分数基音候选频率的合成信号频谱的步骤来选择所述使误差能量最小的第二基频。

3.一种谐波估算方法，包括：

将窗口频谱应用于输入信号，对产生的频谱进行幅度N1的快速傅立叶变换，并计算输入信号的频谱；

将与谐波幅度成比例的窗口频谱应用于整数基音候选频率，对产后的频谱进行幅度N2的快速傅立叶变换，并计算合成的信号频谱；

计算高频的调整值，在所述高频，得到的每个频段的输入信号频谱和合成信号频谱的误差能量在使用整数基音候选频率的谐波频率调整值的范围内最小；以及

使用高频的调整值计算最大谐波幅度，在所述高频每个频段的误差能量最小。

4.如权利要求3所述的方法，其中通过输入信号频谱的绝对值和合成的信号频谱的绝对值之间的差的平方，通过从频段的起点到该频段的终点的差的平方的累加，来选择所述使每个频段的误差能量最小的高频的调整值，以及选择高频的调整值，在所述高频，误差能量在所累加的值中的高频的调整值的极值范围内是最小的。

5.如权利要求3所述的方法，其中所述谐波的幅度通过以下步骤估算：

如果得出输入信号频谱和合成信号频谱，则在每个谐波频段计算最大值点和谐波频率调整值的极限值；

计算得出的输入信号频谱和合成信号频谱的每个频段的误差能量；

计算得出的谐波频率调整值和得出的使误差能量最小的最大值点；以及

通过使用得出的谐波频率调整值和得出的最大值点计算最终的谐波幅度。

6.如权利要求5所述的方法，其中通过输入信号频谱的绝对值和合成信号频谱的绝对值之间差的平方，并将所有谐波频段的差的平方累加，得到所述误差能量。

7.如权利要求5所述的方法，其中通过以下公式得到谐波频率调整值的极限值。

8.一种谐波估算装置，包括：

谐波频率调整装置，用于使用整数单位基音来计算谐波频率调整值的范围，并使用属于该范围内的谐波频率调整值来选择使误差能量最小的频率调整值；以及

谐波幅度估算装置，用于使用使误差能量最小的谐波频率调整值通过谐波来估算最大的谐波幅度，通过谐波频率调整装置得到谐波频率调整值。

9.根据权利要求8所述的装置，其中所述谐波频率调整值的范围与频率成比例，且所述范围在低频段小和在高频段大。

10.根据权利要求8所述的装置，其中通过受谐波调整值影响的输入信号频谱的绝对值和合成信号频谱的绝对值之间差的平方，以及从谐波的起点到该谐波终点的累加该差的平方来得到所述误差能量。

11.根据权利要求8所述的装置，其中使用使误差能量最小的谐波频率调整值和在全部频段上的原始频谱和合成的频谱重合的峰值来估算所述谐波幅度。

12.根据权利要求11所述的装置，进一步包括峰值提取装置，用于在全部频段中提取峰值。

13.根据权利要求8所述的装置，其中所述用于选择使谐波幅度最大的值的谐波频率调整装置通过使用属于谐波频率调整值范围内的值来选择最佳的频率调整值。

14.一种谐波估算装置，包括：

用于计算输入信号的输入信号频谱，并将窗口频谱应用于整数基音候选频率，和合成的信号频谱的装置；

用于从各谐波频段提取峰值点，并计算各谐波频段的频率调整值的极限值的装置；

用于使用得到的频率调整的极限值和峰值点，计算各频段得到的输入信号频谱和得到的合成信号频谱的误差能量的装置；

用于计算使能量最小的谐波频率调整值的装置；以及

用于使用得到的谐波频率调整值和峰值点计算谐波幅度的装置。

15.根据权利要求14所述的装置，其中如果所述谐波频率调整值不是使所述误差能量最小的值，则所述用于计算误差能量的装置调整谐波的间隔。

16.一种谐波估算方法，包括：

产生输入信号频谱；

产生合成的信号频谱；

在调整值的范围内，计算调整值，所述调整值使输入信号频谱和合成的信号频谱的误差能量最小；以及

通过使用每个频段的调整值，估算每个频段的最大谐波幅度。

17.根据权利要求16所述的方法，其中所述误差能量是通过输入信号频谱的绝对值和合成信号频谱的绝对值之间差的平方，以及通过累加从频段的起点到该频段终点的差的平方来确定的。

18.根据权利要求16所述的方法，进一步包括：

确定每个波段的峰值点；

使用所述峰值点确定使误差能量最小的调整值；以及

使用谐波频率调整值和峰值点，计算最大谐波幅度。

19.根据权利要求16所述的方法，其中所述误差能量是通过输入信号频谱的绝对值和合成信号频谱的绝对值之间差的平方，并将所述差的平方在全频段累加来得到的。

20.根据权利要求16所述的方法，其中所述范围确定为±谐波频率调整值的极限值，其中所述极限值是通过下式得到的。

21.根据权利要求16所述方法，其中所述谐波调整值的范围与频率成比例，从而所述范围随着频率的提高而增加。

22.根据权利要求16所述方法，进一步包括：

如果所述调整值不是使误差能量最小的调整值，则将所述调整值改变为其范围内的另一值。

23.一种谐波估算装置，包括：

谐波频率调整器，其计算谐波频率调整值的范围，并在使每个频段误差能量最小的范围内选择谐波频率调整值；以及

谐波幅度估算器，其使用使误差能量最小的谐波频率调整值，估算每个频段的最大谐波幅度。

24.根据权利要求23所述的装置，其中所述谐波频率调整值的范围，与频率成比例，且该范围在低频段小，在高频段大。

25.根据权利要求23所述的装置，其中所述误差能量是通过输入信号频谱的绝对值和合成信号频谱的绝对值之间差的平方，以及通过累加从频段的起点到该频段终点的差的平方来得到的。

26.根据权利要求23所述的装置，其中所述谐波幅度是使用使误差能量最小的谐波频率调整值和在每个频段上的原始频谱和合成频谱的谐波重合的峰值来估算的。

27.根据权利要求23所述的装置，进一步包括峰值提取装置，用于在提取每个频段的原始频谱和合成频谱的谐波重合的峰值。

28.根据权利要求23所述的装置，其中所述谐波频率调整器使用所述范围内的最佳的频率调整值来选择使谐波幅度最大的值。

29.根据权利要求23所述的方法，其中如果所述调整值不是使误差能量最小的调整值，则所述谐波频率调整器调整所述调整值为其范围内的另一值。