CN1266671C - 估算声音编码器的谐波的装置和方法 - Google Patents

估算声音编码器的谐波的装置和方法 Download PDF

Info

Publication number
CN1266671C
CN1266671C CNB031241867A CN03124186A CN1266671C CN 1266671 C CN1266671 C CN 1266671C CN B031241867 A CNB031241867 A CN B031241867A CN 03124186 A CN03124186 A CN 03124186A CN 1266671 C CN1266671 C CN 1266671C
Authority
CN
China
Prior art keywords
frequency
harmonic
spectrum
value
adjusted value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB031241867A
Other languages
English (en)
Other versions
CN1455390A (zh
Inventor
尹诚完
崔龙洙
尹大熙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ericsson LG Co Ltd
Ericsson LG Enterprise Co Ltd
Original Assignee
LG Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LG Electronics Inc filed Critical LG Electronics Inc
Publication of CN1455390A publication Critical patent/CN1455390A/zh
Application granted granted Critical
Publication of CN1266671C publication Critical patent/CN1266671C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/14Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
    • G06F17/141Discrete Fourier transforms
    • G06F17/142Fast Fourier transforms, e.g. using a Cooley-Tukey type algorithm

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Algebra (AREA)
  • General Engineering & Computer Science (AREA)
  • Discrete Mathematics (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

本发明涉及一种估算谐波的方法和装置,其通过以多个基频为中心调整谐波间隔或从提取峰值来减少了计算量,并能够非常有效地应用于低传输速率的声音编码器中,从而减小了原始信号频谱和估算的谐波频谱之间的误差。

Description

估算声音编码器的谐波的装置和方法
技术领域
本发明涉及一种用于估算声音编码器中的谐波的装置和方法。
背景技术
随着通信技术的迅速发展,声音处理成为通信的重要手段。声音处理大致分为:声音编码、声音识别和声音变换。声音编码是最近多媒体环境中的显著技术之一。
由于多媒体和移动通信的发展,以前仅向特殊群体或人提供的服务现在也向公众提供了,而且很多服务呈几何增长。因此,到目前为止所使用的传输速率不能满足用户群。如果传输速率降低,而用户数量增加,则声音质量下降。在这种环境中,发展了声音编码器。
在使用移动通信网络和现在推广的数据网络的声音通信服务中,根据目的与应用,将使用不同的声音编码器。声音编码器通过麦克风接收人的声音,将对应于声音的频率分布、强度和波形转换为编码,发送编码,并合成编码。声音编码器用于移动终端、电话交换机、电视会议系统等。
用于多媒体通信和诸如基于IP的话音(VoIP)的声音存储系统的大多数低传输速率的声音编码器是编码激励线性预测(code-excitedlinear prediction)(CELP)编码器。现有的CELP编码器是用于4-13Kbps传输速率的时域编码器和用于4Kbps以下传输速率的频域编码器。
谐波编码器表示激励信号以基频的谐波分量的形式。因此,谐波编码器在无声的语音间隔中其合成的声音比表示由白噪声形式的激励信号的CELP编码器的声音较为不自然。
但是,在占据了大部分声音信号的声音间隔中,谐波编码器能够以比CELP编码器更低的速率编码声音信号。因此,谐波编码器能用作传输速率在4Kbps或以下的声音编码器。
发明内容
因此,本发明涉及一种估算声音编码器中谐波的装置和方法。在一个实施例中,本发明提供了一种估算声音编码器中谐波的装置和方法,所述方法使用Δ(Delta)调整技术来减少计算量。而且,本发明提供了一种估算声音编码器中谐波的装置和方法,其使用峰值提取和Δ(Delta)调整技术来减少计算。此外,本发明提供了一种估算声音编码器中谐波的装置和方法,其在实时地使用数字信号处理器(DSP)的实施中是非常有效的。进一步,本发明提供了一种估算声音编码器中谐波的装置和方法,其通过提供低传输速率声音编码器方面的必要技术来替代传统技术。
因此,本发明的实施例提供了一种估算声音编码器中谐波的方法,包括:将窗口频谱应用于输入信号,对产生的频谱的幅度N1进行快速傅立叶变换,并计算输入信号的频谱;将与谐波幅度成比例的窗口频谱应用于整数基音(pitch)候选频率,在产生的频谱的幅度N2上进行快速傅立叶变换,并计算合成的信号频谱;计算高频的调整值,在所述高频,得到的每个频段的输入信号频谱和合成信号频谱的误差能量在使用整数单元基音的谐波频率调整值的范围内最小;以及使用高频的调整值计算最大谐波幅度,在所述高频得到的各频段的误差能量最小。
在本发明的另一实施例中,声音编码器的谐波估算装置包括:谐波频率调整装置,用于使用整数单元基音来计算谐波频率调整值的范围,并使用属于该范围内的谐波频率调整值来选择使误差能量最小的频率调整值;以及谐波幅度估算装置,用于使用使误差能量最小的谐波频率调整值通过谐波来估算最大的谐波幅度,并通过谐波频率调整装置得到谐波频率调整值。
在本发明的另一实施例中,声音编码器中的谐波估算装置包括:计算装置,用于计算输入信号的输入信号频谱和合成的信号频谱,将窗口频谱应用于整数基音候选频率;提取装置,用于从各谐波频段提取峰值点,并计算各谐波频段的频率调整值的极限值;计算装置,用于使用得到的频率调整的极限值和峰值点的极限值,计算各频段得到的输入信号频谱和得到的合成信号频谱的误差能量;以及计算装置,用于计算使能量最小的谐波频率调整值和峰值点;以及装置,用于使用得到的谐波频率调整值和峰值点计算谐波幅度。
应该理解,对本发明的上述一般性描述和下述详细描述都是示例性和解释性的,仅作为对本发明的进一步解释,不会限制本发明的权利要求。
附图说明
附图说明了本发明的实施例,并与描述一起对本发明进行描述。其中:
图1是表示根据本发明第一个实施例的分数基音的谐波估算方法的框图;
图2是表示根据本发明第一个实施例的分数基音的谐波估算方法的流程图;
图3是表示根据本发明第二个实施例的使用Δ调整方法的谐波估算装置的框图;
图4是表示根据本发明第二个实施例的使用Δ调整方法的谐波估算装置的流程图;
图5是表示根据本发明第三个实施例的使用Δ调整方法和峰值提取的谐波估算装置的结构图;
图6是表示根据本发明第三个实施例的使用Δ调整方法和峰值提取的谐波估算装置的详细图;
图7是表示根据本发明第三个实施例的使用Δ调整方法和峰值提取的谐波估算装置的流程图;
图8表示仅使用Δ调整方法的情况下合成信号的频谱;以及
图9表示根据本发明的实施例使用Δ调整方法和峰值提取方法的情况下合成信号的频谱。
具体实施方式
以下将参照本发明的实施例进行描述,在附图中示出了其中的例子。以下将描述根据本发明的一种估算声音编码器中谐波的方法和装置。
谐波编码器包括:谐波估算装置和谐波合成器。设计所述谐波估算装置应考虑系统的性能和计算能力。频谱谐波估算影响计算量和声音质量。
而且,谐波估算装置需要对基音、幅度、相位等的许多计算量,并能够使用数字信号处理器(DSP)。通过时域的整数单元和频域的分数单元来寻找该基音。基于分数基音的谐波估算方法需要大量的计算,因为该谐波估算方法使用使输入信号频谱和合成信号频谱的误差能量最小的合成,通过分析来进行的。
另一方面,与CELP编码器相反,在谐波编码器中基音的包络线对于声音质量来说比基音的分辨率更为重要,以通过内插重放合成的信号。谐波估算方法包括离散傅立叶变换(DFT)和快速傅立叶变换(FFT)。如果使用基于离散傅立叶变换的谐波估算方法,则能够立即估算频谱谐波的幅度和相位,与基音周期无关。当基音的周期大时,在离散傅立叶变换中需要大量的计算。
在基于快速傅立叶变换的谐波估算方法中,可以使用在2个或3个基音周期波上进行FFT,并提取频谱的最高点,以观察频谱中谐波的峰峰值方法,或可使用相对简单的方法,例如以对应于基频的谐波的频率对频谱采样。另一方法是最小均方误差(MMSE)方法,其要求比上述方法更大的计算量,并有更高的性能。
基于DFT的方法用于诸如原型波形内插(PWI)的基音周期单元谐波编码器。基于FFT的方法在计算量方面具有优点,并用于诸如正弦变换编码器(STC)、改进的多波段激励(IMBE)和谐波矢量激励编码(HVXC)中的大部分方法。对于基于FFT的谐波估算,有一种MMSE方法,其在两个或更多的基音周期上进行FFT,以计算原始频谱XW(m)和合成信号频谱XW′(m,ω0),并计算使得到的原始频谱XW和得到的合成信号频谱XW′(m,ω0)的误差能量El最小的谐波幅度Al
MMSE方法包括步骤:将窗口频谱WR(n)应用于输入信号x(n),通过幅度N1的FFT变换计算输入信号频谱XW(m),将窗口频谱WR(n)应用于分数基音候选A,通过幅度N2的FFT变换计算合成的信号频谱XW′(m,ω0),并计算使输入信号频谱XW(m)和合成信号频谱XW′(m,ω0)的误差能量El0)最小的声音数据的第I个谐波幅度Al0)。
以下将详细描述基于分数基音的谐波估算方法。图1是表示根据本发明第一个实施例的分数基音的谐波估算方法的框图。
参照图1,分数基音提取器100计算输入信号频谱XW(m)和合成的信号频谱XW′(m,ω0)的误差能量El0)。换言之,分数基音提取器100计算m个分数基音候选A中的一个输入信号频谱XW(m)的合成频谱XW′(m,ω0),搜索使作为分数基音误差的和的误差能量E(ω0)最小的最佳的分数基音候选频率,并选择基音的基频ω0
这里,输入信号的频谱XW(m)是通过对信号XW(n)的幅度N1信号进行FFT获得的信号,其中所述信号XW(n)是将窗口频谱WR(n)与输入信号X(n)相乘获得的。合成的信号频谱XW′(m,ω0)是使用存储的窗口频谱WR(m)和幅度N2,通过在分数基音候选频率的幅度N2进行FFT获得的信号。谐波幅度估算器110选择使谐波幅度最大的值作为用于使分数基音提取器100得到的误差能量最小的频率ω0最佳的谐波。
图2是表示根据本发明第一个实施例的分数基音的谐波估算方法的流程图。参照图2,通过将窗口频谱WR(n)与输入信号X(n)相乘产生获得信号XW(n)(S200)。对产生的信号XW(n)进行幅度N1的FFT变换,并产生输入信号频谱XW(m)(S201)。将产生的输入信号频谱XW(m)用于谐波估算装置的输入。其中m可以大于或等于0,且小于或等于N1。
使用窗口频谱WR(m)采用幅度N2来产生分数基音候选频率的合成信号的频谱XW′(m,ω0)(S202)。表达式1将合成的信号频谱XW′(m,ω0)计算如下:
表达式1:
X W ′ ( m , ω 0 ) = A 1 ( ω 0 ) | W R [ N 2 N 1 m - N 2 2 π ω 0 L + 0.5 ] |
在表达式1中,Al0)是谐波幅度。表达式1根据与谐波幅度Al0)成比例的窗口频谱WR(m,ω0)表示合成的信号频谱XW′(m,ω0)。
窗口频谱XW′(m,ω0)是分析窗口WR(n)的幅度N2(>>N1)的FFT频谱。分析窗口WR(n)具有长度NR,以包括两个或以上的基音周期P0。算子[x]表示取实数x的整数部分的计算。
使用第1个谐波频段的起点al和终点bl得到合成的信号频谱XW′(m,ω0)。通常使用汉明(Hamming)窗口或凯瑟(Kaiser)窗口作为分析窗口WR(n)。在表达式2中,al和bl表示如下:
表达式2
a l = [ N 1 2 π ( l - 0.5 ) ω 0 + 0.5 ]
b l = [ N 1 2 π ( l + 0.5 ) ω 0 + 0.5 ]
如果得到合成的信号频谱(S202),则在全部频段得到了输入信号频谱和合成信号频谱的误差能量El0)(S203)。使用表达式3来获得:
表达式3:
E l ( ω 0 ) = Σ m = a l b l { | X W ( m ) | - | X W ′ ( m , ω 0 ) | } 2
其中1≤l≤L,
Figure C0312418600114
在表达式3中,ω0是基频。XW(m)中m的幅度范围是0≤m≤N1。而且,1表示谐波数。误差能量E10)是输入信号频谱XW(m)的绝对值和合成信号频谱XW′(m,ω0)的绝对值之间差的平方从第1个谐波频段的起点al到该谐波频段终点bl的累加的和。
当通过表达式3获得误差能量时(S203),通过在M分数基音候选频率上重复步骤S202和步骤S203,选择使误差能量El0)最小的基音的基频ω0(S204)。这时,为使误差能量最小,可根据Al0)对表达式3进行偏微分 ∂ E l ∂ A l . = 0
表达式4如下:
表达式4:
A l = Σ m = a l b l | X W ( m ) | | W R [ N 2 N 1 m - N 2 2 π ω 0 l + 0.5 ] | Σ m = a l b l | W R [ N 2 N 1 m - N 2 2 π ω 0 l + 0.5 ] | 2
为提高由表达式4表示的谐波幅度Al0)的可靠性,应该首先搜索一种精确的分数基音,其中如表达式5表示的输入信号频谱和合成信号频谱的误差能量在给出的全部频段内最小。
表达式5:
E ( ω 0 ) = Σ l = 1 L E l ( ω 0 ) , ω 0 ( 0 ) ≤ ω 0 ≤ ω 0 ( M - 1 )
其中M是要搜索的分数基音候选频率数(如10)。进行步骤204后,将表达式4应用于得到的ω0,并得到最大谐波幅度Al(ω′0)(S205)。
第一个实施例是基于谐波分析方法的分数基音。在第一个实施例中,根据使用的基音的值,由固定的al和bl表示谐波频段的MMSE,并搜索精确的分数单元基音。如果由于分配的位或计算量的限制,使编码器的基音搜索精度退化,则原始信号频谱和合成的信号频谱的谐波中心频率之间的误差随着它进入高频而增加。因此,表达式4的分子的相关性隐含下降,以使谐波分析性能大幅地下降。性能取决于输入信号基音的精度,且精确的基音搜索需要大量的计算。
另一方面,如果不将谐波估算应用于整个频段,并根据频段对每个谐波频段进行自适应地控制,从而消除了输入基音和计算方法的相关性,应用一种名为DELTA(Δ)调整方法来减少基音搜索的计算量。在这种Δ调整方法中,将每个谐波对应的谐波频率间隔向左或右调整Δ,所述谐波使用整数基音单元来计算使输入信号频谱和合成信号频谱的误差能量最小的Δl,并使用Δl得到最大谐波幅度。
以下参照图3和4描述Δ调整方法。图3是表示根据本发明第二个实施例的使用Δ调整方法的谐波估算装置的框图。参照图3,Δ调整器300计算使用整数单元基音的谐波频率调整值Δl的范围dl,并选择使Al(Δ)最大的Δl作为使用属于已得到的范围dl的Δl的最佳的频率调整值。谐波幅度估算器310选择使谐波幅度最大的值作为用于频率调整值Δl的最佳的谐波,所述Δl使由Δ调整器300得到的误差能量最小。
图4是表示根据本发明第二个实施例的使用Δ调整方法的谐波估算装置的流程图。参照图4,窗口频谱WR(n)乘以输入信号XW(n),产生新的输入信号XW(n)(S400)。通过进行幅度N1的FFT变换产生的输入信号XW(n),并产生输入信号频谱XW(m)(S401)。产生的输入信号频谱XW(m)作为谐波估算装置的输入。幅度m大于或等于0,且小于或等于N1。
然后,在步骤S401后,通过表达式1使用幅度N2的窗口频谱WR(m),产生整数基音候选频率的合成信号频谱XW′(m,ω0)(S402)。通过表达式2获得合成信号频谱XW′(m,ω0)的第I个谐波频段的起点al和终点bl。然后,在步骤S402后,使用整数单元基音得到谐波频率调整值Δl的极限值dl(S403),通过表达式6得到dl
表达式6:
d l = α 2 - α 1 L - 1 ω 0 ( l - 1 ) + α 2 ω 0
在表达6中,dl表示谐波频率调整值Δl的范围,并且dl的值与频率成比例,且在低频段小,在高频段大。
在步骤S403后,在得到的范围dl中使用表达式7,在频率调整值的范围内得到使误差能量Ell)最小的Δl(S404),表达式7如下:
表达式7:
E l ( Δ l ) = Σ m = a l b l { | X W ( m + Δ l ) | - | X W ′ ( m , ω 0 ) | } 2
表达式7表示了XW(m+Δ)的绝对值和XW′(m,ω0)的绝对值之间的差的平方从谐波频段的起点al到谐波频段的终点bl的和。
Δl的范围从-dl到dl。将在步骤404得到的Δl应用于表达式8,并得到最大谐波幅度(S405)。表达式8如下:
表达式8:
A l = Σ m = a l b l | X W ( m + Δ l ) | | W R [ N 2 N 1 m - N 2 2 π ω 0 l + 0.5 ] | Σ m = a l b l | W R [ N 2 N 1 m - N 2 2 π ω 0 l + 0.5 ] | 2
第二个实施例的谐波幅度估算器310选择使谐波幅度最大的值作为最佳的用于频率调整值的谐波,所述频率调整值使由Δ调整器300通过输入信号频谱的绝对值与合成信号频谱的绝对值的差的平方得到的误差能量最小。
在Δ调整方法中的谐波估算方法中,使用整数基音来调整谐波间隔,并得到使误差能量最小的谐波幅度,从而能够减小在高频段产生的谐波估算误差。但是,由于基音的变化或类似原因,可能产生谐波估算误差。
为解决这一问题,使用了Δ调整和峰峰值的谐波估算方法。换言之,将每个谐波的峰值确定为谐波的代表值,并估算谐波。在全部频段,使用上述方法使原始信号频谱的谐波峰值和合成信号频谱的谐波峰值彼此重合,将表达式4的分子的相关性设置到大,从而在高频段使用Δ调整来最后估算谐波幅度。这将参照图5和图6进行描述。
图5是表示根据本发明第三个实施例的使用Δ调整方法和峰值提取的谐波估算装置的结构图。参照图5,使用Δ调整和峰值提取的谐波估算装置包括:峰值提取器500、Δ调整器510和谐波幅度估算器520。通过将窗口频谱WR(n)应用于输入声音信号x(n)来产生输入信号频谱XW(m),并进行幅度N1的FFT变换。通过将窗口频谱WR(m)应用于整数基音候选频率产生合成信号频谱XW′(m,ω0),并进行幅度N2的FFT。
峰值提取器500从全部频段中提取峰值。换言之,峰值提取器500将全部频段分为一个谐波,并计算最大值作为每个谐波的代表值。在全部频段上,提取的峰值在原始信号频谱和合成的信号频谱的每个谐波重合。换言之,确定与谐波的峰值重合的峰值τpp定位在ω0×I的±(1/2)ω0的范围内的原始信号频谱XW(m)的最大值,对应于合成信号频谱中的每个谐波峰值位置。
该Δ调整器510使用整个频段内最大值来计算频率调整值Δl的范围dl,并选择使Al(Δ)最大的Δl作为使用属于范围dl的Δl的频率调整值。上述谐波频率调整的极限值如下得到:
Figure C0312418600151
谐波幅度估算器520选择使谐波幅度最大的值作为使用频率调整值Δl的最佳的谐波,所述Δl使Δ调整器510得出的误差最小。
图6是表示根据本发明第三个实施例的使用Δ调整方法和峰值提取的谐波估算装置的详细图。参照图6,使用Δ调整和峰值提取的谐波估算装置包括:窗口单元600、傅立叶变换器610、峰值和Δ调整器620、谐波频段频谱合成器630、合成器640、谐波波段误差能量提取器650、误差能量确定器660和谐波幅度估算器670。
窗口单元600将窗口频谱WR(n)应用于输入声音信号x(n),并产生XW(n)。傅立叶变换器610在窗口单元600产生的XW(n)上进行幅度N1的FFT,并产生输入信号频谱XW(m)。峰值检取和Δ调整器620提取谐波的峰值τpp,并使用整数单元基音计算谐波频率调整值Δl的范围d1。谐波频段频谱合成器630将窗口频谱WR(m)应用于整数基音候选频率ω0,并产生具有幅度N2的合成信号频谱XW′(m,ω0)。
合成器640从峰值提取和Δ调整器620的输出减去谐波频谱合成器630的输出,并输出减法的结果。换言之,输出从XW(m+τpp+Δl)-XW′(m,ω0)的计算结果。谐波频段误差能量提取器650使用从合成器640接收的谐波频率调整值Δl的范围dl计算误差能量,并由峰值提取和Δ调整器620得到。
误差能量判定器660确定由谐波频段误差能量提取器650得到的误差能量Δl是否最小。如果误差能量判定器660判定的结果是在Δl得到的能量最小,则将误差能量最小的信息传送到谐波幅度估算器670。误差能量最小的信息可以是误差最小的Δ* l
如果误差能量判定器660判定的结果在Δ*l得到的误差能量不是最小,则误差能量判定器660提取在得到的谐波频率调整Δl的范围内至少一个候选频率。然后,误差能量判定器660将提取的候选频率传送到峰值提取和Δ调整器620。然后,由于另一候选频率,将由峰值提取和Δ调整器620调整的输入信号频谱作为误差能量经由合成器640传送到谐波频段误差能量提取器650。误差能量判定器660判定传送的Δl是否使误差能量最小。谐波幅度估算器670从误差能量判定器660接收在Δ* l的最小的误差能量,并使用得到的dl和峰值τpp计算最终的谐波幅度Al* l)。这里1≤I≤L,
Figure C0312418600161
换言之,确定由每个谐波的峰值作为谐波的代表值,并使全部频段中每个原始信号频谱的谐波峰值与合成信号频谱的谐波峰值重合,从而表达式4中分子的相关性大。因此,在高频段使用Δ调整方法最终估算谐波幅度。
图7是表示根据本发明第三个实施例的使用Δ调整方法和峰值提取的谐波估算装置的流程图。参照图7,将窗口频谱WR(n)应用于输入信号x(n),并产生XW(n)(S700)。通过幅度N1的FFT变换产生的XW(n),并产生输入信号频谱XW(m)(S701)。将产生的输入信号频谱XW(m)作为谐波估算装置的输入。幅度m大于或等于0,且小于或等于N1。
在步骤S701后,使用如表达式1所示幅度为N2的窗口频谱WR(n),产生整数音基候选的合成的信号频谱XW′(m,ω0)(S702)。使用表达式2获得合成信号频谱XW′(m,ω0)的第I个谐波频段的起点al和终点bl。在步骤S702之后,提取在全部谐波频段的每个最大值(峰值=τpp)(S703)。提取的最大值可以是τpp。
在步骤S703后,使用整数单位基音每个谐波频段的调整值Δl的极限值dl(S704)如表达式9。
表达式9:
d l = α L - 1 ω 0 ( l - 1 )
在表达9中,dl表示谐波频率调整值Δl的范围,范围为从-dl到dl,dl的值与频率成比例,且在低频段小,在高频段大,且α是表示根据频段调整范围变化的常数,小于或等于0.5。
在步骤S704后,使用得到的谐波频率调整值的范围dl和峰值τpp调整谐波频率,在频率调整值的范围内得到使由表达式10表示的误差能量最小的Δl
表达式10:
E l ( Δ l ) = Σ m = a l b l { | X W ( m + Δ l + τpp ) | - | X W ′ ( m , ω 0 ) | } 2
表达式10表示了XW(m+Δ)的绝对值和XW′(m,ω0)的绝对值之间的差的平方从谐波频段的起点al到谐波频段的终点bl的和,所述XW′(m,ω0)受到谐波频率调整值的影响。
将在步骤S705中表达式9得到的最小值dl和表达式10得到的谐波调整Δ* l应用于表达式11,并得到最终的谐波幅度(S706)。
表达式11:
A l = Σ m = a l b l | X W ( m + Δ l + τpp ) | | W R [ N 2 N 1 m - N 2 2 π ω 0 l + 0.5 ] | Σ m = a l b l | W R [ N 2 N 1 m - N 2 2 π ω 0 l + 0.5 ] | 2
这里,-dl≤Δ≤dl d l = αω 0 L - 1 ( l - 1 )
在表达式11中,常数α是表示根据频段调整范围变化的常数,小于或等于0.5,且由实验决定。
确定峰值τpp在对应于合成的信号频谱中的每个谐波峰值位置的ω0×1的±(1/2)ω0的范围内位于原始信号频谱的最大值,且得出与该值对应的使误差能量最小的Δ* l。如表达式11所示,通过添加Δ值到输入信号频谱,并提取峰值进一步调整该值,可以更精确地得出最终的幅度Al
图8表示仅使用Δ调整方法的情况下合成信号的频谱。图9表示根据本发明实施例的使用Δ调整方法和峰值提取方法的情况下合成信号的频谱。使用Δ调整方法和峰值提取方法情况下的误差范围小于仅使用Δ调整方法的情况。
如上所述,根据本发明,提供了声音编码器中估算谐波的装置和方法,其使用峰值提取和Δ调整技术减少了计算量。声音编码器中估算谐波的装置和方法在使用数字信号处理器(DSP)的实时处理中是非常有效的,且DSP的计算量是重要的。根据本发明的声音编码器中估算谐波的装置和方法,通过提供低传输速率声音编码器的技术,能够替代传统技术。
对于本领域普通技术人中来说,本发明的各种修改与变化是显而易见的。因此,本发明所附的权利要求中包括本发明的修改与变化,其都落在所附权利要求及其等效的范围内。

Claims (14)

1.一种谐波估算方法,包括:
将窗口频谱应用于输入信号,对产生的频谱进行预定幅度的快速傅立叶变换,并计算输入信号频谱;
使用与第一基频、谐波幅度和高频信号幅度的至少一个成比例的窗口频谱,产生整数基音候选和分数基音候选的至少一个的合成的信号频谱;
计算输入信号频谱和合成信号频谱的误差能量,并计算使误差能量最小的第二基频和该高频的调整值的至少一个;以及
在所述第二基频以及通过使用高频的调整值的至少一个来计算最大谐波幅度。
2.根据权利要求1所述的方法,其中通过重复计算输入信号频谱和M个分数基音候选的合成信号频谱的步骤来选择所述使误差能量最小的第二基频。
3.根据权利要求1所述的方法,其中整数基音候选的操作进一步包括下列步骤:
计算高频的调整值,在所述高频,得到的每个频段的输入信号频谱和合成信号频谱的误差能量在使用整数基音候选频率的谐波频率调整值的范围内最小;以及
使用高频的调整值计算最大谐波幅度,在所述高频每个频段的误差能量最小。
4.如权利要求3所述的方法,其中通过输入信号频谱的绝对值和合成的信号频谱的绝对值之间的差的平方,通过从频段的起点到该频段的终点的差的平方的累加,来选择所述使每个频段的误差能量最小的高频的调整值,以及选择高频的调整值,在所述高频,误差能量在所累加的值中的高频的调整值的极值范围内是最小的。
5.如权利要求3所述的方法,其中所述谐波的幅度通过以下步骤估算:
如果得出输入信号频谱和合成信号频谱,则在每个谐波频段计算最大值点和谐波频率调整值的极限值;
计算得出的输入信号频谱和合成信号频谱的每个频段的误差能量;
计算得出的谐波频率调整值和得出的使误差能量最小的最大值点;以及
通过使用得出的谐波频率调整值和得出的最大值点计算最终的谐波幅度。
6.如权利要求5所述的方法,其中通过输入信号频谱的绝对值和合成信号频谱的绝对值之间差的平方,并将所有谐波频段的差的平方累加,得到所述误差能量。
7.如权利要求5所述的方法,其中通过以下公式得到谐波频率调整值的极限值。
8.一种谐波估算装置,包括:
谐波频率调整器,其计算谐波频率调整值的范围,并在使每个频段误差能量最小的范围内选择谐波频率调整值;以及
谐波幅度估算器,其使用使误差能量最小的谐波频率调整值,估算每个频段的最大谐波幅度。
9.根据权利要求8所述的装置,其中所述谐波频率调整值的范围,与频率成比例,且该范围在低频段小,在高频段大。
10.根据权利要求8所述的装置,其中所述误差能量是通过输入信号频谱的绝对值和合成信号频谱的绝对值之间差的平方,以及通过累加从频段的起点到该频段终点的差的平方来得到的。
11.根据权利要求8所述的装置,其中所述谐波幅度是使用使误差能量最小的谐波频率调整值和在每个频段上的原始频谱和合成频谱的谐波重合的峰值来估算的。
12.根据权利要求8所述的装置,进一步包括峰值提取装置,用于在提取每个频段的原始频谱和合成频谱的谐波重合的峰值。
13.根据权利要求8所述的装置,其中所述谐波频率调整器使用所述范围内的最佳的频率调整值来选择使谐波幅度最大的值。
14.根据权利要求8所述的装置,其中如果所述调整值不是使误差能量最小的调整值,则所述谐波频率调整器调整所述调整值为其范围内的另一值。
CNB031241867A 2002-04-30 2003-04-30 估算声音编码器的谐波的装置和方法 Expired - Fee Related CN1266671C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR23751/2002 2002-04-30
KR10-2002-0023751A KR100446242B1 (ko) 2002-04-30 2002-04-30 음성 부호화기에서 하모닉 추정 방법 및 장치

Publications (2)

Publication Number Publication Date
CN1455390A CN1455390A (zh) 2003-11-12
CN1266671C true CN1266671C (zh) 2006-07-26

Family

ID=29244811

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB031241867A Expired - Fee Related CN1266671C (zh) 2002-04-30 2003-04-30 估算声音编码器的谐波的装置和方法

Country Status (3)

Country Link
US (1) US20030204543A1 (zh)
KR (1) KR100446242B1 (zh)
CN (1) CN1266671C (zh)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SG120121A1 (en) * 2003-09-26 2006-03-28 St Microelectronics Asia Pitch detection of speech signals
KR100707184B1 (ko) * 2005-03-10 2007-04-13 삼성전자주식회사 오디오 부호화 및 복호화 장치와 그 방법 및 기록 매체
CN101180676B (zh) * 2005-04-01 2011-12-14 高通股份有限公司 用于谱包络表示的向量量化的方法和设备
US20070011001A1 (en) * 2005-07-11 2007-01-11 Samsung Electronics Co., Ltd. Apparatus for predicting the spectral information of voice signals and a method therefor
KR100713366B1 (ko) * 2005-07-11 2007-05-04 삼성전자주식회사 모폴로지를 이용한 오디오 신호의 피치 정보 추출 방법 및그 장치
KR100770839B1 (ko) 2006-04-04 2007-10-26 삼성전자주식회사 음성 신호의 하모닉 정보 및 스펙트럼 포락선 정보,유성음화 비율 추정 방법 및 장치
KR100762596B1 (ko) * 2006-04-05 2007-10-01 삼성전자주식회사 음성 신호 전처리 시스템 및 음성 신호 특징 정보 추출방법
KR100735343B1 (ko) 2006-04-11 2007-07-04 삼성전자주식회사 음성신호의 피치 정보 추출장치 및 방법
KR100827153B1 (ko) 2006-04-17 2008-05-02 삼성전자주식회사 음성 신호의 유성음화 비율 검출 장치 및 방법
CN101552005A (zh) * 2008-04-03 2009-10-07 华为技术有限公司 编码方法、解码方法、系统及装置
KR101547344B1 (ko) 2008-10-31 2015-08-27 삼성전자 주식회사 음성복원장치 및 그 방법
CN101814291B (zh) * 2009-02-20 2013-02-13 北京中星微电子有限公司 在时域提高语音信号信噪比的方法和装置
CN102714040A (zh) * 2010-01-14 2012-10-03 松下电器产业株式会社 编码装置、解码装置、频谱变动量计算方法和频谱振幅调整方法
US9418671B2 (en) * 2013-08-15 2016-08-16 Huawei Technologies Co., Ltd. Adaptive high-pass post-filter
JP6724932B2 (ja) * 2018-01-11 2020-07-15 ヤマハ株式会社 音声合成方法、音声合成システムおよびプログラム
CN109324502B (zh) * 2018-08-22 2020-01-07 浙江大学 一种疲劳试验机周期波形的谐波控制方法
CN117116245B (zh) * 2023-10-18 2024-01-30 武汉海微科技有限公司 声音信号的谐波生成方法、装置、设备及存储介质

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5574823A (en) * 1993-06-23 1996-11-12 Her Majesty The Queen In Right Of Canada As Represented By The Minister Of Communications Frequency selective harmonic coding
JPH09237100A (ja) * 1996-02-29 1997-09-09 Matsushita Electric Ind Co Ltd 音声符号化・復号化装置
US6456965B1 (en) * 1997-05-20 2002-09-24 Texas Instruments Incorporated Multi-stage pitch and mixed voicing estimation for harmonic speech coders
KR100416754B1 (ko) * 1997-06-20 2005-05-24 삼성전자주식회사 다중 밴드 여기 음성 부호화기에서 매개변수 추정 장치 및 방법
US5999897A (en) * 1997-11-14 1999-12-07 Comsat Corporation Method and apparatus for pitch estimation using perception based analysis by synthesis
US6253171B1 (en) * 1999-02-23 2001-06-26 Comsat Corporation Method of determining the voicing probability of speech signals
US6418407B1 (en) * 1999-09-30 2002-07-09 Motorola, Inc. Method and apparatus for pitch determination of a low bit rate digital voice message
US6963833B1 (en) * 1999-10-26 2005-11-08 Sasken Communication Technologies Limited Modifications in the multi-band excitation (MBE) model for generating high quality speech at low bit rates
JP3325248B2 (ja) * 1999-12-17 2002-09-17 株式会社ワイ・アール・ピー高機能移動体通信研究所 音声符号化パラメータの取得方法および装置
KR100337293B1 (ko) * 2000-08-24 2002-05-17 서평원 음성부호화기에서 고조파 추정 방법

Also Published As

Publication number Publication date
KR20030085354A (ko) 2003-11-05
KR100446242B1 (ko) 2004-08-30
US20030204543A1 (en) 2003-10-30
CN1455390A (zh) 2003-11-12

Similar Documents

Publication Publication Date Title
CN1266671C (zh) 估算声音编码器的谐波的装置和方法
CN1154086C (zh) Celp转发
CN1248190C (zh) 快速频域音调估计方法和装置
CN1146862C (zh) 音调提取方法和装置
CN1125432C (zh) 基于声码器的语音识别器、识别方法及数字蜂窝电话
CN1655236A (zh) 用于预测量化有声语音的方法和设备
CN1150516C (zh) 语音编码方法和语音编码器
CN101061535A (zh) 用于人工扩展语音信号的带宽的方法和装置
CN1265217A (zh) 在语音通信系统中语音增强的方法和装置
CN101044554A (zh) 可扩展性编码装置、可扩展性解码装置以及可扩展性编码方法
CN1274456A (zh) 语音编码器
CN1193786A (zh) 频谱幅度的双子帧量化
CN1285945A (zh) 一种用于对声音编码、同时抑制声学背景噪声的系统和方法
CN1826632A (zh) 用于语音信号的组合频域和时域音高提取的系统和方法
CN1795495A (zh) 音频编码设备、音频解码设备、音频编码方法和音频解码方法
CN1238058A (zh) 语音处理系统
CN1750124A (zh) 带限音频信号的带宽扩展
CN1552059A (zh) 分布式语音识别系统中语音识别的方法和设备
CN100336101C (zh) 减少对于码本搜索的存储要求的装置和方法
CN1675684A (zh) 具有后端声音活动检测的分布式语音识别设备和方法
CN101044552A (zh) 语音编码装置和语音编码方法
CN1083294A (zh) 对语音编码的随时间变化的频谱按内插法进行分析的方法
CN1210685C (zh) 语音编码中噪音鲁棒分类方法
CN101031960A (zh) 可扩展性编码装置和可扩展性解码装置及其方法
CN1303586C (zh) 使用共振峰增强对话的方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: LG- NORTEL CO., LTD.

Free format text: FORMER OWNER: LG ELECTRONIC CO., LTD.

Effective date: 20061124

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20061124

Address after: Seoul, South Kerean

Patentee after: LG-Nortel Corp.

Address before: Seoul, South Kerean

Patentee before: LG Electronics Inc.

C56 Change in the name or address of the patentee

Owner name: LG-ERICSSON CO., LTD.

Free format text: FORMER NAME: LG-NORTEL CO., LTD.

CP01 Change in the name or title of a patent holder

Address after: Seoul, South Kerean

Patentee after: LG-Ericsson Co.,Ltd.

Address before: Seoul, South Kerean

Patentee before: LG-Nortel Corp.

ASS Succession or assignment of patent right

Owner name: ERICSSON-LG ENTERPRISE CO., LTD.

Free format text: FORMER OWNER: ERICSSON-LG CO., LTD.

Effective date: 20140212

C56 Change in the name or address of the patentee

Owner name: ERICSSON-LG CO., LTD.

Free format text: FORMER NAME: LG-ERICSSON CO., LTD.

CP01 Change in the name or title of a patent holder

Address after: Seoul, South Kerean

Patentee after: ERICSSON-LG Co.,Ltd.

Address before: Seoul, South Kerean

Patentee before: LG-Ericsson Co.,Ltd.

CP03 Change of name, title or address
TR01 Transfer of patent right

Effective date of registration: 20140212

Address after: Gyeonggi Do, South Korea

Patentee after: Ericsson -LG enterprise Kabushiki Kaisha

Address before: Seoul, South Kerean

Patentee before: ERICSSON-LG Co.,Ltd.

TR01 Transfer of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20060726

Termination date: 20180430

CF01 Termination of patent right due to non-payment of annual fee