CN1934618A - 恢复声音信号的谐频的方法 - Google Patents

恢复声音信号的谐频的方法 Download PDF

Info

Publication number
CN1934618A
CN1934618A CNA2005800085761A CN200580008576A CN1934618A CN 1934618 A CN1934618 A CN 1934618A CN A2005800085761 A CNA2005800085761 A CN A2005800085761A CN 200580008576 A CN200580008576 A CN 200580008576A CN 1934618 A CN1934618 A CN 1934618A
Authority
CN
China
Prior art keywords
peak
harmonics
frequency
phase
voice signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2005800085761A
Other languages
English (en)
Inventor
让-伯纳德·劳尔特
马蒂厄·拉格兰奇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Orange SA
Original Assignee
France Telecom SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by France Telecom SA filed Critical France Telecom SA
Publication of CN1934618A publication Critical patent/CN1934618A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/093Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters using sinusoidal excitation models

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

本发明涉及一种用于恢复其频率<i>O</i>和相位<i>?</i><i></i>已知的峰<i>P</i><i>i</i><i></i>与峰<i>P</i><i>i+N</i>之间的声音信号的谐频的方法(1)。本发明方法(1)包括下列步骤:估计(2)该谐频的缺失峰<i>P</i><i>i+1</i>到<i>P</i><i>i+N-1</i><i></i>中的每一个的频率O<i></i>;对于之前估计的所有频率O,从峰<i>P</i><i>i</i><i></i>的相位到峰<i>P</i><i>i+N</i>的相位,逐个峰地计算(3)所执行的相位<i>?</i>;计算(4)在同一峰<i>P</i><i>i+N</i><i></i>处的所执行的相位<i>?</i>与已知相位之间的相位误差<i>err?</i>;以及按照相位误差<i>err?</i>,将每个所执行的相位<i>?</i>校正(5)一个值。

Description

恢复声音信号的谐频的方法
技术领域
本发明涉及通信领域,具体涉及声音信号的数字处理和声音信号的谐波表示的领域。
背景技术
在数字音频信号的谐波建模(harmonic modeling)中,声音信号用一组振荡器表示,振荡器的参数(频率、幅度、相位)随着时间缓慢变化。谐波分析包括用于确定这些参数值的短期时间/频率分析,之后提取峰(peak),然后跟踪谐频(partial)。
要建模的信号被分成l个采样的帧(典型地l=1024)。短期时间/频率分析模块(典型地执行傅立叶变换)计算每帧的信号的短期频谱。用于提取峰的模块仅保留先验的最有关的峰,例如,一个准则是仅保留能量最高的峰。第三和最后模块尝试将峰在时间上彼此连接起来,即,从一帧到另一帧,以形成谐频。在其生存期内,每个谐频对应于一个振荡器。
这种类型的分析和表示尤其可以用在降比特率编码、参数编码(处理信号的三个方面:瞬变、正弦曲线、噪声)、声音源的分离和索引(indexing)、以及声音文件的恢复期间。
目前公认的是,当利用Robert J.McAulay和Thomas F.Quatieri在论文″Speech Analysis/Synthesis Based on a Sinusoidal Representation″,IEEETransactions on Acoustics,Speech and Signal Processing,pp.744-754,1986,或者Laurent Girin,Sylvain Marchand,Joseph di Martino,Axel Rbel和GeoffroyPeeters在论文″Comparing the order of a Polynomial Phase Model for theSynthesis of Quasi-Harmonic Audio Signals″,WASPAA,New Paltz,NY,USA,October 2003中提出的相位内插技术来合成谐频时,获得最好的质量。这些技术用于通过使用三阶或五阶多项式计算所有的中间相位,来合成从峰(Ai,fi,i)到峰(Ai+1,fi+1,i+1)的谐频,其中频率由求导推出。仅当已知起始和结束频率以及相位时,才使用三阶内插。当还已知相位的二阶变分(second ordervariation)时,使用五阶内插(这些等效于频率的一阶变分,原因在于按照定义,频率是相位的导数)。
峰Pi(Ai,fi,i)与Pi+1(Ai+1,fi+1,i+1)之间谐频的合成包括计算帧 i与i+1之间的谐频的值p(n):
pi(n)=p(li+n)=Ai(n)cos(i(n)),n=0,...,l-1    (1)
为此,现有技术中已知使用下面两种内插法之一来计算所有的中间相位。
对于根据McAulay的三阶内插,根据下面的表达式计算相位,其中Te是采样周期:
i(n)=i+2πfinTe+α(nTe)2+β(nTe)3    (2)
通过求解(fi,i,fi+1,i+1)中的等式系统来计算两个未知数α和β。频率通过微分导出:
2πfi(n)=2πfi+2αnTe+3β(nTe)2    (3)
对于根据Girin等人的五阶内插,在峰Pi和Pi+1处频率的一阶变分δfi和δfi+1假定是已知的。然后根据下面的表达式计算相位:
通过求解(fi,fi+1,i,i+1,δfi,δfi+1)中的等式系统来计算三个未知数β,δ,γ。频率通过微分导出:
2πfi(n)=2πfi+δfinTe+3β(nTe)2+4γ(nTe)3+5δ(nTe)4    (5)
由于各种原因,可能会出现在分析结束和/或在合成开始时信号中的特定谐频缺失、损坏或不连续的情况。例如,如果发生分组丢失,则在因特网声音程序广播应用中的解码器的输入处可能缺失特定谐频,如果要分析的信号受到不需要的信号(噪声、滴答(click)、其他信号等)的干扰,则它们可能损坏,或者如果它们的能量太低以至于不能被连续地正确检测,则它们可能是不连续的。为了创建尽可能接近原始信号的合成信号,于是有必要恢复缺失峰。这使得创建其每一个都以幅度、频率和相位来表征的峰成为必要。
上述现有技术的内插技术用于合成对应于缺失峰的部分以及恢复谐频。
然而,这些现有技术的内插技术适于在短期,即,在小于10毫秒(ms)的周期上使用。对于较长的周期,重新合成的信号常常与原始信号有很大不同,并且可能出现令人不快的赝音(artifact)。这些技术确保已有峰与恢复的峰之间的相位连续性,但是不能控制由等式(3)和(5)引起的感应频率。该效果与内插距离成正比增加。
发明内容
本发明的一个目的是提出一种对该问题的替代解决方案,尤其是在缺失部分对应于长的周期(大于10ms)的情况下恢复被识别为谐频的丢失部分的丢失部分,而现有技术对此情况效果相对较差。
因此,本发明要解决的技术问题是提出一种在谐波分析期间恢复声音信号的谐频的丢失部分的方法,在谐波分析中,声音信号被分成时间帧,对时间帧应用时间/频率分析,其提供由采样频率帧表示的连续短期频谱,该分析还在于提取频率帧中的频谱峰并将它们在时间上连接在一起以形成谐频,该方法是现有技术解决方案的替代。
根据本发明,所述技术问题的一个解决方案在于,所述恢复其频率ω和相位已知的峰Pi与峰Pi+N之间的谐频的方法特征在于它包括步骤:
·估计该谐频的缺失峰Pi+1到Pi+N-1中的每一个的频率
Figure A20058000857600071
·对于之前估计的所有频率 从峰Pi的相位到峰Pi+N的相位,逐个峰地计算相位
·计算在同一峰Pi+N处的计算出的相位
Figure A20058000857600074
与已知相位之间的相位误差err;
·将每个计算出的相位 校正一个值,该值是相位误差err的函数。
本发明的方法与现有技术方法的不同之处在于,它提供对丢失峰的频率的更精细控制和随后对应相位的计算,以确保与已有峰的相位的连续性。因此,与上述现有技术方法相对比,本发明的方法没有赝音地重新合成对应于丢失谐频部分的信号。
本发明的方法还具有这样的优点,即,重构信号,该信号与现有技术方法获得的信号相比,在重构误差方面与原始信号更接近。
最后,本发明的方法具有使用低复杂度算法的优点。
本发明还在于一种合成声音信号的合成器,用于实现恢复峰Pi与峰Pi+N之间的谐频的方法,例如是适于使用本发明方法的音频解码器或参数编码器。
本发明还在于一种可直接加载到上述合成器或合成器组的内部存储器中的计算机程序产品,该产品包括软件代码部分,用于当在合成器或合成器组上执行程序时,执行根据本发明的方法的步骤。
本发明还在于一种可在上述合成器或合成器组中使用的介质,其上存储有可直接加载到合成器或合成器组的内部存储器中的计算机程序产品,该产品包括软件代码部分,用于当在合成器或合成器组上执行程序时,执行根据本发明的方法的步骤。
附图说明
在下面参照附图给出的描述期间,本发明的其他特征和优点将变得清楚,其中描述是通过非限制性的示例方式提供的。
图1是本发明的一个示例的流程图。
图2是使用本发明方法的一个示例的图。
具体实施方式
本发明的方法1以下面参照图1流程图描述的方式进行。该方法在于恢复其频率ω和相位已知的峰Pi和峰Pi+N之间的谐频。
在第一步骤2中,该方法例如通过现有技术中已知的线性预测法或内插法,估计缺失峰Pi+1到Pi+N-1的每一个的频率
Figure A20058000857600081
和幅度A。
考虑包括一连串相连的峰Pi(Ai,ωi,i)的谐频,Pi(Ai,ωi,i)在时间iT处是已知的,并且由下列表征:
Ai,在时间iT处峰的幅度;
ωi,在时间iT处峰的频率;和
i,在时间iT处峰的相位模2π。
利用例如ωi与ωi+N之间的线性内插,或者例如论文″Enhanced PartialTracking using linear Prediction″,Mathieu Lagrange,Sylvain Marchand,MartinRaspaud and Jean-Bernard Rault,Proceedings of the Digital Audio Effects(DAFx)Conference,pp 141-146,Queen Mary College,University of London,UK,September 2003中所描述的线性过去或未来预测(past or future prediction),或者利用加权的过去或未来合并,来估计峰Pi与Pi+N之间的缺失峰的频率。
通过例如Ai与Ai+N之间的线性内插,线性过去或未来预测或者加权的过去或未来合并,来估计缺失峰的幅度A。
在第二步骤3中,该方法从峰Pi的相位到峰Pi+N的相位,逐个峰地计算相位 对之前估计的每个频率ω执行该计算。
令i和ωi为起始相位和频率,并且
Figure A20058000857600083
为要重构的范围内的估计频率。为了扩展峰Pi与峰Pi+N之间的谐频,根据下面表达式计算相位:
Figure A20058000857600091
为了避免产生将会影响重新合成的质量的不连续,有必要得到在时间i+N处等于i+N的重构相位 在上述表达式(6)中的数据要么是近似的要么是预测的情况下,统计上是不可能得到该相等的。因此,该方法的后继步骤将在时间i+N处计算的相位误差err分到所有之前重构的缺失峰Pi+1到Pi+N-1之间。
在第三步骤4中,该方法计算在同一峰Pi+N处的计算出的相位 与已知相位i+N之间的相位误差err。该计算可以使用下面的等式系统:
如果
如果
Figure A20058000857600096
否则
Figure A20058000857600098
在第四步骤5中,该方法将每个计算出的相位 校正一个值,该值是相位误差err的函数。典型地根据下面表达式,将在时间i+N处计算出的相位误差均匀分到计算出的相位之间:
Figure A200580008576000910
该分布不必是均匀的,并且可以服从例如非线性法则。
图2使用的例子在于在声音信号的谐波分析时,例如在参数编码期间,利用本发明的方法1恢复谐频。声音信号s(n)用一组振荡器表示,振荡器的参数(频率、幅度)随着时间缓慢变化。按常规的方式,谐波分析包括用于确定这些参数的值的短期时间/频率分析6,之后提取峰7,然后跟踪谐频8。在通过本发明的方法1恢复谐频之前,检测谐频中的间隙9。然后将通过执行方法1重构的峰 作为由谐波分析产生的峰对待,并且可以通过例如现有技术的(三阶或五阶)相位内插法之一,进行与从这些重构的峰恢复的谐频对应的信号的加性合成10。

Claims (16)

1.一种在谐波分析期间恢复声音信号的谐频的方法(1),在谐波分析中,声音信号被分成时间帧,对时间帧应用时间/频率分析,其提供由采样频率帧表示的连续短期频谱,该分析还在于提取频率帧中的频谱峰并将它们在时间上连接在一起以形成谐频,所述恢复其频率和相位已知的峰Pi与峰Pi+N之间的谐频的方法特征在于,它包括步骤:
·估计(2)该谐频的缺失峰Pi+1到Pi+N-1中的每一个的频率
·对于之前估计的所有频率
Figure A2005800085760002C2
从峰Pi的相位到峰Pi+N的相位,逐个峰地计算(3)相位
Figure A2005800085760002C3
·计算(4)在同一峰Pi+N处的计算出的相位 与已知相位之间的相位误差err;
·将每个计算出的相位
Figure A2005800085760002C5
校正(5)一个值,该值是相位误差err的函数。
2.如权利要求1所述的用于恢复声音信号的谐频的方法(1),其中,相位 是根据下面的公式计算出的,其中i &omega; ^ i = &omega; i 是峰Pi的相位和频率,并且i+N &omega; ^ i + N = &omega; i + N 是峰Pi+N的相位和频率:
3.如权利要求1或2所述的用于恢复声音信号的谐频的方法(1),其中,通过已知峰Pi与Pi+N的频率之间的线性内插,来估计缺失峰Pi+1到Pi+N-1的频率
Figure A2005800085760002C10
4.如权利要求1或2所述的用于恢复声音信号的谐频的方法(1),其中,通过线性过去预测来估计缺失峰Pi+1到Pi+N-1的频率
5.如权利要求1或2所述的用于恢复声音信号的谐频的方法(1),其中,通过线性未来预测来估计缺失峰Pi+1到Pi+N-1的频率
Figure A2005800085760002C12
6.如权利要求1或2所述的用于恢复声音信号的谐频的方法(1),其中,通过线性过去预测和线性未来预测的加权组合,来估计缺失峰Pi+1到Pi+N-1的频率
7.如前面任一权利要求所述的用于恢复声音信号的谐频的方法(1),还包括步骤:通过已知峰Pi与Pi+N的幅度A之间的线性内插,估计谐频的缺失峰Pi+1到Pi+N-1中的每一个的幅度。
8.如权利要求1到6中任一个所述的用于恢复声音信号的谐频的方法(1),还包括步骤:通过线性过去预测来估计谐频的缺失峰Pi+1到Pi+N-1中的每一个的幅度。
9.如权利要求1到6中任一个所述的用于恢复声音信号的谐频的方法(1),还包括步骤:通过线性未来预测来估计谐频的缺失峰Pi+1到Pi+N-1中的每一个的幅度。
10.如权利要求1到6中任一个所述的用于恢复声音信号的谐频的方法(1),还包括步骤:通过线性过去预测和线性未来预测,来估计谐频的缺失峰Pi+1到Pi+N-1中的每一个的幅度。
11.如前面任一权利要求所述的用于恢复声音信号的谐频的方法(1),其中,相位校正在于将在时间i+N处的计算出的相位误差err均匀分布到谐频的所有缺失峰Pi+1到Pi+N-1之间。
12.如权利要求11所述的用于恢复声音信号的谐频的方法(1),其中,相位校正是由等式确定的:
Figure A2005800085760003C1
13.如权利要求12所述的用于恢复声音信号的谐频的方法(1),其中,相位校正是使用等式系统确定的:
如果
Figure A2005800085760003C3
如果
Figure A2005800085760003C5
否则
Figure A2005800085760003C6
14.一种用于实现如前面任一权利要求所述的方法的声音信号合成器,特征在于,它包括:
·用于估计该谐频的缺失峰Pi+1到Pi+N-1中的每一个的频率 的装置;
·用于对于之前估计的所有频率
Figure A2005800085760003C8
从峰Pi的相位到峰Pi+N的相位逐个峰地计算相位
Figure A2005800085760003C9
的装置;
·用于计算在同一峰Pi+N处的计算出的相
Figure A2005800085760003C10
与已知相位之间的相位误差err的装置;
·用于将每个计算出的相位
Figure A2005800085760003C11
校正一个其是相位误差err的函数的值的装置。
15.一种可直接加载到如权利要求14所述的合成器或合成器组的内部存储器中的计算机程序产品,该产品包括软件代码部分,用于当在合成器或合成器组上执行程序时,执行如权利要求1到13中任一个所述的方法(1)的步骤。
16.一种可在如权利要求14所述的合成器或合成器组中使用的介质,其上存储有可直接加载到合成器或合成器组的内部存储器中的计算机程序产品,该产品包括软件代码部分,用于当在合成器或合成器组上执行程序时,执行如权利要求1到13中任一个所述的方法(1)的步骤。
CNA2005800085761A 2004-01-20 2005-01-04 恢复声音信号的谐频的方法 Pending CN1934618A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR0400619 2004-01-20
FR0400619A FR2865310A1 (fr) 2004-01-20 2004-01-20 Procede de restauration de partiels d'un signal sonore

Publications (1)

Publication Number Publication Date
CN1934618A true CN1934618A (zh) 2007-03-21

Family

ID=34707988

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2005800085761A Pending CN1934618A (zh) 2004-01-20 2005-01-04 恢复声音信号的谐频的方法

Country Status (7)

Country Link
US (1) US20080243493A1 (zh)
EP (1) EP1714273A1 (zh)
JP (1) JP2007519043A (zh)
KR (1) KR20060131844A (zh)
CN (1) CN1934618A (zh)
FR (1) FR2865310A1 (zh)
WO (1) WO2005081228A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106663438A (zh) * 2014-07-01 2017-05-10 弗劳恩霍夫应用研究促进协会 用于使用垂直相位校正处理音频信号的音频处理器及方法
US11581001B2 (en) 2006-12-12 2023-02-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoder, decoder and methods for encoding and decoding data segments representing a time-domain data stream

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20080073925A (ko) * 2007-02-07 2008-08-12 삼성전자주식회사 파라메트릭 부호화된 오디오 신호를 복호화하는 방법 및장치

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0243562B1 (en) * 1986-04-30 1992-01-29 International Business Machines Corporation Improved voice coding process and device for implementing said process
US5054072A (en) * 1987-04-02 1991-10-01 Massachusetts Institute Of Technology Coding of acoustic waveforms
US5261027A (en) * 1989-06-28 1993-11-09 Fujitsu Limited Code excited linear prediction speech coding system
KR0175965B1 (ko) * 1993-11-30 1999-04-01 마틴 아이. 핀스톤 통신 시스템에서의 송신 노이즈 감축
US5574825A (en) * 1994-03-14 1996-11-12 Lucent Technologies Inc. Linear prediction coefficient generation during frame erasure or packet loss
WO1998006091A1 (fr) * 1996-08-02 1998-02-12 Matsushita Electric Industrial Co., Ltd. Codec vocal, support sur lequel est enregistre un programme codec vocal, et appareil mobile de telecommunications
US5886276A (en) * 1997-01-16 1999-03-23 The Board Of Trustees Of The Leland Stanford Junior University System and method for multiresolution scalable audio signal encoding
SE9903553D0 (sv) * 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
US6757654B1 (en) * 2000-05-11 2004-06-29 Telefonaktiebolaget Lm Ericsson Forward error correction in speech coding
GB2378064A (en) * 2001-03-12 2003-01-29 Simoco Int Ltd A feed-forward signal level control arrangement with a delay in the signal path
US7386217B2 (en) * 2001-12-14 2008-06-10 Hewlett-Packard Development Company, L.P. Indexing video by detecting speech and music in audio
US7243064B2 (en) * 2002-11-14 2007-07-10 Verizon Business Global Llc Signal processing of multi-channel data
SG120121A1 (en) * 2003-09-26 2006-03-28 St Microelectronics Asia Pitch detection of speech signals
DE10354557B4 (de) * 2003-11-21 2007-11-29 Infineon Technologies Ag Verfahren und Vorrichtungen zur Prädiktion von in einem Empfangssignal enthaltenen Rauschen sowie ein digitaler Empfänger
US7672835B2 (en) * 2004-12-24 2010-03-02 Casio Computer Co., Ltd. Voice analysis/synthesis apparatus and program
US8229106B2 (en) * 2007-01-22 2012-07-24 D.S.P. Group, Ltd. Apparatus and methods for enhancement of speech

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11581001B2 (en) 2006-12-12 2023-02-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoder, decoder and methods for encoding and decoding data segments representing a time-domain data stream
US11961530B2 (en) 2006-12-12 2024-04-16 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E. V. Encoder, decoder and methods for encoding and decoding data segments representing a time-domain data stream
CN106663438A (zh) * 2014-07-01 2017-05-10 弗劳恩霍夫应用研究促进协会 用于使用垂直相位校正处理音频信号的音频处理器及方法
US10770083B2 (en) 2014-07-01 2020-09-08 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio processor and method for processing an audio signal using vertical phase correction
US10930292B2 (en) 2014-07-01 2021-02-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio processor and method for processing an audio signal using horizontal phase correction

Also Published As

Publication number Publication date
WO2005081228A1 (fr) 2005-09-01
EP1714273A1 (fr) 2006-10-25
US20080243493A1 (en) 2008-10-02
KR20060131844A (ko) 2006-12-20
FR2865310A1 (fr) 2005-07-22
JP2007519043A (ja) 2007-07-12

Similar Documents

Publication Publication Date Title
RU2675151C2 (ru) Декодер и способ для декодирования аудиосигнала, кодер и способ для кодирования аудиосигнала
CN1205755C (zh) 以少量计算恢复高频分量的音频解码方法和装置
Gkiokas et al. Music tempo estimation and beat tracking by applying source separation and metrical relations
CN1113333C (zh) 激励参数判定方法及其语言编码系统
EP1987513B1 (fr) Procede et dispositif de codage hierarchique d&#39;un signal audio source, procede et dispositif de decodage, programmes et signal correspondants
US20080056511A1 (en) Audio Signal Interpolation Method and Audio Signal Interpolation Apparatus
US9583114B2 (en) Generation of a comfort noise with high spectro-temporal resolution in discontinuous transmission of audio signals
CN1186765C (zh) 2.3kb/s谐波激励线性预测语音编码方法
CN102027533A (zh) 用于确定音频信号的频谱的重力频率的多个局部中心的设备和方法
US20060015328A1 (en) Sinusoidal audio coding
JP3191926B2 (ja) 音響波形のコード化方式
EP3138095B1 (fr) Correction de perte de trame perfectionnée avec information de voisement
CN1934618A (zh) 恢复声音信号的谐频的方法
CN1320257A (zh) 带有改进的编码器的音频传输系统
CN1729509A (zh) 在音频编码中正弦波选择
Disch et al. An amplitude-and frequency modulation vocoder for audio signal processing
Yang et al. Pitch synchronous modulated lapped transform of the linear prediction residual of speech
CN1729510A (zh) 音频编码中的正弦波选择
KR101333162B1 (ko) Imdct 입력신호를 이용한 오디오 신호의 음정 및 속도 가변 장치 및 방법
CN107545900B (zh) 带宽扩展编码和解码中高频弦信号生成的方法和装置
EP1192619B1 (fr) Codage et decodage audio par interpolation
Zinser An efficient, pitch-aligned high-frequency regeneration technique for RELP vocoders
WO2005024784A1 (en) Encoding of transient audio signal components
AU2019240701A1 (en) Improved Subband Block Based Harmonic Transposition
Ciobanu et al. Time-frequency processing of partials for high-quality speech synthesis

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20070321