CN1934618A - 恢复声音信号的谐频的方法 - Google Patents
恢复声音信号的谐频的方法 Download PDFInfo
- Publication number
- CN1934618A CN1934618A CNA2005800085761A CN200580008576A CN1934618A CN 1934618 A CN1934618 A CN 1934618A CN A2005800085761 A CNA2005800085761 A CN A2005800085761A CN 200580008576 A CN200580008576 A CN 200580008576A CN 1934618 A CN1934618 A CN 1934618A
- Authority
- CN
- China
- Prior art keywords
- peak
- harmonics
- frequency
- phase
- voice signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 50
- 230000036961 partial effect Effects 0.000 title abstract description 4
- 230000005236 sound signal Effects 0.000 title abstract description 3
- 230000008034 disappearance Effects 0.000 claims description 15
- 238000004590 computer program Methods 0.000 claims description 4
- 238000011084 recovery Methods 0.000 claims description 4
- 238000001228 spectrum Methods 0.000 claims description 3
- 230000003595 spectral effect Effects 0.000 claims description 2
- 238000005516 engineering process Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 239000000284 extract Substances 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 208000034657 Convalescence Diseases 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/093—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters using sinusoidal excitation models
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
- Electrophonic Musical Instruments (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Abstract
本发明涉及一种用于恢复其频率<i>O</i>和相位<i>?</i><i></i>已知的峰<i>P</i><i>i</i><i></i>与峰<i>P</i><i>i+N</i>之间的声音信号的谐频的方法(1)。本发明方法(1)包括下列步骤:估计(2)该谐频的缺失峰<i>P</i><i>i+1</i>到<i>P</i><i>i+N-1</i><i></i>中的每一个的频率O<i></i>;对于之前估计的所有频率O,从峰<i>P</i><i>i</i><i></i>的相位到峰<i>P</i><i>i+N</i>的相位,逐个峰地计算(3)所执行的相位<i>?</i>;计算(4)在同一峰<i>P</i><i>i+N</i><i></i>处的所执行的相位<i>?</i>与已知相位之间的相位误差<i>err?</i>;以及按照相位误差<i>err?</i>,将每个所执行的相位<i>?</i>校正(5)一个值。
Description
技术领域
本发明涉及通信领域,具体涉及声音信号的数字处理和声音信号的谐波表示的领域。
背景技术
在数字音频信号的谐波建模(harmonic modeling)中,声音信号用一组振荡器表示,振荡器的参数(频率、幅度、相位)随着时间缓慢变化。谐波分析包括用于确定这些参数值的短期时间/频率分析,之后提取峰(peak),然后跟踪谐频(partial)。
要建模的信号被分成l个采样的帧(典型地l=1024)。短期时间/频率分析模块(典型地执行傅立叶变换)计算每帧的信号的短期频谱。用于提取峰的模块仅保留先验的最有关的峰,例如,一个准则是仅保留能量最高的峰。第三和最后模块尝试将峰在时间上彼此连接起来,即,从一帧到另一帧,以形成谐频。在其生存期内,每个谐频对应于一个振荡器。
这种类型的分析和表示尤其可以用在降比特率编码、参数编码(处理信号的三个方面:瞬变、正弦曲线、噪声)、声音源的分离和索引(indexing)、以及声音文件的恢复期间。
目前公认的是,当利用Robert J.McAulay和Thomas F.Quatieri在论文″Speech Analysis/Synthesis Based on a Sinusoidal Representation″,IEEETransactions on Acoustics,Speech and Signal Processing,pp.744-754,1986,或者Laurent Girin,Sylvain Marchand,Joseph di Martino,Axel Rbel和GeoffroyPeeters在论文″Comparing the order of a Polynomial Phase Model for theSynthesis of Quasi-Harmonic Audio Signals″,WASPAA,New Paltz,NY,USA,October 2003中提出的相位内插技术来合成谐频时,获得最好的质量。这些技术用于通过使用三阶或五阶多项式计算所有的中间相位,来合成从峰(Ai,fi,i)到峰(Ai+1,fi+1,i+1)的谐频,其中频率由求导推出。仅当已知起始和结束频率以及相位时,才使用三阶内插。当还已知相位的二阶变分(second ordervariation)时,使用五阶内插(这些等效于频率的一阶变分,原因在于按照定义,频率是相位的导数)。
峰Pi(Ai,fi,i)与Pi+1(Ai+1,fi+1,i+1)之间谐频的合成包括计算帧
i与i+1之间的谐频的值p(n):
pi(n)=p(li+n)=Ai(n)cos(i(n)),n=0,...,l-1 (1)
为此,现有技术中已知使用下面两种内插法之一来计算所有的中间相位。
对于根据McAulay的三阶内插,根据下面的表达式计算相位,其中Te是采样周期:
i(n)=i+2πfinTe+α(nTe)2+β(nTe)3 (2)
通过求解(fi,i,fi+1,i+1)中的等式系统来计算两个未知数α和β。频率通过微分导出:
2πfi(n)=2πfi+2αnTe+3β(nTe)2 (3)
对于根据Girin等人的五阶内插,在峰Pi和Pi+1处频率的一阶变分δfi和δfi+1假定是已知的。然后根据下面的表达式计算相位:
通过求解(fi,fi+1,i,i+1,δfi,δfi+1)中的等式系统来计算三个未知数β,δ,γ。频率通过微分导出:
2πfi(n)=2πfi+δfinTe+3β(nTe)2+4γ(nTe)3+5δ(nTe)4 (5)
由于各种原因,可能会出现在分析结束和/或在合成开始时信号中的特定谐频缺失、损坏或不连续的情况。例如,如果发生分组丢失,则在因特网声音程序广播应用中的解码器的输入处可能缺失特定谐频,如果要分析的信号受到不需要的信号(噪声、滴答(click)、其他信号等)的干扰,则它们可能损坏,或者如果它们的能量太低以至于不能被连续地正确检测,则它们可能是不连续的。为了创建尽可能接近原始信号的合成信号,于是有必要恢复缺失峰。这使得创建其每一个都以幅度、频率和相位来表征的峰成为必要。
上述现有技术的内插技术用于合成对应于缺失峰的部分以及恢复谐频。
然而,这些现有技术的内插技术适于在短期,即,在小于10毫秒(ms)的周期上使用。对于较长的周期,重新合成的信号常常与原始信号有很大不同,并且可能出现令人不快的赝音(artifact)。这些技术确保已有峰与恢复的峰之间的相位连续性,但是不能控制由等式(3)和(5)引起的感应频率。该效果与内插距离成正比增加。
发明内容
本发明的一个目的是提出一种对该问题的替代解决方案,尤其是在缺失部分对应于长的周期(大于10ms)的情况下恢复被识别为谐频的丢失部分的丢失部分,而现有技术对此情况效果相对较差。
因此,本发明要解决的技术问题是提出一种在谐波分析期间恢复声音信号的谐频的丢失部分的方法,在谐波分析中,声音信号被分成时间帧,对时间帧应用时间/频率分析,其提供由采样频率帧表示的连续短期频谱,该分析还在于提取频率帧中的频谱峰并将它们在时间上连接在一起以形成谐频,该方法是现有技术解决方案的替代。
根据本发明,所述技术问题的一个解决方案在于,所述恢复其频率ω和相位已知的峰Pi与峰Pi+N之间的谐频的方法特征在于它包括步骤:
·对于之前估计的所有频率
从峰Pi的相位到峰Pi+N的相位,逐个峰地计算相位
·将每个计算出的相位
校正一个值,该值是相位误差err的函数。
本发明的方法与现有技术方法的不同之处在于,它提供对丢失峰的频率的更精细控制和随后对应相位的计算,以确保与已有峰的相位的连续性。因此,与上述现有技术方法相对比,本发明的方法没有赝音地重新合成对应于丢失谐频部分的信号。
本发明的方法还具有这样的优点,即,重构信号,该信号与现有技术方法获得的信号相比,在重构误差方面与原始信号更接近。
最后,本发明的方法具有使用低复杂度算法的优点。
本发明还在于一种合成声音信号的合成器,用于实现恢复峰Pi与峰Pi+N之间的谐频的方法,例如是适于使用本发明方法的音频解码器或参数编码器。
本发明还在于一种可直接加载到上述合成器或合成器组的内部存储器中的计算机程序产品,该产品包括软件代码部分,用于当在合成器或合成器组上执行程序时,执行根据本发明的方法的步骤。
本发明还在于一种可在上述合成器或合成器组中使用的介质,其上存储有可直接加载到合成器或合成器组的内部存储器中的计算机程序产品,该产品包括软件代码部分,用于当在合成器或合成器组上执行程序时,执行根据本发明的方法的步骤。
附图说明
在下面参照附图给出的描述期间,本发明的其他特征和优点将变得清楚,其中描述是通过非限制性的示例方式提供的。
图1是本发明的一个示例的流程图。
图2是使用本发明方法的一个示例的图。
具体实施方式
本发明的方法1以下面参照图1流程图描述的方式进行。该方法在于恢复其频率ω和相位已知的峰Pi和峰Pi+N之间的谐频。
考虑包括一连串相连的峰Pi(Ai,ωi,i)的谐频,Pi(Ai,ωi,i)在时间iT处是已知的,并且由下列表征:
Ai,在时间iT处峰的幅度;
ωi,在时间iT处峰的频率;和
i,在时间iT处峰的相位模2π。
利用例如ωi与ωi+N之间的线性内插,或者例如论文″Enhanced PartialTracking using linear Prediction″,Mathieu Lagrange,Sylvain Marchand,MartinRaspaud and Jean-Bernard Rault,Proceedings of the Digital Audio Effects(DAFx)Conference,pp 141-146,Queen Mary College,University of London,UK,September 2003中所描述的线性过去或未来预测(past or future prediction),或者利用加权的过去或未来合并,来估计峰Pi与Pi+N之间的缺失峰的频率。
通过例如Ai与Ai+N之间的线性内插,线性过去或未来预测或者加权的过去或未来合并,来估计缺失峰的幅度A。
在第二步骤3中,该方法从峰Pi的相位到峰Pi+N的相位,逐个峰地计算相位
对之前估计的每个频率ω执行该计算。
为了避免产生将会影响重新合成的质量的不连续,有必要得到在时间i+N处等于i+N的重构相位
在上述表达式(6)中的数据要么是近似的要么是预测的情况下,统计上是不可能得到该相等的。因此,该方法的后继步骤将在时间i+N处计算的相位误差err分到所有之前重构的缺失峰Pi+1到Pi+N-1之间。
在第三步骤4中,该方法计算在同一峰Pi+N处的计算出的相位
与已知相位i+N之间的相位误差err。该计算可以使用下面的等式系统:
如果
则
在第四步骤5中,该方法将每个计算出的相位
校正一个值,该值是相位误差err的函数。典型地根据下面表达式,将在时间i+N处计算出的相位误差均匀分到计算出的相位之间:
该分布不必是均匀的,并且可以服从例如非线性法则。
图2使用的例子在于在声音信号的谐波分析时,例如在参数编码期间,利用本发明的方法1恢复谐频。声音信号s(n)用一组振荡器表示,振荡器的参数(频率、幅度)随着时间缓慢变化。按常规的方式,谐波分析包括用于确定这些参数的值的短期时间/频率分析6,之后提取峰7,然后跟踪谐频8。在通过本发明的方法1恢复谐频之前,检测谐频中的间隙9。然后将通过执行方法1重构的峰
作为由谐波分析产生的峰对待,并且可以通过例如现有技术的(三阶或五阶)相位内插法之一,进行与从这些重构的峰恢复的谐频对应的信号的加性合成10。
Claims (16)
1.一种在谐波分析期间恢复声音信号的谐频的方法(1),在谐波分析中,声音信号被分成时间帧,对时间帧应用时间/频率分析,其提供由采样频率帧表示的连续短期频谱,该分析还在于提取频率帧中的频谱峰并将它们在时间上连接在一起以形成谐频,所述恢复其频率和相位已知的峰Pi与峰Pi+N之间的谐频的方法特征在于,它包括步骤:
·估计(2)该谐频的缺失峰Pi+1到Pi+N-1中的每一个的频率
·计算(4)在同一峰Pi+N处的计算出的相位
与已知相位之间的相位误差err;
2.如权利要求1所述的用于恢复声音信号的谐频的方法(1),其中,相位
是根据下面的公式计算出的,其中i和
是峰Pi的相位和频率,并且i+N和
是峰Pi+N的相位和频率:
4.如权利要求1或2所述的用于恢复声音信号的谐频的方法(1),其中,通过线性过去预测来估计缺失峰Pi+1到Pi+N-1的频率
6.如权利要求1或2所述的用于恢复声音信号的谐频的方法(1),其中,通过线性过去预测和线性未来预测的加权组合,来估计缺失峰Pi+1到Pi+N-1的频率
7.如前面任一权利要求所述的用于恢复声音信号的谐频的方法(1),还包括步骤:通过已知峰Pi与Pi+N的幅度A之间的线性内插,估计谐频的缺失峰Pi+1到Pi+N-1中的每一个的幅度。
8.如权利要求1到6中任一个所述的用于恢复声音信号的谐频的方法(1),还包括步骤:通过线性过去预测来估计谐频的缺失峰Pi+1到Pi+N-1中的每一个的幅度。
9.如权利要求1到6中任一个所述的用于恢复声音信号的谐频的方法(1),还包括步骤:通过线性未来预测来估计谐频的缺失峰Pi+1到Pi+N-1中的每一个的幅度。
10.如权利要求1到6中任一个所述的用于恢复声音信号的谐频的方法(1),还包括步骤:通过线性过去预测和线性未来预测,来估计谐频的缺失峰Pi+1到Pi+N-1中的每一个的幅度。
11.如前面任一权利要求所述的用于恢复声音信号的谐频的方法(1),其中,相位校正在于将在时间i+N处的计算出的相位误差err均匀分布到谐频的所有缺失峰Pi+1到Pi+N-1之间。
15.一种可直接加载到如权利要求14所述的合成器或合成器组的内部存储器中的计算机程序产品,该产品包括软件代码部分,用于当在合成器或合成器组上执行程序时,执行如权利要求1到13中任一个所述的方法(1)的步骤。
16.一种可在如权利要求14所述的合成器或合成器组中使用的介质,其上存储有可直接加载到合成器或合成器组的内部存储器中的计算机程序产品,该产品包括软件代码部分,用于当在合成器或合成器组上执行程序时,执行如权利要求1到13中任一个所述的方法(1)的步骤。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR0400619 | 2004-01-20 | ||
FR0400619A FR2865310A1 (fr) | 2004-01-20 | 2004-01-20 | Procede de restauration de partiels d'un signal sonore |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1934618A true CN1934618A (zh) | 2007-03-21 |
Family
ID=34707988
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA2005800085761A Pending CN1934618A (zh) | 2004-01-20 | 2005-01-04 | 恢复声音信号的谐频的方法 |
Country Status (7)
Country | Link |
---|---|
US (1) | US20080243493A1 (zh) |
EP (1) | EP1714273A1 (zh) |
JP (1) | JP2007519043A (zh) |
KR (1) | KR20060131844A (zh) |
CN (1) | CN1934618A (zh) |
FR (1) | FR2865310A1 (zh) |
WO (1) | WO2005081228A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106663438A (zh) * | 2014-07-01 | 2017-05-10 | 弗劳恩霍夫应用研究促进协会 | 用于使用垂直相位校正处理音频信号的音频处理器及方法 |
US11581001B2 (en) | 2006-12-12 | 2023-02-14 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Encoder, decoder and methods for encoding and decoding data segments representing a time-domain data stream |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20080073925A (ko) * | 2007-02-07 | 2008-08-12 | 삼성전자주식회사 | 파라메트릭 부호화된 오디오 신호를 복호화하는 방법 및장치 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0243562B1 (en) * | 1986-04-30 | 1992-01-29 | International Business Machines Corporation | Improved voice coding process and device for implementing said process |
US5054072A (en) * | 1987-04-02 | 1991-10-01 | Massachusetts Institute Of Technology | Coding of acoustic waveforms |
US5261027A (en) * | 1989-06-28 | 1993-11-09 | Fujitsu Limited | Code excited linear prediction speech coding system |
KR0175965B1 (ko) * | 1993-11-30 | 1999-04-01 | 마틴 아이. 핀스톤 | 통신 시스템에서의 송신 노이즈 감축 |
US5574825A (en) * | 1994-03-14 | 1996-11-12 | Lucent Technologies Inc. | Linear prediction coefficient generation during frame erasure or packet loss |
WO1998006091A1 (fr) * | 1996-08-02 | 1998-02-12 | Matsushita Electric Industrial Co., Ltd. | Codec vocal, support sur lequel est enregistre un programme codec vocal, et appareil mobile de telecommunications |
US5886276A (en) * | 1997-01-16 | 1999-03-23 | The Board Of Trustees Of The Leland Stanford Junior University | System and method for multiresolution scalable audio signal encoding |
SE9903553D0 (sv) * | 1999-01-27 | 1999-10-01 | Lars Liljeryd | Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL) |
US6757654B1 (en) * | 2000-05-11 | 2004-06-29 | Telefonaktiebolaget Lm Ericsson | Forward error correction in speech coding |
GB2378064A (en) * | 2001-03-12 | 2003-01-29 | Simoco Int Ltd | A feed-forward signal level control arrangement with a delay in the signal path |
US7386217B2 (en) * | 2001-12-14 | 2008-06-10 | Hewlett-Packard Development Company, L.P. | Indexing video by detecting speech and music in audio |
US7243064B2 (en) * | 2002-11-14 | 2007-07-10 | Verizon Business Global Llc | Signal processing of multi-channel data |
SG120121A1 (en) * | 2003-09-26 | 2006-03-28 | St Microelectronics Asia | Pitch detection of speech signals |
DE10354557B4 (de) * | 2003-11-21 | 2007-11-29 | Infineon Technologies Ag | Verfahren und Vorrichtungen zur Prädiktion von in einem Empfangssignal enthaltenen Rauschen sowie ein digitaler Empfänger |
US7672835B2 (en) * | 2004-12-24 | 2010-03-02 | Casio Computer Co., Ltd. | Voice analysis/synthesis apparatus and program |
US8229106B2 (en) * | 2007-01-22 | 2012-07-24 | D.S.P. Group, Ltd. | Apparatus and methods for enhancement of speech |
-
2004
- 2004-01-20 FR FR0400619A patent/FR2865310A1/fr active Pending
-
2005
- 2005-01-04 KR KR1020067016604A patent/KR20060131844A/ko not_active Application Discontinuation
- 2005-01-04 EP EP05717367A patent/EP1714273A1/fr not_active Withdrawn
- 2005-01-04 JP JP2006550220A patent/JP2007519043A/ja active Pending
- 2005-01-04 US US10/587,097 patent/US20080243493A1/en not_active Abandoned
- 2005-01-04 CN CNA2005800085761A patent/CN1934618A/zh active Pending
- 2005-01-04 WO PCT/FR2005/000019 patent/WO2005081228A1/fr active Application Filing
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11581001B2 (en) | 2006-12-12 | 2023-02-14 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Encoder, decoder and methods for encoding and decoding data segments representing a time-domain data stream |
US11961530B2 (en) | 2006-12-12 | 2024-04-16 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E. V. | Encoder, decoder and methods for encoding and decoding data segments representing a time-domain data stream |
CN106663438A (zh) * | 2014-07-01 | 2017-05-10 | 弗劳恩霍夫应用研究促进协会 | 用于使用垂直相位校正处理音频信号的音频处理器及方法 |
US10770083B2 (en) | 2014-07-01 | 2020-09-08 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio processor and method for processing an audio signal using vertical phase correction |
US10930292B2 (en) | 2014-07-01 | 2021-02-23 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio processor and method for processing an audio signal using horizontal phase correction |
Also Published As
Publication number | Publication date |
---|---|
WO2005081228A1 (fr) | 2005-09-01 |
EP1714273A1 (fr) | 2006-10-25 |
US20080243493A1 (en) | 2008-10-02 |
KR20060131844A (ko) | 2006-12-20 |
FR2865310A1 (fr) | 2005-07-22 |
JP2007519043A (ja) | 2007-07-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2675151C2 (ru) | Декодер и способ для декодирования аудиосигнала, кодер и способ для кодирования аудиосигнала | |
CN1205755C (zh) | 以少量计算恢复高频分量的音频解码方法和装置 | |
Gkiokas et al. | Music tempo estimation and beat tracking by applying source separation and metrical relations | |
CN1113333C (zh) | 激励参数判定方法及其语言编码系统 | |
EP1987513B1 (fr) | Procede et dispositif de codage hierarchique d'un signal audio source, procede et dispositif de decodage, programmes et signal correspondants | |
US20080056511A1 (en) | Audio Signal Interpolation Method and Audio Signal Interpolation Apparatus | |
US9583114B2 (en) | Generation of a comfort noise with high spectro-temporal resolution in discontinuous transmission of audio signals | |
CN1186765C (zh) | 2.3kb/s谐波激励线性预测语音编码方法 | |
CN102027533A (zh) | 用于确定音频信号的频谱的重力频率的多个局部中心的设备和方法 | |
US20060015328A1 (en) | Sinusoidal audio coding | |
JP3191926B2 (ja) | 音響波形のコード化方式 | |
EP3138095B1 (fr) | Correction de perte de trame perfectionnée avec information de voisement | |
CN1934618A (zh) | 恢复声音信号的谐频的方法 | |
CN1320257A (zh) | 带有改进的编码器的音频传输系统 | |
CN1729509A (zh) | 在音频编码中正弦波选择 | |
Disch et al. | An amplitude-and frequency modulation vocoder for audio signal processing | |
Yang et al. | Pitch synchronous modulated lapped transform of the linear prediction residual of speech | |
CN1729510A (zh) | 音频编码中的正弦波选择 | |
KR101333162B1 (ko) | Imdct 입력신호를 이용한 오디오 신호의 음정 및 속도 가변 장치 및 방법 | |
CN107545900B (zh) | 带宽扩展编码和解码中高频弦信号生成的方法和装置 | |
EP1192619B1 (fr) | Codage et decodage audio par interpolation | |
Zinser | An efficient, pitch-aligned high-frequency regeneration technique for RELP vocoders | |
WO2005024784A1 (en) | Encoding of transient audio signal components | |
AU2019240701A1 (en) | Improved Subband Block Based Harmonic Transposition | |
Ciobanu et al. | Time-frequency processing of partials for high-quality speech synthesis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Open date: 20070321 |