JP2007529779A - オーディオ符号化 - Google Patents
オーディオ符号化 Download PDFInfo
- Publication number
- JP2007529779A JP2007529779A JP2007503473A JP2007503473A JP2007529779A JP 2007529779 A JP2007529779 A JP 2007529779A JP 2007503473 A JP2007503473 A JP 2007503473A JP 2007503473 A JP2007503473 A JP 2007503473A JP 2007529779 A JP2007529779 A JP 2007529779A
- Authority
- JP
- Japan
- Prior art keywords
- modified
- sine wave
- transient
- overlap period
- frequency
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/20—Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/093—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters using sinusoidal excitation models
Abstract
Description
1. 過渡信号の時間的位置の推定。オーディオ信号中の過渡信号の位置を決定する。また、過渡信号のタイプ(ステップまたはMeixner)も決定する。
2. 過渡エンベロープの推定:Meixner過渡信号の場合、Meixner Windowを推定する。このMeixner Windowは過渡信号の時間エンベロープを記述するものである。
3. 正弦波コンテントの推定。ここで、推定したMeixner Windowを用いて、過渡信号を記述する幾つかの正弦波を推定する。正弦波は周波数、位相、及び振幅で表される。
E. G. P. Schuijers、A. C. den Brinker、及びA. W. J. Oomen著「高品質オーディオのためのパラメトリック符号化(Parametric Coding for High-Quality Audio)」Preprint 5554、112th AES Convention、Munich、10-13 May 2002。 ステップ過渡成分は信号パワーレベルの急激な変化が特徴である。すなわち、アタックが速く、事実上減衰しない。ステップ過渡信号の特徴はその位置、すなわちその発生時刻である。そのため、時間的位置は、信号そのものは記述しないが、それを使って正弦波オブジェクトの要素を合成を制御する。位置パラメータに基づき、同一または同様の方法をステップ過渡成分とMeixner過渡成分の両方に適用する。
本発明は、符号化及び復号の両方において、過渡位置を含む連続するセグメントの窓間のオーバーラップ期間を修正する上記の既知の方法を含む。本発明の方法は、連続するセグメントの窓間のオーバーラップ期間を正弦波の周波数に依存させることにより、既知の方法を改良する。特に、周波数が高い場合よりも周波数が低い場合にオーバーラップ期間を長くする。
Claims (6)
- 符号化データから正弦波を有する信号を合成する方法であって、前記符号化データは複数の連続する時間セグメントの各々について正弦波を表す1つ以上の周波数値と、可能な過渡発生の時間を特定するデータとを有し、前記方法は、
前記1つ以上の周波数値の各々で正弦波を発生する段階と、
複数の連続するセグメントにわたって正弦波をリンクする段階と、を有し、
過渡がないセグメントは通常の前方エッジと通常の後方エッジを有する通常の窓で重みづけされ、連続するセグメントはその前方エッジと後方エッジの通常オーバーラップ期間を有し、
過渡の発生の時間が特定されたセグメントは、修正された後方エッジを有する第1の修正窓で重みづけされ、後続セグメントは、修正された前方エッジを有する第2の修正窓で重みづけされ、それにより修正された後方エッジと修正された前方エッジは過渡の発生時間を含み通常のオーバーラップ期間よりも短い修正されたオーバーラップ期間を有し、修正されたオーバーラップ期間は周波数値に依存することを特徴とする方法。 - 請求項1に記載の方法であって、
修正されたオーバーラップ期間は、周波数値が高くなると短くなることを特徴とする方法。 - 請求項1または2に記載の方法であって、
修正されたオーバーラップ期間は、実質的にf1/cとして周波数値に依存することを特徴とする方法。 - 請求項1または2に記載の方法であって、
修正されたオーバーラップ期間の2つ以上の固定値を対応する周波数区間に対して使用することを特徴とする方法。 - 符号化データから正弦波を有する信号を合成するオーディオデコーダであって、前記符号化データは複数の連続する時間セグメントの各々について正弦波を表す1つ以上の周波数値と、可能な過渡発生の時間を特定するデータとを有し、前記オーディオデコーダは請求項6ないし9のいずれか一項に記載の方法を使用するように構成されていることを特徴とするオーディオデコーダ。
- 請求項1ないし4いずれか一項に記載の方法を使用するように構成された、信号を符号化するオーディオエンコーダ。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP04101100 | 2004-03-17 | ||
PCT/IB2005/050847 WO2005091275A1 (en) | 2004-03-17 | 2005-03-08 | Audio coding |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007529779A true JP2007529779A (ja) | 2007-10-25 |
JP4355745B2 JP4355745B2 (ja) | 2009-11-04 |
Family
ID=34961605
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007503473A Expired - Fee Related JP4355745B2 (ja) | 2004-03-17 | 2005-03-08 | オーディオ符号化 |
Country Status (6)
Country | Link |
---|---|
US (1) | US7587313B2 (ja) |
EP (1) | EP1728243A1 (ja) |
JP (1) | JP4355745B2 (ja) |
KR (1) | KR20070001185A (ja) |
CN (1) | CN1934619B (ja) |
WO (1) | WO2005091275A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016507788A (ja) * | 2013-02-20 | 2016-03-10 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 過渡位置依存のオーバーラップを使用してオーディオ信号を符号化又は復号化する装置及び方法 |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1934619B (zh) * | 2004-03-17 | 2010-05-26 | 皇家飞利浦电子股份有限公司 | 音频编码 |
US7418394B2 (en) * | 2005-04-28 | 2008-08-26 | Dolby Laboratories Licensing Corporation | Method and system for operating audio encoders utilizing data from overlapping audio segments |
US20100131276A1 (en) * | 2005-07-14 | 2010-05-27 | Koninklijke Philips Electronics, N.V. | Audio signal synthesis |
US8036903B2 (en) * | 2006-10-18 | 2011-10-11 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Analysis filterbank, synthesis filterbank, encoder, de-coder, mixer and conferencing system |
KR101441898B1 (ko) * | 2008-02-01 | 2014-09-23 | 삼성전자주식회사 | 주파수 부호화 방법 및 장치와 주파수 복호화 방법 및 장치 |
JP5336522B2 (ja) * | 2008-03-10 | 2013-11-06 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | 瞬間的事象を有する音声信号の操作装置および操作方法 |
CN101388213B (zh) * | 2008-07-03 | 2012-02-22 | 天津大学 | 一种预回声控制方法 |
EP2372703A1 (en) | 2010-03-11 | 2011-10-05 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Signal processor, window provider, encoded media signal, method for processing a signal and method for providing a window |
JP5743137B2 (ja) | 2011-01-14 | 2015-07-01 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5327518A (en) * | 1991-08-22 | 1994-07-05 | Georgia Tech Research Corporation | Audio analysis/synthesis system |
US5504833A (en) * | 1991-08-22 | 1996-04-02 | George; E. Bryan | Speech approximation using successive sinusoidal overlap-add models and pitch-scale modifications |
US6978236B1 (en) * | 1999-10-01 | 2005-12-20 | Coding Technologies Ab | Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching |
WO2001069593A1 (en) | 2000-03-15 | 2001-09-20 | Koninklijke Philips Electronics N.V. | Laguerre fonction for audio coding |
US7120587B2 (en) * | 2000-11-03 | 2006-10-10 | Koninklijke Philips Electronics N.V. | Sinusoidal model based coding of audio signals |
CN1934619B (zh) * | 2004-03-17 | 2010-05-26 | 皇家飞利浦电子股份有限公司 | 音频编码 |
US8476518B2 (en) * | 2004-11-30 | 2013-07-02 | Stmicroelectronics Asia Pacific Pte. Ltd. | System and method for generating audio wavetables |
-
2005
- 2005-03-08 CN CN2005800085668A patent/CN1934619B/zh not_active Expired - Fee Related
- 2005-03-08 KR KR1020067018758A patent/KR20070001185A/ko active IP Right Grant
- 2005-03-08 WO PCT/IB2005/050847 patent/WO2005091275A1/en active Application Filing
- 2005-03-08 US US10/598,796 patent/US7587313B2/en not_active Expired - Fee Related
- 2005-03-08 EP EP05708973A patent/EP1728243A1/en not_active Withdrawn
- 2005-03-08 JP JP2007503473A patent/JP4355745B2/ja not_active Expired - Fee Related
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016507788A (ja) * | 2013-02-20 | 2016-03-10 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 過渡位置依存のオーバーラップを使用してオーディオ信号を符号化又は復号化する装置及び方法 |
US9947329B2 (en) | 2013-02-20 | 2018-04-17 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for encoding or decoding an audio signal using a transient-location dependent overlap |
US10354662B2 (en) | 2013-02-20 | 2019-07-16 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for generating an encoded signal or for decoding an encoded audio signal using a multi overlap portion |
US10685662B2 (en) | 2013-02-20 | 2020-06-16 | Fraunhofer-Gesellschaft Zur Foerderung Der Andewandten Forschung E.V. | Apparatus and method for encoding or decoding an audio signal using a transient-location dependent overlap |
US10832694B2 (en) | 2013-02-20 | 2020-11-10 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for generating an encoded signal or for decoding an encoded audio signal using a multi overlap portion |
US11621008B2 (en) | 2013-02-20 | 2023-04-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for encoding or decoding an audio signal using a transient-location dependent overlap |
US11682408B2 (en) | 2013-02-20 | 2023-06-20 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for generating an encoded signal or for decoding an encoded audio signal using a multi overlap portion |
Also Published As
Publication number | Publication date |
---|---|
WO2005091275A1 (en) | 2005-09-29 |
US7587313B2 (en) | 2009-09-08 |
CN1934619A (zh) | 2007-03-21 |
EP1728243A1 (en) | 2006-12-06 |
US20070185707A1 (en) | 2007-08-09 |
KR20070001185A (ko) | 2007-01-03 |
CN1934619B (zh) | 2010-05-26 |
JP4355745B2 (ja) | 2009-11-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4355745B2 (ja) | オーディオ符号化 | |
EP3336839B1 (en) | Audio decoder and method for providing a decoded audio information using an error concealment modifying a time domain excitation signal | |
EP3285254B1 (en) | Audio decoder and method for providing a decoded audio information using an error concealment based on a time domain excitation signal | |
JP5925742B2 (ja) | 通信システムにおける隠蔽フレームの生成方法 | |
JP4658596B2 (ja) | 線形予測に基づく音声コーデックにおける効率的なフレーム消失の隠蔽のための方法、及び装置 | |
ES2309969T3 (es) | Procedimiento y dispositivo para la ampliacion artificial de la anchura de banda de señales de voz. | |
US8391373B2 (en) | Concealment of transmission error in a digital audio signal in a hierarchical decoding structure | |
KR101406742B1 (ko) | 피치 주기 보정을 이용한 디지털 오디오 신호의 손실 블록의 합성 방법 | |
JP5006398B2 (ja) | 広帯域ボコーダのタイムワーピングフレーム | |
EP3427256B1 (en) | Hybrid concealment techniques: combination of frequency and time domain packet loss concealment in audio codecs | |
JP2010501896A5 (ja) | ||
US9984696B2 (en) | Transition from a transform coding/decoding to a predictive coding/decoding | |
JP2021006923A (ja) | 適応型ノイズ推定を使用してエラー隠し信号を生成する装置及び方法 | |
JP2007505346A (ja) | 遷移のオーディオ信号成分の符号化 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080307 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080708 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20081008 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20081125 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20090224 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20090303 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090522 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090707 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090803 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120807 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |