KR20050086871A - 오디오 코딩 - Google Patents
오디오 코딩 Download PDFInfo
- Publication number
- KR20050086871A KR20050086871A KR1020057009520A KR20057009520A KR20050086871A KR 20050086871 A KR20050086871 A KR 20050086871A KR 1020057009520 A KR1020057009520 A KR 1020057009520A KR 20057009520 A KR20057009520 A KR 20057009520A KR 20050086871 A KR20050086871 A KR 20050086871A
- Authority
- KR
- South Korea
- Prior art keywords
- phase
- sinusoidal
- track
- frequency
- audio
- Prior art date
Links
- 230000005236 sound signal Effects 0.000 claims abstract description 18
- 230000001052 transient effect Effects 0.000 claims description 30
- 238000000034 method Methods 0.000 claims description 21
- 238000013139 quantization Methods 0.000 claims description 9
- 238000001914 filtration Methods 0.000 claims description 5
- 230000008569 process Effects 0.000 claims description 3
- 230000002194 synthesizing effect Effects 0.000 claims description 2
- 230000006870 function Effects 0.000 description 9
- 238000005259 measurement Methods 0.000 description 6
- 230000003044 adaptive effect Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 230000003595 spectral effect Effects 0.000 description 2
- 230000002459 sustained effect Effects 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012885 constant function Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/093—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters using sinusoidal excitation models
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Cereal-Derived Products (AREA)
- Amplifiers (AREA)
- Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)
- Diaphragms For Electromechanical Transducers (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
Abstract
Description
Claims (16)
- 오디오 신호를 인코딩하는 방법으로서,복수의 순차 세그먼트 각각에 대한 샘플링된 신호값의 각 세트를 제공하는 단계와;상기 복수의 순차 세그먼트 각각에 대한 하나 이상의 정현파(sinusoidal) 성분을 결정하기 위해 상기 샘플링된 신호 값을 분석하는 단계와;정현파 트랙을 제공하기 위해 복수의 순차 세그먼트에 걸쳐 정현파 성분을 링크시키는 단계와;각 정현파 트랙에 대해, 일반적으로 단조롭게 변화하는 값을 포함하는 위상을 결정하는 단계와;상기 위상을 나타내는 정현파 코드을 포함하는 인코딩된 오디오 스트림을 생성하는 단계를포함하는, 오디오 신호를 인코딩하는 방법.
- 제 1항에 있어서, 각 링크된 세그먼트의 위상 값은, 이전의 세그먼트에 대한 주파수 및 상기 링크된 세그먼트의 주파수의 적분, 및 상기 이전 세그먼트의 위상의 함수로서 결정되는, 오디오 신호를 인코딩하는 방법.
- 제 1항에 있어서, 상기 정현파 성분은 주파수 값, 및 범위(-π,π)에서의 위상 값을 포함하는, 오디오 신호를 인코딩하는 방법.
- 제 1항에 있어서, 상기 생성 단계는,적어도 이전 세그먼트에 대한 위상 함수로서 세그먼트에 대한 위상 값을 예측하는 단계와;상기 위상에 대한 상기 예측 값 및 상기 세그먼트에 대한 측정된 위상의 함수로서 상기 정현파 코드를 양자화하는 단계를포함하는, 오디오 신호를 인코딩하는 방법.
- 제 4항에 있어서, 트랙에 대한 상기 정현파 코드는 초기 위상 및 주파수를 포함하고, 상기 예측 단계는 상기 초기 주파수 및 위상을 이용하여, 제 1 예측을 제공하는, 오디오 신호를 인코딩하는 방법.
- 제 4항에 있어서, 상기 생성 단계는 상기 양자화된 정현파 코드의 함수로서 상기 양자화 단계를 제어하는 단계를 포함하는, 오디오 신호를 인코딩하는 방법.
- 제 6항에 있어서, 각 트랙에 대한 상기 정현파 코드는 초기 양자화 단계를 포함하는, 오디오 신호를 인코딩하는 방법.
- 제 1항에 있어서, 상기 정현파 코드는 트랙의 종료의 표시자(indicator)를 포함하는, 오디오 신호를 인코딩하는 방법.
- 제 1항에 있어서,상기 정현파 코드를 이용하여 상기 정현파 성분을 합성하는 단계와;상기 오디오 신호의 나머지 성분을 나타내는 값의 세트를 제공하기 위해 상기 샘플링된 신호 값으로부터 상기 합성된 신호 값을 감산하는 단계와;파라미터를 결정함으로써 상기 오디오 신호의 나머지 성분을 모델링하고, 상기 나머지 성분을 근사하는 단계와;상기 오디오 스트림에서 상기 파라미터를 포함시키는 단계를더 포함하는, 오디오 신호를 인코딩하는 방법.
- 제 1항에 있어서, 상기 샘플링된 신호 값은 과도 성분이 제거되는 오디오 신호를 나타내는, 오디오 신호를 인코딩하는 방법.
- 오디오 스트림 디코딩 방법으로서,링크된 정현파 성분의 각 트랙에 대한 위상을 나타내는 정현파 코드를 포함하는 인코딩된 오디오 스트림을 판독하는 단계와;각 트랙에 대해, 일반적으로 상기 위상을 나타내는 상기 코드로부터 단조롭게 변화하는 값을 생성하는 단계와;트랙에 대한 주파수의 추정치를 제공하기 위해 상기 생성된 값을 필터링하는 단계와;상기 오디오 신호의 상기 정현파 성분을 합성시키기 위해 상기 생성된 값 및 상기 주파수 추정치를 이용하는 단계를포함하는, 오디오 스트림 디코딩 방법.
- 오디오 신호의 복수의 순차 세그먼트 각각에 대한 샘플링된 신호 값의 각 세트를 처리하도록 배열된 오디오 코더로서,상기 복수의 순차 세그먼트 각각에 대한 하나 이상의 정현파 성분을 결정하기 위해 상기 샘플링된 신호 값을 분석하기 위한 분석기와;정현파 트랙을 제공하기 위해 복수의 순차 세그먼트에 걸쳐 정현파 성분을 링크시키는 링커와;각 정현파 트랙에 대해, 일반적으로 단조롭게 변화하는 값을 포함하는 위상을 결정하는 위상 언래퍼(unwrapper)와;상기 위상을 나타내는 정현파 코드를 포함하는 인코딩된 오디오 스트림을 제공하는 위상 인코더를포함하는, 오디오 코더.
- 오디오 플레이어로서,링크된 정현파 성분의 각 트랙에 대한 위상을 나타내는 정현파 코드를 포함하는 인코딩된 오디오 스트림을 판독하는 수단과;각 트랙에 대해, 일반적으로 상기 위상을 나타내는 상기 코드로부터 단조롭게 변화하는 값을 결정하는 위상 언래퍼와;트랙에 대한 주파수의 추정치를 제공하기 위해 상기 생성된 값을 필터링하는 필터와;상기 오디오 신호의 상기 정현파 성분을 합성하기 위해 상기 생성된 값 및 상기 주파수 추정치를 이용하도록 배열된 합성기를포함하는, 오디오 플레이어.
- 제 12항에 기재된 오디오 코더, 및 제 13항에 기재된 오디오 플레이어를 포함하는, 오디오 시스템.
- 오디오 신호의 링크된 정현파 성분의 트랙을 나타내는 정현파 코드를 포함하는 오디오 스트림으로서, 상기 코드는 일반적으로 링크된 정현파 성분의 각 트랙에 대한 위상에 대응하는 일반적으로 단조롭게 변화하는 값을 나타내는, 오디오 스트림.
- 제 15항에 기재된 오디오 스트림이 저장되는, 저장 매체.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP02080002 | 2002-11-29 | ||
EP02080002.5 | 2002-11-29 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20050086871A true KR20050086871A (ko) | 2005-08-30 |
KR101016995B1 KR101016995B1 (ko) | 2011-02-28 |
Family
ID=32405734
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020057009520A KR101016995B1 (ko) | 2002-11-29 | 2003-11-06 | 오디오 스트림을 디코딩하는 방법과, 오디오 플레이어와, 오디오 시스템 |
Country Status (14)
Country | Link |
---|---|
US (1) | US7664633B2 (ko) |
EP (1) | EP1568012B1 (ko) |
JP (1) | JP4606171B2 (ko) |
KR (1) | KR101016995B1 (ko) |
CN (1) | CN100559467C (ko) |
AT (1) | ATE381092T1 (ko) |
AU (1) | AU2003274617A1 (ko) |
BR (1) | BR0316663A (ko) |
DE (1) | DE60318102T2 (ko) |
ES (1) | ES2298568T3 (ko) |
MX (1) | MXPA05005601A (ko) |
PL (1) | PL376861A1 (ko) |
RU (1) | RU2353980C2 (ko) |
WO (1) | WO2004051627A1 (ko) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1846253B (zh) * | 2003-09-05 | 2010-06-16 | 皇家飞利浦电子股份有限公司 | 低比特率音频编码 |
WO2005036529A1 (en) | 2003-10-13 | 2005-04-21 | Koninklijke Philips Electronics N.V. | Audio encoding |
KR101393298B1 (ko) * | 2006-07-08 | 2014-05-12 | 삼성전자주식회사 | 적응적 부호화/복호화 방법 및 장치 |
KR20080073925A (ko) * | 2007-02-07 | 2008-08-12 | 삼성전자주식회사 | 파라메트릭 부호화된 오디오 신호를 복호화하는 방법 및장치 |
KR101080421B1 (ko) * | 2007-03-16 | 2011-11-04 | 삼성전자주식회사 | 정현파 오디오 코딩 방법 및 장치 |
KR101410230B1 (ko) * | 2007-08-17 | 2014-06-20 | 삼성전자주식회사 | 종지 정현파 신호와 일반적인 연속 정현파 신호를 다른방식으로 처리하는 오디오 신호 인코딩 방법 및 장치와오디오 신호 디코딩 방법 및 장치 |
KR101410229B1 (ko) * | 2007-08-20 | 2014-06-23 | 삼성전자주식회사 | 오디오 신호의 연속 정현파 신호 정보를 인코딩하는 방법및 장치와 디코딩 방법 및 장치 |
KR101425354B1 (ko) * | 2007-08-28 | 2014-08-06 | 삼성전자주식회사 | 오디오 신호의 연속 정현파 신호를 인코딩하는 방법 및장치와 디코딩 방법 및 장치 |
ES2942867T3 (es) * | 2010-07-19 | 2023-06-07 | Dolby Int Ab | Procesamiento de señales de audio durante la reconstrucción de alta frecuencia |
US12002476B2 (en) | 2010-07-19 | 2024-06-04 | Dolby International Ab | Processing of audio signals during high frequency reconstruction |
CN103765511B (zh) * | 2011-07-07 | 2016-01-20 | 纽昂斯通讯公司 | 嘈杂语音信号中的脉冲干扰的单信道抑制 |
PL232466B1 (pl) | 2015-01-19 | 2019-06-28 | Zylia Spolka Z Ograniczona Odpowiedzialnoscia | Sposób kodowania, sposób dekodowania, koder oraz dekoder sygnału audio |
US10847172B2 (en) | 2018-12-17 | 2020-11-24 | Microsoft Technology Licensing, Llc | Phase quantization in a speech encoder |
US10957331B2 (en) | 2018-12-17 | 2021-03-23 | Microsoft Technology Licensing, Llc | Phase reconstruction in a speech decoder |
Family Cites Families (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4151471A (en) * | 1977-11-04 | 1979-04-24 | Burns Richard C | System for reducing noise transients |
US4937873A (en) * | 1985-03-18 | 1990-06-26 | Massachusetts Institute Of Technology | Computationally efficient sine wave synthesis for acoustic waveform processing |
US5054072A (en) * | 1987-04-02 | 1991-10-01 | Massachusetts Institute Of Technology | Coding of acoustic waveforms |
CA1332982C (en) * | 1987-04-02 | 1994-11-08 | Robert J. Mcauley | Coding of acoustic waveforms |
US5179626A (en) * | 1988-04-08 | 1993-01-12 | At&T Bell Laboratories | Harmonic speech coding arrangement where a set of parameters for a continuous magnitude spectrum is determined by a speech analyzer and the parameters are used by a synthesizer to determine a spectrum which is used to determine senusoids for synthesis |
US5119397A (en) * | 1990-04-26 | 1992-06-02 | Telefonaktiebolaget L M Ericsson | Combined analog and digital cellular telephone system having a secondary set of control channels |
PL173718B1 (pl) * | 1993-06-30 | 1998-04-30 | Sony Corp | Sposób i urządzenie do kodowania sygnałów cyfrowych |
US5602959A (en) * | 1994-12-05 | 1997-02-11 | Motorola, Inc. | Method and apparatus for characterization and reconstruction of speech excitation waveforms |
US5646961A (en) * | 1994-12-30 | 1997-07-08 | Lucent Technologies Inc. | Method for noise weighting filtering |
US5727119A (en) * | 1995-03-27 | 1998-03-10 | Dolby Laboratories Licensing Corporation | Method and apparatus for efficient implementation of single-sideband filter banks providing accurate measures of spectral magnitude and phase |
US5710863A (en) * | 1995-09-19 | 1998-01-20 | Chen; Juin-Hwey | Speech signal quantization using human auditory models in predictive coding systems |
US5893057A (en) * | 1995-10-24 | 1999-04-06 | Ricoh Company Ltd. | Voice-based verification and identification methods and systems |
US5796842A (en) * | 1996-06-07 | 1998-08-18 | That Corporation | BTSC encoder |
AU3702497A (en) * | 1996-07-30 | 1998-02-20 | British Telecommunications Public Limited Company | Speech coding |
US7295752B1 (en) * | 1997-08-14 | 2007-11-13 | Virage, Inc. | Video cataloger system with audio track extraction |
JPH11224099A (ja) * | 1998-02-06 | 1999-08-17 | Sony Corp | 位相量子化装置及び方法 |
US6496797B1 (en) * | 1999-04-01 | 2002-12-17 | Lg Electronics Inc. | Apparatus and method of speech coding and decoding using multiple frames |
US7039581B1 (en) * | 1999-09-22 | 2006-05-02 | Texas Instruments Incorporated | Hybrid speed coding and system |
KR100780561B1 (ko) | 2000-03-15 | 2007-11-29 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 라게르 함수를 이용한 오디오 코딩 장치 및 방법 |
DE60113034T2 (de) * | 2000-06-20 | 2006-06-14 | Koninkl Philips Electronics Nv | Sinusoidale kodierung |
KR20080099326A (ko) * | 2001-01-16 | 2008-11-12 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 파라메트릭 엔코딩에서 신호 성분들의 링킹 |
EP2239733B1 (en) * | 2001-03-28 | 2019-08-21 | Mitsubishi Denki Kabushiki Kaisha | Noise suppression method |
US7184951B2 (en) * | 2002-02-15 | 2007-02-27 | Radiodetection Limted | Methods and systems for generating phase-derivative sound |
CN1846253B (zh) * | 2003-09-05 | 2010-06-16 | 皇家飞利浦电子股份有限公司 | 低比特率音频编码 |
TWI253625B (en) * | 2004-04-06 | 2006-04-21 | I-Shun Huang | Signal-processing system and method thereof |
-
2003
- 2003-11-06 RU RU2005120380/09A patent/RU2353980C2/ru not_active IP Right Cessation
- 2003-11-06 BR BR0316663-5A patent/BR0316663A/pt not_active IP Right Cessation
- 2003-11-06 AU AU2003274617A patent/AU2003274617A1/en not_active Abandoned
- 2003-11-06 PL PL376861A patent/PL376861A1/pl unknown
- 2003-11-06 CN CNB2003801045917A patent/CN100559467C/zh not_active Expired - Fee Related
- 2003-11-06 MX MXPA05005601A patent/MXPA05005601A/es active IP Right Grant
- 2003-11-06 EP EP03758591A patent/EP1568012B1/en not_active Expired - Lifetime
- 2003-11-06 WO PCT/IB2003/005019 patent/WO2004051627A1/en active IP Right Grant
- 2003-11-06 ES ES03758591T patent/ES2298568T3/es not_active Expired - Lifetime
- 2003-11-06 DE DE60318102T patent/DE60318102T2/de not_active Expired - Lifetime
- 2003-11-06 KR KR1020057009520A patent/KR101016995B1/ko active IP Right Grant
- 2003-11-06 JP JP2004556597A patent/JP4606171B2/ja not_active Expired - Fee Related
- 2003-11-06 US US10/536,228 patent/US7664633B2/en not_active Expired - Fee Related
- 2003-11-06 AT AT03758591T patent/ATE381092T1/de not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
US7664633B2 (en) | 2010-02-16 |
ATE381092T1 (de) | 2007-12-15 |
JP2006508394A (ja) | 2006-03-09 |
EP1568012A1 (en) | 2005-08-31 |
DE60318102T2 (de) | 2008-11-27 |
JP4606171B2 (ja) | 2011-01-05 |
CN1717719A (zh) | 2006-01-04 |
AU2003274617A8 (en) | 2004-06-23 |
MXPA05005601A (es) | 2005-07-26 |
PL376861A1 (pl) | 2006-01-09 |
RU2005120380A (ru) | 2006-01-20 |
RU2353980C2 (ru) | 2009-04-27 |
US20060036431A1 (en) | 2006-02-16 |
KR101016995B1 (ko) | 2011-02-28 |
AU2003274617A1 (en) | 2004-06-23 |
CN100559467C (zh) | 2009-11-11 |
WO2004051627A1 (en) | 2004-06-17 |
BR0316663A (pt) | 2005-10-11 |
ES2298568T3 (es) | 2008-05-16 |
EP1568012B1 (en) | 2007-12-12 |
DE60318102D1 (de) | 2008-01-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DK2543036T3 (en) | Method of encoding audio signals including generic audio and speech frames | |
KR101016995B1 (ko) | 오디오 스트림을 디코딩하는 방법과, 오디오 플레이어와, 오디오 시스템 | |
US7146324B2 (en) | Audio coding based on frequency variations of sinusoidal components | |
RU2368018C2 (ru) | Кодирование аудиосигнала с низкой скоростью передачи битов | |
JP2011203752A (ja) | オーディオ符号化方法及び装置 | |
US7596490B2 (en) | Low bit-rate audio encoding | |
US7197454B2 (en) | Audio coding | |
US20060009967A1 (en) | Sinusoidal audio coding with phase updates | |
KR20070019650A (ko) | 오디오 인코딩 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20140214 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20150211 Year of fee payment: 5 |
|
FPAY | Annual fee payment |
Payment date: 20160211 Year of fee payment: 6 |
|
FPAY | Annual fee payment |
Payment date: 20170206 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20180212 Year of fee payment: 8 |
|
FPAY | Annual fee payment |
Payment date: 20190213 Year of fee payment: 9 |
|
FPAY | Annual fee payment |
Payment date: 20200214 Year of fee payment: 10 |