RU2006105017A - Кодирование аудиосигнала с низкой скоростью передачи битов - Google Patents
Кодирование аудиосигнала с низкой скоростью передачи битов Download PDFInfo
- Publication number
- RU2006105017A RU2006105017A RU2006105017/09A RU2006105017A RU2006105017A RU 2006105017 A RU2006105017 A RU 2006105017A RU 2006105017/09 A RU2006105017/09 A RU 2006105017/09A RU 2006105017 A RU2006105017 A RU 2006105017A RU 2006105017 A RU2006105017 A RU 2006105017A
- Authority
- RU
- Russia
- Prior art keywords
- sinusoidal
- value
- phase
- frequency
- codes
- Prior art date
Links
- 230000005540 biological transmission Effects 0.000 title 1
- 238000000034 method Methods 0.000 claims 16
- 238000013139 quantization Methods 0.000 claims 12
- 230000005236 sound signal Effects 0.000 claims 7
- 230000015572 biosynthetic process Effects 0.000 claims 2
- 238000003786 synthesis reaction Methods 0.000 claims 2
- 230000002194 synthesizing effect Effects 0.000 claims 1
- 230000001052 transient effect Effects 0.000 claims 1
- 230000001419 dependent effect Effects 0.000 abstract 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/093—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters using sinusoidal excitation models
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Claims (19)
1. Способ кодирования сигнала, причем способ содержит обеспечение соответствующего набора значений дискретизированного сигнала (x(t)) для каждого из множества последовательных сегментов,
анализ значений дискретизированного сигнала (x(t)) для определения одной или нескольких синусоидальных компонент для каждого из множества последовательных сегментов, причем каждая синусоидальная компонента включает в себя значение частоты ( Ω) и значение фазы (ψ), связывание синусоидальных компонент на множестве последовательных сегментов для обеспечения синусоидальных дорожек, определение для каждой синусоидальной дорожки в каждом из множества синусоидальных сегментов прогнозируемого значения фазы в функции значения фазы по меньшей мере для предыдущего сегмента, определение для каждой синусоидальной дорожки измеренного значения фазы (ψ), содержащего обычно монотонно изменяющееся значение, квантование синусоидальных кодов (CS) в функции прогнозируемого значения фазы и измеренного значения фазы (ψ) для сегмента, в котором синусоидальные коды квантованы в зависимости по меньшей мере от значения частоты ( Ω) соответствующей синусоидальной дорожки, и создание кодированного сигнала (AS), включающего в себя синусоидальные коды (CS), представляющие частоту и фазу и информацию о связывании.
2. Способ по п.1, в котором в первой синусоидальной дорожке, включающей в себя первую синусоидальную компоненту с первым значением частоты, синусоидальные коды (CS) квантуют с использованием первой точности квантования, а во второй синусоидальной дорожке, включающей в себя вторую синусоидальную компоненту со вторым значением частоты, превышающем первое значение частоты, синусоидальные коды (CS) квантуют с использованием второй точности квантования, которая меньше или равна первой точности квантования.
3. Способ по п.1, в котором синусоидальные коды (CS) для дорожки включают в себя начальное значение фазы и начальное значение частоты, и при прогнозировании используют начальное значение частоты и начальное значение фазы для обеспечения первого прогноза.
4. Способ по п.1, в котором значение фазы каждого связанного сегмента определяют в функции интеграла частоты для предыдущего сегмента и частоты связанного сегмента, а также фазы предыдущего сегмента, в котором синусоидальные компоненты включают в себя значение фазы (ψ) в диапазоне {-π;π}.
6. Способ по п.4, в котором шаг создания содержит управление квантованием в функции квантованных синусоидальных кодов (CS).
7. Способ по п.6, в котором синусоидальные коды (CS) включают в себя индикатор конца дорожки.
8. Способ по п.1, который также содержит синтез синусоидальных компонент с использованием синусоидальных кодов (CS), вычитание значений синтезированного сигнала из дискретизированных значений (x(t)) сигнала для обеспечения набора значений (x3), представляющих остаточную компоненту аудиосигнала, моделирование остаточной компоненты аудиосигнала путем определения параметров, аппроксимирующих остаточную компоненту, и включение упомянутых параметров в аудиопоток (AS).
9. Способ по п.1, в котором значения (xi) дискретизированного сигнала представляют аудиосигнал, из которого были удалены переходные компоненты.
10. Способ декодирования аудиопотока (AS'), включающего в себя синусоидальные коды (CS), представляющие частоту и фазу и информацию о связывании, причем способ содержит прием сигнала, включающего в себя аудиопоток (AS'), деквантование синусоидальных кодов (CS) с получением таким образом значения развернутой деквантованной фазы, где синусоидальные коды (CS) деквантуют в зависимости по меньшей мере от одного значения частоты соответствующей синусоидальной дорожки, вычисление значения () частоты исходя из значений (ψ) деквантованной развернутой фазы, и использование значений деквантованных частоты и фазы для синтеза синусоидальных компонент аудиосигнала (y(t)).
11. Способ по п.10, в котором в первой синусоидальной дорожке, включающей в себя первую синусоидальную компоненту с первым значением частоты, синусоидальные коды (CS) деквантуют с использованием первой точности квантования, а во второй синусоидальной дорожке, включающей в себя вторую синусоидальную компоненту со вторым значением частоты, превышающем первое значение частоты, синусоидальные коды (CS) деквантуют с использованием второй точности квантования, которая меньше или равна первой точности квантования.
12. Способ по п.10, в котором значение фазы каждой связанной синусоидальной компоненты определяют в функции интеграла частоты для предыдущего сегмента и частоты связанного сегмента, а также фазы предыдущего сегмента, и в котором синусоидальные компоненты включают в себя значение фазы (ψ) в диапазоне {-π;π}.
13. Способ по п.12, в котором управление точностью квантования осуществляют в функции квантованных синусоидальных кодов.
14. Аудиокодер, выполненный для обработки соответствующего набора значений дискретизированного сигнала для каждого из множества последовательных сегментов, причем кодер содержит анализатор для анализа значений дискретизированного сигнала для определения одной или нескольких синусоидальных компонент для каждого из множества последовательных сегментов, причем каждая синусоидальная компонента включает в себя значение частоты и значение фазы, блок (13) связывания для связывания синусоидальных компонент на всем множестве последовательных сегментов для обеспечения синусоидальных дорожек, блок (44) разворачивания фазы для определения для каждой синусоидальной дорожки в каждом из множества последовательных сегментов прогнозируемого значения в функции значения фазы по меньшей мере для предыдущего сегмента и для определения для каждой синусоидальной дорожки измеренного значения (ψ) фазы, содержащего обычно монотонно изменяющееся значение, квантователь (50) для квантования синусоидальных кодов в функции прогнозируемого значения фазы и измеренного значения (ψ) фазы для сегмента, где синусоидальные коды квантуют в зависимости по меньшей мере от одного значения частоты соответствующей синусоидальной дорожки, и средство (15) для обеспечения кодированного сигнала, включающего в себя синусоидальные коды (CS), представляющие частоту и фазу.
15. Аудиокодер по п.14, в котором квантователь (50) адаптируется в первой синусоидальной дорожке, включающей первую синусоидальную компоненту с первым значением частоты, для квантования синусоидальных кодов (CS) с использованием первой точности квантования, и во второй синусоидальной дорожке, включающей в себя вторую синусоидальную компоненту со вторым значением частоты, превышающем первое значение частоты, для квантования синусоидальных кодов (CS) с использованием второй точности квантования, которая меньше или равна первой точности квантования.
16. Аудиоплеер, содержащий средство для считывания кодированного аудиосигнала, включающего в себя синусоидальные коды, представляющие частоту и фазу для каждой дорожки связанных синусоидальных компонент, деквантователь для создания значений фазы и для создания значений частоты исходя из упомянутых значений фазы, и синтезатор, скомпонованный для использования созданных значений фазы и частоты для синтеза синусоидальных компонент аудиосигнала.
17. Аудиосистема, содержащая аудиокодер по п.14 и аудиоплеер по п.16.
18. Аудиопоток, содержащий синусоидальные коды, представляющие дорожки синусоидальных компонент, связанных на всем множестве последовательных сегментов аудиосигнала, причем коды представляют прогнозируемое значение фазы в функции значения фазы по меньшей мере для предыдущего сегмента, при этом измеренное значение фазы содержит обычно монотонно изменяющееся значение, синусоидальные коды (CS) квантуются в функции прогнозируемого значения и измеренного значения (ψ) для сегмента, где синусоидальные коды (CS) квантуют в зависимости по меньшей мере от одного значения ( Ω) частоты соответствующей синусоидальной дорожки.
19. Носитель данных, на котором запомнен аудиопоток по п.18.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP03102225 | 2003-07-18 | ||
EP03102225.4 | 2003-07-18 |
Publications (2)
Publication Number | Publication Date |
---|---|
RU2006105017A true RU2006105017A (ru) | 2006-06-27 |
RU2368018C2 RU2368018C2 (ru) | 2009-09-20 |
Family
ID=34072659
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2006105017/09A RU2368018C2 (ru) | 2003-07-18 | 2004-07-08 | Кодирование аудиосигнала с низкой скоростью передачи битов |
Country Status (11)
Country | Link |
---|---|
US (1) | US7640156B2 (ru) |
EP (1) | EP1649453B1 (ru) |
JP (1) | JP4782006B2 (ru) |
KR (1) | KR101058064B1 (ru) |
CN (1) | CN1826634B (ru) |
AT (1) | ATE425533T1 (ru) |
BR (1) | BRPI0412717A (ru) |
DE (1) | DE602004019928D1 (ru) |
ES (1) | ES2322264T3 (ru) |
RU (1) | RU2368018C2 (ru) |
WO (1) | WO2005008628A1 (ru) |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7240001B2 (en) | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
WO2006085243A2 (en) * | 2005-02-10 | 2006-08-17 | Koninklijke Philips Electronics N.V. | Sound synthesis |
DE102006022346B4 (de) | 2006-05-12 | 2008-02-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Informationssignalcodierung |
KR20080073925A (ko) * | 2007-02-07 | 2008-08-12 | 삼성전자주식회사 | 파라메트릭 부호화된 오디오 신호를 복호화하는 방법 및장치 |
KR101149448B1 (ko) * | 2007-02-12 | 2012-05-25 | 삼성전자주식회사 | 오디오 부호화 및 복호화 장치와 그 방법 |
KR101317269B1 (ko) * | 2007-06-07 | 2013-10-14 | 삼성전자주식회사 | 정현파 오디오 코딩 방법 및 장치, 그리고 정현파 오디오디코딩 방법 및 장치 |
KR20090008611A (ko) * | 2007-07-18 | 2009-01-22 | 삼성전자주식회사 | 오디오 신호의 인코딩 방법 및 장치 |
KR101410229B1 (ko) * | 2007-08-20 | 2014-06-23 | 삼성전자주식회사 | 오디오 신호의 연속 정현파 신호 정보를 인코딩하는 방법및 장치와 디코딩 방법 및 장치 |
KR101425355B1 (ko) * | 2007-09-05 | 2014-08-06 | 삼성전자주식회사 | 파라메트릭 오디오 부호화 및 복호화 장치와 그 방법 |
US9082397B2 (en) | 2007-11-06 | 2015-07-14 | Nokia Technologies Oy | Encoder |
KR101325760B1 (ko) * | 2009-12-17 | 2013-11-08 | 한국전자통신연구원 | 오디오/음성 신호 처리 장치의 복부호화 장치 및 방법 |
CN107452392B (zh) | 2013-01-08 | 2020-09-01 | 杜比国际公司 | 临界采样滤波器组中的基于模型的预测 |
CN105765655A (zh) * | 2013-11-22 | 2016-07-13 | 高通股份有限公司 | 高频带译码中的选择性相位补偿 |
PL232466B1 (pl) | 2015-01-19 | 2019-06-28 | Zylia Spolka Z Ograniczona Odpowiedzialnoscia | Sposób kodowania, sposób dekodowania, koder oraz dekoder sygnału audio |
CN107924683B (zh) * | 2015-10-15 | 2021-03-30 | 华为技术有限公司 | 正弦编码和解码的方法和装置 |
EP3483886A1 (en) * | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Selecting pitch lag |
US10957331B2 (en) | 2018-12-17 | 2021-03-23 | Microsoft Technology Licensing, Llc | Phase reconstruction in a speech decoder |
US10847172B2 (en) | 2018-12-17 | 2020-11-24 | Microsoft Technology Licensing, Llc | Phase quantization in a speech encoder |
EP4026122A1 (en) * | 2019-09-03 | 2022-07-13 | Dolby Laboratories Licensing Corporation | Low-latency, low-frequency effects codec |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4885790A (en) * | 1985-03-18 | 1989-12-05 | Massachusetts Institute Of Technology | Processing of acoustic waveforms |
JPH11224099A (ja) * | 1998-02-06 | 1999-08-17 | Sony Corp | 位相量子化装置及び方法 |
US7272556B1 (en) * | 1998-09-23 | 2007-09-18 | Lucent Technologies Inc. | Scalable and embedded codec for speech and audio signals |
AU4072400A (en) * | 1999-04-05 | 2000-10-23 | Hughes Electronics Corporation | A voicing measure as an estimate of signal periodicity for frequency domain interpolative speech codec system |
JP4803938B2 (ja) * | 2000-03-15 | 2011-10-26 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | オーディオ符号化用のラゲール関数 |
KR100363259B1 (ko) | 2000-05-16 | 2002-11-30 | 삼성전자 주식회사 | 인지 특성 가중 함수를 이용한 음성신호의 위상 양자화장치 및 방법 |
ATE303646T1 (de) * | 2000-06-20 | 2005-09-15 | Koninkl Philips Electronics Nv | Sinusoidale kodierung |
JP2004518163A (ja) * | 2001-01-16 | 2004-06-17 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | オーディオ又は音声信号のパラメトリック符号化 |
KR20080099326A (ko) * | 2001-01-16 | 2008-11-12 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 파라메트릭 엔코딩에서 신호 성분들의 링킹 |
EP1382035A1 (en) * | 2001-04-18 | 2004-01-21 | Koninklijke Philips Electronics N.V. | Audio coding |
JP4359499B2 (ja) * | 2001-06-08 | 2009-11-04 | アイピージー エレクトロニクス 503 リミテッド | オーディオ信号の編集 |
CN1771533A (zh) * | 2003-05-27 | 2006-05-10 | 皇家飞利浦电子股份有限公司 | 音频编码 |
-
2004
- 2004-07-08 RU RU2006105017/09A patent/RU2368018C2/ru not_active IP Right Cessation
- 2004-07-08 US US10/564,656 patent/US7640156B2/en not_active Expired - Fee Related
- 2004-07-08 AT AT04744533T patent/ATE425533T1/de not_active IP Right Cessation
- 2004-07-08 CN CN2004800206738A patent/CN1826634B/zh not_active Expired - Fee Related
- 2004-07-08 BR BRPI0412717-0A patent/BRPI0412717A/pt not_active IP Right Cessation
- 2004-07-08 JP JP2006520077A patent/JP4782006B2/ja not_active Expired - Fee Related
- 2004-07-08 KR KR1020067001232A patent/KR101058064B1/ko active IP Right Grant
- 2004-07-08 ES ES04744533T patent/ES2322264T3/es not_active Expired - Lifetime
- 2004-07-08 DE DE602004019928T patent/DE602004019928D1/de not_active Expired - Lifetime
- 2004-07-08 EP EP04744533A patent/EP1649453B1/en not_active Expired - Lifetime
- 2004-07-08 WO PCT/IB2004/051172 patent/WO2005008628A1/en active Application Filing
Also Published As
Publication number | Publication date |
---|---|
CN1826634A (zh) | 2006-08-30 |
ATE425533T1 (de) | 2009-03-15 |
EP1649453B1 (en) | 2009-03-11 |
DE602004019928D1 (de) | 2009-04-23 |
RU2368018C2 (ru) | 2009-09-20 |
KR20060037375A (ko) | 2006-05-03 |
US7640156B2 (en) | 2009-12-29 |
JP2007519027A (ja) | 2007-07-12 |
JP4782006B2 (ja) | 2011-09-28 |
EP1649453A1 (en) | 2006-04-26 |
BRPI0412717A (pt) | 2006-09-26 |
ES2322264T3 (es) | 2009-06-18 |
US20070112560A1 (en) | 2007-05-17 |
CN1826634B (zh) | 2010-12-01 |
WO2005008628A1 (en) | 2005-01-27 |
KR101058064B1 (ko) | 2011-08-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2006105017A (ru) | Кодирование аудиосигнала с низкой скоростью передачи битов | |
KR101604774B1 (ko) | 멀티-레퍼런스 lpc 필터 양자화 및 역 양자화 장치 및 방법 | |
US7876966B2 (en) | Switching between coding schemes | |
US7957958B2 (en) | Pitch period equalizing apparatus and pitch period equalizing method, and speech coding apparatus, speech decoding apparatus, and speech coding method | |
US6470313B1 (en) | Speech coding | |
JP5175028B2 (ja) | デジタル信号の符号化方法及び装置ならびに復号化方法及び装置 | |
KR100827896B1 (ko) | 프레임 에러에 대한 민감도를 감소시키기 위하여 코딩 방식 선택 패턴을 사용하는 예측 음성 코더 | |
KR100603167B1 (ko) | 시간 동기식 파형 보간법을 이용한 피치 프로토타입파형으로부터의 음성 합성 | |
RU2015127216A (ru) | Предсказание на основе модели в наборе фильтров с критической дискретизацией | |
KR100700857B1 (ko) | 전환 스피치 프레임의 다중 펄스 보간 코딩 | |
US20070027678A1 (en) | Low bit-rate audio encoding | |
RU2005120380A (ru) | Аудиокодирование | |
US7197454B2 (en) | Audio coding | |
US6801887B1 (en) | Speech coding exploiting the power ratio of different speech signal components | |
JP2000132193A (ja) | 信号符号化装置及び方法、並びに信号復号装置及び方法 | |
KR101009799B1 (ko) | 음성 신호 압축 장치, 음성 신호 압축 방법 및 프로그램 | |
US7899667B2 (en) | Waveform interpolation speech coding apparatus and method for reducing complexity thereof | |
KR20080092823A (ko) | 부호화/복호화 장치 및 방법 | |
KR20020081352A (ko) | 유사주기 신호의 위상을 추적하는 방법 및 장치 | |
JP3330178B2 (ja) | 音声符号化装置および音声復号化装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
MM4A | The patent is invalid due to non-payment of fees |
Effective date: 20120709 |