RU2006105017A - Кодирование аудиосигнала с низкой скоростью передачи битов - Google Patents

Кодирование аудиосигнала с низкой скоростью передачи битов Download PDF

Info

Publication number
RU2006105017A
RU2006105017A RU2006105017/09A RU2006105017A RU2006105017A RU 2006105017 A RU2006105017 A RU 2006105017A RU 2006105017/09 A RU2006105017/09 A RU 2006105017/09A RU 2006105017 A RU2006105017 A RU 2006105017A RU 2006105017 A RU2006105017 A RU 2006105017A
Authority
RU
Russia
Prior art keywords
sinusoidal
value
phase
frequency
codes
Prior art date
Application number
RU2006105017/09A
Other languages
English (en)
Other versions
RU2368018C2 (ru
Inventor
Андреас Й. ГЕРРИТС (NL)
Андреас Й. ГЕРРИТС
БРИНКЕР Альбертус С. ДЕН (NL)
БРИНКЕР Альбертус С. ДЕН
Original Assignee
Конинклейке Филипс Электроникс Н.В. (Nl)
Конинклейке Филипс Электроникс Н.В.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Конинклейке Филипс Электроникс Н.В. (Nl), Конинклейке Филипс Электроникс Н.В. filed Critical Конинклейке Филипс Электроникс Н.В. (Nl)
Publication of RU2006105017A publication Critical patent/RU2006105017A/ru
Application granted granted Critical
Publication of RU2368018C2 publication Critical patent/RU2368018C2/ru

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/093Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters using sinusoidal excitation models

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Claims (19)

1. Способ кодирования сигнала, причем способ содержит обеспечение соответствующего набора значений дискретизированного сигнала (x(t)) для каждого из множества последовательных сегментов,
анализ значений дискретизированного сигнала (x(t)) для определения одной или нескольких синусоидальных компонент для каждого из множества последовательных сегментов, причем каждая синусоидальная компонента включает в себя значение частоты ( Ω) и значение фазы (ψ), связывание синусоидальных компонент на множестве последовательных сегментов для обеспечения синусоидальных дорожек, определение для каждой синусоидальной дорожки в каждом из множества синусоидальных сегментов прогнозируемого значения фазы
Figure 00000001
в функции значения фазы по меньшей мере для предыдущего сегмента, определение для каждой синусоидальной дорожки измеренного значения фазы (ψ), содержащего обычно монотонно изменяющееся значение, квантование синусоидальных кодов (CS) в функции прогнозируемого значения фазы
Figure 00000002
и измеренного значения фазы (ψ) для сегмента, в котором синусоидальные коды квантованы в зависимости по меньшей мере от значения частоты ( Ω) соответствующей синусоидальной дорожки, и создание кодированного сигнала (AS), включающего в себя синусоидальные коды (CS), представляющие частоту и фазу и информацию о связывании.
2. Способ по п.1, в котором в первой синусоидальной дорожке, включающей в себя первую синусоидальную компоненту с первым значением частоты, синусоидальные коды (CS) квантуют с использованием первой точности квантования, а во второй синусоидальной дорожке, включающей в себя вторую синусоидальную компоненту со вторым значением частоты, превышающем первое значение частоты, синусоидальные коды (CS) квантуют с использованием второй точности квантования, которая меньше или равна первой точности квантования.
3. Способ по п.1, в котором синусоидальные коды (CS) для дорожки включают в себя начальное значение фазы и начальное значение частоты, и при прогнозировании используют начальное значение частоты и начальное значение фазы для обеспечения первого прогноза.
4. Способ по п.1, в котором значение фазы каждого связанного сегмента определяют в функции интеграла частоты для предыдущего сегмента и частоты связанного сегмента, а также фазы предыдущего сегмента, в котором синусоидальные компоненты включают в себя значение фазы (ψ) в диапазоне {-π;π}.
5. Способ по п.1, в котором квантование синусоидальных кодов включает в себя определение разности фаз между каждым прогнозируемым значением
Figure 00000003
и соответствующим наблюдаемым значением (ψ).
6. Способ по п.4, в котором шаг создания содержит управление квантованием в функции квантованных синусоидальных кодов (CS).
7. Способ по п.6, в котором синусоидальные коды (CS) включают в себя индикатор конца дорожки.
8. Способ по п.1, который также содержит синтез синусоидальных компонент с использованием синусоидальных кодов (CS), вычитание значений синтезированного сигнала из дискретизированных значений (x(t)) сигнала для обеспечения набора значений (x3), представляющих остаточную компоненту аудиосигнала, моделирование остаточной компоненты аудиосигнала путем определения параметров, аппроксимирующих остаточную компоненту, и включение упомянутых параметров в аудиопоток (AS).
9. Способ по п.1, в котором значения (xi) дискретизированного сигнала представляют аудиосигнал, из которого были удалены переходные компоненты.
10. Способ декодирования аудиопотока (AS'), включающего в себя синусоидальные коды (CS), представляющие частоту и фазу и информацию о связывании, причем способ содержит прием сигнала, включающего в себя аудиопоток (AS'), деквантование синусоидальных кодов (CS) с получением таким образом значения
Figure 00000004
развернутой деквантованной фазы, где синусоидальные коды (CS) деквантуют в зависимости по меньшей мере от одного значения частоты соответствующей синусоидальной дорожки, вычисление значения (
Figure 00000005
) частоты исходя из значений (ψ) деквантованной развернутой фазы, и использование значений
Figure 00000006
деквантованных частоты и фазы для синтеза синусоидальных компонент аудиосигнала (y(t)).
11. Способ по п.10, в котором в первой синусоидальной дорожке, включающей в себя первую синусоидальную компоненту с первым значением частоты, синусоидальные коды (CS) деквантуют с использованием первой точности квантования, а во второй синусоидальной дорожке, включающей в себя вторую синусоидальную компоненту со вторым значением частоты, превышающем первое значение частоты, синусоидальные коды (CS) деквантуют с использованием второй точности квантования, которая меньше или равна первой точности квантования.
12. Способ по п.10, в котором значение фазы каждой связанной синусоидальной компоненты определяют в функции интеграла частоты для предыдущего сегмента и частоты связанного сегмента, а также фазы предыдущего сегмента, и в котором синусоидальные компоненты включают в себя значение фазы (ψ) в диапазоне {-π;π}.
13. Способ по п.12, в котором управление точностью квантования осуществляют в функции квантованных синусоидальных кодов.
14. Аудиокодер, выполненный для обработки соответствующего набора значений дискретизированного сигнала для каждого из множества последовательных сегментов, причем кодер содержит анализатор для анализа значений дискретизированного сигнала для определения одной или нескольких синусоидальных компонент для каждого из множества последовательных сегментов, причем каждая синусоидальная компонента включает в себя значение частоты и значение фазы, блок (13) связывания для связывания синусоидальных компонент на всем множестве последовательных сегментов для обеспечения синусоидальных дорожек, блок (44) разворачивания фазы для определения для каждой синусоидальной дорожки в каждом из множества последовательных сегментов прогнозируемого значения
Figure 00000007
в функции значения фазы по меньшей мере для предыдущего сегмента и для определения для каждой синусоидальной дорожки измеренного значения (ψ) фазы, содержащего обычно монотонно изменяющееся значение, квантователь (50) для квантования синусоидальных кодов в функции прогнозируемого значения
Figure 00000008
фазы и измеренного значения (ψ) фазы для сегмента, где синусоидальные коды квантуют в зависимости по меньшей мере от одного значения частоты соответствующей синусоидальной дорожки, и средство (15) для обеспечения кодированного сигнала, включающего в себя синусоидальные коды (CS), представляющие частоту и фазу.
15. Аудиокодер по п.14, в котором квантователь (50) адаптируется в первой синусоидальной дорожке, включающей первую синусоидальную компоненту с первым значением частоты, для квантования синусоидальных кодов (CS) с использованием первой точности квантования, и во второй синусоидальной дорожке, включающей в себя вторую синусоидальную компоненту со вторым значением частоты, превышающем первое значение частоты, для квантования синусоидальных кодов (CS) с использованием второй точности квантования, которая меньше или равна первой точности квантования.
16. Аудиоплеер, содержащий средство для считывания кодированного аудиосигнала, включающего в себя синусоидальные коды, представляющие частоту и фазу для каждой дорожки связанных синусоидальных компонент, деквантователь для создания значений фазы и для создания значений частоты исходя из упомянутых значений фазы, и синтезатор, скомпонованный для использования созданных значений фазы и частоты для синтеза синусоидальных компонент аудиосигнала.
17. Аудиосистема, содержащая аудиокодер по п.14 и аудиоплеер по п.16.
18. Аудиопоток, содержащий синусоидальные коды, представляющие дорожки синусоидальных компонент, связанных на всем множестве последовательных сегментов аудиосигнала, причем коды представляют прогнозируемое значение фазы в функции значения фазы по меньшей мере для предыдущего сегмента, при этом измеренное значение фазы содержит обычно монотонно изменяющееся значение, синусоидальные коды (CS) квантуются в функции прогнозируемого значения
Figure 00000009
и измеренного значения (ψ) для сегмента, где синусоидальные коды (CS) квантуют в зависимости по меньшей мере от одного значения ( Ω) частоты соответствующей синусоидальной дорожки.
19. Носитель данных, на котором запомнен аудиопоток по п.18.
RU2006105017/09A 2003-07-18 2004-07-08 Кодирование аудиосигнала с низкой скоростью передачи битов RU2368018C2 (ru)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP03102225 2003-07-18
EP03102225.4 2003-07-18

Publications (2)

Publication Number Publication Date
RU2006105017A true RU2006105017A (ru) 2006-06-27
RU2368018C2 RU2368018C2 (ru) 2009-09-20

Family

ID=34072659

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2006105017/09A RU2368018C2 (ru) 2003-07-18 2004-07-08 Кодирование аудиосигнала с низкой скоростью передачи битов

Country Status (11)

Country Link
US (1) US7640156B2 (ru)
EP (1) EP1649453B1 (ru)
JP (1) JP4782006B2 (ru)
KR (1) KR101058064B1 (ru)
CN (1) CN1826634B (ru)
AT (1) ATE425533T1 (ru)
BR (1) BRPI0412717A (ru)
DE (1) DE602004019928D1 (ru)
ES (1) ES2322264T3 (ru)
RU (1) RU2368018C2 (ru)
WO (1) WO2005008628A1 (ru)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7240001B2 (en) 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
WO2006085243A2 (en) * 2005-02-10 2006-08-17 Koninklijke Philips Electronics N.V. Sound synthesis
DE102006022346B4 (de) 2006-05-12 2008-02-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Informationssignalcodierung
KR20080073925A (ko) * 2007-02-07 2008-08-12 삼성전자주식회사 파라메트릭 부호화된 오디오 신호를 복호화하는 방법 및장치
KR101149448B1 (ko) * 2007-02-12 2012-05-25 삼성전자주식회사 오디오 부호화 및 복호화 장치와 그 방법
KR101317269B1 (ko) * 2007-06-07 2013-10-14 삼성전자주식회사 정현파 오디오 코딩 방법 및 장치, 그리고 정현파 오디오디코딩 방법 및 장치
KR20090008611A (ko) * 2007-07-18 2009-01-22 삼성전자주식회사 오디오 신호의 인코딩 방법 및 장치
KR101410229B1 (ko) * 2007-08-20 2014-06-23 삼성전자주식회사 오디오 신호의 연속 정현파 신호 정보를 인코딩하는 방법및 장치와 디코딩 방법 및 장치
KR101425355B1 (ko) * 2007-09-05 2014-08-06 삼성전자주식회사 파라메트릭 오디오 부호화 및 복호화 장치와 그 방법
US9082397B2 (en) 2007-11-06 2015-07-14 Nokia Technologies Oy Encoder
KR101325760B1 (ko) * 2009-12-17 2013-11-08 한국전자통신연구원 오디오/음성 신호 처리 장치의 복부호화 장치 및 방법
CN107452392B (zh) 2013-01-08 2020-09-01 杜比国际公司 临界采样滤波器组中的基于模型的预测
CN105765655A (zh) * 2013-11-22 2016-07-13 高通股份有限公司 高频带译码中的选择性相位补偿
PL232466B1 (pl) 2015-01-19 2019-06-28 Zylia Spolka Z Ograniczona Odpowiedzialnoscia Sposób kodowania, sposób dekodowania, koder oraz dekoder sygnału audio
CN107924683B (zh) * 2015-10-15 2021-03-30 华为技术有限公司 正弦编码和解码的方法和装置
EP3483886A1 (en) * 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Selecting pitch lag
US10957331B2 (en) 2018-12-17 2021-03-23 Microsoft Technology Licensing, Llc Phase reconstruction in a speech decoder
US10847172B2 (en) 2018-12-17 2020-11-24 Microsoft Technology Licensing, Llc Phase quantization in a speech encoder
EP4026122A1 (en) * 2019-09-03 2022-07-13 Dolby Laboratories Licensing Corporation Low-latency, low-frequency effects codec

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4885790A (en) * 1985-03-18 1989-12-05 Massachusetts Institute Of Technology Processing of acoustic waveforms
JPH11224099A (ja) * 1998-02-06 1999-08-17 Sony Corp 位相量子化装置及び方法
US7272556B1 (en) * 1998-09-23 2007-09-18 Lucent Technologies Inc. Scalable and embedded codec for speech and audio signals
AU4072400A (en) * 1999-04-05 2000-10-23 Hughes Electronics Corporation A voicing measure as an estimate of signal periodicity for frequency domain interpolative speech codec system
JP4803938B2 (ja) * 2000-03-15 2011-10-26 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオ符号化用のラゲール関数
KR100363259B1 (ko) 2000-05-16 2002-11-30 삼성전자 주식회사 인지 특성 가중 함수를 이용한 음성신호의 위상 양자화장치 및 방법
ATE303646T1 (de) * 2000-06-20 2005-09-15 Koninkl Philips Electronics Nv Sinusoidale kodierung
JP2004518163A (ja) * 2001-01-16 2004-06-17 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオ又は音声信号のパラメトリック符号化
KR20080099326A (ko) * 2001-01-16 2008-11-12 코닌클리케 필립스 일렉트로닉스 엔.브이. 파라메트릭 엔코딩에서 신호 성분들의 링킹
EP1382035A1 (en) * 2001-04-18 2004-01-21 Koninklijke Philips Electronics N.V. Audio coding
JP4359499B2 (ja) * 2001-06-08 2009-11-04 アイピージー エレクトロニクス 503 リミテッド オーディオ信号の編集
CN1771533A (zh) * 2003-05-27 2006-05-10 皇家飞利浦电子股份有限公司 音频编码

Also Published As

Publication number Publication date
CN1826634A (zh) 2006-08-30
ATE425533T1 (de) 2009-03-15
EP1649453B1 (en) 2009-03-11
DE602004019928D1 (de) 2009-04-23
RU2368018C2 (ru) 2009-09-20
KR20060037375A (ko) 2006-05-03
US7640156B2 (en) 2009-12-29
JP2007519027A (ja) 2007-07-12
JP4782006B2 (ja) 2011-09-28
EP1649453A1 (en) 2006-04-26
BRPI0412717A (pt) 2006-09-26
ES2322264T3 (es) 2009-06-18
US20070112560A1 (en) 2007-05-17
CN1826634B (zh) 2010-12-01
WO2005008628A1 (en) 2005-01-27
KR101058064B1 (ko) 2011-08-22

Similar Documents

Publication Publication Date Title
RU2006105017A (ru) Кодирование аудиосигнала с низкой скоростью передачи битов
KR101604774B1 (ko) 멀티-레퍼런스 lpc 필터 양자화 및 역 양자화 장치 및 방법
US7876966B2 (en) Switching between coding schemes
US7957958B2 (en) Pitch period equalizing apparatus and pitch period equalizing method, and speech coding apparatus, speech decoding apparatus, and speech coding method
US6470313B1 (en) Speech coding
JP5175028B2 (ja) デジタル信号の符号化方法及び装置ならびに復号化方法及び装置
KR100827896B1 (ko) 프레임 에러에 대한 민감도를 감소시키기 위하여 코딩 방식 선택 패턴을 사용하는 예측 음성 코더
KR100603167B1 (ko) 시간 동기식 파형 보간법을 이용한 피치 프로토타입파형으로부터의 음성 합성
RU2015127216A (ru) Предсказание на основе модели в наборе фильтров с критической дискретизацией
KR100700857B1 (ko) 전환 스피치 프레임의 다중 펄스 보간 코딩
US20070027678A1 (en) Low bit-rate audio encoding
RU2005120380A (ru) Аудиокодирование
US7197454B2 (en) Audio coding
US6801887B1 (en) Speech coding exploiting the power ratio of different speech signal components
JP2000132193A (ja) 信号符号化装置及び方法、並びに信号復号装置及び方法
KR101009799B1 (ko) 음성 신호 압축 장치, 음성 신호 압축 방법 및 프로그램
US7899667B2 (en) Waveform interpolation speech coding apparatus and method for reducing complexity thereof
KR20080092823A (ko) 부호화/복호화 장치 및 방법
KR20020081352A (ko) 유사주기 신호의 위상을 추적하는 방법 및 장치
JP3330178B2 (ja) 音声符号化装置および音声復号化装置

Legal Events

Date Code Title Description
MM4A The patent is invalid due to non-payment of fees

Effective date: 20120709