RU2006139793A - Кодирование сигнала - Google Patents

Кодирование сигнала Download PDF

Info

Publication number
RU2006139793A
RU2006139793A RU2006139793/09A RU2006139793A RU2006139793A RU 2006139793 A RU2006139793 A RU 2006139793A RU 2006139793/09 A RU2006139793/09 A RU 2006139793/09A RU 2006139793 A RU2006139793 A RU 2006139793A RU 2006139793 A RU2006139793 A RU 2006139793A
Authority
RU
Russia
Prior art keywords
parameters
frame
encoding
encoder
excitation
Prior art date
Application number
RU2006139793/09A
Other languages
English (en)
Inventor
Яри М. МЯКИНЕН (FI)
Яри М. МЯКИНЕН
Original Assignee
Нокиа Корпорейшн (Fi)
Нокиа Корпорейшн
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Нокиа Корпорейшн (Fi), Нокиа Корпорейшн filed Critical Нокиа Корпорейшн (Fi)
Publication of RU2006139793A publication Critical patent/RU2006139793A/ru

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Claims (30)

1. Способ кодирования кадра в кодере системы связи, указанный способ включает:
вычисление первого набора параметров, связанного с кадром, причем указанный первый набор параметров содержит параметры банка фильтров;
выбор на первом этапе одного из множества способов кодирования на основе заранее заданных условий, связанных с первым набором параметров;
вычисление второго набора параметров, связанного с кадром;
выбор на втором этапе одного из множества способов кодирования на основе результата выбора на первом этапе и второго набора параметров и
кодирование кадра с использованием выбранного на втором этапе способа кодирования.
2. Способ по п.1, в котором множество способов кодирования включает первый и второй способы возбуждения.
3. Способ по п.1, в котором указанный первый набор параметров основан на уровнях энергии в одной или более полос частот, связанных с кадром.
4. Способ по п.1, в котором на указанном первом этапе для различных заранее заданных условий для указанного первого набора параметров никакого способа кодирования на первом этапе не выбирается.
5. Способ по п.1, в котором указанный второй набор параметров содержит по меньшей мере одно из следующего: спектральные параметры, LTP-параметры и параметры корреляции, связанные с кадром.
6. Способ по п.2, в котором первым способом возбуждения является возбуждение по алгоритму линейного предсказания с возбуждением алгебраическим кодом.
7. Способ по п.2, в котором вторым способом возбуждения является возбуждение кодирования с преобразованием.
8. Способ по п.2, в котором, когда кадр кодируют с использованием второго способа возбуждения, способ кодирования дополнительно содержит:
выбор длины кадра для кодирования с использованием второго способа возбуждения на основе выбора на первом и втором этапах.
9. Способ по п.8, в котором выбор длины кадра для кодирования зависит от отношения сигнал/шум в кадре.
10. Способ по п.1, в котором кодер является кодером AMR-WB+.
11. Способ по п.1, в котором кадр является звуковым.
12. Способ по п.10, в котором звуковой кадр содержит речевой или неречевой сигнал.
13. Способ по п.11, в котором неречевой сигнал содержит музыку.
14. Кодер для кодирования кадра в системе связи, указанный кодер содержит:
первый вычислительный блок для вычисления первого набора параметров, связанного с кадром, причем указанный первый набор параметров содержит параметры банка фильтров;
блок выбора на первом этапе для выбора одного из множества способов кодирования на основе заранее заданных условий, связанных с первым набором параметров;
второй вычислительный блок для вычисления второго набора параметров, связанного с кадром;
блок выбора на втором этапе для выбора одного из множества способов кодирования на основе результата выбора на первом этапе и второго набора параметров и
блок кодирования для кодирования кадра с использованием выбранного на втором этапе способа кодирования.
15. Кодер по п.14, в котором множество способов кодирования включает первый и второй способы возбуждения.
16. Кодер по п.15, в котором первым способом возбуждения является возбуждение по алгоритму линейного предсказания с возбуждением алгебраическим кодом.
17. Кодер по п.15, в котором вторым способом возбуждения является возбуждение кодирования с преобразованием.
18. Кодер по п.14, в котором указанный первый набор параметров основан на уровнях энергии в одной или более полосах частот, связанных с кадром.
19. Кодер по п.14, в котором блок выбора на первом этапе выполнен с возможностью не выбирать никакого способа кодирования на основе различных заранее заданных условий для указанного первого набора параметров.
20. Кодер по п.14, в котором указанный второй набор параметров содержит по меньшей мере одно из следующего: спектральные параметры, LTP-параметры и параметры корреляции, связанные с кадром.
21. Кодер по п.15, который дополнительно содержит:
блок выбора на третьем этапе для выбора длины кадра, кодированного с использованием второго способа возбуждения, на основе выбора в блоке выбора на первом этапе и блоке выбора на втором этапе.
22. Кодер по п.14, в котором выбор длины кодированного кадра зависит от отношения сигнал/шум в кадре.
23. Кодер по п.14, в котором кодер является кодером AMR-WB+.
24. Кодер по п.14, в котором кадр является звуковым.
25. Кодер по п.14, в котором звуковой кадр содержит речевой или неречевой сигнал.
26. Кодер по п.14, в котором неречевой сигнал содержит музыку.
27. Терминал, содержащий кодер по п.14.
28. Терминал по п.27, который является устройством обработки сигнала.
29. Терминал по п.27, который является мобильным терминалом.
30. Способ кодирования кадра в кодере системы связи, указанный способ включает:
вычисление первого набора параметров, связанного с кадром, при этом указанный первый набор параметров содержит параметры банка фильтров;
выбор на первом этапе одного из первого и второго способов возбуждения на основе первого набора параметров и
кодирование кадра с использованием выбранного способа возбуждения.
RU2006139793/09A 2004-04-21 2005-04-19 Кодирование сигнала RU2006139793A (ru)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
GB0408856.3 2004-04-21
GBGB0408856.3A GB0408856D0 (en) 2004-04-21 2004-04-21 Signal encoding

Publications (1)

Publication Number Publication Date
RU2006139793A true RU2006139793A (ru) 2008-05-27

Family

ID=32344124

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2006139793/09A RU2006139793A (ru) 2004-04-21 2005-04-19 Кодирование сигнала

Country Status (18)

Country Link
US (1) US8244525B2 (ru)
EP (1) EP1738355B1 (ru)
JP (1) JP2007534020A (ru)
KR (2) KR20080103113A (ru)
CN (1) CN1969319B (ru)
AT (1) ATE483230T1 (ru)
AU (1) AU2005236596A1 (ru)
BR (1) BRPI0510270A (ru)
CA (1) CA2562877A1 (ru)
DE (1) DE602005023848D1 (ru)
ES (1) ES2349554T3 (ru)
GB (1) GB0408856D0 (ru)
HK (1) HK1104369A1 (ru)
MX (1) MXPA06011957A (ru)
RU (1) RU2006139793A (ru)
TW (1) TWI275253B (ru)
WO (1) WO2005104095A1 (ru)
ZA (1) ZA200609627B (ru)

Families Citing this family (48)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2566368A1 (en) * 2004-05-17 2005-11-24 Nokia Corporation Audio encoding with different coding frame lengths
JP2009503574A (ja) * 2005-07-29 2009-01-29 エルジー エレクトロニクス インコーポレイティド 分割情報のシグナリング方法
WO2007083931A1 (en) * 2006-01-18 2007-07-26 Lg Electronics Inc. Apparatus and method for encoding and decoding signal
US9185487B2 (en) 2006-01-30 2015-11-10 Audience, Inc. System and method for providing noise suppression utilizing null processing noise subtraction
JP2009533992A (ja) * 2006-04-19 2009-09-17 ノキア コーポレイション アップリンク移動体通信の修正2重シンボル速度
JP4847246B2 (ja) * 2006-07-31 2011-12-28 キヤノン株式会社 通信装置、通信装置の制御方法、及び当該制御方法をコンピュータに実行させるためのコンピュータプログラム
WO2008049221A1 (en) * 2006-10-24 2008-05-02 Voiceage Corporation Method and device for coding transition frames in speech signals
KR100964402B1 (ko) * 2006-12-14 2010-06-17 삼성전자주식회사 오디오 신호의 부호화 모드 결정 방법 및 장치와 이를 이용한 오디오 신호의 부호화/복호화 방법 및 장치
JP4410792B2 (ja) * 2006-12-21 2010-02-03 株式会社日立コミュニケーションテクノロジー 暗号化装置
FR2911228A1 (fr) * 2007-01-05 2008-07-11 France Telecom Codage par transformee, utilisant des fenetres de ponderation et a faible retard.
KR101379263B1 (ko) * 2007-01-12 2014-03-28 삼성전자주식회사 대역폭 확장 복호화 방법 및 장치
US8982744B2 (en) * 2007-06-06 2015-03-17 Broadcom Corporation Method and system for a subband acoustic echo canceller with integrated voice activity detection
KR101403340B1 (ko) * 2007-08-02 2014-06-09 삼성전자주식회사 변환 부호화 방법 및 장치
WO2009038422A2 (en) * 2007-09-20 2009-03-26 Lg Electronics Inc. A method and an apparatus for processing a signal
US8050932B2 (en) 2008-02-20 2011-11-01 Research In Motion Limited Apparatus, and associated method, for selecting speech COder operational rates
KR20100006492A (ko) * 2008-07-09 2010-01-19 삼성전자주식회사 부호화 방식 결정 방법 및 장치
KR20100007738A (ko) * 2008-07-14 2010-01-22 한국전자통신연구원 음성/오디오 통합 신호의 부호화/복호화 장치
WO2010134759A2 (ko) * 2009-05-19 2010-11-25 한국전자통신연구원 Mdct-tcx 프레임과 celp 프레임 간 연동을 위한 윈도우 처리 장치 및 윈도우 처리 방법
CN101615910B (zh) * 2009-05-31 2010-12-22 华为技术有限公司 压缩编码的方法、装置和设备以及压缩解码方法
US20110040981A1 (en) * 2009-08-14 2011-02-17 Apple Inc. Synchronization of Buffered Audio Data With Live Broadcast
US9838784B2 (en) 2009-12-02 2017-12-05 Knowles Electronics, Llc Directional audio capture
US8798290B1 (en) 2010-04-21 2014-08-05 Audience, Inc. Systems and methods for adaptive signal equalization
US9558755B1 (en) * 2010-05-20 2017-01-31 Knowles Electronics, Llc Noise suppression assisted automatic speech recognition
WO2012000882A1 (en) 2010-07-02 2012-01-05 Dolby International Ab Selective bass post filter
PL2676265T3 (pl) 2011-02-14 2019-09-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Urządzenie i sposób do kodowania sygnału audio z stosowaniem zrównanej części antycypacji
BR112013020482B1 (pt) 2011-02-14 2021-02-23 Fraunhofer Ges Forschung aparelho e método para processar um sinal de áudio decodificado em um domínio espectral
KR101551046B1 (ko) 2011-02-14 2015-09-07 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 저-지연 통합 스피치 및 오디오 코딩에서 에러 은닉을 위한 장치 및 방법
ES2639646T3 (es) 2011-02-14 2017-10-27 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codificación y decodificación de posiciones de impulso de pistas de una señal de audio
KR101525185B1 (ko) * 2011-02-14 2015-06-02 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 트랜지언트 검출 및 품질 결과를 사용하여 일부분의 오디오 신호를 코딩하기 위한 장치 및 방법
EP3373296A1 (en) 2011-02-14 2018-09-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Noise generation in audio codecs
TWI488176B (zh) 2011-02-14 2015-06-11 Fraunhofer Ges Forschung 音訊信號音軌脈衝位置之編碼與解碼技術
PL2676264T3 (pl) 2011-02-14 2015-06-30 Fraunhofer Ges Forschung Koder audio estymujący szum tła podczas faz aktywnych
MY166394A (en) 2011-02-14 2018-06-25 Fraunhofer Ges Forschung Information signal representation using lapped transform
CN103477387B (zh) 2011-02-14 2015-11-25 弗兰霍菲尔运输应用研究公司 使用频谱域噪声整形的基于线性预测的编码方案
EP2830062B1 (en) * 2012-03-21 2019-11-20 Samsung Electronics Co., Ltd. Method and apparatus for high-frequency encoding/decoding for bandwidth extension
US8645128B1 (en) * 2012-10-02 2014-02-04 Google Inc. Determining pitch dynamics of an audio signal
US9640194B1 (en) 2012-10-04 2017-05-02 Knowles Electronics, Llc Noise suppression for speech processing based on machine-learning mask estimation
AU2014211586B2 (en) * 2013-01-29 2017-02-16 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Concept for coding mode switching compensation
US9147397B2 (en) * 2013-10-29 2015-09-29 Knowles Electronics, Llc VAD detection apparatus and method of operating the same
HRP20240674T1 (hr) 2014-04-17 2024-08-16 Voiceage Evs Llc Postupci, koder i dekoder za linearno prediktivno kodiranje i dekodiranje zvučnih signala pri prijelazu između okvira koji imaju različitu brzinu uzorkovanja
CN105336338B (zh) 2014-06-24 2017-04-12 华为技术有限公司 音频编码方法和装置
CN106448688B (zh) 2014-07-28 2019-11-05 华为技术有限公司 音频编码方法及相关装置
CN110444219B (zh) * 2014-07-28 2023-06-13 弗劳恩霍夫应用研究促进协会 选择第一编码演算法或第二编码演算法的装置与方法
DE112015003945T5 (de) 2014-08-28 2017-05-11 Knowles Electronics, Llc Mehrquellen-Rauschunterdrückung
CN107112025A (zh) 2014-09-12 2017-08-29 美商楼氏电子有限公司 用于恢复语音分量的系统和方法
DE112016000545B4 (de) 2015-01-30 2019-08-22 Knowles Electronics, Llc Kontextabhängiges schalten von mikrofonen
CN105242111B (zh) * 2015-09-17 2018-02-27 清华大学 一种采用类脉冲激励的频响函数测量方法
CN111739543B (zh) * 2020-05-25 2023-05-23 杭州涂鸦信息技术有限公司 音频编码方法的调试方法及其相关装置

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5479559A (en) * 1993-05-28 1995-12-26 Motorola, Inc. Excitation synchronous time encoding vocoder and method
FI101439B1 (fi) * 1995-04-13 1998-06-15 Nokia Telecommunications Oy Transkooderi, jossa on tandem-koodauksen esto
JP2882463B2 (ja) * 1995-11-01 1999-04-12 日本電気株式会社 Vox判定装置
US6134518A (en) * 1997-03-04 2000-10-17 International Business Machines Corporation Digital audio signal coding using a CELP coder and a transform coder
ATE302991T1 (de) * 1998-01-22 2005-09-15 Deutsche Telekom Ag Verfahren zur signalgesteuerten schaltung zwischen verschiedenen audiokodierungssystemen
US6640209B1 (en) * 1999-02-26 2003-10-28 Qualcomm Incorporated Closed-loop multimode mixed-domain linear prediction (MDLP) speech coder
US6633841B1 (en) * 1999-07-29 2003-10-14 Mindspeed Technologies, Inc. Voice activity detection speech coding to accommodate music signals
US7139700B1 (en) * 1999-09-22 2006-11-21 Texas Instruments Incorporated Hybrid speech coding and system
JP4221537B2 (ja) * 2000-06-02 2009-02-12 日本電気株式会社 音声検出方法及び装置とその記録媒体
US7031916B2 (en) * 2001-06-01 2006-04-18 Texas Instruments Incorporated Method for converging a G.729 Annex B compliant voice activity detection circuit
FR2825826B1 (fr) * 2001-06-11 2003-09-12 Cit Alcatel Procede pour detecter l'activite vocale dans un signal, et codeur de signal vocal comportant un dispositif pour la mise en oeuvre de ce procede
US6658383B2 (en) 2001-06-26 2003-12-02 Microsoft Corporation Method for coding speech and music signals
US6785645B2 (en) * 2001-11-29 2004-08-31 Microsoft Corporation Real-time speech and music classifier
KR100880480B1 (ko) * 2002-02-21 2009-01-28 엘지전자 주식회사 디지털 오디오 신호의 실시간 음악/음성 식별 방법 및시스템
KR100477701B1 (ko) * 2002-11-07 2005-03-18 삼성전자주식회사 Mpeg 오디오 인코딩 방법 및 mpeg 오디오 인코딩장치
US7613606B2 (en) * 2003-10-02 2009-11-03 Nokia Corporation Speech codecs
US7120576B2 (en) * 2004-07-16 2006-10-10 Mindspeed Technologies, Inc. Low-complexity music detection algorithm and system

Also Published As

Publication number Publication date
BRPI0510270A (pt) 2007-10-30
EP1738355A1 (en) 2007-01-03
KR20080103113A (ko) 2008-11-26
KR20070001276A (ko) 2007-01-03
EP1738355B1 (en) 2010-09-29
TW200605518A (en) 2006-02-01
TWI275253B (en) 2007-03-01
JP2007534020A (ja) 2007-11-22
ATE483230T1 (de) 2010-10-15
US8244525B2 (en) 2012-08-14
US20050240399A1 (en) 2005-10-27
CA2562877A1 (en) 2005-11-03
CN1969319B (zh) 2011-09-21
CN1969319A (zh) 2007-05-23
GB0408856D0 (en) 2004-05-26
WO2005104095A1 (en) 2005-11-03
HK1104369A1 (en) 2008-01-11
AU2005236596A1 (en) 2005-11-03
ES2349554T3 (es) 2011-01-05
ZA200609627B (en) 2008-09-25
MXPA06011957A (es) 2006-12-15
DE602005023848D1 (de) 2010-11-11

Similar Documents

Publication Publication Date Title
RU2006139793A (ru) Кодирование сигнала
US20200234724A1 (en) Classification Between Time-Domain Coding and Frequency Domain Coding for High Bit Rates
CN1112671C (zh) 综合分析语音编码器中噪声隐蔽电平适应性修改方法
CN101496101B (zh) 用于增益因子限制的系统、方法及设备
CN101523484B (zh) 用于帧擦除恢复的系统、方法和设备
KR101175651B1 (ko) 다중 압축 부호화 방법 및 장치
CN104123946B (zh) 用于在与语音信号相关联的包中包含识别符的系统及方法
CN103258541B (zh) 音频解码方法
US8483854B2 (en) Systems, methods, and apparatus for context processing using multiple microphones
JP5149217B2 (ja) 望ましくないパケット生成を減少する方法および装置
US20020099548A1 (en) Variable rate speech coding
WO2001052241A1 (en) Multi-mode voice encoding device and decoding device
US9293143B2 (en) Bandwidth extension mode selection
CN103038820A (zh) 用于音频信号的相依模式译码的系统、方法、设备和计算机可读媒体
BR9906706B1 (pt) Aparelho e método de codificação de voz de modo múltiplo
JP2008503783A (ja) オーディオ信号のエンコーディングにおけるコーディング・モデルの選択
JP2004310088A (ja) 半レート・ボコーダ
CN105264596B (zh) 用于码激励线性预测类编码器的无边信息的噪声填充
JPWO2008108076A1 (ja) 符号化装置および符号化方法
WO2000077774A1 (fr) Codeur de signaux de bruit et codeur de signaux vocaux
JP3558031B2 (ja) 音声復号化装置
US20100292986A1 (en) encoder
CN101496097A (zh) 用于在与语音信号相关联的包中包含识别符的系统及方法
KR100205060B1 (ko) 정규 펄스 여기 방식을 이용한 celp 보코더의 피치검색 방법

Legal Events

Date Code Title Description
FA92 Acknowledgement of application withdrawn (lack of supplementary materials submitted)

Effective date: 20090302