RU2008112137A - Устройство кодирования речи и способ кодирования речи - Google Patents

Устройство кодирования речи и способ кодирования речи Download PDF

Info

Publication number
RU2008112137A
RU2008112137A RU2008112137/09A RU2008112137A RU2008112137A RU 2008112137 A RU2008112137 A RU 2008112137A RU 2008112137/09 A RU2008112137/09 A RU 2008112137/09A RU 2008112137 A RU2008112137 A RU 2008112137A RU 2008112137 A RU2008112137 A RU 2008112137A
Authority
RU
Russia
Prior art keywords
spectrum
frequency band
speech
encoding device
low
Prior art date
Application number
RU2008112137/09A
Other languages
English (en)
Inventor
Масахиро ОСИКИРИ (JP)
Масахиро ОСИКИРИ
Original Assignee
Панасоник Корпорэйшн (Jp)
Панасоник Корпорэйшн
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Панасоник Корпорэйшн (Jp), Панасоник Корпорэйшн filed Critical Панасоник Корпорэйшн (Jp)
Publication of RU2008112137A publication Critical patent/RU2008112137A/ru

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

1. Устройство кодирования речи, содержащее: ! первую кодирующую секцию, которая кодирует спектр полосы низких частот, содержащий полосу частот ниже пороговой частоты речевого сигнала; ! сглаживающую секцию, которая сглаживает спектр полосы низких частот, используя обратный фильтр с обратными характеристиками огибающей спектра речевого сигнала; и ! вторую кодирующую секцию, которая кодирует спектр высоких частот, содержащий полосу частот выше пороговой частоты речевого сигнала, используя сглаженный спектр полосы низких частот. ! 2. Устройство кодирования речи по п.1, в котором сглаживающая секция формирует обратный фильтр, используя коэффициенты кодирования с линейным предсказанием речевого сигнала. ! 3. Устройство кодирования речи по п.1, в котором сглаживающая секция изменяет степень сглаживания в соответствии со степенью резонанса речевого сигнала. ! 4. Устройство кодирования речи по п.3, в котором при увеличении степени резонанса сглаживающая секция снижает степень сглаживания. ! 5. Устройство кодирования речи по п.1, в котором вторая кодирующая секция модифицирует сглаженный спектр полосы низких частот и кодирует спектр полосы высоких частот, используя модифицированный спектр полосы низких частот. ! 6. Устройство кодирования речи по п.5, в котором вторая кодирующая секция модифицирует сглаженный спектр полосы низких частот, так что динамический диапазон сглаженного спектра полосы низких частот настраивается ближе к динамическому диапазону спектра полосы высоких частот. ! 7. Устройство кодирования речи по п.6, в котором вторая кодирующая секция модифицирует сглаженный спектр полосы низких частот, используя

Claims (13)

1. Устройство кодирования речи, содержащее:
первую кодирующую секцию, которая кодирует спектр полосы низких частот, содержащий полосу частот ниже пороговой частоты речевого сигнала;
сглаживающую секцию, которая сглаживает спектр полосы низких частот, используя обратный фильтр с обратными характеристиками огибающей спектра речевого сигнала; и
вторую кодирующую секцию, которая кодирует спектр высоких частот, содержащий полосу частот выше пороговой частоты речевого сигнала, используя сглаженный спектр полосы низких частот.
2. Устройство кодирования речи по п.1, в котором сглаживающая секция формирует обратный фильтр, используя коэффициенты кодирования с линейным предсказанием речевого сигнала.
3. Устройство кодирования речи по п.1, в котором сглаживающая секция изменяет степень сглаживания в соответствии со степенью резонанса речевого сигнала.
4. Устройство кодирования речи по п.3, в котором при увеличении степени резонанса сглаживающая секция снижает степень сглаживания.
5. Устройство кодирования речи по п.1, в котором вторая кодирующая секция модифицирует сглаженный спектр полосы низких частот и кодирует спектр полосы высоких частот, используя модифицированный спектр полосы низких частот.
6. Устройство кодирования речи по п.5, в котором вторая кодирующая секция модифицирует сглаженный спектр полосы низких частот, так что динамический диапазон сглаженного спектра полосы низких частот настраивается ближе к динамическому диапазону спектра полосы высоких частот.
7. Устройство кодирования речи по п.6, в котором вторая кодирующая секция модифицирует сглаженный спектр полосы низких частот, используя вариант кодирования, который преимущественно уменьшает динамический диапазон по сравнению с вариантом кодирования, который увеличивает динамический диапазон, среди множества вариантов кодирования.
8. Устройство кодирования речи по п.7, в котором вторая кодирующая секция выполняет коррекцию, так что искомое значение варианта кодирования становится меньше, и на основе скорректированного искомого значения ищет подходящий вариант кодирования, используемый для модификации сглаженного спектра полосы низких частот, среди множества вариантов кодирования.
9. Устройство кодирования речи по п.5, в котором вторая кодирующая секция оценивает спектр полосы высоких частот исходя из модифицированного спектра полосы низких частот, модифицирует оцененный спектр полосы высоких частот и кодирует спектр полосы высоких частот речевого сигнала путем использования модифицированного спектра полосы высоких частот.
10. Устройство кодирования речи по п.1, в котором вторая кодирующая секция оценивает спектр полосы высоких частот исходя из сглаженного спектра полосы низких частот, модифицирует оцененный спектр полосы высоких частот и кодирует спектр полосы высоких частот речевого сигнала путем использования модифицированного спектра полосы высоких частот.
11. Устройство мобильной станции радиосвязи, содержащее устройство кодирования речи по п.1.
12. Устройство базовой станции радиосвязи, содержащее устройство кодирования речи согласно п.1.
13. Способ кодирования речи, содержащий:
первый шаг кодирования, состоящий в кодировании спектра полосы низких частот, содержащего полосу частот ниже пороговой частоты речевого сигнала;
шаг сглаживания, состоящий в сглаживании спектра полосы низких частот, с использованием обратного фильтра с обратными характеристиками для огибающей спектра речевого сигнала; и
второй шаг кодирования, состоящий в кодировании спектра полосы высоких частот, содержащего полосу частот выше пороговой частоты речевого сигнала, с использованием сглаженного спектра полосы низких частот.
RU2008112137/09A 2005-09-30 2006-09-29 Устройство кодирования речи и способ кодирования речи RU2008112137A (ru)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2005-286533 2005-09-30
JP2005286533 2005-09-30
JP2006199616 2006-07-21
JP2006-199616 2006-07-21

Publications (1)

Publication Number Publication Date
RU2008112137A true RU2008112137A (ru) 2009-11-10

Family

ID=37899782

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2008112137/09A RU2008112137A (ru) 2005-09-30 2006-09-29 Устройство кодирования речи и способ кодирования речи

Country Status (8)

Country Link
US (1) US8396717B2 (ru)
EP (1) EP1926083A4 (ru)
JP (1) JP5089394B2 (ru)
KR (1) KR20080049085A (ru)
CN (1) CN101273404B (ru)
BR (1) BRPI0616624A2 (ru)
RU (1) RU2008112137A (ru)
WO (1) WO2007037361A1 (ru)

Families Citing this family (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005111568A1 (ja) * 2004-05-14 2005-11-24 Matsushita Electric Industrial Co., Ltd. 符号化装置、復号化装置、およびこれらの方法
CN1998045A (zh) * 2004-07-13 2007-07-11 松下电器产业株式会社 音调频率估计装置以及音调频率估计方法
JPWO2008066071A1 (ja) * 2006-11-29 2010-03-04 パナソニック株式会社 復号化装置および復号化方法
JPWO2008084688A1 (ja) * 2006-12-27 2010-04-30 パナソニック株式会社 符号化装置、復号装置及びこれらの方法
WO2009084221A1 (ja) * 2007-12-27 2009-07-09 Panasonic Corporation 符号化装置、復号装置およびこれらの方法
CN102089814B (zh) * 2008-07-11 2012-11-21 弗劳恩霍夫应用研究促进协会 对编码的音频信号进行解码的设备和方法
RU2487428C2 (ru) * 2008-07-11 2013-07-10 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Устройство и способ для вычисления числа огибающих спектра
WO2010016271A1 (ja) 2008-08-08 2010-02-11 パナソニック株式会社 スペクトル平滑化装置、符号化装置、復号装置、通信端末装置、基地局装置及びスペクトル平滑化方法
CN101741504B (zh) * 2008-11-24 2013-06-12 华为技术有限公司 一种确定信号线性预测编码阶数的方法和装置
WO2010070770A1 (ja) * 2008-12-19 2010-06-24 富士通株式会社 音声帯域拡張装置及び音声帯域拡張方法
EP2402940B9 (en) * 2009-02-26 2019-10-30 Panasonic Intellectual Property Corporation of America Encoder, decoder, and method therefor
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
JPWO2011048741A1 (ja) * 2009-10-20 2013-03-07 日本電気株式会社 マルチバンドコンプレッサ
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
US9047875B2 (en) * 2010-07-19 2015-06-02 Futurewei Technologies, Inc. Spectrum flatness control for bandwidth extension
KR101709095B1 (ko) 2010-07-19 2017-03-08 돌비 인터네셔널 에이비 고주파 복원 동안 오디오 신호들의 프로세싱
US12002476B2 (en) 2010-07-19 2024-06-04 Dolby International Ab Processing of audio signals during high frequency reconstruction
JP6075743B2 (ja) 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
US9361892B2 (en) * 2010-09-10 2016-06-07 Panasonic Intellectual Property Corporation Of America Encoder apparatus and method that perform preliminary signal selection for transform coding before main signal selection for transform coding
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
JP5695074B2 (ja) * 2010-10-18 2015-04-01 パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America 音声符号化装置および音声復号化装置
JP5664291B2 (ja) * 2011-02-01 2015-02-04 沖電気工業株式会社 音声品質観測装置、方法及びプログラム
JP5817499B2 (ja) * 2011-12-15 2015-11-18 富士通株式会社 復号装置、符号化装置、符号化復号システム、復号方法、符号化方法、復号プログラム、及び符号化プログラム
US9390721B2 (en) * 2012-01-20 2016-07-12 Panasonic Intellectual Property Corporation Of America Speech decoding device and speech decoding method
EP2757558A1 (en) * 2013-01-18 2014-07-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Time domain level adjustment for audio signal decoding or encoding
US9711156B2 (en) * 2013-02-08 2017-07-18 Qualcomm Incorporated Systems and methods of performing filtering for gain determination
KR102150496B1 (ko) * 2013-04-05 2020-09-01 돌비 인터네셔널 에이비 오디오 인코더 및 디코더
JP6305694B2 (ja) * 2013-05-31 2018-04-04 クラリオン株式会社 信号処理装置及び信号処理方法
CN108198564B (zh) * 2013-07-01 2021-02-26 华为技术有限公司 信号编码和解码方法以及设备
US9666202B2 (en) 2013-09-10 2017-05-30 Huawei Technologies Co., Ltd. Adaptive bandwidth extension and apparatus for the same
WO2015041070A1 (ja) 2013-09-19 2015-03-26 ソニー株式会社 符号化装置および方法、復号化装置および方法、並びにプログラム
EP3058567B1 (en) * 2013-10-18 2017-06-07 Telefonaktiebolaget LM Ericsson (publ) Coding of spectral peak positions
RU2764260C2 (ru) 2013-12-27 2022-01-14 Сони Корпорейшн Устройство и способ декодирования
EP3115991A4 (en) * 2014-03-03 2017-08-02 Samsung Electronics Co., Ltd. Method and apparatus for high frequency decoding for bandwidth extension
EP4376304A3 (en) * 2014-03-31 2024-07-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder, decoder, encoding method, decoding method, and program
PL3139383T3 (pl) * 2014-05-01 2020-03-31 Nippon Telegraph And Telephone Corporation Kodowanie i dekodowanie sygnału dźwiękowego
US10418042B2 (en) * 2014-05-01 2019-09-17 Nippon Telegraph And Telephone Corporation Coding device, decoding device, method, program and recording medium thereof
EP3703051B1 (en) * 2014-05-01 2021-06-09 Nippon Telegraph and Telephone Corporation Encoder, decoder, coding method, decoding method, coding program, decoding program and recording medium
US9838700B2 (en) * 2014-11-27 2017-12-05 Nippon Telegraph And Telephone Corporation Encoding apparatus, decoding apparatus, and method and program for the same
EP3182411A1 (en) * 2015-12-14 2017-06-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing an encoded audio signal
EP3382702A1 (en) 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for determining a predetermined characteristic related to an artificial bandwidth limitation processing of an audio signal
US10825467B2 (en) * 2017-04-21 2020-11-03 Qualcomm Incorporated Non-harmonic speech detection and bandwidth extension in a multi-source environment

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3283413B2 (ja) 1995-11-30 2002-05-20 株式会社日立製作所 符号化復号方法、符号化装置および復号装置
SE512719C2 (sv) 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
SE9903553D0 (sv) * 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
SE0001926D0 (sv) * 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
SE0004163D0 (sv) 2000-11-14 2000-11-14 Coding Technologies Sweden Ab Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering
JP3870193B2 (ja) 2001-11-29 2007-01-17 コーディング テクノロジーズ アクチボラゲット 高周波再構成に用いる符号器、復号器、方法及びコンピュータプログラム
EP1484841B1 (en) * 2002-03-08 2018-12-26 Nippon Telegraph And Telephone Corporation DIGITAL SIGNAL ENCODING METHOD, DECODING METHOD, ENCODING DEVICE, DECODING DEVICE and DIGITAL SIGNAL DECODING PROGRAM
JP2004062410A (ja) 2002-07-26 2004-02-26 Nippon Seiki Co Ltd 表示装置の表示方法
JP3861770B2 (ja) * 2002-08-21 2006-12-20 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
JP2005062410A (ja) 2003-08-11 2005-03-10 Nippon Telegr & Teleph Corp <Ntt> 音声信号の符号化方法
JP2005286533A (ja) 2004-03-29 2005-10-13 Nippon Hoso Kyokai <Nhk> データ伝送システム、データ送信装置、データ受信装置
US7848921B2 (en) 2004-08-31 2010-12-07 Panasonic Corporation Low-frequency-band component and high-frequency-band audio encoding/decoding apparatus, and communication apparatus thereof
JP5100124B2 (ja) 2004-10-26 2012-12-19 パナソニック株式会社 音声符号化装置および音声符号化方法
JP4859670B2 (ja) 2004-10-27 2012-01-25 パナソニック株式会社 音声符号化装置および音声符号化方法
ES2476992T3 (es) 2004-11-05 2014-07-15 Panasonic Corporation Codificador, descodificador, método de codificación y método de descodificaci�n
EP2138999A1 (en) 2004-12-28 2009-12-30 Panasonic Corporation Audio encoding device and audio encoding method
JP4397826B2 (ja) 2005-01-20 2010-01-13 株式会社資生堂 粉末化粧料の成型方法
SG163555A1 (en) * 2005-04-01 2010-08-30 Qualcomm Inc Systems, methods, and apparatus for highband burst suppression
DE602006004959D1 (de) * 2005-04-15 2009-03-12 Dolby Sweden Ab Zeitliche hüllkurvenformgebung von entkorrelierten signalen

Also Published As

Publication number Publication date
US20090157413A1 (en) 2009-06-18
BRPI0616624A2 (pt) 2011-06-28
JP5089394B2 (ja) 2012-12-05
JPWO2007037361A1 (ja) 2009-04-16
EP1926083A1 (en) 2008-05-28
KR20080049085A (ko) 2008-06-03
WO2007037361A1 (ja) 2007-04-05
CN101273404B (zh) 2012-07-04
US8396717B2 (en) 2013-03-12
CN101273404A (zh) 2008-09-24
EP1926083A4 (en) 2011-01-26

Similar Documents

Publication Publication Date Title
RU2008112137A (ru) Устройство кодирования речи и способ кодирования речи
RU2585990C2 (ru) Устройство и способ для выполнения кодирования методом хаффмана
FI119533B (fi) Audiosignaalien koodaus
CN107408392B (zh) 译码方法和设备
RU2012155222A (ru) Устройство декодирования, устройство кодирования и соответствующие способы
AU724111B2 (en) System for adaptively filtering audio signals to enhance speech intelligibility in noisy environmental conditions
KR101428608B1 (ko) 대역폭 확장을 위한 스펙트럼 평탄도 제어
RU2688247C2 (ru) Устройство и способ для расширения диапазона частот для акустических сигналов
CN103069484B (zh) 时/频二维后处理
US20100106269A1 (en) Method and apparatus for signal processing using transform-domain log-companding
RU2009147514A (ru) Кодер, декодер, способ кодирования и способ декодирования
RU2011135533A (ru) Кодер, декодер и способ для них
KR101454581B1 (ko) 오디오 인코딩을 위한 장치 및 방법
RU2008121724A (ru) Устройство субполосного кодирования и способ субполосного кодирования
WO2013143221A1 (zh) 信号编码和解码的方法和设备
US11232803B2 (en) Encoding device, decoding device, encoding method, decoding method, and non-transitory computer-readable recording medium
RU2419172C2 (ru) Системы и способы динамической нормализации для уменьшения потери точности для сигналов с низким уровнем
JP6892491B2 (ja) 会話/音声信号処理方法および符号化装置
CN102610231B (zh) 一种带宽扩展方法及装置
DE602005027549D1 (de) Basisstation
TW201703027A (zh) 基於能量飽和及信號縮放之增益參數估計
EP1553750A1 (en) Communication terminal having adjustable hearing and/or speech characteristics

Legal Events

Date Code Title Description
FA93 Acknowledgement of application withdrawn (no request for examination)

Effective date: 20090930