RU2008112137A - Устройство кодирования речи и способ кодирования речи - Google Patents

Устройство кодирования речи и способ кодирования речи Download PDF

Info

Publication number
RU2008112137A
RU2008112137A RU2008112137/09A RU2008112137A RU2008112137A RU 2008112137 A RU2008112137 A RU 2008112137A RU 2008112137/09 A RU2008112137/09 A RU 2008112137/09A RU 2008112137 A RU2008112137 A RU 2008112137A RU 2008112137 A RU2008112137 A RU 2008112137A
Authority
RU
Russia
Prior art keywords
spectrum
frequency band
speech
encoding device
low
Prior art date
Application number
RU2008112137/09A
Other languages
English (en)
Inventor
Масахиро ОСИКИРИ (JP)
Масахиро ОСИКИРИ
Original Assignee
Панасоник Корпорэйшн (Jp)
Панасоник Корпорэйшн
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Панасоник Корпорэйшн (Jp), Панасоник Корпорэйшн filed Critical Панасоник Корпорэйшн (Jp)
Publication of RU2008112137A publication Critical patent/RU2008112137A/ru

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

1. Устройство кодирования речи, содержащее: ! первую кодирующую секцию, которая кодирует спектр полосы низких частот, содержащий полосу частот ниже пороговой частоты речевого сигнала; ! сглаживающую секцию, которая сглаживает спектр полосы низких частот, используя обратный фильтр с обратными характеристиками огибающей спектра речевого сигнала; и ! вторую кодирующую секцию, которая кодирует спектр высоких частот, содержащий полосу частот выше пороговой частоты речевого сигнала, используя сглаженный спектр полосы низких частот. ! 2. Устройство кодирования речи по п.1, в котором сглаживающая секция формирует обратный фильтр, используя коэффициенты кодирования с линейным предсказанием речевого сигнала. ! 3. Устройство кодирования речи по п.1, в котором сглаживающая секция изменяет степень сглаживания в соответствии со степенью резонанса речевого сигнала. ! 4. Устройство кодирования речи по п.3, в котором при увеличении степени резонанса сглаживающая секция снижает степень сглаживания. ! 5. Устройство кодирования речи по п.1, в котором вторая кодирующая секция модифицирует сглаженный спектр полосы низких частот и кодирует спектр полосы высоких частот, используя модифицированный спектр полосы низких частот. ! 6. Устройство кодирования речи по п.5, в котором вторая кодирующая секция модифицирует сглаженный спектр полосы низких частот, так что динамический диапазон сглаженного спектра полосы низких частот настраивается ближе к динамическому диапазону спектра полосы высоких частот. ! 7. Устройство кодирования речи по п.6, в котором вторая кодирующая секция модифицирует сглаженный спектр полосы низких частот, используя

Claims (13)

1. Устройство кодирования речи, содержащее:
первую кодирующую секцию, которая кодирует спектр полосы низких частот, содержащий полосу частот ниже пороговой частоты речевого сигнала;
сглаживающую секцию, которая сглаживает спектр полосы низких частот, используя обратный фильтр с обратными характеристиками огибающей спектра речевого сигнала; и
вторую кодирующую секцию, которая кодирует спектр высоких частот, содержащий полосу частот выше пороговой частоты речевого сигнала, используя сглаженный спектр полосы низких частот.
2. Устройство кодирования речи по п.1, в котором сглаживающая секция формирует обратный фильтр, используя коэффициенты кодирования с линейным предсказанием речевого сигнала.
3. Устройство кодирования речи по п.1, в котором сглаживающая секция изменяет степень сглаживания в соответствии со степенью резонанса речевого сигнала.
4. Устройство кодирования речи по п.3, в котором при увеличении степени резонанса сглаживающая секция снижает степень сглаживания.
5. Устройство кодирования речи по п.1, в котором вторая кодирующая секция модифицирует сглаженный спектр полосы низких частот и кодирует спектр полосы высоких частот, используя модифицированный спектр полосы низких частот.
6. Устройство кодирования речи по п.5, в котором вторая кодирующая секция модифицирует сглаженный спектр полосы низких частот, так что динамический диапазон сглаженного спектра полосы низких частот настраивается ближе к динамическому диапазону спектра полосы высоких частот.
7. Устройство кодирования речи по п.6, в котором вторая кодирующая секция модифицирует сглаженный спектр полосы низких частот, используя вариант кодирования, который преимущественно уменьшает динамический диапазон по сравнению с вариантом кодирования, который увеличивает динамический диапазон, среди множества вариантов кодирования.
8. Устройство кодирования речи по п.7, в котором вторая кодирующая секция выполняет коррекцию, так что искомое значение варианта кодирования становится меньше, и на основе скорректированного искомого значения ищет подходящий вариант кодирования, используемый для модификации сглаженного спектра полосы низких частот, среди множества вариантов кодирования.
9. Устройство кодирования речи по п.5, в котором вторая кодирующая секция оценивает спектр полосы высоких частот исходя из модифицированного спектра полосы низких частот, модифицирует оцененный спектр полосы высоких частот и кодирует спектр полосы высоких частот речевого сигнала путем использования модифицированного спектра полосы высоких частот.
10. Устройство кодирования речи по п.1, в котором вторая кодирующая секция оценивает спектр полосы высоких частот исходя из сглаженного спектра полосы низких частот, модифицирует оцененный спектр полосы высоких частот и кодирует спектр полосы высоких частот речевого сигнала путем использования модифицированного спектра полосы высоких частот.
11. Устройство мобильной станции радиосвязи, содержащее устройство кодирования речи по п.1.
12. Устройство базовой станции радиосвязи, содержащее устройство кодирования речи согласно п.1.
13. Способ кодирования речи, содержащий:
первый шаг кодирования, состоящий в кодировании спектра полосы низких частот, содержащего полосу частот ниже пороговой частоты речевого сигнала;
шаг сглаживания, состоящий в сглаживании спектра полосы низких частот, с использованием обратного фильтра с обратными характеристиками для огибающей спектра речевого сигнала; и
второй шаг кодирования, состоящий в кодировании спектра полосы высоких частот, содержащего полосу частот выше пороговой частоты речевого сигнала, с использованием сглаженного спектра полосы низких частот.
RU2008112137/09A 2005-09-30 2006-09-29 Устройство кодирования речи и способ кодирования речи RU2008112137A (ru)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2005286533 2005-09-30
JP2005-286533 2005-09-30
JP2006199616 2006-07-21
JP2006-199616 2006-07-21

Publications (1)

Publication Number Publication Date
RU2008112137A true RU2008112137A (ru) 2009-11-10

Family

ID=37899782

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2008112137/09A RU2008112137A (ru) 2005-09-30 2006-09-29 Устройство кодирования речи и способ кодирования речи

Country Status (8)

Country Link
US (1) US8396717B2 (ru)
EP (1) EP1926083A4 (ru)
JP (1) JP5089394B2 (ru)
KR (1) KR20080049085A (ru)
CN (1) CN101273404B (ru)
BR (1) BRPI0616624A2 (ru)
RU (1) RU2008112137A (ru)
WO (1) WO2007037361A1 (ru)

Families Citing this family (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BRPI0510014B1 (pt) * 2004-05-14 2019-03-26 Panasonic Intellectual Property Corporation Of America Dispositivo de codificação, dispositivo de decodificação e método do mesmo
US20070299658A1 (en) * 2004-07-13 2007-12-27 Matsushita Electric Industrial Co., Ltd. Pitch Frequency Estimation Device, and Pich Frequency Estimation Method
JPWO2008066071A1 (ja) * 2006-11-29 2010-03-04 パナソニック株式会社 復号化装置および復号化方法
WO2008084688A1 (ja) * 2006-12-27 2008-07-17 Panasonic Corporation 符号化装置、復号装置及びこれらの方法
WO2009084221A1 (ja) * 2007-12-27 2009-07-09 Panasonic Corporation 符号化装置、復号装置およびこれらの方法
JP5325293B2 (ja) * 2008-07-11 2013-10-23 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 符号化されたオーディオ信号を復号化するための装置および方法
WO2010003544A1 (en) * 2008-07-11 2010-01-14 Fraunhofer-Gesellschaft Zur Förderung Der Angewandtern Forschung E.V. An apparatus and a method for generating bandwidth extension output data
RU2510536C9 (ru) 2008-08-08 2015-09-10 Панасоник Корпорэйшн Устройство сглаживания спектра, устройство кодирования, устройство декодирования, устройство терминала связи, устройство базовой станции и способ сглаживания спектра
CN101741504B (zh) * 2008-11-24 2013-06-12 华为技术有限公司 一种确定信号线性预测编码阶数的方法和装置
EP2360687A4 (en) * 2008-12-19 2012-07-11 Fujitsu Ltd LANGUAGE EXPANSION DEVICE AND LANGUAGE TREATMENT PROCESS
CN102334159B (zh) * 2009-02-26 2014-05-14 松下电器产业株式会社 编码装置、解码装置及其方法
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
EP2493071A4 (en) * 2009-10-20 2015-03-04 Nec Corp MULTIBAND COMPRESSOR
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
US9047875B2 (en) 2010-07-19 2015-06-02 Futurewei Technologies, Inc. Spectrum flatness control for bandwidth extension
US12002476B2 (en) 2010-07-19 2024-06-04 Dolby International Ab Processing of audio signals during high frequency reconstruction
PL3285258T3 (pl) * 2010-07-19 2019-05-31 Dolby Int Ab Przetwarzanie sygnałów audio podczas rekonstrukcji wysokiej częstotliwości
JP6075743B2 (ja) * 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
AU2011300248B2 (en) 2010-09-10 2014-05-15 Panasonic Corporation Encoder apparatus and encoding method
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
US20130173275A1 (en) * 2010-10-18 2013-07-04 Panasonic Corporation Audio encoding device and audio decoding device
JP5664291B2 (ja) * 2011-02-01 2015-02-04 沖電気工業株式会社 音声品質観測装置、方法及びプログラム
JP5817499B2 (ja) * 2011-12-15 2015-11-18 富士通株式会社 復号装置、符号化装置、符号化復号システム、復号方法、符号化方法、復号プログラム、及び符号化プログラム
JP6082703B2 (ja) * 2012-01-20 2017-02-15 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 音声復号装置及び音声復号方法
EP2757558A1 (en) * 2013-01-18 2014-07-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Time domain level adjustment for audio signal decoding or encoding
US9711156B2 (en) * 2013-02-08 2017-07-18 Qualcomm Incorporated Systems and methods of performing filtering for gain determination
KR102383819B1 (ko) * 2013-04-05 2022-04-08 돌비 인터네셔널 에이비 오디오 인코더 및 디코더
JP6305694B2 (ja) * 2013-05-31 2018-04-04 クラリオン株式会社 信号処理装置及び信号処理方法
CN108198564B (zh) 2013-07-01 2021-02-26 华为技术有限公司 信号编码和解码方法以及设备
US9666202B2 (en) * 2013-09-10 2017-05-30 Huawei Technologies Co., Ltd. Adaptive bandwidth extension and apparatus for the same
US9875746B2 (en) 2013-09-19 2018-01-23 Sony Corporation Encoding device and method, decoding device and method, and program
KR101870594B1 (ko) * 2013-10-18 2018-06-22 텔레폰악티에볼라겟엘엠에릭슨(펍) 스펙트럼의 피크 위치의 코딩 및 디코딩
CN105849801B (zh) 2013-12-27 2020-02-14 索尼公司 解码设备和方法以及程序
US10410645B2 (en) * 2014-03-03 2019-09-10 Samsung Electronics Co., Ltd. Method and apparatus for high frequency decoding for bandwidth extension
EP3550563B1 (en) * 2014-03-31 2024-03-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder, decoder, encoding method, decoding method, and associated programs
JP6301452B2 (ja) * 2014-05-01 2018-03-28 日本電信電話株式会社 符号化装置、及びその方法、プログラム、記録媒体
ES2790278T3 (es) * 2014-05-01 2020-10-27 Nippon Telegraph & Telephone Codificador, descodificador, método de codificación, método de descodificación, programa de codificación, programa de descodificación y medio de grabación
CN110444216B (zh) * 2014-05-01 2022-10-21 日本电信电话株式会社 解码装置、解码方法、记录介质
WO2016084764A1 (ja) * 2014-11-27 2016-06-02 日本電信電話株式会社 符号化装置、復号装置、これらの方法及びプログラム
EP3182411A1 (en) * 2015-12-14 2017-06-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing an encoded audio signal
EP3382702A1 (en) 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for determining a predetermined characteristic related to an artificial bandwidth limitation processing of an audio signal
US10825467B2 (en) * 2017-04-21 2020-11-03 Qualcomm Incorporated Non-harmonic speech detection and bandwidth extension in a multi-source environment

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3283413B2 (ja) 1995-11-30 2002-05-20 株式会社日立製作所 符号化復号方法、符号化装置および復号装置
SE512719C2 (sv) 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
SE9903553D0 (sv) * 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
SE0001926D0 (sv) * 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
SE0004163D0 (sv) * 2000-11-14 2000-11-14 Coding Technologies Sweden Ab Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering
WO2003046891A1 (en) * 2001-11-29 2003-06-05 Coding Technologies Ab Methods for improving high frequency reconstruction
AU2003213439A1 (en) * 2002-03-08 2003-09-22 Nippon Telegraph And Telephone Corporation Digital signal encoding method, decoding method, encoding device, decoding device, digital signal encoding program, and decoding program
JP2004062410A (ja) 2002-07-26 2004-02-26 Nippon Seiki Co Ltd 表示装置の表示方法
JP3861770B2 (ja) * 2002-08-21 2006-12-20 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
JP2005062410A (ja) 2003-08-11 2005-03-10 Nippon Telegr & Teleph Corp <Ntt> 音声信号の符号化方法
JP2005286533A (ja) 2004-03-29 2005-10-13 Nippon Hoso Kyokai <Nhk> データ伝送システム、データ送信装置、データ受信装置
CN101006495A (zh) 2004-08-31 2007-07-25 松下电器产业株式会社 语音编码装置、语音解码装置、通信装置以及语音编码方法
EP1793372B1 (en) 2004-10-26 2011-12-14 Panasonic Corporation Speech encoding apparatus and speech encoding method
RU2007115914A (ru) 2004-10-27 2008-11-10 Мацусита Электрик Индастриал Ко., Лтд. (Jp) Кодер звука и способ кодирования звука
CN101048814B (zh) 2004-11-05 2011-07-27 松下电器产业株式会社 编码装置、解码装置、编码方法及解码方法
EP1821287B1 (en) 2004-12-28 2009-11-11 Panasonic Corporation Audio encoding device and audio encoding method
JP4397826B2 (ja) 2005-01-20 2010-01-13 株式会社資生堂 粉末化粧料の成型方法
TWI324335B (en) * 2005-04-01 2010-05-01 Qualcomm Inc Methods of signal processing and apparatus for wideband speech coding
JP4804532B2 (ja) * 2005-04-15 2011-11-02 ドルビー インターナショナル アクチボラゲット 無相関信号の包絡線整形

Also Published As

Publication number Publication date
EP1926083A4 (en) 2011-01-26
EP1926083A1 (en) 2008-05-28
JPWO2007037361A1 (ja) 2009-04-16
BRPI0616624A2 (pt) 2011-06-28
KR20080049085A (ko) 2008-06-03
JP5089394B2 (ja) 2012-12-05
US8396717B2 (en) 2013-03-12
CN101273404A (zh) 2008-09-24
CN101273404B (zh) 2012-07-04
US20090157413A1 (en) 2009-06-18
WO2007037361A1 (ja) 2007-04-05

Similar Documents

Publication Publication Date Title
RU2008112137A (ru) Устройство кодирования речи и способ кодирования речи
RU2012155222A (ru) Устройство декодирования, устройство кодирования и соответствующие способы
CN107408392B (zh) 译码方法和设备
FI119533B (fi) Audiosignaalien koodaus
JP6321072B2 (ja) オーディオ/音声符号化方法およびオーディオ/音声復号方法
RU2688247C2 (ru) Устройство и способ для расширения диапазона частот для акустических сигналов
CA2231107A1 (en) System for adaptively filtering audio signals to enhance speech intelligibility in noisy environmental conditions
CN103368682B (zh) 信号编码和解码的方法和设备
RU2009147514A (ru) Кодер, декодер, способ кодирования и способ декодирования
RU2011135533A (ru) Кодер, декодер и способ для них
RU2008121724A (ru) Устройство субполосного кодирования и способ субполосного кодирования
KR101454581B1 (ko) 오디오 인코딩을 위한 장치 및 방법
RU2011104350A (ru) Устройство сглаживания спектра, устройство кодирования, устройство декодирования, устройство терминала связи, устройство базовой станции и способ сглаживания спектра
CN102610231B (zh) 一种带宽扩展方法及装置
JP6892491B2 (ja) 会話/音声信号処理方法および符号化装置
CN102855881B (zh) 一种回声抑制方法和装置
US10269361B2 (en) Encoding device, decoding device, encoding method, decoding method, and non-transitory computer-readable recording medium
JP2011501228A (ja) 知覚モデルの適応的調整
US10020002B2 (en) Gain parameter estimation based on energy saturation and signal scaling
EP1553750A1 (en) Communication terminal having adjustable hearing and/or speech characteristics

Legal Events

Date Code Title Description
FA93 Acknowledgement of application withdrawn (no request for examination)

Effective date: 20090930