RU2008112137A - Устройство кодирования речи и способ кодирования речи - Google Patents

Устройство кодирования речи и способ кодирования речи Download PDF

Info

Publication number
RU2008112137A
RU2008112137A RU2008112137/09A RU2008112137A RU2008112137A RU 2008112137 A RU2008112137 A RU 2008112137A RU 2008112137/09 A RU2008112137/09 A RU 2008112137/09A RU 2008112137 A RU2008112137 A RU 2008112137A RU 2008112137 A RU2008112137 A RU 2008112137A
Authority
RU
Russia
Prior art keywords
spectrum
frequency band
speech
encoding device
low
Prior art date
Application number
RU2008112137/09A
Other languages
English (en)
Inventor
Масахиро ОСИКИРИ (JP)
Масахиро ОСИКИРИ
Original Assignee
Панасоник Корпорэйшн (Jp)
Панасоник Корпорэйшн
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Панасоник Корпорэйшн (Jp), Панасоник Корпорэйшн filed Critical Панасоник Корпорэйшн (Jp)
Publication of RU2008112137A publication Critical patent/RU2008112137A/ru

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

1. Устройство кодирования речи, содержащее: ! первую кодирующую секцию, которая кодирует спектр полосы низких частот, содержащий полосу частот ниже пороговой частоты речевого сигнала; ! сглаживающую секцию, которая сглаживает спектр полосы низких частот, используя обратный фильтр с обратными характеристиками огибающей спектра речевого сигнала; и ! вторую кодирующую секцию, которая кодирует спектр высоких частот, содержащий полосу частот выше пороговой частоты речевого сигнала, используя сглаженный спектр полосы низких частот. ! 2. Устройство кодирования речи по п.1, в котором сглаживающая секция формирует обратный фильтр, используя коэффициенты кодирования с линейным предсказанием речевого сигнала. ! 3. Устройство кодирования речи по п.1, в котором сглаживающая секция изменяет степень сглаживания в соответствии со степенью резонанса речевого сигнала. ! 4. Устройство кодирования речи по п.3, в котором при увеличении степени резонанса сглаживающая секция снижает степень сглаживания. ! 5. Устройство кодирования речи по п.1, в котором вторая кодирующая секция модифицирует сглаженный спектр полосы низких частот и кодирует спектр полосы высоких частот, используя модифицированный спектр полосы низких частот. ! 6. Устройство кодирования речи по п.5, в котором вторая кодирующая секция модифицирует сглаженный спектр полосы низких частот, так что динамический диапазон сглаженного спектра полосы низких частот настраивается ближе к динамическому диапазону спектра полосы высоких частот. ! 7. Устройство кодирования речи по п.6, в котором вторая кодирующая секция модифицирует сглаженный спектр полосы низких частот, используя

Claims (13)

1. Устройство кодирования речи, содержащее:
первую кодирующую секцию, которая кодирует спектр полосы низких частот, содержащий полосу частот ниже пороговой частоты речевого сигнала;
сглаживающую секцию, которая сглаживает спектр полосы низких частот, используя обратный фильтр с обратными характеристиками огибающей спектра речевого сигнала; и
вторую кодирующую секцию, которая кодирует спектр высоких частот, содержащий полосу частот выше пороговой частоты речевого сигнала, используя сглаженный спектр полосы низких частот.
2. Устройство кодирования речи по п.1, в котором сглаживающая секция формирует обратный фильтр, используя коэффициенты кодирования с линейным предсказанием речевого сигнала.
3. Устройство кодирования речи по п.1, в котором сглаживающая секция изменяет степень сглаживания в соответствии со степенью резонанса речевого сигнала.
4. Устройство кодирования речи по п.3, в котором при увеличении степени резонанса сглаживающая секция снижает степень сглаживания.
5. Устройство кодирования речи по п.1, в котором вторая кодирующая секция модифицирует сглаженный спектр полосы низких частот и кодирует спектр полосы высоких частот, используя модифицированный спектр полосы низких частот.
6. Устройство кодирования речи по п.5, в котором вторая кодирующая секция модифицирует сглаженный спектр полосы низких частот, так что динамический диапазон сглаженного спектра полосы низких частот настраивается ближе к динамическому диапазону спектра полосы высоких частот.
7. Устройство кодирования речи по п.6, в котором вторая кодирующая секция модифицирует сглаженный спектр полосы низких частот, используя вариант кодирования, который преимущественно уменьшает динамический диапазон по сравнению с вариантом кодирования, который увеличивает динамический диапазон, среди множества вариантов кодирования.
8. Устройство кодирования речи по п.7, в котором вторая кодирующая секция выполняет коррекцию, так что искомое значение варианта кодирования становится меньше, и на основе скорректированного искомого значения ищет подходящий вариант кодирования, используемый для модификации сглаженного спектра полосы низких частот, среди множества вариантов кодирования.
9. Устройство кодирования речи по п.5, в котором вторая кодирующая секция оценивает спектр полосы высоких частот исходя из модифицированного спектра полосы низких частот, модифицирует оцененный спектр полосы высоких частот и кодирует спектр полосы высоких частот речевого сигнала путем использования модифицированного спектра полосы высоких частот.
10. Устройство кодирования речи по п.1, в котором вторая кодирующая секция оценивает спектр полосы высоких частот исходя из сглаженного спектра полосы низких частот, модифицирует оцененный спектр полосы высоких частот и кодирует спектр полосы высоких частот речевого сигнала путем использования модифицированного спектра полосы высоких частот.
11. Устройство мобильной станции радиосвязи, содержащее устройство кодирования речи по п.1.
12. Устройство базовой станции радиосвязи, содержащее устройство кодирования речи согласно п.1.
13. Способ кодирования речи, содержащий:
первый шаг кодирования, состоящий в кодировании спектра полосы низких частот, содержащего полосу частот ниже пороговой частоты речевого сигнала;
шаг сглаживания, состоящий в сглаживании спектра полосы низких частот, с использованием обратного фильтра с обратными характеристиками для огибающей спектра речевого сигнала; и
второй шаг кодирования, состоящий в кодировании спектра полосы высоких частот, содержащего полосу частот выше пороговой частоты речевого сигнала, с использованием сглаженного спектра полосы низких частот.
RU2008112137/09A 2005-09-30 2006-09-29 Устройство кодирования речи и способ кодирования речи RU2008112137A (ru)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2005-286533 2005-09-30
JP2005286533 2005-09-30
JP2006-199616 2006-07-21
JP2006199616 2006-07-21

Publications (1)

Publication Number Publication Date
RU2008112137A true RU2008112137A (ru) 2009-11-10

Family

ID=37899782

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2008112137/09A RU2008112137A (ru) 2005-09-30 2006-09-29 Устройство кодирования речи и способ кодирования речи

Country Status (8)

Country Link
US (1) US8396717B2 (ru)
EP (1) EP1926083A4 (ru)
JP (1) JP5089394B2 (ru)
KR (1) KR20080049085A (ru)
CN (1) CN101273404B (ru)
BR (1) BRPI0616624A2 (ru)
RU (1) RU2008112137A (ru)
WO (1) WO2007037361A1 (ru)

Families Citing this family (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1744139B1 (en) * 2004-05-14 2015-11-11 Panasonic Intellectual Property Corporation of America Decoding apparatus and method thereof
US20070299658A1 (en) * 2004-07-13 2007-12-27 Matsushita Electric Industrial Co., Ltd. Pitch Frequency Estimation Device, and Pich Frequency Estimation Method
US20100076755A1 (en) * 2006-11-29 2010-03-25 Panasonic Corporation Decoding apparatus and audio decoding method
WO2008084688A1 (ja) * 2006-12-27 2008-07-17 Panasonic Corporation 符号化装置、復号装置及びこれらの方法
JPWO2009084221A1 (ja) * 2007-12-27 2011-05-12 パナソニック株式会社 符号化装置、復号装置およびこれらの方法
WO2010003545A1 (en) * 2008-07-11 2010-01-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V. An apparatus and a method for decoding an encoded audio signal
CA2729971C (en) * 2008-07-11 2014-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. An apparatus and a method for calculating a number of spectral envelopes
JP5419876B2 (ja) * 2008-08-08 2014-02-19 パナソニック株式会社 スペクトル平滑化装置、符号化装置、復号装置、通信端末装置、基地局装置及びスペクトル平滑化方法
CN101741504B (zh) * 2008-11-24 2013-06-12 华为技术有限公司 一种确定信号线性预测编码阶数的方法和装置
WO2010070770A1 (ja) * 2008-12-19 2010-06-24 富士通株式会社 音声帯域拡張装置及び音声帯域拡張方法
KR101661374B1 (ko) * 2009-02-26 2016-09-29 파나소닉 인텔렉츄얼 프로퍼티 코포레이션 오브 아메리카 부호화 장치, 복호 장치 및 이들 방법
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
EP2493071A4 (en) * 2009-10-20 2015-03-04 Nec Corp MULTIBAND COMPRESSOR
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
US9047875B2 (en) * 2010-07-19 2015-06-02 Futurewei Technologies, Inc. Spectrum flatness control for bandwidth extension
PL4016527T3 (pl) 2010-07-19 2023-05-22 Dolby International Ab Przetwarzanie sygnałów audio podczas rekonstrukcji wysokich częstotliwości
US12002476B2 (en) 2010-07-19 2024-06-04 Dolby International Ab Processing of audio signals during high frequency reconstruction
JP6075743B2 (ja) * 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
US9361892B2 (en) * 2010-09-10 2016-06-07 Panasonic Intellectual Property Corporation Of America Encoder apparatus and method that perform preliminary signal selection for transform coding before main signal selection for transform coding
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
US20130173275A1 (en) * 2010-10-18 2013-07-04 Panasonic Corporation Audio encoding device and audio decoding device
JP5664291B2 (ja) * 2011-02-01 2015-02-04 沖電気工業株式会社 音声品質観測装置、方法及びプログラム
JP5817499B2 (ja) * 2011-12-15 2015-11-18 富士通株式会社 復号装置、符号化装置、符号化復号システム、復号方法、符号化方法、復号プログラム、及び符号化プログラム
US9390721B2 (en) * 2012-01-20 2016-07-12 Panasonic Intellectual Property Corporation Of America Speech decoding device and speech decoding method
EP2757558A1 (en) * 2013-01-18 2014-07-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Time domain level adjustment for audio signal decoding or encoding
US9711156B2 (en) * 2013-02-08 2017-07-18 Qualcomm Incorporated Systems and methods of performing filtering for gain determination
CN105247614B (zh) * 2013-04-05 2019-04-05 杜比国际公司 音频编码器和解码器
JP6305694B2 (ja) * 2013-05-31 2018-04-04 クラリオン株式会社 信号処理装置及び信号処理方法
CN108198564B (zh) * 2013-07-01 2021-02-26 华为技术有限公司 信号编码和解码方法以及设备
US9666202B2 (en) 2013-09-10 2017-05-30 Huawei Technologies Co., Ltd. Adaptive bandwidth extension and apparatus for the same
CN105531762B (zh) 2013-09-19 2019-10-01 索尼公司 编码装置和方法、解码装置和方法以及程序
WO2015057135A1 (en) * 2013-10-18 2015-04-23 Telefonaktiebolaget L M Ericsson (Publ) Coding and decoding of spectral peak positions
JP6593173B2 (ja) 2013-12-27 2019-10-23 ソニー株式会社 復号化装置および方法、並びにプログラム
JP6383000B2 (ja) * 2014-03-03 2018-08-29 サムスン エレクトロニクス カンパニー リミテッド 帯域幅拡張のための高周波復号方法及びその装置
KR102121642B1 (ko) * 2014-03-31 2020-06-10 프라운호퍼-게젤샤프트 추르 푀르데룽 데어 안제반텐 포르슝 에 파우 부호화 장치, 복호 장치, 부호화 방법, 복호 방법, 및 프로그램
CN110444217B (zh) * 2014-05-01 2022-10-21 日本电信电话株式会社 解码装置、解码方法、记录介质
CN110875048B (zh) * 2014-05-01 2023-06-09 日本电信电话株式会社 编码装置、及其方法、记录介质
EP3696812B1 (en) * 2014-05-01 2021-06-09 Nippon Telegraph and Telephone Corporation Encoder, decoder, coding method, decoding method, coding program, decoding program and recording medium
CN107004422B (zh) * 2014-11-27 2020-08-25 日本电信电话株式会社 编码装置、解码装置、它们的方法及程序
EP3182411A1 (en) 2015-12-14 2017-06-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing an encoded audio signal
EP3382703A1 (en) * 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and methods for processing an audio signal
US10825467B2 (en) * 2017-04-21 2020-11-03 Qualcomm Incorporated Non-harmonic speech detection and bandwidth extension in a multi-source environment

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3283413B2 (ja) 1995-11-30 2002-05-20 株式会社日立製作所 符号化復号方法、符号化装置および復号装置
SE512719C2 (sv) 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
SE9903553D0 (sv) * 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
SE0001926D0 (sv) * 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
SE0004163D0 (sv) 2000-11-14 2000-11-14 Coding Technologies Sweden Ab Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering
CN1279512C (zh) * 2001-11-29 2006-10-11 编码技术股份公司 用于改善高频重建的方法和装置
EP1484841B1 (en) * 2002-03-08 2018-12-26 Nippon Telegraph And Telephone Corporation DIGITAL SIGNAL ENCODING METHOD, DECODING METHOD, ENCODING DEVICE, DECODING DEVICE and DIGITAL SIGNAL DECODING PROGRAM
JP2004062410A (ja) 2002-07-26 2004-02-26 Nippon Seiki Co Ltd 表示装置の表示方法
JP3861770B2 (ja) * 2002-08-21 2006-12-20 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
JP2005062410A (ja) 2003-08-11 2005-03-10 Nippon Telegr & Teleph Corp <Ntt> 音声信号の符号化方法
JP2005286533A (ja) 2004-03-29 2005-10-13 Nippon Hoso Kyokai <Nhk> データ伝送システム、データ送信装置、データ受信装置
EP1785984A4 (en) 2004-08-31 2008-08-06 Matsushita Electric Ind Co Ltd AUDIOCODING DEVICE, AUDIO DECODING DEVICE, COMMUNICATION DEVICE AND AUDIOCODING METHOD
EP1793372B1 (en) 2004-10-26 2011-12-14 Panasonic Corporation Speech encoding apparatus and speech encoding method
BRPI0518193A (pt) 2004-10-27 2008-11-04 Matsushita Electric Ind Co Ltd aparelho e método de codificação vocal, aparelhos de estação móvel e de base de comunicação de rádio
JP4977471B2 (ja) 2004-11-05 2012-07-18 パナソニック株式会社 符号化装置及び符号化方法
CN101091206B (zh) 2004-12-28 2011-06-01 松下电器产业株式会社 语音编码装置和语音编码方法
JP4397826B2 (ja) 2005-01-20 2010-01-13 株式会社資生堂 粉末化粧料の成型方法
SG161223A1 (en) * 2005-04-01 2010-05-27 Qualcomm Inc Method and apparatus for vector quantizing of a spectral envelope representation
KR100933548B1 (ko) * 2005-04-15 2009-12-23 돌비 스웨덴 에이비 비상관 신호의 시간적 엔벨로프 정형화

Also Published As

Publication number Publication date
US20090157413A1 (en) 2009-06-18
WO2007037361A1 (ja) 2007-04-05
BRPI0616624A2 (pt) 2011-06-28
EP1926083A1 (en) 2008-05-28
CN101273404B (zh) 2012-07-04
US8396717B2 (en) 2013-03-12
KR20080049085A (ko) 2008-06-03
JPWO2007037361A1 (ja) 2009-04-16
JP5089394B2 (ja) 2012-12-05
CN101273404A (zh) 2008-09-24
EP1926083A4 (en) 2011-01-26

Similar Documents

Publication Publication Date Title
RU2008112137A (ru) Устройство кодирования речи и способ кодирования речи
RU2585990C2 (ru) Устройство и способ для выполнения кодирования методом хаффмана
CN107408392B (zh) 译码方法和设备
RU2012155222A (ru) Устройство декодирования, устройство кодирования и соответствующие способы
AU724111B2 (en) System for adaptively filtering audio signals to enhance speech intelligibility in noisy environmental conditions
KR101428608B1 (ko) 대역폭 확장을 위한 스펙트럼 평탄도 제어
RU2688247C2 (ru) Устройство и способ для расширения диапазона частот для акустических сигналов
RU2009147514A (ru) Кодер, декодер, способ кодирования и способ декодирования
US20130117029A1 (en) Signal classification method and device, and encoding and decoding methods and devices
RU2011135533A (ru) Кодер, декодер и способ для них
KR101454581B1 (ko) 오디오 인코딩을 위한 장치 및 방법
CN1529882A (zh) 用于扩展窄带滤波的语音信号、特别是由通信设备发送的语音信号的带宽的方法
DE602005027549D1 (de) Basisstation
JP2013081229A (ja) 変換領域ログコンパンディングを使用する信号処理のための方法および装置
WO2013143221A1 (zh) 信号编码和解码的方法和设备
RU2011104350A (ru) Устройство сглаживания спектра, устройство кодирования, устройство декодирования, устройство терминала связи, устройство базовой станции и способ сглаживания спектра
JP6892491B2 (ja) 会話/音声信号処理方法および符号化装置
JP5518482B2 (ja) 低レベル信号の精度の損失を減少させる動的正規化のためのシステムと方法
US10269361B2 (en) Encoding device, decoding device, encoding method, decoding method, and non-transitory computer-readable recording medium
US20040128125A1 (en) Variable rate speech codec
ES2850224T3 (es) Método para estimar ruido en una señal de audio, estimador de ruido, codificador de audio, decodificador de audio, y sistema para transmitir señales de audio
TW201703027A (zh) 基於能量飽和及信號縮放之增益參數估計
EP1553750A1 (en) Communication terminal having adjustable hearing and/or speech characteristics

Legal Events

Date Code Title Description
FA93 Acknowledgement of application withdrawn (no request for examination)

Effective date: 20090930