JPWO2008108080A1 - 音声符号化装置及び音声復号装置 - Google Patents
音声符号化装置及び音声復号装置 Download PDFInfo
- Publication number
- JPWO2008108080A1 JPWO2008108080A1 JP2009502458A JP2009502458A JPWO2008108080A1 JP WO2008108080 A1 JPWO2008108080 A1 JP WO2008108080A1 JP 2009502458 A JP2009502458 A JP 2009502458A JP 2009502458 A JP2009502458 A JP 2009502458A JP WO2008108080 A1 JPWO2008108080 A1 JP WO2008108080A1
- Authority
- JP
- Japan
- Prior art keywords
- power
- unit
- sound source
- output
- prediction residual
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 88
- 238000003786 synthesis reaction Methods 0.000 claims abstract description 88
- 238000004364 calculation method Methods 0.000 claims description 52
- 238000000034 method Methods 0.000 claims description 45
- 230000008569 process Effects 0.000 claims description 27
- 238000013139 quantization Methods 0.000 claims description 27
- 238000001514 detection method Methods 0.000 claims 1
- 230000002194 synthesizing effect Effects 0.000 claims 1
- 230000005284 excitation Effects 0.000 abstract description 151
- 230000006866 deterioration Effects 0.000 abstract description 11
- 238000006243 chemical reaction Methods 0.000 description 56
- 230000005236 sound signal Effects 0.000 description 27
- 238000004458 analytical method Methods 0.000 description 16
- 238000010586 diagram Methods 0.000 description 16
- 230000003044 adaptive effect Effects 0.000 description 14
- 238000000605 extraction Methods 0.000 description 10
- 238000005516 engineering process Methods 0.000 description 8
- 230000010354 integration Effects 0.000 description 6
- 238000010606 normalization Methods 0.000 description 6
- 230000015556 catabolic process Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 238000006731 degradation reaction Methods 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 230000002159 abnormal effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
図2は、本発明の実施の形態に係る音声符号化装置100の構成を示すブロック図である。以下、音声符号化装置100を構成する各部について説明する。
に受信している。エラーフリー時の各パワーのプロット点表示は図1Aと同一であり、エラーフリー時のプロット点をつなぐ直線は破線で示されている。また、K1フレームとK2フレームでフレーム消失した場合のパワーの変移が実線で示されている。なお、黒三角は音源パワーを、黒丸はフィルタゲインを、それぞれ示す。
図2は、本発明の実施の形態に係る音声符号化装置100の構成を示すブロック図である。以下、音声符号化装置100を構成する各部について説明する。
る。
に出力される。
その平均値を減算し、減算結果をベクトル量子化部144に出力する。なお、対数音源振幅の平均値は、大規模な入力信号データベースを用いて事前に算出しておくものとする。
フレーム消失情報がフレーム消失を示していない場合は、復号音源生成部204から出力された復号音源信号を選択する。音源選択部208は、選択した音源信号を復号音源生成部204及び合成フィルタゲイン調整部212に出力する。なお、復号音源生成部204に出力された音源信号は、復号音源生成部204内の適応符号帳に格納される。
とを別々に調整することにより、音源信号のパワーと復号音声信号のパワーの双方をフレーム消失隠蔽処理時とエラーフリー時とで合わせることが可能となる。このため、適応符号帳に格納される音源信号のパワーがエラーフリー時の音源信号のパワーと大きく異ならないようにすることができるので、復帰フレーム以降で発生しうる音切れや異音を低減することができる。また、合成フィルタのフィルタゲインもエラーフリー時のゲインに合わせることが可能となるので、復号音声信号のパワーもエラーフリー時のパワーに合わせることができる。
ピッチパルス振幅平均値はパワーパラメータ符号化部112の対数ピッチパルス振幅平均除去部143に記憶されている平均値と同一である。
蔽処理用冗長情報として用いることにより、消失フレームにおける復号音声信号のパワーをエラーフリー時の復号音声信号のパワーに合わせることから、音切れや過大音といった復号信号パワーの不整合に起因する主観品質の劣化を回避することができる。また、参照音源パワーを用いることにより、復号音声信号パワーだけでなく、復号音源パワーも参照音源パワーに合わせることができるので、復帰フレーム以降における復号音声のパワー不整合に起因する主観品質の劣化を抑制することができる。さらに、パワー関連パラメータをベクトル量子化によって量子化して伝送することにより、いずれか一方の情報を送信する場合に比べて同等〜数ビットの増加ですむことから、パワーに関する隠蔽処理用冗長情報を少ない情報量で送信することができる。
むように1チップ化されてもよい。ここでは、LSIとしたが、集積度の違いにより、IC、システムLSI、スーパーLSI、ウルトラLSIと呼称されることもある。
Claims (5)
- 音源信号のパワーを算出する音源パワー算出手段と、
正規化予測残差パワーを算出する正規化予測残差パワー算出手段と、
算出された音源信号のパワーと正規化予測残差パワーを含む隠蔽処理用パラメータを他のパラメータと多重化する多重化手段と、
を具備する音声符号化装置。 - ピッチパルスを検出するピッチパルス検出手段を具備し、
前記多重化手段は、検出されたピッチパルスの振幅情報をさらに含む前記隠蔽処理用パラメータを多重化する、
請求項1に記載の音声符号化装置。 - 前記隠蔽処理用パラメータをベクトル量子化するベクトル量子化手段を具備する、
請求項1に記載の音声符号化装置。 - 前記ベクトル量子化手段は、前記音源信号のパワーと前記正規化予測残差パワーと前記ピッチパルスの振幅情報のうち、いずれか2以上の情報を組み合わせてベクトルとして量子化する、
請求項3に記載の音声符号化装置。 - 受信した音源信号のパワーと一致するように、フレーム消失時に隠蔽処理によって生成された音源信号のパワーを調整する音源パワー調整手段と、
フレーム消失時に隠蔽処理によって生成された線形予測係数の正規化予測残差パワーを算出する正規化予測残差パワー算出手段と、
算出された前記正規化予測残差パワーと受信した正規化予測残差パワーとの比から合成フィルタのフィルタゲイン調整係数を算出する調整係数算出手段と、
隠蔽処理によって生成された前記音源信号に前記フィルタゲイン調整係数を乗算し、合成フィルタのフィルタゲインを調整する調整手段と、
隠蔽処理によって生成された前記線形予測係数と、前記フィルタゲイン調整係数が乗算された前記音源信号とを用いて、復号音声信号を合成する合成フィルタ手段と、
を具備する音声復号装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009502458A JP5489711B2 (ja) | 2007-03-02 | 2008-02-29 | 音声符号化装置及び音声復号装置 |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007053503 | 2007-03-02 | ||
JP2007053503 | 2007-03-02 | ||
PCT/JP2008/000404 WO2008108080A1 (ja) | 2007-03-02 | 2008-02-29 | 音声符号化装置及び音声復号装置 |
JP2009502458A JP5489711B2 (ja) | 2007-03-02 | 2008-02-29 | 音声符号化装置及び音声復号装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2008108080A1 true JPWO2008108080A1 (ja) | 2010-06-10 |
JP5489711B2 JP5489711B2 (ja) | 2014-05-14 |
Family
ID=39737978
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009502458A Expired - Fee Related JP5489711B2 (ja) | 2007-03-02 | 2008-02-29 | 音声符号化装置及び音声復号装置 |
Country Status (6)
Country | Link |
---|---|
US (1) | US9129590B2 (ja) |
EP (2) | EP3301672B1 (ja) |
JP (1) | JP5489711B2 (ja) |
BR (1) | BRPI0808200A8 (ja) |
ES (1) | ES2642091T3 (ja) |
WO (1) | WO2008108080A1 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011155144A1 (ja) | 2010-06-11 | 2011-12-15 | パナソニック株式会社 | 復号装置、符号化装置及びこれらの方法 |
ES2727748T3 (es) * | 2010-11-22 | 2019-10-18 | Ntt Docomo Inc | Dispositivo y método de codificación de audio |
WO2012144128A1 (ja) | 2011-04-20 | 2012-10-26 | パナソニック株式会社 | 音声音響符号化装置、音声音響復号装置、およびこれらの方法 |
EP3301677B1 (en) * | 2011-12-21 | 2019-08-28 | Huawei Technologies Co., Ltd. | Very short pitch detection and coding |
JP5981408B2 (ja) | 2013-10-29 | 2016-08-31 | 株式会社Nttドコモ | 音声信号処理装置、音声信号処理方法、及び音声信号処理プログラム |
EP2922056A1 (en) * | 2014-03-19 | 2015-09-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and corresponding computer program for generating an error concealment signal using power compensation |
EP2922054A1 (en) | 2014-03-19 | 2015-09-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and corresponding computer program for generating an error concealment signal using an adaptive noise estimation |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5384891A (en) * | 1988-09-28 | 1995-01-24 | Hitachi, Ltd. | Vector quantizing apparatus and speech analysis-synthesis system using the apparatus |
US5615298A (en) * | 1994-03-14 | 1997-03-25 | Lucent Technologies Inc. | Excitation signal synthesis during frame erasure or packet loss |
CA2242610C (en) * | 1996-11-11 | 2003-01-28 | Matsushita Electric Industrial Co., Ltd. | Sound reproducing speed converter |
US6775649B1 (en) * | 1999-09-01 | 2004-08-10 | Texas Instruments Incorporated | Concealment of frame erasures for speech transmission and storage system and method |
US6636829B1 (en) * | 1999-09-22 | 2003-10-21 | Mindspeed Technologies, Inc. | Speech communication system and method for handling lost frames |
US6826527B1 (en) * | 1999-11-23 | 2004-11-30 | Texas Instruments Incorporated | Concealment of frame erasures and method |
US6757654B1 (en) * | 2000-05-11 | 2004-06-29 | Telefonaktiebolaget Lm Ericsson | Forward error correction in speech coding |
FR2813722B1 (fr) * | 2000-09-05 | 2003-01-24 | France Telecom | Procede et dispositif de dissimulation d'erreurs et systeme de transmission comportant un tel dispositif |
EP1199709A1 (en) * | 2000-10-20 | 2002-04-24 | Telefonaktiebolaget Lm Ericsson | Error Concealment in relation to decoding of encoded acoustic signals |
US7031926B2 (en) * | 2000-10-23 | 2006-04-18 | Nokia Corporation | Spectral parameter substitution for the frame error concealment in a speech decoder |
CA2388439A1 (en) | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for efficient frame erasure concealment in linear predictive based speech codecs |
JP4331928B2 (ja) | 2002-09-11 | 2009-09-16 | パナソニック株式会社 | 音声符号化装置、音声復号化装置、及びそれらの方法 |
US7302385B2 (en) * | 2003-07-07 | 2007-11-27 | Electronics And Telecommunications Research Institute | Speech restoration system and method for concealing packet losses |
US7324937B2 (en) * | 2003-10-24 | 2008-01-29 | Broadcom Corporation | Method for packet loss and/or frame erasure concealment in a voice communication system |
KR20070061818A (ko) * | 2004-09-17 | 2007-06-14 | 마츠시타 덴끼 산교 가부시키가이샤 | 음성 부호화 장치, 음성 복호 장치, 통신 장치 및 음성부호화 방법 |
JP2007053503A (ja) | 2005-08-16 | 2007-03-01 | Kaneka Corp | アンテナおよびその製造方法 |
US8255207B2 (en) * | 2005-12-28 | 2012-08-28 | Voiceage Corporation | Method and device for efficient frame erasure concealment in speech codecs |
US20090018824A1 (en) * | 2006-01-31 | 2009-01-15 | Matsushita Electric Industrial Co., Ltd. | Audio encoding device, audio decoding device, audio encoding system, audio encoding method, and audio decoding method |
WO2008007700A1 (fr) * | 2006-07-12 | 2008-01-17 | Panasonic Corporation | Dispositif de décodage de son, dispositif de codage de son, et procédé de compensation de trame perdue |
WO2008007699A1 (en) * | 2006-07-12 | 2008-01-17 | Panasonic Corporation | Audio decoding device and audio encoding device |
-
2008
- 2008-02-29 WO PCT/JP2008/000404 patent/WO2008108080A1/ja active Application Filing
- 2008-02-29 ES ES08710507.8T patent/ES2642091T3/es active Active
- 2008-02-29 JP JP2009502458A patent/JP5489711B2/ja not_active Expired - Fee Related
- 2008-02-29 EP EP17183127.4A patent/EP3301672B1/en active Active
- 2008-02-29 US US12/528,671 patent/US9129590B2/en active Active
- 2008-02-29 EP EP08710507.8A patent/EP2128854B1/en not_active Not-in-force
- 2008-02-29 BR BRPI0808200A patent/BRPI0808200A8/pt not_active Application Discontinuation
Also Published As
Publication number | Publication date |
---|---|
ES2642091T3 (es) | 2017-11-15 |
EP2128854A4 (en) | 2013-08-28 |
BRPI0808200A8 (pt) | 2017-09-12 |
EP3301672B1 (en) | 2020-08-05 |
EP3301672A1 (en) | 2018-04-04 |
EP2128854B1 (en) | 2017-07-26 |
JP5489711B2 (ja) | 2014-05-14 |
US20100049509A1 (en) | 2010-02-25 |
WO2008108080A1 (ja) | 2008-09-12 |
US9129590B2 (en) | 2015-09-08 |
EP2128854A1 (en) | 2009-12-02 |
BRPI0808200A2 (pt) | 2014-07-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4658596B2 (ja) | 線形予測に基づく音声コーデックにおける効率的なフレーム消失の隠蔽のための方法、及び装置 | |
JP5052514B2 (ja) | 音声復号装置 | |
US9020813B2 (en) | Speech enhancement system and method | |
EP2382622B1 (en) | Method and apparatus for generating an enhancement layer within a multiple-channel audio coding system | |
US8175888B2 (en) | Enhanced layered gain factor balancing within a multiple-channel audio coding system | |
JP5489711B2 (ja) | 音声符号化装置及び音声復号装置 | |
EP2382626B1 (en) | Selective scaling mask computation based on peak detection | |
US20020077812A1 (en) | Voice code conversion apparatus | |
ES2707888T3 (es) | Sistemas y procedimientos para mitigar la inestabilidad potencial de tramas | |
JPH0353300A (ja) | 音声符号化装置 | |
US20230178087A1 (en) | Audio Encoding/Decoding based on an Efficient Representation of Auto-Regressive Coefficients | |
KR20070118170A (ko) | 스펙트럼 엔벨로프 표현의 벡터 양자화를 위한 방법 및장치 | |
WO2008007698A1 (fr) | Procédé de compensation des pertes de blocs, appareil de codage audio et appareil de décodage audio | |
WO2010077587A1 (en) | Selective scaling mask computation based on peak detection | |
KR20070085532A (ko) | 스테레오 부호화 장치, 스테레오 복호 장치 및 그 방법 | |
JP6109968B2 (ja) | 補間係数セットを決定するためのシステムおよび方法 | |
Gomez et al. | Recognition of coded speech transmitted over wireless channels | |
US20100153099A1 (en) | Speech encoding apparatus and speech encoding method | |
KR20120032444A (ko) | 적응 코드북 업데이트를 이용한 오디오 신호 디코딩 방법 및 장치 | |
KR20120032443A (ko) | 쉐이핑 함수를 이용한 오디오 신호 디코딩 방법 및 장치 | |
JP2001100797A (ja) | 音声符号化復号装置 | |
Gardner et al. | Survey of speech-coding techniques for digital cellular communication systems |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110201 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130507 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130626 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140204 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140225 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 5489711 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |