JP5142727B2 - 音声復号装置および音声復号方法 - Google Patents
音声復号装置および音声復号方法 Download PDFInfo
- Publication number
- JP5142727B2 JP5142727B2 JP2007552944A JP2007552944A JP5142727B2 JP 5142727 B2 JP5142727 B2 JP 5142727B2 JP 2007552944 A JP2007552944 A JP 2007552944A JP 2007552944 A JP2007552944 A JP 2007552944A JP 5142727 B2 JP5142727 B2 JP 5142727B2
- Authority
- JP
- Japan
- Prior art keywords
- frame
- pulse waveform
- sound source
- signal
- periodic pulse
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 14
- 230000000737 periodic effect Effects 0.000 claims description 64
- 238000001514 detection method Methods 0.000 claims description 17
- 230000003044 adaptive effect Effects 0.000 claims description 12
- 230000001629 suppression Effects 0.000 claims description 12
- 230000015572 biosynthetic process Effects 0.000 claims description 11
- 238000003786 synthesis reaction Methods 0.000 claims description 11
- 230000005284 excitation Effects 0.000 claims description 2
- 230000002194 synthesizing effect Effects 0.000 claims description 2
- 238000004364 calculation method Methods 0.000 description 11
- 238000004891 communication Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 10
- 230000005540 biological transmission Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 230000009172 bursting Effects 0.000 description 3
- 230000010354 integration Effects 0.000 description 3
- 238000010295 mobile communication Methods 0.000 description 3
- 238000001914 filtration Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 2
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000008021 deposition Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 229920006395 saturated elastomer Polymers 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
- G10L19/265—Pre-filtering, e.g. high frequency emphasis prior to encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
図3は、本発明の実施の形態1に係る音声復号装置10の構成を示すブロック図である。以下、伝送途中で第nフレームが損失し、第nフレームの直前の第n−1フレームを用いて第nフレームの損失を補償(隠蔽)する場合を例にとって説明する。つまり、損失した第nフレームの復号の際に、第n−1フレームの音源信号をピッチ周期で繰り返し用いる場合について説明する。
)〜(3)において、exc[ ]は第n−1フレームの音源信号、PITMAXは音声復号装置10がとり得るピッチ周期の最大値、T0はピッチ周期長(ピッチラグ)、exccorrは自己相関値候補、excpowはピッチ周期パワー、exccorrmaxは自己相関値候補中の最大値(最大自己相関値)、定数τは最大自己相関値の探索範囲を表す。自己相関値算出部191は、式(3)により示される最大自己相関値を判定部193に出力する。
可能性があるため、判定部193は、以降の処理を継続して行う。
本実施の形態に係る音声復号装置は、第n−1フレームの非周期性パルス波形区間以外の音源信号に対し位相をランダムにする処理(位相ランダマイズ)を施すものである。
つことができ、音質の変化や音切れ感が少ない復号音声を得ることができる。
Claims (5)
- 過去の音源信号を蓄積する蓄積手段と、
ピッチラグに基づいて選択した過去の音源信号を出力する適応符号帳と、
雑音信号を出力する雑音符号帳と、
前記適応符号帳から出力された音源信号と前記雑音符号帳から出力された雑音信号とを加算する加算手段と、
第nフレーム(nは自然数)が消失した場合に、第n−1フレームの音源信号とピッチ情報を用いて、前記第n−1フレームの音源信号において非周期性パルス波形が存在する区間を検出する検出手段と、
前記加算手段から出力された第n−1フレームの信号の前記非周期性パルス波形が存在する区間において、前記非周期性パルス波形を抑圧する抑圧手段と、
前記非周期性パルス波形が抑圧された前記第n−1フレームの信号に対して合成フィルタによる合成を行って前記第nフレームの復号音声を得る合成手段と、
を具備する音声復号装置。 - 前記検出手段は、前記第n−1フレームにおいて、音源信号の最大自己相関値が閾値未満であり、かつ、音源振幅の第1最大値と第2最大値との差または比が閾値以上である場合に、前記第1最大値が存在する区間を前記非周期性パルス波形が存在する区間として検出する、
請求項1記載の音声復号装置。 - 前記抑圧手段は、前記第n−1フレームにおいて、前記非周期性パルス波形を雑音信号で置換して前記非周期性パルス波形を抑圧する、
請求項1記載の音声復号装置。 - 前記抑圧手段は、前記第n−1フレームにおいて、前記非周期性パルス波形が存在する区間以外にある音源信号の位相をランダムにして前記非周期性パルス波形を抑圧する、
請求項1記載の音声復号装置。 - ピッチラグに基づいて選択された過去の音源信号と雑音信号とを加算する加算工程と、
第nフレーム(nは自然数)が消失した場合に、第n−1フレームの音源信号とピッチ情報を用いて、前記第n−1フレームの音源信号において非周期性パルス波形が存在する区間を検出する検出工程と、
前記加算工程で生成された第n−1フレームの信号の前記非周期性パルス波形が存在する区間において、前記非周期性パルス波形を抑圧する抑圧工程と、
前記非周期性パルス波形が抑圧された前記第n−1フレームの信号に対して合成フィルタによる合成を行って前記第nフレームの復号音声を得る合成工程と、
を具備する音声復号方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007552944A JP5142727B2 (ja) | 2005-12-27 | 2006-12-26 | 音声復号装置および音声復号方法 |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005375401 | 2005-12-27 | ||
JP2005375401 | 2005-12-27 | ||
PCT/JP2006/325966 WO2007077841A1 (ja) | 2005-12-27 | 2006-12-26 | 音声復号装置および音声復号方法 |
JP2007552944A JP5142727B2 (ja) | 2005-12-27 | 2006-12-26 | 音声復号装置および音声復号方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2007077841A1 JPWO2007077841A1 (ja) | 2009-06-11 |
JP5142727B2 true JP5142727B2 (ja) | 2013-02-13 |
Family
ID=38228194
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007552944A Expired - Fee Related JP5142727B2 (ja) | 2005-12-27 | 2006-12-26 | 音声復号装置および音声復号方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US8160874B2 (ja) |
JP (1) | JP5142727B2 (ja) |
WO (1) | WO2007077841A1 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5664291B2 (ja) * | 2011-02-01 | 2015-02-04 | 沖電気工業株式会社 | 音声品質観測装置、方法及びプログラム |
CN102446509B (zh) * | 2011-11-22 | 2014-04-09 | 中兴通讯股份有限公司 | 增强抗丢包的音频编解码方法及系统 |
CN104380377B (zh) * | 2012-06-14 | 2017-06-06 | 瑞典爱立信有限公司 | 用于可缩放低复杂度编码/解码的方法和装置 |
KR101854815B1 (ko) * | 2012-10-10 | 2018-05-04 | 광주과학기술원 | 분광장치 및 분광방법 |
PL3584791T3 (pl) * | 2012-11-05 | 2024-03-18 | Panasonic Holdings Corporation | Urządzenie do kodowania mowy/dźwięku oraz sposób kodowania mowy/dźwięku |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04264597A (ja) * | 1991-02-20 | 1992-09-21 | Fujitsu Ltd | 音声符号化装置および音声復号装置 |
JPH10222196A (ja) * | 1997-02-03 | 1998-08-21 | Gotai Handotai Kofun Yugenkoshi | 音声符号化における波形利得見積方法 |
JP2000267700A (ja) * | 1999-03-17 | 2000-09-29 | Yrp Kokino Idotai Tsushin Kenkyusho:Kk | 音声符号化復号方法および装置 |
JP2001051698A (ja) * | 1999-08-06 | 2001-02-23 | Yrp Kokino Idotai Tsushin Kenkyusho:Kk | 音声符号化復号方法および装置 |
WO2002071389A1 (fr) * | 2001-03-06 | 2002-09-12 | Ntt Docomo, Inc. | Procede et dispositif d'interpolation de donnees sonores, procede et dispositif de creation d'informations relatives aux donnees sonores, procede et dispositif de transmission des informations d'interpolation des donnees sonores, et programme et support d'enregistrement correspondants |
JP2004020676A (ja) * | 2002-06-13 | 2004-01-22 | Hitachi Kokusai Electric Inc | 音声符号化/復号化方法及び音声符号化/復号化装置 |
Family Cites Families (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SE503547C2 (sv) * | 1993-06-11 | 1996-07-01 | Ericsson Telefon Ab L M | Anordning och förfarande för döljande av förlorade ramar |
SE501340C2 (sv) * | 1993-06-11 | 1995-01-23 | Ericsson Telefon Ab L M | Döljande av transmissionsfel i en talavkodare |
SE502244C2 (sv) * | 1993-06-11 | 1995-09-25 | Ericsson Telefon Ab L M | Sätt och anordning för avkodning av ljudsignaler i ett system för mobilradiokommunikation |
US5574825A (en) * | 1994-03-14 | 1996-11-12 | Lucent Technologies Inc. | Linear prediction coefficient generation during frame erasure or packet loss |
US5615298A (en) * | 1994-03-14 | 1997-03-25 | Lucent Technologies Inc. | Excitation signal synthesis during frame erasure or packet loss |
US5550543A (en) * | 1994-10-14 | 1996-08-27 | Lucent Technologies Inc. | Frame erasure or packet loss compensation method |
JP2647034B2 (ja) * | 1994-11-28 | 1997-08-27 | 日本電気株式会社 | 電荷結合素子の製造方法 |
US5732389A (en) * | 1995-06-07 | 1998-03-24 | Lucent Technologies Inc. | Voiced/unvoiced classification of speech for excitation codebook selection in celp speech decoding during frame erasures |
JPH1091194A (ja) | 1996-09-18 | 1998-04-10 | Sony Corp | 音声復号化方法及び装置 |
EP0899720B1 (en) | 1997-08-28 | 2004-12-15 | Texas Instruments Inc. | Quantization of linear prediction coefficients |
US6889185B1 (en) * | 1997-08-28 | 2005-05-03 | Texas Instruments Incorporated | Quantization of linear prediction coefficients using perceptual weighting |
WO1999010719A1 (en) * | 1997-08-29 | 1999-03-04 | The Regents Of The University Of California | Method and apparatus for hybrid coding of speech at 4kbps |
US6810377B1 (en) * | 1998-06-19 | 2004-10-26 | Comsat Corporation | Lost frame recovery techniques for parametric, LPC-based speech coding systems |
US6377915B1 (en) * | 1999-03-17 | 2002-04-23 | Yrp Advanced Mobile Communication Systems Research Laboratories Co., Ltd. | Speech decoding using mix ratio table |
US6678267B1 (en) * | 1999-08-10 | 2004-01-13 | Texas Instruments Incorporated | Wireless telephone with excitation reconstruction of lost packet |
US6775649B1 (en) * | 1999-09-01 | 2004-08-10 | Texas Instruments Incorporated | Concealment of frame erasures for speech transmission and storage system and method |
US6826527B1 (en) * | 1999-11-23 | 2004-11-30 | Texas Instruments Incorporated | Concealment of frame erasures and method |
FR2813722B1 (fr) * | 2000-09-05 | 2003-01-24 | France Telecom | Procede et dispositif de dissimulation d'erreurs et systeme de transmission comportant un tel dispositif |
US6968309B1 (en) * | 2000-10-31 | 2005-11-22 | Nokia Mobile Phones Ltd. | Method and system for speech frame error concealment in speech decoding |
JP3472279B2 (ja) | 2001-06-04 | 2003-12-02 | パナソニック モバイルコミュニケーションズ株式会社 | 音声符号化パラメータ符号化方法及び装置 |
US7711563B2 (en) * | 2001-08-17 | 2010-05-04 | Broadcom Corporation | Method and system for frame erasure concealment for predictive speech coding based on extrapolation of speech waveform |
US7308406B2 (en) * | 2001-08-17 | 2007-12-11 | Broadcom Corporation | Method and system for a waveform attenuation technique for predictive speech coding based on extrapolation of speech waveform |
US7379865B2 (en) * | 2001-10-26 | 2008-05-27 | At&T Corp. | System and methods for concealing errors in data transmission |
DE60230666D1 (de) * | 2001-11-29 | 2009-02-12 | Panasonic Corp | Verfahren zur beseitigung von kodierungsverzerrung und verfahren zur videokodierung und -dekodierung |
KR100929078B1 (ko) * | 2001-11-29 | 2009-11-30 | 파나소닉 주식회사 | 코딩 왜곡 제거 방법 |
US7302385B2 (en) * | 2003-07-07 | 2007-11-27 | Electronics And Telecommunications Research Institute | Speech restoration system and method for concealing packet losses |
US7324937B2 (en) * | 2003-10-24 | 2008-01-29 | Broadcom Corporation | Method for packet loss and/or frame erasure concealment in a voice communication system |
WO2006025313A1 (ja) * | 2004-08-31 | 2006-03-09 | Matsushita Electric Industrial Co., Ltd. | 音声符号化装置、音声復号化装置、通信装置及び音声符号化方法 |
JP4732730B2 (ja) * | 2004-09-30 | 2011-07-27 | パナソニック株式会社 | 音声復号装置 |
-
2006
- 2006-12-26 JP JP2007552944A patent/JP5142727B2/ja not_active Expired - Fee Related
- 2006-12-26 WO PCT/JP2006/325966 patent/WO2007077841A1/ja active Application Filing
- 2006-12-26 US US12/159,312 patent/US8160874B2/en active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04264597A (ja) * | 1991-02-20 | 1992-09-21 | Fujitsu Ltd | 音声符号化装置および音声復号装置 |
JPH10222196A (ja) * | 1997-02-03 | 1998-08-21 | Gotai Handotai Kofun Yugenkoshi | 音声符号化における波形利得見積方法 |
JP2000267700A (ja) * | 1999-03-17 | 2000-09-29 | Yrp Kokino Idotai Tsushin Kenkyusho:Kk | 音声符号化復号方法および装置 |
JP2001051698A (ja) * | 1999-08-06 | 2001-02-23 | Yrp Kokino Idotai Tsushin Kenkyusho:Kk | 音声符号化復号方法および装置 |
WO2002071389A1 (fr) * | 2001-03-06 | 2002-09-12 | Ntt Docomo, Inc. | Procede et dispositif d'interpolation de donnees sonores, procede et dispositif de creation d'informations relatives aux donnees sonores, procede et dispositif de transmission des informations d'interpolation des donnees sonores, et programme et support d'enregistrement correspondants |
JP2004020676A (ja) * | 2002-06-13 | 2004-01-22 | Hitachi Kokusai Electric Inc | 音声符号化/復号化方法及び音声符号化/復号化装置 |
Also Published As
Publication number | Publication date |
---|---|
JPWO2007077841A1 (ja) | 2009-06-11 |
WO2007077841A1 (ja) | 2007-07-12 |
US20090234653A1 (en) | 2009-09-17 |
US8160874B2 (en) | 2012-04-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100391527B1 (ko) | 음성 부호화 장치, 기록 매체, 음성 복호화 장치, 신호 처리용 프로세서, 음성 부호화 복호화 시스템, 통신용 기지국, 통신용 단말 및 무선 통신 시스템 | |
EP2176860B1 (en) | Processing of frames of an audio signal | |
US7664650B2 (en) | Speech speed converting device and speech speed converting method | |
EP1775717B1 (en) | Speech decoding apparatus and compensation frame generation method | |
US7831420B2 (en) | Voice modifier for speech processing systems | |
JP4846712B2 (ja) | スケーラブル復号化装置およびスケーラブル復号化方法 | |
KR100488080B1 (ko) | 멀티모드 음성 인코더 | |
EP3352169B1 (en) | Unvoiced decision for speech processing | |
ES2656022T3 (es) | Detección y codificación de altura tonal muy débil | |
KR20020052191A (ko) | 음성 분류를 이용한 음성의 가변 비트 속도 켈프 코딩 방법 | |
JP2010286853A (ja) | 合成による分析celp型音声符号化のための適応型ウィンドウ | |
JPWO2007052612A1 (ja) | ステレオ符号化装置およびステレオ信号予測方法 | |
CN101180676A (zh) | 用于谱包络表示的向量量化的方法和设备 | |
US20100169082A1 (en) | Enhancing Receiver Intelligibility in Voice Communication Devices | |
JP5142727B2 (ja) | 音声復号装置および音声復号方法 | |
KR20040042903A (ko) | 일반화된 분석에 의한 합성 스피치 코딩 방법 및 그방법을 구현하는 코더 | |
EP2951824B1 (en) | Adaptive high-pass post-filter | |
JPH1097294A (ja) | 音声符号化装置 | |
JPWO2007037359A1 (ja) | 音声符号化装置および音声符号化方法 | |
WO2010098130A1 (ja) | トーン判定装置およびトーン判定方法 | |
KR100718487B1 (ko) | 디지털 음성 코더들에서의 고조파 잡음 가중 | |
JP3785363B2 (ja) | 音声信号符号化装置、音声信号復号装置及び音声信号符号化方法 | |
JP2992998B2 (ja) | 音声符号化復号化装置 | |
JP5511839B2 (ja) | トーン判定装置およびトーン判定方法 | |
JPH02160300A (ja) | 音声符号化方式 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20091020 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120221 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120419 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121030 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121120 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151130 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5142727 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |