JP2002236495A - 音声復号化装置および音声復号化方法 - Google Patents

音声復号化装置および音声復号化方法

Info

Publication number
JP2002236495A
JP2002236495A JP2001367831A JP2001367831A JP2002236495A JP 2002236495 A JP2002236495 A JP 2002236495A JP 2001367831 A JP2001367831 A JP 2001367831A JP 2001367831 A JP2001367831 A JP 2001367831A JP 2002236495 A JP2002236495 A JP 2002236495A
Authority
JP
Japan
Prior art keywords
signal
parameter
noise
decoded signal
stationary noise
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001367831A
Other languages
English (en)
Other versions
JP3806344B2 (ja
Inventor
Hiroyuki Ebara
宏幸 江原
Kazutoshi Yasunaga
和敏 安永
Kazunori Mano
一則 間野
Yuusuke Hiwazaki
祐介 日和▲崎▼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Panasonic Holdings Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp, Matsushita Electric Industrial Co Ltd filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2001367831A priority Critical patent/JP3806344B2/ja
Publication of JP2002236495A publication Critical patent/JP2002236495A/ja
Application granted granted Critical
Publication of JP3806344B2 publication Critical patent/JP3806344B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

(57)【要約】 【課題】 周期性のある定常信号と白色雑音的な定
常雑音信号とを区別して、定常雑音信号区間を正確に検
出すること。 【解決手段】 第1の判定器121は、復号信号の定常
性の判定結果に基づいて現在の処理単位が定常雑音区間
かどうかを仮に判定する。第2の判定器124は、この
仮の判定結果と復号信号の周期性の判定結果とに基づい
て現在の処理単位が定常雑音区間かどうかをさらに判定
することにより、定常母音等の定常的な音声信号が含ま
れる復号信号を定常雑音と区別して、定常雑音区間を正
しく検出する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声信号を符号化
して伝送する移動通信システム、インターネット通信を
含むパケット通信システムなどにおいて、低ビットレー
トで符号化された音声信号を復号化する音声復号化装置
に関し、特に音声信号をスペクトル包絡成分と残差成分
とに分離して表現するようなCELP(Code Excited L
inear Prediction)型音声復号化装置などに関する。
【0002】
【従来の技術】ディジタル移動通信や、インターネット
通信に代表されるパケット通信、あるいは音声蓄積の分
野においては、電波などの伝送路の容量や記憶媒体の有
効利用のために音声情報を圧縮し、高能率で符号化する
ための音声符号化装置が用いられている。なかでもCE
LP(Code Excited LineAr Prediction:符号励振線形
予測符号化)方式をベースにした方式が中・低ビットレ
ートにおいて広く実用化されている。CELPの技術に
ついては、M.R.Schroeder and B.S.Atal:"Code-Excite
d Linear Prediction (CELP):High-quality Speech at
Very Low Bit Rates",Proc.ICASSP-85, 25.1.1, pp.
937-940, 1985"に示されている。
【0003】CELP型音声符号化方式は、音声をある
一定のフレーム長(5ms〜50ms程度)に区切り、
各フレーム毎に音声の線形予測を行い、フレーム毎の線
形予測による予測残差(励振信号)を既知の波形からな
る適応符号ベクトルと雑音符号ベクトルを用いて符号化
するものである。適応符号ベクトルは過去に生成した駆
動音源ベクトルを格納している適応符号帳から、雑音符
号ベクトルは予め用意された定められた数の定められた
形状を有するベクトルを格納している雑音符号帳から選
択されて使用される。雑音符号帳に格納される雑音符号
ベクトルには、ランダムな雑音系列のベクトルや何本か
のパルスを異なる位置に配置することによって生成され
るベクトルなどが用いられる。
【0004】従来のCELP符号化装置では、入力され
たディジタル信号を用いてLPC(Linear Predictive C
oefficient:線形予測係数)の分析・量子化とピッチ探
索と雑音符号帳探索とゲイン符号帳探索とが行われ、L
PC符号(L)とピッチ周期(P)と雑音符号帳インデ
ックス(S)とゲイン符号帳インデックス(G)とが復
号化装置に伝送される。
【0005】復号化装置は、LPC符号(L)とピッチ
周期(P)と雑音符号帳インデックス(S)とゲイン符
号帳インデックス(G)とを復号し、これらの復号結果
に基づいて合成フィルタを駆動音源信号で駆動して復号
信号を得る。
【0006】
【発明が解決しようとする課題】しかしながら、上記従
来の音声復号化装置においては、定常母音等の定常的で
はあるが雑音ではない信号を、定常雑音と区別して定常
雑音区間を検出することが困難であった。
【0007】本発明はかかる点に鑑みてなされたもので
あり、定常雑音信号区間を正確に検出して音声信号を復
号化することが出来る音声復号化装置に関し、特に音声
区間と非音声区間との判定が可能であり、ピッチ周期や
適応符号利得を用いて周期性のある定常信号と白色雑音
的な定常雑音信号とを区別して、定常雑音信号区間を正
確に検出することが出来る音声復号化装置に関する。
【0008】
【課題を解決するための手段】本発明の骨子は、復号信
号の定常雑音性を仮に判定し、この仮の判定結果と復号
信号の周期性の判定結果とに基づいて現在の処理単位が
定常雑音区間かどうかをさらに判定することにより、定
常母音等の定常的な音声信号が含まれる復号信号を定常
雑音と区別して、定常雑音区間を正しく検出することで
ある。
【0009】
【発明の実施の形態】本発明の音声復号化装置は、符号
化信号を復号して音声信号のスペクトル包絡成分を表す
少なくとも1種類の第1パラメータを得る第1復号化手
段と、前記符号化信号を復号して音声信号の残差成分を
表す少なくとも1種類の第2パラメータを得る第2復号
化手段と、前記第1パラメータに基づいて合成フィルタ
を構成し、前記第2パラメータに基づいて生成した駆動
音源信号により前記合成フィルタを駆動して復号信号を
生成する合成手段と、前記第1パラメータに基づいて前
記復号信号の定常雑音性を判定する第1判定手段と、前
記第2パラメータに基づいて前記復号信号の周期性を判
定し、この周期性の判定結果と前記第1判定手段におけ
る定常雑音性の判定結果と前記第1パラメータとに基づ
いて定常雑音区間かどうかを判定する第2判定手段と、
具備する構成を採る。
【0010】この構成によれば、復号信号の周期性も考
慮して定常雑音区間かどうかを判定するので、周期性の
ある定常信号と白色雑音的な定常雑音信号とを区別して
定常雑音区間かどうかを判定することが出来る。
【0011】本発明の音声復号化装置は、上記構成にお
いて、第2パラメータは少なくともピッチ周期を含み、
第2判定手段は、前記ピッチ周期のサブフレーム毎のば
らつきを分析し、この分析結果に基づいて復号信号の周
期性を判定する構成を採る。
【0012】この構成によれば、ピッチ周期のばらつき
に基づいて復号信号の周期性を判断するので、定常雑音
区間かどうかを正確に判定することが出来る。
【0013】本発明の音声復号化装置は、上記構成にお
いて、第2パラメータは、少なくとも適応符号ベクトル
に乗算する適応符号帳ゲインを含み、第2判定手段は、
前記雑音符号帳ゲインに基づいて復号信号の周期性を判
定する構成を採る。
【0014】この構成によれば、適応符号帳ゲインに基
づいて復号信号の周期性を判断するので、定常雑音区間
かどうかを正確に判定することが出来る。
【0015】本発明の音声復号化装置は、上記構成にお
いて、第1パラメータは、少なくともスペクトル包絡パ
ラメータを含み、処理単位間での前記スペクトル包絡パ
ラメータの変動量を算出する変動量算出手段と、現在の
処理単位よりも前の定常雑音区間における前記スペクト
ル包絡パラメータを平均化した値と現在の処理単位にお
けるスペクトル包絡パラメータとの距離を算出する距離
算出手段と、を具備し、第1判定手段は、前記変動量と
前記距離とに基づいて合成手段において生成した復号信
号の定常性を判定し、この判定結果に基づいて前記復号
信号の定常雑音性を判定する構成を採る。
【0016】本発明の音声復号化装置は、上記構成にお
いて、変動量算出手段は、変動量として、現在の処理単
位のスペクトル包絡パラメータと1つ前の処理単位にお
けるスペクトル包絡パラメータとの2乗誤差を算出し、
距離算出手段は、距離として、現在の処理単位よりも前
の定常雑音区間における前記スペクトル包絡パラメータ
を平均化した値と現在の処理単位におけるスペクトル包
絡パラメータとの2乗誤差を算出し、第1判定手段は、
少なくとも、変動量として算出した2乗誤差と距離とし
て算出した2乗誤差のそれぞれについて閾値を設定し、
変動量として算出した2乗誤差と距離として算出した2
乗誤差がいずれも設定した閾値よりも小さい場合に復号
信号が定常であると判定する構成を採る。
【0017】本発明の音声復号化装置は、上記構成にお
いて、現在の処理単位より前の複数の処理単位における
ピッチ周期をそれぞれバッファリングし、このバッファ
リングした複数の処理単位におけるピッチ周期のうち互
いに近接するピッチ周期をグループ化し、グループ化し
た際のグループ数を出力するピッチ履歴分析手段と、現
在の処理単位における復号信号パワと、現在の処理単位
より前の定常雑音区間における復号信号の平均パワとの
変化量を算出する信号パワ変化算出手段と、を具備し、
第2判定手段は、前記変化量が所定の閾値を超えている
場合は音声区間と判定し、有声定常区間ではなく、且
つ、第1判定手段において復号信号が定常と判定された
場合であり、変動量算出手段において算出した変動量が
所定の閾値未満である状態が所定の処理単位数以上続い
ている場合は定常雑音区間と判定し、前記ピッチ履歴分
析手段から出力されるグループ数が所定の閾値以上であ
る場合、又は適応符号利得が所定の閾値以上である場合
は音声区間と判定する構成を採る。
【0018】これらの構成によれば、復号信号の周期性
も考慮して定常雑音区間かどうかを判定するので、周期
性のある定常信号と白色雑音的な定常雑音信号とを区別
して定常雑音区間かどうかを判定することが出来る。
【0019】本発明の音声復号化装置は、上記構成にお
いて、合成手段において生成された復号信号と前記復号
信号に擬似的な定常雑音信号を重畳して得られる雑音重
畳復号信号とから求められたスケーリング係数を、前記
雑音重畳信号に乗算してパワ調整を行う後処理手段を具
備する構成を採る。
【0020】この構成によれば、復号信号と擬似的な雑
音信号とを加算した後にスケーリングを行うため、加算
による復号信号のパワ増加を避けることが出来る。
【0021】本発明の音声復号化装置は、上記構成にお
いて、第2判定手段において定常雑音区間と判定された
場合にのみスケーリング係数を処理単位間で平滑化する
スケーリング手段を具備する構成を採る。
【0022】この構成によれば、定常雑音区間と判定さ
れた場合に、スケーリング係数を平滑化するので、定常
雑音が滑らかになり、定常雑音の主観的な品質を改善す
ることが出来る。
【0023】本発明の音声復号化装置は、上記構成にお
いて、後処理を行う際に使用する少なくとも1種類の第
3パラメータを保持する記憶手段と、現在の処理単位に
おいてフレーム消失が発生した際に、1つ前の処理単位
における第3パラメータを前記記憶手段から出力させる
制御手段と、を具備し、後処理手段は、前記1つ前の処
理単位における第3パラメータを用いて後処理を行う構
成を採る。
【0024】この構成によれば、フレーム消失が発生し
た場合であっても、1つ前の処理単位におけるパラメー
タを用いて後処理を行うので、復号信号の品質を向上さ
せることが出来る。
【0025】本発明の音声復号化装置は、上記構成にお
いて、第3パラメータは、少なくともスケーリング係数
を含み、後処理手段は、記憶手段から出力された1つ前
の処理単位におけるスケーリング係数を用いて後処理を
行う構成を採る。
【0026】この構成によれば、後処理結果のパワが大
きく変動しないようにスケーリング係数を算出し、復号
信号と擬似的な定常雑音信号との加算結果に、算出した
スケーリング係数を乗算して最終的な出力信号を生成す
る。これにより、最終的な出力信号のパワ変動を小さく
抑えて、フレーム消失前の定常雑音信号レベルを維持す
ることが出来るので、音切れ感による主観的品質の劣化
を抑えることが出来る。
【0027】本発明の音声復号化装置は、上記構成にお
いて、雑音生成手段は、固定符号帳からランダムに雑音
符号ベクトルを選択して雑音音源信号を生成する音源生
成手段と、線形予測係数に基づいて第2合成フィルタを
構成し、前記雑音音源信号により前記第2合成フィルタ
を駆動して擬似的な定常雑音信号を合成する第2合成手
段と、前記第2合成手段において合成された擬似的な定
常雑音信号の利得を調整する利得調整手段と、を具備す
る構成を採る。
【0028】この構成によれば、少ない演算量及び少な
いメモリ量で、信号の性質の面から最も有効と判断され
る雑音信号を生成することができる。
【0029】本発明の音声復号化装置は、上記構成にお
いて、後処理手段は、擬似的な定常雑音信号を生成する
雑音生成手段と、合成手段において生成した復号信号と
前記擬似的な雑音信号とを加算して雑音重畳復号信号を
生成する加算手段と、スケーリング係数を前記雑音重畳
復号信号に乗算してパワ調整を行うスケーリング手段
と、を具備する構成を採る。
【0030】この構成によれば、後処理結果のパワが大
きく変動しないようにスケーリング係数を算出し、復号
信号と擬似的な定常雑音信号との加算結果に、算出した
スケーリング係数を乗算して最終的な出力信号を生成す
る。これにより、最終的な出力信号のパワ変動を小さく
抑えて、フレーム消失前の定常雑音信号レベルを維持す
ることが出来るので、音切れ感による主観的品質の劣化
を抑えることが出来る。
【0031】本発明の音声復号化装置は、上記構成にお
いて、スケーリング手段は、合成手段において生成され
た復号信号と前記復号信号に擬似的な定常雑音信号を重
畳して得られる雑音重畳復号信号とに基づいてスケーリ
ング係数を算出するスケーリング係数算出手段と、前記
スケーリング係数を処理単位間で平滑化する第1平滑化
手段と、第1平滑化手段において平滑化したスケーリン
グ係数をサンプル間で平滑化する第2平滑化手段と、前
記第2平滑化手段において平滑化したスケーリング係数
を雑音重畳復号信号に乗算する乗算手段と、を具備する
構成を採る。
【0032】この構成によれば、フレーム間平滑化とサ
ンプル間平滑化を併用しているので、定常雑音がよりス
ムーズになり、主観的な定常雑音の品質を改善すること
ができる。
【0033】本発明の音声復号化方法は、音声信号のス
ペクトル包絡成分を表す少なくとも1種類の第1パラメ
ータを復号する工程と、音声信号の残差成分を表す少な
くとも1種類の第2パラメータを復号する工程と、前記
第1パラメータに基づいて合成フィルタを構成し、前記
第2パラメータに基づいて生成した駆動音源信号により
前記合成フィルタを駆動して復号信号を生成する工程
と、前記第1パラメータに基づいて前記復号信号の定常
雑音性を判定する工程と、前記第2パラメータに基づい
て前記復号信号の周期性を判定し、この周期性の判定結
果と前記定常雑音性の判定結果とに基づいて定常雑音区
間かどうかを判定する工程と、具備するようにした。
【0034】この方法によれば、復号信号の周期性も考
慮して定常雑音区間かどうかを判定するので、周期性の
ある定常信号と白色雑音的な定常雑音信号とを区別して
定常雑音区間かどうかを判定することが出来る。
【0035】本発明の音声復号化プログラムを記録した
記録媒体は、音声信号のスペクトル包絡成分を表す少な
くとも1種類の第1パラメータを復号し、音声信号の残
差成分を表す少なくとも1種類の第2パラメータを復号
し、前記第1パラメータに基づいて合成フィルタを構成
し、前記第2パラメータに基づいて生成した駆動音源信
号により前記合成フィルタを駆動して復号信号を生成
し、前記第1パラメータに基づいて前記復号信号の定常
雑音性を判定し、前記第2パラメータに基づいて前記復
号信号の周期性を判定し、前記周期性の判定結果と前記
定常雑音性の判定結果とに基づいて定常雑音区間かどう
かを判定する構成を採る。
【0036】この構成によれば、復号信号の周期性も考
慮して定常雑音区間かどうかを判定するので、周期性の
ある定常信号と白色雑音的な定常雑音信号とを区別して
定常雑音区間かどうかを判定することが出来る。
【0037】本発明の音声復号化プログラムは、音声信
号のスペクトル包絡成分を表す少なくとも1種類の第1
パラメータを復号する手順と、音声信号の残差成分を表
す少なくとも1種類の第2パラメータを復号する手順
と、前記第1パラメータに基づいて合成フィルタを構成
し、前記第2パラメータに基づいて生成した駆動音源信
号により前記合成フィルタを駆動して復号信号を生成す
る手順と、前記第1パラメータに基づいて前記復号信号
の定常雑音性を判定する手順と、前記第2パラメータに
基づいて前記復号信号の周期性を判定し、この周期性の
判定結果と前記定常雑音性の判定結果とに基づいて定常
雑音区間かどうかを判定する手順と、をコンピュータに
実行させる構成を採る。
【0038】この構成によれば、復号信号の周期性も考
慮して定常雑音区間かどうかを判定するので、周期性の
ある定常信号と白色雑音的な定常雑音信号とを区別して
定常雑音区間かどうかを判定することが出来る。
【0039】以下、本発明の実施形態について添付図面
を参照して説明する。 (実施の形態1)図1に本発明の実施の形態1に係る定
常雑音区間判定装置の構成を示す。
【0040】まず、図示しない符号器が、入力されたデ
ィジタル信号を用いてLPC(Linear Predictive Coeff
icient:線形予測計数)の分析・量子化とピッチ探索と
雑音符号帳探索とゲイン符号帳探索とを行い、LPC符
号(L)とピッチ周期(P)と雑音符号帳インデックス
(S)とゲイン符号帳インデックス(G)とを送信す
る。
【0041】符号受信装置100は、符号器から送信さ
れた符号化信号を受信し、受信信号からLPCを表現す
る符号Lと適応符号ベクトルを表現する符号Aとゲイン
情報を表現する符号Gと雑音符号ベクトルを表現する符
号Fを受信情報から分離する。分離された符号L、符号
A、符号G、及び符号Fは、それぞれ音声復号化装置1
01へ出力される。具体的には、符号LはLPC復号器
110に出力され、符号Aは適応符号帳111に出力さ
れ、符号Gは利得符号帳112に出力され、符号Fは固
定符号帳113に出力される。
【0042】LPC復号器110は、符号LからLPC
を復号し、合成フィルタ117に出力する。また、LP
C復号器110は、復号したLPCを補間特性の良いL
SP(Line Spectrum Pair:線スペクトル対)パラメー
タに変換し、このLSPを定常雑音区間検出装置102
に備えられたサブフレーム間変動算出器119、距離計
算器120、及び平均LSP算出器125のそれぞれに
出力する。
【0043】なお、一般的には符号LはLSPを符号化
したものである場合が多く、その場合LPC復号器はL
SPを復号化した後に復号LSPをLPCに変換する。
尚、LSPパラメータは音声信号のスペクトル包絡成分
を表すスペクトル包絡パラメータの例である。スペクト
ル包絡パラメータには、LSPパラメータの他にPAR
COR係数やLPC自身も含まれる。
【0044】まず、音声復号化装置101について説明
する。
【0045】音声復号化装置101に備えられた適応符
号帳111は、過去に生成した駆動音源信号を逐次更新
しながらバッファリングしており、入力した符号Aを復
号して得られる適応符号帳インデックス(ピッチ周期
(ピッチラグ))を用いて適応符号ベクトルを生成す
る。適応符号帳111にて生成された適応符号ベクトル
は、適応符号利得乗算器114で適応符号利得が乗じら
れた後に加算器116に出力される。また、適応符号帳
111にて得られたピッチ周期は定常雑音区間検出装置
102に備えられたピッチ履歴分析器122へ出力され
る。
【0046】利得符号帳112は、適応符号帳ゲインと
雑音符号帳ゲインのセット(ゲインベクトル)を予め定
められた個数だけ格納しており、入力した符号Gを復号
して得られるゲイン符号帳インデックスによって指定さ
れるゲインベクトルの適応符号帳ゲイン成分(適応符号
利得)を適応符号利得乗算器114および第2の判定器
124へ出力し、雑音符号帳ゲイン成分(雑音符号利
得)を雑音符号利得乗算器115に出力する。
【0047】固定符号帳113は、予め定められた個数
の形状の異なる雑音符号ベクトルを格納しており、入力
した符号Fを復号して得られる雑音符号帳インデックス
によって指定される雑音符号ベクトルを雑音符号利得乗
算器115へ出力する。雑音符号利得乗算器115は、
雑音符号ベクトルに雑音符号利得を乗算し、加算器11
6へ出力する。
【0048】加算器116は、適応符号利得乗算器11
4から入力される適応符号ベクトルと雑音符号利得乗算
器115から入力される雑音符号ベクトルとの加算を行
い、合成フィルタ117の駆動音源信号を生成し、合成
フィルタ117及び適応符号帳111へ出力する。
【0049】合成フィルタ117は、LPC復号器11
0から入力されたLPCを用いてLPC合成フィルタを
構築する。この合成フィルタ117に対して加算器11
6から入力される駆動音源信号を入力としてフィルタ処
理を行って復号音声信号を合成し、合成した復号音声信
号をポストフィルタ118へ出力する。
【0050】ポストフィルタ118は、合成フィルタ1
17によって合成されたポストフィルタ出力信号に対し
てホルマント強調やピッチ強調等の主観的品質を改善す
る処理を行う。これらの処理を施された音声信号は、音
声復号化装置101の最終的なポストフィルタ出力信号
として、定常雑音区間検出装置102に備えられたパワ
変化算出器123へ出力される。
【0051】上述した音声復号化装置101による復号
処理は、予め定められた時間長の処理単位(フレーム:
時間長にして数十ミリ秒程度)、またはフレームをさら
に短く分割した処理単位(サブフレーム)毎に行われる
ものとする。以下においては、サブフレーム毎に処理が
行われる場合について説明する。
【0052】次に、定常雑音区間検出装置102につい
て説明する。まず、定常雑音区間検出装置102に備え
られた第1の定常雑音区間検出部103について説明す
る。第1の定常雑音区間検出部103および第2の定常
雑音区間検出部104は、モード選択を行い、定常雑音
区間か音声信号区間かを判定する。
【0053】LPC復号器110から出力されたLSP
は、定常雑音区間検出装置102に備えられた第1の定
常雑音区間検出部103と定常雑音特徴抽出部105と
にそれぞれ入力される。第1の定常雑音区間検出部10
3に入力されたLSPは、サブフレーム間変動算出器1
19と距離計算器120とに入力される。
【0054】サブフレーム間変動算出器119は、直前
の(1つ前の)サブフレームからどれだけLSPが変化
したのかを計算する。具体的には、LPC復号器110
から入力されたLSPに基づいて、現在のサブフレーム
のLSPと直前のサブフレームのLSPとの差分を次数
毎に計算し、これらの差分の自乗和をサブフレーム間変
動量として第1の判定器121および第2の判定器12
4に出力する。
【0055】尚、LSPの変動量を算出するために用い
る情報はLSPそのものである必要はなく、LSPを時
間方向(サブフレーム方向)に平滑化したものを前記計
算に用いた方が、LSPの量子化誤差等のばらつきによ
る変動の影響を低減することが出来るので好ましい。こ
の平滑化が強いとサブフレーム間の変動に対する追随性
が悪くなるので、前記平滑化は弱めのものとする。例え
ば(式1)に示すように平滑化LSPを定義する場合、
kの値は0.7程度とするのが好ましい。 平滑化LSP[現在のサブフレーム] =k×LSP+(1−k)×平滑化LSP[直前のサブフレーム] …(式1) 距離計算器120は、平均LSP算出器125から入力
された過去の定常雑音区間における平均的なLSPとL
PC復号器110から入力された現在のサブフレームの
LSPとの距離を計算し、計算結果を第1の判定器12
1に出力する。距離計算器120は、平均的なLSPと
現在のサブフレームのLSPとの距離として、例えば、
平均LSP算出器125から入力された平均的なLSP
とLPC復号器110から入力された現在のサブフレー
ムのLSPとの差分を次数毎に計算し、これらの差分の
自乗和を出力する。尚、距離計算器120は、各次数毎
に計算したLSPの差分の自乗和に加えて、次数毎に計
算したLSPの差分自体を出力しても良い。さらに、こ
れらの値に加えて、次数毎に計算したLSPの差分の最
大値を出力しても良い。このように、第1の判定器12
1に多様な距離尺度を出力することにより、第1の判定
器121での判定精度を高めることができる。
【0056】第1の判定器121は、サブフレーム間変
動算出器119と距離計算器120とから入力された情
報を基に、LSPのサブフレーム間における変動の大小
と、現在のサブフレームのLSPと定常雑音区間の平均
的LSPとの類似性(距離)と、を判定する。具体的に
は、これらの判定は閾値処理によって行なわれる。LS
Pのサブフレーム間における変動が小さく、かつ、現在
のサブフレームのLSPが定常雑音区間の平均的LSP
と似ている(距離が小さい)と判断される場合に、現在
のサブフレームは定常雑音区間であると判定する。判定
結果(第1の判定結果)は、第2の判定器124へ出力
される。
【0057】このように、第1の判定器121では、現
在のサブフレームが定常雑音区間かどうかが仮に判定さ
れる。この判定は、1つ前のサブフレームと今回のサブ
フレームとの間でのLSPの変動量に基づいて現在のサ
ブフレームの定常性を判定し、さらに、平均LSPと現
在のサブフレームのLSPとの距離に基づいて現在のサ
ブフレームの雑音性を判定することにより行われる。
【0058】しかし、このLSPに基づく判定のみで
は、定常母音や正弦波等の周期性のある定常信号を誤っ
て雑音信号と判定してしまうことがある。そこで、以下
に説明する第2の定常雑音区間検出部104に備えられ
た第2の判定器124は、現在のサブフレームの周期性
を分析して、その分析結果に応じて定常雑音区間かどう
かを判定する。すなわち、第2の判定器124は、周期
性が強い信号は、定常母音等である(雑音ではない)可
能性が高いので、定常雑音区間ではないと判断する。
【0059】次いで、第2の定常雑音区間検出部104
について説明する。
【0060】ピッチ履歴分析器122は、適応符号帳か
ら入力されたピッチ周期のサブフレーム間でのばらつき
を分析する。具体的には、ピッチ履歴分析器122は、
適応符号帳111から入力されたピッチ周期を、予め定
められたサブフレーム数(例えば10サブフレーム)分
だけバッファリングし、このバッファリングしたピッチ
周期(現在を含めた過去10サブフレーム分のピッチ周
期)を図10に示すような方法でグルーピングする。
【0061】グルーピングについて、現在のフレームを
含めた過去10サブフレーム分のピッチ周期をグルーピ
ングする場合を例に説明する。図10は、グルーピング
を行う手順について説明するフロー図である。まず、S
T1001においてピッチ周期のクラス分けを行う。具
体的には、同じ値のピッチ周期を同じクラスとして扱
う。つまり、全く同じ値のピッチ周期を同じクラスに分
類し、少しでもピッチ周期の値が異なれば、異なるクラ
スに分類する。
【0062】次に、ST1002において、分類された
クラスのうち、ピッチ周期の値が近いクラスを同じ1つ
のグループにまとめるグループ分けを行う。例えば、差
が1以内のピッチ周期が1つのグループに分けられる。
このグループ分けを行う際に、ピッチ周期の差が1であ
るクラスが5クラス(例えばピッチ周期が30,31,
32,33,34であるクラス)存在する場合、これら
5クラスを1グループにまとめてしまっても良い。
【0063】次に、ST1003で、前記グループ分け
の結果、現在のサブフレームを含む過去10サブフレー
ムにおけるピッチ周期が何グループに分けられたかを示
す分析結果を出力する。この分析結果の示すグループ数
が少ないほど(1グループに近いほど)、復号した音声
信号は周期的である可能性が高く、反対にグループ数が
多いほど周期的でない可能性が高くなる。したがって、
復号した音声信号が定常的である場合に、この分析結果
を周期的定常信号性(定常信号の周期性)を示すパラメ
ータとして用いることが可能である。
【0064】パワ変化算出器123には、ポストフィル
タ118から入力されたポストフィルタ出力信号と、平
均雑音パワ算出器126から入力された定常雑音区間の
平均パワ情報とが入力される。パワ変化算出器123
は、ポストフィルタ118から入力されたポストフィル
タ出力信号のパワを求め、求めたポストフィルタ出力信
号のパワと定常雑音区間の平均パワとの比(パワ比)を
計算する。
【0065】このパワ比は、第2の判定器124および
平均雑音パワ算出器126へ出力される。平均雑音パワ
算出器126へは、ポストフィルタ出力信号のパワ情報
も出力される。定常雑音区間の平均パワに比べてポスト
フィルタ118から出力されたポストフィルタ出力信号
のパワ(現在の信号パワ)が大きければ音声区間である
可能性がある。この定常雑音区間の平均パワおよびポス
トフィルタ118から出力されたポストフィルタ出力信
号のパワは、他のパラメータで検出できない音声の立ち
上がり部などを検出するためのパラメータとして用いる
ことが出来る。尚、パワ変化算出器123は、ポストフ
ィルタ出力信号のパワと定常雑音区間の平均パワとの比
に代えて、これらのパワの差を計算してパラメータとし
て用いても良い。
【0066】上述したように、第2の判定器124に
は、ピッチ履歴分析器122におけるピッチ履歴分析結
果(過去のピッチ周期が分類されたグループ数を示す情
報)、および利得符号帳112において得られた適応符
号利得が、それぞれ入力される。第2の判定器124
は、これらの入力情報を用いてポストフィルタ出力信号
の周期性を判定する。また、第2の判定器124には、
第1の判定器121における第1の判定結果、パワ変化
算出器123において算出された定常雑音区間の平均パ
ワと現在のサブフレームのパワとの比、およびサブフレ
ーム間変動算出器119において計算されたLSPのサ
ブフレーム間変動量も入力され、第2の判定器124
は、これらの入力情報と第1の判定結果と、上述した周
期性の判断結果とに基づいて定常雑音区間かどうかを判
定し、判定結果を後段の処理装置に出力する。判定結果
は、平均LSP算出器125および平均雑音パワ算出器
126にも出力される。
【0067】なお、符号受信装置100、音声復号化装
置101、または定常雑音区間検出装置102のいずれ
かに、受信した符号に含まれる有声定常状態かどうかを
示す情報を復号して、その有声定常状態かどうかを示す
情報を、第2の判定器124に出力する復号部を備えて
も良い。
【0068】次いで、定常雑音特徴抽出部105につい
て説明する。平均LSP算出器125には、第2の判定
器124から判定結果が、音声復号化装置101(より
正確にはLPC復号器110)から現在のサブフレーム
のLSPが、それぞれ入力される。平均LSP算出器1
25は、前記判定結果が定常雑音区間であるという判定
の場合のみ、入力した現在のサブフレームのLSPを用
いて定常雑音区間における平均LSPの更新を行う。平
均LSPは例えばAR型の平滑化式によって更新され
る。更新された平均LSPは距離計算器120へ出力さ
れる。
【0069】平均雑音パワ算出器126には、第2の判
定器124から判定結果が、パワ変化算出器123から
ポストフィルタ出力信号のパワおよびパワ比(ポストフ
ィルタ出力信号のパワ/定常雑音区間の平均パワ)が、
それぞれ入力される。平均雑音パワ算出器126は、第
2の判定器124からの判定結果が定常雑音区間である
という判定の場合と(定常雑音区間ではないが)パワ比
が所定の閾値より小さい場合(定常雑音区間の平均パワ
よりも現在のサブフレームのポストフィルタ出力信号パ
ワの方が小さい場合)に、入力したポストフィルタ出力
信号パワを用いて定常雑音区間の平均パワ(平均雑音パ
ワ)の更新を行う。平均雑音パワは、例えばAR型の平
滑化式によって更新される。この場合、前記パワ比が小
さいほど平滑化を弱くする(現在のサブフレームのポス
トフィルタ出力信号パワが反映されやすくする)制御を
加えることにより、音声区間で急激に背景雑音レベルが
低下した場合でも速やかに平均雑音パワのレベルを下げ
ることが可能となる。更新された平均雑音パワはパワ変
化算出器123へ出力される。
【0070】上記構成において、LPC、LSP、およ
び平均LSPはいずれも音声信号のスペクトル包絡成分
を表すパラメータであり、適応符号ベクトル、雑音符号
ベクトル、適応符号利得、および雑音符号利得はいずれ
も音声信号の残差成分を表すパラメータである。尚、ス
ペクトル包絡成分を表すパラメータおよび残差成分を表
すパラメータは上述したものに限定されない。
【0071】次に、図11及び図12を参照して、第1
の判定器121、第2の判定器124、および定常雑音
特徴抽出部105における処理の手順について説明す
る。図11及び図12に示すST1101〜ST110
7の処理は主に第1の定常雑音区間検出部103により
行われ、ST1108〜ST1117の処理は主に第2
の定常雑音区間検出部104により行われ、ST111
8〜ST1120の処理は主に定常雑音特徴抽出部10
5において行われる。
【0072】まずST1101において、現在のサブフ
レームのLSPが算出され、算出されたLSPが前述し
た(式1)に示すように平滑化される。次に、ST11
02において、現在のサブフレームのLSPと1つ前の
(直前の)サブフレームのLSPとの差分(変動量)が
算出される。これらのST1101およびST1102
における処理は前述したサブフレーム間変動算出器11
9において行われる。
【0073】サブフレーム間変動算出器119における
LSPの変動量の算出方法の一例を(式1')、(式
2)、及び(式3)に示す。(式1')は現在のサブフ
レームにおけるLSPを平滑化する式であり、(式2)
は平滑化したLSPのサブフレーム間差分を二乗和の形
で算出する式であり、(式3)はLSPのサブフレーム
間差分の二乗和をさらに平滑化する式である。なお、L'
i(t)はt番目のサブフレームにおけるi次の平滑化LSP
パラメータ、Li(t)はt番目のサブフレームにおけるi次
のLSPパラメータ、DL(t)はt番目のサブフレームにお
けるLSP変動量(サブフレーム間差分二乗和)、DL'
(t)はt番目のサブフレームにおけるLSP変動量(平滑
化したサブフレーム間差分二乗和)、pはLSP(LP
C)分析次数、をそれぞれ示す。この例では、サブフレ
ーム間変動算出器119が、(式1')、(式2)、及
び(式3)を用いてDL'(t)を求め、得られたDL'(t)がL
SPのサブフレーム間変動量としてモード判定に用いら
れる。
【数1】
【数2】
【数3】 次に、ST1103において、距離計算器120により
現在のサブフレームにおけるLSPと過去の雑音区間の
平均LSPとの距離が算出される。距離計算器120に
おける、距離計算の具体例を(式4)および(式5)に
示す。(式4)は過去の雑音区間における平均的なLS
Pと現在のサブフレームにおけるLSPとの距離を全次
数の差分の二乗和で定義したものであり、(式5)は最
も差の大きかった次数のみの差分の二乗値で定義したも
のである。なお、LNiは過去の雑音区間における平均的
なLSPであり、雑音区間において例えば(式6)を用
いてサブフレーム毎に更新される。この例では、距離計
算器120が、(式4)、(式5)、及び(式6)を用
いてD(t)とDX(t)を求め、得られたD(t)とDX(t)が定常雑
音区間のLSPとの距離情報としてモード判定に用いら
れる。
【数4】
【数5】
【数6】 次に、ST1104において、パワ変化算出器123に
よりポストフィルタ出力信号(ポストフィルタ118の
出力信号)のパワが算出される。パワの算出は前述のパ
ワ変化算出器123内で行われ、具体的には例えば(式
7)を用いてパワが求められる。(式7)において、S
(i)はポストフィルタ出力信号であり、Nはサブフレーム
長である。尚、ST1104におけるパワ算出は、図1
に示す第2の定常雑音区間検出部104に備えられたパ
ワ変化算出器123で行われるので、ST1108より
も前に行われれば良く、パワ算出のタイミングはST1
104の位置に限定されない。
【数7】 次に、ST1105において、復号信号の定常雑音性に
ついて判定が行われる。具体的には、ST1102にて
算出された変動量が小さく、かつ、ST1103にて算
出された距離が小さいかどうかが判定される。すなわ
ち、ST1102で算出された変動量およびST110
3で算出された距離について夫々閾値を設定し、ST1
102で算出された変動量が設定された閾値よりも小さ
く、かつ、ST1103で算出された距離も設定された
閾値より小さい場合には定常雑音性が高いと判定されて
ST1107に移行する。
【0074】例えば前述のDL'、D、DXについては、LS
Pが0.0〜1.0の範囲内に正規化されている場合、以下の
ような閾値を用いることによって精度良く判定を行うこ
とが出来る。 DLに対する閾値:0.0004 Dに対する閾値:0.003+D' DXに対する閾値:0.0015 なお、D'は雑音区間におけるDの平均的な値であり、例
えば雑音区間において(式8)の様にして算出される。
【数8】 なお、過去の雑音区間の平均的なLSPであるLNiは、
ある程度十分な(例えば20サブフレーム程度の)時間
の雑音区間がないと十分信頼できる値とならないため、
過去の雑音区間が予め定めた時間長(例えば20サブフ
レーム)以下の場合には、前記DおよびDXは、ST11
05における定常雑音性の判定に用いない。
【0075】ST1107では、現在のサブフレームが
定常雑音区間であると判定され、ST1108に移行す
る。一方、ST1102で算出された変動量またはST
1103で算出された距離のいずれかが設定された閾値
よりも大きい場合には定常性が低いと判定されてST1
106に移行する。ST1106においては、現在のサ
ブフレームが定常雑音区間でない(すなわち音声区間で
ある)と判定され、ST1110に移行する。
【0076】次に、ST1108において、過去の定常
雑音区間の平均パワに比べて現在のサブフレームにおけ
るパワが大きいかどうかが判定される。具体的には、例
えば、パワ変化算出器123の出力結果(ポストフィル
タ出力信号のパワと定常雑音区間の平均パワとの比)に
ついて閾値を設定し、ポストフィルタ出力信号のパワと
定常雑音区間の平均パワとの比が設定した閾値よりも大
きい場合にはST1109に移行し、ST1109にお
いて、現在のサブフレームは音声区間であると判定が修
正される。
【0077】閾値の具体的な値としては、2.0((式
7)を用いて求められるポストフィルタ出力信号のパワ
Pが、雑音区間で求められる定常雑音区間の平均パワPN'
の2倍を越えるような場合にST1109へ移行する。
平均パワPN'は例えば(式9)を用いて定常雑音区間の
サブフレーム毎に更新される)を用いることにより、精
度良く判定を行うことができる。
【数9】 一方、前記パワ変化が設定した閾値よりも小さい場合
は、ST1112に移行する。この場合、ST1107
における判定結果は修正されず、定常雑音区間と判定さ
れたままである。
【0078】次に、ST1110において、定常的な状
態がどれだけ続いているかのチェックと、その定常状態
が有声定常状態であるかがチェックされる。そして、現
在のサブフレームが有声定常状態ではなく、かつ、所定
の時間長だけ定常的な状態が続いている場合にはST1
111に移行し、ST1111において定常雑音区間で
あると判定しなおされる。具体的には、まず、定常的な
状態であるかどうかが、サブフレーム間変動算出器11
9の出力(サブフレーム間変動量)を用いて判断され
る。
【0079】つまり、ST1102で求められたサブフ
レーム間変動量が小さければ(所定の閾値(例えばST
1105で用いた閾値と同じ値)以下であれば)定常的
な状態であると判断される。そして、定常的な状態であ
ると判断された場合は、その状態が過去どれだけの時間
長に渡って続いているかがチェックされる。また、有声
定常状態であるかのチェックは、音声復号化装置101
または定常雑音区間検出装置102から提供される、有
声定常状態かどうかを示す情報に基づいて行われる。
【0080】例えば、伝送されてきた符号情報に前記情
報がモード情報として含まれている場合は、復号したモ
ード情報を利用して有声定常状態かどうかチェックす
る。そうでない場合は、定常雑音区間検出装置102に
備えられた有声定常性を判定する手段が前記情報を出力
し、その情報によって有声定常状態かどうかをチェック
する。上述したチェックの結果、所定の時間長以上(例
えば20サブフレーム以上)定常的な状態が続き、か
つ、有声定常状態でない場合には、ST1108でパワ
変化が大きいと判断された場合であっても、ST111
1において定常雑音区間であると判定しなおされ、ST
1112に移行する。逆に、ST1110の判定結果が
Noの場合(有声定常区間である場合や、定常的な状態
が定められた時間長だけ続いていない場合)は、音声区
間であるという判定が維持され、ST1114に移行す
る。
【0081】次に、ここまでの過程で定常雑音区間であ
ると判定されている場合は、ST1112において、復
号信号の周期性が高いかどうか判定される。具体的に
は、第2の判定器124により、音声復号化装置101
(より正確には利得符号帳112)から入力された適応
符号利得、およびピッチ履歴分析器122から入力され
たピッチ履歴分析結果に基づいて現在のサブフレームに
おける復号信号の周期性が判定される。この場合、適応
符号利得には、サブフレーム間の変動を滑らかにするた
めにAR型の平滑化処理を行った値を用いることが好ま
しい。
【0082】この周期性の判定は、例えば、平滑化処理
を行った適応符号利得(平滑化適応符号利得)について
閾値を設定し、平滑化適応符号利得が所定の閾値を越え
ている場合には、周期性が高いと判定してST1113
に移行する。ST1113においては、音声区間である
と判定しなおされる。
【0083】また、ピッチ履歴分析結果において過去の
サブフレームにおけるピッチ周期が分類されているグル
ープ数が少ないほど周期的な信号が続いている可能性が
高いので、このグループ数を基にして周期性を判定す
る。例えば、過去10サブフレームのピッチ周期が3種
類以下のグループに分類されている場合は、周期的な信
号が続いている区間である可能性が高いためST111
3に移行し、音声区間である(定常雑音区間でない)と
判定しなおす。
【0084】ST1112の判定結果がNoである場合
(平滑化適応符号利得が所定の閾値よりも小さく、か
つ、ピッチ履歴分析結果において過去のピッチ周期が多
くのグループに分類されている場合)は、定常雑音区間
であるという判定結果が維持されたまま、ST1115
に移行する。
【0085】次に、ここまでの過程で判定結果が音声区
間である場合は、ST1114に移行してハングオーバ
カウンタを所定のハングオーバサブフレーム数(例えば
10)にセットする。ハングオーバカウンタには、初期
値としてハングオーバサブフレーム数が設定され、上述
したST1101〜ST1113までの処理によって定
常雑音区間であると判定された場合に1ずつデクリメン
トされる。そして、ハングオーバカウンタが「0」の場
合、本定常雑音区間判定方法において、最終的に定常雑
音区間と判定される。
【0086】ここまでの過程で判定結果が定常雑音区間
である場合、ST1115に移行して、ハングオーバカ
ウンタがハングオーバ区間(「1」〜「ハングオーバサ
ブフレーム数」)内であるかどうかのチェックが行なわ
れる。つまり、ハングオーバカウンタが「0」かどうか
がチェックされる。ハングオーバ区間内である場合(ハ
ングオーバカウンタが「1」〜「ハングオーバサブフレ
ーム数」である場合)には、ST1116に移行して音
声区間であると判定結果を修正し、ST1117に移行
する。そして、ST1117においてハングオーバカウ
ンタを1だけデクリメントする。ハングオーバ区間内で
ない場合(ハングオーバカウンタが「0」である場合)
には、定常雑音区間であるという判定結果を維持したま
まST1118に移行する。
【0087】次に、判定結果が定常雑音区間である場合
には、ST1118において、平均LSP算出器125
により定常雑音区間における平均LSPが更新される。
この更新は、例えば判定結果が定常雑音区間であれば
(式6)によって行われ、そうでなければ更新せずに以
前の値を保持するように行われる。なお、過去定常雑音
区間と判定された時間長が短い場合は(式6)の平滑化
係数0.95を小さくしても良い。
【0088】次に、ST1119において、平均雑音パ
ワ算出器126により平均雑音パワが更新される。この
更新は、例えば判定結果が定常雑音区間であれば(式
9)によって行われ、そうでなければ更新せずに以前の
値を保持するように行われる。ただし、判定結果が定常
雑音区間でなくても平均雑音パワよりも現在のポストフ
ィルタ出力信号パワの方が小さくなっている場合は、
(式9)の平滑化係数0.9を小さくした式を用いて平均
雑音パワの更新を行い、平均雑音パワを下げる。このよ
うな更新を行うことによって、音声区間中で急に背景雑
音レベルが下がった場合にも対応できるようにすること
ができる。
【0089】最後に、ST1120において、第2の判
定器124により判定結果が出力され、平均LSP算出
器125により更新した平均LSPが出力され、平均雑
音パワ算出器126により更新された平均雑音パワが出
力される。
【0090】以上説明したように、本実施の形態によれ
ば、LSPを用いた定常性の判定により定常雑音区間で
あると判断された場合であっても、適応符号利得および
ピッチ周期を用いて現在のサブフレームの周期性の強さ
を検査(判定)し、この周期性の強さに基づいて定常雑
音区間かどうかを再チェックする。したがって、正弦波
や定常母音のように定常だが雑音的でない信号について
も、正しく判定することが出来る。
【0091】(実施の形態2)図2に、本発明の実施の
形態2に係る定常雑音後処理装置の構成を示す。図2に
おいて、図1に示す部分と同じ部分については、図1と
同じ符号を付してその詳細な説明は省略する。
【0092】定常雑音後処理装置200は、雑音生成部
201と加算器202とスケーリング部203とを含ん
で構成される。この定常雑音後処理装置200は、雑音
生成部201で生成された擬似的な定常雑音信号を加算
器202において音声復号化装置101からのポストフ
ィルタ出力信号に加算し、加算後のポストフィルタ出力
信号をスケーリング部203においてスケーリングする
ことによりパワ調整し、後処理後のポストフィルタ出力
信号を出力する。
【0093】雑音生成部201は、音源生成器210
と、合成フィルタ211と、LSP/LPC変換器21
2と、乗算器213と、乗算器214と、利得調整器2
15と、を含んで構成される。スケーリング部203
は、スケーリング係数算出器216と、サブフレーム間
平滑化器217と、サンプル間平滑化器218と、乗算
器219と、を含んで構成される。
【0094】次いで、上記構成の定常雑音後処理装置2
00の動作について説明する。音源生成器210は、音
声復号化装置101に備えられた固定符号帳113から
ランダムに雑音符号ベクトルを選択し、選択した雑音符
号ベクトルに基づいて雑音音源信号を生成して合成フィ
ルタ211へ出力する。雑音音源信号の生成方法は、音
声復号化装置101に備えられた固定符号帳113から
選択した雑音符号ベクトルに基づいて生成する方法に限
定されず、演算量、メモリ量、および生成される雑音信
号の性質の面から最も有効と判断される方法をシステム
ごとに決めて用いることができる。音声復号化装置10
1に備えられた固定符号帳113から雑音符号ベクトル
を選択して使用することは、一般的には最も有効な方法
である。LSP/LPC変換器212は、平均LSP算
出器125からの平均LSPをLPCに変換して合成フ
ィルタ211へ出力する。
【0095】合成フィルタ211は、LSP/LPC変
換器212から入力されたLPCを用いてLPC合成フ
ィルタを構築する。合成フィルタ211は、音源生成器
210から入力される雑音音源信号を入力としてフィル
タ処理を行って雑音信号を合成し、合成した雑音信号を
乗算器213および利得調整器215へ出力する。
【0096】利得調整器215は、合成フィルタ211
の出力信号のパワを、平均雑音パワ算出器126からの
平均雑音パワにスケーリングするための利得調整係数を
算出する。この利得調整係数は、サブフレームの間で滑
らかな連続性が保たれるように平滑化処理が行なわれ、
サブフレーム内でも滑らかな連続性が保たれるようにサ
ンプル毎の平滑化処理も行なわれる。最終的にサンプル
毎の利得調整係数が乗算器213へ出力される。具体的
には(式10)から(式12)のようにして利得調整係
数が求められる。Psnは合成フィルタ211によって合
成された雑音信号のパワ((式7)と同様にして求めら
れる)で、Psn'はPsnをサブフレーム間で平滑化したも
のであり、(式10)を用いて更新される。PN'は(式
9)で求められる定常雑音信号パワであり、Sclは処理
サブフレームにおけるスケーリング係数である。Scl'
は、サンプル毎に適用される利得調整係数であり、サン
プル毎に(式12)を用いて更新される。 Psn'=0.9×Psn'+0.1×Psn (式10) Scl=PN'/Psn' (式11) Scl'=0.85×Scl'+0.15×Scl (式12)
【0097】乗算器213は、利得調整器215から入
力される利得調整係数を、合成フィルタ211から出力
される雑音信号に乗算する。なお、利得調整係数は1サ
ンプル毎に可変である。この乗算結果は、乗算器214
に出力される。
【0098】乗算器214は、生成する雑音信号の絶対
的なレベルを調整するために、予め定められた定数(例
えば0.5程度)を乗算器213からの出力信号に乗算す
る。乗算器214は、乗算器213の中に組み込んでし
まっても良い。レベル調整された信号(定常雑音信号)
は、加算器202へ出力される。以上のようにして、滑
らかな連続性の保たれた定常雑音信号が生成される。
【0099】加算器202は、雑音生成部201で生成
された定常雑音信号を、音声復号化装置101(より正
確にはポストフィルタ118)から出力されたポストフ
ィルタ出力信号に加算し、スケーリング部203(より
正確にはスケーリング計数算出器216および乗算器2
19)へ出力する。
【0100】スケーリング係数算出器216は、音声復
号化装置101(より正確にはポストフィルタ118)
から出力されたポストフィルタ出力信号のパワと、加算
器202から出力された定常雑音信号加算後のポストフ
ィルタ出力信号のパワとをそれぞれ算出し、両者の比を
取ることにより、スケーリング後の信号パワの前記復号
信号(定常雑音加算前)のパワからの変動を小さくする
スケーリング係数を算出し、サブフレーム間平滑化器2
17へ出力する。具体的には、スケーリング係数SCALE
は(式13)の様にして求められる。Pはポストフィル
タ出力信号パワで(式7)で求められ、P'はポストフィ
ルタ出力信号に定常雑音信号を加算した信号のパワでP
と同様の式で求められる。 SCALE=P/P' (式13)
【0101】サブフレーム間平滑化器217は、スケー
リング係数がサブフレーム間で緩やかに変化するように
サブフレーム間で平滑化処理を行う。ただし、平滑化処
理によって音声信号自身のパワ変動が滑らかにされてパ
ワ変動に対する追従性が悪くなってしまうことを避ける
ため、音声区間ではこの平滑化は行わない(もしくは極
めて弱い平滑化とする)。音声区間かどうかは、図1に
示す第2の判定器124から出力される判定結果に基づ
いて判断する。平滑化されたスケーリング係数はサンプ
ル間平滑化器218へ出力される。平滑化されたスケー
リング係数SCALE'は(式14)によって更新される。 SCALE'=0.9×SCALE'+0.1×SCALE (式14)
【0102】サンプル間平滑化器218は、サブフレー
ム間で平滑化されたスケーリング係数がサンプル間で緩
やかに変化するようにサンプル間で平滑化処理を行う。
この平滑化処理は、AR型の平滑化処理により行うこと
が出来る。具体的には、サンプル毎の平滑化スケーリン
グ係数SCALE''は(式15)によって更新される。 SCALE''=0.85×SCALE''+0.15×SCALE' (式15) このように、スケーリング係数に対してサンプル間で平
滑化処理を行って、サンプル毎に徐々にスケーリング係
数を変化させることにより、スケーリング係数がサブフ
レーム境界付近で不連続となることを防ぐことが出来
る。サンプル毎に算出されたスケーリング係数は、乗算
器219へ出力される。
【0103】乗算器219は、サンプル間平滑化器21
8から出力されたスケーリング係数を、加算器202か
ら入力された定常雑音信号付加後のポストフィルタ出力
信号に乗算し、最終出力信号として出力する。
【0104】上記構成において、平均雑音パワ算出器1
26から出力される平均雑音パワ、LSP/LPC変換
器212から出力されるLPC、およびスケーリング係
数算出器216から出力されるスケーリング係数は、い
ずれも後処理を行う際に使用するパラメータである。
【0105】このように、本実施の形態によれば、雑音
生成部201により生成された雑音が復号信号(ポスト
フィルタ出力信号)に加算された後に、スケーリング部
203においてスケーリングが行なわれる。これによ
り、加算後の復号信号パワをスケーリングするので、加
算後の復号信号パワを加算前の復号信号パワと同程度の
レベルにすることが出来る。また、フレーム間平滑化と
サンプル間平滑化を併用しているので、定常雑音がより
スムーズになり、主観的な定常雑音の品質を改善するこ
とが可能となる。
【0106】(実施の形態3)図3に、本発明の実施の
形態3に係る定常雑音後処理装置の構成を示す。図3に
おいて、図2に示す部分と同じ部分については、図2と
同じ符号を付してその詳細な説明は省略する。
【0107】本装置は、実施の形態2に示した定常雑音
後処理装置200の構成に加えて、フレーム消失時に雑
音信号の生成やスケーリングに必要となるパラメータを
保持するメモリと、そのメモリの保持内容を制御するフ
レーム消失補償処理制御部と、そのフレーム消失補償処
理の際に用いられる切替スイッチと、をさらに備えて構
成される。
【0108】定常雑音後処理装置300は、雑音生成部
301と、加算器202と、スケーリング部303と、
フレーム消失補償処理制御部304と、を含んで構成さ
れる。
【0109】雑音生成部301は、図2に示した雑音生
成部201の構成に加えて、フレーム消失時に雑音信号
の生成やスケーリングに必要となるパラメータを保持す
るメモリ310、311と、フレーム消失補償処理の際
に開閉する切替スイッチ313、314と、を含んで構
成される。また、スケーリング部303は、フレーム消
失時の雑音信号の生成やスケーリングに必要となるパラ
メータを保持するメモリ312と、フレーム消失補償処
理の際に開閉する切替スイッチ315と、を含んで構成
される。
【0110】次いで、上記定常雑音後処理装置300の
動作について説明する。まず、雑音生成部301の動作
について説明する。
【0111】メモリ310は、平均雑音パワ算出器12
6から切替スイッチ313を介して出力される、定常雑
音信号のパワ(平均雑音パワ)を保持し、これを利得調
整器215へ出力する。
【0112】切替スイッチ313は、フレーム消失補償
処理制御部304からの制御信号によって開閉する。具
体的には、フレーム消失補償処理を行う旨を示す制御信
号が入力された場合は開放され、それ以外の場合は閉じ
ている。切り替えスイッチ313が開放された場合、メ
モリ310は直前のサブフレームにおける定常雑音信号
のパワを保持しており、次に切替スイッチ313が閉じ
るまでその直前のサブフレームにおける定常雑音信号の
パワが必要に応じて利得調整器215へ出力される。
【0113】メモリ311は、LSP/LPC変換器2
12から切替スイッチ314を介して出力される、定常
雑音信号のLPCを保持し、これを合成フィルタ211
へ出力する。
【0114】切替スイッチ314は、フレーム消失補償
処理制御部304からの制御信号によって開閉する。具
体的には、フレーム消失補償処理を行う旨を示す制御信
号が入力された場合は開放され、それ以外の場合は閉じ
ている。切替スイッチ314が開放された場合、メモリ
311は直前のサブフレームにおける定常雑音信号のL
PCを保持しており、次に切替スイッチ314が閉じる
までその直前のサブフレームにおける定常雑音信号のL
PCが必要に応じて合成フィルタ211へ出力される。
【0115】次いで、スケーリング部303の動作につ
いて説明する。メモリ312は、スケーリング係数算出
器216によって算出され、切替スイッチ315を介し
て出力される、スケーリング係数を保持し、これをサブ
フレーム間平滑化器217に出力する。
【0116】切替スイッチ315は、フレーム消失補償
処理制御部304からの信号によって開閉する。具体的
には、フレーム消失補償処理を行う旨を示す制御信号が
入力された場合は開放され、それ以外の場合は閉じてい
る。切替スイッチ315が開放された場合、メモリ31
2は直前のサブフレームにおけるスケーリング係数を保
持しており、次に切替スイッチ315が閉じるまで直前
のサブフレームにおけるスケーリング係数が必要に応じ
てサブフレーム間平滑化器217へ出力される。
【0117】フレーム消失補償処理制御部304は、誤
り検出などにより得られたフレーム消失情報を入力とし
て、消失フレーム中のサブフレーム、および消失フレー
ムの後の誤りから復帰したサブフレーム(誤り復帰サブ
フレーム)において、フレーム消失補償処理を行う旨を
示す制御信号を切替スイッチ313〜315へ送る。こ
の誤り復帰サブフレームにおけるフレーム消失補償処理
は、複数のサブフレーム(例えば2サブフレーム)にお
いて行われる場合がある。フレーム消失補償処理とは、
消失フレームより前の(過去の)フレームの情報を用い
て、パラメータの補間や音量の制御を施すことにより、
一部のサブフレームにおいて情報が欠落した場合に、復
号結果の品質の劣化を防止する処理である。尚、消失フ
レームの後の誤り復帰サブフレームにおいて極端なパワ
の減衰が全く起こらない場合は、前述のような誤り復帰
サブフレームにおけるフレーム消失補償処理は不要とな
る。
【0118】一般的に用いられるフレーム消失補償法で
は、過去の情報を用いて現フレームの外挿処理を行う。
この場合、外挿したデータは主観的品質を落とす要因と
なるので、徐々に信号パワを減衰させる。しかしなが
ら、定常雑音区間においてフレームが消失した場合、外
挿による歪が与える主観的品質の劣化よりも、パワの減
衰による音切れ感が与える主観的品質の劣化の方が大き
くなることがしばしばある。特にインターネット通信に
代表されるパケット通信ではフレームが連続して消失す
ることがあり、このような音切れによる劣化は著しくな
る傾向がある。このような音切れ感が原因となる品質劣
化を抑えるために、本発明に係る定常雑音後処理装置に
おいては、利得調整器215において、平均雑音パワ算
出器126からの平均雑音パワにスケーリングするため
の利得調整係数を算出して定常雑音信号に乗算する。ま
た、スケーリング係数算出器216において、ポストフ
ィルタ出力信号が加算された定常雑音信号のパワが大き
く変動しないようにスケーリング係数を算出し、このス
ケーリング係数を乗算した信号を最終的な出力信号とし
て出力する。これにより、最終的な出力信号のパワの変
動を小さく抑えて、フレーム消失前の定常雑音信号レベ
ルを維持することが出来るので、音切れ感による主観的
品質の劣化を抑えることが出来る。
【0119】(実施の形態4)図4は、本発明の実施の
形態4に係る音声復号化処理システムの構成を示す図で
ある。この音声復号化処理システムは、実施の形態1に
おいて説明した符号受信装置100、音声復号化装置1
01、および定常雑音区間検出装置102と、実施の形
態3において説明した定常雑音処理装置300と、を備
えて構成される。尚、この音声復号化処理システムは、
定常雑音処理装置300に代えて実施の形態2において
説明した定常雑音処理装置200を備えるようにしても
良い。
【0120】以下、上記音声復号化処理システムの動作
について説明する。各構成要素の詳しい説明は、実施の
形態1〜実施の形態3において図1〜図3を用いて行っ
たので、図4において図1〜図3に示す部分と同じ部分
には、図1〜図3の対応部分と同じ符号を付してその詳
細な説明は省略する。
【0121】符号受信装置100は符号化信号を伝送路
から受信し、各種パラメータを分離して音声復号化装置
101へ出力する。音声復号化装置101は、各種パラ
メータから音声信号を復号し、ポストフィルタ出力信号
とその他復号処理の途中で得られた必要なパラメータを
定常雑音区間検出装置102および定常雑音後処理装置
300へ出力する。定常雑音区間検出装置102は、音
声復号化装置101から入力される情報を用いて定常雑
音区間かどうかの判定を行い、判定結果と判定処理の途
中で得られた必要なパラメータを定常雑音後処理装置3
00へ出力する。
【0122】定常雑音後処理装置300は、音声復号化
装置101から入力したポストフィルタ出力信号に対し
て、音声復号化装置101から入力した各種パラメータ
情報と定常雑音区間検出装置102から入力した判定情
報および各種パラメータ情報とを用いて、定常雑音信号
を生成してポストフィルタ出力信号に重畳する後処理を
行い、その処理結果を最終的なポストフィルタ出力信号
として出力する。
【0123】図5は、本実施の形態に係る音声復号化シ
ステムの処理の流れを示すフロー図である。本図は図4
における定常雑音区間検出装置102および定常雑音後
処理装置300の処理の流れについてのみ示しており、
符号受信装置100および音声復号化装置101の処理
に関しては一般的に用いられる公知の処理によって実現
可能であるので省略する。以下、図5を参照して、本シ
ステムの音声復号化装置101以降の処理について動作
を説明する。まず、ST501において、本実施の形態
に係る音声復号化システムに備えられたメモリに保持さ
れる各種変数の初期化を行う。この初期化されるメモリ
の例と、初期値の例について図6に示す。
【0124】次いで、ST502からST505までの
処理をループ的に行う。この処理は音声復号化装置10
1から出力されるポストフィルタ出力信号がなくなるま
で(音声復号化装置の処理が止まるまで)行われる。S
T502では、モード判定が行われ、現在のサブフレー
ムが定常雑音信号区間(定常雑音モード)か音声区間
(音声モード)か判定される。ST502で行われる処
理の流れについては、後に詳述する。
【0125】次いで、ST503において、定常雑音後
処理装置300により定常雑音の付加(定常雑音後処
理)が行われる。ST503で行われる定常雑音後処理
の流れについては、後に詳述する。次いで、ST504
において、スケーリング部303により最終のスケーリ
ング処理が行われる。ST504で行われるスケーリン
グ処理の流れについては、後に詳述する。
【0126】次いで、ST505において、最後のサブ
フレームかどうかをチェックし、ST502〜ST50
5のループ処理を終了するか継続するか決定する。この
ループ処理は音声復号化装置101から出力されるポス
トフィルタ出力信号がなくなるまで(音声復号化装置1
01の処理が止まるまで)行われる。このループ処理が
終了すると、本実施の形態に係る音声復号化システムに
おける処理は全て終了する。
【0127】次に、図7を用いてST502におけるモ
ード判定処理の流れを説明する。まず、ST701で現
在のサブフレームが消失フレームかどうかをチェックす
る。
【0128】消失フレームの場合は、ST702に進
み、フレーム消失補償処理用のハングオーバカウンタを
所定の値(ここでは「3」とする。)にセットして、S
T704へ進む。このハングオーバカウンタに設定され
る所定の値は、フレーム消失が発生した後に、サブフレ
ームが正常であっても(フレーム消失が発生していなく
とも)フレーム消失補償処理を継続するサブフレームの
数に対応する。
【0129】消失フレームでない場合は、ST703に
進み、フレーム消失補償処理用ハングオーバカウンタの
値が0かどうかをチェックする。チェックの結果、フレ
ーム消失補償処理用ハングオーバカウンタの値が0でな
い場合は、フレーム消失補償処理用ハングオーバカウン
タの値を1だけデクリメントしてST704へ進む。
【0130】次に、ST704でフレーム消失補償処理
を行うかどうかの判断を下す。現在のサブフレームが消
失フレームでもなく、かつ、消失フレーム直後のハング
オーバ区間でもない場合は、フレーム消失補償処理は行
わないと判定してST705へ進む。現在のサブフレー
ムが消失フレームか、もしくは、消失フレーム直後のハ
ングオーバ区間である場合は、フレーム消失補償処理を
行わないと判定してST707へ進む。
【0131】ST705では、実施の形態1で示した平
滑化適応符号利得の算出とピッチ履歴分析が行われる。
これらの処理については実施の形態1で示したので省略
する。尚、ピッチ履歴分析の処理フローは図10を用い
て説明した。これらの処理の後、ST706へ進む。S
T706では、モード選択を行う。モード選択処理の流
れは図11及び図12に詳細に示した。ST708で
は、ST706において算出される定常雑音区間の平均
的LSPをLPCへ変換する。このST708における
処理は、ST706に続いて行わなくとも良く、ST5
03で定常雑音信号の生成を行う前に行えば良い。
【0132】ST704で、フレーム消失補償処理を行
うと判断された場合は、ST707において、直前のサ
ブフレームにおけるモードと定常雑音区間の平均LPC
を、夫々現在のサブフレームにおけるモードおよび平均
LPCとして繰り返し用いるように設定し、ST709
へ進む。
【0133】ST709では、現在のサブフレームにお
けるモード情報(定常雑音モードか音声信号モードかを
示す情報)と、現在のサブフレームにおける定常雑音区
間の平均的LPCをメモリにコピーする。尚、現在のモ
ード情報は、本実施の形態においては必ずしもメモリに
保持しておく必要はないが、このモード判定結果を他の
ブロック(例えば音声復号化装置101)で使用する場
合はメモリに保持しておくことが必要である。以上によ
り、ST502によるモード判定処理は終了する。
【0134】次に、図8を用いてST503における定
常雑音付加処理の流れを説明する。まず、ST801に
おいて、音源生成器210により雑音符号ベクトルが生
成される。雑音ベクトルの生成方法はいかなる方法でも
良いが、実施の形態2で示したように、音声復号化装置
101に備えられた固定符号帳113からランダムに選
択する手法が有効である。
【0135】次に、ST802において、ST801で
生成した雑音ベクトルを駆動音源としてLPC合成フィ
ルタ処理を行う。次に、ST803において、ST80
2で合成された雑音信号の帯域制限フィルタ処理を行っ
て、雑音信号の帯域を音声符号化装置101から出力さ
れる復号信号の帯域と合わせる。尚、この処理は必ずし
も必須ではない。次に、ST804において、ST80
3で得られた帯域制限後の合成雑音信号のパワが算出さ
れる。
【0136】次に、ST805において、ST804で
得られた信号パワの平滑化処理を行う。この平滑化は連
続するサブフレーム間で(式1)に示すようなAR処理
を行うことにより容易に実現することが出来る。平滑化
の係数kはどれだけスムーズな定常信号を得たいかによ
って定められ、0.05〜0.2程度の比較的強い平滑
化を行うことが好ましい。具体的には(式10)のよう
な式を用いる。
【0137】次に、ST806において、生成しようと
している定常雑音信号のパワ(ST1118において算
出済み)とST805で得られたサブフレーム間平滑化
後の信号パワとの比を利得調整係数として算出する(式
11)。算出された利得調整係数はサンプル毎の平滑化
処理が行われ(式12)、ST803にて得られた帯域
制限フィルタ処理後の合成雑音信号に乗ぜられる。そし
て、この利得調整係数を乗ぜられた定常雑音信号に、予
め定められた定数(固定利得)が乗じられる。この固定
利得は、定常雑音信号の絶対的なレベルを調整するため
に乗じられる。
【0138】次に、ST807において、音声復号化装
置101から出力されたポストフィルタ出力信号にST
806にて生成された合成雑音信号を加算し、加算後の
ポストフィルタ出力信号のパワを算出する。
【0139】次に、ST808において、音声復号化装
置101から出力されたポストフィルタ出力信号のパワ
とST807にて算出されたパワとの比がスケーリング
係数として算出される(式13)。スケーリング係数
は、定常雑音付加処理の後段で行われるST504のス
ケーリング処理において用いられる。
【0140】最後に、加算器202により、ST806
にて生成された合成雑音信号(定常雑音信号)と、音声
復号化装置101から出力されたポストフィルタ出力信
号とが加算される。尚、この処理はST807に含めて
行っても良い。以上により、ST503における定常雑
音付加処理が終了する。
【0141】次に、図9を用いてST504におけるス
ケーリングの流れを説明する。まず、ST901におい
て、現在のサブフレームがフレーム消失補償処理の対象
サブフレームかどうかをチェックする。そして、現在の
サブフレームがフレーム消失補償処理の対象サブフレー
ムであればST902へ進み、そうでなければST90
3へ進む。
【0142】ST902ではフレーム消失補償処理を行
う。すなわち、直前のサブフレームにおけるスケーリン
グ係数を現在のスケーリング係数として繰り返し使用す
るように設定を行い、ST903へ進む。
【0143】ST903では、定常雑音区間検出装置1
02から出力された判定結果により、モードが定常雑音
モードかどうかのチェックを行う。モードが定常雑音モ
ードであればST904へ進み、そうでなければST9
05へ進む。
【0144】ST904では、前述の(式1)を用い
て、スケーリング係数のサブフレーム間平滑化処理が行
われる。この場合、kの値は0.1程度とする。具体的
には(式14)のような式を用いる。これは、定常雑音
区間おけるサブフレーム間のパワ変動をスムーズにする
ために行われる。この平滑化処理を行った後、ST90
5へ進む。
【0145】ST905では、スケーリング係数をサン
プル毎に平滑化し、平滑化したスケーリング係数をST
503で生成された定常雑音付加後のポストフィルタ出
力信号に乗じる。サンプル毎の平滑化も前述の(式1)
を用いて行われ、この場合のkの値は0.15程度とす
る。具体的には(式15)のような式を用いる。以上に
より、ST504のスケーリング処理は終了し、スケー
リングされた定常雑音付加後のポストフィルタ出力信号
が得られる。
【0146】尚、上記各実施の形態において、平滑化や
平均的な値の算出に(式1)などに示される計算式を用
いたが、平滑化に用いる式はこのような計算式に限定さ
れない。例えば、過去所定の区間における平均値などを
用いても良い。
【0147】本発明は上記実施の形態1から4に限定さ
れず、種々変更して実施することが可能である。例え
ば、本発明の定常雑音区間検出装置はいかなるタイプの
復号器に対しても適用可能である。
【0148】なお、本発明は上記実施の形態に限定され
ず、種々変更して実施することが可能である。例えば、
上記実施の形態では、音声復号化装置として行う場合に
ついて説明しているが、これに限られるものではなく、
この音声復号化方法をソフトウェアとして行うことも可
能である。
【0149】例えば、上記音声復号化方法を実行するプ
ログラムを予めROM(Read OnlyMemory)に格納して
おき、そのプログラムをCPU(Central Processor Un
it)によって動作させるようにしても良い。
【0150】また、上記音声復号化方法を実行するプロ
グラムをコンピュータで読み取り可能な記憶媒体に格納
し、記憶媒体に格納されたプログラムをコンピュータの
RAM(Random Access memory)に記録して、コンピュ
ータをそのプログラムにしたがって動作させるようにし
ても良い。
【0151】
【発明の効果】以上説明したように、本発明によれば、
適応符号利得およびピッチ周期を用いて復号信号の周期
性の強さを判定し、この周期性の強さに基づいて定常座
圧音区間かどうかを判定する。したがって、正弦波や定
常母音のように定常だが雑音的でない信号についても、
その信号状態を正しく判定することが出来る。
【図面の簡単な説明】
【図1】本発明の実施の形態1に係る定常雑音区間判定
装置の構成を示す図
【図2】本発明の実施の形態2に係る定常雑音後処理装
置の構成を示す図
【図3】本発明の実施の形態3に係る定常雑音後処理装
置の構成を示す図
【図4】本発明の実施の形態4に係る音声復号化処理シ
ステムの構成を示す図
【図5】音声復号化システムの処理の流れを示すフロー
【図6】音声復号化システムに備えられたメモリの例
と、このメモリの初期値の例について示す図
【図7】モード判定処理の流れを示す図
【図8】定常雑音付加処理の流れを示す図
【図9】スケーリングの流れを示す図
【図10】グルーピングの手順について説明するフロー
【図11】モード選択の流れの一部を示す図
【図12】モード選択の流れの一部を示す図
【符号の説明】
100 符号受信装置 101 音声復号化装置 102 定常雑音区間検出装置 103 第1の定常雑音区間検出部 104 第2の定常雑音区間検出部 105 定常雑音特徴抽出部 110 LPC復号器 111 適応符号帳 112 利得符号帳 113 固定符号帳 117、211 合成フィルタ 118 ポストフィルタ 119 サブフレーム間変動算出器 120 距離計算器 121 第1の判定器 122 ピッチ履歴分析器 123 パワ変化算出器 124 第2の判定器 125 平均LSP算出器 126 平均雑音パワ算出器 200、300 定常雑音後処理装置 201、301 雑音生成部 202 加算器 203、303 スケーリング部 210 音源生成器 212 LSP/LPC変換器 213、214、219 乗算器 215 利得調整器 216 スケーリング係数算出器 217 サブフレーム間平滑化器 218 サンプル間平滑化器 304 フレーム消失補償処理制御部 310、311、312 メモリ 313、314、315 切替スイッチ
───────────────────────────────────────────────────── フロントページの続き (72)発明者 安永 和敏 大阪府門真市大字門真1006番地 松下電器 産業株式会社内 (72)発明者 間野 一則 東京都千代田区大手町二丁目3番1号 日 本電信電話株式会社内 (72)発明者 日和▲崎▼ 祐介 東京都千代田区大手町二丁目3番1号 日 本電信電話株式会社内 Fターム(参考) 5D045 CA01 5K041 CC01 EE14 EE23 EE51

Claims (16)

    【特許請求の範囲】
  1. 【請求項1】 符号化信号を復号して音声信号のスペク
    トル包絡成分を表す少なくとも1種類の第1パラメータ
    を得る第1復号化手段と、前記符号化信号を復号して音
    声信号の残差成分を表す少なくとも1種類の第2パラメ
    ータを得る第2復号化手段と、前記第1パラメータに基
    づいて合成フィルタを構成し、前記第2パラメータに基
    づいて生成した駆動音源信号により前記合成フィルタを
    駆動して復号信号を生成する合成手段と、前記第1パラ
    メータに基づいて前記復号信号の定常雑音性を判定する
    第1判定手段と、前記第2パラメータに基づいて前記復
    号信号の周期性を判定し、この周期性の判定結果と前記
    第1判定手段における定常雑音性の判定結果と前記第1
    パラメータとに基づいて定常雑音区間かどうかを判定す
    る第2判定手段と、具備することを特徴とする音声復号
    化装置。
  2. 【請求項2】 第2パラメータは少なくともピッチ周期
    を含み、第2判定手段は、前記ピッチ周期の処理単位間
    でのばらつきに基づいて復号信号の周期性を判定するこ
    とを特徴とする請求項1記載の音声復号化装置。
  3. 【請求項3】 第2パラメータは、少なくとも適応符号
    ベクトルに乗算する適応符号帳ゲインを含み、前記適応
    符号帳ゲインに基づいて復号信号の周期性を判定するこ
    とを特徴とする請求項1又は請求項2のいずれかに記載
    の音声復号化装置。
  4. 【請求項4】 第1パラメータは、少なくともスペクト
    ル包絡パラメータを含み、処理単位間での前記スペクト
    ル包絡パラメータの変動量を算出する変動量算出手段
    と、現在の処理単位よりも前の定常雑音区間における前
    記スペクトル包絡パラメータを平均化した値と現在の処
    理単位におけるスペクトル包絡パラメータとの距離を算
    出する距離算出手段と、を具備し、第1判定手段は、前
    記変動量と前記距離とに基づいて合成手段において生成
    した復号信号の定常性を判定し、この判定結果に基づい
    て前記復号信号の定常雑音性を判定することを特徴とす
    る請求項1から請求項3のいずれかに記載の音声復号化
    装置。
  5. 【請求項5】 変動量算出手段は、変動量として、現在
    の処理単位のスペクトル包絡パラメータと1つ前の処理
    単位におけるスペクトル包絡パラメータとの2乗誤差を
    算出し、距離算出手段は、距離として、現在の処理単位
    よりも前の定常雑音区間における前記スペクトル包絡パ
    ラメータを平均化した値と現在の処理単位におけるスペ
    クトル包絡パラメータとの2乗誤差を算出し、第1判定
    手段は、少なくとも、変動量として算出した2乗誤差と
    距離として算出した2乗誤差のそれぞれについて閾値を
    設定し、変動量として算出した2乗誤差と距離として算
    出した2乗誤差がいずれも設定した閾値よりも小さい場
    合に復号信号が定常であると判定することを特徴とする
    請求項4に記載の音声復号化装置。
  6. 【請求項6】 現在の処理単位より前の複数の処理単位
    におけるピッチ周期をそれぞれバッファリングし、この
    バッファリングした複数の処理単位におけるピッチ周期
    のうち互いに近接するピッチ周期をグループ化し、グル
    ープ化した際のグループ数を出力するピッチ履歴分析手
    段と、現在の処理単位における復号信号パワと、現在の
    処理単位より前の定常雑音区間における復号信号の平均
    パワとの変化量を算出する信号パワ変化算出手段と、を
    具備し、第2判定手段は、前記変化量が所定の閾値を超
    えている場合は音声区間と判定し、有声定常区間ではな
    く、且つ、第1判定手段において復号信号が定常と判定
    された場合であり、変動量算出手段において算出した変
    動量が所定の閾値未満である状態が所定の処理単位数以
    上続いている場合は定常雑音区間と判定し、前記ピッチ
    履歴分析手段から出力されるグループ数が所定の閾値以
    上である場合、又は適応符号利得が所定の閾値以上であ
    る場合は音声区間と判定することを特徴とする請求項4
    又は請求項5に記載の音声復号化装置。
  7. 【請求項7】 合成手段において生成された復号信号と
    前記復号信号に擬似的な定常雑音信号を重畳して得られ
    る雑音重畳復号信号とから求められたスケーリング係数
    を、前記雑音重畳信号に乗算してパワ調整を行う後処理
    手段を具備することを特徴とする請求項1から請求項3
    のいずれかに記載の音声復号化装置。
  8. 【請求項8】第2判定手段において定常雑音区間と判定
    された場合にのみスケーリング係数を処理単位間で平滑
    化するスケーリング手段を具備することを特徴とする請
    求項7に記載の音声復号化装置。
  9. 【請求項9】 後処理を行う際に使用する少なくとも1
    種類の第3パラメータを保持する記憶手段と、現在の処
    理単位においてフレーム消失が発生した際に、1つ前の
    処理単位における第3パラメータを前記記憶手段から出
    力させる制御手段と、を具備し、後処理手段は、前記1
    つ前の処理単位における第3パラメータを用いて後処理
    を行うことを特徴とする請求項8に記載の音声復号化装
    置。
  10. 【請求項10】 第3パラメータは、少なくともスケー
    リング係数を含み、後処理手段は、記憶手段から出力さ
    れた1つ前の処理単位におけるスケーリング係数を用い
    て後処理を行うことを特徴とする請求項9に記載の音声
    復号化装置。
  11. 【請求項11】 後処理手段は、擬似的な定常雑音信号
    を生成する雑音生成手段と、合成手段において生成した
    復号信号と前記擬似的な雑音信号とを加算して雑音重畳
    復号信号を生成する加算手段と、スケーリング係数を前
    記雑音重畳復号信号に乗算してパワ調整を行うスケーリ
    ング手段と、を具備することを特徴とする請求項7から
    請求項10のいずれかに記載の音声復号化装置。
  12. 【請求項12】 雑音生成手段は、固定符号帳からラン
    ダムに雑音符号ベクトルを選択して雑音音源信号を生成
    する音源生成手段と、線形予測係数に基づいて第2合成
    フィルタを構成し、前記雑音音源信号により前記第2合
    成フィルタを駆動して擬似的な定常雑音信号を合成する
    第2合成手段と、前記第2合成手段において合成された
    擬似的な定常雑音信号の利得を調整する利得調整手段
    と、を具備することを特徴とする請求項11に記載の音
    声復号化装置。
  13. 【請求項13】 スケーリング手段は、合成手段におい
    て生成された復号信号と前記復号信号に擬似的な定常雑
    音信号を重畳して得られる雑音重畳復号信号とに基づい
    てスケーリング係数を算出するスケーリング係数算出手
    段と、前記スケーリング係数を処理単位間で平滑化する
    第1平滑化手段と、第1平滑化手段において平滑化した
    スケーリング係数をサンプル間で平滑化する第2平滑化
    手段と、前記第2平滑化手段において平滑化したスケー
    リング係数を雑音重畳復号信号に乗算する乗算手段と、
    を具備することを特徴とする請求項11又は請求項12
    に記載の音声復号化装置。
  14. 【請求項14】 音声信号のスペクトル包絡成分を表す
    少なくとも1種類の第1パラメータを復号する工程と、
    音声信号の残差成分を表す少なくとも1種類の第2パラ
    メータを復号する工程と、前記第1パラメータに基づい
    て合成フィルタを構成し、前記第2パラメータに基づい
    て生成した駆動音源信号により前記合成フィルタを駆動
    して復号信号を生成する工程と、前記第1パラメータに
    基づいて前記復号信号の定常雑音性を判定する工程と、
    前記第2パラメータに基づいて前記復号信号の周期性を
    判定し、この周期性の判定結果と前記定常雑音性の判定
    結果とに基づいて定常雑音区間かどうかを判定する工程
    と、具備することを特徴とする音声復号化方法。
  15. 【請求項15】 音声信号のスペクトル包絡成分を表す
    少なくとも1種類の第1パラメータを復号し、音声信号
    の残差成分を表す少なくとも1種類の第2パラメータを
    復号し、前記第1パラメータに基づいて合成フィルタを
    構成し、前記第2パラメータに基づいて生成した駆動音
    源信号により前記合成フィルタを駆動して復号信号を生
    成し、前記第1パラメータに基づいて前記復号信号の定
    常雑音性を判定し、前記第2パラメータに基づいて前記
    復号信号の周期性を判定し、前記周期性の判定結果と前
    記定常雑音性の判定結果とに基づいて定常雑音区間かど
    うかを判定することを特徴とする音声復号化プログラム
    を記録した記録媒体。
  16. 【請求項16】 音声信号のスペクトル包絡成分を表す
    少なくとも1種類の第1パラメータを復号する手順と、
    音声信号の残差成分を表す少なくとも1種類の第2パラ
    メータを復号する手順と、前記第1パラメータに基づい
    て合成フィルタを構成し、前記第2パラメータに基づい
    て生成した駆動音源信号により前記合成フィルタを駆動
    して復号信号を生成する手順と、前記第1パラメータに
    基づいて前記復号信号の定常雑音性を判定する手順と、
    前記第2パラメータに基づいて前記復号信号の周期性を
    判定し、この周期性の判定結果と前記定常雑音性の判定
    結果とに基づいて定常雑音区間かどうかを判定する手順
    と、をコンピュータに実行させるための音声復号化プロ
    グラム。
JP2001367831A 2000-11-30 2001-11-30 定常雑音区間検出装置及び定常雑音区間検出方法 Expired - Fee Related JP3806344B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001367831A JP3806344B2 (ja) 2000-11-30 2001-11-30 定常雑音区間検出装置及び定常雑音区間検出方法

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2000-366342 2000-11-30
JP2000366342 2000-11-30
JP2001367831A JP3806344B2 (ja) 2000-11-30 2001-11-30 定常雑音区間検出装置及び定常雑音区間検出方法

Publications (2)

Publication Number Publication Date
JP2002236495A true JP2002236495A (ja) 2002-08-23
JP3806344B2 JP3806344B2 (ja) 2006-08-09

Family

ID=26605030

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001367831A Expired - Fee Related JP3806344B2 (ja) 2000-11-30 2001-11-30 定常雑音区間検出装置及び定常雑音区間検出方法

Country Status (1)

Country Link
JP (1) JP3806344B2 (ja)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100463657B1 (ko) * 2002-11-30 2004-12-29 삼성전자주식회사 음성구간 검출 장치 및 방법
WO2006098274A1 (ja) * 2005-03-14 2006-09-21 Matsushita Electric Industrial Co., Ltd. スケーラブル復号化装置およびスケーラブル復号化方法
JP2007104167A (ja) * 2005-10-03 2007-04-19 Oki Electric Ind Co Ltd 送話状態判定方法
WO2008007699A1 (en) * 2006-07-12 2008-01-17 Panasonic Corporation Audio decoding device and audio encoding device
US8175868B2 (en) 2005-10-20 2012-05-08 Nec Corporation Voice judging system, voice judging method and program for voice judgment
JP2016526324A (ja) * 2013-05-16 2016-09-01 クゥアルコム・インコーポレイテッドQualcomm Incorporated 複数のマイクロフォンのための自動利得整合
CN106463137A (zh) * 2014-05-01 2017-02-22 日本电信电话株式会社 编码装置、解码装置、及其方法、程序
JP2017514183A (ja) * 2014-03-19 2017-06-01 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 個別の符号帳情報についての個別の置き換えlpc表現を用いたエラー隠し信号を生成する装置及び方法
US10163444B2 (en) 2014-03-19 2018-12-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating an error concealment signal using an adaptive noise estimation
US10224041B2 (en) 2014-03-19 2019-03-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus, method and corresponding computer program for generating an error concealment signal using power compensation
US10446173B2 (en) 2017-09-15 2019-10-15 Fujitsu Limited Apparatus, method for detecting speech production interval, and non-transitory computer-readable storage medium for storing speech production interval detection computer program

Cited By (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100463657B1 (ko) * 2002-11-30 2004-12-29 삼성전자주식회사 음성구간 검출 장치 및 방법
WO2006098274A1 (ja) * 2005-03-14 2006-09-21 Matsushita Electric Industrial Co., Ltd. スケーラブル復号化装置およびスケーラブル復号化方法
JP4846712B2 (ja) * 2005-03-14 2011-12-28 パナソニック株式会社 スケーラブル復号化装置およびスケーラブル復号化方法
US8160868B2 (en) 2005-03-14 2012-04-17 Panasonic Corporation Scalable decoder and scalable decoding method
JP2007104167A (ja) * 2005-10-03 2007-04-19 Oki Electric Ind Co Ltd 送話状態判定方法
US8175868B2 (en) 2005-10-20 2012-05-08 Nec Corporation Voice judging system, voice judging method and program for voice judgment
WO2008007699A1 (en) * 2006-07-12 2008-01-17 Panasonic Corporation Audio decoding device and audio encoding device
US8812306B2 (en) 2006-07-12 2014-08-19 Panasonic Intellectual Property Corporation Of America Speech decoding and encoding apparatus for lost frame concealment using predetermined number of waveform samples peripheral to the lost frame
JP2016526324A (ja) * 2013-05-16 2016-09-01 クゥアルコム・インコーポレイテッドQualcomm Incorporated 複数のマイクロフォンのための自動利得整合
US10163444B2 (en) 2014-03-19 2018-12-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating an error concealment signal using an adaptive noise estimation
US10733997B2 (en) 2014-03-19 2020-08-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating an error concealment signal using power compensation
US10140993B2 (en) 2014-03-19 2018-11-27 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating an error concealment signal using individual replacement LPC representations for individual codebook information
US11423913B2 (en) 2014-03-19 2022-08-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating an error concealment signal using an adaptive noise estimation
US10224041B2 (en) 2014-03-19 2019-03-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus, method and corresponding computer program for generating an error concealment signal using power compensation
US11393479B2 (en) 2014-03-19 2022-07-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating an error concealment signal using individual replacement LPC representations for individual codebook information
US11367453B2 (en) 2014-03-19 2022-06-21 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating an error concealment signal using power compensation
JP2017514183A (ja) * 2014-03-19 2017-06-01 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 個別の符号帳情報についての個別の置き換えlpc表現を用いたエラー隠し信号を生成する装置及び方法
US10614818B2 (en) 2014-03-19 2020-04-07 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating an error concealment signal using individual replacement LPC representations for individual codebook information
US10621993B2 (en) 2014-03-19 2020-04-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating an error concealment signal using an adaptive noise estimation
CN110875047A (zh) * 2014-05-01 2020-03-10 日本电信电话株式会社 编码装置、及其方法、记录介质、程序
CN106463137B (zh) * 2014-05-01 2019-12-10 日本电信电话株式会社 编码装置、及其方法、记录介质
CN106463137A (zh) * 2014-05-01 2017-02-22 日本电信电话株式会社 编码装置、解码装置、及其方法、程序
CN110875047B (zh) * 2014-05-01 2023-06-09 日本电信电话株式会社 解码装置、及其方法、记录介质
US10446173B2 (en) 2017-09-15 2019-10-15 Fujitsu Limited Apparatus, method for detecting speech production interval, and non-transitory computer-readable storage medium for storing speech production interval detection computer program

Also Published As

Publication number Publication date
JP3806344B2 (ja) 2006-08-09

Similar Documents

Publication Publication Date Title
KR100566163B1 (ko) 음성 복호화 장치, 음성 복호화 방법 및 프로그램을기록한 기록 매체
EP1164580B1 (en) Multi-mode voice encoding device and decoding device
JP3346765B2 (ja) 音声復号化方法及び音声復号化装置
WO1998006091A1 (fr) Codec vocal, support sur lequel est enregistre un programme codec vocal, et appareil mobile de telecommunications
MXPA04011751A (es) Metodo y dispositivo para ocultamiento de borrado adecuado eficiente en codecs de habla de base predictiva lineal.
JP2004508597A (ja) オーディオ信号における伝送エラーの抑止シミュレーション
JPWO2008007699A1 (ja) 音声復号装置および音声符号化装置
US9972325B2 (en) System and method for mixed codebook excitation for speech coding
KR20140005277A (ko) 저-지연 통합 스피치 및 오디오 코딩에서 에러 은닉을 위한 장치 및 방법
US6826527B1 (en) Concealment of frame erasures and method
JP3806344B2 (ja) 定常雑音区間検出装置及び定常雑音区間検出方法
JP3343082B2 (ja) Celp型音声符号化装置
JP2002268696A (ja) 音響信号符号化方法、復号化方法及び装置並びにプログラム及び記録媒体
TW201434033A (zh) 用於判定音調脈衝週期信號界限之系統及方法
JP2002140099A (ja) 音声復号化装置
JP3199142B2 (ja) 音声の励振信号符号化方法および装置
JPH09244695A (ja) 音声符号化装置及び復号化装置
US20220180884A1 (en) Methods and devices for detecting an attack in a sound signal to be coded and for coding the detected attack
JPH0519796A (ja) 音声の励振信号符号化・復号化方法
JP2001147700A (ja) 音声信号の後処理方法および装置並びにプログラムを記録した記録媒体
Tasaki et al. New excitation codebook search methods to reduce perceptual degradation of celp
JPH06266399A (ja) 符号化装置及び音声符号化復号化装置
JP2001265396A (ja) マルチモード音声符号化装置及び復号化装置
JPH07199994A (ja) 音声符号化方式
JP2003195899A (ja) 音声/音響信号の符号化方法及び電子装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040301

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20051102

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051115

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060116

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060207

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060407

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060502

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060512

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090519

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100519

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110519

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110519

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120519

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130519

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130519

Year of fee payment: 7

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees