JP3806344B2 - 定常雑音区間検出装置及び定常雑音区間検出方法 - Google Patents

定常雑音区間検出装置及び定常雑音区間検出方法 Download PDF

Info

Publication number
JP3806344B2
JP3806344B2 JP2001367831A JP2001367831A JP3806344B2 JP 3806344 B2 JP3806344 B2 JP 3806344B2 JP 2001367831 A JP2001367831 A JP 2001367831A JP 2001367831 A JP2001367831 A JP 2001367831A JP 3806344 B2 JP3806344 B2 JP 3806344B2
Authority
JP
Japan
Prior art keywords
stationary noise
signal
lsp
noise
stationary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2001367831A
Other languages
English (en)
Other versions
JP2002236495A (ja
Inventor
宏幸 江原
和敏 安永
一則 間野
祐介 日和▲崎▼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Nippon Telegraph and Telephone Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Nippon Telegraph and Telephone Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Nippon Telegraph and Telephone Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP2001367831A priority Critical patent/JP3806344B2/ja
Publication of JP2002236495A publication Critical patent/JP2002236495A/ja
Application granted granted Critical
Publication of JP3806344B2 publication Critical patent/JP3806344B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、音声信号を符号化して伝送する移動通信システム、インターネット通信を含むパケット通信システムなどにおいて、低ビットレートで符号化された音声信号を復号化する音声復号化装置の出力信号から音声区間あるいは定常雑音区間を検出する定常雑音区間検出装置及び定常雑音区間検出方法に関する。
【0002】
【従来の技術】
ディジタル移動通信や、インターネット通信に代表されるパケット通信、あるいは音声蓄積の分野においては、電波などの伝送路の容量や記憶媒体の有効利用のために音声情報を圧縮し、高能率で符号化するための音声符号化装置が用いられている。なかでもCELP(Code Excited LineAr Prediction:符号励振線形予測符号化)方式をベースにした方式が中・低ビットレートにおいて広く実用化されている。CELPの技術については、M.R.Schroeder and B.S.Atal:"Code-Excited Linear Prediction (CELP):High-quality Speech at Very Low Bit Rates",Proc.ICASSP-85, 25.1.1, pp.937-940, 1985"に示されている。
【0003】
CELP型音声符号化方式は、音声をある一定のフレーム長(5ms〜50ms程度)に区切り、各フレーム毎に音声の線形予測を行い、フレーム毎の線形予測による予測残差(励振信号)を既知の波形からなる適応符号ベクトルと雑音符号ベクトルを用いて符号化するものである。適応符号ベクトルは過去に生成した駆動音源ベクトルを格納している適応符号帳から、雑音符号ベクトルは予め用意された定められた数の定められた形状を有するベクトルを格納している雑音符号帳から選択されて使用される。雑音符号帳に格納される雑音符号ベクトルには、ランダムな雑音系列のベクトルや何本かのパルスを異なる位置に配置することによって生成されるベクトルなどが用いられる。
【0004】
従来のCELP符号化装置では、入力されたディジタル信号を用いてLPC(Linear Predictive Coefficient:線形予測係数)の分析・量子化とピッチ探索と雑音符号帳探索とゲイン符号帳探索とが行われ、LPC符号(L)とピッチ周期(P)と雑音符号帳インデックス(S)とゲイン符号帳インデックス(G)とが復号化装置に伝送される。
【0005】
復号化装置は、LPC符号(L)とピッチ周期(P)と雑音符号帳インデックス(S)とゲイン符号帳インデックス(G)とを復号し、これらの復号結果に基づいて合成フィルタを駆動音源信号で駆動して復号信号を得る。
【0006】
【発明が解決しようとする課題】
しかしながら、上記従来の音声復号化装置においては、定常母音等の定常的ではあるが雑音ではない信号を、定常雑音と区別して定常雑音区間を検出することが困難であった。
【0007】
本発明はかかる点に鑑みてなされたものであり、定常雑音信号区間を正確に検出して音声信号を復号化することが出来る定常雑音区間検出装置及び定常雑音区間検出方法に関する。
【0008】
【課題を解決するための手段】
本発明の骨子は、復号信号の定常雑音性を仮に判定し、この仮の判定結果と復号信号の周期性の判定結果とに基づいて現在の処理単位が定常雑音区間かどうかをさらに判定することにより、定常母音等の定常的な音声信号が含まれる復号信号を定常雑音と区別して、定常雑音区間を正しく検出することである。
【0009】
【発明の実施の形態】
本発明の定常雑音区間検出装置は、過去複数のサブフレームにおけるピッチ周期を1つ以上のクラスに分類し、前記クラスが複数存在する場合にピッチ周期の差が所定の第1閾値より小さいクラスを1つのグループにまとめ、前記グループの数を分析結果として得るピッチ履歴分析部と、前記分析結果が所定の第2閾値より小さい信号区間を音声区間と判定する判定手段と、を具備する構成を採る。
【0010】
本発明の定常雑音区間検出方法は、過去複数のサブフレームにおけるピッチ周期を1つ以上のクラスに分類し、前記クラスが複数存在する場合にピッチ周期の差が所定の第1閾値より小さいクラスを1つのグループにまとめ、前記グループの数を分析結果として得るピッチ履歴分析工程と、前記分析結果が所定の第2閾値より小さい信号区間を音声区間と判定する判定工程と、を具備する方法を採る。
【0039】
以下、本発明の実施形態について添付図面を参照して説明する。
(実施の形態1)
図1に本発明の実施の形態1に係る定常雑音区間判定装置の構成を示す。
【0040】
まず、図示しない符号器が、入力されたディジタル信号を用いてLPC(Linear Predictive Coefficient:線形予測計数)の分析・量子化とピッチ探索と雑音符号帳探索とゲイン符号帳探索とを行い、LPC符号(L)とピッチ周期(P)と雑音符号帳インデックス(S)とゲイン符号帳インデックス(G)とを送信する。
【0041】
符号受信装置100は、符号器から送信された符号化信号を受信し、受信信号からLPCを表現する符号Lと適応符号ベクトルを表現する符号Aとゲイン情報を表現する符号Gと雑音符号ベクトルを表現する符号Fを受信情報から分離する。分離された符号L、符号A、符号G、及び符号Fは、それぞれ音声復号化装置101へ出力される。具体的には、符号LはLPC復号器110に出力され、符号Aは適応符号帳111に出力され、符号Gは利得符号帳112に出力され、符号Fは固定符号帳113に出力される。
【0042】
LPC復号器110は、符号LからLPCを復号し、合成フィルタ117に出力する。また、LPC復号器110は、復号したLPCを補間特性の良いLSP(Line Spectrum Pair:線スペクトル対)パラメータに変換し、このLSPを定常雑音区間検出装置102に備えられたサブフレーム間変動算出器119、距離計算器120、及び平均LSP算出器125のそれぞれに出力する。
【0043】
なお、一般的には符号LはLSPを符号化したものである場合が多く、その場合LPC復号器はLSPを復号化した後に復号LSPをLPCに変換する。尚、LSPパラメータは音声信号のスペクトル包絡成分を表すスペクトル包絡パラメータの例である。スペクトル包絡パラメータには、LSPパラメータの他にPARCOR係数やLPC自身も含まれる。
【0044】
まず、音声復号化装置101について説明する。
【0045】
音声復号化装置101に備えられた適応符号帳111は、過去に生成した駆動音源信号を逐次更新しながらバッファリングしており、入力した符号Aを復号して得られる適応符号帳インデックス(ピッチ周期(ピッチラグ))を用いて適応符号ベクトルを生成する。適応符号帳111にて生成された適応符号ベクトルは、適応符号利得乗算器114で適応符号利得が乗じられた後に加算器116に出力される。また、適応符号帳111にて得られたピッチ周期は定常雑音区間検出装置102に備えられたピッチ履歴分析器122へ出力される。
【0046】
利得符号帳112は、適応符号帳ゲインと雑音符号帳ゲインのセット(ゲインベクトル)を予め定められた個数だけ格納しており、入力した符号Gを復号して得られるゲイン符号帳インデックスによって指定されるゲインベクトルの適応符号帳ゲイン成分(適応符号利得)を適応符号利得乗算器114および第2の判定器124へ出力し、雑音符号帳ゲイン成分(雑音符号利得)を雑音符号利得乗算器115に出力する。
【0047】
固定符号帳113は、予め定められた個数の形状の異なる雑音符号ベクトルを格納しており、入力した符号Fを復号して得られる雑音符号帳インデックスによって指定される雑音符号ベクトルを雑音符号利得乗算器115へ出力する。雑音符号利得乗算器115は、雑音符号ベクトルに雑音符号利得を乗算し、加算器116へ出力する。
【0048】
加算器116は、適応符号利得乗算器114から入力される適応符号ベクトルと雑音符号利得乗算器115から入力される雑音符号ベクトルとの加算を行い、合成フィルタ117の駆動音源信号を生成し、合成フィルタ117及び適応符号帳111へ出力する。
【0049】
合成フィルタ117は、LPC復号器110から入力されたLPCを用いてLPC合成フィルタを構築する。この合成フィルタ117に対して加算器116から入力される駆動音源信号を入力としてフィルタ処理を行って復号音声信号を合成し、合成した復号音声信号をポストフィルタ118へ出力する。
【0050】
ポストフィルタ118は、合成フィルタ117によって合成されたポストフィルタ出力信号に対してホルマント強調やピッチ強調等の主観的品質を改善する処理を行う。これらの処理を施された音声信号は、音声復号化装置101の最終的なポストフィルタ出力信号として、定常雑音区間検出装置102に備えられたパワ変化算出器123へ出力される。
【0051】
上述した音声復号化装置101による復号処理は、予め定められた時間長の処理単位(フレーム:時間長にして数十ミリ秒程度)、またはフレームをさらに短く分割した処理単位(サブフレーム)毎に行われるものとする。以下においては、サブフレーム毎に処理が行われる場合について説明する。
【0052】
次に、定常雑音区間検出装置102について説明する。まず、定常雑音区間検出装置102に備えられた第1の定常雑音区間検出部103について説明する。第1の定常雑音区間検出部103および第2の定常雑音区間検出部104は、モード選択を行い、定常雑音区間か音声信号区間かを判定する。
【0053】
LPC復号器110から出力されたLSPは、定常雑音区間検出装置102に備えられた第1の定常雑音区間検出部103と定常雑音特徴抽出部105とにそれぞれ入力される。第1の定常雑音区間検出部103に入力されたLSPは、サブフレーム間変動算出器119と距離計算器120とに入力される。
【0054】
サブフレーム間変動算出器119は、直前の(1つ前の)サブフレームからどれだけLSPが変化したのかを計算する。具体的には、LPC復号器110から入力されたLSPに基づいて、現在のサブフレームのLSPと直前のサブフレームのLSPとの差分を次数毎に計算し、これらの差分の自乗和をサブフレーム間変動量として第1の判定器121および第2の判定器124に出力する。
【0055】
尚、LSPの変動量を算出するために用いる情報はLSPそのものである必要はなく、LSPを時間方向(サブフレーム方向)に平滑化したものを前記計算に用いた方が、LSPの量子化誤差等のばらつきによる変動の影響を低減することが出来るので好ましい。この平滑化が強いとサブフレーム間の変動に対する追随性が悪くなるので、前記平滑化は弱めのものとする。例えば(式1)に示すように平滑化LSPを定義する場合、kの値は0.7程度とするのが好ましい。
平滑化LSP[現在のサブフレーム]
=k×LSP+(1−k)×平滑化LSP[直前のサブフレーム] …(式1)
距離計算器120は、平均LSP算出器125から入力された過去の定常雑音区間における平均的なLSPとLPC復号器110から入力された現在のサブフレームのLSPとの距離を計算し、計算結果を第1の判定器121に出力する。距離計算器120は、平均的なLSPと現在のサブフレームのLSPとの距離として、例えば、平均LSP算出器125から入力された平均的なLSPとLPC復号器110から入力された現在のサブフレームのLSPとの差分を次数毎に計算し、これらの差分の自乗和を出力する。尚、距離計算器120は、各次数毎に計算したLSPの差分の自乗和に加えて、次数毎に計算したLSPの差分自体を出力しても良い。さらに、これらの値に加えて、次数毎に計算したLSPの差分の最大値を出力しても良い。このように、第1の判定器121に多様な距離尺度を出力することにより、第1の判定器121での判定精度を高めることができる。
【0056】
第1の判定器121は、サブフレーム間変動算出器119と距離計算器120とから入力された情報を基に、LSPのサブフレーム間における変動の大小と、現在のサブフレームのLSPと定常雑音区間の平均的LSPとの類似性(距離)と、を判定する。具体的には、これらの判定は閾値処理によって行なわれる。LSPのサブフレーム間における変動が小さく、かつ、現在のサブフレームのLSPが定常雑音区間の平均的LSPと似ている(距離が小さい)と判断される場合に、現在のサブフレームは定常雑音区間であると判定する。判定結果(第1の判定結果)は、第2の判定器124へ出力される。
【0057】
このように、第1の判定器121では、現在のサブフレームが定常雑音区間かどうかが仮に判定される。この判定は、1つ前のサブフレームと今回のサブフレームとの間でのLSPの変動量に基づいて現在のサブフレームの定常性を判定し、さらに、平均LSPと現在のサブフレームのLSPとの距離に基づいて現在のサブフレームの雑音性を判定することにより行われる。
【0058】
しかし、このLSPに基づく判定のみでは、定常母音や正弦波等の周期性のある定常信号を誤って雑音信号と判定してしまうことがある。そこで、以下に説明する第2の定常雑音区間検出部104に備えられた第2の判定器124は、現在のサブフレームの周期性を分析して、その分析結果に応じて定常雑音区間かどうかを判定する。すなわち、第2の判定器124は、周期性が強い信号は、定常母音等である(雑音ではない)可能性が高いので、定常雑音区間ではないと判断する。
【0059】
次いで、第2の定常雑音区間検出部104について説明する。
【0060】
ピッチ履歴分析器122は、適応符号帳から入力されたピッチ周期のサブフレーム間でのばらつきを分析する。具体的には、ピッチ履歴分析器122は、適応符号帳111から入力されたピッチ周期を、予め定められたサブフレーム数(例えば10サブフレーム)分だけバッファリングし、このバッファリングしたピッチ周期(現在を含めた過去10サブフレーム分のピッチ周期)を図10に示すような方法でグルーピングする。
【0061】
グルーピングについて、現在のフレームを含めた過去10サブフレーム分のピッチ周期をグルーピングする場合を例に説明する。図10は、グルーピングを行う手順について説明するフロー図である。まず、ST1001においてピッチ周期のクラス分けを行う。具体的には、同じ値のピッチ周期を同じクラスとして扱う。つまり、全く同じ値のピッチ周期を同じクラスに分類し、少しでもピッチ周期の値が異なれば、異なるクラスに分類する。
【0062】
次に、ST1002において、分類されたクラスのうち、ピッチ周期の値が近いクラスを同じ1つのグループにまとめるグループ分けを行う。例えば、差が1以内のピッチ周期が1つのグループに分けられる。このグループ分けを行う際に、ピッチ周期の差が1であるクラスが5クラス(例えばピッチ周期が30,31,32,33,34であるクラス)存在する場合、これら5クラスを1グループにまとめてしまっても良い。
【0063】
次に、ST1003で、前記グループ分けの結果、現在のサブフレームを含む過去10サブフレームにおけるピッチ周期が何グループに分けられたかを示す分析結果を出力する。この分析結果の示すグループ数が少ないほど(1グループに近いほど)、復号した音声信号は周期的である可能性が高く、反対にグループ数が多いほど周期的でない可能性が高くなる。したがって、復号した音声信号が定常的である場合に、この分析結果を周期的定常信号性(定常信号の周期性)を示すパラメータとして用いることが可能である。
【0064】
パワ変化算出器123には、ポストフィルタ118から入力されたポストフィルタ出力信号と、平均雑音パワ算出器126から入力された定常雑音区間の平均パワ情報とが入力される。パワ変化算出器123は、ポストフィルタ118から入力されたポストフィルタ出力信号のパワを求め、求めたポストフィルタ出力信号のパワと定常雑音区間の平均パワとの比(パワ比)を計算する。
【0065】
このパワ比は、第2の判定器124および平均雑音パワ算出器126へ出力される。平均雑音パワ算出器126へは、ポストフィルタ出力信号のパワ情報も出力される。定常雑音区間の平均パワに比べてポストフィルタ118から出力されたポストフィルタ出力信号のパワ(現在の信号パワ)が大きければ音声区間である可能性がある。この定常雑音区間の平均パワおよびポストフィルタ118から出力されたポストフィルタ出力信号のパワは、他のパラメータで検出できない音声の立ち上がり部などを検出するためのパラメータとして用いることが出来る。尚、パワ変化算出器123は、ポストフィルタ出力信号のパワと定常雑音区間の平均パワとの比に代えて、これらのパワの差を計算してパラメータとして用いても良い。
【0066】
上述したように、第2の判定器124には、ピッチ履歴分析器122におけるピッチ履歴分析結果(過去のピッチ周期が分類されたグループ数を示す情報)、および利得符号帳112において得られた適応符号利得が、それぞれ入力される。第2の判定器124は、これらの入力情報を用いてポストフィルタ出力信号の周期性を判定する。また、第2の判定器124には、第1の判定器121における第1の判定結果、パワ変化算出器123において算出された定常雑音区間の平均パワと現在のサブフレームのパワとの比、およびサブフレーム間変動算出器119において計算されたLSPのサブフレーム間変動量も入力され、第2の判定器124は、これらの入力情報と第1の判定結果と、上述した周期性の判断結果とに基づいて定常雑音区間かどうかを判定し、判定結果を後段の処理装置に出力する。判定結果は、平均LSP算出器125および平均雑音パワ算出器126にも出力される。
【0067】
なお、符号受信装置100、音声復号化装置101、または定常雑音区間検出装置102のいずれかに、受信した符号に含まれる有声定常状態かどうかを示す情報を復号して、その有声定常状態かどうかを示す情報を、第2の判定器124に出力する復号部を備えても良い。
【0068】
次いで、定常雑音特徴抽出部105について説明する。
平均LSP算出器125には、第2の判定器124から判定結果が、音声復号化装置101(より正確にはLPC復号器110)から現在のサブフレームのLSPが、それぞれ入力される。平均LSP算出器125は、前記判定結果が定常雑音区間であるという判定の場合のみ、入力した現在のサブフレームのLSPを用いて定常雑音区間における平均LSPの更新を行う。平均LSPは例えばAR型の平滑化式によって更新される。更新された平均LSPは距離計算器120へ出力される。
【0069】
平均雑音パワ算出器126には、第2の判定器124から判定結果が、パワ変化算出器123からポストフィルタ出力信号のパワおよびパワ比(ポストフィルタ出力信号のパワ/定常雑音区間の平均パワ)が、それぞれ入力される。平均雑音パワ算出器126は、第2の判定器124からの判定結果が定常雑音区間であるという判定の場合と(定常雑音区間ではないが)パワ比が所定の閾値より小さい場合(定常雑音区間の平均パワよりも現在のサブフレームのポストフィルタ出力信号パワの方が小さい場合)に、入力したポストフィルタ出力信号パワを用いて定常雑音区間の平均パワ(平均雑音パワ)の更新を行う。平均雑音パワは、例えばAR型の平滑化式によって更新される。この場合、前記パワ比が小さいほど平滑化を弱くする(現在のサブフレームのポストフィルタ出力信号パワが反映されやすくする)制御を加えることにより、音声区間で急激に背景雑音レベルが低下した場合でも速やかに平均雑音パワのレベルを下げることが可能となる。更新された平均雑音パワはパワ変化算出器123へ出力される。
【0070】
上記構成において、LPC、LSP、および平均LSPはいずれも音声信号のスペクトル包絡成分を表すパラメータであり、適応符号ベクトル、雑音符号ベクトル、適応符号利得、および雑音符号利得はいずれも音声信号の残差成分を表すパラメータである。尚、スペクトル包絡成分を表すパラメータおよび残差成分を表すパラメータは上述したものに限定されない。
【0071】
次に、図11及び図12を参照して、第1の判定器121、第2の判定器124、および定常雑音特徴抽出部105における処理の手順について説明する。図11及び図12に示すST1101〜ST1107の処理は主に第1の定常雑音区間検出部103により行われ、ST1108〜ST1117の処理は主に第2の定常雑音区間検出部104により行われ、ST1118〜ST1120の処理は主に定常雑音特徴抽出部105において行われる。
【0072】
まずST1101において、現在のサブフレームのLSPが算出され、算出されたLSPが前述した(式1)に示すように平滑化される。次に、ST1102において、現在のサブフレームのLSPと1つ前の(直前の)サブフレームのLSPとの差分(変動量)が算出される。これらのST1101およびST1102における処理は前述したサブフレーム間変動算出器119において行われる。
【0073】
サブフレーム間変動算出器119におけるLSPの変動量の算出方法の一例を(式1')、(式2)、及び(式3)に示す。(式1')は現在のサブフレームにおけるLSPを平滑化する式であり、(式2)は平滑化したLSPのサブフレーム間差分を二乗和の形で算出する式であり、(式3)はLSPのサブフレーム間差分の二乗和をさらに平滑化する式である。なお、L'i(t)はt番目のサブフレームにおけるi次の平滑化LSPパラメータ、Li(t)はt番目のサブフレームにおけるi次のLSPパラメータ、DL(t)はt番目のサブフレームにおけるLSP変動量(サブフレーム間差分二乗和)、DL'(t)はt番目のサブフレームにおけるLSP変動量(平滑化したサブフレーム間差分二乗和)、pはLSP(LPC)分析次数、をそれぞれ示す。この例では、サブフレーム間変動算出器119が、(式1')、(式2)、及び(式3)を用いてDL'(t)を求め、得られたDL'(t)がLSPのサブフレーム間変動量としてモード判定に用いられる。
【数1】
Figure 0003806344
【数2】
Figure 0003806344
【数3】
Figure 0003806344
次に、ST1103において、距離計算器120により現在のサブフレームにおけるLSPと過去の雑音区間の平均LSPとの距離が算出される。距離計算器120における、距離計算の具体例を(式4)および(式5)に示す。(式4)は過去の雑音区間における平均的なLSPと現在のサブフレームにおけるLSPとの距離を全次数の差分の二乗和で定義したものであり、(式5)は最も差の大きかった次数のみの差分の二乗値で定義したものである。なお、LNiは過去の雑音区間における平均的なLSPであり、雑音区間において例えば(式6)を用いてサブフレーム毎に更新される。この例では、距離計算器120が、(式4)、(式5)、及び(式6)を用いてD(t)とDX(t)を求め、得られたD(t)とDX(t)が定常雑音区間のLSPとの距離情報としてモード判定に用いられる。
【数4】
Figure 0003806344
【数5】
Figure 0003806344
【数6】
Figure 0003806344
次に、ST1104において、パワ変化算出器123によりポストフィルタ出力信号(ポストフィルタ118の出力信号)のパワが算出される。パワの算出は前述のパワ変化算出器123内で行われ、具体的には例えば(式7)を用いてパワが求められる。(式7)において、S(i)はポストフィルタ出力信号であり、Nはサブフレーム長である。尚、ST1104におけるパワ算出は、図1に示す第2の定常雑音区間検出部104に備えられたパワ変化算出器123で行われるので、ST1108よりも前に行われれば良く、パワ算出のタイミングはST1104の位置に限定されない。
【数7】
Figure 0003806344
次に、ST1105において、復号信号の定常雑音性について判定が行われる。具体的には、ST1102にて算出された変動量が小さく、かつ、ST1103にて算出された距離が小さいかどうかが判定される。すなわち、ST1102で算出された変動量およびST1103で算出された距離について夫々閾値を設定し、ST1102で算出された変動量が設定された閾値よりも小さく、かつ、ST1103で算出された距離も設定された閾値より小さい場合には定常雑音性が高いと判定されてST1107に移行する。
【0074】
例えば前述のDL'、D、DXについては、LSPが0.0〜1.0の範囲内に正規化されている場合、以下のような閾値を用いることによって精度良く判定を行うことが出来る。
DLに対する閾値:0.0004
Dに対する閾値:0.003+D'
DXに対する閾値:0.0015
なお、D'は雑音区間におけるDの平均的な値であり、例えば雑音区間において(式8)の様にして算出される。
【数8】
Figure 0003806344
なお、過去の雑音区間の平均的なLSPであるLNiは、ある程度十分な(例えば20サブフレーム程度の)時間の雑音区間がないと十分信頼できる値とならないため、過去の雑音区間が予め定めた時間長(例えば20サブフレーム)以下の場合には、前記DおよびDXは、ST1105における定常雑音性の判定に用いない。
【0075】
ST1107では、現在のサブフレームが定常雑音区間であると判定され、ST1108に移行する。一方、ST1102で算出された変動量またはST1103で算出された距離のいずれかが設定された閾値よりも大きい場合には定常性が低いと判定されてST1106に移行する。ST1106においては、現在のサブフレームが定常雑音区間でない(すなわち音声区間である)と判定され、ST1110に移行する。
【0076】
次に、ST1108において、過去の定常雑音区間の平均パワに比べて現在のサブフレームにおけるパワが大きいかどうかが判定される。具体的には、例えば、パワ変化算出器123の出力結果(ポストフィルタ出力信号のパワと定常雑音区間の平均パワとの比)について閾値を設定し、ポストフィルタ出力信号のパワと定常雑音区間の平均パワとの比が設定した閾値よりも大きい場合にはST1109に移行し、ST1109において、現在のサブフレームは音声区間であると判定が修正される。
【0077】
閾値の具体的な値としては、2.0((式7)を用いて求められるポストフィルタ出力信号のパワPが、雑音区間で求められる定常雑音区間の平均パワPN'の2倍を越えるような場合にST1109へ移行する。平均パワPN'は例えば(式9)を用いて定常雑音区間のサブフレーム毎に更新される)を用いることにより、精度良く判定を行うことができる。
【数9】
Figure 0003806344
一方、前記パワ変化が設定した閾値よりも小さい場合は、ST1112に移行する。この場合、ST1107における判定結果は修正されず、定常雑音区間と判定されたままである。
【0078】
次に、ST1110において、定常的な状態がどれだけ続いているかのチェックと、その定常状態が有声定常状態であるかがチェックされる。そして、現在のサブフレームが有声定常状態ではなく、かつ、所定の時間長だけ定常的な状態が続いている場合にはST1111に移行し、ST1111において定常雑音区間であると判定しなおされる。具体的には、まず、定常的な状態であるかどうかが、サブフレーム間変動算出器119の出力(サブフレーム間変動量)を用いて判断される。
【0079】
つまり、ST1102で求められたサブフレーム間変動量が小さければ(所定の閾値(例えばST1105で用いた閾値と同じ値)以下であれば)定常的な状態であると判断される。そして、定常的な状態であると判断された場合は、その状態が過去どれだけの時間長に渡って続いているかがチェックされる。また、有声定常状態であるかのチェックは、音声復号化装置101または定常雑音区間検出装置102から提供される、有声定常状態かどうかを示す情報に基づいて行われる。
【0080】
例えば、伝送されてきた符号情報に前記情報がモード情報として含まれている場合は、復号したモード情報を利用して有声定常状態かどうかチェックする。そうでない場合は、定常雑音区間検出装置102に備えられた有声定常性を判定する手段が前記情報を出力し、その情報によって有声定常状態かどうかをチェックする。上述したチェックの結果、所定の時間長以上(例えば20サブフレーム以上)定常的な状態が続き、かつ、有声定常状態でない場合には、ST1108でパワ変化が大きいと判断された場合であっても、ST1111において定常雑音区間であると判定しなおされ、ST1112に移行する。逆に、ST1110の判定結果がNoの場合(有声定常区間である場合や、定常的な状態が定められた時間長だけ続いていない場合)は、音声区間であるという判定が維持され、ST1114に移行する。
【0081】
次に、ここまでの過程で定常雑音区間であると判定されている場合は、ST1112において、復号信号の周期性が高いかどうか判定される。具体的には、第2の判定器124により、音声復号化装置101(より正確には利得符号帳112)から入力された適応符号利得、およびピッチ履歴分析器122から入力されたピッチ履歴分析結果に基づいて現在のサブフレームにおける復号信号の周期性が判定される。この場合、適応符号利得には、サブフレーム間の変動を滑らかにするためにAR型の平滑化処理を行った値を用いることが好ましい。
【0082】
この周期性の判定は、例えば、平滑化処理を行った適応符号利得(平滑化適応符号利得)について閾値を設定し、平滑化適応符号利得が所定の閾値を越えている場合には、周期性が高いと判定してST1113に移行する。ST1113においては、音声区間であると判定しなおされる。
【0083】
また、ピッチ履歴分析結果において過去のサブフレームにおけるピッチ周期が分類されているグループ数が少ないほど周期的な信号が続いている可能性が高いので、このグループ数を基にして周期性を判定する。例えば、過去10サブフレームのピッチ周期が3種類以下のグループに分類されている場合は、周期的な信号が続いている区間である可能性が高いためST1113に移行し、音声区間である(定常雑音区間でない)と判定しなおす。
【0084】
ST1112の判定結果がNoである場合(平滑化適応符号利得が所定の閾値よりも小さく、かつ、ピッチ履歴分析結果において過去のピッチ周期が多くのグループに分類されている場合)は、定常雑音区間であるという判定結果が維持されたまま、ST1115に移行する。
【0085】
次に、ここまでの過程で判定結果が音声区間である場合は、ST1114に移行してハングオーバカウンタを所定のハングオーバサブフレーム数(例えば10)にセットする。ハングオーバカウンタには、初期値としてハングオーバサブフレーム数が設定され、上述したST1101〜ST1113までの処理によって定常雑音区間であると判定された場合に1ずつデクリメントされる。そして、ハングオーバカウンタが「0」の場合、本定常雑音区間判定方法において、最終的に定常雑音区間と判定される。
【0086】
ここまでの過程で判定結果が定常雑音区間である場合、ST1115に移行して、ハングオーバカウンタがハングオーバ区間(「1」〜「ハングオーバサブフレーム数」)内であるかどうかのチェックが行なわれる。つまり、ハングオーバカウンタが「0」かどうかがチェックされる。ハングオーバ区間内である場合(ハングオーバカウンタが「1」〜「ハングオーバサブフレーム数」である場合)には、ST1116に移行して音声区間であると判定結果を修正し、ST1117に移行する。そして、ST1117においてハングオーバカウンタを1だけデクリメントする。ハングオーバ区間内でない場合(ハングオーバカウンタが「0」である場合)には、定常雑音区間であるという判定結果を維持したままST1118に移行する。
【0087】
次に、判定結果が定常雑音区間である場合には、ST1118において、平均雑音パワ算出器126により平均雑音パワが更新される。この更新は、例えば判定結果が定常雑音区間であれば(式9)によって行われ、そうでなければ更新せずに以前の値を保持するように行われる。ただし、判定結果が定常雑音区間でなくても平均雑音パワよりも現在のポストフィルタ出力信号パワの方が小さくなっている場合は、(式9)の平滑化係数 0.9 を小さくした式を用いて平均雑音パワの更新を行い、平均雑音パワを下げる。このような更新を行うことによって、音声区間中で急に背景雑音レベルが下がった場合にも対応できるようにすることができる。
【0088】
次に、ST1119において、平均LSP算出器125により定常雑音区間における平均LSPが更新される。この更新は、例えば判定結果が定常雑音区間であれば(式6)によって行われ、そうでなければ更新せずに以前の値を保持するように行われる。なお、過去定常雑音区間と判定された時間長が短い場合は(式6)の平滑化係数 0.95 を小さくしても良い。
【0089】
最後に、ST1120において、第2の判定器124により判定結果が出力され、平均LSP算出器125により更新した平均LSPが出力され、平均雑音パワ算出器126により更新された平均雑音パワが出力される。
【0090】
以上説明したように、本実施の形態によれば、LSPを用いた定常性の判定により定常雑音区間であると判断された場合であっても、適応符号利得およびピッチ周期を用いて現在のサブフレームの周期性の強さを検査(判定)し、この周期性の強さに基づいて定常雑音区間かどうかを再チェックする。したがって、正弦波や定常母音のように定常だが雑音的でない信号についても、正しく判定することが出来る。
【0091】
(実施の形態2)
図2に、本発明の実施の形態2に係る定常雑音後処理装置の構成を示す。図2において、図1に示す部分と同じ部分については、図1と同じ符号を付してその詳細な説明は省略する。
【0092】
定常雑音後処理装置200は、雑音生成部201と加算器202とスケーリング部203とを含んで構成される。この定常雑音後処理装置200は、雑音生成部201で生成された擬似的な定常雑音信号を加算器202において音声復号化装置101からのポストフィルタ出力信号に加算し、加算後のポストフィルタ出力信号をスケーリング部203においてスケーリングすることによりパワ調整し、後処理後のポストフィルタ出力信号を出力する。
【0093】
雑音生成部201は、音源生成器210と、合成フィルタ211と、LSP/LPC変換器212と、乗算器213と、乗算器214と、利得調整器215と、を含んで構成される。スケーリング部203は、スケーリング係数算出器216と、サブフレーム間平滑化器217と、サンプル間平滑化器218と、乗算器219と、を含んで構成される。
【0094】
次いで、上記構成の定常雑音後処理装置200の動作について説明する。
音源生成器210は、音声復号化装置101に備えられた固定符号帳113からランダムに雑音符号ベクトルを選択し、選択した雑音符号ベクトルに基づいて雑音音源信号を生成して合成フィルタ211へ出力する。雑音音源信号の生成方法は、音声復号化装置101に備えられた固定符号帳113から選択した雑音符号ベクトルに基づいて生成する方法に限定されず、演算量、メモリ量、および生成される雑音信号の性質の面から最も有効と判断される方法をシステムごとに決めて用いることができる。音声復号化装置101に備えられた固定符号帳113から雑音符号ベクトルを選択して使用することは、一般的には最も有効な方法である。LSP/LPC変換器212は、平均LSP算出器125からの平均LSPをLPCに変換して合成フィルタ211へ出力する。
【0095】
合成フィルタ211は、LSP/LPC変換器212から入力されたLPCを用いてLPC合成フィルタを構築する。合成フィルタ211は、音源生成器210から入力される雑音音源信号を入力としてフィルタ処理を行って雑音信号を合成し、合成した雑音信号を乗算器213および利得調整器215へ出力する。
【0096】
利得調整器215は、合成フィルタ211の出力信号のパワを、平均雑音パワ算出器126からの平均雑音パワにスケーリングするための利得調整係数を算出する。この利得調整係数は、サブフレームの間で滑らかな連続性が保たれるように平滑化処理が行なわれ、サブフレーム内でも滑らかな連続性が保たれるようにサンプル毎の平滑化処理も行なわれる。最終的にサンプル毎の利得調整係数が乗算器213へ出力される。具体的には(式10)から(式12)のようにして利得調整係数が求められる。Psnは合成フィルタ211によって合成された雑音信号のパワ((式7)と同様にして求められる)で、Psn'はPsnをサブフレーム間で平滑化したものであり、(式10)を用いて更新される。PN'は(式9)で求められる定常雑音信号パワであり、Sclは処理サブフレームにおけるスケーリング係数である。Scl'は、サンプル毎に適用される利得調整係数であり、サンプル毎に(式12)を用いて更新される。
Psn'=0.9×Psn'+0.1×Psn (式10)
Scl=PN'/Psn' (式11)
Scl'=0.85×Scl'+0.15×Scl (式12)
【0097】
乗算器213は、利得調整器215から入力される利得調整係数を、合成フィルタ211から出力される雑音信号に乗算する。なお、利得調整係数は1サンプル毎に可変である。この乗算結果は、乗算器214に出力される。
【0098】
乗算器214は、生成する雑音信号の絶対的なレベルを調整するために、予め定められた定数(例えば0.5程度)を乗算器213からの出力信号に乗算する。乗算器214は、乗算器213の中に組み込んでしまっても良い。レベル調整された信号(定常雑音信号)は、加算器202へ出力される。以上のようにして、滑らかな連続性の保たれた定常雑音信号が生成される。
【0099】
加算器202は、雑音生成部201で生成された定常雑音信号を、音声復号化装置101(より正確にはポストフィルタ118)から出力されたポストフィルタ出力信号に加算し、スケーリング部203(より正確にはスケーリング計数算出器216および乗算器219)へ出力する。
【0100】
スケーリング係数算出器216は、音声復号化装置101(より正確にはポストフィルタ118)から出力されたポストフィルタ出力信号のパワと、加算器202から出力された定常雑音信号加算後のポストフィルタ出力信号のパワとをそれぞれ算出し、両者の比を取ることにより、スケーリング後の信号パワの前記復号信号(定常雑音加算前)のパワからの変動を小さくするスケーリング係数を算出し、サブフレーム間平滑化器217へ出力する。具体的には、スケーリング係数SCALEは(式13)の様にして求められる。Pはポストフィルタ出力信号パワで(式7)で求められ、P'はポストフィルタ出力信号に定常雑音信号を加算した信号のパワでPと同様の式で求められる。
SCALE=P/P' (式13)
【0101】
サブフレーム間平滑化器217は、スケーリング係数がサブフレーム間で緩やかに変化するようにサブフレーム間で平滑化処理を行う。ただし、平滑化処理によって音声信号自身のパワ変動が滑らかにされてパワ変動に対する追従性が悪くなってしまうことを避けるため、音声区間ではこの平滑化は行わない(もしくは極めて弱い平滑化とする)。音声区間かどうかは、図1に示す第2の判定器124から出力される判定結果に基づいて判断する。平滑化されたスケーリング係数はサンプル間平滑化器218へ出力される。平滑化されたスケーリング係数SCALE'は(式14)によって更新される。
SCALE'=0.9×SCALE'+0.1×SCALE (式14)
【0102】
サンプル間平滑化器218は、サブフレーム間で平滑化されたスケーリング係数がサンプル間で緩やかに変化するようにサンプル間で平滑化処理を行う。この平滑化処理は、AR型の平滑化処理により行うことが出来る。具体的には、サンプル毎の平滑化スケーリング係数SCALE''は(式15)によって更新される。
SCALE''=0.85×SCALE''+0.15×SCALE' (式15)
このように、スケーリング係数に対してサンプル間で平滑化処理を行って、サンプル毎に徐々にスケーリング係数を変化させることにより、スケーリング係数がサブフレーム境界付近で不連続となることを防ぐことが出来る。サンプル毎に算出されたスケーリング係数は、乗算器219へ出力される。
【0103】
乗算器219は、サンプル間平滑化器218から出力されたスケーリング係数を、加算器202から入力された定常雑音信号付加後のポストフィルタ出力信号に乗算し、最終出力信号として出力する。
【0104】
上記構成において、平均雑音パワ算出器126から出力される平均雑音パワ、LSP/LPC変換器212から出力されるLPC、およびスケーリング係数算出器216から出力されるスケーリング係数は、いずれも後処理を行う際に使用するパラメータである。
【0105】
このように、本実施の形態によれば、雑音生成部201により生成された雑音が復号信号(ポストフィルタ出力信号)に加算された後に、スケーリング部203においてスケーリングが行なわれる。これにより、加算後の復号信号パワをスケーリングするので、加算後の復号信号パワを加算前の復号信号パワと同程度のレベルにすることが出来る。また、フレーム間平滑化とサンプル間平滑化を併用しているので、定常雑音がよりスムーズになり、主観的な定常雑音の品質を改善することが可能となる。
【0106】
(実施の形態3)
図3に、本発明の実施の形態3に係る定常雑音後処理装置の構成を示す。図3において、図2に示す部分と同じ部分については、図2と同じ符号を付してその詳細な説明は省略する。
【0107】
本装置は、実施の形態2に示した定常雑音後処理装置200の構成に加えて、フレーム消失時に雑音信号の生成やスケーリングに必要となるパラメータを保持するメモリと、そのメモリの保持内容を制御するフレーム消失補償処理制御部と、そのフレーム消失補償処理の際に用いられる切替スイッチと、をさらに備えて構成される。
【0108】
定常雑音後処理装置300は、雑音生成部301と、加算器202と、スケーリング部303と、フレーム消失補償処理制御部304と、を含んで構成される。
【0109】
雑音生成部301は、図2に示した雑音生成部201の構成に加えて、フレーム消失時に雑音信号の生成やスケーリングに必要となるパラメータを保持するメモリ310、311と、フレーム消失補償処理の際に開閉する切替スイッチ313、314と、を含んで構成される。また、スケーリング部303は、フレーム消失時の雑音信号の生成やスケーリングに必要となるパラメータを保持するメモリ312と、フレーム消失補償処理の際に開閉する切替スイッチ315と、を含んで構成される。
【0110】
次いで、上記定常雑音後処理装置300の動作について説明する。まず、雑音生成部301の動作について説明する。
【0111】
メモリ310は、平均雑音パワ算出器126から切替スイッチ313を介して出力される、定常雑音信号のパワ(平均雑音パワ)を保持し、これを利得調整器215へ出力する。
【0112】
切替スイッチ313は、フレーム消失補償処理制御部304からの制御信号によって開閉する。具体的には、フレーム消失補償処理を行う旨を示す制御信号が入力された場合は開放され、それ以外の場合は閉じている。切り替えスイッチ313が開放された場合、メモリ310は直前のサブフレームにおける定常雑音信号のパワを保持しており、次に切替スイッチ313が閉じるまでその直前のサブフレームにおける定常雑音信号のパワが必要に応じて利得調整器215へ出力される。
【0113】
メモリ311は、LSP/LPC変換器212から切替スイッチ314を介して出力される、定常雑音信号のLPCを保持し、これを合成フィルタ211へ出力する。
【0114】
切替スイッチ314は、フレーム消失補償処理制御部304からの制御信号によって開閉する。具体的には、フレーム消失補償処理を行う旨を示す制御信号が入力された場合は開放され、それ以外の場合は閉じている。切替スイッチ314が開放された場合、メモリ311は直前のサブフレームにおける定常雑音信号のLPCを保持しており、次に切替スイッチ314が閉じるまでその直前のサブフレームにおける定常雑音信号のLPCが必要に応じて合成フィルタ211へ出力される。
【0115】
次いで、スケーリング部303の動作について説明する。
メモリ312は、スケーリング係数算出器216によって算出され、切替スイッチ315を介して出力される、スケーリング係数を保持し、これをサブフレーム間平滑化器217に出力する。
【0116】
切替スイッチ315は、フレーム消失補償処理制御部304からの信号によって開閉する。具体的には、フレーム消失補償処理を行う旨を示す制御信号が入力された場合は開放され、それ以外の場合は閉じている。切替スイッチ315が開放された場合、メモリ312は直前のサブフレームにおけるスケーリング係数を保持しており、次に切替スイッチ315が閉じるまで直前のサブフレームにおけるスケーリング係数が必要に応じてサブフレーム間平滑化器217へ出力される。
【0117】
フレーム消失補償処理制御部304は、誤り検出などにより得られたフレーム消失情報を入力として、消失フレーム中のサブフレーム、および消失フレームの後の誤りから復帰したサブフレーム(誤り復帰サブフレーム)において、フレーム消失補償処理を行う旨を示す制御信号を切替スイッチ313〜315へ送る。この誤り復帰サブフレームにおけるフレーム消失補償処理は、複数のサブフレーム(例えば2サブフレーム)において行われる場合がある。フレーム消失補償処理とは、消失フレームより前の(過去の)フレームの情報を用いて、パラメータの補間や音量の制御を施すことにより、一部のサブフレームにおいて情報が欠落した場合に、復号結果の品質の劣化を防止する処理である。尚、消失フレームの後の誤り復帰サブフレームにおいて極端なパワの減衰が全く起こらない場合は、前述のような誤り復帰サブフレームにおけるフレーム消失補償処理は不要となる。
【0118】
一般的に用いられるフレーム消失補償法では、過去の情報を用いて現フレームの外挿処理を行う。この場合、外挿したデータは主観的品質を落とす要因となるので、徐々に信号パワを減衰させる。しかしながら、定常雑音区間においてフレームが消失した場合、外挿による歪が与える主観的品質の劣化よりも、パワの減衰による音切れ感が与える主観的品質の劣化の方が大きくなることがしばしばある。特にインターネット通信に代表されるパケット通信ではフレームが連続して消失することがあり、このような音切れによる劣化は著しくなる傾向がある。このような音切れ感が原因となる品質劣化を抑えるために、本発明に係る定常雑音後処理装置においては、利得調整器215において、平均雑音パワ算出器126からの平均雑音パワにスケーリングするための利得調整係数を算出して定常雑音信号に乗算する。また、スケーリング係数算出器216において、ポストフィルタ出力信号が加算された定常雑音信号のパワが大きく変動しないようにスケーリング係数を算出し、このスケーリング係数を乗算した信号を最終的な出力信号として出力する。これにより、最終的な出力信号のパワの変動を小さく抑えて、フレーム消失前の定常雑音信号レベルを維持することが出来るので、音切れ感による主観的品質の劣化を抑えることが出来る。
【0119】
(実施の形態4)
図4は、本発明の実施の形態4に係る音声復号化処理システムの構成を示す図である。この音声復号化処理システムは、実施の形態1において説明した符号受信装置100、音声復号化装置101、および定常雑音区間検出装置102と、実施の形態3において説明した定常雑音処理装置300と、を備えて構成される。尚、この音声復号化処理システムは、定常雑音処理装置300に代えて実施の形態2において説明した定常雑音処理装置200を備えるようにしても良い。
【0120】
以下、上記音声復号化処理システムの動作について説明する。各構成要素の詳しい説明は、実施の形態1〜実施の形態3において図1〜図3を用いて行ったので、図4において図1〜図3に示す部分と同じ部分には、図1〜図3の対応部分と同じ符号を付してその詳細な説明は省略する。
【0121】
符号受信装置100は符号化信号を伝送路から受信し、各種パラメータを分離して音声復号化装置101へ出力する。音声復号化装置101は、各種パラメータから音声信号を復号し、ポストフィルタ出力信号とその他復号処理の途中で得られた必要なパラメータを定常雑音区間検出装置102および定常雑音後処理装置300へ出力する。定常雑音区間検出装置102は、音声復号化装置101から入力される情報を用いて定常雑音区間かどうかの判定を行い、判定結果と判定処理の途中で得られた必要なパラメータを定常雑音後処理装置300へ出力する。
【0122】
定常雑音後処理装置300は、音声復号化装置101から入力したポストフィルタ出力信号に対して、音声復号化装置101から入力した各種パラメータ情報と定常雑音区間検出装置102から入力した判定情報および各種パラメータ情報とを用いて、定常雑音信号を生成してポストフィルタ出力信号に重畳する後処理を行い、その処理結果を最終的なポストフィルタ出力信号として出力する。
【0123】
図5は、本実施の形態に係る音声復号化システムの処理の流れを示すフロー図である。本図は図4における定常雑音区間検出装置102および定常雑音後処理装置300の処理の流れについてのみ示しており、符号受信装置100および音声復号化装置101の処理に関しては一般的に用いられる公知の処理によって実現可能であるので省略する。以下、図5を参照して、本システムの音声復号化装置101以降の処理について動作を説明する。まず、ST501において、本実施の形態に係る音声復号化システムに備えられたメモリに保持される各種変数の初期化を行う。この初期化されるメモリの例と、初期値の例について図6に示す。
【0124】
次いで、ST502からST505までの処理をループ的に行う。この処理は音声復号化装置101から出力されるポストフィルタ出力信号がなくなるまで(音声復号化装置の処理が止まるまで)行われる。ST502では、モード判定が行われ、現在のサブフレームが定常雑音信号区間(定常雑音モード)か音声区間(音声モード)か判定される。ST502で行われる処理の流れについては、後に詳述する。
【0125】
次いで、ST503において、定常雑音後処理装置300により定常雑音の付加(定常雑音後処理)が行われる。ST503で行われる定常雑音後処理の流れについては、後に詳述する。次いで、ST504において、スケーリング部303により最終のスケーリング処理が行われる。ST504で行われるスケーリング処理の流れについては、後に詳述する。
【0126】
次いで、ST505において、最後のサブフレームかどうかをチェックし、ST502〜ST505のループ処理を終了するか継続するか決定する。このループ処理は音声復号化装置101から出力されるポストフィルタ出力信号がなくなるまで(音声復号化装置101の処理が止まるまで)行われる。このループ処理が終了すると、本実施の形態に係る音声復号化システムにおける処理は全て終了する。
【0127】
次に、図7を用いてST502におけるモード判定処理の流れを説明する。まず、ST701で現在のサブフレームが消失フレームかどうかをチェックする。
【0128】
消失フレームの場合は、ST702に進み、フレーム消失補償処理用のハングオーバカウンタを所定の値(ここでは「3」とする。)にセットして、ST704へ進む。このハングオーバカウンタに設定される所定の値は、フレーム消失が発生した後に、サブフレームが正常であっても(フレーム消失が発生していなくとも)フレーム消失補償処理を継続するサブフレームの数に対応する。
【0129】
消失フレームでない場合は、ST703に進み、フレーム消失補償処理用ハングオーバカウンタの値が0かどうかをチェックする。チェックの結果、フレーム消失補償処理用ハングオーバカウンタの値が0でない場合は、フレーム消失補償処理用ハングオーバカウンタの値を1だけデクリメントしてST704へ進む。
【0130】
次に、ST704でフレーム消失補償処理を行うかどうかの判断を下す。現在のサブフレームが消失フレームでもなく、かつ、消失フレーム直後のハングオーバ区間でもない場合は、フレーム消失補償処理は行わないと判定してST705へ進む。現在のサブフレームが消失フレームか、もしくは、消失フレーム直後のハングオーバ区間である場合は、フレーム消失補償処理を行わないと判定してST707へ進む。
【0131】
ST705では、実施の形態1で示した平滑化適応符号利得の算出とピッチ履歴分析が行われる。これらの処理については実施の形態1で示したので省略する。尚、ピッチ履歴分析の処理フローは図10を用いて説明した。これらの処理の後、ST706へ進む。ST706では、モード選択を行う。モード選択処理の流れは図11及び図12に詳細に示した。ST708では、ST706において算出される定常雑音区間の平均的LSPをLPCへ変換する。このST708における処理は、ST706に続いて行わなくとも良く、ST503で定常雑音信号の生成を行う前に行えば良い。
【0132】
ST704で、フレーム消失補償処理を行うと判断された場合は、ST707において、直前のサブフレームにおけるモードと定常雑音区間の平均LPCを、夫々現在のサブフレームにおけるモードおよび平均LPCとして繰り返し用いるように設定し、ST709へ進む。
【0133】
ST709では、現在のサブフレームにおけるモード情報(定常雑音モードか音声信号モードかを示す情報)と、現在のサブフレームにおける定常雑音区間の平均的LPCをメモリにコピーする。尚、現在のモード情報は、本実施の形態においては必ずしもメモリに保持しておく必要はないが、このモード判定結果を他のブロック(例えば音声復号化装置101)で使用する場合はメモリに保持しておくことが必要である。以上により、ST502によるモード判定処理は終了する。
【0134】
次に、図8を用いてST503における定常雑音付加処理の流れを説明する。まず、ST801において、音源生成器210により雑音符号ベクトルが生成される。雑音ベクトルの生成方法はいかなる方法でも良いが、実施の形態2で示したように、音声復号化装置101に備えられた固定符号帳113からランダムに選択する手法が有効である。
【0135】
次に、ST802において、ST801で生成した雑音ベクトルを駆動音源としてLPC合成フィルタ処理を行う。次に、ST803において、ST802で合成された雑音信号の帯域制限フィルタ処理を行って、雑音信号の帯域を音声符号化装置101から出力される復号信号の帯域と合わせる。尚、この処理は必ずしも必須ではない。次に、ST804において、ST803で得られた帯域制限後の合成雑音信号のパワが算出される。
【0136】
次に、ST805において、ST804で得られた信号パワの平滑化処理を行う。この平滑化は連続するサブフレーム間で(式1)に示すようなAR処理を行うことにより容易に実現することが出来る。平滑化の係数kはどれだけスムーズな定常信号を得たいかによって定められ、0.05〜0.2程度の比較的強い平滑化を行うことが好ましい。具体的には(式10)のような式を用いる。
【0137】
次に、ST806において、生成しようとしている定常雑音信号のパワ(ST1118において算出済み)とST805で得られたサブフレーム間平滑化後の信号パワとの比を利得調整係数として算出する(式11)。算出された利得調整係数はサンプル毎の平滑化処理が行われ(式12)、ST803にて得られた帯域制限フィルタ処理後の合成雑音信号に乗ぜられる。そして、この利得調整係数を乗ぜられた定常雑音信号に、予め定められた定数(固定利得)が乗じられる。この固定利得は、定常雑音信号の絶対的なレベルを調整するために乗じられる。
【0138】
次に、ST807において、音声復号化装置101から出力されたポストフィルタ出力信号にST806にて生成された合成雑音信号を加算し、加算後のポストフィルタ出力信号のパワを算出する。
【0139】
次に、ST808において、音声復号化装置101から出力されたポストフィルタ出力信号のパワとST807にて算出されたパワとの比がスケーリング係数として算出される(式13)。スケーリング係数は、定常雑音付加処理の後段で行われるST504のスケーリング処理において用いられる。
【0140】
最後に、加算器202により、ST806にて生成された合成雑音信号(定常雑音信号)と、音声復号化装置101から出力されたポストフィルタ出力信号とが加算される。尚、この処理はST807に含めて行っても良い。以上により、ST503における定常雑音付加処理が終了する。
【0141】
次に、図9を用いてST504におけるスケーリングの流れを説明する。まず、ST901において、現在のサブフレームがフレーム消失補償処理の対象サブフレームかどうかをチェックする。そして、現在のサブフレームがフレーム消失補償処理の対象サブフレームであればST902へ進み、そうでなければST903へ進む。
【0142】
ST902ではフレーム消失補償処理を行う。すなわち、直前のサブフレームにおけるスケーリング係数を現在のスケーリング係数として繰り返し使用するように設定を行い、ST903へ進む。
【0143】
ST903では、定常雑音区間検出装置102から出力された判定結果により、モードが定常雑音モードかどうかのチェックを行う。モードが定常雑音モードであればST904へ進み、そうでなければST905へ進む。
【0144】
ST904では、前述の(式1)を用いて、スケーリング係数のサブフレーム間平滑化処理が行われる。この場合、kの値は0.1程度とする。具体的には(式14)のような式を用いる。これは、定常雑音区間おけるサブフレーム間のパワ変動をスムーズにするために行われる。この平滑化処理を行った後、ST905へ進む。
【0145】
ST905では、スケーリング係数をサンプル毎に平滑化し、平滑化したスケーリング係数をST503で生成された定常雑音付加後のポストフィルタ出力信号に乗じる。サンプル毎の平滑化も前述の(式1)を用いて行われ、この場合のkの値は0.15程度とする。具体的には(式15)のような式を用いる。以上により、ST504のスケーリング処理は終了し、スケーリングされた定常雑音付加後のポストフィルタ出力信号が得られる。
【0146】
尚、上記各実施の形態において、平滑化や平均的な値の算出に(式1)などに示される計算式を用いたが、平滑化に用いる式はこのような計算式に限定されない。例えば、過去所定の区間における平均値などを用いても良い。
【0147】
本発明は上記実施の形態1から4に限定されず、種々変更して実施することが可能である。例えば、本発明の定常雑音区間検出装置はいかなるタイプの復号器に対しても適用可能である。
【0148】
なお、本発明は上記実施の形態に限定されず、種々変更して実施することが可能である。例えば、上記実施の形態では、音声復号化装置として行う場合について説明しているが、これに限られるものではなく、この音声復号化方法をソフトウェアとして行うことも可能である。
【0149】
例えば、上記音声復号化方法を実行するプログラムを予めROM(Read Only Memory)に格納しておき、そのプログラムをCPU(Central Processor Unit)によって動作させるようにしても良い。
【0150】
また、上記音声復号化方法を実行するプログラムをコンピュータで読み取り可能な記憶媒体に格納し、記憶媒体に格納されたプログラムをコンピュータのRAM(Random Access memory)に記録して、コンピュータをそのプログラムにしたがって動作させるようにしても良い。
【0151】
【発明の効果】
以上説明したように、本発明によれば、適応符号利得およびピッチ周期を用いて復号信号の周期性の強さを判定し、この周期性の強さに基づいて定常雑音区間かどうかを判定する。したがって、正弦波や定常母音のように定常だが雑音的でない信号についても、その信号状態を正しく判定することが出来る。
【図面の簡単な説明】
【図1】本発明の実施の形態1に係る定常雑音区間判定装置の構成を示す図
【図2】本発明の実施の形態2に係る定常雑音後処理装置の構成を示す図
【図3】本発明の実施の形態3に係る定常雑音後処理装置の構成を示す図
【図4】本発明の実施の形態4に係る音声復号化処理システムの構成を示す図
【図5】音声復号化システムの処理の流れを示すフロー図
【図6】音声復号化システムに備えられたメモリの例と、このメモリの初期値の例について示す図
【図7】モード判定処理の流れを示す図
【図8】定常雑音付加処理の流れを示す図
【図9】スケーリングの流れを示す図
【図10】グルーピングの手順について説明するフロー図
【図11】モード選択の流れの一部を示す図
【図12】モード選択の流れの一部を示す図
【符号の説明】
100 符号受信装置
101 音声復号化装置
102 定常雑音区間検出装置
103 第1の定常雑音区間検出部
104 第2の定常雑音区間検出部
105 定常雑音特徴抽出部
110 LPC復号器
111 適応符号帳
112 利得符号帳
113 固定符号帳
117、211 合成フィルタ
118 ポストフィルタ
119 サブフレーム間変動算出器
120 距離計算器
121 第1の判定器
122 ピッチ履歴分析器
123 パワ変化算出器
124 第2の判定器
125 平均LSP算出器
126 平均雑音パワ算出器
200、300 定常雑音後処理装置
201、301 雑音生成部
202 加算器
203、303 スケーリング部
210 音源生成器
212 LSP/LPC変換器
213、214、219 乗算器
215 利得調整器
216 スケーリング係数算出器
217 サブフレーム間平滑化器
218 サンプル間平滑化器
304 フレーム消失補償処理制御部
310、311、312 メモリ
313、314、315 切替スイッチ

Claims (6)

  1. 過去複数のサブフレームにおけるピッチ周期を1つ以上のクラスに分類し、前記クラスが複数存在する場合にピッチ周期の差が所定の第1閾値より小さいクラスを1つのグループにまとめ、前記グループの数を分析結果として得るピッチ履歴分析部と、
    前記分析結果が所定の第2閾値より小さい信号区間を音声区間と判定する判定手段と、を具備する定常雑音区間検出装置。
  2. 定常雑音区間の信号のLSPベクトルの平均を求める平均LSP算出手段と、
    現サブフレームにおけるLSPベクトルと前記平均LSP算出手段が算出した平均LSPとの距離を計算する距離計算手段と、
    サブフレーム間のLSPベクトルの変動量が所定の第3閾値より小さく、かつ、前記距離計算手段が計算した距離が所定の第4閾値より小さい区間を定常雑音区間と仮判定する仮判定手段と、を具備し、
    前記判定手段は、前記仮判定手段が定常雑音区間であると判定した場合にのみ、判定処理を行う請求項1に記載の定常雑音区間検出装置。
  3. サブフレーム間で適応符号帳利得を平滑化する平滑化処理手段と、
    前記仮判定手段が判定した定常雑音区間の信号パワを算出する信号パワ算出手段と、を具備し、
    前記判定手段は、前記分析結果が前記第2閾値以上であり、前記平滑化処理された適応符号帳利得が所定の第5閾値より小さく、かつ、前記信号パワ算出手段が算出した信号パワが背景雑音信号の平均パワに所定値を乗算した値より小さい信号区間を定常雑音区間と判定する、請求項2に記載の定常雑音区間検出装置。
  4. 過去複数のサブフレームにおけるピッチ周期を1つ以上のクラスに分類し、前記クラスが複数存在する場合にピッチ周期の差が所定の第1閾値より小さいクラスを1つのグループにまとめ、前記グループの数を分析結果として得るピッチ履歴分析工程と、
    前記分析結果が所定の第2閾値より小さい信号区間を音声区間と判定する判定工程と、を具備する定常雑音区間検出方法。
  5. 定常雑音区間の信号のLSPベクトルの平均を求める平均LSP算出工程と、
    現サブフレームにおけるLSPベクトルと前記平均LSP算出工程で算出した平均LSPとの距離を計算する距離計算工程と、
    サブフレーム間のLSPベクトルの変動量が所定の第3閾値より小さく、かつ、前記距離計算工程で計算した距離が所定の第4閾値より小さい区間を定常雑音区間と仮判定する仮判定工程と、を具備し、
    前記判定工程は、前記仮判定工程で定常雑音区間であると判定した場合にのみ、判定処理を行う請求項4に記載の定常雑音区間検出方法。
  6. サブフレーム間で適応符号帳利得を平滑化する平滑化処理工程と、
    前記仮判定工程で判定した定常雑音区間の信号パワを算出する信号パワ算出工程と、を具備し、
    前記判定工程は、前記分析結果が前記第2閾値以上であり、前記平滑化処理された適応符号帳利得が所定の第5閾値より小さく、かつ、前記信号パワ算出工程で算出した信号パワが背景雑音信号の平均パワに所定値を乗算した値より小さい信号区間を定常雑音区間と判定する、請求項5に記載の定常雑音区間検出方法。
JP2001367831A 2000-11-30 2001-11-30 定常雑音区間検出装置及び定常雑音区間検出方法 Expired - Fee Related JP3806344B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001367831A JP3806344B2 (ja) 2000-11-30 2001-11-30 定常雑音区間検出装置及び定常雑音区間検出方法

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2000-366342 2000-11-30
JP2000366342 2000-11-30
JP2001367831A JP3806344B2 (ja) 2000-11-30 2001-11-30 定常雑音区間検出装置及び定常雑音区間検出方法

Publications (2)

Publication Number Publication Date
JP2002236495A JP2002236495A (ja) 2002-08-23
JP3806344B2 true JP3806344B2 (ja) 2006-08-09

Family

ID=26605030

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001367831A Expired - Fee Related JP3806344B2 (ja) 2000-11-30 2001-11-30 定常雑音区間検出装置及び定常雑音区間検出方法

Country Status (1)

Country Link
JP (1) JP3806344B2 (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100463657B1 (ko) * 2002-11-30 2004-12-29 삼성전자주식회사 음성구간 검출 장치 및 방법
US8160868B2 (en) 2005-03-14 2012-04-17 Panasonic Corporation Scalable decoder and scalable decoding method
JP2007104167A (ja) * 2005-10-03 2007-04-19 Oki Electric Ind Co Ltd 送話状態判定方法
US8175868B2 (en) 2005-10-20 2012-05-08 Nec Corporation Voice judging system, voice judging method and program for voice judgment
US8812306B2 (en) 2006-07-12 2014-08-19 Panasonic Intellectual Property Corporation Of America Speech decoding and encoding apparatus for lost frame concealment using predetermined number of waveform samples peripheral to the lost frame
US9258661B2 (en) * 2013-05-16 2016-02-09 Qualcomm Incorporated Automated gain matching for multiple microphones
EP2922054A1 (en) 2014-03-19 2015-09-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and corresponding computer program for generating an error concealment signal using an adaptive noise estimation
EP2922056A1 (en) 2014-03-19 2015-09-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and corresponding computer program for generating an error concealment signal using power compensation
EP2922055A1 (en) * 2014-03-19 2015-09-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and corresponding computer program for generating an error concealment signal using individual replacement LPC representations for individual codebook information
EP3594946B1 (en) * 2014-05-01 2020-10-28 Nippon Telegraph And Telephone Corporation Decoding of a sound signal
JP6996185B2 (ja) 2017-09-15 2022-01-17 富士通株式会社 発話区間検出装置、発話区間検出方法及び発話区間検出用コンピュータプログラム

Also Published As

Publication number Publication date
JP2002236495A (ja) 2002-08-23

Similar Documents

Publication Publication Date Title
KR100566163B1 (ko) 음성 복호화 장치, 음성 복호화 방법 및 프로그램을기록한 기록 매체
US8825477B2 (en) Systems, methods, and apparatus for frame erasure recovery
KR101406113B1 (ko) 스피치 신호에서 천이 프레임을 코딩하기 위한 방법 및 장치
EP1164580B1 (en) Multi-mode voice encoding device and decoding device
JP3346765B2 (ja) 音声復号化方法及び音声復号化装置
US10141001B2 (en) Systems, methods, apparatus, and computer-readable media for adaptive formant sharpening in linear prediction coding
MXPA04011751A (es) Metodo y dispositivo para ocultamiento de borrado adecuado eficiente en codecs de habla de base predictiva lineal.
US20130218578A1 (en) System and Method for Mixed Codebook Excitation for Speech Coding
JP3806344B2 (ja) 定常雑音区間検出装置及び定常雑音区間検出方法
JP2016507789A (ja) 平均符号化レートを制御するためのシステムおよび方法
TW201434033A (zh) 用於判定音調脈衝週期信號界限之系統及方法
JP2002140099A (ja) 音声復号化装置
JP3199142B2 (ja) 音声の励振信号符号化方法および装置
JP2000235400A (ja) 音響信号符号化装置、復号化装置、これらの方法、及びプログラム記録媒体
JPH0519796A (ja) 音声の励振信号符号化・復号化方法
JPH09244695A (ja) 音声符号化装置及び復号化装置
JP2001265396A (ja) マルチモード音声符号化装置及び復号化装置
CN113826161A (zh) 用于检测待编解码的声音信号中的起音以及对检测到的起音进行编解码的方法和设备
Tasaki et al. New excitation codebook search methods to reduce perceptual degradation of celp
JPH07199994A (ja) 音声符号化方式
Popescu et al. A DIFFERENTIAL, ENCODING, METHOD FOR THE ITP DELAY IN CELP
JPH1020896A (ja) コード駆動線形予測音声符号化方式
JPH07248795A (ja) 音声処理装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040301

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20051102

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051115

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060116

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060207

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060407

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060502

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060512

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090519

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100519

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110519

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110519

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120519

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130519

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130519

Year of fee payment: 7

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees