JPH07509792A

JPH07509792A - 定常信号と非定常信号との識別

Info

Publication number: JPH07509792A
Application number: JP7500526A
Authority: JP
Inventors: ヴィグレン，カール，トルビョルン
Original assignee: テレフオンアクチーボラゲツト　エル　エム　エリクソン
Priority date: 1993-05-26
Filing date: 1994-05-11
Publication date: 1995-10-26
Also published as: SE9301798L; SE9301798D0; FI950311A0; WO1994028542A1; CN1218945A; HK1013881A1; KR100220377B1; CN1110070A; EP0653091B1; FI950311A; DE69421498T2; GR3032107T3; TW324123B; ES2141234T3; AU681551B2; CN1046366C; AU6901694A; DK0653091T3; AU4811296A; SE501305C2

Abstract

(57)【要約】本公報は電子出願前の出願データであるため要約のデータは記録されません。

Description

【発明の詳細な説明】定常信号と非定常信号との識別技術分野本発明は、定常信号と非定常信号との１１１１方法に関する。この方法は、例えば、移動無線通信システムにおいて黄帝を表す信号が、定常であるか否かを検出するために用いられつる。本発明はまた、定常背量を検出し、かつエンコード／デコードするために、この方法を用いる方法および装置に関する。

発明の背景多くの現代の音声コーグは、ＬＰＣ（線型予測コーグ）として知られる音声コーグの大きい部類に属する。この部類に属するコーグの例には、米国国防省による４、８Ｋｂｉｔ／５ＣＥＬＰコーダ、欧州ディジタル・セルラ移動電話システムＧＳＭ（７）ＲＰＥ−ＬＴＰ：Ｉ−ダ、対応する米国システムＡＤＣ（７）ＶＳＥＬＰコーダ、およびパシフィック・ディジクル・セルラ・システムＰＤＣのＶＳＥＬＰコーダがある。

これらのコーグは全て、信号発生プロセスにおいて信号源−フィルタ概念を用いている。フィルタは、再生されるべき信号の短時間スペクトルをモデル化するために用いられ、一方、信号源は、全ての他の信号変化を操作するものと仮定される。

これらの信号源−フィルタ・モデルの共通の特徴は、再生されるべき信号が、信号源の出力信号を定めるパラメータと、フィルタを定めるフィルタパラメータとによって表されることである。「線型予測」という用語は、フィルタパラメータを推定するために一般的に用いられる方法に関するものである。すなわち、再生されるべき信号は、フィルタパラメータの組によって部分的に表される。

信号モデルとして信号源−フィルタの組合せを用いる方法は、音声信号に対し比較的に良く働くことが立証された。しかし、移動電話の使用者が沈黙していて、入力信号が周囲音を含む時、現在公知のコーグがこの状況に対処するのは困難である。そのわけは、それらは音声信号に対して最適化されているからである。通信リンクの他の側にいる聴取者は、聞きなれた黄帝がコーグにより「誤処理」されたために認識されえない時、当惑しやすい。

ここで参照して、その内容を本明細書に取込む、スウェーデン国特許出願第９３　００２９０−５号によれば、この問題は、コーグが受信した信号内の黄帝の存在を検出し、もし信号が黄帝によって支配されていれば、ある、いわゆるアンチスワール・アルゴリズム（ａｎｔｉ−ｓｗｉｒｌｉｎｇ　ａｌｇｏｒｉｔｈｍ）によりフィルタパラメータの計算を修正することによって解決される。

しかし、異なる黄帝は同じ統計的特徴番もたないことが判明した。自動車の雑音のような、１つの形式の黄帝は、定常であるとして特徴づけられうる。バックグラウンドバブルのような、もう１つの形式のものは、非定常であるとして特徴づけられうる。実験は、上述のアンチスワール・アルゴリズムが、定常背量に対しては良く働くが、非定常背合に対しては良く働かないことを示した。従って、定常背量と非定常背合とを識別して、もし黄帝が非定常なものならばアンチスワール・アルゴリズムをバイパスしうるようにすることが望ましい。

発明の要約従って、本発明は、移動無線通信システムにおける黄帝を表す信号などの、定常信号と非定常信号とを識別する方法を提供することを目的とする。

本発明によれば、この方法は、（ａ）Ｎ＞２とするとき、所定の長さのタイムウィンドウＴのＮ個のタイムサブウィンドウＴ１のそれぞれにおける信号の統計的モーメントの１つを推定するステップと、（ｂ）ステップ（ａ）において前記信号の定常性の手段として得られた前記推定値の変化を推定するステップと、（Ｃ）ステップ（ｂ）において得られた前記推定された変化が所定の定常性限度 γを超えているか否かを決定するステップと、を特徴とする。

本発明のもう工つの目的は、フィルタに接続された信号源を含む、ディジタルフレームに基づく音声エンコーダおよび／またはデコーダにおいて、定常背量を検出し、かつエンコードおよび／またはデコードする方法であって、前記フィルタが、エンコードおよび／またはデコードされるべき信号を再生するための、それぞれのフレームに対するフィルタパラメータの組によって定められる、前記方法を提供することである。

本発明によれば、この方法は、（ａ）前記エンコーダ／デコーダへ送られた信号が、主として音声または黄帝のいずれを表しているかを検出するステップと、（ｂ）前記エンコーダ／デコーダへ送られた前記信号が、主として黄帝を表している時、該黄帝が定常であるか否かを検出するステップと、（ｃ）前記信号が定常である時、連続するフレーム間の時間的変化および／または前記組内の少なくともあるフィルタパラメータの領域を制限するステップと、を含む。

本発明のもう１つの目的は、フィルタに接続された信号源を含む、ディジタルフレームに基づく音声コーグおよび／またはデコーダにおいて、定常背量をエンコードおよび／またはデコードする装置であって、前記フィルタが、エンコードおよび／またはデコードされるべき信号を再生するための、それぞれのフレームに対するフィルタパラメータの組によって定められる、前記装置を提供することである。

本発明によれば、この装置は、（ａ）前記エンコーダ／デコーダへ送られた信号が、主として音声または黄帝のいずれを表しているかを検出する手段と、（ｂ）前記エンコーダ／デコーダへ送られた前記信号が、主として黄帝を表している時、該黄帝が定常であるか否かを検出する手段と、（Ｃ）前記エンコーダ／デコーダへ送られた前記信号が定常背量を表す時、連続するフレーム間の時間的変化および／または前記組内の少なくともあるフィルタパラメータの領域を制限する手段と、図面の簡単な説明本発明、および本発明の他の諸口的および諸利点は、添付図面と共に以下の説明を参照することにより最も良く理解されつる。添付図面において、第１図は、本発明の方法を行う手段を備えた音声エンコーダのブロック図であり、第２図は、本発明の方法を行う手段を倫えた音声デコーダのブロック図であり、第３図は、第１図の音声エンコーダ内に用いられうる信号識別器のブロック図であり、゛　第４図は、第１図の音声エンコーダ内に用いられつる好ましい信号識別器のブロック図である。

実施例の詳細な説明本発明は、定常信号と非定常信号とを識別するために一般的に用いられうるが、以下においては本発明を、移動無線通信システムにおける黄帝を表す信号の定常性の検出に関して説明する。

第１図の音声コーグを参照すると、入力線ｌＯ上において入力信号ｓ　（ｎ）がフィルタ推定器１２へ送られ、フィルタ推定器１２は標準化されたプロシージャによりフィルタパラメータを推定する（レビンソンーダービン（Ｌｅｖｉｎｓｏｎ−Ｄｕｒｂｉｎ）アルゴリズム、バーブ（Ｂｕｒｇ）アルゴリズム、コレスキー（Ｃｈｏｌｅｓｋｙ）分解（１９７８年、プレンティス−ホール（Ｐｒｅｎｔｉｃｅ−Ｈａｌ　ｌ）発行、ラビナー（Ｒａｂｉｎｅｒ）、シエイフ７　（Ｓｃｈａｆｅｒ）著、「音声信号のディジタル処理（Ｄｉｇｉ　ｔａｌＰｒｏｃｅｓｓｉｎｇ　ｏｆ　５ｐｅｅｃｈ　Ｓｉｇｎａｌｓ）　Ｊ　、第８章）、ジュール（Ｓｃｈｕｒ）アルゴリズム（１９９１年１月、アイイーイーイー・エスピー− マガジン（ＩＥＥＥ　ＳＰ　Ｍａｇａｚｉｎｅ）、第１２頁ないし第３６頁に所載の、ストロバッハ（Ｓけｏｂａｃｈ）著、「レビンソンおよびジュールのアルゴリズムの新形式（Ｎｅｗ　Ｆｏｒｍ　ｏｆ　Ｌｅｖｉｎｓｏｎ　ａｎｄ　ＳｃｈｕｒＡｌｇｏｒｉｔｈｎｓ）　」）　、ル・ルーーゲゲン（Ｌｅ　Ｒｏｕｘ− Ｇｕｅｇｕｅｎ）アルゴリズム（１９７７年、アイイーイーイー・トランザクションズ・オブ・アカウスティクス（＋［＋ＢＥＴｒａｎｓａｃｔｉｏｎｓ　ｏｆ　Ａｃｏｕｓｔｉｃｓ入音声および信号処理（Ｓｐｅｅｃｈ　ａｎｄ　ＳｉｇｎａｌＰｒｏｃｅｓｓｉｎｇ）　Ｊ　、第ＡＳＳＰ−２６巻、第３号、第２５７頁ないし第２５９頁に所載の、ル・ルー（Ｌｅ　Ｒｏｕｘ）、ゲーゲン（Ｇｕｅｇｕｅｎ）著ｒ部分相関係数の固定点計算（Ａ　Ｆｉｘｅｄ　Ｐｏ１ｎｔ　Ｃｏｍｐｕｔａｔｉｏｎ　ｏｆ　Ｐａｒｔｉａｌ　Ｃｏｒｒｅｌａｔｉｏｎ　ＣｏｅｆｆｉｃｉｅｎｔｓjＪ　）、モトローラ社（ＭｏＬｏｒｏｌａ　Ｉｎｃ、）を権利者とする米国特許第４　５４４　９１９号に説明されている、いわゆるＦＬＡＴアルゴリズム）。フィルタ推定器１２は、それぞれのフレームに対するフィルタパラメータを出力する。これらのフィルタパラメータは励振解析器１４へ送られ、励振解析器１４はまた線１０上の入力信号をも受ける。励振解析器１４は、標準的プロシージャにより最良の信号源または励振パラメータを決定する。そのようなプロシージャの例には、ＶＳＥＬＰ（１９９１年、クルワー・アカデミツク・パブリッシャーズ（Ｋｌｕｗｅｒ　ＡｃａｄｅｍｉｃＰｕｂｌ　１ｓｈｅｒｓ）発行、アタル（ＡＬａｌ）外編、「音声コーディングにおける進歩（Ａｄｖａｎｃｅｓ　ｉｎ　５ｐｅｅｃｈ　Ｃｏｄｉｎｇ）Ｊ　、第６９頁ないじ第７９頁に所載の、ジャーリン（Ｇｅｒｓｏｎ）　、ジャンラフＱａｓｉｕｋ）著［ベクトル和により励振される線形予測（Ｖｅｃｔｏｒ　Ｓｕ＋＋＋　Ｅｘｃｉｔｅｄ　Ｌｉｎｅａｒ　Ｐｒｅｄｉｃｔｉｏｎ）　（ＶＳ　ＥＬ　Ｐ）　Ｊ　）　、ＴＢ　Ｐ　Ｅ　i前記参照文献の第１４５頁ないし第１５６頁に所載の、サラミ（Ｓａｌａｍｉ）著「２進パルス励振：低複雑性ＣＥＬＰコーディングへの新しいアプローチ（ＢｉｎａｒｙＰｕｌｓｅ　Ｅｘｃｉｔａｔｉｏｎ　：　Ａ　Ｎｏｖｅｌ　Ａｐｐｒｏａｃｈ　ｔｏ　Ｌｏｗ　Ｃｏｍｐｌｅｘｉｔｙ　Ｃ［！ＬＰ　Ｃｏｄ奄獅■jＪ　）、確率コードブック（前記参照文献の第１２１頁ないし第１３４頁に所載の、カンブベル（Ｃａｍｐｂｅ　ｌ　Ｉ　）外著、ｒＤｏＤ４．８ＫＢＰＳ規格（提案合衆国規格１０１６）　（Ｔｈｅ　ＤｏＤ４．　８ＫＢＰＳ　５ｔａｎｄａｒｄ　（Ｐｒｏｐｏｓｅｄ　Ｆｅｄｅｒａｌ　５ｔａｎｄａｒｄ　１　０１６）’Ｉ　Ｊ　）、ＡＣＥＬＰ　（１９８７年、音響、音声および信号処理に関する国際会議会報（Ｐｒｏｃ、　Ｉｎｔｅｒｎａｔｉｏｎａｌ　Ｃｏｎｆｅｒｅｎｃｅ　ｏｎ　Ａｃｏｕｓｔｉｃｓ、　５ｐｅｅｃｈ　ａｎｄＳｉｇｎａｌ　Ｐｒｏｃｅｓｓｉｎｇ　１９８７　）　、第１９５３頁ないし第１９５６頁に所載の、アダウル（Ａｄｏｕｌ）、ランプリン（Ｌａｍｂｌｉｎ）著、［音声のＣＥＬＰ：ｌ− ディングのためのある代数的構造の比較（Ａ　Ｃｏｍｐａｒｉｓｏｎ　ｏｆ　Ｓｏｍｅ　Ａｌｇｅｂｌａｉｃ　５ｔｒｕｃｔｕｒｅ　ｆｏｒＣＥＬＰ　Ｃｏｄｉｎｇ　ｏｆ　５ｐｅｅｃｈ）Ｊ　）がある。これらの励振パラメータ、フィルタパラメータ、および線ｌＯ上の入力信号は、音声検出器１６へ送られる。この検出器１６は、入力信号が、主として音声または黄帝のいずれを含むかを決定する。可能な検出器は、例えば、ＧＳＭシステムにおいて定められた音声活動検出器（音声活動検出（Ｖｏｉｓｅ　Ａｃｔｉｖｉｔｙ　Ｄｅｔｅｃｔｉｏｎ）　、０３Ｍ勧告０６．３２、ＥＴＳＩ／ＰＴ　１２）である。適切な検出器は、ＥＰ、Ａ、３３５　５２１　（ブリティシュ・テレコム・ピーエルンー（ＢＲＩＴＩＳ）Ｉ　置ＥＣ０Ｍ　ＰＬＣ））に説明されている。検出器１６は、コーグの入力信号が主として音声を含むか否かを示す出力信号Ｓ／Ｂを発生する。この出力信号は信号推定器２４を経て、フィルタパラメータと共にパラメータ修正器１８へ送られる。

上述のスウェーデン国特許出願によれば、パラメータ修正器１８は、エンコーダへの入力信号内に音声信号が存在しない場合に、決定されたフィルタパラメータを修正する。もし音声信号が存在すれば、フィルタパラメータは、変更なくパラメータ修正器工８を通過する。ことによると変更されたフィルタパラメータおよび励振パラメータが、チャネルコーグ２０へ送られ、チャネルコーグ２０は、線２２上のチャネルを経て送られるビット流を発生する。

パラメータ修正器１８によるパラメータ修正は、いくつかの方法で行われつる。

１つの可能な修正は、フィルタの帯域幅拡大である。これは、フィルタの極が複素平面の原点に向かって移動せしめられることを意味する。原フィルタＨ（ｚ）　−１／Ａ　（ｚ）は、次式によって与えられるものと仮定する。

極が、因子ｒ、０≦ｒ≦ｌ、により移動せしめられる時は、帯域幅の拡大バージョンは、Ａ（ｚ／ｒ）、すなわち、により定められる。

もう１つの可能な修正は、時間領域におけるフィルタパラメータの低域フィルタリングである。すなわち、フレームからフレームへのフィルタパラメータの速い変化を、該パラメータの少なくともあるものを低域フィルタリングすることにより減衰せしめる。この方法の特殊な場合は、いくつかのフレーム、例えば４ないし５フレームにおいて、フィルタパラメータを平均する。

パラメータ修正器１８はまた、これらの２方法の組合せを用い、例えば、帯域幅の拡大に続いて低域フィルタリングを行うこともできる。また、低域フィルタリングから始め、次に帯域幅の拡大を追加することもできる。

以上の説明においては、信号識別器２４を無視した。しかし、上述のように、黄帝は同じ統計的特徴をもつとは限らないので、信号を、音声を表す信号と、黄帝を表す信号とに分割するのでは不十分であることが判明した。従って、黄帝を表す信号を、第３図および第４図に関連してさらに後述するように、信号識別器２４において定常信号と非定常信号とに分割する。従って、信号識別器２４から線２６上への出力信号は、コーディングされるべきフレームが、定常背量または音声／非定常背量のいずれを含むかを示し、前者を含む場合はパラメータ修正器１８が上述のパラメータ修正を行い、後者を含む場合は修正を行わない。

以上の説明においては、パラメータ修正は送信機内のコーグにおいて行われるものと仮定した。しかし、同様のプロシージャは受信機のデコーダにおいても行われうろことを認識すべきである。これは、第２図の実施例により示されている。

第２図において、チャネルからのビット流は、入力線３０上に受信される。このビット流は、チャネルデコーダ３２によりデコードされる。チャネルデコーダ３２は、フィルタパラメータおよび励振パラメータを出力する。この場合、これらのパラメータは、送信機のコーグにおいて修正されていないものと仮定する。

フィルタパラメータおよび励振パラメータは音声検出器３４へ送られ、音声検出器３４は、これらのパラメータを解析して、これらのパラメータにより再生されるへき信号が、音声信号を含むか否かを決定する。音声検出器３４の出力信号Ｓ／Ｂは、信号識別器２４′を経て、パラメータ修正器３６へ送られ、パラメータ修正器３６はさらにフィルタパラメータをも受ける。

上述のスウェーデン国特許出願によれば、もし音声検出器３４が、受けた信号内に音声信号が存在しないことを決定すれば、パラメータ修正器３６は、第２図のパラメータ修正器１８が行う修正と同様の修正を行う。もし音声信号が存在すれば、修正は行われない。ことによると修正されたフィルタパラメータおよび励振パラメータが音声デコーダ３８へ送られ、音声デコーダ３８は、線４０上へ合成出力信号を発生する。音声デコーダ３８は、励振パラメータを用いて上述の信号源信号を発生し、またことによると修正されたフィルタパラメータを用いて信号源−フィルタモデルにおけるフィルタを定める。

第１図のコーグにおけると同様に、信号識別器２４′は、定常背合と非定常背合とを識別する。このようにして、定常背合を含むフレームのみが、パラメータ修正器３６を作動させる。しかし、この場合、信号識別器２４“は、音声信号５（ｎ）に対するアクセスはもたず、その信号を定める励振パラメータに対してのみアクセスを有する。識別プロセスは、第３図および第４図に関連してさらに後述される。

第３図は、第１図の信号識別器２４のブロック図を示す。識別器２４は、入力信号ｓ　（ｎ）と、音声検出器１６からの出力信号Ｓ／Ｂと、を受ける。信号Ｓ／ＢはスイッチＳＷへ送られる。もし音声検出器１６が、信号ｓ　（ｎ）が主として音声を含むことを決定すれば、スイッチＳＷは上部位置をとり、その場合、信号Ｓ／Ｂは識別器２４の出力へ直接送られる。

もし信号ｓ　（ｎ）が主として背合を含めば、スイッチＳＷは下部位置をとり、信号Ｓ／Ｂおよびｓ　（ｎ）は共に計算器手段５０へ送られ、計算器手段５ｏは、それぞれのフレームのエネルギーＥ　（Ｔ、　）を推定する。ここでＴ１は、フレームｌの時間の長さを示しうる。しかし、実施例においては、Ｔ１は２つの連続するフレームのサンプルを含み、Ｅ　（Ｔ、　）はこれらのフレームの全エネルギーを示す。この実施例においては、次のウィンドウＴＩ＋１は１音声フレームシフトされて、それが１つの新しいフレームと、前ウィンドウＴ、からの１つのフレームとを含むようにされる。従って、これらのウィンドウは、ｌフレーム重なり合うことになる。前記エネルギーは、例えば次式により推定されつる。

ただし、ｓ　（ｎ）　＝ｓ　（ｔ、　）である。

エネルギーの推定値Ｅ　（Ｔ、　）は、バッファ５２内に記憶される。このバッファは、例えば、１００ないし２００フレームからの１００ないし２００エネルギー推定値を含有しうる。新しい推定値がバッファ５２に入ると、最も古い推定値はバッファから削除される。従って、バッファ５２は、Ｎをバッファのサイズとすると、常に最後のＮ個のエネルギー推定値を含む。

次に、バッファ５２のエネルギー推定値は計算器手段５４へ送られ、計算器手段５４は次式によって試験変数■７を計算する。

ただし、Ｔは、全ての（ことによると重なり合っている）タイムウィンドウＴ１の累算された時間の長さである。Ｔは通常、例えば１００ないし２００音声フレームまたは２ないし４秒の、固定された長さを有する。言葉で表現すれば、ｖＴは、期間Ｔ内における最大エネルギー推定値を、同じ期間内における最小エネルギー推定値で割ったものである。この試験変数■１は、最後のＮフレーム内におけるエネルギーの変化の推定値である。この推定値は後に、信号の定常性を決定するのに用いられる。もし信号が定常であれば、そのエネルギーはフレームからフレームへと極めて僅かしか変化せず、それは試験変数ＶＴが１に近いことを意味する。非定常信号の場合は、エネルギーはフレームからフレームへとがなり変化し、それは推定値が１よりかなり大きいことを意味する。

試験変数ＶＴは比較器５６へ送られ、そこで試験変数ＶＴは定常性限度γと比較される。もしｖＴがγを超えていれば、非定常信号が出力線２６上に示される。

これは、フィルタパラメータが修正されるべきでないことを示す。γに対する適切な値は２ないし５、特に３ないし４であることがわかっている。

以上の説明から、フレームが音声を含むか否かを検出するためには、その特定のフレームを考慮しさえすればよいことは明らかであり、それは音声検出器１６において行われる。しかし、もしフレームが音声を含まないことが決定されれば、定常性の識別を行うために、そのフレームの周囲のフレームからのエネルギー推定値を蓄積することが必要になる。従って、Ｎ＞２であり通常は１００ないし２００程度であるＮ個の記憶位置を有するバッファが必要となる。このバッファはまた、それぞれのエネルギー推定値に対するフレーム番号をも記憶しつる。

試験変数Ｖ、が試験され終わり、比較器５６において決定がなされ終わると、次のエネルギー推定値が計算器手段５０において発生せしめられ、バッファ５２内ヘンフトされて、その後、新しい試験変数Ｖ、が計算され、比較器５６において γと比較される。このようにして、タイムウィンドウＴは、時間的に１フレーム前方ヘシフトされる。

以上の説明においては、音声検出器１６が背合を含むフレームを検出し終わると、それは後続のフレーム内における背合の検出を続けて、試験変数■、を形成するために十分なエネルギー推定値を、バッファ５２内に蓄積するものと仮定した。しかし、音声検出器１６が、背合を含む少数のフレームを検出した後、音声を含むいくらかのフレームに続いて、新しい背合を含むフレームを検出する場合がある。この理由のために、バッファ５２は「有効時」においてエネルギー値を記憶し、これは、背合を含むフレームに対してのみエネルギー値が計算され、記憶されることを意味する。これはまた、それぞれのエネルギー推定値がなぜ対応するフレーム番号と共に記憶されるかの理由でもある。そのわけは、これが、長時間にわたって背合がなかった時、エネルギー値が関連を有するためには古すぎることを決定する機構を与えるからである。

起こりうるもう１つの場合は、計算されるエネルギー値が少ない、短時間の背合が存在し、極めて長期間の間に、その外に背合がない時である。この場合、バッファ５２は、適度の時間内に有効な試験変数の計算を行うのに十分なエネルギー値を含まない。このような場合に対する解決法は、タイムアウト限度を整定し、その後は、定常性の決定のための十分な基礎がないので、背合を含むフレームが音声として処理されるよ・う４こ定めることである。

さらに、あるフレームが非定常背合を含むことが決定された時、ある場合には定常性限度γを、例えば３．５から３．３へ低下させて、後のフレームに対する決定が「定常」と「非定常」との間であちこちにスイッチすることを防止するとよい。このようにすると、もし非定常フレームが発見されれば、後続のフレームも同様に非定常として分類されやすくなる。結局、定常フレームが発見された時は、定常性限度γは再び増加せしめられる。この技術は、　「ヒステリシス」と呼ばれる。

もう１つの好ましい技術は「延期（ｈａｎｇｏｖｅｒ）　Ｊである。延期とは、信号識別器２４によるある決定が最終的なものになるまでに、少なくともある数のフレーム、例えば、５フレームの間、持続しなくてはならないことを意味する。好ましくは、　「ヒステリシス」と「延期」とは組合わされる。

以上から、第３図の実施例が、典型的な場合において１００ないし２００（もしフレーム番号も記憶されるとすれば２００ないし４００）メモリ位置を有する、かなりのサイズのバッファ５２を必要とすることは明らかである。このバッファは、メモリリソースが極めて少ない信号プロセッサ内に通常存在するので、バッファのサイズを減少させることが望ましい。従って、第４図は、バッファの使用方法が、バッファ５２°を制御するバッファ制御器５８によって修正された、信号識別器２４の実施例を示す。

バッファ制御器５８の目的は、不必要なエネルギー推定値Ｅ　（Ｔ、　）が記憶されないように、バッファ５２°を管理することである。このアプローチは、最も極端なエネルギー推定値のみが実際にＶＴの算出に関連していることの観察に基づいている。従って、僅かだけの大きい、また僅かだけの小さいエネルギー推定値のみをバッファ５２′内に記憶させれば良い近似になるはずである。従って、バッファ５２゛　を、２つのバッファＭＡＸＢＵＦおよびＭＩＮＢＵＦに分割する。

古いエネルギー推定値は、ある時間の後にバッファから消失しなくてはならないので、対応するエネルギー値のフレーム番号もＭＡＸＢＵＦおよびＭＩＮＢＵＦ内に記憶する必要がある。バッファ制御器５８が行う、バッファ５２°内に値を記憶するための１つの可能なアルゴリズムは、添付されている付録のパスカルプログラムに詳述されている。

第４図の実施例は、第３図の実施例に比較すると、準最適なものである。その理由は、例えば、大きいフレームエネルギーが、より大きくより古いフレームエネルギーがＭＡＸＢＵＦ内に存在する時に、ＭＡＸＢＵＦに入りえないからである。この場合、その特定のフレームエネルギーは、たとえ、それが事実上もっと遅（なりえたとしても、前の大きい（しかし古い）フレームエネルギーがシフトアウトされ終わった時失われる。従って、実際に計算されるのはＶ工ではなく、次式のように定義されるＶ′１である。

しかし実際的な観点からは、この実施例は「十分に良＜」、必要なバッファサイズの、１００ないし２００エネルギー推定値の記憶から、約１０推定値（ＭＡＸＢＵＦに対して５、ＭＩＮＢＵＦに対して５）への激減を可能ならしめる。

第２図の説明に関連して上述したように、信号識別器２４゛　は信号ｓ　（ｎ）に対するアクセスをもたない。しかし、フィルタパラメータまたは励振パラメータは通常、フレームエネルギーを表すパラメータを含むので、エネルギー推定値はこのパラメータから得られうる。このようにして、米国規格ｌ５−５４により、フレームエネルギーは励振パラメータｒ（０）によって表される。（もちろん、第１図の信号識別器２４において、「（０）をエネルギー推定値として用いることも可能である。）もう１つのアプローチは、第２図において、信号識別器２４゛およびパラメータ修正器３６を、音声デコーダ３８の右側へ移動させることである。このようにすれば、信号識別器２４゛　は、デコードされた信号を表す、すなわち第１図の信号ｓ　（ｎ）と同じ形式の、信号４０に対しアクセスしうる。

しかし、このアプローチは、パラメータ修正器３６の後に、修正された信号を再生するためのもう１つの音声デコーダを必要とする。

信号識別器２４．２４°の上述の説明においては、定常性の決定がエネルギーの計算に基つくものと仮定されていた。しかし、エネルギーは、定常性の決定のために用いられつる異なる次数の統計的モーメントの単なる１つに過ぎない。このようにして、（信号のエネルギーまたは分散に対応する）２次のモーメント以外の統計的モーメントを用いることは、本発明の範囲内にある。定常性のために異なる次数のいくつかの統計的モーメントを試験すること、および最終的な統計的決定をこれらの試験の結果に基づかせることもまた可能である。

さらに、定められた試験変数■、のみが可能な試験変数ではない。例えば、もう１つの試験変数は、次式のように定められうる。

ただし、式＜ｄＥ　（Ｔ、）／ｄ　ｔ＞は、フレームからフレームへのエネルギーの変化速度の推定値を表す。例えば、前式内の推定値を計算するために、例えば、線形傾向モデルによって、カルマンフィルタが適用されつる（１９８８年、エムアイティー・プレス（ＭＩＴ　Ｐｒｅｓｓ）発行、エイ・ゲルブ（んＧｅ１ｂ）著、「応用最適推定（Ａｐｐｌｉｅｄ　ｏｐｔｉｍｌ　ｅｓｔｉｍｔｉｏｎ）　Ｊ参照）。しかし、本明細書において前に定義した試験変数ＶＴは、信号識別器を背量のレベルに感じないようにする、スケール因子に無関係な望ましい特徴を有する。

明の精神および範囲から逸脱することなく、本発明に対してさまざまな改変および変更を行いうろことを理解しつるはずである。

付録ＰＲＯＣＥＤＵＲＥ　ＦＬｓＣａｔＤｅｔ（ｚｐｂａｃｔ　：　ｒｅａｌＡｃｆＶｅｃｅｏｒＴｙｐｅｉ（入力　）ＺＦＬｓｐ　：　Ｂｏｏｌｅａｎ；　（入力　）ＺＦＬｎｒＭｉｎＦｒａｍｅｓ　：　Ｉｎｅｅｇｅｒｉ　（入力　）ＺＦＬｎｒＦｒａｍｅｓ　、工ｎｅｅ（ｉｅｒ；　（入力　）ＺＦＬｒｒａｘＴｈｒｅｓｈ　：　Ｒｅａｌ；　（入力　）ＺＦＬｍｉｎＴｈｒｅｓｈ　：　Ｒｅａｌ；　（入力　）ＶＡＲＺＦＬｐｏｗＯｌｄ　二Ｒｅａｌ；　（入力ｌ出力）ＶＡＲＺＦＬｎｒＳａｖｅｄ　：　Ｉｎｔｅｇｅｒ；　（入力／出力）ＶＡＲｚＦＬｒＩＩａｘＢｕｔ　：　ｒｅａｌｓｔａＩ−ＢｕｆＴｙｐｅ；　（入力ｌ出力）ＶＡＲｚＦヒ宸Ｃｉｍｅ　：　ｉｎｔｅｇｅｒｓｅａｅＢｕｆＴｙｐｅ；　（入力／出力）ＶＡＲＺＦＬｍｉｎＢｕｆ　：　ｒｅａｌｓ！ａｅＢｕｆＴｙｐｅ；　（入力／出力）ＶＡＲＺＦＬｍｉｎＴｉｍｅ　：　ｉｎｅｅｇｅｒｓｅａセＢｕｆＴｙｐ！；　（入力／出力）ＶＡＲＺＦＬｐｒａｌＮＯ５しａｔ　：　Ｂｏｏｌｅａｎ）；　（入力ｌ出力）ＶＡＲ１：工ｎｔｅ９ｅｒｉｍａｘｉｎｖｕｍ、ｍ１ｎｉ＋ｗｍ　：　Ｒｅａｌ；ｐｏｗＮｏｗルｅｓｔｖａｒ　＋　Ｒｅａｌ；ｏ１ｄＮｏｓｅａセ　：　Ｂｏｏｌｅａｎ；ｒｅｐｌａｃｅ ’Ｎｒ　：　工ｎｔｅｑ＠ｒｊＡＢＥＬｓｔａｅＥｎｄ；ＢＥＧＩＮｏｌｄＮｏｓｔ、ａｔ　ニー　ＺＦＬｐｒｅｌＮＯＳｅａＪＺＦＬｐｒｅｌＮｏＳｌ：ａｅ　ニー　ＺＦＬｓｐ；ＸＦ　ＮＯＴ　ＺＦＬｓｐ　ＡＮＤ　（ＺＦＬａｃｆ［Ｏ］　＞　０１　ＴＨＥＮ　ＢＥＧＩＮ（もし音声でなければ）ＺＦＩ、ｐｒｅｌＮｏｓｔａｔ　ニー　Ｔｒｕｅ；ＺＦＬｎｒＳａｖｅｄ　二＝　ＺＦＬｎｒＳａｖｅｄ　＋　ｌ；ｐｏｗＮｏｗ　ニー　ＺＦＬａｃｆ［Ｏ］　＋　ＺＦＬｐｏｗＯｌｄ；ＺＦＬｐｏｗＯｌｄ　ニー　ＺＦＬａＣｆ［Ｏ］；工Ｆ　ＺＦＬｎｒＳａｖｅｄ　＜　２　ＴＩ（ＥＮＧＯＴＯ５ｅａｔ−Ｅｎｄ；工Ｆ　ＺＦＬｎｒＳａｖｅｄ　＞　ＺＦＬｎｒＦｒａｍｅＳ　ＴＨＥＮＺＦＬｎｒＳａｖｅｄ　：ｍ　ＺＦＬｎｒＦｒａｍｅｓ；（最大値バッファ内に古い要素があるか否かをチェックする）ＦＯＲｉ　：　−ＩＴｏ　ｓｔａｊＢｕｆｆｅｒＬｅｎｇｔ、ｈ　Ｄｏ　ＢＥＧ工ＮＺＦＬｍａｘＴｉｍｅ［ｉｌ　：ｗａ　ＺＦＬｍａｘＴｉｍｅ［ｉｌ　＋　１；工Ｆ　ＺＦＬｍａｘＴｉｍｅ［ｉｌ　＞　ＺＦＬｎｒＦｒａｍｅｓ　ＴＨＥＮ　ＢＥＧ工ＮＺＦＬｍａｘＢｕｆ［ｉｌ　：Ｉ −ｐＯＷＮＯｗ；ＺＦＬｍａｘＴｉｍｅ［１］　：　！　１ｒＥＮＤ。

ＥＮＤ；（最小値バッファ内に古い要素があるか否かをチェックする）ＦＯＲｉ　ニー　Ｉ　ＴＣ）６しａｔＢｕｆｆｅｒＬｅｎｇｔｈ　Ｄｏ　ＢＴＡＩＮＺＦＬａｎｉｎＴｉｍｅ［ｉｌ　：ｘ　ＺＦＬｒａｉｎＴｉｍｅ［ｉｌ　＋　ｌ；工Ｆ　ＺＦＬｍｉｎＴｉｍｅ［ｉｌ　＞　ＺＦＬｎｒＦｒａｍｅｓ　ＴＨＥＮ　ＢＥＧ工ＮＺＦＬｍｉｎＢｕｆ［ｉｌ　：冨ｐｏｗＮｏｗ；ＺＦＬｍｉｎＴｉｍｅ［ｉｌ　：！　ｌ；１：ＮＤ；ＥＮＤ。

ｆｆ１ａ！ｉｍｕｍ　：ｍ　−１Ｅ３８；ｎ’ｌｌ！’ｌｉｍｕｆｎ　：ｍ　− ｍａｘｉｍｕｍ；ｒｅｐｌａｃａＮｒ　：ｗ＝　Ｏ；（最大値バッファ内の要素が置換されるべきか否かをチェックし、最大値を見出すＦＯＲｉ　：ｍ　ｌ　Ｔｏ　ｓｌ−ａｔＢｕｆｆｅｒＬｅｎｇｅｈ　Ｄｏ　ＢＥＧ工Ｎ工Ｆ　ｐｏｗＮｏｗ　＞ｍ　ＺＦＬｍａｘＢｕｆ［ｉｌ　ＴＨＥＮｒｅｐｌａｃｅＮｒ　：ｍ　ｉ；エＦ　ＺＦＬ、ｍａｘＢｕｆ［ｉｌ　）旗　ｍａｘｉｍｕｍ　ＴＨＥＮｍａｘｉｍｕｍ　：！　ＺＦＬｍａｘＢｕｆ［ｉｌ　；ＥＮＤ。

ＩＦ　ｒｅｐｌａｃｅＮｒ　＞　ＯＴＨＥＮ　ＢＥＧ工ＮＺＦＬｍａＸＴ１ｍｅ［ｒｅｐｌａＣｅＮｒｌ　：ｌＩＩ’Ｌ；ＺＦＬｍａｘＢｕｆ［ｒｅｐｌａｃｅＮｒｌ　：ｗ　ｐｏｗＮｏｗ；工Ｆ　ＺＦＬｍａｘＢｕｆ［ｒｅｐｌａｃｅＮｒｌ　＞ｚ　ｍａｘｉｍｕｍ　ＴＨＥＮｍａｘｉｍｕｍ　：雪　ＺＦＬｍａｘＢｕｆ［ｒｅｐｌａｃｅＮｒｌ；ＥＮＤ。

ｒｅｐｌａｃｅＮｒ　：ｚ　Ｏ；（最小値バッファ内の要素が置換されるべきか否かをチェックし、ＦＯＲｉ　＋　−Ｉ　Ｔｏ　ｓｔａｈＢｕｆｆｅｒＬｅｎｇｅｈ　Ｄｏ　ＢＥＧ工Ｎ工Ｆ　ｐｏｗＮｏｗ　＜ｗ　ＺＦＬｍｉｎＢｕｆ［ｉｌ　ＴＨＥＮｒｅｐｌａｃａＮｒ　：ｘ　ｉ；工Ｆ　ＺＦＩｘｉｎＢｕｆ［ｉｌ　＜ｍ　ｍｉｎｉｍｕｍ　ＴＨＥＮｍｉｎｉｍｕｍ　：　ｗ　ＺＦＬｍｉｎＢｕｆ　［ｉｌ　；ＥＮＤ；工Ｆ　ｒｅｐｌａｃａＮｒ　＞　ＯＴＨＥＮ　ＢＥＧＩＮＺＦＬｍｉｎＴｉｒｎｅ［ｒｅｐｌａＣｅＮｒｌ　：爾１；ＺＦＬｍｉｎＢｕｆ［ｒｅｐｌａｃｅＮｒｌ　：＝　ｐｏｗＮｏｗ；工Ｆ　ＺＦＬｍｉｎＢｕｆ［ｒｅｐｌａｃｅＮｒｌ　）ｍ　ｍｉｎｉｍｕｍ　ＴＨＥＮｍｉｎｉｍｕｍ　：ｍ　ＺＦＬｍｉｎＢｕｆ　［ｒｅｐｌａｃｅＮｒｌ　；ＥＮＤ。

工Ｆ　ＺＦＬｎｒＳａｖｅｄ　＞ｗ　ＺＦＬｎｒＭｉｎＦｒａｍｅｓ　ＴＨＥＮ　ＢＥＧＩＮ工Ｆ　ｍｉｎｉｍｕｍ　＞　ｌ　ＴＨＥＮ　ＢＥＧ工Ｎ（試験変数を計算する）しｅｓｔＶａｒ　：＝　ｍａｘｉｍｕｍ／ｍｉｎｉｍｕｍ；（もし試験変数がｍａｘＴｈｒｅｓｈより大ならば、音声と決定するもし試験変数がｍ１ｎＴｈｒｅｓｈより小ならば、バブルと決定するもし試験変数が中間のものならば、前決定を保持するＺＦＬ、ｐｒｅｌＮｏｓｅａｅ　ニーｔ　ｏｌｄＮｏｓセａＬｉ工Ｆ　ｔｅｓｅｖａｒ　＞　ＺＦＬｍａｘＴｈｒｅｓｈ　’ｎ（ＥＮＺＦＬｐｒｅｌＮｏＳこａｔ　：＝　Ｔｒｕｅ；工Ｆ　ｔｅｓｔｖａｒ　＜　ＺＦＬｍｉｎＴｈｒｅｓｈ　ＴＨＥＮＺＦＬｐｒｅｌＮｏＳＬａｍ　：＝　Ｆａｌｓｅ；ＥＮＤ。

ＥＮＤ；ＥＮＤ、’ ５Ｌ２１ｊＥｎｄ：ＤｒＤ；ＰＲＯＣＥＤＵＲＥ　ＦＬｈａｎｇＨａｎｄｌｅｒ（ＺＦＬｍａｘＦｒａｍｅｓ　：　Ｉｎｔｅｇｅｒ；　（入力　）ＺＦＬｈａｎｇＦｒａｍｅｓ　：　工ｎｅｅｇｅｒ；　（入力　）ＺＦＬｖａｄ　：　Ｂｏｏｌｅａｎ；　（入力　）ＶＡＲＺＦＬｅｌａｐｓｅｄＦｒａｍｅｓ　：　工ｎ仁ｅｇｅｒ；　（入力／出カシＶＡＲＺＦＬｓｐＨａｎｇｏｖｅｒ　：　工ｎｔｅｇｅｔ；　（入力／出力）ＶＡＲＺＦＬｖａｃ！０１ｃｌ　：　Ｂｏｏｌｅａｎ；　（入力ｌ出力）ＶＡＲｚｙＬｓｐ　：　Ｂｏｏｌｅａｎ）　；　（出力　）ＥＧＩＮ（音声から無音声への決定の変更をｈａｎｇＦｒａｍｅｓ個のフレーム数だけ遅延させるしかし、もし音声がｍａｘＦｒａｍｅｓ個より少ないフレームしか持続しなかったら、これを行わないＺＦＬｓｐ　：＝　ＺＦＬｖａｄ；ＩＦ　ｔ　ＺＦＬｅｌａｐｓｅｄＰｒａｍｅｓ　＜　ＺＦＬｍａｘＦｒａｍｅｓ　）　ＴＨＥＮＺＦＬｅｌａｐｓｅｄＰｒａｍｅｓ　ニー　ＺＦＬｅｌａｐｓｅｄＦｒａｍｅｓ　＋　ｌ；ＩＦ　ＺＦＬｖａｄＯｌｄ　ＡＮＤ　ＮＯＴ　ＺＦＬｖａｄ　ｒＨＥＮＺＦＬｓｐＨａｎｇＯｖｅｒ　ニー　ＩＨＩＦ　（ＺＦＬｓｐＨａｎｇＯｖｅｒ　＜　ＺＦＬｈａｎｇＦｒａｘｓｌ　ＡＮＤ　ＮＯＴ　ＺＦＬｖａｄ　ＴＨＥＮ　ＢＥ（ＪＮＺＦＬｓｐＨａｎｇＯｖｅｒ　ニー　ＺＦＬｓｐＨａｎｇＯｖｅｒ　＋　１；ＺＦＬＳｐ　：ｍ　Ｔｒｌｌｅ：ＥＮＤ；ＩＦ　ＮＯＴ　ＺＦＬｖａｄ　ＡＮＤ　（ＺＦＬｅｌａｐｓｅｄＦｒａｍｅｓ　＜　ＺＦ−Ｆｒａｍｅｓ　ｌ　ＴＫＥＮＺＦＬｓｐ　：ｅ　’Ｆａｌｓｅ；ＩＦ　ＮＯＴ　ＺＦＬｓｐ　ＡＮＤ　（ＺＦＬｓｐＨａｎｇＯｖｅｒ　＞　ＺＦＬｈａｎｇＦｒａｍｅｓ−１１ＴＨＥＮＺＦＬｅｌａｐｓｅｄＦｒａｍｅｓ　：＊　Ｏ；ＺＦＬｖａｄＯｌｄ　ニー　ＺＦＬｖａｄ；覆の。

Claims

【特許請求の範囲】

１．（ａ）Ｎ＞２とするとき、所定の長さのタイムウィンドウＴのＮ個のタイムサブウィンドウＴｌのそれぞれにおける信号の統計的モーメントの１つを推定するステップと、（ｂ）ステップ（ａ）において前記信号の定常性の手段として得られた前記推定値の変化を推定するステップと、（ｃ）ステップ（ｂ）において得られた前記推定された変化が所定の定常性限度 γを超えているか否かを決定するステップと、を特徴とする、移動無線通信システムにおける背音を表す信号などの、定常信号と非定常信号との識別方法。
２．ステップ（ａ）において２次の統計的モーメントを推定することを特徴とする、請求項第１項記載の方法。
３．ステップ（ａ）においてそれぞれのタイムサブウィンドウＴ１における前記信号のエネルギーＥ（Ｔ１）を推定することを特徴とする、請求項第１項または第２項記載の方法。
４．前記信号が離散時間信号であることを特徴とする、請求項第３項記載の方法。
５．前記推定された変化が、式 ▲数式、化学式、表等があります▼ によって形成されていることを特徴とする、請求項第４項記載の方法。
６．前記推定された変化が、式 ▲数式、化学式、表等があります▼ によって形成されており、ここで、ＭＡＸＢＵＦは最も大きい最近のエネルギー推定値のみを含むバッファであり、ＭＩＮＢＵＦは最も小さい最近のエネルギー推定値のみを含むバッファであることを特徴とする、請求項第４項記載の方法。
７．前記タイムウィンドウＴを集合的に覆う、重なり合うタイムサブウィンドウＴ１を特徴とする、請求項第５項または第６項記載の方法。
８．等しいサイズのタイムサブウィンドウＴ１を特徴とする、請求項第７項記載の方法。
９．それぞれのタイムサブウィンドウＴ１が２つの連続する音声フレームを含むことを特徴とする、請求項第８項記載の方法。
１０．フィルタに接続された信号源を含む、ディジタルフレームに基づく音声エンコーダおよび／またはデコーダにおいて、定常背音を検出し、かつエンコードおよび／またはデコードする方法であって、前記フィルタが、エンコードおよび／またはデコードされるべき信号を再生するための、それぞれのフレームに対するフィルタパラメータの組によって定められる、前記方法が、（ａ）前記エンコーダ／デコーダへ送られた信号が、主として音声または背音のいずれを表しているかを検出するステップと、（ｂ）前記エンコーダ／デコーダへ送られた前記信号が、主として背音を表している時、該背音が定常であるか否かを検出するステップと、（ｃ）前記信号が定常である時、連続するフレーム間の時間的変化および／または前記組内の少なくともあるフィルタパラメータの領域を制限するステップと、を含む、音声エンコーダおよび／またはデコーダにおいて、定常背音を検出し、かつエンコードおよび／またはデコードする方法。
１１．前記定常性検出ステップが、（ｂ１）Ｎ＞２とするとき、所定の長さのタイムウィンドウＴのＮ個のタイムサブウィンドウＴ１のそれぞれにおける前記背音の統計的モーメントの１つを推定するステップと、（ｂ２）ステップ（ｂ１）において前記背音の定常性の手段として得られた前記推定値の変化を推定するステップと、（ｂ３）ステップ（ｂ２）において得られた前記推定された変化が所定の定常性限度γを超えているか否かを決定するステップと、を含むことを特徴とする、請求項第１０項記載の方法。
１２．ステップ（ｂ１）においてそれぞれのタイムサブウィンドウＴ１における前記背音のエネルギーＥ（Ｔ１）を推定することを特徴とする、請求項第１１項記載の方法。
１３．前記推定された変化が、式 ▲数式、化学式、表等があります▼ によって形成されていることを特徴とする、請求項第１２項記載の方法。
１４．前記推定された変化が、式 ▲数式、化学式、表等があります▼ によって形成されており、ここで、ＭＡＸＢＵＦは最も大きい最近のエネルギー推定値のみを含むバッファであり、ＭＩＮＢＵＦは最も小さい最近のエネルギー推定値のみを含むバッファであることを特徴とする、請求項第１２項記載の方法。
１５．前記タイムウィンドウＴを集合的に覆う、重なり合うタイムサブウィンドウＴ１を特徴とする、請求項第１３項または第１４項記載の方法。
１６．等しいサイズのタイムサブウィンドウＴ１を特徴とする、請求項第１５項記載の方法。
１７．それぞれのタイムサブウィンドウＴ１が２つの連続する音声フレームを含むことを特徴とする、請求項第１６項記載の方法。
１８．フィルタに接続された信号源を含む、ディジタルフレームに基づく音声コーダおよび／またはデコーダにおいて、定常背音をエンコードおよび／またはデコードする装置であって、前記フィルタが、エンコードおよび／またはデコードされるべき信号を再生するための、それぞれのフレームに対するフィルタパラメータの組によって定められる、前記装置が、（ａ）前記エンコーダ／デコーダへ送られた信号が、主として音声または背音のいずれを表しているかを検出する手段（１６、３４）と、（ｂ）前記エンコーダ／デコーダへ送られた前記信号が、主として背音を表している時、該背音が定常であるか否かを検出する手段（２４、２４′）と、（ｃ）前記エンコーダ／デコーダへ送られた前記信号が定常背音を表す時、連続するフレーム間の時間的変化および／または前記組内の少なくともあるフィルタパラメータの領域を制限する手段（１８、３６）と、を含む、音声エンコーダおよび／またはデコーダにおいて、定常背音をエンコードおよび／またはデコードする装置。
１９．前記定常性検出手段が、（ｂ１）Ｎ＞２とするとき、所定の長さのタイムウィンドウＴのＮ個のタイムサブウィンドウＴ１のそれぞれにおける前記背音の統計的モーメントの１つを推定する手段（５０）と、（ｂ２）前記背音の定常性の手段としての前記推定値の変化を推定する手段（５４）と、（ｂ３）前記推定された変化が所定の定常性限度γを超えているか否かを決定する手段（５６）と、を含むことを特徴とする、請求項第１８項記載の装置。
２０．それぞれのタイムサブウィンドウＴ１における前記背音のエネルギーＥ（Ｔ１）を推定する手段（５０）を特徴とする、請求項第１９項記載の装置。
２１．前記推定された変化が、式 ▲数式、化学式、表等があります▼ によって形成されていることを特徴とする、請求項第２０項記載の装置。
２２．最近の大きいエネルギー推定値および最近の小さいエネルギー推定値のみをそれぞれ記憶するための第１バッファＭＡＸＢＵＦおよび第２バッファＭＩＮＢＵＦを制御する手段（５８）を特徴とする、請求項第２０項記載の装置。
２３．前記バッファＭＩＮＢＵＦ、ＭＡＸＢＵＦのそれぞれが、エネルギー推定値のほかに、それぞれのバッファ内のそれぞれのエネルギー推定値に対応する前記タイムサブウィンドウＴ１を識別するラベルを記憶することを特徴とする、請求項第２２項記載の装置。
２４．前記推定された変化が、式 ▲数式、化学式、表等があります▼ によって形成されていることを特徴とする、請求項第２３項記載の装置。