JP3263009B2

JP3263009B2 - 送信音声の雑音内容を測定する方法および装置

Info

Publication number: JP3263009B2
Application number: JP18804497A
Authority: JP
Inventors: スチーヴンメダーレイモンド; シャヤロナルド
Original assignee: AT&T Corp
Current assignee: AT&T Corp
Priority date: 1996-07-15
Filing date: 1997-07-14
Publication date: 2002-03-04
Anticipated expiration: 2017-07-14
Also published as: DE69716187D1; CA2207866A1; CA2207866C; EP0820051A3; US5950154A; DE69716187T2; EP0820051B1; EP0820051A2; JPH10107661A

Description

【発明の詳細な説明】

【０００１】

【発明の背景】本発明は、ノイズの多い通信チャネルの
音声の質の向上、特に送信自身の音声の部分からのノイ
ズを測定し、その後で検出したノイズを除去することに
より音声を向上する装置に関する。

【０００２】音声通信システムのすべての形式におい
て、種々の原因によるノイズがユーザの通信に悪影響を
与えることがある。音声に悪影響を与えるノイズは、通
信経路のシステムの入力側と受信側で、音声と一緒に発
生する場合がある。ノイズがあると、ユーザは不愉快で
あるし、イライラするし、また音声の質も悪影響を蒙る
場合もあり、音声の符号化および音声認識装置の性能が
低下する場合もでてくる。

【０００３】通信経路のノイズは、除去するのが特に難
しいが、その原因の一つは、ノイズ信号の発生源を突き
止めるのが難しいためである。それ故、ノイズを直接測
定して「エラー」信号を発生させ、その後で位相反転に
よりエラー信号を打ち消すことによりノイズを除去する
ことはできない。

【０００４】ノイズ成分が直接測定できない場合、ノイ
ズの多い音声信号の質を向上するために種々の方法が試
みられてきた。１９７９年１２月の「ＩＥＥＥ議事録(P
roceedings of the IEEE)」第６７巻、第１２号、Ｖ
節、第１５８６頁乃至第１６０４頁に掲載の、Ｊ．Ｓ．
リム(J.S.Lim)およびＡ．Ｖ．オッペンハイム(A.V. Opp
enheim)の「ノイズの多い音声の質の向上と帯域幅圧縮
(Enhancement and Bandwidth Compression of Noisy Sp
eech)」中に、これらの技術の再検討の記述がある。こ
の中には、使用可能なノイズの多い信号について計算し
た全スペクトルから、推定ノイズ振幅スペクトルのスペ
クトルを除去する方法と、リムおよびオッペンハイムが
提案した対話型モデルに基づくフィルタが記載されてい
る。リム他は、このフィルタを使用して、ノイズの多い
信号全体およびノイズ電力スペクトルの推定値が分かっ
ている場合に、音声成分の最善の全極モデルを発見しよ
うと試みた。このモデルに基づいた方法は、１９９１年
４月の「信号処理に関するＩＥＥＥの議事録(IEEE Tran
sactions On Signal Processing)」の第３９巻、第４号
の第７９５頁乃至第８０５頁に掲載のＪ．Ｈ．Ｌ．ハン
セン(J.H.L. Hansen)およびＭ．Ａ．クレメンツ(M.A.Cl
ements)の「音声認識に適用する制限付き対話型音声向
上(Constrained Iterative Speech Enhancement with A
pplication to Speech Recognition)」で、リアルタイ
ムでない音声平滑化装置を開発するために使用された。
この場合、音声の特性を維持するために、モデルを制限
するために反復動作を行っている際に、別の制限をリム
／オッペンハイムの方法に加えた。

【０００５】多くのノイズ検出技術は、ノイズが大きく
聞こえる音声の間のギャップのところでノイズを検出す
る方法を使用している。それ故、これらの技術は、音声
および音声間のギャップが、システムの送信側で発生す
る送信システムで使用される。しかし、衛星放送システ
ムのように、呼多重化装置(Call Multiplication Equip
ment:CME)を使用する送信システムの場合には、特殊な
問題が生じる。ＣＭＥ送信の場合には、音声部分だけが
送信される。ギャップの部分は、音声検出アルゴリズム
により、元の信号から除去される。衛星が使用すること
ができる帯域幅を最大限に利用するためには、ギャップ
は除去する必要がある。それ故、長距離送信の受信側に
おいては、有用なノイズ情報を含んでいて、音声部分か
ら除去する必要があるノイズを測定するために共通に使
用される元の音声のギャップは、もはや受信することは
できない。その代わり、受信装置は充填ノイズ(fill no
ice)と呼ばれる異なるノイズを挿入する。この充填ノイ
ズは、ノイズ測定問題をさらに厄介なものにしている。

【０００６】それ故、音声部分だけが送信される送信シ
ステムの場合には、音声の質を改善するために、受信端
末おいてノイズを測定し除去することが望ましい。

【０００７】

【発明の概要】本発明は、ノイズと音声の両方を含む信
号からノイズ電力スペクトルを測定する方法および装置
を提供する。測定したノイズは、そのような業務が適し
ている場合には、音声の質を向上するために周知のろ波
技術で使用することができる。

【０００８】最初に、受信処理装置が、ＣＭＥ処理され
た音声と、受信点と受信処理点との間に挿入された充填
ノイズを含む合成信号を受信する。受信プロセッサは、
合成信号に対する充填ノイズの貢献度を識別する。残り
の信号は、合成信号の音声フレームで構成されている。
本発明は、各フレームの音声に関連する電力に基づい
て、これら音声フレームのサブセットを分離する。電力
に関する最も低い１０％の音声フレームの分析は、周波
数と電力レデシベルが二軸になっている二次元のヒスト
グラムを描くことによって行われる。周波数Ｆおよび電
力Ｐによるヒストグラム値は、周波数Ｆ（Ｈｚ）で測定
した音声電力スペクトルの電力がＰ（デシベル）になる
回数を示す。周波数は、０から４，０００ＨｚのＮ個の
同じ大きさの区分に分割することができる。ある実施形
態の場合には、この区分の数は１２９である。また、電
力範囲は、１００デシベルの範囲内でＭ個の数値に分割
することができ、その結果、Ｎ×Ｍのヒストグラムがで
きる。各周波数のヒストグラム値のピーク値は、ノイズ
電力スペクトルを決定するのに使用される。その後、ノ
イズ電力スペクトルは、合成信号からノイズを取り出す
ために使用することができる。

【０００９】分析対象となるフレームの数を決定するた
めに使用される電力域値は、時間の経過中に調整するこ
とができるので、呼の開始時のスタートアップ時間がよ
り速くなり、少なくとも最低限度の大ざっぱなろ波が行
われる。その後、ある時間が経過してから、システムは
安定状態になり、もっと少ないパーセンテージの音声フ
レームを選択することができるようになる。

【００１０】

【発明の詳細な記述】本発明は、本質的には、別個のノ
イズ基準値が入手できない場合の、ノイズ電力スペクト
ル推定装置である。本発明を、遠隔通信ネットワークお
よび音声向上機能が音声信号のノイズの測定によって左
右される、受信音声信号の質の向上に関連して説明す
る。

【００１１】図１Ａは、電話１１のような多数の通信端
末が１２のようなローカル線により接続している遠隔地
のスイッチ１０からなる、例示としての遠隔通信ネット
ワークである。上記ローカル線としては、ツイスト・ペ
アを使用することができる。出力チャネル１３は遠隔地
の局１０からでている。出力チャネルは、長距離を隔て
て通信信号を送信するために、衛星送信機１４に接続す
ることができる。例えば、遠隔通信端末１１はインド
に、通信受信装置はカリフォルニア州のロサンゼルスに
設置することもできる。このような場合、通信信号は、
衛星１４３を通して衛星受信装置を持つゲートウェイ１
４４に送信される。送信信号は、複数のフレームのデー
タからなる。この情報は、通常、通信路多重化装置（Ｃ
ircuit Ｍultiplication Ｅquipment）により圧縮され
る。上記圧縮装置は、衛星通信経路を通して音声部分だ
けを送信する。それ故、圧縮装置は、圧縮をしない場合
にはノイズを含み、もっと容易に検出できるすべての音
声ギャップの送信を行わない。図示の実施形態の場合に
は、衛星通信の際にＣＭＥが使用されている。しかし、
本発明の適用は、衛星環境のみに制限されるものではな
い。それどころか、本発明は、ＣＭＥ類似の処理（すな
わち、音声ギャップの除去）を使用するどのような用途
にも適用することができる。

【００１２】受信側においては、米国ネットワークと国
際ネットワークとの境界のところにあるゲ−トウェイの
受信装置が、音声ギャップにホワイト・ノイズを挿入す
る。その後、合成音声／充填ノイズからなる信号は、米
国のローカル局１５に送られ、最終的には送信チャネル
１９を通して、通信の相手方の受信装置に送られる。

【００１３】図１Ｂは、本発明を使用することができる
ゲ−トウェイの一実施形態である。より詳細に説明する
と、この例の場合には、スイッチ１６は、入力呼を一群
の出力チャネルの一つである、最終出力送信チャネルに
リンクする通路１８のような内部通路を設定する。入力
呼はリンケージの任意のセグメント内で発生したノイズ
と、受信装置により挿入された充填ノイズの両方を含ん
でいると見なされる。

【００１４】本発明の場合には、論理装置２０が、その
呼がファクシミリ、モデムおよび他の通信形式を閉め出
すことによって音声のみになっているかどうかを判断す
る。さらに、論理装置２０は、発信番号または着信番号
が、送信ノイズ低減サービスを受けている顧客のもので
あるかどうかを判断する。論理装置２０が上記判断を行
うと、呼はスイッチ２２により処理装置２１に転送され
る。そうでない場合には、呼は直接チャネル１９に送ら
れる。

【００１５】図１Ｃは、処理装置の一実施形態のブロッ
ク図である。

【００１６】入力は、充填ノイズ検出器１２０および充
填ノイズ除去装置１３０の両方に供給される。充填ノイ
ズ検出器は、受信装置により音声に追加された充填ノイ
ズ信号を検出するために、下記のアルゴリズムに従って
動作する。すなわち、電力識別装置は、充填ノイズ除去
装置１３０から音声フレームを受信し、音声フレームの
電力分布を決定する。上記の識別装置は、例えば、１０
％というような所定の域値に基づいて、音声フレームの
最も低い電力の百分位数の音声フレームを選択する。こ
の例の音声フレームの上記１０％は、ノイズ推定装置１
５０へ送られる。その後、ノイズ推定装置１５０は、音
声自身のノイズのノイズ電力スペクトルを測定するため
に、下記のアルゴリズムに基づいて動作する。その後、
ノイズ推定情報はフィルタ１６０に送られ、このフィル
タは合成信号を処理し、出力する。

【００１７】これは動的プロセスであるので、情報のそ
の後のフレームは、合成信号という形で供給され、また
追加のフレームに対して充填ノイズろ波、電力識別およ
び音声ノイズ推定を行うために、このプロセスは反復し
て行われる。

【００１８】本発明が解決しようとしている問題および
その問題に対する一般的な解決方法は、図２−図７を参
照すれば、さらに容易に理解できる。

【００１９】図２は、充填ノイズおよび音声ノイズの電
力スペクトルの一例である。この図を見れば分かるよう
に、充填ノイズ２１０は、本来基本的にはフラットであ
る。すなわち、全周波数スペクトルにわたってその電力
はどちらかといえば一定である。しかし、図２は、音声
ノイズに対する階調ノイズの一例である。この階調ノイ
ズは、１００−３００Ｈｚのところに強い成分（４０−
６０デシベル）を持つ。それ故、これらノイズ成分（充
填ノイズおよび階調ノイズ）は両方とも、遠隔端末にお
いて発生した入力で交互に変動し、音声内容を識別する
ための音声受信装置の性能に悪影響を与える場合があ
る。通信信号の音声内容に対するこれらノイズ源の両方
の影響を最小限にすれば、有利な結果がもたらされる。

【００２０】図３は、合成信号の複数のフレームにわた
って音声とノイズを含む、通常の合成信号のスペクトル
写真である。点３１のところに、どちらかといえば変動
しないように見える、信号からの影響がいくらかあるこ
とがハッキリ分かる。しかし、この情報は、階調ノイズ
を示唆してはいるが、合成信号に対する適当なフィルタ
を作るには、この情報だけでは十分でない。

【００２１】図１Ｃのところですでに説明したように、
合成信号の充填ノイズの内容は、後で詳細に説明するア
ルゴリズムにより検出される。その後、この充填ノイズ
の内容を、合成信号から除去することができる。特に、
充填ノイズ・フレームは無視することができる。充填ノ
イズ・フレームが除去されると、音声だけを含むフレー
ムだけが残り、音声のノイズ電力スペクトルを測定する
ことができる。ノイズ推定アルゴリズムは、音声を含む
これらフレームのサブセットを識別することにより最高
の動作をする。特に、本発明の場合には、上記アルゴリ
ズムにより、フレームを含む各音声のエネルギー値が決
定され、その後で、低電力域値点の決定が行われ、音声
フレームの１０％が、この低い電力域値点より低い電力
内容を持っているかどうかの判断が行われる。その後、
このプロセスは、音声フレームのこの１０％だけを使用
して、音声自身でノイズを発見することができるかどう
か、またそのノイズは何であるかを分析する。図４は、
音声フレームのこの最も低い１０％のスペクトル写真で
ある。このスペクトル写真を使って、ノイズ対音声の関
係を検出するのは難しい。しかし、このスペクトル写真
を、図５に示すように、三次元のグラフに変換すると、
ノイズ「パターン」の存在がハッキリ見えてくる。

【００２２】この三次元グラフは、周波数、各フレーム
の各周波数のところに現れる信号の電力を示す。複数の
フレームにわたって、図５の領域５１の１００−３００
Ｈｚ付近の周波数のところに、約５０ｄＢの電力を持つ
信号がかなり一貫して存在することが分かるだろう。

【００２３】二次元ヒストグラムが作成されるが、この
ヒストグラムは、各周波数および電力セルに対する三次
元スペクトル写真での発生数に対応するグレイ・レベル
を示す。図６は、上記二次元ヒストグラムである。約５
００−４，０００Ｈｚのところに、２０ｄＢまたはそれ
以下の領域６１に、もっとランダムな分布が存在するこ
とは明かである。しかし、０−５００Ｈｚの周波数で３
５ｄＢ以上の領域に、この電力／周波数の組み合わせが
もっと集中しているのが見られる。この相関関係の深い
関係は、図７に示すような三次元ヒストグラムに、さら
にハッキリと見ることができる。

【００２４】この三次元ヒストグラムには、二つの一般
的な領域が図示されている。第１の領域７１は、基本的
には、周波数および電力スペクトルを横切る、音声フレ
ームの種々の音声部分の分布を示す。このヒストグラム
は、所定の数のフレームでの、特定の電力および周波数
の組み合わせの発生回数を示す。領域７１においては、
上記発生回数はかなりランダムに分布している。しか
し、階調ノイズが存在する領域においては、すなわち、
電力が４０−６０ｄＢである５０−３００Ｈｚの領域に
おいては、上記周波数の事象及び電力の事象が非常に集
中している。この領域を領域７２とする。その強度によ
りスパイク状になっている領域、すなわち、三次元ヒス
トグラムのこれら領域に応じる点またはヒットの数は、
この特定の周波数および電力分布の階調ノイズが存在す
ることを示す。それ故、このヒストグラム情報を、受信
合成信号の音声部分を向上させるために、適当な信号を
発生するろ波装置に供給することができる音声のノイズ
を特徴づけるために使用することができる。それ故、合
成信号の受信装置は、そうでない場合には、音声発生装
置と音声受信装置との間の送信リンクにより発生する恐
れがある、ノイズからの影響が軽減され、質が改善され
た信号を受信する。音声内容のノイズを決定するための
流れについては、図８−図１１を参照しながら説明す
る。

【００２５】図８は、一般的にいって、音声のノイズの
電力スペクトを本発明により測定するための、三つの段
階からなるプロセスである。最初の段階８１において
は、音声の間に挿入した充填ノイズを決定するために、
受信音声の処理が行われる。この処理は、図９のところ
で説明する２モードの検出器および反復データ検出器を
使用して行われる。充填ノイズが合成信号から除去され
ると、残りのフレームに対して、図１０のところで詳細
に説明する電力識別、段階８２が行われる。この電力識
別により、各音声フレームに関連するエネルギー値に基
づいて、使用することができる音声フレームのサブセッ
トが選択され、その結果、ノイズがもっと大きな役割を
果たしているか、またはこれらフレームがより多くのノ
イズを含んでいるために、ノイズの検出の可能性が高い
上記のフレームが選択される。電力識別段階の後で、ノ
イズを含む周波数および電力レベルの区分を識別するた
めに、二次元のヒストグラムが作成され、その結果ノイ
ズ電力スペクトルを発生することができる。これが段階
８３である。ヒストグラムを発生するためのプロセスに
ついては、図１１のところで説明する。

【００２６】合成信号を処理するために行われる特定の
段階を説明する前に、二次元ヒストグラムについて簡単
に説明しておきたい。特に、ヒストグラムを作成する際
には、合成信号の内容を分析するために、システムは複
数の周波数／電力区分を使用する。特に、０−４，００
０Ｈｚの周波数範囲を、それぞれの幅が３１．２５Ｈｚ
の１２９の周波数区分に分割する。このヒストグラム
は、最初のサブスクリプト［ｉ］が、０−９９ｄＢの範
囲の整数のｄＢ単位の電力を表すアレーＨＩＳＴ［ｉ］
［ｊ］である。第２のサブスクリプト［ｊ］は、周波数
区分ビンである。それ故、数値ＨＩＳＴ［ｉ］［ｊ］
は、一つのフレームがｉｄＢの電力レベルで、ｊ番目の
周波数区分を持つ回数を示す。充填ノイズ除去の最終ゴ
ールは、ヒストグラムに対する充填ノイズの悪影響を低
減することである。

【００２７】図９のフローチャートで示す充填ノイズの
検出中に、本発明は、充填ノイズ・フレームを識別する
ために、二つの異なる検出動作、すなわち、２モード検
出および反復データ検出を行う。

【００２８】合成信号に対しては、最初２モード検出が
行われる。この検出動作中、フレームの最大サンプル・
レベルから最少サンプル・レベルの領域が、三つの等し
い隣接している領域に分割される。中央領域のサンプル
・レベルの発現回数が所定の域値より少ない場合には、
フレームは充填ノイズであると見なされる。

【００２９】次の反復データ検出器の場合には、最大値
に適合するサンプル数ｐと、最小値に適合するサンプル
数ｑとを決定するために、フレームの検査が行われる。
上記ｐおよびｑの数値が、所定の域値より大きい場合に
は、フレームは充填ノイズと見なされる。

【００３０】これら二つの検出器に基づいて、充填ノイ
ズと分類されなかった上記フレームは、ノイズ推定処理
に送られる。

【００３１】ノイズ推定動作の次の段階においては、充
填フレーム検出プロセスから残ったフレームに関する電
力識別が行われる。この電力識別動作は、個々の各音声
フレームの全電力に基づいて、音声フレームの所定の最
も低いパーセンテージ（割合）を構成している音声フレ
ームの一つのブロックから、これら音声フレームの選出
プロセスを含む。それ故、最初の段階として、各音声フ
レームの全電力が計算され、それにより分析対象のフレ
ームの上記ブロックの、各音声フレームの電力バンドが
わかる。これが段階１００１である。その後、この処理
装置は、音声フレームの１０％が決定した域値の間に入
る、それに関連する全電力を持つ電力域値レベルを決定
する。これが段階１００２である。このパーセンテージ
は、フィルタの処理のニーズに適合するように調整する
ことができる。事実、スタート時に、開始する際の幾分
有利なろ波能力を得るのに必要な時間を短縮するため
に、そのそれぞれの電力バンドにより決定した音声フレ
ームの最も低い２０％の分析ができるように、域値をで
きるだけ高く設定することができる。本発明の一実施形
態の場合には、どの音声フレームを次に処理するのを決
定する電力域値のこの決定は、下記の方法で行われる。
推定装置は、最初に、分析するフレームに対するスター
ト点として、低い方の域値を決定しなければならない。
推定装置は、上記域値を決定するために、充填ノイズと
識別されなかったフレームのスペクトルの平坦な特性を
使用する。最初に、算術平均に対する幾何学的平均の比
率の計算が行われる。平坦の程度を計算するために、１
２９の各周波数区分の電力が最初に決定される（段階９
１）。「電力（ｊ）」項は、各周波数区分における、入
力スペクトル、すなわち、入力音声にノイズを加えたも
ののスペクトルの電力に対応する。幾何学的電力平均は
式１により計算される。

【００３２】

【数１】また、算術平均は、式２により計算される。

【００３３】

【数２】その後で、平坦度は、幾何学的平均および算術平均を使
用して、式３により計算される。

【００３４】

【数３】但し、ｃｎｔはハイの数値−ローの数値＋１であり、ロ
ーの数値は１０、ハイの数値は１００である。

【００３５】次に、下記式のｎｕｍＰｔｓ（Ｍ）を、全
電力ｄＢ＝Ｍ±０．５を持つフレームの数であるとしよ
う。電力ｄＢ＝Ｍ、すなわち、ａｖＦｌａｔ（Ｍ）を持
つフレーム平均対数平坦度は次式、式４のように設定す
る。

【００３６】

【数４】この場合、フレームの最も低い１０％を決定するための
電力域値のスタート点は、式４により計算された数値
が、所定の平坦な域値より低くなるように、最も低い電
力（ｌｏｗＰｏｗ）Ｍに設定される。この場合、非平坦
度の数値の項は、平坦度が平坦度の域値より大きくなる
場合のフレーム数になるように設定される。その後、高
域決定郡、ｈｉｇｈＰｏｗが、平坦でない音声フレーム
のその１０％に対する最も低い電力がｈｉｇｈＰｏｗよ
り低く、ｌｏｗＰｏｗよりは高くなるように計算され
る。それ故、この電力識別動作は、音声フレームの電力
特性に基づいて、スペクトル的に平坦でない音声フレー
ムの最も低い１０％を選択する。音声フレームのこのサ
ブセットを選択するための根本的な理由は、音声フレー
ムのこのグループにおいては、ノイズがもっと大きく、
もっと推定しやすいからである。

【００３７】音声フレームの識別が完了すると、本発明
は、最初に選択した音声フレームの周波数および電力を
相互に関連づけるヒストグラムを作成し（段階１１０
１）、その後で上記ヒストグラムからノイズ電力スペク
トルを作り出すことにより、音声フレームのノイズ電力
スペクトルを決定する。

【００３８】図６に示すような、二次元ヒストグラム
は、上記フレーム、すなわち、音声を含み、高い方の電
力域値より低い全電力値をもつフレームから作る。ヒス
トグラムを作る際のフレームの数は２００であるが、こ
の数は第１のヒストグラムに対して、例えば、７１フレ
ームというように、実質的に減らすことができ、そのよ
うにした場合には、システムは通信中最初にノイズ検出
を行い、それにより早めにろ波を行う。

【００３９】すでに説明したように、ヒストグラムは、
最初のサブスクリプト［ｉ］が、０−９９ｄＢの範囲の
整数のｄＢ単位の電力を表し、第２のサブスクリプト
［ｊ］が、３１．２５Ｈｚの幅を持つ０−１２８の範囲
の周波数区分である、アレーＨＩＳＴ［ｉ］［ｊ］であ
る。ＨＩＳＴ［ｉ］［ｊ］は、ｉｄＢの電力レベルのと
ころに、そのｊ番目の周波数ビンを持つフレームの回数
である。ノイズ電力スペクトルは、下記の方法で作成す
る。各周波数［ｊ］に対する最大［ｊ］で表す最大のＨ
ＩＳＴ［ｉ］［ｊ］は、すべての［Ｉ］にわたって得ら
れる。この検出動作中の最大の電力Ｉは、最大電力
［ｊ］と呼ばれる。各周波数区分ｊに対する最大値の他
に、局部的な最大電力ロー［ｊ]が、局部的最大値が、
この実施形態の場合には、８に設定してある域値よりも
高いレベルで起こる最も低い電力レベルとして得られ
る。各周波数ビンｊに対する電力スペクトル・レベル
は、最大［ｊ］が２５より小さく、最大電力ロー［ｊ］
が最大電力［ｊ］−４より小さい場合には、３＜ｊ＜３
０と推定され、電力［ｊ］＝最大電力ロー［ｊ］であ
り、そうでない場合には、電力［ｊ］＝最大電力［ｊ］
である。ｊ≦３またはｊ≧３０の場合には、電力［ｊ］
＝最大電力［ｊ］である。

【００４０】この図形により、ホルマント(formant)周
波数レベルがノイズ電力レベルで使用されるのが防止さ
れる。２５以上のレベルは階調的なものと見なされ、２
５以下のピークは９３−９３０Ｈｚの周波数に対するホ
ルマントであると見なされる。上記計算は、１０ミリ秒
につき一つの周波数区分Ｊで行われる。それ故、ヒスト
グラムが完成してから１．２９秒に完了する。

【００４１】上記計算は、本発明の有効なノイズ検出を
実行するための例示的なものである。これらの特定な計
算は、コア情報が依然として合成音声信号、すなわち、
ノイズのために合成信号の選択した部分だけを分析する
ことができるようにする充填ノイズ情報、すなわち、音
声部分から入手している限り、また音声フレームのサブ
セットの選択が、ノイズ電力スペクトルの検出能力を改
善するために行われている限り、修正することができ
る。それ故、この技術は、合成信号の「ホワイト・ノイ
ズ」または「カラー・ノイズ」を検出するのにも使用す
ることができる。ただ一つの違いは、ヒストグラムのこ
のホワイト・ノイズの外観が、階調ノイズの場合ほど目
立つものでないということだけである。

【００４２】本発明を使用すれば、ＣＭＥまたは音声挿
入（Time - Assignment Speech Interpolation：TASI)
方式を使用するシステムのような、その内部で信号の一
部がノイズに対して伝統的に分析される信号の部分、す
なわち、ギャップすなわち、音がない部分が除去または
修正される送信システムでノイズの評価を行うことがで
きる。それ故、本発明を使用すれば、伝統的なノイズ推
定およびろ波技術を使用することができる場合ですら、
音声受信を改善することができる。

【図面の簡単な説明】

【図１Ａ】本発明の一実施形態を使用することができる
システムのブロック図である。

【図１Ｂ】本発明の一実施形態を使用することができる
システムのブロック図である。

【図１Ｃ】本発明の一実施形態を使用することができる
システムのブロック図である。

【図２】本発明が解決することができる問題の一例とし
ての、充填ノイズと音声のノイズとの電力対周波数曲線
を示す図である。

【図３】本発明により処理した信号のタイプの一例とし
ての、音声およびノイズの合成信号のスペクトル写真を
示す図である。

【図４】図３の信号の音声フレームに関連する電力に基
づく、音声の最も低い１０％のスペクトル写真を示す図
である。

【図５】図４のスペクトル写真の三次元グラフを示す図
である。

【図６】図５の三次元スペクトル写真から作った二次元
ヒストグラムを示す図である。

【図７】図６の二次元ヒストグラムが示すデータを含
む、三次元ヒストグラムを示す図である。

【図８】本発明の音声のノイズを検出するための、一般
的な三つの段階からなるフローチャートを示す図であ
る。

【図９】合成受信信号の充填ノイズを検出するためのフ
ローチャートを示す図である。

【図１０】充填ノイズ・フレームを除去した信号で電力
を識別するためのフローチャートを示す図である。

【図１１】本発明の一実施形態による電力識別音声フレ
ームから、ヒストグラムを作成する際のフローチャート
を示す図である。

【符号の説明】

１０スイッチ１１通信端末１２ローカル線１３出力チャネル１６スイッチ１８通路２１処理装置２２スイッチ

───────────────────────────────────────────────────── フロントページの続き (72)発明者ロナルドシャヤアメリカ合衆国 07960 ニュージャーシィ，モリスタウン，ストーンヘンジロード 43 (56)参考文献特開昭56−46300（ＪＰ，Ａ) 特開平５−29191（ＪＰ，Ａ) 特開平５−49054（ＪＰ，Ａ) (58)調査した分野(Int.Cl.⁷，ＤＢ名) H04B 1/10 H04B 15/00 G10L 7/00 - 9/00

Claims

(57)【特許請求の範囲】

【請求項１】遠隔通信送信で受信した音声フレームの
ノイズ・スペクトルを推定する方法であって、該方法
は、第１の複数の音声フレームの各々に対する電力分布を決
定する段階と、該決定された電力分布に基づいて、該第１の複数の音声
フレームのサブセットを選択する段階と、該第１の複数の音声フレームの該サブセットの周波数と
電力とを相互に関連付けるヒストグラムを作成する段階
と、該ヒストグラムを用いて、該第１の複数の音声フレーム
のノイズ電力スペクトルを決定する段階からなることを
特徴とする方法。
【請求項２】請求項１に記載の方法において、該方法
はさらに、該遠隔通信送信の該第１の複数の音声フレームに続い
て、第２の複数の音声フレームを規定する手段と、該第２の複数の音声フレームの各々に対する電力分布を
決定する段階と、該決定された電力分布に基づいて、該第２の複数の音声
フレームのサブセットを選択する段階と、該第２の複数の音声フレームの周波数と電力とを相互に
関連付けるヒストグラムを作成する段階と、該ヒストグラムを用いて、該第２の複数の音声フレーム
のノイズ電力スペクトルを決定する段階とからなること
を特徴とする方法。
【請求項３】請求項２に記載の方法において、該第１
の複数の音声フレームの数は、該第２の複数の音声フレ
ームの音声フレームの数より少ないことを特徴とするシ
ステム。
【請求項４】請求項１に記載の方法において、該方法
はさらに、該遠隔通信送信から充填ノイズ・フレームを
抽出することによって、該遠隔通信送信の音声フレーム
を検出する段階からなることを特徴とする方法。
【請求項５】請求項１に記載の方法において、該ヒス
トグラムを作成する段階は、該第１の複数の音声フレー
ムの該サブセットの音声フレームの各々を分析する段階
からなり、周波数レンジを形成する複数の周波数サブレ
ンジのうちの各々の周波数サブレンジに対する電力が決
定されることを特徴とする方法。
【請求項６】回路多重化装置により作られ、充填ノイ
ズを含む、受信した送信信号のノイズを推定する方法で
あって、該充填ノイズと通信信号とを分離するために、該受信し
た送信信号から充填ノイズを除去する段階と、該通信信号のエネルギー分布を使用して、該通信信号の
一部を選択する段階と、該通信信号の該選択された部分の電力分布と周波数分布
に基づいて、該受信した送信信号のノイズ電力スペクト
ルを決定する段階とからなることを特徴とする方法。
【請求項７】請求項６に記載の方法において、該決定
する段階は、該通信信号の該部分の一部の周波数と電力
とを相互に関連付けるヒストグラムを作成することから
なることを特徴とする方法。
【請求項８】請求項６に記載の方法において、該受信
した送信信号は、複数の音声フレームと複数の充填ノイ
ズ・フレームとからなり、該選択する段階は、音声フレ
ームの各々のエネルギー・レベルに従って、該通信信号
の該部分以外の部分から該音声フレームの所定の割合を
分離する段階からなることを特徴とする方法。
【請求項９】請求項６に記載の方法において、該通信
信号の該部分が、複数の音声フレームからなることを特
徴とする方法。
【請求項１０】請求項９に記載の方法において、該決
定する段階は、該分離した音声フレームの一部の周波数
と電力とを相互に関連付けるヒストグラムを作成する段
階を含むことを特徴とする方法。
【請求項１１】音声部分を含む送信信号を処理する方
法において、該方法は、該送信信号の音声部分を含む部分と該音声部分を含まな
い部分とを分離する段階と、該音声部分の一部の電力分布と周波数分布とに基づいて
該送信信号のノイズ電力スペクトルを決定するために、
該音声部分を分析する段階からなることを特徴とする方
法。
【請求項１２】請求項１１に記載の方法において、該
音声部分を分析する段階は、該音声部分の電力分布を使用して、該音声部分の一部を
選択する段階と、該音声部分の該選択された部分の電力分布と周波数分布
とに基づいて、該送信信号のノイズ・スペクトルを決定
する段階からなることを特徴とする方法。
【請求項１３】請求項１２に記載の方法において、該
決定する段階は、該音声部分の該選択された部分の一部
の周波数と電力とを相互に関連付けるヒストグラムを作
成する段階を含むことを特徴とする方法。
【請求項１４】入力音声信号から送信信号を発生する
呼多重化装置と、第１の場所にあり、該呼多重化装置に接続している送信
機と、該第１の場所から離れた第２の場所にあり、充填ノイズ
発生装置を含む受信装置と、音声と充填ノイズを含む合成音声信号を受信する、該受
信装置に接続された呼処理装置とからなり、該呼処理装
置は、該合成音声信号から充填ノイズ部分を抽出する充填ノイ
ズ検出器と、該音声部分のエネルギー値に基づいて、該合成音声信号
の音声部分を選択する、該充填ノイズ検出器に接続され
た電力識別装置と、該エネルギー値に基づいて選択された音声部分を受信し
てノイズ電力スペクトルを決定する、該電力識別装置に
接続された音声ノイズ推定装置とからなることを特徴と
する音声信号送受信システム。
【請求項１５】請求項１４に記載のシステムにおい
て、該選択された音声部分は複数の音声フレームからな
り、該電力識別装置は該複数の音声フレームを形成する
音声フレームの数を調整する手段を含むことを特徴とす
るシステム。
【請求項１６】請求項１４に記載のシステムにおい
て、該選択された音声部分は複数の音声フレームを形成
し、該音声ノイズ推定装置は、該複数の音声フレームの各々に対する信号周波数レンジ
の複数の周波数サブレンジのうちの各々の周波数サブレ
ンジに対する電力値を決定する手段と、複数の周波数レンジと、該複数の音声フレームにわたる
該周波数レンジの各々に関連する電力値の出現とを示す
ヒストグラムを作成する手段からなることを特徴とする
システム。
【請求項１７】請求項１６に記載のシステムにおい
て、該音声ノイズ推定装置は、該複数の音声フレームの各々に対する信号周波数レンジ
の複数の周波数サブレンジのうちの各々の周波数サブレ
ンジに対する電力値を決定する段階と、複数の周波数レンジと、該複数の音声フレームにわたる
該周波数レンジの各々に関連する電力値の出現とを示す
ヒストグラムを作成する手段からなることを特徴とする
システム。
【請求項１８】入力ポート、出力ポート、該入力ポー
トに接続された内部スイッチ、該内部スイッチに接続さ
れ該入力ポートで受信した送信信号がノイズ処理を受け
る資格があるかどうかを判断するサービス・プロバイダ
評価器、及び該内部スイッチに接続された入力を有する
ノイズ処理装置とからなる呼処理装置において、該ノイズ処理装置が、該入力を受信し、充填ノイズを抽出して該入力から抽出
充填ノイズを差し引くことによって音声を含む音声フレ
ームを生成する充填ノイズ検出器と除去器、該音声フレ
ームを受信して、該音声フレームの電力分布を決定する
電力決定器、該決定された電力分布に基づいて該音声フレームのサブ
セットを選択して、該音声フレームのサブセットにおけ
る周波数と電力とを相互に関連付けるヒストグラムを作
成し、そして該ヒストグラムを用いて該音声フレームに
おけるノイズ電力スペクトルを決定する音声ノイズ推定
器、及び該音声ノイズ推定器と該出力ポートとに接続さ
れ、該出力ポートへの出力を与えるフィルタとからなる
ものである呼処理装置。