JP3263009B2 - 送信音声の雑音内容を測定する方法および装置 - Google Patents

送信音声の雑音内容を測定する方法および装置

Info

Publication number
JP3263009B2
JP3263009B2 JP18804497A JP18804497A JP3263009B2 JP 3263009 B2 JP3263009 B2 JP 3263009B2 JP 18804497 A JP18804497 A JP 18804497A JP 18804497 A JP18804497 A JP 18804497A JP 3263009 B2 JP3263009 B2 JP 3263009B2
Authority
JP
Japan
Prior art keywords
noise
power
audio
frames
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP18804497A
Other languages
English (en)
Other versions
JPH10107661A (ja
Inventor
スチーヴン メダー レイモンド
シャヤ ロナルド
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
AT&T Corp
Original Assignee
AT&T Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by AT&T Corp filed Critical AT&T Corp
Publication of JPH10107661A publication Critical patent/JPH10107661A/ja
Application granted granted Critical
Publication of JP3263009B2 publication Critical patent/JP3263009B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Monitoring And Testing Of Transmission In General (AREA)
  • Noise Elimination (AREA)
  • Radio Relay Systems (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の背景】本発明は、ノイズの多い通信チャネルの
音声の質の向上、特に送信自身の音声の部分からのノイ
ズを測定し、その後で検出したノイズを除去することに
より音声を向上する装置に関する。
【0002】音声通信システムのすべての形式におい
て、種々の原因によるノイズがユーザの通信に悪影響を
与えることがある。音声に悪影響を与えるノイズは、通
信経路のシステムの入力側と受信側で、音声と一緒に発
生する場合がある。ノイズがあると、ユーザは不愉快で
あるし、イライラするし、また音声の質も悪影響を蒙る
場合もあり、音声の符号化および音声認識装置の性能が
低下する場合もでてくる。
【0003】通信経路のノイズは、除去するのが特に難
しいが、その原因の一つは、ノイズ信号の発生源を突き
止めるのが難しいためである。それ故、ノイズを直接測
定して「エラー」信号を発生させ、その後で位相反転に
よりエラー信号を打ち消すことによりノイズを除去する
ことはできない。
【0004】ノイズ成分が直接測定できない場合、ノイ
ズの多い音声信号の質を向上するために種々の方法が試
みられてきた。1979年12月の「IEEE議事録(P
roceedings of the IEEE)」第67巻、第12号、V
節、第1586頁乃至第1604頁に掲載の、J.S.
リム(J.S.Lim)およびA.V.オッペンハイム(A.V. Opp
enheim)の「ノイズの多い音声の質の向上と帯域幅圧縮
(Enhancement and Bandwidth Compression of Noisy Sp
eech)」中に、これらの技術の再検討の記述がある。こ
の中には、使用可能なノイズの多い信号について計算し
た全スペクトルから、推定ノイズ振幅スペクトルのスペ
クトルを除去する方法と、リムおよびオッペンハイムが
提案した対話型モデルに基づくフィルタが記載されてい
る。リム他は、このフィルタを使用して、ノイズの多い
信号全体およびノイズ電力スペクトルの推定値が分かっ
ている場合に、音声成分の最善の全極モデルを発見しよ
うと試みた。このモデルに基づいた方法は、1991年
4月の「信号処理に関するIEEEの議事録(IEEE Tran
sactions On Signal Processing)」の第39巻、第4号
の第795頁乃至第805頁に掲載のJ.H.L.ハン
セン(J.H.L. Hansen)およびM.A.クレメンツ(M.A.Cl
ements)の「音声認識に適用する制限付き対話型音声向
上(Constrained Iterative Speech Enhancement with A
pplication to Speech Recognition)」で、リアルタイ
ムでない音声平滑化装置を開発するために使用された。
この場合、音声の特性を維持するために、モデルを制限
するために反復動作を行っている際に、別の制限をリム
/オッペンハイムの方法に加えた。
【0005】多くのノイズ検出技術は、ノイズが大きく
聞こえる音声の間のギャップのところでノイズを検出す
る方法を使用している。それ故、これらの技術は、音声
および音声間のギャップが、システムの送信側で発生す
る送信システムで使用される。しかし、衛星放送システ
ムのように、呼多重化装置(Call Multiplication Equip
ment:CME)を使用する送信システムの場合には、特殊な
問題が生じる。CME送信の場合には、音声部分だけが
送信される。ギャップの部分は、音声検出アルゴリズム
により、元の信号から除去される。衛星が使用すること
ができる帯域幅を最大限に利用するためには、ギャップ
は除去する必要がある。それ故、長距離送信の受信側に
おいては、有用なノイズ情報を含んでいて、音声部分か
ら除去する必要があるノイズを測定するために共通に使
用される元の音声のギャップは、もはや受信することは
できない。その代わり、受信装置は充填ノイズ(fill no
ice)と呼ばれる異なるノイズを挿入する。この充填ノイ
ズは、ノイズ測定問題をさらに厄介なものにしている。
【0006】それ故、音声部分だけが送信される送信シ
ステムの場合には、音声の質を改善するために、受信端
末おいてノイズを測定し除去することが望ましい。
【0007】
【発明の概要】本発明は、ノイズと音声の両方を含む信
号からノイズ電力スペクトルを測定する方法および装置
を提供する。測定したノイズは、そのような業務が適し
ている場合には、音声の質を向上するために周知のろ波
技術で使用することができる。
【0008】最初に、受信処理装置が、CME処理され
た音声と、受信点と受信処理点との間に挿入された充填
ノイズを含む合成信号を受信する。受信プロセッサは、
合成信号に対する充填ノイズの貢献度を識別する。残り
の信号は、合成信号の音声フレームで構成されている。
本発明は、各フレームの音声に関連する電力に基づい
て、これら音声フレームのサブセットを分離する。電力
に関する最も低い10%の音声フレームの分析は、周波
数と電力レデシベルが二軸になっている二次元のヒスト
グラムを描くことによって行われる。周波数Fおよび電
力Pによるヒストグラム値は、周波数F(Hz)で測定
した音声電力スペクトルの電力がP(デシベル)になる
回数を示す。周波数は、0から4,000HzのN個の
同じ大きさの区分に分割することができる。ある実施形
態の場合には、この区分の数は129である。また、電
力範囲は、100デシベルの範囲内でM個の数値に分割
することができ、その結果、N×Mのヒストグラムがで
きる。各周波数のヒストグラム値のピーク値は、ノイズ
電力スペクトルを決定するのに使用される。その後、ノ
イズ電力スペクトルは、合成信号からノイズを取り出す
ために使用することができる。
【0009】分析対象となるフレームの数を決定するた
めに使用される電力域値は、時間の経過中に調整するこ
とができるので、呼の開始時のスタートアップ時間がよ
り速くなり、少なくとも最低限度の大ざっぱなろ波が行
われる。その後、ある時間が経過してから、システムは
安定状態になり、もっと少ないパーセンテージの音声フ
レームを選択することができるようになる。
【0010】
【発明の詳細な記述】本発明は、本質的には、別個のノ
イズ基準値が入手できない場合の、ノイズ電力スペクト
ル推定装置である。本発明を、遠隔通信ネットワークお
よび音声向上機能が音声信号のノイズの測定によって左
右される、受信音声信号の質の向上に関連して説明す
る。
【0011】図1Aは、電話11のような多数の通信端
末が12のようなローカル線により接続している遠隔地
のスイッチ10からなる、例示としての遠隔通信ネット
ワークである。上記ローカル線としては、ツイスト・ペ
アを使用することができる。出力チャネル13は遠隔地
の局10からでている。出力チャネルは、長距離を隔て
て通信信号を送信するために、衛星送信機14に接続す
ることができる。例えば、遠隔通信端末11はインド
に、通信受信装置はカリフォルニア州のロサンゼルスに
設置することもできる。このような場合、通信信号は、
衛星143を通して衛星受信装置を持つゲートウェイ1
44に送信される。送信信号は、複数のフレームのデー
タからなる。この情報は、通常、通信路多重化装置(C
ircuit Multiplication Equipment)により圧縮され
る。上記圧縮装置は、衛星通信経路を通して音声部分だ
けを送信する。それ故、圧縮装置は、圧縮をしない場合
にはノイズを含み、もっと容易に検出できるすべての音
声ギャップの送信を行わない。図示の実施形態の場合に
は、衛星通信の際にCMEが使用されている。しかし、
本発明の適用は、衛星環境のみに制限されるものではな
い。それどころか、本発明は、CME類似の処理(すな
わち、音声ギャップの除去)を使用するどのような用途
にも適用することができる。
【0012】受信側においては、米国ネットワークと国
際ネットワークとの境界のところにあるゲ−トウェイの
受信装置が、音声ギャップにホワイト・ノイズを挿入す
る。その後、合成音声/充填ノイズからなる信号は、米
国のローカル局15に送られ、最終的には送信チャネル
19を通して、通信の相手方の受信装置に送られる。
【0013】図1Bは、本発明を使用することができる
ゲ−トウェイの一実施形態である。より詳細に説明する
と、この例の場合には、スイッチ16は、入力呼を一群
の出力チャネルの一つである、最終出力送信チャネルに
リンクする通路18のような内部通路を設定する。入力
呼はリンケージの任意のセグメント内で発生したノイズ
と、受信装置により挿入された充填ノイズの両方を含ん
でいると見なされる。
【0014】本発明の場合には、論理装置20が、その
呼がファクシミリ、モデムおよび他の通信形式を閉め出
すことによって音声のみになっているかどうかを判断す
る。さらに、論理装置20は、発信番号または着信番号
が、送信ノイズ低減サービスを受けている顧客のもので
あるかどうかを判断する。論理装置20が上記判断を行
うと、呼はスイッチ22により処理装置21に転送され
る。そうでない場合には、呼は直接チャネル19に送ら
れる。
【0015】図1Cは、処理装置の一実施形態のブロッ
ク図である。
【0016】入力は、充填ノイズ検出器120および充
填ノイズ除去装置130の両方に供給される。充填ノイ
ズ検出器は、受信装置により音声に追加された充填ノイ
ズ信号を検出するために、下記のアルゴリズムに従って
動作する。すなわち、電力識別装置は、充填ノイズ除去
装置130から音声フレームを受信し、音声フレームの
電力分布を決定する。上記の識別装置は、例えば、10
%というような所定の域値に基づいて、音声フレームの
最も低い電力の百分位数の音声フレームを選択する。こ
の例の音声フレームの上記10%は、ノイズ推定装置1
50へ送られる。その後、ノイズ推定装置150は、音
声自身のノイズのノイズ電力スペクトルを測定するため
に、下記のアルゴリズムに基づいて動作する。その後、
ノイズ推定情報はフィルタ160に送られ、このフィル
タは合成信号を処理し、出力する。
【0017】これは動的プロセスであるので、情報のそ
の後のフレームは、合成信号という形で供給され、また
追加のフレームに対して充填ノイズろ波、電力識別およ
び音声ノイズ推定を行うために、このプロセスは反復し
て行われる。
【0018】本発明が解決しようとしている問題および
その問題に対する一般的な解決方法は、図2−図7を参
照すれば、さらに容易に理解できる。
【0019】図2は、充填ノイズおよび音声ノイズの電
力スペクトルの一例である。この図を見れば分かるよう
に、充填ノイズ210は、本来基本的にはフラットであ
る。すなわち、全周波数スペクトルにわたってその電力
はどちらかといえば一定である。しかし、図2は、音声
ノイズに対する階調ノイズの一例である。この階調ノイ
ズは、100−300Hzのところに強い成分(40−
60デシベル)を持つ。それ故、これらノイズ成分(充
填ノイズおよび階調ノイズ)は両方とも、遠隔端末にお
いて発生した入力で交互に変動し、音声内容を識別する
ための音声受信装置の性能に悪影響を与える場合があ
る。通信信号の音声内容に対するこれらノイズ源の両方
の影響を最小限にすれば、有利な結果がもたらされる。
【0020】図3は、合成信号の複数のフレームにわた
って音声とノイズを含む、通常の合成信号のスペクトル
写真である。点31のところに、どちらかといえば変動
しないように見える、信号からの影響がいくらかあるこ
とがハッキリ分かる。しかし、この情報は、階調ノイズ
を示唆してはいるが、合成信号に対する適当なフィルタ
を作るには、この情報だけでは十分でない。
【0021】図1Cのところですでに説明したように、
合成信号の充填ノイズの内容は、後で詳細に説明するア
ルゴリズムにより検出される。その後、この充填ノイズ
の内容を、合成信号から除去することができる。特に、
充填ノイズ・フレームは無視することができる。充填ノ
イズ・フレームが除去されると、音声だけを含むフレー
ムだけが残り、音声のノイズ電力スペクトルを測定する
ことができる。ノイズ推定アルゴリズムは、音声を含む
これらフレームのサブセットを識別することにより最高
の動作をする。特に、本発明の場合には、上記アルゴリ
ズムにより、フレームを含む各音声のエネルギー値が決
定され、その後で、低電力域値点の決定が行われ、音声
フレームの10%が、この低い電力域値点より低い電力
内容を持っているかどうかの判断が行われる。その後、
このプロセスは、音声フレームのこの10%だけを使用
して、音声自身でノイズを発見することができるかどう
か、またそのノイズは何であるかを分析する。図4は、
音声フレームのこの最も低い10%のスペクトル写真で
ある。このスペクトル写真を使って、ノイズ対音声の関
係を検出するのは難しい。しかし、このスペクトル写真
を、図5に示すように、三次元のグラフに変換すると、
ノイズ「パターン」の存在がハッキリ見えてくる。
【0022】この三次元グラフは、周波数、各フレーム
の各周波数のところに現れる信号の電力を示す。複数の
フレームにわたって、図5の領域51の100−300
Hz付近の周波数のところに、約50dBの電力を持つ
信号がかなり一貫して存在することが分かるだろう。
【0023】二次元ヒストグラムが作成されるが、この
ヒストグラムは、各周波数および電力セルに対する三次
元スペクトル写真での発生数に対応するグレイ・レベル
を示す。図6は、上記二次元ヒストグラムである。約5
00−4,000Hzのところに、20dBまたはそれ
以下の領域61に、もっとランダムな分布が存在するこ
とは明かである。しかし、0−500Hzの周波数で3
5dB以上の領域に、この電力/周波数の組み合わせが
もっと集中しているのが見られる。この相関関係の深い
関係は、図7に示すような三次元ヒストグラムに、さら
にハッキリと見ることができる。
【0024】この三次元ヒストグラムには、二つの一般
的な領域が図示されている。第1の領域71は、基本的
には、周波数および電力スペクトルを横切る、音声フレ
ームの種々の音声部分の分布を示す。このヒストグラム
は、所定の数のフレームでの、特定の電力および周波数
の組み合わせの発生回数を示す。領域71においては、
上記発生回数はかなりランダムに分布している。しか
し、階調ノイズが存在する領域においては、すなわち、
電力が40−60dBである50−300Hzの領域に
おいては、上記周波数の事象及び電力の事象が非常に集
中している。この領域を領域72とする。その強度によ
りスパイク状になっている領域、すなわち、三次元ヒス
トグラムのこれら領域に応じる点またはヒットの数は、
この特定の周波数および電力分布の階調ノイズが存在す
ることを示す。それ故、このヒストグラム情報を、受信
合成信号の音声部分を向上させるために、適当な信号を
発生するろ波装置に供給することができる音声のノイズ
を特徴づけるために使用することができる。それ故、合
成信号の受信装置は、そうでない場合には、音声発生装
置と音声受信装置との間の送信リンクにより発生する恐
れがある、ノイズからの影響が軽減され、質が改善され
た信号を受信する。音声内容のノイズを決定するための
流れについては、図8−図11を参照しながら説明す
る。
【0025】図8は、一般的にいって、音声のノイズの
電力スペクトを本発明により測定するための、三つの段
階からなるプロセスである。最初の段階81において
は、音声の間に挿入した充填ノイズを決定するために、
受信音声の処理が行われる。この処理は、図9のところ
で説明する2モードの検出器および反復データ検出器を
使用して行われる。充填ノイズが合成信号から除去され
ると、残りのフレームに対して、図10のところで詳細
に説明する電力識別、段階82が行われる。この電力識
別により、各音声フレームに関連するエネルギー値に基
づいて、使用することができる音声フレームのサブセッ
トが選択され、その結果、ノイズがもっと大きな役割を
果たしているか、またはこれらフレームがより多くのノ
イズを含んでいるために、ノイズの検出の可能性が高い
上記のフレームが選択される。電力識別段階の後で、ノ
イズを含む周波数および電力レベルの区分を識別するた
めに、二次元のヒストグラムが作成され、その結果ノイ
ズ電力スペクトルを発生することができる。これが段階
83である。ヒストグラムを発生するためのプロセスに
ついては、図11のところで説明する。
【0026】合成信号を処理するために行われる特定の
段階を説明する前に、二次元ヒストグラムについて簡単
に説明しておきたい。特に、ヒストグラムを作成する際
には、合成信号の内容を分析するために、システムは複
数の周波数/電力区分を使用する。特に、0−4,00
0Hzの周波数範囲を、それぞれの幅が31.25Hz
の129の周波数区分に分割する。このヒストグラム
は、最初のサブスクリプト[i]が、0−99dBの範
囲の整数のdB単位の電力を表すアレーHIST[i]
[j]である。第2のサブスクリプト[j]は、周波数
区分ビンである。それ故、数値HIST[i][j]
は、一つのフレームがidBの電力レベルで、j番目の
周波数区分を持つ回数を示す。充填ノイズ除去の最終ゴ
ールは、ヒストグラムに対する充填ノイズの悪影響を低
減することである。
【0027】図9のフローチャートで示す充填ノイズの
検出中に、本発明は、充填ノイズ・フレームを識別する
ために、二つの異なる検出動作、すなわち、2モード検
出および反復データ検出を行う。
【0028】合成信号に対しては、最初2モード検出が
行われる。この検出動作中、フレームの最大サンプル・
レベルから最少サンプル・レベルの領域が、三つの等し
い隣接している領域に分割される。中央領域のサンプル
・レベルの発現回数が所定の域値より少ない場合には、
フレームは充填ノイズであると見なされる。
【0029】次の反復データ検出器の場合には、最大値
に適合するサンプル数pと、最小値に適合するサンプル
数qとを決定するために、フレームの検査が行われる。
上記pおよびqの数値が、所定の域値より大きい場合に
は、フレームは充填ノイズと見なされる。
【0030】これら二つの検出器に基づいて、充填ノイ
ズと分類されなかった上記フレームは、ノイズ推定処理
に送られる。
【0031】ノイズ推定動作の次の段階においては、充
填フレーム検出プロセスから残ったフレームに関する電
力識別が行われる。この電力識別動作は、個々の各音声
フレームの全電力に基づいて、音声フレームの所定の最
も低いパーセンテージ(割合)を構成している音声フレ
ームの一つのブロックから、これら音声フレームの選出
プロセスを含む。それ故、最初の段階として、各音声フ
レームの全電力が計算され、それにより分析対象のフレ
ームの上記ブロックの、各音声フレームの電力バンドが
わかる。これが段階1001である。その後、この処理
装置は、音声フレームの10%が決定した域値の間に入
る、それに関連する全電力を持つ電力域値レベルを決定
する。これが段階1002である。このパーセンテージ
は、フィルタの処理のニーズに適合するように調整する
ことができる。事実、スタート時に、開始する際の幾分
有利なろ波能力を得るのに必要な時間を短縮するため
に、そのそれぞれの電力バンドにより決定した音声フレ
ームの最も低い20%の分析ができるように、域値をで
きるだけ高く設定することができる。本発明の一実施形
態の場合には、どの音声フレームを次に処理するのを決
定する電力域値のこの決定は、下記の方法で行われる。
推定装置は、最初に、分析するフレームに対するスター
ト点として、低い方の域値を決定しなければならない。
推定装置は、上記域値を決定するために、充填ノイズと
識別されなかったフレームのスペクトルの平坦な特性を
使用する。最初に、算術平均に対する幾何学的平均の比
率の計算が行われる。平坦の程度を計算するために、1
29の各周波数区分の電力が最初に決定される(段階9
1)。「電力(j)」項は、各周波数区分における、入
力スペクトル、すなわち、入力音声にノイズを加えたも
ののスペクトルの電力に対応する。幾何学的電力平均は
式1により計算される。
【0032】
【数1】 また、算術平均は、式2により計算される。
【0033】
【数2】 その後で、平坦度は、幾何学的平均および算術平均を使
用して、式3により計算される。
【0034】
【数3】 但し、cntはハイの数値−ローの数値+1であり、ロ
ーの数値は10、ハイの数値は100である。
【0035】次に、下記式のnumPts(M)を、全
電力dB=M±0.5を持つフレームの数であるとしよ
う。電力dB=M、すなわち、avFlat(M)を持
つフレーム平均対数平坦度は次式、式4のように設定す
る。
【0036】
【数4】 この場合、フレームの最も低い10%を決定するための
電力域値のスタート点は、式4により計算された数値
が、所定の平坦な域値より低くなるように、最も低い電
力(lowPow)Mに設定される。この場合、非平坦
度の数値の項は、平坦度が平坦度の域値より大きくなる
場合のフレーム数になるように設定される。その後、高
域決定郡、highPowが、平坦でない音声フレーム
のその10%に対する最も低い電力がhighPowよ
り低く、lowPowよりは高くなるように計算され
る。それ故、この電力識別動作は、音声フレームの電力
特性に基づいて、スペクトル的に平坦でない音声フレー
ムの最も低い10%を選択する。音声フレームのこのサ
ブセットを選択するための根本的な理由は、音声フレー
ムのこのグループにおいては、ノイズがもっと大きく、
もっと推定しやすいからである。
【0037】音声フレームの識別が完了すると、本発明
は、最初に選択した音声フレームの周波数および電力を
相互に関連づけるヒストグラムを作成し(段階110
1)、その後で上記ヒストグラムからノイズ電力スペク
トルを作り出すことにより、音声フレームのノイズ電力
スペクトルを決定する。
【0038】図6に示すような、二次元ヒストグラム
は、上記フレーム、すなわち、音声を含み、高い方の電
力域値より低い全電力値をもつフレームから作る。ヒス
トグラムを作る際のフレームの数は200であるが、こ
の数は第1のヒストグラムに対して、例えば、71フレ
ームというように、実質的に減らすことができ、そのよ
うにした場合には、システムは通信中最初にノイズ検出
を行い、それにより早めにろ波を行う。
【0039】すでに説明したように、ヒストグラムは、
最初のサブスクリプト[i]が、0−99dBの範囲の
整数のdB単位の電力を表し、第2のサブスクリプト
[j]が、31.25Hzの幅を持つ0−128の範囲
の周波数区分である、アレーHIST[i][j]であ
る。HIST[i][j]は、idBの電力レベルのと
ころに、そのj番目の周波数ビンを持つフレームの回数
である。ノイズ電力スペクトルは、下記の方法で作成す
る。各周波数[j]に対する最大[j]で表す最大のH
IST[i][j]は、すべての[I]にわたって得ら
れる。この検出動作中の最大の電力Iは、最大電力
[j]と呼ばれる。各周波数区分jに対する最大値の他
に、局部的な最大電力ロー[j]が、局部的最大値が、
この実施形態の場合には、8に設定してある域値よりも
高いレベルで起こる最も低い電力レベルとして得られ
る。各周波数ビンjに対する電力スペクトル・レベル
は、最大[j]が25より小さく、最大電力ロー[j]
が最大電力[j]−4より小さい場合には、3<j<3
0と推定され、電力[j]=最大電力ロー[j]であ
り、そうでない場合には、電力[j]=最大電力[j]
である。j≦3またはj≧30の場合には、電力[j]
=最大電力[j]である。
【0040】この図形により、ホルマント(formant)周
波数レベルがノイズ電力レベルで使用されるのが防止さ
れる。25以上のレベルは階調的なものと見なされ、2
5以下のピークは93−930Hzの周波数に対するホ
ルマントであると見なされる。上記計算は、10ミリ秒
につき一つの周波数区分Jで行われる。それ故、ヒスト
グラムが完成してから1.29秒に完了する。
【0041】上記計算は、本発明の有効なノイズ検出を
実行するための例示的なものである。これらの特定な計
算は、コア情報が依然として合成音声信号、すなわち、
ノイズのために合成信号の選択した部分だけを分析する
ことができるようにする充填ノイズ情報、すなわち、音
声部分から入手している限り、また音声フレームのサブ
セットの選択が、ノイズ電力スペクトルの検出能力を改
善するために行われている限り、修正することができ
る。それ故、この技術は、合成信号の「ホワイト・ノイ
ズ」または「カラー・ノイズ」を検出するのにも使用す
ることができる。ただ一つの違いは、ヒストグラムのこ
のホワイト・ノイズの外観が、階調ノイズの場合ほど目
立つものでないということだけである。
【0042】本発明を使用すれば、CMEまたは音声挿
入(Time - Assignment Speech Interpolation:TASI)
方式を使用するシステムのような、その内部で信号の一
部がノイズに対して伝統的に分析される信号の部分、す
なわち、ギャップすなわち、音がない部分が除去または
修正される送信システムでノイズの評価を行うことがで
きる。それ故、本発明を使用すれば、伝統的なノイズ推
定およびろ波技術を使用することができる場合ですら、
音声受信を改善することができる。
【図面の簡単な説明】
【図1A】本発明の一実施形態を使用することができる
システムのブロック図である。
【図1B】本発明の一実施形態を使用することができる
システムのブロック図である。
【図1C】本発明の一実施形態を使用することができる
システムのブロック図である。
【図2】本発明が解決することができる問題の一例とし
ての、充填ノイズと音声のノイズとの電力対周波数曲線
を示す図である。
【図3】本発明により処理した信号のタイプの一例とし
ての、音声およびノイズの合成信号のスペクトル写真を
示す図である。
【図4】図3の信号の音声フレームに関連する電力に基
づく、音声の最も低い10%のスペクトル写真を示す図
である。
【図5】図4のスペクトル写真の三次元グラフを示す図
である。
【図6】図5の三次元スペクトル写真から作った二次元
ヒストグラムを示す図である。
【図7】図6の二次元ヒストグラムが示すデータを含
む、三次元ヒストグラムを示す図である。
【図8】本発明の音声のノイズを検出するための、一般
的な三つの段階からなるフローチャートを示す図であ
る。
【図9】合成受信信号の充填ノイズを検出するためのフ
ローチャートを示す図である。
【図10】充填ノイズ・フレームを除去した信号で電力
を識別するためのフローチャートを示す図である。
【図11】本発明の一実施形態による電力識別音声フレ
ームから、ヒストグラムを作成する際のフローチャート
を示す図である。
【符号の説明】
10 スイッチ 11 通信端末 12 ローカル線 13 出力チャネル 16 スイッチ 18 通路 21 処理装置 22 スイッチ
───────────────────────────────────────────────────── フロントページの続き (72)発明者 ロナルド シャヤ アメリカ合衆国 07960 ニュージャー シィ,モリスタウン,ストーンヘンジ ロード 43 (56)参考文献 特開 昭56−46300(JP,A) 特開 平5−29191(JP,A) 特開 平5−49054(JP,A) (58)調査した分野(Int.Cl.7,DB名) H04B 1/10 H04B 15/00 G10L 7/00 - 9/00

Claims (18)

    (57)【特許請求の範囲】
  1. 【請求項1】 遠隔通信送信で受信した音声フレームの
    ノイズ・スペクトルを推定する方法であって、該方法
    は、 第1の複数の音声フレームの各々に対する電力分布を決
    定する段階と、 該決定された電力分布に基づいて、該第1の複数の音声
    フレームのサブセットを選択する段階と、 該第1の複数の音声フレームの該サブセットの周波数と
    電力とを相互に関連付けるヒストグラムを作成する段階
    と、 該ヒストグラムを用いて、該第1の複数の音声フレーム
    のノイズ電力スペクトルを決定する段階からなることを
    特徴とする方法。
  2. 【請求項2】 請求項1に記載の方法において、該方法
    はさらに、 該遠隔通信送信の該第1の複数の音声フレームに続い
    て、第2の複数の音声フレームを規定する手段と、 該第2の複数の音声フレームの各々に対する電力分布を
    決定する段階と、 該決定された電力分布に基づいて、該第2の複数の音声
    フレームのサブセットを選択する段階と、 該第2の複数の音声フレームの周波数と電力とを相互に
    関連付けるヒストグラムを作成する段階と、 該ヒストグラムを用いて、該第2の複数の音声フレーム
    のノイズ電力スペクトルを決定する段階とからなること
    を特徴とする方法。
  3. 【請求項3】 請求項2に記載の方法において、該第1
    の複数の音声フレームの数は、該第2の複数の音声フレ
    ームの音声フレームの数より少ないことを特徴とするシ
    ステム。
  4. 【請求項4】 請求項1に記載の方法において、該方法
    はさらに、該遠隔通信送信から充填ノイズ・フレームを
    抽出することによって、該遠隔通信送信の音声フレーム
    を検出する段階からなることを特徴とする方法。
  5. 【請求項5】 請求項1に記載の方法において、該ヒス
    トグラムを作成する段階は、該第1の複数の音声フレー
    ムの該サブセットの音声フレームの各々を分析する段階
    からなり、周波数レンジを形成する複数の周波数サブレ
    ンジのうちの各々の周波数サブレンジに対する電力が決
    定されることを特徴とする方法。
  6. 【請求項6】 回路多重化装置により作られ、充填ノイ
    ズを含む、受信した送信信号のノイズを推定する方法で
    あって、 該充填ノイズと通信信号とを分離するために、該受信し
    た送信信号から充填ノイズを除去する段階と、 該通信信号のエネルギー分布を使用して、該通信信号の
    一部を選択する段階と、 該通信信号の該選択された部分の電力分布と周波数分布
    に基づいて、該受信した送信信号のノイズ電力スペクト
    ルを決定する段階とからなることを特徴とする方法。
  7. 【請求項7】 請求項6に記載の方法において、該決定
    する段階は、該通信信号の該部分の一部の周波数と電力
    とを相互に関連付けるヒストグラムを作成することから
    なることを特徴とする方法。
  8. 【請求項8】 請求項6に記載の方法において、該受信
    した送信信号は、複数の音声フレームと複数の充填ノイ
    ズ・フレームとからなり、該選択する段階は、音声フレ
    ームの各々のエネルギー・レベルに従って、該通信信号
    の該部分以外の部分から該音声フレームの所定の割合を
    分離する段階からなることを特徴とする方法。
  9. 【請求項9】 請求項6に記載の方法において、該通信
    信号の該部分が、複数の音声フレームからなることを特
    徴とする方法。
  10. 【請求項10】 請求項9に記載の方法において、該決
    定する段階は、該分離した音声フレームの一部の周波数
    と電力とを相互に関連付けるヒストグラムを作成する段
    階を含むことを特徴とする方法。
  11. 【請求項11】 音声部分を含む送信信号を処理する方
    法において、該方法は、 該送信信号の音声部分を含む部分と該音声部分を含まな
    い部分とを分離する段階と、 該音声部分の一部の電力分布と周波数分布とに基づいて
    該送信信号のノイズ電力スペクトルを決定するために、
    該音声部分を分析する段階からなることを特徴とする方
    法。
  12. 【請求項12】 請求項11に記載の方法において、該
    音声部分を分析する段階は、 該音声部分の電力分布を使用して、該音声部分の一部を
    選択する段階と、 該音声部分の該選択された部分の電力分布と周波数分布
    とに基づいて、該送信信号のノイズ・スペクトルを決定
    する段階からなることを特徴とする方法。
  13. 【請求項13】 請求項12に記載の方法において、該
    決定する段階は、該音声部分の該選択された部分の一部
    の周波数と電力とを相互に関連付けるヒストグラムを作
    成する段階を含むことを特徴とする方法。
  14. 【請求項14】 入力音声信号から送信信号を発生する
    呼多重化装置と、 第1の場所にあり、該呼多重化装置に接続している送信
    機と、 該第1の場所から離れた第2の場所にあり、充填ノイズ
    発生装置を含む受信装置と、 音声と充填ノイズを含む合成音声信号を受信する、該受
    信装置に接続された呼処理装置とからなり、該呼処理装
    置は、 該合成音声信号から充填ノイズ部分を抽出する充填ノイ
    ズ検出器と、 該音声部分のエネルギー値に基づいて、該合成音声信号
    の音声部分を選択する、該充填ノイズ検出器に接続され
    た電力識別装置と、 該エネルギー値に基づいて選択された音声部分を受信し
    てノイズ電力スペクトルを決定する、該電力識別装置に
    接続された音声ノイズ推定装置とからなることを特徴と
    する音声信号送受信システム。
  15. 【請求項15】 請求項14に記載のシステムにおい
    て、該選択された音声部分は複数の音声フレームからな
    り、該電力識別装置は該複数の音声フレームを形成する
    音声フレームの数を調整する手段を含むことを特徴とす
    るシステム。
  16. 【請求項16】 請求項14に記載のシステムにおい
    て、該選択された音声部分は複数の音声フレームを形成
    し、該音声ノイズ推定装置は、 該複数の音声フレームの各々に対する信号周波数レンジ
    の複数の周波数サブレンジのうちの各々の周波数サブレ
    ンジに対する電力値を決定する手段と、 複数の周波数レンジと、該複数の音声フレームにわたる
    該周波数レンジの各々に関連する電力値の出現とを示す
    ヒストグラムを作成する手段からなることを特徴とする
    システム。
  17. 【請求項17】 請求項16に記載のシステムにおい
    て、該音声ノイズ推定装置は、 該複数の音声フレームの各々に対する信号周波数レンジ
    の複数の周波数サブレンジのうちの各々の周波数サブレ
    ンジに対する電力値を決定する段階と、 複数の周波数レンジと、該複数の音声フレームにわたる
    該周波数レンジの各々に関連する電力値の出現とを示す
    ヒストグラムを作成する手段からなることを特徴とする
    システム。
  18. 【請求項18】 入力ポート、出力ポート、該入力ポー
    トに接続された内部スイッチ、該内部スイッチに接続さ
    れ該入力ポートで受信した送信信号がノイズ処理を受け
    る資格があるかどうかを判断するサービス・プロバイダ
    評価器、及び該内部スイッチに接続された入力を有する
    ノイズ処理装置とからなる呼処理装置において、 該ノイズ処理装置が、 該入力を受信し、充填ノイズを抽出して該入力から抽出
    充填ノイズを差し引くことによって音声を含む音声フレ
    ームを生成する充填ノイズ検出器と除去器、該音声フレ
    ームを受信して、該音声フレームの電力分布を決定する
    電力決定器、 該決定された電力分布に基づいて該音声フレームのサブ
    セットを選択して、該音声フレームのサブセットにおけ
    る周波数と電力とを相互に関連付けるヒストグラムを作
    成し、そして該ヒストグラムを用いて該音声フレームに
    おけるノイズ電力スペクトルを決定する音声ノイズ推定
    器、及び該音声ノイズ推定器と該出力ポートとに接続さ
    れ、該出力ポートへの出力を与えるフィルタとからなる
    ものである呼処理装置。
JP18804497A 1996-07-15 1997-07-14 送信音声の雑音内容を測定する方法および装置 Expired - Fee Related JP3263009B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US08/680760 1996-07-15
US08/680,760 US5950154A (en) 1996-07-15 1996-07-15 Method and apparatus for measuring the noise content of transmitted speech

Publications (2)

Publication Number Publication Date
JPH10107661A JPH10107661A (ja) 1998-04-24
JP3263009B2 true JP3263009B2 (ja) 2002-03-04

Family

ID=24732411

Family Applications (1)

Application Number Title Priority Date Filing Date
JP18804497A Expired - Fee Related JP3263009B2 (ja) 1996-07-15 1997-07-14 送信音声の雑音内容を測定する方法および装置

Country Status (5)

Country Link
US (1) US5950154A (ja)
EP (1) EP0820051B1 (ja)
JP (1) JP3263009B2 (ja)
CA (1) CA2207866C (ja)
DE (1) DE69716187T2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8718960B2 (en) 2009-09-30 2014-05-06 Electronics And Telecommunications Research Institute System and method of selecting white gaussian noise sub-band using singular value decomposition

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6327564B1 (en) * 1999-03-05 2001-12-04 Matsushita Electric Corporation Of America Speech detection using stochastic confidence measures on the frequency spectrum
US6618453B1 (en) * 1999-08-20 2003-09-09 Qualcomm Inc. Estimating interference in a communication system
US6804640B1 (en) * 2000-02-29 2004-10-12 Nuance Communications Signal noise reduction using magnitude-domain spectral subtraction
JP3453130B2 (ja) * 2001-08-28 2003-10-06 日本電信電話株式会社 雑音源判別装置及び方法
US8073689B2 (en) * 2003-02-21 2011-12-06 Qnx Software Systems Co. Repetitive transient noise removal
US8326621B2 (en) 2003-02-21 2012-12-04 Qnx Software Systems Limited Repetitive transient noise removal
US7885420B2 (en) * 2003-02-21 2011-02-08 Qnx Software Systems Co. Wind noise suppression system
US8271279B2 (en) * 2003-02-21 2012-09-18 Qnx Software Systems Limited Signature noise removal
TWI233590B (en) * 2003-09-26 2005-06-01 Ind Tech Res Inst Energy feature extraction method for noisy speech recognition
JP4813774B2 (ja) * 2004-05-18 2011-11-09 テクトロニクス・インターナショナル・セールス・ゲーエムベーハー 周波数分析装置の表示方法
US8280730B2 (en) * 2005-05-25 2012-10-02 Motorola Mobility Llc Method and apparatus of increasing speech intelligibility in noisy environments
US8489396B2 (en) * 2007-07-25 2013-07-16 Qnx Software Systems Limited Noise reduction with integrated tonal noise reduction
JP2011523706A (ja) * 2008-05-22 2011-08-18 テクトロニクス・インコーポレイテッド 3次元ビットマップでの信号検索
JP5870476B2 (ja) * 2010-08-04 2016-03-01 富士通株式会社 雑音推定装置、雑音推定方法および雑音推定プログラム
US10867615B2 (en) 2019-01-25 2020-12-15 Comcast Cable Communications, Llc Voice recognition with timing information for noise cancellation

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA1243779A (en) * 1985-03-20 1988-10-25 Tetsu Taguchi Speech processing system
US4630304A (en) * 1985-07-01 1986-12-16 Motorola, Inc. Automatic background noise estimator for a noise suppression system
US4897878A (en) * 1985-08-26 1990-01-30 Itt Corporation Noise compensation in speech recognition apparatus
US5307405A (en) * 1992-09-25 1994-04-26 Qualcomm Incorporated Network echo canceller
WO1995015550A1 (en) * 1993-11-30 1995-06-08 At & T Corp. Transmitted noise reduction in communications systems

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8718960B2 (en) 2009-09-30 2014-05-06 Electronics And Telecommunications Research Institute System and method of selecting white gaussian noise sub-band using singular value decomposition

Also Published As

Publication number Publication date
CA2207866A1 (en) 1998-01-15
DE69716187D1 (de) 2002-11-14
EP0820051B1 (en) 2002-10-09
DE69716187T2 (de) 2003-06-18
US5950154A (en) 1999-09-07
EP0820051A2 (en) 1998-01-21
JPH10107661A (ja) 1998-04-24
CA2207866C (en) 2002-04-23
EP0820051A3 (en) 1998-11-04

Similar Documents

Publication Publication Date Title
JP3263009B2 (ja) 送信音声の雑音内容を測定する方法および装置
EP0556992B1 (en) Noise attenuation system
US7031916B2 (en) Method for converging a G.729 Annex B compliant voice activity detection circuit
JP3228940B2 (ja) 音声通信ネットワークにおける残留遠端エコーを低減するための方法と装置
EP0563832A1 (en) Stereo audio encoding apparatus and method
CN1254221A (zh) 基于窄带信号产生宽带信号的方法装置及其技术设备
JPH1097292A (ja) 音声信号伝送方法および不連続伝送システム
WO1995015550A1 (en) Transmitted noise reduction in communications systems
CA2501989A1 (en) Isolating speech signals utilizing neural networks
JP2004514327A (ja) 電気通信網における電話リンクの会話品質の測定
JP3310302B2 (ja) エコー測度計算方法及び装置
CN104981870A (zh) 声音增强装置
US7970121B2 (en) Tone, modulated tone, and saturated tone detection in a voice activity detection device
US7194093B1 (en) Measurement method for perceptually adapted quality evaluation of audio signals
GB2305831A (en) Noise suppression using Fourier/Inverse Fourier technique
US6804566B1 (en) Method for continuously controlling the quality of distributed digital sounds
Prasad et al. Evaluation of bandwidth extension of telephony speech by data hiding in three languages
RU2206960C1 (ru) Способ подавления шума в информационном сигнале и устройство для его осуществления
Whitmal et al. Wavelet-based noise reduction
GB2375937A (en) Method for analysing a compressed signal for the presence or absence of information content
KR100729555B1 (ko) 음성 품질의 객관적인 평가방법
JP2003316380A (ja) 会話を含む音の信号処理を行う前の段階の処理におけるノイズリダクションシステム
Kurada et al. Speech Bandwidth Extension Using DWT-FFT-Based Data Hiding.
JP2002189499A (ja) ディジタルオーディオ信号圧縮方法および圧縮装置
JPS63128823A (ja) エコ−サプレツサ

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071221

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081221

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091221

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101221

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees