JP4927957B2 - 通信システムにおいてノイズレベルを評価する方法 - Google Patents

通信システムにおいてノイズレベルを評価する方法 Download PDF

Info

Publication number
JP4927957B2
JP4927957B2 JP2009550325A JP2009550325A JP4927957B2 JP 4927957 B2 JP4927957 B2 JP 4927957B2 JP 2009550325 A JP2009550325 A JP 2009550325A JP 2009550325 A JP2009550325 A JP 2009550325A JP 4927957 B2 JP4927957 B2 JP 4927957B2
Authority
JP
Japan
Prior art keywords
signal
data
smoothing
noise
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009550325A
Other languages
English (en)
Other versions
JP2010519583A (ja
Inventor
クウン・フォス
カルステン・ヴァンドボー・ソーレンセン
ヨン・バーゲンハイム
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Skype Ltd Ireland
Original Assignee
Skype Ltd Ireland
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Skype Ltd Ireland filed Critical Skype Ltd Ireland
Publication of JP2010519583A publication Critical patent/JP2010519583A/ja
Application granted granted Critical
Publication of JP4927957B2 publication Critical patent/JP4927957B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Noise Elimination (AREA)
  • Monitoring And Testing Of Transmission In General (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Dc Digital Transmission (AREA)
  • Near-Field Transmission Systems (AREA)

Description

本発明は通信システムに関する。特に本発明は、通信システムのノイズレベルを評価する方法及び装置に関する。
通信システムでは、通信ネットワークが設けられており、該通信ネットワークは、通話や他の通信イベントで2つの通信ターミナルが相互に情報を送信できるように、それら通信ターミナルを結合できる。情報は、スピーチ、テキスト、画像若しくはビデオを含むことができる。
現代の通信システムは、デジタル信号の伝送に基づく。マイクロホンにより捕獲されるスピーチ等のアナログ情報は、一つのターミナルの送信部にてアナログデジタルコンバータに入力され、デジタル信号に変換される。デジタル信号はエンコードされ、チャネルを介して目的ターミナルの受信部へ伝送するためにデータパケット内に配置される。
スピーチが入力されるターミナルの近傍の背景ノイズは、デジタル信号内のスピーチ情報と共に伝送される。このことにより、目的ターミナルで出力されるスピーチ情報は信号と共に伝送されたノイズにより不明確なものになってしまう。更に、信号にノイズがあることで、スピーチ信号エンコード化に干渉してしまい、結果として、可聴のコーディングについてひずみが増加してしまう、若しくは伝送率の増加に干渉してしまう。
信号にフィルタを掛け伝送ターミナルのエンコーダに入力されるノイズの程度を減少させる試みが為されている。エンコーダに入力される信号からノイズを除去するために、ノイズレベル評価が要求される。
モバイルデバイスなどのターミナルに利用される低複雑度レベル評価は、再帰形ローパスフィルタ、若しくはノイズレベルを評価するための時間平均化を用いて、周波数領域インプット信号を通常平滑にする。
ローパスフィルタの例は、式1の示されるような1次自己回帰フィルタである
Figure 0004927957
ここで、y[n]はフィルタされる要素nのアウトプット、x[n]はフィルタされる要素nのインプットであり、αは0と1の間の平滑化計数である。平滑化計数αが増加すれば、平滑化も増大する。
ローパスフィルタの更なる例は、式2に示されるような、同じ自己回帰フィルタの高速実装である。
Figure 0004927957
低複雑度レベル評価はメモリ要求も低く、計算パワーが低くメモリスペースが限定されたデバイスには非常に適切である。
しかしながら、ノイズレベル評価を生成するためにローパスフィルタを利用する際の一つの問題は、入力信号が背景ノイズとスピーチの両方からなるとき、スピーチの期間により生じる信号エネルギが増加するとノイズ値評価がより高くなるバイアスが掛かってしまう、ということである。
先行技術の方法では、スピーチの存在が検出されたらノイズレベル評価を調整するということで、この問題を軽減する。先行技術の方法では、スピーチアクティビティが検出された期間に平滑化を増加させることが利用され、信号内のスピーチの存在により信号エネルギが増大することを説明する。しかしながら、スピーチの存在の検出は、複数の理由により、必ずしも信頼に足るものではない。スピーチ検出器が初期化されたばかりであると、ノイズからスピーチを区別する十分なヒストリ情報が存在していないことがある。また、スピーチとノイズレベルは混乱されやすい。特に、スピーチの最初の数フレームが低エネルギであり背景ノイズと間違われる場合に、このことが生じる。ノイズ及び/又はスピーチレベルが時間と共に変化しているときにも、スピーチとノイズレベルは混乱され得る。スピーチがノイズとして誤って検出されると、より高いノイズレベル評価へのバイアスが掛かる結果となる。一方、ノイズがスピーチとして誤って検出されるとノイズレベル評価器は利用可能な情報を実効的には利用せず、不正確な評価となってしまう。
従って、先行技術の問題を克服することが本発明の目的である。大量のメモリを要求する複雑な計算方法を利用せずに出力信号の品質を改良する方法を提供することが、本発明の更なる目的である。
本発明の第1の形態では、
音声情報及びノイズを含むデータ内のノイズを評価する方法であって、
一連のインプット値としてデータを受けるステップと、
第1の非線形マッピングをインプット値に適用することでデータを変換するステップであって、インプット値の大きさが増加するときにマッピングの導関数が大きさを減少させる、ステップと、
変換されたデータを平滑化するステップと、
インプットされたデータ内のノイズの評価を決定するために、第1の非線形マッピングとは逆である第2の非線形マッピングを適用することにより、平滑化された、変換されたデータを変換するステップと
を含む方法が提示される。
本発明の第2の形態では、
音声情報及びノイズを含むデータ内のノイズを評価する装置であって、
一連のインプット値としてデータを受ける受け取り手段と、
第1の非線形マッピングをインプット値に適用することでデータを変換する第1の変換手段であって、インプット値の大きさが増加するときにマッピングの導関数が大きさを減少させる、第1の変換手段と、
変換されたデータを平滑化する平滑化手段と、
インプットされたデータ内のノイズの評価を決定するために、第1の非線形マッピングとは逆である第2の非線形マッピングを適用することにより、平滑化された、変換されたデータを変換する第2の変換手段と
を含む装置が提示される。
本発明の第3の形態では、
音声情報及びノイズを含むデータ内のノイズを評価する装置であって、
一連のインプット値としてデータを受けるように構成された受け部と、
第1の非線形マッピングをインプット値に適用することでデータを変換するように構成された第1の変換部であって、インプット値の大きさが増加するときにマッピングの導関数が大きさを減少させる、第1の変換部と、
変換されたデータを平滑化するように構成された平滑化部と、
インプットされたデータ内のノイズの評価を決定するために、第1の非線形マッピングとは逆である第2の非線形マッピングを適用することにより、平滑化された、変換されたデータを変換するように構成された第2の変換部と
を含む装置が提示される。
ノイズを評価するために、本発明の実施形態により提示される方法に従って、変換された信号を平滑化することの一つの利点は、インプット信号の値の大きい増加に対して感度が減少することで、スピーチ存在検出エラーが生じたときにノイズレベル評価のバイアスが小さくなること、である。このことにより、ノイズレベル評価の正確性が改善され、本発明の実施形態で利用される簡易なスピーチ検出方法が可能になる。
周知のノイズレベル評価方法では、フィルタにおける平滑化係数を変更して高エネルギ信号レベルがスピーチ検出エラーを補償することが必要である。しかしながら、本発明の実施形態では、スピーチ存在の検出に応じて平滑化係数が変更を要求される程度は、減少される。このことによりノイズレベルを変更することに関する追跡が改善され、ノイズレベル評価の初期収束が加速される。
ノイズレベル評価の正確性が改善されるので、本発明において簡素な再帰形フィルタを用いることで、本発明を用いなければより複雑な方法でしか得ることのできない結果を得ることができる。
本発明の実施形態では、簡素なローパスフィルタ及び簡素なスピーチ検出方法が利用され得るので、要求される計算上の複雑さは減少する。
本発明をより良く理解し如何にして本発明が実施されるかを示すために、本発明の実施形態を添付の図面を参照して説明する。
図1(a)は、大きい突然のエネルギ変化を伴う信号のグラフを示す。図1(b)は、ローパスフィルタによりフィルタされた大きい突然の変化エネルギを伴う信号のグラフを示す。図1(c)は、ローパスフィルタによりフィルタされる前にインプット信号1(a)の値が逆数に変換され、その後逆変換された場合の、大きい突然のエネルギ変化を伴う信号のグラフを示す。 図2(a)は、小さい突然のエネルギ変化を伴う信号のグラフを示す。図2(b)は、ローパスフィルタによりフィルタされた小さい突然のエネルギ変化を伴う信号のグラフを示す。図2(c)は、ローパスフィルタによりフィルタされる前にインプット信号1(a)の値が逆数に変換され、その後逆変換された場合の、小さい突然のエネルギ変化を伴う信号のグラフを示す。 通信ネットワークを示す。 本発明の実施形態に係る伝送ターミナルを示す。 本発明の別の実施形態に係る伝送ターミナルを示す。
まず図1を参照して、図1は、時間の経過における、大きい突然のエネルギ変化を伴う信号を平滑化する効果を示す。図1(a)は、デシベル(dB)で計測されたインプット信号のエネルギレベルを示す。0dBから10dBへ鋭く増加し、このレベルで維持し、そして信号のエネルギが0dBに鋭く減少するように、図の信号のエネルギレベルは示される。よって、インプット信号は、信号が10dBにまで増加する正ステップと、信号が10dBから減少する負ステップとを含む、と見られる。
図1(b)は、インプット信号1(a)がローパスフィルタを用いてフィルタされた場合の、信号のエネルギレベルを示す。本発明の好適な実施形態では、ローパスフィルタは再帰形フィルタである。
図示されるように、信号がローパスフィルタによりフィルタされると、フィルタされた信号は、インプット信号が10dBにまで増加するよりもより緩やかに10dBにまで増加する。図1(b)に示されるように、フィルタされた信号は、インプット信号が10dBから現象するよりもより緩やかに10dBから減少する。
図1(c)は、ローパスフィルタによりフィルタされる前にインプット信号1(a)の値が逆数に変換される場合の、信号のエネルギレベルを示す。特に図1(c)は、フィルタされた変換信号の結果値が、信号への先の変換操作を逆変換するべく再び変換された後の、アウトプットを示す。
図1(c)に示すグラフは数3によっても示される。ここで0.9の平滑化係数が利用されている。
Figure 0004927957
上式において、x(n)は、図1(a)に示されるインプット信号のインプットエネルギであり、y(n)は、図1(c)に示される信号への先の変換操作を逆変換するべく再び変換されたフィルタ後のアウトプットエネルギである。
数3は、以下の3つの連続ステップの組み合わせを示す。(i)以下の数4に示すインプット信号の反転、(ii)数5に示される平滑化、及び(iii)数6に示されるアウトプット信号の反転。これらの3つのステップは、以下のように数学的に記載され得る。
Figure 0004927957
Figure 0004927957
Figure 0004927957
上式において、v(n)はインプットエネルギx(n)の逆数値であり、w(n)は逆数値v(n)の平滑化アウトプットである。数5において数4と数6を置換すると、数3になる。
エネルギ信号の急な変化において、インプット信号のエネルギ逆数値にフィルタ操作が実行されると、図1(b)のように非逆数フィルタ信号が増加する速さと比べて、信号が10dBまで増加する速さは顕著に減少する、ということが、本発明の発明者により見出された。しかしながら、非逆数フィルタ信号が10dB減少する速さと比べて、逆数フィルタ信号が10dB減少する速さは顕著に増加する
例えば、図1(b)に示すように、非逆数フィルタ信号のアウトプット値がインプット値の負ステップを辿るよりも速く、アウトプット値が正ステップを辿る。逆に、図1(c)に示すように、逆数フィルタ信号のアウトプット値がインプット値の正テップを辿るよりも速く、アウトプット値が負ステップを辿る。結果として、逆数フィルタ信号のアウトプット値は、インプット信号の値における大きい増加に対して感度が低い。これは、周知の数学理論ジェンセンの不等式により生じるものであるが、それについて本明細書ではこれ以上触れない。
図2を参照する。図2は、時間経過における小さい突然のエネルギ変化を伴う信号を平滑化する効果を示す。図2(a)は、1dBの最大値にまで増加することが示されるインプット信号を示す。図2(b)は、ローパスフィルタからアウトプットされる信号を示し、ここではフィルタされる信号はフィルタ前には逆数にされない。図2(c)は、ローパスフィルタからアウトプットされる信号を示し、ここではフィルタされる信号はフィルタ前には逆数にされる。図2(b)及び図2(c)に示すように、アウトプット値が低エネルギインプット信号の正ステップを辿る速度と、アウトプット値が低エネルギインプット信号の負ステップを辿る速度との間の差異は、高エネルギ信号に対するものよりも、ずっと小さい。ここでも図2(c)に示される逆数フィルタ信号は、上記数3により表され得る。
インプット信号の高いエネルギ変化に対して、夫々、非逆数フィルタ信号のアウトプットと、逆数フィルタ信号のアウトプットとを示す、図1(b)と図1(c)とを比較して、非逆数フィルタ信号のアウトプット値がインプット信号の正変化を辿るよりもゆっくりと、逆数フィルタ信号のアウトプット値がインプット信号の正変化を辿る、ということを発明者は明らかにした。従って、逆数フィルタ信号のアウトプットは、大きい正エネルギ変化に対して感度が低い。
逆に、低いエネルギ変化に対して、夫々、非逆数フィルタ信号のアウトプットと、逆数フィルタ信号のアウトプットとを示す、図2(b)と図2(c)とを比較して、非逆数フィルタ信号のアウトプット値がインプット信号の変化を辿るのと同じように、逆数フィルタ信号のアウトプット値がインプット信号の変化を辿る、ということを発明者は明らかにした。従って、逆数フィルタ信号のアウトプットは、小さいエネルギ変化に対して非逆数フィルタ信号のアウトプットと同様な、感度を有する。
更に、インプット値が大きさを増加するに連れて大きさを減少する導関数を有する非線形マッピングが、信号を平滑化する前に信号を逆数化即ち変換するのに利用され得る、ということを発明者は見出した。
本発明の実施形態では、ノイズ評価は、逆数インプット信号を平滑化することから決定される。本発明の実施形態の実装の様子を、以下に示す。
図3を参照して、図3は本発明の実施形態で利用される通信ネットワークを示す。通信ネットワーク104は、インタネットにより提供されるVoIP(ボイス・オーバー・インタネット・プロトコル)ネットワークであればよい。当然のことながら、本明細書でより詳細に示され記載される例示の通信システムはVoIPネットワークの用語を利用するが、本発明の実施形態は、データの移転を促進する他のどんな適切な通信システムで用いられてもよい。例えば、本発明は、GSM、UMTS及びCDMAネットワークなどの、モバイル通信ネットワークで利用されてもよい。
図3は、ネットワーク104に接続されたソースターミナル100及び目的ターミナル112を示す。ソースターミナルは、通信ネットワーク104を介して目的ターミナル112へデータを伝送するように配置されている。
ソースターミナル100及び目的ターミナル112は、例えば、パーソナルコンピュータ、ゲーム機、パーソナルデジタルアシスタント、適切な機能付きのモバイルフォン、テレビジョン、若しくは、ネットワーク104に接続できる他のデバイスであればよい。
図4は、本発明の実施形態に係るソースターミナル100を示す。ソースターミナルは、ネットワーク104を介して目的ターミナル112へ信号を伝送する伝送回路10を有する。
伝送回路10は、アナログデジタルコンバータ38、ノイズレベル評価ブロック34及びエンコーダ14を含む。アナログデジタルコンバータ38は、マイクロホン32から音声インプットを受け、信号をデジタル信号に変換する。アナログデジタルコンバータ38からアウトプットされるデジタル信号s(n)は、背景ノイズを伴うスピーチのデジタルサンプルから成る。
アナログデジタルコンバータ38からアウトプットされるデジタル信号s(n)は、ノイズレベル評価ブロック34内のスピーチ存在検出ブロック22の中にインプットされる。スピーチ存在検出ブロック22は、スピーチ情報がインプット信号s(n)内に存在するか否かを計測する。スピーチ存在検出ブロック22は、ノイズレベル評価ブロック34に設けられたフィルタブロック26に対して、スピーチが存在するか否かに係る徴候をアウトプットする。スピーチ存在徴候は、2値信号(スピーチが存在する若しくはしない)でも、確率信号(スピーチが存在する可能性の徴候)であってもよい。スピーチ存在検出ブロックが、スピーチが存在するか否かを計測する方法は当業者に周知であり、本明細書では更には説明しない。
アナログデジタルコンバータ38からアウトプットされるデジタル信号s(n)は、変換ブロック16の中にもインプットされる。変換ブロック16は、インプット信号s(n)を変換ドメイン信号に変換する。変換は、高速フーリエ変換、離散コサイン変換、フィルタバンク変換、若しくは、カルフネンレーベ(Karhunen Loeve)変換などの他の変換として、実装される周波数変換であればよい。
変換ドメイン信号は、ノイズレベル評価ブロック34内のエネルギブロック18内にインプットされる。エネルギブロック18は、変換ブロック16からアウトプットされる変換ドメイン信号を正信号に変換する。例えば、夫々の変換ドメインサンプルのエネルギを計算してパワースペクトラムを生成することで、このことは達成され得る。
エネルギブロック18からアウトプットされるパワースペクトラムは続いて、パワースペクトラムに非線形関数を適用する第1の非線形関数ブロック24の中にインプットされる。該ブロック24内で適用される非線形関数の導関数は、パワースペクトラムの大きさが増大するにつれて、大きさを減少させる。かような非線形関数の一つの例は、数7である。
Figure 0004927957
上式において、バイアスbがインプットパワースペクトラム値に加えられ、結果としてバイアスされたインプットパワースペクトラムはその逆数値に変換される。パワースペクトラムにバイアスを加えることは、逆数値に変換された値が常時ゼロより大きいことを保証する。信号がゼロより常時大きいことは、数7の式でのゼロによる除算を回避することを保証する。バイアスを加えることは、非常に小さいインプット信号に対するノイズレベル評価器の感度を下げることにもなる。
インプット値が増加するとき値が減少する導関数を有する関数の別の例は、以下の数8である。
Figure 0004927957
上式において、バイアスbがインプットパワースペクトラム値に加えられ、結果としてバイアスされたインプットパワースペクトラムはその対数値に変換される。パワースペクトラムにバイアスを加えることは、対数値に変換された値が常時ゼロより大きいことを保証する。信号がゼロより常時大きいことは、数8の式でのゼロの対数をとることを回避することを保証する。バイアスを加えることは、非常に小さいインプット信号に対するノイズレベル評価器の感度を下げることにもなる。
数7及び数8は、インプットの大きさが増加するとき大きさが減少する導関数を有する非線形関数の例である。本発明の実施形態では、インプットの大きさが増加するとき大きさが減少する導関数を有するどんな非線形関数を、非線形関数ブロック24は利用してもよい。
本発明の一つの実施形態では、非線形関数ブロック24において、パワースペクトラムの様々な周波数帯に対して、数7及び数8の様々なバイアス値bが利用され得る。
非線形ブロック24からアウトプットされる変換されたパワースペクトラム信号を、以下では反転パワースペクトラムと称する。
反転パワースペクトラムはフィルタブロック26にインプットされる。前述のように、フィルタブロック26は、スピーチが信号内に存在するか否かを示すスピーチ存在検出ブロック22からのインプットも受ける。フィルタブロック26では、反転パワースペクトラムの各々のバンドは、時間フィルタを掛けられる。
時間経過によりインプット信号を平滑化するフィルタブロック26において、どのような平滑化操作が利用されてもよい。好適な実施形態では、平滑化操作はローパスフィルタにより実施され得る。本発明の別の実施形態では、平滑化操作は時間平均化により実施され得る。
本発明の実施形態では、平滑化操作は時間再サンプリングを利用し、その場合、フィルタブロック26のアウトプットのサンプリングレートは、フィルタブロック26のインプットのサンプリングレートと異なる。
本発明の一つの実施形態では、フィルタブロック26内で利用されるフィルタは、再帰形フィルタであればよい。
Figure 0004927957
x(t,k)が周波数帯kに対する時間tにおけるフィルタインプットである場合、y(t,k)は周波数帯kに対する時間tにおけるフィルタアウトプットであり、αはフィルタの平滑化係数である。
スピーチが存在する若しくは存在する可能性があるときにフィルタにおいて用いられる平滑化の量が増加するように、フィルタブロック26はスピーチ存在徴候により制御される。よって、スピーチが存在するときにはノイズ評価感度は減少する。本発明の一つの実施形態では、スピーチ存在検出ブロックがスピーチが存在しないことを示す場合には平滑化係数αは0.99に設定される。スピーチ存在検出ブロックがスピーチが存在することを示す場合にはフィルタブロック26は平滑化係数αを1にまで増加する。
1にまで平滑化係数が増加され、スピーチ存在の徴候の間、ノイズレベル評価定数が保持される。数10に示されるように、αが1になると数9は以下のようになる。
Figure 0004927957
フィルタブロック26のアウトプットは第2の非線形関数ブロック28にインプットされる。第2の非線形関数ブロック28では、逆数フィルタパワースペクトラムが内部にマップされパワースペクトラムドメインに戻される。第2の非線形関数ブロック28は、第1の非線形関数ブロック24が信号に適用した変換とは逆の変換を適用するように、構成されている。
例えば、非線形関数ブロック24により適用された第1の変換が、インプットを数7に係るバイアスされた逆数にマップするのであれば、非線形関数ブロック28により適用される第2の変換は、フィルタブロックのアウトプットを、数11に係るバイアスを外された逆数にマップすることになる。
Figure 0004927957
上式において、bは、第1の非線形関数ブロック24内で適用されるものと同じバイアス値である。
同様に、第1の変換が数8によるバイアスされた対数マッピングであるならば、第2の変換は、数12にように、指数マッピング及び負のバイアスとなる。
Figure 0004927957
上式において、bは、第1の非線形関数ブロック24内で適用されるものと同じバイアス値である。
更に、第1の非線形関数ブロック24が、フィルタリングの前にインプットをそのアークタンジェントにマップするのであれば、第2の非線形関数ブロック28は、フィルタブロックのアウトプットを、フィルタブロック26のアウトプットのタンジェントにマップすることになる。
第2の非線形関数ブロック28からアウトプットされる信号は、変換帯k内の時間tにおけるノイズレベル評価信号R(t,k)である。
ノイズレベル評価信号R(t,k)は、計算減衰利得(CAG)ブロック40の中にインプットされる。CAGブロック40は、エネルギブロック18からのパワースペクトラムE(t,k)も受ける。CAGブロック40は、エネルギブロック18からアウトプットされるパワースペクトラムE(t,k)の夫々の周波数帯のエネルギを、評価されたノイズレベル信号R(t,k)の夫々の周波数帯のエネルギと比較してノイズ減少利得を計算する。利得は、以下の数13で計算される。
Figure 0004927957
上式において、G(t,k)は、周波数帯kに対する時間tにおける減衰利得である。ノイズ評価信号R(t,k)及びパワースペクトラム信号E(t,k)は常に正であるから、減衰利得G(t,k)は、0と1の間内にあることが保証される。
パワースペクトラム信号E(t,k)周波数帯エネルギが、評価されたノイズレベル信号R(t,k)周波数帯エネルギと同様である場合、減衰利得は0に近接する。逆に、パワースペクトラム信号E(t,k)周波数帯エネルギが、評価されたノイズレベル信号R(t,k)周波数帯エネルギと比べてずっと大きい場合、減衰利得は1に近接する。夫々の周波数帯に対してCAGブロック40にて計算されるノイズ減少利得G(t,k)は、印加利得ブロック42にアウトプットされる。
変換ブロック16からアウトプットされる変換ドメイン信号も印加利得ブロック42にインプットされる。印加利得ブロック42では、CAG40にて計算された夫々の周波数帯に対する利得が、変換ドメイン信号の夫々の周波数帯に印加される。変換ドメイン信号の夫々の周波数帯を、対応する利得と乗算することで、利得が印加される。
信号は、印加利得ブロック42から逆変換ブロック44にアウトプットされるが、その逆変換ブロック44では信号は逆変換により時間ドメイン信号に変換し戻される。逆変換ブロック44により適用される逆変換は次に示すようなものである。即ち、一連の、変換ブロック16、印加利得ブロック42により適用される変換、及び、逆変換ブロック44により適用される逆変換が、変換ブロック16内へインプットされる信号を再現するものであるが、時間遅延を伴っており且つノイズレベル評価ブロック34によるノイズのための訂正が為されている。逆変換の例は、逆高速フーリエ変換、逆離散コサイン変換、フィルタバンク変換、及び、転置カルフネンレーベ(Karhunen Loeve)変換である。
逆変換ブロックからアウトプットされる時間ドメイン信号は、次にエンコーダ14内にインプットされ、そのエンコーダ14では、信号は符号化スキームに従ってエンコードされる。エンコードされた信号は、通信ネットワーク104を介して目的ターミナル112に伝送される。
図5は、本発明の別の実施形態に係るソースターミナル100を示す。図4に関連して記述した構成要素は、同じ参照番号を用いて図5内で示されている。
図5内に示す実施形態では、信号のパワースペクトラムの夫々の周波数帯は、フィルタブロック26’内で独立して平滑化される。本発明の本実施形態では、信号はエネルギブロック18によりパワースペクトラムに変換された後に、スピーチ存在検出ブロック22’内にインプットされる。このことにより、スピーチ存在検出ブロック22’は、パワースペクトラムの夫々の周波数帯に対するスピーチの存在を測定できる。スピーチ存在検出ブロックは、パワースペクトラムの夫々の周波数に対するスピーチレベル徴候信号をフィルタブロック26にアウトプットする。
フィルタブロック26’は、スピーチ存在検出ブロックにより示される、夫々の周波数に関するスピーチの存在に従って、反転されたパワースペクトラムの夫々の周波数につき、フィルタを掛ける。従って、信号の一つの周波数帯に関してスピーチが検出され別の周波数帯に関してスピ―チが検出されなければ、スピーチが検出されなかった周波数帯に対して、スピーチが検出された周波数帯に対するよりも、より低い平滑化係数が利用され得る。
本発明の別の実施形態では、目的ターミナル112の受信回路内にノイズレベル評価ブロックが設けられてもよい。
本発明の別の実施形態では、本発明は、通信ネットワークを介して目的ターミナルにデータを伝送することを含まない信号処理システム内に、実装されてもよい。例えば、上述の伝送回路は、拡声装置(パブリックアドレスシステム、PAシステム)内で利用される拡声器に信号を直接アウトプットするのに利用され得る。あるいは、ディクテーションマシン及び音楽録音機で後日利用の際に再生されるデジタル若しくはアナログ記録媒体上に、アウトプットが記録されてもよい。
本発明の実施形態では、ノイズレベル評価ブロックの構成要素は、ハードウェアとして実装されてもよく、ターミナル内のプロセッサ上で稼動するソフトウエアとして実装されてもよい。これは実装上の問題に過ぎない。
好適な実施形態を参照して本発明を詳しく示し且つ記述したが、請求項に規定の本発明の範囲から乖離することなく、形式上も詳細にも種々の変更を為すことが可能であることが、当業者には理解されるであろう。特に、インプットの大きさが増加するときに大きさが減少する導関数を有する非線形関数を利用する、非線形関数ブロック24を記載する場合には、当然ながらこのことは、インプットの大きさが増加するときに大きさが概略減少する導関数を有するどの非線形関数も含むということである。即ち、一連のインプットの内部にはパターンを追随しない値が存在することもあるという事実はあるが、最小から最大までの一連のインプット値にわたって、導関数がより大きい値からより小さい値にまで変化するということである。
10・・・伝送回路、14・・・エンコーダ、16・・・変換ブロック、18・・・エネルギブロック、22・・・スピーチ存在検出ブロック、24・・・第1の非線形関数ブロック、26・・・フィルタブロック、28・・・第2の非線形関数ブロック、34・・・ノイズレベル評価ブロック、40・・・計算減衰利得(CAG)ブロック、42・・・印加利得ブロック、44・・・逆変換ブロック、100・・・ソースターミナル、104・・・通信ネットワーク、112・・・目的ターミナル。

Claims (19)

  1. 音声情報及びノイズを含むデータ内のノイズを評価する方法であって、
    一連のインプット値としてデータを受けるステップと、
    第1の非線形マッピングをインプット値に適用することでデータを変換するステップであって、インプット値の大きさが増加するときにマッピングの導関数が大きさを減少させる、ステップと、
    変換されたデータを平滑化するステップと、
    インプットされたデータ内のノイズの評価を決定するために、第1の非線形マッピングとは逆である第2の非線形マッピングを適用することにより、平滑化された、変換されたデータを変換するステップと
    を含む方法。
  2. 変換されたデータがローパスフィルタにより平滑化される
    ことを特徴とする請求項1に記載の方法。
  3. 変換されたデータが時間平均化により平滑化される
    ことを特徴とする請求項1に記載の方法。
  4. 平滑化するステップで、平滑化係数が利用される
    ことを特徴とする請求項1乃至3のうちのいずれか一つに記載の方法。
  5. データが周波数帯を含む信号内に与えられる
    ことを特徴とする請求項1乃至4のうちのいずれか一つに記載の方法。
  6. 更に、
    データ内の音声情報の存在の徴候を検出するステップと、
    音声の存在の徴候が検出された場合、平滑化するステップで適用される平滑化を増加するステップと
    を含む請求項4に記載の方法。
  7. 音声の存在が検出されている間に適用される平滑化が一定である
    ことを特徴とする請求項6に記載の方法。
  8. 平滑化係数を増加することにより、平滑化が増加される
    ことを特徴とする請求項6又は7に記載の方法。
  9. 平滑化係数が1の値にまで増加させられた
    ことを特徴とする請求項8に記載の方法。
  10. 更に、
    信号の夫々の周波数帯に対して平滑化係数を適用するステップと、
    信号の夫々の周波数帯に対して音声の存在の徴候を検出するステップと、
    音声の存在の徴候が一つの周波数帯に対して検出されれば、信号のその周波数帯に適用される平滑化係数を増加するステップと
    を含むことを特徴とする請求項4又は5に記載の方法。
  11. 適用される第1の非線形マッピングが対数マッピングである
    ことを特徴とする請求項1乃至10のうちのいずれか一つに記載の方法。
  12. 適用される第2の非線形マッピングが指数マッピングである
    ことを特徴とする請求項11に記載の方法。
  13. 第1と第2の非線形マッピングが、データをその逆数にマップする
    ことを特徴とする請求項1乃至10のうちのいずれか一つに記載の方法。
  14. 第1の非線形マッピングを適用することにより信号を変換するステップ、
    変換された信号を平滑化するステップ、及び、
    第2の非線形マッピングを適用することにより平滑化された信号を変換するステップ
    が、次の数14により表されることを特徴とする請求項1乃至13のうちのいずれか一つに記載の方法。
    Figure 0004927957
    上式において、x(n)はデータシーケンスのインプット値であり、y(n)はノイズ評価値であり、αは平滑化係数である。
  15. 音声情報及びノイズを含むデータ内のノイズを評価する装置であって、
    一連のインプット値としてデータを受ける受け取り手段と、
    第1の非線形マッピングをインプット値に適用することでデータを変換する第1の変換手段であって、インプット値の大きさが増加するときにマッピングの導関数が大きさを減少させる、第1の変換手段と、
    変換されたデータを平滑化する平滑化手段と、
    インプットされたデータ内のノイズの評価を決定するために、第1の非線形マッピングとは逆である第2の非線形マッピングを適用することにより、平滑化された、変換されたデータを変換する第2の変換手段と
    を含む装置。
  16. 更に、
    データを、周波数帯を含む周波数ドメイン信号に変換する手段を含む
    請求項15に記載の装置。
  17. 更に、
    音声の存在を検出する音声検出手段を含む
    請求項16に記載の装置。
  18. 音声検出手段が、信号の夫々の周波数帯に対して音声の存在の徴候を検出するように構成されており、
    平滑化手段が信号の夫々の周波数帯を平滑化するように構成されており、このことにより、音声の存在が検出される信号に周波数帯に適用される平滑化は、音声の存在が検出されない信号に周波数帯に適用される平滑化よりも、大きい
    ことを特徴とする請求項17に記載の装置。
  19. 音声情報及びノイズを含むデータ内のノイズを評価する装置であって、
    一連のインプット値としてデータを受けるように構成された受け部と、
    第1の非線形マッピングをインプット値に適用することでデータを変換するように構成された第1の変換部であって、インプット値の大きさが増加するときにマッピングの導関数が大きさを減少させる、第1の変換部と、
    変換されたデータを平滑化するように構成された平滑化部と、
    インプットされたデータ内のノイズの評価を決定するために、第1の非線形マッピングとは逆である第2の非線形マッピングを適用することにより、平滑化された、変換されたデータを変換するように構成された第2の変換部と
    を含む装置。
JP2009550325A 2007-02-20 2007-12-20 通信システムにおいてノイズレベルを評価する方法 Expired - Fee Related JP4927957B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GB0703275.8 2007-02-20
GBGB0703275.8A GB0703275D0 (en) 2007-02-20 2007-02-20 Method of estimating noise levels in a communication system
PCT/IB2007/004498 WO2008102207A2 (en) 2007-02-20 2007-12-20 Method of estimating noise levels in a communication system

Publications (2)

Publication Number Publication Date
JP2010519583A JP2010519583A (ja) 2010-06-03
JP4927957B2 true JP4927957B2 (ja) 2012-05-09

Family

ID=37908947

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009550325A Expired - Fee Related JP4927957B2 (ja) 2007-02-20 2007-12-20 通信システムにおいてノイズレベルを評価する方法

Country Status (10)

Country Link
US (1) US8838444B2 (ja)
EP (1) EP2132734B1 (ja)
JP (1) JP4927957B2 (ja)
CN (1) CN101641735B (ja)
AT (1) ATE498887T1 (ja)
BR (1) BRPI0721316A2 (ja)
CA (1) CA2679476C (ja)
DE (1) DE602007012596D1 (ja)
GB (1) GB0703275D0 (ja)
WO (1) WO2008102207A2 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009078093A1 (ja) 2007-12-18 2009-06-25 Fujitsu Limited 非音声区間検出方法及び非音声区間検出装置
GB0919672D0 (en) * 2009-11-10 2009-12-23 Skype Ltd Noise suppression
US9589580B2 (en) 2011-03-14 2017-03-07 Cochlear Limited Sound processing based on a confidence measure
JP5732976B2 (ja) * 2011-03-31 2015-06-10 沖電気工業株式会社 音声区間判定装置、音声区間判定方法、及びプログラム
KR101788484B1 (ko) 2013-06-21 2017-10-19 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. Tcx ltp를 이용하여 붕괴되거나 붕괴되지 않은 수신된 프레임들의 재구성을 갖는 오디오 디코딩
US20170366897A1 (en) 2016-06-15 2017-12-21 Robert Azarewicz Microphone board for far field automatic speech recognition
US10104464B2 (en) 2016-08-25 2018-10-16 Bragi GmbH Wireless earpiece and smart glasses system and method
US10200780B2 (en) 2016-08-29 2019-02-05 Bragi GmbH Method and apparatus for conveying battery life of wireless earpiece
US11490858B2 (en) 2016-08-31 2022-11-08 Bragi GmbH Disposable sensor array wearable device sleeve system and method
EP3573058B1 (en) * 2018-05-23 2021-02-24 Harman Becker Automotive Systems GmbH Dry sound and ambient sound separation

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2897628B2 (ja) * 1993-12-24 1999-05-31 三菱電機株式会社 音声検出器
JPH07193548A (ja) * 1993-12-25 1995-07-28 Sony Corp 雑音低減処理方法
CN1167047C (zh) * 1996-11-07 2004-09-15 松下电器产业株式会社 声源矢量生成装置及方法
FR2768544B1 (fr) * 1997-09-18 1999-11-19 Matra Communication Procede de detection d'activite vocale
US6826528B1 (en) * 1998-09-09 2004-11-30 Sony Corporation Weighted frequency-channel background noise suppressor
US6718301B1 (en) * 1998-11-11 2004-04-06 Starkey Laboratories, Inc. System for measuring speech content in sound
SE9903553D0 (sv) * 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
DE19948308C2 (de) * 1999-10-06 2002-05-08 Cortologic Ag Verfahren und Vorrichtung zur Geräuschunterdrückung bei der Sprachübertragung
US20020041678A1 (en) * 2000-08-18 2002-04-11 Filiz Basburg-Ertem Method and apparatus for integrated echo cancellation and noise reduction for fixed subscriber terminals
US6873732B2 (en) * 2001-07-09 2005-03-29 Xerox Corporation Method and apparatus for resolving perspective distortion in a document image and for calculating line sums in images
US20030187637A1 (en) * 2002-03-29 2003-10-02 At&T Automatic feature compensation based on decomposition of speech and noise
US7242762B2 (en) * 2002-06-24 2007-07-10 Freescale Semiconductor, Inc. Monitoring and control of an adaptive filter in a communication system
KR20040044217A (ko) * 2002-11-19 2004-05-28 주식회사 인티스 디지털 통신의 음성 품질 향상 장치 및 방법
US8009572B2 (en) 2003-07-16 2011-08-30 Skype Limited Peer-to-peer telephone system
TWI233590B (en) * 2003-09-26 2005-06-01 Ind Tech Res Inst Energy feature extraction method for noisy speech recognition
US7535859B2 (en) * 2003-10-16 2009-05-19 Nxp B.V. Voice activity detection with adaptive noise floor tracking
CN1322488C (zh) * 2004-04-14 2007-06-20 华为技术有限公司 一种语音增强的方法
US7454332B2 (en) * 2004-06-15 2008-11-18 Microsoft Corporation Gain constrained noise suppression
US7496138B2 (en) * 2004-11-08 2009-02-24 Interdigital Technology Corporation Method and apparatus for estimating the step-size of an adaptive equalizer
US20070199567A1 (en) * 2006-01-25 2007-08-30 Kanzer Steve H Droplet collection devices and methods to detect and control airborne communicable diseases utilizing rfid
US20090012786A1 (en) * 2007-07-06 2009-01-08 Texas Instruments Incorporated Adaptive Noise Cancellation

Also Published As

Publication number Publication date
CN101641735B (zh) 2012-01-25
JP2010519583A (ja) 2010-06-03
US20080201137A1 (en) 2008-08-21
US8838444B2 (en) 2014-09-16
ATE498887T1 (de) 2011-03-15
CA2679476A1 (en) 2008-08-28
EP2132734B1 (en) 2011-02-16
CA2679476C (en) 2015-11-24
WO2008102207A3 (en) 2008-10-30
BRPI0721316A2 (pt) 2014-02-18
GB0703275D0 (en) 2007-03-28
WO2008102207A2 (en) 2008-08-28
EP2132734A2 (en) 2009-12-16
DE602007012596D1 (de) 2011-03-31
CN101641735A (zh) 2010-02-03

Similar Documents

Publication Publication Date Title
JP4927957B2 (ja) 通信システムにおいてノイズレベルを評価する方法
EP3703052B1 (en) Echo cancellation method and apparatus based on time delay estimation
US8571231B2 (en) Suppressing noise in an audio signal
JP3963850B2 (ja) 音声区間検出装置
CN1727860B (zh) 语音噪音抑制方法和语音噪音抑制器
JP4519169B2 (ja) 信号処理方法および信号処理装置
KR101624652B1 (ko) 잡음 환경의 입력신호로부터 잡음을 제거하는 방법 및 그 장치, 잡음 환경에서 음성 신호를 강화하는 방법 및 그 장치
US20110124380A1 (en) Method and system for double-end talk detection, and method and system for echo elimination
US8098813B2 (en) Communication system
EP1096471B1 (en) Method and means for a robust feature extraction for speech recognition
US9154874B2 (en) Howling detection device, howling suppressing device and method of detecting howling
EP1141948A1 (en) Method and apparatus for adaptively suppressing noise
JP6422885B2 (ja) エコー抑圧
JP2016503262A (ja) エコー抑圧
JP2010103875A (ja) エコー抑圧装置、エコー抑圧方法、エコー抑圧プログラム、記録媒体
CN114530160A (zh) 模型训练方法、回声消除方法、系统、设备及存储介质
US20050119879A1 (en) Method and apparatus to compensate for imperfections in sound field using peak and dip frequencies
EP1278185A2 (en) Method for improving noise reduction in speech transmission
JP2005328527A (ja) 信号品質評価のための測定雑音の低減
CN116504264B (zh) 音频处理方法、装置、设备及存储介质
JPH0784596A (ja) 符号化音声の品質評価方法
US12015902B2 (en) Echo cancellation device, echo cancellation method, and program
WO2022202012A1 (ja) エコー抑圧装置、エコー抑圧方法及びエコー抑圧プログラム
CN114724575A (zh) 一种啸叫检测方法、装置以及系统
CN116506788A (zh) 音频测试方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120110

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120209

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150217

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4927957

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150217

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150217

Year of fee payment: 3

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150217

Year of fee payment: 3

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: R3D02

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees