JP5203933B2 - オーディオ雑音を減少させるシステムおよび方法 - Google Patents

オーディオ雑音を減少させるシステムおよび方法 Download PDF

Info

Publication number
JP5203933B2
JP5203933B2 JP2008507934A JP2008507934A JP5203933B2 JP 5203933 B2 JP5203933 B2 JP 5203933B2 JP 2008507934 A JP2008507934 A JP 2008507934A JP 2008507934 A JP2008507934 A JP 2008507934A JP 5203933 B2 JP5203933 B2 JP 5203933B2
Authority
JP
Japan
Prior art keywords
noise
detected
value
detector
power spectrum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008507934A
Other languages
English (en)
Other versions
JP2008537185A (ja
Inventor
ヤング、ジュン
オリバー、リック
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
DTS LLC
Original Assignee
DTS LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by DTS LLC filed Critical DTS LLC
Publication of JP2008537185A publication Critical patent/JP2008537185A/ja
Application granted granted Critical
Publication of JP5203933B2 publication Critical patent/JP5203933B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M9/00Arrangements for interconnection not involving centralised switching
    • H04M9/08Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Telephone Function (AREA)
  • Telephonic Communication Services (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Noise Elimination (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)

Description

本発明は一般的に、信号処理に関し、特に通話信号のような信号中のオーディオ雑音を減少させるためのシステムおよび方法に関する。
本出願は2005年4月21日出願の米国暫定出願第60/673,671号明細書(発明の名称“SYSTEMS AND METHODS FOR REDUCING AUDIO NOISE”)の特典を主張している。この文献はここではその全体が参考として組み込まれている。
背景雑音と干渉音は通話システムでは通話システムにおける通話品質および理解特性を劣化する可能性がある。通話がない状態で背景雑音と干渉音が存在することも迷惑である。
これらの問題を解決するため、信号対雑音比(SNR)を改良して通話品質と理解特性を改良することを期待して、多くの通話強化および雑音減少(NR)技術が提案されている。しかしながら、SNRと通話品質の改良には矛盾が存在する。SNRの改良は通話音の雑音を少なくするが、多くの有効な雑音減少および通話強化アルゴリズムに関連されるアーティファクトまたは歪は通話品質を劣化させる可能性があり、したがって通話音を不快にする。
少なくとも幾つかの前述の問題はここで説明するように、オーディオ雑音を減少するためのシステムおよび方法の種々の実施形態により解決されることができる。雑音およびネットワークトーンのような1以上の音響成分は時間ドメイン信号から得られるパワースペクトルに基づいて検出されることができる。このような検出の結果はパワースペクトルに適用されることのできる調節スペクトルの決定において決定を行うために使用されることができる。調節されたスペクトルは不所望の雑音を実質的に除去し、および/またはネットワークトーンのような既知の音響成分を考慮する時間ドメイン信号へ戻すように変換されることができる。
本発明の1実施形態はオーディオ雑音を減少するシステムに関する。このシステムは入力時間ドメイン信号を受信し、入力周波数ドメイン信号および入力周波数ドメイン信号のパワースペクトルを生成するように構成された入力コンポーネントを含んでいる。そのシステムはさらに少なくとも1つの検出コンポーネントを含んでいる。各検出コンポーネントはパワースペクトル中の選択された音響成分の存在を検出するように構成されている。システムはさらに少なくとも1つの選択された音響成分の存在の検出に基づいて調節パワースペクトルを生成し、その調節パワースペクトルを入力周波数ドメイン信号と組み合わせて出力周波数ドメイン信号を生成するように構成された調節コンポーネントを含んでいる。システムはさらに出力周波数ドメイン信号に基づいて出力時間ドメイン信号を生成するように構成されている出力コンポーネントを含んでいる。
1実施形態では、入力時間ドメイン信号は通話信号を含んでいる。
1実施形態では、少なくとも1つの検出コンポーネントは雑音活動度検出器、白色雑音検出器、ネットワークトーン検出器の少なくとも1つを含んでいる。1実施形態では、パワースペクトルはN個の周波数ビンを有し、それらは入力時間ドメイン信号のN個のサンプルされた値に対応する。
1実施形態では、雑音活動度検出器は1以上のグループのN個の周波数ビンの大きさを対応する選択された値と比較して、パワースペクトル内の雑音活動度の存在および不在を示す雑音活動度インジケータを生成するように構成される。1実施形態では雑音活動度検出器は、N個の周波数ビンを複数の帯域に区画し、各複数の帯域の大きさ値を獲得し、大きさ値を各複数の帯域のしきい値と比較し、大きさ値が選択された数の複数の帯域のしきい値を超えたならば、雑音活動度の存在を決定するように構成されている。
1実施形態では、白色雑音検出器はN個の周波数ビンの和に基づいて現在のエネルギ値を獲得し、先のエネルギ値と現在のエネルギ値との差を獲得し、その差は正の値を有し、その差が選択された値よりも大きい場合にはパワースペクトルにおける白色雑音の存在を示す白色雑音インジケータを生成するように構成されている。
1実施形態では、ネットワークトーン検出器はN個の周波数ビンから最大値を有する選択されたビンを識別し、選択されたビンが1以上の条件を満たすならばパワースペクトル中にネットワークトーンが存在することを示すネットワークトーンインジケータを生成するように構成されている。1実施形態では、ネットワークトーンインジケータは、選択されたビンが選択された量よりも多く変化されず、選択されたビンがネットワークトーンに対応する周波数範囲内であるならば生成される。
1実施形態では、調節パワースペクトルは1以上の選択された音響成分の検出に基づいて調節される評価されたパワースペクトルを含んでいる。1実施形態では、評価されたパワースペクトルの調節は、ネットワークトーンがネットワークトーン検出器により検出されずに雑音活動度が雑音活動度検出器により検出されるならば選択された量だけ評価されたパワースペクトルをスケーリングする処理を含んでいる。1実施形態では、評価されたパワースペクトルの調節は、ネットワークトーンがネットワークトーン検出器により検出されずに白色雑音が白色雑音検出器により検出されるならば白色雑音を調節する処理を含んでいる。
1実施形態では、システムはさらに入力時間ドメイン信号に基づいて少なくとも1つの検出コンポーネントと調節コンポーネントのバイパスを可能にするために再コンバージェンスコンポーネントを含んでいる。1実施形態では、バイパスは入力時間ドメイン信号を表す選択された値が選択された時間期間にわたってしきい値よりも小さい状態である場合に行われる。1実施形態では、しきい値は実質的にゼロである。
本発明の1実施形態はオーディオ雑音の減少方法に関する。この方法は、入力時間ドメイン信号を受信し、入力周波数ドメイン信号と入力周波数ドメイン信号のパワースペクトルとを生成する処理を含んでいる。この方法はさらに、パワースペクトル中の1以上の音響成分の存在を検出する処理を含んでいる。この方法はさらに、1以上の音響成分の存在の検出に基づいて、調節パワースペクトルを生成する処理を含んでいる。この方法はさらに、出力周波数ドメイン信号を生成するために調節パワースペクトルを入力周波数ドメイン信号と組み合わせる処理を含んでいる。この方法はさらに、出力周波数ドメイン信号に基づいて出力時間ドメイン信号を生成する処理を含んでいる。
1実施形態では、入力時間ドメイン信号は通話信号を含んでいる。
1実施形態では、1以上の音響成分は雑音活動度、白色雑音、ネットワークトーンの少なくとも1つを含んでいる。1実施形態では、パワースペクトルはN個の周波数ビンを有し、入力時間ドメイン信号のN個のサンプルされた値に対応している。
1実施形態では、雑音活動度は1以上のグループのN個の周波数ビンの大きさを対応する選択された値と比較して、パワースペクトル内の雑音活動度の存在および不在を示す雑音活動度インジケータを生成するように構成されている。1実施形態では雑音活動度検出器は、N個の周波数ビンを複数の帯域に区画し、複数の各帯域の大きさ値を獲得し、その大きさ値を複数の各帯域のしきい値と比較し、大きさ値が選択された数の複数の帯域のしきい値を超えたならば、雑音活動度の存在を決定することにより検出される。
1実施形態では、白色雑音はN個の周波数ビンの和に基づいて現在のエネルギ値を獲得し、先のエネルギ値と現在のエネルギ値との差を獲得し、その差は正の値を有し、差が選択された値よりも大きいならばパワースペクトルにおける白色雑音の存在を示す白色雑音インジケータを生成することにより検出される。
1実施形態では、ネットワークトーンはN個の周波数ビンから最大値を有する選択されたビンを識別し、その選択されたビンが1以上の条件を満たすならばパワースペクトル中にネットワークトーンが存在することを示すネットワークトーンインジケータを生成することにより検出される。1実施形態では、ネットワークトーンインジケータは選択されたビンが選択された量よりも多く変化されず、かつ、選択されたビンがネットワークトーンに対応する周波数範囲内であるならば生成される。
1実施形態では、調節パワースペクトルは1以上の音響成分の検出に基づいて調節される評価されたパワースペクトルを含んでいる。1実施形態では、評価されたパワースペクトルの調節は、ネットワークトーンが検出されずに雑音活動度が検出されるならば選択された量だけ評価されたパワースペクトルをスケーリングする処理を含んでいる。1実施形態では、評価されたパワースペクトルの調節はネットワークトーンが検出されずに白色雑音が検出されるならば白色雑音を調節する処理をさらに含んでいる。
1実施形態では、この方法はさらに入力時間ドメイン信号に基づいた検出のバイパスを含んでいる。1実施形態では、バイパスは入力時間ドメイン信号を表す選択された値が選択された時間期間でしきい値よりも小さい状態であるならば行われる。1実施形態では、しきい値は実質的にゼロである。
本発明の1実施形態はオーディオ雑音を減少するシステムに関する。このシステムは入力信号を受信し、その入力信号に対応するパワースペクトルを生成するように構成された入力コンポーネントを含んでおり、ここでの入力信号はある信号対雑音比を有する。このシステムはさらにパワースペクトル中の1以上の音響成分の存在を検出するように構成された検出器を含んでいる。この検出は実質的に同じレベルに入力信号の信号対雑音比を維持しながら行われる。
本発明の1実施形態はオーディオ雑音を減少するためのシステムに関する。このシステムは入力信号に対応するパワースペクトルを生成する手段を含んでいる。このシステムはさらにパワースペクトル中の1以上の音響成分を検出するための手段を含んでいる。このシステムはさらに1以上の音響成分の検出に基づいて入力信号を調節する手段を含んでいる。
本発明のこれらおよび他の観点、利点、優れた特徴は以下の詳細な説明を読み、添付図面を参照することにより明白になるであろう。図面では、類似の素子は類似の参照符合を有している。
本発明は一般的に、雑音減少技術に関する。幾つかの実施形態では、本発明の種々の特徴および技術は、電話装置(無線またはワイヤベース)、無線ベースの装置、補聴器などのような通話装置で実施されることができる。
図1は、入力信号中に存在する1以上の選択された音響成分の検出と、このような検出された音響成分に基づいた入力信号の調節を容易にする種々のコンポーネントを有するシステム100の1実施形態のブロック図を示している。1実施形態では選択された音響成分は雑音を含むことができる。1実施形態では選択された音響成分はネットワークトーンのような人工的に導入された音を含むことができる。
ここでの説明の目的で、時間ドメイン信号はS(n)として示され、周波数ドメイン信号はS(k)として示される。S(k)は大きさと位相の両情報を含み、したがってベクトル量または複素数信号と呼ばれることができる。S(k)の二乗された大きさ部分は共通してパワースペクトルと呼ばれ、PowS(k)として示される。ここでの説明の目的で、「パワースペクトル」は大きさ、大きさの二乗、または任意の大きさベースの量から得られることができる。
したがって図1に示されているように、システム100の1実施形態は入力信号X(n)を受信し、複素数信号X(k)を得て、X(k)のパワースペクトルPowX(k)を決定し、PowX(k)に基づいて調節パワースペクトルPowA(k)を決定し、調節パワースペクトルPowA(k)に基づいてX(k)を調節して調節された複素数信号Y(k)を生成する。この調節された複素数信号Y(k)はその時間ドメイン信号Y(n)へ戻すように変換をされることができる。
1実施形態では、システム100は前述した機能を行うことのできる入力コンポーネント102、検出コンポーネント104、調節コンポーネント106、出力コンポーネント110を含んでいる。1実施形態では、このシステムはさらにバイパスコンポーネント112を含むこともできる。これらのコンポーネントについては以下詳細に説明する。
幾つかの実施形態では、種々の特徴の機能はここではプロセッサ、コンポーネントおよび/またはモジュールにより実現または促進されるとして説明されている。ここでの説明のために、プロセッサは1以上の処理装置および/または1以上のプロセスを含むことができる。同様に、コンポーネントまたはモジュールは1以上の装置および/または1以上のプロセスを含むことができる。
また、異なるコンポーネントは別の装置または同じ装置の一部分として存在することができる。さらに幾つかのコンポーネントは1つの装置の一部分として存在することができ、他のコンポーネントは1以上の装置の一部分として存在することができる。
図1に示されているように、入力信号X(n)は対応する複素数信号X(k)とそのパワースペクトルPoxX(k)を生成する入力コンポーネント102により受信される。パワースペクトルPoxX(k)は1以上の決定結果を生成する決定コンポーネント104により受信される。1以上の検出結果は1以上の検出結果に基づいて調節パワースペクトルPoxA(k)を生成する調節コンポーネント106により受信される。調節パワースペクトルPoxA(k)は調節された複素数信号Y(k)を生成するために複素数信号X(k)と組み合わせられることができる。調節された複素数信号Y(k)は調節された複素数信号Y(k)に対応している出力時間ドメイン信号Y(n)を生成する出力コンポーネント110により受信されるとして示されている。
1実施形態では、図1に示されているように、入力コンポーネント102は入力X(n)と同じであっても同じではなくてもよい信号X’(n)をバイパスコンポーネント112へ提供することができ、そのバイパスコンポーネント112は(矢印114により示されているように)X(k)に対する調節が行われるか、或いは(矢印116により示されているように)システム状態をリセットして調節プロセスをバイパスするかを決定することができる。
図2は図1のシステム100の1実施形態により行われることのできるプロセス120の1実施形態を示している。プロセスブロック122では、複素数周波数ドメイン信号は入力時間ドメイン信号から得られる。プロセスブロック124では、複素数周波数ドメイン信号のパワースペクトルが得られる。プロセスブロック126では、少なくとも1つの選択された音響成分の存在がパワースペクトルに基づいて検出される。プロセスブロック128では、調節パワースペクトルが少なくとも1つの選択された音響成分の検出に基づいて生成される。プロセスブロック130では、複素数周波数ドメイン信号は出力複素数周波数ドメイン信号を生成するために調節パワースペクトルと組み合わせられる。プロセスブロック132では、出力時間ドメイン信号は出力複素数周波数ドメイン信号から生成される。
図3は図2のプロセス120を行うことのできるシステム100の1つの例示的な実施形態を示している。図3の実施例では、図1を参照して前述した種々のコンポーネントは必ずしも識別されない。しかしながらプロセス120の種々の機能は図3に示されている実施例により実現されることができることが理解されるであろう。
1実施形態では、入力時間ドメイン信号はフレームとしてサンプルされることができる。図3に示されている例示的な構成は入力信号のフレーム142の処理に後続する。ここでの説明の目的で、入力フレーム142は8kHzのサンプリング速度の例の場合64のサンプル値を有することが想定される。しかしながら、他のサンプリング値も可能であることが理解されよう。
図3では、信号の入力フレームはX(n)として示されている。ここでの説明では、X(n)は時には、単に入力信号または入力時間ドメイン信号と呼ばれることもある。
1実施形態では、入力信号X(n)はある雑音を除去するために濾波されることができる。例えば、ハイパス濾波(HPF、ブロック144として示されている)はDC成分と幾らかの低い周波数雑音を濾波して除去する処理を行うことができる。
デジタル強化コードレス電気通信(DECT)システムのような幾つかの応用では、入力信号は約100Hzでトーナル雑音を有する可能性がある。このような例の雑音を処理するために、例示的なHPF144は図4の(A)および(B)で示されているように、その周波数応答特性において約100Hzに谷を有するように構成されることができる。
1実施形態では、濾波された信号X’(n)はN/2サンプルのオーバーラップでN個のサンプル(N=128)のフレームに分解されることができる。1実施形態ではこのようなフレームは(複素数スペクトルとも呼ばれる)複素数信号X(k)を得るため(ブロック150)半分のオーバーラップのウィンドウ処理(ブロック146)および128FFT(ブロック148)を受けることができる。
1実施形態では、さらに図3に示されているように、パワースペクトルPowX(k)(k=1,2,…,N/2)はN点FFT(ブロック148)に基づいて得られることができ(ブロック152)、ここでkは値k*/N(Hz)を有する周波数ビンを表しており、fはサンプリングレートである。
入力パワースペクトルPowX(k)に基づいて、例示的な検出器、即ち雑音活動度検出器(ブロック154)、白色雑音検出器(ブロック156)、ネットワークトーン検出器(ブロック158)は雑音活動度、白色雑音、ネットワークトーンを決定することができる。このような決定に基づいて、検出器154、156、158は出力フラグN_Flag、W_Flag、T_Flagをそれぞれ生成することができる。これらの例示的な検出器について以下詳細に説明する。
1実施形態では、雑音活動度検出器152と白色雑音検出器は残留雑音を減少させるように設計されることができる。1実施形態では、雑音活動度検出器154、白色雑音検出器156、ネットワークトーン検出器158のうちの任意の1つまたは任意の組み合わせからの出力は雑音パワー評価とそのスペクトル利得評価に使用されることができる。例えば1実施形態では、3つの全ての検出器154、156、158からの出力は雑音パワー評価とそのスペクトル利得評価に使用されることができる。1実施形態では、ネットワークトーン検出器158からの出力は雑音パワー評価とそのスペクトル利得評価に使用されることができる。
1実施形態では、図3でさらに示されているように、(それらのそれぞれの出力フラグを含めた)検出器154、156、158の出力は調節パワースペクトル生成器160へ与えられる。パワースペクトルPowX(k)もまた調節パワースペクトル生成器160へ与えられることが示されている。
調節パワースペクトル生成器160は多決定融合(ブロック162)、雑音パワースペクトル評価(164)、スペクトル利得評価(ブロック166)を含めた機能を含むものとして示されている。図3は(例示の矢印により)特定例の「フロー」を示しているが、調節パワースペクトル生成器160の種々の機能はこのようなパスにしたがう必要はないことが理解されるであろう。
1実施形態では、調節パワースペクトル生成器160は最初に雑音パワースペクトル164の評価を生成する。1実施形態では、雑音パワースペクトルは次のような例示的な技術により評価されることができ、即ち(1)M個のフレーム(例えばM=8であり、現在のフレームPowX(k)と7個の先のフレームを含める)に対するパワースペクトルを獲得し、各周波数ビンでM個のフレームの中から最小値を獲得し、周波数ビンの最小値を集めることによって評価された雑音パワースペクトルを形成する。例えばビン1がフレーム7からの最小値2.2を有し、ビン2はフレーム2からの最小値1.5を有する等であるならば、評価された雑音パワースペクトルはビン1に対しては値2.2を有し、ビン2に対しては値1.5を有する等である。
1実施形態では、調節パワースペクトル生成器160はスペクトル利得(166)により評価された雑音パワースペクトル(164)を調節する。このスペクトル利得は幾つかの既知の技術に基づいておよび/または決定ブロック154、156、158の出力を含む幾つかの決定(162)に基づいて決定されることができる。例えば特別な利得(各ビンのmSpectralGain(k))は文献(Speech enhancement using a minimum mean square error short-time spectral amplitude estimator、Y. EphraimとD. Malah、IEEE Trans. Acoust.、Speech, Signal Processing、vol. ASSP-32(6)、1109−1121頁、1984年12月)に示されている方法に基づいて計算されることができ、この文献はその全体が参考文献とされている。雑音パワースペクトルを調節するための利得についての検出ベースの決定の1例を以下詳細に説明する。
1実施形態では、図3でさらに示されているように、(ブロック150からの)入力複素数スペクトルX(k)は周波数ドメイン濾波(ブロック166)を受けることができ、このようにして得られたスペクトル利得はX(k)に与えられる。例えばk番目の周波数ビンのスペクトル利得は以下のように計算されることができる。
mSpectralGain(k,m)=Ratio(k,m)/[Ratio(k,m)+1], k=1,2…,64
ここでRatio(k,m)=αmSpectralGain(k,m-1)PowX(k)+γ(1-α)P[PowX(k)]
パラメータαはいわゆる「忘却係数」(0<α<1、α=0.98はその1例)であり、γは定数である(例えば0.0243)。P[PowX(k)]は整流関数であり、ここで1例はmax(0.0, PowX(k) γ/EstimatedNoisePow(k)-1)である。この例ではmSpectralGain(k,0)はゼロとして初期化される。濾波ブロック166の出力は出力複素数スペクトル(複素数信号とも呼ばれる)Y(k)として示されている。
1実施形態では、さらに図3に示されているように出力複素数スペクトルY(k)は時間ドメインへマップするために例えばNポイントIFFT(ブロック168)によりさらに処理されることができる。1実施形態では、オーバーラップ加算(ブロック170)技術は雑音が減少された時間ドメイン信号Y(n)を表すサンプルのフレームを再構成する(ブロック172)ために使用されることができる。
1実施形態では、さらに図3に示されているように、バイパスまたは再コンバージェンス機構が以下のように作用することができる。X’(n)フレームの絶対値の和InstantLevelSumがブロック180で計算されることができる。1以上の先のフレームに対する類似の値も得られることができる。決定ブロック182はある期間(例えば80ms)で、現在の値と1以上の先の値とに基づいてInstantLevelSum=0.0であるかまたは選択された値よりも小さいかを決定する。それが「イエス」であるならば、システム状態はリセットされ、雑音減少処理はバイパスされることができる。このような状態では、Y(k)はX(k)を割当てられ、それによって前述したようにY(n)を生成するように処理されることができる。「ノー」であるならば、雑音パワースペクトル評価および/またはスペクトル利得決定は前述したようにパワースペクトルPowX(k)に基づいて行われることができる。
図5は図3(156)を参照して前述した白色雑音検出器200の1実施形態を示している。
Figure 0005203933
1実施形態では、パラメータkAlphaWは約0.94818の値を有し、mSmoothedInstantEnergyはゼロとして初期化される。
さらに図5に示されているように、mSmoothedInstantEnergyと古い値OldSmoothedInstantEnergyとの差の絶対値(208)は値「A」を有するとして示されている。値「B」はOldSmoothedInstantEnergyとパラメータkEnvelopeRatioの積(214)として規定される。1実施形態ではkEnvelopeRatioは約0.0284の値を有する。値AとBは決定ブロック210で比較される。AがBよりも小さいならば、(ゼロとして初期化される)カウンタmWhiteNoiseFrameCountは1だけ増加(インクリメント)される(216)。そうでなければ、カウンタmWhiteNoiseFrameCountはゼロにリセットされる(218)。
さらに図5に示されているように、カウンタmWhiteNoiseFrameCountの現在値は決定ブロック220で選択されたカウント値kNumWhiteNoiseFramesと比較される。1実施形態ではkNumWhiteNoiseFramesは値38を有する。mWhiteNoiseFrameCountがkNumWhiteNoiseFrames以上であるならば、白色雑音が存在すると考えられ、フラグW_Flagは例示的な値「1」で設定される(222)。カウンタmWhiteNoiseFrameCountもまた値kNumWhiteNoiseFramesに設定される。mWhiteNoiseFrameCountがkNumWhiteNoiseFramesよりも小さいならば、白色雑音の存在は断定されず、フラグW_Flagは「0」に設定される(224)。現在値mSmoothedInstantEnergyは次のフレームの解析のために古い値OldSmoothedInstantEnergyになる(226)。
図6は図3を参照して前述した雑音活動度検出器230の1実施形態を示している(図3の154)。例示の64個のビンを有するパワースペクトルPowX(k)(232)は例えば4つの帯域(i=1乃至4)へ区画される64個のビンを有するものとして示されている(234)。各帯域(i番目の帯域)では、帯域内ビンのパワーの合計はi番目の帯域で値Mag_iを生成するように平方根演算ブロック236により処理される。1実施形態では、値Mag_iは平滑装置ブロック238へ与えられ、その平滑装置ブロック238はまたパラメータkAlphaNad(240)を受信する。1実施形態ではkAlphaNadは約0.55の値を有する。平滑装置238はMag_iおよびkAlphaNadに基づいて以下のように平滑された大きさ値sMag_iを計算する。
sMag_i=kAlphaNadsMag_i+(1-kAlphaNad)Mag_i
i=1乃至4は4つの例示の帯域に関してであることに注意する。1実施形態では、sMag_iの値は約0.925の値で初期化される。
1実施形態では、sMag_iの最小値が維持され、選択された期間(例えば30フレーム)で更新される。したがって、平滑装置238からのsMag_iの現在の値は最小値MinMag_iが更新されるべきであるか否かを見るために既存の最小値と比較されることができる(242)。sMag_iの現在値はしきい値(246)(例えばMinMag_iにより乗算された選択されたパラメータ)と比較される(244)。sMag_iがしきい値よりも大きいならば、雑音活動度が存在すると考えられ、フラグN_Flagはここで説明するように決定融合に対して「1」に設定される。そうでなければN_Flagは「0」に設定される。
図7は図3を参照して前述したネットワークトーン検出器250の1実施形態を示している(図3の158)。ここで示されているように、ネットワークトーン検出器250またはその変形は簡単で効率的なネットワークトーン検出アルゴリズムを提供できる。ネットワークトーン検出器250により与えられる1以上の機能はまた電話システムのようなシステムでネットワークトーン情報を維持しながら効率的な雑音減少を実現するために、雑音減少技術に基づいてスペクトル減算と組み合わせられることができる。さらに、ネットワークトーン検出アルゴリズムは何等の有効な情報も失わずに、より良好なエコー消去を行うようにエコー消去方式と統合されるように一般化されることができる。
1実施形態では、以下のパラメータが図7を説明する目的で規定されることができる。パラメータmInPsdMaxIndexは現在のフレームの周波数ビン数であり、このビンは例示的に64個の周波数ビンの最大エネルギである。パラメータOldInPsdMaxIndexは周波数ビンを表し、これは先のフレームの最大エネルギを有する。パラメータmMaxPsdRatioは0.0と1.0との間の同調可能な正の係数である。パラメータkNLowとkNHighはネットワークトーンが位置される周波数範囲を規定し、kNLowは最小周波数を規定し、kNHighは最大周波数を規定する。パラメータmToneFrameCountはネットワークトーンの要求を満たす連続的なフレームの数を表すカウンタである。パラメータkNumToneFramesはしきい値である。T_Flagは検出されたフラグであり、その1の値は、現在のフレームがネットワークトーンを有すると考えられることを意味し、そうでなければ、現在のフレームはネットワークトーンをもたないと考えられる。
1実施形態では、図7に示されているようにネットワークトーンは次の方法で検出されることができる。プロセスブロック252では、PowX(k)(例示的な構造ではk=1乃至64)で最大値を有するビンが識別されることができ、対応するビン番号kはmInPsdMaxIndexとして示されることができる。mInPsdMaxIndexとoldInPsdMaxIndexとの差(254)の絶対値(256)は「A」として示される。したがってA=|mInPsdMaxIndex-oldInpsdMaxIndex|である。mInPsdMaxIndexとmMaxPsdRatioの積(258)は「B」として示される。したがって、B=mInPsdMaxIndexmMaxPsdRatioである。
決定ブロック260では、次の条件、即ち(A<B)と(kNLow<=mInPsdMaxIndex<=kNHigh)がチェックされる。条件(A<B)は最大値を有する現在のビンがどの程度先のビンから変化されているかを見るためにチェックする。条件(kNLow<=mInPsdMaxIndex<=kNHigh)は最大値ビンが既知のネットワークトーン周波数範囲内であるか否かを見るためにチェックする。
両方の条件が満たされるならば、現在のフレームはネットワークトーンを有すると考えられ、フレームカウンタmToneFrameCountは1だけ増加される(264)。そうでなければ、現在のフレームはネットワークトーンを有していないと考えられ、フレームカウンタmToneFrameCountはゼロにリセットされる(262)。
決定ブロック266はT_Flagを「1」(ネットワークトーンが信号に存在する)として設定するか、または「0」(ネットワークトーンが信号に存在しない)として設定するかを決定する。mToneFrameCount>=kNumToneFramesであるならば、T_Flagは「1」に設定され(268)、そうでなければ「0」に設定される(270)。両方の場合に、mInPsdMaxIndexの現在値は次のフレームの解析のために古い値oldInPsdMaxIndexであるように設定される(272)。
1実施形態では、次の値が使用されることができ、即ち(128FFTの例では)mMaxPsdRatio=0.21、kNumToneFrames=19、kNLow=2、kNHigh=15。
図8は図3を参照して前述した利得の検出ベースの決定の例の1実施形態(図3の280)を示している。mSpectralGain(k)は図3のブロック164で評価された雑音パワースペクトルの同じビンに与えられることのできるk番目のビンに対する利得である。mSpectralGain(k)は決定ブロック282の結果に基づいて調節されるものとして示されており、次の条件、即ち((T_Flag=0)と(N_Flag=1))または(第1のMフレームに現在のフレームがあるか?)が試験される。1実施形態ではM=9である。
決定ブロック282に対する答えが「イエス」ならば、mSpectralGain(k)は係数mNoiseActivityGain(1例では0.2<mNoiseActivityGain<=1.0)によりスケールされる(284)。1実施形態ではmNoiseActivityGainは約0.50の値を有する、その後条件の別のセットが決定ブロック286で試験される。決定ブロック282に対する答えが「ノー」であるならば、決定ブロック286は直接呼出される。
決定ブロックは次の条件、即ち(T_Flag=0)と(W_Flag=1)をテストする。答えが「イエス」ならば、mSpectralGain(k)はmMinSpectralGainmGainWとして評価されることのできる値mWhiteNoiseSpectralGainが割当てられる(288)。1実施形態ではmMinSpectralGainは約0.25の値を有し、mGainWは約0.891の値を有する。答えが「ノー」ならば、mSpectralGain(k)は以下の例の方法でクリッパー290を受ける。mSpectralGain(k)がmMinSpectralGainよりも小さいならば、mSpectralGain(k)=mMinSpectralGainであり、mSpectralGain(k)が1.0よりも大きいならば、kの全ての値(この例では1乃至64)において、mSpectralGain(k)=1.0である。
図9は1実施形態で、システム300が前述のシステム100に類似して構成されることができることを示している。システム300は決定を行うためにT_Flagを与えることのできるネットワークトーン検出器302を有して示されており、ここではこのようなフラグはパワースペクトルPowX(k)に基づいて決定される。例示的なシステム100と同様に、決定を行うことはネットワークトーンの存在または不在に基づいた選択されたスペクトル利得調節を含むことができる。1実施形態では、図8のプロセスに類似する決定を行うプロセスが使用されることができ、ここでは決定はスペクトル利得調節のための異なる値を決定するために、他の決定子フラグではなくT_Flagに基づいて行われる。
先の説明に基づいて、各周波数ビンで与えられるスペクトル利得は雑音パワー評価だけでなく1以上の検出およびそれらの対応する決定に依存することができることが分かるであろう。白色雑音、雑音活動度、ネットワークトーンを例示として説明したが、残留雑音、強い雑音、中程度の雑音、弱い雑音のような他のタイプの雑音も同様に処理されることができる。これらの決定の情報の融合により、全体的な決定誤差は減少されることができ、或いは最小にされることができ、改良されたまたは最適化された濾波利得を所定のシステムで得ることができる。
本発明の特徴の種々の組み合わせを実行することにより、スペクトル濾波で使用される利得は単に雑音評価からだけではなく、雑音パワー評価と他の1以上の検出およびそれらの対応する結果との統合により決定されることができるので、静止雑音(調節可能な抑制量)に対して12−20dBの効率的な雑音抑制で、非常に良好な音声品質が得られることができる。
さらに、本発明の幾つかの限定ではない顕著な特徴について以下説明する。(1)本発明の種々の特徴は通常独立した入力レベルであり、したがって検出および決定からの情報は関連されたパワー評価の正規化に使用されることができ、(2)本発明の種々の特徴は通常AGC(自動利得制御、ここでは入力信号の信号対雑音比が適用される雑音減少処理の前に変更される)に関連される歪を防止することができ、(3)本発明の技術は多くの他の利用可能なNRシステム(多くの計算を必要とするAGCを含む)で使用される大きさのスペクトルの代わりに、パワースペクトルに基づいているので、計算の複雑性が低く、(4)効率的なネットワークトーンの検出および関連される機能が与えられるので、ネットワークトーンが電話機の応用の受信パスで保存されることができ、(5)種々の関連されるパラメータが種々の決定結果にしたがって適合的に変更されることができるので、迅速で調節可能なコンバージェンス時間、フレキシブルな制御能力、再コンバージェンス、初期コンバージェンスが実現可能である。
1実施形態では、ここで説明した1以上の特徴はまた多チャンネル通信システムで実行されることができる。多チャンネルの場合、情報の融合は1つのチャンネルの多検出間だけでなく、多チャンネル間で行われることができる。
ネットワークトーン検出器に関して、以下の点に注意する。ネットワークトーンが現れたならば、雑音減少方式は入力を有用な信号として扱うことができ、ネットワークトーンが減少されていない状態を維持するように異なるスペクトル利得を使用するように切り換える。これにより、雑音減少方式はSNRを増加できるだけでなく、他の利用可能な雑音減少アルゴリズム期間中に利用可能なネットワークトーン情報を維持することもできる。
また、ネットワークトーン検出器はスペクトル減算ベースの雑音減少アルゴリズムで有効であるスペクトルに基づいているので、パワー(または大きさ)スペクトルを得るために余分な計算は必要ではない。その結果として、ネットワークトーン検出器は簡単であり、容易に多くの応用で実行されることができる。さらにネットワークトーン検出器は既存の信号−チャンネル雑音減少方式に簡単に付加されることができる。さらに、ネットワークトーン検出器および関連されるアルゴリズムは幾つかの電話システムで見られる周波数ドメインベースのエコー消去方式に統合するように一般化されることができる。またこの技術は信号通報検出器等にも使用されることができる。
一般的に、プロセッサは例えば、ここで説明したように動作するコンピュータ、プログラム論理装置またはその他のデータおよび命令を表す基板構造を含むことができる。別の実施形態ではプロセッサは制御装置回路、プロセッサ回路、プロセッサ、汎用目的の単一チップまたは多チップマイクロプロセッサ、デジタル信号プロセッサ、埋設されたマイクロプロセッサ、マイクロ制御装置等を含むことができる。
さらに1実施形態では、プログラム論理装置は1以上のコンポーネントとして有効に構成されることができることが認識されるであろう。コンポーネントは1以上のプロセッサで実行されるように構成されると有効である。コンポーネントはソフトウェアモジュール、オブジェクト指向ソフトウェアコンポーネント、クラスコンポーネントおよびタスクコンポーネント、処理方法、機能、属性、手順、サブルーチン、プログラムコードのセグメント、ドライバ、ファームウェア、マイクロコード、回路、データ、データベース、データ構造、テーブル、アレイ、変数のようなソフトウェアまたはハードウェアコンポーネントモジュールを含んでいるがそれらに限定されない。
前述の実施形態は前述の実施形態に適用されるように本発明の基本的な優れた特徴を示し、説明し、指摘しているが、装置の細部の形態および/または示されている方法における種々の省略、置換、変更が当業者により本発明の技術的範囲から逸脱せずに行われることができることが理解されるであろう。したがって、本発明の技術的範囲は前述の説明に限定されるべきではなく特許請求の範囲により規定されるべきである。
オーディオ通信信号のような信号中の1以上の音響成分を識別するように構成された種々のコンポーネントを有するシステムの1実施形態のブロック図。 図1のシステムにより行われることのできるプロセスの1実施形態を示す図。 図1のシステムの1つの例示的な実施形態を示す図。 さらに処理するため信号の調整に使用されることのできる1例の濾波コンポーネントの例示的な応答を示す図。 信号に対応するパワースペクトル中の白色雑音を検出するように構成されることのできる検出器コンポーネントの1実施形態を示す図。 信号に対応するパワースペクトル中の雑音活動度を検出するように構成されることのできる検出器コンポーネントの1実施形態を示す図。 信号に対応するパワースペクトル中のネットワークトーンを検出するように構成されることのできる検出器コンポーネントの1実施形態を示す図。 異なる検出器コンポーネントからの結果が、信号に適用されることのできる調節パワースペクトルを決定するために使用されることのできる1実施形態を示す図。 図1のシステムの別の例示的な実施形態を示す図。

Claims (10)

  1. オーディオ信号の雑音を減少させるシステムであって、
    前記システムは、
    入力コンポーネントと、
    雑音活動度検出器と、
    白色雑音検出器と、
    ネットワークトーン検出器と、
    調節コンポーネントと、
    出力コンポーネントと、
    を具備しており、
    前記入力コンポーネントは、
    雑音を含んでいる入力時間ドメインオーディオ信号を受信し、
    少なくとも、高速フーリエ変換(FFT)を前記入力時間ドメインオーディオ信号に適用することによって、入力周波数ドメイン信号を生成して、
    少なくとも、前記入力周波数ドメイン信号の大きさを獲得することによって、前記入力周波数ドメイン信号のパワースペクトルであって、N個のFFTビンを有している前記パワースペクトルを生成するように構成されており、
    前記雑音活動度検出器は
    記N個のFFTビンを複数の帯域に区画し、
    少なくとも、前記複数の帯域から選択された帯域における前記FFTビンのパワーの和を計算して、前記パワーの和の平方根を計算して、値を生成することによって、前記複数の帯域から選択された数の帯域の記値を獲得し、
    記値と、前記選択された数の帯域のしきい値とを比較し、
    記値が前記選択された数の帯域の前記しきい値を超えた場合に、前記パワースペクトル中に雑音活動度が存在すると決定するように構成されており、
    前記白色雑音検出器は、
    前記パワースペクトル中に白色雑音が検出されたかどうかを示す白色雑音インジケータを生成するように構成されており、
    前記ネットワークトーン検出器は、
    前記パワースペクトル中にネットワークトーンが検出されたかどうかを示すネットワークトーンインジケータを生成するように構成されており、
    前記調節コンポーネントは、
    前記雑音活動度と、前記白色雑音と、前記ネットワークトーンとうちの1つ以上が検されたかどうかによって決まる値を有するスペクトル利得を生成し、
    前記ネットワークトーンが前記ネットワークトーン検出器によって検出されず、且つ前記雑音活動度が前記雑音活動度検出器によって検出された場合に、前記スペクトル利得の値は、第1の量であり、
    前記ネットワークトーンが前記ネットワークトーン検出器によって検出されず、且つ前記白色雑音が前記白色雑音検出器によって検出された場合に、前記スペクトル利得の値は、第2の量である、
    前記スペクトル利得を前記入力周波数ドメイン信号に適用して、減少した雑音を有する出力周波数ドメイン信号を生成するように構成されており、
    前記出力コンポーネントは、
    前記出力周波数ドメイン信号に基づいて、出力時間ドメインオーディオ信号を生成するように構成されている、
    オーディオ信号の雑音を減少させるシステム。
  2. 前記入力時間ドメインオーディオ信号は、音声信号を含んでいる請求項1記載のシステム。
  3. 前記スペクトル利得を前記適用することは、
    ネットワークトーンが前記ネットワークトーン検出器により検出されず、且つ雑音活動度が前記雑音活動度検出器により検出される場合に、前記入力周波数ドメイン信号を、選択された量だけスケーリングすることを含む請求項1記載のシステム。
  4. 前記スペクトル利得を前記適用することは、
    ネットワークトーンが前記ネットワークトーン検出器により検出されず、且つ前記白色雑音が前記白色雑音検出器により検出される場合に、白色雑音に対して前記入力周波数ドメイン信号をスケーリングすることを含む請求項1記載のシステム。
  5. 前記入力時間ドメインオーディオ信号中に所定の時間にわたってサイレンスが検出された場合に、前記入力時間ドメインオーディオ信号に基づいて、前記雑音活動度検出器および前記調節コンポーネントをバイパスさせるように構成されているコンポーネント、を更に具備している請求項1記載のシステム。
  6. 入力時間ドメインオーディオ信号を受信するステップと、
    少なくとも、高速フーリエ変換(FFT)を前記入力時間ドメインオーディオ信号に適用することによって、入力周波数ドメイン信号を生成するステップと、
    少なくとも、前記入力周波数ドメイン信号の大きさを獲得することによって、前記入力周波数ドメイン信号のパワースペクトルであって、N個のFFTビンを有している前記パワースペクトルを生成するステップと、
    前記N個のFFTビンを複数の帯域に区画するステップと、
    少なくとも、選択された帯域における前記FFTビンのパワーの和を計算して、前記パワーの和の平方根を計算して、値を生成することによって、前記複数の帯域から選択された数の帯域の記値を獲得するステップと、
    記値と、前記選択された数の帯域のしきい値とを比較するステップと、
    記値が前記選択された数の帯域の前記しきい値を超えた場合に、前記パワースペクトル中に雑音活動度が存在すると決定するステップと
    記パワースペクトル中に白色雑音が存するかどうかを検出するステップと、
    前記パワースペクトル中にネットワークトーンが存するかどうかを検出するステップと、
    前記雑音活動度と、前記白色雑音と、前記ネットワークトーンとのうちの1つ以上が検されたかどうかによって決まる値を有するスペクトル利得を生成するステップと、
    前記ネットワークトーンが前記ネットワークトーン検出器によって検出されず、且つ前記雑音活動度が前記雑音活動度検出器によって検出された場合に、前記スペクトル利得の値は、第1の量であり、
    前記ネットワークトーンが前記ネットワークトーン検出器によって検出されず、且つ前記白色雑音が前記白色雑音検出器によって検出された場合に、前記スペクトル利得の値は、第2の量である、
    前記スペクトル利得を前記入力周波数ドメイン信号に適用して、減少した雑音を有する出力周波数ドメイン信号を生成するステップと、
    前記出力周波数ドメイン信号に基づいて、出力時間ドメイン信号を生成するステップと、
    を含んでいる、オーディオ信号における雑音の減少方法。
  7. 前記入力時間ドメイン信号は、音声信号を含んでいる請求項記載の方法。
  8. 前記スペクトル利得を前記適用するステップは、
    前記ネットワークトーンが検出されず、且つ前記雑音活動度が検出される場合に、前記入力周波数ドメイン信号を、選択された量だけスケーリングするように構成されている請求項記載の方法。
  9. 前記スペクトル利得を前記適用するステップは、
    前記ネットワークトーンが検出されず、且つ前記白色雑音が検出される場合に、前記白色雑音を調節する処理を更に含んでいる請求項記載の方法。
  10. 前記入力時間ドメインオーディオ信号中に所定の時間にわたりサイレンスが検出された場合に、前記入力時間ドメインオーディオ信号に基づいて、前記検出するステップをバイパスするステップを更に含んでいる請求項記載の方法。
JP2008507934A 2005-04-21 2006-04-21 オーディオ雑音を減少させるシステムおよび方法 Expired - Fee Related JP5203933B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US67367105P 2005-04-21 2005-04-21
US60/673,671 2005-04-21
PCT/US2006/015168 WO2006116132A2 (en) 2005-04-21 2006-04-21 Systems and methods for reducing audio noise

Publications (2)

Publication Number Publication Date
JP2008537185A JP2008537185A (ja) 2008-09-11
JP5203933B2 true JP5203933B2 (ja) 2013-06-05

Family

ID=36808839

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008507934A Expired - Fee Related JP5203933B2 (ja) 2005-04-21 2006-04-21 オーディオ雑音を減少させるシステムおよび方法

Country Status (7)

Country Link
US (2) US7912231B2 (ja)
EP (1) EP1875466B1 (ja)
JP (1) JP5203933B2 (ja)
KR (1) KR101168466B1 (ja)
CN (1) CN100580775C (ja)
CA (1) CA2604210C (ja)
WO (1) WO2006116132A2 (ja)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007028250A2 (en) * 2005-09-09 2007-03-15 Mcmaster University Method and device for binaural signal enhancement
MX2009008055A (es) * 2007-03-02 2009-08-18 Ericsson Telefon Ab L M Metodo y arreglos en una red de telecomunicaciones.
CN101110217B (zh) * 2007-07-25 2010-10-13 北京中星微电子有限公司 一种音频信号的自动增益控制方法及装置
US8712762B2 (en) * 2007-07-27 2014-04-29 Vereniging Voor Christelijk Hoger Onderwijs, Wetenschappelijk Onderzoek En Patiëntenzor Noise suppression in speech signals
DE602007004217D1 (de) * 2007-08-31 2010-02-25 Harman Becker Automotive Sys Schnelle Schätzung der Spektraldichte der Rauschleistung zur Sprachsignalverbesserung
KR101107510B1 (ko) 2008-01-10 2012-02-06 주식회사 만도 전자유압브레이크시스템의 제동장치
US9142221B2 (en) * 2008-04-07 2015-09-22 Cambridge Silicon Radio Limited Noise reduction
TWI415484B (zh) * 2009-01-20 2013-11-11 Green Solution Tech Co Ltd 具有噪音防止之轉換電路及轉換控制器
JP5141542B2 (ja) * 2008-12-24 2013-02-13 富士通株式会社 雑音検出装置及び雑音検出方法
KR101616054B1 (ko) 2009-04-17 2016-04-28 삼성전자주식회사 음성 검출 장치 및 방법
CN102208190B (zh) * 2011-05-06 2012-11-28 声科科技(南京)有限公司 抑制非平稳噪声设备收敛时间的测量方法及装置
US9117455B2 (en) 2011-07-29 2015-08-25 Dts Llc Adaptive voice intelligibility processor
CN103457453B (zh) * 2012-06-04 2016-05-11 台达电子工业股份有限公司 一种用于降低音频噪音的控制方法
US10366703B2 (en) 2014-10-01 2019-07-30 Samsung Electronics Co., Ltd. Method and apparatus for processing audio signal including shock noise
TWI576834B (zh) * 2015-03-02 2017-04-01 聯詠科技股份有限公司 聲頻訊號的雜訊偵測方法與裝置
DE102015207706B3 (de) * 2015-04-27 2016-08-18 Sivantos Pte. Ltd. Verfahren zur frequenzabhängigen Rauschunterdrückung eines Eingangssignals
TWI569594B (zh) * 2015-08-31 2017-02-01 晨星半導體股份有限公司 突波干擾消除裝置及突波干擾消除方法
KR102443637B1 (ko) 2017-10-23 2022-09-16 삼성전자주식회사 네트워크 연결 정보에 기반하여 잡음 제어 파라미터를 결정하는 전자 장치 및 그의 동작 방법
CN109951198B (zh) 2017-12-20 2022-06-07 三星电子株式会社 执行选择性噪声滤波的无线通信设备及操作该设备的方法
JP7042169B2 (ja) * 2018-06-21 2022-03-25 日清紡マイクロデバイス株式会社 音声認識支援システム
CN109829035A (zh) * 2018-12-19 2019-05-31 平安国际融资租赁有限公司 流程搜索方法、装置、计算机设备和存储介质
CN112017674B (zh) * 2020-08-04 2024-02-02 杭州联汇科技股份有限公司 一种基于音频特征检测广播音频信号中噪声的方法
US11915715B2 (en) 2021-06-24 2024-02-27 Cisco Technology, Inc. Noise detector for targeted application of noise removal

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4358738A (en) * 1976-06-07 1982-11-09 Kahn Leonard R Signal presence determination method for use in a contaminated medium
US4630604A (en) 1985-04-09 1986-12-23 Siebe North, Inc. Valve assembly for a replaceable filter respirator
US4628529A (en) 1985-07-01 1986-12-09 Motorola, Inc. Noise suppression system
US4630305A (en) 1985-07-01 1986-12-16 Motorola, Inc. Automatic gain selector for a noise suppression system
IL84948A0 (en) * 1987-12-25 1988-06-30 D S P Group Israel Ltd Noise reduction system
JP2919685B2 (ja) * 1992-11-02 1999-07-12 シャープ株式会社 信号識別回路
PL174216B1 (pl) 1993-11-30 1998-06-30 At And T Corp Sposób redukcji w czasie rzeczywistym szumu transmisji mowy
US5937060A (en) 1996-02-09 1999-08-10 Texas Instruments Incorporated Residual echo suppression
US5933495A (en) 1997-02-07 1999-08-03 Texas Instruments Incorporated Subband acoustic noise suppression
US6415253B1 (en) 1998-02-20 2002-07-02 Meta-C Corporation Method and apparatus for enhancing noise-corrupted speech
US6289309B1 (en) 1998-12-16 2001-09-11 Sarnoff Corporation Noise spectrum tracking for speech enhancement
DK1141948T3 (da) * 1999-01-07 2007-08-13 Tellabs Operations Inc Fremgangsmåde og apparat til adaptiv undertrykkelse af stöj
FI116643B (fi) 1999-11-15 2006-01-13 Nokia Corp Kohinan vaimennus
US6760435B1 (en) 2000-02-08 2004-07-06 Lucent Technologies Inc. Method and apparatus for network speech enhancement
US6523003B1 (en) 2000-03-28 2003-02-18 Tellabs Operations, Inc. Spectrally interdependent gain adjustment techniques
US6766292B1 (en) 2000-03-28 2004-07-20 Tellabs Operations, Inc. Relative noise ratio weighting techniques for adaptive noise cancellation
US6529868B1 (en) 2000-03-28 2003-03-04 Tellabs Operations, Inc. Communication system noise cancellation power signal calculation techniques
US6671667B1 (en) 2000-03-28 2003-12-30 Tellabs Operations, Inc. Speech presence measurement detection techniques
US7617099B2 (en) 2001-02-12 2009-11-10 FortMedia Inc. Noise suppression by two-channel tandem spectrum modification for speech signal in an automobile
US7206418B2 (en) 2001-02-12 2007-04-17 Fortemedia, Inc. Noise suppression for a wireless communication device
US20040148166A1 (en) 2001-06-22 2004-07-29 Huimin Zheng Noise-stripping device
US7277554B2 (en) 2001-08-08 2007-10-02 Gn Resound North America Corporation Dynamic range compression using digital frequency warping
KR100400226B1 (ko) 2001-10-15 2003-10-01 삼성전자주식회사 음성 부재 확률 계산 장치 및 방법과 이 장치 및 방법을이용한 잡음 제거 장치 및 방법
US20030110029A1 (en) * 2001-12-07 2003-06-12 Masoud Ahmadi Noise detection and cancellation in communications systems
US7146316B2 (en) 2002-10-17 2006-12-05 Clarity Technologies, Inc. Noise reduction in subbanded speech signals
JP4520732B2 (ja) 2003-12-03 2010-08-11 富士通株式会社 雑音低減装置、および低減方法
US8189803B2 (en) * 2004-06-15 2012-05-29 Bose Corporation Noise reduction headset
US7454332B2 (en) 2004-06-15 2008-11-18 Microsoft Corporation Gain constrained noise suppression
US20060111912A1 (en) * 2004-11-19 2006-05-25 Christian Andrew D Audio analysis of voice communications over data networks to prevent unauthorized usage

Also Published As

Publication number Publication date
US20110172997A1 (en) 2011-07-14
KR20080002990A (ko) 2008-01-04
US20060256764A1 (en) 2006-11-16
CN100580775C (zh) 2010-01-13
WO2006116132A2 (en) 2006-11-02
JP2008537185A (ja) 2008-09-11
EP1875466B1 (en) 2016-06-29
US7912231B2 (en) 2011-03-22
EP1875466A2 (en) 2008-01-09
CN101164105A (zh) 2008-04-16
CA2604210A1 (en) 2006-11-02
US9386162B2 (en) 2016-07-05
KR101168466B1 (ko) 2012-07-26
WO2006116132A3 (en) 2007-04-12
CA2604210C (en) 2016-06-28

Similar Documents

Publication Publication Date Title
JP5203933B2 (ja) オーディオ雑音を減少させるシステムおよび方法
US10891931B2 (en) Single-channel, binaural and multi-channel dereverberation
TWI463817B (zh) 可適性智慧雜訊抑制系統及方法
Van Waterschoot et al. Fifty years of acoustic feedback control: State of the art and future challenges
US8489396B2 (en) Noise reduction with integrated tonal noise reduction
US20190273988A1 (en) Beamsteering
EP2226794B1 (en) Background noise estimation
US8143620B1 (en) System and method for adaptive classification of audio sources
JPH07306695A (ja) 音声信号の雑音低減方法及び雑音区間検出方法
JP5834088B2 (ja) 動的マイクロフォン信号ミキサ
EP1080465A1 (en) Signal noise reduction by spectral substraction using linear convolution and causal filtering
WO2008104446A2 (en) Method for reducing noise in an input signal of a hearing device as well as a hearing device
CN101142623A (zh) 用于语音编码和语音识别的噪音抑制器
RU2725017C1 (ru) Устройство и способ для обработки аудиосигнала
US11183172B2 (en) Detection of fricatives in speech signals
KR102718917B1 (ko) 음성 신호에서의 마찰음의 검출
Jan et al. Frequency dependent statistical model for the suppression of late reverberations

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090216

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110809

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20111108

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20111115

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111201

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20120529

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120619

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20120919

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20120926

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20121113

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20121113

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121214

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130115

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130214

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160222

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees