JP5275748B2 - 動的ノイズ低減 - Google Patents

動的ノイズ低減 Download PDF

Info

Publication number
JP5275748B2
JP5275748B2 JP2008273648A JP2008273648A JP5275748B2 JP 5275748 B2 JP5275748 B2 JP 5275748B2 JP 2008273648 A JP2008273648 A JP 2008273648A JP 2008273648 A JP2008273648 A JP 2008273648A JP 5275748 B2 JP5275748 B2 JP 5275748B2
Authority
JP
Japan
Prior art keywords
noise
frequency portion
speech
frequency
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2008273648A
Other languages
English (en)
Other versions
JP2009104140A (ja
Inventor
リー シュエマン
ノンピウル ラジェーブ
エー. ヘザーリントン フィリップ
Original Assignee
キューエヌエックス ソフトウェア システムズ リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by キューエヌエックス ソフトウェア システムズ リミテッド filed Critical キューエヌエックス ソフトウェア システムズ リミテッド
Publication of JP2009104140A publication Critical patent/JP2009104140A/ja
Application granted granted Critical
Publication of JP5275748B2 publication Critical patent/JP5275748B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Noise Elimination (AREA)
  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
  • Circuit For Audible Band Transducer (AREA)

Description

本開示は、音声強調に関し、さらに詳細には、高ノイズ条件において音声の明瞭度と音声の質とを向上させることに関する。
車両における音声強調は困難である。一部のシステムは、干渉の影響を受けやすい。干渉は、エンジン、ファン、道路のノイズ、および雨を含む多くのソースに由来し得る。反響およびエコーもまた、特に車両環境における音声強調システムにおいて干渉し得る。
一部のノイズ抑制システムは、知覚可能な周波数帯域の多くの周波数にわたって均等にノイズを減衰させる。高ノイズ環境において、特に低周波数において、均等な量のノイズ抑制がスペクトルにわたって適用されたときに、高レベルの残余ノイズが生成され得、該高レベルの残余ノイズは、所望の信号の明瞭度と質とを低下させ得る。
一部の方法は、第1のフォルマントを犠牲にして第2のフォルマントの周波数を強調し得る。これらの方法は、第2のフォルマントの周波数が第1のフォルマントよりも音声の明瞭度に貢献するということを想定し得る。残念ながら、これらの方法は、ユーザが予期し得る信号の鮮明度と質とを低減させる低周波数帯域の大部分を減衰させ得る。高感度であり、かつ正確であり、待ち時間が最も少なく、知覚可能な周波数帯域にわたって音声を強調するシステムに対する必要性が存在する。
音声強調システムは、音声の質と、音声信号の明瞭度とを改善する。システムは、時間周波数コンバータを含み、該時間周波数コンバータは、音声信号のセグメントを周波数帯域に変換する。信号検出器は、各音声セグメントの周波数帯域の信号パワーを測定する。バックグラウンドノイズ推定器は、音声信号において検出されたバックグラウンドノイズを測定する。動的ノイズ低減コントローラは、音声信号におけるバックグラウンドノイズを動的にモデリングする。音声の強調は、音声信号のスペクトルの一部分において生じたノイズの一部分を動的に減衰させることによって、聴取者にとって知覚的に心地良い音声信号を表現する。
他のシステム、方法、特徴、および利点が、以下の図面と詳細な記述とを考察すると、当業者に明確であるか、または明確になる。全てのかかる追加的なシステム、方法、特徴、および利点が、この記述の範囲内に含まれ、本発明の範囲内に含まれ、そして、添付の特許請求の範囲によって保護されるということが意図されている。
本発明はさらに以下を提供する
(項目1)
音声の質を改善するシステムであって、該システムは、
時間変化する信号を周波数領域に、デジタル化して変換するように構成される、スペクトルコンバータと、
バックグラウンドノイズ推定器であって、該時間変化する信号に存在し、かつノイズレシーバの近傍で検出されるバックグラウンドノイズを測定するように構成される、バックグラウンドノイズ推定器と、
該スペクトルコンバータおよび該バックグラウンドノイズ推定器と通信するスペクトルセパレータであって、音声セグメントのパワースペクトルを分割するように構成される、スペクトルセパレータと、
該スペクトルセパレータと通信するモデラであって、実質的に線形の複数の関数を該音声セグメントの様々な部分に適合させる、モデラと、
動的ノイズ調節器であって、該音声セグメントのノイジーな部分に対応する動的調整係数を指定することによって、該音声セグメントの該ノイジーな部分のスペクトルの大きさを指定するようにプログラムされる、動的ノイズ調節器と、
動的ノイズプロセッサであって、該音声セグメントの1つ以上の部分において検出された該ノイズの一部分を減衰させるようにプログラムされる、動的ノイズプロセッサと
を備える、システム。
(項目2)
上記モデラは、複数の線形関係を近似するように構成される、項目1に記載の音声の質を改善するシステム。
(項目3)
上記モデラは、直線を聴覚スペクトルの中間周波数の部分から低周波数部分に適合させ、かつ直線を該聴覚スペクトルの高周波数部分に適合させるように構成される、項目2に記載の音声の質を改善するシステム。
(項目4)
バックグラウンドノイズ推定器は、バックグラウンドノイズ推定器を備える、項目1に記載の音声の質を改善するシステム。
(項目5)
車両内で聴取される変化するノイズ条件に適応する音声強調システムであって、該音声強調システムは、
周波数帯域において音声セグメントの複数の部分を変換する時間周波数コンバータと、
該音声セグメントの該周波数帯域の信号パワーを測定するように構成される信号検出器と、
車両内で検出された聴覚バックグラウンドノイズを測定するように構成されるバックグラウンドノイズ推定器と、
動的ノイズ低減コントローラであって、該音声セグメントのスペクトルの低周波数部分において発生する該ノイズの一部分の動的な減衰を介して、快く知覚される音声セグメントにするために、該車両内の該聴覚バックグラウンドノイズを動的にモデリングするように構成される、動的ノイズ低減コントローラと
を備える、音声強調システム。
(項目6)
アナログ音声セグメントをデジタル信号に変換するように構成されるアナログデジタル変換器をさらに備える、項目5に記載の音声強調システム。
(項目7)
上記時間周波数コンバータは、短時間フーリエ変換コントローラを備える、項目6に記載の音声強調システム。
(項目8)
上記バックグラウンドノイズ推定器は、上記周波数帯域のそれぞれにおいて音響パワーを平均するように構成されるパワー検出器を備える、項目7に記載の音声強調システム。
(項目9)
上記測定されたバックグラウンドノイズが所定の閾値を超えている場合に、上記バックグラウンドノイズ推定器を無効にするように構成される過渡検出器をさらに備える、項目8に記載の音声強調システム。
(項目10)
上記動的ノイズ低減コントローラは、周波数スペクトルの2つ以上の間隔を区別するように構成される、項目9に記載の音声強調システム。
(項目11)
上記動的ノイズ低減コントローラは、上記音声セグメントのスペクトルの一部分において発生する上記ノイズの一部分を減衰させるようにプログラムされる、項目9に記載の音声強調システム。
(項目12)
上記動的ノイズ低減コントローラは、上記音声セグメントの周波数が実質的に事前に指定された周波数以上である場合に、実質的に均一な抑制を適用するように構成される、項目9に記載の音声強調システム。
(項目13)
上記動的ノイズ低減コントローラは、上記音声セグメントの周波数ビンが事前に指定されたビンより小さい場合に、可変の抑制を適用するように構成される、項目12に記載の音声強調システム。
(項目14)
空気を動かすことによって生成された上記ノイズを抑制する上記動的ノイズ低減コントローラと通信する風抑制システムをさらに備える、項目9に記載の音声強調システム。
(項目15)
車両内で記録された信号に適用される減衰ゲインを動的に制御するシステムであって、該システムは、
サウンドセグメントにおいて該信号パワーをリアルタイムで測定するように構成されるパワープロセッサと、
該サウンドセグメントにおいて検出されたバックグラウンドノイズをリアルタイムで測定するように構成されるバックグラウンドノイズプロセッサと、
複数の線形関係を処理することによって、該測定されたバックグラウンドノイズをモデリングするように構成される動的ノイズ低減プロセッサと、
該測定されたバックグラウンドノイズの該モデルに応答して調整されたノイズ抑制ゲインを有する動的ノイズ抑制フィルタと
を備える、システム。
(項目16)
上記動的ノイズ抑制フィルタは、上記サウンドセグメントの第1の指定された部分と、該サウンドセグメントの第2の指定された部分との間の勾配の差に基づき、抑制ゲインを適用するように構成される、項目15に記載の信号に適用される減衰ゲインを動的に制御するシステム。
(項目17)
上記第1の指定された部分は、上記サウンドセグメントの低周波数部分を含む、項目16に記載の信号に適用される減衰ゲインを動的に制御するシステム。
(項目18)
上記第2の指定された部分は、上記サウンドセグメントの高周波数部分を含む、項目17に記載の信号に適用される減衰ゲインを動的に制御するシステム。
(項目19)
音声セグメントの音声の質および明瞭度を改善する方法であって、該方法は、
サウンドセグメントを別々の周波数帯域に変換することであって、各帯域は、小さな周波数範囲にわたって振幅および位相を識別する、ことと、
各周波数帯域において測定された音響パワーを平均することによって、信号のバックグラウンドノイズを推定することと、
周波数スペクトルの高い部分と周波数スペクトルの低い部分とを区別することと、
該スペクトルの高周波数部分に適用される実質的に一定の減衰と、該周波数スペクトルの低い部分に適用される可変の減衰とを決定することによって、バックグラウンドノイズスペクトルをモデリングすることと、
該一定の減衰と該可変の減衰とを適用することによって、該サウンドセグメントから該バックグラウンドノイズの複数の部分を減衰させることと
を包含する、方法。
(項目20)
上記周波数スペクトルの高い部分と該周波数スペクトルの低い部分との間の分離を指定する所定の周波数帯域を指定することをさらに包含する、項目19に記載の音声セグメントの音声の質および明瞭度を改善する方法。
(項目21)
過渡ノイズが検出される場合に、上記バックグラウンドノイズを推定する動作を無効にすることをさらに包含する、項目19に記載の音声セグメントの音声の質を改善する方法。
(項目22)
上記サウンドセグメントをパワー領域に変換することをさらに包含する、項目19に記載の音声セグメントの音声の質を改善する方法。
(項目23)
可変の減衰レベルは、複数のモデリングされた直線座標切片に基づく、項目19に記載の音声セグメントの音声の質を改善する方法。
(項目24)
バックグラウンドノイズをモデリングすることによって、音声の質を改善するソフトウェアを保持するコンピュータ読み取り可能な媒体であって、該媒体は、
コンピュータ読み取り可能な媒体であって、プロセッサによって処理されるようにアクセス可能であり、かつそのように構成される信号推定ロジック、モデリングロジック、および減衰ロジックを保持する、媒体を備え、
該信号推定ロジックは、入力信号において所望される信号の信号パワーを決定し、
該モデリングロジックは、複数の実質的に線形のモデルを介して、該入力信号から検出された複数のバックグラウンドノイズを表し、
該減衰ロジックは、該モデリングロジックの出力に応答して、該入力信号に適用される抑制のレベルを近似する、コンピュータ読み取り可能な媒体。
(項目25)
上記複数の実質的に線形のモデルを保持するようにプログラムされるメモリをさらに備える、項目24に記載のコンピュータ読み取り可能な媒体。
(摘要)
音声強調システムは、音声の質と、音声信号の明瞭度とを改善する。システムは、時間周波数コンバータを含み、該時間周波数コンバータは、音声信号のセグメントを周波数帯域に変換する。信号検出器は、各音声セグメントの周波数帯域の信号パワーを測定する。バックグラウンドノイズ推定器は、音声信号において検出されたバックグラウンドノイズを測定する。動的ノイズ低減コントローラは、音声信号におけるバックグラウンドノイズを動的にモデリングする。音声の強調は、音声信号のスペクトルの一部分において生じたノイズの一部分を動的に減衰させることによって、聴取者にとって知覚的に心地良い音声信号を表現する。
システムは、以下の図面と記述とを参照してさらに良く理解され得る。図面中のコンポーネントは、必ずしもサイズに比例しておらず、その代わりに、本発明の原理を例示することに重きを置いている。さらに、図面においては、同様な参照番号は、異なる図面全体にわたって対応する部分を示している。
ハンズフリーシステムと、通信デバイスと、車両または筐体内の電話とは、ノイズに影響されやすい。ノイズの空間的特性、線形特性、および非線形特性が、音声を抑制したり、歪ませたりし得る。音声強調システムは、聞き取られ得るバックグラウンドノイズを動的に減衰させることによって音声の質と明瞭度とを改善する。動的ノイズ低減システムは、第1のフォルマントの周辺のより低周波数においてより多くの減衰を提供し、第2のフォルマントの周辺においてより少ない減衰を提供し得る。システムは、第2のフォルマントの周波数を強調しながら、第1のフォルマントの音声信号を排除しないことがあり得る。この強調が、開示されたシステムの一部における音声の明瞭度を改善し得る。
バックグラウンドノイズが、低い強度であったり、中間の強度を下回ったりしたときには、一部の静的ノイズ抑制システム(SNSS)が、所望の音声の質および清澄度を達成し得る。ノイズレベルが中間レベルを超過したり、ノイズが一部の音調(tonal)特性または過渡特性を有したりするときには、静的抑制システムは、変化するノイズ条件に順応しないことがあり得る。一部の用途において、静的ノイズ抑制システムは、高レベルの残余散乱ノイズ、音調ノイズ、および/または過渡ノイズを生成する。これらの残余ノイズは、音声の質および明瞭度を低下させ得る。残余干渉が、聴取者に疲労をもたらし得、そして、自動音声認識(ASR)システムの性能を低下させ得る。
相加性ノイズモデルにおいて、ノイジーな音声は、方程式1によって記述され得る。
y(t)=x(t)+d(t) (1)
ここで、x(t)とd(t)とは、音声信号とノイズ信号とをそれぞれ示す。方程式2において、
Figure 0005275748
は、ノイジーな音声の短時間のスペクトルの大きさを示し、
Figure 0005275748
は、鮮明な音声の短時間のスペクトルの大きさを示し、
Figure 0005275748
は、ノイズの短時間のスペクトルの大きさを示し、Gn,kは、n番目のフレームとk番目の周波数ビンとにおける短時間のスペクトル抑制ゲインを示す。このように、推定された鮮明な音声のスペクトルの大きさは、方程式2によって記述され得る。
Figure 0005275748
一部の静的抑制システムは、処理された信号において、楽音を作り出すので、処理された信号の質は低下し得る。音来のノイズを最小化したり、マスキングしたりするために、抑制ゲインは、方程式3によって記述されるように制限され得る。
n,k=max(σ,Gn,k) (3)
方程式3におけるパラメータσは、一定のノイズフロアであり、該一定のノイズフロアは、各周波数ビンに適用されるノイズの減衰の量を確立する。一部の用途において、例えば、σが約0.3に設定されたときには、システムは、周波数ビンkにおいて約10dBだけノイズを減衰させ得る。
スペクトルゲインに基づいたノイズ低減システムは、通常のノイズ条件の下では良好な性能を有し得る。低周波数のバックグラウンドノイズ条件が、過大であるときには、かかるシステムは、処理された信号に残る高レベルの残余ノイズの影響をこうむり得る。
図1および図2は、中間レベルおよび高レベルの車両ノイズの条件それぞれにおいて記録された音声信号のスペクトログラムである。図3および図4は、音声が静的ノイズ抑制システムによって処理されたあとの、図1および図2に示された音声信号のスペクトログラムに対応するスペクトログラムを示す。図1〜図4において、縦座標は、周波数で測定され、横座標は、時間(例えば、秒)で測定される。図の暗度によって示されているように、静的ノイズ抑制システムは、中間レベル(および、示されていないが、低レベル)のバックグラウンドノイズを効果的に抑制する(図3を参照)。逆に、音声が、強いノイズを受けている車両内で記録されたときには、音声のうちの一部は、残余ノイズによって損なわれたり、マスキングされたりしたように現れる(例えば、図4を参照)。
一部の静的ノイズ抑制システムは、全ての周波数にわたって実質的に同じ量のノイズ抑制を加えるので、音声が強調されるときに、ノイズの形状は、変化しないままであり得る。図5および図6は、中間レベルまたは高レベルのバックグラウンドノイズのパワースペクトル密度のグラフと、静的ノイズ抑制システムによって処理された中間レベルまたは高レベルのバックグラウンドノイズのパワースペクトル密度のグラフとである。例示的な静的ノイズ抑制システムは、異なるノイズのタイプまたは異なるノイズ条件に対して減衰を適応させないことがあり得る。図4および図6に示されたもののような高ノイズ条件においては、高レベルの残余ノイズが、処理された信号に残る。
図7は、リアルタイムまたは遅延音声強調方法700の流れ図であり、該リアルタイムまたは遅延音声強調方法700は、変化するノイズ条件に適応する。連続的な信号が記録されたときに、連続的な信号は、所定のサンプリングレートでサンプリングされ、アナログデジタルコンバータによってデジタル化され得る(デジタル信号として受信された場合には、任意である)。信号に対する複素スペクトルが、短時間フーリエ変換(STFT)によって獲得され得、該短時間フーリエ変換(STFT)は、離散時間信号を周波数ビンに変換し、各ビンは、動作702において小さな周波数範囲にわたって大きさと位相とを識別する。
704において、各周波数ビンに対する信号パワーが測定され、バックグラウンドノイズが706において推定される。バックグラウンドノイズの推定は、各周波数ビンにおける音響パワーの平均を含み得る。過渡中の偏ったバックグラウンドノイズの推定を防止するために、ノイズ推定プロセスは、代替の方法において、検出されたパワーの異常な増加または予測不可能な増加の間には無効にされ得る。瞬間的なバックグラウンドノイズが、所定のデシベルレベルよりも多く、所定のバックグラウンドノイズまたは平均バックグラウンドノイズを超過したときには、過渡の検出プロセスは、バックグラウンドノイズの推定を無効にし得る。
708において、バックグラウンドノイズスペクトルがモデリングされる。モデルは、高周波数範囲と低周波数範囲との間を区別し得る。線形のモデルまたは実質的に線形のモデルが使用されたときに、周波数ビンが所定の周波数ビンとほぼ等しかったり、所定の周波数ビンを上回ったりしたときには、定常な抑制係数または均一な抑制係数が適用され得る。周波数ビンが所定の周波数ビンを下回ったときには、修正された抑制係数または可変抑制係数が適用される。一部の方法において、所定の周波数ビンは、高周波数のスペクトルと中間周波数のスペクトルとの間(または高周波数範囲と中間周波数範囲から低周波数範囲までとの間)の境界を指示したり、その境界を近似したりし得る。
抑制係数は、710において複素信号スペクトルに適用され得る。次に、処理されたスペクトルは、(所望された場合には)任意的な動作712において時間領域に再構築されたり、変換されたりし得る。一部の方法は、短時間逆フーリエ変換(STIFT)または逆サブバンドフィルタリング方法(inverse sub−band filtering method)によって、処理された信号を再構築したり、変換したりし得る。
図8は、代替のリアルタイムまたは遅延音声強調方法800の流れ図であり、該代替のリアルタイムまたは遅延音声強調方法800は、車両内の変化するノイズ条件に適応する。連続的な信号が記録されたときには、連続的な信号は、所定のサンプリングレートでサンプリングされ、アナログデジタルコンバータによってデジタル化され得る(デジタル信号として受信された場合には、任意である)。信号に対する複素スペクトルが、短時間フーリエ変換(STFT)によって獲得され得、該短時間フーリエ変換(STFT)は、動作802において、離散時間信号を周波数ビンに変換する。
バックグラウンドノイズのパワースペクトルが、804において、n番目のフレームにおいて推定され得る。各フレームBのバックグラウンドノイズのパワースペクトルが、方程式4によって記述されるように、dB領域に変換され得る。
φ=10log10 (4)
dBパワースペクトルが、806において、低周波数部分と高周波数部分とに分割され得る。分割は、カットオフ周波数などの所定の周波数fにおいて生じ得、このことが、808と810とにおいて、複数の線形の回帰モデルを分離し得る。例示的なプロセスは、方程式5および方程式6によって記述されている2つの実質的に線形のモデルまたは線形の回帰モデルを適用し得る。
=a+b (5)
=a+b (6)
方程式5および方程式6において、Xは周波数であり、YはバックグラウンドノイズのdBパワーであり、a、aはdBノイズパワースペクトルの低周波数部分と高周波数部分との勾配であり、b、bは周波数がゼロに設定されたときの2つの直線の切片である。
所定の周波数f(kビン)またはカットオフ周波数を下回る所与の周波数に対する動的抑制係数が、方程式7によって記述され得る。
Figure 0005275748
あるいは、所定の周波数またはカットオフ周波数ビンkを下回る各ビンに対して、動的抑制係数が、方程式8によって記述され得る。
Figure 0005275748
動的調節係数または動的ノイズフロアが、均一なノイズフロアまたは均一な閾値を変更することによって記述され得る。変動性は、方程式9によって記述されているように、所定のビンを含むビンに対するビンの相対位置に基づき得る。
Figure 0005275748
音声強調方法は、動的調節Gdynamic,n,kを指定することによってノイジーな音声セグメントのスペクトルの大きさを最小化したり、最大化したりし得、該動的調節Gdynamic,n,kは、812において、n番目のフレームとk番目の周波数ビンとにおける短時間スペクトル抑制ゲインを指示する。
dynamic,n,k=max(η(k),Gn,k) (10)
ノイジーな音声スペクトルの大きさは、動的ゲインGdynamic,n,kによって処理されることにより、814において、方程式11によって記述されているように音声セグメントを鮮明にし得る。
Figure 0005275748
一部の音声強調方法において、鮮明な音声セグメントが、(所望される場合には)時間領域に変換され得る。一部の方法が、短時間逆フーリエ変換(STIFT)によって処理された信号を再構築したり、変換したりし得る。一部の方法は、逆サブバンドフィルタリング方法を使用し得、そして、一部の方法は、他の方法を使用し得る。
図8において、ノイズ低減音声信号の質が改善される。動的ノイズ低減の量は、低周波数のノイズスペクトルと高周波数のノイズスペクトルとの間の勾配の差によって決定され得る。ノイズパワースペクトルの低周波数部分(例えば、第1の指定部分)が、高周波数分(例えば、第2の指定部分)と同様な勾配を有するときには、動的ノイズフロアは、実質的に均一または実質的に一定であり得る。ノイズスペクトルの低周波数部分(例えば、第1の指定部分)の負の勾配が、高周波数部分(例えば、第2の指定部分)の負の勾配よりも大きいときには、より積極的なまたは可変のノイズ低減方法が、より低い周波数において適用され得る。
図7および図8の方法および記述は、信号伝達媒体、メモリなどのコンピュータ読み取り可能な媒体内に符号化され得、該コンピュータ読み取り可能な媒体は、1つ以上の集積回路などのデバイスの中にプログラムされたり、コントローラまたはコンピュータによって処理されたりした一体のロジックまたは別個のロジックを備え得る。方法が、ソフトウェアによって行われる場合には、ソフトウェアまたはロジックは、1つ以上のプロセッサまたはコントローラ、ワイヤレス通信インタフェース、ワイヤレスシステム、車両の娯楽および/または快適度コントローラに存在したり、インタフェースされたりしているメモリ、または音声強調システムにインタフェースされたり、存在したりしている不揮発性または揮発性のタイプのメモリ内にあり得る。メモリは、論理機能を実装するための実行可能な命令の順序付けられたリストを含む。論理機能は、デジタル回路、ソースコード、アナログ回路網、またはアナログ電気信号もしくはオーディオ信号などのアナログソースによって実装され得る。ソフトウェアは、図17に示されたハンズフリーシステムもしくは通信システムまたはオーディオシステムに存在する命令を実行可能なシステム、装置、デバイスによって使用するために、またはそれらと共に使用するために、任意のコンピュータ読み取り可能な媒体または信号伝達媒体において体現され得、図16に示されているように車両の中にもあり得る。かかるシステムは、コンピュータベースのシステム、プロセッサを含むシステム、または任意のハードウェアまたはワイヤレス自動車通信プロトコルまたは他の有線またはワイヤレスの通信プロトコルによって自動車またはワイヤレス通信バスと通信し得る入出力インタフェースを含む別のシステムを含み得る。
「コンピュータ読み取り可能な媒体」、「機械読み取り可能な媒体」、「伝搬された信号」媒体、および/または「信号伝達媒体」は、命令を実行可能なシステム、装置、またはデバイスによって使用するために、あるいはそれらと共に使用するためにソフトウェアを含んだり、格納したり、通信したり、伝搬したり、運んだりする任意の手段を含み得る。機械読み取り可能な媒体は、限定するものではないが、選択的に、電子、磁気、光学、電磁、赤外線または半導体のシステム、装置、デバイス、または伝搬媒体であり得る。機械読み取り可能な媒体の網羅的ではない例は、1つ以上のワイヤを有する電気接続「電子機器」、ポータブルの磁気ディスクもしくは光学ディスク、ランダムアクセスメモリ「RAM」などの揮発性メモリ(電子機器)、読み取り専用メモリ「ROM」(電子機器)、消去可能なプログラマブル読み取り専用メモリ(EPROMまたはフラッシュメモリ)(電子機器)または光ファイバ(光学機器)を含む。機械読み取り可能な媒体は、ソフトウェアが画像としてまたは他のフォーマット(例えば、光学スキャン)によって電子的に格納され、次に、コンパイルされ、および/または解釈されたり、処理されたりするとき、ソフトウェアが印刷される有形の媒体も含み得る。処理された媒体は、次に、コンピュータおよび/または機械メモリに格納され得る。
図9は、音声強調システム900であり、該音声強調システム900は、変化するノイズ条件に適応する。連続的な信号が記録されたときに、連続的な信号は、所定のサンプリングレートでサンプリングされ、アナログデジタルコンバータによって(修正されていない信号がデジタルフォーマットで受信された場合には、任意のデバイスによって)デジタル化され得る。信号の複素スペクトルが、時間周波数トランスフォーマ902によって獲得され得、該時間周波数トランスフォーマ902は、短時間フーリエ変換(STFT)コントローラまたはサブバンドフィルタを備え得、該短時間フーリエ変換(STFT)コントローラまたは該サブバンドフィルタは、デジタル化された信号を周波数ビンまたはサブバンドに分離する。
各周波数ビンまたはサブバンドに対する信号パワーが、信号検出器904によって測定され得、バックグラウンドノイズが、バックグラウンドノイズ推定器906によって推定され得る。バックグラウンドノイズ推定器906は、レシーバの近傍で生じる連続的なノイズまたは周囲ノイズを測定し得る。バックグラウンドノイズ推定器906は、パワー検出器を備え、該パワー検出器は、音声が検出されていないときに、各周波数帯域または選択された周波数帯域における音響パワーを平均する。過渡における偏ったノイズの推定を防止するために、代替のバックグラウンドノイズ推定器が、任意の過渡検出器と通信し、該任意の過渡検出器は、パワーの異常な増加または予測不可能な増加の間、代替のバックグラウンドノイズ推定器を無効にする。瞬間的なバックグラウンドノイズB(f,i)が選択されたデシベルレベル「c」よりも多く、平均バックグラウンドノイズB(f)Aveを超過したときには、過渡検出器は、代替のバックグラウンド推定器を無効にし得る。この関係が方程式12によって表現され得る。
B(f,i)>B(f)Ave+c (12)
動的バックグラウンドノイズ低減コントローラ908は、バックグラウンドノイズを動的にモデリングし得る。モデルは、周波数スペクトルの2つ以上の間隔の間を区別し得る。複数のモデルが使用されるとき、例えば、2つ以上の実質的に線形のモデルが使用されるときに、周波数ビンが、事前に指定されたビンまたは周波数とほぼ等しかったり、それよりも大きかったりしたときには、定常な抑制または均一な抑制が、ノイジーな信号に適用され得る。あるいは、周波数ビンが、事前に指定された周波数ビンまたは周波数を下回ったときには、修正された抑制係数または可変抑制係数が適用される。一部のシステムにおいて、所定の周波数ビンは、聴覚範囲において、高周波数のスペクトルと中間周波数のスペクトルとの間(または高周波数範囲と中間周波数範囲から低周波数範囲までとの間)の境界を指示したり、その境界を近似したりし得る。
モデルに基づいて、動的バックグラウンドノイズ低減コントローラ908は、低周波数スペクトルにおいて生じたノイズを積極的に減衰させることによって、音声を、聴取者にとってより知覚的に心地良くなるようにする。次に、処理されたスペクトルは、(所望される場合には)周波数時間コンバータ910によって時間領域に変換され得る。一部の周波数時間スペクトルコンバータ910は、短時間逆フーリエ変換(STIFT)コントローラまたは逆サブバンドフィルタによって、処理された信号を再構築したり、変換したりする。
図10は、代替の音声強調システム1000であり、該代替の音声強調システム1000は、処理された音声の知覚的質を改善し得る。システムは、人間の聴覚器官の特性から利益を受け得、該システムは、事実上聞き取ることができないノイズを積極的に抑制することなく、音声を、耳にとってより知覚的に心地良くなるようにする。その代わりに、システムは、より可聴周波数範囲に集中し得る。音声強調は、スペクトルコンバータ1002によって達成され得、該スペクトルコンバータ1002は、時間領域信号を周波数領域にデジタル化して変換し、次に、該周波数領域は、パワー領域に変換される。バックグラウンドノイズ推定器906は、レシーバの近傍で生じる連続的なノイズまたは周囲のノイズを測定する。バックグラウンドノイズ推定器906は、パワー検出器を備え、該パワー検出器は、音声がほとんど検出されなかったり、全く検出されなかったりしたときに、各周波数ビンにおける音響パワーを平均する。過渡中の偏ったノイズの推定を防止するために、過渡検出器は、一部の代替の音声強調システムにおいて、パワーの異常な増加または予測不可能な増加の間、バックグラウンドノイズ推定器906を無効にし得る。
スペクトルセパレータ1004は、パワースペクトルを低周波数部分と高周波数部分とに分割し得る。分割は、カットオフ周波数などの所定の周波数または指定された周波数ビンにおいて生じ得る。
必要とされるノイズ抑制を決定するために、モデラ1006は、ノイジーな音声スペクトルの選択された部分に別々の直線を適合させ得る。例えば、モデラ1006は、ある直線を低周波数スペクトルおよび/または中間周波数スペクトルの一部分に適合させ得、別の直線をスペクトルの高周波数の部分の一部分に適合させ得る。回帰によって、最も適合する直線が、スペクトルの複数の部分における車両のノイズの激しさをモデリングし得る。
動的ノイズ調節器1008は、各フレームまたは選択されたフレームと各周波数ビンまたは選択されたk番目の周波数ビンにおける短時間スペクトル抑制ゲインに対する動的調整係数を指定することによってノイジーな音声セグメントのスペクトルの大きさを指定し得る。動的調整係数は、一部のシステムにおいて、ゲイン係数の知覚的非線形の重み付けを含み得る。次に、動的ノイズプロセッサ1010が、スペクトルにおけるノイズのうちの一部を減衰させ得る。
図11は、動的ノイズ低減ロジックまたは記述された方法を包含するソフトウェアを用いてプログラムされ得るプログラマブルフィルタである。プログラマブルフィルタは、受信された信号の信号対ノイズ比に基づいた周波数応答を有し得、例えば、再帰的ウィーナーフィルタである。例示的なウィーナーフィルタの抑制ゲインは、方程式13によって記述され得る。
Figure 0005275748
Figure 0005275748
は、方程式14によって記述されるアプリオリなSNR推定である。
Figure 0005275748
Figure 0005275748
は、方程式15によって記述される経験的SNR推定である。
Figure 0005275748
ここで、
Figure 0005275748
はノイズの大きさの推定である。
Figure 0005275748
は、ノイジーな音声の短時間スペクトルの大きさである。
フィルタの抑制ゲインは、方程式10によって記述された動的ノイズフロアを含むことにより、ゲイン係数を推定し得る。
dynamic,n,k=max(η(k),Gn,k) (10)
均一なフロアまたは一定のフロアがまた使用されることにより、方程式16によって記述されているように、再帰を制限し、かつ、音声の歪みを低減させ得る。
Figure 0005275748
楽音ノイズを最小化させるために、フィルタがプログラムされることにより、方程式17によって記述されるように、
Figure 0005275748
を平滑化し得る。
Figure 0005275748
ここで、βは、約0と約1との間の係数であり得る。
図12と図13とは、動的ノイズ低減を用いて強調された音声信号のスペクトログラムを示す。動的ノイズ低減は、中間の強度(例えば、図1と比較)の車両ノイズを減衰させることにより、図12に示された音声信号を生成する。動的ノイズ低減は、高い強度(例えば、図2と比較)の車両ノイズを減衰させることにより、図13に示された音声信号を生成する。
図14は、中間レベルのバックグラウンドノイズのパワースペクトル密度のグラフと、静的抑制システムによって処理された中間レベルのバックグラウンドノイズのパワースペクトル密度のグラフと、動的ノイズ抑制システムによって処理された中間レベルのバックグラウンドノイズのパワースペクトル密度のグラフとである。図15は、高レベルのバックグラウンドノイズのパワースペクトル密度のグラフと、静的抑制システムによって処理された高レベルのバックグラウンドノイズのパワースペクトル密度のグラフと、動的ノイズ抑制システムによって処理された高レベルのバックグラウンドノイズのパワースペクトル密度のグラフとである。これらの図は、どのように、動的ノイズ抑制システムが、より低い周波数において、一部の静的抑制システムによって生成されたノイズフロアよりも低いノイズフロアを生成するかを示す。
音声強調システムは、音声の明瞭度および/または音声の質とを改善する。ゲインの調節は、車両のマイクロフォンなどの入力デバイスから受信された信号に基づいてリアルタイム(または用途または所望の結果に依存した遅延の後)で行われ得る。システムは、追加の補償デバイスとインタフェースし得、そして、例えば、有声信号または無声信号からの風ノイズなどの特定のノイズを抑制するシステムと通信し得、例えば、本明細書において参考として援用される2003年10月16日出願の「System for Surpressing Wind Noise」と題される、米国代理人整理番号第11336/592(P03131USP)に基づく米国特許出願第10/688,802号に記述されたシステムと通信し得る。
システムは、筐体またはハンズフリーシステムなどの自動車通信デバイスにおいて検出された信号に適用される減衰ゲインを動的に制御し得る。代替のシステムにおいて、信号パワーが、パワープロセッサによって測定され、バックグラウンドノイズが、バックグラウンドノイズプロセッサによって測定または推定され得る。バックグラウンドノイズプロセッサの出力に基づいて、バックグラウンドノイズの複数の線形の関係が、動的ノイズ低減プロセッサによってモデリングされ得る。ノイズ抑制ゲインが、コントローラ、増幅器またはプログラマブルフィルタによって表現され得る。デバイスは、待ち時間が少なく、計算の複雑度が低くなり得る。
他の代替の音声強調システムは、上に記述されたり、図面のそれぞれにおいて示されたりした構造および機能の組み合わせを含む。これらの音声強調システムは、上に記述されたり、図面に例示されたりした構造および機能の任意の組み合わせから形成される。ロジックは、ソフトウェアまたはハードウェア内に実装され得る。ハードウェアは、プロセッサまたは揮発性および/または不揮発性のメモリを有するコントローラを含み、該プロセッサまたはコントローラは、ワイヤレス媒体または有線の媒体を介して周辺デバイスにインタフェースする。高ノイズ条件または低ノイズ条件において、元々の信号のスペクトルが調節されるので、明瞭度と信号の質とが改善され得る。
本発明の様々な実施形態が記述されてきたが、本発明の範囲内において、さらに多くの実施形態および実装が可能であることが、当業者には明らかである。したがって、本発明は、添付の特許請求の範囲およびその均等物を踏まえたものを除いては制限されない。
図1は、音声信号と、中間の強度の車両ノイズとのスペクトログラムである。 図2は、音声信号と、高強度の車両ノイズとのスペクトログラムである。 図3は、強調された音声信号と、静的ノイズ抑制方法によって処理された中間の強度の車両ノイズとのスペクトログラムである。 図4は、強調された音声信号と、静的ノイズ抑制方法によって処理された高強度の車両ノイズとのスペクトログラムである。 図5は、中間レベルのバックグラウンドノイズのパワースペクトル密度のグラフと、静的ノイズ抑制方法によって処理された中間レベルのバックグラウンドノイズのパワースペクトル密度のグラフとである。 図6は、高レベルのバックグラウンドノイズのパワースペクトル密度のグラフと、静的ノイズ抑制方法によって処理された高レベルのバックグラウンドノイズのパワースペクトル密度のグラフとである。 図7は、音声強調システムの流れ図である。 図8は、音声強調システムの第2の流れ図である。 図9は、例示的な動的ノイズ低減システムである。 図10は、代替の例示的な動的ノイズ低減システムである。 図11は、動的ノイズ低減ロジックを用いてプログラムされたフィルタである。 図12は、中間の強度の車両ノイズを減衰させる動的ノイズ低減を用いて強調された音声信号のスペクトログラムである。 図13は、高強度の車両ノイズを減衰させる動的ノイズ低減を用いて強調された音声信号のスペクトログラムである。 図14は、中間レベルのバックグラウンドノイズのパワースペクトル密度のグラフと、静的抑制方法によって処理された中間レベルのバックグラウンドノイズのパワースペクトル密度のグラフと、動的ノイズ抑制方法によって処理された中間レベルのバックグラウンドノイズのパワースペクトル密度のグラフとである。 図15は、高レベルのバックグラウンドノイズのパワースペクトル密度のグラフと、静的抑制方法によって処理された高レベルのバックグラウンドノイズのパワースペクトル密度のグラフと、動的ノイズ抑制方法によって処理された高レベルのバックグラウンドノイズのパワースペクトル密度のグラフとである。 図16は、車両と統合された音声強調システムである。 図17は、ハンズフリー通信デバイス、通信システム、またはオーディオシステムと統合された音声強調システムである。
符号の説明
700 リアルタイムまたは遅延音声強調方法
702 周波数領域
704 信号推定
706 ノイズ推定
708 モデリング
710 ノイズ抑制
712 時間領域

Claims (19)

  1. 音声の質を改善するシステムであって、該システムは、
    第1の直線を音声セグメントの第1の周波数部分のノイズスペクトルに適合させ、第2の直線を該音声セグメントの第2の周波数部分のノイズスペクトルに適合させるように構成されるモデラであって、該第2の周波数部分は、該第1の周波数部分よりも周波数が高い、モデラと、
    該第1の直線と該第2の直線との間の勾配または切片における差を計算し、該差に基づいて動的調整係数を計算するようにプログラムされる動的ノイズ調節器と、
    該動的調整係数に基づいて、該音声セグメントにおいて検出されたノイズを減衰させるようにプログラムされる動的ノイズプロセッサと
    を備え
    該動的ノイズプロセッサは、該動的調整係数を用いて該第1の周波数部分を減衰させ、異なる調整係数を用いて該第2の周波数部分を減衰させるように構成されている、システム。
  2. 前記モデラは、複数の線形関係を近似するように構成され、前記差は、前記第1の直線と前記第2の直線との間の勾配における差である、請求項1に記載の音声の質を改善するシステム。
  3. 前記第1の周波数部分は、聴覚スペクトルの中間周波数部分から所定の周波数より低い該聴覚スペクトルの低周波数部分までを含み、前記第2の周波数部分は、該所定の周波数より高い該聴覚スペクトルの高周波数部分を含む、請求項2に記載の音声の質を改善するシステム。
  4. 変化するノイズ条件に適応する音声強調システムであって、該音声強調システムは、
    車両内で検出された聴覚バックグラウンドノイズを測定するように構成されるバックグラウンドノイズ推定器と、
    該車両内の該聴覚バックグラウンドノイズを動的にモデリングし、第1の音声セグメントにおけるノイズの減衰によって音声セグメントを減衰させるように構成される動的ノイズ低減コントローラと
    を備え、
    該動的ノイズ低減コントローラは、第1の直線を所定の周波数より低い該第1の音声セグメントの低周波数部分のノイズスペクトルに適合させることと、第2の直線を該所定の周波数より高い該第1の音声セグメントの高周波数部分のノイズスペクトルに適合させることと、該第1の直線と該第2の直線との間の勾配または切片における差を計算することと、該差に基づいて該減衰に対する減衰量を計算することとを行うように構成されており、
    該動的ノイズ低減コントローラは、該計算された減衰量を用いて該低周波数部分を減衰させ、異なる減衰量を用いて該高周波数部分を減衰させるように構成されている、音声強調システム。
  5. アナログ音声セグメントをデジタル信号に変換するように構成されるアナログデジタル変換器をさらに備える、請求項に記載の音声強調システム。
  6. 短時間フーリエ変換コントローラを備える時間周波数コンバータをさらに備え、該短時間フーリエ変換コントローラは、前記デジタル信号から周波数帯域を生成するように構成される、請求項に記載の音声強調システム。
  7. 前記バックグラウンドノイズ推定器は、前記周波数帯域のそれぞれにおいて音響パワーを平均するように構成されるパワー検出器を備える、請求項に記載の音声強調システム。
  8. 前記測定されたバックグラウンドノイズが所定の閾値を超えている場合に、前記バックグラウンドノイズ推定器を無効にするように構成される過渡検出器をさらに備える、請求項に記載の音声強調システム。
  9. 前記動的ノイズ低減コントローラは、前記第1の音声セグメントの前記高周波数部分に対して均一な抑制を適用するように構成される、請求項に記載の音声強調システム。
  10. 前記動的ノイズ低減コントローラと通信する風抑制システムをさらに備え、該風抑制システムは、空気を動かすことによって生成されるノイズを抑制する、請求項に記載の音声強調システム。
  11. 車両内で記録された信号に適用される減衰ゲインを動的に制御するシステムであって、該システムは、
    サウンドセグメントにおいて検出されたバックグラウンドノイズをリアルタイムで測定するように構成されるバックグラウンドノイズプロセッサと、
    該測定されたバックグラウンドノイズをモデリングするように構成される動的ノイズ低減プロセッサであって、該動的ノイズ低減プロセッサは、第1の直線を該サウンドセグメントの第1の周波数部分のノイズスペクトルに適合させることと、第2の直線を該サウンドセグメントの第2の周波数部分のノイズスペクトルに適合させることと、該第1の直線と該第2の直線との間の勾配または切片における差を計算することと、該差に基づいてノイズ抑制ゲインを計算することとを行うように構成され、該第2の周波数部分は、該第1の周波数部分よりも周波数が高い、動的ノイズ低減プロセッサと、
    該ノイズ抑制ゲインを該サウンドセグメントに対して適用するように構成される動的ノイズ抑制フィルタと
    を備え
    該動的ノイズ抑制フィルタは、該ノイズ抑制ゲインを用いて該第1の周波数部分を減衰させ、異なる抑制ゲインを用いて該第2の周波数部分を減衰させるように構成されている、システム。
  12. 前記動的ノイズ低減プロセッサは、前記第1の直線と前記第2の直線との間の勾配における差に基づいて、前記ノイズ抑制ゲインを計算するように構成される、請求項11に記載の信号に適用される減衰ゲインを動的に制御するシステム。
  13. 前記第1の周波数部分は、所定の周波数より低い前記サウンドセグメントの低周波数部分を含む、請求項12に記載の信号に適用される減衰ゲインを動的に制御するシステム。
  14. 前記第2の周波数部分は、前記所定の周波数より高い前記サウンドセグメントの高周波数部分を含む、請求項13に記載の信号に適用される減衰ゲインを動的に制御するシステム。
  15. 音声セグメントの音声の質および明瞭度を改善する方法であって、該方法は、
    第1の直線を所定の周波数より低いサウンドセグメントの低周波数部分のノイズスペクトルに適合させることと、
    第2の直線を該所定の周波数より高い該サウンドセグメントの高周波数部分のノイズスペクトルに適合させることと、
    該第1の直線と該第2の直線との間の勾配または切片における差を計算することと、
    バックグラウンドノイズスペクトルをモデリングすることであって、該モデリングすることは、該スペクトルの該高周波数部分に適用されるべき実質的に一定の減衰と、該スペクトルの該低周波数部分に適用されるべき可変の減衰とを決定することによる、ことと、
    該第1の直線と該第2の直線との間の該差に基づいて、該可変の減衰に対するレベルを計算することと、
    該一定の減衰と該可変の減衰とを適用することによって、該サウンドセグメントからのバックグラウンドノイズを減衰させることと
    該一定の減衰を用いて該高周波数部分を減衰させることと、
    該可変の減衰を用いて該低周波数部分を減衰させることと
    を包含する、方法。
  16. 過渡ノイズが検出される場合に、バックグラウンドノイズ推定を無効にすることをさらに包含する、請求項15に記載の音声セグメントの音声の質を改善する方法。
  17. 前記差は、前記第1の直線と前記第2の直線との間の勾配における差である、請求項15に記載の音声セグメントの音声の質を改善する方法。
  18. バックグラウンドノイズをモデリングすることによって、音声の質を改善するソフトウェアを保持するコンピュータ読み取り可能な媒体であって、
    プロセッサによってアクセス可能であり、かつプロセッサによって処理されるように構成される信号推定ロジック、モデリングロジック、および減衰ロジックを保持するコンピュータ読み取り可能な媒体を備え、
    該信号推定ロジックは、入力信号内の所望される信号の信号パワーを決定し、
    該モデリングロジックは、複数の線形のモデルによって、該入力信号から検出された複数のバックグラウンドノイズを表し、該モデリングロジックは、該複数の線形のモデルのうちの第1の直線を該入力信号の第1の周波数部分のノイズスペクトルに適合させ、かつ該複数の線形のモデルのうちの第2の直線を該入力信号の第2の周波数部分のノイズスペクトルに適合させ、該第2の周波数部分は、該第1の周波数部分よりも周波数が高く、
    該減衰ロジックは、該モデリングロジックの出力に応答して、該入力信号に適用されるべき抑制のレベルを近似し、該減衰ロジックは、該第1の直線と該第2の直線との間の勾配または切片における差を計算し、該差に基づいて、該抑制のレベルを計算し、
    該減衰ロジックは、該差に基づく該抑制のレベルを用いて該第1の周波数部分を減衰させ、異なる抑制のレベルを用いて該第2の周波数部分を減衰させる、コンピュータ読み取り可能な媒体。
  19. 前記複数の線形のモデルを保持するようにプログラムされるメモリをさらに備える、請求項18に記載のコンピュータ読み取り可能な媒体。
JP2008273648A 2007-10-24 2008-10-23 動的ノイズ低減 Active JP5275748B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/923,358 US8015002B2 (en) 2007-10-24 2007-10-24 Dynamic noise reduction using linear model fitting
US11/923,358 2007-10-24

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2012141111A Division JP2012177950A (ja) 2007-10-24 2012-06-22 動的ノイズ低減

Publications (2)

Publication Number Publication Date
JP2009104140A JP2009104140A (ja) 2009-05-14
JP5275748B2 true JP5275748B2 (ja) 2013-08-28

Family

ID=40298767

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2008273648A Active JP5275748B2 (ja) 2007-10-24 2008-10-23 動的ノイズ低減
JP2012141111A Withdrawn JP2012177950A (ja) 2007-10-24 2012-06-22 動的ノイズ低減

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2012141111A Withdrawn JP2012177950A (ja) 2007-10-24 2012-06-22 動的ノイズ低減

Country Status (3)

Country Link
US (2) US8015002B2 (ja)
EP (1) EP2056296B1 (ja)
JP (2) JP5275748B2 (ja)

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7724693B2 (en) * 2005-07-28 2010-05-25 Qnx Software Systems (Wavemakers), Inc. Network dependent signal processing
US8326614B2 (en) 2005-09-02 2012-12-04 Qnx Software Systems Limited Speech enhancement system
US8606566B2 (en) * 2007-10-24 2013-12-10 Qnx Software Systems Limited Speech enhancement through partial speech reconstruction
US8326617B2 (en) * 2007-10-24 2012-12-04 Qnx Software Systems Limited Speech enhancement with minimum gating
US8015002B2 (en) 2007-10-24 2011-09-06 Qnx Software Systems Co. Dynamic noise reduction using linear model fitting
US8296136B2 (en) * 2007-11-15 2012-10-23 Qnx Software Systems Limited Dynamic controller for improving speech intelligibility
US9142221B2 (en) * 2008-04-07 2015-09-22 Cambridge Silicon Radio Limited Noise reduction
US8611554B2 (en) * 2008-04-22 2013-12-17 Bose Corporation Hearing assistance apparatus
US8914282B2 (en) * 2008-09-30 2014-12-16 Alon Konchitsky Wind noise reduction
US20100145687A1 (en) * 2008-12-04 2010-06-10 Microsoft Corporation Removing noise from speech
US8433564B2 (en) * 2009-07-02 2013-04-30 Alon Konchitsky Method for wind noise reduction
US8700394B2 (en) * 2010-03-24 2014-04-15 Microsoft Corporation Acoustic model adaptation using splines
US9311927B2 (en) 2011-02-03 2016-04-12 Sony Corporation Device and method for audible transient noise detection
CN103348686B (zh) 2011-02-10 2016-04-13 杜比实验室特许公司 用于风检测和抑制的系统和方法
EP2595145A1 (en) * 2011-11-17 2013-05-22 Nederlandse Organisatie voor toegepast -natuurwetenschappelijk onderzoek TNO Method of and apparatus for evaluating intelligibility of a degraded speech signal
CA2806372C (en) * 2012-02-16 2016-07-19 Qnx Software Systems Limited System and method for dynamic residual noise shaping
CN103325383A (zh) 2012-03-23 2013-09-25 杜比实验室特许公司 音频处理方法和音频处理设备
JP6160045B2 (ja) * 2012-09-05 2017-07-12 富士通株式会社 調整装置および調整方法
CN105051814A (zh) 2013-03-12 2015-11-11 希尔Ip有限公司 降噪方法及系统
EP2816557B1 (en) * 2013-06-20 2015-11-04 Harman Becker Automotive Systems GmbH Identifying spurious signals in audio signals
US9865277B2 (en) * 2013-07-10 2018-01-09 Nuance Communications, Inc. Methods and apparatus for dynamic low frequency noise suppression
US9484044B1 (en) 2013-07-17 2016-11-01 Knuedge Incorporated Voice enhancement and/or speech features extraction on noisy audio signals using successively refined transforms
US9530434B1 (en) 2013-07-18 2016-12-27 Knuedge Incorporated Reducing octave errors during pitch determination for noisy audio signals
US9208794B1 (en) * 2013-08-07 2015-12-08 The Intellisis Corporation Providing sound models of an input signal using continuous and/or linear fitting
US9311930B2 (en) * 2014-01-28 2016-04-12 Qualcomm Technologies International, Ltd. Audio based system and method for in-vehicle context classification
US9721580B2 (en) * 2014-03-31 2017-08-01 Google Inc. Situation dependent transient suppression
CN105336341A (zh) 2014-05-26 2016-02-17 杜比实验室特许公司 增强音频信号中的语音内容的可理解性
US10431240B2 (en) * 2015-01-23 2019-10-01 Samsung Electronics Co., Ltd Speech enhancement method and system
US11003987B2 (en) * 2016-05-10 2021-05-11 Google Llc Audio processing with neural networks
EP3312838A1 (en) 2016-10-18 2018-04-25 Fraunhofer Gesellschaft zur Förderung der Angewand Apparatus and method for processing an audio signal
EP3382700A1 (en) * 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for post-processing an audio signal using a transient location detection
US11017798B2 (en) * 2017-12-29 2021-05-25 Harman Becker Automotive Systems Gmbh Dynamic noise suppression and operations for noisy speech signals
US11363147B2 (en) * 2018-09-25 2022-06-14 Sorenson Ip Holdings, Llc Receive-path signal gain operations
CN112201267B (zh) * 2020-09-07 2024-09-20 北京达佳互联信息技术有限公司 一种音频处理方法、装置、电子设备及存储介质
CN118471246B (zh) * 2024-07-09 2024-10-11 杭州知聊信息技术有限公司 基于人工智能的音频分析降噪方法、系统及存储介质

Family Cites Families (52)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4853963A (en) 1987-04-27 1989-08-01 Metme Corporation Digital signal processing method for real-time processing of narrow band signals
AU671952B2 (en) 1991-06-11 1996-09-19 Qualcomm Incorporated Variable rate vocoder
US5701393A (en) 1992-05-05 1997-12-23 The Board Of Trustees Of The Leland Stanford Junior University System and method for real time sinusoidal signal generation using waveguide resonance oscillators
US5408580A (en) 1992-09-21 1995-04-18 Aware, Inc. Audio compression system employing multi-rate signal analysis
TW271524B (ja) 1994-08-05 1996-03-01 Qualcomm Inc
US5978783A (en) 1995-01-10 1999-11-02 Lucent Technologies Inc. Feedback control system for telecommunications systems
US6263307B1 (en) * 1995-04-19 2001-07-17 Texas Instruments Incorporated Adaptive weiner filtering using line spectral frequencies
US6044068A (en) * 1996-10-01 2000-03-28 Telefonaktiebolaget Lm Ericsson Silence-improved echo canceller
JP2930101B2 (ja) * 1997-01-29 1999-08-03 日本電気株式会社 雑音消去装置
US6336092B1 (en) 1997-04-28 2002-01-01 Ivl Technologies Ltd Targeted vocal transformation
US6493338B1 (en) * 1997-05-19 2002-12-10 Airbiquity Inc. Multichannel in-band signaling for data communications over digital wireless telecommunications networks
US6771629B1 (en) * 1999-01-15 2004-08-03 Airbiquity Inc. In-band signaling for synchronization in a voice communications network
US6690681B1 (en) * 1997-05-19 2004-02-10 Airbiquity Inc. In-band signaling for data communications over digital wireless telecommunications network
US6144937A (en) 1997-07-23 2000-11-07 Texas Instruments Incorporated Noise suppression of speech by signal processing including applying a transform to time domain input sequences of digital signals representing audio information
US6163608A (en) 1998-01-09 2000-12-19 Ericsson Inc. Methods and apparatus for providing comfort noise in communications systems
TW430778B (en) 1998-06-15 2001-04-21 Yamaha Corp Voice converter with extraction and modification of attribute data
US7072831B1 (en) 1998-06-30 2006-07-04 Lucent Technologies Inc. Estimating the noise components of a signal
US20040066940A1 (en) * 2002-10-03 2004-04-08 Silentium Ltd. Method and system for inhibiting noise produced by one or more sources of undesired sound from pickup by a speech recognition unit
JP4193243B2 (ja) 1998-10-07 2008-12-10 ソニー株式会社 音響信号符号化方法及び装置、音響信号復号化方法及び装置並びに記録媒体
JP3454190B2 (ja) * 1999-06-09 2003-10-06 三菱電機株式会社 雑音抑圧装置および方法
AU2066501A (en) * 1999-12-06 2001-06-12 Dmi Biosciences, Inc. Noise reducing/resolution enhancing signal processing method and system
DE10000009A1 (de) * 2000-01-03 2001-07-19 Alcatel Sa Verfahren zur koordinierten Echo- und/oder Geräuschabsenkung
US6628754B1 (en) * 2000-01-07 2003-09-30 3Com Corporation Method for rapid noise reduction from an asymmetric digital subscriber line modem
US6570444B2 (en) 2000-01-26 2003-05-27 Pmc-Sierra, Inc. Low noise wideband digital predistortion amplifier
US6529868B1 (en) * 2000-03-28 2003-03-04 Tellabs Operations, Inc. Communication system noise cancellation power signal calculation techniques
US6741874B1 (en) * 2000-04-18 2004-05-25 Motorola, Inc. Method and apparatus for reducing echo feedback in a communication system
JP4638981B2 (ja) * 2000-11-29 2011-02-23 アンリツ株式会社 信号処理装置
JP2002221988A (ja) * 2001-01-25 2002-08-09 Toshiba Corp 音声信号の雑音抑圧方法と装置及び音声認識装置
US6862558B2 (en) 2001-02-14 2005-03-01 The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration Empirical mode decomposition for analyzing acoustical signals
WO2002093561A1 (de) 2001-05-11 2002-11-21 Siemens Aktiengesellschaft Verfahren zur erweiterung der bandbreite eines schmalbandig gefilterten sprachsignals, insbesondere eines von einem telekommunikationsgerät gesendeten sprachsignals
EP1446796A1 (en) * 2001-10-26 2004-08-18 Koninklijke Philips Electronics N.V. Tracking of sinusoidal parameters in an audio coder
US7142533B2 (en) * 2002-03-12 2006-11-28 Adtran, Inc. Echo canceller and compression operators cascaded in time division multiplex voice communication path of integrated access device for decreasing latency and processor overhead
US7366161B2 (en) * 2002-03-12 2008-04-29 Adtran, Inc. Full duplex voice path capture buffer with time stamp
US7725315B2 (en) * 2003-02-21 2010-05-25 Qnx Software Systems (Wavemakers), Inc. Minimization of transient noises in a voice signal
US7885420B2 (en) * 2003-02-21 2011-02-08 Qnx Software Systems Co. Wind noise suppression system
US7895036B2 (en) * 2003-02-21 2011-02-22 Qnx Software Systems Co. System for suppressing wind noise
JP4380174B2 (ja) 2003-02-27 2009-12-09 沖電気工業株式会社 帯域補正装置
WO2004084181A2 (en) 2003-03-15 2004-09-30 Mindspeed Technologies, Inc. Simple noise suppression model
US7133825B2 (en) * 2003-11-28 2006-11-07 Skyworks Solutions, Inc. Computationally efficient background noise suppressor for speech coding and speech recognition
US7716046B2 (en) 2004-10-26 2010-05-11 Qnx Software Systems (Wavemakers), Inc. Advanced periodic signal enhancement
JP4283212B2 (ja) * 2004-12-10 2009-06-24 インターナショナル・ビジネス・マシーンズ・コーポレーション 雑音除去装置、雑音除去プログラム、及び雑音除去方法
KR100657948B1 (ko) * 2005-02-03 2006-12-14 삼성전자주식회사 음성향상장치 및 방법
US8315863B2 (en) 2005-06-17 2012-11-20 Panasonic Corporation Post filter, decoder, and post filtering method
US8311840B2 (en) 2005-06-28 2012-11-13 Qnx Software Systems Limited Frequency extension of harmonic signals
US7724693B2 (en) * 2005-07-28 2010-05-25 Qnx Software Systems (Wavemakers), Inc. Network dependent signal processing
JP4356670B2 (ja) * 2005-09-12 2009-11-04 ソニー株式会社 雑音低減装置及び雑音低減方法並びに雑音低減プログラムとその電子機器用収音装置
EP1772855B1 (en) 2005-10-07 2013-09-18 Nuance Communications, Inc. Method for extending the spectral bandwidth of a speech signal
US7555075B2 (en) * 2006-04-07 2009-06-30 Freescale Semiconductor, Inc. Adjustable noise suppression system
JP4827675B2 (ja) 2006-09-25 2011-11-30 三洋電機株式会社 低周波帯域音声復元装置、音声信号処理装置および録音機器
US8639500B2 (en) 2006-11-17 2014-01-28 Samsung Electronics Co., Ltd. Method, medium, and apparatus with bandwidth extension encoding and/or decoding
US8015002B2 (en) 2007-10-24 2011-09-06 Qnx Software Systems Co. Dynamic noise reduction using linear model fitting
US8606566B2 (en) * 2007-10-24 2013-12-10 Qnx Software Systems Limited Speech enhancement through partial speech reconstruction

Also Published As

Publication number Publication date
US8015002B2 (en) 2011-09-06
US20090112584A1 (en) 2009-04-30
EP2056296A2 (en) 2009-05-06
JP2009104140A (ja) 2009-05-14
US20120035921A1 (en) 2012-02-09
EP2056296A3 (en) 2012-02-22
US8326616B2 (en) 2012-12-04
JP2012177950A (ja) 2012-09-13
EP2056296B1 (en) 2017-06-14

Similar Documents

Publication Publication Date Title
JP5275748B2 (ja) 動的ノイズ低減
EP1450353B1 (en) System for suppressing wind noise
US8606566B2 (en) Speech enhancement through partial speech reconstruction
US8219389B2 (en) System for improving speech intelligibility through high frequency compression
US8612222B2 (en) Signature noise removal
US8296136B2 (en) Dynamic controller for improving speech intelligibility
US8073689B2 (en) Repetitive transient noise removal
US8249861B2 (en) High frequency compression integration
US8170221B2 (en) Audio enhancement system and method
KR100860805B1 (ko) 음성 강화 시스템
US7716046B2 (en) Advanced periodic signal enhancement
EP2244254B1 (en) Ambient noise compensation system robust to high excitation noise
US20050207583A1 (en) Audio enhancement system and method
US10262673B2 (en) Soft-talk audio capture for mobile devices
JP2008519553A (ja) バーク帯域ワイナ・フィルタと線形減衰とを用いたノイズ低減及びコンフォート・ノイズ・ゲイン制御
WO2006001960A1 (en) Comfort noise generator using modified doblinger noise estimate
US8326621B2 (en) Repetitive transient noise removal
WO2008101324A1 (en) High-frequency bandwidth extension in the time domain
JP2003500936A (ja) エコー抑止システムにおけるニアエンド音声信号の改善
RU2725017C1 (ru) Устройство и способ для обработки аудиосигнала
Parikh et al. Perceptual artifacts in speech noise suppression
Fraga et al. Comparison of Speech Enhancement/Recognition Methods Based on Ephraim and Malah Noise Suppression Rule and Noise Masking Threshold

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110630

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110928

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20111003

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111026

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20111028

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120410

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120622

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121226

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121228

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130423

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130516

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 5275748

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250