JP2005518118A - 周波数解析のためのフィルタセット - Google Patents

周波数解析のためのフィルタセット Download PDF

Info

Publication number
JP2005518118A
JP2005518118A JP2003568555A JP2003568555A JP2005518118A JP 2005518118 A JP2005518118 A JP 2005518118A JP 2003568555 A JP2003568555 A JP 2003568555A JP 2003568555 A JP2003568555 A JP 2003568555A JP 2005518118 A JP2005518118 A JP 2005518118A
Authority
JP
Japan
Prior art keywords
low
filter
pass filter
signal
input signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003568555A
Other languages
English (en)
Inventor
ワッツ・ロイド
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Audience LLC
Original Assignee
Audience LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Audience LLC filed Critical Audience LLC
Publication of JP2005518118A publication Critical patent/JP2005518118A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03HIMPEDANCE NETWORKS, e.g. RESONANT CIRCUITS; RESONATORS
    • H03H17/00Networks using digital techniques
    • H03H17/02Frequency selective networks
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03HIMPEDANCE NETWORKS, e.g. RESONANT CIRCUITS; RESONATORS
    • H03H17/00Networks using digital techniques
    • H03H17/02Frequency selective networks
    • H03H17/04Recursive filters

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Mathematical Physics (AREA)
  • Stereophonic System (AREA)

Abstract

【課題】
【解決手段】 入力信号(100)を解析して複数の周波数成分に分離するためのシステムおよび方法が開示されている。一実施形態では、入力信号(100)が第1の組のローパスフィルタ(102〜132)で処理されることにより、第1の組の周波数成分が取得される。なお、第1の組のローパスフィルタ(102〜132)は、第1のローパスフィルタ(102)と最後のローパスフィルタ(132)とを有するチェーン内に直列に配置され、各ローパスフィルタの出力は、最後のローパスフィルタ(132)に至るまで、チェーン内の次のローパスフィルタに供給される。最後のローパスフィルタ(132)の出力がダウンサンプリング(140)されることにより、ダウンサンプリングされた信号が生成される。ダウンサンプリングされた信号が第2の組のローパスフィルタ(142〜172)で処理されることにより、第2の組の周波数成分が取得される。

Description

本発明は、一般に、信号処理に関する。信号を解析して周波数成分に分離するためのシステムおよび方法が開示されている。
信号を解析する際に有用な工程として、信号を周波数成分に分離する方法がある。ここ最近、時間領域信号を解析して周波数成分に分離する際には、高速フーリエ変換(FFT)アルゴリズムが用いられている。各種の処理、特に、音声信号の処理に対しては、高周波数における高い時間分解能と低周波数における高いスペクトル分解能とを実現しつつ、信号を解析して周波数成分に分離することが望ましい。これを実現するために、数多くの技術が提案されている。そのような技術としては、1組のフィルタを用いて、解析対象の信号を、異なるチャネルすなわち周波数成分に分離するシステムが挙げられる。そのようなフィルタセットは、概ね、生物学上の蝸牛と同じように動作するものであり、蝸牛は、異なる周波数チャネルに対応する一連のフィルタ出力信号を含む。
フィルタセットは、アナログフィルタとデジタルフィルタのいずれで実現されてもよい。従来のフィルタセットは、フィルタ設計の際の実際的な検討事項によって制限されていた。例えば、各チャネル出力を分離するための高次バンドパスフィルタを用いると、費用がかかる。ハイパスフィルタおよびローパスフィルタを用いて、様々な方法が実施されてきたが、音声認識、音声信号の音源分離、および音声信号のストリーム分離など、種々の重要な用途に対して、信号のリアルタイム処理を可能にする、より効率的な技術が必要とされている。
以下では、本発明の好ましい実施形態を詳細に説明する。本発明は、好ましい実施形態を用いて説明されているが、どの実施形態にも限定されないことを理解されたい。逆に、本発明の範囲は、添付の請求項によってのみ限定され、本発明は、数多くの代替、変形、および等価物を包含する。本発明の完全な理解を促すために、以下の説明では、例として数多くの具体的な詳細事項が示されている。本発明は、これらの具体的な詳細事項の一部またはすべてがなくとも、請求項に従って実施することができる。明確にするために、本発明に関連する技術分野で周知の技術事項については、本発明を不必要に不明瞭にしないよう、詳細に説明していない。
多くの特徴を備えた周波数解析のためのフィルタカスケードが以下に開示されている。様々な実施形態において、それらの特徴は、別個あるいは組み合わせて実現されている。例えば、一部の実施形態では、各周波数成分は、ローパスフィルタへの入力からその出力を減算することにより算出される。これにより、バンドパス信号が導出される。一部の実施形態では、ローパスフィルタは、チェーン接続、すなわちカスケード接続されており、各フィルタ出力は、フィルタセット内の次のフィルタ入力に供給される。フィルタセット内の最後のフィルタの出力はダウンサンプリングされ、フィルタセット自体は、全体としては1つの高次アンチエイリアスフィルタとして機能する。次いで、より低い周波数成分からなるダウンサンプリングされたフィルタセット出力は、より効率的に処理されてよい。カスケード内のフィルタは、フィルタのQ値が周波数と共に変化するよう設計されてよい。
予め参照として組み込まれた米国特許出願番号09/534,682(以後、「682出願」とする)は、周波数解析のためのデジタルフィルタカスケードを開示している。カスケード内のフィルタは、チェーン接続されており、複数組のフィルタは、オクターブに分けられ、オクターブ間のダウンサンプリングを行う。フィルタのパラメータは、異なるオクターブ内の対応する複数のフィルタ間で共有される。本明細書で説明するように、フィルタのパラメータが、オクターブ間でQ値すなわちフィルタの鋭度(シャープネス)を変更するようにオクターブ間で変更された場合に、利点を実現できる。一実施形態では、Q値は、実質的に臨界帯域幅に従って変更される。
図1は、入力信号を解析して複数の周波数成分に分離するために一実施形態で用いられるフィルタネットワークを示すブロック図である。入力信号100は、ローパスフィルタ(LPF)102に供給される。LPF102の出力は、減算器104によって入力信号100から減算される。したがって、ノード106における出力は、LPF102前後の信号の差分である。その出力は、入力信号の上限周波数の遮断がどのようなものであっても、LPF102の遮断周波数よりも高い周波数の帯域すなわちチャネルを強調する。LPF102の出力は、同様に、LPF112の入力に向けられ、LPF112の入力および出力の間の差分が、減算器114によって算出され、ノード116で出力される。ノード116の出力は、LPF102およびLPF112の遮断周波数の間の周波数を強調する別の周波数チャネルである。同様に、LPF122、LPF132、および減算器124、134は、ノード126および136において他の周波数チャネルを出力する。ノードの出力は、必要に応じてさらに処理されてよい。例えば、一部の実施形態では、それらの出力は半波整流され、一部の実施形態では、ダイナミックレンジを縮小または拡大するために、出力のゲインが調整される。
他の実施形態では、2次以上のデジタルまたはアナログフィルタを用いてもよい。フィルタの性質は、もちろん、一般に所与の周波数帯域を強調すると共に一般的なバンドパス特性を有する各チャネル出力の正確な性質を決定する。全体として、チャネル出力は、信号の周波数成分を示す。各LPFの入出力の減算のため、各チャネル出力は、周波数の帯域すなわちスライスを示し、すべての出力の和は、入力信号全体を示す。
各LPFの出力は、次のLPFの入力に供給され、ローパスフィルタのチェーンを形成するため、チェーン内の最後のLPFの出力は、最後のフィルタの次数よりもはるかに高次なフィルタの特性を有する。この高次フィルタ効果は、チェーン内の最後のフィルタの出力がダウンサンプリングされる場合に有効に利用することができる。基本的に、周波数チャネルを分離するために用いられるローパスフィルタのチェーンは、信号がダウンサンプリングされる際にアンチエイリアスフィルタの機能を実行する高次フィルタの機能を全体として実現する。
そのことの例は、ダウンサンプラ140がLPF132の出力をダウンサンプリングする図1に示されている。図示のために、4つのフィルタのみをチェーン内に示していることに注意されたい。ほとんどの実施形態では、ダウンサンプリングの前に周波数範囲を処理するために、5以上のフィルタが用いられる。ダウンサンプラ140から出力されたダウンサンプリング済みの信号は、次に、LPF142、LPF142、LPF142、およびLPF142を備える別のローパスフィルタのチェーンによって処理され、ノード146、156、166、および176において、減算器144、154、164、および174により、周波数チャネル出力が導出される。
一実施形態では、個々の2次のフィルタが用いられ、60のフィルタのチェーンが、ダウンサンプリングの前に信号の1オクターブを処理する。ダウンサンプリングは、すべての他のサンプルを単に切り捨てる方法や、それ以外の任意の適切な技術によって実行されてよい。ダウンサンプリングの量は、ナイキスト基準によって決定される。必要に応じて、適切な量のオーバーサンプリングが実行されてよい。フィルタのチェーンの複合的な効果は、非常に高次なアンチエイリアスフィルタの効果と等しい。したがって、信号のダウンサンプリングを実行することにより、高価な高次アンチエイリアスフィルタを用いることなく、より低い周波数オクターブの処理を高速化することができる。
ローパスフィルタをチェーン接続する利点は、一部の実施形態では、周波数帯域を算出するための減算器を用いることなく実現されることに注意されたい。各ローパスフィルタの出力は、各周波数チャネルにおけるエネルギを示すよう直接的に用いられてよい。各チェーン内の最後のフィルタの出力はダウンサンプリングされるため、フィルタチェーン自体は、1つのアンチエイリアスフィルタの機能を実行する。
図2は、ローパスフィルタが、それらの入出力においてチェーン接続されていない別の実施形態を示す図である。入力信号200は、ローパスフィルタ202、204、206、および208に供給される。各ローパスフィルタの入力と出力との間の差分は、減算器212、214、216、および218によって算出される。ここでも、算出された差分は、入力信号の周波数帯域すなわちチャネルの解析を示す。しかしながら、各フィルタの出力は、次のフィルタの入力に供給されないので、上述したチェーン内の最後のフィルタの出力において見られる高次フィルタ効果は、実現されない。
フィルタカスケードは、アナログフィルタとデジタルフィルタのどちらを用いて実現されてもよい。一実施形態では、フィルタは、所望のチャネル分解能を実現するよう設計された遮断周波数を有するデジタルフィルタとして実装される。各フィルタは、それに関連する1組の係数(a0、a1、a2、b1、b2)を有する。各フィルタの出力は、以下の関数に従って算出される:
Figure 2005518118
ここで、フィルタ出力ynは、時間nにおける入力データxn、以前の入力xn-1およびxn-2、および以前の出力yn-1およびyn-2の関数である。図3は、この信号の流れを示すブロック図である。フィルタの出力ynは、カスケード内の次のフィルタの入力xnに提供される。
フィルタ応答H(z)は、以下の式で与えられる:
Figure 2005518118
ここで、fsは、サンプリング周波数である。
式2の伝達関数に上記の代入を行うと、フィルタ係数a0、a1、a2、b1、b2、およびサンプリングレートfsの関数であるフィルタ応答H(f)が得られる。
682出願に記載されているように、フィルタ係数は、複数組のフィルタ間で再利用されてよく、その際、フィルタの応答は、複数組のフィルタの間のダウンサンプリングの結果として変更される。図の実施形態では、フィルタは、複数のオクターブにわたって一様に分配され、1オクターブ当たりのフィルタの数は60となっている。60のオブジェクトがコンピュータで作成される。各オブジェクトは、上述の1組の係数を有しており、さらに、1オクターブずつ離れた周波数で動作する10のフィルタに対応して、10組の状態変数を有する。第1の組の状態変数を用いる60のオブジェクトは、第1のオクターブ群のフィルタに対応し、第2の組の状態変数を用いる(そして、比較的低い周波数でサンプリングを行う)60のオブジェクトは、第2のオクターブ群のフィルタに対応し、以下も、同様に対応している。別の実施形態では、各オブジェクトは、1組の係数と、1組だけの状態変数とを備えており、単一の周波数で実行される。この場合、600のフィルタを表現するために、600のオブジェクトが必要となる。
第1のオクターブのフィルタは、最も高いオクターブ(すなわち、20kHzから10kHz)の周波数に調整され、44.1kHzでサンプリングされる。これは、ナイキストのサンプリング基準を満たしている。第2のオクターブのフィルタは、第1のオクターブ内の対応するフィルタの半分の周波数に調整され、10kHzから5kHzの範囲となる。第2のオクターブのフィルタは、22.05kHz、すなわち第1のサンプリング周波数の半分の周波数でサンプリングされる。各フィルタの係数は、メモリに格納され、フィルタのための計算で用いられる。カスケードの応答は、個々のフィルタの応答(それぞれは弱い応答であるが、合計すると、はるかに強い応答になる)の和である。フィルタの係数は、所望の応答によって決定される。
音声信号は、各フィルタに通されると、次のフィルタに供給される前にサンプリングおよびフィルタリングされる。図4は、フィルタの配列を示すブロック図である。最初のオクターブが終わると、信号は、上述のように第1のオクターブの半分のサンプリングレートでサンプリングを行うフィルタを備える次のオクターブの第1のフィルタに通される。連続的なオクターブが、同じ係数「2」を用いて同様にダウンサンプリングされる。この構成では、各段は、後ろの段のためのアンチエイリアスフィルタとして機能し、高周波数を十分に除去して、エイリアシングなしにダウンサンプリングを実行することを可能にする。余分なアンチエイリアスフィルタは必要にならない。
連続的なオクターブの各々をダウンサンプリングすると、システムの計算の複雑さが大幅に低減される。さらに、フィルタ係数に求められる精度が低くなるため、各係数を表現するために必要なビットが少なくなる。デジタルローパスフィルタは、フィルタ係数を表現するために必要な数値精度が、遮断周波数とサンプリング周波数との比で決まるという特徴を有する。所与のサンプリング周波数に対しては、低い遮断周波数を有するフィルタは、より高い遮断周波数を有するフィルタよりも精度の高い係数を必要とする。連続ダウンサンプリング技術を用いない場合には、44kHzのサンプリングレートで遮断周波数の最も低いフィルタ(30Hz)を表現するために、非常に精度の高いフィルタ係数(23ビットのオーダー)が必要になる。連続ダウンサンプリング技術を用いると、多くのダウンサンプリング工程の後に、最も低いオクターブにおいてサンプリングレートが非常に低くなるため、より低い精度の係数(12ビットのオーダー)を用いて、30Hzの遮断フィルタを表現することができる。このように精度が低減されることで、ハードウェアの複雑さが低減され(少ないメモリ、小さいレジスタ、精度の低い算術演算子)、カスタムハードウェアの実装におけるコスト全体が低減される。
682出願に記載された実施形態では、各フィルタが、1、2、またはそれ以上高いオクターブもしくは低いオクターブのフィルタとフィルタパラメータを共有することで、必要な記憶域を低減している。例えば、第1のオクターブに属する最も周波数の高いフィルタ40は、第2のオクターブに属する最も周波数の高いフィルタ50や、第3のオクターブに属する最も周波数の高いフィルタ60などとフィルタ係数を共有する。第1のオクターブに属する2番目に周波数の高いフィルタ42は、第2および第3のオクターブに属する2番目に周波数の高いフィルタ52および62、およびその他の対応するフィルタすべて(1、2、またはそれ以上低いオクターブの周波数に調整されたもの)と、フィルタ係数を共有する。
あるいは、以下で説明するように、各オクターブ内でフィルタパラメータを変えることにより、低周波数における遅延を改善できることが確認された。多くのシステムにとって、このことは、低周波数での遅延の改善による利点が、記憶装置の必要性の増大を相殺するため、異なるオクターブに属する対応するフィルタ間でフィルタパラメータを共有するのに好ましい。
一実施形態では、フィルタ係数は、フィルタによって処理される周波数帯域(周波数遮断によって決定されたもの)に応じて、所望のQ値(品質係数、すなわち、鋭度もしくは周波数選択度)を実現するよう調整される。カスケード内でフィルタ係数を再利用すると、カスケードのQ値が一定になり、フィルタ応答はすべて、同じ形状(Q値)を有することになる。この「定Q値」構成は、概念的に単純であることやフィルタ係数を共有するという利点を有するが、低周波数では大きな遅延を生じる。例えば、すべての周波数で4周期の位相の蓄積を有する定Q設計では、20kHzタップにおける遅延は、200μsであり、20Hzタップにおける遅延は、200msである。低周波数での動作が速いと、カスケードの応答時間を改善するのに好ましく、これは、低いオクターブにおけるフィルタのフィルタ係数を変更することにより実現できる。
図5は、極のみを有する2次のフィルタ応答の例を示す図である。フィルタは、時定数Tauおよび品質係数Qによって表現されてもよいし、前述したようにフィルタ係数b1およびb2によって表現されてよい。Tauは、中心周波数fcの逆数であって、ピークの位置を表すものであり、Q値は、ピークの鋭さを表すものである。図5からわかるように、Q値の値が高いほど、ピークは鋭くなり、fcはピークの生じる位置を示している。フィルタの式は、以下の通りである:
Figure 2005518118
Tau及びQ値と、b1及びb2との関係は、参照として本明細書に組み込まれる「Lyon’s Cochlear Model」、Apple Technical Report #13、Malcolm Slaney著、1988、に記載されている。フィルタのフィルタ係数は、中心周波数fc=1/TauおよびフィルタのQ値から決定することができる。
フィルタは、極だけでなくゼロ点を有するよう設計されてもよく、そのようなシステムのための式は、以下の通りである:
Figure 2005518118
図6は代表的なフィルタ応答の図であり、Qpは極のQ値を表し、Qzはゼロ点のQ値を、fcpは極の中心周波数(fpとも呼ぶ)を、fczはゼロ点の中心周波数(fzとも呼ぶ)を表す。ゼロ点は、ゲインの降下を停止し、位相を0に戻す。ゼロ点が極に近いほど、この効果は早く生じる。ゼロ点が極に非常に近い場合には、位相軌跡は、ゼロ点によって戻されるまでにあまり遠ざからない(1周期の内のほんの少し)ことがある。この特性は、カスケードを通しての位相の蓄積の総量、延いては、カスケードの遅延応答を抑制する鍵となる。
600個のフィルタを、極だけを有する600の部分のカスケードで用いる場合、各フィルタは、最良の周波数で1/4周期の位相の蓄積を引き起こし、その結果、多大な遅延が発生する。一実施形態では、フィルタカスケードは、中心周波数が、カスケードを通じて幾何級数的(exponentially)に減少するよう構成される。Q値は、カスケードを通じて徐々に減少し、遅延が問題とならない高周波数において鋭い応答を実現し、より早い応答の代償として、ある程度の鋭度の損失が許容される低周波数においては早い応答を実現する。Q値が一定ではないこの実施例は、例えば、潜水艦のパッシブソナー、音声認識、音楽の録音、音声ストリームの分離、および音声定位において用いられる信号処理システムに対して特に有効である。この方法は、ダウンサンプリングされたフィルタカスケードに限定されず、ダウンサンプリングされないフィルタカスケードで用いられてもよいことに注意されたい。
Q値の一定なフィルタカスケードの設計は、遮断周波数の範囲とオクターブ当たりのタップ数とを選択する工程(例えば、20Hzから20kHzまでの周波数範囲、600のタップおよび10のオクターブ(60タップ/オクターブ)を選択)を含む。これにより、各タップのfpが決定される。カスケードを通して所望される鋭度および遅延に基づいて、Qp、Qz、およびfratio=fz/fpに対して固定値が選択される。一実施形態では、定Q設計に用いられる値は、Qp=7.0、Qz=7.5、fratio=1.03であってよい。別の実施形態では、それらの値は、Qp=23、Qz=26、fratio=1.01であってよい。
10オクターブで600のタップを用いる可変Qフィルタカスケードについては、一実施形態は、最も高いオクターブにおける44.1kHzのサンプリングレートおよび2倍オーバーサンプリングと共に、以下の値を用いてよい:Qp=7.0、Qz=7.0、fratio=1.03。これらの値は、最初の360のタップに用いられ、次の240のタップについては、タップ600(周波数の最も低いタップ)における値、すなわちQp=1.6、Qz=1.6、fratio=1.1、に至るまで線形的に変更される。この結果、低周波数においてフィルタ応答が広く、時間応答が大幅に早い設計が実現される。
別の実施形態では、Qp、Qz、およびfratioパラメータは、適切な心理物理的臨界帯域幅およびラウドネス知覚曲線にフィルタ応答を適合させるよう選択される。臨界帯域幅は、フィルタ応答曲線の調整幅であり、その範囲内では、信号成分が、互いに相互作用することができる。臨界帯域幅曲線は、Rossing、1982、「The Science of Sound」(Addison−Wesley、Reading、MA)に記載されており、この開示は、参照として本明細書に組み込まれる。臨界帯域幅は、低周波数における100Hz弱から、高周波数における2半音と3半音(12%および19%)との間の周波数まで変化する。ラウドネス知覚は、異なる周波数に対するフィルタの感度を表す。例えば、20Hzにおける可聴閾値は、約65dBであり、1kHzにおける閾値よりも高い。
可変Qフィルタカスケードの一実施形態は、以下のパラメータを用いる:
Figure 2005518118
ただし、値の指定されているタップの間のパラメータについては、線形補間される。このように、パラメータが区分的に線形変化することにより、心理物理的な臨界帯域幅およびラウドネス知覚曲線との良好な適合が実現される。図7は、臨界帯域に従って設計されたフィルタに対するフィルタ応答を示す図である。フィルタ応答は、中周波数において鋭く、低周波数において広く、臨界帯域幅曲線に対応する。フィルタは、中周波数において比較的感度が高く、低周波数においては約65dBだけ感度が低く、ラウドネス知覚パラメータに適合している。
図8は、臨界帯域に従って設計されたフィルタに対する位相特性を示す図である。フィルタの位相特性は、中から高周波数において約2周期の位相の蓄積が存在するが、低周波数においてはあまり存在しないというものである。その結果、より早い応答が必要とされる低周波数において、応答が早くなる。
信号を周波数成分に分離して解析するためのフィルタカスケードを説明した。様々な実施形態において、フィルタカスケードは、異なる技術を用いて、高周波数における時間分解能と低周波数におけるスペクトル分解能とを改善する。したがって、開示されたフィルタカスケードの各実施形態は、音声認識システムの構成要素として特に有用である。さらに、フィルタカスケードは、音声ストリームの分離や音声定位に有用である。
図9Aは、本明細書に記載されたフィルタセットが音声認識システムで用いられる様子を示す図である。フィルタセット902に音声信号が入力され、特徴抽出部904によってフィルタセットの出力が解析される。特徴は、音素データベース908に含まれる音素と特徴とを一致させる音素分類部906によって分類される。単語データベース910にアクセスする単語検索ブロック909により、音素に基づいて単語が導き出される。
図9Bは、本明細書に記載されたフィルタセットが、音声ストリーム分離システムで用いられる様子を示す図である。音声ストリーム分離システムは、例えば、Lloyd Wattsにより2001年6月21日に提出された米国特許出願No.60/300,012(代理人整理番号ANSCP003+)「ROBUST HEARING SYSTEMS FOR INTELLIGENT MACHINES」に記載されているようなシステムであり、その出願は、参照として本明細書に組み込まれる。フィルタセット912に音声信号が入力され、特徴を抽出する1組の特徴抽出部914によってフィルタセットの出力が解析される。特徴は、特徴分類プロセッサ916によって、関連した音声信号の別個のストリームに分類される。
図9Cは、本明細書に記載されたフィルタセットが、空間相関器または音声定位システムで用いられる様子を示す図である。そのシステムは、例えば、Lloyd Wattsにより2001年11月14日に提出された米国特許出願No.10/004,141(代理人整理番号ANSCP005)「COMPUTATION OF MULTI−SENSOR TIME DELAYS」に記載されているようなシステムであり、その出願は、参照として本明細書に組み込まれる。右チャネル用フィルタセット922に右チャネル音声信号が入力され、左チャネル用フィルタセット924に左チャネル音声信号が入力される。フィルタセットの出力は、バイノーラルプロセッサ926によって相関され、左右のチャネル入力信号の間の時間遅延が決定される。音声の発生源の方向は、時間遅延から決定できる。
理解を深めるために、ある程度詳細に本発明について説明したが、添付の特許請求の範囲内で、ある程度の変更や変形を行ってもよいことは明らかである。本発明のプロセスおよび装置を実施する多くのほかの方法が存在することに注意されたい。 したがって、上述の実施形態は、例示のためのものであって限定を意図しないものと見なされ、本発明は、本明細書に記載された詳細事項に限定されず、添付の特許請求の範囲と均等物との範囲内で変形されてもよい。
入力信号を複数の周波数成分に分離して解析するために一実施形態で用いられるフィルタネットワークを示すブロック図。 ローパスフィルタが、それらの入出力においてチェーン接続されていない別の実施形態を示す図。 フィルタ方程式の信号フローのグラフ。 フィルタの配列を示すブロック図。 極のみを有する2次部分のフィルタ応答の例を示す図。 pが極のQ値、Qzがゼロ点のQ値、fcpが極の中心周波数(fpとも呼ぶ)、fczがゼロ点の中心周波数(fzとも呼ぶ)を表す代表的なフィルタ応答の図。 臨界帯域に従って設計されたフィルタに対するフィルタ応答を示す図。 臨界帯域に従って設計されたフィルタに対する位相特性を示す図。 本明細書に記載されたフィルタセットが音声認識システムで用いられる様子を示す図。 本明細書に記載されたフィルタセットが音声ストリーム分離システムで用いられる様子を示す図。 本明細書に記載されたフィルタセットが空間相関器または音声定位システムで用いられる様子を示す図。
符号の説明
40…フィルタ
42…フィルタ
50…フィルタ
52…フィルタ
60…フィルタ
62…フィルタ
100…入力信号
102…ローパスフィルタ
104…減算器
106…ノード
112…ローパスフィルタ
114…減算器
116…ノード
122…ローパスフィルタ
124…減算器
126…ノード
132…ローパスフィルタ
134…減算器
136…ノード
140…ダウンサンプラ
142…ローパスフィルタ
144…減算器
146…ノード
152…ローパスフィルタ
154…減算器
156…ノード
162…ローパスフィルタ
164…減算器
166…ノード
172…ローパスフィルタ
174…減算器
176…ノード
200…入力信号
202…ローパスフィルタ
204…ローパスフィルタ
206…ローパスフィルタ
208…ローパスフィルタ
212…減算器
214…減算器
216…減算器
218…減算器
902…フィルタセット
904…特徴抽出部
906…音素分類部
908…音素データベース
909…単語検索ブロック
910…単語データベース
912…フィルタセット
914…特徴抽出部
916…特徴分類プロセッサ
922…右チャネル用フィルタセット
924…左チャネル用フィルタセット
926…バイノーラルプロセッサ

Claims (25)

  1. 入力信号を解析して複数の周波数成分に分離する方法であって、
    前記信号を第1の組のローパスフィルタで処理して、第1の組の周波数成分を取得する工程であって、前記第1の組のローパスフィルタは、最初のローパスフィルタと最後のローパスフィルタとを有するチェーン内に直列に配置され、各ローパスフィルタの出力は、前記最後のローパスフィルタに至るまで、前記チェーン内の次のローパスフィルタに供給される、工程と、
    前記最後のローパスフィルタの出力をダウンサンプリングして、ダウンサンプリングされた信号を生成する工程と、
    前記ダウンサンプリングされた信号を第2の組のローパスフィルタで処理して、第2の組の周波数成分を取得する工程と、
    を備える、方法。
  2. 請求項1に記載の入力信号を解析して複数の周波数成分に分離する方法であって、前記周波数成分は、各ローパスフィルタへの入力から当該ローパスフィルタの出力を減算することにより取得される、方法。
  3. 請求項1に記載の入力信号を解析して複数の周波数成分に分離する方法であって、前記第2の組のローパスフィルタは、前記第1の組のローパスフィルタとは異なるQ値を有する、方法。
  4. 請求項1に記載の入力信号を解析して複数の周波数成分に分離する方法であって、前記第2の組のローパスフィルタは、前記第1の組のローパスフィルタよりも鋭度の低いQ値を有する、方法。
  5. 請求項1に記載の入力信号を解析して複数の周波数成分に分離する方法であって、前記第2の組のローパスフィルタは、実質的に人間の臨界帯域幅に従って、前記第1の組のローパスフィルタのQ値と異なるQ値を有する、方法。
  6. 入力信号を解析して複数の周波数成分に分離する方法であって、
    前記信号を第1のローパスフィルタで処理して、第1のローパスフィルタ信号を生成する工程と、
    前記入力信号から前記第1のローパスフィルタ信号を減算して、第1の周波数成分を取得する工程と、
    前記信号を第2のローパスフィルタで処理して、第2のローパスフィルタ信号を生成する工程と、
    前記第1のローパスフィルタ信号から前記第2のローパスフィルタ信号を減算して、第2の周波数成分を取得する工程と、
    を備える、方法。
  7. 入力信号を解析して複数の周波数成分に分離する方法であって、
    前記信号を第1のローパスフィルタで処理して、第1のローパスフィルタ信号を生成する工程と、
    前記入力信号から前記第1のローパスフィルタ信号を減算して、第1の周波数成分を取得する工程と、
    前記ローパスフィルタ信号を第2のローパスフィルタで処理して、第2のローパスフィルタ信号を生成する工程と、
    前記第1のローパスフィルタ信号から前記第2のローパスフィルタ信号を減算して、第2の周波数成分を取得する工程と、
    を備える、方法。
  8. 入力信号を解析して複数の周波数成分に分離する方法であって、
    前記信号の一部を第1の出力周波数チャネルに分離するよう構成されている第1のフィルタを用いて、前記信号を処理する工程と、
    前記信号の一部を第2の出力周波数チャネルに分離するよう構成されている第2のフィルタを用いて、前記信号を処理する工程と、
    を備え、
    前記第1の周波数チャネルは、前記第2の周波数チャネルよりも高い周波数を強調し、
    前記第2のフィルタは、前記第1のフィルタと異なるQ値を有する、方法。
  9. 請求項8に記載の入力信号を解析して複数の周波数成分に分離する方法であって、前記第2のフィルタは、前記第1のフィルタよりも鋭度の低いQ値を有する、方法。
  10. 請求項8に記載の入力信号を解析して複数の周波数成分に分離する方法であって、前記第2のフィルタは、実質的に人間の臨界帯域幅に従って、前記第1のフィルタのQ値と異なるQ値を有する、方法。
  11. 請求項8に記載の入力信号を解析して複数の周波数成分に分離する方法であって、前記フィルタは、ローパスフィルタである、方法。
  12. 入力信号を解析して複数の周波数成分に分離するためのシステムであって、
    第1の組の周波数成分を取得するよう構成された第1の組のローパスフィルタであって、前記第1の組のローパスフィルタは、最初のローパスフィルタと最後のローパスフィルタとを有するチェーン内に直列に配置され、各ローパスフィルタの出力は、前記最後のローパスフィルタに至るまで、前記チェーン内の次のローパスフィルタに供給される、第1の組のローパスフィルタと、
    前記最後のローパスフィルタの出力をダウンサンプリングして、ダウンサンプリングされた信号を生成するよう構成されたダウンサンプラと、
    前記ダウンサンプリングされた信号を処理して、第2の組の周波数成分を取得するよう構成された第2の組のローパスフィルタと、
    を備える、システム。
  13. 請求項12に記載の入力信号を解析して複数の周波数成分に分離するためのシステムであって、前記周波数成分は、各ローパスフィルタへの入力から当該ローパスフィルタの出力を減算することにより取得される、システム。
  14. 請求項12に記載の入力信号を複数の周波数成分に分離して解析するためのシステムであって、前記第2の組のローパスフィルタは、前記第1の組のローパスフィルタとは異なるQ値を有する、システム。
  15. 請求項12に記載の入力信号を複数の周波数成分に分離して解析するためのシステムであって、前記第2の組のローパスフィルタは、前記第1の組のローパスフィルタよりも鋭度の低いQ値を有する、システム。
  16. 請求項12に記載の入力信号を解析して複数の周波数成分に分離するためのシステムであって、前記第2の組のローパスフィルタは、実質的に臨界帯域に従って、前記第1の組のローパスフィルタのQ値と異なるQ値を有する、システム。
  17. 請求項12に記載の入力信号を解析して複数の周波数に分離するためのシステムであって、前記システムは音声認識システムで用いられるものである、システム。
  18. 請求項12に記載の入力信号を解析して複数の周波数に分離するためのシステムであって、前記システムは音声ストリーム分離に用いられるものである、システム。
  19. 請求項12に記載の入力信号を解析して複数の周波数に分離するためのシステムであって、前記システムは音声定位に用いられるものである、システム。
  20. 入力信号を解析して複数の周波数成分に分離するためのシステムであって、
    第1のローパスフィルタ信号を出力する第1のローパスフィルタと、
    前記入力信号から前記第1のローパスフィルタ信号を減算して、第1の周波数成分を取得するよう構成された第1のプロセッサと、
    第2のローパスフィルタ信号を出力する第2のローパスフィルタと、
    前記第1のローパスフィルタ信号から前記第2のローパスフィルタ信号を減算して、第2の周波数成分を取得するよう構成された第2のプロセッサと、
    を備える、システム。
  21. 入力信号を解析して複数の周波数成分に分離するためのシステムであって、
    第1のローパスフィルタ信号を出力する第1のローパスフィルタと、
    前記入力信号から前記第1のローパスフィルタ信号を減算して、第1の周波数成分を取得するよう構成された第1のプロセッサと、
    前記ローパスフィルタ信号を処理して、第2のローパスフィルタ信号を生成するよう構成された第2のローパスフィルタと、
    前記第1のローパスフィルタ信号から前記第2のローパスフィルタ信号を減算して、第2の周波数成分を取得するよう構成された第2のプロセッサと、
    を備える、システム。
  22. 入力信号を解析して複数の周波数成分に分離するためのシステムであって、
    前記信号を処理するよう構成された第1のフィルタであって、前記信号の一部を第1の出力周波数チャネルに分離するよう構成されている第1のフィルタと、
    前記信号を処理するよう構成された第2のフィルタであって、前記信号の一部を第2の出力周波数チャネルに分離するよう構成されている第2のフィルタと、
    を備え、
    前記第1の周波数チャネルは、前記第2の周波数チャネルよりも高い周波数を強調し、
    前記第2のフィルタは、前記第1のフィルタと異なるQ値を有する、システム。
  23. 請求項22に記載の入力信号を解析して複数の周波数成分に分離するためのシステムであって、前記第2のフィルタは、前記第1のフィルタよりも鋭度の低いQ値を有する、システム。
  24. 請求項22に記載の入力信号を解析して複数の周波数成分に分離するためのシステムであって、前記第2のフィルタは、実質的に臨界帯域に従って、前記第1のフィルタのQ値と異なるQ値を有する、システム。
  25. 請求項22に記載の入力信号を解析して複数の周波数成分に分離するためのシステムであって、前記フィルタは、ローパスフィルタである、システム。
JP2003568555A 2002-02-13 2003-02-11 周波数解析のためのフィルタセット Pending JP2005518118A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/074,991 US20050228518A1 (en) 2002-02-13 2002-02-13 Filter set for frequency analysis
PCT/US2003/004124 WO2003069499A1 (en) 2002-02-13 2003-02-11 Filter set for frequency analysis

Publications (1)

Publication Number Publication Date
JP2005518118A true JP2005518118A (ja) 2005-06-16

Family

ID=27732391

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003568555A Pending JP2005518118A (ja) 2002-02-13 2003-02-11 周波数解析のためのフィルタセット

Country Status (5)

Country Link
US (2) US20050228518A1 (ja)
EP (1) EP1474755A1 (ja)
JP (1) JP2005518118A (ja)
AU (1) AU2003216246A1 (ja)
WO (1) WO2003069499A1 (ja)

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8189766B1 (en) 2007-07-26 2012-05-29 Audience, Inc. System and method for blind subband acoustic echo cancellation postfiltering
US8194880B2 (en) 2006-01-30 2012-06-05 Audience, Inc. System and method for utilizing omni-directional microphones for speech enhancement
US8194882B2 (en) 2008-02-29 2012-06-05 Audience, Inc. System and method for providing single microphone noise suppression fallback
US8204253B1 (en) 2008-06-30 2012-06-19 Audience, Inc. Self calibration of audio device
US8204252B1 (en) 2006-10-10 2012-06-19 Audience, Inc. System and method for providing close microphone adaptive array processing
US8259926B1 (en) 2007-02-23 2012-09-04 Audience, Inc. System and method for 2-channel and 3-channel acoustic echo cancellation
US8345890B2 (en) 2006-01-05 2013-01-01 Audience, Inc. System and method for utilizing inter-microphone level differences for speech enhancement
US8355511B2 (en) 2008-03-18 2013-01-15 Audience, Inc. System and method for envelope-based acoustic echo cancellation
US8521530B1 (en) 2008-06-30 2013-08-27 Audience, Inc. System and method for enhancing a monaural audio signal
US8744844B2 (en) 2007-07-06 2014-06-03 Audience, Inc. System and method for adaptive intelligent noise suppression
US9008329B1 (en) 2010-01-26 2015-04-14 Audience, Inc. Noise reduction using multi-feature cluster tracker
US9076456B1 (en) 2007-12-21 2015-07-07 Audience, Inc. System and method for providing voice equalization
US9185487B2 (en) 2006-01-30 2015-11-10 Audience, Inc. System and method for providing noise suppression utilizing null processing noise subtraction
US9536540B2 (en) 2013-07-19 2017-01-03 Knowles Electronics, Llc Speech signal separation and synthesis based on auditory scene analysis and speech modeling
US9640194B1 (en) 2012-10-04 2017-05-02 Knowles Electronics, Llc Noise suppression for speech processing based on machine-learning mask estimation
US9799330B2 (en) 2014-08-28 2017-10-24 Knowles Electronics, Llc Multi-sourced noise suppression
US9820042B1 (en) 2016-05-02 2017-11-14 Knowles Electronics, Llc Stereo separation and directional suppression with omni-directional microphones
US9830899B1 (en) 2006-05-25 2017-11-28 Knowles Electronics, Llc Adaptive noise cancellation
US9838784B2 (en) 2009-12-02 2017-12-05 Knowles Electronics, Llc Directional audio capture
US9978388B2 (en) 2014-09-12 2018-05-22 Knowles Electronics, Llc Systems and methods for restoration of speech components

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4649859B2 (ja) * 2004-03-25 2011-03-16 ソニー株式会社 信号処理装置および方法、記録媒体、並びにプログラム
JP2006203850A (ja) * 2004-12-24 2006-08-03 Matsushita Electric Ind Co Ltd 音像定位装置
US20070253577A1 (en) * 2006-05-01 2007-11-01 Himax Technologies Limited Equalizer bank with interference reduction
US8934641B2 (en) 2006-05-25 2015-01-13 Audience, Inc. Systems and methods for reconstructing decomposed audio signals
US8849231B1 (en) 2007-08-08 2014-09-30 Audience, Inc. System and method for adaptive power control
US8150065B2 (en) 2006-05-25 2012-04-03 Audience, Inc. System and method for processing an audio signal
TWI421858B (zh) * 2007-05-24 2014-01-01 Audience Inc 用於處理音頻訊號的系統及方法
JP4375471B2 (ja) * 2007-10-05 2009-12-02 ソニー株式会社 信号処理装置、信号処理方法、およびプログラム
US8143620B1 (en) 2007-12-21 2012-03-27 Audience, Inc. System and method for adaptive classification of audio sources
US8774423B1 (en) 2008-06-30 2014-07-08 Audience, Inc. System and method for controlling adaptivity of signal modification using a phantom coefficient
EP3259927A1 (en) * 2015-02-19 2017-12-27 Dolby Laboratories Licensing Corporation Loudspeaker-room equalization with perceptual correction of spectral dips
KR20180088184A (ko) * 2017-01-26 2018-08-03 삼성전자주식회사 전자 장치 및 그 제어 방법

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3976863A (en) * 1974-07-01 1976-08-24 Alfred Engel Optimal decoder for non-stationary signals
US4536844A (en) * 1983-04-26 1985-08-20 Fairchild Camera And Instrument Corporation Method and apparatus for simulating aural response information
US4674125A (en) * 1983-06-27 1987-06-16 Rca Corporation Real-time hierarchal pyramid signal processing apparatus
GB2158980B (en) * 1984-03-23 1989-01-05 Ricoh Kk Extraction of phonemic information
GB8429879D0 (en) * 1984-11-27 1985-01-03 Rca Corp Signal processing apparatus
US5027410A (en) * 1988-11-10 1991-06-25 Wisconsin Alumni Research Foundation Adaptive, programmable signal processing and filtering for hearing aids
US5355329A (en) * 1992-12-14 1994-10-11 Apple Computer, Inc. Digital filter having independent damping and frequency parameters
US5473759A (en) * 1993-02-22 1995-12-05 Apple Computer, Inc. Sound analysis and resynthesis using correlograms
US6513004B1 (en) * 1999-11-24 2003-01-28 Matsushita Electric Industrial Co., Ltd. Optimized local feature extraction for automatic speech recognition
US6434417B1 (en) * 2000-03-28 2002-08-13 Cardiac Pacemakers, Inc. Method and system for detecting cardiac depolarization
US6915264B2 (en) * 2001-02-22 2005-07-05 Lucent Technologies Inc. Cochlear filter bank structure for determining masked thresholds for use in perceptual audio coding

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8345890B2 (en) 2006-01-05 2013-01-01 Audience, Inc. System and method for utilizing inter-microphone level differences for speech enhancement
US8867759B2 (en) 2006-01-05 2014-10-21 Audience, Inc. System and method for utilizing inter-microphone level differences for speech enhancement
US8194880B2 (en) 2006-01-30 2012-06-05 Audience, Inc. System and method for utilizing omni-directional microphones for speech enhancement
US9185487B2 (en) 2006-01-30 2015-11-10 Audience, Inc. System and method for providing noise suppression utilizing null processing noise subtraction
US9830899B1 (en) 2006-05-25 2017-11-28 Knowles Electronics, Llc Adaptive noise cancellation
US8204252B1 (en) 2006-10-10 2012-06-19 Audience, Inc. System and method for providing close microphone adaptive array processing
US8259926B1 (en) 2007-02-23 2012-09-04 Audience, Inc. System and method for 2-channel and 3-channel acoustic echo cancellation
US8886525B2 (en) 2007-07-06 2014-11-11 Audience, Inc. System and method for adaptive intelligent noise suppression
US8744844B2 (en) 2007-07-06 2014-06-03 Audience, Inc. System and method for adaptive intelligent noise suppression
US8189766B1 (en) 2007-07-26 2012-05-29 Audience, Inc. System and method for blind subband acoustic echo cancellation postfiltering
US9076456B1 (en) 2007-12-21 2015-07-07 Audience, Inc. System and method for providing voice equalization
US8194882B2 (en) 2008-02-29 2012-06-05 Audience, Inc. System and method for providing single microphone noise suppression fallback
US8355511B2 (en) 2008-03-18 2013-01-15 Audience, Inc. System and method for envelope-based acoustic echo cancellation
US8521530B1 (en) 2008-06-30 2013-08-27 Audience, Inc. System and method for enhancing a monaural audio signal
US8204253B1 (en) 2008-06-30 2012-06-19 Audience, Inc. Self calibration of audio device
US9838784B2 (en) 2009-12-02 2017-12-05 Knowles Electronics, Llc Directional audio capture
US9008329B1 (en) 2010-01-26 2015-04-14 Audience, Inc. Noise reduction using multi-feature cluster tracker
US9640194B1 (en) 2012-10-04 2017-05-02 Knowles Electronics, Llc Noise suppression for speech processing based on machine-learning mask estimation
US9536540B2 (en) 2013-07-19 2017-01-03 Knowles Electronics, Llc Speech signal separation and synthesis based on auditory scene analysis and speech modeling
US9799330B2 (en) 2014-08-28 2017-10-24 Knowles Electronics, Llc Multi-sourced noise suppression
US9978388B2 (en) 2014-09-12 2018-05-22 Knowles Electronics, Llc Systems and methods for restoration of speech components
US9820042B1 (en) 2016-05-02 2017-11-14 Knowles Electronics, Llc Stereo separation and directional suppression with omni-directional microphones

Also Published As

Publication number Publication date
US20050216259A1 (en) 2005-09-29
WO2003069499A9 (en) 2004-06-03
EP1474755A1 (en) 2004-11-10
US20050228518A1 (en) 2005-10-13
WO2003069499A1 (en) 2003-08-21
AU2003216246A1 (en) 2003-09-04

Similar Documents

Publication Publication Date Title
JP2005518118A (ja) 周波数解析のためのフィルタセット
KR102472420B1 (ko) 무선 주파수 신호의 스펙트럼을 검사하기 위한 방법 및 시스템
JP2002510930A (ja) 多重非相関化法を用いた未知の混在ソースの分離
WO2006120829A1 (ja) 混合音分離装置
US5963904A (en) Phoneme dividing method using multilevel neural network
CN108429995A (zh) 音响处理装置、音响处理方法以及存储介质
JP4462617B2 (ja) 音源分離装置,音源分離プログラム及び音源分離方法
CN107819453A (zh) 用于并行化和流水线化可调谐盲源分离滤波器的系统和方法
JP2021076831A (ja) 電子機器、方法およびコンピュータプログラム
JP2016143042A (ja) 雑音除去装置及び雑音除去プログラム
JP4705480B2 (ja) 高調波信号の基本周波数を求める方法
Do et al. Speech Separation in the Frequency Domain with Autoencoder.
Agcaer et al. Optimization of amplitude modulation features for low-resource acoustic scene classification
CN107919136B (zh) 一种基于高斯混合模型的数字语音采样频率估计方法
EP3853628A2 (en) Joint source localization and separation method for acoustic sources
Malek Blind compensation of memoryless nonlinear distortions in sparse signals
Muhsina et al. Signal enhancement of source separation techniques
RU2297049C2 (ru) Способ обратной фильтрации, способ синтезирующей фильтрации, устройство для обратной фильтрации, устройство для синтезирующей фильтрации и приспособления, содержащие такие фильтрующие устройства
Wager et al. Dereverberation using joint estimation of dry speech signal and acoustic system
Zeremdini et al. Multi-pitch estimation based on multi-scale product analysis, improved comb filter and dynamic programming
EP3036739A1 (en) Enhanced estimation of at least one target signal
Vimal Study on the behaviour of Mel frequency cepstral coffecient algorithm for different windows
Rahali et al. Robust Features for Speech Recognition using Temporal Filtering Technique in the Presence of Impulsive Noise
Singh et al. A novel algorithm using MFCC and ERB gammatone filters in speech recognition
Basir et al. Supervised Single Channel Source Separation Using U-Net