JP5091948B2 - ブラインド信号抽出 - Google Patents

ブラインド信号抽出 Download PDF

Info

Publication number
JP5091948B2
JP5091948B2 JP2009513548A JP2009513548A JP5091948B2 JP 5091948 B2 JP5091948 B2 JP 5091948B2 JP 2009513548 A JP2009513548 A JP 2009513548A JP 2009513548 A JP2009513548 A JP 2009513548A JP 5091948 B2 JP5091948 B2 JP 5091948B2
Authority
JP
Japan
Prior art keywords
signal
subband
sequence
input
signals
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2009513548A
Other languages
English (en)
Other versions
JP2009540344A (ja
Inventor
ネデルコ グルビック
イングヴァル クレソン
ペル エリクソン
Original Assignee
イーエックスオーディオ アクチボラゲット
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by イーエックスオーディオ アクチボラゲット filed Critical イーエックスオーディオ アクチボラゲット
Publication of JP2009540344A publication Critical patent/JP2009540344A/ja
Application granted granted Critical
Publication of JP5091948B2 publication Critical patent/JP5091948B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/03Synergistic effects of band splitting and sub-band processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R25/00Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R25/00Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
    • H04R25/40Arrangements for obtaining a desired directivity characteristic
    • H04R25/407Circuits for combining signals of a plurality of transducers

Landscapes

  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Quality & Reliability (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Noise Elimination (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Dc Digital Transmission (AREA)

Description

本発明は、望ましい電磁波信号、音波信号、又はあらゆる他の信号のうちの少なくとも1つを抽出し、他のノイズ及び干渉信号を抑制して、信号の混合物から強化された信号を生成する適応的方法に関する。更に、本発明は、本方法を実施する装置を説明する。
信号抽出(又は強化)アルゴリズムは、一般的に、1組の変換器/センサによって受信された受信信号の好ましいバージョンを作り出すと同時に他の不要なソース信号を減衰又は相殺することを目的とする。このアルゴリズムは、単一のセンサデータを演算して1つ又はいくつかの出力信号を生成することができ、又はそれは、複数のセンサデータを演算して1つ又はいくつかの出力信号を生成することができる。単一の抽出システムは、入力信号の変化に関わらず同じ特性を維持する不変の非適応的システムであるか、又は受信データの特性に基づいてその特性を変化させることができる適応的システムのいずれかとすることができる。フィルタリング演算は、構造パラメータの適応的部分を止めた時には、線形又は非線形のいずれかとすることができる。更に、演算は、2つの状態、すなわち、信号アクティブ及び信号非アクティブに依存する場合があり、すなわち、演算は、信号活性検出に依存している。
例えば、音声抽出に関して、ノイズのある環境における音声を再構成する時に物理的ドメインを認識し、従って、それを考慮する必要がある。これらのドメインは、例えば、音声ブースタ/スペクトル減算/TDMA(時分割多元接続)、及びその他において現れる時間選択性に関するものである。周波数選択性のドメインは、ウィナーフィルタリング/ノッチフィルタリング/FDMA(周波数分割多元接続)、及びその他を含む。空間選択性ドメインは、ウィナーBF(ビーム形成)/BSS(ブラインド信号分離)/MK(最大/最小尖度)/GSC(一般化サイドローブキャンセラ)/LCMV(線形限定最小分散)/SDMA(空間分割多元接続)、及びその他に関する。別の既存のドメインは、例えば、CDMA(符号分割多元接続)法を含む符号選択性ドメインであり、これは、実際には上述の物理的ドメインの組合せである。
いずれの科学的研究も知見も、ノイズのある環境において必要な信号を強化/抽出する時の時間選択性、周波数選択性、及び空間選択性を組み合わせることを未だにできていない。特に、このような組合せは、信号抽出が達成される環境に関する予めの仮定又は特別の知識なしには実施されてこなかった。従って、完全適応自動信号抽出は、当業者によって高く評価されると考えられる。
特に、完全自動信号抽出は、以下の問題、すなわち、センサ及びソースの相互幾何学的形状が未知であり変化すること、望ましいソースの数が未知であること、周囲のノイズソースが未知のスペクトル特性を有すること、センサ特性が理想的でなく経年変化をすること、複雑性による制限、高いノイズを想定した状態においても作動する必要性に直面している。
音声抽出の技術分野における先行文献には、「Computational Neurobiology Laboratory」、「The Salk Institute」、10010N.Torrey Pines Road、La Jolla、California 92037のAnthony J.Bell及びTerrence J.Sejnowski著「ブラインド分離及びブラインド畳み込み解除、情報−理論的方法」、0−7803−2431 45/95 $4.00 0 1995 IEEEがある。
ブラインド分離及びブラインド畳み込み解除は、教師なし学習の問題に関するものである。ブラインド分離においては、人々の異なる会話、音楽などは、行列によって線形に互いに混合される。ソース又は混合処理に関しては何も知られていない。受信されるものは、それらのN個の重ね合わせ、すなわち、x1(t)、x2(t)...、xN(t)である。この作業は、従って、未知の行列Aの逆行列の置換である正方行列Wを見つけることにより、元のソースを復元することである。この問題は、「カクテルパーティ」問題とも呼ばれる。
信号抽出の技術分野における別の先行文献は、JEAN−FRANCOIS CARDOSO著「ブラインド信号分離:統計法則」、「PROCEEDINGS OF THE IEEE」、VOL.86、NO.10、OCTOBER 1998に関するものである。
ブラインド信号分離(BSS)及び独立成分分析(ICA)は、観測された混合物(一般的に、センサのアレイの出力)から観測されていない信号又は「ソース」を復元することを目的とするアレイ処理及びデータ分析の新生の技術であり、信号間の相互独立性の仮定のみを利用している。この仮定が弱いことは、それを強力な手法にしているが、それは、あえて普通の2次統計量の域を超えることを必要とする。この論文の目的は、この問題に対処するために最近開発された手法の一部を精査して、それらが基本原理からどのように出てきたかを説明し、かつそれらが互いにどのように関連するかを示すことである。
BSS−ICA/PCA、ICAは、非線形PCAと同等であり、出力独立性/非相関に依存している。全信号ソースは、同時にアクティブである必要があり、信号を記録するセンサは、信号ソースの数に等しいか又はそれを超える必要がある。更に、既存のBSS及びその均等物は、低いノイズ環境でのみ作動可能である。
信号抽出の技術分野における更に別の先行文献は、Jourjine、A.;Rickard、S;Yzlmaz O.著「非同一直交信号のブラインド分離:2つの混合物からのN個のソースの脱混合」、「Proceedings in 2000 IEEE International Conference on Acoustics、Speech、and Signal Processing」、Volume 5、Page(s):2985−2988、5−9 June 2000に関するものである。
この科学論文において、著者は、2つの混合物のみを使用してあらゆる数のソースをブラインド分離する新しい方法を示している。この方法は、ソースが(W−)非同一直交である時、すなわち、混合物内のいずれか2つの信号の(ウィンドウ)フーリエ変換のサポートが互いに素な集合である時に適用される。この方法が、減衰しかつ遅延したソースの無響の混合物に関して、混合物の時間−周波数表示の比をクラスター化することによって混合パラメータを推定することを可能にすることが示されている。次に、混合パラメータの推定値を用いて1つの混合物の時間−周波数表示を分割し、元のソースを復元する。この技術は、ソースの数が混合物の数よりも大きい場合でさえ有効である。一般的な結果は、音声及び無線信号の両方で検証される。サンプル音声ファイルは、http://eleceng.ucd.ie/〜srickard/bss.htmlで見ることができる。
BSS−非同一直交脱混合は、センサ数><ソース数の場合の重複のない時間−周波数エネルギに依存している。これは、楽音、すなわち、信号の重大な歪みを取り込み、低いノイズ環境においてのみ作動する。
BSS−結合キュムラント対角化は、より高い次数のキュムラント行列を対角化し、センサは、ソースの数よりも大きいか又は等しくなる必要がある。これに関する問題は、その収束の遅さであり、並びにこれは、低いノイズ環境においてのみ作動する。
信号抽出の技術分野における更に別の先行文献は、Koutras、A.;Dermatas、E.著「ブラインド音声抽出を使用した高干渉の現実の部屋環境におけるロバストな音声認識」、「Proceedings in 2002 14th International Conference on Digital Signal Processing」、Volume 1、Page(s):167−171、2002に関するものである。
この論文は、干渉非音声ソースの同時共存の下で現実の部屋環境においてロバストな音声認識を行う新しい「ブラインド信号抽出(BSE)」法を示している。この提案された方法は、最大尖度基準に基づいてターゲット話者の音声を抽出することができる。広範囲の音素認識実験は、様々な非音声ソース(例えば、音楽及びノイズ)の共存状態にある音声者の現実生活状況において使用された時の提案されたネットワークの効率性を証明し、特に高い干渉の下では約23%の音素認識改善を達成した。更に、類似の状況において一般的に使用される公知の「ブラインドソース分離(BSS)」ネットワークとの提案されたネットワークの比較は、計算の複雑性がより低いこと及びBSEネットワークの認識精度がより良いことを示し、それが既存のASR(自動音声認識)システムに対するフロントエンドとして使用されることを理想的にしている。
最大尖度基準は、最大の尖度、かつセンサ数><ソース数の状態で単一ソースを抽出する。この抽出の難しさは、いくつかのスピーカを操作することに関し、かつこれは、低いノイズ環境においてのみ作動する。
信号認識の技術分野における更に別の先行文献は、Amr El−Keyi、Thiagalingam Kirubarajan、及びAlex B.Gershman著「カルマンフィルタに基づくロバストな適応ビーム形成」、「IEEE TRANSACTIONS ON SIGNAL PROCESSING」、VOL.53、NO.8、AUGUST 2005に関するものである。
この論文は、ロバストな最小分散歪みなし応答(MVDR)ビーム形成器を実施するための新しい手法を示している。このビーム形成器は、最悪の場合の性能最適化に基づいており、望ましい信号誘導ベクトルにおける任意であるがノルム有界の不整合に対して優れたロバスト性を提供するように示されている。しかし、この問題を解決する既存のアルゴリズムは、計算効率の良い直接オンライン実装を持たない。この論文において、限定カルマンフィルタに基づき、低計算コストのオンラインで実施することができるロバストなMVDRビーム形成器に関する新しいアルゴリズムが開発されている。このアルゴリズムは、ロバストなMVDRビーム形成器の元の2次円錐プログラミング(SOCP)ベースの実施のものに類似した性能を有することが示されている。また、付加的に非定常環境に対処する提案されたアルゴリズムの2つの改良された修正も示されている。これらの修正は、急速な(急激な)環境変化に対してビーム形成器のロバスト性を更に改良するモデル交換及び仮定統合技術に基づいている。
Anthony J.Bell及びTerrence J.Sejnowski著「ブラインド分離及びブラインド畳み込み解除、情報−理論的方法」、0−7803−2431 45/95 $4.00 0 1995 IEEE JEAN−FRANCOIS CARDOSO著「ブラインド信号分離:統計法則」、「PROCEEDINGS OF THE IEEE」、VOL.86、NO.10、OCTOBER 1998 Jourjine、A.;Rickard、S;Yzlmaz O.著「非同一直交信号のブラインド分離:2つの混合物からのN個のソースの脱混合」、「Proceedings in 2000 IEEE International Conference on Acoustics、Speech、and Signal Processing」、Volume 5、Page(s):2985−2988、5−9 June 2000 Koutras、A.;Dermatas、E.著「ブラインド音声抽出を使用した高干渉の現実の部屋環境におけるロバストな音声認識」、「Proceedings in 2002 14th International Conference on Digital Signal Processing」、Volume 1、Page(s):167−171、2002 Amr El−Keyi、Thiagalingam Kirubarajan、及びAlex B.Gershman著「カルマンフィルタに基づくロバストな適応ビーム形成」、「IEEE TRANSACTIONS ON SIGNAL PROCESSING」、VOL.53、NO.8、AUGUST 2005 http://eleceng.ucd.ie/〜srickard/bss.html
ブラインドビーム形成は、センサ数><ソース数である従来のビーム形成(MVDRのような)と共に受動スピーカ局在化に依存している。これに関する問題は、それが受動局在化により低ノイズ環境においてのみ作動することである。
本発明の基礎をなす概念の作業名は、「ブラインド信号抽出(BSE)」である。図及び説明は、例及びその実施形態として音声強化を含むが、本発明は、音声強化それ自体に限定されず、電磁信号並びに振動を含む音などの検出及び強化も含む。
本発明によるBSEの適応演算は、信号の混合物から1つ又はそれよりも多くの望ましい信号を、それらが一部の個別のパラメータ(尺度)により、例えば、統計的特性、統計的確率分布関数(pdf)の形状、及び望ましい信号の時間又は周波数などにおける位置により空間的又は時間的に典型的に区別することによって分離される場合に区別することに依存している。望ましい信号以外の統計的確率分布関数の形状のような異なる個別のパラメータ(尺度)を伴った信号は、適応演算出力において有利に働かないことになる。BSEにおけるソース信号抽出の原理は、望ましい信号の統計的分布関数(pdf)の形状のようなパラメータが、不要な信号の統計的確率分布関数の形状のようなパラメータとは異なるという条件で、統計的確率分布関数のようなあらゆる種類の個別のパラメータ(尺度)に対して有効である。これは、pdfのような異なるパラメータを有するいくつかのソース信号を本発明によってセンサへの同じ入力と同時に抽出することができるような方法でいくつかの並行BSE構造を実装することができることを意味している。
本発明は、センサ及びソースの相互幾何学形状が未知であり変化すること、音声ソースの数が未知であること、周囲のノイズソースが未知のスペクトル特性を有すること、センサ特性が理想的でなく経年変化をすること、複雑性による制限、高いノイズを想定した状態でも作動する必要性などの例えば完全自動音声抽出のような問題、及び上述の問題を解決することを目的とする。従って、音声抽出の場合には、本発明は、話者に独立の音声特性(統計的分布の形状)だけに基づいて、全ての異なる音声ソース信号を抽出する方法及び装置を提供する。
本発明のBSEは、時間選択性ドメイン及び/又は空間的ドメイン及び/又は時間的ドメインにおいて演算することができてあらゆる数(>0)の変換器/センサに対して演算することができる適合アルゴリズムであるような少数の望ましい特性を提供し、その演算は、信号活性検出に依存しない。更に、ソース及び/又はセンサ相互幾何学形状の予備の知識は、BSEの演算には要求されず、その演算は、較正された変換器/センサアレイを必要としない。BSE演算の別の望ましい特性は、それがソースの統計的独立性又は生成出力の統計的非相関に依存しないことである。
更に、BSEは、実際の環境から抽出したいかなる予め記録したアレイ信号又はパラメータ推定値も必要とせず、実際のソースから抽出したいかなる信号又はパラメータ推定値にも依存しない。BSEは、正並びに負のSNIR(信号対ノイズプラス干渉比)環境において首尾よく演算することができ、その演算は、受信信号の残響除去を含む。
上述及びその他の利点を達成するために、本発明は、望ましい電磁波信号、音波信号、又はあらゆる他の信号のうちの少なくとも1つを抽出してノイズ及び干渉信号を抑制し、信号の混合物から強化された信号を生成する適応的方法を説明する。従って、本方法は、連続時間及びそれに対応する離散的時間の望ましい信号の少なくとも一方が、統計的特性、それらの統計的確率密度関数(pdf)の形状、及び時間又は周波数における位置のような1つ又はそれよりも多くの個別のパラメータによって予め定められる段階と、望ましい信号パラメータが、ノイズ又は干渉ソース信号パラメータとは異なる段階と、望ましい信号、ノイズ及び干渉信号からの受信信号データが、この目的のための少なくとも1つの適切なセンサ手段を通して集められ、連続時間又は相応の離散的時間を利用する入力信号をサンプリングし、離散的時間入力信号のタイムフレームを生成する段階と、信号データを1組のサブバンドに変換する段階と、望ましい信号がノイズ及び干渉信号よりも少なく減衰させられる方法で、全ての混合信号に関する各サブバンドにおける各タイムフレームの入力信号を減衰させる段階、及び望ましい信号が増幅され、かつノイズ及び干渉ソース信号よりも大きく増幅される方法で、全ての混合信号に関する各サブバンドにおける各タイムフレームの入力信号を増幅する段階の少なくとも一方と、フィルタリングされた入力信号と変換された出力信号の間の誤差基準が最小にされるように、各サブバンドにおける各タイムフレームの入力信号に関するフィルタ係数を更新する段階と、サブバンド信号が、所定の組のサブバンドフィルタによってフィルタリングされ、所定の数の出力信号を生成し、それらの各々が、その個別のパラメータに基づいて望ましい信号に有利に働く段階と、出力サブバンド信号を逆変換によって再構成する段階とを含む。ここでの用語「バンド幅」は、一般的には全バンド幅を指すが、全バンド幅よりも少し狭いバンド幅も含まれる。
本発明の一実施形態では、変換する段階は、デジタル表現において利用可能な信号が、より小さいか又は等しい帯域幅のサブバンド信号に分割されるような変換を含む。
本発明の一実施形態では、混合物内の異なる信号間で区別するためのパラメータは、pdfに基づいている。
本発明の別の実施形態では、受信信号データは、それがアナログである時はデジタル形式に変換される。
別の実施形態は、出力信号が必要な時にアナログ信号に変換されることを含む。
更に別の実施形態は、減衰/増幅処理による信号レベルの変化に起因して出力信号レベルが補正されることを含む。
更に別の実施形態は、フィルタ係数のノルムが、最小値と最大値の間の制限値に限定されることを含む。
更に別の実施形態は、フィルタ係数増幅が、フィルタ係数のノルムが最小許容値よりも低い時に達成され、フィルタ係数減衰が、フィルタ係数のノルムが最大許容値よりも高い時に達成されることを含む。
更に別の実施形態は、減衰又は増幅が、各サブバンドにおけるフィルタ係数が時間選択性ドメインにおいて、及び時間的並びに空間的ドメインにおいて望ましい信号を強化するようにブラインド適応されるという原理を導くことを含む。
更に、本発明は、望ましい電磁波信号、音波信号、又はあらゆる他の信号のうちの少なくとも1つを適応的に抽出し、ノイズ及び干渉信号を抑制して、信号の混合物から強化された信号を生成する装置を説明する。従って、本装置は、望ましい信号の個別のパラメータと、不要な信号、すなわち、ノイズ及び干渉ソース信号のパラメータの間の差異を説明する所定の特性を捕らえるようになった1組の非線形関数と、望ましい信号、ノイズ及び干渉信号から信号データを集め、連続時間又は相応の離散的時間を利用する入力信号をサンプリングし、離散的時間入力信号のタイムフレームを形成するようになった少なくとも1つのセンサと、信号データを1組のサブバンドに変換するようになった変換器と、望ましい信号が、ノイズ及び干渉信号よりも少なく減衰させられる方法で、全ての信号に関する各サブバンドにおいて各タイムフレームの入力信号を減衰させるようになった減衰器と、望ましい信号が増幅され、かつノイズ及び干渉信号よりも大きく増幅される方法で、全ての信号に関する各サブバンドにおいて各タイムフレームの入力信号を増幅するようになった増幅器と、線形にフィルタリングされた入力信号と非線形に変換された出力信号の間の誤差基準が最小にされるように更新されるようになった、各サブバンドにおける各タイムフレームの入力信号に関する1組のフィルタ係数と、所定の数の出力信号を生成し、それらの各々が個別のパラメータによって与えられた望ましい信号に有利に働く所定の組のサブバンドフィルタによってサブバンド信号がフィルタリングされるようになったフィルタと、出力サブバンド信号に逆変換を実行するようになった再構成手段とを含む。
本発明の実施形態では、変換器は、デジタル表現において利用可能な信号がより小さいか又は等しい帯域幅のサブバンド信号に分割されるように信号データを変換するようになっている。
装置は、添付の従属装置請求項の組から明らかなように、上述の方法に関する実施形態を実施するようになっていることが認められる。
BSEは、これ以降、音声信号が望ましい信号であり、ノイズ及びその他の干渉信号が不要なソース信号である音波伝播における音声強化に関して概略的に説明する。
これ以降、本発明のより良い理解のために、与えた実施例及び説明する実施形態と共に添付の図面を参照する。
従来技術の音声及びノイズに関する2つの設定を概略的に示す図である。 従来技術の時間選択性の例を概略的に示す図である。 従来技術の時間選択性の例を概略的に示す図である。 従来技術の時間選択性の例を概略的に示す図である。 従来技術により時間的選択性がデジタルフィルタを利用することによってどのように取り扱われるかの例を概略的に示す図である。 従来技術の空間選択性を概略的に示す図である。 従来技術の空間選択性を概略的に示す図である。 図4aの空間選択性による結果として生じた2つの信号を概略的に示す図である。 図4bの空間選択性による結果として生じた2つの信号を概略的に示す図である。 従来技術により音声信号が空間的に3つのマイクロフォンによってどのように集められるかを概略的に示す図である。 本発明によるブラインド「信号抽出」タイムフレームの図式的外観を概略的に示す図である。 本発明による信号分解タイムフレーム図式を概略的に示す図である。 本発明による出力を変換ドメインにおいて生成するために実行されるフィルタリングを概略的に示す図である。 本発明による出力を生成するための逆変換を概略的に示す図である。 本発明によりフィルタ係数のアレイを利用することによる時間、時間的及び空間的選択性を概略的に示す図である。 本発明により時間的ドメインにおいて不要な信号のpdf:sから望ましい信号のpdf:sをフィルタリングするBSEの図式的な図を概略的に示す図である。 本発明により時間的ドメインにおいて不要な信号のpdf:sから望ましい信号のpdf:sをフィルタリングするBSEの図式的な図を概略的に示す図である。 本発明により時間的ドメインにおいて不要な信号のpdf:sから望ましい信号のpdf:sをフィルタリングするBSEの図式的な図を概略的に示す図である。 本発明により望ましい信号をフィルタリングする図式的な図を概略的に示す図である。
本発明は、基本原理、演算、及びアルゴリズムパラメータの表記/選択に関して、本発明によるBSE(ブラインド信号抽出)を説明する。従って、本発明は、望ましいソース信号とノイズ及びその他の干渉信号のような不要なソース信号の間の確率密度関数の形状の差異に基づいてのみ、添付した図に音声ソースとして例示した全ての望ましい信号を抽出する方法及び装置を提供する。
BSEは、時間選択性ドメイン及び/又は空間的ドメイン及び/又は時間的ドメインにおいて演算することができ、あらゆる数(>0)の変換器/センサに対して演算することができ、その演算は、信号活性検出に依存しない適合アルゴリズムであるような少数の望ましい特性を提供する。更に、ソース及び/又はセンサ相互幾何学形状の予備知識は、BSEの演算には要求されず、その演算は、較正された変換器/センサアレイを必要としない。BSE演算の別の望ましい特性は、ソース信号の統計的独立性又は生成出力信号の統計的非相関に依存しないことである。
更に、BSEは、現実の環境から抽出したいかなる予め記録したアレイ信号又はパラメータ推定値も必要とせず、実際のソースから抽出したいかなる信号又はパラメータ推定値にも依存しない。BSEは、正及び負のSNIR(信号対ノイズプラス干渉比)環境において首尾よく演算することができ、その演算は、受信信号の残響除去を含む。
本発明のBSE方法及び装置に関する多くの用途が存在する。BSE演算は、異なる信号抽出用途に使用することができる。これらは、限定ではないが、例えば、パーソナル電話、携帯及び静止のパーソナル無線装置、補聴器、会議のための電話、ノイズのある環境におけるパーソナル通信用装置のような空中音場における信号強化を含み、すなわち、この装置は、次に、聴覚保護及び医療超音波分析手段と組み合わされる。
BSEの別の用途は、例えば、宇宙観測のための望遠鏡アレイ、無線、無線探知測距(レーダ)、医療分析手段のような電磁場における単一の強化に関する。
更に別の用途は、例えば、音響水中通信、音波による航行及び測距(ソナー)のような音響水中場における信号強化の特徴を有する。
更に、例えば、地震検出及び予測、火山分析、機械振動分析のような振動場における信号強化は、その他の可能な用途である。
別の可能な適用分野は、津波検出、海流分析、海温分析、海水塩分分析のような海の波の場における信号強化である。
図1は、従来技術の音声及びノイズに関する2つの設定を示している。図1の上半分は、マイクロフォン12を指すように示す短距離からのノイズの混じったマイクロフォン/センサ/変換器12によって記録される音ソース10を示している。従って、音声+ノイズは、マイクロフォン12によって記録され、SN比(SNR)は、SNR=x[dB]に等しい。図1の下半分は、マイクロフォン/センサ/変換器12から距離Rにおいて記録され抽出される音ソースとしての人10を示している。ここで、記録される音は、α・音声+ノイズであり、α2は、1/R2に比例し、SNRは、x+10・log10α2[dB]に等しい。
図2a〜図2cは、従来技術の時間選択性の異なる例を概略的に示している。マイクロフォン12は、ノイズが付加された望ましいソース信号を含むx(t)を観測している。図2aは、音声の存在下でスイッチがオンし、他の全ての期間においてスイッチがオフになることができるスイッチ14を示している。図2bは、1と0の間のあらゆる値を有することができる乗法関数α(t)を示している。この値は、音声信号の活動パターンによって制御することができ、従って、適応ソフトスイッチになる。
図2cは、各スイッチが個々の狭帯域サブバンド信号に対して作動する適応ソフトスイッチの組の前のフィルタバンク変換を示している。次に、結果として生じたサブバンド出力は、出力信号を生成するために合成フィルタバンクによって再構成される。
図3は、従来技術により時間的選択性、すなわち、時間的に異なる周期性を有する信号がその違いに応じてどのように取り扱われるか、かつデジタルフィルタ30を利用することによって処理される例を概略的に示している。このフィルタは、シンボルz-1で示す単位遅延演算子を適用する。この演算子は、連続するデジタル値に演算する時、その連続における前の値を提供する。従って、この演算子は、事実上、1サンプリング間隔の遅延を導く。演算子z-1を入力値(xn)に適用することにより、前の入力(xn-1)が与えられる。フィルタ出力y(n)は、図3の公式によって説明される。パラメータak及びbkの適切な選択により、デジタルフィルタの特性が決定される。
図4a及び図4bは、従来技術の空間選択性に関する問題を概略的に示し、図5a及び図5bは、図4a及び図4bの空間選択性による結果として生じた2つの信号を、概略的に示している。
図4a及び図4bの矢印は、信号ソースから2つのマイクロフォン12の前に向う方向における2つの等しい波40、42の伝播と、マイクロフォン12に対して角度がある2つの等しい波44、46の伝播とを示している。図4aにおいて、マイクロフォンの前の空間的方向における波は、同位相である。波40、42が同位相で、かつ同じ周波数で同じ距離から送信された時には、集められた信号の振幅は、両振幅の合計まで増加し、ここで図5aに示すような波40、42の2倍の振幅の出力信号を提供する。
図4bにおける2つの波44、46も同位相であるが、各マイクロフォン12に到達するのに半波長の差を伝播する必要があり、従って、図5bに示すように、2つの波が加えられた時には互いに打ち消しあう。
図4a〜図4b及び図5a〜図5bの簡単な例は、望ましい信号が抽出される時に直面する問題の概要を提供する。例えば、音声及びノイズ、時間的選択性及び時間選択性、ソースからマイクロフォン12までの異なる距離、並びに複数の周波数という現実の問題は、現実の環境から抽出したいかなる予め記録したアレイ信号又はパラメータ推定値も必要とせず、実際のソースから抽出したいかなる信号又はパラメータ推定値にも依存しないBSE法を提供することがいかに困難かつ重要であるかを示している。
図6は、音声信号が、マイクロフォン12が上述の全てのドメインにおいて音声及びノイズの両方から信号を拾う全ての方向から3つのマイクロフォンによって空間的に集められる方法を概略的に示している。
ここで図7を参照すると、この図は、本発明によるブラインド信号抽出タイムフレームの図式的外観を概略的に示している。BSE70は、変換器/センサ/マイクロフォン12を使用して物理波伝播場から空間的にサンプリングされた数「I」個の入力信号に対して演算し、別の物理波伝播場が作られるように、逆変換器/逆センサの組を通る数P個の出力信号を生成する。生成された波伝播場は、望ましい信号レベルが不要な信号の信号レベルよりも著しく高いという事実によって特徴付けられる。生成された波伝播場は、空間的にサンプリングされた元の波伝播場の空間的特性を保つことができ、又は元のソースがそれらの現実の物理的位置に関して異なる位置から発生する時に元のソースが現れるように空間的特性を変えることができる。
本発明のBSE70は、上述のように作動し、従って、ブラインド信号抽出(BSE)演算1つの目的は、対応する確率密度関数(pdf:s)を有する望ましいソースから部分的に又は全体的に発生する強化された信号を生成しながら、対応するpdf:sを有する不要なソースから部分的に又は全体的に発生する信号を減衰させ又は相殺することである。これが起こるための要件は、不要なpdfの形状が望ましいpdfの形状と異なることである。
図8は、本発明による信号分解タイムフレーム図式を概略的に示している。受信データx(t)は、変換器/センサ12の組によって集められる。受信データが実際にアナログである時、アナログ−デジタル変換(ADC)12によってデジタル形式に変換される(これは、以下に説明する方法/処理/アルゴリズムのステップ1で達成される)。次に、以下に説明する処理のステップ2で、このデータは、変換によってサブバンドxi (k)(n)に変換される。この変換82は、デジタル表現において利用可能な信号がより小さい(又は等しい)帯域幅のサブバンド信号xi (k)(n)に分割されるようにする。これらのサブバンド信号は、それに対応して、サブバンドフィルタ90の組によってフィルタリングされ、以下に説明する処理のステップ3〜ステップ9で、出力信号の各々が特定のpdf形状を有する信号に有利に働くようないくつかの加算92されたサブバンド信号出力信号yp (k)(n)を生成する。
図10に示すように、これらの出力信号yp (k)(n)は、以下に説明する処理のステップ10で、逆変換100によって再構成される。アナログ信号が必要な時は、以下に説明する処理のステップ11で、デジタル−アナログ変換(DAC)102を実行する。
図11によって与えた例のように、演算の核は、各ステップにおいて、すなわち、各タイムフレームの入力データ110に関して、多重チャンネルサブバンド変換ステップに続いて、フィルタ係数のアレイとして示したフィルタ係数112は、各サブバンドにおいて更新され、全ての信号が減衰され、及び/又は増幅されるようにする。114において、出力信号は、逆変換によって再構成される。
全ての信号が減衰させられる場合には、望ましい形状のpdfを有する信号が他の全ての信号よりも少なく減衰させられる方法でこのステップは達成される。全ての信号が増幅される場合には、望ましい形状のpdfを有する信号が他の全ての信号よりも大きく増幅される。これは、各サブバンドのフィルタ係数が、時間選択性ドメイン、時間的ドメイン及び空間的ドメインにおいて対応するpdfの形状によって決定されるいくつかの信号を強化するようにブラインド適応する原理をもたらす。
不要なpdfの形状が望ましい信号のpdfと著しく異なる時、それに対応する減衰/増幅は、著しく大きくなる。これは、望ましいpdfから更に遠いpdfを有するソースが、変更されるより大きい自由度(アテンション)を受ける原理をもたらす。減衰/増幅は、ステップ3〜ステップ4において実行される。出力信号が望ましい形状のpdfに近づくように生成される時、誤差基準(ステップ4)は、より小さくなる。従って、最適化は、各出力信号に関する誤差基準を最小にするように達成される。次に、フィルタ係数は、ステップ5において更新される。減衰/増幅処理に由来する信号レベルの変化による出力信号のレベルを補正する必要性も存在する。これは、ステップ6及びステップ7において実行される。各サブバンドは、上述の方法によって更新されるので、各サブバンドは、不要な信号エネルギのより大きい寄与を伴ったサブバンドがより大きく減衰させられるスペクトルフィルタリングを自動的をもたらす。
フィルタ係数が限定されずに残っている時は、フィルタ係数は、0に向って降下する可能性があり、又は制御されずに大きくなる可能性がある。従って、最小ノルム値と最大ノルム値の間の制限値によってフィルタ係数を限定することが必要である。この目的のために、フィルタ係数ノルムが最小許容値よりも小さい時に、フィルタ係数増幅が実行され(全体的抽出)、フィルタ係数のノルムが最大許容値よりも大きい時に、フィルタ係数減衰が実行される(全体的収縮)。これは、アルゴリズムのステップ8及びステップ9において実行される。
本発明のBSE方法/処理において利用される定数は、以下の通りである:
I:演算に利用可能な変換器/センサの数を示している(iによって指標付けされる)
K:変換されたサブバンド信号の数を示している(kによって指標付けされる)
P:生成された出力信号の数を示している(pによって指標付けされる)
n:離散化された時間指数を示している(すなわち、実時間t=nT、ここでTはサンプリング周期である)
i:各サブバンドフィルタの長さを示している
Levelp:出力番号pにおいて望ましい出力信号レベルを維持するために使用されるレベル補正項を示している
λ1及びλ2:フィルタ係数更新重みパラメータを示している
1:全体的抽出に対するより低いレベルを示している
2:全体的収縮に対するより高いレベルを示している
利用される関数は、以下の通りである:
p (k)(・)−1組の非線形関数を示している
1 (k、p)(・)−1組のレベル増加関数を示している
2 (k、p)(・)−1組のレベル減少関数を示している
利用される変数は、以下の通りである:
i、n (k、p)(l)−時刻nにおいて有効な係数の長さLiのシーケンス(フィルタ)を示している
Figure 0005091948
−時刻nにおいて有効な係数の長さLiの中間シーケンス(フィルタ)を示している
Δhi、n (k、p)(l):時刻nにおいて有効な(補正)係数の長さLiのシーケンスを示している
Figure 0005091948
−時刻nにおいて有効な(補正)係数の長さLiの中間シーケンスを示している
信号は、以下のように示す:
・受信変換器/センサ入力信号
i(t)、i=1、...I
・サンプリングされた変換器/センサ入力信号
i(n)、i=1、...I
・変換されたサンプリングサブバンド入力信号
Figure 0005091948
ここで使用された変換は、あらゆる周波数選択変換、例えば、短時間ウィンドウFFT、ウェーブレット変換、サブバンドフィルタバンク変換などとすることができる。
・変換されたサンプリングサブバンド出力信号
Figure 0005091948
中間信号:
Figure 0005091948
・逆変換出力サンプリング信号
p(n)、p=1、...P
ここで使用された逆変換は、入力信号を変換するために使用された変換の逆である。
・連続時間出力信号
p(t)、p=1、...P
以下の方法/処理ステップは、本発明のBSEを典型的に規定する:
1.∀iで1組の離散的時間入力信号xi(n)の組を形成するために連続時間入力信号xi(t)をサンプリングする。
2.∀iでK個のサブバンド信号xi (k)(n)を形成するために入力信号xi(n)を変換する。
3.∀p、∀kで中間サブバンド出力信号を計算する:
Figure 0005091948
4,∀p、∀kで補正項を計算する(ここで、‖・‖は、いずれかの数学的ノルムを示している):
Figure 0005091948
5.∀k、∀i、∀p、∀lでフィルタを更新する。
Figure 0005091948
6.∀pで計算する(ここで、‖・‖は、いずれかの数学的ノルムを示している)。
Figure 0005091948
7.∀k、∀pで出力を計算する。
Figure 0005091948
8.
Figure 0005091948
9.
Figure 0005091948
10.
Figure 0005091948
11.∀pで出力信号yp(n)のタイムフレームを形成するためにサブバンド出力信号yp (k)(n)を逆変換する。
12.∀pでデジタル−アナログ変換(DAC)を通じて連続時間出力信号yp(t)を再構成する。
以上のステップを言葉で更に説明する(セクション4を示す図13を参照されたい):
1.全ての入力信号が、必要な時にアナログからデジタル形式に変換される。
2.全ての入力信号が、1つ又はそれよりも多くのサブバンドに変換される。
3.サブバンド入力信号は、各サブバンドk及び全ての出力pに関して、中間出力信号を形成するために、最後の繰返しにおいて(すなわち、時刻n−1において)得られたフィルタ係数によってフィルタリングされる。
4.このステップは、線形化処理を実行する。全てのサブバンドk及び全ての出力pにおいて個々にサブバンド入力信号の線形フィルタリングと非線形に変換された中間出力信号の間のノルム差が最小にされるように、1組の補正項が見つけられる。望ましい信号から予想されるレベルを大部分が占める出力サンプルが、不要の信号から予想されるレベルを大部分が占める出力サンプルよりも大きい値(レベル)を伴って通過するように、非線形関数が選択される。非線形関数が、線形関数fp (k)(x)=xによって置換される時、最適補正項は、入力信号に関わらず、常にゼロに等しくなると考えられることに注意すべきである。
5.全てのサブバンドk、全てのチャンネルi、全ての出力p、及び全てのパラメータ指数lにおいて、補正項は、重み(λ2で)を付けられ、最後の繰返しで得られた重み付け(λ1で)された係数に加算され、中間フィルタの新しい組を形成する。
6.線形化処理は、出力信号のレベルを変化させる可能性があるので、その後の使用ために、フィルタノルムの逆数が計算される。
7.全てのサブバンドk及び全ての出力指数pにおいて、入力信号を現在の(すなわち、時刻nにおける)中間フィルタによってフィルタリングし、フィルタノルムの逆数を乗算することにより、サブバンド出力信号が計算される。
8.全ての出力指数pにおいて個々に、全てのk、i、lにわたる結合された係数の合計ノルムがレベルC1よりも落ちる(又は等しい)時は、全体的抽出が実行され、抽出関数を通じて現在の中間フィルタを通すことによって現在のフィルタ(すなわち、時刻nにおける)を生成する。
9.全ての出力指数pにおいて個々に、全てのk、i、lにわたる結合された係数の合計ノルムがレベルC2を超える(又は等しい)時は、全体的収縮が実行され、収縮関数を通じて現在の中間フィルタを通すことによって現在のフィルタ(すなわち、時刻nにおける)を生成する。
10.全ての出力指数pにおいて個々に、全てのk、i、lにわたる結合された係数の合計ノルムがレベルC1とレベルC2の間になる時は、現在のフィルタ(すなわち、時刻nにおける)は、中間フィルタに等しくなる。
11.全てのpにおいて個々に、サブバンド出力信号は、出力信号を形成するために逆変換される。
12.全てのpにおいて個々に、デジタル−アナログ変換を通じて連続時間出力信号が形成される。
要件及び設定
1.非線形関数fp (k)(・)の選択は、特定のサブバンドkにおいて、望ましい信号の統計的確率密度関数に依存している。対応する確率密度関数pxr(τ)及び対応する分散σr 2を有するゼロ平均の確率論的信号sr(t)、r=1、2、...Rの数(R)を有する時、非線形関数は、次式を満足する必要がある(それが存在するならば)。
Figure 0005091948
この要件は、全ての関数fp (k)(・)が、全ての信号の累乗(分散)を低減する(>の時)又は増大する(<の時)ように作用することを意味する。
・一般性を損なうことなく、単一の最初の信号に対応するpdfが、望ましいpdf、すなわち、最初の出力y1(t)におけるpx1(τ)であると仮定する。その時は、以下の式に従うことが必要である。
Figure 0005091948
より一般的には、出力番号jにおいてソース信号番号sを生成したい時は、∀kで非線形関数fj (k)(・)は、任意のkにおいて以下の式を満たす必要がある。
Figure 0005091948
これらの要件は、非線形関数によって生じた累乗(分散)低減のレベルが、不要な信号が最も減衰するようになることを意味している。
以上の要件は、一般的に、あらゆる入力分散σr 2に関して満たすことができないことに注意すべきである。この場合には、分散に関する許容値の組Θを低減することができ、又は異なる入力分散に関して異なる非線形関数fp (k)(・)を選択することができる。
典型的には、望ましいソース信号が人間の音声である音響環境において、非線形関数は、fp (k)(x)=α1tanh(α2x)の形式とすることができる。
2.要件:
Figure 0005091948
3.要件:
Figure 0005091948
初期設定及びパラメータ選択
∀k、∀pで、フィルタhi、n (k、p)(l)は、以下の式のように初期設定(すなわち、n=0)することができる。
l=0、i∈[1,2,...I]に関して、
Figure 0005091948
他の全てのl及びiに関して、
Figure 0005091948
パラメータは、本発明の1つの非限定的な例示的実施形態では、以下のように選択することができる。
・典型的に:1≦K≦1024
・典型的に:1≦Li≦64
・典型的に:0.01≦α≦0.1
・典型的に:0<α1<1
・典型的に:0<α2<5
・典型的に:0.001≦C1≦0.1
・典型的に:0.1<C2≦10
・典型的に:0<λ1<1
・典型的に:0<λ2≦1
従って、本発明は、信号の混合物から望ましい電磁波信号、音波信号、又はあらゆる他の信号のうちの少なくとも1つを適応的に抽出して他のノイズ及び干渉信号を抑制し、ソース10から部分的又は全体的に発生する強化された信号を生成して、望ましい信号を生成する装置70を提供する。従って、望ましい連続時間の又は相応の離散的時間の入力信号の統計的確率密度を判断するようになった関数は、本装置に含まれる。望ましい統計的確率密度関数は、ノイズ及び干渉信号の統計的確率密度関数とは異なる。
更に、装置は、望ましい信号、ノイズ及び干渉信号から信号データを集めるようになった少なくとも1つのセンサを含む。離散的時間入力信号を形成するために、装置により、必要な時に連続時間入力信号においてサンプリングが実行される。デジタル表現において利用可能な信号がより小さい(又は等しい)帯域幅サブバンド信号に分割されるように、信号データを変換によって1組のサブバンドに変換するようになった変換器も装置に含まれる。
望ましい信号がノイズ及び干渉信号よりも少なく減衰させられる方法で全ての信号に関する各サブバンドにおいて各タイムフレームの入力信号を減衰させるようになった減衰器、及び/又は望ましい信号が増幅され、かつノイズ及び干渉信号よりも大きく増幅される方法で全ての信号に関する各サブバンドにおいて各タイムフレームの入力信号を増幅するようになった増幅器も装置に含まれる。従って、装置は、線形にフィルタリングされた入力信号と非線形に変換された出力信号の間の誤差基準が最小にされるように更新されるようになった各サブバンドにおける各タイムフレームの入力信号に関する1組のフィルタ係数と、所定の数の出力信号を生成し、かつそれらの各々が統計的確率密度関数の形状によって決定される望ましい信号に有利に働く所定の組のサブバンドフィルタによってサブバンド信号がフィルタリングされるようになったフィルタとを含む。最後に、装置は、出力信号への逆変換を実行するようになった再構成手段を含む。
図12a、図12b、図12cは、本発明により時間的ドメインにおいて不要な信号のpdf:sから望ましい信号のpdf:sをフィルタリングするBSEの図式的な図を概略的に示している。図12a、図12b、図12cの下部分は、望ましい種類のpdfを有するサブバンド2及び3と、以上の教示により図12a、図12b、図12cの上部分に示すフィルタが下方に移動される時にそのフィルタによって抑制される不要な種類のpdfを有するサブバンド1及び4とを通って入ってくるデータを示している。
本発明を所定の実施例と本発明をそれらに限定することを意図しない実施形態とによって説明した。当業者は、特許請求の範囲が他の有利な実施形態を説明することを認識する。
50 強化された信号

Claims (9)

  1. 少なくとも一つの連続時間入力信号から離散的な時間でサンプリングされた少なくとも一つの離散的時間入力信号から離散的時間出力信号を抽出する方法であって、
    a)各離散的時間入力信号ごとに、少なくとも一つのサブバンド入力信号を形成するよう第1の変換を前記離散的時間入力信号に適用し、これにより、1組のサブバンドを定義するステップを含み、
    前記第1の変換及び前記サブバンドは、全ての離散的時間入力信号に対して一定であり、各サブバンド入力信号は、前記離散的な時間でのサブバンド入力信号値を有し、
    方法は、さらに、
    b)前記離散的な時間を通じて時間順に反復して実行するステップと、
    c)各サブバンドについて個別に行われるそれぞれの反復のステップは、
    フィルタ入力と中間フィルタ係数のシーケンスとのスカラー積に等しい中間サブバンド出力信号値を決定するステップを有し、
    前記フィルタ入力は、前記離散的時間入力信号それぞれについての前記サブバンド入力信号に対応する連続したサブバンド入力信号値の入力シーケンスを有し、当該入力シーケンスは、現在の反復のステップの前記離散的な時間から時間的に後方に続き、前記入力シーケンスの長さは、全ての反復のステップ及び全てのサブバンドに対して一定であり、
    前記反復のステップは、
    前記反復のステップ全てにおいて一定である非線形関数を前記中間サブバンド出力信号値に適用することによって、修正されたサブバンド出力信号値である修正サブバンド出力信号値を決定するステップと、
    前記中間フィルタ係数のシーケンスと補正項のシーケンスとのベクトルの合計に等しい訂正されたフィルタ係数のシーケンスと前記フィルタ入力とのスカラー積と、前記修正サブバンド出力信号値との差のノルムが最小となるよう補正項のシーケンスを決定するステップと、
    前記中間フィルタ係数のシーケンスと補正項のシーケンスとの重み付けされたベクトルの合計として、結合されたフィルタ係数のシーケンスを決定するステップと、
    を有し、前記重み付けは、全ての反復のステップ及び全てのサブバンドに対して一定であり、
    前記反復のステップは、さらに、
    全てのサブバンド及び全ての離散的時間入力信号についての前記結合されたフィルタ係数のアレイにより決定されるノルムの合計で割った、前記結合されたフィルタ係数のシーケンスと前記フィルタ入力とのスカラー積に等しいサブバンド出力信号値を決定するステップと、
    後述の反復のステップのための前記中間フィルタ係数のシーケンスであって、前記結合されたフィルタ係数のシーケンスに等しい前記中間フィルタ係数のシーケンスを設定するステップと、
    を有し、
    方法は、さらに、
    d)各サブバンドについて、前記サブバンド出力信号値から対応するサブバンド出力信号を形成するステップと、
    e)前記第1の変換の逆変換である第2の変換を前記サブバンド出力信号の全ての組に適用することによって、前記離散的時間出力信号を形成するステップと、
    を有する方法。
  2. 少なくとも一つのさらなる出力信号が抽出され、
    前記ステップc)、d)、e)は、各出力信号毎に個別に実行され、
    前記入力シーケンスの長さは、全ての出力信号に対して一定であり、
    前記重み付けは、全ての出力信号に対して一定であることを特徴とする請求項1に記載の方法。
  3. 決定された前記ノルムの合計がより低いレベル以下である場合、レベル増加関数を結合されたフィルタ係数の各シーケンスに適用し、後述の反復のステップのための前記中間フィルタ係数のシーケンスであって、反復のステップの結果に等しい前記中間フィルタ係数のシーケンスを設定し、
    決定された前記ノルムの合計がより高いレベル以上である場合、レベル減少関数を結合されたフィルタ係数の各シーケンスに適用し、後述の反復のステップのための前記中間フィルタ係数のシーケンスであって、反復のステップの結果に等しい前記中間フィルタ係数のシーケンスを設定することを特徴とする請求項1又は2に記載の方法。
  4. 前記少なくとも一つの連続時間入力信号は、所望の信号及び少なくとも一つの妨害信号を含み、
    前記所望の信号の統計的確率密度関数は、少なくとも一つのサブバンド内の少なくとも一つの妨害信号の統計的確率密度関数とは異なり、
    非線形関数は、前記所望の信号の統計的確率密度関数に依存して選択されることを特徴とする請求項1ないし3のいずれか一つに記載の方法。
  5. 前記非線形関数は、前記所望の信号の累乗より大きい前記妨害信号の累乗を低減することを特徴とする請求項4に記載の方法。
  6. 前記所望の信号は、人間の音声であり、
    前記非線形関数は、f(x)=α 1 ・tanh(α 2 ・x)の形式であることを特徴とする請求項4又は5に記載の方法。
  7. 方法は、さらに、
    前記少なくとも一つの連続時間入力信号を前記離散的な時間でサンプリングするステップを含むことを特徴とする請求項1ないし6のいずれか一つに記載の方法。
  8. 方法は、さらに、
    前記少なくとも一つの連続時間入力信号を少なくとも一つの個別のセンサから収集するステップを含むことを特徴とする請求項7に記載の方法。
  9. 方法は、さらに、
    各離散的時間出力信号から連続時間出力信号形成するステップを含むことを特徴とする請求項1ないし8のいずれか一つに記載の方法。
JP2009513548A 2006-06-05 2006-06-05 ブラインド信号抽出 Active JP5091948B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/EP2006/005347 WO2007140799A1 (en) 2006-06-05 2006-06-05 Blind signal extraction

Publications (2)

Publication Number Publication Date
JP2009540344A JP2009540344A (ja) 2009-11-19
JP5091948B2 true JP5091948B2 (ja) 2012-12-05

Family

ID=37307419

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009513548A Active JP5091948B2 (ja) 2006-06-05 2006-06-05 ブラインド信号抽出

Country Status (10)

Country Link
US (1) US8351554B2 (ja)
EP (1) EP2030200B1 (ja)
JP (1) JP5091948B2 (ja)
CN (1) CN101460999B (ja)
AU (1) AU2006344268B2 (ja)
BR (1) BRPI0621733B1 (ja)
CA (1) CA2652847C (ja)
ES (1) ES2654519T3 (ja)
NO (1) NO341066B1 (ja)
WO (1) WO2007140799A1 (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100332222A1 (en) * 2006-09-29 2010-12-30 National Chiao Tung University Intelligent classification method of vocal signal
US8135548B2 (en) * 2006-10-26 2012-03-13 Abbott Diabetes Care Inc. Method, system and computer program product for real-time detection of sensitivity decline in analyte sensors
US8892432B2 (en) * 2007-10-19 2014-11-18 Nec Corporation Signal processing system, apparatus and method used on the system, and program thereof
GB2459512B (en) * 2008-04-25 2012-02-15 Tannoy Ltd Control system for a transducer array
WO2009151578A2 (en) * 2008-06-09 2009-12-17 The Board Of Trustees Of The University Of Illinois Method and apparatus for blind signal recovery in noisy, reverberant environments
CN102236050B (zh) * 2010-04-27 2014-05-14 叶文俊 明视物质相关电磁波记录方法及架构
US9818416B1 (en) 2011-04-19 2017-11-14 Deka Products Limited Partnership System and method for identifying and processing audio signals
CN104535969A (zh) * 2014-12-23 2015-04-22 电子科技大学 一种基于干扰噪声协方差矩阵重构的波束形成方法
CN105823492B (zh) * 2016-03-18 2018-08-21 北京卫星环境工程研究所 一种洋流干扰中微弱目标信号提取方法
US10219234B2 (en) * 2016-08-18 2019-02-26 Allen-Vanguard Corporation System and method for providing adaptive synchronization of LTE communication systems
US10429491B2 (en) * 2016-09-12 2019-10-01 The Boeing Company Systems and methods for pulse descriptor word generation using blind source separation
CN106419912A (zh) * 2016-10-20 2017-02-22 重庆邮电大学 一种多导联脑电信号的眼电伪迹去除方法
CN108172231B (zh) * 2017-12-07 2021-07-30 中国科学院声学研究所 一种基于卡尔曼滤波的去混响方法及系统

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4020656A1 (de) * 1990-06-29 1992-01-02 Thomson Brandt Gmbh Verfahren zur uebertragung eines signals
US5500879A (en) * 1992-08-14 1996-03-19 Adtran Blind signal separation and equalization of full-duplex amplitude modulated signals on a signal transmission line
US6236731B1 (en) * 1997-04-16 2001-05-22 Dspfactory Ltd. Filterbank structure and method for filtering and separating an information signal into different bands, particularly for audio signal in hearing aids
US6408269B1 (en) * 1999-03-03 2002-06-18 Industrial Technology Research Institute Frame-based subband Kalman filtering method and apparatus for speech enhancement
US20010046268A1 (en) * 2000-03-06 2001-11-29 Alok Sharma Transceiver channel bank with reduced connector density
CN1148905C (zh) * 2000-06-01 2004-05-05 华为技术有限公司 宽带码分多址中抗深衰减的半盲信道估计方法
JP2002023776A (ja) * 2000-07-13 2002-01-25 Univ Kinki ブラインドセパレーションにおける話者音声と非音声雑音の識別方法及び話者音声チャンネルの特定方法
JP4028680B2 (ja) * 2000-11-01 2007-12-26 インターナショナル・ビジネス・マシーンズ・コーポレーション 観測データから原信号を復元する信号分離方法、信号処理装置、モバイル端末装置、および記憶媒体
US7171008B2 (en) * 2002-02-05 2007-01-30 Mh Acoustics, Llc Reducing noise in audio systems
US20040252772A1 (en) * 2002-12-31 2004-12-16 Markku Renfors Filter bank based signal processing
US7443917B2 (en) * 2003-09-02 2008-10-28 Data Jce Ltd Method and system for transmission of information data over a communication line
JP4529492B2 (ja) * 2004-03-11 2010-08-25 株式会社デンソー 音声抽出方法、音声抽出装置、音声認識装置、及び、プログラム
CN1314000C (zh) * 2004-10-12 2007-05-02 上海大学 基于盲信号分离的语音增强装置

Also Published As

Publication number Publication date
EP2030200B1 (en) 2017-10-18
NO20090013L (no) 2009-02-25
US8351554B2 (en) 2013-01-08
ES2654519T3 (es) 2018-02-14
AU2006344268A1 (en) 2007-12-13
BRPI0621733B1 (pt) 2019-09-10
CA2652847C (en) 2015-04-21
EP2030200A1 (en) 2009-03-04
NO341066B1 (no) 2017-08-14
BRPI0621733A2 (pt) 2012-04-24
CA2652847A1 (en) 2007-12-13
CN101460999B (zh) 2011-12-14
AU2006344268B2 (en) 2011-09-29
WO2007140799A1 (en) 2007-12-13
US20090257536A1 (en) 2009-10-15
JP2009540344A (ja) 2009-11-19
CN101460999A (zh) 2009-06-17

Similar Documents

Publication Publication Date Title
JP5091948B2 (ja) ブラインド信号抽出
US10123113B2 (en) Selective audio source enhancement
US9456275B2 (en) Cardioid beam with a desired null based acoustic devices, systems, and methods
CN110085248B (zh) 个人通信中降噪和回波消除时的噪声估计
Simmer et al. Post-filtering techniques
US7099821B2 (en) Separation of target acoustic signals in a multi-transducer arrangement
EP2237271B1 (en) Method for determining a signal component for reducing noise in an input signal
JP6547003B2 (ja) サブバンド信号の適応混合
CN106710601A (zh) 一种语音信号降噪拾音处理方法和装置及冰箱
TW200849219A (en) Systems, methods, and apparatus for signal separation
JP2011511321A (ja) 高度に相関する混合のための強調ブラインド信号源分離アルゴリズム
US9406293B2 (en) Apparatuses and methods to detect and obtain desired audio
Neo et al. Robust microphone arrays using subband adaptive filters
Spriet et al. Stochastic gradient-based implementation of spatially preprocessed speech distortion weighted multichannel Wiener filtering for noise reduction in hearing aids
RU2417460C2 (ru) Выделение сигнала вслепую
Cao et al. Speech enhancement using microphone array with multi-stage processing
CN112017684B (zh) 一种基于麦克风阵列的密闭空间混响消除方法
Zou et al. A broadband speech enhancement technique based on frequency invariant beamforming and GSC
Ingerle Generalised Sidelobe Canceler–Features And Realisation
Zhang et al. A compact-microphone-array-based speech enhancement algorithm using auditory subbands and probability constrained postfilter
Bolom et al. Derivation of Criterion Suitable for Evaluation of Multichannel Noise Reduction Systems for Speech Processing
Madhu Data-driven mask generation for source separation
Yerramsetty Microphone Array Wiener Beamformer and Speaker Localization With emphasis on WOLA Filter Bank

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111104

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120110

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120404

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120910

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120914

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150921

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5091948

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250