JP5091948B2 - ブラインド信号抽出 - Google Patents
ブラインド信号抽出 Download PDFInfo
- Publication number
- JP5091948B2 JP5091948B2 JP2009513548A JP2009513548A JP5091948B2 JP 5091948 B2 JP5091948 B2 JP 5091948B2 JP 2009513548 A JP2009513548 A JP 2009513548A JP 2009513548 A JP2009513548 A JP 2009513548A JP 5091948 B2 JP5091948 B2 JP 5091948B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- subband
- sequence
- input
- signals
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000605 extraction Methods 0.000 title description 27
- 238000000034 method Methods 0.000 claims description 47
- 238000012937 correction Methods 0.000 claims description 10
- 238000005070 sampling Methods 0.000 claims description 9
- 238000012886 linear function Methods 0.000 claims description 7
- 230000001965 increasing effect Effects 0.000 claims description 3
- 230000009467 reduction Effects 0.000 claims description 3
- 239000013598 vector Substances 0.000 claims description 3
- 230000006870 function Effects 0.000 description 23
- 239000000203 mixture Substances 0.000 description 15
- 230000003044 adaptive effect Effects 0.000 description 13
- 230000002123 temporal effect Effects 0.000 description 13
- 238000001914 filtration Methods 0.000 description 12
- 230000002238 attenuated effect Effects 0.000 description 9
- 230000008569 process Effects 0.000 description 9
- 238000006243 chemical reaction Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 8
- 230000003321 amplification Effects 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 7
- 238000001514 detection method Methods 0.000 description 7
- 238000003199 nucleic acid amplification method Methods 0.000 description 7
- 238000012545 processing Methods 0.000 description 7
- 230000009466 transformation Effects 0.000 description 6
- 238000005315 distribution function Methods 0.000 description 5
- 239000000284 extract Substances 0.000 description 5
- 238000000926 separation method Methods 0.000 description 5
- 239000006185 dispersion Substances 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000012880 independent component analysis Methods 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 230000003595 spectral effect Effects 0.000 description 4
- 230000008602 contraction Effects 0.000 description 3
- 230000032683 aging Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000000354 decomposition reaction Methods 0.000 description 2
- 230000004807 localization Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000002156 mixing Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 241000052343 Dares Species 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000005672 electromagnetic field Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000000513 principal component analysis Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- CCEKAJIANROZEO-UHFFFAOYSA-N sulfluramid Chemical group CCNS(=O)(=O)C(F)(F)C(F)(F)C(F)(F)C(F)(F)C(F)(F)C(F)(F)C(F)(F)C(F)(F)F CCEKAJIANROZEO-UHFFFAOYSA-N 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000002604 ultrasonography Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/005—Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2430/00—Signal processing covered by H04R, not provided for in its groups
- H04R2430/03—Synergistic effects of band splitting and sub-band processing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R25/00—Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R25/00—Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
- H04R25/40—Arrangements for obtaining a desired directivity characteristic
- H04R25/407—Circuits for combining signals of a plurality of transducers
Landscapes
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Quality & Reliability (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Otolaryngology (AREA)
- Circuit For Audible Band Transducer (AREA)
- Noise Elimination (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
- Dc Digital Transmission (AREA)
Description
特に、完全自動信号抽出は、以下の問題、すなわち、センサ及びソースの相互幾何学的形状が未知であり変化すること、望ましいソースの数が未知であること、周囲のノイズソースが未知のスペクトル特性を有すること、センサ特性が理想的でなく経年変化をすること、複雑性による制限、高いノイズを想定した状態においても作動する必要性に直面している。
ブラインド信号分離(BSS)及び独立成分分析(ICA)は、観測された混合物(一般的に、センサのアレイの出力)から観測されていない信号又は「ソース」を復元することを目的とするアレイ処理及びデータ分析の新生の技術であり、信号間の相互独立性の仮定のみを利用している。この仮定が弱いことは、それを強力な手法にしているが、それは、あえて普通の2次統計量の域を超えることを必要とする。この論文の目的は、この問題に対処するために最近開発された手法の一部を精査して、それらが基本原理からどのように出てきたかを説明し、かつそれらが互いにどのように関連するかを示すことである。
BSS−ICA/PCA、ICAは、非線形PCAと同等であり、出力独立性/非相関に依存している。全信号ソースは、同時にアクティブである必要があり、信号を記録するセンサは、信号ソースの数に等しいか又はそれを超える必要がある。更に、既存のBSS及びその均等物は、低いノイズ環境でのみ作動可能である。
BSS−結合キュムラント対角化は、より高い次数のキュムラント行列を対角化し、センサは、ソースの数よりも大きいか又は等しくなる必要がある。これに関する問題は、その収束の遅さであり、並びにこれは、低いノイズ環境においてのみ作動する。
この論文は、干渉非音声ソースの同時共存の下で現実の部屋環境においてロバストな音声認識を行う新しい「ブラインド信号抽出(BSE)」法を示している。この提案された方法は、最大尖度基準に基づいてターゲット話者の音声を抽出することができる。広範囲の音素認識実験は、様々な非音声ソース(例えば、音楽及びノイズ)の共存状態にある音声者の現実生活状況において使用された時の提案されたネットワークの効率性を証明し、特に高い干渉の下では約23%の音素認識改善を達成した。更に、類似の状況において一般的に使用される公知の「ブラインドソース分離(BSS)」ネットワークとの提案されたネットワークの比較は、計算の複雑性がより低いこと及びBSEネットワークの認識精度がより良いことを示し、それが既存のASR(自動音声認識)システムに対するフロントエンドとして使用されることを理想的にしている。
最大尖度基準は、最大の尖度、かつセンサ数><ソース数の状態で単一ソースを抽出する。この抽出の難しさは、いくつかのスピーカを操作することに関し、かつこれは、低いノイズ環境においてのみ作動する。
この論文は、ロバストな最小分散歪みなし応答(MVDR)ビーム形成器を実施するための新しい手法を示している。このビーム形成器は、最悪の場合の性能最適化に基づいており、望ましい信号誘導ベクトルにおける任意であるがノルム有界の不整合に対して優れたロバスト性を提供するように示されている。しかし、この問題を解決する既存のアルゴリズムは、計算効率の良い直接オンライン実装を持たない。この論文において、限定カルマンフィルタに基づき、低計算コストのオンラインで実施することができるロバストなMVDRビーム形成器に関する新しいアルゴリズムが開発されている。このアルゴリズムは、ロバストなMVDRビーム形成器の元の2次円錐プログラミング(SOCP)ベースの実施のものに類似した性能を有することが示されている。また、付加的に非定常環境に対処する提案されたアルゴリズムの2つの改良された修正も示されている。これらの修正は、急速な(急激な)環境変化に対してビーム形成器のロバスト性を更に改良するモデル交換及び仮定統合技術に基づいている。
本発明によるBSEの適応演算は、信号の混合物から1つ又はそれよりも多くの望ましい信号を、それらが一部の個別のパラメータ(尺度)により、例えば、統計的特性、統計的確率分布関数(pdf)の形状、及び望ましい信号の時間又は周波数などにおける位置により空間的又は時間的に典型的に区別することによって分離される場合に区別することに依存している。望ましい信号以外の統計的確率分布関数の形状のような異なる個別のパラメータ(尺度)を伴った信号は、適応演算出力において有利に働かないことになる。BSEにおけるソース信号抽出の原理は、望ましい信号の統計的分布関数(pdf)の形状のようなパラメータが、不要な信号の統計的確率分布関数の形状のようなパラメータとは異なるという条件で、統計的確率分布関数のようなあらゆる種類の個別のパラメータ(尺度)に対して有効である。これは、pdfのような異なるパラメータを有するいくつかのソース信号を本発明によってセンサへの同じ入力と同時に抽出することができるような方法でいくつかの並行BSE構造を実装することができることを意味している。
更に、BSEは、実際の環境から抽出したいかなる予め記録したアレイ信号又はパラメータ推定値も必要とせず、実際のソースから抽出したいかなる信号又はパラメータ推定値にも依存しない。BSEは、正並びに負のSNIR(信号対ノイズプラス干渉比)環境において首尾よく演算することができ、その演算は、受信信号の残響除去を含む。
本発明の一実施形態では、混合物内の異なる信号間で区別するためのパラメータは、pdfに基づいている。
本発明の別の実施形態では、受信信号データは、それがアナログである時はデジタル形式に変換される。
更に別の実施形態は、減衰/増幅処理による信号レベルの変化に起因して出力信号レベルが補正されることを含む。
更に別の実施形態は、フィルタ係数のノルムが、最小値と最大値の間の制限値に限定されることを含む。
更に別の実施形態は、フィルタ係数増幅が、フィルタ係数のノルムが最小許容値よりも低い時に達成され、フィルタ係数減衰が、フィルタ係数のノルムが最大許容値よりも高い時に達成されることを含む。
更に別の実施形態は、減衰又は増幅が、各サブバンドにおけるフィルタ係数が時間選択性ドメインにおいて、及び時間的並びに空間的ドメインにおいて望ましい信号を強化するようにブラインド適応されるという原理を導くことを含む。
装置は、添付の従属装置請求項の組から明らかなように、上述の方法に関する実施形態を実施するようになっていることが認められる。
BSEは、これ以降、音声信号が望ましい信号であり、ノイズ及びその他の干渉信号が不要なソース信号である音波伝播における音声強化に関して概略的に説明する。
これ以降、本発明のより良い理解のために、与えた実施例及び説明する実施形態と共に添付の図面を参照する。
BSEは、時間選択性ドメイン及び/又は空間的ドメイン及び/又は時間的ドメインにおいて演算することができ、あらゆる数(>0)の変換器/センサに対して演算することができ、その演算は、信号活性検出に依存しない適合アルゴリズムであるような少数の望ましい特性を提供する。更に、ソース及び/又はセンサ相互幾何学形状の予備知識は、BSEの演算には要求されず、その演算は、較正された変換器/センサアレイを必要としない。BSE演算の別の望ましい特性は、ソース信号の統計的独立性又は生成出力信号の統計的非相関に依存しないことである。
本発明のBSE方法及び装置に関する多くの用途が存在する。BSE演算は、異なる信号抽出用途に使用することができる。これらは、限定ではないが、例えば、パーソナル電話、携帯及び静止のパーソナル無線装置、補聴器、会議のための電話、ノイズのある環境におけるパーソナル通信用装置のような空中音場における信号強化を含み、すなわち、この装置は、次に、聴覚保護及び医療超音波分析手段と組み合わされる。
更に別の用途は、例えば、音響水中通信、音波による航行及び測距(ソナー)のような音響水中場における信号強化の特徴を有する。
更に、例えば、地震検出及び予測、火山分析、機械振動分析のような振動場における信号強化は、その他の可能な用途である。
別の可能な適用分野は、津波検出、海流分析、海温分析、海水塩分分析のような海の波の場における信号強化である。
図2cは、各スイッチが個々の狭帯域サブバンド信号に対して作動する適応ソフトスイッチの組の前のフィルタバンク変換を示している。次に、結果として生じたサブバンド出力は、出力信号を生成するために合成フィルタバンクによって再構成される。
図4a及び図4bの矢印は、信号ソースから2つのマイクロフォン12の前に向う方向における2つの等しい波40、42の伝播と、マイクロフォン12に対して角度がある2つの等しい波44、46の伝播とを示している。図4aにおいて、マイクロフォンの前の空間的方向における波は、同位相である。波40、42が同位相で、かつ同じ周波数で同じ距離から送信された時には、集められた信号の振幅は、両振幅の合計まで増加し、ここで図5aに示すような波40、42の2倍の振幅の出力信号を提供する。
図4bにおける2つの波44、46も同位相であるが、各マイクロフォン12に到達するのに半波長の差を伝播する必要があり、従って、図5bに示すように、2つの波が加えられた時には互いに打ち消しあう。
図6は、音声信号が、マイクロフォン12が上述の全てのドメインにおいて音声及びノイズの両方から信号を拾う全ての方向から3つのマイクロフォンによって空間的に集められる方法を概略的に示している。
図11によって与えた例のように、演算の核は、各ステップにおいて、すなわち、各タイムフレームの入力データ110に関して、多重チャンネルサブバンド変換ステップに続いて、フィルタ係数のアレイとして示したフィルタ係数112は、各サブバンドにおいて更新され、全ての信号が減衰され、及び/又は増幅されるようにする。114において、出力信号は、逆変換によって再構成される。
I:演算に利用可能な変換器/センサの数を示している(iによって指標付けされる)
K:変換されたサブバンド信号の数を示している(kによって指標付けされる)
P:生成された出力信号の数を示している(pによって指標付けされる)
n:離散化された時間指数を示している(すなわち、実時間t=nT、ここでTはサンプリング周期である)
Li:各サブバンドフィルタの長さを示している
Levelp:出力番号pにおいて望ましい出力信号レベルを維持するために使用されるレベル補正項を示している
λ1及びλ2:フィルタ係数更新重みパラメータを示している
C1:全体的抽出に対するより低いレベルを示している
C2:全体的収縮に対するより高いレベルを示している
fp (k)(・)−1組の非線形関数を示している
g1 (k、p)(・)−1組のレベル増加関数を示している
g2 (k、p)(・)−1組のレベル減少関数を示している
利用される変数は、以下の通りである:
hi、n (k、p)(l)−時刻nにおいて有効な係数の長さLiのシーケンス(フィルタ)を示している
Δhi、n (k、p)(l):時刻nにおいて有効な(補正)係数の長さLiのシーケンスを示している
・受信変換器/センサ入力信号
xi(t)、i=1、...I
・サンプリングされた変換器/センサ入力信号
xi(n)、i=1、...I
・変換されたサンプリングサブバンド入力信号
・変換されたサンプリングサブバンド出力信号
yp(n)、p=1、...P
ここで使用された逆変換は、入力信号を変換するために使用された変換の逆である。
・連続時間出力信号
yp(t)、p=1、...P
1.∀iで1組の離散的時間入力信号xi(n)の組を形成するために連続時間入力信号xi(t)をサンプリングする。
2.∀iでK個のサブバンド信号xi (k)(n)を形成するために入力信号xi(n)を変換する。
3.∀p、∀kで中間サブバンド出力信号を計算する:
12.∀pでデジタル−アナログ変換(DAC)を通じて連続時間出力信号yp(t)を再構成する。
1.全ての入力信号が、必要な時にアナログからデジタル形式に変換される。
2.全ての入力信号が、1つ又はそれよりも多くのサブバンドに変換される。
3.サブバンド入力信号は、各サブバンドk及び全ての出力pに関して、中間出力信号を形成するために、最後の繰返しにおいて(すなわち、時刻n−1において)得られたフィルタ係数によってフィルタリングされる。
4.このステップは、線形化処理を実行する。全てのサブバンドk及び全ての出力pにおいて個々にサブバンド入力信号の線形フィルタリングと非線形に変換された中間出力信号の間のノルム差が最小にされるように、1組の補正項が見つけられる。望ましい信号から予想されるレベルを大部分が占める出力サンプルが、不要の信号から予想されるレベルを大部分が占める出力サンプルよりも大きい値(レベル)を伴って通過するように、非線形関数が選択される。非線形関数が、線形関数fp (k)(x)=xによって置換される時、最適補正項は、入力信号に関わらず、常にゼロに等しくなると考えられることに注意すべきである。
5.全てのサブバンドk、全てのチャンネルi、全ての出力p、及び全てのパラメータ指数lにおいて、補正項は、重み(λ2で)を付けられ、最後の繰返しで得られた重み付け(λ1で)された係数に加算され、中間フィルタの新しい組を形成する。
6.線形化処理は、出力信号のレベルを変化させる可能性があるので、その後の使用ために、フィルタノルムの逆数が計算される。
7.全てのサブバンドk及び全ての出力指数pにおいて、入力信号を現在の(すなわち、時刻nにおける)中間フィルタによってフィルタリングし、フィルタノルムの逆数を乗算することにより、サブバンド出力信号が計算される。
8.全ての出力指数pにおいて個々に、全てのk、i、lにわたる結合された係数の合計ノルムがレベルC1よりも落ちる(又は等しい)時は、全体的抽出が実行され、抽出関数を通じて現在の中間フィルタを通すことによって現在のフィルタ(すなわち、時刻nにおける)を生成する。
9.全ての出力指数pにおいて個々に、全てのk、i、lにわたる結合された係数の合計ノルムがレベルC2を超える(又は等しい)時は、全体的収縮が実行され、収縮関数を通じて現在の中間フィルタを通すことによって現在のフィルタ(すなわち、時刻nにおける)を生成する。
10.全ての出力指数pにおいて個々に、全てのk、i、lにわたる結合された係数の合計ノルムがレベルC1とレベルC2の間になる時は、現在のフィルタ(すなわち、時刻nにおける)は、中間フィルタに等しくなる。
11.全てのpにおいて個々に、サブバンド出力信号は、出力信号を形成するために逆変換される。
12.全てのpにおいて個々に、デジタル−アナログ変換を通じて連続時間出力信号が形成される。
1.非線形関数fp (k)(・)の選択は、特定のサブバンドkにおいて、望ましい信号の統計的確率密度関数に依存している。対応する確率密度関数pxr(τ)及び対応する分散σr 2を有するゼロ平均の確率論的信号sr(t)、r=1、2、...Rの数(R)を有する時、非線形関数は、次式を満足する必要がある(それが存在するならば)。
・一般性を損なうことなく、単一の最初の信号に対応するpdfが、望ましいpdf、すなわち、最初の出力y1(t)におけるpx1(τ)であると仮定する。その時は、以下の式に従うことが必要である。
以上の要件は、一般的に、あらゆる入力分散σr 2に関して満たすことができないことに注意すべきである。この場合には、分散に関する許容値の組Θを低減することができ、又は異なる入力分散に関して異なる非線形関数fp (k)(・)を選択することができる。
典型的には、望ましいソース信号が人間の音声である音響環境において、非線形関数は、fp (k)(x)=α1tanh(α2x)の形式とすることができる。
2.要件:
∀k、∀pで、フィルタhi、n (k、p)(l)は、以下の式のように初期設定(すなわち、n=0)することができる。
l=0、i∈[1,2,...I]に関して、
・典型的に:1≦K≦1024
・典型的に:1≦Li≦64
・典型的に:0.01≦α≦0.1
・典型的に:0<α1<1
・典型的に:0<α2<5
・典型的に:0.001≦C1≦0.1
・典型的に:0.1<C2≦10
・典型的に:0<λ1<1
・典型的に:0<λ2≦1
本発明を所定の実施例と本発明をそれらに限定することを意図しない実施形態とによって説明した。当業者は、特許請求の範囲が他の有利な実施形態を説明することを認識する。
Claims (9)
- 少なくとも一つの連続時間入力信号から離散的な時間でサンプリングされた少なくとも一つの離散的時間入力信号から離散的時間出力信号を抽出する方法であって、
a)各離散的時間入力信号ごとに、少なくとも一つのサブバンド入力信号を形成するよう第1の変換を前記離散的時間入力信号に適用し、これにより、1組のサブバンドを定義するステップを含み、
前記第1の変換及び前記サブバンドは、全ての離散的時間入力信号に対して一定であり、各サブバンド入力信号は、前記離散的な時間でのサブバンド入力信号値を有し、
方法は、さらに、
b)前記離散的な時間を通じて時間順に反復して実行するステップと、
c)各サブバンドについて個別に行われるそれぞれの反復のステップは、
フィルタ入力と中間フィルタ係数のシーケンスとのスカラー積に等しい中間サブバンド出力信号値を決定するステップを有し、
前記フィルタ入力は、前記離散的時間入力信号それぞれについての前記サブバンド入力信号に対応する連続したサブバンド入力信号値の入力シーケンスを有し、当該入力シーケンスは、現在の反復のステップの前記離散的な時間から時間的に後方に続き、前記入力シーケンスの長さは、全ての反復のステップ及び全てのサブバンドに対して一定であり、
前記反復のステップは、
前記反復のステップ全てにおいて一定である非線形関数を前記中間サブバンド出力信号値に適用することによって、修正されたサブバンド出力信号値である修正サブバンド出力信号値を決定するステップと、
前記中間フィルタ係数のシーケンスと補正項のシーケンスとのベクトルの合計に等しい訂正されたフィルタ係数のシーケンスと前記フィルタ入力とのスカラー積と、前記修正サブバンド出力信号値との差のノルムが最小となるよう補正項のシーケンスを決定するステップと、
前記中間フィルタ係数のシーケンスと補正項のシーケンスとの重み付けされたベクトルの合計として、結合されたフィルタ係数のシーケンスを決定するステップと、
を有し、前記重み付けは、全ての反復のステップ及び全てのサブバンドに対して一定であり、
前記反復のステップは、さらに、
全てのサブバンド及び全ての離散的時間入力信号についての前記結合されたフィルタ係数のアレイにより決定されるノルムの合計で割った、前記結合されたフィルタ係数のシーケンスと前記フィルタ入力とのスカラー積に等しいサブバンド出力信号値を決定するステップと、
後述の反復のステップのための前記中間フィルタ係数のシーケンスであって、前記結合されたフィルタ係数のシーケンスに等しい前記中間フィルタ係数のシーケンスを設定するステップと、
を有し、
方法は、さらに、
d)各サブバンドについて、前記サブバンド出力信号値から対応するサブバンド出力信号を形成するステップと、
e)前記第1の変換の逆変換である第2の変換を前記サブバンド出力信号の全ての組に適用することによって、前記離散的時間出力信号を形成するステップと、
を有する方法。 - 少なくとも一つのさらなる出力信号が抽出され、
前記ステップc)、d)、e)は、各出力信号毎に個別に実行され、
前記入力シーケンスの長さは、全ての出力信号に対して一定であり、
前記重み付けは、全ての出力信号に対して一定であることを特徴とする請求項1に記載の方法。 - 決定された前記ノルムの合計がより低いレベル以下である場合、レベル増加関数を結合されたフィルタ係数の各シーケンスに適用し、後述の反復のステップのための前記中間フィルタ係数のシーケンスであって、反復のステップの結果に等しい前記中間フィルタ係数のシーケンスを設定し、
決定された前記ノルムの合計がより高いレベル以上である場合、レベル減少関数を結合されたフィルタ係数の各シーケンスに適用し、後述の反復のステップのための前記中間フィルタ係数のシーケンスであって、反復のステップの結果に等しい前記中間フィルタ係数のシーケンスを設定することを特徴とする請求項1又は2に記載の方法。 - 前記少なくとも一つの連続時間入力信号は、所望の信号及び少なくとも一つの妨害信号を含み、
前記所望の信号の統計的確率密度関数は、少なくとも一つのサブバンド内の少なくとも一つの妨害信号の統計的確率密度関数とは異なり、
非線形関数は、前記所望の信号の統計的確率密度関数に依存して選択されることを特徴とする請求項1ないし3のいずれか一つに記載の方法。 - 前記非線形関数は、前記所望の信号の累乗より大きい前記妨害信号の累乗を低減することを特徴とする請求項4に記載の方法。
- 前記所望の信号は、人間の音声であり、
前記非線形関数は、f(x)=α 1 ・tanh(α 2 ・x)の形式であることを特徴とする請求項4又は5に記載の方法。 - 方法は、さらに、
前記少なくとも一つの連続時間入力信号を前記離散的な時間でサンプリングするステップを含むことを特徴とする請求項1ないし6のいずれか一つに記載の方法。 - 方法は、さらに、
前記少なくとも一つの連続時間入力信号を少なくとも一つの個別のセンサから収集するステップを含むことを特徴とする請求項7に記載の方法。 - 方法は、さらに、
各離散的時間出力信号から連続時間出力信号形成するステップを含むことを特徴とする請求項1ないし8のいずれか一つに記載の方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/EP2006/005347 WO2007140799A1 (en) | 2006-06-05 | 2006-06-05 | Blind signal extraction |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009540344A JP2009540344A (ja) | 2009-11-19 |
JP5091948B2 true JP5091948B2 (ja) | 2012-12-05 |
Family
ID=37307419
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009513548A Active JP5091948B2 (ja) | 2006-06-05 | 2006-06-05 | ブラインド信号抽出 |
Country Status (10)
Country | Link |
---|---|
US (1) | US8351554B2 (ja) |
EP (1) | EP2030200B1 (ja) |
JP (1) | JP5091948B2 (ja) |
CN (1) | CN101460999B (ja) |
AU (1) | AU2006344268B2 (ja) |
BR (1) | BRPI0621733B1 (ja) |
CA (1) | CA2652847C (ja) |
ES (1) | ES2654519T3 (ja) |
NO (1) | NO341066B1 (ja) |
WO (1) | WO2007140799A1 (ja) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100332222A1 (en) * | 2006-09-29 | 2010-12-30 | National Chiao Tung University | Intelligent classification method of vocal signal |
US8135548B2 (en) * | 2006-10-26 | 2012-03-13 | Abbott Diabetes Care Inc. | Method, system and computer program product for real-time detection of sensitivity decline in analyte sensors |
US8892432B2 (en) * | 2007-10-19 | 2014-11-18 | Nec Corporation | Signal processing system, apparatus and method used on the system, and program thereof |
GB2459512B (en) * | 2008-04-25 | 2012-02-15 | Tannoy Ltd | Control system for a transducer array |
WO2009151578A2 (en) * | 2008-06-09 | 2009-12-17 | The Board Of Trustees Of The University Of Illinois | Method and apparatus for blind signal recovery in noisy, reverberant environments |
CN102236050B (zh) * | 2010-04-27 | 2014-05-14 | 叶文俊 | 明视物质相关电磁波记录方法及架构 |
US9818416B1 (en) | 2011-04-19 | 2017-11-14 | Deka Products Limited Partnership | System and method for identifying and processing audio signals |
CN104535969A (zh) * | 2014-12-23 | 2015-04-22 | 电子科技大学 | 一种基于干扰噪声协方差矩阵重构的波束形成方法 |
CN105823492B (zh) * | 2016-03-18 | 2018-08-21 | 北京卫星环境工程研究所 | 一种洋流干扰中微弱目标信号提取方法 |
US10219234B2 (en) * | 2016-08-18 | 2019-02-26 | Allen-Vanguard Corporation | System and method for providing adaptive synchronization of LTE communication systems |
US10429491B2 (en) * | 2016-09-12 | 2019-10-01 | The Boeing Company | Systems and methods for pulse descriptor word generation using blind source separation |
CN106419912A (zh) * | 2016-10-20 | 2017-02-22 | 重庆邮电大学 | 一种多导联脑电信号的眼电伪迹去除方法 |
CN108172231B (zh) * | 2017-12-07 | 2021-07-30 | 中国科学院声学研究所 | 一种基于卡尔曼滤波的去混响方法及系统 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE4020656A1 (de) * | 1990-06-29 | 1992-01-02 | Thomson Brandt Gmbh | Verfahren zur uebertragung eines signals |
US5500879A (en) * | 1992-08-14 | 1996-03-19 | Adtran | Blind signal separation and equalization of full-duplex amplitude modulated signals on a signal transmission line |
US6236731B1 (en) * | 1997-04-16 | 2001-05-22 | Dspfactory Ltd. | Filterbank structure and method for filtering and separating an information signal into different bands, particularly for audio signal in hearing aids |
US6408269B1 (en) * | 1999-03-03 | 2002-06-18 | Industrial Technology Research Institute | Frame-based subband Kalman filtering method and apparatus for speech enhancement |
US20010046268A1 (en) * | 2000-03-06 | 2001-11-29 | Alok Sharma | Transceiver channel bank with reduced connector density |
CN1148905C (zh) * | 2000-06-01 | 2004-05-05 | 华为技术有限公司 | 宽带码分多址中抗深衰减的半盲信道估计方法 |
JP2002023776A (ja) * | 2000-07-13 | 2002-01-25 | Univ Kinki | ブラインドセパレーションにおける話者音声と非音声雑音の識別方法及び話者音声チャンネルの特定方法 |
JP4028680B2 (ja) * | 2000-11-01 | 2007-12-26 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 観測データから原信号を復元する信号分離方法、信号処理装置、モバイル端末装置、および記憶媒体 |
US7171008B2 (en) * | 2002-02-05 | 2007-01-30 | Mh Acoustics, Llc | Reducing noise in audio systems |
US20040252772A1 (en) * | 2002-12-31 | 2004-12-16 | Markku Renfors | Filter bank based signal processing |
US7443917B2 (en) * | 2003-09-02 | 2008-10-28 | Data Jce Ltd | Method and system for transmission of information data over a communication line |
JP4529492B2 (ja) * | 2004-03-11 | 2010-08-25 | 株式会社デンソー | 音声抽出方法、音声抽出装置、音声認識装置、及び、プログラム |
CN1314000C (zh) * | 2004-10-12 | 2007-05-02 | 上海大学 | 基于盲信号分离的语音增强装置 |
-
2006
- 2006-06-05 US US12/301,758 patent/US8351554B2/en active Active
- 2006-06-05 AU AU2006344268A patent/AU2006344268B2/en active Active
- 2006-06-05 EP EP06754127.6A patent/EP2030200B1/en active Active
- 2006-06-05 ES ES06754127.6T patent/ES2654519T3/es active Active
- 2006-06-05 CN CN200680054720XA patent/CN101460999B/zh active Active
- 2006-06-05 BR BRPI0621733A patent/BRPI0621733B1/pt active IP Right Grant
- 2006-06-05 CA CA2652847A patent/CA2652847C/en active Active
- 2006-06-05 WO PCT/EP2006/005347 patent/WO2007140799A1/en active Application Filing
- 2006-06-05 JP JP2009513548A patent/JP5091948B2/ja active Active
-
2009
- 2009-01-02 NO NO20090013A patent/NO341066B1/no unknown
Also Published As
Publication number | Publication date |
---|---|
EP2030200B1 (en) | 2017-10-18 |
NO20090013L (no) | 2009-02-25 |
US8351554B2 (en) | 2013-01-08 |
ES2654519T3 (es) | 2018-02-14 |
AU2006344268A1 (en) | 2007-12-13 |
BRPI0621733B1 (pt) | 2019-09-10 |
CA2652847C (en) | 2015-04-21 |
EP2030200A1 (en) | 2009-03-04 |
NO341066B1 (no) | 2017-08-14 |
BRPI0621733A2 (pt) | 2012-04-24 |
CA2652847A1 (en) | 2007-12-13 |
CN101460999B (zh) | 2011-12-14 |
AU2006344268B2 (en) | 2011-09-29 |
WO2007140799A1 (en) | 2007-12-13 |
US20090257536A1 (en) | 2009-10-15 |
JP2009540344A (ja) | 2009-11-19 |
CN101460999A (zh) | 2009-06-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5091948B2 (ja) | ブラインド信号抽出 | |
US10123113B2 (en) | Selective audio source enhancement | |
US9456275B2 (en) | Cardioid beam with a desired null based acoustic devices, systems, and methods | |
CN110085248B (zh) | 个人通信中降噪和回波消除时的噪声估计 | |
Simmer et al. | Post-filtering techniques | |
US7099821B2 (en) | Separation of target acoustic signals in a multi-transducer arrangement | |
EP2237271B1 (en) | Method for determining a signal component for reducing noise in an input signal | |
JP6547003B2 (ja) | サブバンド信号の適応混合 | |
CN106710601A (zh) | 一种语音信号降噪拾音处理方法和装置及冰箱 | |
TW200849219A (en) | Systems, methods, and apparatus for signal separation | |
JP2011511321A (ja) | 高度に相関する混合のための強調ブラインド信号源分離アルゴリズム | |
US9406293B2 (en) | Apparatuses and methods to detect and obtain desired audio | |
Neo et al. | Robust microphone arrays using subband adaptive filters | |
Spriet et al. | Stochastic gradient-based implementation of spatially preprocessed speech distortion weighted multichannel Wiener filtering for noise reduction in hearing aids | |
RU2417460C2 (ru) | Выделение сигнала вслепую | |
Cao et al. | Speech enhancement using microphone array with multi-stage processing | |
CN112017684B (zh) | 一种基于麦克风阵列的密闭空间混响消除方法 | |
Zou et al. | A broadband speech enhancement technique based on frequency invariant beamforming and GSC | |
Ingerle | Generalised Sidelobe Canceler–Features And Realisation | |
Zhang et al. | A compact-microphone-array-based speech enhancement algorithm using auditory subbands and probability constrained postfilter | |
Bolom et al. | Derivation of Criterion Suitable for Evaluation of Multichannel Noise Reduction Systems for Speech Processing | |
Madhu | Data-driven mask generation for source separation | |
Yerramsetty | Microphone Array Wiener Beamformer and Speaker Localization With emphasis on WOLA Filter Bank |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20111104 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120110 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120404 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120910 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120914 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150921 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5091948 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |