JP2009540378A - 信号分離器、マイクロフォン信号に基づいて出力信号を決定するための方法、及び、コンピュータプログラム - Google Patents

信号分離器、マイクロフォン信号に基づいて出力信号を決定するための方法、及び、コンピュータプログラム Download PDF

Info

Publication number
JP2009540378A
JP2009540378A JP2009514695A JP2009514695A JP2009540378A JP 2009540378 A JP2009540378 A JP 2009540378A JP 2009514695 A JP2009514695 A JP 2009514695A JP 2009514695 A JP2009514695 A JP 2009514695A JP 2009540378 A JP2009540378 A JP 2009540378A
Authority
JP
Japan
Prior art keywords
signal
microphone
partial
source
separator
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2009514695A
Other languages
English (en)
Inventor
ブーフナー、ヘルベルト
アイヒナー、ロベルト
ケラーマン、ヴァルター
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sivantos GmbH
Original Assignee
Siemens Audioligische Technik GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens Audioligische Technik GmbH filed Critical Siemens Audioligische Technik GmbH
Publication of JP2009540378A publication Critical patent/JP2009540378A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating
    • G10L21/028Voice signal separating using properties of sound source
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones

Landscapes

  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Auxiliary Devices For Music (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Stereophonic System (AREA)

Abstract

信号分離器(100)に2つのマイクロフォン信号を受信し、少なくとも2つの信号源のオーディオ成分を分離するための音源分離器(130)が含まれる。音源分離器(130)は、第1の信号源のオーディオ成分を表わし、前記第1の出力信号に相当する第1の部分信号(y1)を得、また、基本的に第2の信号源のオーディオ成分を表わす第2の部分信号(y2)を得る。音源分離器(130)は、処理仕様のパラメータを調整して、第1のマイクロフォン信号に対する第1の部分信号の歪みが最大歪みより小さくなるように、マイクロフォン信号から第1の部分信号を生成し、処理仕様のパラメータを調整して、第2のマイクロフォン信号に対する第2の部分信号の歪みが最大歪みより小さくなるように、マイクロフォン信号から第2の部分信号を生成する。信号分離器には、さらに、第2のマイクロフォン信号から第2の部分信号を除去して、第2の出力信号を得るための信号除去器が含まれて、第2の部分信号が低減する。

Description

本発明は、一般に、マイクロフォン信号内の有用な信号源のオーディオ成分を表わす第1の出力信号を決定し、第2のマイクロフォン信号内の有用な信号源のオーディオ成分を表わす第2の出力信号を決定するための信号分離器、適切な方法、及び、適切なコンピュータプログラムに関するものである。とりわけ、本発明は、ブラインド音源分離システムにおいて空間情報を復元する技法及び方法に関するものである。
多くの技術的応用例では、有用な信号部分のオーディオ成分は入力信号に対してほとんど変わらないようにして出力信号に含まれるが、その一方で、干渉信号部分のオーディオ成分は出力信号において低減させられる。
ブラインド音源分離(以下ではBSSとも呼ばれる)技法は、点音源(例えば室内における音声信号)から統計的に無関係と思われるいくつかの信号を分離するために開発されてきた。それぞれの技法については、例えば[非特許文献1]、[非特許文献2]、[非特許文献3]、及び、[非特許文献4]に記載がある。
いくつかのセンサ(例えばマイクロフォン)を用いて、点音源(または信号源)の畳み込み混合が記録され、下流のマルチチャネル適応フィルタリングを用いて混合解除される。この混合解除は、ある特定の次数の統計的モーメントまで、マルチチャネル適応フィルタリングの出力信号を再び相互に統計的に分離しなければならないという点に基づいている。従って、理想的には、ソース信号の1つ(すなわち、点音源または信号源からの1つの信号)だけが、それぞれ、各出力チャネルに加えられるのがブラインド音源分離の目的である。しかし、その欠点は、混合解除後の出力におけるそれぞれの1チャネル表現のために、点音源(または信号源)に関する空間情報が失われる(とりわけ、センサ間のレベル差及びランタイム差)点にある。
一般に、想定された目的は、点音源または信号源の空間位置に関する空間情報を復元することにある(音源分離出力時に)。いくつかの研究が既に実施され、その分野で言及されて発表されており、後述する。
しかしながら、既知のアプローチには、やはり後述するように依然としていくつかの制限がある。これは、所望の点音源(または信号源)以外に、他の信号源(すなわち、例えばその他の点音源または信号源または干渉源)が、それぞれ、ブラインド信号分離出力(すなわちBSS出力)時に依然として存在する可能性のある現実的な応用シナリオにおいてBSS法を用いる場合にとりわけ発現する。
先行技術によるいくつかの現行システムでは、空間情報は省かれるか(例えば[非特許文献1]、[非特許文献2]、[非特許文献3]、及び、[非特許文献4]参照)、または、下流処理によって復元される。
この問題に関して、文献から4つの方法が知られている。
1.BSSとは無関係にあらかじめ決められた擬似空間特性または空間特性(または伝達関数)でBSS出力信号に下流フィルタリングを施すことによって空間情報が生成される([非特許文献6]、[非特許文献7]、及び、[非特許文献8]参照)。例えば、国際公開第2004/006624 A1号パンフレット([非特許文献8]も参照)には、ヘッド関連伝達関数(HRTF)のデータベースから伝達関数すなわち空間パルス応答を選択する方法が示されている。
2.特定のBSS法では、BSSシステムの混合解除フィルタから空間情報を取り出すことができるように、ブラインドシステム識別を実施することが可能である([非特許文献9]、[非特許文献10]参照)。次に、識別された空間特性を用いてBSS出力信号に下流フィルタリングを施すことによって、空間情報を生成することが可能になる。
3.さらに、ブラインドシステム識別を実施しない方法の場合、BSSシステムの混合解除フィルタから空間情報を取り出すことが可能である。[非特許文献19]には、この情報が下流フィルタリングの一部として用いられる、従って空間特性を含む出力信号を生成する技法が示された。
4.もう1つの概念では、もとのセンサ信号が、後処理ブロック内で出力信号と共にマルチチャネルノイズ低減の処理を受ける([非特許文献5]参照)。
ブラインド音源分離(BSS)と同様に、マルチチャネルノイズ低減も特定の所望の信号(点音源または信号源)を改善する方法であるが、BSSとは対照的にそれぞれの干渉源の定常状態の仮定に基づくものである(例えば[非特許文献11]参照)。
例えば[非特許文献5]に示すように、前述のアプローチには、マルチチャネルノイズ低減システムの出力チャネルyp(n)を基準信号dp(n)として遅延マイクロフォン信号を含んでいるそれぞれの1チャネル適応フィルタに接続するステップが含まれる([非特許文献5]の図1参照)。適応時間離散フィルタがデジタル信号処理に広く用いられる技法の代表である([非特許文献12]参照)。既知の原理は、既知の入力信号を前提としてシステムの出力信号を基準信号に近似させるようにフィルタ係数を決定することにある([非特許文献12]参照)。[非特許文献5]による概念の場合、これは、特定の基準に基づいて(例えば平均二乗誤差に基づいて)誤差信号ep(n)=dp(n)−yp(n)を最小限に抑えることによって実現する。
上述の4つの方法を利用して、所望の点音源(または信号源)の空間位置が正確に再現される。しかし、上述の4つの方法の全てが、所望の点音源以外に、依然として存在する可能性のあるそれぞれの他の信号源の(すなわち別の信号源または干渉源の)残留部分も同じ空間位置にマッピングされるという欠点を有している。
[非特許文献13]には、所望の点音源の空間情報と他の信号源の空間情報との両方を考慮し、同じ位置にマッピングする問題を回避するもう1つの方法が提案されている。[非特許文献13]によるアプローチは、2つ以上の結合BBS基準の同時最適化に基づくものである。これによって、互いに非線形に結合される2つ以上の方程式が得られるが、大域的最適化を求めることができることを保証するのは不可能である。やはり[非特許文献13]による実施例の1つによって明らかになったように、その結果、所望の点音源及び依然として存在する抑制信号源(または別の信号源または干渉源)の残留部分も同じ位置にマッピングされることになる。
さらに、[非特許文献15]には、ウィーナーフィルタリングに基づくノイズ低減を利用して両方の耳の補聴器に関する2つのチャネル間の時間遅延を維持する方法が示されている。[非特許文献15]によれば、いくつかのマイクロフォン信号が2つの独立したマルチチャネルウィーナーフィルタに送られる。ノイズの推定値を表わす第1のウィーナーフィルタの出力信号が第1のマイクロフォン信号から減算される。ノイズのもう1つの推定値を表わす第2のウィーナーフィルタの出力信号が第2のマイクロフォン信号から減算される。従って、出力信号は減算によって得られる。
A.Hyvarinen、J.Harhunen、及び、E.Oja、「Independent Componento Analysis」、ニューヨーク、Wiley & Sons、2001年 L.Prra及びC.Spence、「Convolutive Blind Source Separation of Non−stationary Sources」、IEEE Trans. Speech an Audio Processing、2000年5月、p.302−327 欧州特許第1070390 B1号:提出日が1999年4月8日で、1998年4月8日の優先権を主張する、2005年6月22日に公告された、特許カテゴリ(IPC)H03H 21/00の、「Convolutive Blind Source Separation Using a Multiple Decorrelation Method」と題するL.Parra及びC.Spenceの欧州特許第1070390 B1号明細書 H.Buchner、R.Aichner、及び、W.Kellerman、「Blind Source Separation for Convolutive Mixtures:A Unified Treatment」、Y.Huang、J.Benesty(編集者)、Audio Signal Processing、ボストン、Kluwer Academic Publishers、2004年 T.Hoya、T.Tanaka、A.Cichicki、T.Murakami、G.Hori、及び、J.Chambers、「Stereophonic Noise Reduction Using a Combined Sliding Subspace Projection an Adaptive Signal Enchancement」、IEEE Trans. Speech an Audio Processing、2005年5月、第13巻、第3号、p.309−320 J.Allen及びD.Berkley、「Image Method for Efficiently Simulating Small−Room Acoustics」、J.Acoust.Soc.Am.、1979年、p.943−950 J.Garas、「Adaptive 3D Sound Systems」、Kluwer Academic Publishers、2000年 提出日が2003年6月27日で、2002年7月2日の優先権を主張する、2004年1月15日に公告された、特許カテゴリ(IPC)H04S 1/00の、「Sound Source Spatialization System」と題する、E.Schaefferの国際公開第2004/006624 A1号パンフレット Herbert Buchner、Robert Aichner、及び、Walter Kellermann、「Relation between Blind system Identification and Convolutive Blind Source Separation」、Hands−free Speech Communication and Microphone Arrays Workshop、米国ニュージャージー州ピスカタウェイ、2005年 Herbert Buchner、Robert Aichner、Jochen Stenglein、Heinz Teutsch、及び、Walter Kellermann、「Simulataneous Localization of Multiple Sound Source using Blind Adaptive MIMO Filtering」、Proc.IEEE Int.Conf. on Acoustic,Speech,and Signal Processing(ICASSP)、米国フィラデルフィア、2005年3月 R.Martin、「Noise Power Spectral Density Estimation Based on Optimal Smoothing and Minimum Statistics」、IEEE Trans. Speech and Audio Processing、2001年7月、第9巻、第5号、p.504−512 S.Haykin、「Adaptive Filter Theory」、第4版、Prentice−Hall、2002年 T.Takatani、T.Nishikawa、H.Saruwatari、及び、K.Shikano、「High−Fidelity Blind Separetion of Acoustic Signals using SIMO−Model−Based ICA with Information−Geometric Learning」、Proc.Int.Workshop on Acoustic Echo and Noise Control(IWAENC)、日本、京都、2003年9月 K.Matuoka及びS.Nakshimam、「Minimum Distorsion Principle for Blind Source Separation」、Proc.Int.Conf.on Independent Component Analysis and Blind Signal Separation、米国、カリフォルニア州サンディエゴ、2001年12月 T.J.Klasen、M.Moonen、T.Van den Bogaert、及び、J.Wouters、「Preservation of Interaural time delay for binaural hearing aids through multi−channel Wiener filtering based noise reduction」、Proc.IEEE Int.Conf. on Acousitcs,Speech,and Signal Processing(ICASSP)、米国、フィラデルフィア、2005年3月 W.Herbordt、F.Nakamura、W.Kellermann、「Multi−channel estimation of power spectral density of noise for mixture of non−stationay signals」、IPSJ SIG Technical Report、日本、京都、2004年12月、第2004巻、第131号、p.211−216 W.Herbordt、T.Trini、W.Kellermann、「Robust spatial estimation of the signal−to−interference ratio for non−stationary mixtures」、Proc.Int. Workshop on Acoustic Echo and Noise Control、日本、京都、2003年9月、p.247−250 Herbet Buchner、Robert Aichner、W.Kellermann、「TRINICON:A Versatile Framework for Multichannel Blind Signal Processing」、Proc.IEEE Int.Conf.On Accoustics,Speech and Signal Processing(ICASSP)、カナダ、モントリオール、2004年5月、p.889−892 S.Ikeda、N.Murata、「A method of ICA in time−frequency domain」、Proc.Int.Symposium on Independent Component Analysis and Blind Signal Separation、フランス、Aussois、1999年1月、p.365−371
既述の先行技術を考慮すると、本発明の目的は、出力信号によって十分な正確度で有用な信号源の空間位置が再現され、出力信号において干渉信号源からの干渉信号が低減し、干渉信号源からの残留干渉信号が有用な信号源の位置にマッピングされることがないように、複数の入力信号に基づいて複数の出力信号が生成される信号分離の概念を提供することにある。
この目的は、請求項1または12に記載の信号分離器、請求項23または24に記載の方法、及び、請求項25に記載のコンピュータプログラムによって実現する。
本発明によれば、請求項1に従って、第1のマイクロフォン信号における有用な信号源のオーディオ成分を表わす第1の出力信号を決定し、第2のマイクロフォン信号における有用な信号源のオーディオ成分を表わす第2の出力信号を決定するための信号分離器が提供される。
音源分離器によって生じる第1の部分信号が、ほぼ第1の信号源(有用な信号源)のオーディオ成分に相当し(を表わし)、第1の部分信号が音源分離器の第1の入力信号に対して(例えば、第1のマイクロフォン信号に対して)できる限りほとんど歪みを示さないことも保証されるように音源分離器を構成するのが有利であるというのが、本発明の中核をなす概念である。音源分離器の上述の実施により、第1の部分信号は、結果として、音源分離器の第1の入力信号(すなわち、例えば第1のマイクロフォン信号)における第1の信号源(有用な信号源)によって生じる信号部分にほぼ相当することになる。また、音源分離器によって生じる第2の部分信号が、ほぼ第2の信号源(干渉信号源)のオーディオ成分に相当し、やはり、第2の部分信号が音源分離器の第2の入力信号に対して(例えば、第2のマイクロフォン信号に対して)できる限りほとんど歪みを示さないように音源分離器を実施するのが有利であるということも分かった。従って、第2の部分信号は、音源分離器の第2の入力信号(例えば第2のマイクロフォン信号)に対する第2の信号源(干渉信号源)の影響にほぼ相当することになる。
従って、音源分離器の出力において2つの部分信号が得られるが、第1の部分信号は、基本的に第1の信号源(有用な信号源)のオーディオ信号成分を含んでいて、第1のマイクロフォン信号に対して、多くても最大歪みだけ(またはできるだけ少なく)歪んでおり、さらに、第2の部分信号は、基本的に第2の信号源(干渉信号源)のオーディオ信号成分を含んでいて、第2のマイクロフォン信号に対して、多くても最大歪みだけ(またはできるだけ少なく)歪んでいる。
従って、第1の部分信号は、第1の出力信号として直接利用可能である。第2の部分信号も、第2のマイクロフォン信号から第2の部分信号のオーディオ成分を除去するために直接利用可能であり、第2のマイクロフォン信号から第2の部分信号が除去されるので、第2の出力信号が生じることになる。
本発明のやり方では、第1の部分信号は、第1のマイクロフォン信号に対してできるだけ少ない歪みを示すことになる。従って、第1の部分信号における第1の信号源のオーディオ成分に関する位相情報は、第1のマイクロフォン信号における第1の信号源のオーディオ成分に関する位相情報と一致する。ちなみに、おそらく依然として第1の部分信号に含まれている可能性のある第2の信号源のオーディオ成分の残留部分に関する位相情報には、第1のマイクロフォン信号と第1の部分信号との間における歪みの制限のために、第1のマイクロフォン信号における第2の信号源のオーディオ成分と同じ位相情報が含まれている。従って、部分信号の生成時に歪みを制限することによって、第1の部分信号または第1の出力信号における第2の信号源オーディオ成分は、第1の信号源のオーディオ成分がマッピングされる位置とは異なる位置(一般に第2の信号源の位置)にマッピングされることになる。
第2のマイクロフォン信号に対する第2の部分信号における第2の信号源のオーディオ成分の歪みも同じ方法で制限される。従って、第2の部分信号は、例えば単純な差生成によって第2のマイクロフォン信号から第2の信号源のオーディオ成分を除去するのに極めて適している。すなわち、第2の部分信号は、第2のマイクロフォン信号における第2の信号源の部分に歪みのない形でほぼ一致するので、第2のマイクロフォン信号と第2の部分信号との差は、第2のマイクロフォン信号における第1の信号源から生じるオーディオ成分にほぼ相当する。
さらに、第2の部分信号は、第2のマイクロフォン信号に対して制限された程度にしか歪んでいないかまたは位相が変化していないので、第2の部分信号はその正しい空間位置における第2の信号源を表している。従って、第2の信号源のオーディオ成分は信号除去器によって空間的に正しいやり方で除去され、その結果、第2の出力信号における第2の信号源のオーディオ成分の残留部分が最小限に抑えられる。
さらに、第1の信号源の残留信号部分が、第2の部分信号において第2の入力信号(例えば第2のマイクロフォン信号)に対して空間的に正しく表わされる。このようにして、第2のマイクロフォン信号から第2の部分信号を除去すると(例えば差を生成することによって)、空間に関して誤って位置を特定された第1の信号源のオーディオ成分の一部が、第1の信号源の残留信号部分によって取り込まれることになる。
さらに、本発明による音源分離器の導入によって、第2のマイクロフォン信号と第2の部分信号との間の歪みが音源分離器によって制限されるので、信号除去器を特定の単純なやり方で実施することが可能になる。
従って、本発明による信号分離器は、音源分離器における信号歪みの制限によって、音源分離器の出力信号が(直接及びさらなる後処理を伴わずに)第1の信号源及び第2の信号源空間位置を表わすという極めて重要な利点をもたらすことになる。第1の部分信号は、第1のマイクロフォン信号における信号源から生じた部分を直接表わし、その一方で、第2のマイクロフォン信号における第1の信号源の部分は、ただ単に第2のマイクロフォン信号から第2の部分信号を除去するだけで得られる。従って、第1及び第2の出力信号は、音響センサの位置で知覚される第1の信号源の空間位置を正確に表わすことになり、干渉は出力信号における第2の信号源によって大幅に抑制されることになる。
また、用いられる音源分離器は、その出力においてさまざまな信号源のオーディオ成分の1チャネル表現を生じる従来の音源分離器とすることが可能であり、この従来の音源分離器の導入は、ただ単にその第1の入力(第1のマイクロフォン信号に関する)とその第1の出力(第1の部分信号に関する)との間の歪みを制限するかまたは最小限に抑えるため、並びに、その第2の入力(第2のマイクロフォン信号に関する)とその第2の出力(第2の部分信号に関する)との間の歪みを制限するかまたは最小限に抑えるために必要とされるだけである。
さらに、本発明による信号分離器は、干渉信号源の残留部分が入力信号に対するそれらの空間位置に関して変化しないか、または、マイクロフォン信号すなわち干渉信号源からの残留信号が干渉信号源のもとの位置または実際の位置にマッピングされるという利点をもたらす。
望ましい実施形態の場合、音源分離器は、室内における少なくとも2つの信号源の空間位置が原因でまたはそれらの統計的特性が原因でそれら信号源(すなわち、有用な信号源及び干渉信号源)のオーディオ成分を分離するために導入される。それらの相関特性のために信号源を分離するのはとりわけ有利である。というのは、この場合、信号分離がブラインド方式ですなわち信号源の空間位置または室内における音の伝搬に関する予備知識を持たずに実施されるからである。従って、音源分離器は、最小限の予備情報すなわち信号源によって発生する信号の相関特性または信号統計データに関する情報だけしか必要としない。
もう1つの実施形態では、音源分離器は、第1のマイクロフォン信号に対する第1の部分信号の歪みの測度の関数として第1の部分信号を生成し、第1のマイクロフォン信号に対する第1の部分信号の歪みに対する上限を設定するための処理仕様のパラメータを決定するようになっている。換言すれば、第1の部分信号及び第2の部分信号を決定するための処理仕様のパラメータが、歪みに上限があるように決定される。これは、例えば処理仕様のパラメータに関する値空間を事前に定義することによって実施可能であり、値空間は、歪みが最大歪みより小さくなるように選択される。例えば、事前定義には、第1の部分信号が所定のノルム(例えば平均平方)に従って所定の最大偏差未満の値だけ第1のマイクロフォン信号と異なると指定することが可能である。
実施形態の1つでは、音源分離器は、第1のマイクロフォン信号と第1の部分信号との間の歪みが所定のしきい値を超えることが立証された場合に、その歪みが低減するように処理仕様のパラメータを変更するために導入される。代わりにまたは追加として、音源分離器は、さらに、処理仕様のパラメータを設定または最適化する場合に、第1のマイクロフォン信号に対する第1の部分信号(または第2のマクロフォン信号に対する第2の部分信号)の歪みの測度を考慮して導入することも可能である(例えば[非特許文献14])。
上述の測度を用いて、概して言えば、第1のマイクロフォン信号と第1の部分信号の間(または第2のマイクロフォン信号と第2の部分信号の間)の歪みに上限が規定されるか、または、前記歪みが最小限に抑えられることになる。
もう1つの望ましい実施形態の場合、音源分離器は、費用関数を用いた最適化によって第1の部分信号及び第2の部分信号を生成するための1つの処理仕様(または複数の処理仕様)のパラメータを決定するために導入される。上述の最適化によって、信号源のセパレーション(部分信号間の統計的独立性)と歪みとのバランスを含む可能性のある最良の結果を実現することが可能になる。
もう1つの代替実施形態によれば、本発明には請求項12に記載の信号分離器が含まれる。
請求項10に記載の信号分離器は、音源分離器によって少なくとも2つのマイクロフォン信号による干渉信号源から干渉信号を抽出し、可調整フィルタによって結果生じる部分信号を異なるやり方で少なくとも2回歪ませ、第1のマイクロフォン信号から第1の歪み部分信号を除去し、第2のマイクロフォン信号から第2の歪み部分信号を除去するのが有利であるという中核概念に基づくものである。この結果、第1の補正マイクロフォン信号によって第1の出力信号が生じ、第2の補正マイクロフォン信号によって第2の出力信号が生じることになる。第1の歪み部分信号の生成におけるフィルタパラメータ及び第2の歪み部分信号の生成におけるフィルタパラメータを互いに独立して調整して、さまざまな方法で歪みを生じさせられた干渉信号源の変形干渉信号が第1のマイクロフォン信号及び第2のマイクロフォン信号から除去されるようにするために、さらにパラメータ調整器が導入される。パラメータ調整器は、従って、相互に独立して第1及び第2の歪み部分信号を生成するためのパラメータを調整し、両方のマイクロフォン信号において干渉信号源のオーディオ成分を別個に最小限に抑えるかまたは低減させるために導入される。これは、既知のように、干渉信号源と音響センサの間にはマイクロフォン信号を発生するための異なる伝搬経路が存在するため、第1のマイクロフォン信号における干渉信号源の影響が第2のマイクロフォン信号における干渉信号源の影響と異なるので有利である。
さらに、例えば、第1の補正マイクロフォン信号における干渉信号源のオーディオ成分が信号除去器の出力で低減するように実施するのが望ましい部分信号の適応歪みによって、第1の歪み部分信号において、干渉信号源が第1のマイクロフォン信号によって表わされるのと同じ空間位置に確実にマッピングされることになる。従って、第1の歪み部分信号と第1のマイクロフォン信号を組み合わせると、干渉信号源のオーディオ成分の残留部分が干渉信号源の実際の空間位置にマッピングされることになる。
それから類推すると、第2の出力信号において、干渉信号源の残留部分は上述のアプローチに基づいて干渉信号源の実際の位置にマッピングされる。従って、干渉信号源の残留部分が出力信号に存在する限りにおいて、両方の出力信号における干渉信号源の位置は、正確に表わされることになる。
さらに、2つの出力信号は、基本的に2つの入力信号またはマイクロフォン信号に直接基づくものであり、干渉信号源の信号部分だけが入力信号またはマイクロフォン信号から除去されるという点に留意しなければならない。従って、2つの出力信号は、やはり有用な信号源の空間位置を正確に再現することになる。
本発明による信号分離器のもう1つの利点は、2つのマイクロフォン信号から干渉信号源の信号を抽出できなければならないのは音源分離器だけという点である。従って、干渉信号源のオーディオ成分を再現する1チャネル出力信号を生成する必要があるのは音源分離器だけである。音源分離器に生じる可能性のあるマイクロフォン信号に対する部分信号の歪みは、可調整フィルタによって相殺されるが、可調整フィルタは、互いに独立して調整することが可能な2つの方法で部分信号を歪ませて、それぞれ異なる形で歪んだ干渉源の変形干渉信号を両方のマイクロフォン信号から除去する必要があるという事実を公正に評価する。
もう1つの望ましい実施形態では、第1の補正マイクロフォン信号におけるパワーと第2の補正マイクロフォン信号におけるパワーを決定し、第1の可調整フィルタのフィルタパラメータを変化させて、第1の補正マイクロフォン信号におけるパワーを低下させ、第2の可調整フィルタのフィルタパラメータを変化させて、第2の補正マイクロフォン信号におけるパワーを低下させるために、パラメータ調整器が導入される。実際には、第1の補正マイクロフォン信号のパワー及び第2の補正マイクロフォン信号のパワーは、第1及び第2の歪み部分信号を生成する場合に、可調整フィルタによって部分信号の歪が正しく調整されるか否かの容易に利用可能な判定基準になることが分かった。基本的に第1及び第2の歪み部分信号には干渉信号源による1つの信号部分だけしか含まれていないので、例えば、第1の補正マイクロフォン信号において干渉信号源のオーディオ成分が最小限に抑えられるように可調整フィルタの調整が行われる場合、第1の補正マイクロフォン信号のパワーは最小になる。上述の事実は、有用な信号源の信号が極めて弱い時間間隔に特定の効率の良いやり方で活用することも可能である。というのは、干渉信号源からの信号がマイクロフォン信号において優勢になるためである。上述と同様のことが、第2の歪み部分信号を生成するためのフィルタパラメータの最適な調整にも当てはまる。
ここで指摘しておくべきは、意図する信号が、例えばそれに関連したエネルギまたは(平均)パワーを有している可能性のある、例えばブロックまたは一時的部分でもあるという点である。
もう1つの望ましい実施形態の場合、パラメータ調整器には、少なくとも最低限の有用な信号強度を備えた有用な信号源からの有用な信号が第1及び/または第2のマイクロフォン信号に存在する場合にそれを認識するために導入される有用信号認識器が含まれている。パラメータ調整器は、さらに、少なくとも最低限の有用な信号強度を備える有用な信号が存在しない場合に限ってフィルタパラメータを変化させるために導入される。すなわち、補正されたマイクロフォン信号のパワーを最小限に抑えることによって、フィルタパラメータの調整を最適に実施することが可能になることが分かった。具体的には、有用な信号が全くないかまたは極めて小さいものしかない場合、補正されたマイクロフォン信号における干渉信号源のオーディオ成分の最適な低減が生じるように可調整フィルタのフィルタパラメータを調整すると、補正されたマイクロフォン信号のパワーがゼロになるかまたは少なくとも極めて小さくなる。
本発明の望ましい実施形態については、付属の図に関連してさらに詳細に後述することにする。
図1には、本発明第1の実施形態による二次条件を備えた音源分離器を用いる本発明の信号分離器のブロック図が示されている。図1による構成は全体が100で表示されている。信号分離器100は、2つのマイクロフォンまたは音響センサ110、112から2つのマイクロフォン信号x1、x2を受信する。マイクロフォンまたは音響センサ110、112は、少なくとも2つの信号源120、122からの音響信号を記録するが、下記において第1の信号源120は有用信号源と呼ばれ、下記において第2の信号源122は干渉信号源と呼ばれる。一般に、有用信号源120は、第1の音響センサ110及び第2の音響センサ112の両方によって感知することが可能である。また、干渉信号源も、一般に第1の音響センサ110及び第2の音響センサ112の両方によって感知することが可能である。従って、第1のマイクロフォン信号x1には、一般に有用信号源120と干渉信号源122の両方からの信号部分が含まれている。同様に、第2のマイクロフォン信号x2にも、一般に有用信号源120と干渉信号源122の両方からの信号部分が含まれている。
ここで留意すべきは、マイクロフォン信号x1及びx2は、マイクロフォンまたは音響センサ110、112によって直接生成する必要はなく、例えばオーディオ信号の伝送によって(例えばアナログまたはデジタルデータリンクを介した)生成することもできるという点である。さらに、マイクロフォン信号x1、x2はオーディオ再生装置またはコンピュータから生じる場合もある。
ブラインド音源分離器130は、2つのマイクロフォン信号x1、x2を受信して、マイクロフォン信号x1、x2に基づいて2つの部分信号y1、y2を生成する。これに関して、第1の部分信号y1には、基本的に有用信号源120のオーディオ成分が含まれているが、第2の部分信号y2には、基本的に干渉信号源122のオーディオ成分が含まれている。第1の部分信号y1によって第1の出力信号a1が生じる。オプションの遅延手段136によって、第2のマイクロフォン信号x2が遅延し、従って、遅延マイクロフォン信号x2′が生じる。差生成器140が、遅延した第2のマイクロフォン信号x2′を受信するが、差生成器140は、遅延した第2のマイクロフォン信号x2′から第2の部分信号y2を減算するために導入される。こうして、差生成器140は、遅延した第2のマイクロフォン信号x2′と第2の部分信号y2の間の差として第2の出力信号a2を生成することになる。
遅延手段136なしで済ます場合、遅延した第2のマイクロフォン信号x2′は第2のマイクロフォン信号x2と同じになる。
本発明の信号分離器100の構造説明に基づいて、以下ではその機能について述べることにする。
ブラインド音源分離器130は、二次条件を利用している間にブラインド音源分離を実施するために導入される。ブラインド音源分離器は、基本的に第1の信号源または有用信号源120のオーディオ成分を含んでいる第1の部分信号y1を送り出すが、ここで、第2の信号源または干渉信号源122のオーディオ成分は、第1の信号源または有用信号源120のオーディオ成分より少なくとも3dB、ただし望ましいのは6dB(ただし、さらに望ましいのは少なくとも10dBないし少なくとも20dB)弱い。さらに、ブラインド音源分離器130は、第2の部分信号に基本的に第2の信号源または干渉信号源122のオーディオ成分が含まれるように、すなわち、例えば、第2の部分信号y2における第1の信号源120のオーディオ成分が、干渉信号源のオーディオ成分より少なくとも3dB、ただし望ましいのは6dB(ただし、さらに望ましいのは少なくとも10dBないし少なくとも20dB)弱くなるように第2の部分信号y2を生成するために導入される。従って、ブラインド音源分離器130は、2つの部分信号y1及びy2として、基本的に互いに独立した1チャネル信号として第1の信号源120及び第2の信号源122のオーディオ成分を含む2つの信号を生成する。
ブラインド音源分離器130は、さらに、第1の部分信号y1と第1のマイクロフォン信号x1との間の歪みが最大歪みより小さくなることを保証するために導入されるが、この最大歪みは一般に事前定義される。最大歪みは、例えば第1の部分信号y1と第1のマイクロフォン信号x1との間の平均2乗偏差によって規定することが可能である。第1の部分信号y1と第1のマイクロフォン信号x1との間の偏差の測度は、例えば第1のマイクロフォン信号x1におけるパワー及び/または第1の部分信号y1におけるパワーと関連づけることも可能である。
オプションにより、ブラインド音源分離器130は、さらに、第2の部分信号y2と第2のマイクロフォン信号x2との間の歪みが最大歪みより小さくなることを保証するために導入することが可能であるが、この最大歪みは一般に事前定義される。第2のマイクロフォン信号x2に対する第2の部分信号y2の最大歪みは、例えば第1のマイクロフォン信号に対する第1の部分信号y1の最大歪みと同じとすることもできるし、あるいは、それとは異なるようにすることも可能である。望ましい実施形態の1つでは、ブラインド音源分離器130は、第1のマイクロフォン信号x1に対する第1の部分信号y1の歪みと第2のマイクロフォン信号x2に対する第2の部分信号y2の歪みの両方に対する上限を規定するために導入される。
ブラインド音源分離器130は、さらに、第1のマイクロフォン信号x1に対する第1の部分信号y1の歪み(オプションにより、さらに第2のマイクロフォン信号x2に対する第2の部分信号y2の歪み)を最小限に抑えるために、または、パラメータの調整時に歪みの大きさを表わす少なくとも1つの基準を考慮して導入することが可能である。二次条件を備え、歪みの最適化または最小化を可能にするブラインド音源分離器の導入に関する詳細については、例えばK.Matsuoka及びS.Nakashimaによる[非特許文献14]に記載がある。
従って、歪みを制限(または最適化または最小化)することになる上述の二次条件を有するブラインド音源分離器130によって、第1の部分信号y1が基本的に第1の信号源120のオーディオ成分を含んでおり、さらに、第1のマイクロフォン信号x1に対してあまり歪まないことが保証される。
従って、ブラインド音源分離器130は、第1の部分信号y1に、基本的に第1の信号源120から生じる第1のマイクロフォン信号x1の部分が含まれるように導入される。一方、第2の信号源122の信号部分は、第1の部分信号y1において低減させられるかまたは抑制される。従って、実質的には第1の部分信号y1と同じである出力信号a1は、マイクロフォン信号x1に含まれる第1の信号源の部分を表わし、さらに、第1のマイクロフォン信号x1に対してほんのわずかだけ歪んでいる(ブラインド信号分離器130の二次条件によって指定される枠組み内で)。換言すれば、第1の出力信号a1と第1のマイクロフォン信号x1との間の位相ずれは、ブラインド音源分離器130の調整とほとんど無関係である。換言すれば、第1の出力信号a1と第1のマイクロフォン信号x1との間の位相ずれは、基本的にあらかじめ決められ、しかも、ブラインド音源分離器130の調整変更時に、できれば+/−20°を超えて変動しない(ただし、+/−10°以下または+/−5°以下であればさらに望ましい)か、あるいは、そのいずれかである。同様に、二次条件を有するブラインド音源分離器130は、第2の部分信号y2と第2のマイクロフォン信号x2との間の位相ずれが、ブラインド音源分離器130の調整変更時に、+/−20°未満の変動(ただし、+/−10°以下または+/−5°以下であればさらに望ましい)を生じるように導入される。
ブラインド音源分離器130のそれぞれの導入によって(二次条件に基づく)、第1の部分信号y1に基づくかまたは第1の部分信号y1と同じである第1の出力信号a1において、第1の信号源120が位置に関して正確に表わされるという保証が得られる。また、第2の部分信号y2に、第2の信号源122のオーディオ成分が第2のマイクロフォン信号x2に対してほとんど歪まない形で含まれることになり、その結果、差生成器140によって第2の信号源122のオーディオ成分を第2のマイクロフォン信号x2からまたは遅延した第2のマイクロフォン信号x2′から除去することが可能になるという保証も得られる。第2の出力信号a2は、基本的に第2のマイクロフォン信号x2に基づくものであり、第2の部分信号y2の遅延及び除去によってのみ第2のマイクロフォン信号x2に対して変化するので、第2の出力信号a2における第1の信号源120の空間位置は正確に表わされる。さらに、構成100によれば、出力信号a1、a2において、第2の信号源122の空間位置または第2の信号源122によって生じる残留部分も正確に表わされることになる。
指摘しておかなければならないのは、構成100にはオプショナルセレクタ150が含まれるという点である。しかし、図示の実施形態において、第1の出力に第1の出力信号a1として第1の部分信号y1を供給し、差生成器140に第2の部分信号y2を供給するタスクを行うのはセレクタ150だけである。ただし、図2にはセレクタ150の異なるスイッチング状態が示されている。
図2には、本発明の第2の実施形態による本発明の信号分離器のブロック図が示されている。図2による信号分離器は全体が200で表示されている。図2による信号分離器200は、図1による信号分離器100と極めてよく似ているので、図1及び2の同じ特徴及び/または信号は、同じように指定されるので、ここでは再度の説明を控えることにする。
図2による構成200と図1による構成100は、構成200に関して、第2の信号源122は有用信号を生じるが、第1の信号源120は干渉信号を生じるという点において基本的に異なっている。さらに、第2の部分信号y2には基本的に第2の信号源122のオーディオ成分が含まれており、一方、第1の部分信号y1には基本的に第1の信号源120のオーディオ成分が含まれているものと考えられる。このため、第2の部分信号y2は、第2のマイクロフォン信号x2における第2の信号源122によって生じた信号部分を表わす出力信号に相当する。このため、構成200におけるセレクタ150は、第2の信号出力において第2の出力信号a2として第2の部分信号y2を送り出すように構成されている。しかし、差生成器140は、基本的に干渉信号源120からの干渉信号を含む第1の部分信号y1を受信する。また、差生成器140は、第1のマイクロフォン信号x1またはオプションの遅延手段136によって遅延した第1のマイクロフォン信号x1′を受信する。従って、差生成器140の出力信号は、第1の出力信号a1をなし、第1の出力に送られる(例えばもう1つのセレクタを介して)。
要するに、ブラインド音源分離の枠組み内において、有用信号が存在する音源分離器の出力、及び、干渉信号が存在する音源分離器の出力が前もって指定されないように設定することが可能である。従って、セレクタによって、音源分離器の出力のうちのどれが有用な信号を備え、従って信号分離器の出力に直接結合されるかに関する選択、及び、音源分離器の出力のうちのどれが干渉信号を備え、従って干渉信号除去手段に結合されるかに関する選択が行われるのが望ましい。
セレクタによって行われるこの選択は、例えば[非特許文献10]に記載のように、例えば(必ずしもそうとは限らないが)音源の位置に関する空間情報に基づいて実施される。
図1による第1の実施形態では、音源分離器(または音源分離器のコア)の第1の出力信号y1が有用信号を有しており、一方、音源分離器(または音源分離器のコア)の第2の出力信号y2は干渉信号を有している。従ってこの場合、第1の出力信号y1は第1の部分信号z1をなし、一方、第2の出力信号y2は第2の部分信号z2をなす。
図1による第2の実施形態では、音源分離器(または音源分離器のコア)の第1の出力信号y1が干渉信号を有しており、一方、音源分離器(または音源分離器のコア)の第2の出力信号y2は有用信号を有している。従ってこの場合、第1の出力信号y1は第2の部分信号z2をなし、一方、第2の出力信号y2は第1の部分信号z1をなす。
従って、一般には、干渉信号が除去されるマイクロフォン信号に対する第2の部分信号(または干渉信号)の歪みがなるべく制限されるように(例えば二次条件によって)設定することが可能である。しかし、第1の部分信号によって置き換えられるマイクロフォン信号に対する第1の部分信号(または有用信号)の歪みは制限されるのが望ましい。
図3には、本発明の第3の実施形態による可調整フィルタを用いた本発明による音源分離器のブロック図が示されている。図3による構成は、全体が300で表示されている。構成300には、2つのマイクロフォンまたは音響センサ310、312が含まれており、第1の音響センサ310は第1のマイクロフォン信号x1を送り出し、第2の音響センサ312は第2のマイクロフォン信号x2を送り出す。上記で既に例示のように、マイクロフォン信号は、例えば信号伝送手段、オーディオ信号再生手段、または、コンピュータのような他の音源から生じる可能性もある。
図3には、さらに第1の信号源320並びに第2の信号源322が示されているが、これらは両方ともマイクロフォン信号x1、x2において反映される音響信号を送り出す。図3に関連して、下記では信号源320が有用信号源をなし、第2の信号源322が干渉信号源をなすと仮定するものとする。構成300には、さらにブラインド音源分離器(BSS)330が含まれている。ブラインド音源分離器330は、第1のマイクロフォン信号x1及び第2のマイクロフォン信号x2を受信するが、さらに、第1及び第2のマイクロフォン信号x1、x2から部分信号y2を抽出するためにも導入される。構成300には、さらに2つの可調整フィルタ340、350も含まれており、両方ともフィルタリングを施すべき入力信号として部分信号y2を受信する。第1の可調整フィルタ340は、部分信号y2に基づいて第1の歪み部分信号y2′を生成する。第2の可調整フィルタ350は、部分信号y2に基づいて第2の歪み部分信号y2″を生成する。構成300には、さらに第1の差生成器360並びに第2の差生成器370が含まれている。第1の差生成器360は、第1のマイクロフォン信号x1または第1のマイクロフォン信号x1に基づく信号x1′を受信する。第1のマイクロフォン信号x1′に基づく信号は、例えばフィルタ380におけるオプションの全通過フィルタリングによって第1のマイクロフォン信号から生じる。また一方では、代替案として、信号x1′は第1のマイクロフォン信号x1と同じとすることも可能である。従って、差生成器360は、信号x1′から第1の歪み部分信号y2′を減算することによって、第1の出力信号e1(a1とも呼ばれる)を得る。さらに、第2の差生成器370は、第2のマイクロフォン信号x2に基づく信号x2′を受信するが、信号x2′は、例えばフィルタ382における(オプションの)全通過フィルタリングによって第2のマイクロフォン信号x2から生じる。また一方では、信号x2′は第2のマイクロフォン信号x2と同じとすることも可能である。
第2の差生成器370は、信号x2′から(または第2のマイクロフォン信号x2から)第2の歪み部分信号y2″を減算し、その結果として、第2の出力信号e2(a2とも呼ばれる)を得る。
第1の可調整フィルタ340に関連したパラメータ調整器386(適応コントローラとも呼ばれる)が、第1の出力信号e1を受信するが、第1の出力信号e1の関数として行われるフィルタリングのパラメータを調整するために導入される。換言すれば、第1の出力信号e1は第1の可調整フィルタ340に関する誤差信号をなす。同様に、第2の可調整フィルタ350に関連したパラメータ調整器388(適応コントローラとも呼ばれる)が第2の出力信号e2を受信して、フィルタパラメータを調整する。従って、第2の出力信号e2は第2の可調整フィルタ350に関する誤差信号の働きをする。可調整フィルタ340、350は、そのフィルタパラメータが、関連誤差信号に基づいて関連パラメータ調整器または適応コントローラ386、388によって調整される適応フィルタが望ましい。
ここで指摘しておかなければならないのは、第1の可調整フィルタ340及び第2の可調整フィルタ350は、相互に独立して、部分信号y2から第1の歪み部分信号y2′及び第2の歪み部分信号y2″を生成する単一フィルタとして実現することも可能である。この場合も、第1の出力信号e1は、部分信号y2から第1の歪み部分信号y2′を生成するために用いられるフィルタパラメータの調整に役立つ。第2の出力信号e2は、部分信号y2から第2の歪み部分信号y2″を生成するために用いられるフィルタパラメータの調整に役立つ。
従って、フィルタ340、350は、そのフィルタ特性が、関連する出力信号e1、e2の関数としてパラメータ調整器または適応コントローラ386、388によって調整される適応フィルタであり、第1の出力信号e1は、第1のマイクロフォン信号x1(またはそれに基づいて遅延させられた及び/または全通過フィルタリングを施された信号x1′)と第1の歪み部分信号y2′の間の差を表わし、第2の出力信号e2は、第2のマイクロフォン信号x2(または遅延及び/または全通過フィルタリングによってそれから得られた信号x2′)と第2の歪み部分信号y2″の間の差を表わしている。
一般に、結果として、第1のフィルタ340は、パラメータ調整器386に関連して、第1の歪み部分信号y2′が(できるだけうまく)第1のマイクロフォン信号x1またはそれから得られる信号x1′に一致するようにフィルタパラメータを調整するために導入される適応フィルタとみなすことも可能である。換言すれば、第1のマイクロフォン信号x1またはそれから得られる信号x1′は、第1の可調整フィルタ340のフィルタパラメータを調整するための基準信号の働きをする。同様に、第2のマイクロフォン信号x2またはそれから得られる信号x2′は、第2の可調整フィルタ350のフィルタパラメータを調整して、望ましくは第2の歪み部分信号が(できるだけうまく)第2のマイクロフォン信号x2またはそれから得られる信号x2′に一致するように第2のフィルタを調整するための基準信号の働きをする。
留意しなければならないのは、マイクロフォン信号x1、x2またはそれから得られる信号x1′、x2′に実質的に干渉信号源322の一部だけしか含まれていない場合、可調整フィルタ340または350のフィルタ係数の調整を実施するのが望ましいという点である。この場合、第1の歪み部分信号y2′が、マイクロフォン信号x1または信号x1′における干渉信号源322によって生じる部分にほぼ一致し、第2の歪み部分信号y2″が、第2のマイクロフォン信号x2または信号x2′に含まれる干渉信号源322の部分にほぼ一致するように、出力信号e1、e2に基づいてフィルタ340、350のパラメータを調節することが可能である。上述の条件の枠組み内において、第1の出力信号e1及び第2の出力信号e2における干渉信号源322によって生じる部分が、有効に低減するか、または、おそらく最小限に抑えられることになりさえする。(例えばパワーまたはエネルギに関して)。
マイクロフォン信号x1、x2に実質的に干渉信号源322の一部だけしか含まれていない場合、すなわち、マイクロフォン信号x1、x2に有用信号源320のごくわずかな部分だけしか含まれていない場合には、第1の可調整フィルタ340及び第2の可調整フィルタ350のフィルタパラメータは、このように調整するかまたは適応させるのが望ましい。このため、構成300には、例えば、有用信号源320からの有用信号が所定のしきい値レベルまたは可変しきい値レベル未満の場合にそれを認識するために導入される有用信号検出器390がオプションで含まれている。このため、例えば、有用信号検出器390は、第1のマイクロフォン信号x1及び第2のマイクロフォン信号x2(または代わりにこれらのマイクロフォン信号の一方だけ)を受信する。有用信号検出器390は、例えば、音声信号がある場合にそれを認識する音声検出器とすることが可能である(例えば、音声信号だけが有用信号と意図されている場合)。従って、有用信号検出器390は、適応コントローラ386、388のための制御手段として機能することが可能であり、マイクロフォン信号x1、x2における有用信号のオーディオ成分が所定のしきい値または可変しきい値より弱い場合に限って、それらのフィルタパラメータを変更するかまたは適応させるように、可調整フィルタ340、350に関連した適応コントローラ386、388を(オプションにより)制御することが可能である。
有用信号検出器390が用いられるか否かに関係なく(ただし有用信号検出器390の使用に関しては望ましい)、例えば、第1の出力信号e1または第2の出力信号e2のパワーまたはエネルギがフィルタパラメータの変更によって低減するか、または、上述のパワーまたはエネルギがフィルタパラメータの変更によって最小限に抑えられるように、それぞれのフィルタパラメータを調整するために、可調整フィルタ340、350に関連した適応コントローラ386、388を導入することが可能である。換言すれば、フィルタパラメータの調整において、例えば、第1の出力信号e1に含まれているパワーまたはエネルギ及び/または第2の出力信号e2に含まれているパワーまたはエネルギが低減するようなやり方でのみ、フィルタパラメータの変更を許すことが可能である。従って、第1の出力信号e1または第2の出力信号e2におけるパワーまたはエネルギは、例えば信号x1′と第1の歪み部分信号y2′との間または信号x2′と第2の歪み部分信号y2″との間の偏差を表わした平方誤差と解釈することも可能である。
換言すれば、信号x1′と第1の歪み部分信号y2′との間の偏差を距離の測度に関して縮小するかまたは最小限に抑えるようなやり方で、例えば第1の可調整フィルタ340のフィルタパラメータを変更する(関連する適応コントローラ386を用いて)ことが望ましい。距離の測度は、例えば差分信号または誤差信号e1の任意の数学的ノルムとすることが可能である。第2の可調整フィルタ350のフィルタパラメータは、同じようなやり方で調整可能である(関連する適応コントローラ388によって)。
モニタされたフィルタの適応制御に関するさらなる詳細については、例えば[非特許文献16]及び[非特許文献17]から知ることが可能である。本発明の概念の望ましい実施例では、[非特許文献17]の方程式2に従う適応コントローラが用いられる。本発明の概念内で用いられる適応コントローラは、2つのパワー密度スペクトルの計算方法に関して[非特許文献17]に示された適応コントローラとは異なる。本発明の概念内において、ブラインド音源分離(BSS)の出力信号のパワー密度スペクトルを推定するのが望ましい。さらに、マイクロフォン信号とブラインド音源分離の出力信号との間の差分信号(たとえば信号e1、e2)のパワー密度スペクトルを推定するのが望ましい。
図4には、本発明の第4の実施形態による本発明の信号分離器のブロック図が示されている。図4による信号分離器は全体が400で表示されている。図4による信号分離器400は図3による信号分離器300と極めてよく似ているので、図3及び4における同じ特徴または信号は同じ参照番号で表示されている。
図4による信号分離器400と図3による信号分離器300とは、信号分離器400が第2のセレクタ410、420を用いて再構成可能であるという点において基本的に異なる。さらに、オプションによりブラインド音源分離器330は図4による信号分離器400内において二次条件を用いてまたは用いずに操作することが可能である。換言すれば、第1のマイクロフォン信号x1と第1の部分信号y1との間または第2のマイクロフォン信号x2と第2の部分信号y2との間の歪みは、制限することもできるし、あるいは、自由に任意の値にすることも可能である。
第1の構成可能状態において、ブラインド音源分離器330は二次条件で動作し、第1の部分信号y1として、第1のマイクロフォン信号x1に対する歪みが制限されるか、低減させられるか、または、最小限に抑えられる信号を出力するものと仮定する。この場合、第1のセレクタ410は、信号z1として第1の部分信号y1を第2のセレクタ420に送る。第2のセレクタ420は、続いて第1の出力信号a1として信号z1を第1の出力に送る。さらに、第1のセレクタ410は、信号z2として第2の部分信号y2を第1の可調整フィルタ340及び第2の可調整フィルタ350に送る。また、第2セレクタ420は、信号a2として信号e2を第2の出力に送る。オプションの全通過フィルタまたは遅延手段382が、第2の差生成器370とちょうど同じようにこの状態で活動状態になる。前述の動作状態において、第2の可調整フィルタ350は、信号y2″として信号z2を不変のまま第2の差生成器370に送る。前述の状態において、信号e1が利用されないので、第1の差生成器360、第1の可調整フィルタ340、及び、第1の全通過フィルタまたは遅延手段380はオプションにより停止状態にすることが可能である。また、第2の可調整フィルタ350も停止状態にするかまたはバイパスすることが可能である。
第2の動作状態において、ブラインド音源分離器330は二次条件で動作させられるが、第2の部分信号y2は第2のマイクロフォン信号x2に基づく有用信号を表わしている。この場合、第1のセレクタ410は、信号z1として第2の部分信号y2を第2のセレクタ420に送る。第2の動作状態において、第2のセレクタ420は、第2の出力信号a2として信号z1を第2の出力に送る。さらに、第1のセレクタは、信号z2として、前述の動作状態において基本的に干渉信号のオーディオ成分を含んでいる第1の部分信号y1を第1の可調整フィルタ340及び第2の可調整フィルタ350に送る。第1の可調整フィルタ340は、信号y2′を得るため信号z2を不変のまま送るのが望ましい。さらに、第2のセレクタ420は、第1の出力信号a1として信号e1を第1の出力に送る。オプションの第1の全通過フィルタまたは遅延手段380及び第1の差生成器360は、前述の状態で活動状態になる。オプションにより、第2の全通過フィルタまたは遅延手段382、第2の差生成器370、及び/または、第2の可調整フィルタ350は、第2の動作状態において停止状態にすることが可能である。また、第1の可調整フィルタ340も停止状態にするかまたはバイパスすることが可能である。
第3の動作状態において、ブラインド音源分離器330は二次条件を用いずに動作させるが、第1の部分信号y1は基本的に干渉信号のオーディオ成分を有している。この場合、第1のセレクタ410は信号z2として第1の部分信号y1を第1の可調整フィルタ340及び第2の可調整フィルタ350に送る。第2のセレクタも、第1の出力信号a1として信号e1を第1の出力に送る。さらに、第2のセレクタ420は、第2の出力信号a2として信号e2を第2の出力に送る。
第4の動作状態の場合、ブラインド音源分離器330は二次条件を用いずに動作させるが、第2の部分信号y2は基本的に干渉信号のオーディオ成分を表わしている。この場合、第1のセレクタ410は、第1の可調整フィルタ340及び第2の可調整フィルタ350に第2の部分信号y2を送る。また、第2のセレクタは、第1の出力信号a1として信号e1を第1の出力に送り、第2の出力信号a2として信号e2を第2の出力に送る。
信号分離器400は、こうして要件の関数として適応させることが可能である。回路400は、さらに、上述の動作状態の1つだけまたは上述の動作状態の部分集合を呈することができるように導入することも可能である。
図5には、本発明の回路で利用されるブラインド音源分離器のブロック図が示されている。図5によるブラインド音源分離器は、全体が500で表示されている。ブラインド音源分離器500は、第1の入力信号510として例えば第1のマイクロフォン信号x1を受信し、第2の入力信号512として第2のマイクロフォン信号x2を受信する。ブラインド音源分離器500は、さらに、第1の出力信号520として第1の部分信号y1を生成し、第2の出力信号522として第2の部分信号y2を生成するように構成されている。
音源分離器500には、例えば2つのフィルタ/コンバイナ530、532が含まれている。例えば第1のフィルタ/コンバイナ530は、第1の入力信号510及び第2の入力信号512を受信して、第1の出力信号520を送り出す。第2のフィルタ/コンバイナ532は、やはり第1の入力信号510及び第2の入力信号512を受信して、第2の出力信号522を送り出す。また留意しておかなければならないのは、2つのフィルタ/コンバイナ530、532は1つのユニットとして構成することもできるという点である。
パラメータ調整器540が、第1のフィルタ/コンバイナ530及び第2のフィルタ/コンバイナ532のフィルタパラメータを調整するために導入される。このため、パラメータ調整器540は、例えば、両方の入力信号510、512を受信し、代わりにまたは追加として、2つの出力信号520、522を受信する。これに関して、パラメータ調整器540は、例えば入力信号510、512及び/または出力信号520、522の信号統計データを評価して、2つの出力信号520、522間の統計的独立性が改善されるか、最適化されるか、または、最大化されるようにフィルタパラメータを調整するために使用される。換言すれば、パラメータ調整器540は、例えば、出力信号520、522間の統計的独立性が改善される(増す)か、または、少なくとも劣化しない方向またはやり方でフィルタパラメータを変更するために導入される。オプションにより、パラメータ調整器540は、さらに第1の入力信号510と第1の出力信号520との間及び/または第2の入力信号512と第2の出力信号522との間の信号歪みを考慮して、信号歪みが所定の最大許容信号歪みを超えないようにフィルタパラメータを調整するか、設定するか、または、最適化するすることも可能である。従って、フィルタパラメータ調整器540は、出力信号520、522の統計的独立性と入力信号510、512に対する出力信号520、522の歪みとの間の費用関数によって指定される妥協を実現するために導入することが可能である。
ブラインド音源分離の実施に関する詳細については、関連文献、とりわけ文献[非特許文献14]を参照されたい。
ブラインド音源分離に関するさらなる詳細については、[非特許文献18]にも記載がある。出力信号の統計的独立性の測度として、例えばカルバックライブラー距離を用いることが可能である。代わりに、統計的独立性の測度として、最大エントロピー、最小相互伝達情報量、または、ネゲントロピーを用いることも可能である。統計的独立性に関する上述の測度については、例えば[非特許文献1]に記載がある。
図6には、図1による本発明の信号分離器100の信号フローチャートが示されている。図6による信号フローチャートは、全体が600で表示されており、第2のマイクロフォン信号からの干渉信号源のオーディオ成分の音源分離と除去の両方が信号を利用して周波数領域内で実施されるシステムについて表わしている。例えば、マイクロフォン信号x1(t)は、時間ウィンドウ処理610によって個々の信号セグメントに細分される。時間信号x1(t)が例えば特定のサンプリングレートのサンプルの形で存在する場合、セクションx1(t1...t2)には、例えば時点t1とt2の間の数Nのサンプル(Nは16〜4,096の範囲が望ましい)が含まれている可能性がある。その後、信号セクションからスペクトル係数の集合を生成する変換がセクションx1(t1...t2)に対して施される。例えば、離散フーリエ変換620を用いて、時間領域で信号セクションx1(t1...t2)からスペクトル係数集合x1(ω1)t1...t2〜x1(ωI)t1...t2(Iは異なる周波数帯域の数を表わし、ω1〜ωIは例えば離散フーリエ変換のさまざまな周波数帯域を表わしている)を生成することが可能である。第2のマイクロフォン信号の時間セグメントに関するスペクトル係数集合x2(ω1)t1...t2〜x2(ωI)t1...t2を得るため、最初は時間信号として生じる第2のマイクロフォン信号x2(t)に関して類似の処理を実施することも可能である。
ブラインド信号分離器630は、時間セグメント内の第1のマイクロフォン信号x1(t)を表わした第1のスペクトル係数集合、及び、時間セグメント内の第2のマイクロフォン信号x2(t)を表わした第2のスペクトル係数集合を受信する。その結果、ブラインド信号源分離器630は、2つのスペクトル係数集合を処理して、さらに2つのスペクトル係数集合(y1(ω1)t1...t2〜y1(ωI)t1...t2及びy2(ω1)t1...t2〜y2(ωI)t1...t2)として部分信号y1、y2を送り出す。第1の部分信号y1を表わしたスペクトル係数集合は、ある変換を用いて変換され、時間信号に戻される。例えば、逆離散フーリエ変換640を用いることが可能である。従って、第1の部分信号y1または出力信号a1が時間領域で(例えば、時点t1〜t2の間または異なる時間領域において)得られる。
さらに、信号e1は例えば第2のマイクロフォン信号x2と第2の部分信号y2の差として生成することも可能である。図6に示すように、差生成は、異なるスペクトル範囲に関して個別に実施することが可能である。こうして得られた特定の時間間隔内における信号e2のスペクトル係数(e2(ω1)t1...t2〜e2(ωI)t1...t2と呼ばれる)は、例えば逆離散フーリエ変換660を利用して変換され、時間信号に戻される。
指摘しておかなければならないのは、構成200、300、及び、400における処理は、あるスペクトル範囲内でやはり完全にまたは部分的に実施することができるという点である。例えば、第1の可調整フィルタ340におけるフィルタ動作には、例えば信号z2を表わすスペクトル係数と関連するフィルタ係数の乗算だけしか含まれていないので、あるスペクトル範囲内における可調整フィルタ340の構成はとりわけ有利である。従って、フィルタ処理全体を個々の周波数領域に分割すると、互いに独立してフィルタ係数を調整することが可能になる。従って、この実施は、時間領域での実施に比べてかなり単純になる。従って、可調整フィルタ340、350の個々のフィルタ係数は、例えば互いに独立して調整することが可能になる。
周波数領域内における処理に関する詳細については、例えば[非特許文献2]及び[非特許文献3]から知ることが可能である。
周波数領域内における処理の実施に加えて、時間領域内における処理または一部が時間領域内で一部が周波数領域内の混合処理も可能である(例えば[非特許文献4]参照)。
図7には、本発明のもう1つの実施形態による本発明の信号分離器のブロック図が示されている。図7による信号分離器は全体が700で表示されている。信号分離器700に関して、Pのマイクロフォン710A〜710PのPのマイクロフォン信号が得られるものと仮定する。マイクロフォン信号はx1〜xPで表示される。音源分離器(またはブラインド音源分離器)730はPのマイクロフォン信号x1〜xPを受信して、Qの部分信号y1〜yQを生成するが、部分信号y1〜yQは、Qの異なる音源のオーディオ成分を表わしている。
下記では、Q〜Iの信号源の信号を出力に送ることが求められるものと仮定する。さらに、出力信号からIの干渉信号源からの信号をマスクすることが求められるものと仮定する。このため、セレクタ740を導入して、部分信号y1〜yQのIの部分信号がフィルタ746A〜746PのPのブロックに送られる。ブロック746A〜746Pのそれぞれには、関連する適応コントローラ747A〜747Pを備えたIの可調整フィルタが含まれている。例えば、第1ブロック746Aには、Iの可調整フィルタ750A〜750Iが含まれており、1つのブロック内のi番目の可調整フィルタが、フィルタリングを施すべき入力信号としてi番目の干渉信号(信号zQ-I+1〜zQ)を受信する。フィルタのP番目のブロックのIの個別可調整フィルタの出力は、p番目のマイクロフォン信号xPに作用する。Pのフィルタブロックの少なくとも1つのブロック746A〜746Pを用いて、p番目のマイクロフォン信号からIの干渉信号を除去すると、信号ePが得られる。フィルタブロック746A〜746Pのそれぞれを用いて、個別に調整可能なやり方でIの干渉信号を歪ませ、その後それぞれのp番目のマイクロフォン信号から歪み信号が除去される(差生成によって)。Iの干渉信号に関する個々のフィルタのパラメータまたは係数は、それぞれの(例えばp番目の)マイクロフォン信号からIの歪み干渉信号を除去または減算することによって生じる差分信号に基づいて調整される(関連する適応コントローラ747A〜747Pによって)。
適応コントローラ747A〜747Pは、例えばオプションの有用信号検出器748によって制御することも可能であり、有用信号検出器748はその機能に関して図3におる有用信号検出器390に対応する。
また、出力セレクタ780を導入して、干渉信号のないマイクロフォン信号(例えば信号e1〜eP)が出力に送られる。代わりに、出力セレクタ780は、例えば有用信号z1〜zQ-1を出力に送るように構成することも可能である。音源分離器に二次条件が含まれている場合、有用信号z1〜zQ-1は一般に(必ずしもそうとは限らないが)直接利用可能である。
図8には、本発明の実施形態の1つによる第1の本発明の方法に関するフローチャートが示されている。図8による方法は、全体が800で表示されている。この方法は、第1のマイクロフォン信号における有用信号源のオーディオ成分を表わした第1の出力信号を決定し、さらに、第2のマイクロフォン信号における有用信号源のオーディオ成分を表わした第2の出力信号を決定するのに適している。この方法には、第1のステップ810として、2つのマイクロフォン信号を受信し、少なくとも2つの信号源のオーディオ成分を分離して、基本的に第1の信号源のオーディオ成分を表わし、第1の出力信号に相当する第1の部分信号を得るステップ及び第2の信号源のオーディオ成分を基本的に表わす第2の信号を得るステップが含まれている。この方法には、第2のステップ820として、処理仕様のパラメータを調整して、第1のマイクロフォン信号に対する第1の部分信号の歪みが最大歪みより小さくなるように第1の部分信号を生成するステップが含まれている。方法800には、さらに第3のステップ830として、処理仕様のパラメータを調整して、第2のマイクロフォン信号に対する第2の部分信号の歪みが最大歪みより小さくなるように第2の部分信号を生成するためのステップが含まれている。この方法には、第4のステップ840として、さらに第2のマイクロフォン信号から第2の部分信号を除去して、第2の出力信号を得るステップが含まれており、第2の部分信号が低減することになる。図8による方法800は、本発明の装置に関連して例示されたステップの全てによって補完することが可能である。
図9には、本発明の実施形態の1つによる第2の本発明の方法に関するフローチャートが示されている。図9による方法は、全体が900で表示されており、第1のマイクロフォン信号における有用信号源のオーディオ成分を表わした第1の出力信号を決定し、第2のマイクロフォン信号における有用信号源のオーディオ成分を表わした第2の出力信号を決定するのに役立つ。方法900には、第1のステップ910として、2つのマイクロフォン信号を受信し、少なくとも2つの信号源のオーディオ成分を分離して、基本的に干渉信号源のオーディオ成分を表わした部分信号を得るステップが含まれている。方法900には、第2のステップ920として、部分信号を歪ませて、第1の歪み部分信号を得るステップと、第3のステップ930として、部分信号を歪ませて、第2の歪み部分信号を得るステップが含まれている。方法900には、さらに第4のステップ940として、第1のマイクロフォン信号から第1の歪み部分信号を除去するステップと、第5のステップ950として、第2のマイクロフォン信号から第2の歪み部分信号を除去するステップが含まれている。方法900には、第6のステップとして、さらに第1の可調整フィルタの第1のフィルタパラメータを調整して、第1のマイクロフォン信号における干渉信号源のオーディを成分を低減するステップと、第7のステップ970として、第2の可調整フィルタの第2のフィルタパラメータを調整して、第2のマイクロフォン信号における干渉信号源のオーディを成分を低減するステップが含まれている。
図9による方法900は、本発明の装置に関連して例示されたステップの全てによって補完することが可能である。
また、本発明の方法は、状況に応じてハードウェアまたはソフトウェアで実施することも可能である。この実施は、それぞれの方法が実施されるやり方でプログラマブルコンピュータシステムとやりとりすることができる電子的に読み取り可能な制御信号を含んでいる、例えばディスク、CD、DVD、ROM、PROM、EPROM、EEPROM、または、フラッシュ記憶媒体といったデジタル記憶媒体で行うことが可能である。一般に、本発明は、こうして本発明を実施するための機械可読媒体に記憶されたプログラムコードを含むコンピュータプログラム製品がコンピュータで実行される場合、そのコンピュータ製品にあるということにもなる。換言すれば、本発明は、従って、コンピュータプログラムがコンピュータで実行される場合、この方法を実施するためのプログラムコードを含むコンピュータプログラムとして実現することが可能である。
以下では、本発明の中核をなす概念について簡単に要約することにする。さらに理解が深まるように、下記においてまずP=2のセンサ及びQ=2の音源信号の場合について、本発明の説明を行うことにする。図4には、P=Q=2の場合の装置または方法のブロック図が描かれている。上述のように、ブラインド音源分離システム(BSSシステム)330は、P=2のセンサx1、x2においてまたはセンサx1、x2から、Q=2の統計的に独立した音源信号の重ね合わせを得る第1段階を形成する。ブラインド音源分離システム(BSSシステム)330は、2つの出力またはBSS出力y1、y2においてそれぞれ点音源の2つの信号の一方を送り出すのが理想的である。実際の応用シナリオでは、各事例において要求される点音源信号以外に、(信号y1、y2に)他の音源信号の残留部分が含まれている可能性がある。さらに、ブラインド音源分離システム(BSSシステム)330は、一般に任意のフィルタリング正確度までの音源信号だけを決定することが可能である。しかしながら、距離の測度によってBSSシステムの入力x1、x2と出力y1、y2を結合する二次条件を含むことによって(例えば[非特許文献14]参照)、BBSシステムによる分離した点音源の任意のフィルタリングが実施されないようにすることが可能になる。この場合、分離音源信号y1、y2は、第1の音源320(音源1)または第2の音源322(音源2)から生じるセンサ信号x1またはx2におけるそれぞれの部分に対応するのが理想的である([非特許文献14]参照)。
上述の二次条件を具備するBSSシステム330が選択されたか具備しないBSSシステム330が選択されたかによって、後処理のタイプが異なることになる。図4による第2のセレクタ420を用いて出力信号を適切に選択することによって、以下で技法A及び技法Bと呼ばれる2つの後処理技法間における切換えを実施することが可能である。技法Aは、二次条件を具備するBSSシステムを必要とするが、技法Bは二次条件を絶対に必要とするというわけではない。
両方の技法とも、第1のセレクタ410(セレクタ1)において、最初に信号y1または信号y2に所望の点音源が含まれているか否かに関する決定がなされる。次に、所望の点音源信号がチャネルz1に送られ、干渉源信号がチャネルz2に送られる。留意すべきは、実際の応用シナリオでは、他の音源信号の残留部分がまだ存在するという点である。以下では、技法A及びBについて述べることにする。
技法A
所望の点音源がチャネルy1内に位置する(すなわち、チャネルy1が基本的に所望の点音源のオーディオ成分を表わす)場合、第1のセレクタ410(セレクタ1)はチャネルy1をz1に接続する。二次条件(ブラインド信号分離器330の)のために、z1には、第1の音源320(音源1)から第1のセンサまたは音響センサまたはマイクロフォン(センサ1)への伝搬について表わす正確な伝達関数が既に含まれている。従って、z1はその結果として第2のセレクタ420(セレクタ2)から第1の出力(出力1)につなぐことが可能になる(従って、第1の出力信号a1を生成することになる)。
所望の点音源がチャネルy2内に位置する場合、第1のセレクタ410(セレクタ1)は、チャネルy2をz1に接続することになる。二次条件のために、z1には、この場合、第2の音源322(音源2)から第2のセンサまたは音響センサまたはマイクロフォン(センサ2)への伝達関数が含まれている。これが、この場合、第2のセレクタ420(セレクタ2)がチャネルz1を第2の出力(出力2)につなぐことになる理由である(第2の出力信号a2を得るために)。
第1の事例では、第1の音源320(音源1)から第2のセンサまたは音響センサまたはマイクロフォン(センサ2)への伝達関数が信号e2内で復元する。この場合、信号e2は、第2のセレクタ420(セレクタ2)によって第2の出力(出力2)につながれる(第2の出力信号a2を生成するために)。
第2の事例では、第2の音源322(音源2)から第1のセンサまたは音響センサまたはマイクロフォン(センサ1)への伝達関数が必要とされる。前記伝達関数は信号e1内で復元する。その後、信号e1は、第2のセレクタ420(セレクタ2)によって第1の出力(出力1)につながれる(第1の出力信号a1を生成するために)。
その信号z2(干渉信号を含んでいる)において生成される信号e1及びe2は、適応フィルタ(h1とも呼ばれる)及び350(h2とも呼ばれる)に接続され、その後、基準信号から減算される。基準信号を用いて、それぞれ全通過フィルタ380(全通過フィルタa1とも呼ばれる)及び382(全通過フィルタa2とも呼ばれる)によって処理されるセンサ信号x1及びx2も組み込まれる。特殊事例として、全通過フィルタ380(全通過フィルタa1)及び382(全通過フィルタa2)は純遅延装置として選択することも可能である。
フィルタ340(h1)、350(h2)を適応させるため、既に上述の[非特許文献12]による適応フィルタリング技法が用いられる。換言すれば、マルチチャネル音源分離システムの出力チャネルが、各事例毎に基準信号として遅延マイクロフォン信号を取り入れる1チャネル適応フィルタに接続される。一部が離散的な適応フィルタは、デジタル信号処理において広まっている技法を表わしている[非特許文献12]。適応フィルタの原理は、既知の入力信号を前提として、システムまたは適応フィルタの出力信号が基準信号に近似するようにフィルタ係数を決定することにある(例えば[非特許文献12]参照)。これは、誤差信号ep(n)が特定の基準に従って(一般には平均2乗誤差に従って)最小限に抑えられるので実現可能である。例えば、下記の式は誤差信号に適用することが可能である。
1(n)=x1′(n)−y2′(n)
ここで、nは、例えばサンプルのまたは時間間隔のモーメントを表わしており、平均2乗誤差(すなわち、誤差信号epまたはe1の平均パワーまたはエネルギ)は、例えば時間及び/または周波数で平均することによって求めることが可能である。
信号e1、e2の場合、望ましくない点音源はこうして抑制される。センサ信号(または全通過フィルタ380、382によってそれから得られる信号)が基準信号(x1′、x2′)として用いられるという事実により、各事例における所望の点音源と抑制される点音源は、両方とも信号e1、e2において空間的に正確に表わされる。また、各事例毎に1つの基準信号がセンサ信号によって生成されるという事実により、モニタされる適応フィルタに関して効率の良いアルゴリズムを用いて、フィルタ340(h1)、350(h2)を適応させることが可能になる。
後述することになる技法Bとは対照的に、技法Aでは適応フィルタ340(h1)及び350(h2)は定数因子1に置き換えることが可能である(すなわち、なしで済ますことが可能である)。実際の適用に関連したこの特殊事例は、結果としてシステムを単純化することになる。純遅延装置としての全通過フィルタ380(全通過フィルタa1)及び382(全通過フィルタa2)の可能性のある単純化と共に、結果として2つの新たなブロック図が生じることになる。
図1には、所望の音源信号がy2内に位置する場合、すなわち、第1のセレクタ410(セレクタ1)がBSS出力y2をz1に接続する場合の簡略化されたシステムが描かれている。換言すれば、音源信号または有用音源信号はBSS出力y2に生じるが、干渉音源信号はBSS出力y1に生じる。
図2には、所望の音源信号がy1内に位置する場合、すなわち、第1のセレクタ410(セレクタ1)がBBS出力y1をz1に接続する場合の簡略化されたシステムが描かれている。換言すれば、音源信号または有用音源信号はBSS出力y1に生じることになる。しかし干渉音源信号はBSS出力y2に生じることになる。
技法B
技法Bの場合、BSSシステムに関連したまたはブラインドチャネル推定器に関連した二次条件は、必須ではなく任意である。従って、信号y1及びy2には、センサまたは音響センサまたはマイクロフォン(センサ1、センサ2)に対する2つの音源320、322(音源1、音源2)の伝達関数が含まれていると仮定することはできない。このため、技法Bの場合、第2のセレクタ420(セレクタ2)は、第1の出力信号a1として信号e1を第1の出力(出力a1)につなぎ、さらに、第2の出力信号a2として信号e2を第2の出力(出力a2)につなぐ(図4参照)。
図7には、Pのセンサ及びQの点音源を備えたBSSシステム(またはブラインド音源分離のためのシステム)への本発明の拡張が描かれている。干渉源数はIで表示されている。この結果、Q−Iの所望の点音源が生じることになる。BSSシステム700によってQの独立した音源が生じ、Q−Iの所望の点音源が第1のセレクタ740(セレクタ1)によってチャネルz1〜zQ-Iに結合される。干渉源は、第1のセレクタ740(セレクタ1)によってチャネルzQ-I+1〜zQに結合される。チャネルzQ-I+1〜zQは、適応フィルタhi、1〜hiI(i=1,...,P)に接続され、基準信号から減算される。換言すれば、チャネルzQ-I+1〜zQは、適応フィルタhi、1〜hiIによって歪まされ、歪んだ信号は基準信号、すなわち、例えば全通過フィルタリングを施されたマイクロフォン信号x1〜xPから減算される。基準信号、すなわち、全通過によって改訂されたセンサ信号x1,...,xPを用いて、全通過フィルタa1,...,全通過フィルタaPがそれぞれ組み込まれる。特殊事例として、やはり全通過フィルタa1,...,全通過フィルタaPを純遅延装置として選択することが可能になる。こうして、信号e1,...,ePが生成されるが、この場合、Q−1の所望の点音源が全て抑制される。センサ信号(または全通過フィルタリングを施されたセンサ信号)が、基準信号として用いられるという事実により、所望の点音源と抑制される点音源の両方が、それぞれ、信号e1〜ePにおいて空間的に正確に表わされる。
技法Aの場合、やはり二次条件を具備するBSSを選択するのが望ましい。信号z1,...,zQ-Iに所望の点音源を含んでいる伝達関数に基づいて、信号z1,...,zQ-Iは第2のセレクタ780(セレクタ2)によってそれぞれの出力チャネルにつながれることになる。これは、第1のセレクタ740(セレクタ1)によって考慮されたBSS出力信号の潜在的可能性のある置換が、第2のセレクタ780によっても考慮されなければならないということを表わしている。セレクタ2によって実施される出力1,...,Pに対するチャネルz1,...,zQ-Iの接続の選択については、P=Q=2の場合に関して上記で詳述したが、この時点で同様に実施される。残りのP−Q+Iの出力信号が信号e1,...,ePから決定される。
技法Bの場合、BSSシステム(すなわち、例えばブラインド音源分離器730)における二次条件は必須ではない。これが、ここで信号e1,...,ePが出力1,...,Pに接続される理由である。
下記には、本発明の実際の導入に関連していくつかの観測結果が例示される。本明細書に記載の本発明は、音響信号に関するシミュレーションによって検証された。このため、2つの点音源の信号(音声信号)が2つのマイクロフォンを用いて残響室で記録された。この場合、信号の1つは所望の点音源を表わし、他の信号は干渉源を表わしている。マイクロフォン信号はBSSアルゴリズムによって処理され、短い収束時間後、2つのBSS出力チャネルの一方において干渉信号のわずかな残留部分と共に所望の音声信号が生じることになる。もう一方のBSS出力では、所望の信号源のわずかな残留部分と共に干渉信号が生じることになる。第1のセレクタ(セレクタ1)は、干渉源を含むBSS出力信号を適応フィルタh1,1及びh2,1に対して送り出す。従って、所望の点音源並びに干渉源の残留部分の空間的に正確な表現が後処理ブロックの出力e1及びe2において得られる。
技法A及び技法Bの両方が、シミュレーションによって試験された。両方の技法とも、所望の点音源と干渉源の空間的に正確な表現を得ることが可能であった。2つのチャネルは、ステレオ再生システムすなわちヘッドセットによって聞くことが可能である。
従って要するに、本発明によれば、ブラインド音源分離システムにおいて空間情報を復元するためのシステムが得られるということを立証することが可能である。従来のブラインド音源分離システムでは、センサ(または音響センサまたはマイクロフォン)における信号の混合から存在する可能性のある干渉源の残留部分と共に、各出力チャネル毎に、各事例毎に要求される点音源の1チャネルの推定値が求められる。本発明によれば、所望の点音源と依然として存在する可能性のある干渉源の両方からの空間情報を復元する後処理ブロックが提供される。後処理ブロックの出力信号を決定するため、センサ信号(またはマイクロフォン信号)がブラインド音源分離の出力信号(例えば信号y1、y2,...,yQ)と共に利用される。文献によって既知の同様の概念の大部分は、所望の音源の空間表現だけしか実現しないので、依然として存在する可能性のある干渉信号もこの点にマッピングされる。
従って、本発明の基本的概念または動機は、新しい後処理ブロックでは、BSSの出力信号と共にもとのセンサ信号も処理されるので、出力において空間情報(すなわち点音源の空間位置に関する情報)を復元することにである。
要するに、本発明によれば、マルチチャネルオーディオ信号から干渉源の有効な除去を可能にし、干渉源の残りの残留部分はもとの空間位置にマッピングされるようにする信号分離器が得られることを立証することが可能である。本発明によれば、比較的低費用で実現することも可能である。
本発明の第1の実施形態による二次条件を備えた音源分離器を用いる本発明の信号分離器のブロック図である。 本発明の第2の実施形態による二次条件を備えた音源分離器を用いる本発明の信号分離器のブロック図である。 本発明の第3の実施形態による音源分離器によって生じる部分信号にフィルタリングを施す可調整フィルタを用いる本発明の信号分離器のブロック図である。 本発明の第4の実施形態による再構成された本発明の信号分離器のブロック図である。 本発明の信号分離器において利用される音源分離器のブロック図である。 周波数領域において信号を利用する本発明の信号分離器に関する信号フローチャートである。 本発明の第5の実施形態による少なくとも2つのマイクロフォン信号から2つ以上の干渉信号を除去するための本発明の信号分離器のブロック図である。 本発明の第6の実施形態による本発明の第1の方法のフローチャートである。 本発明の第7の実施形態による本発明の第2の方法のフローチャートである。
100 信号分離器
120 有用信号源
130 音源分離器
136 遅延手段
140 差生成器
200 信号分離器
300 信号分離器
320 有用信号源
330 音源分離器
340 可調整フィルタ
350 可調整フィルタ
370 差生成器
382 遅延手段
400 信号分離器
700 信号分離器
740 音源分離器
746A 可調整フィルタ
746P 可調整フィルタ

Claims (25)

  1. 第1のマイクロフォン信号(x1)における有用信号源(120、320)のオーディオ成分を表わす第1の出力信号(a1)を決定し、第2のマイクロフォン信号(x2)における有用信号源のオーディオ成分を表わす第2の出力信号(a2)を決定するための信号分離器(100、200、400、700)であって、
    室内に配置された複数の信号源からのオーディオ信号を受信して少なくとも2つの信号源のオーディオ成分を分離するため、室内に配置された2つの音響センサから前記2つのマイクロフォン信号を受信する音源分離器(130、330)を有し、
    この音源分離器は、第1の信号源のオーディオ成分を表わす前記第1の出力信号に相当する第1の部分信号(y1)を得るように、また、第2の信号源のオーディオ成分を表わす第2の部分信号(y2)を得るように構成され、
    前記音源分離器は、処理仕様のパラメータを調整して、前記第1のマイクロフォン信号に対する前記第1の部分信号の歪みが最大歪みより小さくなるように前記マイクロフォン信号から前記第1の部分信号を生成し、しかも、処理仕様のパラメータを調整して、前記第2のマイクロフォン信号に対する前記第2の部分信号の歪みが最大歪みより小さくなるように前記マイクロフォン信号から前記第2の部分信号を生成するように構成され、更に、
    前記第2のマイクロフォン信号から前記第2の部分信号を除去して、第2の出力信号を得るための信号除去器(140、370)を有し、前記第2の部分信号を低減する、
    信号分離器。
  2. 前記音源分離器(130、330)は、前記室内における信号源の空間位置に基づいてまたは信号源の統計的特性に基づいて少なくとも2つの信号源のオーディオ成分を分離するように構成されている、請求項1に記載の信号分離器。
  3. 前記音源分離器(130、330、500)は、前記第1のマイクロフォン信号(x1)に対する前記第1の部分信号(y1)の歪みの測度の関数として前記第1の部分信号を生成して、前記第1のマイクロフォン信号に対する前記第1の部分信号の歪みに対する上限を設定するように処理仕様のパラメータを決定すべく構成され、
    前記音源分離器は、前記第2のマイクロフォン信号(x2)に対する前記第2の部分信号(y2)の歪みの測度の関数として前記第2の部分信号を生成して、前記第2のマイクロフォン信号に対する前記第2の部分信号の歪みに対する上限を設定するように処理仕様のパラメータを決定すべく構成されている、
    請求項1または2に記載の信号分離器。
  4. 前記音源分離器(130、330)が、費用関数を使用している間に、最適化によって前記第1の部分信号(y1)及び前記第2の部分信号(y2)を生成するための処理仕様のパラメータを決定するように構成され、
    前記費用関数には、前記部分信号間の統計的独立性の測度、前記第1のマイクロフォン信号(x1)と前記第1の部分信号の間の歪みの測度、及び、前記第2のマイクロフォン信号(x2)と前記第2の部分信号(y2)との間の歪みの測度が含まれ、
    前記最適化は、前記部分信号のできるだけ大きい統計的独立性と、前記第1のマイクロフォン信号と前記第1の部分信号との間のできるだけ小さい歪みと、前記第2のマイクロフォン信号と前記第2の部分信号との間のできるだけ小さい歪みとの間の費用関数によって決まる妥協を実現するように意図されている、
    請求項1〜3のいずれか一つに記載の信号分離器。
  5. 前記第1の部分信号と前記第2の部分信号との間の統計的独立性の測度は、カルバックライブラー距離、最大エントロピー、最小伝達情報量、及び/または、ネゲントロピーに基づく、請求項4に記載の信号分離器。
  6. 前記費用関数においては、部分信号(y1、y2)の確率密度関数の非ガウス条件、非白色度、及び/または、非定常条件が考慮される、請求項4または5に記載の信号分離器。
  7. 前記第1のマイクロフォン信号(x1)と前記第1の部分信号(y1)との間の歪みの測度が、前記第1のマイクロフォン信号(x1)の値と前記第1の部分信号(y1)の値との間の差の大きさまたはノルムであり、
    前記第2のマイクロフォン信号(x2)と前記第2の部分信号(y2)との間の歪みの測度が、前記第2のマイクロフォン信号(x2)の値と前記第2の部分信号(y2)の値との間の差の大きさまたはノルムである、
    請求項3〜6のいずれか一つに記載の信号分離器。
  8. 前記信号除去器は、前記第2のマイクロフォン信号(x2)を遅延させて、前記第2の部分信号(y2)を決定する処理時間を相殺し、遅延した第2のマイクロフォン信号(x2′)を得るための遅延手段(136、382)と、前記遅延した第2のマイクロフォン信号と前記第2の部分信号との差として前記第2の出力信号(a2)を決定するための差生成器(140、370)とが含まれる、請求項1〜7のいずれか一つに記載の信号分離器。
  9. 前記信号分離器は、複数のオーディオ周波数領域における複数の信号部分によって前記第1のマイクロフォン信号(x1)、前記第2のマイクロフォン信号(x2)、前記第1の部分信号(y1)、及び/または、前記第2の部分信号(y2)を表わすことで、あるスペクトル範囲内における分析に基づいて少なくとも2つの信号源のオーディオ成分を分離し、しかも、複数のオーディオ周波数領域における複数の信号部分に関して差を生じさせることによって、前記第2のマイクロフォン信号から前記第2の部分信号を除去するように構成されている、請求項1〜8のいずれか一つに記載の信号分離器。
  10. 前記第1の信号源が有用信号源をなす、請求項1〜9のいずれか一つに記載の信号分離器。
  11. 前記音源分離器は、2つの信号源の信号部分を分離して、2つの信号源のどちらが有用信号源であり、どちらが干渉信号源であるかを認識し、前記有用信号源のオーディオ成分を第1の部分信号として出力し、前記干渉信号源のオーディオ成分を第2の部分信号として出力するように構成されている、請求項1〜10のいずれか一つに記載の信号分離器。
  12. 第1のマイクロフォン信号における有用信号源(320)のオーディオ成分を表わす第1の出力信号(a1)を決定し、第2のマイクロフォン信号(x2)における有用信号源のオーディオ成分を表わす第2の出力信号(a2)を決定するための信号分離器(300、400、700)であって、
    室内に配置された2つの音響センサから前記2つのマイクロフォン信号を受信することで室内に配置された信号源からのオーディオ信号を受信して、少なくとも2つの信号源のオーディオ成分を分離するための音源分離器(330、740)を有し、この音源分離器は、基本的に干渉信号源322のオーディオ成分を表わす、部分信号(y2)を得るように構成され、さらに、
    前記部分信号を歪ませて、第1の歪み部分信号(y2′)を得、また、前記部分信号を歪ませて、第2の歪み部分信号(y2″)を得るための可調整フィルタ(340、350、746A、746P)と、
    前記第1の出力信号(a1)をなす第1の補正マイクロフォン信号(e1)を得るため、前記第1のマイクロフォン信号から前記第1の歪み部分信号を除去し、前記第2の出力信号(a2)をなす第2の補正マイクロフォン信号(e2)を得るため、前記第2のマイクロフォン信号から前記第2の歪み部分信号を除去する信号除去器(360、370)と、
    前記可調整フィルタのフィルタパラメータを調整して、前記第1の出力信号における前記干渉信号源のオーディオ成分を低減し、前記可調整フィルタのフィルタパラメータを調整して、前記第2の出力信号における前記干渉信号源のオーディオ成分を低減するパラメータ調整器とを有する、
    信号分離器。
  13. 前記音源分離器(130、330)は、室内におけるそれらの空間位置に基づいてまたは統計的特性に基づいて少なくとも2つの信号源のオーディオ成分を分離するように構成されている、請求項12に記載の信号分離器。
  14. 前記音源分離器(130、330)は、費用関数を使用している間に、最適化によって前記第1の部分信号(y1)及び前記第2の部分信号(y2)を生成するための処理仕様のパラメータを決定するように設計され、前記費用関数には、前記部分信号間の統計的独立性の測度が含まれ、前記音源分離器は最適化によって、最適化前の状態に比較して、前記部分信号の統計的独立性を増加するように設計される、請求項12または13に記載の信号分離器。
  15. 前記第1の部分信号と前記第2の部分信号との間の統計的独立性の測度が、カルバックライブラー距離、最大エントロピー、最小伝達情報量、及び/または、ネゲントロピーに基づく、請求項14に記載の信号分離器。
  16. 前記費用関数においては、部分信号(y1、y2)の確率密度関数の非ガウス条件、非白色度、及び/または、非定常条件が考慮される、請求項12または13に記載の信号分離器。
  17. 前記パラメータ調整器は、前記第1の補正マイクロフォン信号におけるパワーと前記第2の補正マイクロフォン信号におけるパワーを決定し、前記第1の可調整フィルタ(340、350、746A、746P)のフィルタパラメータを変化させて、前記第1の補正マイクロフォン信号(e1)におけるパワーを低下させ、前記可調整フィルタのフィルタパラメータを変化させて、前記第2の補正マイクロフォン信号(e2)におけるパワーを低下させるように構成されている、請求項12〜16のいずれか一つに記載の信号分離器。
  18. 前記パラメータ調整器は、前記第1の補正マイクロフォン信号(e1)におけるパワーが最適化前の状態に対して低下するように、最適化によって前記可調整フィルタ(340、350、746A、746P)のフィルタパラメータを調整し、前記第2の補正マイクロフォン信号(e2)におけるパワーが最適化前の状態に対して低下するように、前記可調整フィルタのフィルタパラメータを調整するように構成されている、請求項12〜17のいずれか一つに記載の信号分離器。
  19. 前記パラメータ調整器は、少なくとも最低の有用信号強度を備えた有用信号源(320)からの有用信号が前記第1のマイクロフォン信号(x1)または前記第2のマイクロフォン信号(x2)に存在する場合にそれを認識し、少なくとも最低の有用信号強度を具備する有用信号が存在しない場合に限って前記可調整フィルタ(340、350、746A、746P)のフィルタパラメータを変更または最適化するように構成された有用信号検出器(390)を有する、請求項12〜18のいずれか一つに記載の信号分離器。
  20. 前記信号分離器は、複数のオーディオ周波数領域における複数の信号部分によって前記第1のマイクロフォン信号(x1)、前記第2のマイクロフォン信号(x2)、前記第1の部分信号(y1)、及び/または、前記第2の部分信号(y2)を表わすように構成され、あるスペクトル範囲内における分析に基づいて前記少なくとも2つの信号源(320、322)のオーディオ成分を分離するように構成され、前記可調整フィルタ(340、350、746A、746P)が前記部分信号のさまざまなスペクトル成分を個別に歪ませるように構成され、
    前記信号除去器(360、370)は、さまざまなスペクトル成分を個別に処理することによって前記第1の補正マイクロフォン信号(e1)における前記干渉信号源のオーディオ成分を低減し、さまざまなスペクトル成分を個別に処理することによって前記第2の補正マイクロフォン信号(e2)における前記干渉信号源のオーディオ成分を低減するように構成されている、請求項12〜19のいずれか一つに記載の信号分離器。
  21. 前記第1の補正マイクロフォン信号(e1)が前記信号除去器の出力信号に相当する、請求項12〜20のいずれか一つに記載の信号分離器。
  22. 前記信号除去器は、前記第1のマイクロフォン信号(x1)または前記第1のマイクロフォン信号の全通過フィルタリングバージョン(x1′)から前記第1の歪み部分信号(y2′)を減算するように構成されている差生成器を有し、この差生成器によって生成される差分信号が、前記第1の補正マイクロフォン信号(e1)に相当し、さらに、前記差生成器は、前記第2のマイクロフォン信号(x2)または前記第2のマイクロフォン信号の全通過フィルタリングバージョン(x2′)から前記第2の歪み部分信号(y2″)を減算するように構成され、前記差生成器によって生成される差分信号が、前記第2の補正マイクロフォン信号(e2)に相当する、請求項12〜21のいずれか一つに記載の信号分離器。
  23. 第1のマイクロフォン信号(x1)における有用信号源のオーディオ成分を表わした第1の出力信号(a1)を決定し、第2のマイクロフォン信号(x2)における有用信号源のオーディオ成分を表わした第2の出力信号(a2)を決定する方法であって、
    室内に配置された2つの音響センサから2つのマイクロフォン信号を受信して、前記室内に配置された信号源からのオーディオ信号を受信するステップ(810)と、
    少なくとも2つの信号源のオーディオ成分を分離して、前記第1の信号源のオーディオ成分を表わした第1の部分信号(y1)と、前記第2の信号源のオーディオ成分を表わした第2の部分信号(y2)を得るステップ(810)と、
    処理仕様のパラメータを調整して、前記第1のマイクロフォン信号に対する前記第1の部分信号の歪みが最大歪みより小さくなるように、前記マイクロフォン信号から前記第1の部分信号を生成するするステップ(820)と、
    処理仕様のパラメータを調整して、前記第2のマイクロフォン信号に対する前記第2の部分信号の歪みが最大歪みより小さくなるように、前記マイクロフォン信号から前記第2の部分信号を生成するするステップ(830)と、
    前記第2のマイクロフォン信号から前記第2の部分信号を除去して、前記第2の出力信号を得るステップ(840)とを有し、前記第2の部分信号が低減される、方法。
  24. 第1のマイクロフォン信号(x1)における有用信号源のオーディオ成分を表わした第1の出力信号(a1)を決定し、第2のマイクロフォン信号(x2)における有用信号源のオーディオ成分を表わした第2の出力信号(a2)を決定する方法であって、
    室内に配置された2つの音響センサからの信号を表わす2つのマイクロフォン信号を受信して、前記室内に配置された信号源からのオーディオ信号を受信するステップ(910)と、
    少なくとも2つの信号源のオーディオ成分を分離して、基本的に干渉信号源のオーディオ成分を表わした部分信号(y2)を得るステップと、
    可調整フィルタで前記部分信号を歪ませて、第1の歪み部分信号(y2′)を得るステップ(930)と、
    可調整フィルタで前記部分信号を歪ませて、第2の歪み部分信号(y2″)を得るステップ(940)と、
    前記第1のマイクロフォン信号から前記第1の歪み部分信号を除去して、前記第1の出力信号をなす第1の補正マイクロフォン信号を得るステップ(940)と、
    前記第2のマイクロフォン信号から前記第2の歪み部分信号を除去して、前記第2の出力信号をなす第2の補正マイクロフォン信号を得るステップ(950)と、
    前記可調整フィルタのフィルタパラメータを調整して、前記第1の補正マイクロフォン信号における前記干渉信号源のオーディオ成分を低減させるステップ(960)と、
    前記可調整フィルタのフィルタパラメータを調整して、前記第2の補正マイクロフォン信号における前記干渉信号源のオーディオ成分を低減させるステップ(970)が含まれている、方法。
  25. コンピュータで、請求項23または24に記載のステップを実行させるためのコンピュータプログラム。
JP2009514695A 2006-06-14 2007-06-12 信号分離器、マイクロフォン信号に基づいて出力信号を決定するための方法、及び、コンピュータプログラム Pending JP2009540378A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE102006027673A DE102006027673A1 (de) 2006-06-14 2006-06-14 Signaltrenner, Verfahren zum Bestimmen von Ausgangssignalen basierend auf Mikrophonsignalen und Computerprogramm
PCT/EP2007/005182 WO2007144147A1 (en) 2006-06-14 2007-06-12 Signal separator, method for determining output signals on the basis of microphone signals, and computer program

Publications (1)

Publication Number Publication Date
JP2009540378A true JP2009540378A (ja) 2009-11-19

Family

ID=38353840

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009514695A Pending JP2009540378A (ja) 2006-06-14 2007-06-12 信号分離器、マイクロフォン信号に基づいて出力信号を決定するための方法、及び、コンピュータプログラム

Country Status (9)

Country Link
US (1) US8090111B2 (ja)
EP (1) EP2027581B1 (ja)
JP (1) JP2009540378A (ja)
CN (1) CN101484938B (ja)
AT (1) ATE547788T1 (ja)
AU (1) AU2007260233B2 (ja)
DE (1) DE102006027673A1 (ja)
DK (1) DK2027581T3 (ja)
WO (1) WO2007144147A1 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012510090A (ja) * 2008-11-25 2012-04-26 クゥアルコム・インコーポレイテッド 複数のオーディオ信号を使用して、周囲ノイズを抑制するための方法および装置
KR101737270B1 (ko) 2016-04-25 2017-05-19 울산대학교 산학협력단 능동 방향성 이득 조정 가능한 양이 보청기 시스템
CN108053834A (zh) * 2017-12-05 2018-05-18 北京声智科技有限公司 音频数据处理方法、装置、终端及系统
JP2023506354A (ja) * 2019-10-04 2023-02-16 フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン ソース分離

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8892432B2 (en) * 2007-10-19 2014-11-18 Nec Corporation Signal processing system, apparatus and method used on the system, and program thereof
JP5605575B2 (ja) * 2009-02-13 2014-10-15 日本電気株式会社 多チャンネル音響信号処理方法、そのシステム及びプログラム
WO2010092913A1 (ja) * 2009-02-13 2010-08-19 日本電気株式会社 多チャンネル音響信号処理方法、そのシステム及びプログラム
EP2234415B1 (en) * 2009-03-24 2011-10-12 Siemens Medical Instruments Pte. Ltd. Method and acoustic signal processing system for binaural noise reduction
US8787591B2 (en) * 2009-09-11 2014-07-22 Texas Instruments Incorporated Method and system for interference suppression using blind source separation
DE102009052992B3 (de) 2009-11-12 2011-03-17 Institut für Rundfunktechnik GmbH Verfahren zum Abmischen von Mikrofonsignalen einer Tonaufnahme mit mehreren Mikrofonen
JP5939161B2 (ja) * 2011-01-13 2016-06-22 日本電気株式会社 音声処理装置及びその制御方法とその制御プログラム、情報処理システム
TWI457789B (zh) * 2012-05-30 2014-10-21 Wistron Corp 電子裝置和輸入指令方法
CN103236264B (zh) * 2013-05-03 2015-07-29 湖北文理学院 一种用于声源分离的编解码方法
MY181965A (en) 2013-10-18 2021-01-15 Fraunhofer Ges Forschung Coding of spectral coefficients of a spectrum of an audio signal
CN107924685B (zh) * 2015-12-21 2021-06-29 华为技术有限公司 信号处理装置和方法
CN107527622B (zh) * 2017-07-07 2019-09-24 西南交通大学 一种基于最大熵的变步长符号子带回声消除方法
CN107369458B (zh) * 2017-07-07 2019-09-24 西南交通大学 一种基于熵吸引的最大熵子带回声消除方法
CN107871510B (zh) * 2017-07-07 2019-11-26 西南交通大学 一种零吸引变核宽度的最大熵回声消除方法
CN107578782B (zh) * 2017-07-07 2019-09-24 西南交通大学 一种变核宽度的最大熵子带回声消除方法
CN107818793A (zh) * 2017-11-07 2018-03-20 北京云知声信息技术有限公司 一种可减少无用语音识别的语音采集处理方法及装置
CN108198569B (zh) * 2017-12-28 2021-07-16 北京搜狗科技发展有限公司 一种音频处理方法、装置、设备及可读存储介质
CN108597531B (zh) * 2018-03-28 2021-05-28 南京大学 一种通过多声源活动检测来改进双通道盲信号分离的方法
CN113348508A (zh) * 2019-01-23 2021-09-03 索尼集团公司 电子设备、方法和计算机程序
CN110310683B (zh) * 2019-07-01 2021-07-06 科大讯飞股份有限公司 录音处理方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003099093A (ja) * 2001-09-25 2003-04-04 Nippon Telegr & Teleph Corp <Ntt> 雑音抑圧方法及びその装置、雑音抑圧プログラム並びにそのプログラム記録媒体
JP2006100869A (ja) * 2004-09-28 2006-04-13 Sony Corp 音声信号処理装置および音声信号処理方法
JP2007279517A (ja) * 2006-04-10 2007-10-25 Kobe Steel Ltd 音源分離装置、音源分離装置用のプログラム及び音源分離方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IL101556A (en) * 1992-04-10 1996-08-04 Univ Ramot Multi-channel signal separation using cross-polyspectra
US6130949A (en) * 1996-09-18 2000-10-10 Nippon Telegraph And Telephone Corporation Method and apparatus for separation of source, program recorded medium therefor, method and apparatus for detection of sound source zone, and program recorded medium therefor
US6167417A (en) 1998-04-08 2000-12-26 Sarnoff Corporation Convolutive blind source separation using a multiple decorrelation method
FR2842064B1 (fr) 2002-07-02 2004-12-03 Thales Sa Systeme de spatialisation de sources sonores a performances ameliorees
US7099821B2 (en) * 2003-09-12 2006-08-29 Softmax, Inc. Separation of target acoustic signals in a multi-transducer arrangement
US8873768B2 (en) * 2004-12-23 2014-10-28 Motorola Mobility Llc Method and apparatus for audio signal enhancement
KR101178801B1 (ko) * 2008-12-09 2012-08-31 한국전자통신연구원 음원분리 및 음원식별을 이용한 음성인식 장치 및 방법

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003099093A (ja) * 2001-09-25 2003-04-04 Nippon Telegr & Teleph Corp <Ntt> 雑音抑圧方法及びその装置、雑音抑圧プログラム並びにそのプログラム記録媒体
JP2006100869A (ja) * 2004-09-28 2006-04-13 Sony Corp 音声信号処理装置および音声信号処理方法
JP2007279517A (ja) * 2006-04-10 2007-10-25 Kobe Steel Ltd 音源分離装置、音源分離装置用のプログラム及び音源分離方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
CSNG200600992215; 高谷 智哉 Tomoya Takatani: 'SIMOモデルに基づくICAを用いたブラインド音源分離 Blind Source Separation Using SIMO-Model-Bas' 日本音響学会2003年春季研究発表会講演論文集-I- THE 2003 SPRING MEETING OF THE ACOUSTICAL SOCI , 200303, 社団法人日本音響学会 *
JPN6012004894; 高谷 智哉 Tomoya Takatani: 'SIMOモデルに基づくICAを用いたブラインド音源分離 Blind Source Separation Using SIMO-Model-Bas' 日本音響学会2003年春季研究発表会講演論文集-I- THE 2003 SPRING MEETING OF THE ACOUSTICAL SOCI , 200303, 社団法人日本音響学会 *
JPN6012052233; 鵜飼訓史,猿渡洋,高谷智哉,鹿野清宏,向井良,澤田宏: '周波数領域ICAと時間領域ICAを統合したSIMOモデル信号のブラインド抽出法の評価' 電子情報通信学会技術研究報告 , 20040625, 電子情報通信学会 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012510090A (ja) * 2008-11-25 2012-04-26 クゥアルコム・インコーポレイテッド 複数のオーディオ信号を使用して、周囲ノイズを抑制するための方法および装置
KR101737270B1 (ko) 2016-04-25 2017-05-19 울산대학교 산학협력단 능동 방향성 이득 조정 가능한 양이 보청기 시스템
CN108053834A (zh) * 2017-12-05 2018-05-18 北京声智科技有限公司 音频数据处理方法、装置、终端及系统
CN108053834B (zh) * 2017-12-05 2020-02-21 北京声智科技有限公司 音频数据处理方法、装置、终端及系统
JP2023506354A (ja) * 2019-10-04 2023-02-16 フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン ソース分離
JP7373253B2 (ja) 2019-10-04 2023-11-02 フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン ソース分離

Also Published As

Publication number Publication date
ATE547788T1 (de) 2012-03-15
AU2007260233A1 (en) 2007-12-21
DE102006027673A1 (de) 2007-12-20
CN101484938B (zh) 2012-02-15
EP2027581A1 (en) 2009-02-25
DK2027581T3 (da) 2012-06-18
US8090111B2 (en) 2012-01-03
CN101484938A (zh) 2009-07-15
AU2007260233B2 (en) 2011-09-15
US20100232621A1 (en) 2010-09-16
WO2007144147A1 (en) 2007-12-21
EP2027581B1 (en) 2012-02-29

Similar Documents

Publication Publication Date Title
JP2009540378A (ja) 信号分離器、マイクロフォン信号に基づいて出力信号を決定するための方法、及び、コンピュータプログラム
US10891931B2 (en) Single-channel, binaural and multi-channel dereverberation
US9438992B2 (en) Multi-microphone robust noise suppression
US9558755B1 (en) Noise suppression assisted automatic speech recognition
US8958572B1 (en) Adaptive noise cancellation for multi-microphone systems
US8682006B1 (en) Noise suppression based on null coherence
US8606571B1 (en) Spatial selectivity noise reduction tradeoff for multi-microphone systems
US9343073B1 (en) Robust noise suppression system in adverse echo conditions
CN111128210B (zh) 具有声学回声消除的音频信号处理的方法和系统
CN110931031A (zh) 一种融合骨振动传感器和麦克风信号的深度学习语音提取和降噪方法
US8761410B1 (en) Systems and methods for multi-channel dereverberation
US9373318B1 (en) Signal rate synchronization for remote acoustic echo cancellation
JP6870078B2 (ja) 動的サウンド調整のための雑音推定
EP3005362B1 (en) Apparatus and method for improving a perception of a sound signal
US10798511B1 (en) Processing of audio signals for spatial audio
JP2014502471A (ja) 動的マイクロフォン信号ミキサ
US11647344B2 (en) Hearing device with end-to-end neural network
JP2011203414A (ja) 雑音及び残響抑圧装置及びその方法
JP6840302B2 (ja) 情報処理装置、プログラム及び情報処理方法
Estreder et al. On perceptual audio equalization for multiple users in presence of ambient noise
CN112703749B (zh) 用于运行机动车上音频输出装置的方法
Sathyapriyan et al. Binaural beam-forming with dominant spatial cue preservation for hearing aids
Hussain et al. Novel sub-band adaptive systems incorporating Wiener filtering for binaural speech enhancement
CN117376753A (zh) 多领麦会议系统麦克风自适应选择方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100129

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20111122

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20111122

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120207

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20120507

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120508

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20120514

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121009

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20130402