JP2009540378A

JP2009540378A - 信号分離器、マイクロフォン信号に基づいて出力信号を決定するための方法、及び、コンピュータプログラム

Info

Publication number: JP2009540378A
Application number: JP2009514695A
Authority: JP
Inventors: ブーフナー、ヘルベルト; アイヒナー、ロベルト; ケラーマン、ヴァルター
Original assignee: Siemens Audioligische Technik GmbH
Current assignee: Sivantos GmbH
Priority date: 2006-06-14
Filing date: 2007-06-12
Publication date: 2009-11-19
Also published as: DK2027581T3; AU2007260233A1; CN101484938B; US20100232621A1; AU2007260233B2; EP2027581A1; EP2027581B1; DE102006027673A1; ATE547788T1; WO2007144147A1; CN101484938A; US8090111B2

Abstract

信号分離器（１００）に２つのマイクロフォン信号を受信し、少なくとも２つの信号源のオーディオ成分を分離するための音源分離器（１３０）が含まれる。音源分離器（１３０）は、第１の信号源のオーディオ成分を表わし、前記第１の出力信号に相当する第１の部分信号（ｙ₁）を得、また、基本的に第２の信号源のオーディオ成分を表わす第２の部分信号（ｙ₂）を得る。音源分離器（１３０）は、処理仕様のパラメータを調整して、第１のマイクロフォン信号に対する第１の部分信号の歪みが最大歪みより小さくなるように、マイクロフォン信号から第１の部分信号を生成し、処理仕様のパラメータを調整して、第２のマイクロフォン信号に対する第２の部分信号の歪みが最大歪みより小さくなるように、マイクロフォン信号から第２の部分信号を生成する。信号分離器には、さらに、第２のマイクロフォン信号から第２の部分信号を除去して、第２の出力信号を得るための信号除去器が含まれて、第２の部分信号が低減する。

Description

本発明は、一般に、マイクロフォン信号内の有用な信号源のオーディオ成分を表わす第１の出力信号を決定し、第２のマイクロフォン信号内の有用な信号源のオーディオ成分を表わす第２の出力信号を決定するための信号分離器、適切な方法、及び、適切なコンピュータプログラムに関するものである。とりわけ、本発明は、ブラインド音源分離システムにおいて空間情報を復元する技法及び方法に関するものである。

多くの技術的応用例では、有用な信号部分のオーディオ成分は入力信号に対してほとんど変わらないようにして出力信号に含まれるが、その一方で、干渉信号部分のオーディオ成分は出力信号において低減させられる。

ブラインド音源分離（以下ではＢＳＳとも呼ばれる）技法は、点音源（例えば室内における音声信号）から統計的に無関係と思われるいくつかの信号を分離するために開発されてきた。それぞれの技法については、例えば[非特許文献１]、[非特許文献２]、[非特許文献３]、及び、[非特許文献４]に記載がある。

いくつかのセンサ（例えばマイクロフォン）を用いて、点音源（または信号源）の畳み込み混合が記録され、下流のマルチチャネル適応フィルタリングを用いて混合解除される。この混合解除は、ある特定の次数の統計的モーメントまで、マルチチャネル適応フィルタリングの出力信号を再び相互に統計的に分離しなければならないという点に基づいている。従って、理想的には、ソース信号の１つ（すなわち、点音源または信号源からの１つの信号）だけが、それぞれ、各出力チャネルに加えられるのがブラインド音源分離の目的である。しかし、その欠点は、混合解除後の出力におけるそれぞれの１チャネル表現のために、点音源（または信号源）に関する空間情報が失われる（とりわけ、センサ間のレベル差及びランタイム差）点にある。

一般に、想定された目的は、点音源または信号源の空間位置に関する空間情報を復元することにある（音源分離出力時に）。いくつかの研究が既に実施され、その分野で言及されて発表されており、後述する。

しかしながら、既知のアプローチには、やはり後述するように依然としていくつかの制限がある。これは、所望の点音源（または信号源）以外に、他の信号源（すなわち、例えばその他の点音源または信号源または干渉源）が、それぞれ、ブラインド信号分離出力（すなわちＢＳＳ出力）時に依然として存在する可能性のある現実的な応用シナリオにおいてＢＳＳ法を用いる場合にとりわけ発現する。

先行技術によるいくつかの現行システムでは、空間情報は省かれるか（例えば[非特許文献１]、[非特許文献２]、[非特許文献３]、及び、[非特許文献４]参照）、または、下流処理によって復元される。

この問題に関して、文献から４つの方法が知られている。
１．ＢＳＳとは無関係にあらかじめ決められた擬似空間特性または空間特性（または伝達関数）でＢＳＳ出力信号に下流フィルタリングを施すことによって空間情報が生成される（[非特許文献６]、[非特許文献７]、及び、[非特許文献８]参照）。例えば、国際公開第２００４／００６６２４Ａ１号パンフレット（[非特許文献８]も参照）には、ヘッド関連伝達関数（ＨＲＴＦ）のデータベースから伝達関数すなわち空間パルス応答を選択する方法が示されている。
２．特定のＢＳＳ法では、ＢＳＳシステムの混合解除フィルタから空間情報を取り出すことができるように、ブラインドシステム識別を実施することが可能である（[非特許文献９]、[非特許文献１０]参照）。次に、識別された空間特性を用いてＢＳＳ出力信号に下流フィルタリングを施すことによって、空間情報を生成することが可能になる。
３．さらに、ブラインドシステム識別を実施しない方法の場合、ＢＳＳシステムの混合解除フィルタから空間情報を取り出すことが可能である。[非特許文献１９]には、この情報が下流フィルタリングの一部として用いられる、従って空間特性を含む出力信号を生成する技法が示された。
４．もう１つの概念では、もとのセンサ信号が、後処理ブロック内で出力信号と共にマルチチャネルノイズ低減の処理を受ける（[非特許文献５]参照）。
ブラインド音源分離（ＢＳＳ）と同様に、マルチチャネルノイズ低減も特定の所望の信号（点音源または信号源）を改善する方法であるが、ＢＳＳとは対照的にそれぞれの干渉源の定常状態の仮定に基づくものである（例えば[非特許文献１１]参照）。
例えば[非特許文献５]に示すように、前述のアプローチには、マルチチャネルノイズ低減システムの出力チャネルｙ_p（ｎ）を基準信号ｄ_p（ｎ）として遅延マイクロフォン信号を含んでいるそれぞれの１チャネル適応フィルタに接続するステップが含まれる（[非特許文献５]の図１参照）。適応時間離散フィルタがデジタル信号処理に広く用いられる技法の代表である（[非特許文献１２]参照）。既知の原理は、既知の入力信号を前提としてシステムの出力信号を基準信号に近似させるようにフィルタ係数を決定することにある（[非特許文献１２]参照）。[非特許文献５]による概念の場合、これは、特定の基準に基づいて（例えば平均二乗誤差に基づいて）誤差信号ｅ_p（ｎ）＝ｄ_p（ｎ）−ｙ_p（ｎ）を最小限に抑えることによって実現する。

上述の４つの方法を利用して、所望の点音源（または信号源）の空間位置が正確に再現される。しかし、上述の４つの方法の全てが、所望の点音源以外に、依然として存在する可能性のあるそれぞれの他の信号源の（すなわち別の信号源または干渉源の）残留部分も同じ空間位置にマッピングされるという欠点を有している。

[非特許文献１３]には、所望の点音源の空間情報と他の信号源の空間情報との両方を考慮し、同じ位置にマッピングする問題を回避するもう１つの方法が提案されている。[非特許文献１３]によるアプローチは、２つ以上の結合ＢＢＳ基準の同時最適化に基づくものである。これによって、互いに非線形に結合される２つ以上の方程式が得られるが、大域的最適化を求めることができることを保証するのは不可能である。やはり[非特許文献１３]による実施例の１つによって明らかになったように、その結果、所望の点音源及び依然として存在する抑制信号源（または別の信号源または干渉源）の残留部分も同じ位置にマッピングされることになる。

さらに、[非特許文献１５]には、ウィーナーフィルタリングに基づくノイズ低減を利用して両方の耳の補聴器に関する２つのチャネル間の時間遅延を維持する方法が示されている。[非特許文献１５]によれば、いくつかのマイクロフォン信号が２つの独立したマルチチャネルウィーナーフィルタに送られる。ノイズの推定値を表わす第１のウィーナーフィルタの出力信号が第１のマイクロフォン信号から減算される。ノイズのもう１つの推定値を表わす第２のウィーナーフィルタの出力信号が第２のマイクロフォン信号から減算される。従って、出力信号は減算によって得られる。
Ａ．Ｈｙｖaｒｉｎｅｎ、Ｊ．Ｈａｒｈｕｎｅｎ、及び、Ｅ．Ｏｊａ、「ＩｎｄｅｐｅｎｄｅｎｔＣｏｍｐｏｎｅｎｔｏＡｎａｌｙｓｉｓ」、ニューヨーク、Ｗｉｌｅｙ＆Ｓｏｎｓ、２００１年Ｌ．Ｐｒｒａ及びＣ．Ｓｐｅｎｃｅ、「ＣｏｎｖｏｌｕｔｉｖｅＢｌｉｎｄＳｏｕｒｃｅＳｅｐａｒａｔｉｏｎｏｆＮｏｎ−ｓｔａｔｉｏｎａｒｙＳｏｕｒｃｅｓ」、ＩＥＥＥＴｒａｎｓ．ＳｐｅｅｃｈａｎＡｕｄｉｏＰｒｏｃｅｓｓｉｎｇ、２０００年５月、ｐ．３０２−３２７欧州特許第１０７０３９０Ｂ１号：提出日が１９９９年４月８日で、１９９８年４月８日の優先権を主張する、２００５年６月２２日に公告された、特許カテゴリ（ＩＰＣ）Ｈ０３Ｈ２１／００の、「ＣｏｎｖｏｌｕｔｉｖｅＢｌｉｎｄＳｏｕｒｃｅＳｅｐａｒａｔｉｏｎＵｓｉｎｇａＭｕｌｔｉｐｌｅＤｅｃｏｒｒｅｌａｔｉｏｎＭｅｔｈｏｄ」と題するＬ．Ｐａｒｒａ及びＣ．Ｓｐｅｎｃｅの欧州特許第１０７０３９０Ｂ１号明細書Ｈ．Ｂｕｃｈｎｅｒ、Ｒ．Ａｉｃｈｎｅｒ、及び、Ｗ．Ｋｅｌｌｅｒｍａｎ、「ＢｌｉｎｄＳｏｕｒｃｅＳｅｐａｒａｔｉｏｎｆｏｒＣｏｎｖｏｌｕｔｉｖｅＭｉｘｔｕｒｅｓ：ＡＵｎｉｆｉｅｄＴｒｅａｔｍｅｎｔ」、Ｙ．Ｈｕａｎｇ、Ｊ．Ｂｅｎｅｓｔｙ（編集者）、ＡｕｄｉｏＳｉｇｎａｌＰｒｏｃｅｓｓｉｎｇ、ボストン、ＫｌｕｗｅｒＡｃａｄｅｍｉｃＰｕｂｌｉｓｈｅｒｓ、２００４年Ｔ．Ｈｏｙａ、Ｔ．Ｔａｎａｋａ、Ａ．Ｃｉｃｈｉｃｋｉ、Ｔ．Ｍｕｒａｋａｍｉ、Ｇ．Ｈｏｒｉ、及び、Ｊ．Ｃｈａｍｂｅｒｓ、「ＳｔｅｒｅｏｐｈｏｎｉｃＮｏｉｓｅＲｅｄｕｃｔｉｏｎＵｓｉｎｇａＣｏｍｂｉｎｅｄＳｌｉｄｉｎｇＳｕｂｓｐａｃｅＰｒｏｊｅｃｔｉｏｎａｎＡｄａｐｔｉｖｅＳｉｇｎａｌＥｎｃｈａｎｃｅｍｅｎｔ」、ＩＥＥＥＴｒａｎｓ．ＳｐｅｅｃｈａｎＡｕｄｉｏＰｒｏｃｅｓｓｉｎｇ、２００５年５月、第１３巻、第３号、ｐ．３０９−３２０Ｊ．Ａｌｌｅｎ及びＤ．Ｂｅｒｋｌｅｙ、「ＩｍａｇｅＭｅｔｈｏｄｆｏｒＥｆｆｉｃｉｅｎｔｌｙＳｉｍｕｌａｔｉｎｇＳｍａｌｌ−ＲｏｏｍＡｃｏｕｓｔｉｃｓ」、Ｊ．Ａｃｏｕｓｔ．Ｓｏｃ．Ａｍ．、１９７９年、ｐ．９４３−９５０Ｊ．Ｇａｒａｓ、「Ａｄａｐｔｉｖｅ３ＤＳｏｕｎｄＳｙｓｔｅｍｓ」、ＫｌｕｗｅｒＡｃａｄｅｍｉｃＰｕｂｌｉｓｈｅｒｓ、２０００年提出日が２００３年６月２７日で、２００２年７月２日の優先権を主張する、２００４年１月１５日に公告された、特許カテゴリ（ＩＰＣ）Ｈ０４Ｓ１／００の、「ＳｏｕｎｄＳｏｕｒｃｅＳｐａｔｉａｌｉｚａｔｉｏｎＳｙｓｔｅｍ」と題する、Ｅ．Ｓｃｈａｅｆｆｅｒの国際公開第２００４／００６６２４Ａ１号パンフレットＨｅｒｂｅｒｔＢｕｃｈｎｅｒ、ＲｏｂｅｒｔＡｉｃｈｎｅｒ、及び、ＷａｌｔｅｒＫｅｌｌｅｒｍａｎｎ、「ＲｅｌａｔｉｏｎｂｅｔｗｅｅｎＢｌｉｎｄｓｙｓｔｅｍＩｄｅｎｔｉｆｉｃａｔｉｏｎａｎｄＣｏｎｖｏｌｕｔｉｖｅＢｌｉｎｄＳｏｕｒｃｅＳｅｐａｒａｔｉｏｎ」、Ｈａｎｄｓ−ｆｒｅｅＳｐｅｅｃｈＣｏｍｍｕｎｉｃａｔｉｏｎａｎｄＭｉｃｒｏｐｈｏｎｅＡｒｒａｙｓＷｏｒｋｓｈｏｐ、米国ニュージャージー州ピスカタウェイ、２００５年ＨｅｒｂｅｒｔＢｕｃｈｎｅｒ、ＲｏｂｅｒｔＡｉｃｈｎｅｒ、ＪｏｃｈｅｎＳｔｅｎｇｌｅｉｎ、ＨｅｉｎｚＴｅｕｔｓｃｈ、及び、ＷａｌｔｅｒＫｅｌｌｅｒｍａｎｎ、「ＳｉｍｕｌａｔａｎｅｏｕｓＬｏｃａｌｉｚａｔｉｏｎｏｆＭｕｌｔｉｐｌｅＳｏｕｎｄＳｏｕｒｃｅｕｓｉｎｇＢｌｉｎｄＡｄａｐｔｉｖｅＭＩＭＯＦｉｌｔｅｒｉｎｇ」、Ｐｒｏｃ．ＩＥＥＥＩｎｔ．Ｃｏｎｆ．ｏｎＡｃｏｕｓｔｉｃ，Ｓｐｅｅｃｈ，ａｎｄＳｉｇｎａｌＰｒｏｃｅｓｓｉｎｇ（ＩＣＡＳＳＰ）、米国フィラデルフィア、２００５年３月Ｒ．Ｍａｒｔｉｎ、「ＮｏｉｓｅＰｏｗｅｒＳｐｅｃｔｒａｌＤｅｎｓｉｔｙＥｓｔｉｍａｔｉｏｎＢａｓｅｄｏｎＯｐｔｉｍａｌＳｍｏｏｔｈｉｎｇａｎｄＭｉｎｉｍｕｍＳｔａｔｉｓｔｉｃｓ」、ＩＥＥＥＴｒａｎｓ．ＳｐｅｅｃｈａｎｄＡｕｄｉｏＰｒｏｃｅｓｓｉｎｇ、２００１年７月、第９巻、第５号、ｐ．５０４−５１２Ｓ．Ｈａｙｋｉｎ、「ＡｄａｐｔｉｖｅＦｉｌｔｅｒＴｈｅｏｒｙ」、第４版、Ｐｒｅｎｔｉｃｅ−Ｈａｌｌ、２００２年Ｔ．Ｔａｋａｔａｎｉ、Ｔ．Ｎｉｓｈｉｋａｗａ、Ｈ．Ｓａｒｕｗａｔａｒｉ、及び、Ｋ．Ｓｈｉｋａｎｏ、「Ｈｉｇｈ−ＦｉｄｅｌｉｔｙＢｌｉｎｄＳｅｐａｒｅｔｉｏｎｏｆＡｃｏｕｓｔｉｃＳｉｇｎａｌｓｕｓｉｎｇＳＩＭＯ−Ｍｏｄｅｌ−ＢａｓｅｄＩＣＡｗｉｔｈＩｎｆｏｒｍａｔｉｏｎ−ＧｅｏｍｅｔｒｉｃＬｅａｒｎｉｎｇ」、Ｐｒｏｃ．Ｉｎｔ．ＷｏｒｋｓｈｏｐｏｎＡｃｏｕｓｔｉｃＥｃｈｏａｎｄＮｏｉｓｅＣｏｎｔｒｏｌ（ＩＷＡＥＮＣ）、日本、京都、２００３年９月Ｋ．Ｍａｔｕｏｋａ及びＳ．Ｎａｋｓｈｉｍａｍ、「ＭｉｎｉｍｕｍＤｉｓｔｏｒｓｉｏｎＰｒｉｎｃｉｐｌｅｆｏｒＢｌｉｎｄＳｏｕｒｃｅＳｅｐａｒａｔｉｏｎ」、Ｐｒｏｃ．Ｉｎｔ．Ｃｏｎｆ．ｏｎＩｎｄｅｐｅｎｄｅｎｔＣｏｍｐｏｎｅｎｔＡｎａｌｙｓｉｓａｎｄＢｌｉｎｄＳｉｇｎａｌＳｅｐａｒａｔｉｏｎ、米国、カリフォルニア州サンディエゴ、２００１年１２月Ｔ．Ｊ．Ｋｌａｓｅｎ、Ｍ．Ｍｏｏｎｅｎ、Ｔ．ＶａｎｄｅｎＢｏｇａｅｒｔ、及び、Ｊ．Ｗｏｕｔｅｒｓ、「ＰｒｅｓｅｒｖａｔｉｏｎｏｆＩｎｔｅｒａｕｒａｌｔｉｍｅｄｅｌａｙｆｏｒｂｉｎａｕｒａｌｈｅａｒｉｎｇａｉｄｓｔｈｒｏｕｇｈｍｕｌｔｉ−ｃｈａｎｎｅｌＷｉｅｎｅｒｆｉｌｔｅｒｉｎｇｂａｓｅｄｎｏｉｓｅｒｅｄｕｃｔｉｏｎ」、Ｐｒｏｃ．ＩＥＥＥＩｎｔ．Ｃｏｎｆ．ｏｎＡｃｏｕｓｉｔｃｓ，Ｓｐｅｅｃｈ，ａｎｄＳｉｇｎａｌＰｒｏｃｅｓｓｉｎｇ（ＩＣＡＳＳＰ）、米国、フィラデルフィア、２００５年３月Ｗ．Ｈｅｒｂｏｒｄｔ、Ｆ．Ｎａｋａｍｕｒａ、Ｗ．Ｋｅｌｌｅｒｍａｎｎ、「Ｍｕｌｔｉ−ｃｈａｎｎｅｌｅｓｔｉｍａｔｉｏｎｏｆｐｏｗｅｒｓｐｅｃｔｒａｌｄｅｎｓｉｔｙｏｆｎｏｉｓｅｆｏｒｍｉｘｔｕｒｅｏｆｎｏｎ−ｓｔａｔｉｏｎａｙｓｉｇｎａｌｓ」、ＩＰＳＪＳＩＧＴｅｃｈｎｉｃａｌＲｅｐｏｒｔ、日本、京都、２００４年１２月、第２００４巻、第１３１号、ｐ．２１１−２１６Ｗ．Ｈｅｒｂｏｒｄｔ、Ｔ．Ｔｒｉｎｉ、Ｗ．Ｋｅｌｌｅｒｍａｎｎ、「Ｒｏｂｕｓｔｓｐａｔｉａｌｅｓｔｉｍａｔｉｏｎｏｆｔｈｅｓｉｇｎａｌ−ｔｏ−ｉｎｔｅｒｆｅｒｅｎｃｅｒａｔｉｏｆｏｒｎｏｎ−ｓｔａｔｉｏｎａｒｙｍｉｘｔｕｒｅｓ」、Ｐｒｏｃ．Ｉｎｔ．ＷｏｒｋｓｈｏｐｏｎＡｃｏｕｓｔｉｃＥｃｈｏａｎｄＮｏｉｓｅＣｏｎｔｒｏｌ、日本、京都、２００３年９月、ｐ．２４７−２５０ＨｅｒｂｅｔＢｕｃｈｎｅｒ、ＲｏｂｅｒｔＡｉｃｈｎｅｒ、Ｗ．Ｋｅｌｌｅｒｍａｎｎ、「ＴＲＩＮＩＣＯＮ：ＡＶｅｒｓａｔｉｌｅＦｒａｍｅｗｏｒｋｆｏｒＭｕｌｔｉｃｈａｎｎｅｌＢｌｉｎｄＳｉｇｎａｌＰｒｏｃｅｓｓｉｎｇ」、Ｐｒｏｃ．ＩＥＥＥＩｎｔ．Ｃｏｎｆ．ＯｎＡｃｃｏｕｓｔｉｃｓ，ＳｐｅｅｃｈａｎｄＳｉｇｎａｌＰｒｏｃｅｓｓｉｎｇ（ＩＣＡＳＳＰ）、カナダ、モントリオール、２００４年５月、ｐ．８８９−８９２Ｓ．Ｉｋｅｄａ、Ｎ．Ｍｕｒａｔａ、「ＡｍｅｔｈｏｄｏｆＩＣＡｉｎｔｉｍｅ−ｆｒｅｑｕｅｎｃｙｄｏｍａｉｎ」、Ｐｒｏｃ．Ｉｎｔ．ＳｙｍｐｏｓｉｕｍｏｎＩｎｄｅｐｅｎｄｅｎｔＣｏｍｐｏｎｅｎｔＡｎａｌｙｓｉｓａｎｄＢｌｉｎｄＳｉｇｎａｌＳｅｐａｒａｔｉｏｎ、フランス、Ａｕｓｓｏｉｓ、１９９９年１月、ｐ．３６５−３７１

既述の先行技術を考慮すると、本発明の目的は、出力信号によって十分な正確度で有用な信号源の空間位置が再現され、出力信号において干渉信号源からの干渉信号が低減し、干渉信号源からの残留干渉信号が有用な信号源の位置にマッピングされることがないように、複数の入力信号に基づいて複数の出力信号が生成される信号分離の概念を提供することにある。

この目的は、請求項１または１２に記載の信号分離器、請求項２３または２４に記載の方法、及び、請求項２５に記載のコンピュータプログラムによって実現する。

本発明によれば、請求項１に従って、第１のマイクロフォン信号における有用な信号源のオーディオ成分を表わす第１の出力信号を決定し、第２のマイクロフォン信号における有用な信号源のオーディオ成分を表わす第２の出力信号を決定するための信号分離器が提供される。

音源分離器によって生じる第１の部分信号が、ほぼ第１の信号源（有用な信号源）のオーディオ成分に相当し（を表わし）、第１の部分信号が音源分離器の第１の入力信号に対して（例えば、第１のマイクロフォン信号に対して）できる限りほとんど歪みを示さないことも保証されるように音源分離器を構成するのが有利であるというのが、本発明の中核をなす概念である。音源分離器の上述の実施により、第１の部分信号は、結果として、音源分離器の第１の入力信号（すなわち、例えば第１のマイクロフォン信号）における第１の信号源（有用な信号源）によって生じる信号部分にほぼ相当することになる。また、音源分離器によって生じる第２の部分信号が、ほぼ第２の信号源（干渉信号源）のオーディオ成分に相当し、やはり、第２の部分信号が音源分離器の第２の入力信号に対して（例えば、第２のマイクロフォン信号に対して）できる限りほとんど歪みを示さないように音源分離器を実施するのが有利であるということも分かった。従って、第２の部分信号は、音源分離器の第２の入力信号（例えば第２のマイクロフォン信号）に対する第２の信号源（干渉信号源）の影響にほぼ相当することになる。

従って、音源分離器の出力において２つの部分信号が得られるが、第１の部分信号は、基本的に第１の信号源（有用な信号源）のオーディオ信号成分を含んでいて、第１のマイクロフォン信号に対して、多くても最大歪みだけ（またはできるだけ少なく）歪んでおり、さらに、第２の部分信号は、基本的に第２の信号源（干渉信号源）のオーディオ信号成分を含んでいて、第２のマイクロフォン信号に対して、多くても最大歪みだけ（またはできるだけ少なく）歪んでいる。

従って、第１の部分信号は、第１の出力信号として直接利用可能である。第２の部分信号も、第２のマイクロフォン信号から第２の部分信号のオーディオ成分を除去するために直接利用可能であり、第２のマイクロフォン信号から第２の部分信号が除去されるので、第２の出力信号が生じることになる。

本発明のやり方では、第１の部分信号は、第１のマイクロフォン信号に対してできるだけ少ない歪みを示すことになる。従って、第１の部分信号における第１の信号源のオーディオ成分に関する位相情報は、第１のマイクロフォン信号における第１の信号源のオーディオ成分に関する位相情報と一致する。ちなみに、おそらく依然として第１の部分信号に含まれている可能性のある第２の信号源のオーディオ成分の残留部分に関する位相情報には、第１のマイクロフォン信号と第１の部分信号との間における歪みの制限のために、第１のマイクロフォン信号における第２の信号源のオーディオ成分と同じ位相情報が含まれている。従って、部分信号の生成時に歪みを制限することによって、第１の部分信号または第１の出力信号における第２の信号源オーディオ成分は、第１の信号源のオーディオ成分がマッピングされる位置とは異なる位置（一般に第２の信号源の位置）にマッピングされることになる。

第２のマイクロフォン信号に対する第２の部分信号における第２の信号源のオーディオ成分の歪みも同じ方法で制限される。従って、第２の部分信号は、例えば単純な差生成によって第２のマイクロフォン信号から第２の信号源のオーディオ成分を除去するのに極めて適している。すなわち、第２の部分信号は、第２のマイクロフォン信号における第２の信号源の部分に歪みのない形でほぼ一致するので、第２のマイクロフォン信号と第２の部分信号との差は、第２のマイクロフォン信号における第１の信号源から生じるオーディオ成分にほぼ相当する。

さらに、第２の部分信号は、第２のマイクロフォン信号に対して制限された程度にしか歪んでいないかまたは位相が変化していないので、第２の部分信号はその正しい空間位置における第２の信号源を表している。従って、第２の信号源のオーディオ成分は信号除去器によって空間的に正しいやり方で除去され、その結果、第２の出力信号における第２の信号源のオーディオ成分の残留部分が最小限に抑えられる。

さらに、第１の信号源の残留信号部分が、第２の部分信号において第２の入力信号（例えば第２のマイクロフォン信号）に対して空間的に正しく表わされる。このようにして、第２のマイクロフォン信号から第２の部分信号を除去すると（例えば差を生成することによって）、空間に関して誤って位置を特定された第１の信号源のオーディオ成分の一部が、第１の信号源の残留信号部分によって取り込まれることになる。

さらに、本発明による音源分離器の導入によって、第２のマイクロフォン信号と第２の部分信号との間の歪みが音源分離器によって制限されるので、信号除去器を特定の単純なやり方で実施することが可能になる。

従って、本発明による信号分離器は、音源分離器における信号歪みの制限によって、音源分離器の出力信号が（直接及びさらなる後処理を伴わずに）第１の信号源及び第２の信号源空間位置を表わすという極めて重要な利点をもたらすことになる。第１の部分信号は、第１のマイクロフォン信号における信号源から生じた部分を直接表わし、その一方で、第２のマイクロフォン信号における第１の信号源の部分は、ただ単に第２のマイクロフォン信号から第２の部分信号を除去するだけで得られる。従って、第１及び第２の出力信号は、音響センサの位置で知覚される第１の信号源の空間位置を正確に表わすことになり、干渉は出力信号における第２の信号源によって大幅に抑制されることになる。

また、用いられる音源分離器は、その出力においてさまざまな信号源のオーディオ成分の１チャネル表現を生じる従来の音源分離器とすることが可能であり、この従来の音源分離器の導入は、ただ単にその第１の入力（第１のマイクロフォン信号に関する）とその第１の出力（第１の部分信号に関する）との間の歪みを制限するかまたは最小限に抑えるため、並びに、その第２の入力（第２のマイクロフォン信号に関する）とその第２の出力（第２の部分信号に関する）との間の歪みを制限するかまたは最小限に抑えるために必要とされるだけである。

さらに、本発明による信号分離器は、干渉信号源の残留部分が入力信号に対するそれらの空間位置に関して変化しないか、または、マイクロフォン信号すなわち干渉信号源からの残留信号が干渉信号源のもとの位置または実際の位置にマッピングされるという利点をもたらす。

望ましい実施形態の場合、音源分離器は、室内における少なくとも２つの信号源の空間位置が原因でまたはそれらの統計的特性が原因でそれら信号源（すなわち、有用な信号源及び干渉信号源）のオーディオ成分を分離するために導入される。それらの相関特性のために信号源を分離するのはとりわけ有利である。というのは、この場合、信号分離がブラインド方式ですなわち信号源の空間位置または室内における音の伝搬に関する予備知識を持たずに実施されるからである。従って、音源分離器は、最小限の予備情報すなわち信号源によって発生する信号の相関特性または信号統計データに関する情報だけしか必要としない。

もう１つの実施形態では、音源分離器は、第１のマイクロフォン信号に対する第１の部分信号の歪みの測度の関数として第１の部分信号を生成し、第１のマイクロフォン信号に対する第１の部分信号の歪みに対する上限を設定するための処理仕様のパラメータを決定するようになっている。換言すれば、第１の部分信号及び第２の部分信号を決定するための処理仕様のパラメータが、歪みに上限があるように決定される。これは、例えば処理仕様のパラメータに関する値空間を事前に定義することによって実施可能であり、値空間は、歪みが最大歪みより小さくなるように選択される。例えば、事前定義には、第１の部分信号が所定のノルム（例えば平均平方）に従って所定の最大偏差未満の値だけ第１のマイクロフォン信号と異なると指定することが可能である。

実施形態の１つでは、音源分離器は、第１のマイクロフォン信号と第１の部分信号との間の歪みが所定のしきい値を超えることが立証された場合に、その歪みが低減するように処理仕様のパラメータを変更するために導入される。代わりにまたは追加として、音源分離器は、さらに、処理仕様のパラメータを設定または最適化する場合に、第１のマイクロフォン信号に対する第１の部分信号（または第２のマクロフォン信号に対する第２の部分信号）の歪みの測度を考慮して導入することも可能である（例えば[非特許文献１４]）。

上述の測度を用いて、概して言えば、第１のマイクロフォン信号と第１の部分信号の間（または第２のマイクロフォン信号と第２の部分信号の間）の歪みに上限が規定されるか、または、前記歪みが最小限に抑えられることになる。

もう１つの望ましい実施形態の場合、音源分離器は、費用関数を用いた最適化によって第１の部分信号及び第２の部分信号を生成するための１つの処理仕様（または複数の処理仕様）のパラメータを決定するために導入される。上述の最適化によって、信号源のセパレーション（部分信号間の統計的独立性）と歪みとのバランスを含む可能性のある最良の結果を実現することが可能になる。

もう１つの代替実施形態によれば、本発明には請求項１２に記載の信号分離器が含まれる。

請求項１０に記載の信号分離器は、音源分離器によって少なくとも２つのマイクロフォン信号による干渉信号源から干渉信号を抽出し、可調整フィルタによって結果生じる部分信号を異なるやり方で少なくとも２回歪ませ、第１のマイクロフォン信号から第１の歪み部分信号を除去し、第２のマイクロフォン信号から第２の歪み部分信号を除去するのが有利であるという中核概念に基づくものである。この結果、第１の補正マイクロフォン信号によって第１の出力信号が生じ、第２の補正マイクロフォン信号によって第２の出力信号が生じることになる。第１の歪み部分信号の生成におけるフィルタパラメータ及び第２の歪み部分信号の生成におけるフィルタパラメータを互いに独立して調整して、さまざまな方法で歪みを生じさせられた干渉信号源の変形干渉信号が第１のマイクロフォン信号及び第２のマイクロフォン信号から除去されるようにするために、さらにパラメータ調整器が導入される。パラメータ調整器は、従って、相互に独立して第１及び第２の歪み部分信号を生成するためのパラメータを調整し、両方のマイクロフォン信号において干渉信号源のオーディオ成分を別個に最小限に抑えるかまたは低減させるために導入される。これは、既知のように、干渉信号源と音響センサの間にはマイクロフォン信号を発生するための異なる伝搬経路が存在するため、第１のマイクロフォン信号における干渉信号源の影響が第２のマイクロフォン信号における干渉信号源の影響と異なるので有利である。

さらに、例えば、第１の補正マイクロフォン信号における干渉信号源のオーディオ成分が信号除去器の出力で低減するように実施するのが望ましい部分信号の適応歪みによって、第１の歪み部分信号において、干渉信号源が第１のマイクロフォン信号によって表わされるのと同じ空間位置に確実にマッピングされることになる。従って、第１の歪み部分信号と第１のマイクロフォン信号を組み合わせると、干渉信号源のオーディオ成分の残留部分が干渉信号源の実際の空間位置にマッピングされることになる。

それから類推すると、第２の出力信号において、干渉信号源の残留部分は上述のアプローチに基づいて干渉信号源の実際の位置にマッピングされる。従って、干渉信号源の残留部分が出力信号に存在する限りにおいて、両方の出力信号における干渉信号源の位置は、正確に表わされることになる。

さらに、２つの出力信号は、基本的に２つの入力信号またはマイクロフォン信号に直接基づくものであり、干渉信号源の信号部分だけが入力信号またはマイクロフォン信号から除去されるという点に留意しなければならない。従って、２つの出力信号は、やはり有用な信号源の空間位置を正確に再現することになる。

本発明による信号分離器のもう１つの利点は、２つのマイクロフォン信号から干渉信号源の信号を抽出できなければならないのは音源分離器だけという点である。従って、干渉信号源のオーディオ成分を再現する１チャネル出力信号を生成する必要があるのは音源分離器だけである。音源分離器に生じる可能性のあるマイクロフォン信号に対する部分信号の歪みは、可調整フィルタによって相殺されるが、可調整フィルタは、互いに独立して調整することが可能な２つの方法で部分信号を歪ませて、それぞれ異なる形で歪んだ干渉源の変形干渉信号を両方のマイクロフォン信号から除去する必要があるという事実を公正に評価する。

もう１つの望ましい実施形態では、第１の補正マイクロフォン信号におけるパワーと第２の補正マイクロフォン信号におけるパワーを決定し、第１の可調整フィルタのフィルタパラメータを変化させて、第１の補正マイクロフォン信号におけるパワーを低下させ、第２の可調整フィルタのフィルタパラメータを変化させて、第２の補正マイクロフォン信号におけるパワーを低下させるために、パラメータ調整器が導入される。実際には、第１の補正マイクロフォン信号のパワー及び第２の補正マイクロフォン信号のパワーは、第１及び第２の歪み部分信号を生成する場合に、可調整フィルタによって部分信号の歪が正しく調整されるか否かの容易に利用可能な判定基準になることが分かった。基本的に第１及び第２の歪み部分信号には干渉信号源による１つの信号部分だけしか含まれていないので、例えば、第１の補正マイクロフォン信号において干渉信号源のオーディオ成分が最小限に抑えられるように可調整フィルタの調整が行われる場合、第１の補正マイクロフォン信号のパワーは最小になる。上述の事実は、有用な信号源の信号が極めて弱い時間間隔に特定の効率の良いやり方で活用することも可能である。というのは、干渉信号源からの信号がマイクロフォン信号において優勢になるためである。上述と同様のことが、第２の歪み部分信号を生成するためのフィルタパラメータの最適な調整にも当てはまる。

ここで指摘しておくべきは、意図する信号が、例えばそれに関連したエネルギまたは（平均）パワーを有している可能性のある、例えばブロックまたは一時的部分でもあるという点である。

もう１つの望ましい実施形態の場合、パラメータ調整器には、少なくとも最低限の有用な信号強度を備えた有用な信号源からの有用な信号が第１及び／または第２のマイクロフォン信号に存在する場合にそれを認識するために導入される有用信号認識器が含まれている。パラメータ調整器は、さらに、少なくとも最低限の有用な信号強度を備える有用な信号が存在しない場合に限ってフィルタパラメータを変化させるために導入される。すなわち、補正されたマイクロフォン信号のパワーを最小限に抑えることによって、フィルタパラメータの調整を最適に実施することが可能になることが分かった。具体的には、有用な信号が全くないかまたは極めて小さいものしかない場合、補正されたマイクロフォン信号における干渉信号源のオーディオ成分の最適な低減が生じるように可調整フィルタのフィルタパラメータを調整すると、補正されたマイクロフォン信号のパワーがゼロになるかまたは少なくとも極めて小さくなる。

本発明の望ましい実施形態については、付属の図に関連してさらに詳細に後述することにする。

図１には、本発明第１の実施形態による二次条件を備えた音源分離器を用いる本発明の信号分離器のブロック図が示されている。図１による構成は全体が１００で表示されている。信号分離器１００は、２つのマイクロフォンまたは音響センサ１１０、１１２から２つのマイクロフォン信号ｘ₁、ｘ₂を受信する。マイクロフォンまたは音響センサ１１０、１１２は、少なくとも２つの信号源１２０、１２２からの音響信号を記録するが、下記において第１の信号源１２０は有用信号源と呼ばれ、下記において第２の信号源１２２は干渉信号源と呼ばれる。一般に、有用信号源１２０は、第１の音響センサ１１０及び第２の音響センサ１１２の両方によって感知することが可能である。また、干渉信号源も、一般に第１の音響センサ１１０及び第２の音響センサ１１２の両方によって感知することが可能である。従って、第１のマイクロフォン信号ｘ₁には、一般に有用信号源１２０と干渉信号源１２２の両方からの信号部分が含まれている。同様に、第２のマイクロフォン信号ｘ₂にも、一般に有用信号源１２０と干渉信号源１２２の両方からの信号部分が含まれている。

ここで留意すべきは、マイクロフォン信号ｘ₁及びｘ₂は、マイクロフォンまたは音響センサ１１０、１１２によって直接生成する必要はなく、例えばオーディオ信号の伝送によって（例えばアナログまたはデジタルデータリンクを介した）生成することもできるという点である。さらに、マイクロフォン信号ｘ₁、ｘ₂はオーディオ再生装置またはコンピュータから生じる場合もある。

ブラインド音源分離器１３０は、２つのマイクロフォン信号ｘ₁、ｘ₂を受信して、マイクロフォン信号ｘ₁、ｘ₂に基づいて２つの部分信号ｙ₁、ｙ₂を生成する。これに関して、第１の部分信号ｙ₁には、基本的に有用信号源１２０のオーディオ成分が含まれているが、第２の部分信号ｙ₂には、基本的に干渉信号源１２２のオーディオ成分が含まれている。第１の部分信号ｙ₁によって第１の出力信号ａ₁が生じる。オプションの遅延手段１３６によって、第２のマイクロフォン信号ｘ₂が遅延し、従って、遅延マイクロフォン信号ｘ₂′が生じる。差生成器１４０が、遅延した第２のマイクロフォン信号ｘ₂′を受信するが、差生成器１４０は、遅延した第２のマイクロフォン信号ｘ₂′から第２の部分信号ｙ₂を減算するために導入される。こうして、差生成器１４０は、遅延した第２のマイクロフォン信号ｘ₂′と第２の部分信号ｙ₂の間の差として第２の出力信号ａ₂を生成することになる。

遅延手段１３６なしで済ます場合、遅延した第２のマイクロフォン信号ｘ₂′は第２のマイクロフォン信号ｘ₂と同じになる。

本発明の信号分離器１００の構造説明に基づいて、以下ではその機能について述べることにする。

ブラインド音源分離器１３０は、二次条件を利用している間にブラインド音源分離を実施するために導入される。ブラインド音源分離器は、基本的に第１の信号源または有用信号源１２０のオーディオ成分を含んでいる第１の部分信号ｙ₁を送り出すが、ここで、第２の信号源または干渉信号源１２２のオーディオ成分は、第１の信号源または有用信号源１２０のオーディオ成分より少なくとも３ｄＢ、ただし望ましいのは６ｄＢ（ただし、さらに望ましいのは少なくとも１０ｄＢないし少なくとも２０ｄＢ）弱い。さらに、ブラインド音源分離器１３０は、第２の部分信号に基本的に第２の信号源または干渉信号源１２２のオーディオ成分が含まれるように、すなわち、例えば、第２の部分信号ｙ₂における第１の信号源１２０のオーディオ成分が、干渉信号源のオーディオ成分より少なくとも３ｄＢ、ただし望ましいのは６ｄＢ（ただし、さらに望ましいのは少なくとも１０ｄＢないし少なくとも２０ｄＢ）弱くなるように第２の部分信号ｙ₂を生成するために導入される。従って、ブラインド音源分離器１３０は、２つの部分信号ｙ₁及びｙ₂として、基本的に互いに独立した１チャネル信号として第１の信号源１２０及び第２の信号源１２２のオーディオ成分を含む２つの信号を生成する。

ブラインド音源分離器１３０は、さらに、第１の部分信号ｙ₁と第１のマイクロフォン信号ｘ₁との間の歪みが最大歪みより小さくなることを保証するために導入されるが、この最大歪みは一般に事前定義される。最大歪みは、例えば第１の部分信号ｙ₁と第１のマイクロフォン信号ｘ₁との間の平均２乗偏差によって規定することが可能である。第１の部分信号ｙ₁と第１のマイクロフォン信号ｘ₁との間の偏差の測度は、例えば第１のマイクロフォン信号ｘ₁におけるパワー及び／または第１の部分信号ｙ₁におけるパワーと関連づけることも可能である。

オプションにより、ブラインド音源分離器１３０は、さらに、第２の部分信号ｙ₂と第２のマイクロフォン信号ｘ₂との間の歪みが最大歪みより小さくなることを保証するために導入することが可能であるが、この最大歪みは一般に事前定義される。第２のマイクロフォン信号ｘ₂に対する第２の部分信号ｙ₂の最大歪みは、例えば第１のマイクロフォン信号に対する第１の部分信号ｙ₁の最大歪みと同じとすることもできるし、あるいは、それとは異なるようにすることも可能である。望ましい実施形態の１つでは、ブラインド音源分離器１３０は、第１のマイクロフォン信号ｘ₁に対する第１の部分信号ｙ₁の歪みと第２のマイクロフォン信号ｘ₂に対する第２の部分信号ｙ₂の歪みの両方に対する上限を規定するために導入される。

ブラインド音源分離器１３０は、さらに、第１のマイクロフォン信号ｘ₁に対する第１の部分信号ｙ₁の歪み（オプションにより、さらに第２のマイクロフォン信号ｘ₂に対する第２の部分信号ｙ₂の歪み）を最小限に抑えるために、または、パラメータの調整時に歪みの大きさを表わす少なくとも１つの基準を考慮して導入することが可能である。二次条件を備え、歪みの最適化または最小化を可能にするブラインド音源分離器の導入に関する詳細については、例えばＫ．Ｍａｔｓｕｏｋａ及びＳ．Ｎａｋａｓｈｉｍａによる[非特許文献１４]に記載がある。

従って、歪みを制限（または最適化または最小化）することになる上述の二次条件を有するブラインド音源分離器１３０によって、第１の部分信号ｙ₁が基本的に第１の信号源１２０のオーディオ成分を含んでおり、さらに、第１のマイクロフォン信号ｘ₁に対してあまり歪まないことが保証される。

従って、ブラインド音源分離器１３０は、第１の部分信号ｙ₁に、基本的に第１の信号源１２０から生じる第１のマイクロフォン信号ｘ₁の部分が含まれるように導入される。一方、第２の信号源１２２の信号部分は、第１の部分信号ｙ₁において低減させられるかまたは抑制される。従って、実質的には第１の部分信号ｙ₁と同じである出力信号ａ₁は、マイクロフォン信号ｘ₁に含まれる第１の信号源の部分を表わし、さらに、第１のマイクロフォン信号ｘ₁に対してほんのわずかだけ歪んでいる（ブラインド信号分離器１３０の二次条件によって指定される枠組み内で）。換言すれば、第１の出力信号ａ₁と第１のマイクロフォン信号ｘ₁との間の位相ずれは、ブラインド音源分離器１３０の調整とほとんど無関係である。換言すれば、第１の出力信号ａ₁と第１のマイクロフォン信号ｘ₁との間の位相ずれは、基本的にあらかじめ決められ、しかも、ブラインド音源分離器１３０の調整変更時に、できれば＋／−２０°を超えて変動しない（ただし、＋／−１０°以下または＋／−５°以下であればさらに望ましい）か、あるいは、そのいずれかである。同様に、二次条件を有するブラインド音源分離器１３０は、第２の部分信号ｙ₂と第２のマイクロフォン信号ｘ₂との間の位相ずれが、ブラインド音源分離器１３０の調整変更時に、＋／−２０°未満の変動（ただし、＋／−１０°以下または＋／−５°以下であればさらに望ましい）を生じるように導入される。

ブラインド音源分離器１３０のそれぞれの導入によって（二次条件に基づく）、第１の部分信号ｙ₁に基づくかまたは第１の部分信号ｙ₁と同じである第１の出力信号ａ₁において、第１の信号源１２０が位置に関して正確に表わされるという保証が得られる。また、第２の部分信号ｙ₂に、第２の信号源１２２のオーディオ成分が第２のマイクロフォン信号ｘ₂に対してほとんど歪まない形で含まれることになり、その結果、差生成器１４０によって第２の信号源１２２のオーディオ成分を第２のマイクロフォン信号ｘ₂からまたは遅延した第２のマイクロフォン信号ｘ₂′から除去することが可能になるという保証も得られる。第２の出力信号ａ₂は、基本的に第２のマイクロフォン信号ｘ₂に基づくものであり、第２の部分信号ｙ₂の遅延及び除去によってのみ第２のマイクロフォン信号ｘ₂に対して変化するので、第２の出力信号ａ₂における第１の信号源１２０の空間位置は正確に表わされる。さらに、構成１００によれば、出力信号ａ₁、ａ₂において、第２の信号源１２２の空間位置または第２の信号源１２２によって生じる残留部分も正確に表わされることになる。

指摘しておかなければならないのは、構成１００にはオプショナルセレクタ１５０が含まれるという点である。しかし、図示の実施形態において、第１の出力に第１の出力信号ａ₁として第１の部分信号ｙ₁を供給し、差生成器１４０に第２の部分信号ｙ₂を供給するタスクを行うのはセレクタ１５０だけである。ただし、図２にはセレクタ１５０の異なるスイッチング状態が示されている。

図２には、本発明の第２の実施形態による本発明の信号分離器のブロック図が示されている。図２による信号分離器は全体が２００で表示されている。図２による信号分離器２００は、図１による信号分離器１００と極めてよく似ているので、図１及び２の同じ特徴及び／または信号は、同じように指定されるので、ここでは再度の説明を控えることにする。

図２による構成２００と図１による構成１００は、構成２００に関して、第２の信号源１２２は有用信号を生じるが、第１の信号源１２０は干渉信号を生じるという点において基本的に異なっている。さらに、第２の部分信号ｙ₂には基本的に第２の信号源１２２のオーディオ成分が含まれており、一方、第１の部分信号ｙ₁には基本的に第１の信号源１２０のオーディオ成分が含まれているものと考えられる。このため、第２の部分信号ｙ₂は、第２のマイクロフォン信号ｘ₂における第２の信号源１２２によって生じた信号部分を表わす出力信号に相当する。このため、構成２００におけるセレクタ１５０は、第２の信号出力において第２の出力信号ａ₂として第２の部分信号ｙ₂を送り出すように構成されている。しかし、差生成器１４０は、基本的に干渉信号源１２０からの干渉信号を含む第１の部分信号ｙ₁を受信する。また、差生成器１４０は、第１のマイクロフォン信号ｘ₁またはオプションの遅延手段１３６によって遅延した第１のマイクロフォン信号ｘ₁′を受信する。従って、差生成器１４０の出力信号は、第１の出力信号ａ₁をなし、第１の出力に送られる（例えばもう１つのセレクタを介して）。

要するに、ブラインド音源分離の枠組み内において、有用信号が存在する音源分離器の出力、及び、干渉信号が存在する音源分離器の出力が前もって指定されないように設定することが可能である。従って、セレクタによって、音源分離器の出力のうちのどれが有用な信号を備え、従って信号分離器の出力に直接結合されるかに関する選択、及び、音源分離器の出力のうちのどれが干渉信号を備え、従って干渉信号除去手段に結合されるかに関する選択が行われるのが望ましい。

セレクタによって行われるこの選択は、例えば[非特許文献10]に記載のように、例えば（必ずしもそうとは限らないが）音源の位置に関する空間情報に基づいて実施される。

図１による第１の実施形態では、音源分離器（または音源分離器のコア）の第１の出力信号ｙ₁が有用信号を有しており、一方、音源分離器（または音源分離器のコア）の第２の出力信号ｙ₂は干渉信号を有している。従ってこの場合、第１の出力信号ｙ₁は第１の部分信号ｚ₁をなし、一方、第２の出力信号ｙ₂は第２の部分信号ｚ₂をなす。

図１による第２の実施形態では、音源分離器（または音源分離器のコア）の第１の出力信号ｙ₁が干渉信号を有しており、一方、音源分離器（または音源分離器のコア）の第２の出力信号ｙ₂は有用信号を有している。従ってこの場合、第１の出力信号ｙ₁は第２の部分信号ｚ₂をなし、一方、第２の出力信号ｙ₂は第１の部分信号ｚ₁をなす。

従って、一般には、干渉信号が除去されるマイクロフォン信号に対する第２の部分信号（または干渉信号）の歪みがなるべく制限されるように（例えば二次条件によって）設定することが可能である。しかし、第１の部分信号によって置き換えられるマイクロフォン信号に対する第１の部分信号（または有用信号）の歪みは制限されるのが望ましい。

図３には、本発明の第３の実施形態による可調整フィルタを用いた本発明による音源分離器のブロック図が示されている。図３による構成は、全体が３００で表示されている。構成３００には、２つのマイクロフォンまたは音響センサ３１０、３１２が含まれており、第１の音響センサ３１０は第１のマイクロフォン信号ｘ₁を送り出し、第２の音響センサ３１２は第２のマイクロフォン信号ｘ₂を送り出す。上記で既に例示のように、マイクロフォン信号は、例えば信号伝送手段、オーディオ信号再生手段、または、コンピュータのような他の音源から生じる可能性もある。

図３には、さらに第１の信号源３２０並びに第２の信号源３２２が示されているが、これらは両方ともマイクロフォン信号ｘ₁、ｘ₂において反映される音響信号を送り出す。図３に関連して、下記では信号源３２０が有用信号源をなし、第２の信号源３２２が干渉信号源をなすと仮定するものとする。構成３００には、さらにブラインド音源分離器（ＢＳＳ）３３０が含まれている。ブラインド音源分離器３３０は、第１のマイクロフォン信号ｘ₁及び第２のマイクロフォン信号ｘ₂を受信するが、さらに、第１及び第２のマイクロフォン信号ｘ₁、ｘ₂から部分信号ｙ₂を抽出するためにも導入される。構成３００には、さらに２つの可調整フィルタ３４０、３５０も含まれており、両方ともフィルタリングを施すべき入力信号として部分信号ｙ₂を受信する。第１の可調整フィルタ３４０は、部分信号ｙ₂に基づいて第１の歪み部分信号ｙ₂′を生成する。第２の可調整フィルタ３５０は、部分信号ｙ₂に基づいて第２の歪み部分信号ｙ₂″を生成する。構成３００には、さらに第１の差生成器３６０並びに第２の差生成器３７０が含まれている。第１の差生成器３６０は、第１のマイクロフォン信号ｘ₁または第１のマイクロフォン信号ｘ₁に基づく信号ｘ₁′を受信する。第１のマイクロフォン信号ｘ₁′に基づく信号は、例えばフィルタ３８０におけるオプションの全通過フィルタリングによって第１のマイクロフォン信号から生じる。また一方では、代替案として、信号ｘ₁′は第１のマイクロフォン信号ｘ₁と同じとすることも可能である。従って、差生成器３６０は、信号ｘ₁′から第１の歪み部分信号ｙ₂′を減算することによって、第１の出力信号ｅ₁（ａ₁とも呼ばれる）を得る。さらに、第２の差生成器３７０は、第２のマイクロフォン信号ｘ₂に基づく信号ｘ₂′を受信するが、信号ｘ₂′は、例えばフィルタ３８２における（オプションの）全通過フィルタリングによって第２のマイクロフォン信号ｘ₂から生じる。また一方では、信号ｘ₂′は第２のマイクロフォン信号ｘ₂と同じとすることも可能である。

第２の差生成器３７０は、信号ｘ₂′から（または第２のマイクロフォン信号ｘ₂から）第２の歪み部分信号ｙ₂″を減算し、その結果として、第２の出力信号ｅ₂（ａ₂とも呼ばれる）を得る。

第１の可調整フィルタ３４０に関連したパラメータ調整器３８６（適応コントローラとも呼ばれる）が、第１の出力信号ｅ₁を受信するが、第１の出力信号ｅ₁の関数として行われるフィルタリングのパラメータを調整するために導入される。換言すれば、第１の出力信号ｅ₁は第１の可調整フィルタ３４０に関する誤差信号をなす。同様に、第２の可調整フィルタ３５０に関連したパラメータ調整器３８８（適応コントローラとも呼ばれる）が第２の出力信号ｅ₂を受信して、フィルタパラメータを調整する。従って、第２の出力信号ｅ₂は第２の可調整フィルタ３５０に関する誤差信号の働きをする。可調整フィルタ３４０、３５０は、そのフィルタパラメータが、関連誤差信号に基づいて関連パラメータ調整器または適応コントローラ３８６、３８８によって調整される適応フィルタが望ましい。

ここで指摘しておかなければならないのは、第１の可調整フィルタ３４０及び第２の可調整フィルタ３５０は、相互に独立して、部分信号ｙ₂から第１の歪み部分信号ｙ₂′及び第２の歪み部分信号ｙ₂″を生成する単一フィルタとして実現することも可能である。この場合も、第１の出力信号ｅ₁は、部分信号ｙ₂から第１の歪み部分信号ｙ₂′を生成するために用いられるフィルタパラメータの調整に役立つ。第２の出力信号ｅ₂は、部分信号ｙ₂から第２の歪み部分信号ｙ₂″を生成するために用いられるフィルタパラメータの調整に役立つ。

従って、フィルタ３４０、３５０は、そのフィルタ特性が、関連する出力信号ｅ₁、ｅ₂の関数としてパラメータ調整器または適応コントローラ３８６、３８８によって調整される適応フィルタであり、第１の出力信号ｅ₁は、第１のマイクロフォン信号ｘ₁（またはそれに基づいて遅延させられた及び／または全通過フィルタリングを施された信号ｘ₁′）と第１の歪み部分信号ｙ₂′の間の差を表わし、第２の出力信号ｅ₂は、第２のマイクロフォン信号ｘ₂（または遅延及び／または全通過フィルタリングによってそれから得られた信号ｘ₂′）と第２の歪み部分信号ｙ₂″の間の差を表わしている。

一般に、結果として、第１のフィルタ３４０は、パラメータ調整器３８６に関連して、第１の歪み部分信号ｙ₂′が（できるだけうまく）第１のマイクロフォン信号ｘ₁またはそれから得られる信号ｘ₁′に一致するようにフィルタパラメータを調整するために導入される適応フィルタとみなすことも可能である。換言すれば、第１のマイクロフォン信号ｘ₁またはそれから得られる信号ｘ₁′は、第１の可調整フィルタ３４０のフィルタパラメータを調整するための基準信号の働きをする。同様に、第２のマイクロフォン信号ｘ₂またはそれから得られる信号ｘ₂′は、第２の可調整フィルタ３５０のフィルタパラメータを調整して、望ましくは第２の歪み部分信号が（できるだけうまく）第２のマイクロフォン信号ｘ₂またはそれから得られる信号ｘ₂′に一致するように第２のフィルタを調整するための基準信号の働きをする。

留意しなければならないのは、マイクロフォン信号ｘ₁、ｘ₂またはそれから得られる信号ｘ₁′、ｘ₂′に実質的に干渉信号源３２２の一部だけしか含まれていない場合、可調整フィルタ３４０または３５０のフィルタ係数の調整を実施するのが望ましいという点である。この場合、第１の歪み部分信号ｙ₂′が、マイクロフォン信号ｘ₁または信号ｘ₁′における干渉信号源３２２によって生じる部分にほぼ一致し、第２の歪み部分信号ｙ₂″が、第２のマイクロフォン信号ｘ₂または信号ｘ₂′に含まれる干渉信号源３２２の部分にほぼ一致するように、出力信号ｅ₁、ｅ₂に基づいてフィルタ３４０、３５０のパラメータを調節することが可能である。上述の条件の枠組み内において、第１の出力信号ｅ₁及び第２の出力信号ｅ₂における干渉信号源３２２によって生じる部分が、有効に低減するか、または、おそらく最小限に抑えられることになりさえする。（例えばパワーまたはエネルギに関して）。

マイクロフォン信号ｘ₁、ｘ₂に実質的に干渉信号源３２２の一部だけしか含まれていない場合、すなわち、マイクロフォン信号ｘ₁、ｘ₂に有用信号源３２０のごくわずかな部分だけしか含まれていない場合には、第１の可調整フィルタ３４０及び第２の可調整フィルタ３５０のフィルタパラメータは、このように調整するかまたは適応させるのが望ましい。このため、構成３００には、例えば、有用信号源３２０からの有用信号が所定のしきい値レベルまたは可変しきい値レベル未満の場合にそれを認識するために導入される有用信号検出器３９０がオプションで含まれている。このため、例えば、有用信号検出器３９０は、第１のマイクロフォン信号ｘ₁及び第２のマイクロフォン信号ｘ₂（または代わりにこれらのマイクロフォン信号の一方だけ）を受信する。有用信号検出器３９０は、例えば、音声信号がある場合にそれを認識する音声検出器とすることが可能である（例えば、音声信号だけが有用信号と意図されている場合）。従って、有用信号検出器３９０は、適応コントローラ３８６、３８８のための制御手段として機能することが可能であり、マイクロフォン信号ｘ₁、ｘ₂における有用信号のオーディオ成分が所定のしきい値または可変しきい値より弱い場合に限って、それらのフィルタパラメータを変更するかまたは適応させるように、可調整フィルタ３４０、３５０に関連した適応コントローラ３８６、３８８を（オプションにより）制御することが可能である。

有用信号検出器３９０が用いられるか否かに関係なく（ただし有用信号検出器３９０の使用に関しては望ましい）、例えば、第１の出力信号ｅ₁または第２の出力信号ｅ₂のパワーまたはエネルギがフィルタパラメータの変更によって低減するか、または、上述のパワーまたはエネルギがフィルタパラメータの変更によって最小限に抑えられるように、それぞれのフィルタパラメータを調整するために、可調整フィルタ３４０、３５０に関連した適応コントローラ３８６、３８８を導入することが可能である。換言すれば、フィルタパラメータの調整において、例えば、第１の出力信号ｅ₁に含まれているパワーまたはエネルギ及び／または第２の出力信号ｅ₂に含まれているパワーまたはエネルギが低減するようなやり方でのみ、フィルタパラメータの変更を許すことが可能である。従って、第１の出力信号ｅ₁または第２の出力信号ｅ₂におけるパワーまたはエネルギは、例えば信号ｘ₁′と第１の歪み部分信号ｙ₂′との間または信号ｘ₂′と第２の歪み部分信号ｙ₂″との間の偏差を表わした平方誤差と解釈することも可能である。

換言すれば、信号ｘ₁′と第１の歪み部分信号ｙ₂′との間の偏差を距離の測度に関して縮小するかまたは最小限に抑えるようなやり方で、例えば第１の可調整フィルタ３４０のフィルタパラメータを変更する（関連する適応コントローラ３８６を用いて）ことが望ましい。距離の測度は、例えば差分信号または誤差信号ｅ₁の任意の数学的ノルムとすることが可能である。第２の可調整フィルタ３５０のフィルタパラメータは、同じようなやり方で調整可能である（関連する適応コントローラ３８８によって）。

モニタされたフィルタの適応制御に関するさらなる詳細については、例えば[非特許文献16]及び[非特許文献１７]から知ることが可能である。本発明の概念の望ましい実施例では、[非特許文献１７]の方程式２に従う適応コントローラが用いられる。本発明の概念内で用いられる適応コントローラは、２つのパワー密度スペクトルの計算方法に関して[非特許文献１７]に示された適応コントローラとは異なる。本発明の概念内において、ブラインド音源分離（ＢＳＳ）の出力信号のパワー密度スペクトルを推定するのが望ましい。さらに、マイクロフォン信号とブラインド音源分離の出力信号との間の差分信号（たとえば信号ｅ₁、ｅ₂）のパワー密度スペクトルを推定するのが望ましい。

図４には、本発明の第４の実施形態による本発明の信号分離器のブロック図が示されている。図４による信号分離器は全体が４００で表示されている。図４による信号分離器４００は図３による信号分離器３００と極めてよく似ているので、図３及び４における同じ特徴または信号は同じ参照番号で表示されている。

図４による信号分離器４００と図３による信号分離器３００とは、信号分離器４００が第２のセレクタ４１０、４２０を用いて再構成可能であるという点において基本的に異なる。さらに、オプションによりブラインド音源分離器３３０は図４による信号分離器４００内において二次条件を用いてまたは用いずに操作することが可能である。換言すれば、第１のマイクロフォン信号ｘ₁と第１の部分信号ｙ₁との間または第２のマイクロフォン信号ｘ₂と第２の部分信号ｙ₂との間の歪みは、制限することもできるし、あるいは、自由に任意の値にすることも可能である。

第１の構成可能状態において、ブラインド音源分離器３３０は二次条件で動作し、第１の部分信号ｙ₁として、第１のマイクロフォン信号ｘ₁に対する歪みが制限されるか、低減させられるか、または、最小限に抑えられる信号を出力するものと仮定する。この場合、第１のセレクタ４１０は、信号ｚ₁として第１の部分信号ｙ₁を第２のセレクタ４２０に送る。第２のセレクタ４２０は、続いて第１の出力信号ａ₁として信号ｚ₁を第１の出力に送る。さらに、第１のセレクタ４１０は、信号ｚ₂として第２の部分信号ｙ₂を第１の可調整フィルタ３４０及び第２の可調整フィルタ３５０に送る。また、第２セレクタ４２０は、信号ａ₂として信号ｅ₂を第２の出力に送る。オプションの全通過フィルタまたは遅延手段３８２が、第２の差生成器３７０とちょうど同じようにこの状態で活動状態になる。前述の動作状態において、第２の可調整フィルタ３５０は、信号ｙ₂″として信号ｚ₂を不変のまま第２の差生成器３７０に送る。前述の状態において、信号ｅ₁が利用されないので、第１の差生成器３６０、第１の可調整フィルタ３４０、及び、第１の全通過フィルタまたは遅延手段３８０はオプションにより停止状態にすることが可能である。また、第２の可調整フィルタ３５０も停止状態にするかまたはバイパスすることが可能である。

第２の動作状態において、ブラインド音源分離器３３０は二次条件で動作させられるが、第２の部分信号ｙ₂は第２のマイクロフォン信号ｘ₂に基づく有用信号を表わしている。この場合、第１のセレクタ４１０は、信号ｚ₁として第２の部分信号ｙ₂を第２のセレクタ４２０に送る。第２の動作状態において、第２のセレクタ４２０は、第２の出力信号ａ₂として信号ｚ₁を第２の出力に送る。さらに、第１のセレクタは、信号ｚ₂として、前述の動作状態において基本的に干渉信号のオーディオ成分を含んでいる第１の部分信号ｙ₁を第１の可調整フィルタ３４０及び第２の可調整フィルタ３５０に送る。第１の可調整フィルタ３４０は、信号ｙ₂′を得るため信号ｚ₂を不変のまま送るのが望ましい。さらに、第２のセレクタ４２０は、第１の出力信号ａ₁として信号ｅ₁を第１の出力に送る。オプションの第１の全通過フィルタまたは遅延手段３８０及び第１の差生成器３６０は、前述の状態で活動状態になる。オプションにより、第２の全通過フィルタまたは遅延手段３８２、第２の差生成器３７０、及び／または、第２の可調整フィルタ３５０は、第２の動作状態において停止状態にすることが可能である。また、第１の可調整フィルタ３４０も停止状態にするかまたはバイパスすることが可能である。

第３の動作状態において、ブラインド音源分離器３３０は二次条件を用いずに動作させるが、第１の部分信号ｙ₁は基本的に干渉信号のオーディオ成分を有している。この場合、第１のセレクタ４１０は信号ｚ₂として第１の部分信号ｙ₁を第１の可調整フィルタ３４０及び第２の可調整フィルタ３５０に送る。第２のセレクタも、第１の出力信号ａ₁として信号ｅ₁を第１の出力に送る。さらに、第２のセレクタ４２０は、第２の出力信号ａ₂として信号ｅ₂を第２の出力に送る。

第４の動作状態の場合、ブラインド音源分離器３３０は二次条件を用いずに動作させるが、第２の部分信号ｙ₂は基本的に干渉信号のオーディオ成分を表わしている。この場合、第１のセレクタ４１０は、第１の可調整フィルタ３４０及び第２の可調整フィルタ３５０に第２の部分信号ｙ₂を送る。また、第２のセレクタは、第１の出力信号ａ₁として信号ｅ₁を第１の出力に送り、第２の出力信号ａ₂として信号ｅ₂を第２の出力に送る。

信号分離器４００は、こうして要件の関数として適応させることが可能である。回路４００は、さらに、上述の動作状態の１つだけまたは上述の動作状態の部分集合を呈することができるように導入することも可能である。

図５には、本発明の回路で利用されるブラインド音源分離器のブロック図が示されている。図５によるブラインド音源分離器は、全体が５００で表示されている。ブラインド音源分離器５００は、第１の入力信号５１０として例えば第１のマイクロフォン信号ｘ₁を受信し、第２の入力信号５１２として第２のマイクロフォン信号ｘ₂を受信する。ブラインド音源分離器５００は、さらに、第１の出力信号５２０として第１の部分信号ｙ₁を生成し、第２の出力信号５２２として第２の部分信号ｙ₂を生成するように構成されている。

音源分離器５００には、例えば２つのフィルタ／コンバイナ５３０、５３２が含まれている。例えば第１のフィルタ／コンバイナ５３０は、第１の入力信号５１０及び第２の入力信号５１２を受信して、第１の出力信号５２０を送り出す。第２のフィルタ／コンバイナ５３２は、やはり第１の入力信号５１０及び第２の入力信号５１２を受信して、第２の出力信号５２２を送り出す。また留意しておかなければならないのは、２つのフィルタ／コンバイナ５３０、５３２は１つのユニットとして構成することもできるという点である。

パラメータ調整器５４０が、第１のフィルタ／コンバイナ５３０及び第２のフィルタ／コンバイナ５３２のフィルタパラメータを調整するために導入される。このため、パラメータ調整器５４０は、例えば、両方の入力信号５１０、５１２を受信し、代わりにまたは追加として、２つの出力信号５２０、５２２を受信する。これに関して、パラメータ調整器５４０は、例えば入力信号５１０、５１２及び／または出力信号５２０、５２２の信号統計データを評価して、２つの出力信号５２０、５２２間の統計的独立性が改善されるか、最適化されるか、または、最大化されるようにフィルタパラメータを調整するために使用される。換言すれば、パラメータ調整器５４０は、例えば、出力信号５２０、５２２間の統計的独立性が改善される（増す）か、または、少なくとも劣化しない方向またはやり方でフィルタパラメータを変更するために導入される。オプションにより、パラメータ調整器５４０は、さらに第１の入力信号５１０と第１の出力信号５２０との間及び／または第２の入力信号５１２と第２の出力信号５２２との間の信号歪みを考慮して、信号歪みが所定の最大許容信号歪みを超えないようにフィルタパラメータを調整するか、設定するか、または、最適化するすることも可能である。従って、フィルタパラメータ調整器５４０は、出力信号５２０、５２２の統計的独立性と入力信号５１０、５１２に対する出力信号５２０、５２２の歪みとの間の費用関数によって指定される妥協を実現するために導入することが可能である。

ブラインド音源分離の実施に関する詳細については、関連文献、とりわけ文献[非特許文献14]を参照されたい。

ブラインド音源分離に関するさらなる詳細については、[非特許文献18]にも記載がある。出力信号の統計的独立性の測度として、例えばカルバックライブラー距離を用いることが可能である。代わりに、統計的独立性の測度として、最大エントロピー、最小相互伝達情報量、または、ネゲントロピーを用いることも可能である。統計的独立性に関する上述の測度については、例えば[非特許文献１]に記載がある。

図６には、図１による本発明の信号分離器１００の信号フローチャートが示されている。図６による信号フローチャートは、全体が６００で表示されており、第２のマイクロフォン信号からの干渉信号源のオーディオ成分の音源分離と除去の両方が信号を利用して周波数領域内で実施されるシステムについて表わしている。例えば、マイクロフォン信号ｘ₁（ｔ）は、時間ウィンドウ処理６１０によって個々の信号セグメントに細分される。時間信号ｘ₁（ｔ）が例えば特定のサンプリングレートのサンプルの形で存在する場合、セクションｘ₁（ｔ₁．．．ｔ₂）には、例えば時点ｔ₁とｔ₂の間の数Ｎのサンプル（Ｎは１６〜４，０９６の範囲が望ましい）が含まれている可能性がある。その後、信号セクションからスペクトル係数の集合を生成する変換がセクションｘ₁（ｔ₁．．．ｔ₂）に対して施される。例えば、離散フーリエ変換６２０を用いて、時間領域で信号セクションｘ₁（ｔ₁．．．ｔ₂）からスペクトル係数集合ｘ₁（ω₁）ｔ₁．．．ｔ₂〜ｘ₁（ω_I）ｔ₁．．．ｔ₂（Ｉは異なる周波数帯域の数を表わし、ω₁〜ω_Iは例えば離散フーリエ変換のさまざまな周波数帯域を表わしている）を生成することが可能である。第２のマイクロフォン信号の時間セグメントに関するスペクトル係数集合ｘ₂（ω₁）ｔ₁．．．ｔ₂〜ｘ₂（ω_I）ｔ₁．．．ｔ₂を得るため、最初は時間信号として生じる第２のマイクロフォン信号ｘ₂（ｔ）に関して類似の処理を実施することも可能である。

ブラインド信号分離器６３０は、時間セグメント内の第１のマイクロフォン信号ｘ₁（ｔ）を表わした第１のスペクトル係数集合、及び、時間セグメント内の第２のマイクロフォン信号ｘ₂（ｔ）を表わした第２のスペクトル係数集合を受信する。その結果、ブラインド信号源分離器６３０は、２つのスペクトル係数集合を処理して、さらに２つのスペクトル係数集合（ｙ₁（ω₁）ｔ₁．．．ｔ₂〜ｙ₁（ω_I）ｔ₁．．．ｔ₂及びｙ₂（ω₁）ｔ₁．．．ｔ₂〜ｙ₂（ω_I）ｔ₁．．．ｔ₂）として部分信号ｙ₁、ｙ₂を送り出す。第１の部分信号ｙ₁を表わしたスペクトル係数集合は、ある変換を用いて変換され、時間信号に戻される。例えば、逆離散フーリエ変換６４０を用いることが可能である。従って、第１の部分信号ｙ₁または出力信号ａ₁が時間領域で（例えば、時点ｔ₁〜ｔ₂の間または異なる時間領域において）得られる。

さらに、信号ｅ₁は例えば第２のマイクロフォン信号ｘ₂と第２の部分信号ｙ₂の差として生成することも可能である。図６に示すように、差生成は、異なるスペクトル範囲に関して個別に実施することが可能である。こうして得られた特定の時間間隔内における信号ｅ２のスペクトル係数（ｅ₂（ω₁）ｔ₁．．．ｔ₂〜ｅ₂（ω_I）ｔ₁．．．ｔ₂と呼ばれる）は、例えば逆離散フーリエ変換６６０を利用して変換され、時間信号に戻される。

指摘しておかなければならないのは、構成２００、３００、及び、４００における処理は、あるスペクトル範囲内でやはり完全にまたは部分的に実施することができるという点である。例えば、第１の可調整フィルタ３４０におけるフィルタ動作には、例えば信号ｚ₂を表わすスペクトル係数と関連するフィルタ係数の乗算だけしか含まれていないので、あるスペクトル範囲内における可調整フィルタ３４０の構成はとりわけ有利である。従って、フィルタ処理全体を個々の周波数領域に分割すると、互いに独立してフィルタ係数を調整することが可能になる。従って、この実施は、時間領域での実施に比べてかなり単純になる。従って、可調整フィルタ３４０、３５０の個々のフィルタ係数は、例えば互いに独立して調整することが可能になる。

周波数領域内における処理に関する詳細については、例えば[非特許文献２]及び[非特許文献３]から知ることが可能である。

周波数領域内における処理の実施に加えて、時間領域内における処理または一部が時間領域内で一部が周波数領域内の混合処理も可能である（例えば[非特許文献４]参照）。

図７には、本発明のもう１つの実施形態による本発明の信号分離器のブロック図が示されている。図７による信号分離器は全体が７００で表示されている。信号分離器７００に関して、Ｐのマイクロフォン７１０Ａ〜７１０ＰのＰのマイクロフォン信号が得られるものと仮定する。マイクロフォン信号はｘ₁〜ｘ_Pで表示される。音源分離器（またはブラインド音源分離器）７３０はＰのマイクロフォン信号ｘ₁〜ｘ_Pを受信して、Ｑの部分信号ｙ₁〜ｙ_Qを生成するが、部分信号ｙ₁〜ｙ_Qは、Ｑの異なる音源のオーディオ成分を表わしている。

下記では、Ｑ〜Ｉの信号源の信号を出力に送ることが求められるものと仮定する。さらに、出力信号からＩの干渉信号源からの信号をマスクすることが求められるものと仮定する。このため、セレクタ７４０を導入して、部分信号ｙ₁〜ｙ_QのＩの部分信号がフィルタ７４６Ａ〜７４６ＰのＰのブロックに送られる。ブロック７４６Ａ〜７４６Ｐのそれぞれには、関連する適応コントローラ７４７Ａ〜７４７Ｐを備えたＩの可調整フィルタが含まれている。例えば、第１ブロック７４６Ａには、Ｉの可調整フィルタ７５０Ａ〜７５０Ｉが含まれており、１つのブロック内のｉ番目の可調整フィルタが、フィルタリングを施すべき入力信号としてｉ番目の干渉信号（信号ｚ_Q-I+1〜ｚ_Q）を受信する。フィルタのＰ番目のブロックのＩの個別可調整フィルタの出力は、ｐ番目のマイクロフォン信号ｘ_Pに作用する。Ｐのフィルタブロックの少なくとも１つのブロック７４６Ａ〜７４６Ｐを用いて、ｐ番目のマイクロフォン信号からＩの干渉信号を除去すると、信号ｅ_Pが得られる。フィルタブロック７４６Ａ〜７４６Ｐのそれぞれを用いて、個別に調整可能なやり方でＩの干渉信号を歪ませ、その後それぞれのｐ番目のマイクロフォン信号から歪み信号が除去される（差生成によって）。Ｉの干渉信号に関する個々のフィルタのパラメータまたは係数は、それぞれの（例えばｐ番目の）マイクロフォン信号からＩの歪み干渉信号を除去または減算することによって生じる差分信号に基づいて調整される（関連する適応コントローラ７４７Ａ〜７４７Ｐによって）。

適応コントローラ７４７Ａ〜７４７Ｐは、例えばオプションの有用信号検出器７４８によって制御することも可能であり、有用信号検出器７４８はその機能に関して図３におる有用信号検出器３９０に対応する。

また、出力セレクタ７８０を導入して、干渉信号のないマイクロフォン信号（例えば信号ｅ₁〜ｅ_P）が出力に送られる。代わりに、出力セレクタ７８０は、例えば有用信号ｚ₁〜ｚ_Q-1を出力に送るように構成することも可能である。音源分離器に二次条件が含まれている場合、有用信号ｚ₁〜ｚ_Q-1は一般に（必ずしもそうとは限らないが）直接利用可能である。

図８には、本発明の実施形態の１つによる第１の本発明の方法に関するフローチャートが示されている。図８による方法は、全体が８００で表示されている。この方法は、第１のマイクロフォン信号における有用信号源のオーディオ成分を表わした第１の出力信号を決定し、さらに、第２のマイクロフォン信号における有用信号源のオーディオ成分を表わした第２の出力信号を決定するのに適している。この方法には、第１のステップ８１０として、２つのマイクロフォン信号を受信し、少なくとも２つの信号源のオーディオ成分を分離して、基本的に第１の信号源のオーディオ成分を表わし、第１の出力信号に相当する第１の部分信号を得るステップ及び第２の信号源のオーディオ成分を基本的に表わす第２の信号を得るステップが含まれている。この方法には、第２のステップ８２０として、処理仕様のパラメータを調整して、第１のマイクロフォン信号に対する第１の部分信号の歪みが最大歪みより小さくなるように第１の部分信号を生成するステップが含まれている。方法８００には、さらに第３のステップ８３０として、処理仕様のパラメータを調整して、第２のマイクロフォン信号に対する第２の部分信号の歪みが最大歪みより小さくなるように第２の部分信号を生成するためのステップが含まれている。この方法には、第４のステップ８４０として、さらに第２のマイクロフォン信号から第２の部分信号を除去して、第２の出力信号を得るステップが含まれており、第２の部分信号が低減することになる。図８による方法８００は、本発明の装置に関連して例示されたステップの全てによって補完することが可能である。

図９には、本発明の実施形態の１つによる第２の本発明の方法に関するフローチャートが示されている。図９による方法は、全体が９００で表示されており、第１のマイクロフォン信号における有用信号源のオーディオ成分を表わした第１の出力信号を決定し、第２のマイクロフォン信号における有用信号源のオーディオ成分を表わした第２の出力信号を決定するのに役立つ。方法９００には、第１のステップ９１０として、２つのマイクロフォン信号を受信し、少なくとも２つの信号源のオーディオ成分を分離して、基本的に干渉信号源のオーディオ成分を表わした部分信号を得るステップが含まれている。方法９００には、第２のステップ９２０として、部分信号を歪ませて、第１の歪み部分信号を得るステップと、第３のステップ９３０として、部分信号を歪ませて、第２の歪み部分信号を得るステップが含まれている。方法９００には、さらに第４のステップ９４０として、第１のマイクロフォン信号から第１の歪み部分信号を除去するステップと、第５のステップ９５０として、第２のマイクロフォン信号から第２の歪み部分信号を除去するステップが含まれている。方法９００には、第６のステップとして、さらに第１の可調整フィルタの第１のフィルタパラメータを調整して、第１のマイクロフォン信号における干渉信号源のオーディを成分を低減するステップと、第７のステップ９７０として、第２の可調整フィルタの第２のフィルタパラメータを調整して、第２のマイクロフォン信号における干渉信号源のオーディを成分を低減するステップが含まれている。

図９による方法９００は、本発明の装置に関連して例示されたステップの全てによって補完することが可能である。

また、本発明の方法は、状況に応じてハードウェアまたはソフトウェアで実施することも可能である。この実施は、それぞれの方法が実施されるやり方でプログラマブルコンピュータシステムとやりとりすることができる電子的に読み取り可能な制御信号を含んでいる、例えばディスク、ＣＤ、ＤＶＤ、ＲＯＭ、ＰＲＯＭ、ＥＰＲＯＭ、ＥＥＰＲＯＭ、または、フラッシュ記憶媒体といったデジタル記憶媒体で行うことが可能である。一般に、本発明は、こうして本発明を実施するための機械可読媒体に記憶されたプログラムコードを含むコンピュータプログラム製品がコンピュータで実行される場合、そのコンピュータ製品にあるということにもなる。換言すれば、本発明は、従って、コンピュータプログラムがコンピュータで実行される場合、この方法を実施するためのプログラムコードを含むコンピュータプログラムとして実現することが可能である。

以下では、本発明の中核をなす概念について簡単に要約することにする。さらに理解が深まるように、下記においてまずＰ＝２のセンサ及びＱ＝２の音源信号の場合について、本発明の説明を行うことにする。図４には、Ｐ＝Ｑ＝２の場合の装置または方法のブロック図が描かれている。上述のように、ブラインド音源分離システム（ＢＳＳシステム）３３０は、Ｐ＝２のセンサｘ₁、ｘ₂においてまたはセンサｘ₁、ｘ₂から、Ｑ＝２の統計的に独立した音源信号の重ね合わせを得る第１段階を形成する。ブラインド音源分離システム（ＢＳＳシステム）３３０は、２つの出力またはＢＳＳ出力ｙ₁、ｙ₂においてそれぞれ点音源の２つの信号の一方を送り出すのが理想的である。実際の応用シナリオでは、各事例において要求される点音源信号以外に、（信号ｙ₁、ｙ₂に）他の音源信号の残留部分が含まれている可能性がある。さらに、ブラインド音源分離システム（ＢＳＳシステム）３３０は、一般に任意のフィルタリング正確度までの音源信号だけを決定することが可能である。しかしながら、距離の測度によってＢＳＳシステムの入力ｘ₁、ｘ₂と出力ｙ₁、ｙ₂を結合する二次条件を含むことによって（例えば[非特許文献１４]参照）、ＢＢＳシステムによる分離した点音源の任意のフィルタリングが実施されないようにすることが可能になる。この場合、分離音源信号ｙ₁、ｙ₂は、第１の音源３２０（音源１）または第２の音源３２２（音源２）から生じるセンサ信号ｘ₁またはｘ₂におけるそれぞれの部分に対応するのが理想的である（[非特許文献１４]参照）。

上述の二次条件を具備するＢＳＳシステム３３０が選択されたか具備しないＢＳＳシステム３３０が選択されたかによって、後処理のタイプが異なることになる。図４による第２のセレクタ４２０を用いて出力信号を適切に選択することによって、以下で技法Ａ及び技法Ｂと呼ばれる２つの後処理技法間における切換えを実施することが可能である。技法Ａは、二次条件を具備するＢＳＳシステムを必要とするが、技法Ｂは二次条件を絶対に必要とするというわけではない。

両方の技法とも、第１のセレクタ４１０（セレクタ１）において、最初に信号ｙ₁または信号ｙ₂に所望の点音源が含まれているか否かに関する決定がなされる。次に、所望の点音源信号がチャネルｚ₁に送られ、干渉源信号がチャネルｚ₂に送られる。留意すべきは、実際の応用シナリオでは、他の音源信号の残留部分がまだ存在するという点である。以下では、技法Ａ及びＢについて述べることにする。

技法Ａ
所望の点音源がチャネルｙ₁内に位置する（すなわち、チャネルｙ₁が基本的に所望の点音源のオーディオ成分を表わす）場合、第１のセレクタ４１０（セレクタ１）はチャネルｙ₁をｚ₁に接続する。二次条件（ブラインド信号分離器３３０の）のために、ｚ₁には、第１の音源３２０（音源１）から第１のセンサまたは音響センサまたはマイクロフォン（センサ１）への伝搬について表わす正確な伝達関数が既に含まれている。従って、ｚ₁はその結果として第２のセレクタ４２０（セレクタ２）から第１の出力（出力１）につなぐことが可能になる（従って、第１の出力信号ａ₁を生成することになる）。

所望の点音源がチャネルｙ₂内に位置する場合、第１のセレクタ４１０（セレクタ１）は、チャネルｙ₂をｚ₁に接続することになる。二次条件のために、ｚ₁には、この場合、第２の音源３２２（音源２）から第２のセンサまたは音響センサまたはマイクロフォン（センサ２）への伝達関数が含まれている。これが、この場合、第２のセレクタ４２０（セレクタ２）がチャネルｚ１を第２の出力（出力２）につなぐことになる理由である（第２の出力信号ａ₂を得るために）。

第１の事例では、第１の音源３２０（音源１）から第２のセンサまたは音響センサまたはマイクロフォン（センサ２）への伝達関数が信号ｅ₂内で復元する。この場合、信号ｅ₂は、第２のセレクタ４２０（セレクタ２）によって第２の出力（出力２）につながれる（第２の出力信号ａ₂を生成するために）。

第２の事例では、第２の音源３２２（音源２）から第１のセンサまたは音響センサまたはマイクロフォン（センサ１）への伝達関数が必要とされる。前記伝達関数は信号ｅ₁内で復元する。その後、信号ｅ₁は、第２のセレクタ４２０（セレクタ２）によって第１の出力（出力１）につながれる（第１の出力信号ａ₁を生成するために）。

その信号ｚ₂（干渉信号を含んでいる）において生成される信号ｅ₁及びｅ₂は、適応フィルタ（ｈ₁とも呼ばれる）及び３５０（ｈ₂とも呼ばれる）に接続され、その後、基準信号から減算される。基準信号を用いて、それぞれ全通過フィルタ３８０（全通過フィルタａ₁とも呼ばれる）及び３８２（全通過フィルタａ₂とも呼ばれる）によって処理されるセンサ信号ｘ₁及びｘ₂も組み込まれる。特殊事例として、全通過フィルタ３８０（全通過フィルタａ₁）及び３８２（全通過フィルタａ₂）は純遅延装置として選択することも可能である。

フィルタ３４０（ｈ₁）、３５０（ｈ₂）を適応させるため、既に上述の[非特許文献12]による適応フィルタリング技法が用いられる。換言すれば、マルチチャネル音源分離システムの出力チャネルが、各事例毎に基準信号として遅延マイクロフォン信号を取り入れる１チャネル適応フィルタに接続される。一部が離散的な適応フィルタは、デジタル信号処理において広まっている技法を表わしている[非特許文献１２]。適応フィルタの原理は、既知の入力信号を前提として、システムまたは適応フィルタの出力信号が基準信号に近似するようにフィルタ係数を決定することにある（例えば[非特許文献１２]参照）。これは、誤差信号ｅ_p（ｎ）が特定の基準に従って（一般には平均２乗誤差に従って）最小限に抑えられるので実現可能である。例えば、下記の式は誤差信号に適用することが可能である。
ｅ₁（ｎ）＝ｘ₁′（ｎ）−ｙ₂′（ｎ）
ここで、ｎは、例えばサンプルのまたは時間間隔のモーメントを表わしており、平均２乗誤差（すなわち、誤差信号ｅ_pまたはｅ₁の平均パワーまたはエネルギ）は、例えば時間及び／または周波数で平均することによって求めることが可能である。

信号ｅ₁、ｅ₂の場合、望ましくない点音源はこうして抑制される。センサ信号（または全通過フィルタ３８０、３８２によってそれから得られる信号）が基準信号（ｘ₁′、ｘ₂′）として用いられるという事実により、各事例における所望の点音源と抑制される点音源は、両方とも信号ｅ₁、ｅ₂において空間的に正確に表わされる。また、各事例毎に１つの基準信号がセンサ信号によって生成されるという事実により、モニタされる適応フィルタに関して効率の良いアルゴリズムを用いて、フィルタ３４０（ｈ₁）、３５０（ｈ₂）を適応させることが可能になる。

後述することになる技法Ｂとは対照的に、技法Ａでは適応フィルタ３４０（ｈ₁）及び３５０（ｈ₂）は定数因子１に置き換えることが可能である（すなわち、なしで済ますことが可能である）。実際の適用に関連したこの特殊事例は、結果としてシステムを単純化することになる。純遅延装置としての全通過フィルタ３８０（全通過フィルタａ₁）及び３８２（全通過フィルタａ₂）の可能性のある単純化と共に、結果として２つの新たなブロック図が生じることになる。

図１には、所望の音源信号がｙ₂内に位置する場合、すなわち、第１のセレクタ４１０（セレクタ１）がＢＳＳ出力ｙ₂をｚ₁に接続する場合の簡略化されたシステムが描かれている。換言すれば、音源信号または有用音源信号はＢＳＳ出力ｙ₂に生じるが、干渉音源信号はＢＳＳ出力ｙ₁に生じる。

図２には、所望の音源信号がｙ₁内に位置する場合、すなわち、第１のセレクタ４１０（セレクタ１）がＢＢＳ出力ｙ₁をｚ₁に接続する場合の簡略化されたシステムが描かれている。換言すれば、音源信号または有用音源信号はＢＳＳ出力ｙ₁に生じることになる。しかし干渉音源信号はＢＳＳ出力ｙ₂に生じることになる。

技法Ｂ
技法Ｂの場合、ＢＳＳシステムに関連したまたはブラインドチャネル推定器に関連した二次条件は、必須ではなく任意である。従って、信号ｙ₁及びｙ₂には、センサまたは音響センサまたはマイクロフォン（センサ１、センサ２）に対する２つの音源３２０、３２２（音源１、音源２）の伝達関数が含まれていると仮定することはできない。このため、技法Ｂの場合、第２のセレクタ４２０（セレクタ２）は、第１の出力信号ａ₁として信号ｅ₁を第１の出力（出力ａ₁）につなぎ、さらに、第２の出力信号ａ₂として信号ｅ₂を第２の出力（出力ａ₂）につなぐ（図４参照）。

図７には、Ｐのセンサ及びＱの点音源を備えたＢＳＳシステム（またはブラインド音源分離のためのシステム）への本発明の拡張が描かれている。干渉源数はＩで表示されている。この結果、Ｑ−Ｉの所望の点音源が生じることになる。ＢＳＳシステム７００によってＱの独立した音源が生じ、Ｑ−Ｉの所望の点音源が第１のセレクタ７４０（セレクタ１）によってチャネルｚ₁〜ｚ_Q-Iに結合される。干渉源は、第１のセレクタ７４０（セレクタ１）によってチャネルｚ_Q-I+1〜ｚ_Qに結合される。チャネルｚ_Q-I+1〜ｚ_Qは、適応フィルタｈ_i、1〜ｈ_i、_I（ｉ＝１，．．．，Ｐ）に接続され、基準信号から減算される。換言すれば、チャネルｚ_Q-I+1〜ｚ_Qは、適応フィルタｈ_i、1〜ｈ_i、_Iによって歪まされ、歪んだ信号は基準信号、すなわち、例えば全通過フィルタリングを施されたマイクロフォン信号ｘ₁〜ｘ_Pから減算される。基準信号、すなわち、全通過によって改訂されたセンサ信号ｘ₁，．．．，ｘ_Pを用いて、全通過フィルタａ₁，．．．，全通過フィルタａ_Pがそれぞれ組み込まれる。特殊事例として、やはり全通過フィルタａ₁，．．．，全通過フィルタａ_Pを純遅延装置として選択することが可能になる。こうして、信号ｅ１，．．．，ｅＰが生成されるが、この場合、Ｑ−１の所望の点音源が全て抑制される。センサ信号（または全通過フィルタリングを施されたセンサ信号）が、基準信号として用いられるという事実により、所望の点音源と抑制される点音源の両方が、それぞれ、信号ｅ１〜ｅＰにおいて空間的に正確に表わされる。

技法Ａの場合、やはり二次条件を具備するＢＳＳを選択するのが望ましい。信号ｚ₁，．．．，ｚ_Q-Iに所望の点音源を含んでいる伝達関数に基づいて、信号ｚ₁，．．．，ｚ_Q-Iは第２のセレクタ７８０（セレクタ２）によってそれぞれの出力チャネルにつながれることになる。これは、第１のセレクタ７４０（セレクタ１）によって考慮されたＢＳＳ出力信号の潜在的可能性のある置換が、第２のセレクタ７８０によっても考慮されなければならないということを表わしている。セレクタ２によって実施される出力１，．．．，Ｐに対するチャネルｚ₁，．．．，ｚ_Q-Iの接続の選択については、Ｐ＝Ｑ＝２の場合に関して上記で詳述したが、この時点で同様に実施される。残りのＰ−Ｑ＋Ｉの出力信号が信号ｅ₁，．．．，ｅ_Pから決定される。

技法Ｂの場合、ＢＳＳシステム（すなわち、例えばブラインド音源分離器７３０）における二次条件は必須ではない。これが、ここで信号ｅ₁，．．．，ｅ_Pが出力１，．．．，Ｐに接続される理由である。

下記には、本発明の実際の導入に関連していくつかの観測結果が例示される。本明細書に記載の本発明は、音響信号に関するシミュレーションによって検証された。このため、２つの点音源の信号（音声信号）が２つのマイクロフォンを用いて残響室で記録された。この場合、信号の１つは所望の点音源を表わし、他の信号は干渉源を表わしている。マイクロフォン信号はＢＳＳアルゴリズムによって処理され、短い収束時間後、２つのＢＳＳ出力チャネルの一方において干渉信号のわずかな残留部分と共に所望の音声信号が生じることになる。もう一方のＢＳＳ出力では、所望の信号源のわずかな残留部分と共に干渉信号が生じることになる。第１のセレクタ（セレクタ１）は、干渉源を含むＢＳＳ出力信号を適応フィルタｈ_1,1及びｈ_2,1に対して送り出す。従って、所望の点音源並びに干渉源の残留部分の空間的に正確な表現が後処理ブロックの出力ｅ１及びｅ２において得られる。

技法Ａ及び技法Ｂの両方が、シミュレーションによって試験された。両方の技法とも、所望の点音源と干渉源の空間的に正確な表現を得ることが可能であった。２つのチャネルは、ステレオ再生システムすなわちヘッドセットによって聞くことが可能である。

従って要するに、本発明によれば、ブラインド音源分離システムにおいて空間情報を復元するためのシステムが得られるということを立証することが可能である。従来のブラインド音源分離システムでは、センサ（または音響センサまたはマイクロフォン）における信号の混合から存在する可能性のある干渉源の残留部分と共に、各出力チャネル毎に、各事例毎に要求される点音源の１チャネルの推定値が求められる。本発明によれば、所望の点音源と依然として存在する可能性のある干渉源の両方からの空間情報を復元する後処理ブロックが提供される。後処理ブロックの出力信号を決定するため、センサ信号（またはマイクロフォン信号）がブラインド音源分離の出力信号（例えば信号ｙ₁、ｙ₂，．．．，ｙ_Q）と共に利用される。文献によって既知の同様の概念の大部分は、所望の音源の空間表現だけしか実現しないので、依然として存在する可能性のある干渉信号もこの点にマッピングされる。

従って、本発明の基本的概念または動機は、新しい後処理ブロックでは、ＢＳＳの出力信号と共にもとのセンサ信号も処理されるので、出力において空間情報（すなわち点音源の空間位置に関する情報）を復元することにである。

要するに、本発明によれば、マルチチャネルオーディオ信号から干渉源の有効な除去を可能にし、干渉源の残りの残留部分はもとの空間位置にマッピングされるようにする信号分離器が得られることを立証することが可能である。本発明によれば、比較的低費用で実現することも可能である。

本発明の第１の実施形態による二次条件を備えた音源分離器を用いる本発明の信号分離器のブロック図である。本発明の第２の実施形態による二次条件を備えた音源分離器を用いる本発明の信号分離器のブロック図である。本発明の第３の実施形態による音源分離器によって生じる部分信号にフィルタリングを施す可調整フィルタを用いる本発明の信号分離器のブロック図である。本発明の第４の実施形態による再構成された本発明の信号分離器のブロック図である。本発明の信号分離器において利用される音源分離器のブロック図である。周波数領域において信号を利用する本発明の信号分離器に関する信号フローチャートである。本発明の第５の実施形態による少なくとも２つのマイクロフォン信号から２つ以上の干渉信号を除去するための本発明の信号分離器のブロック図である。本発明の第６の実施形態による本発明の第１の方法のフローチャートである。本発明の第７の実施形態による本発明の第２の方法のフローチャートである。

１００信号分離器
１２０有用信号源
１３０音源分離器
１３６遅延手段
１４０差生成器
２００信号分離器
３００信号分離器
３２０有用信号源
３３０音源分離器
３４０可調整フィルタ
３５０可調整フィルタ
３７０差生成器
３８２遅延手段
４００信号分離器
７００信号分離器
７４０音源分離器
７４６Ａ可調整フィルタ
７４６Ｐ可調整フィルタ

Claims

第１のマイクロフォン信号（ｘ₁）における有用信号源（１２０、３２０）のオーディオ成分を表わす第１の出力信号（ａ₁）を決定し、第２のマイクロフォン信号（ｘ₂）における有用信号源のオーディオ成分を表わす第２の出力信号（ａ₂）を決定するための信号分離器（１００、２００、４００、７００）であって、
室内に配置された複数の信号源からのオーディオ信号を受信して少なくとも２つの信号源のオーディオ成分を分離するため、室内に配置された２つの音響センサから前記２つのマイクロフォン信号を受信する音源分離器（１３０、３３０）を有し、
この音源分離器は、第１の信号源のオーディオ成分を表わす前記第１の出力信号に相当する第１の部分信号（ｙ₁）を得るように、また、第２の信号源のオーディオ成分を表わす第２の部分信号（ｙ₂）を得るように構成され、
前記音源分離器は、処理仕様のパラメータを調整して、前記第１のマイクロフォン信号に対する前記第１の部分信号の歪みが最大歪みより小さくなるように前記マイクロフォン信号から前記第１の部分信号を生成し、しかも、処理仕様のパラメータを調整して、前記第２のマイクロフォン信号に対する前記第２の部分信号の歪みが最大歪みより小さくなるように前記マイクロフォン信号から前記第２の部分信号を生成するように構成され、更に、
前記第２のマイクロフォン信号から前記第２の部分信号を除去して、第２の出力信号を得るための信号除去器（１４０、３７０）を有し、前記第２の部分信号を低減する、
信号分離器。
前記音源分離器（１３０、３３０）は、前記室内における信号源の空間位置に基づいてまたは信号源の統計的特性に基づいて少なくとも２つの信号源のオーディオ成分を分離するように構成されている、請求項１に記載の信号分離器。
前記音源分離器（１３０、３３０、５００）は、前記第１のマイクロフォン信号（ｘ₁）に対する前記第１の部分信号（ｙ₁）の歪みの測度の関数として前記第１の部分信号を生成して、前記第１のマイクロフォン信号に対する前記第１の部分信号の歪みに対する上限を設定するように処理仕様のパラメータを決定すべく構成され、
前記音源分離器は、前記第２のマイクロフォン信号（ｘ₂）に対する前記第２の部分信号（ｙ₂）の歪みの測度の関数として前記第２の部分信号を生成して、前記第２のマイクロフォン信号に対する前記第２の部分信号の歪みに対する上限を設定するように処理仕様のパラメータを決定すべく構成されている、
請求項１または２に記載の信号分離器。
前記音源分離器（１３０、３３０）が、費用関数を使用している間に、最適化によって前記第１の部分信号（ｙ₁）及び前記第２の部分信号（ｙ₂）を生成するための処理仕様のパラメータを決定するように構成され、
前記費用関数には、前記部分信号間の統計的独立性の測度、前記第１のマイクロフォン信号（ｘ₁）と前記第１の部分信号の間の歪みの測度、及び、前記第２のマイクロフォン信号（ｘ₂）と前記第２の部分信号（ｙ₂）との間の歪みの測度が含まれ、
前記最適化は、前記部分信号のできるだけ大きい統計的独立性と、前記第１のマイクロフォン信号と前記第１の部分信号との間のできるだけ小さい歪みと、前記第２のマイクロフォン信号と前記第２の部分信号との間のできるだけ小さい歪みとの間の費用関数によって決まる妥協を実現するように意図されている、
請求項１〜３のいずれか一つに記載の信号分離器。
前記第１の部分信号と前記第２の部分信号との間の統計的独立性の測度は、カルバックライブラー距離、最大エントロピー、最小伝達情報量、及び／または、ネゲントロピーに基づく、請求項４に記載の信号分離器。
前記費用関数においては、部分信号（ｙ₁、ｙ₂）の確率密度関数の非ガウス条件、非白色度、及び／または、非定常条件が考慮される、請求項４または５に記載の信号分離器。
前記第１のマイクロフォン信号（ｘ₁）と前記第１の部分信号（ｙ₁）との間の歪みの測度が、前記第１のマイクロフォン信号（ｘ₁）の値と前記第１の部分信号（ｙ₁）の値との間の差の大きさまたはノルムであり、
前記第２のマイクロフォン信号（ｘ₂）と前記第２の部分信号（ｙ₂）との間の歪みの測度が、前記第２のマイクロフォン信号（ｘ₂）の値と前記第２の部分信号（ｙ₂）の値との間の差の大きさまたはノルムである、
請求項３〜６のいずれか一つに記載の信号分離器。
前記信号除去器は、前記第２のマイクロフォン信号（ｘ₂）を遅延させて、前記第２の部分信号（ｙ₂）を決定する処理時間を相殺し、遅延した第２のマイクロフォン信号（ｘ₂′）を得るための遅延手段（１３６、３８２）と、前記遅延した第２のマイクロフォン信号と前記第２の部分信号との差として前記第２の出力信号（ａ₂）を決定するための差生成器（１４０、３７０）とが含まれる、請求項１〜７のいずれか一つに記載の信号分離器。
前記信号分離器は、複数のオーディオ周波数領域における複数の信号部分によって前記第１のマイクロフォン信号（ｘ₁）、前記第２のマイクロフォン信号（ｘ₂）、前記第１の部分信号（ｙ₁）、及び／または、前記第２の部分信号（ｙ₂）を表わすことで、あるスペクトル範囲内における分析に基づいて少なくとも２つの信号源のオーディオ成分を分離し、しかも、複数のオーディオ周波数領域における複数の信号部分に関して差を生じさせることによって、前記第２のマイクロフォン信号から前記第２の部分信号を除去するように構成されている、請求項１〜８のいずれか一つに記載の信号分離器。
前記第１の信号源が有用信号源をなす、請求項１〜９のいずれか一つに記載の信号分離器。
前記音源分離器は、２つの信号源の信号部分を分離して、２つの信号源のどちらが有用信号源であり、どちらが干渉信号源であるかを認識し、前記有用信号源のオーディオ成分を第１の部分信号として出力し、前記干渉信号源のオーディオ成分を第２の部分信号として出力するように構成されている、請求項１〜１０のいずれか一つに記載の信号分離器。
第１のマイクロフォン信号における有用信号源（３２０）のオーディオ成分を表わす第１の出力信号（ａ₁）を決定し、第２のマイクロフォン信号（ｘ₂）における有用信号源のオーディオ成分を表わす第２の出力信号（ａ₂）を決定するための信号分離器（３００、４００、７００）であって、
室内に配置された２つの音響センサから前記２つのマイクロフォン信号を受信することで室内に配置された信号源からのオーディオ信号を受信して、少なくとも２つの信号源のオーディオ成分を分離するための音源分離器（３３０、７４０）を有し、この音源分離器は、基本的に干渉信号源３２２のオーディオ成分を表わす、部分信号（ｙ₂）を得るように構成され、さらに、
前記部分信号を歪ませて、第１の歪み部分信号（ｙ₂′）を得、また、前記部分信号を歪ませて、第２の歪み部分信号（ｙ₂″）を得るための可調整フィルタ（３４０、３５０、７４６Ａ、７４６Ｐ）と、
前記第１の出力信号（ａ₁）をなす第１の補正マイクロフォン信号（ｅ₁）を得るため、前記第１のマイクロフォン信号から前記第１の歪み部分信号を除去し、前記第２の出力信号（ａ₂）をなす第２の補正マイクロフォン信号（ｅ₂）を得るため、前記第２のマイクロフォン信号から前記第２の歪み部分信号を除去する信号除去器（３６０、３７０）と、
前記可調整フィルタのフィルタパラメータを調整して、前記第１の出力信号における前記干渉信号源のオーディオ成分を低減し、前記可調整フィルタのフィルタパラメータを調整して、前記第２の出力信号における前記干渉信号源のオーディオ成分を低減するパラメータ調整器とを有する、
信号分離器。
前記音源分離器（１３０、３３０）は、室内におけるそれらの空間位置に基づいてまたは統計的特性に基づいて少なくとも２つの信号源のオーディオ成分を分離するように構成されている、請求項１２に記載の信号分離器。
前記音源分離器（１３０、３３０）は、費用関数を使用している間に、最適化によって前記第１の部分信号（ｙ₁）及び前記第２の部分信号（ｙ₂）を生成するための処理仕様のパラメータを決定するように設計され、前記費用関数には、前記部分信号間の統計的独立性の測度が含まれ、前記音源分離器は最適化によって、最適化前の状態に比較して、前記部分信号の統計的独立性を増加するように設計される、請求項１２または１３に記載の信号分離器。
前記第１の部分信号と前記第２の部分信号との間の統計的独立性の測度が、カルバックライブラー距離、最大エントロピー、最小伝達情報量、及び／または、ネゲントロピーに基づく、請求項１４に記載の信号分離器。
前記費用関数においては、部分信号（ｙ₁、ｙ₂）の確率密度関数の非ガウス条件、非白色度、及び／または、非定常条件が考慮される、請求項１２または１３に記載の信号分離器。
前記パラメータ調整器は、前記第１の補正マイクロフォン信号におけるパワーと前記第２の補正マイクロフォン信号におけるパワーを決定し、前記第１の可調整フィルタ（３４０、３５０、７４６Ａ、７４６Ｐ）のフィルタパラメータを変化させて、前記第１の補正マイクロフォン信号（ｅ₁）におけるパワーを低下させ、前記可調整フィルタのフィルタパラメータを変化させて、前記第２の補正マイクロフォン信号（ｅ₂）におけるパワーを低下させるように構成されている、請求項１２〜１６のいずれか一つに記載の信号分離器。
前記パラメータ調整器は、前記第１の補正マイクロフォン信号（ｅ₁）におけるパワーが最適化前の状態に対して低下するように、最適化によって前記可調整フィルタ（３４０、３５０、７４６Ａ、７４６Ｐ）のフィルタパラメータを調整し、前記第２の補正マイクロフォン信号（ｅ₂）におけるパワーが最適化前の状態に対して低下するように、前記可調整フィルタのフィルタパラメータを調整するように構成されている、請求項１２〜１７のいずれか一つに記載の信号分離器。
前記パラメータ調整器は、少なくとも最低の有用信号強度を備えた有用信号源（３２０）からの有用信号が前記第１のマイクロフォン信号（ｘ₁）または前記第２のマイクロフォン信号（ｘ₂）に存在する場合にそれを認識し、少なくとも最低の有用信号強度を具備する有用信号が存在しない場合に限って前記可調整フィルタ（３４０、３５０、７４６Ａ、７４６Ｐ）のフィルタパラメータを変更または最適化するように構成された有用信号検出器（３９０）を有する、請求項１２〜１８のいずれか一つに記載の信号分離器。
前記信号分離器は、複数のオーディオ周波数領域における複数の信号部分によって前記第１のマイクロフォン信号（ｘ₁）、前記第２のマイクロフォン信号（ｘ₂）、前記第１の部分信号（ｙ₁）、及び／または、前記第２の部分信号（ｙ₂）を表わすように構成され、あるスペクトル範囲内における分析に基づいて前記少なくとも２つの信号源（３２０、３２２）のオーディオ成分を分離するように構成され、前記可調整フィルタ（３４０、３５０、７４６Ａ、７４６Ｐ）が前記部分信号のさまざまなスペクトル成分を個別に歪ませるように構成され、
前記信号除去器（３６０、３７０）は、さまざまなスペクトル成分を個別に処理することによって前記第１の補正マイクロフォン信号（ｅ₁）における前記干渉信号源のオーディオ成分を低減し、さまざまなスペクトル成分を個別に処理することによって前記第２の補正マイクロフォン信号（ｅ₂）における前記干渉信号源のオーディオ成分を低減するように構成されている、請求項１２〜１９のいずれか一つに記載の信号分離器。
前記第１の補正マイクロフォン信号（ｅ₁）が前記信号除去器の出力信号に相当する、請求項１２〜２０のいずれか一つに記載の信号分離器。
前記信号除去器は、前記第１のマイクロフォン信号（ｘ₁）または前記第１のマイクロフォン信号の全通過フィルタリングバージョン（ｘ₁′）から前記第１の歪み部分信号（ｙ₂′）を減算するように構成されている差生成器を有し、この差生成器によって生成される差分信号が、前記第１の補正マイクロフォン信号（ｅ₁）に相当し、さらに、前記差生成器は、前記第２のマイクロフォン信号（ｘ₂）または前記第２のマイクロフォン信号の全通過フィルタリングバージョン（ｘ₂′）から前記第２の歪み部分信号（ｙ₂″）を減算するように構成され、前記差生成器によって生成される差分信号が、前記第２の補正マイクロフォン信号（ｅ₂）に相当する、請求項１２〜２１のいずれか一つに記載の信号分離器。
第１のマイクロフォン信号（ｘ₁）における有用信号源のオーディオ成分を表わした第１の出力信号（ａ₁）を決定し、第２のマイクロフォン信号（ｘ₂）における有用信号源のオーディオ成分を表わした第２の出力信号（ａ₂）を決定する方法であって、
室内に配置された２つの音響センサから２つのマイクロフォン信号を受信して、前記室内に配置された信号源からのオーディオ信号を受信するステップ（８１０）と、
少なくとも２つの信号源のオーディオ成分を分離して、前記第１の信号源のオーディオ成分を表わした第１の部分信号（ｙ₁）と、前記第２の信号源のオーディオ成分を表わした第２の部分信号（ｙ₂）を得るステップ（８１０）と、
処理仕様のパラメータを調整して、前記第１のマイクロフォン信号に対する前記第１の部分信号の歪みが最大歪みより小さくなるように、前記マイクロフォン信号から前記第１の部分信号を生成するするステップ（８２０）と、
処理仕様のパラメータを調整して、前記第２のマイクロフォン信号に対する前記第２の部分信号の歪みが最大歪みより小さくなるように、前記マイクロフォン信号から前記第２の部分信号を生成するするステップ（８３０）と、
前記第２のマイクロフォン信号から前記第２の部分信号を除去して、前記第２の出力信号を得るステップ（８４０）とを有し、前記第２の部分信号が低減される、方法。
第１のマイクロフォン信号（ｘ₁）における有用信号源のオーディオ成分を表わした第１の出力信号（ａ₁）を決定し、第２のマイクロフォン信号（ｘ₂）における有用信号源のオーディオ成分を表わした第２の出力信号（ａ₂）を決定する方法であって、
室内に配置された２つの音響センサからの信号を表わす２つのマイクロフォン信号を受信して、前記室内に配置された信号源からのオーディオ信号を受信するステップ（９１０）と、
少なくとも２つの信号源のオーディオ成分を分離して、基本的に干渉信号源のオーディオ成分を表わした部分信号（ｙ₂）を得るステップと、
可調整フィルタで前記部分信号を歪ませて、第１の歪み部分信号（ｙ₂′）を得るステップ（９３０）と、
可調整フィルタで前記部分信号を歪ませて、第２の歪み部分信号（ｙ₂″）を得るステップ（９４０）と、
前記第１のマイクロフォン信号から前記第１の歪み部分信号を除去して、前記第１の出力信号をなす第１の補正マイクロフォン信号を得るステップ（９４０）と、
前記第２のマイクロフォン信号から前記第２の歪み部分信号を除去して、前記第２の出力信号をなす第２の補正マイクロフォン信号を得るステップ（９５０）と、
前記可調整フィルタのフィルタパラメータを調整して、前記第１の補正マイクロフォン信号における前記干渉信号源のオーディオ成分を低減させるステップ（９６０）と、
前記可調整フィルタのフィルタパラメータを調整して、前記第２の補正マイクロフォン信号における前記干渉信号源のオーディオ成分を低減させるステップ（９７０）が含まれている、方法。
コンピュータで、請求項２３または２４に記載のステップを実行させるためのコンピュータプログラム。