JP2005234479A

JP2005234479A - 音源分離装置

Info

Publication number: JP2005234479A
Application number: JP2004046680A
Authority: JP
Inventors: Kazuaki Minami; 見並　　一明
Original assignee: Toyota Motor Corp; Toyota InfoTechnology Center Co Ltd
Current assignee: Toyota Motor Corp; Toyota InfoTechnology Center Co Ltd
Priority date: 2004-02-23
Filing date: 2004-02-23
Publication date: 2005-09-02

Abstract

【課題】最初に逆行列が演算されるまでの間に、各マイクを介して混合信号が入力されたとしても、話者音声に対応する信号を分離する処理を適切に実行する。
【解決手段】音源から各マイクまでの空間伝達関数行列の逆行列を所定演算方法に従って演算する逆行列演算手段と、その演算された逆行列を用いて、各マイクを介して入力される混合信号から、話者音声に対応する信号を分離する音源分離手段と、を備える音源分離装置であって、特定の状況とその特定の状況で用いられるべき逆行列との対応関係を格納する記憶手段と、現在の状況を検出する検出手段と、前記検出手段によって検出された現在の状況に対応する逆行列を、前記記憶手段から取得する取得手段と、を備え、前記音源分離手段は、前記逆行列が最初に演算されるまでの間、前記取得手段によって取得された逆行列を用いて、各マイクを介して入力される混合信号から、話者音声に対応する信号を分離する。
【選択図】図１

Description

本発明は、音源からマイクまでの空間伝達関数行列の逆行列を所定演算方法に従って演算し、その演算された逆行列を用いて、各マイクを介して入力される混合信号から、話者音声に対応する信号を分離する技術に関する。

従来、２つのマイクを介して入力される混合信号（話者音声と雑音の混合信号）から、話者音声に対応する信号を分離して取り出すための技術が提案されている（例えば非特許文献１参照）。
この従来技術においては、各音源Ｓから各マイクまでの空間伝達関数行列Ｇの逆行列Ｇ^−１が演算され、この逆行列Ｇ^−１を用いて、各マイクを介して入力される混合信号（話者音声と雑音の混合信号）から、話者音声に対応する信号が分離される。図６を参照しながら、この従来技術の動作について簡単に説明する。図６は、話者音声に対応する信号を分離するシステム起動直後の動作を示す。図６中、左から右方向（Ｔ０、Ｔ１、Ｔ２、Ｔ３、Ｔ４・・・の順）に時間が経過していることを示す。

本システム起動直後のＴ０（区間、タイムスロットともいう。以下同様。）においては、逆行列Ｇ^−１（０）を演算するために必要なデータを収集する処理が実行される。Ｔ１においては、Ｔ０で収集されたデータに基づいて、逆行列Ｇ^−１（０）を演算する処理が実行される。Ｔ２においては、Ｔ１で演算された逆行列Ｇ^−１（０）を用いて、各マイクを介して入力される混合信号から、話者音声に対応する信号を分離する処理が実行される。

なお、図６に示すように、Ｔ１においては、逆行列Ｇ^−１（１）を演算するために必要なデータを収集する処理も実行される。Ｔ２においては、Ｔ１で収集されたデータに基づいて、逆行列Ｇ^−１（１）を演算する処理も実行される。Ｔ３においては、Ｔ２で演算された逆行列Ｇ^−１（１）を用いて、各マイクを介して入力される混合信号から、話者音声に対応する信号を分離する処理も実行される。以後の区間（Ｔ２、Ｔ３、Ｔ４・・・）においても同様である。

このように、従来技術においては、システム起動後、最初に逆行列（ここではＧ^−１（０））が演算されるのはＴ２においてであるから、Ｔ２に至るまでのＴ０及びＴ１においては、逆行列Ｇ^−１（０）を演算することができない。従って、システム起動後、Ｔ２に至るまでのＴ０及びＴ１においては、仮に各マイクを介して混合信号が入力されたとしても、話者音声に対応する信号を分離する処理を適切に実行できないという問題がある。
http://www.wave-com.co.jp/noisekit/system.html 特開２００３−２７１１６６号公報

本発明の課題は、最初に逆行列が演算されるまでの間に、各マイクを介して混合信号が入力されたとしても、話者音声に対応する信号を分離する処理を適切に実行するための技術を提供することにある。

本発明は、上記課題を解決するためになされたものであり、音源から各マイクまでの空間伝達関数行列の逆行列を所定演算方法に従って演算する逆行列演算手段と、その演算さ
れた逆行列を用いて、各マイクを介して入力される混合信号から、話者音声に対応する信号を分離する音源分離手段と、を備える音源分離装置であって、特定の状況とその特定の状況で用いられるべき逆行列との対応関係を格納する記憶手段と、現在の状況を検出する検出手段と、前記検出手段によって検出された現在の状況に対応する逆行列を、前記記憶手段から取得する取得手段と、を備え、前記音源分離手段は、前記逆行列が最初に演算されるまでの間、前記取得手段によって取得された逆行列を用いて、各マイクを介して入力される混合信号から、話者音声に対応する信号を分離する。

本発明によれば、最初に逆行列が演算されるまでの間に、各マイクを介して混合信号が入力されたとしても、前記取得手段によって取得された逆行列を用いることができるので、話者音声に対応する信号を分離する処理を適切に実行できることになる。

上記音源分離装置においては、例えば、前記特定の状況で用いられるべき逆行列は、前記特定の状況で過去に演算された逆行列である。
これは、特定の状況で用いられるべき逆行列の例示である。従って、特定の状況で用いられるべき逆行列はユーザーなどが予め演算して求めた逆行列、その他逆行列であってもよい。

また、上記音源分離装置においては、例えば、音声関連処理手段と、音声関連処理手段動作スイッチと、をさらに備え、前記逆行列演算手段は、前記音声関連処理手段動作スイッチのオン・オフにかかわらず、音源から各マイクまでの空間伝達関数行列の逆行列を所定演算方法に従って演算し、前記音声関連処理手段動作スイッチがオンされる前は、前記音源分離手段と音声関連処理手段は動作せず、前記音声関連処理手段動作スイッチがオンされた後（例えば直後）は、前記音源分離手段は、前記音声関連処理手段動作スイッチがオンされる前に前記逆行列演算手段によって演算された逆行列を用いて、各マイクを介して入力される混合信号から、話者音声に対応する信号を分離し、前記音声関連処理手段は、前記音源分離手段からの出力である分離後の話者音声に対応する信号を利用して所定処理を行う。

このようにすれば、音声関連処理手段動作スイッチがオンされた後（例えば最初に逆行列が演算されるまでの間）は、各マイクを介して混合信号が入力されたとしても、音声関連処理手段動作スイッチがオンされる前に前記逆行列演算手段によって演算された逆行列を用いることができるので、話者音声に対応する信号を分離する処理を適切に実行できることになる。

また、上記音源分離装置においては、例えば、前記検出手段によって検出された現在の状況が変化したか否かを判定する判定手段と、前記判定手段によって変化したと判定された場合、前記逆行列演算手段による演算処理の優先度を高く設定する手段と、をさらに備える。

このようにすれば、現在の状況が変化した場合、逆行列演算手段による演算処理の優先度が高くなり、演算頻度が上がることから、収束を早めることが可能となり、話者音声に対応する信号を分離する処理をより適切に実行できることになる。

また、上記音源分離装置においては、例えば、各マイクからの入力が可聴周波数帯域の周波数成分を含むか否かを判定する判定手段をさらに備え、前記判定手段によって含まないと判定された場合、前記逆行列演算手段は、逆行列の演算を中止し、前記音源分離手段は、前記中止時に用いるために保持されていた逆行列を用いて、各マイクを介して入力される混合信号から、話者音声に対応する信号を分離する。

このようにすれば、各マイク１０からの入力が可聴周波数帯域の周波数成分を含まない場合（例えば無音状態の場合）には、逆行列Ｇ^−１演算部２０による演算を中止し、その中止直前に演算されていた逆行列Ｇ^−１を用いるので、逆行列Ｇ^−１演算値発散の発生を少なくすることが可能となり、話者音声に対応する信号を分離する処理をより適切に実行できることになる。

また、上記音源分離装置においては、例えば、前記中止時に用いるために、前記中止直前に演算された逆行列を保持する手段をさらに備える。
これは、中止時に用いるために保持されていた逆行列の例示である。従って、ユーザーなどが予め演算して求めた逆行列、その他逆行列を保持する手段であってもよい。

本発明は方法の発明として次のように特定することができる。
音源からマイクまでの空間伝達関数行列の逆行列を所定演算方法に従って演算し、その演算された逆行列を用いて、各マイクを介して入力される混合信号から、話者音声に対応する信号を分離する音源分離方法であって、前記逆行列が最初に演算されるまでの間、同じ又は類似の状況で過去に演算された逆行列を用いて、各マイクを介して入力される混合信号から、話者音声に対応する信号を分離する音源分離方法。

本発明はプログラムの発明として次のように特定することもできる。
コンピュータを、音源から各マイクまでの空間伝達関数行列の逆行列を所定演算方法に従って演算する逆行列演算手段、その演算された逆行列を用いて、各マイクを介して入力される混合信号から、話者音声に対応する信号を分離する音源分離手段、特定の状況とその特定の状況で用いられるべき逆行列との対応関係を格納する記憶手段、現在の状況を検出する検出手段、前記検出手段によって検出された現在の状況に対応する逆行列を、前記記憶手段から取得する取得手段、前記逆行列が最初に演算されるまでの間、前記取得手段によって取得された逆行列を用いて、各マイクを介して入力される混合信号から、話者音声に対応する信号を分離する手段、として機能させるためのプログラム。

また、本発明は上記プログラムを記録したコンピュータ読み取り可能な記録媒体としても特定できる。

本発明によれば、最初に逆行列が演算されるまでの間に、各マイクを介して混合信号が入力されたとしても、話者音声に対応する信号を分離する処理を適切に実行することが可能となる。

以下、この発明の一実施形態について図面を参照しながら説明する。
（話者音声分離装置の概要）
図１に示すように、話者音声分離装置（又は話者音声分離システム）は、逆行列Ｇ^−１を用いて、各マイク１０を介して入力される混合信号（話者音声と雑音の混合信号）から、話者音声に対応する信号を分離するための装置である。本装置は音声関連処理部Ａに接続されており、本装置からの出力である分離後の話者音声に対応する信号が音声関連処理部Ａへ入力される。音声関連処理部Ａは、その入力信号に対して既存の音声認識処理を実行し、その認識結果に応じて各種処理を実行する。本装置及び音声関連処理部Ａ（音源分離部３０）は音声関連処理部動作スイッチＢに接続されており、この音声関連処理部動作スイッチＢのオンにより、これらに電源が供給されるようになっている。なお、以下の実施形態においては、話者音声分離装置及び音声関連処理部Ａが車両に搭載されている例について説明する。
（話者音声分離装置の概略システム構成）
図１に示すように、話者音声分離装置は、少なくとも２つのマイク（マイクロフォン）１０、逆行列Ｇ^−１演算部２０、音源分離部３０、検出部４０、逆行列Ｇ^−１データベース５０、逆行列取得部６０、及び登録部７０などを備えている。

各マイク１０は逆行列Ｇ^−１演算部２０及び音源分離部３０に接続されており、各音源（話者音声と雑音）からの信号（混合信号）が各マイク１０を介して逆行列Ｇ^−１演算部２０及び音源分離部３０へ入力される。

逆行列Ｇ^−１演算部２０は、各音源Ｓから各マイク１０までの空間伝達関数行列Ｇの逆行列Ｇ^−１を、所定の演算方法に従って演算（推定）するためのものであり、例えば、図示しないＣＰＵが雑音除去プログラムなどの所定プログラムを実行することにより実現される。所定の演算方法としては、例えば、公知の独立成分分析法、その他、各種の統計的手法がある。

音源分離部３０は、各マイク１０を介して入力される混合信号から話者音声に対応する信号を、逆行列Ｇ^−１を用いて分離（音源分離）するためのものであり、例えば、図示しないＣＰＵが雑音除去プログラムなどの所定プログラムを実行することにより実現される。逆行列Ｇ^−１は、例えば、演算部２０による演算の結果得られる。または、後述の逆行列Ｇ^−１データベース５０から取得される（読み出される）。音源分離部３０は音声関連処理部Ａに接続されており、音源分離部３０からの出力である分離後の話者音声に対応する信号が音声関連処理部Ａへ入力される。

音声関連処理部Ａは、音源分離部３０からの入力信号に対して既存の音声認識処理を実行するためのものであり、例えば、音声認識部やハンズフリー部である。音声関連処理部Ａは、いわゆるカーナビゲーションシステムなどの車載システムに組み込まれていることもあるし、これとは別の独立したシステムとして構成されることもある。

検出部４０（本発明の現在の状況を検出する検出手段に相当）は、車両に関する状態を検出するためのものである。車両に関する状態としては、道路状態や車両状態などがある。道路状態としては、一般道路、高速道路、悪路（例えば未舗装道路）などの種別、上り坂入り口であるか否かなどがある。車両状態としては、エンジンの稼働状態、エアコンの稼働状態、ラジオやテレビなどのオーディオ機器の稼働状態などがある。

検出部４０は、例えば、道路状態として車両現在位置（例えば車両に搭載されているＧＰＳ受信機から得る）に対応する道路の種別を検出する場合には、車両現在位置に対応する道路データを、道路種別を示す識別子が対応付けられた各道路データを含む地図データベースから検索し、その検索された道路データの識別子を参照することで判別する。

また、検出部４０は、例えば、道路状態として車両現在位置が上り坂入り口であるか否かを検出する場合には、車両現在位置に対応する道路データを、上り坂入り口であることを示す識別子が対応付けられた各道路データを含む地図データベースから検索し、その検索された道路データに対応付けられている識別子の位置と車両現在位置とを比較することで判別する。

また、検出部４０は、例えば、車両状態としてエアコンの稼働状態を検出する場合には、エアコン制御部（ＥＣＵなど）からエアコンに対する制御内容を示すデータを得て、このデータに基づいてエアコンの稼働状態（稼働音など）を検出する。車両状態としてエンジンの稼働状態、オーディオ機器などの稼働状態を検出する場合も同様である。

逆行列Ｇ^−１データベース５０には、走行道路に関する情報や車両状態に関する情報（
又はこれらの組合せ）と逆行列Ｇ^−１（例えば過去に演算された逆行列Ｇ^−１）との対応関係が格納されている。

取得部６０は、検出部４０からその検出結果である車両に関する情報を得て、逆行列Ｇ^−１データベース５０から、その車両に関する状態に対応する逆行列Ｇ^−１を取得（読み出す）ためのものであり、例えば、図示しないＣＰＵが所定プログラムを実行することにより実現される。

登録部７０は、検出部４０からその検出結果である車両に関する情報と、その情報が検出された時点の演算結果である逆行列Ｇ^−１とを得て、両者を対応付けて逆行列Ｇ^−１データベース５０へ格納するためのものであり、例えば、図示しないＣＰＵが所定プログラムを実行することにより実現される。これにより、逆行列Ｇ^−１データベース５０には、車両に関する情報（走行道路に関する情報や車両状態に関する情報（又はこれらの組合せ））と過去に演算された逆行列Ｇ^−１との対応関係が格納される。
（話者音声分離装置の動作）
次に、以上のように構成された装置の動作について図面を参照しながら説明する。
（第１実施形態）
図２は第１実施形態の動作を説明するためのフローチャートである。

ユーザーが音声関連処理部動作スイッチＢをオフにすると、音源分離部３０と音声関連処理部Ａは電源が供給されず動作しない。このような状態の下では、逆行列Ｇ^−１演算部２０により逆行列Ｇ^−１を演算する必要はないともいえる。

しかしながら、本実施形態では、音源分離部３０と音声関連処理部Ａが動作しない状態の下であっても、図１に示す枠線内の要素（マイク１０、逆行列Ｇ^−１２０、検出部４０、逆行列Ｇ^−１ＤＢ５０、及び取得部６０）には常に（音声関連処理部動作スイッチＢのオン・オフにかかわらず）電源が供給されており、図６に示すように、各区間（Ｔ１、Ｔ２・・・）で逆行列Ｇ^−１演算部２０により逆行列Ｇ^−１を（Ｇ^−１（０）、Ｇ^−１（０）・・・）演算しこれをメモリ等に保持する（Ｓ１０）。

そして、ユーザーによる音声関連処理起動後（例えば、ユーザーが音声関連処理部動作スイッチＢをオンにすると）（Ｓ１１）、音声分離部３０は、電源が供給されて動作を開始する。すなわち、音声分離部３０は、最初に逆行列Ｇ^−１（０）が演算されるＴ２まで待つことなく、Ｓ１０で予め演算されて保持されている逆行列Ｇ^−１を用いて話者音声を分離する（Ｓ１２）。なお、音声関連処理部Ａも、電源が供給されて動作を開始する。すなわち、音声関連処理部Ａは、音源分離部３０からの入力信号に対して既存の音声認識処理を実行する。

従って、ユーザーによる音声関連処理起動後最初に逆行列Ｇ^−１（０）が演算されるまでの間に、各マイク１０を介して混合信号が入力されたとしても、音声関連処理部動作スイッチＢがオンされる前に逆行列Ｇ^−１演算部２０によって演算された逆行列を用いることができるので、話者音声に対応する信号を分離する処理を適切に実行できることになる。
（第２実施形態）
図３は第２実施形態の動作を説明するためのフローチャートである。

ユーザーによる音声関連処理の起動（例えば、ユーザーが音声関連処理部動作スイッチＢをオン）により（Ｓ２０）、取得部４０は、ナビＥＣＵ（音声関連処理部Ａがいわゆるナビゲーション装置に含まれる場合）などから走行道路に関する情報、他のＥＣＵから車両状態に関する情報を所定のタイミング（例えば定期的又は設定タイミングごと）で取得
する（Ｓ２１）。また、取得部４０は、その取得した情報（走行道路に関する情報、車両状態に関する情報）に対応する逆行列Ｇ^−１を、逆行列Ｇ^−１データベース５０から取得する（Ｓ２２）。ここでは、逆行列Ｇ^−１データベース５０には、走行道路に関する情報や車両状態に関する情報（又はこれらの組合せ）と過去に演算された逆行列Ｇ^−１との対応関係が格納されているものとする。従って、取得部４０は該当する過去に演算された逆行列Ｇ^−１を取得する。この逆行列Ｇ^−１は過去に同じ状況で演算したものである。

そして、音声分離部３０は、最初に逆行列Ｇ^−１（０）が演算されるＴ２まで待つことなく、先ほどＳ２２で取得した過去に演算された逆行列Ｇ^−１を初期値として用いて話者音声を分離する（Ｓ２３）。なお、音声関連処理部Ａも、Ｓ２０以降電源が供給されて動作を開始する。すなわち、音声関連処理部Ａは、音源分離部３０からの入力信号に対して既存の音声認識処理を実行する。

従って、最初に逆行列Ｇ^−１（０）が演算されるまでの間に、各マイク１０を介して混合信号が入力されたとしても、逆行列Ｇ^−１データベース５０から読み出した逆行列を用いることができるので、話者音声に対応する信号を分離する処理を適切に実行できることになる。
（第３実施形態）
図４は第３実施形態の動作を説明するためのフローチャートである。

ユーザーによる音声関連処理の起動（例えば、ユーザーが音声関連処理部動作スイッチＢをオン）により（Ｓ３０）、取得部６０は、ナビＥＣＵなどから走行道路に関する情報、他のＥＣＵから車両状態に関する情報を所定のタイミング（例えば定期的又は設定タイミングごと）で取得する（Ｓ３１）。そして、取得部６０は、その取得した情報に基づいて走行道路が変わったか（あるいは車両状態が変わったか）を判定し、変更有り（例えばより走行音が大きい道路に変わった）と判定した場合には、他の処理よりも、逆行列Ｇ^−１演算部２０による演算処理の優先度を高くして、演算頻度を上げる（Ｓ３２）。例えば、逆行列Ｇ^−１演算部２０をタスクとして構成している場合には、そのＣＰＵ割当時間を増やすことで優先度を高くする。例えば、図６において、４秒に１回演算していたのを１秒に１回演算するようにする。

音声分離部３０は、演算頻度が上がった逆行列Ｇ^−１演算部２０により演算された逆行列Ｇ^−１を用いて話者音声を分離する（Ｓ３３）。なお、音声関連処理部Ａも、Ｓ３０以降電源が供給されて動作を開始する。すなわち、音声関連処理部Ａは、音源分離部３０からの入力信号に対して既存の音声認識処理を実行する。

このように、走行道路が変わったか（あるいは車両状態が変わったか）場合には、逆行列Ｇ^−１演算部２０による演算処理の優先度を高くして、演算頻度を上げるように構成してあることから、走行条件等変動時の収束を早めることが可能となり、話者音声に対応する信号を分離する処理をより適切に実行できることになる。
（第４実施形態）
図５は第４実施形態の動作を説明するためのフローチャートである。

ユーザーによる音声関連処理の起動（例えば、ユーザーが音声関連処理部動作スイッチＢをオン）により（Ｓ４０）、取得部６０は、ナビＥＣＵなどから走行道路に関する情報、他のＥＣＵから車両状態に関する情報を所定のタイミング（例えば定期的又は設定タイミングごと）で取得する（Ｓ４１）。そして、取得部６０は、その取得した情報に基づいて、各マイク１０からの入力が可聴周波数帯域の周波数成分を含むか否かを判定し、含まないと判定した場合（例えばエンジン停止時、車両停止時、エアコンオフ時）には、逆行列Ｇ^−１演算部２０による逆行列Ｇ^−１の演算を中止し、その中止直前に演算されていた
逆行列Ｇ^−１を用いて話者音声を分離する（Ｓ４１、Ｓ４２）。なお、音声関連処理部Ａも、Ｓ４０以降電源が供給されて動作を開始する。すなわち、音声関連処理部Ａは、音源分離部３０からの入力信号に対して既存の音声認識処理を実行する。

このように、各マイク１０からの入力が可聴周波数帯域の周波数成分を含まない場合には、逆行列Ｇ^−１演算部２０による演算を中止し、その中止直前に演算されていた逆行列Ｇ^−１を用いて話者音声を分離するように構成してあることから、逆行列Ｇ^−１演算値発散の発生を少なくすることが可能となり、話者音声に対応する信号を分離する処理をより適切に実行できることになる。

上記実施形態はあらゆる点で単なる例示にすぎない。このため、本発明は上記実施形態に限定して解釈されるものではない。すなわち、本発明は、その精神または主要な特徴から逸脱することなく、他の様々な形で実施することができる。

本発明の実施形態である話者音声分離装置の概略システム構成である。第１実施形態の動作を説明するためのフローチャートである。第２実施形態の動作を説明するためのフローチャートである。第３実施形態の動作を説明するためのフローチャートである。第４実施形態の動作を説明するためのフローチャートである。音声分離処理を説明するための図である。

符号の説明

１０マイク
２０逆行列Ｇ^−１演算部
３０音源分離部
４０検出部
５０逆行列Ｇ^−１データベース
６０逆行列取得部
７０登録部
Ａ音声関連処理部（音声認識部／ハンズフリー部）
Ｂ音声関連処理部動作スイッチ

Claims

音源から各マイクまでの空間伝達関数行列の逆行列を所定演算方法に従って演算する逆行列演算手段と、その演算された逆行列を用いて、各マイクを介して入力される混合信号から、話者音声に対応する信号を分離する音源分離手段と、を備える音源分離装置であって、
特定の状況とその特定の状況で用いられるべき逆行列との対応関係を格納する記憶手段と、
現在の状況を検出する検出手段と、
前記検出手段によって検出された現在の状況に対応する逆行列を、前記記憶手段から取得する取得手段と、
を備え、
前記音源分離手段は、前記逆行列が最初に演算されるまでの間、前記取得手段によって取得された逆行列を用いて、各マイクを介して入力される混合信号から、話者音声に対応する信号を分離する音源分離装置。
前記特定の状況で用いられるべき逆行列は、前記特定の状況で過去に演算された逆行列である、
請求項１に記載の音源分離装置。
音声関連処理手段と、
音声関連処理手段動作スイッチと、
をさらに備え、
前記逆行列演算手段は、前記音声関連処理手段動作スイッチのオン・オフにかかわらず、音源から各マイクまでの空間伝達関数行列の逆行列を所定演算方法に従って演算し、
前記音声関連処理手段動作スイッチがオンされる前は、前記音源分離手段と音声関連処理手段は動作せず、
前記音声関連処理手段動作スイッチがオンされた後は、前記音源分離手段は、前記音声関連処理手段動作スイッチがオンされる前に前記逆行列演算手段によって演算された逆行列を用いて、各マイクを介して入力される混合信号から、話者音声に対応する信号を分離し、前記音声関連処理手段は、前記音源分離手段からの出力である分離後の話者音声に対応する信号を利用して所定処理を行う、
請求項１又は２に記載の音源分離装置。
前記検出手段によって検出された現在の状況が変化したか否かを判定する判定手段と、
前記判定手段によって変化したと判定された場合、前記逆行列演算手段による演算処理の優先度を高く設定する手段と、
をさらに備える請求項１から３のいずれかに記載の音源分離装置。
各マイクからの入力が可聴周波数帯域の周波数成分を含むか否かを判定する判定手段をさらに備え、
前記判定手段によって含まないと判定された場合、
前記逆行列演算手段は、逆行列の演算を中止し、
前記音源分離手段は、前記中止時に用いるために保持されていた逆行列を用いて、各マイクを介して入力される混合信号から、話者音声に対応する信号を分離する、
請求項１から４のいずれかに記載の音源分離装置。
前記中止時に用いるために、前記中止直前に演算された逆行列を保持する手段をさらに備える請求項５に記載の音源分離装置。
音源からマイクまでの空間伝達関数行列の逆行列を所定演算方法に
従って演算し、その演算された逆行列を用いて、各マイクを介して入力される混合信号から、話者音声に対応する信号を分離する音源分離方法であって、
前記逆行列が最初に演算されるまでの間、同じ又は類似の状況で過去に演算された逆行列を用いて、各マイクを介して入力される混合信号から、話者音声に対応する信号を分離する音源分離方法。
コンピュータを、
音源から各マイクまでの空間伝達関数行列の逆行列を所定演算方法に従って演算する逆行列演算手段、
その演算された逆行列を用いて、各マイクを介して入力される混合信号から、話者音声に対応する信号を分離する音源分離手段、
特定の状況とその特定の状況で用いられるべき逆行列との対応関係を格納する記憶手段、
現在の状況を検出する検出手段、
前記検出手段によって検出された現在の状況に対応する逆行列を、前記記憶手段から取得する取得手段、
前記逆行列が最初に演算されるまでの間、前記取得手段によって取得された逆行列を用いて、各マイクを介して入力される混合信号から、話者音声に対応する信号を分離する手段、
として機能させるためのプログラム。
請求項１から６のいずれかに記載の音源分離装置を搭載した車両。