JP2019004466A

JP2019004466A - 収音装置、放収音装置、信号処理方法、及びプログラム

Info

Publication number: JP2019004466A
Application number: JP2018111926A
Authority: JP
Inventors: 良田中; Makoto Tanaka; 田中　　良; クレーヴパスカル; Cleve Pascal; レンガラジャンバラス; Rengarajan Bharath
Original assignee: Yamaha Unified Communications Inc
Current assignee: Yamaha Unified Communications Inc
Priority date: 2017-06-12
Filing date: 2018-06-12
Publication date: 2019-01-10
Anticipated expiration: 2038-06-12
Also published as: US20180358032A1; CN109036450A; DE102018109246A1; JP7334399B2

Abstract

【課題】従来の収音装置では、人の声だけでなく雑音に対してもビームフォーミングのフォーカス方向を調整する。このため、不要な雑音を収音し、人の声を断片的にしか収音できない可能性がある。【解決手段】収音装置は、複数のマイクと、前記複数のマイクの収音信号を処理して指向性を形成する指向性形成部と、前記指向性形成部の前段に配置された第１エコーキャンセラと、前記指向性形成部の後段に配置された第２エコーキャンセラと、を備えている。【選択図】図３

Description

この発明に係るいくつかの実施形態は、入力された信号を分析して人の話す声を収音する収音装置、放収音装置、信号処理方法、及びプログラムに関する。

マイクから離れた人の声を収音する場合、通常は収音したくない雑音や残響成分が人の声に対して相対的に大きくなる。したがって、収音したい声の音質は、著しく低下する。このため、雑音や残響成分を抑圧し、声のみを明瞭に収音することが求められる。

従来の収音装置においては、マイクで取得した音に対して音の到来方向を検出し、ビームフォーミングのフォーカス方向を調整することで人の声の収音を行なっている。

しかし、従来の収音装置では、人の声だけでなく雑音に対してもビームフォーミングのフォーカス方向を調整する。このため、不要な雑音を収音し、人の声を断片的にしか収音できない可能性がある。

この発明に係るいくつかの実施形態は、入力された信号を分析して人の話す声のみを収音する収音装置、放収音装置、信号処理方法、及びプログラムを提供することを目的とする。

収音装置は、複数のマイクと、前記複数のマイクの収音信号を処理して指向性を形成する指向性形成部と、前記指向性形成部の前段に配置された第１エコーキャンセラと、前記指向性形成部の後段に配置された第２エコーキャンセラと、を備えている。

放収音装置を模式的に示した斜視図である。放収音装置のブロック図である。放収音装置の機能ブロック図である。音声判定部の構成を示すブロック図である。到来方向とマイクによる音のズレとの関係を示す図である。到来方向検出部の構成を示すブロック図である。指向性形成部の構成を示すブロック図である。放収音装置の動作を示すフローチャートである。

図１は、放収音装置１０を模式的に示した斜視図である。図１においては、放音及び収音に係る主構成を記載して、その他の構成は記載していない。

放収音装置１０は、直方体形状の筐体１、マイク１１、マイク１２、マイク１３、スピーカ７０Ｌ、及びスピーカ７０Ｒを備えている。複数のマイク１１、マイク１２、及びマイク１３は、筐体１の一側面に一列に並んで配置されている。スピーカ７０Ｌ及びスピーカ７０Ｒは対としてマイク１１、マイク１２、及びマイク１３を挟んでマイク１１、マイク１２、及びマイク１３の外側に配置されている。

この例においては、マイクの数は３個であるが、放収音装置１０は、少なくとも２個以上のマイクが設置されていれば動作可能である。また、スピーカの数も２個に限るものではなく、放収音装置１０は、少なくとも１個以上のスピーカが設置されていれば動作可能である。また、スピーカ７０Ｌ又はスピーカ７０Ｒは、筐体１と別の構成として設けられていてもよい。

図２は、放収音装置１０のブロック図である。図２に示すように、放収音装置１０は、マイク１１、マイク１２、マイク１３、スピーカ７０Ｌ、スピーカ７０Ｒ、信号処理部１５、メモリ１５０、及びインタフェース（Ｉ／Ｆ）１９を備えている。

マイク１１、マイク１２、及びマイク１３で取得された音声である収音信号は、信号処理部１５で信号処理され、Ｉ／Ｆ１９に入力される。Ｉ／Ｆ１９は、例えば通信Ｉ／Ｆであり、該収音信号を、外部の装置（遠隔地）に送信する。あるいは、Ｉ／Ｆ１９は、外部の装置から放音信号を受信する。メモリ１５０は、マイク１１、マイク１２、及びマイク１３で取得された収音信号を録音データとして記録する。

信号処理部１５は、マイク１１、マイク１２、及びマイク１３で取得された音声を以下に詳細に説明するように信号処理する。また、信号処理部１５は、Ｉ／Ｆ１９から入力した放音信号を処理する。スピーカ７０Ｌ又はスピーカ７０Ｒは、信号処理部１５で信号処理された信号を放音する。

なお、信号処理部１５の機能は、パーソナルコンピュータ等の一般的な情報処理装置で実現することも可能である。この場合、情報処理装置は、メモリ１５０に記憶されたプログラム１５１、又はフラッシュメモリ等の記憶媒体に記憶されたプログラムを読み出して実行することにより、信号処理部１５の機能を実現する。

図３は、放収音装置１０の機能ブロック図である。図３に示すように、放収音装置１０は、マイク１１、マイク１２、マイク１３、スピーカ７０Ｌ、スピーカ７０Ｒ、信号処理部１５、及びインタフェース（Ｉ／Ｆ）１９を備えている。信号処理部１５は、第１エコーキャンセラ３１、第１エコーキャンセラ３２、第１エコーキャンセラ３３、指向性形成部（ＢＦ：Beam Forming）２０、第２エコーキャンセラ４０、音声判定部（ＶＡＤ：Voice Activity Detection）５０、及び到来方向検出部（ＤＯＡ：Direction Of Arrival）６０を備えている。

第１エコーキャンセラ３１はマイク１１の後段に、第１エコーキャンセラ３２はマイク１２の後段に、第１エコーキャンセラ３３はマイク１３の後段に、それぞれ設置されている。第１エコーキャンセラ３１、第１エコーキャンセラ３２、第１エコーキャンセラ３３は、前段のマイクの収音信号のそれぞれに対して、エコーキャンセルを行う。これにより、第１エコーキャンセラ３１、第１エコーキャンセラ３２、及び第１エコーキャンセラ３３は、スピーカ７０Ｌ又はスピーカ７０Ｒから各マイクに至るエコーを除去する。

第１エコーキャンセラ３１、第１エコーキャンセラ３２、第１エコーキャンセラ３３が行うエコーキャンセルは、ＦＩＲフィルタ処理と減算処理からなる。第１エコーキャンセラ３１、第１エコーキャンセラ３２、及び第１エコーキャンセラ３３エコーキャンセルは、インタフェース（Ｉ／Ｆ）１９から信号処理部１５へ入力されたスピーカ７０Ｌ又はスピーカ７０Ｒで放音する信号（放音信号）を入力し、ＦＩＲフィルタでエコー成分を推定し、第１エコーキャンセラ３１、第１エコーキャンセラ３２、及び第１エコーキャンセラ３３へ入力された収音信号から、それぞれ推定したエコー成分を減算する処理である。

ＶＡＤ５０は、第１エコーキャンセラ３２の後段に設置されている。すなわち、ＶＡＤ５０は、中央に位置するマイク１２で収音した収音信号に対して音声であるか否かの判定を行う。ＶＡＤ５０で人の声が有ると判定された場合、音声フラグがＤＯＡ６０に入力される。ＶＡＤ５０については後に詳細に述べる。なお、ＶＡＤ５０は、第１エコーキャンセラ３２の後段に限られず、第１エコーキャンセラ３２、又は第１エコーキャンセラ３３の後段に設置されていてもよい。

ＤＯＡ６０は、第１エコーキャンセラ３１及び第１エコーキャンセラ３３の後段に設置されている。ＤＯＡ６０は、音声の到来方向を検出する。ＤＯＡ６０は、音声フラグが入力されると、マイク１１及びマイク１３で収音した収音信号に対して到来方向（θ）の検出を行う。到来方向（θ）については後で詳細に説明する。ＤＯＡ６０は、音声フラグが入力されたときのみ検出を行うため、人の声以外の雑音が発生したとしても、到来方向（θ）の値は変更しない。ＤＯＡ６０で検出された到来方向（θ）は、ＢＦ２０へ入力される。ＤＯＡ６０については後に詳細に述べる。

ＢＦ２０は、入力された到来方向（θ）を基に、ビームフォーミング処理を行う。ビームフォーミング処理により、到来方向（θ）の音にフォーカスすることができる。これにより、到来方向（θ）以外の方向から到来する雑音を最小化することができるため、到来方向（θ）の声音を選択的に収音することができる。ＢＦ２０については後に詳細に述べる。

第２エコーキャンセラ４０は、ＢＦ２０でビームフォーミング処理を施された信号に対して、周波数スペクトル振幅乗算処理を行う。これにより、第２エコーキャンセラ４０は、減算処理のみで除去できなかった残留エコー成分を除去することができる。周波数スペクトル振幅乗算処理は、どの様な処理であってもよいが、例えば、周波数領域におけるスペクトラルゲイン、スペクトラルサブトラクション、エコーサプレッサの少なくともいずれか１つ、又は全てを用いる。残留エコー成分は、例えば部屋の暗騒音のために、第１エコーキャンセラ３１等で生じたエコー成分の推定誤差に起因する誤差成分や、スピーカ７０Ｌ又はスピーカ７０Ｒの放音レベルがある程度のレベルに達した場合に生じる筐体の振動音等である。第２エコーキャンセラ４０は、第１エコーキャンセラにおける減算処理で推定したエコー成分のスペクトルと、入力信号のスペクトルと、に基づいて、残留エコー成分のスペクトルを推定し、スペクトルの振幅を乗算にて減衰させることで推定した残留エコー成分のスペクトルを入力信号から除外する。

以上の様に、本実施形態の信号処理部１５は、減算処理により除去しきれない残留エコー成分も除去する。ただし、仮に前段で周波数スペクトル振幅乗算処理を行なうと、収音信号レベルのゲインの情報が失われるため、ＢＦ２０における指向性形成の処理が困難となる。また、仮に前段で周波数スペクトル振幅乗算処理を行なうと、後述の倍音パワースペクトル、パワースペクトル変化率、パワースペクトル平坦率、フォルマント強度、倍音強度、パワー、パワーの一階差分、パワーの二階差分、ケプストラム係数、ケプストラム係数の一階差分、又はケプストラム係数の二階差分の情報が失われるため、ＶＡＤ５０において音声判定が困難となる。そこで、本実施形態の信号処理部１５は、まず減算処理によりエコー成分を除去して、ＢＦ２０による指向性形成処理、ＶＡＤ５０による音声音判定、及びＤＯＡ６０における到来方向の検出処理を行い、指向性形成された後の信号に対して、周波数スペクトル振幅乗算処理を行なう。

次に、図４を用いてＶＡＤ５０の機能について詳細に説明する。

ＶＡＤ５０は、音声信号の各種音声特徴量についてニューラルネットワーク５７を用いて解析を行う。ＶＡＤ５０は、解析の結果、人の声が有ると判定した場合、音声フラグを出力する。

各種音声特徴量としては、例えば、ゼロクロス率４１、倍音パワースペクトル４２、パワースペクトル変化率４３、パワースペクトル平坦率４４、フォルマント強度４５、倍音強度４６、パワー４７、パワーの一階差分４８、パワーの二階差分４９、ケプストラム係数５１、ケプストラム係数の一階差分５２、又はケプストラム係数の二階差分５３が挙げられる。

ゼロクロス率４１は、音声信号の時間領域においてゼロクロスとなる点の出現頻度を算出したものである。ゼロクロスは、音声の基本周波数であるピッチに対応する。倍音パワースペクトル４２は、音声信号に含まれる倍音のそれぞれの周波数成分がどの位のパワーを有するかを表わしたものである。パワースペクトル変化率４３は音声信号の周波数成分に対するパワーの変化率を表わしたものである。パワースペクトル平坦率４４は、音声信号の周波数成分のうねりの度合いを表わしたものである。フォルマント強度４５は、音声信号に含まれるフォルマント成分の強度を表わしたものである。倍音強度４６は、音声信号に含まれる倍音のそれぞれの周波数成分の強度を表わしたものである。パワー４７は、音声信号のパワーである。パワーの一階差分４８は、パワー４７の前回との差である。パワーの二階差分４９は、パワーの一階差分４８の前回との差である。ケプストラム係数５１は、音声信号の離散コサイン変換の振幅の対数である。ケプストラム係数の一階差分５２は、ケプストラム係数５１の前回との差である。ケプストラム係数の二階差分５３は、ケプストラム係数の一階差分５２の前回との差である。

なお、ケプストラム係数５１を求めるときの音声信号は、プリエンファシスフィルタを用いて高域を強調したものを用いてもよいし、音声信号の離散コサイン変換の振幅は、メルフィルタバンクを用いて圧縮をしたものを使用してもよい。

なお、音声特徴量としては、上述のパラメータには限定されず、人の声とその他の音を判別することができる指標となるものであれば使用できる。

ニューラルネットワーク５７は、人間の判断事例から結果を導き出す手法であり、入力値に対し、人間が導き出した判断結果に近づくように各ノードの係数が決定されているものである。

ニューラルネットワーク５７は、各ニューロンにおいて、各種音声特徴量（ゼロクロス率４１、倍音パワースペクトル４２、パワースペクトル変化率４３、パワースペクトル平坦率４４、フォルマント強度４５、倍音強度４６、パワー４７、パワーの一階差分４８、パワーの二階差分４９、ケプストラム係数５１、ケプストラム係数の一階差分５２、又はケプストラム係数の二階差分５３）についての値を入力することによって、この入力された値を基に所定の値を出力する。ニューラルネットワーク５７は、再後段の２つのニューロンにおいて、それぞれ人の声であるという第１指標値と、人の声ではないという第２指標値とを出力する。最終的に、ニューラルネットワーク５７は、第１指標値と第２指標値との差分が、所定の閾値を超える場合に、人の声であると判定する。これにより、ニューラルネットワーク５７は、人間の判断事例を基に、音声信号が人の声であるか否かを判定することができる。

次に、図５及び図６を用いてＤＯＡ６０の機能について詳細に説明する。図５は、到来方向とマイクによる音のズレとの関係を示す図である。図６は、ＤＯＡ６０の構成を示すブロック図である。図５において、一方向の矢印は、音源からの音声の到来する方向を示している。

ＤＯＡ６０は、図５及び図６に示すように、所定の距離（Ｌ１）を隔てて存在するマイク１１及びマイク１３を用いる。ＤＯＡ６０に音声フラグが入力されると、マイク１１及びマイク１３で収音した収音信号の相互相関関数が算出６１される。ここで、音声の到来方向（θ）は、マイク１１及びマイク１３の並ぶ面に対して垂直な方向からのズレとして表すことができる。このため、マイク１１に対してマイク１３への入力信号は、到来方向（θ）分の音のズレ（Ｌ２）が生じる。

ＤＯＡ６０は、相互相関関数のピーク位置に基づいて、マイク１１及びマイク１３それぞれの入力信号の時間差を検出する。入力信号の時間差と音速の積により音のズレ（Ｌ２）が算出される。ここで、Ｌ２＝Ｌ１×ｓｉｎθである。Ｌ１は固定の数値であるため、Ｌ２から三角関数の演算により到来方向（θ）を検出６３することができる。

なお、ＶＡＤ５０が解析の結果、人の声では無いと判定した場合、ＤＯＡ６０は音声の到来方向（θ）の検出を行わず、到来方向（θ）は、直前の到来方向（θ）に維持される。

次に、図７を用いてＢＦ２０の機能について詳細に説明する。図７は、ＢＦ２０の構成を示すブロック図である。

ＢＦ２０は、複数の適応型フィルタを内蔵しており、入力された音声信号をフィルタリングすることにより、ビームフォーミング処理を行う。適応型フィルタとしては、例えば、ＦＩＲフィルタにより構成される。図７においては、マイク毎にＦＩＲフィルタ２１、ＦＩＲフィルタ２２、及びＦＩＲフィルタ２３の３つのＦＩＲフィルタを示しているが、さらに多くのＦＩＲフィルタを備えていてもよい。

ＤＯＡ６０から音声の到来方向（θ）が入力されると、ビーム係数更新部２５はＦＩＲフィルタの係数を更新する。例えば、ビーム係数更新部２５は、更新された到来方向（θ）に基づくフォーカス角度での利得が１．０となる拘束条件のもと、出力信号が最小となるように、入力された音声信号に基づいて、適応アルゴリズムを用いてＦＩＲフィルタの係数を更新する。これにより、到来方向（θ）以外の方向から到来する雑音を最小化することができるため、到来方向（θ）の声音を選択的に収音することができる。

ＢＦ２０は、上述の様な処理を繰り返し、到来方向（θ）に対応した音声信号を出力する。これにより、信号処理部１５は、常に人の声がある方向を到来方向（θ）として高感度で収音することができる。このように、信号処理部１５は、人の声を追尾することができるため、雑音により人の声の音質が劣化することを抑制することができる。

以下、図８を用いて、放収音装置１０の動作を説明する。図８は、放収音装置１０の動作を示すフローチャートである。

まず、放収音装置１０は、マイク１１、マイク１２、及びマイク１３で収音を行なう（Ｓ１１）。マイク１１、マイク１２、及びマイク１３で収音された音声は、音声信号として、信号処理部１５に入力される。

次に、第１エコーキャンセラ３１、第１エコーキャンセラ３２、第１エコーキャンセラ３３は、第１エコーキャンセル処理を行う（Ｓ１２）。第１エコーキャンセル処理は、上述のように、減算処理であり、第１エコーキャンセラ３１、第１エコーキャンセラ３２、及び第１エコーキャンセラ３３へ入力された収音信号から、エコー成分を除去する処理である。

第１エコーキャンセル処理の後、ＶＡＤ５０は、音声信号を各種音声特徴量についてニューラルネットワーク５７を用いて解析を行う（Ｓ１３）。ＶＡＤ５０は、解析の結果、収音信号が音声であると判定した場合（Ｓ１３：Ｙｅｓ）。ＶＡＤ５０は、音声フラグをＤＯＡ６０へ出力する。ＶＡＤ５０は、人の声が無いと判定した場合（Ｓ１３：Ｎｏ）。ＶＡＤ５０は、音声フラグをＤＯＡ６０へ出力しない。そのため、到来方向（θ）は、直前の到来方向（θ）に維持される（Ｓ１０４）。これにより、音声フラグの入力が無い場合は、ＤＯＡ６０での到来方向（θ）の検出が省略されるため、無駄な処理を省略することができ、人の声以外の音源に対して感度が向けられることもない。

次に、音声フラグがＤＯＡ６０へ出力されると、ＤＯＡ６０は到来方向（θ）を検出する（Ｓ１４）。検出された到来方向（θ）は、ＢＦ２０へ入力される。

ＢＦ２０は、指向性を形成する（Ｓ１５）。ＢＦ２０は、入力された音声信号を到来方向（θ）に基づいてフィルタ係数を調整する。ＢＦ２０は、調整されたフィルタを用いて、ビームフォーミング処理を行う。これにより、ＢＦ２０は、到来方向（θ）に対応した音声信号を出力することにより、到来方向（θ）の声音を選択的に収音することができる。

次に、第２エコーキャンセラ４０は、第２エコーキャンセル処理を行う（Ｓ１６）。第２エコーキャンセラ４０は、ＢＦ２０でビームフォーミング処理を施された信号に対して、周波数スペクトル振幅乗算処理を行う。これにより、第２エコーキャンセラ４０は、第１エコーキャンセル処理で除去できなかった残留エコー成分を除去することができる。エコー成分が除去された音声信号は、第２エコーキャンセラ４０からインタフェース（Ｉ／Ｆ）１９を介して信号処理部１５へ入力される。

スピーカ７０Ｌ又はスピーカ７０Ｒは、信号処理部１５で信号処理され、インタフェース（Ｉ／Ｆ）１９を介して信号処理部１５へ入力された音声信号に基づいて放音する（Ｓ１７）。

なお、本実施形態では、放収音装置１０として、放音及び収音の機能を有する放収音装置１０を例示したが、この例に限らない。例えば、収音の機能を有する収音装置であってもよい。

本実施形態の説明は、すべての点で例示であって、制限的なものではない。本発明の範囲は、上述の実施形態ではなく、特許請求の範囲によって示される。さらに、本発明の範囲には、特許請求の範囲と均等の意味及び範囲内でのすべての変更が含まれることが意図される。

１０…放収音装置
１１，１２，１３…マイク
１５…信号処理部
１９…Ｉ／Ｆ
２０…ＢＦ
２１，２２，２３…ＦＩＲフィルタ
２５…ビーム係数更新部
３１，３２，３３…第１エコーキャンセラ
４０…第２エコーキャンセラ
４１…ゼロクロス率
４２…倍音パワースペクトル
４３…パワースペクトル変化率
４４…パワースペクトル平坦率
４５…フォルマント強度
４６…倍音強度
４７…パワー
４８…一階差分
４９…二階差分
５０…ＶＡＤ
５１…ケプストラム係数
５２…一階差分
５３…二階差分
５７…ニューラルネットワーク
６０…ＤＯＡ
６１…算出
６３…検出
７０Ｌ…スピーカ
７０Ｒ…スピーカ
１５０…メモリ
１５１…プログラム

Claims

複数のマイクと、
前記複数のマイクの収音信号を処理して指向性を形成する指向性形成部と、
前記指向性形成部の前段に配置された第１エコーキャンセラと、
前記指向性形成部の後段に配置された第２エコーキャンセラと、
を備えた収音装置。
請求項１に記載の収音装置において、
前記第１エコーキャンセラは、減算処理を行う、
収音装置。
請求項１または請求項２に記載の収音装置において、
前記第２エコーキャンセラは、周波数スペクトル振幅乗算処理を行う、
収音装置。
請求項１乃至請求項３のいずれかに記載の収音装置において、
前記第１エコーキャンセラは、前記複数のマイクの収音信号のそれぞれに対して、エコーキャンセルを行う、
収音装置。
請求項１乃至請求項４のいずれかに記載の収音装置において、
前記第１エコーキャンセラの後段に、音源の到来方向を検出する到来方向検出部を備えた、
収音装置。
請求項５に記載の収音装置において、
前記指向性形成部は、前記到来方向検出部で検出された到来方向に基づいて、指向性を形成する、
収音装置。
請求項１乃至請求項６のいずれかに記載の収音装置において、
前記第１エコーキャンセラの後段に、音声の判定を行う音声判定部を備えた、
収音装置。
請求項５または請求項６に記載の収音装置において、
前記第１エコーキャンセラの後段に、音声の判定を行う音声判定部を備え、
前記到来方向検出部は、
前記音声判定部において前記音声が有ると判定した場合に、前記到来方向を検出する処理を行い、
前記音声判定部において前記音声が無いと判定された場合に、直前に検出した前記到来方向の値を保持する、
収音装置。
請求項７または請求項８に記載の収音装置において、
前記音声判定部は、ニューラルネットワークを用いて前記音声の判定を行う
収音装置。
請求項１乃至請求項９のいずれかに記載の収音装置と、
スピーカと、を備え、
前記第１エコーキャンセラは、前記スピーカに入力する信号に基づいてエコーキャンセル処理を行う、
放収音装置。
複数のマイクの収音信号の少なくともいずれか１つに第１エコーキャンセル処理を行い、
前記第１エコーキャンセル処理後の前記収音信号を用いて指向性を形成し、
前記指向性を形成した後に、第２エコーキャンセル処理を行う、
信号処理方法。
請求項１１に記載の信号処理方法において、
前記第１エコーキャンセル処理は、推定されたエコー成分を減算する処理である、
信号処理方法。
請求項１１または請求項１２に記載の信号処理方法において、
前記第２エコーキャンセル処理は、周波数スペクトル振幅乗算処理である、
信号処理方法。
請求項１１乃至請求項１３のいずれかに記載の信号処理方法において、
前記第１エコーキャンセル処理は、前記複数のマイクの収音信号のそれぞれに対して、エコーキャンセルを行う、
信号処理方法。
請求項１１乃至請求項１４のいずれかに記載の信号処理方法において、
前記第１エコーキャンセル処理の後に、音源の到来方向を検出する、
信号処理方法。
請求項１５に記載の信号処理方法において、
検出された前記到来方向に基づいて、指向性を形成する、
信号処理方法。
請求項１１乃至請求項１６のいずれかに記載の信号処理方法において、
前記第１エコーキャンセル処理の後に、音声であるか否かの判定を行う、
信号処理方法。
請求項１５または請求項１６に記載の信号処理方法において、
前記第１エコーキャンセル処理の後に、音声であるか否かの判定を行い、
前記音声の判定において前記音声が有ると判定した場合に、前記到来方向を検出する処理を行い、
前記音声の判定において前記音声が無いと判定された場合に、直前に検出した前記到来方向の値を保持する、
信号処理方法。
請求項１７または請求項１８に記載の信号処理方法において、
前記音声の判定において、ニューラルネットワークを用いて前記音声の判定を行う、
信号処理方法。
複数のマイクの収音信号の少なくともいずれか１つに第１エコーキャンセル処理を行い、
前記第１エコーキャンセル処理後の前記収音信号を用いて指向性を形成し、
前記指向性を形成した後に、第２エコーキャンセル処理を行う、
処理を収音装置に実行させるプログラム。