WO2021131346A1

WO2021131346A1 - 収音装置、収音方法及び収音プログラム

Info

Publication number: WO2021131346A1
Application number: PCT/JP2020/041412
Authority: WO
Inventors: 慎一杠
Original assignee: パナソニックインテレクチュアルプロパティコーポレーションオブアメリカ
Priority date: 2019-12-26
Filing date: 2020-11-05
Publication date: 2021-07-01
Also published as: US11967304B2; EP4064726A4; CN114830232A; EP4064726A1; JPWO2021131346A1; US20220319489A1

Abstract

収音装置（１）は、参照信号から、マイクロホン（１１）によって取得された入力信号に含まれる雑音信号の成分を示す推定雑音信号を生成する適応フィルタ（１４１）と、入力信号から推定雑音信号を減算した雑音除去信号を生成する雑音除去信号生成部（１５）と、雑音除去信号を用いて適応フィルタ（１４１）のフィルタ係数を更新するフィルタ係数更新部（１４２）と、雑音除去信号の絶対値が最大である信号サンプル位置から所定番目に大きい信号サンプル位置までの複数の信号サンプル位置のうちの少なくとも１つの信号サンプル位置を特定するサンプル位置特定部（１６２）とを備え、フィルタ係数更新部（１４２）は、サンプル位置特定部（１６２）によって特定された少なくとも１つの信号サンプル位置においてフィルタ係数を更新する。

Description

収音装置、収音方法及び収音プログラム

　本開示は、マイクロホンによって取得された入力信号に含まれる雑音信号を除去する収音装置、収音方法及び収音プログラムに関するものである。

　従来、マイクロホンとスピーカとを用いた拡声型の双方向通話システムが存在している。このような拡声型の双方向通話システムにおいて、送話側の話者が話した音声は、送話側のマイクロホンに入力され、送話信号として通信回線を介して受話側の機器へ送信され、受話側のスピーカで再生される。受話側のスピーカで再生された音声は、受話側の空間を伝搬し受話側のマイクロホンに入力され、送話側に送信される。このとき、送話側のスピーカからは、通信回線を通過した時間と受話側の空間を伝搬した時間とを経過した自身の発話した声が再生される。このように、受話側のスピーカからマイクロホンの間で伝搬する音声は音響エコーと呼ばれ、通話品質の劣化に繋がる。

　例えば、特許文献１に示す雑音消去装置は、音声入力端子に入力された音声および雑音に応じた第１受音信号を生成し、参照入力端子に入力された雑音に応じた第２受音信号を生成し、適応フィルタにより第２受音信号から擬似雑音信号を生成し、第１受音信号から擬似雑音信号を減算して雑音抑圧信号を生成し、雑音抑圧信号を用いて適応フィルタのフィルタ係数を更新し、雑音源と参照入力端子および音声入力端子との相対的位置関係により、フィルタ係数がピーク値となるタップを示すピークタップ位置を導出し、ピークタップ位置を利用して、フィルタ係数に対応するタップ位置の区間を分類し、分類した区間毎に、区間に対応するフィルタ係数の更新頻度を制御している。

　しかしながら、上記従来の技術では、雑音を除去するための演算量を削減するために、更なる改善が必要とされていた。

特許第５２０５９３５号明細書

　本開示は、上記の問題を解決するためになされたもので、雑音を除去するための演算量を削減することができる技術を提供することを目的とするものである。

　本開示の一態様に係る収音装置は、参照信号から、マイクロホンによって取得された入力信号に含まれる雑音信号の成分を示す推定雑音信号を生成する適応フィルタと、前記入力信号から前記推定雑音信号を減算した雑音除去信号を生成する信号生成部と、前記雑音除去信号を用いて前記適応フィルタのフィルタ係数を更新する係数更新部と、前記雑音除去信号の絶対値が最大である信号サンプル位置から所定番目に大きい信号サンプル位置までの複数の信号サンプル位置のうちの少なくとも１つの信号サンプル位置を特定する特定部とを備え、前記係数更新部は、前記特定部によって特定された前記少なくとも１つの信号サンプル位置において前記フィルタ係数を更新する。

　本開示によれば、雑音を除去するための演算量を削減することができる。

本開示の実施の形態１における通話装置の構成を示す図である。本開示の実施の形態１における収音装置の動作を説明するためのフローチャートである。本開示の実施の形態２における通話装置の構成を示す図である。本開示の実施の形態３における通話装置の構成を示す図である。

　（本開示の基礎となった知見）
　上記の従来の技術では、雑音源と参照入力端子および音声入力端子との相対的位置関係により、フィルタ係数がピーク値となるタップを示すピークタップ位置を導出し、ピークタップ位置を利用して、フィルタ係数に対応するタップ位置の区間を分類し、分類した区間毎に、区間に対応するフィルタ係数の更新頻度を制御している。すなわち、従来の技術は、ピークタップ位置の近傍の第１の区間を特定し、第１の区間以外の区間におけるフィルタ係数の更新頻度を、第１の区間におけるフィルタ係数の更新頻度よりも低くしている。これにより、従来の技術は、装置又は環境によるフィルタ係数の変動が小さい区間におけるフィルタ係数の更新頻度を低くすることにより、計算量を抑えている。

　上記の従来の技術は、雑音源と参照入力端子および音声入力端子との相対的位置関係により、フィルタ係数がピーク値となるタップを示すピークタップ位置を算出しているが、音声入力端子が生成する信号から適応フィルタが生成する擬似雑音信号を減算した差信号のピーク値を算出していない。そのため、上記従来の技術は、雑音を除去するための演算量をさらに削減するための更なる改善が可能であると考えられる。

　以上の課題を解決するために、本開示の一態様に係る収音装置は、参照信号から、マイクロホンによって取得された入力信号に含まれる雑音信号の成分を示す推定雑音信号を生成する適応フィルタと、前記入力信号から前記推定雑音信号を減算した雑音除去信号を生成する信号生成部と、前記雑音除去信号を用いて前記適応フィルタのフィルタ係数を更新する係数更新部と、前記雑音除去信号の絶対値が最大である信号サンプル位置から所定番目に大きい信号サンプル位置までの複数の信号サンプル位置のうちの少なくとも１つの信号サンプル位置を特定する特定部とを備え、前記係数更新部は、前記特定部によって特定された前記少なくとも１つの信号サンプル位置において前記フィルタ係数を更新する。

　従来は所定のサンプリング周波数の全ての信号サンプル位置においてフィルタ係数が更新されていた。これに対し、本構成によれば、雑音除去信号の絶対値が最大である信号サンプル位置から所定番目に大きい信号サンプル位置までの複数の信号サンプル位置のうちの少なくとも１つの信号サンプル位置が特定され、特定された少なくとも１つの信号サンプル位置において適応フィルタのフィルタ係数が更新される。したがって、適応フィルタのフィルタ係数の更新処理回数が削減されるので、雑音を除去するための演算量を削減することができる。

　また、上記の収音装置において、前記少なくとも１つの信号サンプル位置は、前記雑音除去信号の絶対値が最大である信号サンプル位置であってもよい。

　この構成によれば、雑音除去信号の絶対値が最大である信号サンプル位置において適応フィルタのフィルタ係数が更新されるので、フィルタ係数の更新処理回数が１フレーム毎に１回となり、雑音を除去するための演算量をより削減することができる。

　また、上記の収音装置において、前記参照信号は、スピーカへ出力される再生信号であってもよい。

　この構成によれば、マイクロホンによって取得された入力信号に含まれる音響エコーの成分を除去することができる。

　また、上記の収音装置において、前記係数更新部は、前記少なくとも１つの信号サンプル位置における前記雑音除去信号の前記絶対値の大きさに応じて、前記フィルタ係数を更新する更新速度を変化させてもよい。

　この構成によれば、例えば、更新速度を速くすることにより、雑音除去信号を大まかに収束させることができ、更新速度を遅くすることにより、雑音除去信号を細かく収束させることができる。

　また、上記の収音装置において、前記係数更新部は、前記少なくとも１つの信号サンプル位置における前記雑音除去信号の前記絶対値が閾値より大きい場合、前記更新速度を現在よりも速くし、前記少なくとも１つの信号サンプル位置における前記雑音除去信号の前記絶対値が前記閾値以下である場合、前記更新速度を現在よりも遅くしてもよい。

　この構成によれば、少なくとも１つの信号サンプル位置における雑音除去信号の絶対値が閾値より大きい場合、更新速度が現在よりも速く設定されるので、雑音除去信号を大まかに収束させることができる。また、少なくとも１つの信号サンプル位置における雑音除去信号の絶対値が閾値以下である場合、更新速度が現在よりも遅く設定されるので、雑音除去信号を細かく収束させることができる。この結果、演算速度の向上と、演算精度の向上との両立を図ることができる。

　また、上記の収音装置において、前記入力信号を複数の周波数帯域に分割する第１帯域分割部と、前記参照信号を前記複数の周波数帯域に分割する第２帯域分割部と、前記複数の周波数帯域毎に生成された前記雑音除去信号を合成する帯域合成部と、をさらに備え、前記適応フィルタは、前記複数の周波数帯域毎に前記推定雑音信号を生成する複数の適応フィルタを含み、前記信号生成部は、前記複数の周波数帯域毎に前記雑音除去信号を生成する複数の信号生成部を含み、前記特定部は、前記複数の周波数帯域毎に前記少なくとも１つの信号サンプル位置を特定する複数の特定部を含み、前記係数更新部は、前記複数の周波数帯域毎に前記少なくとも１つの信号サンプル位置において前記フィルタ係数を更新する複数の係数更新部を含んでもよい。

　この構成によれば、入力信号及び参照信号が複数の周波数帯域に分割され、複数の周波数帯域毎に、推定雑音信号の生成処理、雑音除去信号の生成処理、信号サンプル位置の特定処理及びフィルタ係数の更新処理が行われるので、演算時間を短縮することができるとともに、単位時間あたりの演算量を削減することができる。

　また、上記の収音装置において、前記適応フィルタは、参照信号から、第１マイクロホンによって取得された第１入力信号に含まれる雑音信号の成分を示す第１推定雑音信号を生成する第１適応フィルタと、参照信号から、前記第１マイクロホンとは異なる第２マイクロホンによって取得された第２入力信号に含まれる雑音信号の成分を示す第２推定雑音信号を生成する第２適応フィルタと、を含み、前記信号生成部は、前記第１入力信号から前記第１推定雑音信号を減算した第１雑音除去信号を生成する第１信号生成部と、前記第２入力信号から前記第２推定雑音信号を減算した第２雑音除去信号を生成する第２信号生成部と、を含み、前記係数更新部は、前記第１雑音除去信号を用いて前記第１適応フィルタのフィルタ係数を更新する第１係数更新部と、前記第２雑音除去信号を用いて前記第２適応フィルタのフィルタ係数を更新する第２係数更新部と、を含み、前記特定部は、前記第１雑音除去信号の絶対値が最大である信号サンプル位置から所定番目に大きい信号サンプル位置までの複数の信号サンプル位置のうちの少なくとも１つの信号サンプル位置を特定する第１特定部と、前記第２雑音除去信号の絶対値が最大である信号サンプル位置から所定番目に大きい信号サンプル位置までの複数の信号サンプル位置のうちの少なくとも１つの信号サンプル位置を特定する第２特定部と、を含んでもよい。

　この構成によれば、マイクロホンが１つ増える毎に、適応フィルタ、信号生成部、係数更新部及び特定部もそれぞれ１つずつ増える。しかしながら、マイクロホンが増えたとしても、個々の処理の演算量は従来よりも削減されるので、処理全体の演算量を従来よりも削減することができる。

　本開示の他の態様に係る収音方法は、適応フィルタ、信号生成部、係数更新部及び特定部を備える収音装置における収音方法であって、前記適応フィルタが、参照信号から、マイクロホンによって取得された入力信号に含まれる雑音信号の成分を示す推定雑音信号を生成し、前記信号生成部が、前記入力信号から前記推定雑音信号を減算した雑音除去信号を生成し、前記特定部が、前記雑音除去信号の絶対値が最大である信号サンプル位置から所定番目に大きい信号サンプル位置までの複数の信号サンプル位置のうちの少なくとも１つの信号サンプル位置を特定し、前記係数更新部が、特定された前記少なくとも１つの信号サンプル位置において前記雑音除去信号を用いて前記適応フィルタのフィルタ係数を更新する。

　本開示の他の態様に係る収音プログラムは、参照信号から、マイクロホンによって取得された入力信号に含まれる雑音信号の成分を示す推定雑音信号を生成する適応フィルタと、前記入力信号から前記推定雑音信号を減算した雑音除去信号を生成する信号生成部と、前記雑音除去信号を用いて前記適応フィルタのフィルタ係数を更新する係数更新部と、前記雑音除去信号の絶対値が最大である信号サンプル位置から所定番目に大きい信号サンプル位置までの複数の信号サンプル位置のうちの少なくとも１つの信号サンプル位置を特定する特定部としてコンピュータを機能させ、前記係数更新部は、前記特定部によって特定された前記少なくとも１つの信号サンプル位置において前記フィルタ係数を更新する。

　以下添付図面を参照しながら、本開示の実施の形態について説明する。なお、以下の実施の形態は、本開示を具体化した一例であって、本開示の技術的範囲を限定するものではない。

　（実施の形態１）
　図１は、本開示の実施の形態１における通話装置の構成を示す図である。なお、通話装置は、自動車等に搭載される拡声型のハンズフリー通話システム、拡声型の双方向通信会議システム及びインターホンシステムなどに利用される。

　図１に示す通話装置は、収音装置１、マイクロホン１１、入力端子１２、スピーカ１３及び出力端子１７を備える。

　マイクロホン１１は、送話者がいる空間内に配置され、送話者の音声を収音する。マイクロホン１１は、収音した音声を示す入力信号を収音装置１に出力する。

　入力端子１２は、受話側の通話装置（不図示）から受信した再生信号を収音装置１及びスピーカ１３へ出力する。

　スピーカ１３は、入力された再生信号を外部へ出力する。ここで、スピーカ１３から出力された音声が、マイクロホン１１によって収音された場合、受話側のスピーカからは、受話側の話者の発話した音声が遅れて再生されることになり、いわゆる音響エコーが発生する。

　収音装置１は、エコーキャンセラ１４、雑音除去信号生成部１５及び係数更新判断部１６を備える。

　エコーキャンセラ１４は、適応フィルタ１４１及びフィルタ係数更新部１４２を備える。

　適応フィルタ１４１は、参照信号から、マイクロホン１１によって取得された入力信号に含まれる雑音信号の成分を示す推定雑音信号を生成する。参照信号は、例えば、スピーカ１３へ出力される再生信号である。雑音信号は、例えば、音響エコー信号である。適応フィルタ１４１は、フィルタ係数と参照信号とを畳み込むことにより、入力信号に含まれる雑音信号の成分を示す推定雑音信号を生成する。なお、推定雑音信号は、擬似エコー信号とも呼ばれる。

　雑音除去信号生成部１５は、入力信号から推定雑音信号を減算した雑音除去信号を生成する。雑音除去信号生成部１５は、入力信号から推定雑音信号を減算することにより、雑音除去信号を生成する。雑音除去信号生成部１５は、生成した雑音除去信号を係数更新判断部１６及び出力端子１７へ出力する。

　係数更新判断部１６は、絶対値算出部１６１及びサンプル位置特定部１６２を備える。

　絶対値算出部１６１は、雑音除去信号生成部１５によって生成された雑音除去信号の絶対値を算出する。

　サンプル位置特定部１６２は、雑音除去信号の絶対値が最大である信号サンプル位置から所定番目に大きい信号サンプル位置までの複数の信号サンプル位置のうちの少なくとも１つの信号サンプル位置を特定する。

　フィルタ係数更新部１４２は、所定のサンプリング周期で、雑音除去信号を用いて適応フィルタ１４１のフィルタ係数を更新する。適応フィルタ１４１は、フィルタ係数更新部１４２によって更新されたフィルタ係数と参照信号とを畳み込むことにより推定雑音信号を生成する。フィルタ係数更新部１４２は、サンプル位置特定部１６２によって特定された少なくとも１つの信号サンプル位置においてフィルタ係数を更新する。少なくとも１つの信号サンプル位置は、雑音除去信号の絶対値が最大である信号サンプル位置である。

　フィルタ係数更新部１４２は、適応アルゴリズムを用いて、雑音除去信号が最小となるようにフィルタ係数を更新する。適応アルゴリズムとしては、例えば、学習同定法（ＮＬＭＳ（Ｎｏｒｍａｒｉｚｅｄ　Ｌｅａｓｔ　Ｍｅａｎ　Ｓｑｕａｒｅ）法）、アフィン射影法又は再帰的最小２乗法（ＲＬＳ（Ｒｅｃｕｒｓｉｖｅ　Ｌｅａｓｔ　Ｓｑｕａｒｅ）法）が用いられる。

　出力端子１７は、収音装置１によって入力信号から雑音成分（音響エコー成分）をキャンセルした雑音除去信号を出力する。出力端子１７は、雑音除去信号生成部１５によって生成された雑音除去信号を出力する。

　なお、入力端子１２及び出力端子１７は、通信部（不図示）に接続されている。通信部は、ネットワークを介して受話側の通話装置（不図示）へ雑音除去信号を送信するとともに、ネットワークを介して受話側の通話装置（不図示）から再生信号を受信する。ネットワークは、例えば、インターネットである。

　ここで、本実施の形態１におけるフィルタ係数の更新について説明する。

　従来のフィルタ係数は、下記の式（１）を用いて算出される。

　上記の式（１）において、ｐｆＣｏｅｆ［ｎ］はタップ位置ｎにおけるフィルタ係数を表し、μはステップゲインを表し、ｐｆＳｐｋ［ｎ＋ｋ］は参照信号を表し、ｅｒｒ［ｎ＋ｋ］は雑音除去信号を表し、ｋは１フレーム中における信号サンプル位置を表す。１フレームあたりの信号サンプル数はＬ個であり、信号サンプル位置ｋは０～Ｌ－１の値を取り得る。また、タップ数はＭ個であり、タップ位置ｎは０～Ｍ－１の値を取り得る。

　上記の式（１）に示すように、１フレームあたりの信号サンプル数はＬ個であるため、従来のフィルタ係数は、１フレームあたりＬ回更新される。さらに、タップ数はＭ個であるため、従来のフィルタ係数の１フレームあたりの演算処理数は、Ｌ＊Ｍ回となる。

　一方、本実施の形態１におけるフィルタ係数は、下記の式（２）を用いて算出される。

　上記の式（２）において、ｐｆＣｏｅｆ［ｎ］はタップ位置ｎにおけるフィルタ係数を表し、μはステップゲインを表し、ｐｆＳｐｋ［ｎ＋ｔ］は参照信号を表し、ｅｒｒ＿ｍａｘは１フレーム中における雑音除去信号の絶対値の最大値を表し、ｔは１フレーム中における雑音除去信号の絶対値が最大となる信号サンプル位置を表す。１フレームあたりの信号サンプル数はＬ個であり、信号サンプル位置ｋは０～Ｌ－１の値を取り得る。また、タップ数はＭ個であり、タップ位置ｎは０～Ｍ－１の値を取り得る。

　上記の式（２）に示すように、Ｌ個の信号サンプル位置の中から雑音除去信号の絶対値が最大となる１つの信号サンプル位置ｔが特定されるため、本実施の形態１のフィルタ係数は、１フレームあたり１回のみ更新される。さらに、タップ数はＭ個であるため、本実施の形態１のフィルタ係数の１フレームあたりの演算処理数は、１＊Ｍ回となる。

　このように、本実施の形態１におけるフィルタ係数更新部１４２は、フィルタ係数を更新するための演算量を従来に比べて大幅に削減することができる。

　また、上記の式（１）及び式（２）におけるステップゲインμは、ステップサイズとも呼ばれ、フィルタ係数の更新速度を決定する正の定数である。

　フィルタ係数更新部１４２は、少なくとも１つの信号サンプル位置における雑音除去信号の絶対値の大きさに応じて、フィルタ係数を更新する更新速度を変化させてもよい。すなわち、フィルタ係数更新部１４２は、雑音除去信号の絶対値が最大である信号サンプル位置における雑音除去信号の絶対値の大きさに応じて、フィルタ係数を更新する更新速度を変化させてもよい。フィルタ係数更新部１４２は、少なくとも１つの信号サンプル位置における雑音除去信号の絶対値が閾値より大きい場合、更新速度を現在よりも速くし、少なくとも１つの信号サンプル位置における雑音除去信号の絶対値が閾値以下である場合、更新速度を現在よりも遅くする。

　フィルタ係数更新部１４２は、上記の式（２）におけるステップゲインμを調整することにより、フィルタ係数の更新速度を変化させることができる。すなわち、フィルタ係数更新部１４２は、雑音除去信号の絶対値が最大である信号サンプル位置における雑音除去信号の絶対値が閾値より大きい場合、ステップゲインμを大きくする。これにより、フィルタ係数の更新速度が現在よりも速くなる。一方、フィルタ係数更新部１４２は、雑音除去信号の絶対値が最大である信号サンプル位置における雑音除去信号の絶対値が閾値以下である場合、ステップゲインμを小さくする。これにより、フィルタ係数の更新速度は現在よりも遅くなる。

　このように、少なくとも１つの信号サンプル位置における雑音除去信号の絶対値が閾値より大きい場合、更新速度が現在よりも速く設定されるので、雑音除去信号を大まかに収束させることができる。また、少なくとも１つの信号サンプル位置における雑音除去信号の絶対値が閾値以下である場合、更新速度が現在よりも遅く設定されるので、雑音除去信号を細かく収束させることができる。この結果、演算速度の向上と、演算精度の向上との両立を図ることができる。

　続いて、本開示の実施の形態１における収音装置１の動作について説明する。

　図２は、本開示の実施の形態１における収音装置の動作を説明するためのフローチャートである。

　まず、ステップＳ１において、雑音除去信号生成部１５は、マイクロホン１１からの入力信号を取得する。このとき、マイクロホン１１は、入力信号を雑音除去信号生成部１５へ出力する。

　次に、ステップＳ２において、エコーキャンセラ１４の適応フィルタ１４１は、入力端子１２からの参照信号を取得する。このとき、入力端子１２は、受話側の通話装置（不図示）から受信した再生信号を収音装置１及びスピーカ１３へ出力する。適応フィルタ１４１は、入力端子１２からスピーカ１３へ出力される再生信号を参照信号として取得する。

　次に、ステップＳ３において、適応フィルタ１４１は、フィルタ係数と参照信号とを畳み込むことにより、入力信号に含まれる雑音信号の成分を示す推定雑音信号を生成する。

　次に、ステップＳ４において、雑音除去信号生成部１５は、入力信号から推定雑音信号を減算することにより、雑音除去信号を生成する。雑音除去信号生成部１５は、生成した雑音除去信号を係数更新判断部１６及び出力端子１７へ出力する。

　次に、ステップＳ５において、出力端子１７は、雑音除去信号生成部１５によって生成された雑音除去信号を出力する。

　次に、ステップＳ６において、係数更新判断部１６の絶対値算出部１６１は、雑音除去信号生成部１５によって生成された雑音除去信号を取得する。

　次に、ステップＳ７において、絶対値算出部１６１は、１フレーム分の雑音除去信号を取得したか否かを判断する。

　なお、収音装置１は、不図示のメモリを備えている。雑音除去信号生成部１５によって生成された雑音除去信号はメモリに記憶される。絶対値算出部１６１は、１フレーム分の雑音除去信号がメモリに記憶されているか否かを判断することにより、１フレーム分の雑音除去信号を取得したか否かを判断してもよい。

　ここで、１フレーム分の雑音除去信号を取得していないと判断された場合（ステップＳ７でＮＯ）、ステップＳ１に処理が戻る。

　一方、１フレーム分の雑音除去信号を取得したと判断された場合（ステップＳ７でＹＥＳ）、ステップＳ８において、絶対値算出部１６１は、１フレームの信号サンプル位置毎に取得された各雑音除去信号の絶対値を算出する。

　次に、ステップＳ９において、サンプル位置特定部１６２は、雑音除去信号の絶対値が最大である信号サンプル位置を特定する。

　次に、ステップＳ１０において、フィルタ係数更新部１４２は、サンプル位置特定部１６２によって特定された雑音除去信号の絶対値が最大である信号サンプル位置においてフィルタ係数を更新する。

　従来は所定のサンプリング周波数の全ての信号サンプル位置においてフィルタ係数が更新されていた。これに対し、本実施の形態１によれば、雑音除去信号の絶対値が最大である信号サンプル位置から所定番目に大きい信号サンプル位置までの複数の信号サンプル位置のうちの少なくとも１つの信号サンプル位置が特定され、特定された少なくとも１つの信号サンプル位置において適応フィルタ１４１のフィルタ係数が更新される。したがって、適応フィルタ１４１のフィルタ係数の更新処理回数が削減されるので、雑音を除去するための演算量を削減することができる。

　なお、本実施の形態１では、フィルタ係数更新部１４２は、雑音除去信号の絶対値が最大である信号サンプル位置においてフィルタ係数を更新しているが、本開示は特にこれに限定されない。フィルタ係数更新部１４２は、雑音除去信号の絶対値が２番目に大きい信号サンプル位置においてフィルタ係数を更新してもよく、雑音除去信号の絶対値が３番目に大きい信号サンプル位置においてフィルタ係数を更新してもよい。すなわち、フィルタ係数更新部１４２は、雑音除去信号の絶対値が最大である信号サンプル位置から所定番目に大きい信号サンプル位置までの複数の信号サンプル位置のうちの１つの信号サンプル位置においてフィルタ係数を更新してもよい。

　また、フィルタ係数更新部１４２は、雑音除去信号の絶対値が最大である信号サンプル位置及び雑音除去信号の絶対値が２番目に大きい信号サンプル位置においてフィルタ係数を更新してもよい。すなわち、フィルタ係数更新部１４２は、雑音除去信号の絶対値が最大である信号サンプル位置から所定番目に大きい信号サンプル位置までの複数の信号サンプル位置のうちの２つ以上の信号サンプル位置においてフィルタ係数を更新してもよい。

　また、本実施の形態１では、スピーカ１３に出力される再生信号が参照信号として適応フィルタ１４１に入力され、入力信号に含まれる音響エコー信号の成分を示す推定雑音信号が生成されるが、本開示は特にこれに限定されない。マイクロホン１１とは異なる他のマイクロホンが、マイクロホン１１が設置されている空間内に設置されてもよい。他のマイクロホンは、マイクロホン１１が取得対象とする音声以外の空間内の雑音を取得し、取得した雑音信号を適応フィルタ１４１へ参照信号として出力してもよい。

　また、本実施の形態１では、エコーキャンセラ１４には、時間領域の再生信号が入力され、雑音除去信号生成部１５には、時間領域の入力信号が入力されるが、本開示は特にこれに限定されず、エコーキャンセラ１４には、周波数領域の再生信号が入力され、雑音除去信号生成部１５には、周波数領域の入力信号が入力されてもよい。

　この場合、入力端子１２とスピーカ１３との間には、エコーキャンセラ１４に入力される時間領域の再生信号を周波数領域の再生信号に変換する高速フーリエ変換部が設けられてもよい。また、マイクロホン１１と雑音除去信号生成部１５との間には、雑音除去信号生成部１５に入力される時間領域の入力信号を周波数領域の入力信号に変換する高速フーリエ変換部が設けられてもよい。また、雑音除去信号生成部１５と出力端子１７との間には、雑音除去信号生成部１５から出力端子１７に入力される周波数領域の雑音除去信号を時間領域の雑音除去信号に変換する逆高速フーリエ変換部が設けられてもよい。

　（実施の形態２）
　実施の形態１における通話装置は、１つのマイクロホン１１を備えているが、実施の形態２における通話装置は、複数のマイクロホンを備えている。

　図３は、本開示の実施の形態２における通話装置の構成を示す図である。

　図３に示す通話装置は、収音装置１Ａ、第１マイクロホン１１Ａ、第２マイクロホン１１Ｂ、入力端子１２、スピーカ１３、第１出力端子１７Ａ及び第２出力端子１７Ｂを備える。なお、実施の形態２において、実施の形態１と同じ構成については同じ符号を付し説明を省略する。

　第１マイクロホン１１Ａ及び第２マイクロホン１１Ｂは、送話者がいる空間内に配置され、送話者の音声を収音する。第１マイクロホン１１Ａは、収音した音声を示す第１入力信号を収音装置１Ａに出力する。第２マイクロホン１１Ｂは、収音した音声を示す第２入力信号を収音装置１Ａに出力する。

　第１出力端子１７Ａは、収音装置１Ａによって第１入力信号から雑音成分（音響エコー成分）をキャンセルした第１雑音除去信号を出力する。第２出力端子１７Ｂは、収音装置１Ａによって第２入力信号から雑音成分（音響エコー成分）をキャンセルした第２雑音除去信号を出力する。

　なお、入力端子１２、第１出力端子１７Ａ及び第２出力端子１７Ｂは、通信部（不図示）に接続されている。通信部は、ネットワークを介して受話側の通話装置（不図示）へ雑音除去信号を送信するとともに、ネットワークを介して受話側の通話装置（不図示）から再生信号を受信する。

　収音装置１Ａは、第１エコーキャンセラ１４Ａ、第１雑音除去信号生成部１５Ａ、第１係数更新判断部１６Ａ、第２エコーキャンセラ１４Ｂ、第２雑音除去信号生成部１５Ｂ及び第２係数更新判断部１６Ｂを備える。

　第１エコーキャンセラ１４Ａは、第１適応フィルタ１４１Ａ及び第１フィルタ係数更新部１４２Ａを備える。第２エコーキャンセラ１４Ｂは、第２適応フィルタ１４１Ｂ及び第２フィルタ係数更新部１４２Ｂを備える。

　第１適応フィルタ１４１Ａは、参照信号から、第１マイクロホン１１Ａによって取得された第１入力信号に含まれる雑音信号の成分を示す第１推定雑音信号を生成する。

　第２適応フィルタ１４１Ｂは、参照信号から、第１マイクロホン１１Ａとは異なる第２マイクロホン１１Ｂによって取得された第２入力信号に含まれる雑音信号の成分を示す第２推定雑音信号を生成する。

　第１雑音除去信号生成部１５Ａは、第１入力信号から第１推定雑音信号を減算した第１雑音除去信号を生成する。第１雑音除去信号生成部１５Ａは、第１入力信号から第１推定雑音信号を減算することにより、第１雑音除去信号を生成する。第１雑音除去信号生成部１５Ａは、生成した第１雑音除去信号を第１係数更新判断部１６Ａ及び第１出力端子１７Ａへ出力する。

　第２雑音除去信号生成部１５Ｂは、第２入力信号から第２推定雑音信号を減算した第２雑音除去信号を生成する。第２雑音除去信号生成部１５Ｂは、第２入力信号から第２推定雑音信号を減算することにより、第２雑音除去信号を生成する。第２雑音除去信号生成部１５Ｂは、生成した第２雑音除去信号を第２係数更新判断部１６Ｂ及び第２出力端子１７Ｂへ出力する。

　第１係数更新判断部１６Ａは、第１絶対値算出部１６１Ａ及び第１サンプル位置特定部１６２Ａを備える。第２係数更新判断部１６Ｂは、第２絶対値算出部１６１Ｂ及び第２サンプル位置特定部１６２Ｂを備える。

　第１絶対値算出部１６１Ａは、第１雑音除去信号生成部１５Ａによって生成された第１雑音除去信号の絶対値を算出する。

　第１サンプル位置特定部１６２Ａは、第１雑音除去信号の絶対値が最大である信号サンプル位置から所定番目に大きい信号サンプル位置までの複数の信号サンプル位置のうちの少なくとも１つの信号サンプル位置を特定する。

　第２絶対値算出部１６１Ｂは、第２雑音除去信号生成部１５Ｂによって生成された第２雑音除去信号の絶対値を算出する。

　第２サンプル位置特定部１６２Ｂは、第２雑音除去信号の絶対値が最大である信号サンプル位置から所定番目に大きい信号サンプル位置までの複数の信号サンプル位置のうちの少なくとも１つの信号サンプル位置を特定する。

　第１フィルタ係数更新部１４２Ａは、第１雑音除去信号を用いて第１適応フィルタ１４１Ａのフィルタ係数を更新する。第１適応フィルタ１４１Ａは、第１フィルタ係数更新部１４２Ａによって更新されたフィルタ係数と参照信号とを畳み込むことにより第１推定雑音信号を生成する。第１フィルタ係数更新部１４２Ａは、第１サンプル位置特定部１６２Ａによって特定された少なくとも１つの信号サンプル位置においてフィルタ係数を更新する。少なくとも１つの信号サンプル位置は、第１雑音除去信号の絶対値が最大である信号サンプル位置である。

　第２フィルタ係数更新部１４２Ｂは、第２雑音除去信号を用いて第２適応フィルタ１４１Ｂのフィルタ係数を更新する。第２適応フィルタ１４１Ｂは、第２フィルタ係数更新部１４２Ｂによって更新されたフィルタ係数と参照信号とを畳み込むことにより第２推定雑音信号を生成する。第２フィルタ係数更新部１４２Ｂは、第２サンプル位置特定部１６２Ｂによって特定された少なくとも１つの信号サンプル位置においてフィルタ係数を更新する。少なくとも１つの信号サンプル位置は、第２雑音除去信号の絶対値が最大である信号サンプル位置である。

　なお、本実施の形態２におけるフィルタ係数の更新処理は、実施の形態１におけるフィルタ係数の更新処理と同じである。

　また、本実施の形態２では、通話装置は２つマイクロホンを備えているが、本開示は特にこれに限定されず、通話装置は３つ以上のマイクロホンを備えてもよい。

　このように、マイクロホンが１つ増える毎に、エコーキャンセラ及び係数更新判断部もそれぞれ１つずつ増える。しかしながら、マイクロホンが増えたとしても、個々の処理の演算量は従来よりも削減されるので、処理全体の演算量を従来よりも削減することができる。

　（実施の形態３）
　実施の形態３における収音装置は、入力信号を複数の周波数帯域に分割し、参照信号を複数の周波数帯域に分割し、複数の周波数帯域毎に雑音除去信号を生成し、複数の周波数帯域毎に生成された雑音除去信号を合成する。

　図４は、本開示の実施の形態３における通話装置の構成を示す図である。

　図４に示す通話装置は、収音装置１Ｂ、マイクロホン１１、入力端子１２、スピーカ１３及び出力端子１７を備える。なお、実施の形態３において、実施の形態１と同じ構成については同じ符号を付し説明を省略する。

　収音装置１Ｂは、第１エコーキャンセラ１４Ａ、第１雑音除去信号生成部１５Ａ、第１係数更新判断部１６Ａ、第２エコーキャンセラ１４Ｂ、第２雑音除去信号生成部１５Ｂ、第２係数更新判断部１６Ｂ、第３エコーキャンセラ１４Ｃ、第３雑音除去信号生成部１５Ｃ、第３係数更新判断部１６Ｃ、第４エコーキャンセラ１４Ｄ、第４雑音除去信号生成部１５Ｄ、第４係数更新判断部１６Ｄ、第１帯域分割部２１、第２帯域分割部２２及び帯域合成部２３を備える。

　第１帯域分割部２１は、マイクロホン１１から出力された入力信号を複数の周波数帯域に分割する。本実施の形態３では、入力信号は４つの周波数帯域に分割されている。第１帯域分割部２１は、フルバンドの入力信号を周波数帯域が異なる４つのサブバンドの入力信号に分割する。第１帯域分割部２１は、４つのサブバンドの入力信号のそれぞれを、第１雑音除去信号生成部１５Ａ、第２雑音除去信号生成部１５Ｂ、第３雑音除去信号生成部１５Ｃ及び第４雑音除去信号生成部１５Ｄへ出力する。

　第２帯域分割部２２は、入力端子１２から出力された参照信号を複数の周波数帯域に分割する。本実施の形態３では、参照信号は４つの周波数帯域に分割されている。第２帯域分割部２２は、フルバンドの参照信号を周波数帯域が異なる４つのサブバンドの参照信号に分割する。第２帯域分割部２２は、４つのサブバンドの参照信号のそれぞれを、第１エコーキャンセラ１４Ａ、第２エコーキャンセラ１４Ｂ、第３エコーキャンセラ１４Ｃ及び第４エコーキャンセラ１４Ｄへ出力する。

　第１エコーキャンセラ１４Ａ、第２エコーキャンセラ１４Ｂ、第３エコーキャンセラ１４Ｃ及び第４エコーキャンセラ１４Ｄの構成は、実施の形態１におけるエコーキャンセラ１４の構成と同じである。すなわち、第１エコーキャンセラ１４Ａ、第２エコーキャンセラ１４Ｂ、第３エコーキャンセラ１４Ｃ及び第４エコーキャンセラ１４Ｄは、それぞれ適応フィルタ１４１及びフィルタ係数更新部１４２を備える。

　第１係数更新判断部１６Ａ、第２係数更新判断部１６Ｂ、第３係数更新判断部１６Ｃ及び第４係数更新判断部１６Ｄの構成は、実施の形態１における係数更新判断部１６の構成と同じである。すなわち、第１係数更新判断部１６Ａ、第２係数更新判断部１６Ｂ、第３係数更新判断部１６Ｃ及び第４係数更新判断部１６Ｄは、それぞれ絶対値算出部１６１及びサンプル位置特定部１６２を備える。

　複数の適応フィルタ１４１は、複数の周波数帯域毎に推定雑音信号を生成する。

　第１雑音除去信号生成部１５Ａ、第２雑音除去信号生成部１５Ｂ、第３雑音除去信号生成部１５Ｃ及び第４雑音除去信号生成部１５Ｄは、複数の周波数帯域毎に雑音除去信号を生成する。

　複数のサンプル位置特定部１６２は、複数の周波数帯域毎に少なくとも１つの信号サンプル位置を特定する。

　複数のフィルタ係数更新部１４２は、複数の周波数帯域毎に少なくとも１つの信号サンプル位置においてフィルタ係数を更新する。なお、本実施の形態３におけるフィルタ係数の更新処理は、実施の形態１におけるフィルタ係数の更新処理と同じである。

　帯域合成部２３は、複数の周波数帯域毎に生成された雑音除去信号を合成する。帯域合成部２３は、第１雑音除去信号生成部１５Ａ、第２雑音除去信号生成部１５Ｂ、第３雑音除去信号生成部１５Ｃ及び第４雑音除去信号生成部１５Ｄによって生成された雑音除去信号を合成する。帯域合成部２３は、４つのサブバンドの雑音除去信号をフルバンドの雑音除去信号に合成する。帯域合成部２３は、フルバンドの雑音除去信号を出力端子１７へ出力する。

　なお、本実施の形態３では、入力信号及び参照信号が４つの周波数帯域に分割されるが、本開示は特にこれに限定されず、入力信号及び参照信号が２つの周波数帯域に分割されてもよいし、３つの周波数帯域に分割されてもよいし、５つ以上の周波数帯域に分割されてもよい。

　このように、入力信号及び参照信号が複数の周波数帯域に分割され、複数の周波数帯域毎に推定雑音信号の生成処理、雑音除去信号の生成処理、信号サンプル位置の特定処理及びフィルタ係数の更新処理が行われるので、演算時間を短縮することができるとともに、単位時間あたりの演算量を削減することができる。

　なお、上記各実施の形態において、各構成要素は、専用のハードウェアで構成されるか、各構成要素に適したソフトウェアプログラムを実行することによって実現されてもよい。各構成要素は、ＣＰＵまたはプロセッサなどのプログラム実行部が、ハードディスクまたは半導体メモリなどの記録媒体に記録されたソフトウェアプログラムを読み出して実行することによって実現されてもよい。また、プログラムを記録媒体に記録して移送することにより、又はプログラムをネットワークを経由して移送することにより、独立した他のコンピュータシステムによりプログラムが実施されてもよい。

　本開示の実施の形態に係る装置の機能の一部又は全ては典型的には集積回路であるＬＳＩ（Ｌａｒｇｅ　Ｓｃａｌｅ　Ｉｎｔｅｇｒａｔｉｏｎ）として実現される。これらは個別に１チップ化されてもよいし、一部又は全てを含むように１チップ化されてもよい。また、集積回路化はＬＳＩに限るものではなく、専用回路又は汎用プロセッサで実現してもよい。ＬＳＩ製造後にプログラムすることが可能なＦＰＧＡ（Ｆｉｅｌｄ　Ｐｒｏｇｒａｍｍａｂｌｅ　Ｇａｔｅ　Ａｒｒａｙ）、又はＬＳＩ内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサを利用してもよい。

　また、本開示の実施の形態に係る装置の機能の一部又は全てを、ＣＰＵ等のプロセッサがプログラムを実行することにより実現してもよい。

　また、上記で用いた数字は、全て本開示を具体的に説明するために例示するものであり、本開示は例示された数字に制限されない。

　また、上記フローチャートに示す各ステップが実行される順序は、本開示を具体的に説明するために例示するためのものであり、同様の効果が得られる範囲で上記以外の順序であってもよい。また、上記ステップの一部が、他のステップと同時（並列）に実行されてもよい。

　本開示に係る技術は、雑音を除去するための演算量を削減することができるので、マイクロホンによって取得された入力信号に含まれる雑音信号を除去する技術に有用である。

Claims

　参照信号から、マイクロホンによって取得された入力信号に含まれる雑音信号の成分を示す推定雑音信号を生成する適応フィルタと、
　前記入力信号から前記推定雑音信号を減算した雑音除去信号を生成する信号生成部と、
　前記雑音除去信号を用いて前記適応フィルタのフィルタ係数を更新する係数更新部と、
　前記雑音除去信号の絶対値が最大である信号サンプル位置から所定番目に大きい信号サンプル位置までの複数の信号サンプル位置のうちの少なくとも１つの信号サンプル位置を特定する特定部とを備え、
　前記係数更新部は、前記特定部によって特定された前記少なくとも１つの信号サンプル位置において前記フィルタ係数を更新する、
　収音装置。
　前記少なくとも１つの信号サンプル位置は、前記雑音除去信号の絶対値が最大である信号サンプル位置である、
　請求項１記載の収音装置。
　前記参照信号は、スピーカへ出力される再生信号である、
　請求項１又は２記載の収音装置。
　前記係数更新部は、前記少なくとも１つの信号サンプル位置における前記雑音除去信号の前記絶対値の大きさに応じて、前記フィルタ係数を更新する更新速度を変化させる、
　請求項１～３のいずれか１項に記載の収音装置。
　前記係数更新部は、前記少なくとも１つの信号サンプル位置における前記雑音除去信号の前記絶対値が閾値より大きい場合、前記更新速度を現在よりも速くし、前記少なくとも１つの信号サンプル位置における前記雑音除去信号の前記絶対値が前記閾値以下である場合、前記更新速度を現在よりも遅くする、
　請求項４記載の収音装置。
　前記入力信号を複数の周波数帯域に分割する第１帯域分割部と、
　前記参照信号を前記複数の周波数帯域に分割する第２帯域分割部と、
　前記複数の周波数帯域毎に生成された前記雑音除去信号を合成する帯域合成部と、
　をさらに備え、
　前記適応フィルタは、前記複数の周波数帯域毎に前記推定雑音信号を生成する複数の適応フィルタを含み、
　前記信号生成部は、前記複数の周波数帯域毎に前記雑音除去信号を生成する複数の信号生成部を含み、
　前記特定部は、前記複数の周波数帯域毎に前記少なくとも１つの信号サンプル位置を特定する複数の特定部を含み、
　前記係数更新部は、前記複数の周波数帯域毎に前記少なくとも１つの信号サンプル位置において前記フィルタ係数を更新する複数の係数更新部を含む、
　請求項１～５のいずれか１項に記載の収音装置。
　前記適応フィルタは、
　参照信号から、第１マイクロホンによって取得された第１入力信号に含まれる雑音信号の成分を示す第１推定雑音信号を生成する第１適応フィルタと、
　参照信号から、前記第１マイクロホンとは異なる第２マイクロホンによって取得された第２入力信号に含まれる雑音信号の成分を示す第２推定雑音信号を生成する第２適応フィルタと、
　を含み、
　前記信号生成部は、
　前記第１入力信号から前記第１推定雑音信号を減算した第１雑音除去信号を生成する第１信号生成部と、
　前記第２入力信号から前記第２推定雑音信号を減算した第２雑音除去信号を生成する第２信号生成部と、
　を含み、
　前記係数更新部は、
　前記第１雑音除去信号を用いて前記第１適応フィルタのフィルタ係数を更新する第１係数更新部と、
　前記第２雑音除去信号を用いて前記第２適応フィルタのフィルタ係数を更新する第２係数更新部と、
　を含み、
　前記特定部は、
　前記第１雑音除去信号の絶対値が最大である信号サンプル位置から所定番目に大きい信号サンプル位置までの複数の信号サンプル位置のうちの少なくとも１つの信号サンプル位置を特定する第１特定部と、
　前記第２雑音除去信号の絶対値が最大である信号サンプル位置から所定番目に大きい信号サンプル位置までの複数の信号サンプル位置のうちの少なくとも１つの信号サンプル位置を特定する第２特定部と、
　を含む、
　請求項１～６のいずれか１項に記載の収音装置。
　適応フィルタ、信号生成部、係数更新部及び特定部を備える収音装置における収音方法であって、
　前記適応フィルタが、参照信号から、マイクロホンによって取得された入力信号に含まれる雑音信号の成分を示す推定雑音信号を生成し、
　前記信号生成部が、前記入力信号から前記推定雑音信号を減算した雑音除去信号を生成し、
　前記特定部が、前記雑音除去信号の絶対値が最大である信号サンプル位置から所定番目に大きい信号サンプル位置までの複数の信号サンプル位置のうちの少なくとも１つの信号サンプル位置を特定し、
　前記係数更新部が、特定された前記少なくとも１つの信号サンプル位置において前記雑音除去信号を用いて前記適応フィルタのフィルタ係数を更新する、
　収音方法。
　参照信号から、マイクロホンによって取得された入力信号に含まれる雑音信号の成分を示す推定雑音信号を生成する適応フィルタと、
　前記入力信号から前記推定雑音信号を減算した雑音除去信号を生成する信号生成部と、
　前記雑音除去信号を用いて前記適応フィルタのフィルタ係数を更新する係数更新部と、
　前記雑音除去信号の絶対値が最大である信号サンプル位置から所定番目に大きい信号サンプル位置までの複数の信号サンプル位置のうちの少なくとも１つの信号サンプル位置を特定する特定部としてコンピュータを機能させ、
　前記係数更新部は、前記特定部によって特定された前記少なくとも１つの信号サンプル位置において前記フィルタ係数を更新する、
　収音プログラム。