JP5022459B2 - 収音装置、収音方法及び収音プログラム - Google Patents

収音装置、収音方法及び収音プログラム Download PDF

Info

Publication number
JP5022459B2
JP5022459B2 JP2010046311A JP2010046311A JP5022459B2 JP 5022459 B2 JP5022459 B2 JP 5022459B2 JP 2010046311 A JP2010046311 A JP 2010046311A JP 2010046311 A JP2010046311 A JP 2010046311A JP 5022459 B2 JP5022459 B2 JP 5022459B2
Authority
JP
Japan
Prior art keywords
reception
signal
sound
filter
covariance matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2010046311A
Other languages
English (en)
Other versions
JP2011182292A (ja
Inventor
裕輔 日岡
澄宇 阪内
賢一 古家
陽一 羽田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2010046311A priority Critical patent/JP5022459B2/ja
Publication of JP2011182292A publication Critical patent/JP2011182292A/ja
Application granted granted Critical
Publication of JP5022459B2 publication Critical patent/JP5022459B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Telephone Function (AREA)

Description

本発明は、TV会議や音声会議、電話、遠隔講義などの収音技術、特に複数の収音再生装置を縦続接続して使用する際の収音技術に関する。
ハンズフリー通話を行う際には、一般にマイクロホンから話者までの距離が離れているため、十分聞き取りやすい音量にするためにはマイクロホンの感度を上げる必要がある。特に複数の話者がいる場合には、話者ごとに距離が異なるため、話者ごとに感度を変える必要がある。このような目的を実現する従来技術として特許文献1の実施例1に示す技術が知られている。従来技術では複数のマイクロホンからなるマイクロホンアレーを用いて、話者の方向ごとに異なる感度を持った指向性パターンを形成する。すなわち図1に示すように、M個のマイクロホン11からなるマイクロホンアレー11の近傍に位置する話者Aに対しては感度を低めに、マイクロホンアレー11から離れた場所に位置する話者Bに対しては感度を高めになるように、指向性を形成する。但し、Mは2以上の自然数であり、m=1,2,…,Mである。
従来技術では話者の方向を自動的に検知して感度を調整するが、従来技術による収音装置をハンズフリー通話において利用する場合、スピーカの再生音(通話相手から送られてきた音)に対する感度をも上げてしまうため、音響エコーが発生してしまい最悪の場合にはハウリングを起こしてしまうという問題がある。この問題に対し、特許文献1の実施例3の方法によれば、音響エコーを発するスピーカに指向性の死角を向け音響エコーを抑圧しながら話者に対する感度を上げることが可能である。すなわち、図2に示すようにマイクロホンアレー11から見て、話者Aとスピーカ2の方向が十分異なる場合には、音響エコーを抑圧しながら話者の感度を上げるような指向性を形成できる。また非特許文献1が音響エコーの抑圧と音量調整を同時に行うような指向性形成方法として知られている。
特許4104626号公報
小林和則、古家賢一、羽田陽一、片岡章俊、"方向別自動音量調整マイクロホンアレー"、電子情報通信学会論文誌A、社団法人電子情報通信学会、2004、Vol.J87-A, No.12、pp.1491-1501
しかし、従来技術は、スピーカと話者の位置に制約が生じる。すなわち、図3のように話者Aとスピーカ2が同じまたは近接した方向に位置する場合には、両者の区別がつかないため適切な指向性を形成することができない。このためスピーカの位置が任意に決められるような装置の場合には、従来技術は利用できない。
特に図4のように、複数の収音再生装置10、10及び10を縦続に接続し、対地側の話者Z(通話相手)から送られてくる音が全ての収音再生装置の備えるスピーカ2から再生されるような形態では、話者とスピーカの方向は近接しているうえ、収音再生装置の位置はユーザが任意に決めるためこの問題が顕在化する。
上記の課題を解決するために、本発明の第一の態様によれば、収音装置は、各音源から発せられ、音響空間に配置された複数チャネルのマイクロホンにより収音された受音信号を用いて、送信信号を生成し送話端に出力する。収音装置は、受話端から受話信号を受け取り、この受話信号から受話区間を判定する受話判定部と、受話判定部が受話区間ではないと判定した場合には、音源の位置を検出し、音源の位置に対応する共分散行列を算出して共分散行列記憶部に記憶し、共分散行列を用いて各音源に対する送話信号レベルが各々所望のレベルとなるよう複数チャネルのフィルタ係数を算出し、受話判定部が受話区間であると判定した場合には、フィルタ係数を算出することを停止し、停止時のフィルタ係数算出に用いた共分散行列を記憶部に保存する指向性形成フィルタ算出部と、マイクロホンの受音信号を、複数チャネルのフィルタ係数で、各々フィルタリングする複数チャネルのフィルタと、複数チャネルのフィルタの出力信号を加算し、送話信号として出力する加算部と、受話判定部が受話区間であると判定した場合には、フィルタの入力信号、または、加算部の入力信号、または、加算部の出力信号を0とするスイッチとを備える。指向性形成フィルタ算出部は、受話判定部が受話区間であると判定した後に受話区間ではないと判定した場合には、停止時のフィルタ係数算出に用いた共分散行列を記憶部から読み出してフィルタ係数の算出に用いる。
上記の課題を解決するために、本発明の第二の態様によれば、収音装置は、各音源から発せられ、音響空間に配置された複数チャネルのマイクロホンにより収音された受音信号を用いて、送信信号を生成し送話端に出力する。収音装置は、受話端から受話信号を受け取り、この受話信号から受話区間を判定する受話判定部と、受話判定部が受話区間ではないと判定した場合には、音源の位置を検出し、音源の位置に対応する共分散行列を算出して共分散行列記憶部に記憶し、共分散行列を用いて各音源に対する送話信号レベルが各々所望のレベルとなるよう複数チャネルのフィルタ係数を算出し、受話判定部が受話区間であると判定した場合には、フィルタ係数を算出することを停止し、停止時のフィルタ係数算出に用いた共分散行列を記憶部に保存する指向性形成フィルタ算出部と、受話判定部が受話区間ではないと判定した場合には、マイクロホンの受音信号を、指向性形成フィルタ算出部で算出した複数チャネルのフィルタ係数で各々フィルタリングし、受話判定部が受話区間であると判定した場合には、マイクロホンの受音信号を、全ての値が0の複数チャネルのフィルタ係数で各々フィルタリングするフィルタと、複数チャネルのフィルタの出力信号を加算し、送話信号として出力する加算部、とを備える。指向性形成フィルタ算出部は、受話判定部が受話区間であると判定した後に受話区間ではないと判定した場合には、停止時のフィルタ係数算出に用いた共分散行列を記憶部から読み出してフィルタ係数の算出に用いる。
上記の課題を解決するために、本発明の第三の態様によれば、収音方法は、各音源から発せられ、音響空間に配置された複数チャネルのマイクロホンにより収音された受音信号を用いて、送信信号を生成し送話端に出力する。収音方法は、受話端から受話信号を受け取り、この受話信号から受話区間を判定する受話判定ステップと、受話判定ステップにおいて受話区間ではないと判定した場合には、音源の位置を検出し、音源の位置に対応する共分散行列を算出して共分散行列記憶部に記憶し、共分散行列を用いて各音源に対する送話信号レベルが各々所望のレベルとなるよう複数チャネルのフィルタ係数を算出し、受話判定ステップにおいて受話区間であると判定した場合には、フィルタ係数を算出することを停止し、停止時のフィルタ係数算出に用いた共分散行列を記憶部に保存する指向性形成フィルタ算出ステップと、マイクロホンの受音信号を、複数チャネルのフィルタ係数で、各々フィルタリングするフィルタリングステップと、複数チャネルのフィルタの出力信号を加算し、送話信号として出力する加算ステップと、受話判定ステップにおいて受話区間であると判定した場合には、フィルタリングステップにおける入力信号、または、加算ステップにおける入力信号、または、加算ステップにおける出力信号を0とするステップとを備える。指向性形成フィルタ算出ステップは、受話判定ステップにおいて受話区間であると判定した後に受話区間ではないと判定した場合には、停止時のフィルタ係数算出に用いた共分散行列を記憶部から読み出してフィルタ係数の算出に用いる。
上記の課題を解決するために、本発明の第四の態様によれば、収音方法は、各音源から発せられ、音響空間に配置された複数チャネルのマイクロホンにより収音された受音信号を用いて、送信信号を生成し送話端に出力する。収音方法は、受話端から受話信号を受け取り、この受話信号から受話区間を判定する受話判定ステップと、受話判定ステップにおいて受話区間ではないと判定した場合には、音源の位置を検出し、音源の位置に対応する共分散行列を算出して共分散行列記憶部に記憶し、共分散行列を用いて各音源に対する送話信号レベルが各々所望のレベルとなるよう複数チャネルのフィルタ係数を算出し、受話判定ステップにおいて受話区間であると判定した場合には、フィルタ係数を算出することを停止し、停止時のフィルタ係数算出に用いた共分散行列を記憶部に保存する指向性形成フィルタ算出ステップと、受話判定ステップにおいて受話区間ではないと判定した場合には、マイクロホンの受音信号を、指向性形成フィルタ算出ステップで算出した複数チャネルのフィルタ係数で各々フィルタリングし、受話判定ステップにおいて受話区間であると判定した場合には、マイクロホンの受音信号を、全ての値が0の複数チャネルのフィルタ係数で各々フィルタリングするフィルタリングステップと、複数チャネルのフィルタの出力信号を加算し、送話信号として出力する加算ステップとを備える。収音方法は、指向性形成フィルタ算出ステップは、受話判定ステップにおいて受話区間であると判定した後に受話区間ではないと判定した場合には、停止時のフィルタ係数算出に用いた共分散行列を記憶部から読み出してフィルタ係数の算出に用いる。
本発明は、ネットワークから送られてくる通話相手の音(受話信号)を観測し、マイクロホンアレーの動作を制御するので、音響エコーを抑えることができ、さらに、スピーカ及び話者の位置を任意に決めることができ、計算量を減らすことができるという効果を奏する。
話者の位置関係とマイクロホンアレー11の指向性パターンの例を示す図。 話者の位置関係及びスピーカとマイクロホンアレー11の指向性パターンの例を示す図。 話者とスピーカがマイクロホンアレー11から見て同方向に位置する場合の指向性パターンの例を示す図。 (A)は複数の収音再生装置10、10及び10を縦続に接続し、対地側の話者Z(通話相手)から送られてくる音が全ての収音再生装置の備えるスピーカ2から再生されるような形態を示し、(B)は収音再生装置10の構成例を示す図。 収音装置100及び200の構成例を示す図。 収音装置100の処理フローを示す図 受話判定部110の構成例を示す図。 従来技術及び実施例1の収音装置の発話及び受話状態による処理の変化を示す図。 指向性形成フィルタ算出部120の構成例を示す図。 指向性形成フィルタ算出部120の処理フローを示す図。 受話判定部210の構成例を示す図。
以下、本発明の実施の形態について、詳細に説明する。
<収音装置100>
図5及び6を用いて実施例1に係る収音装置100を説明する。収音装置100は2以上のフィルタ12、12、…、12と、受話判定部110と、指向性形成フィルタ算出部120と、加算部13と、を備える。
また、例えば、M個のマイクロホン11、11、…、11からなるマイクロホンアレー11、または、マイクロホンアレー11の出力を受け取る図示しない入力部を備える。本実施例では収音装置100は図示しない入力部を備える。また、SW131〜133の何れか一つを備えてもよい。本実施例ではSW133を備える。
収音装置100は、各音源9、9、…、9から発せられ、音響空間に配置された複数チャネルのマイクロホン11、11、…、11により収音された受音信号を用いて、送信信号を生成し送話端4に出力する。なお、マイクロホン11〜11の各出力受音信号は特に図示しないがディジタルアナログ変換器により予め決められたサンプリング周波数でディジタル値に変換して得られたディジタルの受音信号であるものとする。
<受話判定部110>
受話判定部110は、ネットワーク1と接続されている図示しない受話端から受話信号を受け取り、この受話信号から受話区間を判定する(s110)。
受話判定部110は、受話区間であると判定した場合には、後述する指向性形成フィルタ算出部120において、フィルタ係数を算出することを停止するように制御信号を出力する。また、送話端4に出力する送話信号を0とするために、SW133に対し制御信号を出力し、スイッチをオフにし、送話信号を出力しないようにする。
図7を用いて、受話区間を判定する方法を例示する。受話判定部110は、例えば、短時間平均パワー算出部110Bと、長時間平均パワー算出部110Cと、割算部110Dと、判定部110Gとを備える。
短時間平均パワー算出部110Bは、受け取った受話信号の短時間平均パワー(例えば0.1〜1s間程度の平均パワー)PavSRを算出し、出力する。長時間平均パワー算出部110Cは、受け取った受話信号の長時間平均パワー(例えば1〜100s間程度の平均パワー)PavLRを算出し、出力する。割算部110Dは、短時間平均パワーと長時間平均パワーを入力とし、その比RpR=PavSR/PavLRを求め、出力する。判定部110Gは、割算部110Dにおいて求めた比RpRと、予め定めた閾値RthURとを入力とし、これを比較し、比RpRが閾値RthURを超える場合に受話区間と判定し、上述したフィルタ係数の算出の停止を指示する制御信号やSW133をオフにする制御信号を出力する。それ以外の場合には、フィルタ係数の算出を指示する制御信号やSW133をオンにする制御信号を出力してもよい。なお、閾値RthURは、経験的に一意に決定するものであり、少なくとも1以上の値であり、例えば5〜100程度の値をとる。
図8は、フィルタの更新状態及び収音装置の出力の時間変化を表している。図中の「on」はフィルタの更新及び送信信号を出力することを表し、「off」は更新及び送信信号の出力がなされないことを表す。特許文献1の実施例3の場合には、受話状態(区間A)において、スピーカ方向に指向性のヌルを向けるように学習を続ける。しかし発話区間と受話区間が頻繁に変わる場合(区間B)には、フィルタの学習が効果的に行われない。一方、本発明による方法では、受話区間ではフィルタの学習を行わず出力信号が0になるような処理を行うことで、区間Bのようなケースでも音量調整の効果を損なうことなく、音響エコーの抑圧を行うことができる。
<指向性形成フィルタ算出部120>
受話判定部110において、受話区間ではないと判定した場合には、指向性形成フィルタ算出部120は、マイクロホンアレー11の受音信号を入力とし、各音源9、9、…、9に対する送話信号レベルが各々所望のレベルとなるよう複数チャネルのフィルタ係数を算出し(s120)、このフィルタ係数をフィルタ12、12、…、12に出力する。例えば、特許文献1記載の方法により、音源位置を検出し、その音源からの収音レベルを推定して指向性を形成し、フィルタ係数を算出する。詳細は後述する。受話判定部110において、受話区間であると判定した場合には、指向性形成フィルタ算出部120は、受話判定部110から受け取る制御信号に従って、フィルタ係数の算出を停止する。
<フィルタ12、12、…、12
フィルタ12、12、…、12は、指向性形成フィルタ算出部120からフィルタ係数を受け取り、設定する。さらに、マイクロホン11、11、…、11の受音信号を、複数チャネルのフィルタ係数で、各々フィルタリングする(s125)。
<加算部13>
加算部13は、複数チャネルのフィルタの出力信号を入力とし、これを全て加算し、得られた値を送話信号として送話端4に出力する(s130)。
<指向性形成フィルタ算出部120の処理概要>
指向性形成フィルタ算出部120は、例えば特許文献1と同様の方法により、音源位置を検出し、その音源からの収音レベルを推定して指向性を形成する。図9及び10を用いて指向性形成フィルタ算出部120の概要を説明する。指向性形成フィルタ算出部120は、状態判定部14と、音源位置検出部15と、周波数領域変換部16と、共分散行列算出部17と、共分散行列記憶部18と、収音レベル推定部19と、フィルタ係数算出部21を有する。
図10に示すように、まず、ステップS1で音源数KをK=0に初期設定する。次にステップS2で状態判定部14により定期的に発話検出を行い、発話が検出されるとステップS3で音源位置検出部15により音源位置検出を実行する。ステップS4で、検出された音源位置が以前に検出された音源位置の何れかと一致するか判定し、一致するものがあればステップS5でその音源位置に対応する共分散行列RXX(ω)を共分散行列算出部17で新たに計算し、ステップS6で共分散行列記憶部18の対応する領域の共分散行列を更新する。
ステップS4で以前に検出された音源位置と一致しなかった場合は、ステップS7でKを1だけ増加させ、ステップS8でその音源位置に対応する共分散行列RXX(ω)を共分散行列算出部17で新たに計算し、ステップS9で共分散行列記憶部18の新たな領域に共分散行列を記憶する。
次に、ステップS10で記憶されている共分散行列から、収音レベル推定部19により収音レベルを推定し、ステップS11で推定収音レベルと共分散行列を使ってフィルタ係数算出部21によりフィルタ係数の算出を行い、ステップS12でフィルタ12〜12Mの設定フィルタ係数を更新する。なお、指向性を形成する方法は他の従来技術を用いてもよい。
ここで、ステップS8の詳細を説明する。なお、他のステップの処理については、特許文献1に詳しく記載されている。共分散行列算出部17では、マイクロホンの受音信号の共分散を求め、共分散行列を生成する。各音源9(但しk=1,2,…,Kであり、Kは音源の数である)に対し周波数領域変換部16で得られたマイクロホンの受音信号の周波数領域変換信号をX(ω)〜X(ω)とすると、これらの信号のM×M共分散行列RXX(ω)は一般に以下の式で表される。
Figure 0005022459
但し、は複素共役を表す。特許文献1の実施例3による方法では、話者に対する感度を上げながら、スピーカに死角を向ける指向性を形成するために共分散行列RXX(ω)を求める。このとき、時間平均を行うため一定時間以上の発話区間と受話区間の信号データが必要になる。しかしながら、図8の区間Bのように、一般に会話をする際に話者は頻繁に交代することから、所望の指向性を形成するために十分な信号データを得られないうちに話者位置が変わってしまうことが多く、結果として共分散行列を求めるため大きな計算量を要する割に十分な音響エコー抑圧効果を得られないことがある。
一方、本実施例においては、受話区間であると判定した場合には、指向性形成フィルタ算出部120は、フィルタ係数の算出を停止するように制御信号を受け取った場合には、各部の処理を停止する。従って、共分散行列RXX(ω)の算出も停止するため、受話区間ではないと判定した場合には、停止時のフィルタ係数の算出に用いた情報(共分散行列等)に基づき、フィルタ係数を算出する。よって、単に計算量を減らすことができるだけではなく、受話区間後の発話にも迅速に追従することができるという効果を奏する。
<効果>
このような構成とすることによって、本発明は、ネットワークから送られてくる通話相手の音(受話信号)を観測し、マイクロホンアレーの動作を制御するので、音響エコーを抑えることができる。言い換えると、観測した受話信号が十分小さい時のみマイクロホンアレーの指向性の学習を行い、得られたデータを用いて収音処理を行う。一方、受話信号が大きい場合にはマイクロホンアレーの指向性の学習を停止し、さらにマイクロホンアレーの出力を小さくする処理を行う。これにより従来技術の課題として述べたようにスピーカと話者位置が近接する場合も、音響エコーの抑圧性能を失うことなく指向性形成による音量調整が可能になる。さらに、スピーカ及び話者の位置を任意に決めることができ、計算量を減らすことができる。また、話者が頻繁に交代するような場合にも、計算量を要することなく音響エコー抑圧効果を得ることができる。
上述した収音装置100は、コンピュータにより機能させることもできる。この場合はコンピュータに、目的とする装置として機能させるためのプログラム、又はその処理手順の各過程をコンピュータに実行させるためのプログラムを、CD−ROM、磁気ディスク、半導体記憶装置などの記録媒体から、あるいは通信回線を介してそのコンピュータ内にダウンロードし、そのプログラムを実行させればよい。
[変形例]
なお、マイクロホンアレー11は収音装置100に含まれる(内蔵)構成であってもよい。
なお、SW133に代えて、SW131またはSW132を備えてもよい。受話判定部110の制御信号により、何れのSWもon,offの制御が可能な構成とする。SW132を用いた場合には加算部で行われる加算処理を省くことができ、SW131を用いた場合にはさらにフィルタで行われるフィルタリング処理を省くことができる。
受話判定部110は、他の方法によって、受話区間を判定してもよい。例えば、受話判定部110は、短時間平均パワー算出部110Bと、判定部110Gとを備え、短時間平均パワー算出部110Bは、受け取った受話信号の短時間平均パワー(例えば0.1〜1s間程度の平均パワー)PavSRを算出する。判定部110Gは、短時間平均パワー算出部110Bにおいて算出した短時間平均パワーPavSRと、予め定めた閾値RthURとを比較し、それを超える場合に受話区間と判定し、フィルタ係数の更新を停止する制御信号及び送話信号の出力を停止する制御信号を出力する構成としてもよい。短時間平均パワーによって、十分に受話区間を推定できる場合には、このような構成により実施例1と同様の効果が得られ計算量が少ない収音装置とすることができる。
また、SW131〜133の何れも有さず、フィルタ12、12、…、12にフィルタ係数として0を設定する構成としてもよい。この場合、制御信号に代えてフィルタ係数を送信してもよい。例えば、受話判定部110において、受話区間であると判定した場合には、指向性形成フィルタ算出部120に制御信号を出力し、指向性形成フィルタ算出部120において、フィルタ係数を算出することを停止し、停止時のフィルタ係数の算出に用いた情報(共分散行列RXX(ω)など)を図示しない記憶部に保存する。その後、受話判定部110は、フィルタ12、12、…、12のフィルタ係数を全て0にするように制御信号を出力するか、または、全て0のフィルタ係数をフィルタ12、12、…、12に送信する。フィルタ12、12、…、12では、このフィルタ係数とマイクロホン11、11、…、11の受音信号を用いて、フィルタリングを行い、送話端に出力する送話信号を0とする。その後に、受話判定部110において、受話区間ではないと判定した場合には、指向性形成フィルタ算出部110において、記憶部から停止時のフィルタ係数の算出に用いた情報を取り出し、これに基づきフィルタ係数を更新する。このような構成とすることで、十分な信号データを得られないうちに話者位置が変わってしまい、結果として共分散行列を求めるため大きな計算量を要する割に十分な音響エコー抑圧効果を得られないという問題を解消できる。
<収音装置200>
図5及び11を用いて実施例2に係る収音装置200を説明する。実施例1と異なる部分についてのみ説明する。
収音装置200は、受話判定部210の構成が実施例1の収音装置100と異なる。
<受話判定部210>
受話判定部210は、マイクロホン11、11、…、11のうちの少なくとも1つ(例えばマイクロホン11の受音信号)から受音信号を受け取り(図5中破線で示す)、ネットワーク1と接続されている図示しない受話端から受話信号を受け取る。
受話判定部210は、受話区間であると判定した場合であって、受音信号と受話信号が類似している場合には、指向性形成フィルタ算出部120において、フィルタ係数を算出することを停止するように制御信号を出力する。また、送話端4に出力する送話信号を0とするために、SW133に対し制御信号を出力し、スイッチをオフにし、送話信号を出力しないようにする。
図11を用いて、受話区間を判定する方法を例示する。受話判定部210は、例えば、短時間平均パワー算出部110Bと、長時間平均パワー算出部110Cと、割算部110Dと、類似度判定部210Hと、判定部210Gとを備える。
短時間平均パワー算出部110Bと、長時間平均パワー算出部110Cと、割算部110Dにおける処理は実施例1と同様である。
類似度判定部210Hは、マイクロホン11により収音された受音信号と受話端から受け取った受話信号を入力とし、これを用いて、受音信号と受話信号が類似しているか否かを判定する。例えば、受話信号と受音信号の相互相関や、振幅スペクトルの相関などを用いて、類似度を求める。このとき類似度は0から1の間の値をとるように正規化されており、0の時は全く類似性がない、1の時は完全に一致することを表す。さらに、類似度と予め定めた閾値RthUSとを比較し、類似度が閾値RthUSを超える場合には、類似している旨の類似度判定結果を出力する。なお、閾値RthUSは、0〜1の間の値であり、経験的に一意に決定するものであり、例えば、0.5程度の値をとる。
判定部110Gは、割算部110Dにおいて求めた比RpRと、予め定めた閾値RthURとを入力とし、比RpRと閾値RthURを比較し、比RpRが閾値RthURを超え、かつ、類似している旨の類似度判定結果を受け取った場合には、フィルタ係数の算出の停止する制御信号とSW133をオフにする制御信号を出力する。それ以外の場合には、フィルタ係数の算出を指示する制御信号やSW133をオンにする制御信号を出力してもよい。
<効果>
このような構成とすることで、受話信号が再生されるスピーカが話者と近接した方向にある場合でも、例えばスピーカが話者に比べて非常に遠くに位置する場合や、スピーカとマイクロホンの間に大きな遮蔽物がある場合など、音響エコーの影響がほとんどないような場合において、受話信号が存在する場合でも音量調整を行うことができるという効果を奏する。音響エコーの影響がほとんどないような場合には、指向性形成による音量調整を停止する必要が無いので、このような構成が有効である。
本発明は、複数の収音再生装置を縦続接続して使用する際の収音技術等に利用することができる。
100,200 収音装置
12 フィルタ
13 加算部
110 受話判定部
120 指向性形成フィルタ算出部

Claims (11)

  1. 各音源から発せられ、音響空間に配置された複数チャネルのマイクロホンにより収音された受音信号を用いて、送信信号を生成し送話端に出力する収音装置であって、
    受話端から受話信号を受け取り、この受話信号から受話区間を判定する受話判定部と、
    前記受話判定部が受話区間ではないと判定した場合には、音源の位置を検出し、前記音源の位置に対応する共分散行列を算出して共分散行列記憶部に記憶し、前記共分散行列を用いて各音源に対する送話信号レベルが各々所望のレベルとなるよう複数チャネルのフィルタ係数を算出し、前記受話判定部が受話区間であると判定した場合には、前記フィルタ係数を算出することを停止し、停止時のフィルタ係数算出に用いた共分散行列を記憶部に保存する指向性形成フィルタ算出部と、
    前記マイクロホンの受音信号を、前記複数チャネルのフィルタ係数で、各々フィルタリングする複数チャネルのフィルタと、
    前記複数チャネルのフィルタの出力信号を加算し、送話信号として出力する加算部と、
    前記受話判定部が受話区間であると判定した場合には、前記フィルタの入力信号、または、前記加算部の入力信号、または、前記加算部の出力信号を0とするスイッチとを備え、
    前記指向性形成フィルタ算出部は、前記受話判定部が受話区間であると判定した後に受話区間ではないと判定した場合には、前記停止時のフィルタ係数算出に用いた共分散行列を前記記憶部から読み出してフィルタ係数の算出に用いる、
    収音装置。
  2. 各音源から発せられ、音響空間に配置された複数チャネルのマイクロホンにより収音された受音信号を用いて、送信信号を生成し送話端に出力する収音装置であって、
    受話端から受話信号を受け取り、この受話信号から受話区間を判定する受話判定部と、
    前記受話判定部が受話区間ではないと判定した場合には、音源の位置を検出し、前記音源の位置に対応する共分散行列を算出して共分散行列記憶部に記憶し、前記共分散行列を用いて各音源に対する送話信号レベルが各々所望のレベルとなるよう複数チャネルのフィルタ係数を算出し、前記受話判定部が受話区間であると判定した場合には、前記フィルタ係数を算出することを停止し、停止時のフィルタ係数算出に用いた共分散行列を記憶部に保存する指向性形成フィルタ算出部と、
    前記受話判定部が受話区間ではないと判定した場合には、前記マイクロホンの受音信号を、前記指向性形成フィルタ算出部で算出した前記複数チャネルのフィルタ係数で各々フィルタリングし、前記受話判定部が受話区間であると判定した場合には、前記マイクロホンの受音信号を、全ての値が0の前記複数チャネルのフィルタ係数で各々フィルタリングするフィルタと、
    前記複数チャネルのフィルタの出力信号を加算し、送話信号として出力する加算部、とを備え、
    前記指向性形成フィルタ算出部は、前記受話判定部が受話区間であると判定した後に受話区間ではないと判定した場合には、前記停止時のフィルタ係数算出に用いた共分散行列を前記記憶部から読み出してフィルタ係数の算出に用いる、
    収音装置。
  3. 請求項1または2記載の収音装置であって、
    前記受話判定部は、
    前記受話信号の短時間平均パワーを算出する短時間平均パワー算出部と、
    前記受話信号の長時間平均パワーを算出する長時間平均パワー算出部と、
    短時間平均パワーと長時間平均パワーの比を求める割算部と、
    前記割算部において求めた比と、予め定めた閾値とを比較することにより受話区間か否かを判定する判定部と、を備える、
    ことを特徴とする収音装置。
  4. 請求項1または2記載の収音装置であって、
    前記受話判定部は、
    前記受話信号の短時間平均パワーを算出する短時間平均パワー算出部と、
    前記短時間平均パワーと、予め定めた閾値とを比較することにより受話区間か否かを判定する判定部と、を備える、
    ことを特徴とする収音装置。
  5. 請求項1から4の何れかに記載の収音装置であって、
    前記受話判定部は、
    前記マイクロホンにより収音された受音信号と前記受け取った受話信号を用いて、受音信号と受話信号が類似しているか否かを判定する類似度判定部を備え、
    前記受話判定部において、受話区間であり、かつ、受音信号と受話信号が類似していると判定した場合には、
    前記指向性形成フィルタ算出部において、フィルタ係数を算出することを停止し、送話端に出力する送話信号を0とする、
    ことを特徴とする収音装置。
  6. 各音源から発せられ、音響空間に配置された複数チャネルのマイクロホンにより収音された受音信号を用いて、送信信号を生成し送話端に出力する収音方法であって、
    受話端から受話信号を受け取り、この受話信号から受話区間を判定する受話判定ステップと、
    前記受話判定ステップにおいて受話区間ではないと判定した場合には、音源の位置を検出し、前記音源の位置に対応する共分散行列を算出して共分散行列記憶部に記憶し、前記共分散行列を用いて各音源に対する送話信号レベルが各々所望のレベルとなるよう複数チャネルのフィルタ係数を算出し、前記受話判定ステップにおいて受話区間であると判定した場合には、前記フィルタ係数を算出することを停止し、停止時のフィルタ係数算出に用いた共分散行列を記憶部に保存する指向性形成フィルタ算出ステップと、
    前記マイクロホンの受音信号を、前記複数チャネルのフィルタ係数で、各々フィルタリングするフィルタリングステップと、
    前記複数チャネルのフィルタの出力信号を加算し、送話信号として出力する加算ステップと、
    前記受話判定ステップにおいて受話区間であると判定した場合には、前記フィルタリングステップにおける入力信号、または、前記加算ステップにおける入力信号、または、前記加算ステップにおける出力信号を0とするステップとを備え、
    前記指向性形成フィルタ算出ステップは、前記受話判定ステップにおいて受話区間であると判定した後に受話区間ではないと判定した場合には、前記停止時のフィルタ係数算出に用いた共分散行列を前記記憶部から読み出してフィルタ係数の算出に用いる、
    収音方法。
  7. 各音源から発せられ、音響空間に配置された複数チャネルのマイクロホンにより収音された受音信号を用いて、送信信号を生成し送話端に出力する収音方法であって、
    受話端から受話信号を受け取り、この受話信号から受話区間を判定する受話判定ステップと、
    前記受話判定ステップにおいて受話区間ではないと判定した場合には、音源の位置を検出し、前記音源の位置に対応する共分散行列を算出して共分散行列記憶部に記憶し、前記共分散行列を用いて各音源に対する送話信号レベルが各々所望のレベルとなるよう複数チャネルのフィルタ係数を算出し、前記受話判定ステップにおいて受話区間であると判定した場合には、前記フィルタ係数を算出することを停止し、停止時のフィルタ係数算出に用いた共分散行列を記憶部に保存する指向性形成フィルタ算出ステップと、
    前記受話判定ステップにおいて受話区間ではないと判定した場合には、前記マイクロホンの受音信号を、前記指向性形成フィルタ算出ステップで算出した前記複数チャネルのフィルタ係数で各々フィルタリングし、前記受話判定ステップにおいて受話区間であると判定した場合には、前記マイクロホンの受音信号を、全ての値が0の前記複数チャネルのフィルタ係数で各々フィルタリングするフィルタリングステップと、
    前記複数チャネルのフィルタの出力信号を加算し、送話信号として出力する加算ステップとを備え、
    前記指向性形成フィルタ算出ステップは、前記受話判定ステップにおいて受話区間であると判定した後に受話区間ではないと判定した場合には、前記停止時のフィルタ係数算出に用いた共分散行列を前記記憶部から読み出してフィルタ係数の算出に用いる、
    収音方法。
  8. 請求項6または7記載の収音方法であって、
    前記受話判定ステップは、
    前記受話信号の短時間平均パワーを算出する短時間平均パワー算出ステップと、
    前記受話信号の長時間平均パワーを算出する長時間平均パワー算出ステップと、
    短時間平均パワーと長時間平均パワーの比を求める割算ステップと、
    前記割算ステップにおいて求めた比と、予め定めた閾値とを比較することにより受話区間か否かを判定する判定ステップと、を備える、
    ことを特徴とする収音方法。
  9. 請求項6または7記載の収音方法であって、
    前記受話判定ステップは、
    前記受話信号の短時間平均パワーを算出する短時間平均パワー算出ステップと、
    前記短時間平均パワーと、予め定めた閾値とを比較することにより受話区間か否かを判定する判定ステップと、を備える、
    ことを特徴とする収音方法。
  10. 請求項6から9の何れかに記載の収音方法であって、
    前記受話判定ステップは、
    前記マイクロホンにより収音された受音信号と前記受け取った受話信号を用いて、受音信号と受話信号が類似しているか否かを判定する類似度判定ステップを備え、
    前記受話判定ステップにおいて、受話区間であり、かつ、受音信号と受話信号が類似していると判定した場合には、
    前記指向性形成フィルタ算出ステップにおいて、フィルタ係数を算出することを停止し、送話端に出力する送話信号を0とする、
    ことを特徴とする収音方法。
  11. 請求項1から5の何れかに記載の収音装置として、コンピュータを機能させるためのプログラム。
JP2010046311A 2010-03-03 2010-03-03 収音装置、収音方法及び収音プログラム Active JP5022459B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010046311A JP5022459B2 (ja) 2010-03-03 2010-03-03 収音装置、収音方法及び収音プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010046311A JP5022459B2 (ja) 2010-03-03 2010-03-03 収音装置、収音方法及び収音プログラム

Publications (2)

Publication Number Publication Date
JP2011182292A JP2011182292A (ja) 2011-09-15
JP5022459B2 true JP5022459B2 (ja) 2012-09-12

Family

ID=44693316

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010046311A Active JP5022459B2 (ja) 2010-03-03 2010-03-03 収音装置、収音方法及び収音プログラム

Country Status (1)

Country Link
JP (1) JP5022459B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102112018B1 (ko) 2013-11-08 2020-05-18 한국전자통신연구원 영상 회의 시스템에서의 음향 반향 제거 장치 및 방법

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4298466B2 (ja) * 2003-10-30 2009-07-22 日本電信電話株式会社 収音方法、装置、プログラム、および記録媒体
JP4594854B2 (ja) * 2005-11-30 2010-12-08 日本電信電話株式会社 音声スイッチ方法、音声スイッチ装置、音声スイッチプログラム及びそのプログラムを記録した記録媒体
JP5034607B2 (ja) * 2006-11-02 2012-09-26 株式会社日立製作所 音響エコーキャンセラシステム

Also Published As

Publication number Publication date
JP2011182292A (ja) 2011-09-15

Similar Documents

Publication Publication Date Title
TWI713844B (zh) 用於語音處理的方法及積體電路
US20190158965A1 (en) Hearing aid comprising a beam former filtering unit comprising a smoothing unit
US8842851B2 (en) Audio source localization system and method
TWI435318B (zh) 利用多重裝置上的多重麥克風之語音加強之方法、設備及電腦可讀媒體
JP4247002B2 (ja) マイクロホンアレイを用いた話者距離検出装置及び方法並びに当該装置を用いた音声入出力装置
US9544698B2 (en) Signal enhancement using wireless streaming
US9319782B1 (en) Distributed speaker synchronization
US8233352B2 (en) Audio source localization system and method
JP4286637B2 (ja) マイクロホン装置および再生装置
JP5249207B2 (ja) 適応性のある方向性信号処理を備えた補聴装置
US9516411B2 (en) Signal-separation system using a directional microphone array and method for providing same
JP5493611B2 (ja) 情報処理装置、情報処理方法およびプログラム
EP2863392B1 (en) Noise reduction in multi-microphone systems
US10250975B1 (en) Adaptive directional audio enhancement and selection
US20110144779A1 (en) Data processing for a wearable apparatus
US20100324890A1 (en) Method and Apparatus For Selecting An Audio Stream
WO2008041878A2 (en) System and procedure of hands free speech communication using a microphone array
KR20080059147A (ko) 노이즈 환경에서 스피치 신호의 강건한 분리
KR20130114166A (ko) 배향 감지 녹음 제어 시스템, 방법, 장치, 및 컴퓨터 판독가능 매체
EP2761617A1 (en) Processing signals
KR20120027510A (ko) 멀티채널 신호의 위상 기반 프로세싱을 위한 시스템들, 방법들, 장치들, 및 컴퓨터 판독가능한 매체
GB2493327A (en) Processing audio signals during a communication session by treating as noise, portions of the signal identified as unwanted
CN110769352B (zh) 一种信号处理方法、装置以及计算机存储介质
US10529358B2 (en) Method and system for reducing background sounds in a noisy environment
WO2020163419A1 (en) Intelligent personal assistant

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20110701

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120306

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120426

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120605

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120615

R150 Certificate of patent or registration of utility model

Ref document number: 5022459

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150622

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350