JP7175096B2

JP7175096B2 - 収音装置、プログラム及び方法

Info

Publication number: JP7175096B2
Application number: JP2018062672A
Authority: JP
Inventors: 隆矢頭
Original assignee: Oki Electric Industry Co Ltd
Current assignee: Oki Electric Industry Co Ltd
Priority date: 2018-03-28
Filing date: 2018-03-28
Publication date: 2022-11-18
Anticipated expiration: 2038-03-28
Also published as: US10880642B2; JP2019176328A; US20190306619A1

Description

この発明は、収音装置、プログラム及び方法に関し、例えば、雑音環境下で用いられる音声通信システム等に適用し得る。

雑音環境下で音声通信システムや音声認識応用システムを利用する場合、必要な目的音声と同時に混入する周囲の雑音は、良好なコミュニケーションを阻害し、音声認識率の低下をもたらす厄介な存在である。従来、このような複数の音源が存在する環境下において、特定の方向の音のみ分離・収音することで不要音の混入を避け必要な目的音を得る技術として、マイクアレイを用いたビームフォーマ（ＢｅａｍＦｏｒｍｅｒ；以下「ＢＦ」とも呼ぶ；特許文献１、２参照）がある。ＢＦとは各マイクロホンに到達する信号の時間差を利用して指向性を形成する技術である。しかしＢＦだけでは収音を目的とするエリア（以下、「目的エリア」と呼ぶ）の周囲に他の音源が存在する場合、目的エリア内に存在する音（以下、「目的エリア音」と呼ぶ）だけを収音することが難しい。そのため、従来、特許文献１、２等により、複数のマイクアレイを用いて目的エリアを収音するエリア収音方式が提案されている。

図１４は、２つのマイクアレイＭＡ１００、ＭＡ２００を用いて、目的エリアの音源からの目的エリア音を収音する処理について示した説明図である。図１４（ａ）は、各マイクアレイＭＡ１００、ＭＡ２００の構成例について示した説明図である。図１４（ｂ）、図１４（ｃ）は、それぞれ図１４（ａ）に示すマイクアレイＭＡ１００、ＭＡ２００のＢＦ出力について周波数領域で示した図（グラフ形式のイメージ図)である。図１４において各マイクアレイＭＡ１００、ＭＡ２００は、それぞれ２つのマイクロホンｃｈ１、ｃｈ２により構成されている。

従来のエリア収音では、図１４（ａ）に示すように、マイクアレイＭＡ１００、ＭＡ２００の指向性を別々の方向から収音したいエリア（目的エリア）で交差させて収音する。図１４（ａ）の状態では、各マイクアレイＭＡ１００、ＭＡ２００の指向性に目的エリア内に存在する音（目的エリア音）だけでなく、目的エリア方向の雑音（非目的エリア音）も含まれている。しかし、図１４（ｂ）、図１４（ｃ）に示すように、マイクアレイＭＡ１００、ＭＡ２００の指向性を周波数領域で比較すると、目的エリア音成分はどちらの出力にも含まれるが、非目的エリア音成分は各マイクアレイで異なることになる。従来のエリア収音技術では、このような特性を利用し、２つのマイクアレイＭＡ１００、ＭＡ２００のＢＦ出力に、共通に含まれる成分以外を抑圧することで目的エリア音のみ抽出することができる。

特開２０１４－０７２７０８号公報特開２００５－１９５９５５号公報

浅野太著，"音響テクノロジーシリーズ１６音のアレイ信号処理－音源の定位・追跡と分離－"，日本音響学会編，コロナ社，２０１１年２月２５日発行

ところで、サイレンが鳴り響く火災現場や、救急現場から指令センタ（消防本部）への緊急連絡の手段として、緊急車両には連絡用のハンドセット（送受話器）が備えられている。従来の緊急車両に搭載されるハンドセットは、利用環境が大騒音下であるが故、現場からの連絡が周囲の騒音でかき消されて、本部（例えば、緊急車両の搭乗員を指揮する本部）に正確な情報を伝えられず誤った情報となり、的確な判断の阻害や、対応の遅れなどの問題が生じるおそれがある。そのため、これまでもハンドセットについて様々な雑音除去技術の活用が検討されてきたが、通話品質の確保、コスト増大など導入には多くの課題があった。このような利用環境において、上述のエリア収音技術は有効な解決策として期待される。例えば、ハンドセットの送話口周辺に２つのマイクアレイを設置し、当該２つのマイクアレイのそれぞれの指向性を、送話口の前で交差させエリア収音を機能させることにより、サイレン等の大騒音を排除し、消防隊員等の送話者の音声だけを本部等に正確に伝達することが可能になる。

エリア収音を実現するためには、少なくても２つのマイクアレイが必要である。一方、ハンドセットにおいて送話口部分の大きさは外形で直径６ｃｍ程度と小さく、そこにエリア収音実現のために２つのマイクアレイを装着する場合、それぞれのマイクアレイを非常に近接した状態で設置する必要がある。その結果、当該ハンドセットを用いたエリア収音において、収音エリアは送話器直近の非常に狭いエリアに限定される。しかしながら、ハンドセットに、従来のエリア収音処理を適用する場合、利用者（話者）によってハンドセットの持ち方や顔の大きさが異なり、口元が上述の狭く限定された収音エリア（ハンドセットについて設定される収音エリア）からずれる可能性がある。この場合、ハンドセットの収音エリアから利用者（話者）の口元がずれると、収音した音声の歪や脱落が生じ、安定した収音ができないという問題があった。

そのため、安定的にエリア収音を行うことができる収音装置、プログラム及び方法が望まれている。

第１の本発明の収音装置は、（１）３以上の異なる指向性のマイクアレイを形成可能なマイクアレイ部からの入力信号に基づいて、２パターン以上の前記マイクアレイの組み合わせに基づくエリア収音出力を取得する第１のエリア収音手段と、（２）前記第１のエリア収音手段が取得した各パターンのエリア収音出力を統合した結果をエリア収音結果として出力する第２のエリア収音手段とを有し、（３）前記第２のエリア収音手段は、前記第１のエリア収音手段が取得した各パターンのエリア収音出力を周波数毎に互いに比較し、周波数毎に最も強度の強い成分を選択した結果をエリア収音結果として出力することを特徴とする。

第２の本発明の収音プログラムは、コンピュータを、（１）３以上の異なる指向性のマイクアレイを形成可能なマイクアレイ部からの入力信号に基づいて、２パターン以上の前記マイクアレイの組み合わせに基づくエリア収音出力を取得する第１のエリア収音手段と、（２）前記第１のエリア収音手段が取得した各パターンのエリア収音出力を統合した結果をエリア収音結果として出力する第２のエリア収音手段として機能させ、（３）前記第２のエリア収音手段は、前記第１のエリア収音手段が取得した各パターンのエリア収音出力を周波数毎に互いに比較し、周波数毎に最も強度の強い成分を選択した結果をエリア収音結果として出力することを特徴とする。

第３の本発明は、収音装置が行う収音方法において、（１）第１のエリア収音手段、及び第２のエリア収音手段を備え、（２）前記第１のエリア収音手段は、３以上の異なる指向性のマイクアレイを形成可能なマイクアレイ部からの入力信号に基づいて、２パターン以上の前記マイクアレイの組み合わせに基づくエリア収音出力を取得し、（３）前記第２のエリア収音手段は、前記第１のエリア収音手段が取得した各パターンのエリア収音出力を統合した結果をエリア収音結果として出力し、（３）前記第２のエリア収音手段は、前記第１のエリア収音手段が取得した各パターンのエリア収音出力を周波数毎に互いに比較し、周波数毎に最も強度の強い成分を選択した結果をエリア収音結果として出力することを特徴とする。

本発明によれば、効率良く、かつ安定的にエリア収音を行う収音装置を提供することができる。

第１の実施形態に係る各装置の構成（第１の実施形態に係る収音部（収音装置）の機能的構成を含む）について示したブロック図である。第１の実施形態に係るハンドセットの使用状態について示した図（斜視図）である。第１の実施形態に係るハンドセットの送話口部分を拡大して示した図である。３個のマイクロホンにより形成されるマイクアレイの構成例について示した説明図（イメージ図）である。３個のマイクロホンにより形成されるマイクアレイの各組み合わせ（組み合わせのパターン）に対応するエリア収音処理について示した説明図（イメージ図）である。２つのマイクアレイの指向性を交差させた場合におけるエリア収音の感度の分布（計算上の感度の分布）を示した図である。マイクロホン数が２個の場合の減算型ＢＦに係る構成を示すブロック図である。２個のマイクロホンを用いた減算型ＢＦにより形成される指向特性を示す図である。第１の実施形態に係る収音部（収音装置）におけるエリア収音結果の統合処理の例について示した説明図（イメージ図）である。第２の実施形態に係る各装置の構成（第２の実施形態に係る収音部（収音装置）の機能的構成を含む）について示したブロック図である。第３の実施形態に係る各装置の構成（第３の実施形態に係る収音部（収音装置）の機能的構成を含む）について示したブロック図である。第３の実施形態に係る収音部（収音装置）におけるエリア収音結果の統合処理の例について示した説明図（イメージ図）である。実施形態に係るマイクアレイ部のマイクロホンの数を４つとした場合の構成（実施形態に係る変形例の構成）について示した説明図である。従来の収音装置において、２つのマイクアレイのビームフォーマ（ＢＦ）による指向性を別々の方向から目的エリアへ向けた場合の構成例について示した説明図である。

（Ａ）第１の実施形態
以下、本発明による収音装置、プログラム及び方法の第１の実施形態を、図面を参照しながら詳述する。この実施形態では、本発明の収音装置、プログラム及び方法を収音部に適用した例について説明する。

まず、この実施形態におけるマイクアレイを用いたエリア収音処理の基本的な原理について図４～図６を用いて説明する。

本願発明者は、多角形（Ｎ角形；Ｎは３以上の整数）の各頂点の位置にマイクロホンを配置し、多角形の中心方向に複数の収音エリアを構築することで、各収音エリアの広がり度合いの違いを利用して、１つのマイクアレイの組合せで実現した収音エリアより広い範囲のエリアの収音が可能になる方法を発明した。

例えば、３個のマイクロホンを用いたエリア収音の構成（３角形の角頂点の位置に配置したマイクロホンの構成）を考えた場合、図４に示すように、マイクロホンの組み合わせによって３個のマイクアレイ（指向性の方向の異なる３個のマイクアレイ）を設定することができる。図４に示すように、３個のマイクロホンｃｈ１～ｃｈ３では、マイクロホンｃｈ１、ｃｈ２を対とするマイクアレイＭＡ３０１、マイクロホンｃｈ２、ｃｈ３を対とするマイクアレイＭＡ３０２、及びマイクロホンｃｈ３、ｃｈ１を対とするマイクアレイＭＡ３０３を設定することができる。

さらに、３個のマイクロホンｃｈ１～ｃｈ３の構成では、図５に示すように、３個のマイクアレイＭＡ３０１、ＭＡ３０２、ＭＡ３０３の組み合わせ（３通りの組み合わせのパターン）に応じたエリア収音が可能となる。

図５（ａ）では、マイクアレイＭＡ３０１の指向性を一点鎖線で図示し、マイクアレイＭＡ３０２の指向性を二点鎖線で図示している。また、図５（ｂ）では、マイクアレイＭＡ３０２の指向性を一点鎖線で図示し、マイクアレイＭＡ３０３の指向性を二点鎖線で図示している。さらに、図５（ｃ）では、マイクアレイＭＡ３０１の指向性を一点鎖線で図示し、マイクアレイＭＡ３０３の指向性を二点鎖線で図示している。さらにまた、図５（ａ）では、マイクアレイＭＡ３０１、ＭＡ３０２の組み合わせ（パターン）に応じた収音エリアＡ３０１にハッチ（斜線）を付している。また、図５（ｂ）では、マイクアレイＭＡ３０２、ＭＡ３０３の組み合わせ（パターン）に応じた収音エリアＡ３０２にハッチ（斜線）を付している。さらに、図５（ｃ）では、マイクアレイＭＡ３０１、ＭＡ３０３の組み合わせ（パターン）に応じた収音エリアＡ３０３にハッチ（斜線）を付している。

図５に示すように、３個のマイクロホンｃｈ１～ｃｈ３の構成では、いずれのマイクアレイでも、マイクアレイ同士（マイクアレイを構成する２つのマイクロホンの位置を結ぶ線分同士）で角度を有することから、互いの指向性を交差させて、組み合わせ毎に異なるエリア収音（異なる領域のエリア収音）が実現可能である。

一方、マイクアレイを用いたエリア収音の収音エリアは、マイクアレイの前方（マイクアレイから遠い方）に拡がる性質がある。以下、その性質について図６を用いて説明する。

図６は、２つのマイクアレイＭＡ４００、ＭＡ５００の指向性を互いに直角を成すように交差させた場合におけるエリア収音の感度の分布（計算上の感度の分布）を示した図である。言い換えると、図６では、２つのマイクアレイＭＡ４００、ＭＡ５００の指向性が交差する領域及びその周辺におけるエリア収音の感度を図示している。なお、図６では、マイクアレイＭＡ４００、ＭＡ５００は、それぞれ２つのマイクロホンｃｈ１、ｃｈ２を備えている。また、図６では、エリア収音の感度を５段階（０～－５ｄＢ、－５～－１０ｄＢ、－１０～－１５ｄＢ、－１５～－２０ｄＢ、－２０～－２５ｄＢ）に分けて、段階ごとに異なるパターン（模様）を付している。図６に示すように、マイクアレイＭＡ４００、ＭＡ５００から遠い方（すなわち、右下方向）に向けて感度が高い領域が伸びている状態となることが分かる。

したがって、図５（ａ）の組み合わせ（マイクアレイＭＡ３０１、ＭＡ３０２の組み合わせ）、図５（ｂ）の組み合わせ（マイクアレイＭＡ３０２、ＭＡ３０３の組み合わせ）、図５（ｃ）の組み合わせ（マイクアレイＭＡ３０３、ＭＡ３０１の組み合わせ）によるエリア収音の収音エリア（エリア収音の感度の分布）は、それぞれマイクアレイの組み合わせ毎に異なり、重なる部分とそうでない部分（感度の分布が一致する部分と一致しない部分）が生じることになる。

すなわち、図５に示すように、３個のマイクロホンｃｈ１～ｃｈ３の構成において、異なる２つないし３つのマイクアレイの組み合わせでエリア収音を行い、それぞれの収音結果を足し合わせれば、１つのマイクアレイの組合せで実現した収音エリアより広い範囲のエリア収音が可能になる。言い換えると、多角形（Ｎ角形；Ｎは３以上の整数）の角頂点の位置に配置されたマイクロホンで形成される複数のマイクアレイのうち、異なる複数のマイクアレイの組み合わせ（組み合わせのパターン）でエリア収音を行い、それぞれのエリア収音結果（エリア収音の出力）を加算した結果を、最終的な目的エリアの収音結果として取り扱う処理を行うことで、話者の口元の位置（送話器から見た話者の口元の位置）の差異に対して、より頑健なエリア収音（より安定的なエリア収音）を行うことができる。

しかし、重複エリアを有する複数のエリアの収音結果を足し合わせると、重複したエリアのゲインは重複しないエリアのそれに対して、エリア成分が加算されることでより強調されたものとなる。拡張されたエリアに関して、エリア内の収音特性は結果として不均一なものとなり、エリアに存在する目的音源が持つ本来の特性とは異なる特性になってしまう場合がある。とりわけ音源位置が重複エリアと重複しないエリアに跨る場合には特性が歪曲される可能性が高い。

そこで、第１の実施形態の収音部（収音装置）では、重複エリアを有する複数のエリア収音出力に対し、各々の出力の同一周波数成分同士を比較し、最大振幅を有するエリアの出力のみを、拡張された複数エリア収音の出力の成分として選択するものとする。そして、第１の実施形態の収音部（収音装置）では、当該最大値選択処理を全周波数成分対して実施する。したがって、第１の実施形態の収音部（収音装置）では複数エリアの成分の足し合わせは行なわれず、結果として、同一周波数成分に対して１つのエリア収音出力のみが選択されて出力されるため、収音特性の均一性が保たれる。

これにより、第１の実施形態の収音部（収音装置）では、拡張されたエリア内の収音特性を均一化し、歪の少ない安定した収音方法を提供することができる。

（Ａ－１）第１の実施形態の構成
図１は、この実施形態に関連する各装置の構成について示したブロック図である。

図１では、この実施形態に係る収音部１２０を備える通信装置１００と、通信装置２００とを図示している。また、図１では、通信装置１００、２００間は、通信路Ｐにより通信可能な構成となっている。収音部１２０は、上述の基本的な原理を実現した構成となっている。

通信装置１００は、第１のユーザＵ１が発話した音声（音）を収音し、収音した音声の音声データを通信路Ｐを介して通信装置２００に送信するとともに、通信装置２００から受信した音声データに基づく音声（第２のユーザＵ２が発話した音声）を表音出力する装置である。また、通信装置２００は、第２のユーザＵ２が発話した音声（音）を収音し、収音した音声の音声データを通信路Ｐを介して通信装置１００に送信するとともに、通信装置１００から受信した音声データに基づく音声（第１のユーザＵ１が発話した音声）を表音出力する装置である。

第１のユーザＵ１は、例えば、救急車や消防車等の緊急車両に登場する搭乗員等が該当し、第２のユーザＵ２としては、例えば、遠隔地（例えば、緊急車両を指揮する司令センタ）の司令担当者等が該当する。

通信路Ｐは、有線・無線に限定されず種々の接続手段や接続構成（ネットワーク構成）を適用することができる。

次に、通信装置１００の構成概要について図１を用いて説明する。

通信装置１００は、ハンドセット１１０、収音部１２０、通信部１３０、及び出力部１４０を有している。

ハンドセット１１０は、３個のマイクロホンＭＣ１～ＭＣ３（３ｃｈマイクロホン）により構成されるマイクアレイ部１１１とスピーカ１１２とを備えている。

通信部１３０は、通信路Ｐを介して通信装置２００と通信するための通信インタフェースである。

収音部１２０は、マイクアレイ部１１１で捕捉した音響信号に基づいて第１のユーザＵ１の発話した音声（音）を収音する。そして、通信部１３０は、収音部１２０が収音した音声の音声データを通信装置２００側に送信する。

出力部１４０は、通信部１３０を介して通信装置２００から音声データ（第２のユーザＵ２が発話した音声の音声データ）を取得し、当該音声データに基づく音響信号をスピーカ１１２に供給し、スピーカ１１２に当該音響信号を表音出力させる。

通信装置１００のハードウェア的な構成については限定されないものであるが、この実施形態の例では、図１に示すように、通信装置１００は、ハードウェア的にはハンドセット１１０を備える電話機の構成となっているものとする。なお、通信装置１００は、必ずしもハンドセット１１０を備える必要はなく、スマートホンのように筐体（シャーシ）全体が、実質的にハンドセットとして機能する構成（例えば、スマートホンの筐体の一部に送話口が設定された構成）としてもよい。

次に、通信装置２００の構成概要について図１を用いて説明する。

通信装置２００は、スピーカ２１０、マイク２２０、通信部２３０、出力部２４０、及び収音部２５０を有している。

通信部２３０は、通信路Ｐを介して通信装置２００と通信するための通信インタフェースである。

収音部２５０は、マイク２２０で捕捉した音響信号に基づいて第２のユーザＵ２の発話した音声（音）を収音する。そして、通信部２３０は、収音部２５０が収音した音声の音声データを通信装置１００側に送信する。

出力部２４０は、通信部２３０を介して通信装置１００から音声データ（第１のユーザＵ１が発話した音声の音声データ）を取得し、当該音声データに基づく音響信号をスピーカ２１０に供給し、スピーカ２１０に当該音響信号を表音出力させる。

次に、収音部１２０の詳細構成について図１を用いて説明する。

収音部１２０は、信号入力部１２１、周波数変換部１２２、指向性形成部１２３、目的エリア音抽出部１２４及びエリア音成分選択部１２５を有している。

収音部１２０は、例えば、プロセッサやメモリ等を備えるコンピュータにプログラム（実施形態に係る収音プログラムを含む）を実行させるようにしてもよいが、その場合であっても、機能的には、図１のように示すことができる。収音部１２０の各構成要素の処理の詳細については後述する。

次に、送受話器としてのハンドセット１１０の構成について図２、図３を用いて説明する。

図２は、ハンドセット１１０が第１のユーザＵ１の手Ｕ１ａで把持されている状態について示した斜視図である。

図２に示すようにハンドセット１１０は、第１のユーザＵ１（手Ｕ１ａ）に把持させるための棒形状の把手部１１５と、把手部１１５の一端に設けられた送話口１１３（送話器）と、把手部１１５の他端に設けられた受話口１１４（受話器）とを有している。

図３は、ハンドセット１１０の送話口１１３の部分を拡大して示した図である。

図２、に示すように、受話口１１４にはスピーカ１１２が配置されている。また、図２、図３に示すように、円形の面を備える送話口１１３には、マイクアレイ部１１１（マイクロホンＭＣ１～ＭＣ３）が配置されている。

次に、マイクアレイ部１１１の構成について、図２、図３を用いて説明する。

この実施形態の例では、マイクアレイ部１１１は、３個のマイクロホンＭＣ１～ＭＣ３を有する構成であるものとする。

図２に示すように、第１のユーザＵ１が通信装置１００を手Ｕ１ａで把持し、耳にスピーカＳＰを押し付けた場合に、第１のユーザＵ１の口元が位置する送話口１１３の周囲（第１のユーザＵ１の口元と最も近接する部分の周囲）に３個のマイクロホンＭＣ１～ＭＣ３が配置されている。

図２、図３に示すハンドセット１１０では、上述の図４、図５に示す構成と同様に、マイクアレイ部１１１を構成する３個のマイクロホンＭＣ１～ＭＣ３の各位置（各マイクロホンの中心位置）が、送話口１１３の周囲上で、正三角形の頂点となるように配置されている。図２、図３では、収音エリアの拡大を等方向とするため、マイクロホンＭＣ１～ＭＣ３による三角形の各辺を同じ距離（マイクロホンＭＣ１～ＭＣ３による三角形が正三角形）としているが、各辺の距離や各角の角度は全て同じでなくてもよい。

なお、図３に示すように、以下では、マイクアレイ部１１１において、マイクロホンＭＣ１ＭＣ２を対とするマイクアレイをＭＡ１、マイクロホンＭＣ２、ＭＣ３を対とするマイクアレイをＭＡ２、マイクロホンＭＣ３、ＭＣ１を対とするマイクアレイをＭＡ３と呼ぶものとする。

（Ａ－２）第１の実施形態の動作
次に、以上のような構成を有するこの実施形態の動作（実施形態に係る収音方法）を説明する。

通信装置１００では、収音部１２０が、マイクアレイ部１１１のマイクロホンＭＣ１～ＭＣ３から供給される音響信号を用いて、目的エリアの目的エリア音を収音する目的エリア音収音処理を行う。

以下では、通信装置１００を構成する収音部１２０内部の動作を中心に説明する。

信号入力部１２１は、各マイクロホンＭＣ１～ＭＣ３で収音した音響信号をアナログ信号からデジタル信号に変換し、周波数変換部１２２に供給する。その後、周波数変換部１２２では、例えば高速フーリエ変換を用いてマイク信号を時間領域から周波数領域へ変換する。指向性形成部１２３はＢＦにより指向性を形成する。

ここで、図７、図８を用いてＢＦによる指向性形成について説明する。

ＢＦとは、マイクアレイにおいて各マイクロホンに到達する信号の時間差を利用して収音の指向性を形成する技術である（非特許文献１参照）。ＢＦは加算型と減算型の大きく２つの種類に分けられが、ここでは少ないマイクロホン数で指向性を形成できる減算型ＢＦについて説明する。

図７は、マイクロホン数が２個（ＭＣ１、ＭＣ２）の場合の減算型ＢＦ６００に係る構成を示すブロック図である。

図８は、２個のマイクロホンＭＣ１、ＭＣ２を用いた減算型ＢＦ６００により形成される指向特性を示す図である。

減算型ＢＦ６００は、まず遅延器６１０により目的とする方向に存在する音（以下、「目的音」と呼ぶ）が各マイクロホンＭＣ１、ＭＣ２に到来する信号の時間差を算出し、遅延を加えることにより目的音の位相を合わせる。時間差は（１）式により算出される。ここで、ｄはマイクロホンＭＣ１、ＭＣ２間の距離、ｃは音速、τ_ｉは遅延量を示している。またθ_Ｌは、マイクロホンＭＣ１、Ｍ２の位置を結んだ直線に対する垂直方向から目的方向への角度を示している。

ここで、死角がマイクロホンＭＣ１とマイクロホンＭＣ２の中心に対し、マイクロホンＭＣ１の方向に存在する場合、遅延器６１０は、マイクロホンＭＣ１の入力信号ｘ_１（ｔ）に対し遅延処理を行う。その後、減算器６２０が、（２）式に従い減算処理を行う。減算器６２０では、この減算処理は周波数領域でも同様に行うことができ、その場合（２）式は（３）式のように変更される。

ここでθ_Ｌ＝±π／２の場合、形成される指向性は図８（ａ）に示すように、カージオイド型の単一指向性となり、θ_Ｌ＝０，πの場合は、図８（ｂ）のような８の字型の双指向性となる。また、減算器６２０では、スペクトル減算法（ＳｐｅｃｔｒａｌＳｕｂｔｒａｃｔｉｏｎ）の処理（以下、単に「ＳＳ」とも呼ぶ）を用いることで、双指向性の死角に強い指向性を形成することもできる。ＳＳによる指向性は、（４）式に従い全周波数、もしくは指定した周波数帯域で形成される。（４）式では、マイクロホンＭＣ１の入力信号Ｘ_１を用いているが、マイクロホンＭＣ２の入力信号Ｘ_２でも同様の効果を得ることができる。ここで、ｎはフレーム番号、βはＳＳの強度を調節するための係数を示している。減算器６２０では、減算時に値がマイナスなった場合は、０または元の値を小さくした値に置き換えるフロアリング処理を行うようにしてもよい。この方式では、双指向性の特性によって目的方向以外に存在する音（以下、「非目的音」と呼ぶ）を抽出し、抽出した非目的音の振幅スペクトルを入力信号の振幅スペクトルから減算することで、目的音を強調することができる。

ところで、ある特定の目的エリア内に存在する目的エリア音だけを収音したい場合、減算型ＢＦを用いるだけでは、そのエリアと同一方向の線上に存在する音源（以下、「非目的エリア音」と呼ぶ）も収音してしまう。

そこで、指向性形成部１２３では、特許文献１で提案されているエリア収音処理（複数のマイクアレイを用い、それぞれ別々の方向から目的エリアへ指向性を向け、指向性を目的エリアで交差させることで目的エリア音を収音する処理）を行うものとして説明する。具体的には、指向性形成部１２３は、以下のような処理によりエリア収音処理を行うようにしてもよい。

指向性形成部１２３は、マイクアレイＭＡ１～ＭＡ３のそれぞれについて、三角形（マイクロホンＭＣ１～ＭＣ３により形成される三角形）の内側に向かってＢＦによって指向性を形成する。そして、指向性形成部１２３は、マイクアレイＭＡ１、ＭＡ２、ＭＡ３の各ＢＦ出力Ｙ_１（ｎ）、Ｙ_２（ｎ）、Ｙ_３（ｎ）を、目的エリア音抽出部１２４に供給する。

目的エリア音抽出部１２４は、指向性形成部１２３で形成したマイクアレイＭＡ１、ＭＡ２、ＭＡ３のＢＦ出力Ｙ_１（ｎ）、Ｙ_２（ｎ）、Ｙ_３（ｎ）を用いてエリア音を抽出する。上述の通り、各ＢＦ出力（Ｙ_１（ｎ）、Ｙ_２（ｎ）、Ｙ_３（ｎ））は、３角形（マイクロホンＭＣ１～ＭＣ３により形成される三角形）の各辺から中心（三角形の内側方向）に向かう指向性を成したものである。したがって、各ＢＦ出力は、そのいずれの２つの組み合せ（組み合わせのパターン）においても２つの指向性が３角形の中心付近で交差するため、目的エリア音抽出部１２４は、以下に記すエリア収音方法によって、互いの指向性が交差したエリアの音を抽出することが出来る。ここでは、代表として、マイクアレイＭＡ１のＢＦ出力Ｙ_１（ｎ）と、マイクアレイＭＡ２のＢＦ出力Ｙ_２（ｎ）を用いた場合について説明する。目的エリア音抽出部１２４は、Ｙ_１（ｎ）、Ｙ_２（ｎ）を（５）、もしくは（６）式に従いＳＳし、目的エリア方向に存在する非目的エリア音Ｎ_１－１（ｎ）、Ｎ_１－２（ｎ）を抽出する。ここでα_１、α_２は、目的エリアと各マイクアレイの距離の違いによって生じる信号レベルの差を補正する補正係数であり、所定の処理によって逐一計算されるべきものであり、その手法は特許文献１にも記載されているが、ここでは簡単のため、目的エリアと各マイクアレイまでの距離は同一（α_１（ｎ）＝α_２（ｎ）＝１）とし、（５）、（６）式を（７）、（８）式に代える。

その後、目的エリア音抽出部１２４は、（９）、（１０）式に従い、各ＢＦ出力から非目的エリア音をＳＳして目的エリア音を抽出する。ここで、γ_１（ｎ）、γ_２（ｎ）はＳＳ時の強度を変更するための係数である。

目的エリア音抽出部１２４において、強調音Ｚ_１－１（ｎ）、Ｚ_１－２（ｎ）のうちいずれを出力としても構わないが、ここではＺ_１－１（ｎ）をマイクアレイＭＡ１－マイクアレイＭＡ２の組み合せ（組み合わせのパターン）によるエリア収音出力Ｚ_１（ｎ）として用いることとする。

同様にして目的エリア音抽出部１２４は、マイクアレイＭＡ２－マイクアレイＭＡ３の組み合せによるエリア収音出力Ｚ_２（ｎ）、及びマイクアレイＭＡ３－マイクアレイＭＡ１の組み合せによるエリア収音出力Ｚ_３（ｎ）を抽出し、エリア音成分選択部１２５へ供給する。

以下では、マイクアレイＭＡ１－マイクアレイＭＡ２の組み合せによる収音エリア（上述の図５（ａ）のエリアＡ３０１に相当するエリア）をエリアＡ１、マイクアレイＭＡ２－マイクアレイＭＡ３の組み合せよる収音エリア（上述の図５（ｂ）のエリアＡ３０２に相当するエリア）をエリアＡ２、マイクアレイＭＡ３－マイクアレイＭＡ１の組み合せによる収音エリア（上述の図５（ｃ）のエリアＡ３０３に相当するエリア）をエリアＡ３と呼ぶものとする。

エリアＡ１、Ａ２、Ａ３は、それぞれ重複するエリアはあるものの、全体としては互いに異なるため、それぞれのエリア収音出力Ｚ_１（ｎ）、Ｚ_２（ｎ）、Ｚ_３（ｎ）は異なる周波数成分（特徴）を有する。エリア音成分選択部１２５では、各々のエリア収音出力の同一周波数成分同士を比較した結果に基づいて、最大振幅の成分を選択し、当該最大振幅成分を拡張された複数エリア収音の出力の成分として抽出する。

図９は、エリア音成分選択部１２５による処理を模式的に示した説明図（イメージ図）である。図９（ａ）、図９（ｂ）、図９（ｃ）は、それぞれＺ_１（ｎ）、Ｚ_２（ｎ）、Ｚ_３（ｎ）のエリア音成分（周波数ごとの強度）を棒グラフの形式で示した図である。そして、図９（ｄ）は、エリア収音出力Ｚ_１（ｎ）、Ｚ_２（ｎ）、Ｚ_３（ｎ）を統合した結果である最終出力Ｗ（ｎ）の成分（周波数ごとの強度）を棒グラフ形式で示した図である。

図９では、任意の周波数ｍにおけるエリア収音出力Ｚ_１（ｎ）の成分を「Ｃ１」（Ｃ１＝Ｚ_１（ｍ））、周波数ｍにおけるエリア収音出力Ｚ_２（ｎ）の成分を「Ｃ２」（Ｃ２＝Ｚ_２（ｍ））、周波数ｍにおけるエリア収音出力Ｚ_３（ｎ）の成分を「Ｃ３」（Ｃ３＝Ｚ_３（ｍ））、周波数ｍにおける最終出力Ｗ（ｎ）の成分を「ＣＷ」（ＣＷ＝Ｗ（ｍ））と図示している。

エリア音成分選択部１２５は、Ｃ１、Ｃ２、Ｃ３から最も強度の強い成分（最大振幅の成分）を選択して、ＣＷ（最終出力Ｗ（ｍ））に適用する。図９では、Ｃ１、Ｃ２、Ｃ３から最も強度の強い成分（最大振幅の成分）として、Ｃ２を選択し、ＣＷに適用している。エリア音成分選択部１２５は、全周波数（全成分）について同様の処理を行い、最終出力Ｗ（ｎ）を生成する。

以上のように、収音部１２０は、拡大されたエリアから収音された目的音声として最終出力Ｗ（ｎ）を出力する。このとき、収音部１２０は、Ｗ（ｎ）を周波数－時間変換した音声データとして出力するようにしてもよい。

そして、通信部１３０は、最終出力Ｗ（ｎ）に基づく音声データを、通信路Ｐを介して通信装置２００に送信する。

そして、通信装置２００の通信部２３０は、通信装置１００から受信した音声データ（Ｗ（ｎ）に基づく音声データ）を出力部１４０に供給する。出力部１４０は、受信した音声データに基づく音響信号をスピーカ２１０に供給して表音出力（第２のユーザＵ２に向けて表音出力）させる。

（Ａ－３）第１の実施形態の効果
第１の実施形態によれば、以下のような効果を奏することができる。

第１の実施形態の収音部１２０では、別々の方向からエリア収音を行い、従来の１組のマイクアレイを用いたエリア収音よりも広く、等方向性をもった収音エリアを形成することができる。第１の実施形態の収音部１２０では、複数のエリア収音出力の周波数成分において、同一周波数成分に対して１つのエリア収音出力のみが選択されて出力されるため、エリア拡大においても収音特性の均一性が保たれる。これにより、収音部１２０では、ハンドセット１１０の送話口１１３に付けられたマイクロホンＭＣ１～ＭＣ３を用いたエリア収音を行う際に、話者（第１のユーザＵ１）の口元と送話口１１３との相対的な位置がずれた場合等でも安定した音声収音が可能となる。

（Ｂ）第２の実施形態
以下、本発明による収音装置、プログラム及び方法の第２の実施形態を、図面を参照しながら詳述する。この実施形態では、本発明の収音装置、プログラム及び方法を収音部に適用した例について説明する。

第２の実施形態の収音部（収音装置）は、複数のエリア収音のエリア収音出力のパワーを算出し、最大パワーのエリア収音出力を拡張されたエリアの出力と見做して選択・代表させる点で第１の実施形態と異なっている。すなわち、第２の実施形態の収音部（収音装置）では、第１の実施形態と異なり、周波数成分毎の最大値検出は行なわず、最大パワーのエリアを選択する。

（Ｂ－１）第２の実施形態の構成
図１０は、第２の実施形態に関連する各装置の構成について示したブロック図である。

第２の実施形態では、通信装置１００が通信装置１００Ａに置き換わっている点で第１の実施形態と異なっている。

また、第２の実施形態の通信装置１００Ａでは、収音部１２０が、収音部１２０Ａに置き換わっている点で第１の実施形態と異なっている。さらに、第２の実施形態の収音部１２０Ａでは、目的エリア音抽出部１２４及びエリア音成分選択部１２５が除外され、エリア選択部１２６が追加されている点で第１の実施形態とことなっている。

（Ｂ－２）第２の実施形態の動作
次に、以上のような構成を有する第１の実施形態の動作（実施形態に係る収音方法）を説明する。

以下では、通信装置１００Ａを構成する収音部１２０Ａ内部の動作について第１の実施形態との差異を説明する。

収音部１２０Ａにおいて、マイクアレイ部１１１から、目的エリア音抽出部１２４までの処理は、第１の実施形態と同様の処理である。第２の実施形態においては、第１の実施形態における「複数のエリア音の同一周波数成分同士の大きさの比較」に代えて、複数のエリア収音出力のパワーを計算、最も大きなパワーを有するエリア収音出力を拡張されたエリアの出力と見做して選択・代表させる。

エリア選択部１２６では、エリア音抽出部で抽出されたエリア収音出力Ｚ_１（ｎ）、Ｚ_２（ｎ）、Ｚ_３（ｎ）のそれぞれのパワー（例えば、各周波数成分の加算値や、各周波数成分の平均値）を算出し、３つの出力のうち最もパワーが大きかった出力を、最終出力Ｗ（ｎ）として取得する。

Ｗ（ｎ）は、時間変換された後、通信路を介して通信装置２００（スピーカ２１０）より出力される。

（Ｂ－３）第２の実施形態の効果
第２の実施形態によれば、第１の実施形態と比較して、以下のような効果を奏することができる。

第２の実施形態の収音部１２０Ａでは、当該複数のエリア収音出力の中から、最もパワーの大きいエリア収音出力（すなわち最も目的音を多く含むエリアのエリア収音出力）が選択されて出力されるため、近似的に収音エリアの拡大が図れるとともに、１つのエリア音（エリア収音出力）のみを選択・出力しているため収音特性の均一性が保たれる。

（Ｃ）第３の実施形態
以下、本発明による収音装置、プログラム及び方法の第２の実施形態を、図面を参照しながら詳述する。この実施形態では、本発明の収音装置、プログラム及び方法を収音部に適用した例について説明する。

第３の実施形態の収音部（収音装置）では、複数のエリアに対してエリア毎に目的エリア音の有無を判定し、目的音が存在すると判定されたエリア収音出力に対してのみ、周波数成分の最大値選択処理（例えば、第１の実施形態におけるエリア音成分選択部１２５の処理）の対象とする点で第１の実施形態と異なっている。

（Ｃ－１）第３の実施形態の構成
図１１は、第３の実施形態に関連する各装置の構成について示したブロック図である。

第３の実施形態では、通信装置１００が通信装置１００Ｂに置き換わっている点で第１の実施形態と異なっている。また、第３の実施形態では、収音部１２０が収音部１２０Ｂに置き換わっている点で第１の実施形態と異なっている。

第３の実施形態の収音部１２０Ｂでは、エリア音成分選択部１２５がエリア音成分選択部１２５Ｂに置き換えられ、エリア音判定部１２８及び振幅スペクトル比算出部１２９が追加されている点で、第１の実施形態と異なっている。

第１の実施形態の収音部１２０では、複数の収音エリアについてエリア収音出力を取得し、取得した全てのエリア収音出力を統合して収音エリアの拡大を図っているが、取得したエリア収音出力すべてに目的音成分が含まれているとは限らない。第１の実施形態の収音部１２０では、複数の収音エリアのエリア収音出力を得られるが、その複数のエリア収音出力の中には、目的音成分を含まないものも存在し得る。

従って、第１の実施形態の収音部１２０のように、目的音成分を含まないエリア収音出力の周波数成分も、目的音を含むエリア収音出力と同列に最大成分検出の対象とすることは得策でない場合がある。例えば、第１の実施形態の収音部１２０において、目的音を含まないエリア収音出力が選択に加わる場合、かえって雑音性分の増加を助長する可能性がある。そこで、第３の実施形態の収音部１２０Ｂでは、エリア音判定部１２８が、それぞれのエリア収音出力（この実施形態では、Ｚ_１（ｎ）、Ｚ_２（ｎ）、Ｚ_３（ｎ））について、目的エリア音が存在しているか否かを判定する。そして、第３の実施形態の収音部１２０Ｂでは、エリア音判定部１２８の判定により目的エリア音が存在していると判定されたエリア収音出力のみを、エリア音成分選択部１２５Ｂによる成分の最大値選択の対象とするものとする。

（Ｃ－２）第３の実施形態の動作
次に、以上のような構成を有する第３の実施形態の動作（実施形態に係る収音方法）を説明する。

以下では、通信装置１００Ｂを構成する収音部１２０Ｂ内部の動作について第１の実施形態との差異を説明する。

収音部１２０Ｂにおいて、マイクアレイ部１１１から、目的エリア音抽出部１２４までの処理は、第１の実施形態と同様の処理である。

エリア音判定部１２８は、目的エリア音抽出部１２４が得たエリア収音出力Ｚ_１（ｎ）、Ｚ_２（ｎ）、Ｚ_３（ｎ）のそれぞれに対して目的エリア音の存在の有無を判定する。

エリア音判定部１２８が、各エリア収音出力について目的エリア音の存在の有無を判定する方法は限定されないものであり、例えば、エリア収音出力と入力音との振幅スペクトル比を用いて判定する方法や、エリア収音を行なう際のＢＦ出力間のコヒーレンスを用いて判定する方法等がある。この実施形態の例では、エリア音判定部１２８は、各エリア収音出力の振幅スペクトル比に基づいて、目的エリア音の存在の有無を判定するものとして説明する。エリア音判定部１２８において、エリア収音出力の振幅スペクトル比に基づいて目的エリア音の存在の有無を判定する具体的処理としては、例えば、参考文献１（特開２０１６－１２７４５７）に記載された処理を適用することができる。

振幅スペクトル比算出部１２９は、周波数変換部１２２からは周波数変換された入力信号Ｘ_１、Ｘ_２、Ｘ_３を、目的エリア音抽出部１２４からはエリア収音出力Ｚ_１、Ｚ_２、Ｚ_３を取得して、振幅スペクトル比の算出を行う。例えば、振幅スペクトル比算出部１２９は、下記（１１）、（１２）（１３）式を用いて、エリア収音出力Ｚ_１、Ｚ_２、Ｚ_３と入力信号Ｘ_１、Ｘ_２、Ｘ_３の振幅スペクトル比を周波数ごとに算出する。そして、振幅スペクトル比算出部１２９は、下記（１４）、（１５）（１６）式を用いて、全周波数の振幅スペクトル比を加算して、振幅スペクトル比加算値Ｕ_１、Ｕ_２、Ｕ_３を求める。ここでエリア収音出力Ｚ_１、Ｚ_２、Ｚ_３は、それぞれ（マイクアレイＭＡ１－マイクアレイＭＡ２）、（マイクアレイＭＡ２－マイクアレイＭＡ３）、（マイクアレイＭＡ３－マイクアレイＭＡ１）の組み合せによって得られたエリア収音出力であることから、（１１）、（１２）（１３）式では、それぞれのマイクアレイの共通マイクロホンＭＣ２、ＭＣ３、ＭＣ１の振幅スペクトルに対応するＸ_２、Ｘ_３、Ｘ_１が用いられる。

なお、（１４）式を用いて行われる処理において得られるＵ_１は、各周波数の振幅スペクトル比Ｒ_１ｉを周波数の下限ｊから上限ｋでの帯域で足し合わせた振幅スペクトル比加算値である。また、（１５）式を用いて行われる処理において得られるＵ_２は、各周波数の振幅スペクトル比Ｒ_２ｉを、周波数の下限ｊから上限ｋでの帯域で足し合わせた振幅スペクトル比加算値である。さらに、（１６）式を用いて行われる処理において得られるＵ_３は、各周波数の振幅スペクトル比Ｒ_３ｉを、周波数の下限ｊから上限ｋでの帯域で足し合わせた振幅スペクトル比加算値である。ここで、振幅スペクトル比算出部１２９において演算対象とする周波数の帯域を制限しても良い。例えば、振幅スペクトル比算出部１２９は、演算対象を音声情報が十分に含まれる１００Ｈｚから６ｋＨｚに制限して、上記演算を行うようにしても良い。

エリア音判定部１２８は、振幅スペクトル比算出部１２９により算出した振幅スペクトル比加算値を予め設定した閾値と比較し、エリア音が存在するかしないかを判定する。エリア音判定部１２８は、目的エリア音が存在すると判定したエリア収音出力はそのまま出力するが、目的エリア音が存在しないと判定されたエリア収音出力は出力せずに無音データ（例えば、予め設定されたダミーデータ）に置き換えて出力する。なお、エリア音判定部１２８は、無音データの代わりに、入力信号（エリア収音に用いたマイクアレイを構成するいずれかのマイクロホンの入力信号）のゲインを弱めたものを出力しても良い。さらに、エリア音判定部１２８は、振幅スペクトル比加算値が閾値よりも一定以上大きい場合、その後の数秒間は、振幅スペクトル比加算値に関わらず目的エリア音が存在すると判定する処理（ハングオーバー機能に対応する処理）を追加するようにしてもよい。

エリア音成分選択部１２５Ｂでは、エリア音判定部１２８から送られた各々のエリア収音出力の同一周波数成分同士を比較し、最大振幅の成分を選択、当該最大振幅成分を拡張された複数エリア収音の出力の成分として抽出する。エリア音判定部１２８で目的エリア音が存在しないと判定されたエリア収音出力は、ゼロもしくは大幅にゲインが弱められるため、エリア音成分選択部１２５Ｂで選択されることはほぼない。

図１２は、エリア音成分選択部１２５Ｂによる処理を模式的に示した説明図（イメージ図）である。図１２（ａ）、図１２（ｂ）、図１２（ｃ）は、それぞれＺ_１（ｎ）、Ｚ_２（ｎ）、Ｚ_３（ｎ）のエリア音成分（周波数ごとの強度）を棒グラフの形式で示した図である。そして、図１２（ｄ）は、最終出力Ｗ（ｎ）の成分（周波数ごとの強度）を棒グラフ形式で示した図である。

図１２の例では、エリア音判定部１２８が、エリア収音出力Ｚ_１（ｎ）、Ｚ_２（ｎ）については目的エリア音が含まれていると判定し、エリア収音出力Ｚ_３（ｎ）については目的エリア音が含まれていないと判断した例について示している。したがって、図１２の例では、エリア音成分選択部１２５Ｂにより生成されるエリア収音出力Ｗ（ｎ）には、エリア収音出力Ｚ_１（ｎ）、Ｚ_２（ｎ）から選択された成分（周波数ごとに、最も強度の強い成分）のみが含まれる結果となる。

以上のように、収音部１２０Ｂは、拡大されたエリアから収音された目的音声として最終出力Ｗ（ｎ）を出力する。そして、この最終出力Ｗ（ｎ）は、時間変換された後、通信路Ｐを介して通信装置２００（スピーカ２１０）より出力される。

（Ｃ－３）第３の実施形態の効果
第３の実施形態によれば、第１の実施形態と比較して、以下のような効果を奏することができる。

第３の実施形態の収音部１２０Ｂでは、複数の収音エリア毎に目的音の存在有無を判定し、目的音が存在しないエリアの周波数成分に対しては、ゼロ化もしくはゲインの縮小を行なっている。これにより、第３の実施形態の収音部１２０Ｂでは、複数のエリアから収音しても不要なミュージカルノイズなどの混入が避けられ、拡大されやエリアにおいても均一かつ高品質なエリア収音結果が得られる。

（Ｄ）他の実施形態
本発明は、上記の実施形態に限定されるものではなく、以下に例示するような変形実施形態も挙げることができる。

（Ｄ－１）上記の各実施形態では、収音部１２０、１２０Ａ、１２０Ｂは通信装置１００の一部を構成するものとして説明したが、独立した装置として構成するようにしてもよい。また、上記の各実施形態では、収音部１２０、１２０Ａ、１２０Ｂにマイクアレイ部１は含まない構成として説明したが、収音部１２０、１２０Ａ、１２０Ｂとマイクアレイ部１を一体とした装置として構成するようにしてもよい。

（Ｄ－２）上記の各実施形態では、本発明の収音装置（収音部１２０、１２０Ａ、１２０Ｂ）をハンドセット等の手持ち型の送話器（送受話器）を備える装置等に適用する例について説明したが、本発明の収音装置は、ヘッドセットやウェアラブルデバイス（例えば、マイクロホン付きのヘッドマウントディスプレイ、マイクロホン付きのネックバンド型ヘッドホン等）に適用し、第１のユーザＵ１による装着時に第１のユーザＵ１の口元が位置する領域を目的エリアとし、その周囲（送話口）の多角形（Ｎ角形）の各頂点にマイクロホンを設置し、上記の実施形態と同様にエリア収音処理するようにしてもよい。

（Ｄ－３）上記の実施形態では、３個のマイクロホンＭＣ１～ＭＣ３を用いたエリア収音の例について示したが、マイクアレイ部１１１に設置するマイクロホンの数（マイクロホンを配置する多角形の辺（角）の数）は限定されないものでる。例えば、３方向あるいは４方向からエリア収音を行なってもマイクロホンの数の増加は僅かであり、結果的に処理量の増加も限定的である。具体的には、例えば、上記の実施形態において、４つのマイクロホンを四角形の角頂点に配置した場合、４エリアのエリア収音を行なっているにも係らず、マイク数は従来のエリア収音の最小構成である２マイクアレイ×２と同じ４つのマイクロホンで実現できるため、簡素な構成で処理量も少なくハンドセット１１０という限られたスペースの機器にも容易に実装できる。

以上のように、マイクアレイ部１１１に設置するマイクロホンの数（マイクロホンの位置により形成される多角形の角数）が増せば、指向性の方向（ＢＦ出力の指向性の方向）が多様化し、発話者（第１のユーザＵ１）の口元の変動（ハンドセット１１０の送話口１１３と第１のユーザＵ１の口元との相対的な位置の変動）に対して安定性がさらに向上する。

図１３は、マイクアレイ部１１１のマイクロホンの数を４つとした場合の構成について示した説明図である。

図１３では、４つのマイクロホンＭＣ１～ＭＣ４が四角形（正方形）の角頂点の位置に配置されている。４つのマイクロホンＭＣ１～ＭＣ４は互いに隣り合うマイクロホン同士と組み合わされて、マイクロホンＭＣ１、ＭＣ２の対により形成されるマイクアレイＭＡ７０１と、マイクロホンＭＣ２、ＭＣ３の対により形成されるマイクアレイＭＡ７０２と、マイクロホンＭＣ３、ＭＣ４の対により形成されるマイクアレイＭＡ７０３と、マイクロホンＭＣ４、ＭＣ１の対により形成されるマイクアレイＭＡ７０４の４つが形成される。さらにこれらのマイクロアレイは隣り合うマイクアレイとの組み合わせ（一部のマイクロホンを共有するマイクアレイの組み合わせ）により４つのエリア収音が可能となる。例えば、マイクアレイ部１１１に、４つのマイクロホンＭＣ１～ＭＣ４の構成を適用した場合、収音部１２０では、マイクアレイＭＡ７０１、ＭＡ７０２の組み合わせによるエリア収音と、マイクアレイＭＡ７０２、ＭＡ７０３の組み合わせによるエリア収音と、マイクアレイＭＡ７０３、ＭＡ７０４の組み合わせによるエリア収音と、マイクアレイＭＡ７０４、ＭＡ７０１の組み合わせによるエリア収音の各出力（４つのエリア収音の出力）を取得することができる。そして、収音部１２０では、上述の４つのエリア収音の出力に基づいた収音結果（例えば、４つのエリア収音出力を第１～第３の実施形態のいずれかの処理で統合した結果）を取得することができる。

１００…通信装置、１１０…ハンドセット、１１１…マイクアレイ部、ＭＣ１、ＭＣ２、ＭＣ３…マイクロホン、１１２…スピーカ、１１３…送話口、１１４…受話口、１１５…把手部、１２０…収音部、１２１…信号入力部、１２２…周波数変換部、１２３…指向性形成部、１２４…目的エリア音抽出部、１２５…エリア音選択部、１３０…通信部、１４０…出力部、２００…通信装置、２１０…スピーカ、２２０…マイク、２３０…通信部、２４０…出力部、２５０…収音部、Ｕ１…第１のユーザ、Ｕ１ａ…聴者の手、Ｕ２…第２のユーザ、Ｐ…通信路。

Claims

３以上の異なる指向性のマイクアレイを形成可能なマイクアレイ部からの入力信号に基づいて、２パターン以上の前記マイクアレイの組み合わせに基づくエリア収音出力を取得する第１のエリア収音手段と、
前記第１のエリア収音手段が取得した各パターンのエリア収音出力を統合した結果をエリア収音結果として出力する第２のエリア収音手段とを有し、
前記第２のエリア収音手段は、前記第１のエリア収音手段が取得した各パターンのエリア収音出力を周波数毎に互いに比較し、周波数毎に最も強度の強い成分を選択した結果をエリア収音結果として出力する
ことを特徴とする収音装置。
前記第２のエリア収音手段は、前記第１のエリア収音手段が取得した各パターンのエリア収音出力について目的エリア音の有無の判定処理を行い、前記判定処理の結果目的エリア音を含むと判定されたエリア収音出力のみに基づきエリア収音結果を得ることを特徴とする請求項１に記載の収音装置。
前記マイクアレイ部は、Ｎ角形（Ｎは３以上の整数）の角頂点の位置に配置されたＮ個のマイクロホンを備えることを特徴とする請求項１又は２に記載の収音装置。
それぞれの前記マイクアレイの指向性は、前記Ｎ角形の内側方向にむけられていることを特徴とする請求項３に記載の収音装置。
前記第１のエリア収音手段は、それぞれのパターンの前記マイクアレイの組み合わせについて、
それぞれの前記マイクアレイから入力されたそれぞれの入力信号について前記Ｎ角形の内側方向にビームフォーマにより指向性を形成する指向性形成処理と、
それぞれの前記マイクアレイのビームフォーマ出力をスペクトル減算することで目的エリア方向に存在する非目的エリア音を抽出する非目的エリア音抽出処理と、
それぞれの前記マイクアレイのビームフォーマ出力から前記非目的エリア音をスペクトル減算することにより、エリア収音出力を取得するエリア収音処理と
を行うことを特徴とする請求項４に記載の収音装置。
コンピュータを、
３以上の異なる指向性のマイクアレイを形成可能なマイクアレイ部からの入力信号に基づいて、２パターン以上の前記マイクアレイの組み合わせに基づくエリア収音出力を取得する第１のエリア収音手段と、
前記第１のエリア収音手段が取得した各パターンのエリア収音出力を統合した結果をエリア収音結果として出力する第２のエリア収音手段として機能させ、
前記第２のエリア収音手段は、前記第１のエリア収音手段が取得した各パターンのエリア収音出力を周波数毎に互いに比較し、周波数毎に最も強度の強い成分を選択した結果をエリア収音結果として出力する
ことを特徴とする収音プログラム。
収音装置が行う収音方法において、
第１のエリア収音手段、及び第２のエリア収音手段を備え、
前記第１のエリア収音手段は、３以上の異なる指向性のマイクアレイを形成可能なマイクアレイ部からの入力信号に基づいて、２パターン以上の前記マイクアレイの組み合わせに基づくエリア収音出力を取得し、
前記第２のエリア収音手段は、前記第１のエリア収音手段が取得した各パターンのエリア収音出力を統合した結果をエリア収音結果として出力し、
前記第２のエリア収音手段は、前記第１のエリア収音手段が取得した各パターンのエリア収音出力を周波数毎に互いに比較し、周波数毎に最も強度の強い成分を選択した結果をエリア収音結果として出力する
ことを特徴とする収音方法。