JP4894353B2

JP4894353B2 - 放収音装置

Info

Publication number: JP4894353B2
Application number: JP2006147228A
Authority: JP
Inventors: 利晃石橋; 田中　　良; 訓史鵜飼
Original assignee: Yamaha Corp
Current assignee: Yamaha Corp
Priority date: 2006-05-26
Filing date: 2006-05-26
Publication date: 2012-03-14
Anticipated expiration: 2026-05-26
Also published as: CA2653598A1; WO2007138985A1; US20090180633A1; EP2040485A4; CN101455094B; JP2007318550A; EP2040485A1; CN101455094A; US8300839B2

Description

この発明は、ネットワーク等を介して複数の地点間で行う音声会議等に用いる放収音装置、特にマイクとスピーカとが比較的近い位置に配置された放収音装置に関するものである。

従来、遠隔地間で音声会議を行う方法として、音声会議を行う地点毎に放収音装置を設置して、これら装置をネットワークで接続し、音声信号を通信する方法が多く用いられている。そして、放収音装置では、相手装置側の音声を放音するスピーカと、自装置側の音声を収音するマイクロホンとが１つの筐体に同時に設置されたものが多い。

例えば、特許文献１の音声会議装置（放収音装置）は、ネットワークを介して入力される音声信号を天面に配置されたスピーカから放音し、側面に配置された異なる複数方向をそれぞれの正面方向とする各マイク音声信号を収音し、ネットワークを介して収音信号を外部に送信する。
特開平８−２９８６９６号公報

しかしながら、特許文献１の装置では、マイクとスピーカとが近接することで、各マイクの収音信号にスピーカからの回り込み音声が多く含まれる。そして、この回り込み音声の音量が比較的大きく、発話者からの発声音の音量が相対的に小さい場合には、発話者方位を正確に検出して、当該方位からの収音を正確に行うことができない。

したがって、この発明の目的は、回り込み音声に影響されずに発話者方位を検出し、当該発話者からの音声を確実に収音・出力することができる放収音装置を提供することにある。

この発明の放収音装置は、所定基準面に対して対称となる音圧で入力音声信号を放音するスピーカを備えた放音手段と、所定基準面の一方側の音声を収音する第１マイク群および他方側の音声を収音する第２マイク群とからなる収音手段と、第１マイク群の収音信号に遅延・振幅処理を行うことで得られる第１収音ビーム信号群の各収音ビーム信号と、第２マイク群の収音信号に遅延・振幅処理を行うことで得られる第２収音ビーム信号群の各収音ビーム信号とを所定基準面に対して対称に生成する収音ビーム信号生成手段と、各タイミングで基準面に対称な収音ビーム信号同士のエネルギー比を算出して、当該エネルギー比が所定の基準レベル範囲内にない収音ビーム信号の組合せを検出し、エネルギー比が基準レベル範囲よりも高いか低いかにより、組合せを構成する二本の収音ビーム信号から一本の収音ビーム信号を選択する収音ビーム信号選択手段と、を備えたことを特徴としている。

この構成では、収音ビーム信号選択手段は、基準面に対して対称位置にある収音ビーム信号同士のエネルギー比を算出する。ここで、基準面に対して発話者側にあり且つ発話者方位に対応する収音ビーム信号の信号エネルギーは高くなり、これに対称な収音ビーム信号のエネルギーは殆ど変化しない。従って、この組合せによるエネルギー比は変化する。また、発話者方位に対応しない収音ビーム信号の信号エネルギーは殆ど変化しないので、他の組合せによるエネルギー比は変化しない。これにより、発声音の到来方位に対応する収音ビーム信号を含む組合せのエネルギー比のみが高くなる。収音ビーム信号選択手段は、組合せのエネルギー比の平均値を基準にして所定閾値を予め設定しておき、当該閾値を超える信号エネルギー比の絶対値レベルを有する収音ビーム信号の組合せが検出されれば、当該組合せを選択する。そして、収音ビーム信号選択手段は、検出された組合せの信号エネルギーが、平均値よりも高いか低いかによりいずれか一方の収音ビーム信号を選択する。すなわち、エネルギー比の算出時に、基準側とした収音ビーム信号の信号エネルギーが大きければエネルギー比が小さくなる方向に変化し、基準側とした収音ビーム信号の信号エネルギーが小さければエネルギー比が大きくなる方向に変化することを利用して、収音ビーム信号を選択する。

また、この発明の放収音装置は、所定基準面に対して対称となる音圧で入力音声信号を放音するスピーカを備えた放音手段と、所定基準面の一方側に対してそれぞれ異なる方位に指向性を有する複数のマイクを備え、各マイクからの出力信号を収音ビーム信号とする第１マイク群、および他方側に対してそれぞれ異なる方位に指向性を有する複数のマイクを備え、各マイクからの出力信号を収音ビーム信号とする第２マイク群を備え、第１マイク群で得られる収音ビーム信号と第２マイク群で得られる収音ビーム信号とが基準面に対して対称に設定された収音手段と、各タイミングで基準面に対称な収音ビーム信号同士のエネルギー比を算出して、当該エネルギー比が所定の基準レベル範囲内にない収音ビーム信号の組合せを検出し、エネルギー比が前記基準レベル範囲よりも高いか低いかにより、組合せを構成する二本の収音ビーム信号から一本の収音ビーム信号を選択する収音ビーム信号選択手段と、を備えたことを特徴としている。

この構成では、収音ビーム信号を用いることなく、各マイクに指向性を持たせることで、マイク出力から直接に収音ビーム信号を生成する。この際、第１マイク群のマイクの指向性で形成される収音ビーム群と第２マイク群のマイクの指向性で形成される収音ビーム群とを、基準面に対して対称に設定する。これにより、前述のように収音ビーム信号選択手段により収音ビームが選択される。

また、この発明の放収音装置は、収音ビーム信号選択手段で、エネルギー比をデシベル単位に換算して、該デシベル単位に換算された値に基づいて収音ビーム信号を選択することを特徴としている。

この構成では、デシベル単位を利用することで、わずかな信号エネルギー比の変化でも、顕著に表される。これにより、信号エネルギー比による収音ビーム信号および対称位置にある収音ビーム信号の組合せの検出が、より正確に行われる。

この発明によれば、回り込み音声のレベルに影響されることなく、発話者等の音源方位を正確に検出して、当該方位からの音声を確実に収音して出力することができる。

本発明の第１の実施形態に係る放収音装置について図を参照して説明する。
図１（Ａ）は本実施形態に係る放収音装置１のマイク、スピーカ配置を示す平面図であり、図１（Ｂ）は図１（Ａ）に示す放収音装置１により形成される収音ビーム領域を示す図である。
図２は本実施形態の放収音装置１の機能ブロック図である。

本実施形態の放収音装置１は、筐体１０１に、複数のスピーカＳＰ１〜ＳＰ３、複数のマイクＭＩＣ１１〜ＭＩＣ１７，ＭＩＣ２１〜ＭＩＣ２７、図２に示す機能部を備えて成る。

筐体１０１は一方向に長尺な略直方体形状からなり、筐体１０１の長尺な辺（面）の両端部には、筐体１０１の下面を設置面から所定間隔離間する所定高さの脚部（図示せず）が設置されている。なお、以下の説明では、筐体１０１の四側面のうち、長尺な面を長尺面、短尺な面を短尺面と称する。

筐体１０１の下面には、同形状からなる無指向性の単体スピーカＳＰ１〜ＳＰ３が設置されている。これら単体スピーカＳＰ１〜ＳＰ３は長尺方向に沿って一定の間隔で直線状に設置されており、且つ、各単体スピーカＳＰ１〜ＳＰ３の中心を結ぶ直線は、筐体１０１の長尺面に沿い、短尺面の中心間を結ぶ中心軸１００に対して水平方向位置が一致するように設置されている。すなわち、中心軸１００を含む垂直な基準面にスピーカＳＰ１〜ＳＰ３の中心を結ぶ直線が配置される。このように、単体スピーカＳＰ１〜ＳＰ３を配列設置することでスピーカアレイＳＰＡ１０が構成される。このような状態では、スピーカアレイＳＰＡ１０の各単体スピーカＳＰ１〜ＳＰ３から音声を放音すると、放音音声は二つの長尺面に同等に伝わる。この際、二つの対向する長尺面に伝搬する放音音声は、前記基準面に対して直交する互いに対称な方向へ進行する。

筐体１０１の一方の長尺面には、同スペックのマイクＭＩＣ１１〜ＭＩＣ１７が設置されている。これらマイクＭＩＣ１１〜ＭＩＣ１７は長尺方向に沿って一定の間隔で直線状に設置されており、これによりマイクアレイＭＡ１０が構成される。また、筐体１０１の他方の長尺面にも、同スペックのマイクＭＩＣ２１〜ＭＩＣ２７が設置されている。これらマイクＭＩＣ２１〜ＭＩＣ２７も長尺方向に沿って一定の間隔で直線状に設置されており、これにより、マイクアレイＭＡ２０が構成される。マイクアレイＭＡ１０とマイクアレイＭＡ２０とはその配列軸の垂直位置が一致するように配置されており、さらに、マイクアレイＭＡ１０の各マイクＭＩＣ１１〜ＭＩＣ１７と、マイクアレイＭＡ２０の各マイクＭＩＣ２１〜ＭＩＣ２７とは、それぞれ前記基準面に対して対称な位置に配置されている。具体的に、例えば、マイクＭＩＣ１１とマイクＭＩＣ２１とが基準面に対して対称の関係にあり、同様にマイクＭＩＣ１７とマイクＭＩＣ２７とが対称の関係にある。

なお、本実施形態では、スピーカアレイＳＰＡ１０のスピーカ数を３本とし、各マイクアレイＭＡ１０，ＭＡ２０のマイク数をそれぞれ７本としたが、これに限ることなく、仕様に応じてスピーカ数およびマイク数は適宜設定すればよい。また、スピーカアレイの各スピーカ間隔およびマイクアレイの各マイク間隔は一定ではなくてもよく、例えば、長尺方向に沿って中央部で密に配置され、両端部に向かうに従って疎に配置されるような態様でもよい。

次に、図２に示すように、本実施形態の放収音装置１は、機能的に、入出力コネクタ１１、入出力Ｉ／Ｆ１２、放音指向性制御部１３、Ｄ／Ａコンバータ１４、放音用アンプ１５、前述のスピーカアレイＳＰＡ１０（スピーカＳＰ１〜ＳＰ３）、前述のマイクアレイＭＡ１０，ＭＡ２０（マイクＭＩＣ１１〜ＭＩＣ１７，ＭＩＣ２１〜ＭＩＣ２７）、収音用アンプ１６、Ａ／Ｄコンバータ１７、収音ビーム生成部１８１，１８２、収音ビーム選択部１９、および、エコーキャンセル部２０を備える。

入出力Ｉ／Ｆ１２は、入出力コネクタ１１を介して入力された、他の放収音装置からの入力音声信号をネットワークに対応するデータ形式（プロトコル）から変換して、エコーキャンセル部２０を介して放音指向性制御部１３に与える。また、入出力Ｉ／Ｆ１２は、エコーキャンセル部２０で生成される出力音声信号をネットワークに対応するデータ形式（プロトコル）に変換して、入出力コネクタ１１を介して、ネットワークに送信する。

放音指向性制御部１３は、放音指向性が設定されていなければ、スピーカアレイＳＰＡ１０の各スピーカＳＰ１〜ＳＰ３へ、入力音声信号に基づく放音信号を同時に与える。また、放音指向性制御部１３は、仮想点音源の設定等の放音指向性が指定されると、指定された放音指向性に基づいて、スピーカアレイＳＰＡ１０の各スピーカＳＰ１〜ＳＰ３にそれぞれ固有の遅延処理及び振幅処理等を入力音声信号に対して行うことで個別放音信号を生成する。放音指向性制御部１３は、これら個別放音信号をスピーカＳＰ１〜ＳＰ３毎に設置されたＤ／Ａコンバータ１４に出力する。各Ｄ／Ａコンバータ１４は個別放音信号をアナログ形式に変換して各放音用アンプ１５に出力し、各放音用アンプ１５は個別放音信号を増幅してスピーカＳＰ１〜ＳＰ３に与える。

スピーカＳＰ１〜ＳＰ３は、与えられた放音信号および個別放音信号を音声変換して外部に放音する。スピーカＳＰ１〜ＳＰ３は筐体１０１の下面に設置されているので、放音された音声は、放収音装置１が設置される机の設置面を反射して、会議者のいる装置の横から斜め上方に向かって伝搬される。また、放音音声の一部は、放収音装置１の底面からマイクアレイＭＡ１０，ＭＡ２０が設置された側面へ回り込む。

マイクアレイＭＡ１０，ＭＡ２０の各マイクＭＩＣ１１〜ＭＩＣ１７、ＭＩＣ２１〜ＭＩＣ２７は、無指向性であっても有指向性であってもよいが、有指向性であることが望ましく、放収音装置１の外部からの音声を収音して電気変換し、収音信号を各収音用アンプ１６に出力する。

この際、このようなスピーカアレイＳＰＡ１０の構成およびマイクアレイＭＡ１０，ＭＡ２０の構成から、基準面に対して対称位置にあるマイクアレイＭＡ１０のマイクＭＩＣ１ｎ（ｎ＝１〜７）と、マイクアレイＭＡ２０のマイクＭＩＣ２ｎ（ｎ＝１〜７）とで、スピーカアレイＳＰＡ１０の単体スピーカＳＰ１〜ＳＰ３からの回り込み音声が、同等に収音される。

各収音用アンプ１６は、収音信号を増幅してそれぞれＡ／Ｄコンバータ１７に与え、Ａ／Ｄコンバータ１７は、収音信号をデジタル変換して収音ビーム生成部１８１，１８２に出力する。収音ビーム生成部１８１には、一方の長尺面に設置されたマイクアレイＭＡ１０の各マイクＭＩＣ１１〜ＭＩＣ１７での収音信号が入力され、収音ビーム生成部１８２には、他方の長尺面に設置されたマイクアレイＭＡ２０のマイクＭＩＣ２１〜ＭＩＣ２７での収音信号が入力される。

収音ビーム生成部１８１は、各マイクＭＩＣ１１〜ＭＩＣ１７の収音信号に対して所定の遅延処理等を行い、収音ビーム信号ＭＢ１１〜ＭＢ１４を生成する。収音ビーム信号ＭＢ１１〜ＭＢ１４は、図１（Ｂ）に示すように、マイクＭＩＣ１１〜ＭＩＣ１７が設置された長尺面側で当該長尺面に沿ってそれぞれに異なる所定幅の領域が収音ビーム領域に設定されている。

収音ビーム生成部１８２は、各マイクＭＩＣ２１〜ＭＩＣ２７の収音信号に対して所定の遅延処理等を行い、収音ビーム信号ＭＢ２１〜ＭＢ２４を生成する。収音ビーム信号ＭＢ２１〜ＭＢ２４は、図１（Ｂ）に示すように、マイクＭＩＣ２１〜ＭＩＣ２７が設置された長尺面側で当該長尺面に沿ってそれぞれに異なる所定幅の領域が収音ビーム領域に設定されている。

この際、収音ビーム信号ＭＢ１１と収音ビーム信号ＭＢ２１とは、前記中心軸１００を有する垂直面（基準面）に対して対称なビームとして形成される。同様に、収音ビーム信号ＭＢ１２と収音ビーム信号ＭＢ２２、収音ビーム信号ＭＢ１３と収音ビーム信号ＭＢ２３、収音ビーム信号ＭＢ１４と収音ビーム信号ＭＢ２４も、前記基準面に対して対称なビームとして形成される。

収音ビーム選択部１９は、入力された収音ビーム信号ＭＢ１１〜ＭＢ１４、ＭＢ２１〜ＭＢ２４から話者音声を主に収音した収音ビーム信号を選択して、収音ビーム信号ＭＢとしてエコーキャンセル部２０に出力する。

図３は、収音ビーム選択部１９の主要構成を示すブロック図である。
収音ビーム選択部１９は、ＢＰＦ（バンドパスフィルタ）１９１、全波整流回路１９２、レベル検出回路１９３、レベル比算出回路１９４、レベル比較器１９５、収音ビーム信号選択回路１９６を備える。

ＢＰＦ１９１は、ビーム特性を主に有する帯域および人の音声の主成分帯域を通過帯域とするバンドパスフィルタであり、収音ビーム信号ＭＢ１１〜ＭＢ１４、ＭＢ２１〜ＭＢ２４を帯域通過フィルタ処理して、全波整流回路１９２に出力する。

全波整流回路１９２は、収音ビーム信号ＭＢ１１〜ＭＢ１４、ＭＢ２１〜ＭＢ２４を全波整流（絶対値化）する。

レベル検出回路１９３は、全波整流された収音ビーム信号ＭＢ１１〜ＭＢ１４、ＭＢ２１〜ＭＢ２４のピーク検出を行い、このピーク値をそのタイミングでの信号レベル（信号エネルギー）とし、それぞれの信号レベルデータＥ１１〜Ｅ１４，Ｅ２１〜Ｅ２４をレベル比算出回路１９４に出力する。

具体的に、図４（Ａ）〜（Ｃ）に示すような状況で放収音が行われ、放音と会議者Ａ，Ｂの発話とが生じた場合には、各信号レベルデータＥ１１〜Ｅ１４，Ｅ２１〜Ｅ２４は次のようになる。

図４は、本実施形態の放収音装置１を机Ｃ上に配置し、二人の会議者Ａ，Ｂが会議を行っている状況を示した図であり、（Ａ）は会議者Ａが発言している状況、（Ｂ）は会議者Ｂが発言している状況、（Ｃ）は会議者Ａ，Ｂともに発言していない状況を示す。

図５は、放音音声の信号レベルデータＥｓｐ、各収音ビーム信号の信号レベルデータＥ１１〜Ｅ１４，Ｅ２１〜Ｅ２４の時系列（Ｔ）分布を示すものであり、（Ａ）が放音音声の信号レベルデータＥｓｐ、（Ｂ）〜（Ｅ）がそれぞれ収音ビーム信号ＭＢ１１〜ＭＢ１４に対応する信号レベルデータＥ１１〜Ｅ１４、（Ｆ）〜（Ｉ）がそれぞれ収音ビーム信号ＭＢ２１〜ＭＢ２４に対応する信号レベルデータＥ２１〜Ｅ２４を示す。また、図５（Ａ）において、２００は入力音声信号の放音音声成分であり、図５（Ｂ）〜（Ｉ）において、２０１は回り込み音声が収音された時に発生する回り込み音声成分である。また、図５（Ｂ）〜（Ｉ）において、３０１は会議者Ａの発声音が収音された時に発生する収音音声成分であり、３０２は会議者Ｂの発声音が収音された時に発生する収音音声成分である。

図５に示すように、放音音声が発生した場合、レベル検出回路１９３は、各収音ビーム信号ＭＢ１１〜ＭＢ１４、ＭＢ２１〜ＭＢ２４の信号レベルデータＥ１１〜Ｅ１４、Ｅ２１〜Ｅ２４において、図５（Ｂ）〜（Ｉ）に示すように回り込み音声成分２０１を検出する。また、図４（Ａ）、図５（Ｆ）に示すように、時刻Ｔ１〜Ｔ２で会議者Ａが発言すると、レベル検出回路１９３は、収音ビーム信号ＭＢ２１の信号レベルデータＥ２１において収音音声成分３０１を検出する。さらに、図４（Ｂ）、図５（Ｄ）に示すように、時刻Ｔ３〜Ｔ４で会議者Ｂが発言すると、レベル検出回路１９３は、収音ビーム信号ＭＢ１３の信号レベルデータＥ１３において収音音声成分３０２を検出する。

しかしながら、図５（Ｄ），（Ｆ）に示すように、収音音声成分３０１，３０２の信号レベルが回り込み音声成分２０１の信号レベルよりも低い場合がある。この場合、収音音声成分３０１，３０２を回り込み音声成分２０１と区別することができず、話者方位を検出することができない。これを解決するため、本願発明では、次のレベル比算出回路１９４で所定の信号比を算出して、話者方位を検出する。

レベル比算出回路１９４は、レベル検出回路１９３から入力された信号レベルデータＥ１１〜Ｅ１４，Ｅ２１〜Ｅ２４の平均信号レベルデータＥａｖを算出する。そして、レベル比算出回路１９４は、各信号レベルデータＥ１１〜Ｅ１４，Ｅ２１〜Ｅ２４と平均信号レベルデータＥａｖとのレベル比ＣＥ１１〜ＣＥ１４，ＣＥ２１〜ＣＥ２４を算出する。具体的には、各信号レベルデータＥｍｎ（ｍ＝１，２，ｎ＝１〜４）に対して、
ＣＥｍｎ＝Ａ＊Ｌｏｇ（Ｅｍｎ／Ｅａｖ）（Ａは定数） ―（１）
を用いて、レベル比ＣＥ１１〜ＣＥ１４，ＣＥ２１〜ＣＥ２４をデシベル単位で算出する。

図６は、平均信号レベルデータＥａｖ、レベル比ＣＥ１１〜ＣＥ１４、ＣＥ２１〜ＣＥ２４の時系列（Ｔ）分布を示すものであり、（Ａ）が平均信号レベルデータＥａｖ、（Ｂ）〜（Ｅ）がそれぞれ収音ビーム信号ＭＢ１１〜ＭＢ１４に対応するレベル比データＣＥ１１〜ＣＥ１４、（Ｆ）〜（Ｉ）がそれぞれ収音ビーム信号ＭＢ２１〜ＭＢ２４に対応するレベル比データＣＥ２１〜ＣＥ２４を示す。

このように、各信号レベルデータを平均信号レベルデータで除算して比を算出することで、全ての信号レベルデータＥ１１〜Ｅ１４，Ｅ２１〜Ｅ２４に略同等に含まれる回り込み音声成分２０１が略「１」、すなわちデシベル単位であれば略「０」相当となる。一方、収音音声成分３０１は信号レベルデータＥ２１に固有で、収音音声成分３０２は信号レベルデータＥ１３に固有な成分であるので、レベル比データＣＥ２１は、収音音声成分３０１の発生するタイミング（Ｔ１〜Ｔ２）で高レベル成分４０１が発生し、レベル比データＣＥ１３は、収音音声成分３０２の発生するタイミング（Ｔ３〜Ｔ４）で高レベル成分４０２が発生する。なお、このようにデシベル単位を用いることにより、定数Ａを適宜設定すれば、高レベル成分４０１，４０２を他の部分よりも顕著にすることができる。

レベル比算出回路１９４は、これらレベル比データＣＥ１１〜ＣＥ１４，ＣＥ２１〜ＣＥ２４をレベル比較器１９５に出力する。

レベル比較器１９５は、レベル比データＣＥに対して、予め所定の閾値ＤＥｔｈを設定し、当該閾値ＤＥｔｈを超えるレベルのデータを検出すると、該当するレベル比データＣＥに対応する収音ビーム信号ＭＢ１１〜ＭＢ１４、ＭＢ２１〜ＭＢ２４の選択情報を収音ビーム信号選択回路１９６に出力する。ここで、閾値ＤＥｔｈは、予め発声音による収音音声がない状況で暗騒音や意図的に発生させた放音音声に対する回り込み音声の収音レベル等から適宜設定しておく。

具体的に図６の場合、サンプリングタイミングＴ１〜Ｔ２の時点では、高レベル成分４０１が検出され、レベル比データＣＥ２１に対応する収音ビーム信号ＭＢ２１を選択する選択情報が出力される。また、サンプリングタイムＴ３〜Ｔ４の時点では、高レベル成分４０２が検出され、レベル比データＣＥ１３に対応する収音ビーム信号ＭＢ１３を選択する選択情報が出力される。

収音ビーム信号選択回路１９６は、レベル比較器１９５から入力された選択情報に基づいて、収音ビーム信号ＭＢ１１〜ＭＢ１４、ＭＢ２１〜ＭＢ２４のうちで該当する収音ビーム信号を選択して、出力収音ビーム信号ＭＢとしてエコーキャンセル部２０に出力する。

具体的に、図６の場合、サンプリングタイミングＴ１〜Ｔ２の時点では収音ビーム信号ＭＢ２１を選択して出力し、サンプリングタイムＴ３〜Ｔ４の時点では収音ビーム信号ＭＢ１３を選択して出力する。

このような構成、処理を用いることで、会議者（話者）の発声音の収音信号レベルが、回り込み音声信号レベルと同等であったり、回り込み音声信号レベルよりも低くなっても、確実に発声音に対応する収音ビーム信号ＭＢを選択することができる。

エコーキャンセル部２０は、適応型フィルタ２０１とポストプロセッサ２０２とを備える。適応型フィルタ２０１は、入力音声信号に対して、選択された収音ビーム信号ＭＢの収音指向性に基づく擬似回帰音信号を生成する。ポストプロセッサ２０２は、収音ビーム選択部１９から出力される収音ビーム信号ＭＢから擬似回帰音信号を減算して、出力音声信号として入出力Ｉ／Ｆ１２に出力する。このようなエコーキャンセル処理を行うことにより、高いＳ／Ｎ比で発声音を収音して出力することができる。

次に、第２の実施形態に係る放収音装置について図を参照して説明する。
本実施形態の放収音装置は、収音ビーム選択部１９のレベル比算出回路１９４、レベル比較器１９５、収音ビーム信号選択回路１９６の処理が異なるのみで、他の構成は第１の実施形態に示した放収音装置と同じであるので、レベル比算出回路１９４、レベル比較器１９５、収音ビーム信号選択回路１９６の処理のみを説明し、他の構成については説明を省略する。

レベル比算出回路１９４は、レベル検出回路１９３から入力された信号レベルデータＥ１１〜Ｅ１４，Ｅ２１〜Ｅ２４から、互いに図１の基準面１００に対して対称な収音ビームの信号レベルデータＥ同士のレベル比ＣＥ１〜ＣＥ４を算出する。具体的には、各信号レベルデータＥ１ｎ，Ｅ２ｎ（ｎ＝１〜４）に対して、
ＣＥｎ＝Ｂ＊Ｌｏｇ（Ｅ２ｎ／Ｅ１ｎ）（Ｂは定数） ―（２）
を用いて、レベル比ＣＥ１〜ＣＥ４をデシベル単位で算出する。
図７（Ａ）〜（Ｄ）はそれぞれレベル比ＣＥ１〜ＣＥ４の時系列（Ｔ）分布を示すものである。

このように、基準面１００に対して対称位置にある信号レベルデータ同士を除算して比を算出することで、基準面１００に対して略対称な特性の回り込み音声成分２０１が略「１」、すなわちデシベル単位であれば略「０」相当となる。一方、収音音声成分３０１は、会議者Ａの方位に対応する収音ビーム信号ＭＢ２１の信号レベルデータＥ２１に現れ、収音ビーム信号ＭＢ２１と基準面１００に対して対称な収音ビーム信号ＭＢ１１には現れない。したがって、式（２）から、レベル比データＣＥ１は、収音音声成分３０１の発生するタイミング（Ｔ１〜Ｔ２）で、基準レベル０ｄＢより正の方向に高い正方向高レベル成分５０１が発生する。また、収音音声成分３０２は、会議者Ｂの方位に対応する収音ビーム信号ＭＢ１３の信号レベルデータＥ１３に現れ、収音ビーム信号ＭＢ１３と基準面１００に対して対称な収音ビーム信号ＭＢ２３には現れない。したがって、式（２）から、レベル比データＣＥ３は、収音音声成分３０２の発生するタイミング（Ｔ３〜Ｔ４）で、基準レベル０ｄＢよりも低い、すなわち負方向に高い負方向高レベル成分５０２が発生する。なお、このようにデシベル単位を用いることにより、定数Ｂを適宜設定すれば、正方向高レベル成分５０１，負方向高レベル成分５０２を他の部分よりも顕著にすることができる。

レベル比算出回路１９４は、これらレベル比データＣＥ１〜ＣＥ４をレベル比較器１９５に出力する。

レベル比較器１９５は、レベル比データＣＥ１〜ＣＥ４に対して、予め所定のレベル範囲ＤＷｔｈを設定し、当該レベル範囲ＤＷｔｈを正方向または負方向に超えるレベルのデータを検出すると、該当するレベル比データＣＥに対応する収音ビーム信号の組合せを検出して、この組合せの選択情報を収音ビーム信号選択回路１９６に出力する。また、レベル比較器１９５は、該当するレベル比データＣＥが正方向に高いレベルであるのか、負方向に高いレベルであるのかを示す正負レベル情報を収音ビーム信号選択回路１９６に出力する。ここで、レベル範囲ＤＷｔｈも、前述の閾値ＤＥｔｈと同様に、予め発声音による収音音声がない状況で暗騒音や意図的に発生させた放音音声に対する回り込み音声の収音レベル等から適宜設定しておく。

具体的に、図７の場合、サンプリングタイミングＴ１〜Ｔ２の時点では、正方向高レベル成分５０１が検出され、レベル比データＣＥ１に対応する収音ビーム信号ＭＢ１１，ＭＢ２１の組合せを選択する選択情報が出力される。また、正方向に高いレベルであることを示す正レベル情報が出力される。
一方、サンプリングタイムＴ３〜Ｔ４の時点では、負方向高レベル成分５０２が検出され、レベル比データＣＥ３に対応する収音ビーム信号ＭＢ１３，ＭＢ２３の組合せを選択する選択情報が出力される。また、負方向に高いレベルであることを示す負レベル情報が出力される。

収音ビーム信号選択回路１９６は、レベル比較器１９５から入力された選択情報に基づいて、収音ビーム信号ＭＢ１１〜ＭＢ１４、ＭＢ２１〜ＭＢ２４のうちで該当する収音ビーム信号の組合せを選択して、正負レベル情報に基づいて選択された二つの収音ビーム信号から信号レベルの大きい方の収音ビーム信号を選択して、出力収音ビーム信号ＭＢとしてエコーキャンセル部２０に出力する。

具体的に、図７の場合、サンプリングタイミングＴ１〜Ｔ２の時点では収音ビーム信号ＭＢ１１，ＭＢ２１を選択する。さらに、式（２）において正方向に高レベルになるには、信号レベルデータＥ２１が信号レベルデータＥ１１よりも高い場合であるので、正レベル情報に基づいて収音ビーム信号ＭＢ２１を選択する。
一方、サンプリングタイミングＴ３〜Ｔ４の時点では収音ビーム信号ＭＢ１３，ＭＢ２３を選択する。さらに、式（２）において負方向に高レベルになるには、信号レベルデータＥ１３が信号レベルデータＥ２３よりも高い場合であるので、負レベル情報に基づいて収音ビーム信号ＭＢ１３を選択する。
このような構成、処理を用いても、会議者（話者）の発声音の収音信号レベルが、回り込み音声信号レベルと同等であったり、回り込み音声信号レベルよりも低くなっても、確実に発声音に対応する収音ビーム信号ＭＢを選択することができる。

また、前述の説明では、スピーカ配列方向に平行な基準面にマイクアレイが対称に配置された例を示したが、第１の実施形態の方法を用いれば、基準面に対して一方側にしかマイクアレイが存在しない場合にも適用することができる。

また、前述の各実施形態の説明では、収音ビーム生成部により収音ビーム信号を生成する場合を示したが、各マイクＭＩＣ１１〜ＭＩＣ１７、ＭＩＣ２１〜ＭＩＣ２７に収音指向性を持たせ、各マイクＭＩＣ１１〜ＭＩＣ１７、ＭＩＣ２１〜ＭＩＣ２７からの出力信号をそのまま収音ビーム信号として用いるようにしてもよい。この場合、基準面１００に対して対称位置にあるマイク同士の収音指向性は、基準面１００に対して対称に設定すれば、第２の実施形態に対しても適用することができる。

本実施形態に係る放収音装置のマイク、スピーカ配置を示す平面図、および、放収音装置により形成される収音ビーム領域を示す図である。本実施形態の放収音装置の機能ブロック図である。図２に示す収音ビーム選択部１９の構成を示すブロック図である。本実施形態の放収音装置１を机Ｃ上に配置し、二人の会議者Ａ，Ｂが会議を行っている状況を示した図である。放音音声の信号レベルデータＥｓｐ、各収音ビーム信号の信号レベルデータＥ１１〜Ｅ１４，Ｅ２１〜Ｅ２４の時系列（Ｔ）分布を示す図である。平均信号レベルデータＥａｖ、レベル比ＣＥ１１〜ＣＥ１４、ＣＥ２１〜ＣＥ２４の時系列（Ｔ）分布を示す図である。それぞれレベル比ＣＥ１〜ＣＥ４の時系列（Ｔ）分布を示す図である。

符号の説明

１−放収音装置、１０１−筐体、１１−入出力コネクタ、１２−入出力Ｉ／Ｆ、１３−放音指向性制御部、１４−Ｄ／Ａコンバータ、１５−放音用アンプ、１６−収音用アンプ、１７−Ａ／Ｄコンバータ、１８１，１８２−収音ビーム生成部、１９−収音ビーム選択部、１９１−ＢＰＦ、１９２−全波整流回路、１９３−レベル検出回路、１９４−レベル比算出回路、１９５−レベル比較器、１９６−収音ビーム信号選択回路、２０−エコーキャンセル部、２０１−適応型フィルタ、２０２−ポストプロセッサ、ＳＰ１〜ＳＰ３−スピーカ、ＳＰＡ１０−スピーカアレイ、ＭＩＣ１１〜ＭＩＣ１７，ＭＩＣ２１〜ＭＩＣ２７−マイク、ＭＡ１０，ＭＡ２０−マイクアレイ

Claims

所定基準面に対して対称となる音圧で入力音声信号を放音するスピーカを備えた放音手段と、
所定基準面の一方側の音声を収音する第１マイク群および他方側の音声を収音する第２マイク群とからなる収音手段と、
前記第１マイク群の収音信号に遅延・振幅処理を行うことで得られる第１収音ビーム信号群の各収音ビーム信号と、前記第２マイク群の収音信号に遅延・振幅処理を行うことで得られる第２収音ビーム信号群の各収音ビーム信号とを前記所定基準面に対して対称に生成する収音ビーム信号生成手段と、
各タイミングで前記基準面に対称な収音ビーム信号同士のエネルギー比を算出して、当該エネルギー比が所定の基準レベル範囲内にない収音ビーム信号の組合せを検出し、前記エネルギー比が前記基準レベル範囲よりも高いか低いかにより、前記組合せを構成する二本の収音ビーム信号から一本の収音ビーム信号を選択する収音ビーム信号選択手段と、
を備えた放収音装置。
所定基準面に対して対称となる音圧で入力音声信号を放音するスピーカを備えた放音手段と、
所定基準面の一方側に対してそれぞれ異なる方位に指向性を有する複数のマイクを備え、各マイクからの出力信号を収音ビーム信号とする第１マイク群、および他方側に対してそれぞれ異なる方位に指向性を有する複数のマイクを備え、各マイクからの出力信号を収音ビーム信号とする第２マイク群を備え、前記第１マイク群で得られる収音ビーム信号と前記第２マイク群で得られる収音ビーム信号とが前記基準面に対して対称に設定された収音手段と、
各タイミングで前記基準面に対称な収音ビーム信号同士のエネルギー比を算出して、当該エネルギー比が所定の基準レベル範囲内にない収音ビーム信号の組合せを検出し、前記エネルギー比が前記基準レベル範囲よりも高いか低いかにより、前記組合せを構成する二本の収音ビーム信号から一本の収音ビーム信号を選択する収音ビーム信号選択手段と、
を備えた放収音装置。
前記収音ビーム信号選択手段は、前記エネルギー比をデシベル単位に換算して、該デシベル単位に換算された値に基づいて収音ビーム信号を選択する請求項１または２に記載の放収音装置。