WO2018174135A1

WO2018174135A1 - 収音装置および収音方法

Info

Publication number: WO2018174135A1
Application number: PCT/JP2018/011318
Authority: WO
Inventors: 窒登川合; 未輝雄村松; 井上　貴之; 訓史鵜飼
Original assignee: ヤマハ株式会社
Priority date: 2017-03-24
Filing date: 2018-03-22
Publication date: 2018-09-27
Also published as: JP6849055B2; US20200015010A1; US10873810B2; EP3606092A4; CN110447239B; CN110447239A; JPWO2018174135A1; EP3606092A1

Abstract

収音装置は、レベル制御部を備えている。レベル制御部は、第１マイクから生成される第１収音信号および第２マイクから生成される第２収音信号の相関が閾値を超える周波数成分の割合に応じて前記第１収音信号または前記第２収音信号のレベル制御を行なう。

Description

収音装置および収音方法

　本発明の一実施形態は、マイクを用いて音源の音を取得する収音装置および収音方法に関する。

　特許文献１乃至特許文献３には、２つのマイクのコヒーレンスを求めて、話者の声等の目的音を強調する手法が開示されている。

　例えば、特許文献１の手法は、無指向性マイクを２つ用いて２つの信号の平均コヒーレンスを求め、求めた平均コヒーレンスの値に基づいて、目的音声であるか否かを判定する。

特開２０１６－０４２６１３号公報特開２０１３－０６１４２１号公報特開２００６－１２９４３４号公報

　従来の手法は、遠方の雑音を低減することは開示されていない。

　そこで、本発明の一実施形態の目的は、従来よりも高精度に遠方の雑音を低減することができる収音装置および収音方法を提供することにある。

　本発明の一実施形態によれば、従来よりも高精度に遠方の雑音を低減することができる。

収音装置１Ａの構成を示す概略図である。マイク１０Ａおよびマイク１０Ｂの指向性を示す平面図である。収音装置１Ａの構成を示すブロック図である。レベル制御部１５の構成の一例を示す図である。図５（Ａ）および図５（Ｂ）は、ゲインテーブルの一例を示す図である。変形例１に係るレベル制御部１５の構成を示す図である。図７（Ａ）は、指向性形成部２５および指向性形成部２６の機能的構成を示すブロック図であり、図７（Ｂ）は、指向性を示す平面図である。変形例２に係るレベル制御部１５の構成を示す図である。強調処理部５０の機能的構成を示すブロック図である。３つのマイク（マイク１０Ａ、マイク１０Ｂ、およびマイク１０Ｃ）を備えた収音装置１Ｂの外観図である。図１１（Ａ）は、指向性形成部の機能的構成を示す図であり、図１１（Ｂ）は、指向性の一例を示す図である。図１２（Ａ）は、指向性形成部の機能的構成を示す図であり、図１２（Ｂ）は、指向性の一例を示す図である。レベル制御部１５の動作を示すフローチャートである。変形例に係るレベル制御部１５の動作を示すフローチャートである。収音装置に接続される外部装置（ＰＣ）の構成例を示すブロック図である。収音装置の構成例を示すブロック図である。レベル制御部を外部装置（サーバ）に設ける場合の構成例を示すブロック図である。

　本実施形態の収音装置は、第１マイクと、第２マイクと、レベル制御部と、を備えている。レベル制御部は、前記第１マイクから生成される第１収音信号および前記第２マイクから生成される第２収音信号の相関を求めて、該相関が閾値を超える周波数成分の割合に応じて前記第１収音信号または前記第２収音信号のレベル制御を行なう。

　近傍の音および遠方の音には少なくとも反射音が含まれているため、コヒーレンスが極端に低くなる周波数がある。計算値にこの様な極端に低い値が含まれていると、平均が低くなる場合がある。しかし、上記割合は、閾値以上の周波数成分がどの程度存在するかにのみ影響し、閾値未満の周波数におけるコヒーレンスの値自体が低い値であるか、高い値であるかは、レベル制御には全く影響しない。したがって、収音装置は、割合に応じてレベル制御を行なうことで、目的音を高精度で強調することができ、遠方の雑音を低減することができる。

　図１は、収音装置１Ａの構成を示す外観の概略図である。図１においては、収音に係る主構成を記載して、その他の構成は記載していない。収音装置１Ａは、円筒形状の筐体７０、マイク１０Ａ、およびマイク１０Ｂ、を備えている。

　マイク１０Ａおよびマイク１０Ｂは、筐体７０の上面に配置されている。ただし、筐体７０の形状、およびマイクの配置態様は一例であり、この例に限るものではない。

　図２は、マイク１０Ａおよびマイク１０Ｂの指向性を示す平面図である。一例として、マイク１０Ａは、装置の前方（図中の左方向）の感度が最も強く、後方（図中の右方向）に感度が無い、指向性マイクである。マイク１０Ｂは、全方向に均一な感度を有する無指向性マイクである。ただし、マイク１０Ａおよびマイク１０Ｂの指向性の態様は、この例に限るものではない。例えば、マイク１０Ａおよびマイク１０Ｂともに無指向性のマイクであってもよいし、ともに指向性のマイクであってもよい。また、マイクの数も２つに限るものではなく、例えば３つ以上のマイクを備えていてもよい。

　図３は、収音装置１Ａの構成を示すブロック図である。収音装置１Ａは、マイク１０Ａ、マイク１０Ｂ、レベル制御部１５、およびインタフェース（Ｉ／Ｆ）１９を備えている。レベル制御部１５は、ＣＰＵ（Central Processing Unit）１５１が記憶媒体であるメモリ１５２に記憶されているプログラムを読み出すことにより、ソフトウェアの機能として実現される。ただし、レベル制御部１５は、ＦＰＧＡ（Field-Programmable Gate Array）等の専用のハードウェアにより実現されてもよい。また、レベル制御部１５は、ＤＳＰ（Digital Signal Processor）により実現されてもよい。

　レベル制御部１５は、マイク１０Ａの収音信号Ｓ１およびマイク１０Ｂの収音信号Ｓ２を入力する。レベル制御部１５は、マイク１０Ａの収音信号Ｓ１またはマイク１０Ｂの収音信号Ｓ２をレベル制御して、Ｉ／Ｆ１９に出力する。Ｉ／Ｆ１９は、ＵＳＢまたはＬＡＮ等の通信インタフェースである。収音装置１Ａは、Ｉ／Ｆ１９を介して収音信号を他の装置に出力する。

　図４は、レベル制御部１５の機能的な構成の一例を示す図である。レベル制御部１５は、コヒーレンス算出部２０、ゲイン制御部２１、およびゲイン調整部２２を備えている。

　コヒーレンス算出部２０は、マイク１０Ａの収音信号Ｓ１およびマイク１０Ｂの収音信号Ｓ２を入力する。コヒーレンス算出部２０は、相関の一例として、収音信号Ｓ１および収音信号Ｓ２のコヒーレンスを算出する。

　ゲイン制御部２１は、コヒーレンス算出部２０の算出結果に基づいて、ゲイン調整部２２のゲインを決定する。ゲイン調整部２２は、収音信号Ｓ２を入力する。ゲイン調整部２２は、収音信号Ｓ２のゲインを調整して、Ｉ／Ｆ１９に出力する。

　なお、この例では、マイク１０Ｂの収音信号Ｓ２のゲインを調整して、Ｉ／Ｆ１９に出力する態様となっているが、マイク１０Ａの収音信号Ｓ１のゲインを調整して、Ｉ／Ｆ１９に出力する態様としてもよい。ただし、マイク１０Ｂは、無指向性マイクであるため、全周囲の音を収音することができる。よって、マイク１０Ｂの収音信号Ｓ２のゲインを調整して、Ｉ／Ｆ１９に出力することが好ましい。

　コヒーレンス算出部２０は、収音信号Ｓ１および収音信号Ｓ２をそれぞれフーリエ変換して、周波数軸の信号Ｘ（ｆ，ｋ）およびＹ（ｆ，ｋ）に変換する（Ｓ１１）。「ｆ」は周波数であり、「ｋ」は、フレーム番号を表す。コヒーレンス算出部２０は、以下の数式１に従って、コヒーレンス（複素クロススペクトルの時間平均値）を算出する（Ｓ１２）。

　ただし、上記数式１は、一例である。例えば、コヒーレンス算出部２０は、以下の数式２または数式３に従ってコヒーレンスを算出してもよい。

　なお、「ｍ」は、サイクル番号（所定フレーム数からなる信号のまとまりを示す識別番号）であり、「Ｔ」は、１サイクルのフレーム数を表す。

　ゲイン制御部２１は、上記コヒーレンスに基づいて、ゲイン調整部２２のゲインを決定する。例えば、ゲイン制御部２１は、全周波数（周波数ビンの数）に対して、コヒーレンスの振幅が所定の閾値γｔｈを超えた周波数ビンの割合Ｒ（ｋ）を求める（Ｓ１３）。　

　閾値γｔｈは、例えばγｔｈ＝０．６に設定される。なお、上記数式４におけるｆ０は、下限周波数ビンであり、ｆ１は、上限周波数ビンである。

　ゲイン制御部２１は、この割合Ｒ（ｋ）に応じて、ゲイン調整部２２のゲインを決定する（Ｓ１４）。より具体的には、ゲイン制御部２１は、周波数ビン毎にコヒーレンスが閾値γｔｈを超えるか否かを判定し、該閾値を超える周波数ビン数を集計し、集計結果に応じてゲインを決定する。図５（Ａ）は、ゲインテーブルの一例を示す図である。図５（Ａ）に示す例のゲインテーブルによれば、ゲイン制御部２１は、割合Ｒが、所定値Ｒ１以上では、減衰しない（ゲイン＝１）。ゲイン制御部２１は、割合Ｒが所定値Ｒ１からＲ２までは、割合Ｒの低下にしたがって、ゲインが減衰するように設定する。ゲイン制御部２１は、割合ＲがＲ２よりも小さい場合には、最小ゲイン値で維持する。最小ゲイン値は、０であってもよいが、０よりもわずかに大きな値として、わずかに音が聞こえる状態としてもよい。これにより、ユーザは、故障等により音が途切れたと勘違いすることがない。

　コヒーレンスは、２つの信号の相関が高い場合に、高い値を示す。遠方の音は、残響音成分が多く、到来方向の定まらない音である。例えば、マイク１０Ａが指向性であり、マイク１０Ｂが無指向性である場合には、遠方の音に対する収音性能が大きく異なる。したがって、コヒーレンスは、遠方の音源の音が入力された場合には小さくなり、装置に近い音源の音が入力された場合には大きくなる。

　よって、収音装置１Ａは、装置から遠い音源の音を収音せず、装置に近い音源の音を目的音として強調することができる。

　本実施形態の収音装置１Ａは、ゲイン制御部２１は、全周波数に対して、コヒーレンスが所定の閾値γｔｈを超えた周波数の割合Ｒ（ｋ）を求め、該割合に応じてゲイン制御を行なう例を示した。近傍の音および遠方の音には反射音が含まれているため、コヒーレンスが極端に低くなる周波数がある。この様な極端に低い値が含まれていると、平均が低くなる場合がある。しかし、上記割合Ｒ（ｋ）は、閾値以上の周波数成分がどの程度存在するかにのみ影響し、閾値未満におけるコヒーレンスの値自体が低い値であるか、高い値であるかは、ゲイン制御には全く影響しないため、割合Ｒ（ｋ）に応じてゲイン制御を行なうことで、遠方の雑音を低減することができ、目的音を高精度で強調することができる。

　なお、所定値Ｒ１および所定値Ｒ２は、どの様な値に設定してもよいが、所定値Ｒ１は、減衰させずに収音したい最大範囲に応じて設定する。例えば、音源の位置が半径約３０ｃｍよりも遠い場合に、コヒーレンスの割合Ｒの値が低下する場合に、距離が約４０ｃｍとなる時のコヒーレンスの割合Ｒの値を、所定値Ｒ１に設定することで、半径約４０ｃｍまでは、減衰させずに収音することができる。また、所定値Ｒ２は、減衰させたい最小範囲に応じて設定する。例えば、距離が１００ｃｍとなる時の割合Ｒの値を、所定値Ｒ２に設定することで、距離が１００ｃｍ以上ではほとんど収音されず、距離が１００ｃｍよりも近くなると、徐々にゲインが上昇して収音されることになる。

　また、所定値Ｒ１および所定値Ｒ２は、固定値ではなく、動的に変化させてもよい。例えば、レベル制御部１５は、所定時間内の過去に算出された割合Ｒの平均値Ｒ０（あるいは最も大きい値）を求め、所定値Ｒ１＝Ｒ０＋０．１、所定値Ｒ２＝Ｒ０－０．１とする。これにより、現在の音源の位置を基準として、該音源の位置よりも近い範囲の音は収音され、音源の位置よりも遠い範囲の音が収音されない状態となる。

　なお、図５（Ａ）の例は、所定距離（例えば３０ｃｍ）から急激にゲインが低下して、所定距離（例えば１００ｃｍ）以上の音源はほとんど収音されない態様であり、リミッタの機能に類似する。しかし、ゲインテーブルは、他にも図５（Ｂ）に示すように、様々な態様が考えられる。図５（Ｂ）の例では、割合Ｒに応じて徐々にゲインが低下し、所定値Ｒ１からゲインの低下度合いが大きくなり、所定値Ｒ２以上では、再び徐々にゲインが低下する態様であり、コンプレッサの機能に類似する。

　次に、図６は、変形例１に係るレベル制御部１５の構成を示す図である。レベル制御部１５は、指向性形成部２５および指向性形成部２６を備えている。図１３は、変形例１に係るレベル制御部１５の動作を示すフローチャートである。図７（Ａ）は、指向性形成部２５および指向性形成部２６の機能的構成を示すブロック図である。

　指向性形成部２５は、マイク１０Ｂの出力信号Ｍ２を、そのまま収音信号Ｓ２として出力する。指向性形成部２６は、図７（Ａ）に示すように、減算部２６１および選択部２６２を備えている。

　減算部２６１は、マイク１０Ｂの出力信号Ｍ２からマイク１０Ａの出力信号Ｍ１を差分して、選択部２６２に入力する。

　選択部２６２は、マイク１０Ａの出力信号Ｍ１のレベルと、およびマイク１０Ｂの出力信号Ｍ２からマイク１０Ａの出力信号Ｍ１を差分した差分信号のレベルと、を比較し、高レベル側の信号を収音信号Ｓ１として出力する（Ｓ１０１）。図７（Ｂ）に示すように、マイク１０Ｂの出力信号Ｍ２からマイク１０Ａの出力信号Ｍ１を差分した差分信号は、マイク１０Ｂの指向性を反転した状態となる。

　このようにして、変形例１に係るレベル制御部１５は、指向性のある（特定の方向の音に感度を有しない）マイクを用いた場合であっても、装置の全周囲に対して、感度を持たせることができる。この場合も、収音信号Ｓ１は指向性を有し、収音信号Ｓ２は無指向性であるため、遠方の音に対する収音性能が異なる。よって、変形例１に係るレベル制御部１５は、装置の全周囲に対して感度を持たせながらも、装置から遠い音源の音を収音せず、装置に近い音源の音を目的音として強調することができる。

　指向性形成部２５および指向性形成部２６の態様は、図７（Ａ）の例に限らない。収音信号Ｓ１と、収音信号Ｓ２と、において、筐体７０に近い音源に対する相関が高く、かつ遠方の音源に対する相関が低くなる態様であれば、本実施形態の構成を実現することができる。

　例えば、図１０は、３つのマイク（マイク１０Ａ、マイク１０Ｂ、およびマイク１０Ｃ）を備えた収音装置１Ｂの外観図である。図１１（Ａ）は、指向性形成部の機能的構成を示す図である。図１１（Ｂ）は、指向性の一例を示す図である。

　図１１（Ｂ）に示すように、この例では、マイク１０Ａ、マイク１０Ｂ、およびマイク１０Ｃは、全て指向性マイクである。マイク１０Ａ、マイク１０Ｂ、およびマイク１０Ｃは、平面視して、それぞれ１２０度ずつ異なる方向に感度を有する。

　図１１（Ａ）における指向性形成部２６は、マイク１０Ａ、マイク１０Ｂ、およびマイク１０Ｃの信号のいずれか１つを選択することで、指向性の第１収音信号を形成する。例えば、上記指向性形成部２６は、マイク１０Ａ、マイク１０Ｂ、およびマイク１０Ｃの信号の最も高レベルの信号を選択する。

　図１１（Ａ）における指向性形成部２５は、マイク１０Ａ、マイク１０Ｂ、およびマイク１０Ｃの信号の重み和を算出することで、無指向性の第２収音信号を形成する。

　これにより、収音装置１Ｂは、全て指向性のある（特定の方向に感度を有しない）マイクを備えた場合であっても、装置の全周囲に対して、感度を持たせることができる。この場合も、収音信号Ｓ１は指向性を有し、収音信号Ｓ２は無指向性であるため、遠方の音に対する収音性能が異なる。よって、収音装置１Ｂは、装置の全周囲に対して感度を持たせながらも、装置から遠い音源の音を収音せず、装置に近い音源の音を目的音として強調することができる。

　また、例えば全てのマイクが無指向性マイクであっても例えば図１２（Ａ）に示すように、指向性形成部２６が遅延和を求めることで、図１２（Ｂ）に示すように、特定の方向に強い感度を持った収音信号Ｓ１を生成することもできる。この場合、３つの無指向性マイクを用いる例であるが、２つまたは４つ以上の無指向性マイクを用いて特定の方向に強い感度を持った収音信号Ｓ１を生成することもできる。

　次に、図９は、強調処理部５０の機能的構成を示すブロック図である。

　人の声は、所定の周波数毎にピーク成分を有する調波構造となっている。したがって、コムフィルタ設定部７５は、以下の数式５に示すように、人の声のピーク成分を通過させ、ピーク成分以外を除去するゲイン特性Ｇ（ｆ，ｔ）を求め、コムフィルタ７６のゲイン特性として設定する。

　すなわち、コムフィルタ設定部７５は、収音信号Ｓ２をフーリエ変換し、振幅を対数演算したものをさらにフーリエ変換してケプストラムｚ（ｃ，ｔ）を求める。コムフィルタ設定部７５は、このケプストラムｚ（ｃ，ｔ）を最大にするｃの値ｃ_ｐｅａｋ（ｔ）＝ａｒｇｍａｘ_ｃ｛ｚ（ｃ，ｔ）｝を抽出する。コムフィルタ設定部７５は、ｃの値がｃ_ｐｅａｋ（ｔ）およびその近辺以外の場合には、ケプストラム値ｚ（ｃ，ｔ）＝０として、ケプストラムのピーク成分を抽出する。コムフィルタ設定部７５は、このピーク成分ｚ_ｐｅａｋ（ｃ、ｔ）を周波数軸の信号に戻し、コムフィルタ７６のゲイン特性Ｇ（ｆ，ｔ）とする。これにより、コムフィルタ７６は、人の声の調波成分を強調するフィルタとなる。

　なお、ゲイン制御部２１は、コヒーレンス算出部２０の算出結果に基づいて、コムフィルタ７６による強調処理の強さを調整してもよい。例えば、ゲイン制御部２１は、上述の割合Ｒ（ｋ）の値が所定値Ｒ１以上の場合に、コムフィルタ７６による強調処理をオンして、上述の割合Ｒ（ｋ）の値が所定値Ｒ１未満の場合に、コムフィルタ７６による強調処理をオフする。この場合、コムフィルタ７６による強調処理も、相関の算出結果に応じて収音信号Ｓ２（または収音信号Ｓ１）のレベル制御を行なう一態様に含まれる。したがって、収音装置１は、コムフィルタ７６による目的音の強調処理だけを行なってもよい。

　なお、レベル制御部１５は、例えば、ノイズ成分を推定し、該推定したノイズ成分を用いたスペクトルサブトラクション法により、ノイズ成分を除去することで、目的音を強調する処理を行なってもよい。さらに、レベル制御部１５は、コヒーレンス算出部２０の算出結果に基づいて、ノイズ除去処理の強さを調整してもよい。例えば、レベル制御部１５は、上述の割合Ｒ（ｋ）の値が所定値Ｒ１以上の場合に、ノイズ除去処理による強調処理をオンして、上述の割合Ｒ（ｋ）の値が所定値Ｒ１未満の場合に、ノイズ除去処理による強調処理をオフする。この場合、ノイズ除去処理による強調処理も、相関の算出結果に応じて収音信号Ｓ２（または収音信号Ｓ１）のレベル制御を行なう一態様に含まれる。

　図１５は、収音装置に接続される外部装置（ＰＣ：パーソナルコンピュータ）２の構成例を示すブロック図である。ＰＣ２は、Ｉ／Ｆ５１、ＣＰＵ５２、Ｉ／Ｆ５３、およびメモリ５４を備えている。Ｉ／Ｆ５１は、例えばＵＳＢインタフェースであり、収音装置１ＡのＩ／Ｆ１９に対してＵＳＢケーブルで接続される。Ｉ／Ｆ５３は、ＬＡＮ等の通信インタフェースであり、ネットワーク７に接続される。ＣＰＵ５２は、Ｉ／Ｆ５１を介して収音装置１Ａから収音信号を入力する。ＣＰＵ５２は、メモリ５４に記憶されているプログラムを読み出して、図１５に示すＶｏＩＰ（Voice over Internet Protocol）５２１の機能を実行する。ＶｏＩＰ５２１は、収音信号をパケットデータに変換する。ＣＰＵ５２は、ＶｏＩＰ５２１で変換したパケットデータを、Ｉ／Ｆ５３を介してネットワーク７に出力する。これにより、ＰＣ２は、ネットワーク７を介して接続される他装置と収音信号を送受信することができる。したがって、ＰＣ２は、例えば遠隔地と音声会議を行なうことができる。

　図１６は、収音装置１Ａの変形例を示すブロック図である。この変形例の収音装置１Ａは、ＣＰＵ１５１は、メモリ１５２からプログラムを読み出して、ＶｏＩＰ５２１の機能を実行する。この場合、Ｉ／Ｆ１９は、ＬＡＮ等の通信インタフェースであり、ネットワーク７に接続される。ＣＰＵ１５１は、Ｉ／Ｆ１９を介してＶｏＩＰ５２１で変換したパケットデータを、Ｉ／Ｆ５３を介してネットワーク７に出力する。これにより、収音装置１Ａは、ネットワーク７を介して接続される他装置と収音信号を送受信することができる。したがって、収音装置１Ａは、例えば遠隔地と音声会議を行なうことができる。

　図１７は、レベル制御部１５の構成を外部装置（サーバ）９に設ける場合の構成例を示すブロック図である。サーバ９は、Ｉ／Ｆ９１、ＣＰＵ９３、およびメモリ９４を備えている。Ｉ／Ｆ９１は、例えばＵＳＢインタフェースであり、収音装置１ＡのＩ／Ｆ１９に対してＵＳＢケーブルで接続される。

　この例では、収音装置１Ａは、レベル制御部１５を備えていない。ＣＰＵ１５１は、メモリ１５２からプログラムを読み出して、ＶｏＩＰ５２１の機能を実行する。この例では、ＶｏＩＰ５２１は、収音信号Ｓ１および収音信号Ｓ２を、それぞれパケットデータに変換する。または、ＶｏＩＰ５２１は、収音信号Ｓ１および収音信号Ｓ２を、１つのパケットデータに変換する。１つのパケットデータに変換する場合でも、収音信号Ｓ１および収音信号Ｓ２は、それぞれ区別して別のデータとしてパケットデータに格納される。

　この例では、Ｉ／Ｆ１９は、ＬＡＮ等の通信インタフェースであり、ネットワーク７に接続される。ＣＰＵ１５１は、Ｉ／Ｆ１９を介してＶｏＩＰ５２１で変換したパケットデータを、Ｉ／Ｆ５３を介してネットワーク７に出力する。

　サーバ９のＩ／Ｆ５３は、ＬＡＮ等の通信インタフェースであり、ネットワーク７に接続される。ＣＰＵ５２は、Ｉ／Ｆ９１を介して収音装置１Ａからパケットデータを入力する。ＣＰＵ５２は、メモリ５４に記憶されているプログラムを読み出して、ＶｏＩＰ９２の機能を実行する。ＶｏＩＰ９２は、パケットデータを収音信号Ｓ１および収音信号Ｓ２に変換する。また、ＣＰＵ９５は、メモリ９４からプログラムを読み出して、レベル制御部９５の機能を実行する。レベル制御部９５は、レベル制御部１５と同じ機能を有する。ＣＰＵ９３は、レベル制御部９５でレベル制御を行なった後の収音信号を再びＶｏＩＰ９２に出力する。ＣＰＵ９３は、ＶｏＩＰ９２において収音信号をパケットデータに変換する。ＣＰＵ９３は、ＶｏＩＰ９２で変換したパケットデータを、Ｉ／Ｆ９１を介してネットワーク７に出力する。例えば、ＣＰＵ９３は、収音装置１Ａの通信先にパケットデータを送信する。したがって、収音装置１Ａは、レベル制御部９５でレベル制御された後の収音信号を通信先に送信することができる。

　最後に、本実施形態の説明は、すべての点で例示であって、制限的なものではないと考えられるべきである。本発明の範囲は、上述の実施形態ではなく、特許請求の範囲によって示される。さらに、本発明の範囲は、特許請求の範囲と均等の範囲を含む。

１Ａ，１Ｂ…収音装置
１０Ａ，１０Ｂ，１０Ｃ…マイク
１５…レベル制御部
１９…Ｉ／Ｆ
２０…コヒーレンス算出部
２１…ゲイン制御部
２２…ゲイン調整部
２５，２６…指向性形成部
５０…強調処理部
５７…帯域分割部
５９…帯域合成部
７０…筐体
７５…コムフィルタ設定部
７６…コムフィルタ
２６１…減算部
２６２…選択部

Claims

　第１マイクから生成される第１収音信号および第２マイクから生成される第２収音信号の相関が閾値を超える周波数成分の割合に応じて前記第１収音信号または前記第２収音信号のレベル制御を行なう、レベル制御部、
　を備えた収音装置。
　前記第１マイクと、前記第２マイクと、
　を備えた請求項１に記載の収音装置。
　前記レベル制御部は、周波数毎に前記相関が前記閾値を超えるか否かを判定し、周波数成分の割合を求め、該閾値を超える周波数の数を集計した集計結果として、前記周波数成分の割合を求め、前記集計結果に応じて前記レベル制御を行なう、
　請求項１または請求項２に記載の収音装置。
　前記第１マイクおよび前記第２マイクの出力する音信号から、前記第１収音信号および前記第２収音信号を生成する、指向性形成部を備えた、
　請求項１乃至請求項３のいずれかに記載の収音装置。
　前記第１マイクおよび前記第２マイクは、指向性マイクであり、
　前記指向性形成部は、前記第１マイクおよび前記第２マイクから、指向性を有する前記第１収音信号と、無指向性の前記第２収音信号を生成する、
　請求項４に記載の収音装置。
　前記指向性形成部は、前記第１マイクおよび前記第２マイクの出力する音信号の遅延和を求めることにより、前記第１収音信号または前記第２収音信号を生成する、
　請求項４に記載の収音装置。
　前記レベル制御部は、
　ノイズ成分を推定し、前記レベル制御として、該推定したノイズ成分を前記第１収音信号または前記第２収音信号から除去する処理を行なう、
　請求項１乃至請求項６のいずれかに記載の収音装置。
　前記レベル制御部は、前記割合に応じて、前記ノイズ成分を除去する処理をオンまたはオフする、
　請求項７に記載の収音装置。
　前記レベル制御部は、人の声に基づく調波成分を除去するコムフィルタを備えた、
　請求項１乃至請求項８のいずれかに記載の収音装置。
　前記レベル制御部は、前記割合に応じて、前記コムフィルタによる処理をオンまたはオフする、
　請求項９に記載の収音装置。
　前記レベル制御部は、前記第１収音信号または前記第２収音信号のゲインを制御するゲイン制御部を備えた、
　請求項１乃至請求項１０のいずれかに記載の収音装置。
　前記レベル制御部は、前記割合が第１閾値未満となった場合に、前記割合に応じて前記ゲインを減衰させる、
　請求項１１に記載の収音装置。
　前記第１閾値は、所定時間内に算出された前記割合に基づいて決定される、
　請求項１２に記載の収音装置。
　前記レベル制御部は、前記割合が第２閾値未満となった場合に、前記ゲインを最小ゲインに設定する、
　請求項１１乃至請求項１３のいずれかに記載の収音装置。
　前記相関は、コヒーレンスを含む、
　請求項１乃至請求項１４のいずれかに記載の収音装置。
　第１マイクから生成される第１収音信号および第２マイクから生成される第２収音信号の相関が閾値を超える周波数成分の割合に応じて前記第１収音信号または前記第２収音信号のレベル制御を行なう、
　収音方法。
　周波数毎に前記相関が前記閾値を超えるか否かを判定し、周波数成分の割合を求め、該閾値を超える周波数の数を集計した集計結果として、前記周波数成分の割合を求め、前記集計結果に応じて前記レベル制御を行なう、
　請求項１６に記載の収音方法。
　前記第１マイクおよび前記第２マイクの出力する音信号から、前記第１収音信号および前記第２収音信号を生成する、
　請求項１６または請求項１７に記載の収音方法。
　前記第１マイクおよび前記第２マイクから、指向性を有する前記第１収音信号と、無指向性の前記第２収音信号を生成する、
　請求項１８に記載の収音方法。
　前記第１マイクおよび前記第２マイクの出力する音信号の遅延和を求めることにより、前記第１収音信号または前記第２収音信号を生成する、
　請求項１９に記載の収音方法。