WO2022038673A1

WO2022038673A1 - 収音装置、収音方法、プログラム

Info

Publication number: WO2022038673A1
Application number: PCT/JP2020/031121
Authority: WO
Inventors: 大将千葉; 賢一野口
Original assignee: 日本電信電話株式会社
Priority date: 2020-08-18
Filing date: 2020-08-18
Publication date: 2022-02-24

Abstract

ターゲットエリアが遠方に位置する場合において、音源強調性能を改善することができる収音装置を提供する。本発明の収音装置は、マイクロホンアレーから遠方に位置する所望の音源エリアに対し、中周波数帯域の特性に基づいて低周波数帯域の特性を補正することを特徴とする。

Description

収音装置、収音方法、プログラム

本発明は、方向性のある雑音源（干渉雑音源）に囲まれた所望の領域（以下、ターゲットエリア）に位置する音源（以下、目的音源）の音のみを強調し収音する収音装置、収音方法、プログラムに関する。

　この分野の従来技術として、例えば特許文献１～５などがある。例えば特許文献２の実施形態２の収音装置は、図１に例示する構成であって、２つのマイクロホンアレー３Ｌ、３Ｒと、６つ以上の収音部（同図の例では、第１～第６収音部４’－１～４’－６）と、周波数領域変換部５と、処理対象信号生成部１４０’と、パワースペクトル推定部７’と、利得係数算出部１３０’と、乗算部９と、逆周波数領域変換部１０を含む。図２は、特許文献２の実施形態２の収音装置の各収音部の設定を説明するための音源位置の領域を示す図である。図３は特許文献２の実施形態２の収音装置の動作フローである。

　第１収音部４’－１は、図２に示す角度領域Θ_Ｌ１の音を抑圧して収音する（Ｓ４’－１）。第３収音部４’－３は、図２に示す角度領域Θ_Ｌ２の音を抑圧して収音する（Ｓ４’－３）。第５収音部４’－５は、図２に示す角度領域Θ_Ｌ３の音を抑圧して収音する（Ｓ４’－５）。

　同様に、マイクロホンアレー３Ｒの第２収音部４’－２は、図２に示す角度領域Θ_Ｒ１の音を抑圧して収音する（Ｓ４’－２）。第４収音部４’－４は、図２に示す角度領域Θ_Ｒ２の音を抑圧して収音する（Ｓ４’－４）。第６収音部４’－６は、図２に示す角度領域Θ_Ｒ３の音を抑圧して収音する（Ｓ４’－６）。

　周波数領域変換部５は、各収音部４’－１～４’－６で収音された信号ｙ_ＬＬ（ｎ）、ｙ_ＬＲ（ｎ）、ｙ_ＣＬ（ｎ）、ｙ_ＣＲ（ｎ）、ｙ_ＲＬ（ｎ）、ｙ_ＲＲ（ｎ）を、周波数領域の信号Ｙ_ＬＬ（ω，ｌ）、Ｙ_ＬＲ（ω，ｌ）、Ｙ_ＣＬ（ω，ｌ）、Ｙ_ＣＲ（ω，ｌ）、Ｙ_ＲＬ（ω，ｌ）、Ｙ_ＲＲ（ω，ｌ）に変換する。

　処理対象信号生成部１４０’は、周波数領域の第１収音部４－１’からの信号Ｙ_ＬＬ（ω，ｌ）、第２収音部４－２’からの信号Ｙ_ＬＲ（ω，ｌ）、第５収音部４－５’からの信号Ｙ_ＲＬ（ω，ｌ）、第６収音部４－６’からの信号Ｙ_ＲＲ（ω，ｌ）を加算し、加算された信号Ｙ’_Ｓ（ω，ｌ）を４で割り、平均値を処理対象信号Ｙ_Ｓ（ω，ｌ）として出力する（Ｓ１４０’）。

　パワースペクトル推定部７’は、各収音部からの周波数領域の信号Ｙ_ＬＬ（ω，ｌ）、Ｙ_ＣＬ（ω，ｌ）、Ｙ_ＲＬ（ω，ｌ）、Ｙ_ＬＲ（ω，ｌ）、Ｙ_ＣＲ（ω，ｌ）、Ｙ_ＲＲ（ω，ｌ）から、パワー値｜Ｙ_ＬＬ（ω，ｌ）｜^２、｜Ｙ_ＣＬ（ω，ｌ）｜^２、｜Ｙ_ＲＬ（ω，ｌ）｜^２、｜Ｙ_ＬＲ（ω，ｌ）｜^２、｜Ｙ_ＣＲ（ω，ｌ）｜^２、｜Ｙ_ＲＲ（ω，ｌ）｜^２を計算し、パワー値をベクトル形式でまとめた、パワーベクトルＹ（ω，ｌ）を算出し、パワーベクトルＹ（ω，ｌ）とパワー推定行列Ｔ^＋に基づいて、推定信号パワーベクトルＸ_ｏｐｔ（ω，ｌ）を算出する（Ｓ７’）。利得係数算出部１３０’は、入力された推定信号パワーベクトルＸ_ｏｐｔ（ω，ｌ）を、推定信号パワー｜Ｓ（ω，ｌ）｜^２、推定左側方雑音パワー｜Ｎ_ＬＬ（ω，ｌ）｜^２、推定左方向雑音パワー｜Ｎ_Ｌ（ω，ｌ）｜^２、推定正面方向雑音パワー｜Ｎ_Ｃ（ω，ｌ）｜^２、推定右方向雑音パワー｜Ｎ_Ｒ（ω，ｌ）｜^２、推定右側方雑音パワー｜Ｎ_ＲＲ（ω，ｌ）｜^２としてそれぞれ出力し、推定信号パワー｜Ｓ（ω，ｌ）｜^２と処理対象信号Ｙ_Ｓ（ω，ｌ）から、第１ゲイン係数Ｇ_Ｓ（ω，ｌ）を計算し、推定信号パワー｜Ｓ（ω，ｌ）｜^２、推定左側方雑音パワー｜Ｎ_ＬＬ（ω，ｌ）｜^２、推定左方向雑音パワー｜Ｎ_Ｌ（ω，ｌ）｜^２、推定正面方向雑音パワー｜Ｎ_Ｃ（ω，ｌ）｜^２、推定右方向雑音パワー｜Ｎ_Ｒ（ω，ｌ）｜^２、推定右側方雑音パワー｜Ｎ_ＲＲ（ω，ｌ）｜^２から、第２ゲイン係数Ｇ_ＳＮＲ（ω，ｌ）を計算し、第１ゲイン係数Ｇ_Ｓ（ω，ｌ）と第２ゲイン係数Ｇ_ＳＮＲ（ω，ｌ）との積を利得係数Ｒ（ω，ｌ）として出力する（Ｓ１３０’）。

　乗算部９は、利得係数算出部１３０’で算出した利得係数Ｒ（ω，ｌ）を処理対象信号Ｙ_Ｓ（ω，ｌ）に乗算する（Ｓ９）。逆周波数領域変換部１０は、利得係数が乗算された処理対象信号Ｒ（ω，ｌ）Ｙ_Ｓ（ω，ｌ）を時間領域に変換する。上述の処理により時間周波数ビンごとに、干渉雑音源成分を抑圧した信号を取得できる。

特開２００９－００５２６１号公報特開２００９－０２５４９０号公報特開２０１０－０２６４８５号公報特開２０１３－１８３３５８号公報特開２０１６－１２７４５７号公報

　従来技術が抱える課題として、目的音源がマイクロホンアレーの遠方にあるほど、低周波における音声強調性能は劣化する、という課題がある。

　目的音源と干渉雑音源の相対位置が同じでも、マイクロホンアレーが目的音源の遠方に位置するほど目的音源、マイクロホンアレー、干渉雑音源のなす角は小さくなる。その結果、ビームフォーマで鋭い指向性を形成することが困難になる。すると、ビームフォーマの出力（ビーム出力）では目的音源と干渉雑音源の感度差が小さくなるため複数の音源が励起しやすい。ビーム出力で複数の音源が励起していると、音源間の干渉により局所パワースペクトル推定の混合モデルと実際の混合との近似誤差が大きくなるためパワースペクトル推定精度は劣化する。また、ビームフォーマの一般的性質として、低周波になるほどビームフォーマの指向性は鈍くなる。従って、低周波になるほど音声強調性能は劣化しやすい。

　そこで本発明では、ターゲットエリアが遠方に位置する場合において、音源強調性能を改善することができる収音装置を提供することを目的とする。

　本発明の収音装置は、マイクロホンアレーから遠方に位置する所望の音源エリアに対し、中周波数帯域の特性に基づいて低周波数帯域の特性を補正することを特徴とする。

　本発明の収音装置によれば、ターゲットエリアが遠方に位置する場合において、音源強調性能を改善することができる。

特許文献２の収音装置の構成例を示すブロック図。特許文献２の収音装置の各収音部の設定を説明するための音源位置の領域を示す図。特許文献２の収音装置の動作例を示すフローチャート。実施例１の収音装置の構成例を示すブロック図。実施例１の収音装置の動作例を示すフローチャート。実施例１の収音装置の推定値補正部の構成例を示すブロック図。実施例１の収音装置の推定値補正部の動作例を示すフローチャート。実施例１の収音装置の性能評価実験の結果（ＳＤＲ平均値）を示すグラフ。実施例１の収音装置の性能評価実験の実験条件を説明する図。実施例１の収音装置の性能評価実験の結果（低周波成分のみの信号のＳＤＲ平均値）を示すグラフ。コンピュータの機能構成例を示す図。

　以下、本発明の実施の形態について、詳細に説明する。なお、同じ機能を有する構成部には同じ番号を付し、重複説明を省略する。

　目的音源および干渉雑音源の周波数成分は偏在していないと仮定する。また、ビームフォーマの周波数方向における指向性の一般的性質から、F_lowからF_highまでの周波数（中周波数帯域）ではビームフォーマの指向性は十分に鋭く、またパワースペクトル推定値の推定精度も十分に高いと仮定する。

　ここで、中周波数帯域は、例えばF_low=0.1Fs,F_high=0.25Fsとする。ただし、Fsは標本化周波数である。

　ある時間フレームごとに、パワースペクトル推定部７’で算出したパワースペクトル推定値に含まれる中周波数帯域のパワースペクトル推定値を用いて、中周波数帯域の各領域のパワー比ρ_mid（以下、各領域のパワー比）を算出する。実施例１では、低周波において、複数の音源が励起している時間周波数ビンでは、音声強調性能が改善するような各領域のパワースペクトルの形状は各領域のパワー比ρ_midに近いと仮定する。そこで、各領域のパワー比から生成したパワースペクトル（補正用パワースペクトル）とパワースペクトル推定部７’で算出した各領域のパワースペクトル推定値を混合することでパワースペクトル推定値を補正する。すなわち、ビーム出力で複数の音源が励起している、もしくは、励起しやすい場合は、パワースペクトル推定部７’で算出したパワースペクトル推定値を補正用パワースペクトルに近づけることを意図している。

　本実施例の収音装置は、マイクロホンアレーから遠方に位置する所望の音源エリアに対し、中周波数帯域の特性に基づいて低周波数帯域の特性を補正することを特徴とする収音装置であって、各周波数領域の局所ＰＳＤを推定し、各周波数領域の中周波数帯域のパワー比で推定された局所ＰＳＤのうち低周波数帯域の局所ＰＳＤを補正し、補正された局所ＰＳＤに基づいてビームを形成する収音装置である。

　以下、図４を参照して実施例１の収音装置の構成を説明する。同図に示すように本実施例の収音装置は、特許文献２の収音装置が備える、２つのマイクロホンアレー３Ｌ、３Ｒと、６つ以上の収音部（同図の例では、第１～第６収音部４－１～４－６）と、周波数領域変換部５と、処理対象信号生成部１４０と、パワースペクトル推定部７と、利得係数算出部１３０と、乗算部９と、逆周波数領域変換部１０をすべて含み、さらにパワースペクトル推定部７の後段であって、利得係数算出部１３０の前段に、あらたに推定値補正部２０１を含む。また、図５に示すように、本実施例の収音装置は、特許文献２の収音装置の動作であるステップＳ４－１～Ｓ４－６、Ｓ１４０、Ｓ７、Ｓ１３０、Ｓ９を実行し、さらに、ステップＳ７、Ｓ１４０の後、かつステップＳ１３０の前にステップＳ２０１を実行する。

≪推定値補正部２０１≫
　推定値補正部２０１は、処理対象信号Y_S(ω,l)と、推定信号パワーベクトルX_opt(ω,l)を入力とし、補正した推定信号パワーベクトルX^_opt(ω,l)を出力する（Ｓ２０１）。

　中周波数帯域を[F_low,F_high)と定義する。また、Ω_low,Ω_highは、それぞれF_low,F_highに対応する周波数ビンインデックスとする。以下では、標本化周波数をFsとし、F_low=0.1Fs,F_high=0.25Fsとする。

　図６に示すように、推定値補正部２０１は、パワー比算出部２０１１と、混合係数算出部２０１２と、補正用パワーベクトル算出部２０１３と、パワースペクトル混合部２０１４を含む。

［推定値補正部２０１における処理の流れ］
　現在の時間フレームにおいて、パワー比算出部２０１１はステップＳ２０１１（後述）を実行する。

　ω＜Ω_lowの周波数ビン：混合係数算出部２０１２、補正用パワーベクトル算出部２０１３、パワースペクトル混合部２０１４は、ステップＳ２０１２、Ｓ２０１３、Ｓ２０１４（後述）を実行する。

　ω≧Ω_lowの周波数ビン：パワースペクトル混合部２０１４は、ステップＳ２０１４を実行する。

　以下、図７を参照して、ステップＳ２０１１～Ｓ２０１４の各動作を説明する。

＜パワー比算出部２０１１＞
　パワー比算出部２０１１は、特許文献２と同様に推定したパワーベクトルX_optを入力とし、パワーベクトルX_optのあらかじめ定めた中周波数帯域[F_low,F_high)の予め定めた各領域のパワー比ρ_midを算出する（Ｓ２０１１）。

　ただし、インデックス記号⇒ω:周波数ビン、l:時間フレーム、c:エリア、定数⇒Ω:周波数ビン数、L:時間フレーム数、C:エリア数とする。また、(z)[c]はベクトルzからインデックスcの要素を抽出する操作とする。

＜混合係数算出部２０１２＞
　混合係数算出部２０１２は、パワー比ρ_midのスパース性に基づく指標で混合係数のベクトルλ(ω,l)を算出する（Ｓ２０１２）。

例えば、以下のような式が考えられる。

　なお、g(・)は重みづけのための関数（恒等写像、べき関数など）であり、後述する実験結果では恒等写像とした。また、この実施例では、λ₀(ω,l)=λ₁(ω,l)=…=λ_C-1(ω,l)である。

　なお、中周波数帯域の各領域のパワー比ρ_midがスパースな時/スパースでないときに現実空間では以下の事象が起きている。

　時間フレームlにおける領域cのパワー比ρ_mid(l,c)について、ρ_mid(l,:)を時間フレームlにおける各領域のパワー比のベクトルとすると、現実の空間で、
・ρ_mid(l,:)がスパースな時：時間フレームlにおいて音源が励起している領域は少ない。

・ρ_mid(l,:)がスパースでないとき：時間フレームlにおいて音源が励起している領域は多い。

と考えられる。

　例えば、
・ρ_mid(l,0)＝1.0の場合、時間フレームlでは領域c＝0のみ音源が励起している。

・ρ_mid(l,0)＝ρ_mid(l,1)＝・・・＝ρ_mid(l,C-1)＝1/Cの場合、時間フレームlでは全ての領域で音源が励起している。

と考えられる。なお、前述したようにCはエリア数（領域の数）、また、ベクトルρ_mid(l,:)の要素の総和は1.0である。

＜補正用パワーベクトル算出部２０１３＞
　補正用パワーベクトル算出部２０１３は、パワー比ρ_mid(l,c)と、処理対象信号Y_S(ω,l)を入力とし、処理対象信号Y_S(ω,l)とパワー比ρ_mid(l,c)の積（次式）を補正用パワーベクトルX_modとして算出する（Ｓ２０１３）。

　X_mod,c(ω,l)は、X_mod(ω,l)のインデックスcにおける要素である。

＜パワースペクトル混合部２０１４＞
　パワースペクトル混合部２０１４は、ステップＳ７で推定したパワーベクトルX_opt(ω,l)と、補正用パワーベクトルX_mod(ω,l)と、混合係数のベクトルλ(ω,l)を入力とし、hを全ての要素が１のベクトルとし、混合係数のベクトルλ(ω,l)とパワーベクトルX_opt(ω,l)の要素ごとの積と、h-λと補正用パワーベクトルX_mod(ω,l)の要素ごとの積の和に基づいて補正後のパワーベクトルX^_opt(ω,l)を算出する。

　なお、〇は、ベクトルの要素ごとの積とする。hは、要素数がC個で、全ての要素が1であり、X_modと同じ要素数のベクトルとする。

　以下、特許文献２の収音装置と同様に、ステップＳ１３０で補正後のパワーベクトルＸ＾_ｏｐｔと処理対象信号Ｙ_Ｓから算出した周波数ごとの利得係数Ｒを、ステップＳ９で処理対象信号Ｙ_Ｓに乗算し、時間領域に変換して出力する。

［変形例］
　混合の比率は、各時間フレームや周波数ビンにおいて、複数の音源が励起しているか、もしくは、励起しやすいかを示す、以下の(1)～(3)の指標およびパラメタの内、少なくとも１つ以上を用いて決定すればよい。

(1)その時間フレームにおける各領域のパワー比のスパース性に関する指標（実施例１）
・各領域のパワー比のスパース性が低い。

⇒複数の音源が励起している。

⇒音源間の干渉により、低周波における音源強調性能は劣化すると考えられる。

(2)その周波数ビンにおけるゲイン行列T(ω)のスパース性に関する指標
・ビームフォーマの指向性が鈍い。

⇒ゲイン行列のスパース性が低い。

⇒ビーム出力で複数の音源が励起しやすい。

(3)目的音源と各マイクロホンアレー間の距離および２つのマイクロホンアレー間の距離
・２つのマイクロホンアレー間の距離が狭いほど目的音源がマイクロホンアレーの遠方に位置する場合は指向性の鋭いビームフォーマを構築することが難しい。

⇒ビーム出力で、複数の音源が励起しやすい。

　なお、上記実施例、変形例に記載したように、中周波数帯域の各領域のパワー比を、現在の時間フレームの該当周波数ビンのパワーの総和として算出することにかえて、過去の時間フレームのパワー値や、その統計量（平均、最小、最大値など）を利用して算出してもよい。

＜実施例１の収音装置の性能評価（１）＞
　実施例１の収音装置を計算機のシミュレーション実験（鏡像法）で評価した結果を図８に示す。実験条件（空間サイズと音源・マイクロホンアレーの位置）については図９に示すとおりである。目的音源から２つの直線マイクロホンアレーの中央までの距離dを0.5,1.0,・・・,3.5と0.5mずつ変化させて音源強調性能を比較した。ただし、目的音源と干渉雑音源間の相対位置は固定した。評価指標はSDR(信号対歪み比、参考非特許文献１)を用いた。

（参考非特許文献１：Vincent, Emmanuel, et.al., "Performance measurement in blind audio source separation,"IEEE trans. on ASLP 14(4) 1462-1469, 2006）
　SDRは数値が大きいほど音声強調性能が高いことを示す。目的音源がマイクロホンアレーの遠方に位置する場合、実施例１の収音装置は従来技術よりもSDR平均値、すなわち音源強調性能が改善することを確認した。

＜実施例１の収音装置の性能評価（２）＞
　以下の方法により、実施例１の収音装置の適用対象となる低周波成分のみの信号のSDRを算出した。強調信号x(n)、リファレンス信号x_ref(n)を短時間フーリエ変換する。周波数領域の強調信号X(ω,t)、リファレンス信号X_ref(ω,t)において、次式でω≧Ω_lowの成分を0とする。

　逆短時間フーリエ変換し、低周波成分のみの強調信号x_low(n)、リファレンス信号x_{ref_low}(n)を得る。x_low(n)とx_{ref_low}(n)からSDR（参考非特許文献１）を算出する。評価実験の結果を図１０に示す。

＜補記＞
　本発明の装置は、例えば単一のハードウェアエンティティとして、キーボードなどが接続可能な入力部、液晶ディスプレイなどが接続可能な出力部、ハードウェアエンティティの外部に通信可能な通信装置（例えば通信ケーブル）が接続可能な通信部、ＣＰＵ（Central Processing Unit、キャッシュメモリやレジスタなどを備えていてもよい）、メモリであるＲＡＭやＲＯＭ、ハードディスクである外部記憶装置並びにこれらの入力部、出力部、通信部、ＣＰＵ、ＲＡＭ、ＲＯＭ、外部記憶装置の間のデータのやり取りが可能なように接続するバスを有している。また必要に応じて、ハードウェアエンティティに、ＣＤ－ＲＯＭなどの記録媒体を読み書きできる装置（ドライブ）などを設けることとしてもよい。このようなハードウェア資源を備えた物理的実体としては、汎用コンピュータなどがある。

　ハードウェアエンティティの外部記憶装置には、上述の機能を実現するために必要となるプログラムおよびこのプログラムの処理において必要となるデータなどが記憶されている（外部記憶装置に限らず、例えばプログラムを読み出し専用記憶装置であるＲＯＭに記憶させておくこととしてもよい）。また、これらのプログラムの処理によって得られるデータなどは、ＲＡＭや外部記憶装置などに適宜に記憶される。

　ハードウェアエンティティでは、外部記憶装置（あるいはＲＯＭなど）に記憶された各プログラムとこの各プログラムの処理に必要なデータが必要に応じてメモリに読み込まれて、適宜にＣＰＵで解釈実行・処理される。その結果、ＣＰＵが所定の機能（上記、…部、…手段などと表した各構成要件）を実現する。

　本発明は上述の実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。また、上記実施形態において説明した処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されるとしてもよい。

　既述のように、上記実施形態において説明したハードウェアエンティティ（本発明の装置）における処理機能をコンピュータによって実現する場合、ハードウェアエンティティが有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記ハードウェアエンティティにおける処理機能がコンピュータ上で実現される。

　上述の各種の処理は、図１１に示すコンピュータの記録部１００２０に、上記方法の各ステップを実行させるプログラムを読み込ませ、制御部１００１０、入力部１００３０、出力部１００４０などに動作させることで実施できる。

　この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、ＤＶＤ（Digital Versatile Disc）、ＤＶＤ－ＲＡＭ（Random Access Memory）、ＣＤ－ＲＯＭ（Compact Disc Read Only Memory）、ＣＤ－Ｒ（Recordable）／ＲＷ（ReWritable）等を、光磁気記録媒体として、ＭＯ（Magneto-Optical disc）等を、半導体メモリとしてＥＥＰ－ＲＯＭ（Electrically Erasable and Programmable-Read Only Memory）等を用いることができる。

　また、このプログラムの流通は、例えば、そのプログラムを記録したＤＶＤ、ＣＤ－ＲＯＭ等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。

　このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録媒体に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるＡＳＰ（Application Service Provider）型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの（コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等）を含むものとする。

　また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、ハードウェアエンティティを構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。

Claims

　マイクロホンアレーから遠方に位置する所望の音源エリアに対し、中周波数帯域の特性に基づいて低周波数帯域の特性を補正することを特徴とする
　収音装置。
　請求項１に記載の収音装置であって、
　各周波数領域の局所ＰＳＤを推定し、各周波数領域の中周波数帯域のパワー比で推定された局所ＰＳＤのうち低周波数帯域の局所ＰＳＤを補正し、補正された局所ＰＳＤに基づいてビームを形成する
　収音装置。
　あらかじめ定めた１つ以上のマイクロホンからの信号または所望音源位置を含む角度領域を収音範囲とする特性に設定した収音部で収音した信号から生成した処理対象信号Ｙ_Ｓと、周波数ごとの所望音源の信号量とその他の音源の信号量であるパワーベクトルＸ_ｏｐｔを用いる請求項１または２に記載の収音装置であって、
　前記パワーベクトルＸ_ｏｐｔのあらかじめ定めた中周波数帯域［Ｆ_ｌｏｗ，Ｆ_ｈｉｇｈ）の予め定めた各領域のパワー比ρ_ｍｉｄを算出するパワー比算出部と、
　前記パワー比ρ_ｍｉｄのスパース性に基づく指標で混合係数のベクトルλを算出する混合係数算出部と、
　前記処理対象信号Ｙ_Ｓと前記パワー比ρ_ｍｉｄの積を補正用パワーベクトルＸ_ｍｏｄとして算出する補正用パワーベクトル算出部と、
　ｈを全ての要素が１のベクトルとし、前記混合係数のベクトルλと前記パワーベクトルＸ_ｏｐｔの要素ごとの積と、ｈ－λと前記補正用パワーベクトルＸ_ｍｏｄの要素ごとの積の和に基づいて補正後のパワーベクトルＸ＾_ｏｐｔを算出するパワースペクトル混合部を含み、
　前記補正後のパワーベクトルＸ＾_ｏｐｔと前記処理対象信号Ｙ_Ｓから算出した周波数ごとの利得係数Ｒを、前記処理対象信号Ｙ_Ｓに乗算する
　収音装置。
　収音装置が実行する収音方法であって、
　マイクロホンアレーから遠方に位置する所望の音源エリアに対し、中周波数帯域の特性に基づいて低周波数帯域の特性を補正することを特徴とする
　収音方法。
　コンピュータを請求項１から３の何れかに記載の収音装置として機能させるプログラム。