JP2021118461A - 収音装置、収音プログラム、及び収音方法 - Google Patents

収音装置、収音プログラム、及び収音方法 Download PDF

Info

Publication number
JP2021118461A
JP2021118461A JP2020011109A JP2020011109A JP2021118461A JP 2021118461 A JP2021118461 A JP 2021118461A JP 2020011109 A JP2020011109 A JP 2020011109A JP 2020011109 A JP2020011109 A JP 2020011109A JP 2021118461 A JP2021118461 A JP 2021118461A
Authority
JP
Japan
Prior art keywords
sound
correction coefficient
target area
target
level
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020011109A
Other languages
English (en)
Other versions
JP6908142B1 (ja
Inventor
一浩 片桐
Kazuhiro Katagiri
一浩 片桐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2020011109A priority Critical patent/JP6908142B1/ja
Application granted granted Critical
Publication of JP6908142B1 publication Critical patent/JP6908142B1/ja
Publication of JP2021118461A publication Critical patent/JP2021118461A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

【課題】効率的かつ安定的なエリア収音処理を行う収音装置を提供する。【解決手段】収音装置100は、複数のマイクロホンアレイMA1、MA2から供給される入力信号のビームフォーマに基づいて目的方向信号を取得し、各マイクロホンアレイMA1、MA2の目的音方向信号に含まれる目的エリア音成分を近づけるための補正係数を算出し、補正係数を用いてマイクロホンアレイMA1、MA2毎の目的方向信号を補正し、補正したマイクロホンアレイMA1、MA2毎の目的方向信号に基づいて目的エリア音を抽出し、目的エリア内の補正係数の分布を示す補正係数データと収音特性の分布を示す収音特性データを取得し、算出した補正係数と補正係数データとの比較に基づいて目的エリア音の音源位置を推定し、推定した音源位置と目的エリア内のスイートスポットの収音レベルの差を補正する補正係数を算出して抽出した目的エリア音を補正して出力する。【選択図】図1

Description

この発明は、収音装置、プログラム及び方法に関し、例えば、特定のエリアの音を強調し、それ以外のエリアの音を抑制するシステムに適用し得る。
複数の音源が存在する環境下において、ある特定方向の音のみ分離し収音する技術として、マイクロホンアレイを用いたビームフォーマ(Beam Former;以下「BF」とも呼ぶ)がある。BFとは、各マイクロホンに到達する信号の時間差を利用して指向性を形成する技術である(非特許文献1参照)。
従来、BFは、加算型と減算型の大きく2つの種類に分けられる。特に減算型BFは、加算型即に比べ、少ないマイクロホン数で指向性を形成できるという利点がある。
図8は、マイクロホンMの数が2個の場合の減算型BF200に係る構成を示すブロック図である。
図9は、2個のマイクロホンM1、M2を用いた減算型BF200により形成される指向性フィルタの例について示した説明図である。
減算型BF200は、まず遅延器210により目的とする方向に存在する音(以下、「目的音」と呼ぶ)が各マイクロホンM1、M2に到来する信号の時間差を算出し、遅延を加えることにより目的音の位相を合わせる。上述の時間差は以下の(1)式により算出することができる。
ここで、dはマイクロホンM1、M2間の距離、cは音速、τは遅延量である。またθは、各マイクロホンM(M1、M2)を結んだ直線に対する垂直方向から目的方向への角度である。
また、ここで、死角がマイクロホンM1とM2の中心に対し、マイクロホンM1の方向に存在する場合、遅延器210は、マイクロホンM1の入力信号x(t)に対し遅延処理を行う。その後、減算型BF200では、以下の(2)式に従い処理(減算処理)を行う。
減算型BF200の処理は周波数領域でも同様に行うことができ、その場合(2)式は以下の(3)のように変更される。
Figure 2021118461
ここでθ=±π/2の場合、減算型BF200により形成される指向性は図9(a)に示すように、カージオイド型の単一指向性となる。また、「θ=0,π」の場合、減算型BF200により形成される指向性は、図9(b)のような8の字型の双指向性となる。
以下では、入力信号から単一指向性を形成するフィルタを「単一指向性フィルタ」と呼び、双指向性を形成するフィルタを双指向性フィルタと呼ぶものとする。
また、減算器220では、スペクトル減算法(Spectral Subtraction;以下、単に、「SS」とも呼ぶ)を用いることで、双指向性の死角に強い指向性を形成することもできる。SSによる指向性は、以下の(4)式に従い全周波数、もしくは指定した周波数帯域で形成される。
以下の(4)式では、マイクロホンM1の入力信号Xを用いているが、マイクロホンM2の入力信号Xでも同様の効果を得ることができる。ここでβは、SSの強度を調節するための係数である。また、減算器220では、減算時に値がマイナスになった場合は、0または元の値を小さくした値に置き換えるフロアリング処理を行う。以上のような減算型BF200の処理方式では、双指向性の特性によって目的方向以外に存在する音(以下、「非目的音」と呼ぶ)を抽出し、抽出した非目的音の振幅スペクトルを入力信号の振幅スペクトルから減算することで、目的音を強調することができる。
Figure 2021118461
ある特定のエリア内に存在する音(以下、「目的エリア音」と呼ぶ)だけを収音したい場合、減算型BFを用いるだけでは、そのエリアの周囲に存在する音源の音(以下、「非目的エリア音」と呼ぶ)も収音してしまう可能性がある。そこで、特許文献1では、複数のマイクロホンアレイを用い、それぞれ別々の方向から目的エリアへ指向性を向け、指向性を目的エリアで交差させることで目的エリア音を収音する手法(以下、「エリア収音」と呼ぶ)を提案している。エリア収音では、まず各マイクロホンアレイのBF出力に含まれる目的エリア音の振幅スペクトルの比率を推定し、それを補正係数とする。
例えば、2つのマイクロホンアレイを使用する場合、目的エリア音振幅スペクトルの補正係数は、以下の(5)式及び(6)式の組み合わせ、又は以下の(7)式及び(8)式の組み合わせにより算出することができる。ここで、Y1k(n)は第1のマイクロホンアレイのBF出力の振幅スペクトルであり、Y2k(n)は第2のマイクロホンアレイのBF出力の振幅スペクトルであり、Nは周波数ビンの総数であり、kは周波数である。また、ここで、α(n)、α(n)は各BF出力に対する振幅スペクトル補正係数である。さらに、ここで、modeは最頻値を表し、medeianは中央値を表している。
Figure 2021118461
以上の処理により、減算器220は、振幅スペクトル補正係数α(n)、α(n)を求め、求めた補正係数により各BF出力を補正し、SSすることで、目的エリア方向に存在する非目的エリア音を抽出する。さらに、減算器220は、抽出した非目的エリア音を各BFの出力からSSすることにより目的エリア音を抽出することができる。
減算型BF200は、第1のマイクロホンアレイからみた目的エリア方向に存在する非目的エリア音N(n)を抽出際、例えば、(9)式に示すように、第1のマイクロホンアレイのBF出力Y(n)から第2のマイクロホンアレイのBF出力Y(n)に振幅スペクトル補正係数αを掛けたものをSSする。減算型BF200は、同様に、以下の(10)式に従い、第2のマイクロホンアレイからみた目的エリア方向に存在する非目的エリア音N(n)を抽出する。
その後、減算型BF200は、以下の(11)式、又は(12)式に従い、各BF出力から非目的エリア音をSSして目的エリア音を抽出する。なお、以下の(11)式は、第1のマイクロホンアレイを基準として、目的エリア音を抽出する場合の処理を示している。また、以下の(12)式は、第2のマイクロホンアレイを基準として目的エリア音を抽出する場合の処理を示している。ここでγ(n)、γ(n)は、SS時の強度を変更するための係数である。
Figure 2021118461
特開2014−072708号公報
浅野太著,"音響テクノロジーシリーズ16 音のアレイ信号処理−音源の定位・追跡と分離−",日本音響学会編,コロナ社,2011年2月25日発行
特許文献1の記載技術を適用した収音装置において、マイクロホンアレイMA1を基準として(11)式により目的エリア音を抽出する場合、目的エリア内で目的エリア音源が移動してマイクロホンアレイMA1から離れると、距離減衰のため出力音も小さくなってしまう。また声には指向性があるため、特許文献1の記載技術を適用した収音装置では、発話者の顔の向きによっても出力音量が変わってしまう。したがって、特許文献1の記載技術を適用した収音装置では、目的エリア内での目的エリア音源の位置や向きにより音量が小さくなると、受聴者が安定して聞き取れない恐れがある。
また、特許文献1の記載技術を適用した収音装置では、抽出した目的エリア音と非目的エリア音のSN比を算出して、最もSN比が高くなる出力を選択している。しかしながら、特許文献1の記載技術を適用した収音装置では、SN比が高くても目的エリア音の音量が小さい方が選択される場合があるため、音量の安定は保証されない。
以上のような問題に鑑み、効率的かつ安定的なエリア収音処理を行うことができる収音装置、プログラム及び方法が望まれている。
第1の本発明の収音装置は、(1)複数のマイクロホンアレイから供給される入力信号に基づく信号のそれぞれに対し、ビームフォーマによって目的エリアが存在する目的エリア方向へ指向性を形成して、前記マイクロホンアレイごとに前記目的エリア方向からの目的方向信号を取得する指向性形成手段と、(2)それぞれの前記マイクロホンアレイの目的音方向信号に含まれる目的エリア音の成分を近づけるための補正係数を算出する補正係数算出手段と、(3)前記補正係数算出手段で算出した補正係数を用いて、前記マイクロホンアレイ毎の目的方向信号を補正し、補正した前記マイクロホンアレイ毎の目的方向信号に基づいて前記目的エリア音を抽出する目的エリア音抽出手段と(4)少なくとも前記目的エリアを含む領域内における位置ごとの補正係数を記録した補正係数データを保持する補正係数データ保持手段と、(5)少なくとも前記目的エリアを含む領域内における位置ごとの前記目的エリア音の収音レベルを記録した収音特性データを保持する収音特性データ保持手段と、(6)前記補正係数算出手段が算出した補正係数と、前記補正係数データに記録された位置ごとの補正係数との比較結果を利用して前記目的エリア音の音源位置を推定する音源位置推定手段と、(7)前記収音特性データに基づいて、収音レベルが最大となるスイートスポットの位置の収音レベルと、前記音源位置推定手段が推定した音源位置の収音レベルとを取得し、前記スイートスポットの収音レベルと前記音源位置推定手段が推定した音源位置の収音レベルとのレベル差を補正する補正係数を算出し、前記レベル差を補正する補正係数を用いて前記目的エリア音抽出手段が抽出した前記目的エリア音を補正して出力する目的エリア音出力レベル補正手段とを有することを特徴とする。
第2の本発明の収音装プログラムは、コンピュータを、(1)複数のマイクロホンアレイから供給される入力信号に基づく信号のそれぞれに対し、ビームフォーマによって目的エリアが存在する目的エリア方向へ指向性を形成して、前記マイクロホンアレイごとに前記目的エリア方向からの目的方向信号を取得する指向性形成手段と、(2)それぞれの前記マイクロホンアレイの目的音方向信号に含まれる目的エリア音の成分を近づけるための補正係数を算出する補正係数算出手段と、(3)前記補正係数算出手段で算出した補正係数を用いて、前記マイクロホンアレイ毎の目的方向信号を補正し、補正した前記マイクロホンアレイ毎の目的方向信号に基づいて前記目的エリア音を抽出する目的エリア音抽出手段と(4)少なくとも前記目的エリアを含む領域内における位置ごとの補正係数を記録した補正係数データを保持する補正係数データ保持手段と、(5)少なくとも前記目的エリアを含む領域内における位置ごとの前記目的エリア音の収音レベルを記録した収音特性データを保持する収音特性データ保持手段と、(6)前記補正係数算出手段が算出した補正係数と、前記補正係数データに記録された位置ごとの補正係数との比較結果を利用して前記目的エリア音の音源位置を推定する音源位置推定手段と、(7)前記収音特性データに基づいて、収音レベルが最大となるスイートスポットの位置の収音レベルと、前記音源位置推定手段が推定した音源位置の収音レベルとを取得し、前記スイートスポットの収音レベルと前記音源位置推定手段が推定した音源位置の収音レベルとのレベル差を補正する補正係数を算出し、前記レベル差を補正する補正係数を用いて前記目的エリア音抽出手段が抽出した前記目的エリア音を補正して出力する目的エリア音出力レベル補正手段とを有することを特徴とする。
第3の本発明は、収音装置が行う収音装置において、(1)前記収音装置は、指向性形成手段、補正係数算出手段、目的エリア音抽出手段、収音特性データ保持手段、音源位置推定手段、及び目的エリア音出力レベル補正手段を有し、(2)前記指向性形成手段は、複数のマイクロホンアレイから供給される入力信号に基づく信号のそれぞれに対し、ビームフォーマによって目的エリアが存在する目的エリア方向へ指向性を形成して、前記マイクロホンアレイごとに前記目的エリア方向からの目的方向信号を取得し、(3)前記補正係数算出手段は、それぞれの前記マイクロホンアレイの目的音方向信号に含まれる目的エリア音の成分を近づけるための補正係数を算出し、(4)前記目的エリア音抽出手段は、前記補正係数算出手段で算出した補正係数を用いて、前記マイクロホンアレイ毎の目的方向信号を補正し、補正した前記マイクロホンアレイ毎の目的方向信号に基づいて前記目的エリア音を抽出し、(5)前記補正係数データ保持手段は、少なくとも前記目的エリアを含む領域内における位置ごとの補正係数を記録した補正係数データを保持し、(6)前記収音特性データ保持手段は、少なくとも前記目的エリアを含む領域内における位置ごとの前記目的エリア音の収音レベルを記録した収音特性データを保持し、(7)前記音源位置推定手段は、前記補正係数算出手段が算出した補正係数と、前記補正係数データに記録された位置ごとの補正係数との比較結果を利用して前記目的エリア音の音源位置を推定し、(8)前記目的エリア音出力レベル補正手段は、前記収音特性データに基づいて、収音レベルが最大となるスイートスポットの位置の収音レベルと、前記音源位置推定手段が推定した音源位置の収音レベルとを取得し、前記スイートスポットの収音レベルと前記音源位置推定手段が推定した音源位置の収音レベルとのレベル差を補正する補正係数を算出し、前記レベル差を補正する補正係数を用いて前記目的エリア音抽出手段が抽出した前記目的エリア音を補正して出力することを特徴とする。
本発明によれば、効率的かつ安定的なエリア収音処理を行うことができる。
実施形態に係る収音装置の機能的構成を示すブロック図である。 実施形態に係る収音装置のハードウェア構成の例について示したブロック図である。 ビームフォーマを用いたエリア収音の収音特性についてシミュレーションした結果を示したである。 目的エリアを含む領域内の各位置の振幅スペクトル補正係数の値を示した図(グラフ)である。 図4において、振幅スペクトル補正係数が設定帯域(約−3dBから3dB)の部分を明るく強調したグラフである。 図4において、振幅スペクトル補正係数が設定帯域(約−3dB)未満の部分を明るく強調したグラフである。 図4において、振幅スペクトル補正係数が設定帯域(約3dB)を超える部分を明るく強調したグラフである。 従来の減算型BFの構成を示すブロック図である。 従来の減算型BFにより形成される指向性フィルタの例について示した説明図である。
(A)主たる実施形態
以下、本発明による収音装置、収音プログラム及び収音方法の一実施形態を図面を参照して説明する。
(A−1)第1の実施形態の構成
図1は、第1の実施形態に係る収音装置100の機能的構成を示すブロック図である。
収音装置100は、2つのマイクロホンアレイMA(MA1、MA2)を用いて、目的エリアの音源からの目的エリア音を収音する目的エリア音収音処理を行う。以下では、マイクロホンアレイMA1、MA2を、それぞれ「第1のマイクロホンアレイMA1」、「第2のマイクロホンアレイMA2」とも呼ぶものとする。
マイクロホンアレイMA1、MA2は、目的エリアが存在する空聞の任意の場所に配置される。目的エリアに対するマイクロホンアレイMA1、MA2の位置は、指向性が目的エリアでのみ重なればどこでも良く、例えば目的エリアを挟んで対向に配置しても良い。各マイクロホンアレイは2つ以上のマイクロホンMから構成され、各マイクロホンMにより音響信号を収音する。この実施形態では、各マイクロホンアレイに、音響信号を収音する2つのマイクロホンM1、M2が配置されるものとして説明する。すなわち、この実施形態において、各マイクロホンアレイは、2chマイクロホンアレイを構成しているものとする。2個のマイクロホンM1、M2の間の距離は限定されないものであるが、この実施形態の例では、2個のマイクロホンM1、M2の間の距離は3cmとする。なお、マイクロホンアレイMAの数は2つに限定するものではなく、目的エリアが複数存在する場合、全てのエリアをカバーできる数のマイクロホンアレイMAを配置する必要がある。
次に、図1、図2を用いて収音装置100の内部構成について説明する。
図1に示す通り、収音装置100は、信号入力部101、指向性形成部102、遅延補正部103、空間座標データ記憶部104、補正係数算出部105、目的エリア音抽出部106、補正係数データ記憶部107、目的エリア音位置推定部108、収音特性データ記憶部109、及び目的エリア音出力レベル補正部110有している。
収音装置100は、全てハードウェア(例えば、専用チップ等)により構成するようにしてもよいし一部又は全部についてソフトウェア(プログラム)として構成するようにしてもよい。収音装置100は、例えば、プロセッサ及びメモリを有するコンピュータにプログラム(実施形態の収音プログラムを含む)をインストールすることにより構成するようにしてもよい。
次に、図2を用いて、収音装置100のハードウェア構成について説明する。
図2は、収音装置100のハードウェア構成の例について示したブロック図である。
収音装置100は、全てハードウェア(例えば、専用チップ等)により構成するようにしてもよいし一部又は全部についてソフトウェア(プログラム)として構成するようにしてもよい。収音装置100は、例えば、プロセッサ及びメモリを有するコンピュータにプログラム(実施形態の収音プログラムを含む)をインストールすることにより構成するようにしてもよい。
図2では、収音装置100を、ソフトウェア(コンピュータ)を用いて構成する際のハードウェア構成の例について示している。
図2に示す収音装置100は、ハードウェア的な構成要素として、プログラム(実施形態の収音プログラムを含む)がインストールされたコンピュータ200を有している。また、コンピュータ200は、収音プログラム専用のコンピュータとしてもよいし、他の機能のプログラムと共用される構成としてもよい。
図2に示すコンピュータ200は、プロセッサ201、一次記憶部202、及び二次記憶部203を有している。一次記憶部202は、プロセッサ201の作業用メモリ(ワークメモリ)として機能する記憶手段であり、例えば、DRAM(Dynamic Random Access Memory)等の高速動作するメモリを適用することができる。二次記憶部203は、OS(Operating System)やプログラムデータ(実施形態に係る収音プログラムのデータを含む)等の種々のデータを記録する記憶手段であり、例えば、FLASHメモリやHDD等の不揮発性メモリを適用することができる。この実施形態のコンピュータ200では、プロセッサ201が起動する際、二次記憶部203に記録されたOSやプログラム(実施形態に係る収音プログラムを含む)を読み込み、一次記憶部202上に展開して実行する。
なお、コンピュータ200の具体的な構成は図2の構成に限定されないものであり、種々の構成を適用することができる。例えば、一次記憶部202が不揮発メモリ(例えば、FLASHメモリ等)であれば、二次記憶部203については除外した構成としてもよい。
(A−2)実施形態の動作
次に、以上のような構成を有するこの実施形態の収音装置100の動作(実施形態に係る収音方法、及び収音プログラム)を説明する。
信号入力部101は、各マイクロホンアレイで収音した音響信号をアナログ信号からデジタル信号に変換し入力する処理を行う。信号入力部101は、その後、例えば高速フーリエ変換を用いて入力信号(デジタル信号)を、時間領域から周波数領域へ変換する。以下では、各マイクロホンアレイにおいて、マイクロホンM1、M2の周波数領域の入力信号を、それぞれX、Xとして説明する。
指向性形成部102は、マイクロホンアレイ毎に入力信号に対し、(4)式に従いBFにより目的エリア方向に指向性を形成する。以下では、マイクロホンアレイMA1、MA2のBF出力の振幅スペクトルを、それぞれY1k(n)、Y2k(n)として説明する。
空間座標データ記憶部104は、全ての目的エリアと、各マイクロホンアレイと、各マイクロホンアレイを構成するマイクロホンの位置情報を保持する。空間座標データ記憶部104が保持する位置情報には、各マイクロホンアレイの位置(例えば、各マイクロホンアレイの中心位置)、及び各マイクロホンの位置(例えば、各マイクロホンアレイを構成するマイクロホンの中心位置)に関する情報が含まれる。空間座標データ記憶部104が保持する位置情報には、例えば、各マイクロホンアレイを構成する各マイクロホンの位置、各マイクロホンアレイにおけるマイクロホン間の距離、各マイクロホンアレイの位置とマイクロホンアレイ間の距離、およびマイクロホンアレイ間を結んだ直線と各マイクロホンアレイの指向性の方向(目的エリア方向)との間の角度の情報を含むようにしてもよい。以下では、各マイクロホンアレイにおいて、マイクロホンアレイ間を結んだ直線と当該マイクロホンアレイの指向性の方向(目的エリア方向)との角度を「設定角度」と呼ぶものとする。この実施形態において、空間座標データ記憶部104に保持される位置情報には、マイクロホンアレイMA1、MA2の間の距離及び、マイクロホンアレイMA1、MA2の設定角度の情報が含まれているものとする。そして、この実施形態の例では、マイクロホンアレイMA1、MA2の間の距離は60cmで、マイクロホンアレイMA1、MA2の設定角度はいずれも45度であるものとして説明する。
遅延補正部103は、目的エリアと各マイクロホンアレイの距離の違いにより発生する遅延を算出して補正する。遅延補正部103は、まず、空間座標データ記憶部104から目的エリアの位置とマイクロホンアレイの位置を取得し、各マイクロホンアレイへの目的エリア音の到達時間の差を算出する。遅延補正部103は、次に最も目的エリアから遠い位置に配置されたマイクロホンアレイを基準として、全てのマイクロホンアレイに目的エリア音が同時に到達するように遅延を加える。
補正係数算出部105は、各BF出力に含まれる目的エリア音成分の振幅スペクトルを同じにする(近づける)ための振幅スペクトル補正係数を算出する。以下では、マイクロホンアレイMA1、MA2のBF出力に対する振幅スペクトル補正係数を、それぞれα(n)、α(n)として説明する。補正係数算出部105は、「(5)式、(7)式」または「(6)式、(8)式」に従い振幅スペクトル補正係数を算出する。主マイクロホンアレイ(目的エリア音の抽出に際して基準となる方のマイクロホンアレイ)がマイクロホンアレイMA1に設定される場合、補正係数算出部105は、(6)式、(8)式により振幅スペクトル補正係数α(n)を算出する。また、主マイクロホンアレイがマイクロホンアレイMA2に設定される場合、補正係数算出部105は、(5)式、(7)式により振幅スペクトル補正係数α(n)を算出する。
なお、収音装置100において、主マイクロホンアレイは、いずれかのマイクロホンアレイを任意に設定可能とするようにしてもよい。
以下では、補正係数算出部105が算出(例えば、直近/最新に算出)して出力した振幅スペクトル補正係数を「CF1」と表すものとする。目的エリア音抽出部106は、主マイクロホンアレイにマイクロホンアレイMA1が選択された場合振幅スペクトル補正係数CF1としてα(n)を算出し、主マイクロホンアレイにマイクロホンアレイMA2が選択された場合振幅スペクトル補正係数CF1としてα(n)を算出する。
目的エリア音抽出部106は、補正係数算出部105で算出した振幅スペクトル補正係数CF1により補正したBF出力を(9)式又は(10)式に従いSSし、目的エリア方向に存在する非目的エリア音を抽出する。さらに、目的エリア音抽出部106は、抽出した非目的エリア音を各BFの出力から(11)式又は(12)式に従いSSすることにより目的エリア音を抽出する。主マイクロホンアレイとしてマイクロホンアレイMA1が選択された場合、目的エリア音抽出部106は、算出した振幅スペクトル補正係数α(n)により各BF出力を(9)式に従いSSし、目的エリア方向に存在する非目的エリア音を抽出する。さらに、目的エリア音抽出部106は、抽出した非目的エリア音を各BFの出力から(11)式に従いSSすることにより目的エリア音を抽出する。一方、主マイクロホンアレイとしてマイクロホンアレイMA2が選択された場合、目的エリア音抽出部106は、振幅スペクトル補正係数α(n)により各BF出力を(10)式に従い目的エリア方向に存在する非目的エリア音を抽出し、抽出した非目的エリア音を各BFの出力から(12)式に従い目的エリア音を抽出する。
図3は、主マイクロホンアレイをマイクロホンアレイMA1に固定した場合において各位置の収音特性(目的エリア音抽出部106により抽出される目的エリア音の収音特性)の例(シミュレーション結果)を示した図(グラフ)である。
図3では、マイクロホンアレイMA1、MA2の位置、及びマイクロホンアレイMA1、MA2によるBFの指向性の交点の位置P1に星形の図形を付している。言い換えると、位置P1は、設計上の目的エリアの中心位置であると言える。そして、図3では、位置P1の周囲における目的エリア音の収音特性(目的エリア音振幅スペクトルの強度;単位は「dB」;以下、「出力レベル」又は「収音レベル」とも呼ぶ)の分布を示している。図3では、上述の出力レベルの大きさを当該領域の色の濃淡(点描の粗密)で示しており、濃度が濃い(点描の密度が高い)ほど、出力レベルの小さい領域であることを示している。言い換えると、図3では、濃度が薄い(点描の密度が低い)ほど、出力レベルの高い領域であることを示している。図3では、マイクロホンアレイMA1、MA2の間の中間点で、マイクロホンアレイMA1、MA2を結んだ線に直交する中心線L1を図示している。位置P1は中心線L1上に存在するものとする。図3では、出力レベルが同じ値となる線状の部分に白色の等高線を付している。図3では、グラフの右側に、グラフ内の出力レベルに対応するカラーチャート(パターンチャート)を付記している。
図3では、マイクロホンアレイMA1、MA2の間を通る線をL2と図示している。また、図3では、マイクロホンアレイMA1、MA2の指向性の方向(目的エリア方向)を、それぞれ線L3、L4としている。したがって、ここでは、マイクロホンアレイMA1の設定角度は線L2と線L3との間の角度となり、マイクロホンアレイMA2の設定角度は線L2と線L4との間の角度となる。ここでは、図3に示すように、マイクロホンアレイMA1、MA2の設定角度はそれぞれ45度とし、マイクロホンアレイMA1、MA2の間の距離を60cmに設定された例となっている。
図3のシミュレーション結果(従来の収音装置による収音結果)では、主マイクロホンアレイであるマイクロホンアレイMA1の側に出力レベルが偏っており、話者の位置、顔の向きによって出力レベルが小さくなる場合があることが分かる。すなわち、従来の収音装置を用いた場合、収音結果が聴者にとって聞き取りにくい内容となったり、収音結果を音声認識処理に入力した場合音声認識率が低下するおそれがある。言い換えると、従来の収音装置を用いた場合、話者の位置、顔の向きによって、収音特性のスイートスポットが中心線L1を中心として対称(左右対称)でないため、収音エリアの設定(調整)がしにくく、安定的な収音処理ができない場合がある。
補正係数データ記憶部107は、空間座標データ記憶部104に設定された各マイクロホンアレイの位置情報に基づき、目的エリア音を含む領域における位置毎の振幅スペクトル補正係数の値を、(5)、(6)式または(7)、(8)式に従いシミュレーションにより算出したデータ(以下、「補正係数データ」と呼ぶ)を保持する。補正係数データ記憶部107は、予め作成された補正係数データ(例えば、外部の図示しないコンピュータにより作成された補正係数データ)をデータベース(例えば、空間座標データ記憶部104で管理される位置ごとの振幅スペクトル補正係数)として保持するようにしてもよいし、収音装置100内で計算されたデータを保持するようにしてもよい。言い換えると、補正係数データ記憶部107には、空間座標データ記憶部104で管理される位置に応じた振幅スペクトル補正係数を取得可能なデータ(データベース)が保持されていれば、その具体的な構成については限定されないものである。
補正係数データに設定される解像度は限定されないものであるが、例えば、10cm〜20cmとしてもよい。なお、この実施形態では、補正係数データに設定される解像度(振幅スペクトル補正係数を保持する位置のグリッド幅)は空間座標データ記憶部104で保持される位置情報と同じであるものとする。
図4は、目的エリア音を含む領域における位置毎の振幅スペクトル補正係数の値(シミュレーション結果)の例について示したグラフである。
図4に示すシミュレーション結果の条件(例えば、マイクロホンアレイの位置情報等)は、上述の図3のシミュレーションと同様の条件となっているものとする。図4では、マイクロホンアレイMA1、MA2の位置、及びマイクロホンアレイMA1、MA2によるBFの指向性の交点の位置P1に星形の図形を付している。言い換えると、位置P1は、設計上の目的エリアの中心点であると言える。そして、図4では、位置P1の周囲における振幅スペクトル補正係数の値を示している。図4では、上述の振幅スペクトル補正係数の大きさを当該領域の色の濃淡(点描の粗密)で示しており、濃度が濃い(点描の密度が高い)ほど、振幅スペクトル補正係数の小さい領域であることを示している。言い換えると、図4では、濃度が薄い(点描の密度が低い)ほど、振幅スペクトル補正係数の高い領域であることを示している。図4では、マイクロホンアレイMA1、MA2の間の中間点で、マイクロホンアレイMA1、MA2を結んだ線に直交する中心線L1を図示している。位置P1は中心線L1上に存在するものとする。また、図4では、振幅スペクトルが同じ値となる線状の部分に白色の等高線を付している。さらに、図4では、グラフの右側に、グラフ内の振幅スペクトル補正係数に対応するカラーチャート(パターンチャート)を付記している。
目的エリア音位置推定部108は、補正係数算出部105で算出した振幅スペクトル補正係数CF1を、補正係数データ記憶部107から取得した補正係数データと照らし合わせて目的エリア音の発生源(音源)の位置(以下、「音源位置」と呼ぶ)を推定する。言い換えると、目的エリア音位置推定部108は、補正係数データから、振幅スペクトル補正係数CF1に対応する位置を音源位置の推定結果として取得する。言い換えると、目的エリア音位置推定部108は、補正係数データにより示される補正係数値の分布状況と振幅スペクトル補正係数CF1との比較結果に基づいて音源位置を推定する。以下では、目的エリア音位置推定部108が音源位置を推定する処理(以下、「音源位置推定処理」と呼ぶ)を行った結果取得された位置を「推定音源位置」とも呼ぶものとする。
収音装置100において主マイクロホンアレイがマイクロホンアレイMA1に設定される場合、目的エリア音位置推定部108は、(6)式もしくは(8)式に従い算出された振幅スペクトル補正係数CF1を用いて音源位置推定処理を行うことになる。また、収音装置100において主マイクロホンアレイがマイクロホンアレイMA2に設定される場合、目的エリア音位置推定部108は、(5)式もしくは(7)式に従い算出された振幅スペクトル補正係数CF1を用いて音源位置推定処理を行うことになる。
目的エリア音位置推定部108は、音源位置推定処理の精度を高めるために、例えば、以下の処理を追加するようにしてもよい。
まず、目的エリア音位置推定部108は、補正係数算出部105で算出した振幅スペクトル補正係数CF1を予め設定された帯域(以下、「設定帯域」と呼ぶ;上限及び又は下限の閾値により設定された帯域)と比較する。この実施形態において、設定帯域は、実験等により音源位置推定処理に適した範囲を適用することが望ましい。例えば、設定帯域は、デシベル表示であれば−3dB〜3dBの間としてもよい。この実施形態では、設定帯域は−3dB〜3dBの範囲であるものとして以下の説明を行う。
図5、図6、図7は、それぞれ図4に示す補正係数データ(シミュレーション結果)において、振幅スペクトル補正係数の値が、−3dB〜3dBの範囲内の領域(設定帯域の範囲内の領域)、−3dB未満の領域(設定帯域を下回る領域)、3dBを超える場合(設定帯域を上回る領域)について点描の密度を薄くして強調(ハイライト)し、それ以外の領域について点描の密度を濃くした状態で示す図となっている。また、図5〜図7では、振幅スペクトルが同じ値となる線状の部分に白色の等高線を付している。さらに、図5〜図7では、グラフの右側に、グラフ内の振幅スペクトル補正係数に対応するカラーチャート(パターンチャート)を付記している。
まず、補正係数算出部105で算出した振幅スペクトル補正係数CF1が、設定帯域の範囲内(−3dB〜3dB)であった場合における目的エリア音位置推定部108による音源位置推定処理の例について説明する。この場合、目的エリア音位置推定部108は、振幅スペクトル補正係数CF1と補正係数データとを照らし合わせて合致する位置(例えば、補正係数データ上で、振幅スペクトル補正係数CF1と一致する値又は最も近い値が設定された位置)に目的エリア音が存在すると推定するようにしてもよい。また、このとき、目的エリア音位置推定部108は、近似的に目的エリアの中心位置(位置P1)を推定音源位置(音源位置)とみなして取得するようにしてもよい。
次に、補正係数算出部105で算出した振幅スペクトル補正係数CF1が、設定帯域の範囲外(3dBより大きい又は−3dB未満の場合)における目的エリア音位置推定部108による音源位置推定処理の例について説明する。この場合、目的エリアの中心付近(位置P1の付近)よりも外側に音源位置が存在すると考えることができるが、図6、図7に示すように、音源位置がマイクロホンアレイの近くにある場合、振幅スペクトル補正係数CF1は、目的エリアの中心位置P1を挟んだ反対側で同じ値を取る可能性がある。すなわち、補正係数データ上で、振幅スペクトル補正係数CF1に合致する位置が2か所以上存在する場合には、いずれの位置も音源推定位置の候補となるため、単純に振幅スペクトル補正係数CF1と補正係数データとの比較だけでは音源位置を判別することができないことになる。
そこで、この実施形態の目的エリア音位置推定部108では、目的エリア音の音源位置が同じ位置に存在していても、主マイクロホンアレイがマイクロホンアレイMA1のときとマイクロホンアレイMA2のときで出力レベル(目的エリア音抽出部106で抽出される目的エリア音のレベル;以下、「収音レベル」とも呼ぶ)が異なるという特徴を利用して、音源位置を推定(複数の候補から絞り込む)する処理を行うものとする。上述の通り、図3は、主マイクロホンアレイがマイクロホンアレイMA1のときの収音特性であるが、主マイクロホンアレイがマイクロホンアレイMA2のときの収音特性は、この図の分布を反転したものになる。つまり、いずれかのマイクロホンアレイと近い位置に目的エリア音の音源位置が存在する場合、当該音源位置から近い方のマイクロホンアレイを主マイクロホンアレイとしたときの出力レベルは、スイートスポットに近いため大きくなる。逆に目的エリア音の音源位置から遠い方のマイクロホンアレイを主マイクロホンアレイとしたときの出力レベルは、スイートスポットから外れて小さくなる。すなわち、この場合、同じ位置でも主マイクロホンアレイを変更した場合の出力レベル差(以下、「DF1」と表す)は大きくなる。
一方、いずれのマイクロホンアレイからも離れた位置に目的エリア音の音源位置が存在する場合、どちらのマイクロホンアレイを主マイクロホンアレイとして処理しても、出力レベルは小さくなり、出力レベル差DF1も小さくなる。例えば、主マイクロホンアレイがマイクロホンアレイMA1で、かつ設定帯域を超えていた場合、目的エリア音抽出部106において、主マイクロホンアレイをマイクロホンアレイMA1として(11)式により処理した目的エリア音出力と、主マイクロホンアレイをマイクロホンアレイMA2として(12)式により処理した目的エリア音の出力レベル差DF1を算出するようにしてもよい。
そして、この実施形態の目的エリア音位置推定部108では、振幅スペクトル補正係数CF1が、設定帯域の範囲外の場合、例えば、以下のような手順で、複数の推定音源位置の候補(振幅スペクトル補正係数CF1が一致する位置;以下、「候補位置」と呼ぶ)から、最終的な推定音源位置を選択するようにしてもよい。このとき、目的エリア音位置推定部108は、例えば、出力レベル差DF1が一定値TL以上の場合、主マイクロホンアレイに近い方の候補位置に目的エリア音の音源位置が存在すると推定し、出力レベル差DF1が一定値TL未満の場合、主マイクロホンアレイの側から見て目的エリアの中心位置P1を挟んだ向かい側の位置に目的エリア音の音源位置が存在すると推定するようにしてもよい。なお、この実施形態において、TLの値は、実験等により音源位置推定処理に適した範囲を適用することが望ましい。
以上のように、目的エリア音位置推定部108は、振幅スペクトル補正係数CF1に基づいて目的エリアの音源位置を推定する音源位置推定処理を行う。
収音特性データ記憶部109は、マイクロホンアレイの位置の組み合わせに応じた収音特性に関するデータ(以下、「収音特性データ」と呼ぶ)をデータベースとして保持している。
収音特性データとしては、例えば、各マイクロホンアレイの位置情報に基づき、位置毎の出力レベル(抽出される目的エリア音のレベル)をシミュレーションにより算出して、位置毎(例えば、空間座標データ記憶部104に記憶されたデータで規定される座標毎)にマッピングしたデータを適用することができる。例えば、収音装置100では、予め各マイクロホンの位置情報の組み合わせごとに対応する収音特性の集合体を収音特性データとして収音特性データ記憶部109に登録しておいてもよいし、空間座標データ記憶部104から取得した各マイクロホンアレイの位置情報に基づいてシミュレーション処理を行って取得した収音特性を収音特性データとして保持するようにしてもよい。また、収音特性データには、各マイクロホンアレイの位置情報の組み合わせに対応するスイートスポット(シミュレーションにおいて目的エリア音の出力レベルが最大となる位置)の位置情報を含むようにしてもよい。
目的エリア音出力レベル補正部110は、収音特性データ記憶部109の収音特性データに基づき、推定音源位置の出力レベルと、スイートスポットの出力レベルを取得し、そのレベルの差分に基づき、推定音源位置の出力レベルをスイートスポットの出力レベルと同じく補正するための補正係数(以下、「出力レベル補正係数CF2」と呼ぶ)を算出する。そして、目的エリア音出力レベル補正部110は、目的エリア音抽出部106で抽出した目的エリア音に出力レベル補正係数CF2を掛けて出力する。
目的エリア音出力レベル補正部110が出力レベル補正係数CF2を算出する具体的な計算式は限定されないものであるが、上述の振幅スペクトル補正係数を算出するための式(例えば、上述の(6)式〜(8)式)と同様の式を当てはめて適用するようにしてもよい。
例えば、主マイクロホンアレイがマイクロホンアレイMA1である場合、目的エリア音出力レベル補正部110は、(6)式もしくは(8)式に従い算出したものを使用して推定音源位置の出力レベルを補正するための出力レベル補正係数CF2を算出するようにしてもよい。また、例えば、主マイクロホンアレイがマイクロホンアレイMA2である場合、目的エリア音出力レベル補正部110は、(5)式もしくは(7)式に従い算出したものを使用して推定音源位置の出力レベルを補正するための出力レベル補正係数CF2を算出するようにしてもよい。なお、目的エリア音位置推定部108において、推定した音源位置を全て目的エリアの中心と見なす場合、予めそのエリア中心とスイートスポットのレベル差をレベル補正係数として算出しておくようにしてもよい。
(A−3)実施形態の効果
この実施形態によれば、以下のような効果を奏することができる。
この実施形態の収音装置100では、目的エリア音振幅スペクトル補正係数に基づき、目的エリア音の位置を推定し、補正係数データ(収音特性のマップ)と照らし合わせ、推定位置の出力レベルがスイートスポットの出力レベルと同じ大きさになるように補正している。これにより、この実施形態では、目的エリア内での音量(目的エリア音出力レベル補正部110から出力される目的エリア音の出力レベル)が一定(例えば、スイートスポットと同じ音量)となるため、安定的な収音が可能となる。例えば、収音エリア内で話者が移動したり、話者の顔の向きが変わっても、安定的に同じ音量で収音することが可能となる。
ところで、振幅スペクトル補正係数は、もともとエリア内の目的エリア音が、2つのマイクロホンアレイに同じレベルで入力されるように補正するための係数である。それ故、振幅スペクトル補正係数は、目的エリア音の音源位置がどちらのマイクロホンアレイに近いかにより値が異なる。上述の通り、図4は、マイクロホンアレイMA1、MA2の間の距離は60cmで、マイクロホンアレイMA1、MA2の設定角度はいずれも45度とした場合において、目的エリア音の位置を変えて振幅スペクトル補正係数を算出し、各位置の振幅スペクトル補正係数の値の大きさをマッピングしたものである。そして、目的エリア音位置推定部108では、この特性を利用することで、上述の通り、図4の振幅スペクトル補正係数の分布に基き、振幅スペクトル補正係数から目的エリア音の位置を推定することができる。さらに、目的エリア音位置推定部108では、上述の通り、推定位置と図3及び図4とを照らし合わせることで、推定位置の出力レベルとスイートスポットとの出力レベル差を算出できる。
(B)他の実施形態
本発明は、上記の各実施形態に限定されるものではなく、以下に例示するような変形実施形態も挙げることができる。
(B−1)上記の実施形態において、マイクロホンアレイと目的エリア音の配置により、当初から遅延が発生しない場合は、遅延補正部103の処理を省略するようにしてもよい。
100…収音装置、101…信号入力部、102…指向性形成部、103…遅延補正部、104…空間座標データ記憶部、105…補正係数算出部、106…目的エリア音抽出部、107…補正係数データ記憶部、108…目的エリア音位置推定部、109…収音特性データ記憶部、110…目的エリア音出力レベル補正部、200…コンピュータ、201…プロセッサ、202…一次記憶部、203…二次記憶部、210…遅延器、220…減算器、M、M1、M2…マイクロホン、MA、MA1、MA2…マイクロホンアレイ。
第3の本発明は、収音装置が行う収音方法において、(1)前記収音装置は、指向性形成手段、補正係数算出手段、目的エリア音抽出手段、補正係数データ保持手段、収音特性データ保持手段、音源位置推定手段、及び目的エリア音出力レベル補正手段を有し、(2)前記指向性形成手段は、複数のマイクロホンアレイから供給される入力信号に基づく信号のそれぞれに対し、ビームフォーマによって目的エリアが存在する目的エリア方向へ指向性を形成して、前記マイクロホンアレイごとに前記目的エリア方向からの目的方向信号を取得し、(3)前記補正係数算出手段は、それぞれの前記マイクロホンアレイの目的音方向信号に含まれる目的エリア音の成分を近づけるための補正係数を算出し、(4)前記目的エリア音抽出手段は、前記補正係数算出手段で算出した補正係数を用いて、前記マイクロホンアレイ毎の目的方向信号を補正し、補正した前記マイクロホンアレイ毎の目的方向信号に基づいて前記目的エリア音を抽出し、(5)前記補正係数データ保持手段は、少なくとも前記目的エリアを含む領域内における位置ごとの補正係数を記録した補正係数データを保持し、(6)前記収音特性データ保持手段は、少なくとも前記目的エリアを含む領域内における位置ごとの前記目的エリア音の収音レベルを記録した収音特性データを保持し、(7)前記音源位置推定手段は、前記補正係数算出手段が算出した補正係数と、前記補正係数データに記録された位置ごとの補正係数との比較結果を利用して前記目的エリア音の音源位置を推定し、(8)前記目的エリア音出力レベル補正手段は、前記収音特性データに基づいて、収音レベルが最大となるスイートスポットの位置の収音レベルと、前記音源位置推定手段が推定した音源位置の収音レベルとを取得し、前記スイートスポットの収音レベルと前記音源位置推定手段が推定した音源位置の収音レベルとのレベル差を補正する補正係数を算出し、前記レベル差を補正する補正係数を用いて前記目的エリア音抽出手段が抽出した前記目的エリア音を補正して出力することを特徴とする。

Claims (4)

  1. 複数のマイクロホンアレイから供給される入力信号に基づく信号のそれぞれに対し、ビームフォーマによって目的エリアが存在する目的エリア方向へ指向性を形成して、前記マイクロホンアレイごとに前記目的エリア方向からの目的方向信号を取得する指向性形成手段と、
    それぞれの前記マイクロホンアレイの目的音方向信号に含まれる目的エリア音の成分を近づけるための補正係数を算出する補正係数算出手段と、
    前記補正係数算出手段で算出した補正係数を用いて、前記マイクロホンアレイ毎の目的方向信号を補正し、補正した前記マイクロホンアレイ毎の目的方向信号に基づいて前記目的エリア音を抽出する目的エリア音抽出手段と
    少なくとも前記目的エリアを含む領域内における位置ごとの補正係数を記録した補正係数データを保持する補正係数データ保持手段と、
    少なくとも前記目的エリアを含む領域内における位置ごとの前記目的エリア音の収音レベルを記録した収音特性データを保持する収音特性データ保持手段と、
    前記補正係数算出手段が算出した補正係数と、前記補正係数データに記録された位置ごとの補正係数との比較結果を利用して前記目的エリア音の音源位置を推定する音源位置推定手段と、
    前記収音特性データに基づいて、収音レベルが最大となるスイートスポットの位置の収音レベルと、前記音源位置推定手段が推定した音源位置の収音レベルとを取得し、前記スイートスポットの収音レベルと前記音源位置推定手段が推定した音源位置の収音レベルとのレベル差を補正する補正係数を算出し、前記レベル差を補正する補正係数を用いて前記目的エリア音抽出手段が抽出した前記目的エリア音を補正して出力する目的エリア音出力レベル補正手段と
    を有することを特徴とする収音装置。
  2. 前記マイクロホンアレイの位置情報を保持する位置情報保持手段をさらに備え、
    前記補正係数データ保持手段は、前記位置情報保持手段が保持した前記位置情報に基づいて算出された前記補正係数データを保持し、
    前記収音特性データ保持手段は、前記位置情報保持手段が保持した前記位置情報に基づいて算出された前記収音特性データを保持する
    ことを特徴とする請求項1に記載の収音装置。
  3. コンピュータを、
    複数のマイクロホンアレイから供給される入力信号に基づく信号のそれぞれに対し、ビームフォーマによって目的エリアが存在する目的エリア方向へ指向性を形成して、前記マイクロホンアレイごとに前記目的エリア方向からの目的方向信号を取得する指向性形成手段と、
    それぞれの前記マイクロホンアレイの目的音方向信号に含まれる目的エリア音の成分を近づけるための補正係数を算出する補正係数算出手段と、
    前記補正係数算出手段で算出した補正係数を用いて、前記マイクロホンアレイ毎の目的方向信号を補正し、補正した前記マイクロホンアレイ毎の目的方向信号に基づいて前記目的エリア音を抽出する目的エリア音抽出手段と
    少なくとも前記目的エリアを含む領域内における位置ごとの補正係数を記録した補正係数データを保持する補正係数データ保持手段と、
    少なくとも前記目的エリアを含む領域内における位置ごとの前記目的エリア音の収音レベルを記録した収音特性データを保持する収音特性データ保持手段と、
    前記補正係数算出手段が算出した補正係数と、前記補正係数データに記録された位置ごとの補正係数との比較結果を利用して前記目的エリア音の音源位置を推定する音源位置推定手段と、
    前記収音特性データに基づいて、収音レベルが最大となるスイートスポットの位置の収音レベルと、前記音源位置推定手段が推定した音源位置の収音レベルとを取得し、前記スイートスポットの収音レベルと前記音源位置推定手段が推定した音源位置の収音レベルとのレベル差を補正する補正係数を算出し、前記レベル差を補正する補正係数を用いて前記目的エリア音抽出手段が抽出した前記目的エリア音を補正して出力する目的エリア音出力レベル補正手段と
    して機能させることを特徴とする収音プログラム。
  4. 収音装置が行う収音装置において、
    前記収音装置は、指向性形成手段、補正係数算出手段、目的エリア音抽出手段、収音特性データ保持手段、音源位置推定手段、及び目的エリア音出力レベル補正手段を有し、
    前記指向性形成手段は、複数のマイクロホンアレイから供給される入力信号に基づく信号のそれぞれに対し、ビームフォーマによって目的エリアが存在する目的エリア方向へ指向性を形成して、前記マイクロホンアレイごとに前記目的エリア方向からの目的方向信号を取得し、
    前記補正係数算出手段は、それぞれの前記マイクロホンアレイの目的音方向信号に含まれる目的エリア音の成分を近づけるための補正係数を算出し、
    前記目的エリア音抽出手段は、前記補正係数算出手段で算出した補正係数を用いて、前記マイクロホンアレイ毎の目的方向信号を補正し、補正した前記マイクロホンアレイ毎の目的方向信号に基づいて前記目的エリア音を抽出し、
    前記補正係数データ保持手段は、少なくとも前記目的エリアを含む領域内における位置ごとの補正係数を記録した補正係数データを保持し、
    前記収音特性データ保持手段は、少なくとも前記目的エリアを含む領域内における位置ごとの前記目的エリア音の収音レベルを記録した収音特性データを保持し、
    前記音源位置推定手段は、前記補正係数算出手段が算出した補正係数と、前記補正係数データに記録された位置ごとの補正係数との比較結果を利用して前記目的エリア音の音源位置を推定し、
    前記目的エリア音出力レベル補正手段は、前記収音特性データに基づいて、収音レベルが最大となるスイートスポットの位置の収音レベルと、前記音源位置推定手段が推定した音源位置の収音レベルとを取得し、前記スイートスポットの収音レベルと前記音源位置推定手段が推定した音源位置の収音レベルとのレベル差を補正する補正係数を算出し、前記レベル差を補正する補正係数を用いて前記目的エリア音抽出手段が抽出した前記目的エリア音を補正して出力する
    ことを特徴とする収音方法。
JP2020011109A 2020-01-27 2020-01-27 収音装置、収音プログラム、及び収音方法 Active JP6908142B1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020011109A JP6908142B1 (ja) 2020-01-27 2020-01-27 収音装置、収音プログラム、及び収音方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020011109A JP6908142B1 (ja) 2020-01-27 2020-01-27 収音装置、収音プログラム、及び収音方法

Publications (2)

Publication Number Publication Date
JP6908142B1 JP6908142B1 (ja) 2021-07-21
JP2021118461A true JP2021118461A (ja) 2021-08-10

Family

ID=76918328

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020011109A Active JP6908142B1 (ja) 2020-01-27 2020-01-27 収音装置、収音プログラム、及び収音方法

Country Status (1)

Country Link
JP (1) JP6908142B1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115148203B (zh) * 2022-06-06 2024-09-24 青岛海尔科技有限公司 拾音校准方法、装置、非易失性存储介质及电子设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005303898A (ja) * 2004-04-15 2005-10-27 Nippon Telegr & Teleph Corp <Ntt> マイク位置決定方法、マイク位置決定装置、マイク位置決定プログラム
JP2015023508A (ja) * 2013-07-22 2015-02-02 沖電気工業株式会社 収音装置及びプログラム
JP2017022468A (ja) * 2015-07-07 2017-01-26 沖電気工業株式会社 収音装置、プログラム及び方法
JP2017183902A (ja) * 2016-03-29 2017-10-05 沖電気工業株式会社 収音装置及びプログラム
JP2019057901A (ja) * 2017-09-22 2019-04-11 沖電気工業株式会社 機器制御装置、機器制御プログラム、機器制御方法、対話装置、及びコミュニケーションシステム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005303898A (ja) * 2004-04-15 2005-10-27 Nippon Telegr & Teleph Corp <Ntt> マイク位置決定方法、マイク位置決定装置、マイク位置決定プログラム
JP2015023508A (ja) * 2013-07-22 2015-02-02 沖電気工業株式会社 収音装置及びプログラム
JP2017022468A (ja) * 2015-07-07 2017-01-26 沖電気工業株式会社 収音装置、プログラム及び方法
JP2017183902A (ja) * 2016-03-29 2017-10-05 沖電気工業株式会社 収音装置及びプログラム
JP2019057901A (ja) * 2017-09-22 2019-04-11 沖電気工業株式会社 機器制御装置、機器制御プログラム、機器制御方法、対話装置、及びコミュニケーションシステム

Also Published As

Publication number Publication date
JP6908142B1 (ja) 2021-07-21

Similar Documents

Publication Publication Date Title
CN108369811B (zh) 分布式音频捕获和混合
JP5482854B2 (ja) 収音装置及びプログラム
JP6065030B2 (ja) 収音装置、プログラム及び方法
JP6065028B2 (ja) 収音装置、プログラム及び方法
JP6187626B1 (ja) 収音装置及びプログラム
JP6131989B2 (ja) 収音装置、プログラム及び方法
JP6613078B2 (ja) 信号処理装置及びその制御方法
JP7194897B2 (ja) 信号処理装置及び信号処理方法
JP6763332B2 (ja) 収音装置、プログラム及び方法
JP6540730B2 (ja) 収音装置、プログラム及び方法、並びに、判定装置、プログラム及び方法
JP6908142B1 (ja) 収音装置、収音プログラム、及び収音方法
JP6436180B2 (ja) 収音装置、プログラム及び方法
JP6943120B2 (ja) 収音装置、プログラム及び方法
JP2016163135A (ja) 収音装置、プログラム及び方法
JP6863004B2 (ja) 収音装置、プログラム及び方法
JP6822505B2 (ja) 収音装置、収音プログラム及び収音方法
JP7158976B2 (ja) 収音装置、収音プログラム及び収音方法
JP6879340B2 (ja) 収音装置、収音プログラム、及び収音方法
JP6065029B2 (ja) 収音装置、プログラム及び方法
JP2022135110A (ja) 収音装置、収音プログラム、及び収音方法
JP6725014B1 (ja) 収音装置、収音プログラム及び収音方法
WO2018042773A1 (ja) 収音装置、記録媒体及び方法
JP6923025B1 (ja) 収音装置、プログラム及び方法
JP6624256B1 (ja) 収音装置、プログラム及び方法
JP7529065B1 (ja) 収音装置、収音プログラム及び収音方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200127

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210316

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210513

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210601

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210614

R150 Certificate of patent or registration of utility model

Ref document number: 6908142

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150