JP6923025B1 - 収音装置、プログラム及び方法 - Google Patents

収音装置、プログラム及び方法 Download PDF

Info

Publication number
JP6923025B1
JP6923025B1 JP2020030289A JP2020030289A JP6923025B1 JP 6923025 B1 JP6923025 B1 JP 6923025B1 JP 2020030289 A JP2020030289 A JP 2020030289A JP 2020030289 A JP2020030289 A JP 2020030289A JP 6923025 B1 JP6923025 B1 JP 6923025B1
Authority
JP
Japan
Prior art keywords
sound
target area
signal
area sound
microphone
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020030289A
Other languages
English (en)
Other versions
JP2021136528A (ja
Inventor
大 藤枝
大 藤枝
一浩 片桐
一浩 片桐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2020030289A priority Critical patent/JP6923025B1/ja
Application granted granted Critical
Publication of JP6923025B1 publication Critical patent/JP6923025B1/ja
Publication of JP2021136528A publication Critical patent/JP2021136528A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)

Abstract

【課題】 本発明によれば、より少ない歪みの目的エリア音を収音する収音装置、プログラム及び方法を提供することができる。【解決手段】 本発明は収音装置に関する。そして本発明の収音装置は、複数のマイクロホンアレイから入力された入力信号に基づいて、それぞれのマイクロホンアレイのビームフォーマ出力を取得し、取得したビームフォーマ出力を用いて目的エリアを音源とする目的エリア音を抽出する手段と、目的エリア音を用いて、入力信号から目的エリア音の成分を除去して非目的エリア音を抽出する手段と、それぞれのマイクロホンアレイを構成するそれぞれのマイクロホンの非目的エリア音を比較し、比較結果に基づく選択処理を行う手段と、抽出された目的エリア音成分に、選択結果に基づく混合信号を混合する手段と、混合した混合後信号を出力する出力手段とを有することを特徴とする。【選択図】 図1

Description

この発明は、収音装置、プログラム及び方法に関し、例えば、特定のエリアの音を強調し、それ以外のエリアの音を抑制するシステムに適用し得る。
複数の音源が存在する環境下において、ある特定方向の音のみ分離し収音する技術として、マイクロホンアレイを用いたビームフォーマ(Beam Former;以下「BF」とも呼ぶ)がある。BFとは、各マイクロホンに到達する信号の時間差を利用して指向性を形成する技術である(非特許文献1参照)。
従来、BFは、加算型と減算型の大きく2つの種類に分けられる。特に減算型BFは、加算型即に比べ、少ないマイクロホン数で指向性を形成できるという利点がある。
図4は、マイクロホンMの数が2個の場合の減算型BF200に係る構成を示すブロック図である。
図5は、2個のマイクロホンM1、M2を用いた減算型BF200により形成される指向性フィルタの例について示した説明図である。
減算型BF200は、まず遅延器210により目的とする方向に存在する音(以下、「目的音」と呼ぶ)が各マイクロホンM1、M2に到来する信号の時間差を算出し、遅延を加えることにより目的音の位相を合わせる。上述の時間差は以下の(1)式により算出することができる。
ここで、dはマイクロホンM1、M2間の距離、cは音速、τは遅延量である。またθは、各マイクロホンM(M1、M2)を結んだ直線に対する垂直方向から目的方向への角度である。
また、ここで、死角がマイクロホンM1とM2の中心に対し、マイクロホンM1の方向に存在する場合、遅延器210は、マイクロホンM1の入力信号x(t)に対し遅延処理を行う。その後、減算型BF200では、以下の(2)式に従い処理(減算処理)を行う。
減算型BF200の処理は周波数領域でも同様に行うことができ、その場合(2)式は以下の(3)のように変更される。
Figure 0006923025
ここでθ=±π/2の場合、減算型BF200により形成される指向性は図5(a)に示すように、カージオイド型の単一指向性となる。また、「θ=0,π」の場合、減算型BF200により形成される指向性は、図5(b)のような8の字型の双指向性となる。
以下では、入力信号から単一指向性を形成するフィルタを「単一指向性フィルタ」と呼び、双指向性を形成するフィルタを双指向性フィルタと呼ぶものとする。
また、減算器220では、スペクトル減算法(Spectral Subtraction;以下、単に、「SS」とも呼ぶ)を用いることで、双指向性の死角に強い指向性を形成することもできる。SSによる指向性は、以下の(4)式に従い全周波数、もしくは指定した周波数帯域で形成される。
以下の(4)式では、マイクロホンM1の入力信号Xを用いているが、マイクロホンM2の入力信号Xでも同様の効果を得ることができる。ここでβは、SSの強度を調節するための係数である。また、減算器220では、減算時に値がマイナスなった場合は、0または元の値を小さくした値に置き換えるフロアリング処理を行う。以上のような減算型BF200の処理方式では、双指向性の特性によって目的方向以外に存在する音(以下、「非目的音」と呼ぶ)を抽出し、抽出した非目的音の振幅スペクトルを入力信号の振幅スペクトルから減算することで、目的音を強調することができる。
Figure 0006923025
ある特定のエリア内に存在する音(以下、「目的エリア音」と呼ぶ)だけを収音したい場合、減算型BFを用いるだけでは、そのエリアの周囲に存在する音源の音(以下、「非目的エリア音」と呼ぶ)も収音してしまう可能性がある。そこで、特許文献1では、複数のマイクロホンアレイを用い、それぞれ別々の方向から目的エリアヘ指向性を向けレ指向性を目的エリアで交差させることで目的エリア音を収音する手法(以下、「エリア収音」と呼ぶ)を提案している。エリア収音では、まず各マイクロホンアレイのBF出力に含まれる目的エリア音の振幅スペクトルの比率を推定し、それを補正係数とする。
例えば、2つのマイクロホンアレイを使用する場合、目的エリア音振幅スペクトルの補正係数は、以下の(5)式及び(6)式の組み合わせ、又は以下の(7)式及び(8)式の組み合わせにより算出することができる。ここで、Y1k(n)は第1のマイクロホンアレイのBF出力の振幅スペクトルであり、Y2k(n)は第2のマイクロホンアレイのBF出力の振幅スペクトルであり、Nは周波数ビンの総数であり、kは周波数である。また、ここで、α(n)、α(n)は各BF出力に対する振幅スペクトル補正係数である。さらに、ここで、modeは最頻値を表し、medeianは中央値を表している。
Figure 0006923025
以上の処理により、減算器220は、補正係数α(n)、α(n)を求め、求めた補正係数により各BF出力を補正し、SSすることで、目的エリア方向に存在する非目的エリア音を抽出する。さらに、減算器220は、抽出した非目的エリア音を各BFの出力からSSすることにより目的エリア音を抽出することができる。
減算型BF200は、第1のマイクロホンアレイからみた目的エリア方向に存在する非目的エリア音N(n)を抽出する際、例えば、(9)式に示すように、第1のマイクロホンアレイのBF出力Y(n)から第2のマイクロホンアレイのBF出力Y(n)に振幅スペクトル補正係数αを掛けたものをSSする。減算型BF200は、同様に、以下の(10)式に従い、第2のマイクロホンアレイからみた目的エリア方向に存在する非目的エリア音N(n)を抽出する。
その後、減算型BF200は、以下の(11)式、又は(12)式に従い、各BF出力から非目的エリア音をSSして目的エリア音を抽出する。なお、以下の(11)式は、第1のマイクロホンアレイを基準として、目的エリア音を抽出する場合の処理を示している。また、以下の(12)式は、第2のマイクロホンアレイを基準として目的エリア音を抽出する場合の処理を示している。ここでγ(n)、γ(n)は、SS時の強度を変更するための係数である。
Figure 0006923025
以上のように、特許文献1に記載の技術は、複数のマイクロホンアレイで構成され、各マイクロホンアレイはビームフォーマによって目的エリア方向への指向性を形成し、すべてのビームフォーマ出力に含まれる目的エリア音のパワーが等しくなるようにパワーを補正し、それぞれのビームフォーマ出力をスペクトル減算することで非目的エリア音を抽出し、各ビームフォーマ出力から非目的エリア音をスペクトル減算することで、目的エリア音を抽出する。
ところで、背景雑音や非目的エリア音の音量レベルが大きい場合、目的エリア音抽出の際に行うSSにより、目的エリア音が歪んだり、ミュージカルノイズという耳障りな異音が発生したりする可能性がある。
そこで、特許文献2の手法では、背景雑音と非目的エリア音の大きさに応じて、マイクの入力信号と推定雑音の音量レベルをそれぞれ調節し、抽出した目的エリア音に混合している。
特開2014−72708号公報 特開2017−183902号公報
浅野太著、"音響テクノロジーシリーズ16 音のアレイ信号処理−音源の定位・追跡と分離−"、日本音響学会編、コロナ社、2011年2月25日発行
しかしながら、特許文献2の手法では、目的エリアの近くに非目的エリア音が存在する場合、混合する入力信号のレベルを下げるため、非目的エリア音の混入は抑えることができるが、目的エリア音の歪みを改善する効果は低くなってしまう。
そのため、より少ない歪みの目的エリア音を収音する収音装置、プログラム及び方法が望まれている。
第1の本発明は、(1)複数のマイクロホンアレイから入力された入力信号に基づいて、それぞれの前記マイクロホンアレイのビームフォーマ出力を取得し、取得した前記ビームフォーマ出力を用いて目的エリアを音源とする目的エリア音を抽出する目的エリア音抽出手段と、(2)前記目的エリア音を用いて、前記入力信号から前記目的エリア音の成分を除去して非目的エリア音を抽出する非目的エリア音抽出手段と、(3)それぞれの前記マイクロホンアレイを構成するそれぞれのマイクロホンの前記非目的エリア音を比較し、比較結果に基づく選択処理を行う選択手段と、(4)前記目的エリア音抽出手段で抽出された目的エリア音成分に、前記選択手段の選択結果に基づく混合信号を混合する信号混合手段と、(5)前記信号混合手段が混合した混合後信号を出力する出力手段とを有することを特徴とする。
第2の本発明の収音プログラムは、コンピュータを、(1)複数のマイクロホンアレイから入力された入力信号に基づいて、それぞれの前記マイクロホンアレイのビームフォーマ出力を取得し、取得した前記ビームフォーマ出力を用いて目的エリアを音源とする目的エリア音を抽出する目的エリア音抽出手段と、(2)前記目的エリア音を用いて、前記入力信号から前記目的エリア音の成分を除去して非目的エリア音を抽出する非目的エリア音抽出手段と、(3)それぞれの前記マイクロホンアレイを構成するそれぞれのマイクロホンの前記非目的エリア音を比較し、比較結果に基づく選択処理を行う選択手段と、(4)前記目的エリア音抽出手段で抽出された目的エリア音成分に、前記選択手段の選択結果に基づく混合信号を混合する信号混合手段と、(5)前記信号混合手段が混合した混合後信号を出力する出力手段として機能させることを特徴とする。
第3の本発明は、収音装置が行う収音方法において、(1)前記収音装置は、選択手段、目的エリア音抽出手段、非目的エリア音抽出手段、信号混合手段、及び出力手段を有し、(2)前記目的エリア音抽出手段は、複数のマイクロホンアレイから入力された入力信号に基づいて、それぞれの前記マイクロホンアレイのビームフォーマ出力を取得し、取得した前記ビームフォーマ出力を用いて目的エリアを音源とする目的エリア音を抽出し、(3)前記非目的エリア音抽出手段は、前記目的エリア音を用いて、前記入力信号から前記目的エリア音の成分を除去して非目的エリア音を抽出し、(4)前記選択手段は、それぞれの前記マイクロホンアレイを構成するそれぞれのマイクロホンの前記非目的エリア音を比較し、比較結果に基づく選択処理を行い、(5)前記信号混合手段は、前記目的エリア音抽出手段で抽出された目的エリア音成分に、前記選択手段の選択結果に基づく混合信号を混合し、(6)前記信号混合手段は、前記選択手段が混合した混合後信号を出力することを特徴とする。
本発明によれば、より少ない歪みの目的エリア音を収音する収音装置、プログラム及び方法を提供することができる。
第1の実施形態に係る収音装置の機能的構成について示したブロック図である。 第1の実施形態に係る収音装置のハードウェア構成について示したブロック図である。 第2の実施形態に係る収音装置の機能的構成について示したブロック図である。 従来のマイクロホン数が2個の場合の減算型BFに係る構成を示すブロック図である。 従来の2個のマイクロホンを用いた減算型BFにより形成される指向特性を示す図である。
(A)第1の実施形態
以下、本発明による収音装置、プログラム及び方法の第1の実施形態を、図面を参照しながら詳述する。
(A−1)第1の実施形態の構成
図1は、この実施形態の収音装置100の機能的構成について示したブロック図である。
収音装置100は、2つのマイクロホンアレイMA(MA1、MA2)を用いて、目的エリアの音源からの目的エリア音を収音する目的エリア音収音処理を行う。
マイクロホンアレイMA1、MA2は、目的エリアが存在する空間の任意の場所に配置される。目的エリアに対するマイクロホンアレイMA1、MA2の位置は、指向性が目的エリアでのみ重なればどこでも良く、例えば目的エリアを挟んで対向に配置しても良い。各マイクロホンアレイMAは2つ以上のマイクロホンMから構成され、各マイクロホンMにより音響信号を収音する。この実施形態では、各マイクロホンアレイMAに、音響信号を収音する2つのマイクロホンM(M1、M2)が配置されるものとして説明する。すなわち、各マイクロホンアレイMAは、2chマイクロホンアレイを構成している。なお、マイクロホンアレイMAの数は2つに限定するものではなく、目的エリアが複数存在する場合、全てのエリアをカバーできる数のマイクロホンアレイMAを配置する必要がある。
次に、収音装置100の内部構成について説明する。
収音装置100は、信号入力部101、雑音抑圧部102、指向性形成部103、遅延補正部104、空間座標データ105、補正係数算出部106、目的エリア音抽出部107、非目的エリア音抽出部108、混合成分選択部109、信号混合部110、及び信号出力部111を備える。なお、収音装置100を構成する各機能ブロックの詳細処理については後述する。
次に、収音装置100のハードウェア構成の例について説明する。
収音装置100は、全てハードウェア(例えば、専用チップ等)により構成するようにしてもよいし一部又は全部についてソフトウェア(プログラム)として構成するようにしてもよい。収音装置100は、例えば、プロセッサ及びメモリを有するコンピュータにプログラム(実施形態の収音プログラムを含む)をインストールすることにより構成するようにしてもよい。
図2は、収音装置100のハードウェア構成の例について示したブロック図である。
図2では、収音装置100を、ソフトウェア(コンピュータ)を用いて構成する際のハードウェア構成の例について示している。
図2に示す収音装置100は、ハードウェア的な構成要素として、プログラム(実施形態の収音プログラムを含む)がインストールされたコンピュータ300を有している。また、コンピュータ300は、収音プログラム専用のコンピュータとしてもよいし、他の機能のプログラムと共用される構成としてもよい。
図2に示すコンピュータ300は、プロセッサ301、一次記憶部302、及び二次記憶部303を有している。一次記憶部302は、プロセッサ301の作業用メモリ(ワークメモリ)として機能する記憶手段であり、例えば、DRAM(Dynamic Random Access Memory)等の高速動作するメモリを適用することができる。二次記憶部303は、OS(Operating System)やプログラムデータ(実施形態に係る収音プログラムのデータを含む)等の種々のデータを記録する記憶手段であり、例えば、FLASHメモリやHDDやSSD等の不揮発性メモリを適用することができる。この実施形態のコンピュータ300では、プロセッサ301が起動する際、二次記憶部303に記録されたOSやプログラム(実施形態に係る収音プログラムを含む)を読み込み、一次記憶部302上に展開して実行する。
なお、コンピュータ300の具体的な構成は図2の構成に限定されないものであり、種々の構成を適用することができる。例えば、一次記憶部302が不揮発メモリ(例えば、FLASHメモリ等)であれば、二次記憶部303については除外した構成としてもよい。
(A−2)第1の実施形態の動作
次に、以上のような構成を有する第1の実施形態の収音装置100の動作(実施形態に係る収音方法)を説明する。
信号入力部101は、各マイクロホンアレイで収音した音響信号をアナログ信号からデジタル信号に変換し入力する。その後、例えば高速フーリエ変換を用いて時間領域から周波数領域へ変換する。
雑音抑圧部102は、信号入力部101で取得した信号に含まれる背景雑音の成分を推定し、抑圧する。雑音抑圧部102による雑音抑圧には、例えば、SSやウィーナーフィルタリング法(Wiener Filltering)などを用いることができる。
指向性形成部103は、マイクロホンアレイ毎に雑音抑圧部により背景雑音を抑圧した信号に対し、(4)式に従いBFにより目的エリア方向に指向性を形成する。
遅延補正部104は、目的エリアと各マイクロホンアレイの距離の違いにより発生する遅延を算出し、補正する。遅延補正部104は、まず空間座標データ105から目的エリアの位置と各マイクロホンアレイの位置を取得し、各マイクロホンアレイヘの目的エリア音の到達時間の差を算出する。次に最も目的エリアから遠い位置に配置されたマイクロホンアレイを基準として、全てのマイクロホンアレイに目的エリア音が同時に到達するように遅延を加える。
空間座標データ105は、全ての目的エリアと各マイクロホンアレイを構成するマイクロホンの位置情報を保持している。空間座標データ105が各マイクロホンアレイの各マイクロホンの位置情報を保持する方法や、空間座標データ105が保持する位置情報の具体的な形式は限定されないものであり、種々のデータ形式を適用することができる。
補正係数算出部106は、各BF出力に含まれる目的エリア音成分の振幅スペクトルを同じにするための補正係数を(5)、(6)式または(7)、(8)式に従い算出する。
目的エリア音抽出部107は、補正係数算出部106で算出した補正係数により補正した各BF出力データを(9)、もしくは(10)式に従いSSし、目的エリア方向に存在する非目的エリア音を抽出する。さらに、目的エリア音抽出部107は、抽出した雑音を各BFの出力から(11)、もしくは(12)式に従いSSすることにより目的エリア音を抽出する。
非目的エリア音抽出部108は、(9)式、(10)式に従いSSし、各マイクロホンアレイ(MA1、MA2)の各マイクロホン(M1、M2)の入力信号に含まれる目的エリア音を除去して非目的エリア音を抽出する。
以下では、マイクロホンアレイMA1を構成するマイクロホンM1、M2の入力信号の振幅スペクトルを、それぞれX11(n)、X12(n)と表し、マイクロホンアレイMA2を構成するマイクロホンM1、M2の入力信号の振幅スペクトルをそれぞれ、X21(n)、X22(n)と表すものとする。また、以下では、X11(n)、X12(n)、X21(n)、X22(n)に含まれる非目的エリア音の振幅スペクトルを、それぞれΞ11(n)、Ξ12(n)、Ξ21(n)、Ξ22(n)と表すものとする。
そうすると、Ξ11(n)、Ξ12(n)、Ξ21(n)、Ξ22(n)は、それぞれ(13)式〜(16)式で求めることができる。
Figure 0006923025
混合成分選択部109は、(17)式のように、抽出された非目的エリア音Ξ11(n)、Ξ12(n)、Ξ21(n)、Ξ22(n)を周波数成分毎に比較し、最も振幅スペクトルが小さいマイクロホンを選択する。そして、(18)式のように、選択されたマイクロホンの入力信号の振幅スペクトルの周波数成分を、混合信号成分とする。
ここで、kは、周波数(周波数成分の識別子)である。また、収音装置100(混合成分選択部109、信号混合部110)において、信号処理に用いる周波数の帯域(kの範囲)は、上限と下限を設けて制限しても良い。ここでは、I及びiはマイクロホンアレイの識別番号を示し、J及びjはマイクロホンの識別番号を示している。また、ここでは、マイクロホンアレイMA1、MA2の識別番号を、それぞれ1、2とする。さらにまた、ここでは、各マイクロホンアレイにおいてマイクロホンM1、M2の識別番号を、それぞれ1、2とする。
Figure 0006923025
なお、例えば、混合成分選択部109は、周波数kについて、(17)式でマイクロホンアレイMA1のいずれかのマイクロホンが選択された場合、(19)式に従い、マイクロホンアレイMA1を構成するマイクロホンの入力信号成分(X11k(n)とX12k(n))の加算平均を混合信号成分としても良い。また、例えば、混合成分選択部109は、周波数kについて、マイクロホンアレイMA2のいずれかのマイクロホンが選択された場合、同様にマイクロホンアレイMA2を構成するマイクロホンの入力信号成分(X21k(n)とX22k(n))の加算平均を混合信号成分としても良い。
Figure 0006923025
信号混合部110は、目的エリア音抽出部107で抽出した目的エリア音の成分に、混合成分選択部109で周波数毎に選択した入力信号成分(周波数ごとに選択された入力信号成分を集合させた信号;この実施形態において、「混合信号」と呼ぶ)を混合する。例えば、信号混合部110が、式(11)に従いマイクロホンアレイMA1を基準としてエリア収音を行う場合、最終的な出力W1k(n)は以下の(20)式に従い混合される。ここでμは、混合する信号(混合信号)の成分の大きさを調整するパラメータである。μは全周波数で一定でも良いし、周波数毎に変えても良い。
Figure 0006923025
以上のように、信号混合部110は、混合を行った出力信号に位相を復元する際、位相情報は、目的エリア音抽出部において基準としたマイクロホンアレイを構成するマイクロホンの入力信号の加算平均、もしくはどれか1つのマイクロホンの入力信号を使用する。
また、信号混合部110は、混合信号として選択した入力信号の位相情報を出力信号に反映しても良い。例えば、(11)式を用いて目的エリア音が抽出された場合、信号混合部110は、マイクロホンアレイMA1を基準としているので、入力信号成分X11k(n)とX12k(n)の加算平均、又は、X11k(n)若しくはX12k(n)のどちらかの位相情報を用いて、出力信号に位相を復元するようにしてもよい。
さらに、信号混合部110において、信号の混合処理は、目的エリア音と混合信号の振幅スペクトルに、それぞれ位相情報を復元した後に行っても良い。この場合、信号混合部110では、位相復元に使用する情報は、目的エリア音と混合信号で別々にすることができる。例えば、信号混合部110において、目的エリア音には、目的エリア音抽出部107において基準としたマイクロホンアレイを構成するマイクロホンの入力信号成分の加算平均、もしくはマイクロホンアレイを構成するマイクロホンの内どれか1つ入力信号成分を使用するようにしてもよい。また、信号混合部110において、混合信号には、混合信号成分として選択した入力信号成分の位相を使用するようにしてもよい。
そして、信号出力部111は、信号混合部110において処理した出力信号を、周波数領域から時間領域へ変換し、出力する。
以上のように、第1の実施形態では、混合信号として、各マイクロホンの入力信号から抽出された非目的エリア音の振幅スペクトルを周波数毎に比較し、最も振幅スペクトルが小さいマイクロホンの入力信号の振幅スペクトルの周波数成分を、混合信号成分として選択する。
(A−3)第1の実施形態の効果
第1の実施形態によれば、以下のような効果を奏することができる。
第1の実施形態の収音装置100では、各マイクロホンアレイについて抽出された非目的エリア音の周波数成分毎に、振幅スペクトルの小さいマイクロホンアレイを選択することで、目的エリアの近くに非目的エリア音が存在する場合においても、混合後の非目的エリア音の混入を抑え、目的エリア音の歪みを改善することができる。
(B)第2の実施形態
以下、本発明による収音装置、プログラム及び方法の第2の実施形態を、図面を参照しながら詳述する。
(B−1)第2の実施形態の構成
図3は、第2の実施形態に係る収音装置100Aの機能的構成について示した図である。図3では、上述の図1と同一部分又は対応部分には、同一符号又は対応符号を付している。
第2の実施形態の収音装置100Aでは、混合成分選択部109と信号混合部110が混合成分選択部109Aと信号混合部110Aに置き換わっている点で第1の実施形態と異なっている。
(B−2)第2の実施形態の動作
次に、以上のような構成を有する第2の実施形態の収音装置100Aの動作を説明する。
以下では、第2の実施形態の収音装置100Aの動作について、第1の実施形態との差異を中心に説明する。
第2の実施形態では、混合成分選択部109Aと信号混合部110Aのみが異なっているので、以下では、混合成分選択部109Aと信号混合部110Aに関係する動作のみを説明する。
混合成分選択部109Aは、(21)式のように、抽出された非目的エリア音Ξ11(n)、Ξ12(n)、Ξ21(n)、Ξ22(n)の平均振幅スペクトルを比較し、最も平均振幅スペクトルが小さいマイクロホンを選択する。そして、混合成分選択部109Aは、(22)式のように、選択されたマイクロホンの入力信号を、混合信号とする。ここで、I及びiはマイクロホンアレイの識別番号を示し及び、J及びjはマイクロホンの識別番号を示している。また、ここでは、マイクロホンアレイMA1、MA2の識別番号を、それぞれ1、2とする。さらに、ここでは、各マイクロホンアレイにおいてマイクロホンM1、M2の識別番号を、それぞれ1、2とする。
すなわち、混合成分選択部109Aは、非目的エリア音Ξ11(n)、Ξ12(n)、Ξ21(n)、Ξ22(n)のそれぞれについて平均振幅スペクトルを算出し、最も平均振幅スペクトルが小さい非目的エリア音に対応するマイクロホンを選択し、選択したマイクロホンの入力信号を混合信号とする。具体的には、例えば、混合成分選択部109Aは、Ξ11(n)の平均振幅スペクトルが最も小さい場合、マイクロホンアレイMA1のマイクロホンM1を選択し、入力信号X11(n)を混合信号とすることになる。
なお、式(21)において、「Ξ」(大文字のグザイ)の上に「 ̄」(バー)が付記された記号が存在するが、明細書上では使用可能な文字の都合上「 ̄Ξ」と表記するものとする。
ここで、 ̄Ξij(n)はΞij(n)の平均振幅スペクトル(振幅スペクトルの全周波数成分の平均値)である。なお、平均振幅スペクトルは、全帯域でなく、平均する周波数の上限と下限を設けて帯域制限しても良い。
そして、混合成分選択部109Aは、(22)式のように、選択されたマイクロホンの入力信号を、混合信号とする。
Figure 0006923025
なお、例えば、混合成分選択部109は、(21)式で、マイクロホンアレイMA1のいずれかのマイクロホンが選択された場合、(23)式に従い、マイクロホンアレイMA1を構成するマイクロホンM1、M2の入力信号(X11(n)とX12(n))の加算平均を混合信号とするようにしても良い。さらに、例えば、混合成分選択部109は、(21)式で、マイクロホンアレイMA2のいずれかのマイクロホンが選択された場合、同様にマイクロホンアレイMA2を構成するマイクロホンM1、M2の入力信号(X21(n)とX22(n))の加算平均を混合信号とするようにしても良い。
Figure 0006923025
信号混合部110Aは、目的エリア音抽出部107で抽出した目的エリア音に、混合成分選択部109で選択された入力信号を混合する。例えば、信号混合部110Aが、式(11)に従いマイクロホンアレイMA1を基準としてエリア収音を行う場合、最終的な出力W(n)は、(24)式に従い混合される。ここで、μは混合する信号の大きさを調整するパラメータである。
Figure 0006923025
信号混合部110Aでは、混合を行った出力信号に位相を復元する際、位相情報としては、第1の実施形態と同様に、目的エリア音抽出部107において基準としたマイクロホンアレイを構成するマイクロホンの入力信号の加算平均や、どれか1つのマイクロホンの入力信号等を使用するようにしてもよい。さらに、信号混合部110Aでは、位相情報として、混合信号として選択した入力信号の位相等を使用しても良い。
以上のように、第2の実施形態では、混合信号として、各マイクロホンの入力信号から抽出された非目的エリア音の平均振幅スペクトルを比較し、最も平均振幅スペクトルが小さいマイクロホンの入力信号を選択して混合信号とする。
(B−3)第2の実施形態の効果
第2の実施形態によれば、以下のような効果を奏することができる。
第2の実施形態の収音装置100Aでは、各マイクロホンアレイについて抽出された非目的エリア音の平均振幅スペクトルの小さいマイクロホンアレイを選択することで、目的エリアの近くに非目的エリア音が存在する場合においても、混合後の非目的エリア音の混入を抑え、目的エリア音の歪みを改善することができる。
(C)他の実施形態
本発明は、上記の各実施形態に限定されるものではなく、以下に例示するような変形実施形態も挙げることができる。
(C−1)上記の各実施形態の収音装置では、収音に用いる各マイクロホンアレイMAのマイクロホンの数は2つであったが、3つ以上のマイクを用いて収音した音響信号に基づいて目的エリア方向の音を収音するようにしてもよい。上記の各実施形態において、適用するマイクロホンアレイMA毎のマイクロホンの数や目的音方向の音を収音する方式については、既存の種々の方式を適用することができる。
100…収音装置、M1、M2…マイクロホン、MA1、MA2…マイクロホンアレイ、101…信号入力部、102…雑音抑圧部、103…指向性形成部、104…遅延補正部、105…空間座標データ、106…補正係数算出部、108…非目的エリア音抽出部、109…混合成分選択部、110…信号混合部、111…信号出力部。

Claims (7)

  1. 複数のマイクロホンアレイから入力された入力信号に基づいて、それぞれの前記マイクロホンアレイのビームフォーマ出力を取得し、取得した前記ビームフォーマ出力を用いて目的エリアを音源とする目的エリア音を抽出する目的エリア音抽出手段と、
    前記目的エリア音を用いて、前記入力信号から前記目的エリア音の成分を除去して非目的エリア音を抽出する非目的エリア音抽出手段と、
    それぞれの前記マイクロホンアレイを構成するそれぞれのマイクロホンの前記非目的エリア音を比較し、比較結果に基づく選択処理を行う選択手段と、
    前記目的エリア音抽出手段で抽出された目的エリア音成分に、前記選択手段の選択結果に基づく混合信号を混合する信号混合手段と、
    前記信号混合手段が混合した混合後信号を出力する出力手段と
    を有することを特徴とする収音装置。
  2. 前記選択手段は、周波数毎に、それぞれの前記マイクロホンアレイを構成するそれぞれの前記マイクロホンの前記非目的エリア音の成分を比較して、いずれかの前記マイクロホンの入力信号の成分を、前記混合信号の成分として選択し、
    前記信号混合手段は、前記目的エリア音抽出手段で抽出された前記目的エリア音成分に、前記選択手段で周波数ごとに選択された成分により前記混合信号を構成して混合する、
    ことを特徴とする請求項1に記載の収音装置。
  3. 前記選択手段は、それぞれの前記マイクロホンアレイを構成するそれぞれの前記マイクロホンの前記非目的エリア音の成分が最も振幅スペクトルが小さい前記マイクロホンの入力信号の成分を混合信号の成分として選択することを特徴とする請求項2に記載の収音装置。
  4. 前記選択手段は、それぞれの前記マイクロホンアレイを構成するそれぞれの前記マイクロホンの前記非目的エリア音の平均振幅スペクトルを比較して、いずれかの前記マイクロホンの前記入力信号を、前記混合信号として選択し、
    前記信号混合手段は、前記目的エリア音抽出手段で抽出された前記目的エリア音に、前記選択手段で選択された前記入力信号を前記混合信号として混合する
    ことを特徴とする請求項1に記載の収音装置。
  5. 前記選択手段は、それぞれの前記マイクロホンアレイを構成するそれぞれの前記マイクロホンの前記非目的エリア音の前記平均振幅スペクトルが最も小さい前記マイクロホンの入力信号を混合信号として選択することを特徴とする請求項4に記載の収音装置。
  6. コンピュータを、
    複数のマイクロホンアレイから入力された入力信号に基づいて、それぞれの前記マイクロホンアレイのビームフォーマ出力を取得し、取得した前記ビームフォーマ出力を用いて目的エリアを音源とする目的エリア音を抽出する目的エリア音抽出手段と、
    前記目的エリア音を用いて、前記入力信号から前記目的エリア音の成分を除去して非目的エリア音を抽出する非目的エリア音抽出手段と、
    それぞれの前記マイクロホンアレイを構成するそれぞれのマイクロホンの前記非目的エリア音を比較し、比較結果に基づく選択処理を行う選択手段と、
    前記目的エリア音抽出手段で抽出された目的エリア音成分に、前記選択手段の選択結果に基づく混合信号を混合する信号混合手段と、
    前記信号混合手段が混合した混合後信号を出力する出力手段と
    して機能させることを特徴とする収音プログラム。
  7. 収音装置が行う収音方法において、
    前記収音装置は、選択手段、目的エリア音抽出手段、非目的エリア音抽出手段、信号混合手段、及び出力手段を有し、
    前記目的エリア音抽出手段は、複数のマイクロホンアレイから入力された入力信号に基づいて、それぞれの前記マイクロホンアレイのビームフォーマ出力を取得し、取得した前記ビームフォーマ出力を用いて目的エリアを音源とする目的エリア音を抽出し、
    前記非目的エリア音抽出手段は、前記目的エリア音を用いて、前記入力信号から前記目的エリア音の成分を除去して非目的エリア音を抽出し、
    前記選択手段は、それぞれの前記マイクロホンアレイを構成するそれぞれのマイクロホンの前記非目的エリア音を比較し、比較結果に基づく選択処理を行い、
    前記信号混合手段は、前記目的エリア音抽出手段で抽出された目的エリア音成分に、前記選択手段の選択結果に基づく混合信号を混合し、
    前記信号混合手段は、前記選択手段が混合した混合後信号を出力する
    することを特徴とする収音方法。
JP2020030289A 2020-02-26 2020-02-26 収音装置、プログラム及び方法 Active JP6923025B1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020030289A JP6923025B1 (ja) 2020-02-26 2020-02-26 収音装置、プログラム及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020030289A JP6923025B1 (ja) 2020-02-26 2020-02-26 収音装置、プログラム及び方法

Publications (2)

Publication Number Publication Date
JP6923025B1 true JP6923025B1 (ja) 2021-08-18
JP2021136528A JP2021136528A (ja) 2021-09-13

Family

ID=77269546

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020030289A Active JP6923025B1 (ja) 2020-02-26 2020-02-26 収音装置、プログラム及び方法

Country Status (1)

Country Link
JP (1) JP6923025B1 (ja)

Also Published As

Publication number Publication date
JP2021136528A (ja) 2021-09-13

Similar Documents

Publication Publication Date Title
JP5482854B2 (ja) 収音装置及びプログラム
JP6065028B2 (ja) 収音装置、プログラム及び方法
JP6131989B2 (ja) 収音装置、プログラム及び方法
JP5772151B2 (ja) 音源分離装置、プログラム及び方法
JP6540730B2 (ja) 収音装置、プログラム及び方法、並びに、判定装置、プログラム及び方法
JP6763332B2 (ja) 収音装置、プログラム及び方法
JP6943120B2 (ja) 収音装置、プログラム及び方法
JP2016163135A (ja) 収音装置、プログラム及び方法
JP6436180B2 (ja) 収音装置、プログラム及び方法
JP6923025B1 (ja) 収音装置、プログラム及び方法
JP6908142B1 (ja) 収音装置、収音プログラム、及び収音方法
JP6725014B1 (ja) 収音装置、収音プログラム及び収音方法
JP6624256B1 (ja) 収音装置、プログラム及び方法
WO2018042773A1 (ja) 収音装置、記録媒体及び方法
JP6260666B1 (ja) 収音装置、プログラム及び方法
JP6822505B2 (ja) 収音装置、収音プログラム及び収音方法
JP6863004B2 (ja) 収音装置、プログラム及び方法
JP6065029B2 (ja) 収音装置、プログラム及び方法
JP6624255B1 (ja) 収音装置、プログラム及び方法
JP6879340B2 (ja) 収音装置、収音プログラム、及び収音方法
JP6669219B2 (ja) 収音装置、プログラム及び方法
JP6885483B1 (ja) 収音装置、収音プログラム及び収音方法
JP7158976B2 (ja) 収音装置、収音プログラム及び収音方法
JP2024027617A (ja) 音声認識装置、音声認識プログラム、音声認識方法、収音装置、収音プログラム及び収音方法
JP7207170B2 (ja) 収音装置、収音プログラム、収音方法、及び収音システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200226

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210413

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210614

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210629

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210712

R150 Certificate of patent or registration of utility model

Ref document number: 6923025

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150