JP2018170717A - 収音装置、プログラム及び方法 - Google Patents

収音装置、プログラム及び方法 Download PDF

Info

Publication number
JP2018170717A
JP2018170717A JP2017068486A JP2017068486A JP2018170717A JP 2018170717 A JP2018170717 A JP 2018170717A JP 2017068486 A JP2017068486 A JP 2017068486A JP 2017068486 A JP2017068486 A JP 2017068486A JP 2018170717 A JP2018170717 A JP 2018170717A
Authority
JP
Japan
Prior art keywords
gain
sound
target area
directivity
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017068486A
Other languages
English (en)
Other versions
JP6763332B2 (ja
Inventor
大 藤枝
Masaru Fujieda
大 藤枝
一浩 片桐
Kazuhiro Katagiri
一浩 片桐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2017068486A priority Critical patent/JP6763332B2/ja
Publication of JP2018170717A publication Critical patent/JP2018170717A/ja
Application granted granted Critical
Publication of JP6763332B2 publication Critical patent/JP6763332B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)
  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)

Abstract

【課題】 より演算量で、事前に決定しなければならないパラメータなしに、マイク及びマイクアレイそれぞれの数と配置に制限されることなく目的エリア音のみを強調することができる。
【解決手段】 複数のマイクアレイが出力する捕捉信号を周波数領域に変換した入力信号のそれぞれに対し、ビームフォーマによって目的エリア音方向へ指向性を形成する際の指向性ゲインを取得する指向性ゲイン算出手段と、それぞれのマイクアレイの指向性ゲインに基づいて目的エリア音を強調するエリア強調ゲインを取得するエリア強調ゲイン算出手段と、マイクアレイの入力信号と、エリア強調ゲイン算出手段が取得したエリア強調ゲインに基づいて、目的エリア音を強調した目的エリア強調信号を取得する目的エリア音取得手段とを有することを特徴とする。
【選択図】 図1

Description

本発明は、収音装置、プログラム及び方法に関し、例えば、特定のエリアの音のみを強調し、それ以外のエリアの音を抑圧する場合に適用し得るものである。
従来、特定の方向に存在する音(音声や音響;以下、音声及び音響をまとめて音響と呼ぶこともある)を強調し、それ以外の音を抑圧する技術として、マイクアレイを用いたビームフォーマがある。ビームフォーマとは、各マイクに到達する信号の時間差を利用して指向性や死角を形成する技術である(非特許文献1、非特許文献2参照)。
しかし、単純にビームフォーマの指向性を収音目的とするエリア(以下、「目的エリア」と呼ぶ)に向けただけでは、目的エリアの周囲に雑音源が存在する場合、目的エリア内に存在する音源(以下、「目的エリア音」と呼ぶ)だけでなく、目的エリア外に存在する雑音源(以下、「非目的エリア音」と呼ぶ)も同時に収音してしまうという問題が存在する。
この問題に対して、複数のマイクアレイを用いて、別々の方向から指向性を目的エリアに向けて交差させ、目的エリア音を収音する従来方式が提案されている(特許文献1)。特許文献1に記載された方式では、各マイクアレイのビームフォーマ出力を同時に処理することで、目的エリアを抽出する。
図6は、従来の複数のマイクアレイを用いた収音処理の例について示した説明図である。
図6では、2つのマイクアレイMA(MA、MA)の指向性を目的エリアに向けた場合の例について示している。
図6(a)は、2つのマイクアレイMA、MAの指向性を目的エリアに向けた場合の各マイクアレイMAや、目的エリア音の音源との位置関係について示している。また、図6(a)では、マイクアレイMA、MAに対応する指向性(ビームフォーマの指向性)D1、D2についても図示している。さらに、図6(a)の例では、目的エリアの音源の周囲に非目的エリア音の音源が存在している。従って、図6(a)の状態では、マイクアレイMA、MAのビームフォーマ出力には、共に、目的エリアにある音源による目的エリア音だけでなく、同じ指向性方向の非目的エリアにある音源による非目的エリア音が含まれてしまう。
図6(b)、図6(c)は、それぞれ、2つのマイクアレイMA、MAのビームフォーマ出力の周波数成分を示している。音声のスパース性を仮定すると、図6(b)、図6(c)に示すように、一つの周波数成分には一つの音源(目的エリア音又は非目的エリア音)しか含まれない。そして、目的エリアは全てのマイクアレイの指向性に含まれているため、目的エリア音の周波数成分は、全てのビームフォーマ出力に、同じ割合、同じ分布で含まれる。これと比較して、非目的エリア音の周波数成分は、ビームフォーマ出力ごとに異なっている。このような特徴から、各ビームフォーマ出力に共通に含まれる周波数成分は、目的エリア音が有する成分と推定することができ、これに基づいて、特許文献1等に記載された従来の目的エリア音の収音方法が実現されている。
図7は、従来の収音方法を適用した収音装置10の機能的構成について示したブロック図である。
図6に示す従来の収音装置10は、データ入力部2、周波数領域変換部3、指向性形成部4、伝搬遅延差補正部5、パワー補正部6、第1の減算部7、及び第2の減算部8を有している。
マイクアレイMA、MAからの捕捉信号は、それぞれ、データ入力部2においてアナログ信号からデジタル信号(データ)に変換され、周波数領域変換部3において時間領域から周波数領域へと変換されて捕捉信号群X及びXが得られる。そして、指向性形成部4において図6(a)の指向性D1、指向性D2のような指向性を有するビームフォーマが適用されてビームフォーマ出力信号Xma1(f)及びXma2(f)が得られる。そして、伝搬遅延差補正部5において各マイクアレイと目的エリアとの距離(既知の情報)に基づいていずれかのビームフォーマ出力信号Xma1(f)及びXma2(f)を遅延させてタイミングを合わせて、遅延補正信号X’ma1(f)及びX’ma2(f)が得られる。
パワー補正部6では、各マイクアレイと目的エリアとの距離による振幅差に加えて、目的エリア内の話者の向きに適応するため、(1)式によって振幅補正係数αma1(アルファ)を算出する。なお、(1)式中の演算子mode(A(f))は、変数fにより値が変わる関数値A(f)のうち最も多く出現した値(最頻値)を得る演算子である。また、最頻値に代えて、(2)式のように中央値を用いても良い。なお、(2)式中の演算子median(A(f))は、変数fにより値が変わる関数値A(f)の中央値を得る演算子である。
Figure 2018170717
そして、第1の減算部7において、マイクアレイMAに係る遅延補正信号X’ma1(f)から振幅補正係数αma1によって振幅を補正したマイクアレイMAに係る遅延補正信号X’ma2(f)をスペクトル減算することにより、両ビームフォーマ出力で重なっている目的エリア音成分が消去され、マイクアレイMAに係る遅延補正信号X’ma1(f)に含まれている非目的エリア音成分Nma1(f)が抽出される。(3)式は、概ねこのような考え方に従っている算出式である。
ma1=X’ma1−αma1・X’ma2 …(3)
そして、第2の減算部8において、マイクアレイMAに係る遅延補正信号X’ma1(f)から非目的エリア音成分Nma1(f)をスペクトル減算することにより、目的エリア音Yma1(f)が抽出される。(4)式は、概ねこのような考え方に従っている算出式である((4)式中のβma1(ベータ)は、非目的エリア音の除去強度を定めている一定値を取る係数である)。
ma1=X’ma1−βma1・Nma1…(4)
以上のように、従来の収音方法を適用した収音装置では、目的エリアの周囲に非目的エリア音源が存在していても、目的エリア音のみを収音することができる。
特開2014−72708号公報
浅野太著、"音のアレイ信号処理 −音源の定位・追跡と分離"、社団法人日本音響学会、コロナ社、2011年2月25日発行 矢頭隆、森戸誠、山田圭、小川哲司共著、"正方形マイクロホンアレイによる音源分離技術(<特集>音声認識技術の実用化への取り組み)"、一般社団法人情報処理学会、情報処理51(11)、pp.1410−1416.2010年
しかし、従来の収音方法では、各マイクアレイMAと目的エリアとの距離による振幅差と目的エリア内の話者の向きとに適応するために、(1)式のような最頻値の演算か、(2)式のような中央値の演算を必要とする。最頻値を算出するには度数分布(ヒストグラムとも呼ぶ)を作成する必要があり、度数分布を作成するには多数の比較演算に加えて、階級の細かさ(分解能)を経験的に決める必要がある。また、中央値を算出するには与えられたデータを大小の順で並べ替える必要があり、多数の比較演算を行う必要がある。
また、さらに、従来の収音方法では、やはり各マイクアレイMAと目的エリアとの距離による振幅差と目的エリア内の話者の向きとに適応するための振幅補正係数αma1を算出するために、マイクアレイの数は2個でなければならない。そのため、例えば、図8のように、目的エリアを3次元的に設定する場合には、2つのマイクアレイMA、MAをマイク数3個以上の平面マイクアレイ(図8は、4つのマイク1〜1を用いた平面マイクアレイの例を示している)として、2つのマイクアレイMA、MAの指向性が目的エリア内(例えば、目的エリアの中心位置近傍)で交差するように注意深く設置しなければならない。
つまり、従来の収音方法では、演算量が多いという課題や、パラメータを事前に経験的に決めなければならないという課題や、マイク及びマイクアレイそれぞれの数と配置が制限されるという課題があった。
そのため、より少ない演算量で、事前に決定しなければならないパラメータなしに、マイク及びマイクアレイそれぞれの数と配置に制限されることなく、目的エリア音のみを強調する収音装置、プログラム及び方法が望まれている。
第1の本発明の収音装置は、(1)複数のマイクアレイが出力する捕捉信号を周波数領域に変換した入力信号のそれぞれに対し、ビームフォーマによって目的エリア音方向へ指向性を形成する際の指向性ゲインを取得する指向性ゲイン算出手段と、(2)それぞれの前記マイクアレイの指向性ゲインに基づいて目的エリア音を強調するエリア強調ゲインを取得するエリア強調ゲイン算出手段と、(3)前記マイクアレイの入力信号と、前記エリア強調ゲイン算出手段が取得したエリア強調ゲインに基づいて、目的エリア音を強調した目的エリア強調信号を取得する目的エリア音取得手段とを有することを特徴とする。
第2の本発明の収音プログラムは、コンピュータを、(1)複数のマイクアレイが出力する捕捉信号を周波数領域に変換した入力信号のそれぞれに対し、ビームフォーマによって目的エリア音方向へ指向性を形成する際の指向性ゲインを取得する指向性ゲイン算出手段と、(2)それぞれの前記マイクアレイの指向性ゲインに基づいて目的エリア音を強調するエリア強調ゲインを取得するエリア強調ゲイン算出手段と、(3)前記マイクアレイの入力信号と、前記エリア強調ゲイン算出手段が取得したエリア強調ゲインに基づいて、目的エリア音を強調した目的エリア強調信号を取得する目的エリア音取得手段として機能させることを特徴とする。
第3の本発明は、収音方法において、(1)指向性ゲイン算出手段、エリア強調ゲイン算出手段、及び目的エリア音取得手段を備え、(2)前記指向性ゲイン算出手段は、複数のマイクアレイが出力する捕捉信号を周波数領域に変換した入力信号のそれぞれに対し、ビームフォーマによって目的エリア音方向へ指向性を形成する際の指向性ゲインを取得し、(3)前記エリア強調ゲイン算出手段は、それぞれの前記マイクアレイの指向性ゲインに基づいて目的エリア音を強調するエリア強調ゲインを取得し、(4)前記目的エリア音取得手段は、前記マイクアレイの入力信号と、前記エリア強調ゲイン算出手段が取得したエリア強調ゲインに基づいて、目的エリア音を強調した目的エリア強調信号を取得することを特徴とする。
本発明によれば、より少ない演算量で、事前に決定しなければならないパラメータなしに、マイク及びマイクアレイそれぞれの数と配置に制限されることなく目的エリア音のみを強調することができる。
第1、第3、第4の実施形態に係る収音装置の機能的構成について示したブロック図である。 第1の実施形態に係る収音装置における収音処理の概要(技術思想)について示した説明図(イメージ図)である。 第1の実施形態に係るマイクアレイの構成例について示した説明図である。 第1の実施形態に係る指向性ゲイン算出部の内部構成について示したブロック図である。 第2の実施形態に係る収音装置の機能的構成について示したブロック図である。 従来の収音方法の例について示した説明図である。 従来の収音装置の機能的構成について示したブロック図である。 従来の収音装置で用いられる平面マイクアレイの構成例について示した説明図である。
(A)第1の実施形態
以下、本発明による収音装置、プログラム及び方法の第1の実施形態を、図面を参照しながら詳述する。
(A−1)第1の実施形態の構成
図1は、この実施形態の収音装置100の機能的構成について示したブロック図である。なお、図1において、括弧内の符号は、後述する第3及び第4の実施形態で用いられる符号である。
収音装置100は、M個のマイクアレイMA(MA〜MA)から供給される音響信号を用いて、目的エリアの音源からの目的エリア音を収音する目的エリア音収音処理を行う。
各マイクアレイMAは、それぞれ目的エリアが存在する空間の、目的エリアを指向できる場所に配置される。
なお、図1のマイクアレイMA〜MAは、それぞれマイク1を直線状に等間隔で配置するように図示したが、この限りではなく、ビームフォーマを実行できる配置であればよい。各マイクアレイMAを構成するマイク1の個数は、少なくとも2個以上である以外に制限はなく、マイクアレイMAごとに異なっても良く、全てのマイクアレイMAで同じであっても良い。以下では、任意のi番目のマイクアレイMAのマイク1の個数をLと表すものとする。したがって、マイクアレイMA〜MAのマイク1の個数はそれぞれL〜Lとなる。
また、各マイクアレイMAを構成するマイク1の配置は、目的エリアを指向できること以外に制限はない、例えば、第1の実施形態において、複数のマイク1を直線状に配置したリニアマイクアレイでも良いし、複数のマイク1を平面上に配置した平面マイクアレイでも良いし、複数のマイク1を結晶型(正多角形配置、長方形配置、正多面体配置、正多角柱配置、直方体配置など)に配置した結晶型マイクアレイ等でも良い。また、マイク1の配置は、マイクアレイMAごとに異なっても良く、全てのマイクアレイMAで同じであっても良い。
次に、収音装置100における収音処理(目的エリア音の強調方法;この実施形態の収音方法)の概要(技術思想)について、図2を用いて説明する。
まず、図2(a−1)〜図2(a−3)を参照する。図2(a−1)では、マイクアレイMAを構成するいずれかのマイク1によって捕捉された捕捉信号に係る周波数成分(以下、「MAの振幅」と呼ぶ)を示している。また、図2(a−3)では、マイクアレイMAに係るビームフォーマ出力(BF出力)の周波数成分(以下、「BF1の振幅」とも呼ぶ)を示している。さらに、図2(a−2)は、「BF1の振幅」を「MAの振幅」で除した値(以下、「MAの指向性ゲイン」と呼ぶ)を示している。
次に、図2(b−1)〜図2(b−3)を参照する。図2(b−1)では、マイクアレイMAを構成するいずれかのマイク1によって捕捉された捕捉信号に係る周波数成分(以下、「MAの振幅」と呼ぶ)を示している。また、図2(b−3)では、マイクアレイMAに係るビームフォーマ出力(BF出力)の周波数成分(以下、「BF2の振幅」とも呼ぶ)を示している。さらに、図2(b−2)は、「BF2の振幅」を「MAの振幅」で除した値(以下、「MAの指向性ゲイン」と呼ぶ)を示している。
次に、図2(c−1)〜図2(c−3)を参照する。図2(c−1)は、図2(a−1)と同様に「MAの振幅」を示している。図2(c−2)は、「MAの指向性ゲイン」と「MA2の指向性ゲイン」を乗じたもの(以下、「エリア強調ゲイン」と呼ぶ)である。図2(c−3)は、「MAの振幅」から「MAの指向性ゲイン」を用いて抽出した目的エリア音を示している。
「MAの指向性ゲイン」と「MAの指向性ゲイン」は、ビームフォーマの方法によって、ビームフォーマ後に算出する必要がある場合とない場合とがある。例えば、遅延和法によるビームフォーマ(非特許文献1参照)ではビームフォーマ後の振幅が求まるので、指向性ゲインは除算によって求める必要がある。また例えば、従来のスペクトル減算によるビームフォーマに関する非特許文献2参照では、ビームフォーマ後の振幅を求めるように記載されているが、実際には式変形によって指向性ゲインを求めるようにすることもできる。また例えば、特開2007−318528号公報(以下、「参考文献1」と呼ぶ)に記載された方法は、指向性ゲインを求めて捕捉信号の周波数成分に乗じることでビームフォーマ後の振幅を得る方法なので、指向性ゲインは直接求まる。
以上のようにして得られた「MAの指向性ゲイン」と「MAの指向性ゲイン」は、非目的エリア音に対しては0と1が互い違いになっているが、目的エリア音の周波数成分に対しては必ず1となっている。したがって、2つの指向性ゲインを掛け合わせることで、図2(c−2)の「エリア強調ゲイン」のように、目的エリア音の周波数成分のみを強調するゲインが得られる。言い換えると、「MAの指向性ゲイン」及び「MAの指向性ゲイン」は、非目的エリア音の成分については、0又は1のいずれかの値(0又は1に近似した値)をとり得るが、目的エリア音の周波数成分については両方とも必ず1(1に近似した値)となっている。
なお、「MAの指向性ゲイン」と「MAの指向性ゲイン」において、それぞれが抑圧可能な非目的エリア音に対する指向性ゲインは必ず0になるとは限らないが、必ず小さな値(例えば、0に近似した値)にはなっており、目的エリア音に対する指向性ゲインは必ず1以下になるので、「エリア強調ゲイン」における非目的エリア音に対するゲインは必ず小さくなる。
そこで、この実施形態の収音装置100では、マイクアレイMAごとに算出された指向性ゲインを、周波数成分ごとに全マイクアレイMAに渡って掛け合わせることで算出したエリア強調ゲインを用いて目的エリア音を抽出するものとする。これにより、この実施形態の収音装置100では、従来技術のように最頻値や中央値を求める必要がないので、比較的少ない演算量で、目的エリア音を強調する処理を実現することができる。
ところで、各マイクアレイMAの構成は、例えば、図3のように、3つのマイクアレイMA〜MAを用意し、2つのマイクアレイMA、MAは2つのマイク1、1を横方向(図3における水平方向)に並べたリニアアレイとし、マイクアレイMAはマイク2個を縦方向(図3における垂直方向)に並べたリニアアレイとしてもよい。
図3のように各マイクアレイMAを配置した場合、収音装置100は、それぞれのマイクアレイMAにおいて目的エリア方向を収音するビームフォーマからビームフォーマのゲインを算出し、周波数成分ごとに3つのビームフォーマのゲインを全て掛け合わせることで、目的エリア音を抽出することができる。図3において、マイクアレイMA〜MAの指向性(指向性の中心面)をD11〜D13と図示している。つまり、マイクアレイMA〜MAのそれぞれの指向性D11〜D13の中心面は、図3中の指向性D11〜D13に示す平面となり、この実施形態の収音装置100によって定まる目的エリアは指向性D11〜D13の中心面が交わる位置の周辺となる。
次に、収音装置100の内部構成について図1を用いて説明する。
図1に示すように、第1の実施形態に係る収音装置100は、データ入力部102、周波数領域変換部103、指向性ゲイン算出部104、エリア強調ゲイン算出部105、及び目的エリア音抽出部106を有している。収音装置100内部の各構成要素の詳細については後述する。
収音装置100において、デジタル信号に変換された後の処理構成を、プロセッサやメモリ等を備えるコンピュータにプログラム(実施形態に係る収音プログラムを含む)を実行させるようにしてもよいが、その場合であっても、機能的には、図1で表すことができる。
次に、指向性ゲイン算出部104の内部構成について図4を用いて説明する。
図4は指向性ゲイン算出部104内部の機能的構成について示したブロック図である。
指向性ゲイン算出部104は、マイクアレイMA〜MAに対してそれぞれ雑音推定部111〜111及びスペクトル減算ゲイン算出部112〜112を有している。指向性ゲイン算出部104内部の各構成要素の詳細については後述する。
(A−2)第1の実施形態の動作
次に、以上のような構成を有する第1の実施形態の収音装置100の動作(この実施形態の収音方法)を説明する。
データ入力部102は、マイクアレイMA1〜MAで捕捉した音響信号を、マイク1ごとにアナログ信号からデジタル信号(データ)に変換する。そして、データ入力部102は、得られた捕捉信号群x(t)〜x(t)は、周波数領域変換部103に与えられる。i番目の捕捉信号群x(t)は、(5)式に示すように、L個の捕捉信号xi,1(t)〜xi,Li(t)で構成されるベクトルである。
(t)=[xi,1(t),・・・,xi,Li(t)] …(5)
周波数領域変換部103は、マイクアレイMA〜MAから入力されたデータを、マイクごとに時間領域から周波数領域へと変換する。周波数領域変換部103は、得られた周波数領域の捕捉信号群X(f)〜X(f)を、指向性ゲイン算出部104及び目的エリア音抽出部106に与える。i番目の周波数領域の捕捉信号群X(f)は、(6)式に示すように、L個の捕捉信号Xi,1(f)〜Xi,Li(f)で構成されるベクトルである。周波数領域変換部103における変換には、高速フーリエ変換(FFT:Fast Fourier Transform)やウェーブレット変換、フィルタバンクなどを利用することができるが、FFTが最も好適である。ここで、周波数領域変換部103は、FFTを行う際、ハミング窓などの各種窓関数を用いるようにしても良い。
(f)=[Xi,1(f),・・・,Xi,Li(f)] …(6)
指向性ゲイン算出部104は、マイクアレイMAごとに、周波数領域の捕捉信号群X(f)〜X(f)に基づいてビームフォーマを適用して指向性ゲインG(f)〜G(f)を算出する。得られた指向性ゲインG(f)〜G(f)は、エリア強調ゲイン算出部105に与えられる。指向性ゲインは、1つのマイクアレイに属する捕捉信号群X(f)から、周波数ごとに1つだけ求まる(つまり、X(f)とは異なり、G(f)はスカラーである)。指向性ゲイン算出部104において、ビームフォーマの方法には、任意の方法を用いることができるが、非特許文献2に記載のスペクトル減算による方法に代表される鋭い指向性を形成できる方法が好適に用いられる。この実施形態の指向性ゲイン算出部104は、例として、図3のように、目的エリアが全てのマイク1に対して正面に位置しており、全てのマイクアレイMAが2つのマイク1、1で構成され、いずれのマイクアレイMAも同一の方法で指向性ゲインを算出し、指向性ゲインはスペクトル減算に基づく方法で算出されるものとして説明する。
次に図4を用いて、指向性ゲイン算出部104の内部処理について説明する。
全てのマイクアレイMAに対して同様の処理が行われるため、ここではi番目のマイクアレイMAに対応する雑音推定部111、及びスペクトル減算ゲイン算出部112の動作についてのみ記す。
雑音推定部111は、(7)式に示すように、片方の捕捉信号からもう片方の捕捉信号を減じることで、正面方向(目的エリア方向)にある音源(目的エリア音)を抑圧し、雑音(非目的エリア音)を推定する。スペクトル減算ゲイン算出部112は、(8)式に示すように、1から非目的エリア音と捕捉信号との振幅比を減じる(スペクトル減算する)ことで、指向性ゲインG(f)を算出する。(8)式において、β(f)(ベータ)は推定された非目的エリア音の振幅を補正したりスペクトル減算の強さ(非目的エリア音の除去強度)を調整したりする周波数成分ごとに定められた定数係数である。また、(8)式において、Gminは、指向性ゲインの最小値(最大抑圧量とも呼ばれる)を定める定数値である。なお、(8)式の両辺にXi,1(f)の絶対値を乗じると、(9)式が得られ、スペクトル減算によるビームフォーマ出力の振幅が求まる。ビームフォーマ出力を得る場合には(9)式を用いるのが一般的だが、本実施形態では(8)式を用いることで指向性ゲインを直接算出するものとする。
Figure 2018170717
エリア強調ゲイン算出部105は、(10)式のように、周波数成分ごとに指向性ゲインG(f)〜G(f)を掛け合わせてエリア強調ゲインH(f)を算出する。得られたエリア強調ゲインH(f)は、目的エリア音抽出部106に与えられる。
H(f) = G(f)・G(f)・…・G(f) …(10)
目的エリア音抽出部106は、捕捉信号群X(f)〜X(f)のいずれか又はそれらを統合した信号に、エリア強調ゲインH(f)を乗じることで目的エリア強調信号Y(f)を算出する。得られた目的エリア強調信号Y(f)は、次段へ与えられる。エリア強調ゲインH(f)が乗じられる信号は任意であり、先頭のX1,1(f)としても良いし、最も目的エリアに近いマイク1に係る捕捉信号としても良いし、最も目的エリアに近いマイクアレイMAの捕捉信号群に遅延和ビームフォーマを適用して目的エリア音を少しだけ強調した信号としても良い。
(A−3)第1の実施形態の効果
第1の実施形態によれば、以下のような効果を奏することができる。
第1の実施形態によれば、マイクアレイMAごとに算出された指向性ゲインを、周波数成分ごとに全マイクアレイMAに渡って掛け合わせることで算出したエリア強調ゲインを用いて目的エリア音を抽出するので、比較的少ない演算量で、事前に決定しなければならないパラメータなしに、マイク1及びマイクアレイMAそれぞれの数と配置に制限されることなく、目的エリアが非目的エリア音源に囲まれている状況でも、目的エリア音のみを強調することができる。
(B)第2の実施形態
以下、本発明による収音装置、プログラム及び方法の第2の実施形態を、図面を参照しながら詳述する。
(B−1)第2の実施形態の構成
図5は、第2の実施形態の収音装置200の機能的構成について示したブロック図であり、上述の図1と同一部分又は対称部分には、同一符号又は対称符号を付している。以下では、第2の実施形態の収音装置100Aについて、第1の実施形態との差異のみを説明する。
第1の実施形態(収音装置100)の説明では、各マイクアレイMAと目的エリアとの間の距離(以下、「アレイ収音距離」と呼ぶ)について何ら言及しなかった。例えば、第1の実施形態において、アレイ収音距離が高々150cm程度であるような、ある程度小規模な環境の場合には、収音装置100においてアレイ収音距離は無視して信号処理しても著しく出力信号の品質が低下することはない。しかし、アレイ収音距離の差(例えば、マイクアレイMAのアレイ収音距離とマイクアレイMAのアレイ収音距離との差)が300cm以上となるような場合、各マイクアレイMAに目的エリア音が到達する時間差が大き過ぎるために、マイクアレイMA間で目的エリア音方向を強調するタイミングがずれ、正しくエリア音を抽出できないことがある。
そこで、第2の実施形態の収音装置200では、各マイクアレイMAのアレイ収音距離、又はマイクアレイMA同士のアレイ収音距離の差が既知であるとして、指向性ゲインを遅延させることでタイミングを合わせる。
図5に示すように、収音装置200では、エリア強調ゲイン算出部105がエリア強調ゲイン算出部105に置き換わり、さらに伝搬遅延補正部207が追加されている点で第1の実施形態と異なっている。
(B−2)第2の実施形態の動作
次に、以上のような構成を有する第2の実施形態の収音装置200の動作(この実施形態の収音方法)を説明する。
第2の実施形態に係る収音装置200の動作は、伝搬遅延補正部207とエリア強調ゲイン算出部205除けば、第1の実施形態に係る収音装置100の動作と同様であるためその他の要素の動作説明を省略する。
伝搬遅延補正部207は、事前に確認されたマイクアレイMAごとのアレイ収音距離又は各マイクアレイ間のアレイ収音距離の差に基づいて、アレイ収音距離が最も小さい(目的エリアと最も近い)マイクアレイMA以外のマイクアレイMAに由来する指向性ゲインG(f)〜G(f)を遅延させる。得られた遅延指向性ゲインG’(f)〜G’(f)は、エリア強調ゲイン算出部205に与えられる。すなわち、遅延指向性ゲインG’(f)〜G’(f)は、全てのマイクアレイMAについてアレイ収音距離に基づくタイミングのずれ(遅延)を補正して、タイミングを同期させた指向性ゲインとなる。
エリア強調ゲイン算出部205は、(11)式のように周波数成分ごとに遅延指向性ゲインG’(f)〜G’(f)を掛け合わせてエリア強調ゲインH(f)を算出する。エリア強調ゲイン算出部205は、得られたエリア強調ゲインH(f)は、目的エリア音抽出部106に与える。
H(f) = G’(f)・G’(f)・…・G’(f) …(11)
(B−3)第2の実施形態の効果
第2の実施形態によれば、第1の実施形態の効果に加えて以下のような効果を奏することができる。
第2の実施形態の収音装置200では、マイクアレイMA間のアレイ収音距離の差が300cmを超えるような大規模な環境で、かつ、目的エリアが非目的エリア音源に囲まれている状況でも、目的エリア音のみを強調することができる。
(C)第3の実施形態
以下、本発明による収音装置、プログラム及び方法の第3の実施形態を、図面を参照しながら詳述する。
(C−1)第3の実施形態の構成
第3の実施形態の収音装置300も上述の図1を用いて示すことができる。
以下では、第3の実施形態について第1及び第2の実施形態との差異のみを説明する。
第1及び第2の実施形態の収音装置100、200では、全マイクアレイMA(MA〜MA)由来する指向性ゲインを掛け合わせることでエリア強調ゲインを算出していた。しかし、この方法は、信号に雑音を抑圧するフィルタをM回掛けていることに相当するため、第1及び第2の実施形態の収音装置100、200の出力信号はひずむおそれがある。
そこで、第3の実施形態の収音装置300では、単にM個の指向性ゲインを掛け合わせるのでなく、M個の指向性ゲインを掛け合わせた後でM乗根を取ることで、当該ひずみを回避する。
図1に示すように、第3の実施形態の収音装置300では、エリア強調ゲイン算出部105がエリア強調ゲイン算出部305に置き換わっている点で第1の実施形態の収音装置100と異なっている。
(C−2)第3の実施形態の動作
次に、以上のような構成を有する第3の実施形態の収音装置300の動作(この実施形態の収音方法)を説明する。
第3の実施形態に係る収音装置300の動作は、エリア強調ゲイン算出部305を除けば、第1の実施形態に係る収音装置100の動作と同様であるためその他の要素の動作説明を省略する。
エリア強調ゲイン算出部305は、(12)式のように、周波数成分ごとに指向性ゲインG(f)〜G(f)を掛け合わせて、さらにM乗根を取ることで、エリア強調ゲインH(f)を算出する。そして、エリア強調ゲイン算出部305で得られたエリア強調ゲインH(f)は、目的エリア音抽出部106に与えられる。
Figure 2018170717
(C−3)第3の実施形態の効果
第3の実施形態によれば、第2の実施形態の効果に加えて、以下のような効果を奏することができる。
第3の実施形態の収音装置300では、エリア強調ゲインを算出する際に、掛け合わせる指向性ゲインの数の累乗根を取るので、第1の実施形態のような信号に雑音を抑圧するフィルタを多重で掛ける処理を回避できるので、より少ないひずみで目的エリア音のみを強調することができる。
(D)第4の実施形態
以下、本発明による収音装置、プログラム及び方法の第4の実施形態を、図面を参照しながら詳述する。
(D−1)第4の実施形態の構成
第4の実施形態の収音装置400も上述の図1を用いて示すことができる。
以下では、第4の実施形態について第3の実施形態との差異のみを説明する。
第3の実施形態の収音装置300では、エリア強調ゲインを算出する際に、掛け合わせる指向性ゲインの数の累乗根を取ることで、第1の実施形態のような信号に雑音を抑圧するフィルタを多重で掛ける処理を回避していた。一方、周波数成分ごとに全てのマイクアレイに対する指向性ゲインの最小値をエリア強調ゲインとすることでも同様の効果を奏することができ、さらに第3の実施形態よりも少ない演算量で実現することができる。そこで、第4の実施形態の収音装置400では、周波数成分ごとに全てのマイクアレイに対する指向性ゲインの最小値を集め、エリア強調ゲインとするものとする。
図1に示すように、第4の実施形態の収音装置400では、エリア強調ゲイン算出部305がエリア強調ゲイン算出部405に置き換わっている点で第3の実施形態の収音装置300と異なっている。
(D−2)第4の実施形態の動作
次に、以上のような構成を有する第4の実施形態の収音装置400の動作(この実施形態の収音方法)を説明する。
第4の実施形態に係る収音装置400の動作は、エリア強調ゲイン算出部405を除けば、第3の実施形態に係る収音装置300の動作と同様であるためその他の要素の動作説明を省略する。
エリア強調ゲイン算出部405は、周波数成分ごとに全てのマイクアレイに対する指向性ゲインG(f)〜G(f)の最小値をエリア強調ゲインH(f)として算出する。エリア強調ゲイン算出部405により得られたエリア強調ゲインH(f)は、目的エリア音抽出部106に与えられる。
上述の通り、音声のスパース性に基づき目的エリア音と雑音は周波数領域では重ならない。そして、上述の図2に示す通り、「MAの指向性ゲイン」及び「MAの指向性ゲイン」は、非目的エリア音の成分については0又は1のいずれかの値(0又は1に近似した値のいずれか)をとり得るが、目的エリア音の周波数成分については両方とも必ず1(1に近似した値)となっている。そうすると、図2(c−2)に示すように、周波数成分ごとに指向性ゲインG(f)、G(f)の最小値をとったとしても、周波数成分ごとに指向性ゲインG(f)、G(f)の最小値を取った場合と同一又は近似した値が得られることになる。
(D−3)第4の実施形態の効果
第4の実施形態によれば、第3の実施形態の効果に加えて、以下のような効果を奏することができる。
第4の実施形態の収音装置400(エリア強調ゲイン算出部405)では、第3の実施形態と異なり、累乗根の計算が不要なので、より少ない演算量で目的エリア音のみを強調することができる。
(e)他の実施形態
本発明は、上記の各実施形態に限定されるものではなく、以下に例示するような変形実施形態も挙げることができる。
(e−1)第2の実施形態の収音装置200のエリア強調ゲイン算出部105において、エリア強調ゲインを算出する際に、(11)式のように遅延指向性ゲインG’(f)〜G’(f)掛け合わせた後、第3の実施形態のエリア強調ゲイン算出部305と同様に、遅延指向性ゲインの数(M)の累乗根をとることで、エリア強調ゲインを得るようにしてもよい。
また、第2の実施形態のエリア強調ゲイン算出部105において、第4の実施形態のエリア強調ゲイン算出部405と同様に、周波数成分ごとに全てのマイクアレイMAに対する遅延指向性ゲインG’(f)〜G’(f)の最小値を集め、エリア強調ゲインとして取得するようにしてもよい。
100…収音装置、102…データ入力部、103…周波数領域変換部、104…指向性ゲイン算出部、105…エリア強調ゲイン算出部、106…目的エリア音抽出部。

Claims (7)

  1. 複数のマイクアレイが出力する捕捉信号を周波数領域に変換した入力信号のそれぞれに対し、ビームフォーマによって目的エリア音方向へ指向性を形成する際の指向性ゲインを取得する指向性ゲイン算出手段と、
    それぞれの前記マイクアレイの指向性ゲインに基づいて目的エリア音を強調するエリア強調ゲインを取得するエリア強調ゲイン算出手段と、
    前記マイクアレイの入力信号と、前記エリア強調ゲイン算出手段が取得したエリア強調ゲインに基づいて、目的エリア音を強調した目的エリア強調信号を取得する目的エリア音取得手段と
    を有することを特徴とする収音装置。
  2. 前記エリア強調ゲイン算出手段は、周波数成分ごとに、全ての前記マイクアレイに係る指向性ゲインを掛け合わせてエリア強調ゲインを算出することを特徴とする請求項1に記載の収音装置。
  3. 前記エリア強調ゲイン算出手段は、周波数成分ごとに、全ての前記マイクアレイに係る指向性ゲインを掛け合わせ、さらに前記マイクアレイの数に対応する累乗根を取ることでエリア強調ゲインを算出することを特徴とする請求項2に記載の収音装置。
  4. 前記エリア強調ゲイン算出手段は、周波数成分ごとに全ての前記マイクアレイに対する指向性ゲインの最小値を選択することでエリア強調ゲインを求める
    ことを特徴とする請求項1に記載の収音装置。
  5. それぞれの前記マイクアレイと目的エリアとの距離の差分に応じて、全ての前記マイクアレイの指向性ゲインのタイミングのずれを補正した指向性ゲインを取得する補正手段をさらに備え、
    前記エリア強調ゲイン算出手段は、前記補正手段が補正した指向性ゲインを用いてエリア強調ゲインを求める
    ことを特徴とする請求項1〜4のいずれかに記載の収音装置。
  6. コンピュータを、
    複数のマイクアレイが出力する捕捉信号を周波数領域に変換した入力信号のそれぞれに対し、ビームフォーマによって目的エリア音方向へ指向性を形成する際の指向性ゲインを取得する指向性ゲイン算出手段と、
    それぞれの前記マイクアレイの指向性ゲインに基づいて目的エリア音を強調するエリア強調ゲインを取得するエリア強調ゲイン算出手段と、
    前記マイクアレイの入力信号と、前記エリア強調ゲイン算出手段が取得したエリア強調ゲインに基づいて、目的エリア音を強調した目的エリア強調信号を取得する目的エリア音取得手段と
    して機能させることを特徴とする収音プログラム。
  7. 収音方法において、
    指向性ゲイン算出手段、エリア強調ゲイン算出手段、及び目的エリア音取得手段を備え、
    前記指向性ゲイン算出手段は、複数のマイクアレイが出力する捕捉信号を周波数領域に変換した入力信号のそれぞれに対し、ビームフォーマによって目的エリア音方向へ指向性を形成する際の指向性ゲインを取得し、
    前記エリア強調ゲイン算出手段は、それぞれの前記マイクアレイの指向性ゲインに基づいて目的エリア音を強調するエリア強調ゲインを取得し、
    前記目的エリア音取得手段は、前記マイクアレイの入力信号と、前記エリア強調ゲイン算出手段が取得したエリア強調ゲインに基づいて、目的エリア音を強調した目的エリア強調信号を取得する
    ことを特徴とする収音方法。
JP2017068486A 2017-03-30 2017-03-30 収音装置、プログラム及び方法 Active JP6763332B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017068486A JP6763332B2 (ja) 2017-03-30 2017-03-30 収音装置、プログラム及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017068486A JP6763332B2 (ja) 2017-03-30 2017-03-30 収音装置、プログラム及び方法

Publications (2)

Publication Number Publication Date
JP2018170717A true JP2018170717A (ja) 2018-11-01
JP6763332B2 JP6763332B2 (ja) 2020-09-30

Family

ID=64017948

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017068486A Active JP6763332B2 (ja) 2017-03-30 2017-03-30 収音装置、プログラム及び方法

Country Status (1)

Country Link
JP (1) JP6763332B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020148909A (ja) * 2019-03-13 2020-09-17 株式会社東芝 信号処理装置、信号処理方法およびプログラム
CN112185406A (zh) * 2020-09-18 2021-01-05 北京大米科技有限公司 声音处理方法、装置、电子设备和可读存储介质
CN112423191A (zh) * 2020-11-18 2021-02-26 青岛海信商用显示股份有限公司 一种视频通话设备和音频增益方法
CN112634931A (zh) * 2020-12-22 2021-04-09 北京声智科技有限公司 语音增强方法及装置
CN113767432A (zh) * 2020-06-29 2021-12-07 深圳市大疆创新科技有限公司 音频处理方法、音频处理装置、电子设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001204092A (ja) * 2000-01-18 2001-07-27 Nippon Telegr & Teleph Corp <Ntt> ゾーン別収音装置
JP2007235358A (ja) * 2006-02-28 2007-09-13 Nippon Telegr & Teleph Corp <Ntt> 収音装置、プログラム及びこれを記録した記録媒体
JP2014502108A (ja) * 2010-12-03 2014-01-23 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 音響三角測量方式による空間的に選択的な音の取得のための装置および方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001204092A (ja) * 2000-01-18 2001-07-27 Nippon Telegr & Teleph Corp <Ntt> ゾーン別収音装置
JP2007235358A (ja) * 2006-02-28 2007-09-13 Nippon Telegr & Teleph Corp <Ntt> 収音装置、プログラム及びこれを記録した記録媒体
JP2014502108A (ja) * 2010-12-03 2014-01-23 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 音響三角測量方式による空間的に選択的な音の取得のための装置および方法

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020148909A (ja) * 2019-03-13 2020-09-17 株式会社東芝 信号処理装置、信号処理方法およびプログラム
JP7027365B2 (ja) 2019-03-13 2022-03-01 株式会社東芝 信号処理装置、信号処理方法およびプログラム
CN113767432A (zh) * 2020-06-29 2021-12-07 深圳市大疆创新科技有限公司 音频处理方法、音频处理装置、电子设备
CN112185406A (zh) * 2020-09-18 2021-01-05 北京大米科技有限公司 声音处理方法、装置、电子设备和可读存储介质
CN112423191A (zh) * 2020-11-18 2021-02-26 青岛海信商用显示股份有限公司 一种视频通话设备和音频增益方法
CN112423191B (zh) * 2020-11-18 2022-12-27 青岛海信商用显示股份有限公司 一种视频通话设备和音频增益方法
CN112634931A (zh) * 2020-12-22 2021-04-09 北京声智科技有限公司 语音增强方法及装置
CN112634931B (zh) * 2020-12-22 2024-05-14 北京声智科技有限公司 语音增强方法及装置

Also Published As

Publication number Publication date
JP6763332B2 (ja) 2020-09-30

Similar Documents

Publication Publication Date Title
JP2018170717A (ja) 収音装置、プログラム及び方法
JP5482854B2 (ja) 収音装置及びプログラム
JP5489144B1 (ja) ビームフォーミング方法、及び超音波診断装置
US8654990B2 (en) Multiple microphone based directional sound filter
JP5139111B2 (ja) 移動音源からの音の抽出方法および装置
RU2559520C2 (ru) Устройство и способ для пространственно избирательного получения звука с помощью акустической триангуляции
KR20090037692A (ko) 혼합 사운드로부터 목표 음원 신호를 추출하는 방법 및장치
KR20120029839A (ko) 비등간격으로 배치된 마이크로폰을 이용한 음질 향상 장치 및 방법
JP6131989B2 (ja) 収音装置、プログラム及び方法
CN109285557B (zh) 一种定向拾音方法、装置及电子设备
KR20090051614A (ko) 마이크로폰 어레이를 이용한 다채널 사운드 획득 방법 및장치
CN107925816B (zh) 用于在波束成形的音频中重新创建方向提示的方法和装置
JP6225245B2 (ja) 信号処理装置、方法及びプログラム
JP5494699B2 (ja) 収音装置及びプログラム
KR20090037845A (ko) 혼합 신호로부터 목표 음원 신호를 추출하는 방법 및 장치
JP2016163135A (ja) 収音装置、プログラム及び方法
JP7254938B2 (ja) 音響源用の結合音源定位及び分離方法
JP6182169B2 (ja) 収音装置、その方法及びプログラム
JP6241520B1 (ja) 収音装置、プログラム及び方法
JP6863004B2 (ja) 収音装置、プログラム及び方法
JP2018056902A (ja) 収音装置、プログラム及び方法
JP6065029B2 (ja) 収音装置、プログラム及び方法
JP2017181761A (ja) 信号処理装置及びプログラム、並びに、ゲイン処理装置及びプログラム
JP6624256B1 (ja) 収音装置、プログラム及び方法
JP2010152107A (ja) 目的音抽出装置及び目的音抽出プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191115

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200713

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200811

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200824

R150 Certificate of patent or registration of utility model

Ref document number: 6763332

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150