JP5022461B2 - マイクアレイ・ネットワークシステムおよび該システムを用いた音源定位方法 - Google Patents
マイクアレイ・ネットワークシステムおよび該システムを用いた音源定位方法 Download PDFInfo
- Publication number
- JP5022461B2 JP5022461B2 JP2010056796A JP2010056796A JP5022461B2 JP 5022461 B2 JP5022461 B2 JP 5022461B2 JP 2010056796 A JP2010056796 A JP 2010056796A JP 2010056796 A JP2010056796 A JP 2010056796A JP 5022461 B2 JP5022461 B2 JP 5022461B2
- Authority
- JP
- Japan
- Prior art keywords
- sound source
- microphone array
- source position
- nodes
- node
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
- Circuit For Audible Band Transducer (AREA)
Description
特に、高音質な音声取得を目的として、音源定位や音源分離を主な処理とするマイクアレイが広く研究されている。ここで、音源定位とは音の到達時間差などから音源の方向・位置を特定することであり、また音源分離は音源定位の結果を利用して雑音となる音源を消去し特定方向にある特定音源の抽出を行うことである。
しかしながら、かかる音声処理システムの場合でも、小アレイで取得した全てのマイクの音声データを、ネットワークを介して一箇所の音声サーバに統合することから、ネットワークの通信トラフィックの増加の問題がある。また、通信データ量や通信トラフィック量の増加に伴う音声処理の遅延が生じるという問題がある。
従って、マイクアレイのネットワークシステムの大規模化を想定し、システム全体の計算量の低減ならびにネットワークの通信量を抑えるようなシステムアーキテクチャーが重要となる。
各ノードは、複数のマイクをアレイ状に配列して構成されたマイクアレイと、マイクアレイの収音信号を入力し、音源方向の推定を行う収音処理部と、音源方向推定結果および最大応答強度に関して、他ノードの収音処理部とデータ通信を行うデータ通信部と、を備える構成とされ、収音処理部は、自ノードを含む複数のノードの音源方向推定結果および最大応答強度から、複数の音源位置候補を算出し、音源位置推定を行うことを特徴とする。
ここで、音源方向推定方法は、例えば、MUSIC(Multiple signal classification)法などの従来から知られた音源定位方法を用いて行う。また、最大応答強度は、各方向に関してMUSIC法による応答を求めたものの最大値であり、推定された音源方向から到達する音声信号の応答強度である。
1)各ノードは、複数のマイクをアレイ状に配列して構成されたマイクアレイと、マイクアレイの収音信号を入力し、音源方向の推定を行う収音処理部と、音源方向推定結果、最大応答強度、音声データを音声処理サーバにデータ送信を行うデータ通信部と、を備え、
2)音声処理サーバは、各ノードの音源方向推定結果および最大応答強度から、複数の音源位置候補を算出し、音源位置推定を行うことを特徴とするものである。
1)各ノードは、複数のマイクをアレイ状に配列して構成されたマイクアレイと、マイクアレイの収音信号を入力し、音源方向の推定を行う収音処理部と、音源方向推定結果、最大応答強度、音声データを音声処理サーバにデータ送信を行うデータ通信部と、を備え、
2)音声処理サーバは、各ノードの音源方向推定結果および最大応答強度から、複数の音源位置候補を算出し、音源位置推定を行い、これに基づいて特定ノードから音声データを取り込むことを特徴とするものである。
さらに、音源位置推定結果に基づいて特定ノードから音声データを取り込むことにより、全ノードの全音声データをネットワーク上で通信する必要はない。特定ノードから音声データのデータ交換を行うことにより、システム全体の計算量の低減およびネットワークの通信量を更に抑えることが可能となる。
マルチホップ伝送ネットワークを用いることで、マイクアレイから取り込まれた音声データは、音声処理サーバとつながっているノードからしか送られてくるものでなくとも構わない。マルチホップ伝送ネットワークによれば、複数のネットワークをホッピングする形で、マイクアレイを有するノードの音声データが音声処理サーバに到達できることになる。
また中継ノードにおいて、音源位置推定結果に基づいて、音声データを集約(雑音除去)することにより、音声データの圧縮も可能である。
具体的に、2次元の定位の場合は、2つのノードの音源方向推定結果の交点を算出し、各交点に対して最大応答強度に基づく重み付けを行い、音源位置候補を求める。また、3次元の定位の場合は、2次元の定位のように必ずしも交点が得られないことから、2つのノードの音源方向推定結果の2直線を最短で結ぶ線分上に存在する仮想交点を算出し、最短で結ぶ線分の長さと2つのノードの最大応答強度とを用いて、音源位置候補を求める。
各ノードにおいて、以下のa)〜c)の工程を備えたことを特徴とする。
a)音源方向推定結果および最大応答強度を算出する音源方向推定工程
b)自ノードを含む複数のノードの音源方向推定結果および最大応答強度から、複数の音源位置候補を算出する音源位置候補算出工程
c)音源位置候補算出工程により算出した音源位置候補から音源位置推定を行う音源位置推定工程
ここで、音源方向推定工程は、例えば、MUSIC(Multiple signal classification)法などの従来から知られた音源定位方法を用いて行う。また、最大応答強度は、各方向に関してMUSIC法による応答を求めたものの最大値であり、推定された音源方向から到達する音声信号の応答強度である。
1)各ノードにおいて、
a)音源方向推定結果および最大応答強度を算出する音源方向推定工程と、
2)音声処理サーバにおいて、
b)各ノードの音源方向推定結果および最大応答強度から、複数の音源位置候補を算出する音源位置候補算出工程と、
c)音源位置候補算出工程により算出した音源位置候補から音源位置推定を行う音源位置推定工程と、
を備えたことを特徴とする。
音声処理サーバは、音源位置候補算出工程と音源位置候補算出工程により、各ノードの音源定位推定結果の集約情報を基にして、音源の位置を推定する。従って、ノード内で音声定位推定を行って、音声処理サーバに対して音源定位推定結果をデータ交換することにより、音声処理サーバにおける計算量の低減およびネットワークの通信量を抑えることが可能となる。
1)各ノードにおいて、
a)音源方向推定結果および最大応答強度を算出する音源方向推定工程と、
2)音声処理サーバにおいて、
b)各ノードの音源方向推定結果および最大応答強度から、複数の音源位置候補を算出する音源位置候補算出工程と、
c)音源位置候補算出工程により算出した音源位置候補から音源位置推定を行う音源位置推定工程と、
d)音源位置推定工程に基づいて特定ノードから音声データを取り込む音声データ取得工程と、
を備えたことを特徴とする。
音声処理サーバは、音源位置候補算出工程と音源位置推定工程により、各ノードの音源定位推定結果の集約情報を基にして、音源の位置を推定する。従って、ノード内で音声定位推定を行って、音声処理サーバに対して音源定位推定結果をデータ交換することで、通信量が抑えることが可能となる。
さらに、音声処理サーバは、音声データ取得工程により、音源位置推定に基づいて特定ノードから音声データを取り込むことにより、全ノードの全音声データをネットワーク上で通信する必要はない。特定ノードから音声データのデータ交換を行うことにより、計算量の低減およびネットワークの通信量を更に抑えることが可能となる。
マルチホップ伝送ネットワークを用いることで、マイクアレイから取り込まれた音声データは、音声処理サーバとつながっているノードからしか送られてくるものでなくとも構わない。マルチホップ伝送ネットワークによれば、複数のネットワークをホッピングする形で、マイクアレイを有するノードの音声データが音声処理サーバに到達できることになる。
また中継ノードにおいて、音源位置推定結果に基づいて、音声データを集約(雑音除去)することにより、音声データの圧縮も可能である。
この音源位置候補算出工程において、2次元の定位の場合は、2つのノードの音源方向推定結果の交点を算出し、各交点に対して最大応答強度に基づく重み付けを行い、音源位置候補を求める。3次元の定位の場合は、2次元の定位のように必ずしも交点が得られないことから、2つのノードの音源方向推定結果の2直線を最短で結ぶ線分上に存在する仮想交点を算出し、最短で結ぶ線分の長さと2つのノードの最大応答強度とを用いて、音源位置候補を求める。
ここで、所定のルールとは、ノード間距離が所定の範囲にあるノードを組み合わせる場合、精度が得られやすいとするルールが挙げられる。遠くのノード同士や、近接しすぎたノード同士では精度が得られないと予測される。
また、本発明によれば、マイクアレイのノード毎に音声データの分散処理を行うことにより、ネットワークの通信量やマイクサーバでの演算量を抑えることができるといった効果がある。
得られた複数の重みを示す丸印(位置とスケール)は音源位置候補となる。そして、得られた複数の音源位置候補の重心を求めることで音源位置を推定する。図2の場合、複数の音源位置候補の重心を求めるとは、複数の重みを示す丸印(位置とスケール)の重み付き重心を求めることである。
得られた複数の重みを示す丸印(位置とスケール)は音源位置候補となる。そして、得られた複数の音源位置候補の重心を求めることで音源位置を推定する。図3の場合、複数の音源位置候補の重心を求めるとは、複数の重みを示す丸印(位置とスケール)の重み付き重心を求めることである。
このように、各ノード内で分散して音声定位を行い、その結果を音声処理サーバに統合し、上述の2次元定位や3次元定位の処理を行い、音源の位置を推定する。
マイクアレイを備えるノードは、マイクアレイからの信号をA/D変換し(ステップS11)、各マイクの収音信号を入力する(ステップS13)。各マイクから収音した信号を用いて、ノートに搭載されているプロセッサが収音処理部として音源方向を推定する(ステップS15)。
収音処理部は、図6に示すグラフのように、マイクアレイの正面(垂線方向)を0°とし、その左右−90°〜90°までの方向について、MUSIC法の応答強度を算出する。そして、応答強度が強い方向を音源方向と推定する。その収音処理部は、図示しないネットワークを介して音声処理サーバと接続されており、ノード内で音源方向推定結果(A)と最大応答強度(B)をデータ交換している(ステップS17)。音源方向推定結果(A)と最大応答強度(B)は、音声処理サーバに送られる。
音声処理サーバでは、各ノードから送られてくるデータを受信する(ステップS21)。各ノードの最大応答強度から複数の音源位置候補を算出する(ステップS23)。そして、音源方向推定結果(A)と最大応答強度(B)に基づいて音源の位置を推定する(ステップS25)。
この3つのケースA〜Cを用いて、ノード数と各ノードの音源方向推定の誤差ばらつきを変更し、3次元位置推定の結果を比較した。3次元位置推定は、各ノードが通信相手をひとつランダムに選び、仮想交点を求めている。
図8の結果から、音源方向の推定精度が悪くても、ノード数を増やすことで、3次元位置推定の精度を向上させられることがわかる。
1a,1b,1c,・・・,1n マイクアレイ
2,2a,2b,2c,・・・,2n 収音処理部
3 I/O部
4 プロセッサ
10,11,12 ネットワーク
20 音声処理サーバ
30,30a,30b,30c ノード
Claims (15)
- マイクアレイを備えた複数のノードが相互にネットワークで接続されたマイクアレイ・ネットワークシステムであって、
各ノードは、
複数のマイクをアレイ状に配列して構成されたマイクアレイと、
マイクアレイの収音信号を入力し、音源方向の推定を行う収音処理部と、
音源方向推定結果および最大応答強度に関して、他ノードの収音処理部とデータ通信を行うデータ通信部と、
を備え、
前記収音処理部は、自ノードを含む複数のノードの音源方向推定結果および最大応答強度から、複数の音源位置候補を算出し、音源位置推定を行うことを特徴とするマイクアレイ・ネットワークシステム。 - マイクアレイを備えた複数のノードと音声処理サーバがネットワークで接続されたマイクアレイ・ネットワークシステムであって、
各ノードは、
複数のマイクをアレイ状に配列して構成されたマイクアレイと、
マイクアレイの収音信号を入力し、音源方向の推定を行う収音処理部と、
音源方向推定結果、最大応答強度、音声データを前記音声処理サーバにデータ送信を行うデータ通信部と、
を備え、
前記音声処理サーバは、
各ノードの音源方向推定結果および最大応答強度から、複数の音源位置候補を算出し、音源位置推定を行うことを特徴とするマイクアレイ・ネットワークシステム。 - マイクアレイを備えた複数のノードと音声処理サーバがネットワークで接続されたマイクアレイ・ネットワークシステムであって、
各ノードは、
複数のマイクをアレイ状に配列して構成されたマイクアレイと、
マイクアレイの収音信号を入力し、音源方向の推定を行う収音処理部と、
音源方向推定結果、最大応答強度、音声データを前記音声処理サーバにデータ送信を行うデータ通信部と、
を備え、
前記音声処理サーバは、
各ノードの音源方向推定結果および最大応答強度から、複数の音源位置候補を算出し、音源位置推定を行い、
前記音源位置推定に基づいて特定ノードから音声データを取り込むことを特徴とするマイクアレイ・ネットワークシステム。 - 前記ネットワークがマルチホップ伝送ネットワークであることを特徴とする請求項1〜3のいずれかに記載のマイクアレイ・ネットワークシステム。
- 前記音源位置候補算出は、2つのノードの前記音源方向推定結果の交点、若しくは、2つのノードの前記音源方向推定結果の2直線を最短で結ぶ線分上に存在する仮想交点を算出することを特徴とする請求項1〜4のいずれかに記載のマイクアレイ・ネットワークシステム。
- 前記音源位置推定は、前記複数の音源位置候補に対して前記最大応答強度および前記最短で結ぶ線分の長さに基づく重み付けを行い、前記複数の音源位置候補の重心を算出することにより位置推定することを特徴とする請求項1〜4のいずれかに記載のマイクアレイ・ネットワークシステム。
- 複数のマイクをアレイ状に配列して構成されたマイクアレイと、
該マイクアレイの収音信号を入力し音源方向の推定を行う収音処理部と、
他ノードの収音処理部とデータ通信を行うデータ通信部と、
を備えた複数のノードが相互にネットワークで接続されたマイクアレイ・ネットワークシステムを用いる音源定位方法であって、
各ノードにおいて、
音源方向推定結果および最大応答強度を算出する音源方向推定工程と、
自ノードを含む複数のノードの音源方向推定結果および最大応答強度から、複数の音源位置候補を算出する音源位置候補算出工程と、
前記音源位置候補算出工程により算出した音源位置候補から音源位置推定を行う音源位置推定工程と、
を備えたことを特徴とするマイクアレイ・ネットワークシステムにおける音源定位方法。 - 複数のマイクをアレイ状に配列して構成されたマイクアレイと、
該マイクアレイの収音信号を入力し音源方向の推定を行う収音処理部と、
音声処理サーバとデータ通信を行うデータ通信部と、
を備えた複数のノードおよび前記音声処理サーバがネットワークで接続されたマイクアレイ・ネットワークシステムを用いる音源定位方法であって、
各ノードにおいて、
音源方向推定結果および最大応答強度を算出する音源方向推定工程と、
前記音声処理サーバにおいて、
各ノードの音源方向推定結果および最大応答強度から、複数の音源位置候補を算出する音源位置候補算出工程と、
前記音源位置候補算出工程により算出した音源位置候補から音源位置推定を行う音源位置推定工程と、
を備えたことを特徴とするマイクアレイ・ネットワークシステムにおける音源定位方法。 - 複数のマイクをアレイ状に配列して構成されたマイクアレイと、
該マイクアレイの収音信号を入力し音源方向の推定を行う収音処理部と、
音声処理サーバとデータ通信を行うデータ通信部と、
を備えた複数のノードおよび前記音声処理サーバがネットワークで接続されたマイクアレイ・ネットワークシステムを用いる音源定位方法であって、
各ノードにおいて、
音源方向推定結果および最大応答強度を算出する音源方向推定工程と、
前記音声処理サーバにおいて、
各ノードの音源方向推定結果および最大応答強度から、複数の音源位置候補を算出する音源位置候補算出工程と、
前記音源位置候補算出工程により算出した音源位置候補から音源位置推定を行う音源位置推定工程と、
前記音源位置推定工程に基づいて特定ノードから音声データを取り込む音声データ取得工程と、
を備えたことを特徴とするマイクアレイ・ネットワークシステムにおける音源定位方法。 - 前記ネットワークがマルチホップ伝送ネットワークであることを特徴とする請求項7〜9のいずれかに記載のマイクアレイ・ネットワークシステムにおける音源定位方法。
- 前記音源位置候補算出工程は、2つのノードの前記音源方向推定結果の交点、若しくは、2つのノードの前記音源方向推定結果の2直線を最短で結ぶ線分上に存在する仮想交点を算出することを特徴とする請求項7〜10のいずれかに記載のマイクアレイ・ネットワークシステムにおける音源定位方法。
- 前記音源位置推定工程は、前記複数の音源位置候補に対して前記最大応答強度および2つのノードの前記音源方向推定結果の2直線を最短で結ぶ線分の長さに基づく重み付けを行い、前記複数の音源位置候補の重心を算出することにより位置推定することを特徴とする請求項7〜10のいずれかに記載のマイクアレイ・ネットワークシステムにおける音源定位方法。
- 請求項11に記載の音源位置候補算出工程において、前記2つのノードは、前記最大応答強度が所定閾値以上を有するノードの全組合せであること。
- 請求項11に記載の音源位置候補算出工程において、前記2つのノードは、ノード中からランダムに抽出されたものであること。
- 請求項11に記載の音源位置候補算出工程において、前記2つのノードは、該2つのノード間距離が所定範囲内のものであること。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010056796A JP5022461B2 (ja) | 2010-03-12 | 2010-03-12 | マイクアレイ・ネットワークシステムおよび該システムを用いた音源定位方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010056796A JP5022461B2 (ja) | 2010-03-12 | 2010-03-12 | マイクアレイ・ネットワークシステムおよび該システムを用いた音源定位方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011193176A JP2011193176A (ja) | 2011-09-29 |
JP5022461B2 true JP5022461B2 (ja) | 2012-09-12 |
Family
ID=44797660
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010056796A Expired - Fee Related JP5022461B2 (ja) | 2010-03-12 | 2010-03-12 | マイクアレイ・ネットワークシステムおよび該システムを用いた音源定位方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5022461B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11908464B2 (en) | 2018-12-19 | 2024-02-20 | Samsung Electronics Co., Ltd. | Electronic device and method for controlling same |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014087495A1 (ja) * | 2012-12-05 | 2014-06-12 | 株式会社日立製作所 | 音声対話ロボット、音声対話ロボットシステム |
JP6250297B2 (ja) * | 2013-04-15 | 2017-12-20 | シャープ株式会社 | 音声入力装置、および画像表示装置 |
JP7051876B6 (ja) * | 2017-01-27 | 2023-08-18 | シュアー アクイジッション ホールディングス インコーポレイテッド | アレイマイクロホンモジュール及びシステム |
KR102395445B1 (ko) * | 2018-03-26 | 2022-05-11 | 한국전자통신연구원 | 음원의 위치를 추정하기 위한 전자 장치 |
CN110297215B (zh) * | 2019-06-19 | 2023-01-31 | 东北电力大学 | 一种圆阵列声源定位可视化系统及方法 |
JP7250281B2 (ja) * | 2019-12-12 | 2023-04-03 | 本田技研工業株式会社 | 三次元構造復元装置、三次元構造復元方法、およびプログラム |
CN113376578A (zh) * | 2021-06-07 | 2021-09-10 | 上海数川数据科技有限公司 | 一种基于到达角度和声音强度匹配的声源定位方法及系统 |
CN114720943B (zh) * | 2022-06-06 | 2022-09-02 | 深圳市景创科技电子股份有限公司 | 多声道声源定位方法及系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007074317A (ja) * | 2005-09-06 | 2007-03-22 | Fuji Xerox Co Ltd | 情報処理装置および情報処理方法 |
-
2010
- 2010-03-12 JP JP2010056796A patent/JP5022461B2/ja not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11908464B2 (en) | 2018-12-19 | 2024-02-20 | Samsung Electronics Co., Ltd. | Electronic device and method for controlling same |
Also Published As
Publication number | Publication date |
---|---|
JP2011193176A (ja) | 2011-09-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5022461B2 (ja) | マイクアレイ・ネットワークシステムおよび該システムを用いた音源定位方法 | |
JP5289517B2 (ja) | センサネットワークシステムとその通信方法 | |
JP4675381B2 (ja) | 音源特性推定装置 | |
CN103308889B (zh) | 复杂环境下被动声源二维doa估计方法 | |
JP6467736B2 (ja) | 音源位置推定装置、音源位置推定方法および音源位置推定プログラム | |
JP2015154207A (ja) | 音響処理装置、及び音響処理方法 | |
CN109901112B (zh) | 基于多通道声获取的声学同时定位与建图方法 | |
CN105388459A (zh) | 分布式麦克风阵列网络的鲁棒声源空间定位方法 | |
JP5412470B2 (ja) | 位置測定システム | |
KR101767928B1 (ko) | 음원 위치 추정 장치 및 방법 | |
JP2019062435A (ja) | 機器制御装置、機器制御プログラム、機器制御方法、対話装置、及びコミュニケーションシステム | |
JP5361008B2 (ja) | パーティクルフィルターに基づく音響センサーを利用した3次元空間での客体追跡方法 | |
TWI429885B (zh) | 迴響環境之聲源能量分佈可視化的方法 | |
KR20090128221A (ko) | 음원 위치 추정 방법 및 그 방법에 따른 시스템 | |
Cobos et al. | Wireless acoustic sensor networks and applications | |
JP2011033369A (ja) | 会議装置 | |
Takagi et al. | Microphone array network for ubiquitous sound acquisition | |
Astapov et al. | Simplified acoustic localization by linear arrays for wireless sensor networks | |
Zhu et al. | WIFI fingerprinting indoor localization system based on spatio-temporal (ST) metrics | |
JP6650245B2 (ja) | インパルス応答生成装置及びプログラム | |
Farmani et al. | TDOA-based self-calibration of dual-microphone arrays | |
JP6415975B2 (ja) | 音源方向推定装置 | |
CN111289947B (zh) | 信息处理方法、装置以及设备 | |
KR101483271B1 (ko) | 음원 위치 추정에 있어 대표 점 선정 방법 및 그 방법을이용한 음원 위치 추정 시스템 | |
Pasha et al. | Forming ad-hoc microphone arrays through clustering of acoustic room impulse responses |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120529 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120605 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120615 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150622 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |