JP2013030946A - センサネットワークシステムとその通信方法 - Google Patents

センサネットワークシステムとその通信方法 Download PDF

Info

Publication number
JP2013030946A
JP2013030946A JP2011164986A JP2011164986A JP2013030946A JP 2013030946 A JP2013030946 A JP 2013030946A JP 2011164986 A JP2011164986 A JP 2011164986A JP 2011164986 A JP2011164986 A JP 2011164986A JP 2013030946 A JP2013030946 A JP 2013030946A
Authority
JP
Japan
Prior art keywords
node
signal
base station
sound
sensor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011164986A
Other languages
English (en)
Other versions
JP5289517B2 (ja
Inventor
Hiroshi Kawaguchi
博 川口
Masahiko Yoshimoto
雅彦 吉本
Shintaro Izumi
慎太郎 和泉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Semiconductor Technology Academic Research Center
Original Assignee
Semiconductor Technology Academic Research Center
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Semiconductor Technology Academic Research Center filed Critical Semiconductor Technology Academic Research Center
Priority to JP2011164986A priority Critical patent/JP5289517B2/ja
Priority to US13/547,426 priority patent/US8600443B2/en
Publication of JP2013030946A publication Critical patent/JP2013030946A/ja
Application granted granted Critical
Publication of JP5289517B2 publication Critical patent/JP5289517B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02166Microphone arrays; Beamforming
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/40Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
    • H04R1/406Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2201/00Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
    • H04R2201/40Details of arrangements for obtaining desired directional characteristic by combining a number of identical transducers covered by H04R1/40 but not provided for in any of its subgroups
    • H04R2201/4012D or 3D arrays of transducers

Landscapes

  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)

Abstract

【課題】センサネットワークシステムにおいてデータ集約を効率的に行うことができ、ネットワークトラフィックを大幅に削減する。
【解決手段】既知の位置情報を有する複数のノードが相互に伝搬経路を介するネットワーク上で接続されかつ時間同期されたセンサネットワークシステムを用いて、各ノードで測定されたデータを1つの基地局に集約するように収集するセンサネットワークシステムにおいて、基地局は各ノードからの信号の角度推定値と各ノードの位置情報とに基づいて、信号源の位置を計算し、信号源に最も近いノードをクラスタヘッドノードに指定し、信号源の位置とクラスタヘッドノードの情報とを各ノードに送信して各クラスタヘッドノードからホップ数内に位置する各ノードを各クラスタに所属するノードとしてクラスタリングし、指定されたクラスタに属する各ノード毎に、センサアレイで受信した信号に対して強調処理して基地局に送信する。
【選択図】図25

Description

本発明は、高音質な音声取得を目的とするマイクロホンアレイ・ネットワークシステムなどのセンサネットワークシステムとその通信方法に関する。
従来、音声を利用するアプリケーションシステム(例えば、複数台のマイクロホンを接続するような音声会議システム、音声認識するロボットシステム、各種音声インタフェースを備えたシステム等)では、高音質な音声を利用するために、音源定位、音源分離、雑音除去、エコーキャンセル等の様々な音声処理を行っている。特に、高音質な音声取得を目的として、音源定位や音源分離を主な処理とするマイクロホンアレイが広く研究されている。ここで、音源定位とは音の到達時間差などから音源の方向・位置を特定することであり、また音源分離は音源定位の結果を利用して雑音となる音源を消去し特定方向にある特定音源の抽出を行うことである。
マイクロホンアレイを用いた音声処理は、通常、マイクロホン数が多いほど雑音処理などの音声処理性能が向上することが知られている。また、そのような音声処理では、音源の位置情報を用いる音源定位の手法が多く存在している(例えば、非特許文献1を参照。)。音源定位の結果が正確であるほど音声処理が有効に働くことになる。すなわち、マイクロホン数を増加して音源定位の高精度化と高音質のための雑音除去を同時に図ることが必要とされている。
従来の大規模マイクロホンアレイを用いた音源定位の場合、音源の位置範囲を網目状に分割し、各区間に対して音源位置を確率的に求める。この計算には、全音声データをワークステーションなどの一箇所の音声処理サーバに収集し、全音声データを一括処理して音源の位置を推定していた(例えば、非特許文献2を参照。)。このような全音声データの一括処理の場合には、音声収集のためのマイクロホンと音声処理サーバ間の信号配線長、通信量や音声処理サーバでの演算量が膨大となっていた。配線長、通信量、音声処理サーバでの演算量の増大、また音声処理サーバ一箇所に多数のA/Dコンバータを配置できないという物理的な制限によって、マイクロホン数を増やせないという問題がある。また、信号配線長が長くなることによるノイズの発生の問題もある。そのため、高音質を追求するためのマイクロホン数の増加が困難であるという問題が生じていた。
かかる問題を改善する方法として、複数のマイクロホンを小アレイに分割し、それを統合するマイクロホンアレイによる音声処理システムが知られている(例えば、非特許文献3を参照。)。しかしながら、かかる音声処理システムの場合でも、小アレイで取得したすべてのマイクロホンの音声データを、ネットワークを介して一箇所の音声サーバに統合することから、ネットワークの通信トラフィックの増加の問題がある。また、通信データ量や通信トラフィック量の増加に伴う音声処理の遅延が生じるという問題がある。
また、今後、ユビキタス・システムにおける収音やテレビ会議システムなどの要求に応えるためには、より多くのマイクロホンが必要となってくる(例えば、特許文献1を参照。)。しかしながら、上述の通り、現状のマイクロホンアレイのネットワークシステムでは、マイクロホンアレイで得られた音声データをそのままサーバに転送しているに過ぎない。マイクロホンアレイの各ノードが相互に音源の位置情報を交換して、システム全体の計算量の低減並びにネットワークの通信量の低減を図るシステムは見当たらない。従って、マイクロホンアレイのネットワークシステムの大規模化を想定し、システム全体の計算量の低減並びにネットワークの通信量を抑えるようなシステムアーキテクチャーが重要となる。
上述したように、音声処理サーバにおける通信量と演算量を抑えながら、数多くのマイクロホンアレイを用いて音源定位精度を高め、雑音除去などの音声処理を有効に行わせることが求められている。また、昨今、音源を用いた位置測定システムが提案されている。例えば、特許文献2では、超音波タグとマイクロホンアレイとを用いて超音波タグを算定することが開示されている。さらに、特許文献3では、マイクロホンアレイを用いて収音を行うことが開示されている。
特開2008−113164号公報 国際公開第2008/026463号パンフレット 特開2008−058342号公報 特開2008−099075号公報
R.O. Schmidt, "Multiple emitter location and signal parameter estimation", In Proceedings of the RADC Spectrum Estimation Workshop, pp.243-248, October 1979. E. Weinstein et al., "Loud: A 1020-node modular microphone array and beamformer for intelligent computing spaces", MIT, MIT/LCS Technical Memo MIT-LCS-TM-642, April 2004. A. Brutti et al., "Classification of Acoustic Maps to Determine Speaker Position and Orientation from a Distributed Microphone Network", In Proceedings of ICASSP, Vol. IV, pp. 493-496, April. 2007. Wendi Rabiner Heinzelman et al., "Energy-Efficient Communication Protocol for Wireless Microsensor Networks", Proceedings of the 33rd Hawaii International Conference on System Sciences, 2000, Vol. 8, pp.1-10, January 2000. Vivek Katiyar et al., "A Survey on Clustering Algorithms for Heterogeneous Wireless Sensor Networks", International Journal of Advanced Netwoking and Applications, Vol. 02, Issue 04, pp. 745-754, 2011. J. Benesty et al., "Handbook of Speech Processing", Springer, 2007. F. Asano et al., "Sound Source Localization and Signal Separation for Office Robot (Jijo-2)", Proceedings of IEEE MFI, pp. 243-248, 1999. M. Maroti et al., "The Flooding Time Synchronization Protocol", Proceedings of 2nd ACM SenSys, pp. 39-49, 2004. T. Takeuchi et al., "Cross-Layer Design for Low-Power Wireless Sensor Node Using Wave Clock", IEICE Transactions on Communications, Vol. E91-B, No. 11, pp. 3480-3488, November 2008. Maleq Khan et al., "Distributed Algorithms for Constructing Approximate Minimum Spanning Trees in Wireless Networks", IEEE Transactions on Parallel and Distributed Systems, Vol. 20, No 1, pp. 124-139, January 2009. W. Ye et al., "Medium Access Control With Coordinated Adaptive Sleeping for Wireless Sensor Networks", IEEE/ACM Transactions on Networking, Vol. 12, No. 3, pp. 493-506, 2004.
しかしながら、多くのモバイル端末に搭載されているGPSシステムやWiFiシステムの位置測定機能では、地図上のおおまかな位置を取得できても、数十cmといった近距離での端末間の位置関係を取得できないという問題点があった。
例えば、非特許文献4においては、無線センサネットワークにおいて、伝送エネルギーを効率的に使用して無線通信を行う通信プロトコルが開示されている。また、非特許文献5においては、無線センサネットワークにおいて、消費エネルギーを減少させるための方法として、センサネットワークの寿命を長くするために、クラスタリング技術を用いることが開示されている。
しかしながら、従来技術に係るクラスタリング手法はネットワーク層に限定された手法であり、センシング対象(アプリケーション層)やノードのハードウェア構成を考慮していない。このため、従来手法は、現実の物理的な信号源位置に基づいた経路構築が必要となるアプリケーションには適応しないという問題点があった。
本発明の目的は以上の問題点を解決し、例えばマイクロホンアレイ・ネットワークシステムなどのセンサネットワークシステムにおいて、従来技術に比較してデータ集約を効率的に行うことができ、ネットワークトラフィックを大幅に削減できかつセンサノードの消費電力を低減できるセンサネットワークシステムとその通信方法を提供することにある。
本発明に係るセンサネットワークシステムは、それぞれセンサアレイを備え、既知の位置情報を有する複数のノードが所定の通信プロトコルを用いて相互に所定の伝搬経路を介するネットワーク上で接続され、かつ時間同期されたセンサネットワークシステムを用いて、上記各ノードで測定されたデータを1つの基地局に集約するように収集するセンサネットワークシステムであって、
上記各ノードは、
複数のセンサをアレイ状に配列して構成されたセンサアレイと、
上記センサアレイで受信した所定の信号源からの信号に基づいて上記信号の検出をしたときに、検出メッセージを基地局に送信するとともに、上記信号の到来方向の角度を推定して角度推定値を上記基地局に送信し、もしくは、他のノードから所定のホップ数で受信した信号検出時の起動メッセージに応答して、起動して上記信号の到来方向の角度を推定して角度推定値を上記基地局に送信する方向推定処理部と、
上記音源に対応して上記基地局から指定されたクラスタに属する各ノード毎に、上記センサアレイで受信した所定の信号源からの信号に対して強調処理し、当該強調処理された信号を基地局に送信する通信処理部とを備え、
上記基地局は、上記各ノードからの上記信号の角度推定値と上記各ノードの位置情報とに基づいて、上記信号源の位置を計算するとともに、上記信号源に最も近いノードをクラスタヘッドノードに指定し、上記信号源の位置と上記指定されたクラスタヘッドノードの情報とを上記各ノードに送信することにより、上記各クラスタヘッドノードから上記ホップ数内に位置する各ノードを各クラスタに所属するノードとしてクラスタリングし、
上記各ノードは、上記音源に対応して上記基地局から指定されたクラスタに属する各ノード毎に、上記センサアレイで受信した所定の信号源からの信号に対して強調処理し、当該強調処理された信号を基地局に送信することを特徴とする。
また、上記センサネットワークシステムにおいて、上記各ノードは、上記信号を検出する前、もしくは、上記起動メッセージを受信する前は、スリープモードに設定されて、上記信号を検出する回路及び上記起動メッセージを受信する回路以外の回路に対する電源供給を停止することを特徴とする。
さらに、上記センサネットワークシステムにおいて、上記センサは、音声を検出するマイクロホンであることを特徴とする。
本発明に係るセンサネットワークシステムの通信方法は、それぞれセンサアレイを備え、既知の位置情報を有する複数のノードが所定の通信プロトコルを用いて相互に所定の伝搬経路を介するネットワーク上で接続され、かつ時間同期されたセンサネットワークシステムを用いて、上記各ノードで測定されたデータを1つの基地局に集約するように収集するセンサネットワークシステムの通信方法であって、
上記各ノードは、
複数のセンサをアレイ状に配列して構成されたセンサアレイと、
上記センサアレイで受信した所定の信号源からの信号に基づいて上記信号の検出をしたときに、検出メッセージを基地局に送信するとともに、上記信号の到来方向の角度を推定して角度推定値を上記基地局に送信し、もしくは、他のノードから所定のホップ数で受信した信号検出時の起動メッセージに応答して、起動して上記信号の到来方向の角度を推定して角度推定値を上記基地局に送信する方向推定処理部と、
上記音源に対応して上記基地局から指定されたクラスタに属する各ノード毎に、上記センサアレイで受信した所定の信号源からの信号に対して強調処理し、当該強調処理された信号を基地局に送信する通信処理部とを備え、
上記通信方法は、
上記基地局が、上記各ノードからの上記信号の角度推定値と上記各ノードの位置情報とに基づいて、上記信号源の位置を計算するとともに、上記信号源に最も近いノードをクラスタヘッドノードに指定し、上記信号源の位置と上記指定されたクラスタヘッドノードの情報とを上記各ノードに送信することにより、上記各クラスタヘッドノードから上記ホップ数内に位置する各ノードを各クラスタに所属するノードとしてクラスタリングするステップと、
上記各ノードが、上記音源に対応して上記基地局から指定されたクラスタに属する各ノード毎に、上記センサアレイで受信した所定の信号源からの信号に対して強調処理し、当該強調処理された信号を基地局に送信するステップとを含むことを特徴とする。
また、上記センサネットワークシステムの通信方法において、上記各ノードが、上記信号を検出する前、もしくは、上記起動メッセージを受信する前は、スリープモードに設定されて、上記信号を検出する回路及び上記起動メッセージを受信する回路以外の回路に対する電源供給を停止するステップをさらに含むことを特徴とする。
さらに、上記センサネットワークシステムの通信方法において、上記センサは、音声を検出するマイクロホンであることを特徴とする。
従って、本発明に係るセンサネットワークシステムとその通信方法によれば、センサネットワーク上でのクラスタリング、クラスタヘッド決定、ルーティングのために、センシング対象となる信号を利用し、複数の信号源の物理配置に対応し、データ集約に特化したネットワーク経路を構築することで、冗長な経路を削減し、同時にデータ集約の効率を高めることができる。また、経路構築のための通信オーバーヘッドが少ないため、ネットワークトラフィックが削減され、消費電力の大きい通信回路の稼働時間を減らすことができる。それ故、センサネットワークシステムにおいて、従来技術に比較してデータ集約を効率的に行うことができ、ネットワークトラフィックを大幅に削減できかつセンサノードの消費電力を低減できる。
本発明の第1の実施形態に係る音源定位システム及び第2の実施形態に係る位置測定システムで用いるノードの詳細構成を示すブロック図である。 図1のシステムで用いるマイクロホンアレイ・ネットワークシステムにおける処理を示すフローチャートである。 図1のシステムで用いるゼロクロス点による音声アクティビティの検出(VAD)を示す波形図である。 図1のシステムで用いる遅延和回路部の詳細を示すブロック図である。 分散配置された複数の図4の遅延和回路部の基本原理を示す平面図である。 図5のシステムにおける動作を示す音源からの時間遅延を示すグラフである。 第1の実施形態に係る音源定位システムの構成を示す説明図である。 図7の音源定位システムにおける2次元の音源定位を説明する説明図である。 図7の音源定位システムにおける3次元の音源定位を説明する説明図である。 本発明の実施例1に係るマイクロホンアレイ・ネットワークシステムの構成を示す構成図である。 図10のマイクロホンアレイを備えたノードの構成を示す構成図である。 図7のマイクロホンアレイ・ネットワークシステムの機能を示す機能図である。 図7のマイクロホンアレイ・ネットワークシステムにおける3次元の音源定位精度の実験を説明する説明図である。 図7のマイクロホンアレイ・ネットワークシステムにおける3次元の音源定位精度向上を示す測定結果を示すグラフである。 本発明の実施例2に係るマイクロホンアレイ・ネットワークシステムの構成を示す構成図である。 図15の実施例2に係る音源定位システムを説明する説明図である。 本発明の第2の実施形態に係る位置測定システムで用いるネットワークの構成を示すブロック図である。 (a)は図17の位置測定システムで用いるフラディング時間同期プロトコル(Flooding Time Synchronization Protocol(FTSP))の方法を示す斜視図であり、(b)はその方法を示すデータ伝搬の状況を示すタイミングチャートである。 図17の位置測定システムで用いる線形補間付き時間同期を示すグラフである。 図17の位置測定システムにおける各タブレット間の信号伝送手順及び各タブレットで実行される各処理を示すタイミングチャートの第1の部分である。 図17の位置測定システムにおける各タブレット間の信号伝送手順及び各タブレットで実行される各処理を示すタイミングチャートの第2の部分である。 図17の位置測定システムの各タブレットで測定された角度情報から各タブレット間の距離を測定する方法を示す平面図である。 本発明の第3の実施形態に係るマイクロホンアレイ・ネットワークシステムのためのデータ集約システムのノードの構成を示すブロック図である。 図22のデータ通信部57aの詳細構成を示すブロック図である。 図23のパラメータメモリ57b内のテーブルメモリの詳細構成を示す表である。 図22のデータ集約システムの処理動作を示す模式平面図であって、(a)は基地局からのFTSPの処理及びルーティング(T11)を示す模式平面図であり、(b)は音声アクティビティ検出(VAD)及び検出メッセージ送信(T12)を示す模式平面図であり、(c)はウェイクアップメッセージ及びクラスタリング(T13)を示す模式平面図であり、(d)はクラスタを選択して遅延和処理(T14)を示す模式平面図である。 図22のデータ集約システムの処理動作の第1の部分を示すタイミングチャートである。 図22のデータ集約システムの処理動作の第2の部分を示すタイミングチャートである。 図22のデータ集約システムの実施例の構成を示す平面図である。
以下、本発明に係る実施形態について図面を参照して説明する。なお、以下の各実施形態において、同様の構成要素については同一の符号を付している。
従来技術において説明したように、多数のノードから構成されるセンサネットワークにおいて、自立分散型のルーティングアルゴリズムは必要不可欠である。センシング対象となる信号の発生源がセンシングエリアに複数存在し、それらに対して最適な経路を構築するためには、クラスタリングを用いたルーティングが有効である。本発明に係る実施形態では、高音質な音声取得を目的とするマイクロホンアレイ・ネットワークシステムに係るセンサネットワークシステムにおいて、音源定位システムを用いて効率的にデータ集約を行うことができるセンサネットワークシステムとその通信方法について以下に説明する。
(第1の実施形態)
図1は本発明の第1の実施形態に係る音源定位システムで用いるノードの詳細構成を示すブロック図であり、第2の実施形態に係る位置測定システムでも用いる。本実施形態に係る音源定位システムは、例えばユビキタスネットワークシステム(UNS)を用いて構築され、例えば16個のマイクロホンを有する小規模なマイクロホンアレイ(センサノード)を所定のネットワークで結ぶことで、全体として大規模なマイクロホンアレイ音声処理システムを構築することにより、音源定位システムを構成する。ここで、センサノードにはそれぞれマイクロホンロプロセッサを搭載し、分散・協調し合って音声処理を行う。
各センサノードは、図1に示すように、
(1)収音する複数のマイクロホン1に接続されたAD変換回路51と、
(2)AD変換回路51に接続され音声信号を検知するための発話推定処理部(Voice Activity Detection:以下、VAD処理部という。また、VADを音声アクティビティ検出という。)52と、
(3)AD変換回路51によりAD変換された音声信号又はサウンド信号を含む音声信号等(ここで、サウンド信号は、例えば、500Hzなどの可聴周波数の信号もしくは超音波信号をいう。)を一時的に記憶するSRAM(Static Random Access Memory)54と、
(4)SRAM54から出力される音声信号等のディジタルデータに対して音源の位置を推定する音源定位(Sound Source Localization)処理を実行してその結果をSSS処理部56に出力するSSL処理部55と、
(5)SRAM54及びSSL処理部55から出力される音声信号等のディジタルデータに対して、特定の音源を抽出する音源分離(Sound Source Separation)処理を実行して、それらの処理の結果として得られたSNRの高い音声データを他のノードと、ネットワークインターフェース回路57を介して送受信することにより収集するSSS処理部56と、
(6)他の周囲センサノードNn(n=1,2,…,N)と接続され、音声データを送受信するデータ通信部を構成するネットワークインターフェース回路57とを備えて構成される。
各センサノードNn(n=0,1,2,…,N)は互いに同様の構成を有するが、基地局のセンサノードN0では、上記音声データをネットワーク上で集約することで、さらにSNRが高められた音声データが得られる。なお、VAD処理部52及び電源管理部53は第1の実施形態の音源定位において用いるが、第2の実施形態の位置推定では、原則として用いない。また、後述する距離推定は、例えばSSL処理部55で実行される。
以上のように構成されたシステムにおいて、16個のマイクロホン1からの入力音声データはAD変換回路51によりデジタル化され、音声データの情報はSRAM54に格納される。その後、情報は、音源定位と音源分離のために使用される。それらを含む音声処理は、待機電力を節約する電力管理部53ジャ及びVAD処理部52よって実行される。音声がマイクロホンアレイの周囲に存在しない場合は、音声処理部はオフになっており、使用していない場合は多数のマイクロホン1がはるかに電力を浪費するために、電源管理は基本的に必要である。
図2は図1のシステムで用いるマイクロホンアレイ・ネットワークシステムにおける処理を示すフローチャートである。
図2において、1つのマイクロホン1からの音声を入力し(S1)、音声アクティビティ(VA)の検出処理(S2)を実行する。ここでは、ゼロクロス点を計数し(S2a)、音声アクティビティ(発話推定)を検出したか否かを判断し(S2b)、検出したら周囲のサブアレイをウエイクアップモードにし(S3)、すべてのマイクロホン1の音声を入力する(S4)。そして、音源の定位処理(S5)では、サブアレイ内の方向推定(S5a)、位置情報の通信(S5b)及び音源の定位処理(S5c)を行った後、音源の分離処理(S6)を行う。ここでは、サブアレイ内の分離(S6a)、音声データの通信(S6b)及びさらなる音源の分離(S6c)を実行し、音声データを出力する(S7)。
当該システムの顕著な特徴は以下の通りである。
(1)全体のノードを活性化するには、低電力の音声アクティビティ検出を行っている。
(2)音源定位のために、音源の局在化(定位化)を行っている。
(3)音の騒音レベルを低減するために音源分離処理を行っている。
また、サブアレイの各ノードは相互通信をサポートするために互いに接続されている。従って、各ノードで得られる音声データはさらに音源のSNRを改善するために収集できる。当該システムは、周囲のノードとの相互作用を介して多数のマイクロホンアレイを構成している。従って、計算はノード間で分散できる。当該システムは、マイクロホンの数の面でスケーラビリティ(拡張性)を有している。また、各ノードは捕捉された音声データに対して前置処理を実行している。
図3は図1のシステムで用いるゼロクロス点による音声アクティビティの検出(VAD:発話推定の検出)を示す波形図である。
本実施形態に係るマイクロホンアレイのネットワークは、その電力消費が容易に多大になる多数のマイクロホンで構成されている。本実施形態に係るインテリジェントマイクロホンアレイシステムは、可能な限り電力を節約するために限られたエネルギー源で動作する必要がある。周囲が静かなときでも音声処理ユニットとマイクアンプはある程度の電力を消費するので、電力を節約する音声処理が効果的である。本発明者らの以前の装置では、サブアレイの待機電力を削減する低消費電力VADハードウェア実装を提案したが、本実施形態では、VADのためのゼロクロスアルゴリズムを使用する。図3から明らかなように、音声信号は高トリガー値又は低トリガー値であるトリガーラインを交差した後、ゼロクロス点は、入力信号とオフセットラインとの最初の交差に存在する。音声信号と非音声信号との間で、このゼロクロス点の存在比率は大幅に異なります。ゼロクロスVADは、この違いを検出し、音声区間の最初のポイントとの終点を出力することにより、音声を検出する。唯一の要件は、トリガーラインとオフセットラインとにわたってクロス点を捕捉することである。このとき、詳細な音声信号の検出は不要であり、その結果、サンプリング周波数とビット数を減らすことができます。
本発明者らのVADでは、サンプリング周波数を2kHzに低減することができ、サンプルあたりのビット数が10ビットに設定することができる。単一のマイクロホンは、信号を検出するのに十分であり、残りの15個のマイクロホンも同様にオフになっています。これらの値は人間の言葉を検出するのに十分であり、この場合において、ただ3.49μWの電力が0.18−μmCMOSプロセスで消費されている。
音声処理部からの低電力VAD処理部52を分離することで、電力管理部53を使用して音声処理部(SSL処理部55及びSSS処理部56など)をオフにすることができます。さらに、すべてのノードですべてのVAD処理部52を動作させる必要がある。VAD処理部52は、単にシステム内のノードの限られた数で活性化され、VAD処理部52は、音声信号を検出すると、主信号に係るプロセッサが実行を開始し、サンプリング周波数とビット数が十分な値まで増加されている。なお、AD変換回路51の仕様にアナログを決定するこれらのパラメータは、システムに統合されている特定のアプリケーションに応じて変更することができる。
次いで、分散配置された音声捕捉処理について以下に説明する。図4は図1のシステムで用いる遅延和回路部の詳細を示すブロック図である。高いSNRの音声データを取得するには、主要な音源を向上させる方法の以下の2つのタイプが提案されている。
(1)幾何学的位置情報を用いる手法、及び
(2)位置情報を使用しない統計的手法。
本実施形態に係るシステムでは、ネットワーク内のノードの位置がわかっていることを前提としているため、幾何学的方法に分類されているアルゴリズム(例えば、非特許文献6参照、図4)を形成する遅延和ビームを選択した。この方法は、統計的手法に比べ少ない歪みが得られる。幸いなことに、それは計算のわずかな量を必要とし、それが簡単に分散処理に適用可能である。分散ノードから音声データを収集するためのキーポイントは、隣接ノード間での音声の位相を並置させることであり、ここで、位相不整合(=時間遅延)は各ノードへの音源からの距離の違いによって発生する。
図5は分散配置された複数の図4の遅延和回路部の基本原理を示す平面図であり、図6は図5のシステムにおける動作を示す音源からの時間遅延を示すグラフである。本実施形態では、図5に示すように形成する分散遅延和ビームを実現するために、二層のアルゴリズムを導入する。ローカル層では、各ノードは、ノードの原点からローカルな遅れを有する16チャンネルの音声を収集してから、拡張された単一の音は、基本的な遅延和のアルゴリズムを使用して、ノード内に取得される。次に、加算アレイの位置で計算できる一定のグローバルな遅延で強調された音声データは、グローバル層の隣接ノードへ送信され、最後に、高いSNRを有する音声データに集約される。音声パケットは、タイムスタンプと、64個のサンプルの音声データを含む。ここで、タイムスタンプは、TPacket=TREC−Dsenderで与えられる。ここで、TRECは、パケット内の音声データが記録されたときにおける送信側ノードでのタイマー値を表し、DSenderは送信側ノードの原点でグローバルな遅延を示す。受信側ノードでは、受信したタイムスタンプがTPacketにそのグローバルな遅延(DReceiver)を追加することで調整し、音声データは遅延和の形で集約される(図6)。各ノードは、単一チャンネルの音声データを送信するものの、その結果、高いSNRの音声データは基地局で取得することができる。
図7は、本発明の音源定位の説明図を示している。図7に示すように、マイクロホンアレイを備えた6つのノードと1つの音声処理サーバ20がネットワーク10で接続されている。複数のマイクロホンをアレイ状に配列して構成されたマイクロホンアレイを備える6つのノードは、室内の四方の壁面に存在し、それぞれのノード内に存在する収音処理用のプロセッサで音源方向の推定を行い、その結果を音声処理サーバに統合することで音源の位置を特定する。各ノードでデータの処理を行うために、ネットワークの通信量が削減でき、ノード間で演算量が分散されるものである。
以下では、2次元の音源定位の場合と3次元の音源定位の場合に分けて詳細に説明する。まず、本発明の2次元の音源定位方法について図8を参照しながら説明する。図8は2次元の音源定位方法を説明している。図8に示すように、ノード1〜ノード3は、それぞれのマイクロホンアレイから収音した収音信号から音源方向を推定する。各ノードは、各方向に対して、MUSIC法の応答強度を計算して、その最大値をとる方向を音源方向と推定している。図8では、ノード1がマイクロホンアレイの配列面の垂線方向(正面方向)を0°とし、−90°〜90°までの方向に対して、応答強度を計算し、θ1=−30°の方向を音源方向と推定する場合を示している。ノード2やノード3も同様に各方向に対して、応答強度を計算して、その最大値をとる方向を音源方向と推定する。
そして、ノード1とノード2、或いは、ノード1とノード3というように、2つのノードの音源方向推定結果の交点に対して、重み付けを行っていく。ここで、重みは、各ノードのMUSIC法の最大応答強度に基づいて決定している(例えば2つのノードの最大応答強度の積とする)。図8では、重みのスケールを交点部分の丸印の径で表現している。
得られた複数の重みを示す丸印(位置とスケール)は音源位置候補となる。そして、得られた複数の音源位置候補の重心を求めることで音源位置を推定する。図8の場合、複数の音源位置候補の重心を求めるとは、複数の重みを示す丸印(位置とスケール)の重み付き重心を求めることである。
次に、本発明の3次元の音源定位方法について図9を参照しながら説明する。図9は3次元の音源定位方法を説明している。図9に示すように、ノード1〜ノード3は、それぞれのマイクロホンアレイから収音した収音信号から音源方向を推定する。各ノードは、3次元方向に対して、MUSIC法の応答強度を計算して、その最大値をとる方向を音源方向と推定している。図9は、ノード1がマイクロホンアレイの配列面の垂線方向(正面方向)の回転座標系の方向に対して、応答強度を計算し、強度が大きな方向を音源方向と推定する場合を示している。ノード2やノード3も同様に各方向に対して、応答強度を計算して、その最大値をとる方向を音源方向と推定する。
そして、ノード1とノード2、或いは、ノード1とノード3というように、2つのノードの音源方向推定結果の交点に対して、重みを求めていくのであるが、3次元の場合には交点が得られないことが多い。そのため、2つのノードの音源方向推定結果の直線を最短で結ぶ線分上に仮想的に交点を求めることにしている。なお、重みは、2次元と同様に、各ノードのMUSIC法の最大応答強度に基づいて決定している(例えば2つのノードの最大応答強度の積とする)。図9では、図8と同様に、重みのスケールを交点部分の丸印の径で表現している。
得られた複数の重みを示す丸印(位置とスケール)は音源位置候補となる。そして、得られた複数の音源位置候補の重心を求めることで音源位置を推定する。図9の場合、複数の音源位置候補の重心を求めるとは、複数の重みを示す丸印(位置とスケール)の重み付き重心を求めることである。
本発明の一実施形態について説明する。図10は、実施例1のマイクロホンアレイ・ネットワークシステムの構成図を示している。図10は、16個のマイクロホンがアレイ状に配列されたマイクロホンアレイ備えたノード(1a,1b,…,1n)と1つの音声処理サーバ20がネットワーク10で接続されたシステム構成を示している。それぞれのノードは、図11に示すように、16個のアレイ状に配列されたマイクロホン(m11,m12,…,m43,m44)の信号線が収音処理部2の入出力部(I/O部)3に接続されており、マイクロホンから収音された信号が収音処理部2のプロセッサ4に入力される。収音処理部2のプロセッサ4は、入力した収音信号を用いて、MUSIC法のアルゴリズムの処理を行って音源方向の推定を行う。
そして、収音処理部2のプロセッサ4は、図7で示される音声処理サーバ20に対して、音源方向推定結果と最大応答強度を送信する。
このように、各ノード内で分散して音声定位を行い、その結果を音声処理サーバに統合し、上述の2次元定位や3次元定位の処理を行い、音源の位置を推定する。
図12は、実施例1のマイクロホンアレイ・ネットワークシステムの機能図を示している。
マイクロホンアレイを備えるノードは、マイクロホンアレイからの信号をA/D変換し(ステップS11)、各マイクロホンの収音信号を入力する(ステップS13)。各マイクロホンから収音した信号を用いて、ノートに搭載されているプロセッサが収音処理部として音源方向を推定する(ステップS15)。
収音処理部は、図12に示すグラフのように、マイクロホンアレイの正面(垂線方向)を0°とし、その左右−90°〜90°までの方向について、MUSIC法の応答強度を算出する。そして、応答強度が強い方向を音源方向と推定する。その収音処理部は、図示しないネットワークを介して音声処理サーバと接続されており、ノード内で音源方向推定結果(A)と最大応答強度(B)をデータ交換している(ステップS17)。音源方向推定結果(A)と最大応答強度(B)は、音声処理サーバに送られる。
音声処理サーバでは、各ノードから送られてくるデータを受信する(ステップS21)。各ノードの最大応答強度から複数の音源位置候補を算出する(ステップS23)。そして、音源方向推定結果(A)と最大応答強度(B)に基づいて音源の位置を推定する(ステップS25)。
以下では、3次元の音源定位精度を説明する。図13は3次元の音源定位精度の実験の様子を模式図で示したものである。床面積が12m×12mで高さが3mの部屋を想定している。16個のマイクロホンをアレイ状に配列したマイクロホンアレイを床面の四方に等間隔で並べた16のサブアレイを想定した(16サブアレイのケースA)。また、マイクロホンアレイを床面の四方に16個及び天井面の四方に16個のマイクロホンアレイを等間隔で並べ、更に、床面に等間隔に9つのマイクロホンアレイを配置した41のサブアレイを想定した(41サブアレイのケースB)。また、マイクロホンアレイを床面の四方に32個及び天井面の四方に32個のマイクロホンアレイを等間隔で並べ、更に、床面に等間隔に9つのマイクロホンアレイを配置した73のサブアレイを想定した(73サブアレイのケースC)。
この3つのケースA〜Cを用いて、ノード数と各ノードの音源方向推定の誤差ばらつきを変更し、3次元位置推定の結果を比較した。3次元位置推定は、各ノードが通信相手をひとつランダムに選び、仮想交点を求めている。
測定した結果を図14に示す。図14の横軸は、方向推定誤差のばらつき(標準偏差)を示しており、縦軸は、位置推定誤差を示している。図14の結果から、音源方向の推定精度が悪くても、ノード数を増やすことで、3次元位置推定の精度を向上させられることがわかる。
本発明の他の実施形態について説明する。図16は、実施例2のマイクロホンアレイ・ネットワークシステムの構成図を示している。図17は、16個のマイクロホンがアレイ状に配列されたマイクロホンアレイ備えたノード(1a,1b,1c)がネットワーク(11,12)で接続されたシステム構成を示している。実施例2のシステムの場合、実施例1のシステム構成と異なり、音声処理サーバが存在しない。また、それぞれのノードは、実施例1と同様に、図11に示すように、16個のアレイ状に配列されたマイクロホン(m11,m12,…,m43,m44)の信号線が収音処理部2のI/O部3に接続されており、マイクロホンから収音された信号が収音処理部2のプロセッサ4に入力される。収音処理部2のプロセッサ4は、入力した収音信号を用いて、MUSIC法のアルゴリズムの処理を行って音源方向の推定を行う。
そして、収音処理部2のプロセッサ4は、隣接するノードや他のノードとの間で、音源方向推定結果をデータ交換する。収音処理部2のプロセッサ4は、自ノードを含む複数のノードの音源方向推定結果及び最大応答強度から、上述の2次元定位や3次元定位の処理を行い、音源の位置を推定する。
(第2の実施形態)
図1は、本発明の第2の実施形態に係る位置測定システムで用いるノードの詳細構成を示すブロック図である。第2の実施形態に係る位置測定システムは、第1の実施形態に係る音源定位システムを用いて、従来技術に比較して高精度で端末の位置を測定することを特徴としている。本実施形態に係る位置測定システムは、例えばユビキタスネットワークシステム(UNS)を用いて構築され、例えば16個のマイクロホンを有する小規模なマイクロホンアレイ(センサノード)を所定のネットワークで結ぶことで、全体として大規模なマイクロホンアレイ音声処理システムを構築することにより、位置測定システムを構成する。ここで、センサノードにはそれぞれマイクロホンロプロセッサを搭載し、分散・協調し合って音声処理を行う。
センサノードは図1の構成を有し、ここで、各センサノードでの処理の一例について以下に説明する。まず、初期段階ではすべてのセンサノードはスリープ状態にあり、ある程度距離の離れた幾つかのセンサノードは、例えば1つのセンサノードはサウンド信号を所定時間(例えば、3秒間)送信し、当該サウンド信号を検知したセンサノードは、多チャンネル入力による音源方向推定を開始する。同時にウエイクアップメッセージを周辺に存在する他のセンサノードにブロードキャストし、受け取ったセンサノードも即座に音源方向推定を開始する。各センサノードは、音源方向推定完了後、推定結果を基地局(サーバ装置に接続されたセンサノード)へ向けて送信する。基地局は収集した各センサノードの方向推定結果を用いて音源位置の推定を行い、音源方向推定を行ったすべてのセンサノードに向けて結果をブロードキャストする。次に、各センサノードは基地局から受け取った位置推定結果を用いて音源分離を行う。音源分離も音源定位と同様に、センサノード内とセンサノード間の2段階に分けて実行される。各センサノードで得られた音声データは、再びネットワークを介して基地局へ集約される。最終的に得られたSNRの高い音声信号は基地局からサーバ装置に転送され、サーバ装置上で所定のアプリケーションに用いられる。
図17は本実施形態の位置測定システムで用いるネットワークの構成(具体例)を示すブロック図である。また、図18(a)は図17の位置測定システムで用いるフラディング時間同期プロトコル(Flooding Time Synchronization Protocol(FTSP))の方法を示す斜視図であり、図18(b)はその方法を示すデータ伝搬の状況を示すタイミングチャートである。さらに、図19は図12の位置測定システムで用いる線形補間付き時間同期を示すグラフである。
図17において、サーバ装置SVを含むセンサノードN0〜N2間は例えばUTPケーブル60で接続され、10BASE−Tのイーサネット(登録商標)を用いて通信を行う。本実施例では、各センサノードN0〜N2は直線トポロジーで接続され、そのうち1つのセンサノードN0が基地局として動作して、例えばパーソナルコンピュータにてなるサーバ装置SVに接続されている。当該通信システムのデータリンク層には低消費電力化のために公知の低電力リスニング法(Low Power Listening)を使用し、ネットワーク層における経路構築には公知のタイニー・ディフュージョン法(Tiny Diffusion)を用いる。
本実施例において、センサノードN0〜N2間で音声データの集約を行うためには、ネットワーク上のすべてのセンサノードで時刻(タイマーの値)を同期する必要がある。本実施例では、公知のフラディングタイム同期プロトコル(Flooding Time Synchronization Protocol(FTSP))に線形補間を加えた同期手法を用いる。FTSPは一方向の簡略な通信のみによって高精度の同期を実現するものである。FTSPによる同期の精度は隣接センサノード間で1マイクロ秒以下だが、各センサノードが持つ水晶発振器にはばらつきがあり、図19のように同期処理後は時間と共に時刻ずれが生じてしまう。このずれは1秒間で数マイクロ秒から数十マイクロ秒であり、これでは音源分離の性能を低下させてしまうおそれがある。
図18(a)は図17の位置測定システムで用いるフラディング時間同期プロトコル(Flooding Time Synchronization Protocol(FTSP);例えば、非特許文献8参照)の方法を示す斜視図であり、図18(b)はその方法を示すデータ伝搬の状況を示すタイミングチャートである。
提案する本実施例のシステムでは、FTSPによる時刻同期時にセンサノード間の時刻ずれを記憶し、線形補間によってタイマーの進み方を調整する。1度目の同期時の受信タイムスタンプを、2度目の同期時のタイムスタンプを、受信側のタイマ値をとすると、の期間にだけのタイマーの進み方を調節することで、発振周波数のずれを補正することができる。これにより、同期完了後の時刻ずれを1秒間で0.17マイクロ秒以内に抑えることができる。FTSPによる時刻同期が1分に1度であったとしても、線形補間を行うことによりセンサノード間の時刻ずれは、10マイクロ秒以内に抑えられ、音源分離の性能を維持することが可能となる。
各センサノードにおいて相対時刻(例えば、最初のセンサノードがオンされた時刻を0として経過時間を相対時刻として定義する。)又は絶対時刻(例えば、暦の日時分秒を時刻とする。)を記憶しておいて、各センサノード間で時刻同期を上述の方法で行う。この時刻同期は、後述するようにセンサノード間の正確な距離を測定するために用いる。
図20A及び図20Bは、第2の実施形態に係る位置測定システムにおける各タブレットT1〜T4間の信号伝送手順及び各タブレットT1〜T4で実行される各処理を示すタイミングチャートである。ここで、例えば図1の構成を有する各タブレットT1〜T4は上記センサノードを備えて構成される。以下の説明では、タブレットT1をマスターとし、タブレットT2〜T4をスレーブとした場合の一例について説明するが、タブレットの数や、マスターはいずれのタブレットを使用してもよい。また、サウンド信号は可聴音波又は可聴域の周波数を越える超音波などであってもよい。ここで、サウンド信号は例えばAD変換回路51はDA変換回路も備えてSSL処理部55の指示に応答して1つのマイクロホン1から、例えば無指向性サウンド信号を発生し、もしくは、超音波発生素子を備えてSSL処理部55の指示に応答して超音波の無指向性サウンド信号を発生してもよい。さらに、図20A及び図20BにおいてSSS処理は実行しなくてもよい。
図20Aにおいて、まず、ステップS31では、タブレットT1は、タブレットT2〜T4に対して、「サウンド信号をマイクロホン1で受信する準備を行いかつサウンド信号に応答してSSL処理を実行することを指示するSSL指示信号」を送信した後、所定時間後、サウンド信号を例えば3秒間などの所定時間送信する。SSL指示信号には、サウンド信号の送信時刻情報が含まれており、各タブレットT2〜T4は、サウンド信号を受信した時刻と、上記送信時刻情報の差分、すなわち、サウンド信号の伝送時間を計算し、公知の音波又は超音波の速度に上記計算された伝送時間を乗算することにより、タブレットT1と自分のタブレットとの間の距離を計算して内蔵メモリに記憶する。また、各タブレットT2〜T4は、受信したサウンド信号に基づいて、第1実施形態で詳細説明したMUSIC法(例えば、非特許文献7参照。)を用いて音源定位の処理を行うことによりサウンド信号の到来方向を推定計算して内蔵メモリに記憶する。すなわち、各タブレットT2〜T4のSSL処理では、タブレットT1から自分のタブレットまでの距離と、タブレットT1に対する角度を推定計算して記憶する。
次いで、ステップS32では、タブレットT1は、タブレットT3,T4に対して、「マイクロホン1で受信する準備を行いかつサウンド信号に応答してSSL処理を実行することを指示するSSL指示信号」を送信した後、所定時間後、タブレットT2に対して、サウンド信号を発生することを指示するサウンド発生信号を送信する。ここで、タブレットT1もサウンド信号の待機状態となる。タブレットT2は、サウンド発生信号に応答して、サウンド信号を発生してタブレットT1,T3,T4に送信する。各タブレットT1,T3,T4は、受信したサウンド信号に基づいて、第1実施形態で詳細説明したMUSIC法を用いて音源定位の処理を行うことによりサウンド信号の到来方向を推定計算して内蔵メモリに記憶する。すなわち、各タブレットT1,T3,T4のSSL処理では、タブレットT2に対する角度を推定計算して記憶する。
さらに、ステップS33では、タブレットT1は、タブレットT2,T4に対して、「マイクロホン1で受信する準備を行いかつサウンド信号に応答してSSL処理を実行することを指示するSSL指示信号」を送信した後、所定時間後、タブレットT3に対して、サウンド信号を発生することを指示するサウンド発生信号を送信する。ここで、タブレットT1もサウンド信号の待機状態となる。タブレットT3は、サウンド発生信号に応答して、サウンド信号を発生してタブレットT1,T2,T4に送信する。各タブレットT1,T2,T4は、受信したサウンド信号に基づいて、第1実施形態で詳細説明したMUSIC法を用いて音源定位の処理を行うことによりサウンド信号の到来方向を推定計算して内蔵メモリに記憶する。すなわち、各タブレットT1,T2,T4のSSL処理では、タブレットT3に対する角度を推定計算して記憶する。
またさらに、ステップS34では、タブレットT1は、タブレットT2,T3に対して、「マイクロホン1で受信する準備を行いかつサウンド信号に応答してSSL処理を実行することを指示するSSL指示信号」を送信した後、所定時間後、タブレットT4に対して、サウンド信号を発生することを指示するサウンド発生信号を送信する。ここで、タブレットT1もサウンド信号の待機状態となる。タブレットT4は、サウンド発生信号に応答して、サウンド信号を発生してタブレットT1,T2,T3に送信する。各タブレットT1,T2,T3は、受信したサウンド信号に基づいて、第1実施形態で詳細説明したMUSIC法を用いて音源定位の処理を行うことによりサウンド信号の到来方向を推定計算して内蔵メモリに記憶する。すなわち、各タブレットT1,T2,T3のSSL処理では、タブレットT4に対する角度を推定計算して記憶する。
次いで、データ通信を行うステップS35では、タブレットT1はタブレットT2に対して情報返信指示信号を送信する。これに応答して、タブレットT2は、ステップS31で計算されたタブレットT1とT2間の距離と、ステップS31〜S34で計算された、タブレットT2から各タブレットT1,T3,T4を見たときの角度とを含む情報返信信号をタブレットT1に返信する。また、タブレットT1はタブレットT3に対して情報返信指示信号を送信する。これに応答して、タブレットT3は、ステップS31で計算されたタブレットT1とT3間の距離と、ステップS31〜S34で計算された、タブレットT3から各タブレットT1,T2,T4を見たときの角度とを含む情報返信信号をタブレットT1に返信する。さらに、タブレットT1はタブレットT4に対して情報返信指示信号を送信する。これに応答して、タブレットT4は、ステップS31で計算されたタブレットT1とT4間の距離と、ステップS31〜S34で計算された、タブレットT4から各タブレットT1,T2,T3を見たときの角度とを含む情報返信信号をタブレットT1に返信する。
タブレットT1のSSL全体処理においては、以上のように収集された情報に基づいて、タブレットT1は、図21を参照して説明するように以下のようにして各タブレット間の距離を計算し、また、各タブレットT1〜T4での他のタブレットを見た角度情報に基づいて、例えば、タブレットT1(図21のA)をXY座標の原点としたときの、他のタブレットT2〜T4のXY座標を公知の三角関数の定義式を用いて計算することにより、
すべてのタブレットT1〜T4の座標値を求めることができる。当該座標値は、ディスプレイに表示してもいいし、プリンタに出力して印字してもよい。また、上記座標値を用いて、例えば詳細後述する所定のアプリケーションを実行してもよい。
なお、タブレットT1のSSL全体処理については、マスターであるタブレットT1のみが行ってもよいし、すべてのタブレットT1〜T4で行ってもよい。すなわち、少なくとも1つのタブレット又はサーバ装置(例えば、図17のSV)が実行すればよい。また、上記SSL処理及び上記SSL全体処理は、制御部である例えばSSL処理部55により実行される。
図21は第2の実施形態に係る位置測定システムの各タブレットT1〜T4(図21におけるA,B,C,Dに対応する。)で測定された角度情報から各タブレット間の距離を測定する方法を示す平面図である。サーバ装置は、すべてのタブレットが角度情報を取得した後、全員分の距離情報を計算する。距離情報の計算では、図21に示すように、12個の角度の値とどれか1辺の長さを用いて、正弦定理によりすべての辺の長さを求める。ABの長さをdとすると、ACの長さは次式で求められる。
Figure 2013030946
他の辺の長さも同様に、12個の角度と上記長さdを用いて求めることができる。各センサノードが上述の時刻同期を行うことができれば、上記の計算法を用いずに、各センサノードが発音開始時間と到達時間の差から距離を求めることができる。図21のノード数を4としたが、本発明はこれに限らず、ノード数を2以上でノード数に関わらずノード間距離を求めることができる。
以上の第2の実施形態では、2次元の位置を推定したが、本発明はこれに限らず、同様の数式を用いて3次元の位置を推定してもよい。
さらに、センサノードの移動端末への実装について以下に説明する。当該ネットワークシステムの実用化に際しては、センサノードを壁や天井に固定して使用するだけでなく、ロボットのような移動する端末に実装することも考えられる。被認識者の位置が推定できれば、より解像度な画像の収集や高精度な音声認識のために、ロボットを被認識者に近づけるといった操作が可能となる。また、近年急速に普及が進んでいるスマートフォン等のモバイル端末は、GPS機能を用いて自身の現在位置を取得することができるが、近距離での端末同士の位置関係を取得することは難しい。しかし、当該ネットワークシステムのセンサノードをモバイル端末に実装すれば、端末から音声を発して互いを音源定位することで、GPS機能等では判別できない近距離における端末同士の位置関係の取得が可能となる。本実施形態では、端末同士の位置関係を利用するアプリケーションとして、メッセージ交換システムと多人数ホッケーゲームシステムの2種類を、プログラミング言語javaを用いて実装した。
本実施例では、アプリケーションを実行するタブレットパーソナルコンピュータと、プロトタイプセンサノードとを接続した。タブレットパーソナルコンピュータのOSとしては汎用のOSが搭載されており、2か所のUSB2.0ポートやIEEE802.1b/g/n準拠の無線LAN機能を有して無線ネットワークを構成する。このタブレットパーソナルコンピュータの4辺に、プロトタイプセンサノードのマイクロホンを5cm間隔で配置し、センサノード(FPGAで構成される)では音源定位モジュールが稼動しており、定位結果をタブレットパーソナルコンピュータに出力するように構成した。本実施例における位置推定精度は数cm程度であり、従来技術に比較して大幅に高精度になる。
(第3の実施形態)
図22は本発明の第3の実施形態に係るマイクロホンアレイ・ネットワークシステムのためのデータ集約システムのノードの構成を示すブロック図であり、図23は図22のデータ通信部57aの詳細構成を示すブロック図である。また、図24は図23のパラメータメモリ57b内のテーブルメモリの詳細構成を示す表である。第3の実施形態に係るデータ集約システムは、第1の実施形態に係る音源定位システムと、第2の実施形態に係る音源位置測定システムとを用いて、音声データを効率的に集約するデータ集約システムを構成したことを特徴とする。具体的には、本実施形態に係るデータ集約システムの通信方法を、複数の音源に対応するマイクアレイネットワークシステムのための経路構築手法として用いる。マイクアレイネットワークとは、複数のマイクロホンを用いてSNRの高い音声信号を得る技術である。これにデータ処理、通信機能を持たせてネットワークを構築することで、広範囲の、SNRの高い音声データを集めることができる。本実施形態では、マイクアレイネットワークに適用することで、複数の音源位置に対して最適な経路を構築し、各音源からの音声を同時に収集することができる。これにより、例えば複数話者に対応した音声会議システムなどが実現できる。
各センサノードは、図22に示すように、
(1)収音する複数のマイクロホン1に接続されたAD変換回路51と、
(2)AD変換回路51に接続され音声信号を検知するためのVAD処理部52と、
(3)AD変換回路51によりAD変換された音声信号又はサウンド信号を含む音声信号等の音声データを一時的に記憶するSRAM54と、
(4)SRAM54に記憶された音声データに対して遅延和処理を実行する遅延和回路部58と、
(5)SRAM54から出力される音声データに対して音源の位置を推定する音源定位(Sound Source Localization)処理を実行してその結果を音源分離処理(SSS処理)及びその他の処理を実行して、それらの処理の結果として得られたSNRの高い音声データを他のノードと、データ通信部57aを介して送受信することにより収集するマイクロプロセッサユニット(MPU)50と、
(6)データ通信部57a及びMPU50と接続され、時間同期処理のためのタイマーと、データ通信のためのパラメータを記憶するパラメータメモリとを含むタイマー及びパラメータメモリ57bと、
(7)他の周囲センサノードNn(n=1,2,…,N)と接続され、音声データ及び制御パケット等を送受信するネットワークインターフェース回路を構成するデータ通信部57aとを備えて構成される。
各センサノードNn(n=0,1,2,…,N)は互いに同様の構成を有するが、基地局のセンサノードN0では、上記音声データをネットワーク上で集約することで、さらにSNRが高められた音声データが得られる。
図23のデータ通信部57aは、図23に示すように、
(1)他の周囲センサノードNn(n=1,2,…,N)と接続され、音声データ及び制御パケット等を送受信する物理層回路部61と、
(2)物理層回路部61及び時間同期部63に接続され、音声データ及び制御パケット等に関するメディアアクセス制御処理を実行するMAC処理部62と、
(3)MAC処理部62、並びにタイマー及びパラメータメモリ57bに接続され、他のノードとの時間同期処理を実行する時間同期部63と、
(4)MAC処理部62により抽出した音声データ又は制御パケットなどのデータを一時的に記憶してヘッダーアナライザ66に出力する受信バッファ64と、
(5)パケット発生部68により発生された音声データ又は制御パケットなどのパケットを一時的に記憶してMAC処理部62に出力する送信バッファ65と、
(6)受信バッファ64に記憶されたパケットを受けとり、そのパケットのヘッダーを解析してその結果をルーティング処理部67又はVAD処理部50、遅延和回路部52及びMPU59に出力するヘッダーアナライザ66と、
(7)ヘッダーアナライザ66からの解析結果に基づいてパケットをどのノードに送信するようにルーティングするかを決定してその結果をパケット発生部68に出力するルーティング処理部67と、
(8)遅延和回路部52からの音声データ又はMPU59からの制御データを受けとり、ルーティング処理部67からのルーティング指示に基づいて所定のパケットを発生して送信バッファ65を会してMAC処理部62に出力するパケット発生部68と、
を備えて構成される。
また、パラメータメモリ57b内のテーブルメモリは、図24に示すように、
(1)予め決定されて記憶される自ノード情報(ノードID及び自ノードのXY座標)と、
(2)時間期間T11で取得される経路情報(その1)(基地局方向への送信先ノードID)と、
(3)時間期間T12で取得される経路情報(その2)(クラスタCL1の送信先ノードID、クラスタCL2の送信先ノードID、…、クラスタCLNの送信先ノードID)と、
(4)時間期間T13及びT14で取得されるクラスタ情報(クラスタヘッドノードID(クラスタCL1)、音源SS1のXY座標、クラスタヘッドノードID(クラスタCL2)、音源SS2のXY座標、…、クラスタヘッドノードID(クラスタCLN)、音源SSNのXY座標)とを記憶する。
なお、各ノードNn(n=1,2,…,N)は、平面上で位置し、所定のXY座標系の座標(既知)を有するものとし、各音源の位置は位置測定処理により測定される。
図25は図22のデータ集約システムの処理動作を示す模式平面図であって、図25(a)は基地局からのFTSPの処理及びルーティング(T11)を示す模式平面図であり、図25(b)は音声アクティビティ検出(VAD)及び検出メッセージ送信(T12)を示す模式平面図であり、図25(c)はウェイクアップメッセージ及びクラスタリング(T13)を示す模式平面図であり、図25(d)はクラスタを選択して遅延和処理(T14)を示す模式平面図である。また、図26A及び図26Bは図22のデータ集約システムの処理動作を示すタイミングチャートである。
図25、図26A及び図26Bの動作例では、2つの音源SSA,SSBに対してそれぞれ1ホップのクラスタを構築し、右下の基地局(複数のノードのうちの1つのノードであり、正方形の中に丸を有する記号で示す。)N0へ音声データを集約・強調しつつ収集する例を示している。まず、マイクアレイセンサノードの基地局N0は、例えば30分などの一定時間毎に、所定のFTSP及びNNT(Nearest Neighbor Tree;最隣接木)プロトコルを用いて同時に、制御パケットCP(白抜きの矢印)を用いて、ノード間の時間同期と基地局までのスパニング木による収集経路構築のためのブロードキャストを行う(図25(a)、図26AのT11)。基地局以外の各ノード(N1乃至N8)は、その後低消費電力化のために、音声入力が検知されるまでスリープモードとなる。スリープモードでは、図22のAD変換回路51及びVAD処理部52を含む回路、ウェイクアップメッセージを受信するための回路(データ通信部57aのうちの物理層回路部61及びMAC処理部62、並びにタイマー及びパラメータメモリ57b)以外の回路は電源供給がされず、消費電力を大幅に減少できる。
次いで、上記2つの音源SSA,SSBからそれぞれ音声信号を発生したとき、音声信号を(すなわち発話を)検知してVAD処理部52が反応したノード(図25及び図26Aにおいて●で示すノードN4乃至N7)は、検出メッセージを制御パケットCPを用いて基地局N0に向けて検出メッセージをT11で構築したスパニング木の経路を使って基地局N0へ送信する(図25(b)及び図26AのT12)とともに、起動を指示するウェイクアップメッセージ(起動メッセージ)を制御パケットCPを用いてブロードキャストする(図25(c)及び図26AのT13)。ただし、このときブロードキャストする範囲は、構築するクラスタ距離と同じホップ数だけである(図25の動作例の場合は1ホップ)。このウェイクアップメッセージによって周辺のスリープしているノード(N1乃至N3,N8)を起動し、同時にVAD処理部52の反応したノードを中心としたクラスタを形成する。
次に、VAD処理部52が反応したノードと、ウェイクアップメッセージによって起動したノードは(動作例では、基地局N0以外のノードN1乃至N8)、マイクアレイネットワークシステムを用いて音源の方向を推定し、その結果を基地局N0へ送信する。このとき使用する経路は図25(a)で構築したスパニング木による経路である。基地局N0は各ノードの音源方向推定結果及び各ノードの既知位置に基づいて、上述の第2の実施形態に係る位置測定システムの方法を用いて幾何学的に各音源の絶対位置を推定する。さらに、基地局N0は、検出メッセージの送信元ノードのうち最も音源に近いノードをクラスタヘッドノードに指定し、推定された音源の絶対位置と併せてネットワーク全体の各ノード(N1乃至N8)にブロードキャストする。もし複数の音源SSA,SSBが推定された場合は、音源の数と同数のクラスタヘッドノードを指定する。これによって、音源の物理的な位置に対応したクラスタが形成され、各クラスタヘッドノードから基地局N0までの経路が構築される(図25(d)及び図26BのT14)。図25の動作例では、音源SSAのクラスタヘッドノードとして、ノードN6(図26(d)において◎で図示されている)が指定され、そのクラスタに属するノードは、N6から1ホップ内のN3、N6、N7である。また、音源SSBのクラスタヘッドノードとして、ノードN4(図26(d)において◎で図示されている)が指定され、そのクラスタに属するノードは、N4から1ホップ内のN1、N3、N4、N5、N7である。すなわち、上記各クラスタヘッドノードN6,N4から上記ホップ数内に位置する各ノードを各クラスタに所属するノードとしてクラスタリングされる。そして、各クラスタに属する各ノードで測定された音声データに基づいて強調処理を行って、強調処理後の音声データを基地局N0に送信される。これにより、各音源SSA,SSBに対応するクラスタ毎に強調処理された音声データがパケットESA,ESBを用いて基地局N0に送信される。ここで、パケットESAは音源SSAからの音声データを強調処理してなる音声データを伝送するパケットであり、パケットESBは音源SSBからの音声データを強調処理してなる音声データを伝送するパケットである。
図27は図22のデータ集約システムの実施例の構成を示す平面図である。発明者らは、本実施形態に係るマイクロホンアレイのネットワークを評価するために、FPGA(フィールドプログラマブルゲートアレイ)ボードを使用して試作装置を作成した。試作装置は、VAD処理部、音源定位、音源分離、及び有線データ通信モジュールの機能を備える。試作装置のFPGAボードは、16チャンネルのマイクロホン1を備えて構成され、16チャンネルのマイクロホン1は、7.5センチ間隔のグリッド状に配置されている。このシステムの目標は30Hzから8kHzの周波数範囲を持っている人間の音声なので、サンプリング周波数は16kHzに設定されている。
ここで、各サブアレイは、UTPケーブルを使用して接続される。10BASE−Tイーサネット(登録商標)プロトコルは、物理層として使用される。データリンク層では、LPL(リスニング低消費電力)を採用するプロトコル(例えば、非特許文献11参照。)の消費電力を削減する。
提案システムの性能を確認するに、本発明者らは図27の3つのサブアレイで実験を行った。図27に示すように、3つのサブアレイが配置され、中心部に位置する1つのサブアレイ1は、基地局としてサーバPCに接続されている。ここで、ネットワークトポロジは、マルチホップ環境を評価するために、2つのホップ線形トポロジーを用いた。
時間同期処理後の測定された信号波形から、FTSP同期処理が完了した直後において、サブアレイ間で最大のタイムラグは1μsであって、線形補間ありと線形補間無しとにおけるサブアレイ間の最大タイムラグは、それぞれ毎分10マイクロ秒と、毎分900マイクロ秒であった。
次に、本発明者らは、分散遅延和回路部のアルゴリズムを使用して音声のデータ捕捉を評価した。ここで、図27に示すように、500Hzの正弦波の信号源と、雑音源(300Hz、700HZ、及び1300Hzの正弦波)を使用した。実験結果からは、音声信号が強化され、雑音が減少され、マイクロホンの数が増加するにつれてSNRが改善されている。また、48チャンネルの条件で、300Hz及び1300Hzの雑音が劇的に信号源(500Hz)を劣化させずに、20デシベルだけ抑圧されていることがわかった。一方、700Hzの雑音が若干抑制されている。これは、信号源と雑音源の位置によって干渉が発生したためであると考えられる。また、他の実験では、48チャンネルの場合であっても、雑音源の位置の周りで、700Hzの雑音源が抑圧ほとんど抑圧されていないということがわかった、この問題は、ノード数を増やすことで回避できると考えられる。さらに、本発明者らはまた、3つのサブアレイを使用して音声の捕捉をリアルタイムで動作できることを確認した。
以上説明したように、従来技術に係るクラスタベースルーティングでは、ネットワーク層の情報のみに基づいてクラスタリングを行っていた。一方、大規模センサネットワークでセンシング対象となる信号源が複数存在するような環境において、それぞれの信号源に最適化した経路を構築するためには、センシング情報に基づいたセンサノードのクラスタリング技術が必要であった。そこで、本発明に係る手法では、クラスタヘッドの選定とクラスタの構築にセンシングした信号情報(アプリケーション層の情報)を用いることで、よりアプリケーションに特化した経路構築を実現した。また、マイクアレイネットワークにおけるVAD処理部52のようなウェイクアップ機構(ハードウェア)と組み合わせることで、より低消費電力性能を高めることが可能となる。
以上の実施形態においては、高音質な音声取得を目的とするマイクロホンアレイ・ネットワークシステムに係るセンサネットワークシステムについて説明したが、本発明はこれに限らず、温度、湿度、人検出、動物検出、応力検出、光検出などの種々のセンサに係るセンサネットワークシステムに適用できる。
以上詳述したように、本発明に係るセンサネットワークシステムとその通信方法によれば、センサネットワーク上でのクラスタリング、クラスタヘッド決定、ルーティングのために、センシング対象となる信号を利用し、複数の信号源の物理配置に対応し、データ集約に特化したネットワーク経路を構築することで、冗長な経路を削減し、同時にデータ集約の効率を高めることができる。また、経路構築のための通信オーバーヘッドが少ないため、ネットワークトラフィックが削減され、消費電力の大きい通信回路の稼働時間を減らすことができる。それ故、センサネットワークシステムにおいて、従来技術に比較してデータ集約を効率的に行うことができ、ネットワークトラフィックを大幅に削減できかつセンサノードの消費電力を低減できる。
1,m11,m12,…,m43,m44…マイクロホン、
1a,1b,1c,…,1n…マイクロホンアレイ、
2,2a,2b,2c,…,2n…収音処理部、
3…入出力部(I/O部)、
4…プロセッサ、
10,11,12…ネットワーク、
20…音声処理サーバ、
30,30a,30b,30c…ノード、
50…MPU、
51…AD変換回路、
52…VAD処理部、
53…電源管理部、
54…SRAM、
55…SSL処理部、
56…SSS処理部、
57…ネットワークインターフェース回路、
57a…データ通信部、
57b…タイマー及びパラメータメモリ、
58…遅延和回路部、
61…物理層回路部、
62…MAC処理部、
63…時間同期部、
64…受信バッファ、
65…送信バッファ、
66…ヘッダーアナライザ、
67…ルーティング処理部、
67m…テーブルメモリ、
68…パケット発生部、
N0〜NN…センサノード(ノード)、
SV…サーバ装置、
T1〜T4…タブレット。

Claims (6)

  1. それぞれセンサアレイを備え、既知の位置情報を有する複数のノードが所定の通信プロトコルを用いて相互に所定の伝搬経路を介するネットワーク上で接続され、かつ時間同期されたセンサネットワークシステムを用いて、上記各ノードで測定されたデータを1つの基地局に集約するように収集するセンサネットワークシステムであって、
    上記各ノードは、
    複数のセンサをアレイ状に配列して構成されたセンサアレイと、
    上記センサアレイで受信した所定の信号源からの信号に基づいて上記信号の検出をしたときに、検出メッセージを基地局に送信するとともに、上記信号の到来方向の角度を推定して角度推定値を上記基地局に送信し、もしくは、他のノードから所定のホップ数で受信した信号検出時の起動メッセージに応答して、起動して上記信号の到来方向の角度を推定して角度推定値を上記基地局に送信する方向推定処理部と、
    上記音源に対応して上記基地局から指定されたクラスタに属する各ノード毎に、上記センサアレイで受信した所定の信号源からの信号に対して強調処理し、当該強調処理された信号を基地局に送信する通信処理部とを備え、
    上記基地局は、上記各ノードからの上記信号の角度推定値と上記各ノードの位置情報とに基づいて、上記信号源の位置を計算するとともに、上記信号源に最も近いノードをクラスタヘッドノードに指定し、上記信号源の位置と上記指定されたクラスタヘッドノードの情報とを上記各ノードに送信することにより、上記各クラスタヘッドノードから上記ホップ数内に位置する各ノードを各クラスタに所属するノードとしてクラスタリングし、
    上記各ノードは、上記音源に対応して上記基地局から指定されたクラスタに属する各ノード毎に、上記センサアレイで受信した所定の信号源からの信号に対して強調処理し、当該強調処理された信号を基地局に送信することを特徴とするセンサネットワークシステム。
  2. 上記各ノードは、上記信号を検出する前、もしくは、上記起動メッセージを受信する前は、スリープモードに設定されて、上記信号を検出する回路及び上記起動メッセージを受信する回路以外の回路に対する電源供給を停止することを特徴とする請求項1記載のセンサネットワークシステム。
  3. 上記センサは、音声を検出するマイクロホンであることを特徴とする請求項1又は2記載のセンサネットワークシステム。
  4. それぞれセンサアレイを備え、既知の位置情報を有する複数のノードが所定の通信プロトコルを用いて相互に所定の伝搬経路を介するネットワーク上で接続され、かつ時間同期されたセンサネットワークシステムを用いて、上記各ノードで測定されたデータを1つの基地局に集約するように収集するセンサネットワークシステムの通信方法であって、
    上記各ノードは、
    複数のセンサをアレイ状に配列して構成されたセンサアレイと、
    上記センサアレイで受信した所定の信号源からの信号に基づいて上記信号の検出をしたときに、検出メッセージを基地局に送信するとともに、上記信号の到来方向の角度を推定して角度推定値を上記基地局に送信し、もしくは、他のノードから所定のホップ数で受信した信号検出時の起動メッセージに応答して、起動して上記信号の到来方向の角度を推定して角度推定値を上記基地局に送信する方向推定処理部と、
    上記音源に対応して上記基地局から指定されたクラスタに属する各ノード毎に、上記センサアレイで受信した所定の信号源からの信号に対して強調処理し、当該強調処理された信号を基地局に送信する通信処理部とを備え、
    上記通信方法は、
    上記基地局が、上記各ノードからの上記信号の角度推定値と上記各ノードの位置情報とに基づいて、上記信号源の位置を計算するとともに、上記信号源に最も近いノードをクラスタヘッドノードに指定し、上記信号源の位置と上記指定されたクラスタヘッドノードの情報とを上記各ノードに送信することにより、上記各クラスタヘッドノードから上記ホップ数内に位置する各ノードを各クラスタに所属するノードとしてクラスタリングするステップと、
    上記各ノードが、上記音源に対応して上記基地局から指定されたクラスタに属する各ノード毎に、上記センサアレイで受信した所定の信号源からの信号に対して強調処理し、当該強調処理された信号を基地局に送信するステップとを含むことを特徴とするセンサネットワークシステムの通信方法。
  5. 上記各ノードが、上記信号を検出する前、もしくは、上記起動メッセージを受信する前は、スリープモードに設定されて、上記信号を検出する回路及び上記起動メッセージを受信する回路以外の回路に対する電源供給を停止するステップをさらに含むことを特徴とする請求項4記載のセンサネットワークシステムの通信方法。
  6. 上記センサは、音声を検出するマイクロホンであることを特徴とする請求項4又は5記載のセンサネットワークシステムの通信方法。
JP2011164986A 2011-07-28 2011-07-28 センサネットワークシステムとその通信方法 Expired - Fee Related JP5289517B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2011164986A JP5289517B2 (ja) 2011-07-28 2011-07-28 センサネットワークシステムとその通信方法
US13/547,426 US8600443B2 (en) 2011-07-28 2012-07-12 Sensor network system for acquiring high quality speech signals and communication method therefor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011164986A JP5289517B2 (ja) 2011-07-28 2011-07-28 センサネットワークシステムとその通信方法

Publications (2)

Publication Number Publication Date
JP2013030946A true JP2013030946A (ja) 2013-02-07
JP5289517B2 JP5289517B2 (ja) 2013-09-11

Family

ID=47597610

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011164986A Expired - Fee Related JP5289517B2 (ja) 2011-07-28 2011-07-28 センサネットワークシステムとその通信方法

Country Status (2)

Country Link
US (1) US8600443B2 (ja)
JP (1) JP5289517B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016526331A (ja) * 2013-05-23 2016-09-01 ノールズ エレクトロニクス,リミテッド ライアビリティ カンパニー Vad検出マイク及びその動作方法
WO2017061023A1 (ja) * 2015-10-09 2017-04-13 株式会社日立製作所 音声信号処理方法および装置
JP2017536040A (ja) * 2014-11-12 2017-11-30 クアルコム,インコーポレイテッド マイクロフォン始動の遅延時間減少
JP2018074251A (ja) * 2016-10-25 2018-05-10 キヤノン株式会社 音響システム及びその制御方法、信号生成装置、コンピュータプログラム
KR20190135045A (ko) * 2017-04-10 2019-12-05 시러스 로직 인터내셔널 세미컨덕터 리미티드 헤드셋들을 위한 유연한 음성 캡처 프론트-엔드

Families Citing this family (116)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
PL398136A1 (pl) * 2012-02-17 2013-08-19 Binartech Spólka Jawna Aksamit Sposób wykrywania kontekstu urzadzenia przenosnego i urzadzenie przenosne z modulem wykrywania kontekstu
US9264799B2 (en) * 2012-10-04 2016-02-16 Siemens Aktiengesellschaft Method and apparatus for acoustic area monitoring by exploiting ultra large scale arrays of microphones
US10565862B2 (en) * 2012-11-27 2020-02-18 Comcast Cable Communications, Llc Methods and systems for ambient system control
US9294839B2 (en) 2013-03-01 2016-03-22 Clearone, Inc. Augmentation of a beamforming microphone array with non-beamforming microphones
US20180317019A1 (en) 2013-05-23 2018-11-01 Knowles Electronics, Llc Acoustic activity detecting microphone
US20140372027A1 (en) * 2013-06-14 2014-12-18 Hangzhou Haicun Information Technology Co. Ltd. Music-Based Positioning Aided By Dead Reckoning
KR20160083904A (ko) * 2013-11-08 2016-07-12 노우레스 일렉트로닉스, 엘엘시 마이크로폰 및 대응하는 디지털 인터페이스
WO2015123658A1 (en) 2014-02-14 2015-08-20 Sonic Blocks, Inc. Modular quick-connect a/v system and methods thereof
US9774949B2 (en) * 2014-02-28 2017-09-26 Texas Instruments Incorporated Power control for multichannel signal processing circuit
US9516412B2 (en) * 2014-03-28 2016-12-06 Panasonic Intellectual Property Management Co., Ltd. Directivity control apparatus, directivity control method, storage medium and directivity control system
CN106165444B (zh) * 2014-04-16 2019-09-17 索尼公司 声场再现设备、方法和程序
US20150323667A1 (en) * 2014-05-12 2015-11-12 Chirp Microsystems Time of flight range finding with an adaptive transmit pulse and adaptive receiver processing
KR102208477B1 (ko) 2014-06-30 2021-01-27 삼성전자주식회사 마이크 운용 방법 및 이를 지원하는 전자 장치
US9685730B2 (en) 2014-09-12 2017-06-20 Steelcase Inc. Floor power distribution system
US9584910B2 (en) 2014-12-17 2017-02-28 Steelcase Inc. Sound gathering system
US9781508B2 (en) * 2015-01-05 2017-10-03 Oki Electric Industry Co., Ltd. Sound pickup device, program recorded medium, and method
KR102387567B1 (ko) * 2015-01-19 2022-04-18 삼성전자주식회사 음성 인식 방법 및 음성 인식 장치
US9554207B2 (en) 2015-04-30 2017-01-24 Shure Acquisition Holdings, Inc. Offset cartridge microphones
US9565493B2 (en) 2015-04-30 2017-02-07 Shure Acquisition Holdings, Inc. Array microphone system and method of assembling the same
JP6501259B2 (ja) * 2015-08-04 2019-04-17 本田技研工業株式会社 音声処理装置及び音声処理方法
US9875081B2 (en) 2015-09-21 2018-01-23 Amazon Technologies, Inc. Device selection for providing a response
US9585675B1 (en) * 2015-10-23 2017-03-07 RELIGN Corporation Arthroscopic devices and methods
US11064291B2 (en) 2015-12-04 2021-07-13 Sennheiser Electronic Gmbh & Co. Kg Microphone array system
US9894434B2 (en) 2015-12-04 2018-02-13 Sennheiser Electronic Gmbh & Co. Kg Conference system with a microphone array system and a method of speech acquisition in a conference system
US10509626B2 (en) 2016-02-22 2019-12-17 Sonos, Inc Handling of loss of pairing between networked devices
US9820039B2 (en) 2016-02-22 2017-11-14 Sonos, Inc. Default playback devices
US9947316B2 (en) 2016-02-22 2018-04-17 Sonos, Inc. Voice control of a media playback system
US9965247B2 (en) 2016-02-22 2018-05-08 Sonos, Inc. Voice controlled media playback system based on user profile
US10264030B2 (en) 2016-02-22 2019-04-16 Sonos, Inc. Networked microphone device control
US10095470B2 (en) 2016-02-22 2018-10-09 Sonos, Inc. Audio response playback
US9978390B2 (en) 2016-06-09 2018-05-22 Sonos, Inc. Dynamic player selection for audio signal processing
US10134399B2 (en) 2016-07-15 2018-11-20 Sonos, Inc. Contextualization of voice inputs
US10152969B2 (en) 2016-07-15 2018-12-11 Sonos, Inc. Voice detection by multiple devices
US10115400B2 (en) 2016-08-05 2018-10-30 Sonos, Inc. Multiple voice services
US20180075842A1 (en) * 2016-09-14 2018-03-15 GM Global Technology Operations LLC Remote speech recognition at a vehicle
US9942678B1 (en) 2016-09-27 2018-04-10 Sonos, Inc. Audio playback settings for voice interaction
US9743204B1 (en) 2016-09-30 2017-08-22 Sonos, Inc. Multi-orientation playback device microphones
US10181323B2 (en) 2016-10-19 2019-01-15 Sonos, Inc. Arbitration-based voice recognition
US10545219B2 (en) 2016-11-23 2020-01-28 Chirp Microsystems Three dimensional object-localization and tracking using ultrasonic pulses
US10367948B2 (en) 2017-01-13 2019-07-30 Shure Acquisition Holdings, Inc. Post-mixing acoustic echo cancellation systems and methods
EP3574659A1 (en) 2017-01-27 2019-12-04 Shure Acquisition Holdings, Inc. Array microphone module and system
US11183181B2 (en) 2017-03-27 2021-11-23 Sonos, Inc. Systems and methods of multiple voice services
CN107135443B (zh) * 2017-03-29 2020-06-23 联想(北京)有限公司 一种信号处理方法及电子设备
US20180317006A1 (en) * 2017-04-28 2018-11-01 Qualcomm Incorporated Microphone configurations
US10475449B2 (en) 2017-08-07 2019-11-12 Sonos, Inc. Wake-word detection suppression
US10482904B1 (en) 2017-08-15 2019-11-19 Amazon Technologies, Inc. Context driven device arbitration
US10048930B1 (en) 2017-09-08 2018-08-14 Sonos, Inc. Dynamic computation of system response volume
US10446165B2 (en) 2017-09-27 2019-10-15 Sonos, Inc. Robust short-time fourier transform acoustic echo cancellation during audio playback
US10621981B2 (en) 2017-09-28 2020-04-14 Sonos, Inc. Tone interference cancellation
US10482868B2 (en) 2017-09-28 2019-11-19 Sonos, Inc. Multi-channel acoustic echo cancellation
US10466962B2 (en) 2017-09-29 2019-11-05 Sonos, Inc. Media playback system with voice assistance
US10880650B2 (en) 2017-12-10 2020-12-29 Sonos, Inc. Network microphone devices with automatic do not disturb actuation capabilities
US10818290B2 (en) 2017-12-11 2020-10-27 Sonos, Inc. Home graph
WO2019152722A1 (en) 2018-01-31 2019-08-08 Sonos, Inc. Device designation of playback and network microphone device arrangements
US11175880B2 (en) 2018-05-10 2021-11-16 Sonos, Inc. Systems and methods for voice-assisted media content selection
US10847178B2 (en) 2018-05-18 2020-11-24 Sonos, Inc. Linear filtering for noise-suppressed speech detection
US10959029B2 (en) 2018-05-25 2021-03-23 Sonos, Inc. Determining and adapting to changes in microphone performance of playback devices
US11523212B2 (en) 2018-06-01 2022-12-06 Shure Acquisition Holdings, Inc. Pattern-forming microphone array
US11297423B2 (en) 2018-06-15 2022-04-05 Shure Acquisition Holdings, Inc. Endfire linear array microphone
US10681460B2 (en) 2018-06-28 2020-06-09 Sonos, Inc. Systems and methods for associating playback devices with voice assistant services
CN110164423B (zh) * 2018-08-06 2023-01-20 腾讯科技(深圳)有限公司 一种方位角估计的方法、设备及存储介质
US10461710B1 (en) 2018-08-28 2019-10-29 Sonos, Inc. Media playback system with maximum volume setting
US11076035B2 (en) 2018-08-28 2021-07-27 Sonos, Inc. Do not disturb feature for audio notifications
US10878811B2 (en) 2018-09-14 2020-12-29 Sonos, Inc. Networked devices, systems, and methods for intelligently deactivating wake-word engines
US10587430B1 (en) 2018-09-14 2020-03-10 Sonos, Inc. Networked devices, systems, and methods for associating playback devices based on sound codes
US11310596B2 (en) 2018-09-20 2022-04-19 Shure Acquisition Holdings, Inc. Adjustable lobe shape for array microphones
US11109133B2 (en) 2018-09-21 2021-08-31 Shure Acquisition Holdings, Inc. Array microphone module and system
US11024331B2 (en) 2018-09-21 2021-06-01 Sonos, Inc. Voice detection optimization using sound metadata
US10811015B2 (en) 2018-09-25 2020-10-20 Sonos, Inc. Voice detection optimization based on selected voice assistant service
US11100923B2 (en) 2018-09-28 2021-08-24 Sonos, Inc. Systems and methods for selective wake word detection using neural network models
US10692518B2 (en) 2018-09-29 2020-06-23 Sonos, Inc. Linear filtering for noise-suppressed speech detection via multiple network microphone devices
US10883953B2 (en) * 2018-10-16 2021-01-05 Texas Instruments Incorporated Semiconductor device for sensing impedance changes in a medium
US11899519B2 (en) 2018-10-23 2024-02-13 Sonos, Inc. Multiple stage network microphone device with reduced power consumption and processing load
EP3654249A1 (en) 2018-11-15 2020-05-20 Snips Dilated convolutions and gating for efficient keyword spotting
US11183183B2 (en) 2018-12-07 2021-11-23 Sonos, Inc. Systems and methods of operating media playback systems having multiple voice assistant services
US11132989B2 (en) 2018-12-13 2021-09-28 Sonos, Inc. Networked microphone devices, systems, and methods of localized arbitration
US10602268B1 (en) * 2018-12-20 2020-03-24 Sonos, Inc. Optimization of network microphone devices using noise classification
US10867604B2 (en) 2019-02-08 2020-12-15 Sonos, Inc. Devices, systems, and methods for distributed voice processing
US11315556B2 (en) 2019-02-08 2022-04-26 Sonos, Inc. Devices, systems, and methods for distributed voice processing by transmitting sound data associated with a wake word to an appropriate device for identification
WO2020191354A1 (en) 2019-03-21 2020-09-24 Shure Acquisition Holdings, Inc. Housings and associated design features for ceiling array microphones
US11438691B2 (en) 2019-03-21 2022-09-06 Shure Acquisition Holdings, Inc. Auto focus, auto focus within regions, and auto placement of beamformed microphone lobes with inhibition functionality
US11558693B2 (en) 2019-03-21 2023-01-17 Shure Acquisition Holdings, Inc. Auto focus, auto focus within regions, and auto placement of beamformed microphone lobes with inhibition and voice activity detection functionality
US11120794B2 (en) 2019-05-03 2021-09-14 Sonos, Inc. Voice assistant persistence across multiple network microphone devices
TW202101422A (zh) 2019-05-23 2021-01-01 美商舒爾獲得控股公司 可操縱揚聲器陣列、系統及其方法
EP3977449A1 (en) 2019-05-31 2022-04-06 Shure Acquisition Holdings, Inc. Low latency automixer integrated with voice and noise activity detection
US11200894B2 (en) 2019-06-12 2021-12-14 Sonos, Inc. Network microphone device with command keyword eventing
US10586540B1 (en) 2019-06-12 2020-03-10 Sonos, Inc. Network microphone device with command keyword conditioning
US11361756B2 (en) 2019-06-12 2022-06-14 Sonos, Inc. Conditional wake word eventing based on environment
US11486961B2 (en) * 2019-06-14 2022-11-01 Chirp Microsystems Object-localization and tracking using ultrasonic pulses with reflection rejection
US11138975B2 (en) 2019-07-31 2021-10-05 Sonos, Inc. Locally distributed keyword detection
US11138969B2 (en) 2019-07-31 2021-10-05 Sonos, Inc. Locally distributed keyword detection
US10871943B1 (en) 2019-07-31 2020-12-22 Sonos, Inc. Noise classification for event detection
US11937056B2 (en) * 2019-08-22 2024-03-19 Rensselaer Polytechnic Institute Multi-talker separation using 3-tuple coprime microphone array
US11297426B2 (en) 2019-08-23 2022-04-05 Shure Acquisition Holdings, Inc. One-dimensional array microphone with improved directivity
US11189286B2 (en) 2019-10-22 2021-11-30 Sonos, Inc. VAS toggle based on device orientation
CN112714048B (zh) * 2019-10-24 2024-01-12 博西华电器(江苏)有限公司 智能设备及控制方法、云平台、智能家居系统、存储介质
US11200900B2 (en) 2019-12-20 2021-12-14 Sonos, Inc. Offline voice control
US11562740B2 (en) 2020-01-07 2023-01-24 Sonos, Inc. Voice verification for media playback
US11556307B2 (en) 2020-01-31 2023-01-17 Sonos, Inc. Local voice data processing
US11308958B2 (en) 2020-02-07 2022-04-19 Sonos, Inc. Localized wakeword verification
US11552611B2 (en) 2020-02-07 2023-01-10 Shure Acquisition Holdings, Inc. System and method for automatic adjustment of reference gain
USD944776S1 (en) 2020-05-05 2022-03-01 Shure Acquisition Holdings, Inc. Audio device
US11482224B2 (en) 2020-05-20 2022-10-25 Sonos, Inc. Command keywords with input detection windowing
US11308962B2 (en) 2020-05-20 2022-04-19 Sonos, Inc. Input detection windowing
US11727919B2 (en) 2020-05-20 2023-08-15 Sonos, Inc. Memory allocation for keyword spotting engines
WO2021243368A2 (en) 2020-05-29 2021-12-02 Shure Acquisition Holdings, Inc. Transducer steering and configuration systems and methods using a local positioning system
US11698771B2 (en) 2020-08-25 2023-07-11 Sonos, Inc. Vocal guidance engines for playback devices
PL242112B1 (pl) * 2020-08-27 2023-01-16 Vemmio Spółka Z Ograniczoną Odpowiedzialnością System oraz metoda głosowej kontroli inteligentnego budynku
CN112201235B (zh) * 2020-09-16 2022-12-27 华人运通(上海)云计算科技有限公司 游戏终端的控制方法、装置、车载系统和车辆
US11984123B2 (en) 2020-11-12 2024-05-14 Sonos, Inc. Network device interaction by range
US20220148575A1 (en) * 2020-11-12 2022-05-12 Samsung Electronics Co., Ltd. Electronic apparatus and controlling method thereof
US11551700B2 (en) 2021-01-25 2023-01-10 Sonos, Inc. Systems and methods for power-efficient keyword detection
CN116918351A (zh) 2021-01-28 2023-10-20 舒尔获得控股公司 混合音频波束成形系统
CN112954763B (zh) * 2021-02-07 2022-12-23 中山大学 一种基于樽海鞘算法优化的wsn分簇路由方法
CN113129905B (zh) * 2021-03-31 2022-10-04 深圳鱼亮科技有限公司 一种基于多麦克风阵列节点的分布式语音唤醒系统
CN115643123B (zh) * 2022-12-26 2023-03-21 无锡谨研物联科技有限公司 一种物联网多网融合实验系统及方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007074317A (ja) * 2005-09-06 2007-03-22 Fuji Xerox Co Ltd 情報処理装置および情報処理方法
JP2010268324A (ja) * 2009-05-17 2010-11-25 Semiconductor Technology Academic Research Center 発話推定による回路起動方法及び回路起動装置
JP2011080868A (ja) * 2009-10-07 2011-04-21 Hitachi Ltd 音響監視システム、及び音声集音システム

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6195046B1 (en) * 1996-06-06 2001-02-27 Klein S. Gilhousen Base station with slave antenna for determining the position of a mobile subscriber in a CDMA cellular telephone system
EP1238489B1 (en) * 1999-12-13 2008-03-05 Broadcom Corporation Voice gateway with downstream voice synchronization
US6973184B1 (en) * 2000-07-11 2005-12-06 Cisco Technology, Inc. System and method for stereo conferencing over low-bandwidth links
CN1777819A (zh) * 2003-04-22 2006-05-24 皇家飞利浦电子股份有限公司 物体位置测定系统、设备和方法
JP2008058342A (ja) 2006-08-29 2008-03-13 Canon Inc 画像形成装置
US20090262604A1 (en) 2006-08-30 2009-10-22 Junichi Funada Localization system, robot, localization method, and sound source localization program
JP4919204B2 (ja) 2006-10-13 2012-04-18 国立大学法人神戸大学 センサネットワークシステム及びメディアアクセス制御方法
JP2008113164A (ja) 2006-10-30 2008-05-15 Yamaha Corp 通信装置
US20100008515A1 (en) * 2008-07-10 2010-01-14 David Robert Fulton Multiple acoustic threat assessment system

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007074317A (ja) * 2005-09-06 2007-03-22 Fuji Xerox Co Ltd 情報処理装置および情報処理方法
JP2010268324A (ja) * 2009-05-17 2010-11-25 Semiconductor Technology Academic Research Center 発話推定による回路起動方法及び回路起動装置
JP2011080868A (ja) * 2009-10-07 2011-04-21 Hitachi Ltd 音響監視システム、及び音声集音システム

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016526331A (ja) * 2013-05-23 2016-09-01 ノールズ エレクトロニクス,リミテッド ライアビリティ カンパニー Vad検出マイク及びその動作方法
JP2017536040A (ja) * 2014-11-12 2017-11-30 クアルコム,インコーポレイテッド マイクロフォン始動の遅延時間減少
WO2017061023A1 (ja) * 2015-10-09 2017-04-13 株式会社日立製作所 音声信号処理方法および装置
US10629222B2 (en) 2015-10-09 2020-04-21 Hitachi, Ltd. Sound signal procession method and device
JP2018074251A (ja) * 2016-10-25 2018-05-10 キヤノン株式会社 音響システム及びその制御方法、信号生成装置、コンピュータプログラム
KR20190135045A (ko) * 2017-04-10 2019-12-05 시러스 로직 인터내셔널 세미컨덕터 리미티드 헤드셋들을 위한 유연한 음성 캡처 프론트-엔드
KR102545750B1 (ko) * 2017-04-10 2023-06-21 시러스 로직 인터내셔널 세미컨덕터 리미티드 헤드셋들을 위한 유연한 음성 캡처 프론트-엔드

Also Published As

Publication number Publication date
JP5289517B2 (ja) 2013-09-11
US20130029684A1 (en) 2013-01-31
US8600443B2 (en) 2013-12-03

Similar Documents

Publication Publication Date Title
JP5289517B2 (ja) センサネットワークシステムとその通信方法
Mandal et al. Beep: 3D indoor positioning using audible sound
Estrin et al. Instrumenting the world with wireless sensor networks
JP5022461B2 (ja) マイクアレイ・ネットワークシステムおよび該システムを用いた音源定位方法
US20080267422A1 (en) Microphone Array and Digital Signal Processing System
EP2879402A1 (en) Information processing system and storage medium
Bergamo et al. Collaborative sensor networking towards real-time acoustical beamforming in free-space and limited reverberance
Wang et al. A wireless time-synchronized COTS sensor platform: Applications to beamforming
JP5412470B2 (ja) 位置測定システム
EP2710841B1 (en) Distributed blind source separation
Kraljević et al. Free-field TDOA-AOA sound source localization using three soundfield microphones
US20110058683A1 (en) Method & apparatus for selecting a microphone in a microphone array
Uddin et al. RF-Beep: A light ranging scheme for smart devices
Tiete et al. MEMS microphones for wireless applications
US20140269198A1 (en) Beamforming Sensor Nodes And Associated Systems
Takagi et al. Microphone array network for ubiquitous sound acquisition
Cobos et al. Wireless acoustic sensor networks and applications
Zhang et al. Self-organization of unattended wireless acoustic sensor networks for ground target tracking
JP2011033369A (ja) 会議装置
Soda et al. Handsfree voice interface for home network service using a microphone array network
Izumi et al. Data aggregation protocol for multiple sound sources acquisition with microphone array network
You et al. Scalable and low-cost acoustic source localization for wireless sensor networks
Verreycken et al. Passive acoustic sound source tracking in 3D using distributed microphone arrays
Astapov et al. Collective acoustic localization in a network of dual channel low power devices
Azimi-Sadjadi et al. Acoustic source localization with high performance sensor nodes

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130513

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130528

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130604

LAPS Cancellation because of no payment of annual fees