JPWO2017086030A1 - 情報処理装置、情報処理方法、及びプログラム - Google Patents

情報処理装置、情報処理方法、及びプログラム Download PDF

Info

Publication number
JPWO2017086030A1
JPWO2017086030A1 JP2017551757A JP2017551757A JPWO2017086030A1 JP WO2017086030 A1 JPWO2017086030 A1 JP WO2017086030A1 JP 2017551757 A JP2017551757 A JP 2017551757A JP 2017551757 A JP2017551757 A JP 2017551757A JP WO2017086030 A1 JPWO2017086030 A1 JP WO2017086030A1
Authority
JP
Japan
Prior art keywords
sound
unit
information processing
sound collection
processing apparatus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017551757A
Other languages
English (en)
Other versions
JP6747451B2 (ja
Inventor
高橋 直也
直也 高橋
祐基 光藤
祐基 光藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of JPWO2017086030A1 publication Critical patent/JPWO2017086030A1/ja
Application granted granted Critical
Publication of JP6747451B2 publication Critical patent/JP6747451B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S3/00Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received
    • G01S3/80Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received using ultrasonic, sonic or infrasonic waves
    • G01S3/802Systems for determining direction or deviation from predetermined direction
    • G01S3/809Rotating or oscillating beam systems using continuous analysis of received signal for determining direction in the plane of rotation or oscillation or for determining deviation from a predetermined direction in such a plane
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S3/00Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received
    • G01S3/80Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received using ultrasonic, sonic or infrasonic waves
    • G01S3/8006Multi-channel systems specially adapted for direction-finding, i.e. having a single aerial system capable of giving simultaneous indications of the directions of different signals
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S3/00Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received
    • G01S3/80Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received using ultrasonic, sonic or infrasonic waves
    • G01S3/802Systems for determining direction or deviation from predetermined direction
    • G01S3/808Systems for determining direction or deviation from predetermined direction using transducers spaced apart and measuring phase or time difference between signals therefrom, i.e. path-difference systems
    • G01S3/8083Systems for determining direction or deviation from predetermined direction using transducers spaced apart and measuring phase or time difference between signals therefrom, i.e. path-difference systems determining direction of source
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/40Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
    • H04R1/406Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S3/00Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received
    • G01S3/80Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received using ultrasonic, sonic or infrasonic waves
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S5/00Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations
    • G01S5/18Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations using ultrasonic, sonic, or infrasonic waves
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2201/00Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
    • H04R2201/02Details casings, cabinets or mounting therein for transducers covered by H04R1/02 but not provided for in any of its subgroups
    • H04R2201/025Transducer mountings or cabinet supports enabling variable orientation of transducer of cabinet
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2201/00Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
    • H04R2201/40Details of arrangements for obtaining desired directional characteristic by combining a number of identical transducers covered by H04R1/40 but not provided for in any of its subgroups
    • H04R2201/4012D or 3D arrays of transducers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/20Processing of the output signals of the acoustic transducers of an array for obtaining a desired directivity characteristic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2499/00Aspects covered by H04R or H04S not otherwise provided for in their subgroups
    • H04R2499/10General applications
    • H04R2499/11Transducers incorporated or for use in hand-held devices, e.g. mobile phones, PDA's, camera's

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Remote Sensing (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Otolaryngology (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • General Health & Medical Sciences (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
  • Details Of Audible-Bandwidth Transducers (AREA)

Abstract

【課題】集音部の数の低減と、音源の方向の推定における分解能の向上とを両立する。
【解決手段】位置及び向きのうち少なくともいずれかを示す位置情報が変化する集音部による、1以上の音源それぞれからの音響の集音結果を取得する取得部と、前記集音部の前記位置情報の変化に伴う、当該集音部に集音される音響の周波数変化に基づき、前記1以上の音源それぞれの方向を推定する推定部と、を備える、情報処理装置。
【選択図】図1

Description

本開示は、情報処理装置、情報処理方法、及びプログラムに関する。
近年では、所謂音声認識技術や音響解析技術の発展に伴い、ユーザから発話された音声や、周囲に存在する音源からの音響を入力情報として利用することで、状態や状況を認識し、認識結果に応じて処理を実行することが可能な情報処理装置が各種提案されている。このような情報処理装置の中には、音声や音響の集音結果に基づき当該音響の到来方向(即ち、音源の方向)を推定し、推定結果を、雑音の抑圧や目的音の認識精度の向上等のような各種処理にフィードバックすることが可能なものも提案されている。例えば、特許文献1には、複数のマイクロフォン(以降では、「集音部」とも称する)それぞれの集音結果に基づき、音響の到来方向を推定する技術の一例が開示されている。
特開2011−61422号公報
音響の到来方向を推定する仕組みの一例として、特許文献1に開示された技術のように、複数の集音部それぞれによる集音結果を利用する技術が挙げられる。このような技術では、音響の到来方向の推定に係る分解能やビームフォーミングのメインローブの幅は、集音部の間隔や数に依存し、より広い周波数帯域でより高い分解能を得るためには、高密度に多数設置された集音部を要する場合がある。
一方で、集音部の数の増加は、集音部自体のコスト、配線コスト、メンテナンスコスト、及び、集音部間の特性のばらつきへの対策等の各種コストが増加する場合がある。また、集音部の数の増加に伴い、装置自体の重量が増加する場合もある。
そこで、本開示では、集音部の数の低減と、音源の方向の推定における分解能の向上とを両立することが可能な、情報処理装置、情報処理方法、及びプログラムを提案する。
本開示によれば、位置及び向きのうち少なくともいずれかを示す位置情報が変化する集音部による、1以上の音源それぞれからの音響の集音結果を取得する取得部と、前記集音部の前記位置情報の変化に伴う、当該集音部に集音される音響の周波数変化に基づき、前記1以上の音源それぞれの方向を推定する推定部と、を備える、情報処理装置が提供される。
また、本開示によれば、位置及び向きのうち少なくともいずれかを示す位置情報が変化する集音部による、1以上の音源それぞれからの音響の集音結果を取得することと、プロセッサが、前記集音部の前記位置情報の変化に伴う、当該集音部に集音される音響の周波数変化に基づき、前記1以上の音源それぞれの方向を推定することと、を含む、情報処理方法が提供される。
また、本開示によれば、コンピュータに、
位置及び向きのうち少なくともいずれかを示す位置情報が変化する集音部による、1以上の音源それぞれからの音響の集音結果を取得することと、前記集音部の前記位置情報の変化に伴う、当該集音部に集音される音響の周波数変化に基づき、前記1以上の音源それぞれの方向を推定することと、を実行させる、プログラムが提供される。
以上説明したように本開示によれば、集音部の数の低減と、音源の方向の推定における分解能の向上とを両立することが可能な、情報処理装置、情報処理方法、及びプログラムが提供される。
なお、上記の効果は必ずしも限定的なものではなく、上記の効果とともに、または上記の効果に代えて、本明細書に示されたいずれかの効果、または本明細書から把握され得る他の効果が奏されてもよい。
本開示の一実施形態に係る情報処理システムの概略的なシステム構成の一例を示している。 同実施形態に係る情報処理システムの機能構成の一例を示したブロック図である。 集音部が円運動する場合における、集音部と音響との間の空間的な位置関係の一例を模式的に示した図である。 互いに異なる位置に存在する複数の音源それぞれから到来する音響の観測結果の一例を示している。 2つの音源が互いに異なる方向に位置する場合における、各音源から到来する音響のスペクトルの一例を示している。 図5に示したスペクトルに基づく、音響の到来方向の推定結果をヒストグラムとして表したグラフの一例である。 音源の位置が集音部に近い場合における、集音部と当該音源との間の空間的な位置関係の一例を模式的に示した図である。 近接音源から到来する音響の観測結果の一例を示している。 ドップラー効果による変調時の位相差を算出する方法の一例について説明するための説明図である。 ドップラー効果による変調時の位相差を算出する方法の一例について説明するための説明図である。 変形例1に係る情報処理システムの概要について説明するための説明図である。 複数の集音部による音響の観測結果の一例を示している。 複数の集音部それぞれの集音結果に基づき算出される振幅スペクトルの一例を示している。 複数の集音部それぞれの集音結果に基づき算出される振幅スペクトルの他の一例を示している。 変形例3に係る情報処理システムの概要について説明するための説明図である。 集音ユニットが設置された移動体の速度及び加速度の検出結果の一例を示している。 変形例4に係る情報処理システムの概要について説明するための説明図である。 同実施形態に係る情報処理装置のハードウェア構成の一例を示した図である。
以下に添付図面を参照しながら、本開示の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。
なお、説明は以下の順序で行うものとする。
1.構成
1.1.システム構成
1.2.機能構成
2.技術的特徴
2.1.基本的な原理
2.2.集音部が円運動を行い、音源から到来する音響が平面波とみなせる場合
2.3.音源から音響と集音部の軌道とを一般化した場合
2.4.音源から観測点に近い場合
2.5.音源分離、ビームフォーミングへの応用
3.変形例
3.1.変形例1:複数の集音部を利用する場合の例
3.2.変形例2:他の方向推定技術との組み合わせ
3.3.変形例3:観測点が移動する場合の一例
3.4.変形例4:屋内における適用例
4.ハードウェア構成
5.むすび
<<1.構成>>
<1.1.システム構成>
まず、本開示の一実施形態に係る情報処理システムの概要について説明する。例えば、図1は、本実施形態に係る情報処理システムの概略的なシステム構成の一例を示している。なお、図1に示す例では、水平面上の互いに直交する方向をx方向及びy方向とし、鉛直方向をz方向として説明する。
図1に示すように、本実施形態に係る情報処理システム1は、情報処理装置10と、集音ユニット30とを含む。また、集音ユニット30は、集音部301と、支持部303、駆動部305とを含む。支持部303は、一部が駆動部305に連結されており、駆動部305が駆動することで、軌道L1(円軌道)に沿って回転する。また、集音部301は、支持部303により支持されている。このような構成に基づき、駆動部305が駆動することにより支持部303が回転することで、集音部301は、軌道L1に沿って移動することとなる(即ち、集音部301の位置や向きが軌道L1に沿って変化する)。
集音部301は、所謂マイクロフォンのような集音デバイスにより構成される。また、集音部301は、例えば、マイクロフォンアレイのように、複数の集音デバイスを含んでもよい。集音部301は、周囲から到来する音響を集音し、集音結果に基づく音響信号を情報処理装置10に出力する。例えば、図1に示す例の場合には、ユーザU11及びU12が発話した音声が集音部301により集音され、当該音声の集音結果に基づく音響信号が情報処理装置10に出力される。
情報処理装置10は、集音部301から音声や音響(以降では、総じて「音響」と称する場合がある)の集音結果に基づく音響信号を取得し、取得した音響信号の変化に基づき、集音ユニット30に対する当該音響の音源の方向(即ち、音響の到来方向)を推定する。より具体的には、情報処理装置10は、集音部301を所定の軌道(例えば、2次元または3次元的な軌道)に沿って移動させたときに、音響の集音結果に基づく音響信号の周波数がドップラー効果により変化する特性を利用することで、集音ユニット30に対する当該音響の音源の方向を推定する。
具体的な一例として、図1に示す例では、集音部301は、水平面(即ち、xy平面)上において、2次元的な軌道L1(即ち、円軌道)に沿って移動する。このとき、集音部301とユーザU11との間の位置関係に着目すると、集音部301が軌道L1に沿って移動することで、集音部301とユーザU11との間の相対的な位置関係が変化し、集音部301とユーザU11との間の距離が変化する。これにより、例えば、ユーザU11により発話された音声の集音部301による集音結果に基づく音響信号は、ドップラー効果により周波数が変化することとなる。このとき、情報処理装置10は、例えば、集音部3301の位置の変化を直接的または間接的に認識し、当該集音部301の位置の変化と、当該集音部301による集音結果に基づく音響信号の変化とに基づき、集音ユニット30に対する音源(即ち、ユーザU11)の方向を推定する。これは、ユーザU12の場合についても同様である。
また、情報処理装置10は、集音ユニット30の動作を制御してもよい。具体的には、情報処理装置10は、駆動部305の動作を制御することで、集音部301を所望の速度で所定の軌道(例えば、軌道L1)に沿って移動させてもよい。これにより、情報処理装置10は、駆動部305の駆動に伴う集音部301の位置や向きの変化を認識することが可能となる。
また、集音ユニット30の制御主体は、必ずしも情報処理装置10である必要はない。この場合には、情報処理装置10は、例えば、駆動部305の駆動状態を示す情報を集音ユニット30から取得することで、駆動部305の駆動に伴う集音部301の位置や向きの変化を認識すればよい。なお、以降の説明では、情報処理装置10が、集音ユニット30(特に、駆動部305)の動作を制御するものとして説明する。
以上、図1を参照して、本実施形態に係る情報処理システムの概要について説明した。
<1.2.機能構成>
次いで、図2を参照して、本実施形態に係る情報処理システム1の機能構成の一例について、特に、情報処理装置10の機能構成に着目して説明する。図2は、本実施形態に係る情報処理システム1の機能構成の一例を示したブロック図である。
図2に示すように、情報処理装置10は、解析部101と、駆動制御部103と、処理実行部105と、記憶部107とを含む。
駆動制御部103は、駆動部305の動作を制御する。また、駆動制御部103は、駆動部305の制御結果を示す情報を後述する解析部101に出力する。これにより、解析部101は、駆動部305の制御結果を認識し、ひいては、当該駆動部305の駆動に伴う集音部301の動き(即ち、位置及び向きの変化)を認識することが可能となる。
解析部101は、集音部301から音響の集音結果に基づく音響信号を取得する。また、解析部101は、駆動制御部103から、駆動部305の制御結果を示す情報を取得する。解析部101は、駆動部305の制御結果を示す情報に基づき、集音部301の移動方向、向きの変化、及び移動速度等のような、集音部301の動き(即ち、位置及び向きの変化)を認識する。そして、解析部101は、認識した集音部301の動きと、当該集音部301から取得した音響信号の変化(即ち、ドップラー効果による周波数の変化)とに基づき、集音ユニット30に対する音源の方向(即ち、音響の到来方向)を推定する。そして、解析部101は、音源の方向の推定結果を示す情報を、後述する処理実行部105に出力する。なお、解析部101による、音源の方向の推定に係る処理の詳細については、「3.技術的特徴」として別途後述する。また、解析部101が、「推定部」の一例に相当する。
記憶部107は、情報処理装置10が各種機能を実行するための各種データを、一時的または恒常的に記憶するための記憶領域である。例えば、記憶部107には、後述する処理実行部105が、各種機能(例えば、アプリケーション)を実行するためのデータ(例えば、ライブラリ)や、当該機能を実行するための制御情報(例えば、設定情報等)が記憶されていてもよい。
処理実行部105は、情報処理装置10が提供する各種機能(例えば、アプリケーション)を実行するための構成である。処理実行部105は、解析部101から、音源の方向の推定結果を示す情報を取得し、当該音源の方向の推定結果に基づき、各種機能を実行してもよい。
具体的な一例として、処理実行部105は、音源の方向の推定結果に基づき、当該音源の方向から到来する音響(即ち、当該音源からの音響)を強調してもよい。また、他の一例として、処理実行部105は、音源の方向の推定結果に基づき、他の方向から到来する音響(即ち、雑音)を抑圧してもよい。この場合には、例えば、処理実行部105は、取得した音響信号に対して、方向に応じてゲイン値を乗算することにより、所望の方向から到来する音響を強調または抑圧すればよい。なお、処理実行部105が、「音響制御部」の一例に相当する。
また、処理実行部105は、音源の方向の推定結果に基づき、他の構成の動作を制御してもよい。具体的な一例として、処理実行部105は、指向性を制御可能に構成されたスピーカーやマイクロフォン等のようなデバイス(所謂、指向性デバイス)の当該指向性を、音源の方向の推定結果に基づき制御してもよい。より具体的な一例として、処理実行部105は、ユーザの音声が集音された場合に、音源(即ち、当該ユーザ)の方向の推定結果に基づき、指向性スピーカーの指向性が当該ユーザの方向に向くように制御してもよい。
なお、図2を参照して説明した情報処理システム1の機能構成はあくまで一例であり、必ずしも同構成には限定されない。具体的な一例として、集音ユニット30と情報処理装置10とが一体的に構成されていてもよい。また、情報処理装置10の各構成のうち、一部の構成が、情報処理装置10とは異なる外部装置(例えば、サーバ等)に設けられていてもよい。また、情報処理装置10が提供する機能に応じて、図2に示した各種構成とは異なる他の構成が設けられていてもよい。具体的な一例として、処理実行部105の非制御対象となる指向性デバイス(例えば、スピーカーやマイクロフォン等)が別途設けられていてもよい。
以上、図2を参照して、本実施形態に係る情報処理システム1の機能構成の一例について、特に、情報処理装置10の機能構成に着目して説明した。
<<2.技術的特徴>>
次に、本実施形態の技術的特徴として、特に、情報処理装置10(特に、解析部101)による音源の方向の推定に係る処理の詳細について説明する。
<2.1.基本的な原理>
前述したように、本実施形態に係る情報処理システム1は、集音部を所定の軌道(例えば、2次元または3次元的な軌道)に沿って位置や向きを変化させたときに、音響の集音結果に基づく音響信号がドップラー効果により変化する特性を利用することで、音源の方向(音響の到来方向)を推定する。この音源の方向の推定にあたり、本実施形態に係る情報処理システム1は、以下の点を仮定する。
(1)集音部の移動速度は既知または観測可能である。
(2)方向の推定の対象となる音源から到来する音響は、定常性及びトーン性を仮定することが可能な区間を含む。
(3)集音部から見た音源の移動速度は、少なくとも、当該集音部が所定の軌道に沿って移動する速度と比較して十分に小さい。
(4)集音部から見た音源の速度変化は、少なくとも、当該集音部が所定の軌道に沿って移動する速度と比較して十分にゆるやかである。
仮定(1)については、例えば、情報処理装置10が、あらかじめ決められた軌道に沿って集音部301が移動するように制御することで実現可能である。また、他の一例として、情報処理装置10が、各種センサ等の検知結果に基づき、集音部301の移動速度を算出することでも実現することが可能である。
仮定(2)は、少なくともスペクトルグラムの観測区間において、時間的に音の性質が急激に変化することがなく(定常性)、所謂長波構造を有する(トーン性)音響を対象としていることを意味する。なお、仮定(2)については、例えば、音声や楽曲、動物の鳴き声、サイレン等のようにトーン性を有する音響に広く適用可能である。
仮定(3)及び(4)については、集音部301の移動速度に応じてその程度が変わるが、集音部301から音源が十分に離れている場合(換言すると、音源から到来する音響を平面波とみなせる場合)については適用可能である。また、集音部301に対して音源の位置が近い場合においても、集音部301の移動速度に対して音源の緯度速度が十分に遅い場合(静止している場合も含む)については適用可能である。
また、前述したように、本実施形態に係る情報処理装置10は、集音部301が移動することにより生ずるドップラー効果を、音源の方向の推定に利用する。具体的には、集音部301が音源に対して近づく場合には、当該音源からの音響の集音結果は、当該音響に比べてピッチが高く観測される(即ち、波長が短くなる)。これに対して、集音部301が音源から遠ざかる場合には、当該音源からの音響の集音結果は、当該音響に比べてピッチが低く観測される(即ち、波長が長くなる)。
前述した仮定(2)により、音源から到来する音響には定常とみなせる区間があり、その区間での音高(ピッチ)の変化は、仮定(3)及び(4)より、集音部301の移動速度の変化と、当該音響の到来方向とに依存する。なお、仮定(1)により、集音部301の移動速度の変化は既知であるため、情報処理装置10は、音響の集音結果に基づく音響信号の音高の変化に基づき、当該音響の到来方向(即ち、音源の方向)を推定することが可能となる。なお、以降では、具合的な例を挙げて、さらに詳しく説明する。
<2.2.集音部が円運動を行い、音源から到来する音響が平面波とみなせる場合>
まず、図3及び図4を参照して、音源が集音部301から十分に離れており、当該音源から到来する音響が平面波とみなせ、かつ、集音部301が円状の軌道を等速度で移動する場合に着目して、音源の方向を推定する方法の一例について説明する。
例えば、図3は、集音部301が円運動する場合における、集音部301と音響との間の空間的な位置関係の一例を模式的に示した図である。なお、本説明では、図3に示すように、集音部301は、半径rの円周上を所定の角速度φで移動するものとして、音源の方向を推定する方法の一例について説明する。なお、平面波は、進行方向がθの正弦波であり、周波数をfとする。ここで、集音部301の時刻tにおける速度をv=(v,v)とすると、当該速度vは、以下に(式1)として示す計算式で表される。
Figure 2017086030
・・・(式1)
なお、上記に示した(式1)において、φは、t=0における角度を示すものとする。ここで、平面波の進行方向を向いた単位ベクトルをe=(cosθ,sinθ)とすると、ドップラー効果により変調されて集音部301に観測される信号(以降では、「観測信号」とも称する)の周波数fは、以下に(式2)として示す計算式で表される。なお、(式2)に示すように、vは、eとvとの内積で表される。
Figure 2017086030
・・・(式2)
上記に示した(式2)において、平面波の周波数fは未知の値であるが、その他の値は既知であるため、観測信号の周波数fの変調の位相から音源の方向(即ち、平面波の到来方向)を導出することが可能となる。
なお、音源が複数存在する場合には、各音源から到来する音響は、音源の位置に応じてことある位相で変調される。例えば、図4は、互いに異なる位置に存在する複数の音源それぞれから到来する音響の観測結果の一例を示している。図4において、横軸は時間tを示し、縦軸は観測信号の周波数fを示している。なお、図4に示された複数のグラフは、それぞれ異なる音源から到来した音響に基づく観測信号の一例を示している。図4を参照するとわかるように、本実施形態に係る情報処理システム1に依れば、単一の集音部301により複数の音源それぞれの方向を推定することが可能であることがわかる。また、本実施形態に係る情報処理システム1に依れば、特定の位相の信号のみを抽出することで、例えば、信号の周波数が重なっているような状況下においても、所望の方向に位置する音源から到来する音響を抽出及び分離することが可能である。
以上、図3及び図4を参照して、音源が集音部301から十分に離れており、当該音源から到来する音響が平面波とみなせ、かつ、集音部301が円状の軌道を等速度で移動する場合に着目して、音源の方向を推定する方法の一例について説明した。
<2.3.音源から音響と集音部の軌道とを一般化した場合>
次いで、図5及び図6を参照して、音源から音響と集音部の軌道とを一般化した場合、即ち、音源から到来する音響を正弦波に限らず、かつ、集音部301が移動する軌道を円状の軌道に限定しない場合において、音源の方向を推定する方法の一例について説明する。なお、本説明においても、音源が集音部301から十分に離れており、当該音源から到来する音響が平面波とみなせるものとして説明する。
まず、音源から到来する音響の時刻tにおけるスペクトルをA(ω,t)、集音部301の時刻tにおける速度をv=(v,v)、平面波の進行方向を向いた単位ベクトルをe=(cosθ,sinθ)、速度vの平面波の進行方向の成分をvとする。なお、vは、前述した例と同様に、eとvとの内積で表される。また、角周波数をωで表すものとする。このとき、集音部301で観測される信号(即ち、観測信号)のスペクトルA(ω,t)は、以下に(式3)として示す計算式で表される。なお、「A」は、「A」の上にチルダが付された文字を示すものとする。
Figure 2017086030
・・・(式3)
なお、上記に示した(式3)において、dは、音源から集音部301までの距離を表す。また、ωは、音源から到来する音響の角周波数を示す。また、ωは、ドップラー効果によって変調された(瞬時)角周波数を示している。ここで、前述した仮定(2)により、スペクトルはある短い区間では定常とみなせることから、以下に(式4)として示した関係式が成り立つ。
Figure 2017086030
・・・(式4)
上記に(式4)として示した関係式に基づき、(式3)として前述した観測信号のスペクトルA(ω,t)を時間tで偏微分すると、(式5)として示す計算式が導出される。
Figure 2017086030
・・・(式5)
一方、観測信号のスペクトルA(ω,t)の周波数方向の偏微分は、以下に(式6)として示す計算式で表される。
Figure 2017086030
・・・(式6)
ここで、観測信号のスペクトルA(ω,t)の時間方向の偏微分と、当該スペクトルA(ω,t)の周波数方向の偏微分との比をγとすると、γは以下に(式7)として示す計算式で表される。
Figure 2017086030
・・・(式7)
ここで、γ及びvは観測可能であることから、上記に示した(式7)に基づき、音響の到来方向e(即ち、音源の方向)を推定することが可能となる。なお、実質的には、観測誤差やノイズの影響も想定されるため、複数の(ω,t)においてγを求め、音の到来方向eの推定精度を向上させてもよい。
なお、音源が複数存在する場合には、ある周波数においてある音源から到来する音響が支配的であれば、推定されるeの値は、当該音源の方向を示すこととなる。したがって、各音源間において、周波数上で重なりがない帯域が存在する場合には、その帯域の情報を用いることで、各音源の方向を推定することが可能となる。例えば、図5は、2つの音源が互いに異なる方向に位置する場合における、各音源から到来する音響のスペクトルの一例を示している。図5において、横軸は時間tを示し、縦軸は観測信号の周波数fを示している。なお、図5に示す例では、互いに異なる方向ek1及びek2に位置する音源それぞれから到来する音響のスペクトルの一例を示している。
ここで、図5に示したスペクトルに基づき、各時刻及び各周波数(即ち、複数の(ω,t))について音響の到来方向eを算出し、当該eの算出結果を到来方向ごとにカウントしてヒストグラムを生成すると、図6に示すようになる。図6は、図5に示したスペクトルに基づく、音響の到来方向の推定結果をヒストグラムとして表したグラフの一例である。図6において、横軸は音響の進行方向θ(換言すると、音響の到来方向)、縦軸は複数の(ω,t))について算出された音響の到来方向eのカウント値Nを示している。即ち、図6に示す例では、θ及びθのそれぞれの方向に音源が存在する可能性が高いことを示している。
なお、スペクトルの重なりや、音源から到来する音響に含まれる非定常な部分の影響により、音響の到来方向eの推定結果に歪みが生じる場合がある。しかしながら、前述した仮定(1)〜(4)で示した条件を満たす場合においては、多くの場合において到来方向eが正しく推定され得る。そのため、例えば、図6に示すようなヒストグラムを生成し、当該ヒストグラムのピーク値から、各音源からの音響の到来方向(即ち、各音源の方向)を推定することが可能となる。
以上、図5及び図6を参照して、音源から音響と集音部の軌道とを一般化した場合において、音源の方向を推定する方法の一例について説明した。なお、上記に説明した内容からもわかるように、本実施形態に係る情報処理システム1は、ドップラー効果により、集音部301による集音結果に基づく音響信号の周波数が変化すれば、集音部301の位置及び向きのうち少なくともいずれかを変化させる態様(例えば、集音部301を移動させる軌道)は特に限定されない。
<2.4.音源から観測点に近い場合>
次いで、図7〜図10を参照して、音源の位置が集音部に近い場合、即ち、音源から到来する音響が平面波であるという仮定が成り立たない場合において、音源の方向を推定する方法の一例について説明する。
例えば、図7は、音源の位置が集音部301に近い場合における、集音部301と当該音源との間の空間的な位置関係の一例を模式的に示した図である。なお、本説明では、音源の方向の推定方法をよりわかりやすくするために、音源から到来する音響は周波数fの単一正弦波であり、集音部301は、図3に示す例と同様に、半径rの円状の軌道L1上を所定の角速度φで移動するものとする。なお、図7において、参照符号Sは、音源の位置を示している。また、参照符号lは、集音部301が移動する軌道L1の回転中心と音源Sとの間の距離を示している。このとき、ドップラー効果により集音部301に観測される信号(即ち、観測信号)の瞬時周波数fは、以下に(式8)として示す計算式で表される。
Figure 2017086030
・・・(式8)
なお、上記に示した(式8)において、φは、t=0における角度を示すものとする。例えば、図8は、近接音源から到来する音響の観測結果の一例を示している。図8において、横軸は時間tを示し、縦軸は観測信号の周波数fを示している。なお、図8に示す例では、近接音源からの音響の観測結果に加えて、当該音響が平面波とみなせる場合における観測結果の一例を参考として提示している。上記に示した(式8)と、図6とを参照するとわかるように、近接音源の場合には、ドップラー効果により変調された信号に歪みが生じるが、依然として周期及び位相が保存されていることがわかる。そのため、ドップラー効果により変調された信号の位相から、音源の方向θを推定することが可能である。
具体的には、音源の方向をθとした場合に、定常な周波数は、sin(φt+φ+θ)のかたちで変調されるため(例えば、上述した(式2)を参照)、f=sin(φt+φ)との位相差θとして、音源の方向を推定することが可能となる。より具体的な一例として、相互相関関数を計算し、相関値が最大となる時刻ΔTから、位相差θ=φΔTとして求めればよい。なお、この場合には、観測点と近接音源との間の距離lは未知であってもよい。
具体的には、上記に示した(式8)において、(f,θ,l)=(f’,θ’,l’)とした、Aref(f,t)及びRと観測信号の相互相関を計算し、相関値が最大となる(f’,θ’,l’)を求めることで、位相差θ=θ’を推定することが可能となる。この場合におけるAref(f,t)及びRは、以下に(式8a)として示すとおりである。なお、この手法では、方向だけでなく音源までの距離l=l’についても推定可能であるが、精度よく求めるためには3変数についての最大化問題を解く必要があり、計算量がより大きくなる場合がある。
Figure 2017086030
・・・(式8a)
また、位相差θを導出する方法の他の一例について、図9及び図10を参照して以下に説明する。図9及び図10は、ドップラー効果による変調時の位相差を算出する方法の一例について説明するための説明図である。図9及び図10において、横軸は時間tを示し、縦軸は周波数fを示している。
まず、図9に示すように、直線f=fと観測信号との交点の周期が一定となるように、周波数fを導出する。次いで、図10に示すように、f=sin(φt+φ)のゼロ点時刻t=(nπ−φ)/φと、直線f=fと観測信号とが交わる時刻tとを導出する。そして、導出した時刻t及びtに基づき、位相差θ=φ(t−t)を算出すればよい。なお、この場合においても、観測点と近接音源との間の距離lは未知であってもよい。
また、観測点と近接音源との間の距離lをなんらかの方法で特定することが可能な場合には、前述した(式8)に基づき、音響の到来方向(即ち、音源の方向)を推定できることは言うまでもない。
以上、図7〜図10を参照して、音源の位置が集音部に近い場合、即ち、音源から到来する音響が平面波であるという仮定が成り立たない場合において、音源の方向を推定する方法の一例について説明した。
<2.5.音源分離、ビームフォーミングへの応用>
上述したように、本実施形態に係る情報処理システム1に依れば、周波数ビン毎の音響の到来方向(即ち、音源の方向)を推定することが可能である。そのため、前述したように、例えば、取得された観測信号に対して、所望の方向に応じてゲイン値を乗算することで、所望の方向から到来する音響を強調または抑圧することが可能である。
なお、本実施形態に係る情報処理システム1において得られる音響は、ドップラー効果により変調されて歪んだ音響となるが、例えば、前述した(式3)に基づき、ドップラー効果による変調を逆補正することで、集音部301が静止している場合と同様に歪みの少ない音響を取得することが可能である。
また、音源の移動や計算誤差等に伴い、当該音源の方向の推定結果が急激に変化することで、フィルタゲインが急激に変化し、ミュージカルノイズが発生する場合が想定され得る。このような場合には、例えば、ミュージカルノイズの発生を避けるために、音源の方向の推定結果やフィルタゲイン値に対して、時間方向に平滑化を施す処理等を加えてもよい。
以上、本実施形態の技術的特徴として、特に、情報処理装置10による音源の方向の推定に係る処理の詳細について説明した。
<<3.変形例>>
次いで、本実施形態に係る情報処理システム1の変形例について説明する。
<3.1.変形例1:複数の集音部を利用する場合の例>
まず、変形例1として、複数の集音部301を利用することで、音源の方向の推定に係る性能(例えば、分解能等)をより向上させることが可能な仕組みの一例について説明する。
前述した通り、本実施形態に係る情報処理システム1では、単一の集音部301により、複数の音源それぞれの方向を推定することが可能である。一方で、音源の方向の推定に係る分解能は、集音部301の移動速度や音源からの音響の定常性の度合い等に依存する場合がある。例えば、集音部301の移動速度が過度に遅い場合には、ドップラー効果の影響を観測しにくくなり、特に、音源が複数存在する場合の方向推定が困難になる場合がある。一方で、集音部301の移動速度が過度に速い場合には、瞬時周波数の変化が激しくなり、スペクトルのピークがぼやけ、音源の方向を高い精度で推定することが困難となる場合がある。また、集音部301の移動速度は、当該集音部301を移動させる駆動部305等のハードウェア的な制約を受け、特に、集音部301をより高速に移動させることが困難な場合もある。そこで、変形例1に係る情報処理システムでは、上述した制約下においても、複数の集音部301を利用することで、音源の方向の推定に係る性能(例えば、分解能等)をより向上させることを可能としている。
例えば、図11は、変形例1に係る情報処理システム1の概要について説明するための説明図であり、複数の集音部301を利用する場合における、各集音部301と音響との間の空間的な位置関係の一例を模式的に示した図である。なお、本説明では、図11に示すように、複数の集音部301のそれぞれが同一の円状の軌道L1上を移動するものとし、かつ、音源から到来する音響は平面波とみなせるものとして説明する。また、図12は、複数の集音部301による音響の観測結果の一例を示している。図12において、横軸は時間tを示し、縦軸は観測信号の周波数fを示している。
具体的な一例として、情報処理装置10は、複数の集音部301それぞれについて集音された音響信号に基づき音源の到来方向を推定する。なお、図12を参照するとわかるように、複数の集音部301それぞれにより取得される観測信号は、各集音部301間の相対的な位置関係の違いに起因して位相がずれる。そのため、情報処理装置10は、各集音部301に対応する音源の到来方向の推定結果に応じたヒストグラムを、複数の集音部301間の相対的な位置関係の違いに起因する位相分だけずらして加算する。このような処理により、情報処理装置10は、音源の方向の推定結果として、より鋭いヒストグラムを取得することが可能となり、当該ヒストグラムのピーク値に基づき音源の方向をより精度よく推定することが可能となる。
また、他の一例として、各集音部301で観測される音響信号(即ち、観測信号)の周波数から振幅スペクトルを算出し、当該振幅スペクトルに基づき、音源の方向を推定する方法が挙げられる。本説明では、音源の方向の推定方法をよりわかりやすくするために、周波数fの単一正弦波の平面波がθ方向から到来する状況に着目して説明する。
具体的には、同一の円状の軌道L1上に位置するN個の集音部301それぞれの、時刻t=0における角度をφ…φとすると、i番目の集音部301で観測される音響信号(即ち、観測信号)の周波数fは、以下に(式9)として示された計算式で表される。
Figure 2017086030
・・・(式9)
ここで、i番目の集音部301で観測される音響信号の振幅スペクトルをA(f)とし、未知の到来方向をθ’と仮定とすると、ドップラー効果の影響を補正した振幅スペクトルの和A(f)は、以下に(式10)として示す計算式で表される。なお、「A」は、「A」の上にバーが付された文字を示すものとする。
Figure 2017086030
・・・(式10)
例えば、図13は、複数の集音部301それぞれの集音結果に基づき算出される振幅スペクトルの一例を示しており、上述した(式10)において、θ=θ’の場合の振幅スペクトルの一例を示している。図13において、横軸は周波数fを示し、縦軸は振幅|A|を示している。図13を参照するとわかるように、θ=θ’において、観測信号に対してドップラー効果の影響を補正した場合の周波数が複数の集音部301間で略一致し、スペクトルのピークがより鋭くなり最大値を取る。
このような特性に基づき、振幅スペクトルの和A(f)が最も鋭く最大値を取るようなθ’を求めることで、音響の到来方向(即ち、音源の方向)を推定することが可能となる。なお、この場合には、A(f)は、θ方向の音響がより強調されるため、ビームフォーミングや音源分離等に利用することが可能となる。
また、(式10)として上記に示した関係式は、任意の周波数fについて成立するため、音源から到来する音響は必ずしも単一正弦波に限らず、任意のスペクトルであってもよい。例えば、図14は、複数の集音部301それぞれの集音結果に基づき算出される振幅スペクトルの他の一例を示しており、本来の音響の到来方向θとは異なる到来方向を仮定して(即ち、θ≠θ’)、振幅スペクトルの和A(f)を求めた場合のスペクトルの一例である。この場合には、各集音部301に対応する振幅スペクトルA(f)の補正後のスペクトルは重ならないため、図14に示すように、図13に示す例に比べて、ピーク値がより小さく、裾野の広がった形状のスペクトルとなる。
以上、変形例1として、図11〜図14を参照して、複数の集音部301を利用することで、音源の方向の推定に係る性能(例えば、分解能等)をより向上させることが可能な仕組みの一例について説明した。
<3.2.変形例2:他の方向推定技術との組み合わせ>
次いで、変形例2として、本実施形態に係る情報処理システム1による音源の方向の推定に係る処理を、他の方向推定技術に係る処理と組み合わせることで、音源の方向の推定に係る精度をより向上させるための技術の一例について説明する。
具体的には、様々な方向から多くの雑音が混入するような状況下においては、雑音の到来方向に応じて、対象とする音源からの音響の到来方向を推定するための、変調後の観測信号の算出が困難となる場合がある。このような場合には、例えば、情報処理装置10は、観測点の周囲の映像を解析することで音源の位置の候補を推定し、当該推定結果と、前述した集音部301における観測信号に基づく音響の到来方向の推定結果とを組み合わせることで、音源の方向を推定してもよい。
具体的には、情報処理装置10は、撮像装置等により撮像された観測点の周囲の映像を取得し、取得した映像に対して画像解析等の各種解析処理を施すことで音源の候補(例えば、人等)を抽出し、抽出結果に基づき音源の方向の候補を推定する。そして、情報処理装置10は、集音部301の集音結果に基づく音響信号(観測信号)の解析時に、映像に基づき推定された音源の方向から到来する音響がより強調されるようなフィルタを適用してもよい。より具体的な一例として、音響の到来方向に応じた周波数変調のしかたに沿ってスペクトルを平滑化させるようなフィルタをかけることで、所望の方向から到来する音響を強調することも可能である。
なお、上記に説明した例はあくまで一例であり、本実施形態に係る情報処理システム1による音源の方向の推定に係る処理と組み合わせる他の方向推定技術は、音源の方向の候補を推定することが可能であれば、必ずしも映像の解析に基づく技術には限定されない。
以上、変形例2として、本実施形態に係る情報処理システム1による音源の方向の推定に係る処理を、他の方向推定技術に係る処理と組み合わせることで、音源の方向の推定に係る精度をより向上させるための技術の一例について説明した。
<3.3.変形例3:観測点が移動する場合の一例>
次いで、変形例3として、本実施形態に係る情報処理システム1を、自動車(車両)等の移動体に適用する場合の一例について説明する。例えば、図15は、変形例3に係る情報処理システム1の概要について説明するための説明図である。図15に示す例では、集音ユニット30が移動体50(例えば、自動車、電車、自転車等)に載置されており、移動体50の移動に伴い、集音ユニット30自体も移動する。なお、本説明では、集音部301は、円状の軌道に沿って移動するものとして説明する。また、図15に示す例では、移動体50は、xy平面上を移動するものとする。
この場合には、例えば、情報処理装置10は、移動体50の移動速度を認識する。具体的な一例として、情報処理装置10は、移動体50から移動速度を示す情報(例えば、速度計の値や、ハンドル操作の内容を示す情報等)を取得し、取得結果に応じて移動体50の移動速度を認識してもよい。また、情報処理装置10は、加速度センサ等の各種センサの検知結果に基づき、移動体50の移動速度を認識してもよい。また、他の一例として、情報処理装置10は、GPS(Global Positioning System)等による移動体50の位置の測位結果に基づき、当該移動体50の移動速度を算出してもよい。もちろん、情報処理装置10は、前述した各種方法のうち2以上の方法を組み合わせることで、移動体50の移動速度を認識してもよい。
例えば、図16は、集音ユニット30が設置された移動体50の速度及び加速度の検出結果の一例を示している。図16において、各グラフの横軸は時間を示している。また、図16において、|v|は、移動体50の速度の絶対値を示しており、例えば、速度計の値として取得することが可能である。また、aは、移動体50に対してx方向に加わる加速度を示しており、aは、移動体50に対してy方向に加わる加速度を示している。なお、加速度a及びaは、例えば、加速度センサの検知結果として取得することが可能である。また、vは、移動体50の移動速度のx方向成分を示しており、vは、移動体50の移動速度のy方向成分を示している。なお、移動体50のx方向の速度vは、x方向に加わる加速度aの時間方向の積分値として算出することが可能である。同様に、移動体50のy方向の速度vは、y方向に加わる加速度aの時間方向の積分値として算出することが可能である。
そして、情報処理装置10は、移動体50の速度をバイアスとして、移動体50に対して相対的に円状の軌道に沿って移動する集音部301の速度に加算することで、移動体50の移動に伴う集音部301の移動速度を算出する。ここで、移動体50の速度をvcar、移動体50に対して相対的に円状の軌道に沿って移動する集音部301の速度をvmicとすると、移動体50の移動に伴う集音部301の移動速度vtotalは、以下に(式11)として示す計算式で表される。
Figure 2017086030
・・・(式11)
なお、以降の処理については、前述した実施形態と同様である。具体的な一例として、情報処理装置10は、(式3)〜(式7)を参照して前述した処理に基づき、集音ユニット30(ひいては、移動体50)に対する音源の方向を推定すればよい。このような構成により、例えば、情報処理システム1を自動車に適用することで、サイレンの到来方向や、死角に位置する他の自動車の走行音等の到来方向を推定することで、周囲の状況の把握や危険察知に応用することが可能となる。
なお、移動体50の種別は、必ずしも限定されず、当該移動体50の動きも図15に示すような平面的な動きには限定されない。具体的な一例として、移動体50が、所謂ドローン等のような小型無人飛行機として構成されていてもよい。このような場合には、小型無人飛行機として構成された移動体50に設置された情報処理装置10は、集音部301の速度や、音響の進行方向を3次元的に解析することで、音源の方向(即ち、音響の到来方向)を3次元的に推定するとよい。
また、小型無人飛行機のように比較的高速に3次元的に移動する移動体50を適用する場合には、集音部301を回転させるための回転機構を設けない場合においても、移動体50の運動を監視することで音源の方向を検知できる場合がある。具体的には、加速度センサ、超音波センサ、気圧センサ、GPS等により移動体50の速度を推定し、当該速度を集音部301の移動速度とみなして、音源の方向を推定すればよい。このような構成の場合には、例えば、移動体50が動き回りながら音響の到来方向を推定し、当該推定結果を集計することで、集計結果に基づき音源の位置を推定することも可能である。
また、所謂ドローンのように移動体50自身が音を出すような場合には、例えば、複数の移動体50間において互いの位置を把握しあうことも可能である。この場合には、例えば、一方の移動体50側が、他方の移動体50を音源とみなして、当該他方の移動体50の位置または方向を推定すればよい。
以上、変形例3として、図15及び図16を参照して、本実施形態に係る情報処理システム1を、自動車等の移動体に適用する場合の一例について説明した。
<3.4.変形例4:屋内における適用例>
次いで、変形例4として、本実施形態に係る情報処理システム1を、屋内に設置された機器に適用した場合の一例を示す。例えば、図17は、変形例4に係る情報処理システム1の概要について説明するための説明図であり、屋内に設定されたシーリングファンに対して情報処理システム1を適用した場合の一例を示している。
具体的には、図17に示す例では、天井に対して設置されたシーリングファン30’を前述した集音ユニット30(例えば、図1参照)として利用し、シーリングファンの回転翼303’を、集音部301を支持する支持部303として利用している。このような構成により、シーリングファンの回転翼303’が開店することで、集音部301が円状の軌道に沿って移動することとなる。このとき、例えば、ユーザU21やユーザU22から発せられた音声は、集音部301に集音される際に、ドップラー効果の影響により変調されることとなる。即ち、図17に示す例では、ユーザU21及びユーザU22からの音声の集音結果に基づき、シーリングファン30’(即ち、集音ユニット30)に対する当該ユーザU21及びユーザU22それぞれの方向を推定することが可能となる。
このような構成により、例えば、音声入力が行われた場合に当該音声を発話したユーザ(即ち、話者)の方向を推定し、当該ユーザに対してサービスを提供することが可能となる。なお、このとき、例えば、画像認識技術等と組み合わせることで、ユーザ個人を特定し、個人の特定結果に応じたサービスを提供できるようにシステムが構成されていてもよい。
また、図17に示す例のように、シーリングファン30’を集音ユニット30として利用することで、床やテーブル上に集音部を設置する場合に比べて場所をとらず、集音部301の位置を固定化することが可能となる。また、図17に示すように、シーリングファン30’を集音ユニット30として利用する場合には、集音ユニット30(即ち、シーリングファン30’)を部屋の中央付近に設置できる可能性が高く、音源(例えば、ユーザ)との間に障害物が介在する可能性が低い。そのため、図17に示すように、シーリングファン30’を集音ユニット30として利用することで、音源(例えば、ユーザ)の方向をより精度良く推定することが可能となる。
以上、変形例4として、図17を参照して、本実施形態に係る情報処理システム1を、屋内に設置された機器に適用した場合の一例について説明した。なお、変形例4では、シーリングファンを集音ユニット30として利用する場合について説明したが、集音ユニット30として利用可能な機器は必ずしもシーリングファンのみには限定されないことは言うまでもない。より具体的には、想定される音源の移動速度に対して十分に速い速度で移動する機構を少なくとも一部に有する機器であれば、集音ユニット30として利用することは可能である。
<<4.ハードウェア構成>>
次に、図18を参照して、本開示の各実施形態に係る情報処理装置10(即ち、上述した信号処理装置11〜14)のハードウェア構成の一例について説明する。図18は、本開示の各実施形態に係る情報処理装置10のハードウェア構成の一例を示した図である。
図18に示すように、本実施形態に係る情報処理装置10は、プロセッサ901と、メモリ903と、ストレージ905と、操作デバイス907と、報知デバイス909と、集音デバイス913と、バス917とを含む。また、情報処理装置10は、音響デバイス911と、通信デバイス915とのうち少なくともいずれかを含んでもよい。
プロセッサ901は、例えばCPU(Central Processing Unit)、GPU(Graphics Processing Unit)、DSP(Digital Signal Processor)又はSoC(System on Chip)であってよく、情報処理装置10の様々な処理を実行する。プロセッサ901は、例えば、各種演算処理を実行するための電子回路により構成することが可能である。なお、前述した解析部101、駆動制御部103、及び処理実行部105は、プロセッサ901により実現され得る。
メモリ903は、RAM(Random Access Memory)及びROM(Read Only Memory)を含み、プロセッサ901により実行されるプログラム及びデータを記憶する。ストレージ905は、半導体メモリ又はハードディスクなどの記憶媒体を含み得る。例えば、前述した記憶部107は、メモリ903及びストレージ905の少なくともいずれか、もしくは、双方の組み合わせにより実現され得る。
操作デバイス907は、ユーザが所望の操作を行うための入力信号を生成する機能を有する。操作デバイス907は、例えば、タッチパネルとして構成され得る。また、他の一例として、操作デバイス907は、例えばボタン、スイッチ、及びキーボードなどユーザが情報を入力するための入力部と、ユーザによる入力に基づいて入力信号を生成し、プロセッサ901に供給する入力制御回路などから構成されてよい。
報知デバイス909は、出力デバイスの一例であり、例えば、液晶ディスプレイ(LCD:Liquid Crystal Display)装置、有機EL(OLED:Organic Light Emitting Diode)ディスプレイなどのデバイスであってよい。この場合には、報知デバイス909は、画面を表示することにより、ユーザに対して所定の情報を報知することができる。
なお、上記に示した報知デバイス909の例はあくまで一例であり、ユーザに対して所定の情報を報知可能であれば、報知デバイス909の態様は特に限定されない。具体的な一例として、報知デバイス909は、LED(Light Emitting Diode)のように、点灯又は点滅のパターンにより、所定の情報をユーザに報知するデバイスであってもよい。また、報知デバイス909は、所謂バイブレータのように、振動することで、所定の情報をユーザに報知するデバイスであってもよい。
音響デバイス911は、スピーカー等のように、所定の音響信号を出力することで、所定の情報をユーザに報知するデバイスである。
集音デバイス913は、マイクロフォン等のような、ユーザから発せられた音声や周囲の環境の音響を集音し、音響情報(音響信号)として取得するためのデバイスである。また、集音デバイス913は、集音された音声や音響を示すアナログの音響信号を示すデータを音響情報として取得してもよいし、当該アナログの音響信号をデジタルの音響信号に変換し、変換後のデジタルの音響信号を示すデータを音響情報として取得してもよい。なお、前述した集音部301は、集音デバイス913により実現され得る。
通信デバイス915は、情報処理装置10が備える通信手段であり、ネットワークを介して外部装置と通信する。通信デバイス915は、有線または無線用の通信インタフェースである。通信デバイス915を、無線通信インタフェースとして構成する場合には、当該通信デバイス915は、通信アンテナ、RF(Radio Frequency)回路、ベースバンドプロセッサなどを含んでもよい。
通信デバイス915は、外部装置から受信した信号に各種の信号処理を行う機能を有し、受信したアナログ信号から生成したデジタル信号をプロセッサ901に供給することが可能である。
バス917は、プロセッサ901、メモリ903、ストレージ905、操作デバイス907、報知デバイス909、音響デバイス911、集音デバイス913、及び通信デバイス915を相互に接続する。バス917は、複数の種類のバスを含んでもよい。
また、コンピュータに内蔵されるプロセッサ、メモリ、及びストレージなどのハードウェアを、上記した情報処理装置10が有する構成と同等の機能を発揮させるためのプログラムも作成可能である。また、当該プログラムを記録した、コンピュータに読み取り可能な記憶媒体も提供され得る。
<<5.むすび>>
以上、説明したように、本実施形態に係る情報処理システム1では、集音部301の位置及び向きのうち少なくともいずれかを所定のパターンで変化させる(例えば、所定の軌道に沿って移動させる)ことで、当該集音部301により少なくとも1以上の音源からの音響を集音する。そして、情報処理装置10は、集音部301により集音された音響に基づく音響信号の周波数が、当該集音部301の位置及び向きの変化に伴うドップラー効果の影響により変化する特性を利用することで、集音された音響の音源の方向を推定する。
このような構成により、本実施形態に係る情報処理システム1は、周囲に音源が複数存在するような状況下においても、少なくとも1つの集音部301を設けることで、当該複数の音源それぞれの方向を、より高い分解能で推定することが可能となる。即ち、本実施形態に係る情報処理システム1に依れば、集音部301の数の低減と、音源の方向の推定における分解能の向上とを両立することが可能となる。また、本実施形態に係る情報処理システム1では、集音部301の数をより少なくすることが可能なため、各種コストを低減することが可能となり、重量もより軽くすることが可能となる。
以上、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、本開示の技術的範囲はかかる例に限定されない。本開示の技術分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。
また、本明細書に記載された効果は、あくまで説明的または例示的なものであって限定的ではない。つまり、本開示に係る技術は、上記の効果とともに、または上記の効果に代えて、本明細書の記載から当業者には明らかな他の効果を奏しうる。
なお、以下のような構成も本開示の技術的範囲に属する。
(1)
位置及び向きのうち少なくともいずれかを示す位置情報が所定のパターンで変化する集音部による、1以上の音源それぞれからの音響の集音結果を取得する取得部と、
前記集音部の前記位置情報の変化に伴う、当該集音部に集音される音響の周波数変化に基づき、前記1以上の音源それぞれの方向を推定する推定部と、
を備える、情報処理装置。
(2)
前記集音部の前記位置情報を前記所定のパターンで変化させる駆動部の動作を制御する駆動制御部を備える、前記(1)に記載の情報処理装置。
(3)
前記駆動制御部は、前記集音部の前記位置情報が、略円形状の所定の軌道に沿って変化するように前記駆動部の動作を制御する、前記(2)に記載の情報処理装置。
(4)
前記推定部は、前記集音部により集音される音響のスペクトルの時間方向の変化と当該スペクトルの周波数方向の変化との比と、前記集音部の前記位置情報の変化と、に基づき、前記1以上の音源それぞれの方向を推定する、前記(1)〜(3)のいずれか一項に記載の情報処理装置。
(5)
前記1以上の音源それぞれの方向の推定結果に基づき、少なくともいずれかの方向から到来し集音される音響の振幅を制御する、音響制御部を備える、前記(1)〜(4)のいずれか一項に記載の情報処理装置。
(6)
前記取得部は、複数の前記集音部それぞれによる音響の集音結果を取得し、
前記推定部は、複数の前記集音部それぞれの移動に伴う、当該複数の集音部それぞれにより集音される音響の前記周波数変化に基づき、前記1以上の音源それぞれの方向を推定する、
前記(1)〜(5)のいずれか一項に記載の情報処理装置。
(7)
前記集音部は、前記位置情報が所定の移動体に対して相対的に前記所定のパターンで変化するように、当該移動体に支持され、
前記推定部は、前記所定の移動体の位置及び向きのうち少なくともいずれかの変化と、当該所定の移動体に対する前記集音部の相対的な前記位置情報の変化と、に伴う、前記音響の前記周波数変化に基づき、前記1以上の音源それぞれの方向を推定する、
前記(1)〜(6)のいずれか一項に記載の情報処理装置。
(8)
前記所定の移動体は、車両である、前記(7)に記載の情報処理装置。
(9)
前記集音部は、所定の駆動体に対して保持され、当該駆動体が駆動することで、前記位置情報が前記所定のパターンで変化する、前記(1)〜(6)のいずれか一項に記載の情報処理装置。
(10)
前記駆動体は、回転体であり、
前記集音部は、前記回転体が回転することで、前記位置情報が略円形状の所定の軌道に沿って変化する、
前記(9)に記載の情報処理装置。
(11)
前記回転体は、所定の天井面または壁面に設置されるファンの回転翼である、前記(10)に記載の情報処理装置。
(12)
前記音源は、音響を発する他の移動体であり、
前記推定部は、前記他の移動体の方向を、前記集音部により集音される音響の前記周波数変化に基づき推定する、前記(1)〜(6)のいずれか一項に記載の情報処理装置。
(13)
前記推定部は、取得された前記他の移動体の位置の推定結果を、前記集音部により集音される音響の前記周波数変化に基づく当該他の移動体の方向の推定結果に基づき補正する、前記(12)に記載の情報処理装置。
(14)
前記取得部は、撮像部により撮像された画像を取得し、
前記推定部は、取得された前記画像の解析結果と、前記集音部により集音される音響の前記周波数変化と、に基づき、前記1以上の音源それぞれの方向を推定する、前記(1)〜(13)のいずれか一項に記載の情報処理装置。
(15)
位置及び向きのうち少なくともいずれかを示す位置情報が所定のパターンで変化する集音部による、1以上の音源それぞれからの音響の集音結果を取得することと、
プロセッサが、前記集音部の前記位置情報の変化に伴う、当該集音部に集音される音響の周波数変化に基づき、前記1以上の音源それぞれの方向を推定することと、
を含む、情報処理方法。
(16)
コンピュータに、
位置及び向きのうち少なくともいずれかを示す位置情報が所定のパターンで変化する集音部による、1以上の音源それぞれからの音響の集音結果を取得することと、
前記集音部の前記位置情報の変化に伴う、当該集音部に集音される音響の周波数変化に基づき、前記1以上の音源それぞれの方向を推定することと、
を実行させる、プログラム。
1 情報処理システム
10 情報処理装置
101 解析部
103 駆動制御部
105 処理実行部
107 記憶部
30 集音ユニット
301 集音部
303 支持部
305 駆動部

Claims (17)

  1. 位置及び向きのうち少なくともいずれかを示す位置情報が変化する集音部による、1以上の音源それぞれからの音響の集音結果を取得する取得部と、
    前記集音部の前記位置情報の変化に伴う、当該集音部に集音される音響の周波数変化に基づき、前記1以上の音源それぞれの方向を推定する推定部と、
    を備える、情報処理装置。
  2. 前記集音部は、前記位置情報が所定のパターンで変化する、請求項1に記載の情報処理装置。
  3. 前記集音部の前記位置情報を前記所定のパターンで変化させる駆動部の動作を制御する駆動制御部を備える、請求項2に記載の情報処理装置。
  4. 前記駆動制御部は、前記集音部の前記位置情報が、略円形状の所定の軌道に沿って変化するように前記駆動部の動作を制御する、請求項3に記載の情報処理装置。
  5. 前記推定部は、前記集音部により集音される音響のスペクトルの時間方向の変化と当該スペクトルの周波数方向の変化との比と、前記集音部の前記位置情報の変化と、に基づき、前記1以上の音源それぞれの方向を推定する、請求項1に記載の情報処理装置。
  6. 前記1以上の音源それぞれの方向の推定結果に基づき、少なくともいずれかの方向から到来し集音される音響の振幅を制御する、音響制御部を備える、請求項1に記載の情報処理装置。
  7. 前記取得部は、複数の前記集音部それぞれによる音響の集音結果を取得し、
    前記推定部は、複数の前記集音部それぞれの移動に伴う、当該複数の集音部それぞれにより集音される音響の前記周波数変化に基づき、前記1以上の音源それぞれの方向を推定する、
    請求項1に記載の情報処理装置。
  8. 前記集音部は、前記位置情報が所定の移動体に対して相対的に前記所定のパターンで変化するように、当該移動体に支持され、
    前記推定部は、前記所定の移動体の位置及び向きのうち少なくともいずれかの変化と、当該所定の移動体に対する前記集音部の相対的な前記位置情報の変化と、に伴う、前記音響の前記周波数変化に基づき、前記1以上の音源それぞれの方向を推定する、
    請求項1に記載の情報処理装置。
  9. 前記所定の移動体は、車両である、請求項8に記載の情報処理装置。
  10. 前記集音部は、所定の駆動体に対して保持され、当該駆動体が駆動することで、前記位置情報が前記所定のパターンで変化する、請求項1に記載の情報処理装置。
  11. 前記駆動体は、回転体であり、
    前記集音部は、前記回転体が回転することで、前記位置情報が略円形状の所定の軌道に沿って変化する、
    請求項10に記載の情報処理装置。
  12. 前記回転体は、所定の天井面または壁面に設置されるファンの回転翼である、請求項11に記載の情報処理装置。
  13. 前記音源は、音響を発する他の移動体であり、
    前記推定部は、前記他の移動体の方向を、前記集音部により集音される音響の前記周波数変化に基づき推定する、請求項1に記載の情報処理装置。
  14. 前記推定部は、取得された前記他の移動体の位置の推定結果を、前記集音部により集音される音響の前記周波数変化に基づく当該他の移動体の方向の推定結果に基づき補正する、請求項13に記載の情報処理装置。
  15. 前記取得部は、撮像部により撮像された画像を取得し、
    前記推定部は、取得された前記画像の解析結果と、前記集音部により集音される音響の前記周波数変化と、に基づき、前記1以上の音源それぞれの方向を推定する、請求項1に記載の情報処理装置。
  16. 位置及び向きのうち少なくともいずれかを示す位置情報が変化する集音部による、1以上の音源それぞれからの音響の集音結果を取得することと、
    プロセッサが、前記集音部の前記位置情報の変化に伴う、当該集音部に集音される音響の周波数変化に基づき、前記1以上の音源それぞれの方向を推定することと、
    を含む、情報処理方法。
  17. コンピュータに、
    位置及び向きのうち少なくともいずれかを示す位置情報が変化する集音部による、1以上の音源それぞれからの音響の集音結果を取得することと、
    前記集音部の前記位置情報の変化に伴う、当該集音部に集音される音響の周波数変化に基づき、前記1以上の音源それぞれの方向を推定することと、
    を実行させる、プログラム。
JP2017551757A 2015-11-17 2016-09-28 情報処理装置、情報処理方法、及びプログラム Active JP6747451B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2015224659 2015-11-17
JP2015224659 2015-11-17
PCT/JP2016/078682 WO2017086030A1 (ja) 2015-11-17 2016-09-28 情報処理装置、情報処理方法、及びプログラム

Publications (2)

Publication Number Publication Date
JPWO2017086030A1 true JPWO2017086030A1 (ja) 2018-09-06
JP6747451B2 JP6747451B2 (ja) 2020-08-26

Family

ID=58718713

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017551757A Active JP6747451B2 (ja) 2015-11-17 2016-09-28 情報処理装置、情報処理方法、及びプログラム

Country Status (5)

Country Link
US (1) US11067661B2 (ja)
EP (1) EP3379844A4 (ja)
JP (1) JP6747451B2 (ja)
CN (1) CN108293161A (ja)
WO (1) WO2017086030A1 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108597525B (zh) * 2018-04-25 2019-05-03 四川远鉴科技有限公司 语音声纹建模方法及装置
KR102607863B1 (ko) * 2018-12-03 2023-12-01 삼성전자주식회사 음원 분리 장치 및 음원 분리 방법
DE102018222862A1 (de) * 2018-12-21 2020-06-25 Robert Bosch Gmbh Verfahren und System zur Lokalisierung einer Akustikquelle relativ zu einem Fahrzeug
JP7120077B2 (ja) 2019-02-27 2022-08-17 トヨタ自動車株式会社 運転支援システム
CN110010126B (zh) * 2019-03-11 2021-10-08 百度国际科技(深圳)有限公司 语音识别方法、装置、设备和存储介质
WO2020230377A1 (ja) * 2019-05-15 2020-11-19 パナソニックIpマネジメント株式会社 情報処理方法、無人飛行体及び無人飛行体制御システム
CN110164443B (zh) * 2019-06-28 2021-09-14 联想(北京)有限公司 用于电子设备的语音处理方法、装置以及电子设备
GB2587335A (en) * 2019-09-17 2021-03-31 Nokia Technologies Oy Direction estimation enhancement for parametric spatial audio capture using broadband estimates
CN110567577A (zh) * 2019-10-15 2019-12-13 合肥工业大学 一种消除旋转声源多普勒效应的方法
NL2033911B1 (en) * 2023-01-05 2024-07-16 Stichting Radboud Univ Biomimetic microphone

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005277832A (ja) * 2004-03-25 2005-10-06 Matsushita Electric Ind Co Ltd 音声記録装置
WO2006054599A1 (ja) * 2004-11-16 2006-05-26 Nihon University 音源方向判定装置及び方法
JP2012129873A (ja) * 2010-12-16 2012-07-05 Chubu Electric Power Co Inc 指定領域からの伝播音の再生方法とその装置

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4368798B2 (ja) * 2002-08-30 2009-11-18 日東紡音響エンジニアリング株式会社 音源探査システム
DE102008029352A1 (de) * 2008-06-20 2009-12-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung, Verfahren und Computerprogramm zum Lokalisieren einer Schallquelle
US9557400B2 (en) * 2009-04-24 2017-01-31 Wayne State University 3D soundscaping
JP5493611B2 (ja) 2009-09-09 2014-05-14 ソニー株式会社 情報処理装置、情報処理方法およびプログラム
JP5702160B2 (ja) * 2011-01-20 2015-04-15 中部電力株式会社 音源推定方法及び音源推定装置
JP5602653B2 (ja) * 2011-01-31 2014-10-08 インターナショナル・ビジネス・マシーンズ・コーポレーション 情報処理装置、情報処理方法、情報処理システム、およびプログラム
US9357293B2 (en) * 2012-05-16 2016-05-31 Siemens Aktiengesellschaft Methods and systems for Doppler recognition aided method (DREAM) for source localization and separation
US9197930B2 (en) * 2013-03-15 2015-11-24 The Nielsen Company (Us), Llc Methods and apparatus to detect spillover in an audience monitoring system
CN104376849A (zh) * 2013-08-14 2015-02-25 Abb技术有限公司 区分声音的系统和方法及状态监控系统和移动电话机
CN104360308B (zh) * 2014-11-28 2017-03-01 北京智谷睿拓技术服务有限公司 移动声源信息确定方法及确定装置、用户设备

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005277832A (ja) * 2004-03-25 2005-10-06 Matsushita Electric Ind Co Ltd 音声記録装置
WO2006054599A1 (ja) * 2004-11-16 2006-05-26 Nihon University 音源方向判定装置及び方法
JP2012129873A (ja) * 2010-12-16 2012-07-05 Chubu Electric Power Co Inc 指定領域からの伝播音の再生方法とその装置

Also Published As

Publication number Publication date
EP3379844A4 (en) 2018-11-14
US20180332385A1 (en) 2018-11-15
US11067661B2 (en) 2021-07-20
WO2017086030A1 (ja) 2017-05-26
JP6747451B2 (ja) 2020-08-26
EP3379844A1 (en) 2018-09-26
CN108293161A (zh) 2018-07-17

Similar Documents

Publication Publication Date Title
WO2017086030A1 (ja) 情報処理装置、情報処理方法、及びプログラム
CN106123897B (zh) 基于多特征的室内融合定位方法
US9360546B2 (en) Systems, methods, and apparatus for indicating direction of arrival
JP6109927B2 (ja) 源信号分離のためのシステム及び方法
CN105979442B (zh) 噪声抑制方法、装置和可移动设备
CN110875060A (zh) 语音信号处理方法、装置、系统、设备和存储介质
CN113281706B (zh) 一种目标定位方法、装置及计算机可读存储介质
JP2018536304A (ja) レーザ・マルチ・ビームを利用した自己混合
JP2019505047A (ja) ドローン飛行制御
US20180233129A1 (en) Enhanced automatic speech recognition
JP2017530580A (ja) 平面センサーアレイ
US11454694B2 (en) Wave source direction estimation apparatus, wave source direction estimation system, wave source direction estimation method, and wave source direction estimation program
Liu et al. Vernier: Accurate and fast acoustic motion tracking using mobile devices
CN108627801A (zh) 移动体位置估计系统、装置和方法
JP2017211348A (ja) 軌跡推定装置、軌跡推定方法及びプログラム
US20190250240A1 (en) Correlation function generation device, correlation function generation method, correlation function generation program, and wave source direction estimation device
CN103257338B (zh) 一种室内定位的方法及系统
Zhao et al. Design and evaluation of a prototype system for real-time monitoring of vehicle honking
Ruan et al. Making sense of doppler effect for multi-modal hand motion detection
Wu et al. HDSpeed: Hybrid detection of vehicle speed via acoustic sensing on smartphones
Mattos et al. Passive sonar applications: target tracking and navigation of an autonomous robot
US20200265215A1 (en) System architecture and method of authenticating a user
CN108594163A (zh) 用单个传声器移动结合内积运算识别声源的方法
Ogiso et al. Infrastructure-less Localization from Indoor Environmental Sounds Based on Spectral Decomposition and Spatial Likelihood Model
Cevher A Bayesian framework for target tracking using acoustic and image measurements

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20190208

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20190214

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20190222

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20190515

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20190522

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190919

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190919

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200707

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200720

R151 Written notification of patent or utility model registration

Ref document number: 6747451

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151