JP6289936B2 - 音源方向推定装置、音源方向推定方法およびプログラム - Google Patents

音源方向推定装置、音源方向推定方法およびプログラム Download PDF

Info

Publication number
JP6289936B2
JP6289936B2 JP2014036032A JP2014036032A JP6289936B2 JP 6289936 B2 JP6289936 B2 JP 6289936B2 JP 2014036032 A JP2014036032 A JP 2014036032A JP 2014036032 A JP2014036032 A JP 2014036032A JP 6289936 B2 JP6289936 B2 JP 6289936B2
Authority
JP
Japan
Prior art keywords
phase difference
score
acoustic signal
sound source
difference distribution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014036032A
Other languages
English (en)
Other versions
JP2015161551A (ja
Inventor
寧 丁
寧 丁
祐介 木田
祐介 木田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2014036032A priority Critical patent/JP6289936B2/ja
Priority to CN201510086405.6A priority patent/CN104865550A/zh
Priority to US14/629,784 priority patent/US9473849B2/en
Publication of JP2015161551A publication Critical patent/JP2015161551A/ja
Application granted granted Critical
Publication of JP6289936B2 publication Critical patent/JP6289936B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S3/00Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received
    • G01S3/80Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received using ultrasonic, sonic or infrasonic waves
    • G01S3/802Systems for determining direction or deviation from predetermined direction
    • G01S3/808Systems for determining direction or deviation from predetermined direction using transducers spaced apart and measuring phase or time difference between signals therefrom, i.e. path-difference systems
    • G01S3/8083Systems for determining direction or deviation from predetermined direction using transducers spaced apart and measuring phase or time difference between signals therefrom, i.e. path-difference systems determining direction of source
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/40Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
    • H04R1/406Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/20Processing of the output signals of the acoustic transducers of an array for obtaining a desired directivity characteristic
    • H04R2430/23Direction finding using a sum-delay beam-former

Description

本発明の実施の形態は、音源方向推定装置、音源方向推定方法およびプログラムに関する。
音源とマイクとの距離に依存せずに音源の方向を精度よく推定する技術として、複数チャンネルの音響信号から生成される位相差分布を用いる技術がある。位相差分布は、複数チャンネルの音響信号の周波数ごとの位相差を表す分布であり、複数チャンネルの音響信号を収音するマイク間の距離に応じて、音源の方向に依存した特定のパターンを持つ。このパターンは、複数チャンネルの音響信号の音圧レベル差が小さくても変わらないため、音源がマイクから離れた位置にあり、複数チャンネルの音響信号の音圧レベル差が小さい場合であっても、位相差分布を用いることで音源の方向を精度よく推定できる。
しかし、位相差分布を用いて音源の方向を推定する従来の技術では、位相差分布から方向を求める処理に要する計算量が多く、計算能力の低い機器では音源の方向をリアルタイムに推定できない。このため、位相差分布を用いた音源方向の推定を少ない計算量で行うことが求められている。
特開2003−337164号公報 特開2006−267444号公報 特開2008−079255号公報
本発明が解決しようとする課題は、位相差分布を用いた音源方向の推定を少ない計算量で行うことができる音源方向推定装置、音源方向推定方法およびプログラムを提供することである。
実施形態の音源方向推定装置は、取得部と、生成部と、スコア計算部と、推定部と、を備える。取得部は、複数のマイクから複数チャンネルの音響信号を取得する。生成部は、前記複数チャンネルの音響信号の位相差を予め定めた周波数ビンごとに計算して、前記音響信号に対応する位相差分布を生成する。スコア計算部は、量子化された前記音響信号に対応する位相差分布を、所定の角度分解能に応じて定められた複数の方向ごとに予め生成された複数のテンプレートであって、各テンプレートが該テンプレートに対応する方向の位相差分布を前記量子化部と同じ方法で量子化することで生成された前記複数のテンプレートの各々と比較して、量子化された前記音響信号に対応する位相差分布と前記テンプレートとの相似性に応じたスコアを、前記複数の方向ごとに計算する。推定部は、前記複数の方向のうち前記スコアが大きい方向を、前記音響信号の音源の方向として推定する。
第1実施形態の音源方向推定装置の機能的な構成例を示すブロック図。 位相差分布の一例を示す図。 量子化された位相差分布の一例を示す図。 テンプレートに用いる方向ごとの位相差分布の一例を示す図。 方向ごとの位相差分布を量子化することで生成されたテンプレートの一例を示す図。 方向ごとに算出されたスコアの一例を示す図。 第1実施形態の音源方向推定装置による処理手順の一例を示すフローチャート。 第2実施形態の音源方向推定装置の機能的な構成例を示すブロック図。 第2実施形態の音源方向推定装置による処理手順の一例を示すフローチャート。 第3実施形態の音源方向推定装置の機能的な構成例を示すブロック図。 第3実施形態の音源方向推定装置による処理手順の一例を示すフローチャート。 第4実施形態の音源方向推定装置の機能的な構成例を示すブロック図。 スコア波形の一例を示す図。 第4実施形態の音源方向推定装置による処理手順の一例を示すフローチャート。 第5実施形態の音源方向推定装置の機能的な構成例を示すブロック図。 スコア波形の一例を示す図。 第5実施形態の音源方向推定装置による処理手順の一例を示すフローチャート。 音源の方向を区別できない例を説明する図。 変形例におけるマイクの配置の一例を示す図。 スコアから変換された全方位スコアの一例を示す図。 スコアから変換された全方位スコアの一例を示す図。 スコアから変換された全方位スコアの一例を示す図。 全方位スコアを統合した統合スコアの一例を示す図。
[第1実施形態]
図1は、第1実施形態の音源方向推定装置の機能的な構成例を示すブロック図である。本実施形態の音源方向推定装置は、図1に示すように、取得部11と、生成部12と、比較部13と、記憶部14と、推定部15と、出力部16と、を備える。
取得部11は、マイクアレイを構成する複数のマイクから複数チャンネルの音響信号を取得する。本実施形態では、図1に示すように、2つのマイクM1,M2から2つのチャンネルの音響信号を取得するものとする。マイクアレイを構成する2つのマイクM1,M2は相対的な位置関係が固定であり、マイク間距離が変動することはない。音響信号は、例えば音源が人間(話者)である場合、話者の発話などの音声信号である。
生成部12は、取得部11により取得された複数チャンネルの音響信号の位相差を予め定めた周波数ビンごとに計算して位相差分布を生成する。
具体的には、生成部12は、取得部11により取得された2つのチャンネルの音響信号のそれぞれを、例えば高速フーリエ変換(FFT:Fast Fourier Transform)により時間領域の信号から周波数領域の信号に変換する。そして、生成部12は、2つのチャンネルの信号周波数ごとの位相差φ(ω)を下記式(1)により計算して、位相差分布を生成する。
Figure 0006289936
なお、ωは周波数であり、X(ω)は2つのチャンネルのうち一方の周波数帯域の信号、X(ω)は2つのチャンネルのうち他方の周波数帯域の信号である。計算した位相差の周期は2πであり、本実施形態では位相差の範囲を−πからπの間の範囲としている。なお、位相差の範囲としては、例えば0から2πの間の範囲などの他の範囲を設定してもよい。
位相差分布の一例を図2示す。本実施形態では、1kHzから8kHzまでの1kHzごとに周波数ビンが定められているものとする。生成部12は、これら予め定められた周波数ビンごとに2つのチャンネルの音響信号の位相差を計算して、例えば図2に示すような位相差分布を生成する。
比較部13は、生成部12が生成した位相差分布を、予め方向ごとに生成されたテンプレートと比較して、両者の相似性に応じたスコアを方向ごとに計算する。相似性の計算は、例えば両者の距離を利用すればよい。本実施形態では、比較部13は、量子化された位相差分布を画像として扱い、テンプレートとの重なり度合いに応じたスコアを計算する。このため、比較部13は、量子化部131とスコア計算部132とを含む構成とされる。
量子化部131は、生成部12が生成した位相差分布を量子化する。量子化された位相差分布q(ω,n)は、下記式(2)で表される。
Figure 0006289936
なお、αは量子化係数であり、nは量子化された周波数ビンごとの位相差の値を示すインデックスである。量子化係数αは、必要な解像度に応じて設定すればよく、本実施形態では量子化係数αをπ/5に設定した。この場合、インデックスnは、π/5単位に量子化された位相差の値を示す。
量子化された位相差分布の一例を図3に示す。量子化部131は、生成部12が生成した位相差分布を量子化して、例えば図3に示すような量子化された位相差分布を生成する。
スコア計算部132は、量子化された位相差分布を、予め方向ごとに生成されたテンプレートと比較し、両者が重なる周波数ビンの数、つまり、位相差分布とテンプレートとで量子化された位相差が一致する周波数ビンの数を、そのテンプレートに対応する方向に対するスコアとして計算する。
ここで、方向ごとのスコア計算に用いるテンプレートについて説明する。テンプレートは、既知のマイク間距離を用いて予め計算された方向ごとの位相差分布を、量子化部131と同じ方法(例えば量子化係数が共通)で予め量子化することにより生成される。テンプレートに用いる方向ごとの位相差分布Φ(ω,θ)は、下記式(3)の計算式によって求められる。
Figure 0006289936
なお、dはマイクアレイを構成する2つのマイクM1,M2のマイク間距離、cは音速、θは2つのマイクM1,M2の位置を結ぶ直線に対して、位相差分布を計算する方向がなす角度(deg.)である。以下、この角度を方向角度という。テンプレートを予め生成しておく方向角度は、方向推定の対象となる角度範囲内で、必要な角度分解能に応じて定めればよい。
テンプレートに用いる方向ごとの位相差分布の一例を図4に示す。本実施形態では、方向角度が−90度から90度の角度範囲内で1度ごとにテンプレートを予め生成しておくものとする。図4に示す例は、マイク間距離dが0.2mの場合に、−90度から90度の角度範囲内で1度ごとに計算された位相差分布を示すものであるが、便宜上、方向角度θが−60度、30度、90度のみの位相差分布、すなわち、これらの方向角度θにおける周波数ビンごとの位相差の値(−πからπの間の値)を示している。
以上のように計算された方向ごとの位相差分布は、量子化部131と同じ方法で量子化され、方向ごとのテンプレートとして、音源方向推定装置の内部または外部に設けられた記憶部14に格納される。方向ごとの位相差分布を量子化することで生成されるテンプレートQ(ω,θ,n)は、下記式(4)で表される。
Figure 0006289936
なお、量子化係数αは、量子化部131で設定される量子化係数αと同じ値が設定され、本実施形態ではπ/5に設定される。
図4に示した方向ごとの位相差分布を量子化することで生成されたテンプレートの一例を図5に示す。図5(a)は、方向角度θが−60度の方向に対応するテンプレートの一例を示し、図5(b)は、方向角度θが30度の方向に対応するテンプレートの一例を示し、図5(c)は、方向角度θが90度の方向に対応するテンプレートの一例を示している。
なお、本実施形態では、図5に例示するように、方向ごとの位相差分布を量子化したものをテンプレートとして記憶部14に格納しているが、これに限らない。例えば、図4に例示したように、方向ごとの位相差分布をテンプレートとして記憶部14に格納しておき、生成部12が生成した位相差分布を量子化部131により量子化することと併せて、記憶部14にテンプレートとして格納した方向ごとの位相差分布を、それぞれ量子化部131により量子化する構成としてもよい。
スコア計算部132は、記憶部14が記憶する方向ごとのテンプレートを1つずつ順次読み出して、量子化部131により量子化された位相差分布を、記憶部14から読み出したテンプレートと比較する処理を繰り返すことにより、方向ごとのスコアを計算する。具体的には、スコア計算部132は、量子化部131により量子化された位相差分布と比較対象となるテンプレートとで位相差が一致する周波数ビンの数を、そのテンプレートに対応する方向(方向角度θ)のスコアとして計算する。方向ごとのスコアν(θ)は、下記式(5)の計算式によって求められる。
Figure 0006289936
本実施形態では、方向ごとのスコアν(θ)は、量子化された位相差分布がテンプレートと一致する周波数ビンに平等の部分スコアを与え、この部分スコアを積み立てることで求められる。図3に示した量子化された位相差分布を図5に示したテンプレートと比較することで求められる方向ごとのスコアの一例を図6に示す。図6では、方向ごとのスコアを方向角度順に並べて補間した波形(以下、スコア波形という。)として表しており、方向角度が−60度の方向のスコアは1(ν(−60)=1)であり、方向角度が30度の方向のスコアは5(ν(30)=5)であり、方向角度が30度の方向のスコアは1(ν(90)=1)である。
推定部15は、生成部12が生成した位相差分布とテンプレートとの相似性が高い方向、つまりスコア計算部132によって計算されたスコアが高い方向を、音源の方向として推定する。推定部15が推定する音源の方向は、下記式(6)で表される。
Figure 0006289936
出力部16は、推定部15が推定した音源の方向を外部に出力する。
図7は、第1実施形態の音源方向推定装置による処理手順の一例を示すフローチャートである。以下、この図7のフローチャートに沿って、第1実施形態の音源方向推定装置の動作概要を説明する。
図7に示す処理が開始されると、取得部11が、2つのマイクM1,M2から2つのチャンネルの音響信号を取得する(ステップS101)。
次に、生成部12が、ステップS101で取得された2つのチャンネルの音響信号の位相差を周波数ビンごとに計算して、位相差分布を生成する(ステップS102)。
次に、量子化部131が、ステップS102で生成された位相差分布を量子化し、量子化された位相差分布を生成する(ステップS103)。
次に、スコア計算部132が、比較対象とするテンプレートを記憶部14から1つ読み出す(ステップS104)。そして、スコア計算部132は、ステップS103で生成された量子化された位相差分布を、ステップS104で記憶部14から読み出したテンプレートと比較して、量子化された位相差が一致する周波数ビンの数を、当該テンプレートに対応する方向に対するスコアとして計算する(ステップS105)。
その後、スコア計算部132は、記憶部14に記憶されたすべてのテンプレートを比較対象としてステップS105の処理を行ったか否かを判定し(ステップS106)、比較対象とされていないテンプレートがあれば(ステップS106:No)、ステップS104に戻って処理を繰り返す。
一方、記憶部14に記憶されたすべてのテンプレートを比較対象としてステップS105の処理を行っていれば(ステップS106:Yes)、推定部15が、ステップS105で計算されたスコアのうち、最も高いスコアが得られた方向を音源の方向として推定する(ステップS107)。そして、出力部16が、ステップS107で推定された音源の方向を、音源方向推定装置の外部に出力し(ステップS108)、一連の処理を終了する。
以上、具体的な例を挙げながら説明したように、本実施形態の音源方向推定装置は、複数のマイクM1,M2から取得された複数チャンネルの音響信号の位相差分布を、予め方向ごとに生成されたテンプレートと比較し、両者の相似性に応じたスコアを方向ごとに計算して、スコアに基づいて音源の方向を推定する。したがって、本実施形態の音源方向推定装置によれば、位相差分布を用いた音源方向の推定を少ない計算量で行うことができ、計算に用いるハードウェア資源が低スペックであっても、精度のよい音源方向の推定をリアルタイムに行うことができる。
特に、本実施形態の音源方向推定装置は、複数チャンネルの音響信号の位相差分布を量子化して方向ごとのテンプレートと比較し、量子化された位相差が一致する周波数ビンの数を、比較対象のテンプレートに対応する方向のスコアとして計算する。このため、スコア計算に要する計算量はきわめて少ない。
[第2実施形態]
次に、第2実施形態について説明する。上述した第1実施形態では、量子化された位相差分布がテンプレートと一致する周波数ビンに平等の部分スコアを与えて、この部分スコアを積み立てることで、方向ごとのスコアを計算している。しかし、マイクM1,M2の性能や雑音、残響などの影響で、位相差分布に外れ値が発生することがあり、この外れ値が、音源方向の推定に悪影響を与える虞がある。そこで、本実施形態では、周波数ビンごとに加算スコアを設定し、量子化された位相差分布がテンプレートと一致する周波数ビンの各々に設定された加算スコアの和を、比較対象のテンプレートに対応する方向のスコアとして計算する構成とし、外れ値の影響を抑制する。
以下、第1実施形態と共通の構成要素については図中同一の符号を付して重複した説明を適宜省略しながら、本実施形態に特徴的な部分を説明する。
図8は、第2実施形態の音源方向推定装置の機能的な構成例を示すブロック図である。本実施形態の音源方向推定装置は、図8に示すように、第1実施形態の比較部13に代えて、比較部21を備える。その他の構成は第1実施形態と同様である。比較部21は、第1実施形態と同様の量子化部131と、設定部211と、スコア計算部212とを含む。
設定部211は、取得部11が取得した2つのチャンネルの音響信号に基づいて、生成部12が位相差を計算した周波数ビンごとに、加算スコアを設定する。加算スコアは、その周波数ビンの位相差が外れ値である可能性が低いほど高い値となるように設定する。
具体的には、例えば、各周波数ビンにおける音響信号の対数パワーの大きさに応じた値、例えば対数パワーの値そのもの、あるいは対数パワーの値に比例した値を、各周波数ビンの加算スコアとして設定することができる。また、各周波数ビンにおける音響信号の信号雑音比(S/N比)の大きさに応じた値、例えばS/N比の値そのもの、あるいはS/N比に比例した値を、各周波数ビンの加算スコアとして設定するようにしてもよい。
スコア計算部212は、第1実施形態のスコア計算部132と同様に、記憶部14が記憶する方向ごとのテンプレートを1つずつ順次読み出して、量子化部131により量子化された位相差分布を、記憶部14から読み出したテンプレートと比較する処理を繰り返すことにより、方向ごとのスコアを計算する。ただし、本実施形態のスコア計算部212は、量子化部131により量子化された位相差分布と比較対象となるテンプレートとで位相差が一致する周波数ビンの各々に対して設定部211により設定された加算スコアの和を、そのテンプレートに対応する方向のスコアとして計算する。
図9は、第2実施形態の音源方向推定装置による処理手順の一例を示すフローチャートである。以下、この図9のフローチャートに沿って、第2実施形態の音源方向推定装置の動作概要を説明する。
図9のステップS201からステップS203までの処理は、図7に示したステップS101からステップS103までの処理と同様であるため説明を省略する。
本実施形態では、ステップS203で量子化された位相差分布が生成されると、次に、設定部211が、ステップS201で取得された音響信号に基づいて、周波数ビンごとの加算スコアを設定する(ステップS204)。なお、このステップS204の処理は、ステップS202やステップS203の処理よりも前に行ってもよいし、これらの処理と並列で行ってもよい。
次に、スコア計算部212が、比較対象とするテンプレートを記憶部14から1つ読み出す(ステップS205)。そして、スコア計算部212は、ステップS203で生成された量子化された位相差分布を、ステップS205で記憶部14から読み出したテンプレートと比較して、量子化された位相差が一致する周波数ビンの各々に対してステップS204で設定された加算スコアの和を、当該テンプレートに対応する方向に対するスコアとして計算する(ステップS206)。
図9のステップS207からステップS209までの処理は、図7に示したステップS106からステップS108までの処理と同様であるため説明を省略する。
以上説明したように、本実施形態の音源方向推定装置は、マイクM1,M2から取得した音響信号に基づいて周波数ビンごとに加算スコアを設定し、量子化された位相差分布がテンプレートと一致する周波数ビンの各々に設定された加算スコアの和を、比較対象のテンプレートに対応する方向のスコアとして計算する。したがって、本実施形態の音源方向推定装置によれば、位相差分布の外れ値の影響を有効に抑制して、音源方向の推定を第1実施形態よりもさらに精度よく行うことができる。
[第3実施形態]
次に、第3実施形態について説明する。上述した第1実施形態では、記憶部14に記憶された方向ごとのテンプレートのすべてを、量子化された位相差分布の比較対象として順次読み出して処理を行う。しかし、予めテンプレートを作成した方向の角度分解能に対し、ユーザが要求する角度分解能が低い場合は、すべてのテンプレートを比較対象として処理を行う必要はない。そこで、本実施形態では、ユーザによる角度分解能の指定を受け付けて、指定された角度分解能に応じた数のテンプレートを選択して処理を行う構成とし、計算量のさらなる低減を図る。
以下、第1実施形態と共通の構成要素については図中同一の符号を付して重複した説明を適宜省略しながら、本実施形態に特徴的な部分を説明する。なお、以下では第1実施形態と同様の方法でスコア計算を行う例を説明するが、第2実施形態と同様の方法でスコア計算を行うようにしてもよい。
図10は、第3実施形態の音源方向推定装置の機能的な構成例を示すブロック図である。本実施形態の音源方向推定装置は、図10に示すように、第1実施形態の構成に加えて、分解能指定受付部31を備える。さらに、本実施形態の音源方向推定装置は、第1実施形態の比較部13に代えて、比較部32を備える。その他の構成は第1実施形態と同様である。比較部32は、第1実施形態と同様の量子化部131と、スコア計算部321とを含む。
分解能指定受付部31は、ユーザによる角度分解能の指定を受け付ける。この角度分解能は、音源の方向をどの程度のきめ細かさで推定するかを表し、数値により指定されるものであってもよいし、例えば5度,10度,15度,・・・といったように、予め定めた角度分解能の中から選択されてもよい。
スコア計算部321は、記憶部14が記憶する方向ごとのテンプレートのうち、ユーザにより指定された角度分解能に応じた数のテンプレートを、量子化部131により量子化された位相差分布の比較対象として選択する。例えば、方向角度が1度ごとのテンプレートが記憶部14に記憶されている場合に、ユーザにより指定された角度分解能が10度であれば、スコア計算部321は、記憶部14が記憶するテンプレートの中から方向角度が10度ごとのテンプレート、つまり1/10の数のテンプレートを比較対象として選択する。
そして、スコア計算部321は、比較対象として選択したテンプレートを1つずつ記憶部14から順次読み出して、量子化部131により量子化された位相差分布を、記憶部14から読み出したテンプレートと比較する処理を繰り返すことにより、ユーザにより指定された角度分解能に対応する方向ごとのスコアを計算する。なお、スコア計算の方法は、第1実施形態のスコア計算部132と同様である。
図11は、第3実施形態の音源方向推定装置による処理手順の一例を示すフローチャートである。以下、この図11のフローチャートに沿って、第3実施形態の音源方向推定装置の動作概要を説明する。
図11のステップS301からステップS303までの処理は、図7に示したステップS101からステップS103までの処理と同様であるため説明を省略する。
本実施形態では、ステップS303で量子化された位相差分布が生成されると、次に、分解能指定受付部31が、ユーザによる角度分解能の指定を受け付ける(ステップS304)。なお、このステップS304の処理は、ステップS301からステップS303のいずれかの処理よりも前に行ってもよいし、これらの処理と並列で行ってもよい。
次に、スコア計算部321が、記憶部14が記憶する方向ごとのテンプレートのうち、ステップS304で指定された角度分解能に応じて、比較対象とするテンプレートを選択する(ステップS305)。そして、スコア計算部321は、ステップS305で選択したテンプレートを記憶部14から1つ読み出し(ステップS306)、ステップS303で生成された量子化された位相差分布を、ステップS306で記憶部14から読み出したテンプレートと比較して、量子化された位相差が一致する周波数ビンの数を、当該テンプレートに対応する方向に対するスコアとして計算する(ステップS307)。
その後、スコア計算部321は、ステップS305で選択したすべてのテンプレートを比較対象としてステップS307の処理を行ったか否かを判定し(ステップS308)、比較対象とされていないテンプレートがあれば(ステップS308:No)、ステップS306に戻って処理を繰り返す。
一方、ステップS305で選択したすべてのテンプレートを比較対象としてステップS307の処理を行っていれば(ステップS308:Yes)、推定部15が、ステップS307で計算されたスコアのうち、最も高いスコアが得られた方向を音源の方向として推定する(ステップS309)。そして、出力部16が、ステップS309で推定された音源の方向を、音源方向推定装置の外部に出力し(ステップS310)、一連の処理を終了する。
以上説明したように、本実施形態の音源方向推定装置は、ユーザにより指定された角度分解能に応じて比較対象とするテンプレートを選択し、量子化された位相差分布を選択したテンプレートの各々と比較して、指定された角度分解能に対応する方向ごとのスコアを計算する。したがって、本実施形態の音源方向推定装置によれば、音源方向の推定に要する計算量を第1実施形態よりもさらに低減させることができる。
[第4実施形態]
次に、第4実施形態について説明する。上述した第1実施形態では、推定部15が音源の方向を推定する際に、音源の数が1つであると仮定して、比較部13での処理により最も高いスコアが得られた方向を音源の方向と推定している。しかし、実際には複数の音源から同時に音が発せられる場合もある。そこで、第4実施形態では、ユーザによる音源数の指定を受け付けて、指定された数の音源の方向を推定する構成とする。
以下、第1実施形態と共通の構成要素については図中同一の符号を付して重複した説明を適宜省略しながら、本実施形態に特徴的な部分を説明する。なお、以下では第1実施形態と同様の方法でスコア計算を行う例を説明するが、第2実施形態や第3実施形態と同様の方法でスコア計算を行うようにしてもよい。
図12は、第4実施形態の音源方向推定装置の機能的な構成例を示すブロック図である。本実施形態の音源方向推定装置は、図12に示すように、第1実施形態の構成に加えて、音源数指定受付部41を備える。さらに、本実施形態の音源方向推定装置は、第1実施形態の推定部15に代えて、推定部42を備える。その他の構成は第1実施形態と同様である。
音源数指定受付部41は、ユーザによる音源数の指定を受け付ける。この音源数指定受付部41が受け付けた、ユーザが指定する音源数は、推定部42に渡される。
推定部42は、比較部13のスコア計算部132によって計算された方向ごとのスコアを方向角度順に並べて補間したスコア波形を生成して、このスコア波形の極大値を検出する。そして、推定部42は、スコア波形から検出した極大値のうち、ユーザによって指定された音源数と同じ数の極大値をスコアが大きい順に選択し、選択した極大値に対応する方向をそれぞれ音源の方向として推定する。
図13は、推定部42が生成したスコア波形の一例を示す図である。図13に例示するスコア波形では、方向角度が−60度、−30度、60度の位置にそれぞれ極大値が存在する。ここで、ユーザによって指定された音源数が2である場合、推定部42は、これら3つの極大値のうち、スコアが大きい順に2つの極大値、つまり方向角度が60度の位置の極大値と方向角度が−30度の位置の極大値とを選択する。そして、推定部42は、これら選択した2つの極大値に対応する方向、つまり方向角度が60度の方向と方向角度が−30度の方向とを、音源の方向として推定する。
図14は、第4実施形態の音源方向推定装置による処理手順の一例を示すフローチャートである。以下、この図14のフローチャートに沿って、第4実施形態の音源方向推定装置の動作概要を説明する。
図14のステップS401からステップS403までの処理は、図7に示したステップS101からステップS103までの処理と同様であるため説明を省略する。
本実施形態では、ステップS403で量子化された位相差分布が生成されると、次に、音源数指定受付部41が、ユーザによる音源数の指定を受け付ける(ステップS404)。なお、このステップS404の処理は、ステップS401からステップS403のいずれかの処理よりも前に行ってもよいし、これらの処理と並列で行ってもよい。また、このステップS404の処理は、後述のステップS409の処理の前であれば、後述のステップS405からステップS408のいずれかの処理の後に行ってもよいし、これらの処理と並列で行ってもよい。
図14のステップS405からステップS407までの処理は、図7に示したステップS104からステップS106までの処理と同様であるため説明を省略する。
本実施形態では、ステップS407の判定で記憶部14に記憶されたすべてのテンプレートを比較対象としてステップS406の処理を行ったと判断されると(ステップS407:Yes)、推定部42が、ステップS406で計算されたスコアを方向角度順に並べて補間したスコア波形を生成し、スコア波形の極大値を検出する(ステップS408)。そして、推定部42は、検出した極大値のうち、ステップS404で指定された音源数と同じ数の極大値をスコアが大きい順に選択し、選択した極大値に対応する方向をそれぞれ音源の方向として推定する(ステップS409)。そして、出力部16が、ステップS409で推定された音源の方向を、音源方向推定装置の外部に出力し(ステップS410)、一連の処理を終了する。
以上説明したように、本実施形態の音源方向推定装置は、方向ごとのスコアからスコア波形を生成して極大値を検出し、検出した極大値のうち、ユーザにより指定された音源数と同じ数の極大値をスコアの大きい順に選択して、選択した極大値に対応する方向を音源の方向として推定する。したがって、本実施形態の音源方向推定装置によれば、複数の音源から同時に音が発せられる場合であっても、これら複数の音源の方向を少ない計算量で精度よく推定することができる。
[第5実施形態]
次に、第5実施形態について説明する。第5実施形態は、上述した第4実施形態と同様に複数の音源方向を推定するものであるが、ユーザから音源数の指定を受け付けることなく複数の音源方向を推定するものである。
以下、第1実施形態と共通の構成要素については図中同一の符号を付して重複した説明を適宜省略しながら、本実施形態に特徴的な部分を説明する。なお、以下では第1実施形態と同様の方法でスコア計算を行う例を説明するが、第2実施形態や第3実施形態と同様の方法でスコア計算を行うようにしてもよい。
図15は、第5実施形態の音源方向推定装置の機能的な構成例を示すブロック図である。本実施形態の音源方向推定装置は、図15に示すように、第1実施形態の推定部15に代えて、推定部51を備える。その他の構成は第1実施形態と同様である。
推定部51は、第4実施形態の推定部42と同様に、比較部13のスコア計算部132によって計算された方向ごとのスコアを方向角度順に並べて補間したスコア波形を生成して、このスコア波形の極大値を検出する。ただし、本実施形態の推定部51は、スコア波形から検出した極大値のうち、スコアが予め定めた閾値以上の極大値を選択して、選択した極大値に対応する方向をそれぞれ音源の方向として推定する。
図16は、推定部51が生成したスコア波形の一例を示す図である。図16に例示するスコア波形では、方向角度が−60度、−30度、60度の位置にそれぞれ極大値が存在する。ここで、スコアに対する閾値として3が設定されている場合、推定部51は、これら3つの極大値のうち、スコアが3以上の極大値、つまり方向角度が60度の位置の極大値と方向角度が−30度の位置の極大値とを選択する。そして、推定部51は、これら選択した2つの極大値に対応する方向、つまり方向角度が60度の方向と方向角度が−30度の方向とを、音源の方向として推定する。
図17は、第5実施形態の音源方向推定装置による処理手順の一例を示すフローチャートである。以下、この図17のフローチャートに沿って、第5実施形態の音源方向推定装置の動作概要を説明する。
図17のステップS501からステップS506までの処理は、図7に示したステップS101からステップS106までの処理と同様であるため説明を省略する。
本実施形態では、ステップS506の判定で記憶部14に記憶されたすべてのテンプレートを比較対象としてステップS505の処理を行ったと判断されると(ステップS506:Yes)、推定部51が、ステップS505で計算されたスコアを方向角度順に並べて補間したスコア波形を生成し、スコア波形の極大値を検出する(ステップS507)。そして、推定部42は、検出した極大値のうち、スコアが予め定めた閾値以上の極大値を選択し、選択した極大値に対応する方向をそれぞれ音源の方向として推定する(ステップS508)。そして、出力部16が、ステップS508で推定された音源の方向を、音源方向推定装置の外部に出力し(ステップS509)、一連の処理を終了する。
以上説明したように、本実施形態の音源方向推定装置は、方向ごとのスコアからスコア波形を生成して極大値を検出し、検出した極大値のうち、スコアが閾値以上の極大値を選択して、選択した極大値に対応する方向を音源の方向として推定する。したがって、本実施形態の音源方向推定装置によれば、複数の音源から同時に音が発せられる場合であっても、これら複数の音源の方向を少ない計算量で精度よく推定することができる。
[変形例]
次に、上述した実施形態の変形例について説明する。上述した実施形態では、2つのマイクM1,M2から2つのチャンネルの音響信号を取得して位相差分布を生成する。この例では、2つのマイクM1,M2の位置を結ぶ直線に対して線対称の位置に別々の音源がある場合、それぞれの音源の音響信号から生成される位相差分布が同じになるため、音源の方向を区別できない。例えば図18に示す例では、方向角度が60度の位置にある音源SS1の音響信号から生成される位相差分布と、方向角度が120度の位置にある音源SS2の音響信号から生成される位相差分布とが同じになるため、音源の方向が60度なのか120度なのかを一意に特定できない。このため、上述した各実施形態では、音源の方向推定の対象となる角度範囲を−90度から90度の範囲に限定している。
しかし、音響信号を取得するマイクの数を増やすことで、音源の方向推定の対象となる角度範囲を広げることができる。以下では、3つのマイクを用いて3つのチャンネルの音響信号を取得し、これら3つのチャンネルのうちの2つのチャンネルの音響信号から得られるスコアを積み立てることで、360度の角度範囲(同一平面上の全方位)で音源方向の推定を行う変形例を説明する。
本変形例におけるマイクの配置の一例を図19に示す。本変形例では、3つのマイクM1,M2,M3が図19に示す位置関係で配置されているものとする。また、音源SSは、方向角度が60度の方向に位置していることを想定する。
まず、2つのマイクM1,M2から取得される2つのチャンネルの音響信号に対して第1実施形態と同様の処理を行うことにより、−90度から90度の角度範囲での方向ごとのスコア(図6と同様のスコア波形)が得られる。本変形例では、このようにして得られたスコアを、マイクM1とマイクM2の配置を考慮して、−180度から180度の角度範囲のスコア(全方位スコア)に変換する。このとき、マイクM1とマイクM2とを結ぶ直線に対して線対称の位置に2つの方向候補があるため、全方位スコアは、図20(a)に示す第1候補スコアと、図20(b)に示す第2候補スコアとが得られる。
同様に、2つのマイクM2,M3から取得される2つのチャンネルの音響信号に対して第1実施形態と同様の処理を行うことで得られたスコアを、マイクM2とマイクM3の配置を考慮して全方位スコアに変換し、図21(a)に示す第1候補スコアと、図21(b)に示す第2候補スコアとを得る。同様に、2つのマイクM3,M1から取得される2つのチャンネルの音響信号に対して第1実施形態と同様の処理を行うことで得られたスコアを、マイクM3とマイクM1の配置を考慮して全方位スコアに変換し、図22(a)に示す第1候補スコアと、図22(b)に示す第2候補スコアとを得る。
最後に、任意の2つのチャンネルの音響信号から得られた全方位スコアを積み立てることにより、図23に示すような統合スコアを生成する。任意の2つのチャンネルの音響信号から得られた全方位スコアには、上述したように第1候補スコアと第2候補スコアの2つの候補があるが、実際に音源SSが存在する方向のスコアは2つのチャンネルの組み合わせのすべてにおいて同じになる。このため、任意の2つのチャンネルの音響信号から得られた全方位スコアを積み立てると、図23に示すように、音源SSが存在する方向のスコアが高い統合スコアが得られる。図23に示す例では、方向角度が60度の方向のスコアが最も高いため、音源SSの方向は60度であると推定できる。
なお、以上の説明では、3つのマイクM1,M2,M3から取得した3つのチャンネルの音響信号を用いて同一平面上の全方位で音源方向の推定を行うようにしているが、4つ以上のマイクから取得した4つ以上のチャンネルの音響信号を用いれば、同様の原理で同一平面上のみならず、空間的な方向の推定も可能となる。また、音響信号を取得するマイクの数を増やして位相差分布を生成する音響信号の組み合わせを多くし、スコアの積み立てを行うようにすれば、外れ値の影響を低減させて音源方向の推定精度を向上させることもできる。
上述した実施形態の音源方向推定装置は、例えば、汎用のコンピュータ装置を基本ハードウェアとして用いて実現することが可能である。すなわち、実施形態の音源方向推定装置は、汎用のコンピュータ装置に搭載されたプロセッサにプログラムを実行させることにより実現することができる。このとき、音源方向推定装置は、上記のプログラムをコンピュータ装置にあらかじめインストールすることで実現してもよいし、CD−ROMなどの記憶媒体に記憶して、あるいはネットワークを介して上記のプログラムを配布して、このプログラムをコンピュータ装置に適宜インストールすることで実現してもよい。また、上記のプログラムをサーバーコンピュータ装置上で実行させ、ネットワークを介してその結果をクライアントコンピュータ装置で受け取ることにより実現してもよい。
また、上述した実施形態の音源方向推定装置で使用する各種情報は、上記のコンピュータ装置に内蔵あるいは外付けされたメモリ、ハードディスクもしくはCD−R、CD−RW、DVD−RAM、DVD−Rなどの記録媒体を適宜利用して格納しておくことができる。例えば、上述した実施形態の音源方向推定装置が使用するテンプレートは、これら記録媒体を適宜利用して格納しておくことができる。
本実施形態の音源方向推定装置で実行されるプログラムは、音源方向推定装置を構成する各処理部(取得部11、生成部12、比較部13(比較部21,32)、推定部15(推定部42,51)および出力部16)を含むモジュール構成となっており、実際のハードウェアとしては、例えば、プロセッサが上記記憶媒体からプログラムを読み出して実行することにより、上記各処理部が主記憶上にロードされ、主記憶上に生成されるようになっている。なお、本実施形態の音源方向推定装置は、上述した各処理部の一部または全部を、ASIC(Application Specific Integrated Circuit)やFPGA(Field-Programmable Gate Array)などの専用のハードウェアを用いて実現することも可能である。
以上、本発明の実施形態を説明したが、ここで説明した実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。ここで説明した新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。ここで説明した実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
11 取得部
12 生成部
13 比較部
14 記憶部
15 推定部
16 出力部
21 比較部
31 分解能指定受付部
32 比較部
41 音源数指定受付部
42 推定部
51 推定部
131 量子化部
132 スコア計算部
211 設定部
212 スコア計算部
321 スコア計算部
M1,M2,M3 マイク

Claims (11)

  1. 複数のマイクから複数チャンネルの音響信号を取得する取得部と、
    前記複数チャンネルの音響信号の位相差を予め定めた周波数ビンごとに計算して、前記音響信号に対応する位相差分布を生成する生成部と、
    前記音響信号に対応する位相差分布を量子化する量子化部と、
    量子化された前記音響信号に対応する位相差分布を、所定の角度分解能に応じて定められた複数の方向ごとに予め生成された複数のテンプレートであって、各テンプレートが該テンプレートに対応する方向の位相差分布を前記量子化部と同じ方法で量子化することで生成された前記複数のテンプレートの各々と比較して、量子化された前記音響信号に対応する位相差分布と前記テンプレートとの相似性に応じたスコアを、前記複数の方向ごとに計算するスコア計算部と、
    前記複数の方向のうち前記スコアが大きい方向を、前記音響信号の音源の方向として推定する推定部と、を備える音源方向推定装置。
  2. 前記スコア計算部は、前記音響信号に対応する位相差分布と前記テンプレートとで量子化された位相差が一致する周波数ビンの数を前記スコアとして計算する、請求項に記載の音源方向推定装置。
  3. 記音響信号に基づいて周波数ビンごとに加算スコアを設定する設定部をさらに備え、
    前記スコア計算部は、前記音響信号に対応する位相差分布と前記テンプレートとで量子化された位相差が一致する周波数ビンの各々に設定された前記加算スコアの和を前記スコアとして計算する、請求項に記載の音源方向推定装置。
  4. 前記設定部は、各周波数ビンにおける前記音響信号の対数パワーの大きさに応じて前記加算スコアを設定する、請求項に記載の音源方向推定装置。
  5. 前記設定部は、各周波数ビンにおける前記音響信号の信号雑音比の大きさに応じて前記加算スコアを設定する、請求項に記載の音源方向推定装置。
  6. 前記推定部は、前記スコアを方向角度順に並べたスコア波形を生成して該スコア波形の極大値を検出し、検出された極大値のうち前記スコアが大きい順に指定された数の極大値を選択して、選択した極大値に対応する方向を、前記音響信号の音源の方向として推定する、請求項のいずれか一項に記載の音源方向推定装置。
  7. 前記推定部は、前記スコアを方向角度順に並べたスコア波形を生成して該スコア波形の極大値を検出し、検出された極大値のうち前記スコアが予め定めた閾値以上の極大値を選択して、選択した極大値に対応する方向を、前記音響信号の音源の方向として推定する、請求項のいずれか一項に記載の音源方向推定装置。
  8. 前記スコア計算部は、予め生成された前記複数のテンプレートのうち、ユーザにより指定された角度分解能に応じた数の前記テンプレートを選択し、量子化された前記音響信号に対応する位相差分布を、選択した前記テンプレートの各々と比較して、ユーザにより指定された角度分解能に対応する方向ごと前記スコアを計算する、請求項1〜のいずれか一項に記載の音源方向推定装置。
  9. 前記複数のマイクは、第1マイクと第2マイクと第3マイクとを含み、
    前記生成部は、前記音響信号のうち、前記第1マイクと前記第2マイクとから取得される2つのチャンネルの第1音響信号に対応する位相差分布と、前記第2マイクと前記第3マイクとから取得される2つのチャンネルの第2音響信号に対応する位相差分布と、前記第3マイクと前記第1マイクとから取得される2つのチャンネルの第3音響信号に対応する位相差分布とを生成し、
    前記量子化部は、前記第1音響信号に対応する位相差分布と、前記第2音響信号に対応する位相差分布と、前記第3音響信号に対応する位相差分布とをそれぞれ量子化し、
    前記スコア計算部は、量子化された前記第1音響信号に対応する位相差分布と、量子化された前記第2音響信号に対応する位相差分布と、量子化された前記第3音響信号に対応する位相差分布とを、それぞれ前記複数のテンプレートの各々と比較して、量子化された前記第1音響信号に対応する位相差分布と前記テンプレートとの相似性に応じた前記複数の方向ごとのスコアと、量子化された前記第2音響信号に対応する位相差分布と前記テンプレートとの相似性に応じた前記複数の方向ごとのスコアと、量子化された前記第3音響信号に対応する位相差分布と前記テンプレートとの相似性に応じた前記複数の方向ごとのスコアとを計算し、
    前記推定部は、前記第1音響信号に対応して計算されたスコアと、前記第2音響信号に対応して計算されたスコアと、前記第2音響信号に対応して計算されたスコアとを前記複数の方向ごとに加算して、前記複数の方向のうち前記スコアが大きい方向を、前記音響信号の音源の方向として推定する、請求項1〜8のいずれか一項に記載の音源方向推定装置。
  10. 音源方向推定装置において実行される音源方向推定方法であって、
    数のマイクから複数チャンネルの音響信号を取得する工程と、
    記複数チャンネルの音響信号の位相差を予め定めた周波数ビンごとに計算して、前記音響信号に対応する位相差分布を生成する工程と、
    前記音響信号に対応する位相差分布を量子化する工程と、
    量子化された前記音響信号に対応する位相差分布を、所定の角度分解能に応じて定められた複数の方向ごとに予め生成された複数のテンプレートであって、各テンプレートが該テンプレートに対応する方向の位相差分布を前記音響信号に対応する位相差分布に対する量子化と同じ方法で量子化することで生成された前記複数のテンプレートの各々と比較して、量子化された前記音響信号に対応する位相差分布と前記テンプレートとの相似性に応じたスコアを、前記複数の方向ごとに計算する工程と、
    前記複数の方向のうち前記スコアが大きい方向を、前記音響信号の音源の方向として推定する工程と、を含む音源方向推定方法。
  11. コンピュータに、
    複数のマイクから複数チャンネルの音響信号を取得する機能と、
    前記複数チャンネルの音響信号の位相差を予め定めた周波数ビンごとに計算して、前記音響信号に対応する位相差分布を生成する機能と、
    前記音響信号に対応する位相差分布を量子化する機能と、
    量子化された前記音響信号に対応する位相差分布を、所定の角度分解能に応じて定められた複数の方向ごとに予め生成された複数のテンプレートであって、各テンプレートが該テンプレートに対応する方向の位相差分布を前記音響信号に対応する位相差分布に対する量子化と同じ方法で量子化することで生成された前記複数のテンプレートの各々と比較して、量子化された前記音響信号に対応する位相差分布と前記テンプレートとの相似性に応じたスコアを、前記複数の方向ごとに計算する機能と、
    前記複数の方向のうち前記スコアが大きい方向を、前記音響信号の音源の方向として推定する機能と、を実現させるためのプログラム。
JP2014036032A 2014-02-26 2014-02-26 音源方向推定装置、音源方向推定方法およびプログラム Active JP6289936B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2014036032A JP6289936B2 (ja) 2014-02-26 2014-02-26 音源方向推定装置、音源方向推定方法およびプログラム
CN201510086405.6A CN104865550A (zh) 2014-02-26 2015-02-16 声源方向估计设备和声源方向估计方法
US14/629,784 US9473849B2 (en) 2014-02-26 2015-02-24 Sound source direction estimation apparatus, sound source direction estimation method and computer program product

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014036032A JP6289936B2 (ja) 2014-02-26 2014-02-26 音源方向推定装置、音源方向推定方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2015161551A JP2015161551A (ja) 2015-09-07
JP6289936B2 true JP6289936B2 (ja) 2018-03-07

Family

ID=53883554

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014036032A Active JP6289936B2 (ja) 2014-02-26 2014-02-26 音源方向推定装置、音源方向推定方法およびプログラム

Country Status (3)

Country Link
US (1) US9473849B2 (ja)
JP (1) JP6289936B2 (ja)
CN (1) CN104865550A (ja)

Families Citing this family (72)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6289936B2 (ja) * 2014-02-26 2018-03-07 株式会社東芝 音源方向推定装置、音源方向推定方法およびプログラム
JP6221158B2 (ja) * 2014-08-27 2017-11-01 本田技研工業株式会社 自律行動ロボット、及び自律行動ロボットの制御方法
US10095470B2 (en) 2016-02-22 2018-10-09 Sonos, Inc. Audio response playback
US10097919B2 (en) 2016-02-22 2018-10-09 Sonos, Inc. Music service selection
US10264030B2 (en) 2016-02-22 2019-04-16 Sonos, Inc. Networked microphone device control
US9947316B2 (en) 2016-02-22 2018-04-17 Sonos, Inc. Voice control of a media playback system
US10509626B2 (en) 2016-02-22 2019-12-17 Sonos, Inc Handling of loss of pairing between networked devices
US9965247B2 (en) 2016-02-22 2018-05-08 Sonos, Inc. Voice controlled media playback system based on user profile
US9978390B2 (en) 2016-06-09 2018-05-22 Sonos, Inc. Dynamic player selection for audio signal processing
US10152969B2 (en) 2016-07-15 2018-12-11 Sonos, Inc. Voice detection by multiple devices
US10134399B2 (en) 2016-07-15 2018-11-20 Sonos, Inc. Contextualization of voice inputs
US10115400B2 (en) 2016-08-05 2018-10-30 Sonos, Inc. Multiple voice services
US9942678B1 (en) 2016-09-27 2018-04-10 Sonos, Inc. Audio playback settings for voice interaction
US9743204B1 (en) 2016-09-30 2017-08-22 Sonos, Inc. Multi-orientation playback device microphones
US10181323B2 (en) 2016-10-19 2019-01-15 Sonos, Inc. Arbitration-based voice recognition
US10375498B2 (en) * 2016-11-16 2019-08-06 Dts, Inc. Graphical user interface for calibrating a surround sound system
US11183181B2 (en) 2017-03-27 2021-11-23 Sonos, Inc. Systems and methods of multiple voice services
US10475449B2 (en) 2017-08-07 2019-11-12 Sonos, Inc. Wake-word detection suppression
US10048930B1 (en) 2017-09-08 2018-08-14 Sonos, Inc. Dynamic computation of system response volume
US10609479B2 (en) * 2017-09-14 2020-03-31 Fujitsu Limited Device and method for determining a sound source direction
US10264354B1 (en) * 2017-09-25 2019-04-16 Cirrus Logic, Inc. Spatial cues from broadside detection
US10446165B2 (en) 2017-09-27 2019-10-15 Sonos, Inc. Robust short-time fourier transform acoustic echo cancellation during audio playback
US10621981B2 (en) 2017-09-28 2020-04-14 Sonos, Inc. Tone interference cancellation
US10051366B1 (en) 2017-09-28 2018-08-14 Sonos, Inc. Three-dimensional beam forming with a microphone array
US10482868B2 (en) 2017-09-28 2019-11-19 Sonos, Inc. Multi-channel acoustic echo cancellation
US10466962B2 (en) 2017-09-29 2019-11-05 Sonos, Inc. Media playback system with voice assistance
DK3704873T3 (da) 2017-10-31 2022-03-28 Widex As Fremgangsmåde til at betjene et høreapparatsystem og et høreapparatsystem
US10880650B2 (en) 2017-12-10 2020-12-29 Sonos, Inc. Network microphone devices with automatic do not disturb actuation capabilities
US10818290B2 (en) 2017-12-11 2020-10-27 Sonos, Inc. Home graph
US11343614B2 (en) 2018-01-31 2022-05-24 Sonos, Inc. Device designation of playback and network microphone device arrangements
US10524051B2 (en) * 2018-03-29 2019-12-31 Panasonic Corporation Sound source direction estimation device, sound source direction estimation method, and recording medium therefor
JP7079189B2 (ja) * 2018-03-29 2022-06-01 パナソニックホールディングス株式会社 音源方向推定装置、音源方向推定方法及びそのプログラム
US11175880B2 (en) 2018-05-10 2021-11-16 Sonos, Inc. Systems and methods for voice-assisted media content selection
US10847178B2 (en) 2018-05-18 2020-11-24 Sonos, Inc. Linear filtering for noise-suppressed speech detection
US10959029B2 (en) 2018-05-25 2021-03-23 Sonos, Inc. Determining and adapting to changes in microphone performance of playback devices
US11408963B2 (en) 2018-06-25 2022-08-09 Nec Corporation Wave-source-direction estimation device, wave-source-direction estimation method, and program storage medium
US20210263125A1 (en) * 2018-06-25 2021-08-26 Nec Corporation Wave-source-direction estimation device, wave-source-direction estimation method, and program storage medium
US10681460B2 (en) 2018-06-28 2020-06-09 Sonos, Inc. Systems and methods for associating playback devices with voice assistant services
US10461710B1 (en) 2018-08-28 2019-10-29 Sonos, Inc. Media playback system with maximum volume setting
US11076035B2 (en) 2018-08-28 2021-07-27 Sonos, Inc. Do not disturb feature for audio notifications
US10587430B1 (en) 2018-09-14 2020-03-10 Sonos, Inc. Networked devices, systems, and methods for associating playback devices based on sound codes
US10878811B2 (en) 2018-09-14 2020-12-29 Sonos, Inc. Networked devices, systems, and methods for intelligently deactivating wake-word engines
US11024331B2 (en) 2018-09-21 2021-06-01 Sonos, Inc. Voice detection optimization using sound metadata
US10811015B2 (en) 2018-09-25 2020-10-20 Sonos, Inc. Voice detection optimization based on selected voice assistant service
JP7243105B2 (ja) * 2018-09-27 2023-03-22 富士通株式会社 音源方向判定装置、音源方向判定方法、及び音源方向判定プログラム
US11100923B2 (en) 2018-09-28 2021-08-24 Sonos, Inc. Systems and methods for selective wake word detection using neural network models
US10692518B2 (en) 2018-09-29 2020-06-23 Sonos, Inc. Linear filtering for noise-suppressed speech detection via multiple network microphone devices
US11899519B2 (en) 2018-10-23 2024-02-13 Sonos, Inc. Multiple stage network microphone device with reduced power consumption and processing load
EP3654249A1 (en) 2018-11-15 2020-05-20 Snips Dilated convolutions and gating for efficient keyword spotting
US11183183B2 (en) 2018-12-07 2021-11-23 Sonos, Inc. Systems and methods of operating media playback systems having multiple voice assistant services
US11132989B2 (en) 2018-12-13 2021-09-28 Sonos, Inc. Networked microphone devices, systems, and methods of localized arbitration
US10602268B1 (en) 2018-12-20 2020-03-24 Sonos, Inc. Optimization of network microphone devices using noise classification
US11315556B2 (en) 2019-02-08 2022-04-26 Sonos, Inc. Devices, systems, and methods for distributed voice processing by transmitting sound data associated with a wake word to an appropriate device for identification
US10867604B2 (en) 2019-02-08 2020-12-15 Sonos, Inc. Devices, systems, and methods for distributed voice processing
US11120794B2 (en) 2019-05-03 2021-09-14 Sonos, Inc. Voice assistant persistence across multiple network microphone devices
US11200894B2 (en) 2019-06-12 2021-12-14 Sonos, Inc. Network microphone device with command keyword eventing
US11361756B2 (en) 2019-06-12 2022-06-14 Sonos, Inc. Conditional wake word eventing based on environment
US10586540B1 (en) 2019-06-12 2020-03-10 Sonos, Inc. Network microphone device with command keyword conditioning
US11138969B2 (en) 2019-07-31 2021-10-05 Sonos, Inc. Locally distributed keyword detection
US10871943B1 (en) 2019-07-31 2020-12-22 Sonos, Inc. Noise classification for event detection
US11138975B2 (en) 2019-07-31 2021-10-05 Sonos, Inc. Locally distributed keyword detection
US11189286B2 (en) 2019-10-22 2021-11-30 Sonos, Inc. VAS toggle based on device orientation
US11200900B2 (en) 2019-12-20 2021-12-14 Sonos, Inc. Offline voice control
US11562740B2 (en) 2020-01-07 2023-01-24 Sonos, Inc. Voice verification for media playback
US11556307B2 (en) 2020-01-31 2023-01-17 Sonos, Inc. Local voice data processing
US11308958B2 (en) 2020-02-07 2022-04-19 Sonos, Inc. Localized wakeword verification
US11308962B2 (en) 2020-05-20 2022-04-19 Sonos, Inc. Input detection windowing
US11727919B2 (en) 2020-05-20 2023-08-15 Sonos, Inc. Memory allocation for keyword spotting engines
US11482224B2 (en) 2020-05-20 2022-10-25 Sonos, Inc. Command keywords with input detection windowing
US11698771B2 (en) 2020-08-25 2023-07-11 Sonos, Inc. Vocal guidance engines for playback devices
US11551700B2 (en) 2021-01-25 2023-01-10 Sonos, Inc. Systems and methods for power-efficient keyword detection
WO2023243348A1 (ja) * 2022-06-14 2023-12-21 ソニーグループ株式会社 物体位置解析装置、および物体位置解析方法、並びにプログラム

Family Cites Families (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5347496A (en) * 1993-08-11 1994-09-13 The United States Of America As Represented By The Secretary Of The Navy Method and system of mapping acoustic near field
US5878367A (en) * 1996-06-28 1999-03-02 Northrop Grumman Corporation Passive acoustic traffic monitoring system
JP4815661B2 (ja) * 2000-08-24 2011-11-16 ソニー株式会社 信号処理装置及び信号処理方法
US7123727B2 (en) * 2001-07-18 2006-10-17 Agere Systems Inc. Adaptive close-talking differential microphone array
JP2003337164A (ja) * 2002-03-13 2003-11-28 Univ Nihon 音到来方向検出方法及びその装置、音による空間監視方法及びその装置、並びに、音による複数物体位置検出方法及びその装置
US7809145B2 (en) * 2006-05-04 2010-10-05 Sony Computer Entertainment Inc. Ultra small microphone array
JP4035069B2 (ja) * 2003-02-27 2008-01-16 財団法人名古屋産業科学研究所 熱音響効果を利用した音波増幅・減衰器を備えた配管装置
DE10313331B4 (de) * 2003-03-25 2005-06-16 Siemens Audiologische Technik Gmbh Verfahren zur Bestimmung einer Einfallsrichtung eines Signals einer akustischen Signalquelle und Vorrichtung zur Durchführung des Verfahrens
US7054228B1 (en) * 2003-03-25 2006-05-30 Robert Hickling Sound source location and quantification using arrays of vector probes
JP4521549B2 (ja) * 2003-04-25 2010-08-11 財団法人くまもとテクノ産業財団 上下、左右方向の複数の音源の分離方法、そのためのシステム
JP3906230B2 (ja) 2005-03-11 2007-04-18 株式会社東芝 音響信号処理装置、音響信号処理方法、音響信号処理プログラム、及び音響信号処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JP4247195B2 (ja) 2005-03-23 2009-04-02 株式会社東芝 音響信号処理装置、音響信号処理方法、音響信号処理プログラム、及び音響信号処理プログラムを記録した記録媒体
JP4300194B2 (ja) * 2005-03-23 2009-07-22 株式会社東芝 音響再生装置、音響再生方法および音響再生プログラム
JP4234746B2 (ja) * 2006-09-25 2009-03-04 株式会社東芝 音響信号処理装置、音響信号処理方法及び音響信号処理プログラム
JP4310371B2 (ja) * 2007-09-11 2009-08-05 パナソニック株式会社 音判定装置、音検知装置及び音判定方法
JP2009080309A (ja) 2007-09-26 2009-04-16 Toshiba Corp 音声認識装置、音声認識方法、音声認識プログラム、及び音声認識プログラムを記録した記録媒体
CN101617245B (zh) 2007-10-01 2012-10-10 松下电器产业株式会社 声源方向检测装置
WO2009076523A1 (en) * 2007-12-11 2009-06-18 Andrea Electronics Corporation Adaptive filtering in a sensor array system
ATE518224T1 (de) * 2008-01-04 2011-08-15 Dolby Int Ab Audiokodierer und -dekodierer
JP4816711B2 (ja) * 2008-11-04 2011-11-16 ソニー株式会社 通話音声処理装置および通話音声処理方法
KR101012709B1 (ko) * 2009-05-20 2011-02-09 국방과학연구소 위상비교 방향탐지기의 채널위상오차 제거 시스템 및 방법
US8265341B2 (en) * 2010-01-25 2012-09-11 Microsoft Corporation Voice-body identity correlation
JP5337072B2 (ja) * 2010-02-12 2013-11-06 日本電信電話株式会社 モデル推定装置、音源分離装置、それらの方法及びプログラム
CN102387506B (zh) * 2010-08-30 2015-06-03 中兴通讯股份有限公司 通信系统共存时的物理资源配置和信号发送方法及系统
US9111526B2 (en) * 2010-10-25 2015-08-18 Qualcomm Incorporated Systems, method, apparatus, and computer-readable media for decomposition of a multichannel music signal
KR101736911B1 (ko) * 2010-12-07 2017-05-19 한국전자통신연구원 빔포밍 음향 이미징을 이용한 보안 감시 시스템 및 이를 이용한 보안 감시 방법
JP5516455B2 (ja) * 2011-02-23 2014-06-11 トヨタ自動車株式会社 接近車両検出装置及び接近車両検出方法
JP5685177B2 (ja) * 2011-12-12 2015-03-18 本田技研工業株式会社 情報伝達システム
WO2013091021A1 (en) * 2011-12-22 2013-06-27 Wolfson Dynamic Hearing Pty Ltd Method and apparatus for wind noise detection
JP6031761B2 (ja) * 2011-12-28 2016-11-24 富士ゼロックス株式会社 音声解析装置および音声解析システム
US9106196B2 (en) * 2013-06-20 2015-08-11 2236008 Ontario Inc. Sound field spatial stabilizer with echo spectral coherence compensation
JP6158006B2 (ja) * 2013-09-17 2017-07-05 株式会社東芝 音声処理装置、方法、及びプログラム
JP6289936B2 (ja) * 2014-02-26 2018-03-07 株式会社東芝 音源方向推定装置、音源方向推定方法およびプログラム

Also Published As

Publication number Publication date
US20150245152A1 (en) 2015-08-27
JP2015161551A (ja) 2015-09-07
CN104865550A (zh) 2015-08-26
US9473849B2 (en) 2016-10-18

Similar Documents

Publication Publication Date Title
JP6289936B2 (ja) 音源方向推定装置、音源方向推定方法およびプログラム
JP4812302B2 (ja) 音源方向推定システム、音源方向推定方法及び音源方向推定プログラム
JP5079761B2 (ja) 直間比推定装置、音源距離測定装置、雑音除去装置、各装置の方法と、装置プログラム
JP2017090853A (ja) 情報処理装置、情報処理方法およびプログラム
US10262678B2 (en) Signal processing system, signal processing method and storage medium
WO2019187589A1 (ja) 音源方向推定装置、音源方向推定方法、プログラム
KR20140135349A (ko) 복수의 마이크로폰을 이용한 비동기 음성인식 장치 및 방법
JP7235534B2 (ja) マイクロホンアレイ位置推定装置、マイクロホンアレイ位置推定方法、およびプログラム
JP6158006B2 (ja) 音声処理装置、方法、及びプログラム
JP2010175431A (ja) 音源方向推定装置とその方法と、プログラム
CN103688187A (zh) 使用相位谱的声音源定位
JP2007006253A (ja) 信号処理装置、マイクロフォンシステム、話者方向検出方法及び話者方向検出プログラム
JP7346552B2 (ja) 正規化を介して音響信号をフィンガープリンティングするための方法、記憶媒体及び装置
KR101483513B1 (ko) 음원위치추적장치 및 음원위치추적방법
JP5986966B2 (ja) 音場収音再生装置、方法及びプログラム
JP2017067948A (ja) 音声処理装置および音声処理方法
JP5784075B2 (ja) 信号区間分類装置、信号区間分類方法、およびプログラム
JP2008089312A (ja) 信号到来方向推定装置及び方法、並びに信号分離装置及び方法、コンピュータプログラム
JP5705190B2 (ja) 音響信号強調装置、音響信号強調方法、およびプログラム
JP2008060635A (ja) ブラインド信号抽出装置、その方法、そのプログラム、及びそのプログラムを記録した記録媒体
JP4849404B2 (ja) 信号処理装置、信号処理方法およびプログラム
JP6933303B2 (ja) 波源方向推定装置、波源方向推定方法、およびプログラム
JP4676920B2 (ja) 信号分離装置、信号分離方法、信号分離プログラム及び記録媒体
JP2005241452A (ja) 測角方法及び装置
JP6213324B2 (ja) 音声信号処理装置及びプログラム

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20151102

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160829

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170531

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170606

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170711

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180109

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180207

R151 Written notification of patent or utility model registration

Ref document number: 6289936

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

Free format text: JAPANESE INTERMEDIATE CODE: R313114

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350