JP5701164B2 - 位置検出装置及び位置検出方法 - Google Patents
位置検出装置及び位置検出方法 Download PDFInfo
- Publication number
- JP5701164B2 JP5701164B2 JP2011138595A JP2011138595A JP5701164B2 JP 5701164 B2 JP5701164 B2 JP 5701164B2 JP 2011138595 A JP2011138595 A JP 2011138595A JP 2011138595 A JP2011138595 A JP 2011138595A JP 5701164 B2 JP5701164 B2 JP 5701164B2
- Authority
- JP
- Japan
- Prior art keywords
- information
- unit
- position information
- sound source
- particle
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2457—Query processing with adaptation to user needs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Length Measuring Devices By Optical Means (AREA)
- Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
Description
図1は、本実施形態に係る位置検出装置の構成を示す概略図である。
位置検出装置1は、第1情報検出部11、第1位置情報推定部21、第2情報検出部12、第2位置情報推定部22及び情報統合部31を含んで構成される。
第1情報検出部11は、第1のモダリティ(態様)の情報を検出し、検出した第1のモダリティの情報を第1位置情報推定部21に出力する。第1のモダリティの情報は、例えば、多チャネル音響信号である。その場合、第1情報検出部11は、M(Mは2以上の整数)チャネルのマイクロホンアレーである。第1情報検出部11は、位置が異なる収音手段(例えば、マイクロホン)を複数個(例えば、M=8個)備え、各収音手段は受信した音波を音響信号に変換して、変換された音響信号を並列して多チャネル(Mチャネル)音響信号として第1位置情報推定部21に出力する。
第1音源定位部211は、予め定めた数(例えば、72個、即ち方向ψが5°間隔)の伝達関数ベクトルv(ψ)を、方向ψと対応付けて記憶した記憶部を備える。第1音源定位部211は、記憶部から選択した伝達関数ベクトルv(ψ)と、多チャネル音響信号に基づいて算出した固有ベクトルεi(後述)に基づき、式(1)を用いて空間スペクトルP(ψ)を算出する。
第1音源定位部211は、固有ベクトルeiを算出するために、入力された多チャネル音響信号に離散フーリエ変換を行い周波数領域に変換してスペクトルxを算出する。スペクトルはM列のベクトルである。
第1音源定位部211は、算出したスペクトルxに基づき相関行列Rxxを、式(2)を用いて算出する。
第1音源定位部211は、式(3)を満たすように固有値dと固有ベクトルεを算出する。
第1音源定位部211は、式(3)を満たす固有値dと固有ベクトルεとの組を保持する。
第1音源定位部211は、N+1番目からK番目まで固有値dが大きい固有値dに対応する固有ベクトルε(K−N個)に基づき、式(1)を用いて空間スペクトルP(ψ)を算出する。
そして、第1音源定位部211は、周波数毎に空間スペクトルP(ψ)の算出処理を行い、予め設定した周波数帯域の空間スペクトルP(ψ)を取得する。
ここで、予め設定した周波数帯域とは、発話者が発する音声の音圧が大きい周波数帯域であり、かつ雑音の音圧が小さい周波数帯域が望ましい。例えば、0.5〜2.8kHzである。
ここで、第1音源定位部211は、音響信号データから予め設定した閾値よりもS/N比が高い(即ち、ノイズが少ない)周波数帯域ωを抽出する。第1音源定位部211は、抽出した周波数帯域ωにおいて式(3)を用いて算出した最大固有値dmaxの平方根に空間スペクトルP(ψ)で式(4)を用いて重み付け加算して広帯域の空間スペクトルPavg(ψ)を算出する。
ここで、ピーク値について説明する。推定範囲における広帯域空間スペクトルにおいて、角度ψの値Pavg(ψ)が、直前の隣接する角度の値Pavg(ψ−Δψ)および直後の隣接する角度の値Pavg(ψ+Δψ)よりも大きな値である場合に、その角度ψの値Pavg(ψ)がピーク値である。また、その角度ψが,音源方向ψである。
なお、第1音源定位部211は、音源毎の位置情報を推定するために、上述のSEVD−MUSIC法の代わりに、例えば、WDS−BF(Weighted Delay and Sum Beam Forming)法を用いて音源毎の位置情報を推定してもよい。
第1音源定位部211は、定めた音源毎の位置情報(一次候補)を音源分離部213及び相関行列生成部216に出力する。第1音源定位部211は、入力された多チャネル音響信号を音源分離部213及び第2音源定位部218に出力する。
音源分離部213は、分離した音源l毎の音響信号slを音源同定部214及び相関行列生成部216に出力する。
音源同定部214は、クラス情報λlを決定するために、例えば、階層的ガウシアン混合モデル(hierarchical Gaussian Mixture Model;h−GMM)に基づく音源同定法を用いてもよい。
音源同定部214は、自身が備える記憶部に、階層的ガウシアン混合モデル情報を予め記憶しておく。
図2は、本実施形態に係るGMM階層関係情報の一例を示す概念図である。
図2に示すGMM階層関係情報において、最上位の階層(階層情報)Λ1は、音響を示すクラス情報λ1をルート情報とし、サブクラス情報として音声を示すクラス情報λ11、音楽を示すクラス情報λ12、環境音を示すクラス情報λ13及び無音の状態を示すクラス情報λ14を含む。
階層Λ11は、男声を示すクラス情報λ111と女声を示すクラス情報λ112をサブクラス情報として含む。階層Λ12は、クラシック音楽を示すクラス情報λ121とジャズ音楽を示すクラス情報λ122をサブクラス情報として含む。階層Λ13は、ドア音を示すクラス情報λ131と電子音を示すクラス情報λ132をサブクラス情報として含む。
図3は、本実施形態においてクラス情報を決定する処理のフローチャートである。
(ステップS101)音源同定部214は、注目する階層Λiを、最上位の階層Λ1と初期設定する。その後、ステップS102に進む。
(ステップS102)音源同定部214は、音源分離部213から入力された音響信号slに基づき音響特徴量xtを算出する。ここで、tはフレーム時刻を示す。音響特徴量xtは、例えば24次元のメル尺度ケプストラム(Mel−Frequency Cepstrum Coefficient;MFCC)である。その場合には、音源同定部214は、予め記憶された複数の候補ベクトルの中から、音響特徴量xtに最も近似する1つを選択することで、音響特徴量xtをベクトル量子化する。その後、ステップS103に進む。
音源同定部214は、読み出した尤度f(xt|λ)に基づき結合尤度を算出し、結合尤度を最大とするクラス情報λ’を決定する。決定されたクラス情報λ’は、式(5)で表される。
音源同定部214は、クラス情報λ’が階層Λiに含まれるサブクラス情報λでない、つまりルート情報と判断したとき(ステップS104 N)、ステップS106に進む。
音源同定部214は、クラス情報λ’がルート情報である階層Λ’が存在しないと判断したとき(ステップS105 N)、ステップS106に進む。
(ステップS106)音源同定部214は、クラス情報λ’をフレーム時刻tにおける音源lのクラス情報λlと決定する。
相関行列生成部216は、音源分離部213から入力された音源lの音響信号sl及び第1音源定位部211から入力された音源lの音源方向ψに基づいて、音源l毎に相関行列Vlを算出する。
相関行列生成部216は、算出した音源l毎の相関行列Vlを目的音選択部217に出力する。
目的音選択部217は、相関行列Kλを算出するために、目的としない音源の種類(非目的音)を示すクラス情報λに対応する音響信号slの相関行列Vlj(1個とは限らない)を全て乗算する。目的音選択部217は、乗算して得られた行列に目的とする種類の種別(目的音)を示すクラス情報に対応する音響信号slの相関行列Vli(1個とは限らない)を全て除算して、目的音毎の相関行列Kλを算出する。即ち、相関行列Kλは、非目的音に対する相関行列Vljの目的音に対する相関行列Vliとの比を表す。
次に、第2音源定位部218は、算出した相関行列Rと取得した相関行列Kλに基づいてクラス情報λ毎に一般化固有値展開を行って、固有値δm(1≦m≦M)と固有ベクトルemを算出する。相関行列R、相関行列Kλ、固有値δm、固有ベクトルemは、式(7)に示される関係がある。
第2音源定位部218は、算出した固有ベクトルem、及び伝達関数記憶部215から読み出した各音源方向ψに対応するM列の伝達関数ベクトルG(ψ)に基づき、指標値として例えば式(1)を用いて空間スペクトルP(ψ)を算出する。但し、第2音源定位部218は、式(1)に固有ベクトルεiの代わりに、算出した固有ベクトルemを代入し、伝達関数ベクトルv(ψ)の代わりに、読み出した伝達関数ベクトルG(ψ)を代入する。
第2音源定位部218は、空間スペクトルP(ψ)が最も大きい音源方向ψを選択し、選択した音源方向ψをクラス情報λ毎の位置情報と定める。
第2音源定位部218は、算出した音源方向ψをクラス情報λに対応した音源毎の位置情報、即ち情報源毎の第1の位置情報として情報統合部31に出力する。
第2情報検出部12は、例えば、熱画像センサ部121及び距離画像センサ部122を含んで構成される。熱画像センサ部121は、物体の特徴量として物体の温度を表す熱画像情報を検出する。熱画像情報は、被写体である物体表面の温度を画素ごとの画素値として示す情報である。検出対象が人体の場合には、その個体差が比較的少なく、しばしば頭部が露出しているため検知に好都合である。また、熱画像情報は、照度の変化に影響されない。熱画像センサ部121は、第2位置情報推定部22に第2のモダリティの一部として出力する。
これにより、照度変化の影響を最小限にして被写体となる物体毎の第2の位置情報を推定することができる。但し、本実施形態に係る位置検出装置2は、これに限らず他の手法を用いて第2の位置情報を推定してもよい。
第1二値化部2211は、熱画像情報を二値化する際、熱画像情報に含まれる画素値が示す温度が、予め定められた温度T1より高く、かつ予め定められた温度T2より低い範囲にある場合、その画素における二値化熱画像情報に含まれる画素値を1と定める。熱画像情報に含まれる画素値が示す温度が、その範囲外にある場合、その画素における二値化熱画像情報に含まれる画素値を0と定める。
この温度範囲は、検出対象物体の表面温度に応じて予め設定した値である。例えば、検出対象物体が人体である場合、温度T1、温度T2は、それぞれ35℃、37℃である。
第2二値化部2212は、距離画像情報を二値化する際、距離画像情報に含まれる画素値が示す距離が、予め定められた距離d1より長く、かつ予め定められた距離d2より未短い範囲にある場合、その画素における二値化距離画像情報に含まれる画素値を1と定める。距離画像情報に含まれる画素値が示す距離が、その範囲外にある場合、その画素における二値化距離画像情報に含まれる画素値を0と定める。
この距離範囲は、検出対象物体が所在しうる位置に応じて予め設定した値である。例えば、距離画像センサ部122から極端に接近している物体や離れている物体を除外することができる。
第2クラスタリング部2222が、二値化距離画像情報に対して行うクラスタリング処理は、第1クラスタリング部2221が、二値化熱画像情報に対して行うクラスタリング処理と同様である。
第2不要クラスタ除去部2232が、第2クラスタ情報と第2矩形クラスタ情報に対して行う処理は、第1不要クラスタ除去部2231が、第1クラスタ情報と第1矩形クラスタ情報に対して行う処理に対して行う処理と同様である。
マッピング部225は、第2矩形クラスタ情報に基づいて、二値化熱画像情報を二値化距離画像情報にマッピングする。
マッピング部225は、マッピングした二値化熱画像情報と二値化距離画像情報の論理積を画素ごとにとり、統合二値化距離画像情報を生成する。マッピング部225は生成した統合二値化距離画像情報を第3クラスタリング部226に出力する。
マッピング部225が行うマッピング処理について図4を用いて説明する。
図4の左側は、二値化熱画像情報に基づく第1クラスタ101を破線で示し、第1矩形クラスタ情報が示す第1矩形領域102を実線で示す。
図4の右側は、二値化距離画像情報に基づく第2クラスタ201を実線で示し、第2矩形クラスタ情報が示す第2矩形領域202を実線で示す。
第2矩形領域202の内部に、この座標変換により二値化熱画像情報に基づく第1クラスタ203を破線で示す。
なお、第2矩形領域202の内部に、後述する第3クラスタリング部226におけるクラスタリング処理によって生成された第3クラスタ情報が示す新たなクラスタ204を太い実線で示す。
第3クラスタリング部226は、生成した第3クラスタ情報を物体定位部227に出力する。
また、第3クラスタリング部226は、生成した第3クラスタ情報に基づいて、第2不要クラスタ除去部2232と同様に不要クラスタ除去処理を行い、残ったクラスタを示す第3クラスタ情報を物体定位部227に出力してもよい。
物体定位部227は、第3クラスタ情報が示す各クラスタに含まれる画素の座標の重心を、算出した距離情報に基づき被写体表面の水平方向及び垂直方向の位置情報を算出する。
物体定位部227は、算出した水平方向、垂直方向の位置情報及び距離値を3次元のクラスタ毎の位置情報とする。
なお、物体定位部227は、算出した位置情報に基づき距離画像センサ部122又は熱画像センサ部121からの方向情報を算出し、これを1次元のクラスタ毎の位置情報としてもよい。
情報統合部31は、位置情報を統合するために、例えば粒子フィルタリング法(particle filtering)を用い、情報源毎に与えられた複数の粒子各々に対応する状態変数に基づき入力された位置情報を統合する。各粒子に対応する状態変数は、仮想的な位置情報(仮想位置情報ともいい、以下の説明では、単に位置情報と呼ぶ)と重み係数を含む。ここで、情報統合部31は、情報源毎の位置情報と、複数の粒子からなる粒子群毎に各粒子の状態変数の分布を対応付ける。
図5は、本実施形態に係る位置情報統合処理の概要を示す概念図である。
本実施形態に係る位置情報統合処理は、主に情報源対応付け、状態遷移及び再標本化の各過程を含む。これらの過程は、粒子フィルタリング法の一部に基づく処理である。
図5において、上段はI.情報源対応付け、中段はII.状態遷移、下段はIII.再標本化の各過程の概念を示す。各段ともに、横軸は位置を示し、円で示される粒子の分布を表す。円の大きさは、各粒子の重み係数の大きさを表す。
左側の分布を示す「粒子群A」は、情報統合部31が、その分布を位置A1、位置A2の情報源に対応した粒子群(Particle Group; PG)Aと対応付けられることを表す。粒子群とは、複数の粒子からなる組を指す。情報統合部31は、位置情報と状態変数(この例では位置情報)の分布をもつ粒子群を対応付けることにより、位置情報の検出誤差への耐性を担保することができる。
右側の「粒子を生成させる領域」は、情報統合部31が、入力させた位置情報が示す位置に対応する粒子が存在しないため、この位置の周辺の領域が新たに粒子を生成させる領域であることを表す。このようにして、情報統合部31は粒子群単位で対応する位置情報の有無により、粒子群を消滅又は生成する。
図5の下段は、中段に示す粒子のうち予め定めた第1の値よりも重み係数が大きい粒子を分割し、予め定めた第2の値よりも重み係数が小さい粒子を棄却することを示す。終点に×印が示されている破線の矢印は、情報統合部31が、その起点にある粒子を棄却することを示す。太い実線の矢印は、情報統合部31が、その起点にある粒子を分割することを示す。濃い塗りつぶしの円は、分割して新たに生成した粒子を示す。推定位置を示す上向きの矢印は、情報統合部31は、これらの粒子からなる粒子群の位置情報に基づき矢印の終点が示す位置を示す位置情報を生成することを示す。
図6は、本実施形態に係る位置情報統合処理を示すフローチャートである。
(ステップS201)情報統合部31は、本処理に係る係数を初期設定する。
情報統合部31は、処理に用いる係数、例えば、本処理の繰り返し回数Nrep、情報源毎の粒子数Np、粒子の初期分布の分散σp、第1の位置情報の推定誤差e1ψ、第2の位置情報の推定誤差e2ψ、尤度の閾値KPG、粒子群を消滅させるまでの生存フレーム数(生存期間)Lu、第1の位置情報に対する重み係数w1、第2の位置情報に対する重み係数w2を、それぞれ105、1000、5°、5°、5°、0.005、100、0.5、0.5と設定する。本実施形態では、上述の係数値に限らず、他の値を用いてもよい。また、情報統合部31は、粒子群は存在しないものと設定する。その後、ステップS202に進む。
(ステップS204)情報統合部31は、入力された第1の位置情報と第2の位置情報と各粒子が属す粒子群との対応付けを行う。そのために、情報統合部31は、次の処理を行う。
情報統合部31は、第1の位置情報が示す情報源(例えば音源)毎の位置情報(例えば、推定方向ψ)と粒子iの位置情報(ψi)に基づいて、例えば式(8)を用いて第1の位置情報による粒子iの尤度L1iを算出する。
情報統合部31は、第2の位置情報が示す情報源(例えばクラスタ)毎の位置情報と粒子iの位置情報(ψi)に基づいて、例えば式(9)を用いて第2の位置情報による粒子iの尤度L2iを算出する。但し、情報統合部31は、尤度L2iを算出する前に、3次元の直交座標で表された第2の位置情報を座標変換して方向ψを算出する。
情報統合部31は、算出した尤度L1iと尤度L2iを、例えば式(10)を用いて重み付け加算して、尤度Liを算出する。
情報統合部31は、算出した尤度Lが閾値KPGと等しいか、又は大きい粒子群が、その入力された位置情報が示す情報源に対応すると判断し、算出した尤度Lが閾値KPGよりも小さい粒子群が、その入力された位置情報が示す情報源に対応しないと判断する。その後、ステップS205に進む。
情報統合部31は、1つの粒子群についてNp個の粒子を対応する情報源の位置(推定方向)を中心に、各粒子の位置が分布するように生成する。ここで、情報統合部31は、例えば、分散σpの正規分布となるように粒子を生成する。粒子を生成するとは、情報統合部31が、粒子の位置情報と重み係数の組を状態変数として生成することを指す。このとき、情報統合部31は、各粒子の重み係数を1/Npと、粒子毎に等しい値であって、合計が1に正規化されるように定める。その後、ステップS206に進む。
情報統合部31は、消滅後フレーム数が予め定められた閾値Luより大きくないと判断したとき(ステップS207 N)、ステップS208に進む。
(ステップS209)情報統合部31は、対応する情報源がないと判断した粒子群を消滅させる。ここで、情報統合部31は、その粒子群に属する粒子iに対応する状態変数及び重み係数を削除する。その後、ステップS210に進む。
ここで、情報統合部31は、例えば、ランダムウォークモデルに基づいて現在のフレームtの位置情報(推定方向)ψ(t)に雑音成分rを加えて次のフレームt+1の位置情報ψ(t+1)に更新する。雑音成分rは、例えば、その分布が、予め設定された平均値(ゼロ、即ち原点)及び分散の正規分布であるガウス雑音である。これにより、情報統合部31は、粒子の分布が時間の経過により次第に拡散する状況を考慮でき、環境の変化に対して頑健に位置情報を推定できる。なお、本実施形態では、情報統合部31は、ランダムウォークモデルに基づく方法に限らず、例えば、過去のフレームの位置情報も考慮した運動方程式を導入して次のフレームの位置情報を算出してもよい。その後、ステップS211に進む。
ここで、情報統合部31は、例えば、現在のフレームtの重み係数wi(t)に尤度Li(t)を乗算して次のフレームt+1の重み係数wi(t+1)を算出する。これにより、情報統合部31は、入力された位置情報に基づく情報源と粒子iとの関連性、即ち尤度Li高いほど重み係数wiが大きくなるように重みづけることができる。その後、ステップS212に進む。
再標本化において、情報統合部31は、例えばSIR(sampling importance resampling)法に基づいて次の処理を行う。
情報統合部31は、粒子i毎の重み係数wiを、その粒子群における重み係数の総和で除算して、規格化重み係数piを算出する。情報統合部31は、算出した規格化重み係数piが、予め設定した閾値pthよりも小さい粒子iを消滅させ、算出した規格化重み係数piが、予め設定した閾値pthと等しい、又はより大きい粒子iを維持する。このとき、情報統合部31は、消滅させて粒子数Ndを計数する。情報統合部31は、規格化重み係数を新たな重み係数と定める。
情報統合部31は、推定位置情報を算出する際、加重平均の代わりに、単純平均等、他の方法を用いてもよい。情報統合部31は、算出した推定位置情報を位置推定装置1の外部に出力する。
その後、情報統合部31は処理対象のフレームtを次フレームt+1に進め、ステップS202に進む。
但し、以下に述べる条件下で位置検出装置1を実時間で動作させた。
位置検出装置1は、人型ロボットに装着され、第1情報検出部11と第2情報検出部12はロボットの頭部に配置されている。1名の利用者が、ロボットの右前方−60°から左前方60°の範囲で発話しながら移動する。この方向は、ロボットの前方正面を0°とする方位角であり、正の値は前方正面より左側であること、負の値は前方正面より右側であることを示す。即ち、次に説明する推定位置情報は、その利用者を情報源とする時間経過に伴って変化する方向を示す情報である。
図7は、最上段から順に(a)参照位置情報、(b)第1位置情報、(c)第2位置情報、(d)本実施形態を示す。いずれも、横軸はフレーム時刻(フレーム番号)を示し、縦軸は位置情報として方向を示す。ここで、1フレームは20msである。
図7(a)は、当初は利用者の方向が50°であり、時間経過に伴い利用者は右側に移動することを示す。フレーム時刻2300において方向が−45°となる。その後、利用者は左側に移動し、フレーム時刻3100において方向が−3°となる。その後、利用者は右側に移動し、フレーム時刻4000において方向が−23°となる。その後、利用者は左側に移動し、フレーム時刻4900において方向が18°となる。その後、利用者は右側に移動し、フレーム時刻6000において方向が−40°となる。その後、利用者は右側に移動し、フレーム時刻7000において方向が33°となる。
図7(b)は、フレーム時刻0から600まで、1900から2800まで、3800から4200まで、5900から6500までの区間において、方向が示されていないことを示す。この結果は、利用者が発話していない等の原因により、第1の位置情報の推定に失敗している可能性を示す。但し、その他の区間においては、方向は参照位置情報とほぼ同様な値である。
図7(c)において、フレーム時刻0から300まで、1000から1600まで、3000から3500まで、4700から5600までの間、方向が示されていない区間である。この方向が示されていない区間は、参照位置情報が極大又は極小値となる区間となる傾向がある。
また、その他の区間において、方向は参照位置情報とほぼ同様な値であるが、短い周期の時間変動が参照位置情報より著しい。この結果は、熱画像センタ部121及び距離画像センサ部122が取得する背景雑音が方向推定に影響を与えることを示す。
図7(d)が示す方向は、(a)と同様な時間変化を示す。即ち、本実施形態では、(b)において方向が示されていない区間と、(c)において方向が示されていない区間を補完することを示す。
また、図7(d)が示す方向は、(a)、(c)よりも滑らかであり、背景雑音による影響が緩和されていることを示す。これは、情報統合部31が、粒子フィルタリングを用いることにより、誤差を見込むと同時に尤度が高い情報が重視されて、環境の変動に対してロバストに位置情報を推定できることを示す。
これにより、注目する情報源を確実に抽出し、その情報の種別の同定と位置情報の推定を精度よく行うことができる。
また、上述した実施形態における位置検出装置1の一部、または全部を、LSI(Large Scale Integration)等の集積回路として実現しても良い。位置検出装置1の各機能ブロックは個別にプロセッサ化してもよいし、一部、または全部を集積してプロセッサ化しても良い。また、集積回路化の手法はLSIに限らず専用回路、または汎用プロセッサで実現しても良い。また、半導体技術の進歩によりLSIに代替する集積回路化の技術が出現した場合、当該技術による集積回路を用いても良い。
211…第1音源定位部、213…音源分離部、214…音源同定部、
215…伝達関数記憶部、216…相関行列生成部、217…目的音選択部、
218…第2音源定位部
12…第2情報検出部、22…第2位置情報推定部、
2211…第1二値化部、2212…第2二値化部、2221…第1クラスタリング部、
2222…第2クラスタリング部、2231…第1不要クラスタ除去部、
2232…第2不要クラスタ除去部、225…マッピング部、
226…第3クラスタリング部、227…物体定位部227、
31…情報統合部
Claims (6)
- 情報源を表す第1の態様の情報に基づいて第1の位置情報を推定する第1位置情報推定部と、
前記情報源を表す第2の態様の情報に基づいて第2の位置情報を推定する第2位置情報推定部と、
前記第1の位置情報及び前記第2の位置情報の各々と複数の粒子からなる粒子群を対応付け、対応付けられた粒子群に属する粒子毎の位置情報に基づいて前記情報源の位置情報を算出する情報統合部と
を備え、
前記第1位置情報推定部は、
前記第1の態様の情報の種別を表すクラス情報を決定する情報源同定部と、
前記決定されたクラス情報から選択された目的情報に対応する情報源の位置情報を算出する情報源定位部と
を備えることを特徴とする位置検出装置。 - 前記情報統合部は、
前記第1の位置情報及び前記第2の位置情報のいずれにも対応しない粒子群を消滅させ、前記第1の位置情報及び前記第2の位置情報に対応する粒子群がない場合、対応する粒子群を生成することを特徴とする請求項1に記載の位置検出装置。 - 前記情報統合部は、
前記第1の位置情報及び前記第2の位置情報の各々と前記粒子の位置情報との距離に基づいて、前記粒子が属する粒子群が対応するか否か判断することを特徴とする請求項1又は2に記載の位置検出装置。 - 前記第1の態様の情報に基づく第1の相関行列に基づいて、前記クラス情報に対応する第2の相関行列を算出する目的情報選択部を備え、
前記情報源定位部は、
前記第1の相関行列と前記クラス情報に対応する第2の相関行列に基づいて算出した固有ベクトルと位置情報毎の伝達関数ベクトルを用いて算出した空間スペクトルを最大にする位置情報を前記目的情報に対応する情報源の位置情報として算出することを特徴とする請求項1に記載の位置検出装置。 - 前記第1の態様の情報は音響信号であり、前記第2の態様の情報は画像信号であることを特徴とする請求項1から4のいずれか1項に記載の位置検出装置。
- 位置検出装置における位置検出方法において、
前記位置検出装置が、情報源を表す第1の態様の情報に基づいて第1の位置情報を推定する第1の過程と、
前記位置検出装置が、前記情報源を表す第2の態様の情報に基づいて第2の位置情報を推定する第2の過程と、
前記位置検出装置が、前記第1の位置情報及び前記第2の位置情報の各々と複数の粒子からなる粒子群を対応付け、対応付けられた粒子群に属する粒子毎の位置情報に基づいて前記情報源の位置情報を算出する第3の過程と
を有し、
前記第1の過程は、
前記位置検出装置が、前記第1の態様の情報の種別を表すクラス情報を決定する情報源同定過程と、
前記位置検出装置が、前記決定されたクラス情報から選択された目的情報に対応する情報源の位置情報を算出する情報源定位過程と
を有することを特徴とする位置検出方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US37437410P | 2010-08-17 | 2010-08-17 | |
US61/374,374 | 2010-08-17 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012042454A JP2012042454A (ja) | 2012-03-01 |
JP5701164B2 true JP5701164B2 (ja) | 2015-04-15 |
Family
ID=45898929
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011138595A Active JP5701164B2 (ja) | 2010-08-17 | 2011-06-22 | 位置検出装置及び位置検出方法 |
Country Status (2)
Country | Link |
---|---|
US (2) | US10037357B1 (ja) |
JP (1) | JP5701164B2 (ja) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10037357B1 (en) | 2010-08-17 | 2018-07-31 | Google Llc | Selecting between global and location-specific search results |
JP5997007B2 (ja) * | 2012-10-31 | 2016-09-21 | 日本電信電話株式会社 | 音源位置推定装置 |
US11675795B2 (en) * | 2015-05-15 | 2023-06-13 | Yahoo Assets Llc | Method and system for ranking search content |
CN105070304B (zh) * | 2015-08-11 | 2018-09-04 | 小米科技有限责任公司 | 实现对象音频录音的方法及装置、电子设备 |
CN105513612A (zh) * | 2015-12-02 | 2016-04-20 | 广东小天才科技有限公司 | 语言词汇的音频处理方法及装置 |
US10242074B2 (en) * | 2016-02-03 | 2019-03-26 | Facebook, Inc. | Search-results interfaces for content-item-specific modules on online social networks |
US10628458B2 (en) * | 2017-01-31 | 2020-04-21 | Walmart Apollo, Llc | Systems and methods for automated recommendations |
US11609964B2 (en) | 2017-01-31 | 2023-03-21 | Walmart Apollo, Llc | Whole page personalization with cyclic dependencies |
US11010784B2 (en) | 2017-01-31 | 2021-05-18 | Walmart Apollo, Llc | Systems and methods for search query refinement |
US10554779B2 (en) | 2017-01-31 | 2020-02-04 | Walmart Apollo, Llc | Systems and methods for webpage personalization |
US10592577B2 (en) | 2017-01-31 | 2020-03-17 | Walmart Apollo, Llc | Systems and methods for updating a webpage |
JP6924066B2 (ja) * | 2017-04-27 | 2021-08-25 | 株式会社デンソーテン | レーダ装置および物標検出方法 |
EP3678385B1 (en) * | 2017-08-30 | 2023-01-04 | Panasonic Intellectual Property Management Co., Ltd. | Sound pickup device, sound pickup method, and program |
US10949224B2 (en) | 2019-01-29 | 2021-03-16 | Walmart Apollo Llc | Systems and methods for altering a GUI in response to in-session inferences |
US10803065B1 (en) * | 2019-09-12 | 2020-10-13 | Business Objects Software Ltd | Microcubes |
JP7189555B2 (ja) * | 2019-12-11 | 2022-12-14 | 本田技研工業株式会社 | 音響処理装置、音響処理方法およびプログラム |
Family Cites Families (35)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4845658A (en) * | 1986-12-01 | 1989-07-04 | Massachusetts Institute Of Technology | Information method and apparatus using simplex and duplex communications |
US5675819A (en) * | 1994-06-16 | 1997-10-07 | Xerox Corporation | Document information retrieval using global word co-occurrence patterns |
US6393415B1 (en) * | 1999-03-31 | 2002-05-21 | Verizon Laboratories Inc. | Adaptive partitioning techniques in performing query requests and request routing |
JP2003524259A (ja) * | 2000-02-22 | 2003-08-12 | メタカルタ インコーポレイテッド | 情報の空間符号化及び表示 |
US8346770B2 (en) * | 2003-09-22 | 2013-01-01 | Google Inc. | Systems and methods for clustering search results |
US7353109B2 (en) * | 2004-02-05 | 2008-04-01 | Alpine Electronics, Inc. | Display method and apparatus for navigation system for performing cluster search of objects |
US8341143B1 (en) * | 2004-09-02 | 2012-12-25 | A9.Com, Inc. | Multi-category searching |
US7801899B1 (en) * | 2004-10-01 | 2010-09-21 | Google Inc. | Mixing items, such as ad targeting keyword suggestions, from heterogeneous sources |
US7483881B2 (en) * | 2004-12-30 | 2009-01-27 | Google Inc. | Determining unambiguous geographic references |
US7822751B2 (en) | 2005-05-27 | 2010-10-26 | Google Inc. | Scoring local search results based on location prominence |
US7826965B2 (en) * | 2005-06-16 | 2010-11-02 | Yahoo! Inc. | Systems and methods for determining a relevance rank for a point of interest |
US9183349B2 (en) * | 2005-12-16 | 2015-11-10 | Nextbio | Sequence-centric scientific information management |
WO2007081681A2 (en) * | 2006-01-03 | 2007-07-19 | Textdigger, Inc. | Search system with query refinement and search method |
US7761350B1 (en) * | 2006-04-26 | 2010-07-20 | Aol Inc. | Biasing of search result clustering to ensure more effective point of interest (POI) targeting |
WO2007129731A1 (ja) * | 2006-05-10 | 2007-11-15 | Honda Motor Co., Ltd. | 音源追跡システム、方法、およびロボット |
US7630972B2 (en) * | 2007-01-05 | 2009-12-08 | Yahoo! Inc. | Clustered search processing |
US7966321B2 (en) * | 2007-01-17 | 2011-06-21 | Google Inc. | Presentation of local results |
US8359300B1 (en) * | 2007-04-03 | 2013-01-22 | Google Inc. | System and method for displaying both localized search results and internet search results |
US7917490B2 (en) * | 2007-07-09 | 2011-03-29 | Google Inc. | Interpreting local search queries |
JP2009031951A (ja) * | 2007-07-25 | 2009-02-12 | Sony Corp | 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム |
US8892455B2 (en) * | 2007-09-28 | 2014-11-18 | Walk Score Management, LLC | Systems, techniques, and methods for providing location assessments |
US8090714B2 (en) * | 2007-11-16 | 2012-01-03 | Iac Search & Media, Inc. | User interface and method in a local search system with location identification in a request |
US8423536B2 (en) * | 2008-08-05 | 2013-04-16 | Yellowpages.Com Llc | Systems and methods to sort information related to entities having different locations |
US8151205B2 (en) * | 2008-09-30 | 2012-04-03 | Nokia Corporation | Methods, apparatuses, and computer program products for providing activity coordination information |
US20100171763A1 (en) * | 2009-01-05 | 2010-07-08 | Apple Inc. | Organizing Digital Images Based on Locations of Capture |
JP2010165305A (ja) * | 2009-01-19 | 2010-07-29 | Sony Corp | 情報処理装置、および情報処理方法、並びにプログラム |
CN102034782A (zh) * | 2009-09-30 | 2011-04-27 | 万国半导体有限公司 | 一种用于功率半导体器件的混合合金引线框架 |
US8433512B1 (en) * | 2009-11-12 | 2013-04-30 | Google Inc. | Enhanced identification of interesting points-of-interest |
CA2721404A1 (en) * | 2009-11-17 | 2011-05-17 | Daniel Blais | System and method for searching a database |
US8611678B2 (en) * | 2010-03-25 | 2013-12-17 | Apple Inc. | Grouping digital media items based on shared features |
US8538973B1 (en) * | 2010-04-05 | 2013-09-17 | Google Inc. | Directions-based ranking of places returned by local search queries |
US8463772B1 (en) * | 2010-05-13 | 2013-06-11 | Google Inc. | Varied-importance proximity values |
US10037357B1 (en) | 2010-08-17 | 2018-07-31 | Google Llc | Selecting between global and location-specific search results |
US20140358971A1 (en) * | 2010-10-19 | 2014-12-04 | Google Inc. | Techniques for identifying chain businesses and queries |
US9098589B1 (en) * | 2010-11-23 | 2015-08-04 | Google Inc. | Geographic annotation of electronic resources |
-
2010
- 2010-12-09 US US12/964,158 patent/US10037357B1/en active Active
-
2011
- 2011-06-22 JP JP2011138595A patent/JP5701164B2/ja active Active
-
2018
- 2018-07-31 US US16/051,449 patent/US11461336B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2012042454A (ja) | 2012-03-01 |
US20180336249A1 (en) | 2018-11-22 |
US11461336B2 (en) | 2022-10-04 |
US10037357B1 (en) | 2018-07-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5701164B2 (ja) | 位置検出装置及び位置検出方法 | |
US10045120B2 (en) | Associating audio with three-dimensional objects in videos | |
JP7158806B2 (ja) | オーディオ認識方法、ターゲットオーディオを位置決める方法、それらの装置、およびデバイスとコンピュータプログラム | |
US9495591B2 (en) | Object recognition using multi-modal matching scheme | |
US9749738B1 (en) | Synthesizing audio corresponding to a virtual microphone location | |
Shih et al. | Occupancy estimation using ultrasonic chirps | |
Aarabi et al. | Robust sound localization using multi-source audiovisual information fusion | |
CN106653041B (zh) | 音频信号处理设备、方法和电子设备 | |
JP4912778B2 (ja) | 信号源の軌跡をモデル化する方法及びシステム | |
EP2123116B1 (en) | Multi-sensor sound source localization | |
Checka et al. | Multiple person and speaker activity tracking with a particle filter | |
JP6467736B2 (ja) | 音源位置推定装置、音源位置推定方法および音源位置推定プログラム | |
JP2017044916A (ja) | 音源同定装置および音源同定方法 | |
JP7370014B2 (ja) | 収音装置、収音方法、及びプログラム | |
KR20060029043A (ko) | 오디오/비디오 센서를 이용한 위치 파악, 추적 및 분리장치와 그 방법 | |
TW201120469A (en) | Method, computer readable storage medium and system for localizing acoustic source | |
JP6543848B2 (ja) | 音声処理装置、音声処理方法及びプログラム | |
JP2014098568A (ja) | 音源位置推定装置、音源位置推定方法および音源位置推定プログラム | |
WO2020116054A1 (ja) | 信号処理装置及び信号処理方法 | |
CN109997186B (zh) | 一种用于分类声环境的设备和方法 | |
CN112614508A (zh) | 音视频结合的定位方法、装置、电子设备以及存储介质 | |
Zhang et al. | AcousticFusion: Fusing sound source localization to visual SLAM in dynamic environments | |
Liu et al. | 3D audio-visual speaker tracking with a two-layer particle filter | |
EP2362238B1 (en) | Estimating the distance from a sensor to a sound source | |
Andra et al. | Feasibility evaluation for keyword spotting system using mini microphone array on UAV |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20131127 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140627 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140708 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140812 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150203 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150217 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5701164 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |