JP5193518B2 - パターン探索装置及びその方法 - Google Patents

パターン探索装置及びその方法 Download PDF

Info

Publication number
JP5193518B2
JP5193518B2 JP2007183788A JP2007183788A JP5193518B2 JP 5193518 B2 JP5193518 B2 JP 5193518B2 JP 2007183788 A JP2007183788 A JP 2007183788A JP 2007183788 A JP2007183788 A JP 2007183788A JP 5193518 B2 JP5193518 B2 JP 5193518B2
Authority
JP
Japan
Prior art keywords
pattern
learning
search
distribution
dimension
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2007183788A
Other languages
English (en)
Other versions
JP2009020769A (ja
Inventor
智行 柴田
修 山口
俊和 和田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2007183788A priority Critical patent/JP5193518B2/ja
Priority to US12/170,597 priority patent/US8510311B2/en
Publication of JP2009020769A publication Critical patent/JP2009020769A/ja
Application granted granted Critical
Publication of JP5193518B2 publication Critical patent/JP5193518B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24147Distances to closest patterns, e.g. nearest neighbour classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Probability & Statistics with Applications (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Description

本発明は、学習パターン集合中から入力パターンに対してハッシュ関数を用いて高速に最近傍パターンを探索するパターン探索装置及びその方法に関する。
従来のハッシュ関数を用いた近似最近傍探索法には、非特許文献1と非特許文献2に開示されているものがある。この従来技術は、図5に示すように、学習パターン集合を任意ベクトル上に射影し、そのベクトル上での存在範囲を一定間隔で分割するハッシュ関数を定義し、入力パターンのハッシュ値により学習パターン集合中の限られた最近傍候補から最近傍パターンを探索するものである。
P. Indyk and R. Motwani, 「Approximate Nearest Neighbors: Towards Removing the Curse of Dimensionality,」 In Proceedings of the 30th ACM Symposium on Theory of Computing (STOC'98) , pp.604-613, May 1998. M. Datar, P. Indyk, N. Immorlica, and V. Mirrokni,「Locality-Sensitive Hashing Scheme Based on p-Stable Distributions,」 In Proceedings of the 20th Annual Symposium on Computational Geometry(SCG2004), June 2004.
上記したように、従来技術には、図5に示すように、登録済みパターンを任意ベクトル上に射影し、そのベクトル上での存在範囲を一定間隔で分割するハッシュ関数を用いるものがある。
しかし、ハッシュ関数により分割した空間領域(以下、バケットという)において探索対象である入力パターンを内包するバケット中に存在する学習パターンが、学習パターン集合の分布に応じてパターン数が異なり、学習パターンの密度が高いバケットでは探索時間が遅くなり、学習パターンの密度が低いバケットでは真の最近傍パターンと得られた近似最近傍パターンとの距離の誤差の比(以下、誤差比という)が高くなるという問題点がある。
また、探索対象である入力パターンを内包するバケット中に学習パターンが存在しない場合、探索することができないという問題点がある。
そこで本発明は、上記問題点を解決するためになされたものであって、探索速度の高速化と誤差比の低減を可能とするパターン探索装置及びその方法を提供することを目的とする。
本発明は、d次元の複数の学習パターンを記憶する記憶部と、前記複数の学習パターンから、前記d次元の任意の次元軸上における前記学習パターンのそれぞれの存在確率の累積確率を表す累積確率分布を求める分布獲得部と、前記d次元の各次元において累積確率値がそれぞれ一定の幅になるように分割された複数の確率区間のそれぞれに、前記d次元の前記累積確率分布で対応する前記次元軸上の分布区間内の任意の点の値を、前記各確率区間に対応するハッシュ値に変換するハッシュ関数を求めるハッシュ関数獲得部と、前記ハッシュ関数を用いて前記各学習パターンのハッシュ値をそれぞれ求め、前記各学習パターンを前記ハッシュ値に対応するバケットに分類する学習部と、前記ハッシュ関数を用いて入力パターンのハッシュ値を求め、前記入力パターンのハッシュ値に対応するバケットに属する前記学習パターンの中から、前記入力パターンに最も類似する前記学習パターンを探索する探索部と、を有したことを特徴とするパターン探索装置である。
本発明によれば、学習パターンの累積確率分布から、確率値を一定間隔で分割するハッシュ関数を定義するため、各バケット中のパターン数がほぼ一定になり、最近傍解を得る際の平均的な探索速度の高速化と誤差比の低減を可能とする。
以下、本発明の実施形態について図面に基づいて説明する。
(第1の実施形態)
以下、第1の実施形態のパターン探索装置1について図1と図2に基づいて説明する。
本実施形態のパターン探索装置1は、図2に示すように、予め検索対象となる複数の学習パターンを学習パターン集合として登録する。ここで、学習パターン集合は正規分布(ガウス分布)で表現できると仮定する。
これら学習パターンの任意の軸上における累積確率分布をシグモイド関数で近似し、その累積確率分布を基に確率値を一定間隔で分割するハッシュ関数を複数個定義する。
そして、未知のパターンが入力されると各ハッシュ関数の出力であるハッシュ値によりバケット中に存在する学習パターン集合の各部分集合からの和集合を求め、その和集合中から入力パターンに最も類似する学習パターン(以下、最近傍パターンという)を探索する。
本実施形態のパターン探索装置1は、パターン認識に用いられるものであり、例えば、画像に写された物体認識(例えば、顔認識)やデータマイニングに適用できる。
(1)パターン探索装置1の構成
図1は、本実施形態に係わるパターン探索装置1を示すブロック図である。
パターン探索装置1は、登録部2、累積確率分布獲得部3、ハッシュ関数部4、学習部5、探索部6から構成されている。
各部2〜6の下記で説明する各機能は、コンピュータに格納されたプログラムによっても実現できる。
以下、順番に各部の機能を説明する。
(2)登録部2
登録部2は、予め検索対象となる顔画像などの複数の学習パターンを学習パターン集合として登録する。
そして、登録した学習パターンを累積確率分布獲得部3と学習部5に送る。
(3)累積確率分布獲得部3
累積確率分布獲得部3は、登録部2で登録した学習パターン集合の任意軸での累積確率分布を主成分分析で求める。
本実施形態では、学習パターン集合が正規分布(ガウス分布)であると仮定し、全ての次元での累積確率分布を求めるが、仮にd次元上での累積確率分布を推定し分布を求める場合、下記の(1)式のシグモイド関数により近似する。
Figure 0005193518
ここで、μは平均値、αは標準偏差である。この2つのパラメータは初期値としては前記学習パターン集合の平均値と標準偏差を用い、最小二乗近似により累積確率分布へのシグモイド関数当てはめの最適化を行う。
獲得した各累積確率分布をハッシュ関数部4に送る。
(4)ハッシュ関数部4
ハッシュ関数部4は、累積確率分布獲得部3により求めた累積確率分布のそれぞれについて、確率値が一定になるようにn個に分割するハッシュ関数を求める。
ハッシュ関数は、下記の(2)式で定義できる。
Figure 0005193518
ここで、ΔはPs(x)の値域[0,1]を[0,Δ],[Δ,2Δ],・・・[(n−1)Δ,1]のようにn個に分割した際の1つのバケットの確率値である。
各次元でのハッシュ関数を獲得し、学習部5と探索部6に送る。
(5)学習部5
学習部5は、登録部2により登録した学習パターン集合とハッシュ関数部4により獲得した各ハッシュ関数により、学習パターン集合に属する各学習パターンを、各ハッシュ関数の出力値であるハッシュ値に対応する各バケットに振り分け、部分集合を構成して、リスト構造にする。
これら部分集合は、パターンの次元数がDで、n個に分割するハッシュ関数である場合、全部でDn個生成する。
生成した部分集合は、探索部6に送る。
(6)探索部6
探索部6には、まず検索したい顔画像などの未知のパターンqが入力される。そして、この入力パターンqについての、学習パターン集合ALLの中から最も類似する学習パターン(すなわち、最近傍パターン)を探索する。
この探索は、ハッシュ関数部4により獲得した各ハッシュ関数と、学習部5によって生成した部分集合により探索する。
入力パターンqを入力値としたときハッシュ関数の出力であるハッシュ値Hにより限定される部分集合BiHは、下記の(3)式で定義できる。
Figure 0005193518
ここでは、ランダムで選択したm個のハッシュ関数により得られる部分集合の和集合を最近傍候補C(q)とする。
Figure 0005193518
このとき、最近傍候補C(q)を獲得する際に、含まれたバケット数を重複度w(x)とし、これによりソートし最大となるパターンと入力パターンとの距離を暫定距離zとする。xとxのL距離をd(x,x)と定義すると、暫定距離zは下記の(5)式のようになる。
Figure 0005193518
ここで、下記の(6)式を満たす候補xは最近傍にはなり得ないので最近傍候補C(q)から除外できる。
Figure 0005193518
この性質に基づき、以下の手続きで絞込み探索を行う。
ステップ1において、i:=1とする。
ステップ2において、Ci−1(q)内の各要素に対して上記の(6)式の条件を満足する候補を除外し、得られた候補集合をC(q)とする。もし、i=mなら、ステップ4へ進む。もし、|C(q)|=1なら、その要素を最近傍パターンとして停止する。
ステップ3において、i:=i+1としてステップ2に戻る。
ステップ4において、C(q)内の候補全てと入力パターンとの距離計算を行い、最小距離を与える学習パターンを最近傍パターンとして停止する。
最後に獲得した最近傍パターンをパターン探索装置1の外部に出力する。
(7)変更例
(7−1)変更例1
上記実施形態では、探索部6において最近傍候補C(q)は重複度w(x)により並び替え、上位b%のみとして探索してもよい。
(7−2)変更例2
上記実施形態では、探索部6においてハッシュ関数により得られる部分集合の和集合を最近傍候補C(q)としているが、探索部6においてハッシュ関数により得られる部分集合の積集合、または、その積集合の近傍の和集合を最近傍候補C(q)として探索してもよい。
(第2の実施形態)
本発明の第2の実施形態に係わるパターン探索装置101について図3に基づいて説明する。
本実施形態のパターン探索装置101と第1の実施形態のパターン探索装置1と異なる点は次の2点である。
第1の異なる点は、直交変換部107において学習パターン集合のそれぞれの学習パターンを部分空間に射影し、ベクトル空間内でのユークリッド距離に直交変換し、この直交変換した学習パターンを登録部102に登録する。
第2の異なる点は、累積確率分布獲得部103において、各学習パターンに関してシグモイド関数の重み付け和により累積確率分布を獲得する。
(1)パターン探索装置101の構成
図3は、本実施形態に係わるパターン探索装置101を示すブロック図である。
パターン探索装置101は、登録部102、累積確率分布獲得部103、ハッシュ関数部104、学習部105、探索部106、直交変換部107から構成されている。
なお、パターン探索装置101の動作のうち、第1の実施形態のパターン探索装置1と同様な処理については説明を省略する。
(2)直交変換部107
直交変換部107は、予め検索対象となる学習パターン集合を主成分分析する。そして、固有値の高い順に直交変換を行うためのN番目までの固有ベクトル、つまりN×Dの直交変換行列O={φ ,φ ,・・・,φ }を保存し、登録部102へ送る。
(3)登録部102
登録部102は、直交変換部107により獲得した固有ベクトルを用いて、予め検索対象となる学習パターン集合のそれぞれを直交変換した後、学習パターン集合として登録する。
そして、この直交変換した学習パターン集合を累積確率分布獲得部103と学習部105に送る。
(4)累積確率分布獲得部103
累積確率分布獲得部103は、登録部102で登録した学習パターン集合の各軸上での累積確率分布をそれぞれ求める。
ここでは各累積確率分布を、一般分布とし、この一般分布を混合ガウス分布と仮定し、シグモイド関数の重み付け和により推定する。実際には、ランダムで選択した学習パターンに対して、下記の(7)式により各学習パターンでのhを最適化し最小二乗近似により累積確率分布を関数化する。
Figure 0005193518
ここでh’はhの平均値である。nの個数は定数で与えるか、一般的な最適化手法により近似精度の許容範囲における最小数を求める。
(5)探索部106
探索部106は、まず検索したい顔画像などの未知の入力パターンqが入力される。そして、この入力パターンqについての、学習パターン集合ALL中の最近傍パターンを探索する。この探索は、ハッシュ関数部104により獲得した各ハッシュ関数と、学習部105によって生成した部分集合により探索する。
直交変換部107により獲得した固有ベクトルにより入力パターンを直交変換し、直交入力パターンOqとする。直交入力パターンを入力値としたときハッシュ関数の出力であるハッシュ値Hにより限定される部分集合BiHを下記の(8)式で定義できる。
Figure 0005193518
ここでは、ランダムで選択したm個のハッシュ関数により得られる部分集合の和集合を最近傍候補C(q)とする。
Figure 0005193518
このとき、最近傍候補C(q)を獲得する際に、含まれたバケット数を重複度w(x)とし、これによりソートし最大となるパターンと入力パターンとの距離を暫定距離zとする。xとxのL距離をd(x,x)と定義すると、暫定距離zは下記の(10)式のようになる。
Figure 0005193518
ここで、下記の(11)式を満たす候補xは最近傍にはなり得ないので最近傍候補C(q)から除外できる。
Figure 0005193518
この性質に基づき、固有値の高い主軸への射影成分から順に、以下の手続きで絞込み探索を行う。
ステップ1において、i:=1とする。
ステップ2において、Ci−1(q)内の各要素に対して上記の(11)式の条件を満足する候補を除外し、得られた候補集合をC(q)とする。もし、i=mなら、ステップ4へ進む。もし、|C(q)|=1なら、その要素を最近傍パターンとして停止する。
ステップ3においてi:=i+1としてステップ2に戻る。
ステップ4において、C(q)内の候補全てと入力パターンとの距離計算を行い、最小距離を与える学習パターンを最近傍パターンとして停止する。
このような計算を行う理由は、固有値の最も高い第一主成分は最も分散の大きい軸であり、C(q)−B1h1(q)の殆どの要素が、|φ q−φx|>zという条件を満足してしまうためφ の値を調べるだけで一挙に最近傍候補集合を小さくすることができる。第二主成分以降もそれ以降の主軸と比べた際に同様のことが言えるため、候補を絞り込む効率を考えると妥当な処理であるといえる。
最後に獲得した最近傍パターンをパターン探索装置1の外部に出力する。
(第3の実施形態)
本発明の第3の実施形態に係わるパターン認識装置201について図4に基づいて説明する。
本実施形態のパターン認識装置201と、第1の実施形態のパターン探索装置1及び第2の実施形態のパターン探索装置101と異なる点は次の点である。
第1の異なる点は、パターン認識装置201は、予め検索対象となる学習パターン集合を登録して学習パターン集合とする。この学習パターン集合に対応するクラスを登録し、入力パターンに対してパターン探索部208により最近傍パターンを探索し、クラス部209により出力した対応するクラスを認識結果として出力する。
第2の異なる点は、パターン探索部208は、累積確率分布獲得部203においてパターンを獲得する次元軸での値により、累積ヒストグラムを獲得し、それを累積確率分布とする。
(1)パターン認識装置201の構成
図4は、本実施形態に係わるパターン認識装置201を示すブロック図である。
パターン認識装置201は、登録部202、累積確率分布獲得部203、ハッシュ関数部204、学習部205、探索部206、直交変換部207、パターン探索部208、クラス部209から構成されている。
なお、パターン認識装置201の動作のうち、第1の実施形態のパターン探索装置1及び第2の実施形態のパターン探索装置101と同様な処理については説明を省略する。
(2)累積確率分布獲得部203
累積確率分布獲得部203は、登録部202で登録した学習パターン集合の各軸上での累積確率分布をそれぞれ獲得する。ここでは各累積確率分布を、学習パターン集合の各軸上での値により並び替えを行い、累積ヒストグラムを求めることにより推定する。
上記各実施形態における関数による分布表現との違いは、最適化パラメータがないため一意に求めることができる反面、学習パターンが少ないと学習パターン間の分布が線形で表現されるため誤差が大きくなる点である。
(3)パターン探索部208
パターン探索部208は、登録部202、累積確率分布獲得部203、ハッシュ関数部204、学習部205、探索部206、直交変換部207から構成され、入力パターンの最近傍パターンを、登録部202に登録した学習パターン集合の中から探索する。
(4)クラス部209
クラス部209は、学習パターン集合中の各パターンに対応するクラスを登録しておき、パターン探索部208により探索した入力パターンの最近傍パターンに対応するクラスを、入力パターンのクラスとしてパターン探索装置1の外部に出力する。
(変更例)
なお、本発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。
また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。
本発明の第1の実施形態のパターン探索装置の構成を示すブロック図である。 第1の実施形態の概念の説明図である。 第2の実施形態のパターン探索装置の構成を示すブロック図である。 第3の実施形態のパターン探索装置の構成を示すブロック図である。 従来技術の概念の説明図である。
符号の説明
1・・・パターン探索装置
2・・・登録部
3・・・累積確率獲得部
4・・・ハッシュ関数部
5・・・学習部
6・・・探索部

Claims (11)

  1. d次元の複数の学習パターンを記憶する記憶部と、
    前記複数の学習パターンから、前記d次元の任意の次元軸上における前記学習パターンのそれぞれの存在確率の累積確率を表す累積確率分布を求める分布獲得部と、
    前記d次元の各次元において累積確率値がそれぞれ一定の幅になるように分割された複数の確率区間のそれぞれに、前記d次元の前記累積確率分布で対応する前記次元軸上の分布区間内の任意の点の値を、前記各確率区間に対応するハッシュ値に変換するハッシュ関数を求めるハッシュ関数獲得部と、
    前記ハッシュ関数を用いて前記各学習パターンのハッシュ値をそれぞれ求め、前記各学習パターンを前記ハッシュ値に対応するバケットに分類する学習部と、
    前記ハッシュ関数を用いて入力パターンのハッシュ値を求め、前記入力パターンのハッシュ値に対応するバケットに属する前記学習パターンの中から、前記入力パターンに最も類似する前記学習パターンを探索する探索部と、
    を有したことを特徴とするパターン探索装置。
  2. 前記分布獲得部は、前記学習パターンの分布が正規分布であると仮定し、前記累積確率分布をシグモイド関数で近似する、
    請求項記載のパターン探索装置。
  3. 前記分布獲得部は、前記累積確率分布を関数の重み付け和によって近似する、
    請求項記載のパターン探索装置。
  4. 前記分布獲得部は、前記各次元軸に関して、前記学習パターンの値により累積ヒストグラムを獲得し、前記累積ヒストグラムを前記累積確率分布とする、
    請求項記載のパターン探索装置。
  5. 前記複数の学習パターンのそれぞれを部分空間に射影し、ベクトル空間内でのユークリッド距離に直交変換する直交変換部をさらに有し、
    前記記憶部は、前記直交変換した学習パターンをそれぞれ記憶する、
    請求項記載のパターン探索装置。
  6. 前記直交変換部は、前記学習パターンを主成分分析により直交変換する、
    請求項記載のパターン探索装置。
  7. 前記分布獲得部は、前記d次元のうちの任意の複数の次元軸のそれぞれについての累積確率分布をそれぞれ求め、
    前記ハッシュ関数獲得部は、前記各累積確率分布についてのハッシュ関数をそれぞれ求め、
    前記学習部は、前記各ハッシュ関数を用いて前記各学習パターンのハッシュ値をそれぞれ求めて、前記各学習パターンを前記各ハッシュ値に対応するバケットに分類し、
    前記探索部は、前記ハッシュ値に対応する前記バケット中の複数の前記学習パターンを求めるときに、前記各バケット中の前記学習パターンの和集合の中から前記探索を行う、
    請求項記載のパターン探索装置。
  8. 前記探索部は、前記学習パターンのそれぞれが前記和集合に属する回数を求め、前記回数が上位のみの複数の前記学習パターンの中から前記探索を行う、
    請求項記載のパターン探索装置。
  9. 前記分布獲得部は、前記d次元のうちの任意の複数の次元軸のそれぞれについての累積確率分布をそれぞれ求め、
    前記ハッシュ関数獲得部は、前記各累積確率分布についてのハッシュ関数をそれぞれ求め、
    前記学習部は、前記各ハッシュ関数を用いて前記各学習パターンのハッシュ値をそれぞれ求めて、前記各学習パターンを前記各ハッシュ値に対応するバケットに分類し、
    前記探索部は、前記ハッシュ値に対応する前記バケット中の複数の前記学習パターンを求めるときに、前記各バケット中の前記学習パターンの積集合、または、前記積集合の近傍の中から前記探索を行う、
    請求項記載のパターン探索装置。
  10. 記憶部が、d次元の複数の学習パターンを記憶する記憶ステップと、
    分布獲得部が、前記複数の学習パターンから、前記d次元の任意の次元軸上における前記学習パターンのそれぞれの存在確率の累積確率を表す累積確率分布を求める分布獲得ステップと、
    ハッシュ関数獲得部が、前記d次元の各次元において累積確率値がそれぞれ一定の幅になるように分割された複数の確率区間のそれぞれに、前記d次元の前記累積確率分布で対応する前記次元軸上の分布区間内の任意の点の値を、前記各確率区間に対応するハッシュ値に変換するハッシュ関数を求めるハッシュ関数獲得ステップと、
    学習部が、前記ハッシュ関数を用いて前記各学習パターンのハッシュ値をそれぞれ求め、前記各学習パターンを前記ハッシュ値に対応するバケットに分類する学習ステップと、
    探索部が、前記ハッシュ関数を用いて入力パターンのハッシュ値を求め、前記入力パターンのハッシュ値に対応するバケットに属する前記学習パターンの中から、前記入力パターンに最も類似する前記学習パターンを探索する探索ステップと、
    を有するパターン探索方法。
  11. d次元の複数の学習パターンを記憶する記憶機能と、
    前記複数の学習パターンから、前記d次元の任意の次元軸上における前記学習パターンのそれぞれの存在確率の累積確率を表す累積確率分布を求める分布獲得機能と、
    前記d次元の各次元において累積確率値がそれぞれ一定の幅になるように分割された複数の確率区間のそれぞれに、前記d次元の前記累積確率分布で対応する前記次元軸上の分布区間内の任意の点の値を、前記各確率区間に対応するハッシュ値に変換するハッシュ関数を求めるハッシュ関数獲得機能と、
    前記ハッシュ関数を用いて前記各学習パターンのハッシュ値をそれぞれ求め、前記各学習パターンを前記ハッシュ値に対応するバケットに分類する学習機能と、
    前記ハッシュ関数を用いて入力パターンのハッシュ値を求め、前記入力パターンのハッシュ値に対応するバケットに属する前記学習パターンの中から、前記入力パターンに最も類似する前記学習パターンを探索する探索機能と、
    をコンピュータに実現させるためのパターン探索プログラム。
JP2007183788A 2007-07-13 2007-07-13 パターン探索装置及びその方法 Active JP5193518B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2007183788A JP5193518B2 (ja) 2007-07-13 2007-07-13 パターン探索装置及びその方法
US12/170,597 US8510311B2 (en) 2007-07-13 2008-07-10 Pattern search apparatus and method thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007183788A JP5193518B2 (ja) 2007-07-13 2007-07-13 パターン探索装置及びその方法

Publications (2)

Publication Number Publication Date
JP2009020769A JP2009020769A (ja) 2009-01-29
JP5193518B2 true JP5193518B2 (ja) 2013-05-08

Family

ID=40253991

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007183788A Active JP5193518B2 (ja) 2007-07-13 2007-07-13 パターン探索装置及びその方法

Country Status (2)

Country Link
US (1) US8510311B2 (ja)
JP (1) JP5193518B2 (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5637939B2 (ja) * 2011-06-28 2014-12-10 Kddi株式会社 少ないコードブックの情報量によって高次元の特徴ベクトルを検索する検索装置及びプログラム
JP5598925B2 (ja) * 2011-06-29 2014-10-01 Kddi株式会社 高次元の特徴ベクトルを高精度で検索する検索装置及びプログラム
US8334898B1 (en) * 2011-07-26 2012-12-18 ByteLight, Inc. Method and system for configuring an imaging device for the reception of digital pulse recognition information
JP5592337B2 (ja) * 2011-11-18 2014-09-17 日本電信電話株式会社 コンテンツ変換方法、コンテンツ変換装置及びコンテンツ変換プログラム
WO2014050952A1 (ja) * 2012-09-27 2014-04-03 日本電気株式会社 バイナリデータ変換方法と装置及びプログラム
EP2945071B1 (en) 2013-01-11 2020-08-26 NEC Corporation Index generating device and method, and search device and search method
JP6038700B2 (ja) 2013-03-25 2016-12-07 株式会社東芝 整形装置
JP5957411B2 (ja) * 2013-04-25 2016-07-27 日本電信電話株式会社 アドレス解決システム及び方法
JP6631519B2 (ja) 2014-07-10 2020-01-15 日本電気株式会社 インデックス生成装置及びインデックス生成方法
JP6457648B2 (ja) * 2015-01-27 2019-01-23 ノキア テクノロジーズ オサケユイチア 位置特定およびマッピングの方法
US10778707B1 (en) * 2016-05-12 2020-09-15 Amazon Technologies, Inc. Outlier detection for streaming data using locality sensitive hashing
KR101958939B1 (ko) * 2017-03-30 2019-03-15 오드컨셉 주식회사 벡터 양자화의 혼합에 기초한 부호화 방법 및 이를 이용한 최근접 이웃 검색(nns) 방법

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0793159A (ja) * 1993-09-21 1995-04-07 Hitachi Ltd ルール生成装置およびそのための方法
US5802509A (en) * 1993-09-21 1998-09-01 Hitachi, Ltd. Rule generation system and method of generating rule
US7158654B2 (en) * 1993-11-18 2007-01-02 Digimarc Corporation Image processor and image processing method
US5668897A (en) * 1994-03-15 1997-09-16 Stolfo; Salvatore J. Method and apparatus for imaging, image processing and data compression merge/purge techniques for document image databases
US6236749B1 (en) * 1998-03-23 2001-05-22 Matsushita Electronics Corporation Image recognition method
US6421463B1 (en) * 1998-04-01 2002-07-16 Massachusetts Institute Of Technology Trainable system to search for objects in images
DE69901544T2 (de) * 1998-10-30 2003-01-16 Ibm Verfahren und vorrichtung zum erstellen eines musterwörterbuches zur anwendung in der erkennung von homologen sequenzen
JP4327289B2 (ja) * 1999-02-12 2009-09-09 Juki株式会社 部品認識方法および装置
JP2001266151A (ja) * 2000-03-17 2001-09-28 Toshiba Corp 個人識別装置および個人識別方法
US6556621B1 (en) * 2000-03-29 2003-04-29 Time Domain Corporation System for fast lock and acquisition of ultra-wideband signals
TWI282941B (en) * 2001-03-15 2007-06-21 Toshiba Corp Entrance management apparatus and entrance management method by using face features identification
US7200270B2 (en) * 2001-12-13 2007-04-03 Kabushiki Kaisha Toshiba Pattern recognition apparatus and method using distributed model representation of partial images
EP1504412B1 (en) * 2002-04-19 2018-04-11 CA, Inc. Processing mixed numeric and/or non-numeric data
US7796885B2 (en) * 2002-11-05 2010-09-14 Lightfleet Corporation Distribution optical elements and compound collecting lenses for broadcast optical interconnect
JP4114600B2 (ja) * 2003-12-02 2008-07-09 日本電気株式会社 可変長文字列検索装置及び可変長文字列検索方法並びにプログラム
JP3861157B2 (ja) * 2004-02-27 2006-12-20 国立大学法人広島大学 参照データ最適化装置とパターン認識システム
KR100560330B1 (ko) * 2004-04-21 2006-03-30 에이디정보통신 주식회사 색상 보정이 가능한 대용량 2차원 칼라 바코드인코딩/디코딩 시스템 및 그 방법
JP4349216B2 (ja) * 2004-06-21 2009-10-21 富士ゼロックス株式会社 分布適合度検定装置、消耗品補給タイミング判定装置、画像形成装置、分布適合度検定方法及びプログラム
US20060193159A1 (en) * 2005-02-17 2006-08-31 Sensory Networks, Inc. Fast pattern matching using large compressed databases
US7809722B2 (en) * 2005-05-09 2010-10-05 Like.Com System and method for enabling search and retrieval from image files based on recognized information
US8176052B2 (en) * 2006-03-03 2012-05-08 Perfect Search Corporation Hyperspace index

Also Published As

Publication number Publication date
JP2009020769A (ja) 2009-01-29
US20090019044A1 (en) 2009-01-15
US8510311B2 (en) 2013-08-13

Similar Documents

Publication Publication Date Title
JP5193518B2 (ja) パターン探索装置及びその方法
Xi et al. Fast time series classification using numerosity reduction
WO2019134567A1 (zh) 样本集的处理方法及装置、样本的查询方法及装置
CN107341178B (zh) 一种基于自适应的二进制量化哈希编码的数据检索方法
Lou et al. Matchminer: Efficient spanning structure mining in large image collections
KR101191223B1 (ko) 이미지 검색 방법, 장치, 및 이 방법을 실행하기 위한 컴퓨터 판독 가능한 기록 매체
JP5862413B2 (ja) 情報変換規則生成プログラム、情報変換規則生成装置および情報変換規則生成方法
De Marsico et al. HERO: human ear recognition against occlusions
JP2005011042A (ja) データ検索方法、データ検索装置、データ検索プログラムおよびコンピュータで読み取り可能な記録媒体
Ullah et al. ck-NN: A Clustered k-Nearest Neighbours Approach for Large-Scale Classification
US6301388B1 (en) Image matching apparatus
JP6004015B2 (ja) 学習方法、情報処理装置および学習プログラム
Zhang et al. Dynamic time warping under product quantization, with applications to time-series data similarity search
US20180173726A1 (en) Generation device, generation method, and non-transitory computer-readable recording medium
Hu et al. Fast k-means for large scale clustering
WO2010016313A1 (ja) パターン判定装置、方法、およびプログラム
JP5971722B2 (ja) ハッシュ関数の変換行列を定める方法、該ハッシュ関数を利用するハッシュ型近似最近傍探索方法、その装置及びそのコンピュータプログラム
Du et al. Large-scale signature matching using multi-stage hashing
JP2002537605A (ja) マッチングエンジン
Kusamura et al. GPU acceleration of content-based image retrieval based on SIFT descriptors
US9189693B2 (en) Information processing apparatus and information processing method
Sabahi et al. Perceptual image hashing using random forest for content-based image retrieval
Jayaraman et al. An enhanced geometric hashing
JP2010205043A (ja) パターン学習方法、装置、およびプログラム
Binh et al. A suite of techniques to improve random projection in time series motif discovery

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100527

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120508

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120628

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130108

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130204

R151 Written notification of patent or utility model registration

Ref document number: 5193518

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160208

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313114

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350