JP5193518B2 - パターン探索装置及びその方法 - Google Patents
パターン探索装置及びその方法 Download PDFInfo
- Publication number
- JP5193518B2 JP5193518B2 JP2007183788A JP2007183788A JP5193518B2 JP 5193518 B2 JP5193518 B2 JP 5193518B2 JP 2007183788 A JP2007183788 A JP 2007183788A JP 2007183788 A JP2007183788 A JP 2007183788A JP 5193518 B2 JP5193518 B2 JP 5193518B2
- Authority
- JP
- Japan
- Prior art keywords
- pattern
- learning
- search
- distribution
- dimension
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24147—Distances to closest patterns, e.g. nearest neighbour classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Probability & Statistics with Applications (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Description
P. Indyk and R. Motwani, 「Approximate Nearest Neighbors: Towards Removing the Curse of Dimensionality,」 In Proceedings of the 30th ACM Symposium on Theory of Computing (STOC'98) , pp.604-613, May 1998. M. Datar, P. Indyk, N. Immorlica, and V. Mirrokni,「Locality-Sensitive Hashing Scheme Based on p-Stable Distributions,」 In Proceedings of the 20th Annual Symposium on Computational Geometry(SCG2004), June 2004.
以下、第1の実施形態のパターン探索装置1について図1と図2に基づいて説明する。
図1は、本実施形態に係わるパターン探索装置1を示すブロック図である。
登録部2は、予め検索対象となる顔画像などの複数の学習パターンを学習パターン集合として登録する。
累積確率分布獲得部3は、登録部2で登録した学習パターン集合の任意軸での累積確率分布を主成分分析で求める。
ハッシュ関数部4は、累積確率分布獲得部3により求めた累積確率分布のそれぞれについて、確率値が一定になるようにn個に分割するハッシュ関数を求める。
学習部5は、登録部2により登録した学習パターン集合とハッシュ関数部4により獲得した各ハッシュ関数により、学習パターン集合に属する各学習パターンを、各ハッシュ関数の出力値であるハッシュ値に対応する各バケットに振り分け、部分集合を構成して、リスト構造にする。
探索部6には、まず検索したい顔画像などの未知のパターンqが入力される。そして、この入力パターンqについての、学習パターン集合ALLの中から最も類似する学習パターン(すなわち、最近傍パターン)を探索する。
(7−1)変更例1
上記実施形態では、探索部6において最近傍候補C(q)は重複度w(x)により並び替え、上位b%のみとして探索してもよい。
上記実施形態では、探索部6においてハッシュ関数により得られる部分集合の和集合を最近傍候補C(q)としているが、探索部6においてハッシュ関数により得られる部分集合の積集合、または、その積集合の近傍の和集合を最近傍候補C(q)として探索してもよい。
本発明の第2の実施形態に係わるパターン探索装置101について図3に基づいて説明する。
図3は、本実施形態に係わるパターン探索装置101を示すブロック図である。
直交変換部107は、予め検索対象となる学習パターン集合を主成分分析する。そして、固有値の高い順に直交変換を行うためのN番目までの固有ベクトル、つまりN×Dの直交変換行列O={φT 1,φT 2,・・・,φT N}を保存し、登録部102へ送る。
登録部102は、直交変換部107により獲得した固有ベクトルを用いて、予め検索対象となる学習パターン集合のそれぞれを直交変換した後、学習パターン集合として登録する。
累積確率分布獲得部103は、登録部102で登録した学習パターン集合の各軸上での累積確率分布をそれぞれ求める。
探索部106は、まず検索したい顔画像などの未知の入力パターンqが入力される。そして、この入力パターンqについての、学習パターン集合ALL中の最近傍パターンを探索する。この探索は、ハッシュ関数部104により獲得した各ハッシュ関数と、学習部105によって生成した部分集合により探索する。
本発明の第3の実施形態に係わるパターン認識装置201について図4に基づいて説明する。
図4は、本実施形態に係わるパターン認識装置201を示すブロック図である。
累積確率分布獲得部203は、登録部202で登録した学習パターン集合の各軸上での累積確率分布をそれぞれ獲得する。ここでは各累積確率分布を、学習パターン集合の各軸上での値により並び替えを行い、累積ヒストグラムを求めることにより推定する。
パターン探索部208は、登録部202、累積確率分布獲得部203、ハッシュ関数部204、学習部205、探索部206、直交変換部207から構成され、入力パターンの最近傍パターンを、登録部202に登録した学習パターン集合の中から探索する。
クラス部209は、学習パターン集合中の各パターンに対応するクラスを登録しておき、パターン探索部208により探索した入力パターンの最近傍パターンに対応するクラスを、入力パターンのクラスとしてパターン探索装置1の外部に出力する。
なお、本発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。
2・・・登録部
3・・・累積確率獲得部
4・・・ハッシュ関数部
5・・・学習部
6・・・探索部
Claims (11)
- d次元の複数の学習パターンを記憶する記憶部と、
前記複数の学習パターンから、前記d次元の任意の次元軸上における前記学習パターンのそれぞれの存在確率の累積確率を表す累積確率分布を求める分布獲得部と、
前記d次元の各次元において累積確率値がそれぞれ一定の幅になるように分割された複数の確率区間のそれぞれに、前記d次元の前記累積確率分布で対応する前記次元軸上の分布区間内の任意の点の値を、前記各確率区間に対応するハッシュ値に変換するハッシュ関数を求めるハッシュ関数獲得部と、
前記ハッシュ関数を用いて前記各学習パターンのハッシュ値をそれぞれ求め、前記各学習パターンを前記ハッシュ値に対応するバケットに分類する学習部と、
前記ハッシュ関数を用いて入力パターンのハッシュ値を求め、前記入力パターンのハッシュ値に対応するバケットに属する前記学習パターンの中から、前記入力パターンに最も類似する前記学習パターンを探索する探索部と、
を有したことを特徴とするパターン探索装置。 - 前記分布獲得部は、前記学習パターンの分布が正規分布であると仮定し、前記累積確率分布をシグモイド関数で近似する、
請求項1記載のパターン探索装置。 - 前記分布獲得部は、前記累積確率分布を関数の重み付け和によって近似する、
請求項1記載のパターン探索装置。 - 前記分布獲得部は、前記各次元軸に関して、前記学習パターンの値により累積ヒストグラムを獲得し、前記累積ヒストグラムを前記累積確率分布とする、
請求項1記載のパターン探索装置。 - 前記複数の学習パターンのそれぞれを部分空間に射影し、ベクトル空間内でのユークリッド距離に直交変換する直交変換部をさらに有し、
前記記憶部は、前記直交変換した学習パターンをそれぞれ記憶する、
請求項1記載のパターン探索装置。 - 前記直交変換部は、前記学習パターンを主成分分析により直交変換する、
請求項5記載のパターン探索装置。 - 前記分布獲得部は、前記d次元のうちの任意の複数の次元軸のそれぞれについての累積確率分布をそれぞれ求め、
前記ハッシュ関数獲得部は、前記各累積確率分布についてのハッシュ関数をそれぞれ求め、
前記学習部は、前記各ハッシュ関数を用いて前記各学習パターンのハッシュ値をそれぞれ求めて、前記各学習パターンを前記各ハッシュ値に対応するバケットに分類し、
前記探索部は、前記ハッシュ値に対応する前記バケット中の複数の前記学習パターンを求めるときに、前記各バケット中の前記学習パターンの和集合の中から前記探索を行う、
請求項1記載のパターン探索装置。 - 前記探索部は、前記学習パターンのそれぞれが前記和集合に属する回数を求め、前記回数が上位のみの複数の前記学習パターンの中から前記探索を行う、
請求項7記載のパターン探索装置。 - 前記分布獲得部は、前記d次元のうちの任意の複数の次元軸のそれぞれについての累積確率分布をそれぞれ求め、
前記ハッシュ関数獲得部は、前記各累積確率分布についてのハッシュ関数をそれぞれ求め、
前記学習部は、前記各ハッシュ関数を用いて前記各学習パターンのハッシュ値をそれぞれ求めて、前記各学習パターンを前記各ハッシュ値に対応するバケットに分類し、
前記探索部は、前記ハッシュ値に対応する前記バケット中の複数の前記学習パターンを求めるときに、前記各バケット中の前記学習パターンの積集合、または、前記積集合の近傍の中から前記探索を行う、
請求項1記載のパターン探索装置。 - 記憶部が、d次元の複数の学習パターンを記憶する記憶ステップと、
分布獲得部が、前記複数の学習パターンから、前記d次元の任意の次元軸上における前記学習パターンのそれぞれの存在確率の累積確率を表す累積確率分布を求める分布獲得ステップと、
ハッシュ関数獲得部が、前記d次元の各次元において累積確率値がそれぞれ一定の幅になるように分割された複数の確率区間のそれぞれに、前記d次元の前記累積確率分布で対応する前記次元軸上の分布区間内の任意の点の値を、前記各確率区間に対応するハッシュ値に変換するハッシュ関数を求めるハッシュ関数獲得ステップと、
学習部が、前記ハッシュ関数を用いて前記各学習パターンのハッシュ値をそれぞれ求め、前記各学習パターンを前記ハッシュ値に対応するバケットに分類する学習ステップと、
探索部が、前記ハッシュ関数を用いて入力パターンのハッシュ値を求め、前記入力パターンのハッシュ値に対応するバケットに属する前記学習パターンの中から、前記入力パターンに最も類似する前記学習パターンを探索する探索ステップと、
を有するパターン探索方法。 - d次元の複数の学習パターンを記憶する記憶機能と、
前記複数の学習パターンから、前記d次元の任意の次元軸上における前記学習パターンのそれぞれの存在確率の累積確率を表す累積確率分布を求める分布獲得機能と、
前記d次元の各次元において累積確率値がそれぞれ一定の幅になるように分割された複数の確率区間のそれぞれに、前記d次元の前記累積確率分布で対応する前記次元軸上の分布区間内の任意の点の値を、前記各確率区間に対応するハッシュ値に変換するハッシュ関数を求めるハッシュ関数獲得機能と、
前記ハッシュ関数を用いて前記各学習パターンのハッシュ値をそれぞれ求め、前記各学習パターンを前記ハッシュ値に対応するバケットに分類する学習機能と、
前記ハッシュ関数を用いて入力パターンのハッシュ値を求め、前記入力パターンのハッシュ値に対応するバケットに属する前記学習パターンの中から、前記入力パターンに最も類似する前記学習パターンを探索する探索機能と、
をコンピュータに実現させるためのパターン探索プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007183788A JP5193518B2 (ja) | 2007-07-13 | 2007-07-13 | パターン探索装置及びその方法 |
US12/170,597 US8510311B2 (en) | 2007-07-13 | 2008-07-10 | Pattern search apparatus and method thereof |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007183788A JP5193518B2 (ja) | 2007-07-13 | 2007-07-13 | パターン探索装置及びその方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009020769A JP2009020769A (ja) | 2009-01-29 |
JP5193518B2 true JP5193518B2 (ja) | 2013-05-08 |
Family
ID=40253991
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007183788A Active JP5193518B2 (ja) | 2007-07-13 | 2007-07-13 | パターン探索装置及びその方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US8510311B2 (ja) |
JP (1) | JP5193518B2 (ja) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5637939B2 (ja) * | 2011-06-28 | 2014-12-10 | Kddi株式会社 | 少ないコードブックの情報量によって高次元の特徴ベクトルを検索する検索装置及びプログラム |
JP5598925B2 (ja) * | 2011-06-29 | 2014-10-01 | Kddi株式会社 | 高次元の特徴ベクトルを高精度で検索する検索装置及びプログラム |
US8334898B1 (en) * | 2011-07-26 | 2012-12-18 | ByteLight, Inc. | Method and system for configuring an imaging device for the reception of digital pulse recognition information |
JP5592337B2 (ja) * | 2011-11-18 | 2014-09-17 | 日本電信電話株式会社 | コンテンツ変換方法、コンテンツ変換装置及びコンテンツ変換プログラム |
WO2014050952A1 (ja) * | 2012-09-27 | 2014-04-03 | 日本電気株式会社 | バイナリデータ変換方法と装置及びプログラム |
EP2945071B1 (en) | 2013-01-11 | 2020-08-26 | NEC Corporation | Index generating device and method, and search device and search method |
JP6038700B2 (ja) | 2013-03-25 | 2016-12-07 | 株式会社東芝 | 整形装置 |
JP5957411B2 (ja) * | 2013-04-25 | 2016-07-27 | 日本電信電話株式会社 | アドレス解決システム及び方法 |
JP6631519B2 (ja) | 2014-07-10 | 2020-01-15 | 日本電気株式会社 | インデックス生成装置及びインデックス生成方法 |
JP6457648B2 (ja) * | 2015-01-27 | 2019-01-23 | ノキア テクノロジーズ オサケユイチア | 位置特定およびマッピングの方法 |
US10778707B1 (en) * | 2016-05-12 | 2020-09-15 | Amazon Technologies, Inc. | Outlier detection for streaming data using locality sensitive hashing |
KR101958939B1 (ko) * | 2017-03-30 | 2019-03-15 | 오드컨셉 주식회사 | 벡터 양자화의 혼합에 기초한 부호화 방법 및 이를 이용한 최근접 이웃 검색(nns) 방법 |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0793159A (ja) * | 1993-09-21 | 1995-04-07 | Hitachi Ltd | ルール生成装置およびそのための方法 |
US5802509A (en) * | 1993-09-21 | 1998-09-01 | Hitachi, Ltd. | Rule generation system and method of generating rule |
US7158654B2 (en) * | 1993-11-18 | 2007-01-02 | Digimarc Corporation | Image processor and image processing method |
US5668897A (en) * | 1994-03-15 | 1997-09-16 | Stolfo; Salvatore J. | Method and apparatus for imaging, image processing and data compression merge/purge techniques for document image databases |
US6236749B1 (en) * | 1998-03-23 | 2001-05-22 | Matsushita Electronics Corporation | Image recognition method |
US6421463B1 (en) * | 1998-04-01 | 2002-07-16 | Massachusetts Institute Of Technology | Trainable system to search for objects in images |
DE69901544T2 (de) * | 1998-10-30 | 2003-01-16 | Ibm | Verfahren und vorrichtung zum erstellen eines musterwörterbuches zur anwendung in der erkennung von homologen sequenzen |
JP4327289B2 (ja) * | 1999-02-12 | 2009-09-09 | Juki株式会社 | 部品認識方法および装置 |
JP2001266151A (ja) * | 2000-03-17 | 2001-09-28 | Toshiba Corp | 個人識別装置および個人識別方法 |
US6556621B1 (en) * | 2000-03-29 | 2003-04-29 | Time Domain Corporation | System for fast lock and acquisition of ultra-wideband signals |
TWI282941B (en) * | 2001-03-15 | 2007-06-21 | Toshiba Corp | Entrance management apparatus and entrance management method by using face features identification |
US7200270B2 (en) * | 2001-12-13 | 2007-04-03 | Kabushiki Kaisha Toshiba | Pattern recognition apparatus and method using distributed model representation of partial images |
EP1504412B1 (en) * | 2002-04-19 | 2018-04-11 | CA, Inc. | Processing mixed numeric and/or non-numeric data |
US7796885B2 (en) * | 2002-11-05 | 2010-09-14 | Lightfleet Corporation | Distribution optical elements and compound collecting lenses for broadcast optical interconnect |
JP4114600B2 (ja) * | 2003-12-02 | 2008-07-09 | 日本電気株式会社 | 可変長文字列検索装置及び可変長文字列検索方法並びにプログラム |
JP3861157B2 (ja) * | 2004-02-27 | 2006-12-20 | 国立大学法人広島大学 | 参照データ最適化装置とパターン認識システム |
KR100560330B1 (ko) * | 2004-04-21 | 2006-03-30 | 에이디정보통신 주식회사 | 색상 보정이 가능한 대용량 2차원 칼라 바코드인코딩/디코딩 시스템 및 그 방법 |
JP4349216B2 (ja) * | 2004-06-21 | 2009-10-21 | 富士ゼロックス株式会社 | 分布適合度検定装置、消耗品補給タイミング判定装置、画像形成装置、分布適合度検定方法及びプログラム |
US20060193159A1 (en) * | 2005-02-17 | 2006-08-31 | Sensory Networks, Inc. | Fast pattern matching using large compressed databases |
US7809722B2 (en) * | 2005-05-09 | 2010-10-05 | Like.Com | System and method for enabling search and retrieval from image files based on recognized information |
US8176052B2 (en) * | 2006-03-03 | 2012-05-08 | Perfect Search Corporation | Hyperspace index |
-
2007
- 2007-07-13 JP JP2007183788A patent/JP5193518B2/ja active Active
-
2008
- 2008-07-10 US US12/170,597 patent/US8510311B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2009020769A (ja) | 2009-01-29 |
US20090019044A1 (en) | 2009-01-15 |
US8510311B2 (en) | 2013-08-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5193518B2 (ja) | パターン探索装置及びその方法 | |
Xi et al. | Fast time series classification using numerosity reduction | |
WO2019134567A1 (zh) | 样本集的处理方法及装置、样本的查询方法及装置 | |
CN107341178B (zh) | 一种基于自适应的二进制量化哈希编码的数据检索方法 | |
Lou et al. | Matchminer: Efficient spanning structure mining in large image collections | |
KR101191223B1 (ko) | 이미지 검색 방법, 장치, 및 이 방법을 실행하기 위한 컴퓨터 판독 가능한 기록 매체 | |
JP5862413B2 (ja) | 情報変換規則生成プログラム、情報変換規則生成装置および情報変換規則生成方法 | |
De Marsico et al. | HERO: human ear recognition against occlusions | |
JP2005011042A (ja) | データ検索方法、データ検索装置、データ検索プログラムおよびコンピュータで読み取り可能な記録媒体 | |
Ullah et al. | ck-NN: A Clustered k-Nearest Neighbours Approach for Large-Scale Classification | |
US6301388B1 (en) | Image matching apparatus | |
JP6004015B2 (ja) | 学習方法、情報処理装置および学習プログラム | |
Zhang et al. | Dynamic time warping under product quantization, with applications to time-series data similarity search | |
US20180173726A1 (en) | Generation device, generation method, and non-transitory computer-readable recording medium | |
Hu et al. | Fast k-means for large scale clustering | |
WO2010016313A1 (ja) | パターン判定装置、方法、およびプログラム | |
JP5971722B2 (ja) | ハッシュ関数の変換行列を定める方法、該ハッシュ関数を利用するハッシュ型近似最近傍探索方法、その装置及びそのコンピュータプログラム | |
Du et al. | Large-scale signature matching using multi-stage hashing | |
JP2002537605A (ja) | マッチングエンジン | |
Kusamura et al. | GPU acceleration of content-based image retrieval based on SIFT descriptors | |
US9189693B2 (en) | Information processing apparatus and information processing method | |
Sabahi et al. | Perceptual image hashing using random forest for content-based image retrieval | |
Jayaraman et al. | An enhanced geometric hashing | |
JP2010205043A (ja) | パターン学習方法、装置、およびプログラム | |
Binh et al. | A suite of techniques to improve random projection in time series motif discovery |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100527 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120508 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120628 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130108 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130204 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 5193518 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160208 Year of fee payment: 3 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313114 Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |