JP5224537B2 - 局所性検知可能ハッシュの構築装置、類似近傍検索処理装置及びプログラム - Google Patents
局所性検知可能ハッシュの構築装置、類似近傍検索処理装置及びプログラム Download PDFInfo
- Publication number
- JP5224537B2 JP5224537B2 JP2009132236A JP2009132236A JP5224537B2 JP 5224537 B2 JP5224537 B2 JP 5224537B2 JP 2009132236 A JP2009132236 A JP 2009132236A JP 2009132236 A JP2009132236 A JP 2009132236A JP 5224537 B2 JP5224537 B2 JP 5224537B2
- Authority
- JP
- Japan
- Prior art keywords
- locality
- detectable
- random number
- hash
- number table
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
今、最大値が10であるときに、ベクトル(3,1,5,8)のUNARY表現は、
(1110000000,1000000000,1111100000,1111111100)であり、この結合は、
111000000010000000001111100001111111100である。
乱数表が(10,23,38)であるときにおけるbit samplingした結果は、上記結合の10,23,38番目のビットを結合した011になる。このbit samplingし結合した値を、ハッシュのキーとして元のデータをパケットに格納する。
従来の局所性検知可能ハッシュでは、乱数表間に特に関連性は規定されていない。実施例1である処理Aでは、全ての乱数をソートしたときに、図8に示すように、連続した乱数値によって、各乱数表が構成されているように、乱数表を構築している。
次に、ソートされた乱数表の処理方法(処理B)について説明する。
次に、ソートされた乱数表を用いた局所性検知可能ハッシュ構築方法(処理C)について説明する。
次に、ソートされた乱数表を用いた近似近傍検索処理方法(処理D)について説明する。
(1)必要な個数集まった時点で出力する仕方、
(2)登場回数の多い順に出力する仕方、
(3)候補集合内で線形検索をして近い順に出力する仕方
がある。
E1…類似近傍検索エンジン、
E11…乱数表構築エンジン、
E12…局所性検知可能ハッシュ構築エンジン、
E13…近似近傍検索エンジン。
Claims (5)
- 画像や動画、テキスト等の多次元ベクトルとして表現されている多次元ベクトルデータベースにおいて、
多数の乱数をソートするソート手段と;
上記ソートされた複数の乱数を、昇順または降順に、複数の乱数表に割り当てる割り当て手段と;
上記割り振られた乱数表を用いて、局所性検知可能ハッシングを行う局所性検知可能ハッシュの構築手段と;
を有することを特徴とする局所性検知可能ハッシュの構築装置。 - 請求項1において、
必要な乱数を一度に構築することによって、上記乱数表を構築することを特徴とする局所性検知可能ハッシュの構築装置。 - 請求項1において、
上記割り振られた乱数表を、上記乱数表の先頭から、1回のスキャンで、局所性検知可能ハッシング処理を実行することを特徴とする局所性検知可能ハッシュの構築装置。 - 画像や動画、テキスト等の多次元ベクトルとして表現されている多次元ベクトルデータベースにおいて、
多数の乱数をソートするソート手段と;
上記ソートされた複数の乱数を、昇順または降順に、複数の乱数表に割り当てる割り当て手段と;
上記割り振られた乱数表を用いて、局所性検知可能ハッシングを構築する局所性検知可能ハッシュの構築手段と;
上記割り振られた乱数表を用いて、近似近傍検索処理を実現する近似近傍検索処理手段と;
を有することを特徴とする類似近傍検索処理装置。 - 請求項1〜請求項4のいずれか1項記載の装置を構成する各手段としてコンピュータを機能させるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009132236A JP5224537B2 (ja) | 2009-06-01 | 2009-06-01 | 局所性検知可能ハッシュの構築装置、類似近傍検索処理装置及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009132236A JP5224537B2 (ja) | 2009-06-01 | 2009-06-01 | 局所性検知可能ハッシュの構築装置、類似近傍検索処理装置及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010277522A JP2010277522A (ja) | 2010-12-09 |
JP5224537B2 true JP5224537B2 (ja) | 2013-07-03 |
Family
ID=43424394
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009132236A Expired - Fee Related JP5224537B2 (ja) | 2009-06-01 | 2009-06-01 | 局所性検知可能ハッシュの構築装置、類似近傍検索処理装置及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5224537B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5971722B2 (ja) * | 2010-12-10 | 2016-08-17 | 国立大学法人豊橋技術科学大学 | ハッシュ関数の変換行列を定める方法、該ハッシュ関数を利用するハッシュ型近似最近傍探索方法、その装置及びそのコンピュータプログラム |
CN102622366B (zh) * | 2011-01-28 | 2014-07-30 | 阿里巴巴集团控股有限公司 | 相似图像的识别方法和装置 |
JP5601277B2 (ja) * | 2011-05-06 | 2014-10-08 | 富士通株式会社 | 情報処理装置、情報処理システムおよび検索方法 |
CN103581224B (zh) * | 2012-07-25 | 2018-05-22 | 腾讯科技(深圳)有限公司 | 推送信息的方法和装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06103127A (ja) * | 1992-09-22 | 1994-04-15 | Kanebo Ltd | ハッシュファイルデータ管理装置およびハッシュファイルデータ管理方法 |
-
2009
- 2009-06-01 JP JP2009132236A patent/JP5224537B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2010277522A (ja) | 2010-12-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8533203B2 (en) | Identifying synonyms of entities using a document collection | |
US9087111B2 (en) | Personalized tag ranking | |
Stupar et al. | Rankreduce–processing k-nearest neighbor queries on top of mapreduce | |
US9053386B2 (en) | Method and apparatus of identifying similar images | |
KR101732754B1 (ko) | 콘텐츠 기반 이미지 검색 | |
Fu et al. | Privacy-preserving smart similarity search based on simhash over encrypted data in cloud computing | |
US12013899B2 (en) | Building a graph index and searching a corresponding dataset | |
Li et al. | Learning label preserving binary codes for multimedia retrieval: A general approach | |
Adamu et al. | A survey on big data indexing strategies | |
US7765204B2 (en) | Method of finding candidate sub-queries from longer queries | |
JP5224537B2 (ja) | 局所性検知可能ハッシュの構築装置、類似近傍検索処理装置及びプログラム | |
Diwate et al. | Study of different algorithms for pattern matching | |
Le et al. | Efficient retrieval of matrix factorization-based top-k recommendations: A survey of recent approaches | |
CN113918807A (zh) | 数据推荐方法、装置、计算设备及计算机可读存储介质 | |
JP5194856B2 (ja) | コンパクトな決定図を用いた効率的インデックス付け | |
Wei et al. | Heterogeneous translated hashing: A scalable solution towards multi-modal similarity search | |
Mathew et al. | Efficient information retrieval using Lucene, LIndex and HIndex in Hadoop | |
WO2016059787A1 (ja) | 情報処理装置、情報処理方法、及び、記録媒体 | |
KR102062139B1 (ko) | 지능형 자료구조 기반의 데이터 처리 방법 및 그를 위한 장치 | |
CN114911826A (zh) | 一种关联数据检索方法和系统 | |
JP2011159100A (ja) | 逐次類似文書検索装置、逐次類似文書検索方法およびプログラム | |
Dourado et al. | Fusion vectors: Embedding graph fusions for efficient unsupervised rank aggregation | |
Forman et al. | Scaling up text classification for large file systems | |
Roy et al. | Locality sensitive hashing in fourier frequency domain for soft set containment search | |
US20230153338A1 (en) | Sparse embedding index for search |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20111012 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130301 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130308 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130308 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5224537 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160322 Year of fee payment: 3 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |