JP2015055975A - クラスタリング装置及びクラスタリング方法 - Google Patents
クラスタリング装置及びクラスタリング方法 Download PDFInfo
- Publication number
- JP2015055975A JP2015055975A JP2013188289A JP2013188289A JP2015055975A JP 2015055975 A JP2015055975 A JP 2015055975A JP 2013188289 A JP2013188289 A JP 2013188289A JP 2013188289 A JP2013188289 A JP 2013188289A JP 2015055975 A JP2015055975 A JP 2015055975A
- Authority
- JP
- Japan
- Prior art keywords
- hash value
- vector
- target
- clustering
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
なお、中心ベクトルは、上記以外の式によって算出されてもよい。例えば、クラスタに属する対象ベクトルの平均としてもよい。
ここでkはベクトルの各成分の属性(添え字)、Dはベクトルの次元数、vi,kはベクトルviの成分kの値を表す。次に、ハッシュ値算出部103は、算出したコサイン類似度と指定された定数Aとの積を求める。定数Aは、1以上の値で予め設定される。指定された定数Aは、設定ファイル又は外部入力等によって予めハッシュ値算出部103に記憶されている。
(cos(v1,v2)×A+切片)/LSHパラメータ
Claims (6)
- クラスタリング対象の複数の対象ベクトルを入力する入力手段と、
前記入力手段によって入力された複数の対象ベクトルそれぞれに対して、ベクトルが類似していると類似の値となるハッシュ値を算出する第1ハッシュ値算出手段と、
前記入力手段によって入力された複数の対象ベクトルそれぞれを、予め設定された数のクラスタの何れかに分類する分類手段と、
前記分類手段によって分類された対象ベクトルに基づいて、各クラスタを代表する代表ベクトルを算出する代表ベクトル算出手段と、
前記代表ベクトル算出手段によって算出された代表ベクトルそれぞれに対して、前記ハッシュ値を算出する第2ハッシュ値算出手段と、
前記第1ハッシュ値算出手段によって算出された対象ベクトルのハッシュ値と、前記第2ハッシュ値算出手段によって算出された代表ベクトルのハッシュ値とを比較して、当該対象ベクトルが分類される候補となるクラスタを特定する候補特定手段と、
前記候補特定手段によって特定されたクラスタのうちの何れかに、対象ベクトルを再分類する再分類手段と、
を備えるクラスタリング装置。 - 前記第1ハッシュ値算出手段及び前記第2ハッシュ値算出手段は、ベクトルの方向が類似していると類似の値となるハッシュ値を算出する請求項1に記載のクラスタリング装置。
- 前記再分類手段は、前記候補特定手段によって特定されたクラスタの代表ベクトルと対象ベクトルとの類似度を算出して、当該類似度に基づいて対象ベクトルを再分類する請求項1又は2に記載のクラスタリング装置。
- 前記第1ハッシュ値算出手段は、1つの前記対象ベクトルに対して、互いに異なる系列の複数のハッシュ値を算出し、
前記第2ハッシュ値算出手段は、1つの前記代表ベクトルに対して前記系列の複数のハッシュ値を算出し、
前記候補特定手段は、同一の系列の前記対象ベクトルのハッシュ値と前記代表ベクトルのハッシュ値とを比較する、請求項1〜3の何れか一項に記載のクラスタリング装置。 - 前記第1ハッシュ値算出手段は、1つの前記対象ベクトルに対して、複数の乱数ベクトルとの類似度を算出して、当該類似度に基づいて1つのハッシュ値を算出し、
前記第2ハッシュ値算出手段は、1つの前記代表ベクトルに対して、複数の乱数ベクトルとの類似度を算出して、当該類似度に基づいて1つのハッシュ値を算出する、請求項1〜4の何れか一項に記載のクラスタリング装置。 - クラスタリング装置の動作方法であるクラスタリング方法であって、
クラスタリング対象の複数の対象ベクトルを入力する入力ステップと、
前記入力ステップにおいて入力された複数の対象ベクトルそれぞれに対して、ベクトルが類似していると類似の値となるハッシュ値を算出する第1ハッシュ値算出ステップと、
前記入力ステップにおいて入力された複数の対象ベクトルそれぞれを、予め設定された数のクラスタの何れかに分類する分類ステップと、
前記分類ステップにおいて分類された対象ベクトルに基づいて、各クラスタを代表する代表ベクトルを算出する代表ベクトル算出ステップと、
前記代表ベクトル算出ステップにおいて算出された代表ベクトルそれぞれに対して、前記ハッシュ値を算出する第2ハッシュ値算出ステップと、
前記第1ハッシュ値算出ステップにおいて算出された対象ベクトルのハッシュ値と、前記第2ハッシュ値算出ステップにおいて算出された代表ベクトルのハッシュ値とを比較して、当該対象ベクトルが分類される候補となるクラスタを特定する候補特定ステップと、
前記候補特定ステップにおいて特定されたクラスタのうちの何れかに、対象ベクトルを再分類する再分類ステップと、
を含むクラスタリング方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013188289A JP6092056B2 (ja) | 2013-09-11 | 2013-09-11 | クラスタリング装置及びクラスタリング方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013188289A JP6092056B2 (ja) | 2013-09-11 | 2013-09-11 | クラスタリング装置及びクラスタリング方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015055975A true JP2015055975A (ja) | 2015-03-23 |
JP6092056B2 JP6092056B2 (ja) | 2017-03-08 |
Family
ID=52820347
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013188289A Active JP6092056B2 (ja) | 2013-09-11 | 2013-09-11 | クラスタリング装置及びクラスタリング方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6092056B2 (ja) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080205774A1 (en) * | 2007-02-26 | 2008-08-28 | Klaus Brinker | Document clustering using a locality sensitive hashing function |
JP2009294855A (ja) * | 2008-06-04 | 2009-12-17 | Hitachi Ltd | 類似データ検索システム |
JP2013012076A (ja) * | 2011-06-29 | 2013-01-17 | Kddi Corp | 高次元の特徴ベクトルを高精度で検索する検索装置及びプログラム |
JP2013130965A (ja) * | 2011-12-20 | 2013-07-04 | Hitachi Ltd | データ分析装置、データ分析方法及びプログラム |
-
2013
- 2013-09-11 JP JP2013188289A patent/JP6092056B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080205774A1 (en) * | 2007-02-26 | 2008-08-28 | Klaus Brinker | Document clustering using a locality sensitive hashing function |
JP2009294855A (ja) * | 2008-06-04 | 2009-12-17 | Hitachi Ltd | 類似データ検索システム |
JP2013012076A (ja) * | 2011-06-29 | 2013-01-17 | Kddi Corp | 高次元の特徴ベクトルを高精度で検索する検索装置及びプログラム |
JP2013130965A (ja) * | 2011-12-20 | 2013-07-04 | Hitachi Ltd | データ分析装置、データ分析方法及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP6092056B2 (ja) | 2017-03-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Kaushik et al. | Comparative study of K-means and hierarchical clustering techniques | |
JP5254893B2 (ja) | 画像変換方法及び装置並びにパターン識別方法及び装置 | |
JP5193518B2 (ja) | パターン探索装置及びその方法 | |
US20190272344A1 (en) | Random draw forest index structure for searching large scale unstructured data | |
Zhang et al. | Efficient kNN algorithm based on graph sparse reconstruction | |
JP6163461B2 (ja) | クラス分類装置、方法、及びプログラム | |
JP2015501017A (ja) | 画像検索方法 | |
JP2018018330A (ja) | データ検索プログラム、データ検索方法およびデータ検索装置 | |
JP6311000B1 (ja) | 生成装置、生成方法、及び生成プログラム | |
Spolaôr et al. | Label construction for multi-label feature selection | |
Islam et al. | Data clustering using hybrid genetic algorithm with k-means and k-medoids algorithms | |
JP2018173909A (ja) | 学習プログラム、学習方法および学習装置 | |
US11327719B2 (en) | Random number generation method selecting system, random number generation method selecting method, and random number generation method selecting program | |
Forest et al. | An invariance-guided stability criterion for time series clustering validation | |
US9792561B2 (en) | Learning method, information conversion device, and recording medium | |
JP6092056B2 (ja) | クラスタリング装置及びクラスタリング方法 | |
WO2021100209A1 (ja) | 画像識別装置、画像識別方法及び画像識別プログラム | |
US20190294637A1 (en) | Similar data search device, similar data search method, and recording medium | |
US20210042550A1 (en) | Information processing device, information processing method, and computer-readable recording medium recording information processing program | |
Li et al. | Hubness-based sampling method for nyström spectral clustering | |
JP5962405B2 (ja) | 認証プログラム、認証方法及び認証装置 | |
Ali et al. | A k nearest neighbours classifiers ensemble based on extended neighbourhood rule and features subsets | |
US20150142712A1 (en) | Rule discovery system, method, apparatus, and program | |
Doreswamy et al. | Similarity based cluster Analysis on engineering materials data sets | |
EP4310717A1 (en) | Recommendation data generation device, control method, and non-transitory computer-readable medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160215 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20161111 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20161206 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20161216 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170117 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170208 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6092056 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |