JP6248774B2 - 最近傍探索のための情報処理装置及び方法 - Google Patents
最近傍探索のための情報処理装置及び方法 Download PDFInfo
- Publication number
- JP6248774B2 JP6248774B2 JP2014085624A JP2014085624A JP6248774B2 JP 6248774 B2 JP6248774 B2 JP 6248774B2 JP 2014085624 A JP2014085624 A JP 2014085624A JP 2014085624 A JP2014085624 A JP 2014085624A JP 6248774 B2 JP6248774 B2 JP 6248774B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- similarity matrix
- samples
- unit
- data samples
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
1.各データサンプルに対してランダムにクラスタを割り振る。
2.割り振ったデータサンプルを基に各クラスタの中心を計算する。
3.各データサンプルについて各クラスタ中心との距離を求め、最も近いクラスタ中心のクラスタに割り当て直す。
4.上記の処理で全てのデータサンプルについてクラスタの割り当てが変化しなかったら終了する。そうでない場合は2及び3の処理を繰り返す。
類似度行列算出部1021は、各データサンプルの特徴ベクトルsiに対して、自データサンプル以外の他のデータサンプルの特徴ベクトルsjとのユークリッド距離に基づく類似度h(si,sj)を算出する。具体的には、以下のような式に従って類似度を算出する。
類似度h(si,sj)については、以下のような足切りを行う。
・{h(si,sj)|i:fixed,1≦j≦m,j≠i}において、上位r個以外はh(si,sj)=0
足切り処理後の初期類似度行列Zの行毎に、成分の総和が1となるように正規化する。図17の例では、点線矩形で囲まれたi行目において、類似度の総和が1となるように正規化する。
正規化処理後の初期類似度行列Zから、類似度行列Z^を算出する。これによって、m×mの対称行列となった類似度行列Z^が得られる。
複数のデータサンプルを格納するデータ格納部と、
前記データ格納部に格納された前記複数のデータサンプル間についての類似度行列に、前記複数のデータサンプルから選択された特定のデータサンプルとの類似度に基づく前記複数のデータサンプル間の類似度行列が近似するように、前記特定のデータサンプルを抽出する抽出部と、
を有する情報処理装置。
前記抽出部が、
前記複数のデータサンプル間についての類似度行列を算出する類似度行列算出部と、
算出された前記類似度行列に対して固有値分解を行って固有ベクトルを生成する固有値分解処理部と、
生成された前記固有ベクトルの各成分の絶対値に基づき、前記複数のデータサンプルから前記特定のデータサンプルを特定する特定部と、
を有する付記1記載の情報処理装置。
前記特定のデータサンプルを用いて前記複数のデータサンプルの各々についてハッシュベクトルを算出する算出部と、
算出された前記ハッシュベクトルと、前記データサンプルについてのカテゴリ名とを対応付けてデータベースに登録する登録部と、
あるデータについて前記特定のデータサンプルを用いて算出されたハッシュベクトルと前記データベースに登録されたハッシュベクトルとの距離を算出して、最短距離のハッシュベクトルに対応付けられたカテゴリ名を特定する処理部と、
をさらに有する付記1又は2記載の情報処理装置。
複数のデータサンプルを格納するデータ格納部に格納された前記複数のデータサンプル間についての類似度行列に、前記複数のデータサンプルから選択された特定のデータサンプルとの類似度に基づく前記複数のデータサンプル間の類似度行列が近似するように、前記特定のデータサンプルを抽出する
処理を含み、コンピュータが実行する情報処理方法。
前記抽出する処理が、
前記複数のデータサンプル間についての類似度行列を算出し、
算出された前記類似度行列に対して固有値分解を行って固有ベクトルを生成し、
生成された前記固有ベクトルの各成分の絶対値に基づき、前記複数のデータサンプルから前記特定のデータサンプルを特定する
処理を含む付記4記載の情報処理方法。
複数のデータサンプルを格納するデータ格納部に格納された前記複数のデータサンプル間についての類似度行列に、前記複数のデータサンプルから選択された特定のデータサンプルとの類似度に基づく前記複数のデータサンプル間の類似度行列が近似するように、前記特定のデータサンプルを抽出する
処理を、コンピュータに実行させるためのプログラム。
前記抽出する処理が、
前記複数のデータサンプル間についての類似度行列を算出し、
算出された前記類似度行列に対して固有値分解を行って固有ベクトルを生成し、
生成された前記固有ベクトルの各成分の絶対値に基づき、前記複数のデータサンプルから前記特定のデータサンプルを特定する
処理を含む付記6記載のプログラム。
102 アンカー抽出部
103 アンカー格納部
104 ハッシュベクトル算出部
105 登録部
106 データベース
107 データ入力部
108 第2データ格納部
109 照合処理部
110 データ出力部
Claims (5)
- 複数のデータサンプルを格納するデータ格納部と、
前記データ格納部に格納された前記複数のデータサンプル間についての類似度行列に、前記複数のデータサンプルから選択された特定のデータサンプルとの類似度に基づく前記複数のデータサンプル間の類似度行列が近似するように、前記特定のデータサンプルを抽出する抽出部と、
を有する情報処理装置。 - 前記抽出部が、
前記複数のデータサンプル間についての類似度行列を算出する類似度行列算出部と、
算出された前記類似度行列に対して固有値分解を行って固有ベクトルを生成する固有値分解処理部と、
生成された前記固有ベクトルの各成分の絶対値に基づき、前記複数のデータサンプルから前記特定のデータサンプルを特定する特定部と、
を有する請求項1記載の情報処理装置。 - 前記特定のデータサンプルを用いて前記複数のデータサンプルの各々についてハッシュベクトルを算出する算出部と、
算出された前記ハッシュベクトルと、前記データサンプルについてのカテゴリ名とを対応付けてデータベースに登録する登録部と、
あるデータについて前記特定のデータサンプルを用いて算出されたハッシュベクトルと前記データベースに登録されたハッシュベクトルとの距離を算出して、最短距離のハッシュベクトルに対応付けられたカテゴリ名を特定する処理部と、
をさらに有する請求項1又は2記載の情報処理装置。 - 複数のデータサンプルを格納するデータ格納部に格納された前記複数のデータサンプル間についての類似度行列に、前記複数のデータサンプルから選択された特定のデータサンプルとの類似度に基づく前記複数のデータサンプル間の類似度行列が近似するように、前記特定のデータサンプルを抽出する
処理を含み、コンピュータが実行する情報処理方法。 - 複数のデータサンプルを格納するデータ格納部に格納された前記複数のデータサンプル間についての類似度行列に、前記複数のデータサンプルから選択された特定のデータサンプルとの類似度に基づく前記複数のデータサンプル間の類似度行列が近似するように、前記特定のデータサンプルを抽出する
処理を、コンピュータに実行させるためのプログラム。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2014085624A JP6248774B2 (ja) | 2014-04-17 | 2014-04-17 | 最近傍探索のための情報処理装置及び方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2014085624A JP6248774B2 (ja) | 2014-04-17 | 2014-04-17 | 最近傍探索のための情報処理装置及び方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2015207055A JP2015207055A (ja) | 2015-11-19 |
| JP6248774B2 true JP6248774B2 (ja) | 2017-12-20 |
Family
ID=54603841
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2014085624A Expired - Fee Related JP6248774B2 (ja) | 2014-04-17 | 2014-04-17 | 最近傍探索のための情報処理装置及び方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP6248774B2 (ja) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN115129713B (zh) * | 2022-06-16 | 2025-07-11 | 腾讯科技(深圳)有限公司 | 数据检索方法、装置、计算机设备和存储介质 |
Family Cites Families (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP5225183B2 (ja) * | 2009-04-10 | 2013-07-03 | インターナショナル・ビジネス・マシーンズ・コーポレーション | リンク予測システム、方法及びプログラム |
| JP5501896B2 (ja) * | 2010-08-12 | 2014-05-28 | 日本電信電話株式会社 | パターン抽出装置、パターン抽出方法、およびパターン抽出プログラム |
| US8758659B2 (en) * | 2010-09-29 | 2014-06-24 | Fns Tech Co., Ltd. | Method of grooving a chemical-mechanical planarization pad |
| JP2012088972A (ja) * | 2010-10-20 | 2012-05-10 | Nippon Telegr & Teleph Corp <Ntt> | データ分類装置、データ分類方法及びデータ分類プログラム |
| JP5545889B2 (ja) * | 2011-07-07 | 2014-07-09 | 日本電信電話株式会社 | パターン抽出装置、パターン抽出方法およびパターン抽出プログラム |
| US8832655B2 (en) * | 2011-09-29 | 2014-09-09 | Accenture Global Services Limited | Systems and methods for finding project-related information by clustering applications into related concept categories |
-
2014
- 2014-04-17 JP JP2014085624A patent/JP6248774B2/ja not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| JP2015207055A (ja) | 2015-11-19 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN110287312B (zh) | 文本相似度的计算方法、装置、计算机设备及计算机存储介质 | |
| CN107209853B (zh) | 定位和地图构建方法 | |
| CN106980623B (zh) | 一种数据模型的确定方法及装置 | |
| WO2019080411A1 (zh) | 电子装置、人脸图像聚类搜索方法和计算机可读存储介质 | |
| CN108229532B (zh) | 图像识别方法、装置和电子设备 | |
| JP6041439B2 (ja) | 画像に基づくバイナリ特徴ベクトルを用いた画像検索装置、システム、プログラム及び方法 | |
| CN106776856B (zh) | 一种融合颜色特征与词汇树的车辆图像检索方法 | |
| US20150039538A1 (en) | Method for processing a large-scale data set, and associated apparatus | |
| US20210073890A1 (en) | Catalog-based image recommendations | |
| CN109711228A (zh) | 一种实现图像识别的图像处理方法及装置、电子设备 | |
| WO2019136897A1 (zh) | 图像处理方法、装置、电子设备及存储介质 | |
| JP2015001982A (ja) | 画像類似度確定装置及び方法並びに画像特徴取得装置及び方法 | |
| CN110347855A (zh) | 画作推荐方法、终端设备、服务器、计算机设备及介质 | |
| CN111026865A (zh) | 知识图谱的关系对齐方法、装置、设备及存储介质 | |
| JPWO2017183548A1 (ja) | 情報処理システム、情報処理方法、及び、記録媒体 | |
| WO2019171440A1 (ja) | 画像解析装置、画像解析方法および画像解析プログラム | |
| WO2020134819A1 (zh) | 一种搜索人脸的方法及相关装置 | |
| CN106203508A (zh) | 一种基于Hadoop平台的图像分类方法 | |
| US9639808B2 (en) | Non-transitory computer readable medium, information processing apparatus, and attribute estimation method | |
| JP6248774B2 (ja) | 最近傍探索のための情報処理装置及び方法 | |
| WO2014167880A1 (ja) | 画像検索装置、画像検索方法、および記録媒体 | |
| JP2017219984A (ja) | 画像検索システム、画像辞書生成システム、画像処理システム及びプログラム | |
| JP6393982B2 (ja) | 空間分割方法、空間分割装置および空間分割プログラム | |
| JP5959446B2 (ja) | コンテンツをバイナリ特徴ベクトルの集合で表現することによって高速に検索する検索装置、プログラム及び方法 | |
| CN112348060A (zh) | 分类向量生成方法、装置、计算机设备和存储介质 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170110 |
|
| TRDD | Decision of grant or rejection written | ||
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20171018 |
|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20171024 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20171106 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 6248774 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| LAPS | Cancellation because of no payment of annual fees |
