JP7099316B2 - 類似度演算装置、方法、およびプログラム - Google Patents
類似度演算装置、方法、およびプログラム Download PDFInfo
- Publication number
- JP7099316B2 JP7099316B2 JP2018524062A JP2018524062A JP7099316B2 JP 7099316 B2 JP7099316 B2 JP 7099316B2 JP 2018524062 A JP2018524062 A JP 2018524062A JP 2018524062 A JP2018524062 A JP 2018524062A JP 7099316 B2 JP7099316 B2 JP 7099316B2
- Authority
- JP
- Japan
- Prior art keywords
- similarity
- data
- label
- node
- attribute value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 36
- 238000013500 data storage Methods 0.000 claims description 71
- 238000004364 calculation method Methods 0.000 claims description 70
- 230000015654 memory Effects 0.000 description 11
- 238000004590 computer program Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- 230000010354 integration Effects 0.000 description 4
- 230000001815 facial effect Effects 0.000 description 3
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 230000001174 ascending effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/18—File system types
- G06F16/182—Distributed file systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2228—Indexing structures
- G06F16/2272—Management thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/9035—Filtering based on additional data, e.g. user or group profiles
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明の第1の実施の形態としての類似演算装置1の機能ブロック構成を図1に示す。図1において、類似演算装置1は、類似インデックス記憶部11と、ラベル生成部12と、データ記憶部13と、類似演算部14とを備える。
次に、本発明の第2の実施の形態について図面を参照して詳細に説明する。なお、本実施の形態の説明において参照する各図面において、本発明の第1の実施の形態と同一の構成および同様に動作するステップには同一の符号を付して本実施の形態における詳細な説明を省略する。
次に、本発明の第3の実施の形態について図面を参照して詳細に説明する。なお、本実施の形態の説明において参照する各図面において、本発明の第1および第2の実施の形態と同一の構成および同様に動作するステップには同一の符号を付して本実施の形態における詳細な説明を省略する。
この公知文献に示された類似インデックスは、図12に示すように、あるノード以下に、当該ノードに記憶された各データの類似性に関わる属性値に対して類似閾値(δx)以上となるデータの類似性に関わる属性値を格納する。つまり、ノードA1に格納されたデータの類似性に関わる属性値の下にある部分木にある全てのノードに格納されたデータは、ノードA1に格納されたデータとの類似度がδ1よりも大きいことを表す。
次に、本発明の第4の実施の形態について図面を参照して詳細に説明する。本実施の形態では、データが、類似性に関わる属性以外にも他の属性を有する場合に、他の属性に関する条件を満たすデータを対象に類似性に基づく演算を行う例について説明する。
11、31 類似インデックス記憶部
12、32 ラベル生成部
13、23、43 データ記憶部
14、24、34、44 類似演算部
1001 CPU
1002 メモリ
1003 出力装置
1004 入力装置
Claims (5)
- データの類似性に関わる属性値を格納したノードが、前記データ間の類似関係を表すよう階層的に構成された類似インデックスを記憶した類似インデックス記憶手段と、
前記データ毎に、前記類似インデックスにおいて前記属性値が格納されたノードの位置を示すパスに基づくラベルを生成するラベル生成手段と、
前記データ毎に、前記属性値と、前記ラベルと、前記類似性に関わる前記属性値以外の他の属性値と、を関連付けた情報を記憶するデータ記憶手段と、
前記データ記憶手段に記憶された全てまたは一部の情報が示す前記データであって、前記他の属性値に関する選択条件を満たす前記データである所定データについて、前記ラベルに基づき前記類似インデックスを再構成し、再構成した前記類似インデックスを用いて前記所定データを対象とする前記類似性に基づく演算を実行する類似演算手段と、
を備え、
前記属性値が格納されたノードには、親のノードにおける前記データとの前記類似性の順に、前記属性値が配置され、
前記ラベル生成手段は、前記属性値が格納されたノードの位置、及び、当該ノード内での前記属性値の配置順序を示すパスに基づく前記ラベルを、前記データ毎に、生成する、
類似演算装置。 - 前記データ記憶手段が、前記属性値および前記ラベルを関連付けた情報を、複数のブロックに分散して記憶するとき、
前記類似演算手段は、前記ラベルのプリフィックスに基づいて、前記属性値および前記ラベルを関連付けた情報を複数のブロックに再分散して前記データ記憶手段に記憶させ、再分散された各ブロックに記憶された情報が示す前記データについて、前記ラベルに基づき再構成した前記類似インデックスを用いて、前記類似性に基づく演算を実行することを特徴とする請求項1に記載の類似演算装置。 - 前記類似インデックス記憶手段は、前記類似インデックスにおいて任意のノード以下に、そのノードに格納された前記データの前記属性値に対する前記類似性が類似閾値以上の他の前記データの前記属性値を格納するよう構成された前記類似インデックスを記憶し、
前記ラベル生成手段は、前記ラベルに、前記データの前記属性値が格納されたノードの位置を示すパスにおいて適用された前記類似閾値を表す情報をさらに含め、
前記類似演算手段は、前記ラベルに含まれる前記類似閾値を表す情報に基づいて、前記再分散の際に用いるプリフィックスを決定することを特徴とする請求項2に記載の類似演算装置。 - コンピュータ装置が、
データの類似性に関わる属性値を格納したノードが、前記データ間の類似関係を表すよう階層的に構成された類似インデックスを用いて、
前記データ毎に、前記類似インデックスにおいて前記属性値が格納されたノードの位置を示すパスに基づくラベルを生成し、
前記データ毎に、前記属性値と、前記ラベルと、前記類似性に関わる前記属性値以外の他の属性値と、を関連付けた情報をデータ記憶手段に記憶し、
前記データ記憶手段に記憶された全てまたは一部の情報が示す前記データであって、前記他の属性値に関する選択条件を満たす前記データである所定データについて、前記ラベルに基づき前記類似インデックスを再構成し、再構成した前記類似インデックスを用いて前記所定データを対象とする前記類似性に基づく演算を実行し、
前記属性値が格納されたノードには、親のノードにおける前記データとの前記類似性の順に、前記属性値が配置され、
前記ラベルの生成において、前記属性値が格納されたノードの位置、及び、当該ノード内での前記属性値の配置順序を示すパスに基づく前記ラベルを、前記データ毎に、生成する、方法。 - データの類似性に関わる属性値を格納したノードが、前記データ間の類似関係を表すよう階層的に構成された類似インデックスを用いて、
前記データ毎に、前記類似インデックスにおいて前記属性値が格納されたノードの位置を示すパスに基づくラベルを生成するラベル生成ステップと、
前記データ毎に、前記属性値と、前記ラベルと、前記類似性に関わる前記属性値以外の他の属性値と、を関連付けた情報をデータ記憶手段に記憶するデータ記憶ステップと、
前記データ記憶手段に記憶された全てまたは一部の情報が示す前記データであって、前記他の属性値に関する選択条件を満たす前記データである所定データについて、前記ラベルに基づき前記類似インデックスを再構成し、再構成した前記類似インデックスを用いて前記所定データを対象とする前記類似性に基づく演算を実行する類似演算ステップと、
をコンピュータ装置に実行させ、
前記属性値が格納されたノードには、親のノードにおける前記データとの前記類似性の順に、前記属性値が配置され、
前記ラベル生成ステップにおいて、前記属性値が格納されたノードの位置、及び、当該ノード内での前記属性値の配置順序を示すパスに基づく前記ラベルを、前記データ毎に、生成させる、プログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016122509 | 2016-06-21 | ||
JP2016122509 | 2016-06-21 | ||
PCT/JP2017/022440 WO2017221857A1 (ja) | 2016-06-21 | 2017-06-19 | 類似演算装置、方法および記憶媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2017221857A1 JPWO2017221857A1 (ja) | 2019-04-11 |
JP7099316B2 true JP7099316B2 (ja) | 2022-07-12 |
Family
ID=60784110
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018524062A Active JP7099316B2 (ja) | 2016-06-21 | 2017-06-19 | 類似度演算装置、方法、およびプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US11113314B2 (ja) |
JP (1) | JP7099316B2 (ja) |
WO (1) | WO2017221857A1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106527892B (zh) * | 2016-11-04 | 2020-04-07 | 惠州Tcl移动通信有限公司 | 一种电子设备的截屏方法及系统 |
CN112052251B (zh) * | 2020-09-14 | 2022-12-23 | 深圳市商汤科技有限公司 | 目标数据更新方法和相关装置、设备及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005222329A (ja) | 2004-02-05 | 2005-08-18 | Ntt Communications Kk | メタデータ付与装置、メタデータ付与方法およびメタデータ付与プログラム |
JP2009211554A (ja) | 2008-03-05 | 2009-09-17 | Canon Inc | 画像処理装置、画像処理方法、コンピュータプログラム、および記憶媒体 |
WO2012164735A1 (ja) | 2011-06-03 | 2012-12-06 | 富士通株式会社 | 情報処理装置、データ管理方法およびデータ管理プログラム |
JP2013239050A (ja) | 2012-05-16 | 2013-11-28 | Silex Technology Inc | データベース操作プログラム |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5987468A (en) | 1997-12-12 | 1999-11-16 | Hitachi America Ltd. | Structure and method for efficient parallel high-dimensional similarity join |
US8131722B2 (en) * | 2006-11-20 | 2012-03-06 | Ebay Inc. | Search clustering |
JP2014197412A (ja) | 2014-06-12 | 2014-10-16 | トムソン ライセンシングThomson Licensing | 画像の類似検索システム及び方法 |
-
2017
- 2017-06-19 WO PCT/JP2017/022440 patent/WO2017221857A1/ja active Application Filing
- 2017-06-19 JP JP2018524062A patent/JP7099316B2/ja active Active
- 2017-06-19 US US16/310,845 patent/US11113314B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005222329A (ja) | 2004-02-05 | 2005-08-18 | Ntt Communications Kk | メタデータ付与装置、メタデータ付与方法およびメタデータ付与プログラム |
JP2009211554A (ja) | 2008-03-05 | 2009-09-17 | Canon Inc | 画像処理装置、画像処理方法、コンピュータプログラム、および記憶媒体 |
WO2012164735A1 (ja) | 2011-06-03 | 2012-12-06 | 富士通株式会社 | 情報処理装置、データ管理方法およびデータ管理プログラム |
JP2013239050A (ja) | 2012-05-16 | 2013-11-28 | Silex Technology Inc | データベース操作プログラム |
Non-Patent Citations (1)
Title |
---|
劉 健全,類似度の階層関係に基づく木構造索引を用いた効率的な類似検索,第5回データ工学と情報マネジメントに関するフォーラム (第11回日本データベース学会年次大会) [online],電子情報通信学会データ工学研究専門委員会 日本データベース学会 情報処理学会データベースシステム研究会 ,2013年05月31日,DEIM Forum 2013 A9-1,Internet<URL:http://db-event.jpn.org/deim2013/proceedings/pdf/a9-1.pdf> |
Also Published As
Publication number | Publication date |
---|---|
US11113314B2 (en) | 2021-09-07 |
US20190179836A1 (en) | 2019-06-13 |
WO2017221857A1 (ja) | 2017-12-28 |
JPWO2017221857A1 (ja) | 2019-04-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7689630B1 (en) | Two-level bitmap structure for bit compression and data management | |
JP5407169B2 (ja) | クラスタリングプログラム、検索プログラム、クラスタリング方法、検索方法、クラスタリング装置および検索装置 | |
JP3566111B2 (ja) | 記号辞書作成方法及び記号辞書検索方法 | |
US20150032708A1 (en) | Database analysis apparatus and method | |
JP2009110513A (ja) | ワードの類似性を用いたオントロジーの自動生成 | |
JP6434162B2 (ja) | データ管理システム、データ管理方法およびプログラム | |
JP4374902B2 (ja) | 類似画像検索装置、類似画像検索方法、および類似画像検索プログラム | |
CA2931184A1 (en) | A method of generating a reference index data structure and method for finding a position of a data pattern in a reference data structure | |
JP2006185408A (ja) | データベース構築装置及びデータベース検索装置及びデータベース装置 | |
JP7099316B2 (ja) | 類似度演算装置、方法、およびプログラム | |
CN105589908A (zh) | 用于事务集合的关联规则计算方法 | |
JP2005165598A (ja) | 可変長文字列検索装置及び可変長文字列検索方法並びにプログラム | |
JP5844824B2 (ja) | Sparqlクエリ最適化方法 | |
CN112883192B (zh) | 一种异构领域用户与资源关联挖掘方法及系统 | |
Alvarez et al. | Counting triangulations and other crossing-free structures via onion layers | |
JP5812007B2 (ja) | インデックス作成装置、データ検索装置、インデックス作成方法、データ検索方法、インデックス作成プログラムおよびデータ検索プログラム | |
JPWO2018012413A1 (ja) | 類似データ検索装置、類似データ検索方法および記録媒体 | |
Heule et al. | Clausal Proof Compression. | |
JP2001022766A (ja) | 多次元データベースの高速処理方法および装置 | |
JP6666312B2 (ja) | 多次元データ管理システム及び多次元データ管理方法 | |
JP6631139B2 (ja) | 検索制御プログラム、検索制御方法および検索サーバ装置 | |
WO2019163584A1 (ja) | 文書要約装置、方法、及びプログラム | |
JP5175607B2 (ja) | 決定木作成装置 | |
WO2013069149A1 (ja) | データ検索装置、データの検索方法及びプログラム | |
JP7464499B2 (ja) | コード化装置、コード化方法及びコード化プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20181206 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200515 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210406 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210528 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20211021 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20211116 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220114 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220531 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220613 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7099316 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |