JP5315291B2 - グラフにおけるノードの間の類似度を計算するための方法、プログラム、およびシステム - Google Patents
グラフにおけるノードの間の類似度を計算するための方法、プログラム、およびシステム Download PDFInfo
- Publication number
- JP5315291B2 JP5315291B2 JP2010105065A JP2010105065A JP5315291B2 JP 5315291 B2 JP5315291 B2 JP 5315291B2 JP 2010105065 A JP2010105065 A JP 2010105065A JP 2010105065 A JP2010105065 A JP 2010105065A JP 5315291 B2 JP5315291 B2 JP 5315291B2
- Authority
- JP
- Japan
- Prior art keywords
- node
- label value
- nodes
- calculating
- similarity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
- G06F16/9024—Graphs; Linked lists
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
“We propose fast subtree kernels on graphs. On graphs with n nodes and medges and maximum degree d, these kernels comparing subtreesof height h can be computed in O(mh), whereas theclassic subtree kernel by Ramon & G¨artner scales as O(n24dh). Key to this efficiency is theobservation that the Weisfeiler-Lehman test ofisomorphism from graph theory elegantly computes a subtreekernel as a byproduct. Our fast subtree kernels candeal with labeled graphs, scale up easily to large graphs and outperformstate-of-the-art graph kernels on several classification benchmark datasets interms of accuracy and runtime.”
“Graphs are a powerful and versatile tooluseful in various subfields of science and engineering. In many applications, forexample, in pattern recognition and computer vision, it is required to measurethe similarity of objects. When graphs are used for the representation ofstructured objects, then the problem of measuring object similarity turns intothe problem of computing the similarity of graphs, which is also known as graphmatching. In this paper, similarity measures on graphs and related algorithmswill be reviewed. Applications of graph matching will be demonstrated givingexamples from the fields of pattern recognition and computer vision. Also recenttheoretical work showing various relations between different similaritymeasures will be discussed.”
g.nodelabellist:ノードラベルのリストを表す長さnのリスト
g.nodelabellistx:g.nodelabellistと同じデータ構造で、ラベル書込み用バッファとして使用される、長さnのリスト
g.adjacencymatrix:グラフの隣接行列。ノードiとノードjにリンクがあれば行列の要素(i, j)は1、そうでなければ0を持つ。大きさはn × nになるが、0要素を省略するスパース行列というデータ構造を使えばn × dで済む。
g.edgelabelmatrix:エッジ・ラベルのリストを表す長さn × nの行列。ノードiとノードjにリンクがあれば行列の要素(i, j)にエッジのラベル値を持ち、そうでなければ0の値を持つ。大きさはn ×nになるが、0要素を省略するスパース行列というデータ構造を使えばn ×dで済む。
for ( i = 1; i <= p; i++ ) {
LHi =(P2 * i) % P1;
}
ここで、%は、割算の余りを計算する演算子である。なお、これ以外の任意の乱数生成ルーチンを使用することもできることに留意されたい。
NewLabel =Hash(ThisNodeLabel,NeighboringNodeLabels[], ConnectedEdgeLabels[])
・CoS(ID):接続ノードベクトル(2361次元)の内積で類似度を定義
・CoS(label):接続ノードのラベル個数ベクトル(13次元)の内積で類似度を定義
・SimRank:ランダムウォークベースの既存手法
・AugmentedSimRank:ノードラベルを考慮したランダムウォークベースの既存手法
210・・・グラフ・データ格納部
215・・・グラフ探索部
220・・・ハッシュ計算部
225・・・ノード選択部
230・・・ラベル値補正部
235・・・ノード類似度計算部
Claims (15)
- コンピュータの処理によって、1以上のグラフにおけるノードの間の類似度を計算する方法であって、
前記1以上のグラフにおけるノードのそれぞれについて、当該ノードの隣接ノードのラベル値に基づいて新ラベル値を計算するステップと、
ノード間の類似度を計算する対象ノードのそれぞれについて、当該対象ノードの前記ラベル値の影響を取り除くように、その隣接ノードの前記新ラベル値を補正するステップと、
1の対象ノードの隣接ノードの補正された新ラベル値と、他の対象ノードの隣接ノードの補正された新ラベル値を用いて、前記対象ノードの間の類似度を計算するステップと、
を含む、方法。 - 前記新ラベル値を計算するステップが、前記隣接ノードのラベル値のハッシュ計算を実行するステップを含む、請求項1に記載の方法。
- 前記ハッシュ計算を実行するステップが、前記隣接ノードが複数存在する場合に複数の前記隣接ノードのラベル値同士をXORした値を計算するステップを含む、請求項2に記載の方法。
- 前記ハッシュ計算を実行するステップが、前記隣接ノードが複数存在する場合に複数の前記隣接ノードのラベル値同士をXORした値と当該ノードのラベル値のXORを計算するステップを含む、請求項2に記載の方法。
- 前記補正するステップが、当該対象ノードの前記ラベル値の影響を取り除くために、前記対象ノードの隣接ノードの新ラベル値と対象ノードのラベル値をXORした値を計算するステップを含む、請求項4に記載の方法。
- 前記新ラベルを計算するステップが、当該ノードに接続されたエッジのラベル値を用いて隣接ノードのラベル値を変換するステップを含む、請求項1に記載の方法。
- 前記変換するステップが、隣接ノードのラベル値を当該ノードに接続されたエッジのラベル値に応じてビット回転するステップを含む、請求項6に記載の方法。
- 前記変換するステップが、隣接ノードのラベル値に当該ノードに接続されたエッジのラベル値を加算するステップを含む、請求項7に記載の方法。
- 前記類似度を計算するステップが、1の対象ノードの隣接ノードの補正された新ラベル値と他の対象ノードの隣接ノードの補正された新ラベル値を比較し、ジャカード係数(Jaccard coefficient)を計算するステップを含む、請求項1に記載の方法
- 前記新ラベル値を計算するステップが、前記1以上のグラフにおけるノードのラベル値を当該ノードの前記新ラベル値で置き換えるステップを含み、前記新ラベル値を計算するステップを、所定の回数繰り返すステップを含む、請求項1に記載の方法。
- 前記ラベル値が、離散値である、請求項1に記載の方法。
- 前記ラベル値が、所定のビット列である、請求項1に記載の方法。
- 前記ラベル値が、固定長のビット列である、請求項1に記載の方法。
- 1以上のグラフにおけるノードの間の類似度を計算するためのプログラムであって、
前記1以上のグラフにおけるノードのそれぞれについて、当該ノードの隣接ノードにのラベル値に基づいて新ラベル値を計算するステップと、
ノード間の類似度を計算する対象ノードのそれぞれについて、当該対象ノードの前記ラベル値の影響を取り除くように、その隣接ノードの前記新ラベル値を補正するステップと、
1の対象ノードの隣接ノードの補正された新ラベル値と、他の対象ノードの隣接ノードの補正された新ラベル値を用いて、前記対象ノードの間の類似度を計算するステップと、
をコンピュータに実行させる、プログラム。 - 1以上のグラフにおけるノードの間の類似度を計算するためのシステムであって、
前記1以上のグラフにおけるノードのそれぞれについて、当該ノードの隣接ノードのラベル値に基づいて新ラベル値を計算する手段と、
ノード間の類似度を計算する対象ノードのそれぞれについて、当該対象ノードの前記ラベル値の影響を取り除くように、その隣接ノードの前記新ラベル値を補正する手段と、
1の対象ノードの隣接ノードの補正された新ラベル値と、他の対象ノードの隣接ノードの補正された新ラベル値を用いて、前記対象ノードの間の類似度を計算する手段と、
を備える、システム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010105065A JP5315291B2 (ja) | 2010-04-30 | 2010-04-30 | グラフにおけるノードの間の類似度を計算するための方法、プログラム、およびシステム |
US13/093,962 US8538169B2 (en) | 2010-04-30 | 2011-04-26 | Method, program, and system for calculating similarity between nodes in graph |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010105065A JP5315291B2 (ja) | 2010-04-30 | 2010-04-30 | グラフにおけるノードの間の類似度を計算するための方法、プログラム、およびシステム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011233069A JP2011233069A (ja) | 2011-11-17 |
JP5315291B2 true JP5315291B2 (ja) | 2013-10-16 |
Family
ID=44858307
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010105065A Expired - Fee Related JP5315291B2 (ja) | 2010-04-30 | 2010-04-30 | グラフにおけるノードの間の類似度を計算するための方法、プログラム、およびシステム |
Country Status (2)
Country | Link |
---|---|
US (1) | US8538169B2 (ja) |
JP (1) | JP5315291B2 (ja) |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8762390B2 (en) * | 2011-11-21 | 2014-06-24 | Nec Laboratories America, Inc. | Query specific fusion for image retrieval |
US9135369B2 (en) | 2012-05-02 | 2015-09-15 | Nvidia Corporation | System, method, and computer program product for performing graph aggregation |
US9009179B2 (en) * | 2012-05-02 | 2015-04-14 | Nvidia Corporation | System, method, and computer program product for performing graph matching |
US9405853B2 (en) * | 2013-06-17 | 2016-08-02 | Hewlett Packard Enterprise Development Lp | Reading object queries |
US10657178B2 (en) * | 2014-08-22 | 2020-05-19 | Hewlett Packard Enterprise Development Lp | Processing of a generate entity type graph component of a graph analysis system |
CN105989154B (zh) * | 2015-03-03 | 2020-07-14 | 华为技术有限公司 | 相似性度量的方法及设备 |
US11222072B1 (en) * | 2015-07-17 | 2022-01-11 | EMC IP Holding Company LLC | Graph database management system and method for a distributed computing environment |
US9558265B1 (en) * | 2016-05-12 | 2017-01-31 | Quid, Inc. | Facilitating targeted analysis via graph generation based on an influencing parameter |
US10824607B2 (en) | 2016-07-21 | 2020-11-03 | Ayasdi Ai Llc | Topological data analysis of data from a fact table and related dimension tables |
US11301774B2 (en) | 2017-02-28 | 2022-04-12 | Nec Corporation | System and method for multi-modal graph-based personalization |
US10803122B2 (en) * | 2017-04-11 | 2020-10-13 | International Business Machines Corporation | Labeled graph isomorphism allowing for false positive |
US10866963B2 (en) * | 2017-12-28 | 2020-12-15 | Dropbox, Inc. | File system authentication |
CN108197491B (zh) * | 2017-12-29 | 2021-06-15 | 西安电子科技大学 | 一种基于密文的子图检索方法 |
CA3095362A1 (en) * | 2019-10-03 | 2021-04-03 | Royal Bank Of Canada | System and method for behavioral pattern recognition |
CN110826812A (zh) * | 2019-11-13 | 2020-02-21 | 南京航空航天大学 | 一种基于图的布尔可满足性问题的目标算法预测方法 |
JP7346286B2 (ja) * | 2019-12-25 | 2023-09-19 | 株式会社日立製作所 | 関連性分析装置、及び方法 |
US11809986B2 (en) | 2020-05-15 | 2023-11-07 | International Business Machines Corporation | Computing graph similarity via graph matching |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07155169A (ja) | 1993-12-10 | 1995-06-20 | Hitachi Ltd | 生体高分子局所類似配列の表示、抽出方法及び装置 |
JPH07219759A (ja) | 1994-01-31 | 1995-08-18 | Kodo Tsushin Syst Kenkyusho:Kk | 通信ソフトウェア開発支援装置 |
CN1186737C (zh) * | 2002-02-05 | 2005-01-26 | 国际商业机器公司 | 对尚未访问的网页进行基于路径的排队的方法和系统 |
KR100513735B1 (ko) * | 2002-12-05 | 2005-09-08 | 삼성전자주식회사 | 지각적 인식이 가능한 3차원 형상의 기술방법과 이를이용한 3차원 그래픽 모델의 데이터베이스 검색 방법 및장치 |
US7257244B2 (en) * | 2003-02-24 | 2007-08-14 | Vanderbilt University | Elastography imaging modalities for characterizing properties of tissue |
US7174043B2 (en) * | 2003-02-25 | 2007-02-06 | Evernote Corp. | On-line handwriting recognizer |
JP4073015B2 (ja) | 2003-03-05 | 2008-04-09 | 日本電信電話株式会社 | 類似度計算方法、装置、プログラムおよび該プログラムを格納した記録媒体 |
JP2007128389A (ja) | 2005-11-07 | 2007-05-24 | Fujitsu Ltd | 単語クラス作成プログラム、単語クラス作成装置、及び単語クラス作成方法、並びに類似度算出プログラム、類似度算出装置、及び類似度算出方法 |
US7599902B2 (en) * | 2006-04-27 | 2009-10-06 | Hrl Laboratories, Llc | Analogical reasoning system |
US8041082B1 (en) * | 2007-11-02 | 2011-10-18 | Google Inc. | Inferring the gender of a face in an image |
JP4956503B2 (ja) | 2008-07-30 | 2012-06-20 | 日本放送協会 | グラフ統合装置及びそのプログラム |
-
2010
- 2010-04-30 JP JP2010105065A patent/JP5315291B2/ja not_active Expired - Fee Related
-
2011
- 2011-04-26 US US13/093,962 patent/US8538169B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US20110268364A1 (en) | 2011-11-03 |
US8538169B2 (en) | 2013-09-17 |
JP2011233069A (ja) | 2011-11-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5315291B2 (ja) | グラフにおけるノードの間の類似度を計算するための方法、プログラム、およびシステム | |
JP5306461B2 (ja) | グラフの類似度計算システム、方法及びプログラム | |
CN105786980B (zh) | 对描述同一实体的不同实例进行合并的方法、装置及设备 | |
CN111461164A (zh) | 样本数据集的扩容方法及模型的训练方法 | |
Zhang et al. | An efficient, large-scale, non-lattice-detection algorithm for exhaustive structural auditing of biomedical ontologies | |
US20230401426A1 (en) | Prediction method, prediction apparatus and program | |
Djukanovic et al. | An A⁎ search algorithm for the constrained longest common subsequence problem | |
Nguyen et al. | On a linear fused Gromov-Wasserstein distance for graph structured data | |
JP6770709B2 (ja) | 機械学習用モデル生成装置及びプログラム。 | |
JP2004318884A (ja) | 有向スケールフリーオブジェクト関係のモデリング | |
Paszek et al. | Efficient algorithms for genomic duplication models | |
Hamilton et al. | An entanglement-based volumetric benchmark for near-term quantum hardware | |
Zhang et al. | Nonbifurcating Phylogenetic Tree Inference via the Adaptive LASSO | |
CN109472023B (zh) | 一种基于实体及文本联合嵌入的实体关联度衡量方法、系统及存储介质 | |
Han et al. | Improving quartet graph construction for scalable and accurate species tree estimation from gene trees | |
Blum et al. | Hybrid techniques based on solving reduced problem instances for a longest common subsequence problem | |
Patra et al. | Motif discovery in biological network using expansion tree | |
Zhang et al. | A heuristic cluster-based em algorithm for the planted (l, d) problem | |
Guan et al. | DCG++: a data-driven metric for geometric pattern recognition | |
Wicaksana et al. | Web-app realization of Shor’s quantum factoring algorithm and Grover’s quantum search algorithm | |
US11797580B2 (en) | Connection nature between nodes in graph structure | |
Porter | Fast NeighborNet: Improving the Speed of the Neighbor-Net Phylogenetic Network Algorithm with Multithreading and a Relaxed Search Strategy | |
CN115794196B (zh) | EdgeX的关键软件识别方法、装置、设备及存储介质 | |
JP4082615B2 (ja) | 判定装置、判定方法、及びプログラム | |
WO2023017565A1 (ja) | 信頼性計算方法、信頼性計算装置、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130115 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130416 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130423 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130515 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130618 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130708 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |