JP2008181331A - Relation extraction method, relation extraction system - Google Patents
Relation extraction method, relation extraction system Download PDFInfo
- Publication number
- JP2008181331A JP2008181331A JP2007014167A JP2007014167A JP2008181331A JP 2008181331 A JP2008181331 A JP 2008181331A JP 2007014167 A JP2007014167 A JP 2007014167A JP 2007014167 A JP2007014167 A JP 2007014167A JP 2008181331 A JP2008181331 A JP 2008181331A
- Authority
- JP
- Japan
- Prior art keywords
- nodes
- query
- graph
- data
- query graph
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本発明は、グラフ構造で表現されたデータからノード間の関係の強弱を求めるグラフマインニング技術に関する。 The present invention relates to a graph mining technique for obtaining the strength of a relationship between nodes from data expressed in a graph structure.
近年、さまざまな構造を持つデータをグラフとして表現し、その中からグラフパターンのマッチングによる検索を実行して検索結果を得るデータベースシステムの開発が進んでいる。非特許文献1は、グラフパターンマッチングによるRDF(Resource Description Framework)データの検索を行うための仕様である。非特許文献1に示された仕様に基づいたシステムでは、グラフ構造のクエリを用いて、多様なノードや多様なアークから構成されるグラフ構造を持つ大量のデータから構造がマッチするデータを抽出し、マッチした部分をサブグラフとして取得することができる。なお、特許文献1には、キーワードや概念などの情報に基づいてグラフ構造のクエリグラフパターンを生成する技術が記載されている。クエリグラフパターンとは、グラフ構造を持つデータから構造がマッチするデータを抽出するためのグラフである。
In recent years, development of a database system that expresses data having various structures as a graph and executes a search by matching a graph pattern from the data to obtain a search result has been progressing.
また、グラフとして表現されたデータから特徴的な関係を発見するグラフマイニングなどの手法に関する研究が進展している。非特許文献2には、特徴的な関係を求めたい複数の事柄に関するキーワードを用いてインターネット上で情報検索を行った検索結果の重なりを求めて、複数の事柄間の係数を求める技術が記載されている。
しかしながら、非特許文献1には、クエリグラフパターンにマッチしたサブグラフを抽出することは記載されているが、抽出結果から特徴的な関係を発見することについては記載されていない。
However, Non-Patent
また、非特許文献2に記載の技術は、関係を求めたい複数の事柄について、インターネット上に存在する情報を検索対象として用いるものであって、多様なノードや多様なアークで構成されたグラフ構造を持つデータを検索対象とすることについては想定しておらず、その方法も記載されていない。 The technique described in Non-Patent Document 2 uses information existing on the Internet as a search target for a plurality of matters for which a relationship is desired, and has a graph structure composed of various nodes and various arcs. It is not assumed that data having a search target is to be searched, and the method is not described.
本発明は、上記に鑑みてなされたものであり、その課題とするところは、多様なノードや多様なアークから構成されたグラフ構造データから、注目したノード同士の関係の強さを複数の観点から求めることにある。 The present invention has been made in view of the above, and the problem is that a graph structure data composed of various nodes and various arcs can be used to determine the strength of the relationship between the nodes in question from a plurality of viewpoints. There is to ask from.
第1の本発明に係る関係抽出方法は、入力手段により、多様なノードと多様なアークから構成されるグラフ構造を持つデータが格納されているグラフ構造データベースに格納されたノードの中の複数のノードの選択を受け付けるステップと、クエリ発行手段により、選択されたノードの各々について、グラフ構造を持つデータから構造がマッチするデータを抽出するためのクエリグラフパターンの変数ノードに選択されたノードを代入し、当該クエリグラフパターンにマッチするデータをグラフ構造データベースから取得するステップと、係数計算手段により、データを取得するステップで選択されたノードの各々について取得したデータを比較してノードが重複する数を求め、当該重複数に基づいて選択されたノード間の係数を計算するステップと、を有することを特徴とする。 In the relation extraction method according to the first aspect of the present invention, a plurality of nodes among the nodes stored in the graph structure database in which data having a graph structure composed of various nodes and various arcs is stored by the input means. Accepting the selection of the node and assigning the selected node to the variable node of the query graph pattern for extracting the data whose structure matches from the data having the graph structure for each selected node by the query issuing means The number of overlapping nodes by comparing the data acquired for each of the nodes selected in the step of acquiring data matching the query graph pattern from the graph structure database and the step of acquiring data by the coefficient calculation means And calculate the coefficient between the selected nodes based on the overlap number. Characterized in that it has Tsu and up, the.
本発明にあっては、多様なノードと多様なアークから構成されるグラフ構造を持つデータの中から複数のノードの選択を受け付け、選択されたノードの各々について、クエリグラフパターンの変数ノードに選択されたノードを代入したクエリグラフパターンにマッチするデータを抽出し、選択されたノード毎に抽出したデータ間で重複するノードの数に基づいて係数を計算することで、選択されたノード同士の関係の強さを求めることができる。 In the present invention, selection of a plurality of nodes from data having a graph structure composed of various nodes and various arcs is accepted, and each of the selected nodes is selected as a variable node of a query graph pattern. The data that matches the query graph pattern assigned to the selected node is extracted, and the coefficient is calculated based on the number of nodes that overlap between the extracted data for each selected node. Can be determined.
上記関係抽出方法において、データを取得するステップは、選択されたノードに対応する変数ノードを含むクエリグラフパターンをクエリグラフパターンを格納しているクエリグラフパターンデータベースから取得することを特徴とする。 In the above relationship extraction method, the step of acquiring data is characterized in that a query graph pattern including a variable node corresponding to the selected node is acquired from a query graph pattern database storing the query graph pattern.
本発明にあっては、クエリグラフパターンを格納するクエリグラフパターンから利用するクエリグラフパターンを取得することで、さまざまなクエリグラフパターンを素早く取得することができ、いろいろな観点から選択されたノード同士の関係の強さを求めることができる。 In the present invention, by acquiring a query graph pattern to be used from a query graph pattern storing a query graph pattern, various query graph patterns can be quickly acquired, and nodes selected from various viewpoints can be obtained. The strength of the relationship can be obtained.
上記関係抽出方法において、データを取得するステップは、選択されたノードに対応する変数ノードを含むクエリグラフパターンを選択されたノードに基づいて生成することを特徴とする。 In the relation extraction method, the step of acquiring data generates a query graph pattern including a variable node corresponding to the selected node based on the selected node.
本発明にあっては、利用するクエリグラフパターンを選択されたノードに基づいて生成するので、選択されたノードに応じた柔軟なクエリグラフパターンの利用を可能とする。 In the present invention, since the query graph pattern to be used is generated based on the selected node, the flexible query graph pattern according to the selected node can be used.
上記関係抽出方法において、受け付けるステップは、選択されたノードに対応する変数ノードを含むクエリグラフパターンを入力することを特徴とする。 In the relationship extracting method, the accepting step inputs a query graph pattern including a variable node corresponding to the selected node.
本発明にあっては、利用するクエリグラフパターンを入力することにより、所望の観点からノード間の関係性の強弱を求めることを可能とする。 In the present invention, by inputting a query graph pattern to be used, it is possible to obtain the strength of the relationship between nodes from a desired viewpoint.
上記関係抽出方法において、計算するステップにより計算された係数に基づいて選択されたノード間の関係をグラフ構造として表示するステップを有することを特徴とする。 The relation extracting method includes a step of displaying a relation between nodes selected based on the coefficient calculated in the calculating step as a graph structure.
本発明にあっては、ノード間の関係の強弱を計算された係数に基づいてグラフ構造として表示することにより、利用者は選択したノードの関係を視覚的に容易に把握することが可能となる。 In the present invention, by displaying the strength of the relationship between nodes as a graph structure based on the calculated coefficient, the user can easily grasp the relationship between the selected nodes visually. .
第2の本発明に係る関係抽出システムは、多様なノードと多様なアークから構成されるグラフ構造を持つデータが格納されているグラフ構造データベースに接続され、グラフ構造データベースに格納されたノードの中の複数のノードの選択を受け付ける入力手段と、選択されたノードの各々について、グラフ構造を持つデータから構造がマッチするデータを抽出するためのクエリグラフパターンの変数ノードに選択されたノードを代入し、当該クエリグラフパターンにマッチするデータをグラフ構造データベースから取得するクエリ発行手段と、クエリ発行手段が選択されたノードの各々について取得したデータを比較してノードが重複する数を求め、当該重複数に基づいて選択されたノード間の係数を計算する係数計算手段と、を有することを特徴とする。 The relation extraction system according to the second aspect of the present invention is connected to a graph structure database in which data having a graph structure composed of various nodes and various arcs is stored, and among the nodes stored in the graph structure database. Input means for accepting selection of a plurality of nodes, and for each of the selected nodes, the selected node is substituted into a variable node of a query graph pattern for extracting data whose structure matches from data having a graph structure The query issuing means for acquiring data matching the query graph pattern from the graph structure database and the query issuing means for comparing the data acquired for each of the selected nodes to obtain the number of overlapping nodes, Coefficient calculating means for calculating a coefficient between nodes selected based on The features.
上記関係抽出システムにおいて、クエリグラフパターンを格納しているクエリグラフパターンデータベースを有し、クエリ発行手段は、選択されたノードに対応する変数ノードを含むクエリグラフパターンをクエリグラフパターンデータベースから取得することを特徴とする。 The relation extraction system has a query graph pattern database storing a query graph pattern, and the query issuing means acquires a query graph pattern including a variable node corresponding to the selected node from the query graph pattern database. It is characterized by.
上記関係抽出システムにおいて、クエリ発行手段は、選択されたノードに対応する変数ノードを含むクエリグラフパターンを選択されたノードに基づいて生成することを特徴とする。 In the relationship extraction system, the query issuing unit generates a query graph pattern including a variable node corresponding to the selected node based on the selected node.
上記関係抽出システムにおいて、入力手段は、選択されたノードに対応する変数ノードを含むクエリグラフパターンを入力することを特徴とする。 In the relationship extraction system, the input unit inputs a query graph pattern including a variable node corresponding to the selected node.
上記関係抽出システムにおいて、係数計算手段により計算された係数に基づいて選択されたノード間の関係をグラフ構造として表示する表示手段を有することを特徴とする。 The relation extraction system includes display means for displaying a relation between nodes selected based on the coefficient calculated by the coefficient calculation means as a graph structure.
本発明によれば、多様なノードや多様なアークから構成されたグラフ構造データから、注目したノード同士の関係の強さを複数の観点から求めることができる。 According to the present invention, it is possible to obtain the strength of the relationship between nodes of interest from a plurality of viewpoints from graph structure data composed of various nodes and various arcs.
以下、本発明の実施の形態について図面を用いて説明する。 Hereinafter, embodiments of the present invention will be described with reference to the drawings.
図1は、本実施の形態における関係抽出装置10を用いた関係抽出システム1の構成を示すブロック図である。同図に示す関係抽出システム1は、関係抽出装置10と、ユーザインタフェース提供部20と、グラフ構造データベース30とを有しており、関係抽出装置10は、ユーザインタフェース提供部20、グラフ構造データベース30にアクセス可能な状態で接続されている。
FIG. 1 is a block diagram showing a configuration of a
関係抽出装置10は、ユーザインタフェース提供部20で選択されたノードに基づいてクエリグラフパターンを検索または生成するクエリ発行部11と、クエリグラフパターンを記憶しておくクエリグラフパターンデータベース12と、クエリグラフパターンを用いた検索結果から関係性を表す係数を計算する係数計算部13とを有する。なお、関係抽出装置10は、演算処理装置、記憶装置、メモリ等を備えたコンピュータにより構成できるものであり、各部の処理はプログラムによって実行される。
The
ユーザインタフェース提供部20は、関連性を求めたいノードの選択が行えるGUIを提供したり、選択したノードの関連性の表示を行う。
The user
グラフ構造データベース30は、図2に示すような多様なノードや多様なアークから構成されたグラフ構造を持つデータが格納されている。同図において、何も表示されていないアークのラベル名は「技術キーワード」であり、ネームスペースも一部省略している。本実施の形態におけるグラフ構造データは、ラベル付き有効グラフデータであり、ラベル付き有効グラフで表現可能なデータのデータモデルを定めたものがRDFである。
The
図3は、これらのグラフ構造データがとのように既存のリレーショナルデータベースなどで管理されているデータから生成され、グラフ化されているかを示す説明図である。同図は、図2のデータの一部を示したものであり、「論文G」と、その著者の「山田太郎」と、その題名の「B技術入門」と、そのキーワード「B技術」とが与えられているデータを、RDF/XML形式データおよびRDFのグラフで表現したものである。ここでは、グラフのアークのことをRDFの仕様に基づいてプロパティと呼んでいる。 FIG. 3 is an explanatory diagram showing whether the graph structure data is generated from data managed in an existing relational database or the like and graphed. This figure shows a part of the data in FIG. 2, “Paper G”, its author “Taro Yamada”, its title “Introduction to B Technology”, and its keyword “B Technology”. Is represented by RDF / XML format data and an RDF graph. Here, the arc of the graph is called a property based on the RDF specification.
次に、上記のように構成された関係抽出システム1の動作を図を用いて説明する。
Next, the operation of the
図4は、本実施の形態における関係抽出システム1の動作を示すシーケンス図である。まず、ユーザインタフェース提供部20においてユーザ操作用GUIが生成される(S1)。本実施の形態においては、選択されるノードが特定できるキーワードなどの入力を促すGUIが生成される。
FIG. 4 is a sequence diagram showing the operation of the
そして、生成されたGUIがユーザに提示され、ユーザにより関係性を求めたいノードが複数個選択される(S2)。ユーザにより選択されたノードやノードのIDであるURI(Uniform Resource Identifier)などが関係抽出装置10に送信される。また、検索の指示内容を関係抽出装置10に送信してもよい。検索の指示内容としては、後述するクエリグラフパターンを直接指定するものでもよいし、クエリグラフパターンを生成するのに有用な情報でもよい。なお、本実施の形態においては、ユーザに入力を促してノードを選択する関係抽出システム1について説明したが、ユーザインタフェース提供部20を備えずに、関係抽出装置10に接続された別の装置が、ユーザを介さずにノードを選択し、それを入力するものであってもよい。
Then, the generated GUI is presented to the user, and the user selects a plurality of nodes for which a relationship is desired (S2). The node selected by the user and the URI (Uniform Resource Identifier) which is the ID of the node are transmitted to the
クエリ発行部11では、受信したノードのキーワードやURIなどの入力値や検索の指示内容などに基づいて、クエリグラフパターンデータベース12からクエリグラフパターンの探索を行う(S3)。クエリグラフパターンデータベース12には、多数のクエリグラフパターンが格納されており、クエリ発行部11は、その中から入力値に関連したクエリグラフパターンを検索する。例えば、「A技術」、「B技術」、「C技術」、「D技術」という具体的な技術名がキーワードとして入力されたとする。この場合、クエリグラフパターンデータベース12から技術名を取り得る変数ノード「?keyword」を有するクエリグラフパターンを検索して、読み出す。
The
例として、図5、図6に技術名を取り得る変数ノード「?keyword」を有するクエリグラフパターンを示す。図5は、変数ノード「?keyword」をプロパティ「rm:技術キーワード」で指し示す2つの変数ノード「?x」、「?y」を有し、2つの変数ノード「?x」、「?y」のそれぞれは、変数ノード「?person 」をプロパティ「rm:著者」で指し示し、変数ノード「?person」は、ノード「Person:人」につながるプロパティ「rdf:type」を有しているクエリグラフパターンである。 As an example, FIG. 5 and FIG. 6 show a query graph pattern having a variable node “? Keyword” that can take a technical name. FIG. 5 includes two variable nodes “? X” and “? Y” indicating the variable node “? Keyword” with the property “rm: technical keyword”, and the two variable nodes “? X” and “? Y”. Each indicates a variable node “? Person” with a property “rm: author”, and the variable node “? Person” has a property “rdf: type” that leads to the node “Person: person”. It is.
図6は、図5に示したものに対して、変数ノード「?x」が、プロパティ「pj:担当者」で変数ノード「?person」を指し示すようになっているクエリグラフパターンである。 FIG. 6 is a query graph pattern in which the variable node “? X” indicates the variable node “? Person” with the property “pj: person in charge” with respect to what is shown in FIG.
なお、本実施の形態では、クエリグラフパターンデータベース12に格納されたクエリグラフパターンの中からユーザの入力値に基づいてクエリグラフパターンを抽出したが、例えば、クエリグラフパターンデータベース12を備えず、特許文献1に示す方法を用いて、ユーザの入力値に基づいてグラフ構造データベース30に格納されるデータを解析することにより、クエリグラフパターンを生成しても良い。
In the present embodiment, the query graph pattern is extracted from the query graph patterns stored in the query
続いて、クエリ発行部11は、得られたクエリグラフパターンの変数ノードに入力値を代入したものをクエリとして、グラフ構造データベース30に対してパターンにマッチするデータ(サブグラフ)を返すように要求を出す(S4)。例えば、キーワード「A技術」、「B技術」、「C技術」、「D技術」が入力され、図5に示すクエリグラフパターンAが得られていたとすると、クエリグラフパターンAの変数ノード「?keyword」の部分に、「A技術」、「B技術」、「C技術」、「D技術」をそれぞれ代入した4つのクエリが作られる。
Subsequently, the
そして、グラフ構造データベース30は、クエリにマッチするデータを返す(S5)。図7は、図2に示したグラフ構造に対して、図5に示すクエリグラフパターンAの変数ノード「?keyword」の部分に、「B技術」を代入したクエリグラフパターンを利用して得られた結果を太線で示した図である。図7では、上記クエリにパターンマッチする構造が3箇所示されており、クエリグラフパターンAの各変数ノード「?x」、「?y」、「?person」に対応するサブグラフのノードの値を抽出することができる。例えば、上記クエリにマッチしたパターンにおける変数ノード「?person」に対応する値は、「Person:山田太郎」、「Person:田中一郎」、「Person:鈴木花子」の3つである。
Then, the
続いて、クエリを利用して得られた結果が係数計算部13に渡され(S6)、係数計算部13は、それらの結果に基づいて、入力されたノード間の関係の強弱を計算する(S7)。本実施の形態においては、入力された各ノードの値を代入したクエリを利用して得られたデータ間で重複する同概念のノードの数を算出して、係数を求める。なお、係数計算部13に渡されるデータは、得られたグラフ構造データ、あるいは、クエリグラフパターンの変数ノードの値などである。
Subsequently, the result obtained by using the query is passed to the coefficient calculation unit 13 (S6), and the
例として、クエリグラフパターンAの変数ノード「?person」に対応する値を係数を求める際に参照する場合を示す。「A技術」を代入して得られた変数ノード「?person」に対応する値は、「Person:山本幸子」、「Person:中村二郎」、「Person:山田太郎」であり、「B技術」を代入して得られた変数ノード「?person」に対応する値は、すでに示したように「Person:山田太郎」、「Person:田中一郎」、「Person:鈴木花子」である。「C技術」を代入して得られた変数ノード「?person」に対応する値は、「Person:山田太郎」、「Person:田中一郎」であり、「D技術」を代入して得られた変数ノード「?person」に対応する値は、「Person:田中一郎」、「Person:鈴木花子」である。 As an example, a case where a value corresponding to the variable node “? Person” of the query graph pattern A is referred to when a coefficient is obtained is shown. The values corresponding to the variable node “? Person” obtained by substituting “A technology” are “Person: Sachiko Yamamoto”, “Person: Jiro Nakamura”, “Person: Taro Yamada”, and “B technology”. As described above, the values corresponding to the variable node “? Person” obtained by substituting are “Person: Taro Yamada”, “Person: Ichiro Tanaka”, and “Person: Hanako Suzuki”. The values corresponding to the variable node “? Person” obtained by substituting “C technology” are “Person: Taro Yamada” and “Person: Ichiro Tanaka”, and obtained by substituting “D technology”. The values corresponding to the variable node “? Person” are “Person: Ichiro Tanaka” and “Person: Hanako Suzuki”.
これらの結果により、入力された各ノード間で重複する変数ノード「?person」に対応する値を求めると、「A技術」と「B技術」に関しては「Person:山田太郎」が重複し、「A技術」と「C技術」に関しては「Person:山田太郎」が重複し、「A技術」と「D技術」に関しては重複する値はない。また、「B技術」と「C技術」に関しては「Person:山田太郎」と「Person:田中一郎」の2つが重複し、「B技術」と「D技術」に関しては「Person:田中一郎」と「Person:鈴木花子」の2つが重複し、「C技術」と「D技術」に関しては「田中一郎」が重複している。 Based on these results, when the value corresponding to the variable node “? Person” that is duplicated between the input nodes is obtained, “Person: Taro Yamada” is duplicated for “A technology” and “B technology”. “Person: Taro Yamada” overlaps for “A technology” and “C technology”, and there is no overlapping value for “A technology” and “D technology”. In addition, “Person: Taro Yamada” and “Person: Ichiro Tanaka” overlap for “B Technology” and “C Technology”, and “Person: Ichiro Tanaka” for “B Technology” and “D Technology”. “Person: Hanako Suzuki” overlaps, and “C Technology” and “D Technology” overlap “Ichiro Tanaka”.
入力された各ノード間で重複するノードの数が得られたら、次式(1)に示すシンプソン係数を用いて関係性の強弱を求める。
例えば、「A技術」と「B技術」の係数を求めると、「A技術」と「B技術」のそれぞれを代入したクエリの結果の変数ノード「?person」に対応する値のうち重複するものの個数は1であり、「A技術」を代入したクエリの結果の変数ノード「?person」に対応する値の個数は3であり、「B技術」を代入したクエリの結果の変数ノード「?person」に対応する値の個数は3であるので、シンプソン係数は、1/min(3,3)=0.33となる。図8は、入力された各ノード間の係数を同様に求めた表を示す図である。 For example, when the coefficients of “A technology” and “B technology” are obtained, duplicate values among the values corresponding to the variable node “? Person” of the query result obtained by assigning each of “A technology” and “B technology” The number is 1, the number of values corresponding to the variable node “? Person” of the query result to which “A technology” is substituted is 3, and the variable node “? Person” of the query result to which “B technology” is substituted. Since the number of values corresponding to “3” is 3, the Simpson coefficient is 1 / min (3, 3) = 0.33. FIG. 8 is a diagram showing a table in which coefficients between input nodes are similarly obtained.
また、図9は、図6に示したクエリグラフパターンBの変数ノード「?keyword」に「A技術」、「B技術」、「C技術」、「D技術」をそれぞれ代入して得られた結果からS7に示した処理により係数を求めて表にした図である。 FIG. 9 is obtained by substituting “A technology”, “B technology”, “C technology”, and “D technology” into the variable node “? Keyword” of the query graph pattern B shown in FIG. It is the figure which calculated | required the coefficient by the process shown to S7 from the result, and made it a table | surface.
図8、図9に示すように、クエリグラフパターンAを利用したものと、クエリグラフパターンBを利用したものでは結果が異なっている。これは、グラフパターンが異なることに起因しており、求めた係数を関係抽出システム1がユーザに提示するときに、クエリグラフパターンを併せて提示すれば、どの観点から係数を求めたのかユーザは判断することができる。なお、クエリグラフパターンAは、技術をキーワードとする2つの論文の著者という観点であり、クエリグラフパターンBは、技術をキーワードとする論文の著者であって技術をキーワードとするプロジェクトの担当者でもあるという観点である。
As shown in FIGS. 8 and 9, the results using the query graph pattern A are different from those using the query graph pattern B. This is because the graph pattern is different. When the
求めた係数は、ユーザインタフェース提供部20に送られ、ユーザインタフェース提供部20により表示結果画面の生成が行われてユーザに提示される(S8)。画像は、例えば、図10、図11に示すように、グラフにより表示する。これにより、ユーザは指定したノードの関係を視覚的に容易に把握することが可能となる。また、複数のクエリグラフパターンを用いることにより、複数のクエリグラフパターン(観点)毎に結果を得ることができるので、クエリグラフパターン(観点)とノード間の関係の強弱との相関を示すことが可能となる。
The obtained coefficient is sent to the user
したがって、本実施の形態によれば、多様なノードや多様なアークから構成されたグラフ構造のデータを格納するグラフ構造データベース30に接続される関係抽出装置10が、関係の強弱を求めたい複数のノードを入力し、多数のクエリグラフパターンを格納したクエリグラフパターンデータベース12から入力されたノードに関連したクエリグラフパターンを検索するクエリ発行部11と、検索したクエリグラフパターンを用いて入力されたノードの値のそれぞれについてグラフ構造データベース30から抽出されたサブグラフ間で重複する同概念のノードの数を用いて係数を求めることにより、入力されたノード間の関係の強弱を求めることができる。また、複数のクエリグラフパターンを利用することにより、複数の観点から入力されたノード間の関係の強弱を求めることができる。
Therefore, according to the present embodiment, the
1…関係抽出システム
10…関係抽出装置
11…クエリ発行部
12…クエリグラフパターンデータベース
13…係数計算部
20…ユーザインタフェース提供部
30…グラフ構造データベース
DESCRIPTION OF
Claims (10)
クエリ発行手段により、前記選択されたノードの各々について、前記グラフ構造を持つデータから構造がマッチするデータを抽出するためのクエリグラフパターンの変数ノードに前記選択されたノードを代入し、当該クエリグラフパターンにマッチするデータを前記グラフ構造データベースから取得するステップと、
係数計算手段により、前記データを取得するステップで前記選択されたノードの各々について取得したデータを比較してノードが重複する数を求め、当該重複数に基づいて前記選択されたノード間の係数を計算するステップと、
を有することを特徴とする関係抽出方法。 Receiving a selection of a plurality of nodes among nodes stored in a graph structure database storing data having a graph structure composed of various nodes and various arcs by an input means;
For each of the selected nodes, the selected node is substituted for a variable node of a query graph pattern for extracting data whose structure matches from the data having the graph structure by each query issuing means, and the query graph Obtaining data matching the pattern from the graph structure database;
The coefficient calculating means compares the data acquired for each of the selected nodes in the step of acquiring the data to determine the number of overlapping nodes, and calculates the coefficient between the selected nodes based on the overlap number. A calculating step;
A relationship extraction method characterized by comprising:
前記グラフ構造データベースに格納されたノードの中の複数のノードの選択を受け付ける入力手段と、
前記選択されたノードの各々について、前記グラフ構造を持つデータから構造がマッチするデータを抽出するためのクエリグラフパターンの変数ノードに前記選択されたノードを代入し、当該クエリグラフパターンにマッチするデータを前記グラフ構造データベースから取得するクエリ発行手段と、
前記クエリ発行手段が前記選択されたノードの各々について取得したデータを比較してノードが重複する数を求め、当該重複数に基づいて前記選択されたノード間の係数を計算する係数計算手段と、
を有することを特徴とする関係抽出システム。 Connected to a graph structure database that stores data with a graph structure consisting of various nodes and arcs,
Input means for accepting selection of a plurality of nodes among the nodes stored in the graph structure database;
For each of the selected nodes, data that matches the query graph pattern by substituting the selected node into a variable node of a query graph pattern for extracting data whose structure matches from the data having the graph structure Issuance means for obtaining from the graph structure database;
A coefficient calculation means for comparing the data obtained by the query issuing means for each of the selected nodes to determine the number of overlapping nodes, and calculating a coefficient between the selected nodes based on the overlap number;
A relationship extraction system characterized by comprising:
前記クエリ発行手段は、前記選択されたノードに対応する変数ノードを含むクエリグラフパターンを前記クエリグラフパターンデータベースから取得することを特徴とする請求項6記載の関係抽出システム。 A query graph pattern database storing query graph patterns;
The relation extraction system according to claim 6, wherein the query issuing unit acquires a query graph pattern including a variable node corresponding to the selected node from the query graph pattern database.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007014167A JP4698618B2 (en) | 2007-01-24 | 2007-01-24 | Relationship extraction method and relationship extraction system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007014167A JP4698618B2 (en) | 2007-01-24 | 2007-01-24 | Relationship extraction method and relationship extraction system |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008181331A true JP2008181331A (en) | 2008-08-07 |
JP4698618B2 JP4698618B2 (en) | 2011-06-08 |
Family
ID=39725187
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007014167A Active JP4698618B2 (en) | 2007-01-24 | 2007-01-24 | Relationship extraction method and relationship extraction system |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4698618B2 (en) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014149723A (en) * | 2013-02-01 | 2014-08-21 | Ntt Docomo Inc | Feature estimation device and feature estimation method |
JP2016009337A (en) * | 2014-06-24 | 2016-01-18 | ヤフー株式会社 | Search device for rdf data and search method for rdf data |
CN106294588A (en) * | 2016-07-28 | 2017-01-04 | 广东中标数据科技股份有限公司 | The method and device of fast search content to be inquired about |
JP2019159966A (en) * | 2018-03-14 | 2019-09-19 | ヤフー株式会社 | Information processor, information processing method and program |
CN111597391A (en) * | 2019-02-21 | 2020-08-28 | 西门子股份公司 | Method and system for searching database |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102411778B1 (en) | 2019-05-28 | 2022-06-22 | 주식회사 케이티 | Server, method and computer program for infering comparative advantage of multiple knowledge |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11203289A (en) * | 1998-01-16 | 1999-07-30 | Fuji Xerox Co Ltd | Associated retrieval expression retrieving device and computer readable recording medium storing associated retrieval expression retrieving program |
JP2003085570A (en) * | 2001-09-14 | 2003-03-20 | Fuji Xerox Co Ltd | Method and apparatus for displaying connection relationship |
JP2003337933A (en) * | 2002-05-20 | 2003-11-28 | Just Syst Corp | Knowledge data processor |
JP2006313500A (en) * | 2005-05-09 | 2006-11-16 | Nippon Telegr & Teleph Corp <Ntt> | Reverse query graph pattern generation device and method, program for generation, reverse subgraph retrieving device using the same, retrieval method and retrieval program |
JP2006313499A (en) * | 2005-05-09 | 2006-11-16 | Nippon Telegr & Teleph Corp <Ntt> | Extended query graph pattern generation device and method, program for generation and extended subgraph retrieval device and method using the same and program for retrieval |
JP2006313501A (en) * | 2005-05-09 | 2006-11-16 | Nippon Telegr & Teleph Corp <Ntt> | Common query graph pattern generation device and method, program for generation and common subgraph retrieving device and method using the same and program for retrieval |
-
2007
- 2007-01-24 JP JP2007014167A patent/JP4698618B2/en active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11203289A (en) * | 1998-01-16 | 1999-07-30 | Fuji Xerox Co Ltd | Associated retrieval expression retrieving device and computer readable recording medium storing associated retrieval expression retrieving program |
JP2003085570A (en) * | 2001-09-14 | 2003-03-20 | Fuji Xerox Co Ltd | Method and apparatus for displaying connection relationship |
JP2003337933A (en) * | 2002-05-20 | 2003-11-28 | Just Syst Corp | Knowledge data processor |
JP2006313500A (en) * | 2005-05-09 | 2006-11-16 | Nippon Telegr & Teleph Corp <Ntt> | Reverse query graph pattern generation device and method, program for generation, reverse subgraph retrieving device using the same, retrieval method and retrieval program |
JP2006313499A (en) * | 2005-05-09 | 2006-11-16 | Nippon Telegr & Teleph Corp <Ntt> | Extended query graph pattern generation device and method, program for generation and extended subgraph retrieval device and method using the same and program for retrieval |
JP2006313501A (en) * | 2005-05-09 | 2006-11-16 | Nippon Telegr & Teleph Corp <Ntt> | Common query graph pattern generation device and method, program for generation and common subgraph retrieving device and method using the same and program for retrieval |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014149723A (en) * | 2013-02-01 | 2014-08-21 | Ntt Docomo Inc | Feature estimation device and feature estimation method |
JP2016009337A (en) * | 2014-06-24 | 2016-01-18 | ヤフー株式会社 | Search device for rdf data and search method for rdf data |
CN106294588A (en) * | 2016-07-28 | 2017-01-04 | 广东中标数据科技股份有限公司 | The method and device of fast search content to be inquired about |
JP2019159966A (en) * | 2018-03-14 | 2019-09-19 | ヤフー株式会社 | Information processor, information processing method and program |
CN111597391A (en) * | 2019-02-21 | 2020-08-28 | 西门子股份公司 | Method and system for searching database |
Also Published As
Publication number | Publication date |
---|---|
JP4698618B2 (en) | 2011-06-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4381012B2 (en) | Data search system and data search method using universal identifier | |
JP4547300B2 (en) | Common query graph pattern generation device, generation method, generation program, and common subgraph search device, search method, and search program using the same | |
JP4698618B2 (en) | Relationship extraction method and relationship extraction system | |
JP2005332212A (en) | Retrieval server, retrieval terminal, retrieval method, and retrieval execution method | |
JP2010277322A (en) | Common query graph pattern generation device, common query graph pattern generation method, and program for common query graph pattern generation | |
JP4547298B2 (en) | Extended query graph pattern generation device, generation method, generation program, and extended subgraph search device, search method, and search program using them | |
JP2010282241A (en) | File management device, file management system, file management method, and program | |
JP4904920B2 (en) | Template document creation program, template document creation method, and template document creation device | |
JP2010066808A (en) | Information processor and search method | |
JP2013054602A (en) | Graph pattern matching system and graph pattern matching method | |
WO2018163241A1 (en) | Ontology creation assistance device | |
JP5210970B2 (en) | Common query graph pattern generation method, common query graph pattern generation device, and common query graph pattern generation program | |
JP4547299B2 (en) | Inverted query graph pattern generation device, generation method, generation program, and inverted subgraph search device, search method, and search program using the same | |
JP2004246422A (en) | Information retrieval support device | |
JP2007249700A (en) | Document management device, document retrieval method, document retrieval program and recording medium | |
JP6607691B2 (en) | Evaluation value calculation device and program | |
JP2013145508A (en) | Graph pattern matching system and graph pattern representative origin extraction method | |
JP5002631B2 (en) | Word information collection device, word information collection method, and word information collection program | |
JP2004133742A (en) | Work support method, work support program and work support system | |
JP2009271671A (en) | Information processor, information processing method, program, and recording medium | |
JP6707410B2 (en) | Document search device, document search method, and computer program | |
JP2000322167A (en) | Data management system and method for displaying data attribute | |
JP2005316881A (en) | Program for drawing retrieval, drawing retrieval device, and method for displaying drawing retrieval result | |
de Spindler et al. | Using synchronised tag clouds for browsing data collections | |
JP5574775B2 (en) | Idea organization support device and idea organization support program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20101109 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101124 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110120 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110222 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110301 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4698618 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |