JP5210970B2 - 共通クエリグラフパターン生成方法、共通クエリグラフパターン生成装置及び共通クエリグラフパターン生成プログラム - Google Patents

共通クエリグラフパターン生成方法、共通クエリグラフパターン生成装置及び共通クエリグラフパターン生成プログラム Download PDF

Info

Publication number
JP5210970B2
JP5210970B2 JP2009129168A JP2009129168A JP5210970B2 JP 5210970 B2 JP5210970 B2 JP 5210970B2 JP 2009129168 A JP2009129168 A JP 2009129168A JP 2009129168 A JP2009129168 A JP 2009129168A JP 5210970 B2 JP5210970 B2 JP 5210970B2
Authority
JP
Japan
Prior art keywords
query graph
graph pattern
common query
search
subgraph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009129168A
Other languages
English (en)
Other versions
JP2010277332A (ja
Inventor
具英 山本
透 小林
隆彦 村山
宏之 佐藤
啓 坂本
健治 大友
京士 飯塚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2009129168A priority Critical patent/JP5210970B2/ja
Publication of JP2010277332A publication Critical patent/JP2010277332A/ja
Application granted granted Critical
Publication of JP5210970B2 publication Critical patent/JP5210970B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、膨大なデータの中からユーザが必要とする情報を検索するために用いる共通クエリグラフパターンを生成する技術に関する。
近年、コンピュータネットワーク上に存在する大量のデータの中から利用者が必要とする情報を簡易に入手する技術が注目を集めている。精度の高い検索を行うために用いられる技術にセマンティックWebがある。セマンティックWebは、Webサイト上にメタデータとしてセマンティクス(意味情報)を付与し、人の手を使わずにデータを機械的に処理できる空間を創出するものである。セマンティックWebに関連した取り組みにおいては、さまざまな人や組織によってインターネット上に提供された、Recource Description Framework(RDF)を用いて表現可能なグラフ構造のデータからグラフパターンのマッチングによって必要な情報を検索する技術が必要とされている。
グラフ構造を持つ大量のデータの中から所望のサブグラフを抽出する場合、予め抽出したいサブグラフの構造が分かっていなければならなかった。そこで、特許文献1は、ユーザにより入力された情報または予め設定された情報に関連し、且つ、共通の意味合いの構造を持つ情報を取得することができるクエリグラフパターンを自動的に生成する技術を提案した。特許文献1の技術は、グラフ構造を持つデータの2点以上のノードを結ぶ共通の構造を抽出して共通クエリグラフパターンを生成し、共通クエリグラフパターンのノードに値を代入して検索を行うものである。
特開2006−313501号公報
しかしながら、特許文献1の技術では、生成した共通クエリグラフパターンに有意でない構造やあまりにも当たり前の構造が含まれていることが多く、共通クエリグラフパターンが巨大化するために検索時に余計な時間がかかるという問題があった。
本発明は、上記に鑑みてなされたものであり、その目的とするところは、グラフ構造を持つ大量のデータの中から所望のサブグラフを抽出する際、より短い時間での検索を可能とすることにある。
第1の本発明に係る共通クエリグラフパターン生成方法は、グラフ構造を持つデータが格納されているグラフ構造データベースに接続される共通クエリグラフパターン生成装置により実行される共通クエリグラフパターン生成方法であって、ユーザが入力した情報または予め設定された情報に制約される2点以上のノード間に存在するパスを検索するための検索クエリグラフパターンを生成するステップと、検索クエリグラフパターンにマッチする検索サブグラフをグラフ構造データベースから取得するステップと、グラフ構造データベースにおける所定の部分サブグラフの出現頻度を統計処理することにより、当該部分サブグラフの有意性を判定するステップと、取得した検索サブグラフからグラフの構造およびこのグラフ中のプロパティ名が一致するものを抽出し、任意のノード名を変数とし、有意性が低いと判定された部分サブグラフを含まない共通クエリグラフパターンを生成するステップと、共通クエリグラフパターンを共通クエリグラフパターン蓄積手段に格納するステップと、を有することを特徴とする。
第2の本発明に係る共通クエリグラフパターン生成方法は、グラフ構造を持つデータが格納されているグラフ構造データベースに接続される共通クエリグラフパターン生成装置により実行される共通クエリグラフパターン生成方法であって、ユーザが入力した情報または予め設定された情報に制約される2点以上のノード間に存在するパスを検索するための検索クエリグラフパターンを生成するステップと、検索クエリグラフパターンにマッチする検索サブグラフをグラフ構造データベースから取得するステップと、取得した検索サブグラフからグラフの構造およびこのグラフ中のプロパティ名が一致するものを抽出し、任意のノード名を変数とした共通クエリグラフパターンを生成するステップと、共通クエリグラフパターンを共通クエリグラフパターン蓄積手段に格納するステップと、グラフ構造データベースにおける所定の部分サブグラフの出現頻度を統計処理することにより、当該部分サブグラフの有意性を判定するステップと、有意性が低いと判定された部分サブグラフを含む共通クエリグラフパターンを共通クエリグラフパターン蓄積手段から削除するステップと、を有することを特徴とする。
第3の本発明に係る共通クエリグラフパターン生成装置は、グラフ構造を持つデータが格納されているグラフ構造データベースに接続される共通クエリグラフパターン生成装置であって、共通クエリグラフパターンを蓄積する共通クエリグラフパターン蓄積手段と、ユーザが入力した情報または予め設定された情報に制約される2点以上のノード間に存在するパスを検索するための検索クエリグラフパターンを生成する検索クエリグラフパターン生成手段と、検索クエリグラフパターンにマッチする検索サブグラフをグラフ構造データベースから取得する検索サブグラフ取得手段と、グラフ構造データベースにおける所定の部分サブグラフの出現頻度を統計処理することにより、当該部分サブグラフの有意性を判定する統計処理手段と、取得した検索サブグラフからグラフの構造およびこのグラフ中のプロパティ名が一致するものを抽出し、任意のノード名を変数とし、有意性が低いと判定された部分サブグラフを含まない共通クエリグラフパターンを生成して共通クエリグラフパターン蓄積手段に格納する共通クエリグラフパターン生成手段と、を有することを特徴とする。
第4の本発明に係る共通クエリグラフパターン生成装置は、グラフ構造を持つデータが格納されているグラフ構造データベースに接続される共通クエリグラフパターン生成装置であって、共通クエリグラフパターンを蓄積する共通クエリグラフパターン蓄積手段と、ユーザが入力した情報または予め設定された情報に制約される2点以上のノード間に存在するパスを検索するための検索クエリグラフパターンを生成する検索クエリグラフパターン生成手段と、検索クエリグラフパターンにマッチする検索サブグラフをグラフ構造データベースから取得する検索サブグラフ取得手段と、取得した検索サブグラフからグラフの構造およびこのグラフ中のプロパティ名が一致するものを抽出し、任意のノード名を変数とした共通クエリグラフパターンを生成して共通クエリグラフパターン蓄積手段に格納する共通クエリグラフパターン生成手段と、グラフ構造データベースにおける所定の部分サブグラフの出現頻度を統計処理することにより、当該部分サブグラフの有意性を判定する統計処理手段と、有意性が低いと判定された部分サブグラフを含む共通クエリグラフパターンを共通クエリグラフパターン蓄積手段から削除する共通クエリグラフパターン削除手段と、を有することを特徴とする。
第5の本発明に係る共通クエリグラフパターン生成プログラムは、上記共通クエリグラフパターン生成方法における各ステップをコンピュータに実行させることを特徴とする。
本発明によれば、グラフ構造を持つ大量のデータの中から所望のサブグラフを抽出する際、より短い時間での検索が可能となる。
本実施の形態における検索装置を用いた検索システムの構成を示すブロック図である。 グラフ構造データベース内のデータを示す図である。 上記検索システムの動作を示すシーケンス図である。 検索システムの入力GUIを示す図である。 図2のデータについて、入力されたキーワードにつながるプロパティを太線で示した図である。 検索クエリグラフパターンを示す説明図である。 図6に示す検索クエリグラフパターンにマッチした検索サブグラフを示す図である。 グラフ構造データベース内の別のデータを示す図である。 部分サブグラフの例を示す図である。 別の部分サブグラフの例を示す図である。 上記各部分サブグラフの統計結果を示すグラフである。 図7に示す検索サブグラフにおいて共通する構造およびプロパティを太線で示した図である。 生成された共通クエリグラフパターンを示す図である。 共通クエリグラフパターンから無意味な部分サブグラフを含む共通クエリグラフパターンを削除する様子を説明するための説明図である。 図13に示す共通クエリグラフパターンに値を代入した様子を示す図である。 図15に示すクエリにより取得された共通サブグラフの例を示す図である。 表形式で結果を表示する出力用GUIの様子を示す図である。 上記検索システムの別の動作を示すシーケンス図である。 上記検索システムのさらに別の動作を示すシーケンス図である。
以下、本発明の実施の形態について図面を用いて説明する。
図1は、本実施の形態における検索装置を用いた検索システムの構成を示すブロック図である。同図に示す検索システム1は、検索装置10、ユーザ端末20、グラフ構造データベース30、およびオントロジデータベース40を有する。検索装置10は、ユーザ端末20、グラフ構造データベース30、およびオントロジデータベース40にアクセス可能な状態で接続される。
検索装置10は、入力用GUI生成部11、共通クエリグラフパターン生成部12、共通クエリグラフパターン蓄積部13、統計処理部14、および出力用GUI生成部15を備える。なお、検索装置10は、演算処理装置、記憶装置、メモリ等を備えたコンピュータにより構成して、各部の処理がプログラムによって実行されるものとしてもよい。このプログラムは検索装置10が備える記憶装置に記憶されており、磁気ディスク、光ディスク、半導体メモリ等の記録媒体に記録することも、ネットワークを通して提供することも可能である。以下、各部について説明する。
入力用GUI生成部11は、ユーザに検索内容の情報を入力させるための入力用GUIを生成してユーザ端末20へ送信し、ユーザ端末20からユーザが入力した情報を受信する。
共通クエリグラフパターン生成部12は、ユーザが入力した情報または予め設定された情報に制約される2点以上のノード間に存在するパスを検索するための検索クエリグラフパターンを生成し、検索クエリグラフパターンにマッチする検索サブグラフをグラフ構造データベース30から取得し、取得した検索サブグラフの中でグラフの構造とグラフ中のプロパティが一致するものが複数存在する場合、共通する構造とプロパティ以外のノード名を変数とした共通クエリグラフパターンを生成する。共通クエリグラフパターンを生成する際に、グラフ構造データベース30における所定の部分サブグラフの出現頻度を統計処理することにより部分サブグラフの有意性を判定し、有意性が低いと判定した部分サブグラフを含む共通クエリグラフパターンを削除する。
共通クエリグラフパターン蓄積部13は、共通クエリグラフパターン生成部12が生成した共通クエリグラフパターンを蓄積する。共通クエリグラフパターン蓄積部13に蓄積された共通クエリグラフパターンに値を代入してグラフ構造データベース30にアクセスすることで検索を行う。
統計処理部14は、上記部分サブグラフの出現頻度を統計処理して有意性を判定する。部分サブグラフの有意性の判定については後述する。
出力用GUI生成部15は、ユーザに検索結果を提示するための出力用GUIを生成する。
グラフ構造データベース30は、図2に示すようなグラフ構造を持つデータが格納されている。本実施の形態におけるグラフ構造データは、ラベル付き有向グラフデータであり、データのアーク(ノード間を結ぶ矢印)をRDFの仕様に基づいてプロパティと称する。
オントロジデータベース40には、言葉の意味や分類体系を定義するためのオントロジデータが格納されている。
次に、検索システム1の動作について図を用いて説明する。図3は、検索システム1の動作の流れを示すシーケンス図である。
まず、入力用GUI生成部11において入力用GUIが生成され(ステップS11)、生成された入力用GUIがユーザ端末20に表示されて、ユーザによりキーワードの入力および概念の選択が行われる(ステップS12)。本実施の形態において生成される入力用GUIには、図4に示すように、キーワードを入力するスペースと、概念(クラス)を選択する欄が設けられる。図4に示す例では、キーワードとして「セマンティックWeb」が入力され、クラスとして「person:人」が選択された。入力されたキーワードおよび選択された概念のデータは、共通クエリグラフパターン生成部12へ出力される。
共通クエリグラフパターン生成部12では、キーワードを基にグラフ構造データベース30にアクセスが行われる(ステップS13)。具体的には、キーワードにつながるプロパティやクラスを探索するクエリを生成し、グラフ構造データベース30へアクセスする。
そして、グラフ構造データベース30において、キーワードにつながるプロパティが抽出される(ステップS14)。図5に、抽出されたプロパティのアークを太線で示し、そのプロパティ名に下線を引いたグラフ構造データの例を示す。
そして、共通クエリグラフパターン生成部12は、グラフの両端のノードに関する制約条件に合致した検索クエリグラフパターンを生成する(ステップS15)。つまり、抽出されたプロパティとユーザにより選択されたクラスとの間にあるパスをグラフ構造データベース30から抽出することが可能な検索クエリグラフパターンを生成する。
図6は、生成された検索クエリグラフパターンを示す図である。同図では、ステップS14で抽出されたプロパティ「rm:キーワード」「ms:用語」と、ユーザにより選択されたクラス「Person:人」にプロパティ「rdf:type」でつながるノード「?Person」が固定された2種類の検索クエリグラフパターンを示す。同図において、名称の先頭に「?」マークが記載されているノードは、任意の値が入る変数であることを示す。
続いて、共通クエリグラフパターン生成部12は、生成された検索クエリグラフパターンを基に、グラフ構造データベース30へアクセスし(ステップS16)、グラフ構造データベース30は、条件に合致する検索サブグラフ(変数ノード「?keyword」と変数ノード「?Person」との間にパスが存在するサブグラフ)を抽出する(ステップS17)。
図7は、グラフ構造データベース30から抽出された検索サブグラフの例を示す図である。同図に示す検索サブグラフでは、変数ノード「?keyword」としてノード「セマンティックWeb」がマッチした検索サブグラフを示す。変数ノード「?Person」の値が同一のデータについては同一ノードを1つのみ示す。図7では、変数ノード「?Person」が(1)「Person:山田太郎」、(2)「Person:田中一郎」、(3)「Person:鈴木花子」の3種類の検索サブグラフを示す。また、共通クエリグラフパターンの生成については、図2中に示す他のキーワード「XML」も同様に処理を行う。
この後、オントロジ処理を含む共通クエリグラフパターンの生成処理を行うが、本発明では、共通クエリグラフパターンから無意味なものを削除した共通クエリグラフパターンを生成する。共通クエリグラフパターンが無意味であるか否かは、所定の部分サブグラフの出現頻度を統計処理することにより、部分サブグラフの有意性を判定し、共通クエリグラフパターンが有意性の低い部分サブグラフを含むか否かにより判断する。
具体的に説明すると、例えば、図8に示すグラフ構造データがグラフ構造データベース30に格納されていたとする。図8では、人とグループおよび会社がプロパティ「Person:所属」でつながっている。ここで、図9,10に示す各部分サブグラフの出現頻度をグラフ構造データベース30から取得する。図11に、各部分サブグラフ(グループと会社)の出現頻度を基にして、横軸に所属者数、縦軸に組織数を求めたグラフを示す。同図に示すグラフでは、それぞれのグループに対しては少数の人が結びついているのに対し、それぞれの会社に対しては多数の人が結びついている。ここでは、人とグループとの結びつきは関係性を示すデータとして有意であるが、人と会社との結びつきは関係性を示すデータとして無意味であると考えられるので、閾値aを基準として閾値aより所属者数が少ないものを有意であり、多いものを無意味と判定する。その結果、図10に示す部分サブグラフを有する共通クエリグラフパターンは生成しない。
図3において、共通クエリグラフパターン生成部12が統計処理部14に所定の部分サブグラフの統計処理を指示すると(ステップS18)、統計処理部14は、所定の部分サブグラフの出現頻度・分散を算出する(ステップS19)。部分サブグラフの出現頻度は、グラフ構造データベース30から取得する(ステップS20)。部分サブグラフの出現頻度を統計処理した結果、所定の条件を満たす部分サブグラフを削除すべき部分サブグラフとして抽出する。
また、共通クエリグラフパターン生成部12は、検索サブグラフに含まれるプロパティを基に、オントロジデータベース40にアクセスし(ステップS21)、プロパティの中に同じ意味に分類されているものを抽出する(ステップS22)。図7に示した検索サブグラフにおいては、「キーワード」と「用語」とが同じ意味に分類されているものとする。
続いて、各検索サブグラフにおいてそれぞれのグラフ構造中のプロパティの組み合わせの中で他の検索サブグラフに出現するものを部分検索サブグラフとして抽出する(ステップS23)。このとき、ステップS22で抽出された単語は同一と見なされる。図12は、図7の検索サブグラフから抽出した部分検索サブグラフであり、プロパティを太線で示した。図12において、「ms:用語」と「rm:キーワード」は同一と見なされる。
そして、共通クエリグラフパターン生成部12は、ステップS19で抽出した削除すべき部分サブグラフを含まず、部分検索サブグラフにおいて共通した構造を有し、プロパティ以外のノードを変数ノードとした共通クエリグラフパターンを生成する(ステップS24)。生成した共通クエリグラフパターンは共通クエリグラフパターン蓄積部13に蓄積される(ステップS25)。図13に生成した共通クエリグラフパターンの例を示す。
ここでは、削除する共通クエリグラフパターンについての具体的な例を示さなかったが、図14に示すように、部分検索サブグラフにおいて共通した構造を有し、プロパティ以外のノードを変数ノードとした全共通クエリグラフパターン(図14左枠)から無意味な部分サブグラフを含むものを削除した共通クエリグラフパターン(図14右枠)だけを蓄積する。これにより、有意でない構造やあまりにも当たり前の構造を含む共通クエリグラフパターンが削除される。
続いて、検索について説明する。検索は、共通クエリグラフパターンを利用して行うが、無意味な共通クエリグラフパターンが削除されているため、共通クエリグラフパターンを検索のクエリとして利用する場合にも該当候補が少なくなり検索時間が短縮される。
共通クエリグラフパターンの変数ノード「?keyword」にユーザにより入力されたキーワード「セマンティックWeb」を代入し、グラフ構造データベース30にアクセスし(ステップS26)、グラフ構造データベース30においてこのクエリにマッチする共通サブグラフを抽出する(ステップS27)。図15は、図13に示した共通クエリグラフパターンにキーワード「セマンティックWeb」を代入した様子を示す図である。
そして、抽出された共通サブグラフをマージする(ステップS28)。図16に2つの共通サブグラフがマージされた様子を示す。同図では、同一のノードを1つのノードとして表すように2つの共通サブグラフがマージされている。
そして、出力用GUI生成部15は、マージされた共通サブグラフを用いて出力用GUIを生成し(ステップS29)、ユーザ端末20により表示する(ステップS30)。図17に、生成した表形式の出力用GUIの例を示す。
次に、検索システムの別の動作の流れについて説明する。図18は、共通クエリグラフパターンの生成の別の例を示すシーケンス図である。図3におけるステップS17までの処理、および、図3におけるステップS26以降の処理は図3と同様であるので図18では省略している。図18で示す動作は、オントロジ処理を含む共通クエリグラフパターンの生成処理をした後、生成した共通クエリグラフパターンを共通クエリグラフパターン蓄積部13に蓄積する際に、無意味な共通クエリグラフパターンを除いたものだけを蓄積する点で図3のものと異なる。
検索サブグラフが抽出されると、検索サブグラフに含まれるプロパティを基に、オントロジデータベース40にアクセスし(ステップS31)、プロパティの中に同じ意味に分類されているものを抽出し(ステップS32)、各検索サブグラフにおいてそれぞれのグラフ構造中のプロパティの組み合わせの中で他の検索サブグラフに出現するものを部分検索サブグラフとして抽出する(ステップS33)。
ここで、共通クエリグラフパターン生成部12が統計処理部14に所定の部分サブグラフの統計処理を指示すると(ステップS34)、統計処理部14は、所定の部分サブグラフの出現頻度・分散を算出する(ステップS35)。部分サブグラフの出現頻度は、グラフ構造データベース30から取得する(ステップS36)。部分サブグラフの出現頻度を統計処理した結果、所定の条件を満たす部分サブグラフを削除すべき部分サブグラフとして抽出する。
共通クエリグラフパターン生成部12は、部分検索サブグラフにおいて共通した構造を有し、プロパティ以外のノードを変数ノードとした共通クエリグラフパターンを生成する(ステップS37)。そして、ステップS35で抽出した削除すべき部分サブグラフを含む共通クエリグラフパターンを除いた共通クエリグラフパターンを共通クエリグラフパターン蓄積部13に蓄積する(ステップS38)。
次に、検索システムのさらに別の動作の流れについて説明する。図19は、共通クエリグラフパターンの生成のさらに別の例を示すシーケンス図である。図3におけるステップS17までの処理、および、図3におけるステップS26以降の処理は図3と同様であるので図19では省略している。図19で示す動作は、オントロジ処理を含む共通クエリグラフパターンの生成処理をし、生成した共通クエリグラフパターンを共通クエリグラフパターン蓄積部13に蓄積するまでは、従来のものと同様であるが、その後、無意味な共通クエリグラフパターンを共通クエリグラフパターン蓄積部13から削除する点で異なる。
検索サブグラフが抽出されると、検索サブグラフに含まれるプロパティを基に、オントロジデータベース40にアクセスし(ステップS41)、プロパティの中に同じ意味に分類されているものを抽出し(ステップS42)、各検索サブグラフにおいてそれぞれのグラフ構造中のプロパティの組み合わせの中で他の検索サブグラフに出現するものを部分検索サブグラフとして抽出する(ステップS43)。
共通クエリグラフパターン生成部12は、部分検索サブグラフにおいて共通した構造を有し、プロパティ以外のノードを変数ノードとした共通クエリグラフパターンを生成する(ステップS44)。そして、共通クエリグラフパターンを共通クエリグラフパターン蓄積部13に蓄積する(ステップS45)。
その後、共通クエリグラフパターン生成部12が統計処理部14に所定の部分サブグラフの統計処理を指示すると(ステップS46)、統計処理部14は、所定の部分サブグラフの出現頻度・分散を算出する(ステップS47)。部分サブグラフの出現頻度は、グラフ構造データベース30から取得する(ステップS48)。部分サブグラフの出現頻度を統計処理した結果、所定の条件を満たす部分サブグラフを削除すべき部分サブグラフとして抽出する。
そして、削除すべき部分サブグラフを含む共通クエリグラフパターンを共通クエリグラフパターン蓄積部13から削除する(ステップS49,S50)。
以上説明したように、本実施の形態によれば、所定の部分サブグラフの出現頻度を統計処理して部分サブグラフの有意、無意味の判定を行い、無意味と判定された部分サブグラフを含む共通クエリグラフパターンを削除した共通クエリグラフパターンを生成することにより、検索に利用する共通クエリグラフパターンが、無意味なものが削除されているために縮小しており、共通クエリグラフパターンに値を代入して検索のクエリとして利用する場合に該当候補が少なくなり、検索時間を短縮することができる。
1…検索システム
10…検索装置
11…生成部
12…共通クエリグラフパターン生成部
13…共通クエリグラフパターン蓄積部
14…統計処理部
15…生成部
20…ユーザ端末
30…グラフ構造データベース
40…オントロジデータベース

Claims (5)

  1. グラフ構造を持つデータが格納されているグラフ構造データベースに接続される共通クエリグラフパターン生成装置により実行される共通クエリグラフパターン生成方法であって、
    ユーザが入力した情報または予め設定された情報に制約される2点以上のノード間に存在するパスを検索するための検索クエリグラフパターンを生成するステップと、
    前記検索クエリグラフパターンにマッチする検索サブグラフを前記グラフ構造データベースから取得するステップと、
    前記グラフ構造データベースにおける所定の部分サブグラフの出現頻度を統計処理することにより、当該部分サブグラフの有意性を判定するステップと、
    取得した前記検索サブグラフからグラフの構造およびこのグラフ中のプロパティ名が一致するものを抽出し、任意のノード名を変数とし、有意性が低いと判定された前記部分サブグラフを含まない共通クエリグラフパターンを生成するステップと、
    前記共通クエリグラフパターンを共通クエリグラフパターン蓄積手段に格納するステップと、
    を有することを特徴とする共通クエリグラフパターン生成方法。
  2. グラフ構造を持つデータが格納されているグラフ構造データベースに接続される共通クエリグラフパターン生成装置により実行される共通クエリグラフパターン生成方法であって、
    ユーザが入力した情報または予め設定された情報に制約される2点以上のノード間に存在するパスを検索するための検索クエリグラフパターンを生成するステップと、
    前記検索クエリグラフパターンにマッチする検索サブグラフを前記グラフ構造データベースから取得するステップと、
    取得した前記検索サブグラフからグラフの構造およびこのグラフ中のプロパティ名が一致するものを抽出し、任意のノード名を変数とした共通クエリグラフパターンを生成するステップと、
    前記共通クエリグラフパターンを共通クエリグラフパターン蓄積手段に格納するステップと、
    前記グラフ構造データベースにおける所定の部分サブグラフの出現頻度を統計処理することにより、当該部分サブグラフの有意性を判定するステップと、
    有意性が低いと判定された前記部分サブグラフを含む共通クエリグラフパターンを前記共通クエリグラフパターン蓄積手段から削除するステップと、
    を有することを特徴とする共通クエリグラフパターン生成方法。
  3. グラフ構造を持つデータが格納されているグラフ構造データベースに接続される共通クエリグラフパターン生成装置であって、
    共通クエリグラフパターンを蓄積する共通クエリグラフパターン蓄積手段と、
    ユーザが入力した情報または予め設定された情報に制約される2点以上のノード間に存在するパスを検索するための検索クエリグラフパターンを生成する検索クエリグラフパターン生成手段と、
    前記検索クエリグラフパターンにマッチする検索サブグラフを前記グラフ構造データベースから取得する検索サブグラフ取得手段と、
    前記グラフ構造データベースにおける所定の部分サブグラフの出現頻度を統計処理することにより、当該部分サブグラフの有意性を判定する統計処理手段と、
    取得した前記検索サブグラフからグラフの構造およびこのグラフ中のプロパティ名が一致するものを抽出し、任意のノード名を変数とし、有意性が低いと判定された前記部分サブグラフを含まない共通クエリグラフパターンを生成して前記共通クエリグラフパターン蓄積手段に格納する共通クエリグラフパターン生成手段と、
    を有することを特徴とする共通クエリグラフパターン生成装置。
  4. グラフ構造を持つデータが格納されているグラフ構造データベースに接続される共通クエリグラフパターン生成装置であって、
    共通クエリグラフパターンを蓄積する共通クエリグラフパターン蓄積手段と、
    ユーザが入力した情報または予め設定された情報に制約される2点以上のノード間に存在するパスを検索するための検索クエリグラフパターンを生成する検索クエリグラフパターン生成手段と、
    前記検索クエリグラフパターンにマッチする検索サブグラフを前記グラフ構造データベースから取得する検索サブグラフ取得手段と、
    取得した前記検索サブグラフからグラフの構造およびこのグラフ中のプロパティ名が一致するものを抽出し、任意のノード名を変数とした共通クエリグラフパターンを生成して前記共通クエリグラフパターン蓄積手段に格納する共通クエリグラフパターン生成手段と、
    前記グラフ構造データベースにおける所定の部分サブグラフの出現頻度を統計処理することにより、当該部分サブグラフの有意性を判定する統計処理手段と、
    有意性が低いと判定された前記部分サブグラフを含む共通クエリグラフパターンを前記共通クエリグラフパターン蓄積手段から削除する共通クエリグラフパターン削除手段と、
    を有することを特徴とする共通クエリグラフパターン生成装置。
  5. 請求項1又は2に記載した共通クエリグラフパターン生成方法における各ステップをコンピュータに実行させるための共通クエリグラフパターン生成プログラム。
JP2009129168A 2009-05-28 2009-05-28 共通クエリグラフパターン生成方法、共通クエリグラフパターン生成装置及び共通クエリグラフパターン生成プログラム Expired - Fee Related JP5210970B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009129168A JP5210970B2 (ja) 2009-05-28 2009-05-28 共通クエリグラフパターン生成方法、共通クエリグラフパターン生成装置及び共通クエリグラフパターン生成プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009129168A JP5210970B2 (ja) 2009-05-28 2009-05-28 共通クエリグラフパターン生成方法、共通クエリグラフパターン生成装置及び共通クエリグラフパターン生成プログラム

Publications (2)

Publication Number Publication Date
JP2010277332A JP2010277332A (ja) 2010-12-09
JP5210970B2 true JP5210970B2 (ja) 2013-06-12

Family

ID=43424239

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009129168A Expired - Fee Related JP5210970B2 (ja) 2009-05-28 2009-05-28 共通クエリグラフパターン生成方法、共通クエリグラフパターン生成装置及び共通クエリグラフパターン生成プログラム

Country Status (1)

Country Link
JP (1) JP5210970B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9245049B2 (en) 2011-02-16 2016-01-26 Empire Technology Development Llc Performing queries using semantically restricted relations
JP5582540B2 (ja) * 2011-06-13 2014-09-03 日本電信電話株式会社 グラフ構造を有するデータから頻度の高い部分構造を抽出する方法、その装置およびプログラム
CN103324644B (zh) * 2012-03-23 2016-05-11 日电(中国)有限公司 一种查询结果多样化方法及装置
US8935271B2 (en) * 2012-12-21 2015-01-13 Facebook, Inc. Extract operator

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002351898A (ja) * 2001-05-23 2002-12-06 Internatl Business Mach Corp <Ibm> グラフ構造データの処理方法、処理システムおよびプログラム
JP4547300B2 (ja) * 2005-05-09 2010-09-22 日本電信電話株式会社 共通クエリグラフパターン生成装置、生成方法、生成用プログラム、およびこれらを用いた共通サブグラフ検索装置、検索方法、検索用プログラム
JP4909200B2 (ja) * 2006-10-06 2012-04-04 日本放送協会 人間関係グラフ生成装置及びコンテンツ検索装置、並びに、人間関係グラフ生成プログラム及びコンテンツ検索プログラム

Also Published As

Publication number Publication date
JP2010277332A (ja) 2010-12-09

Similar Documents

Publication Publication Date Title
JP4947245B2 (ja) 情報検索装置、情報検索方法、コンピュータ・プログラムおよびデータ構造
JP4547300B2 (ja) 共通クエリグラフパターン生成装置、生成方法、生成用プログラム、およびこれらを用いた共通サブグラフ検索装置、検索方法、検索用プログラム
US10366154B2 (en) Information processing device, information processing method, and computer program product
US20160140232A1 (en) System and Method of Expanding a Search Query
JP6611458B2 (ja) ウェブページアクセスのための装置及び方法
US20160140130A1 (en) Method of Naming Query Clusters
US8620941B2 (en) Apparatus and method of searching and visualizing instance path
JP5210970B2 (ja) 共通クエリグラフパターン生成方法、共通クエリグラフパターン生成装置及び共通クエリグラフパターン生成プログラム
JP5844824B2 (ja) Sparqlクエリ最適化方法
JP2006313499A (ja) 拡張クエリグラフパターン生成装置、生成方法、生成用プログラム、およびこれらを用いた拡張サブグラフ検索装置、検索方法、検索用プログラム
CN107239568B (zh) 分布式索引实现方法及装置
JP5627002B2 (ja) 類似映像出力方法、類似映像出力装置および類似映像出力プログラム
JP2006302024A (ja) 関連文書表示方法及びプログラム
JP5059239B1 (ja) オントロジースキーマーに基づくインスタンス経路の探索方法及び装置
KR20110023304A (ko) 개념 네트워크 기반 사용자 프로파일 구성 방법 및 시스템과 이를 이용한 개인화 질의 확장 시스템
JP2011175486A (ja) 名寄せチェック支援装置、名寄せチェック支援プログラム及び名寄せチェック支援方法
JP5181283B2 (ja) データ処理装置、ワークフローシステム、データ処理方法及びコンピュータプログラム
JP2010244187A (ja) 文書検索システムおよび方法
JP4547299B2 (ja) 反転クエリグラフパターン生成装置、生成方法、生成用プログラム、およびこれらを用いた反転サブグラフ検索装置、検索方法、検索プログラム
JP4843656B2 (ja) 構造化データ検索プログラム及び構造化データ検索装置
JP6632564B2 (ja) 違法コンテンツ探索装置、違法コンテンツ探索方法、及びプログラム
JP6625087B2 (ja) 違法コンテンツ探索装置及び違法コンテンツ探索方法
JP6530002B2 (ja) コンテンツ探索装置、コンテンツ探索方法、プログラム
JP2010015394A (ja) リンク先提示装置およびコンピュータプログラム
JP5439261B2 (ja) クラスタリング装置、クラスタリング方法及びクラスタリングプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110921

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20120509

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20120511

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130213

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130219

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130225

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160301

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5210970

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees