JP5271808B2 - 共通クエリグラフパターン生成装置、共通クエリグラフパターン生成方法、および共通クエリグラフパターン生成用プログラム - Google Patents

共通クエリグラフパターン生成装置、共通クエリグラフパターン生成方法、および共通クエリグラフパターン生成用プログラム Download PDF

Info

Publication number
JP5271808B2
JP5271808B2 JP2009129100A JP2009129100A JP5271808B2 JP 5271808 B2 JP5271808 B2 JP 5271808B2 JP 2009129100 A JP2009129100 A JP 2009129100A JP 2009129100 A JP2009129100 A JP 2009129100A JP 5271808 B2 JP5271808 B2 JP 5271808B2
Authority
JP
Japan
Prior art keywords
query graph
graph pattern
search
input
common
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009129100A
Other languages
English (en)
Other versions
JP2010277322A (ja
Inventor
健治 大友
具英 山本
京士 飯塚
宏之 佐藤
啓 坂本
隆彦 村山
透 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2009129100A priority Critical patent/JP5271808B2/ja
Publication of JP2010277322A publication Critical patent/JP2010277322A/ja
Application granted granted Critical
Publication of JP5271808B2 publication Critical patent/JP5271808B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、膨大なデータの中からユーザが必要とする情報を検索するために用いる共通クエリグラフパターンを生成する共通クエリグラフパターン生成装置、共通クエリグラフパターン生成方法、および共通クエリグラフパターン生成用プログラムに関する。
近年、コンピュータネットワーク上には大量のデータが存在しており、ユーザはその中から所望のデータを検索することが困難になってきている。そのため、大量のデータから所望のデータを簡易に入手するための精度の高い検索技術が注目を集めている。
このような精度の高い検索を行うために用いられる技術にセマンティックWebがある。このセマンティックWebは、Webサイト上にメタデータとしてセマンティクス(意味情報)を付与し、人の手を使わずにデータを機械的に処理できる空間を創出するものである。
このセマンティックWebを利用することにより、メタデータの記述方法を定めたResource Description Framework(RDF)により表現されたグラフ構造のデータから、グラフパターンをクエリとしてマッチングさせて必要なデータを検索することが可能になる。
このRDFにより表現されたグラフ構造は、サブジェクト(主体)としてのノードを始点とし、オブジェクト(客体)としてのノードを終点として、これらのノード間を、識別情報となるラベルを付加し矢印で表現したプロパティ(属性)としてのアークで連結することで、その構成を表現することができる。
特許文献1には、このクエリグラフパターンを用いてグラフ構造を持つ大量のデータの中から情報を検索する際、ユーザにより入力されたキーワードを含むノードおよびそのノードと同じラベルを持つアークにつながるノードのそれぞれと、ユーザにより指定された概念(クラス)のインスタンスとして存在するノードとの間にある共通の構造を検索するための検索クエリグラフパターンを生成し、この検索クエリグラフパターンに基づいて抽出されたサブグラフの構造からさらに共通のグラフ構造を有する共通クエリグラフパターンを自動的に生成する技術が記載されている。
この技術を用いて生成された共通クエリグラフパターンを用いて検索処理を行うことにより、ユーザにより入力された情報および予め設定された情報に基づいて、共通の意味合いの構造を持つ情報を抽出することが可能になる。
特開2006−313501号公報
この特許文献1に記載の技術において共通クエリグラフパターンを生成する際に、ユーザにより入力されたキーワードを含むノードおよびそのノードと同じラベルを持つアークにつながるノードのそれぞれと、ユーザにより指定された概念(クラス)のインスタンスとして存在するノードとの間が2点以上のノードで構成されている場合には、ノード間のアークの向きのパターンが複数存在するため検索クエリグラフパターンが複数生成される。
例えば、ユーザにより入力されたキーワードと同じラベルを持つアークにつながる任意のノードを「?key」とし、ユーザにより指定された概念(クラス)のインスタンスとして存在する任意のノードを「?target」とすると、このノード「?key」とノード「?target」との間に2点の任意のノード「?node1」、「?node2」が存在するときには、図6(a)〜(h)に示すようにアークの向きのパターンにより8通りの検索クエリグラフパターンが生成される。
しかし、検索クエリグラフパターンが8通り生成されると、これらのパターンのそれぞれに基づいて共通クエリグラフパターンを生成し、さらに生成された各共通クエリグラフパターンに基づいて所望のサブグラフの検索処理を行うことになるため、計算量が膨大になり処理に相当な時間がかかってしまうという問題があった。
この場合、共通クエリグラフパターンの共通度(頻出度)の高い構造を選択することで共通クエリグラフパターンの数を制御することも可能であるが、共通度(頻出度)の高い共通クエリグラフパターンには有意でなく当たり前の構造や理解不能な構造が含まれることが多く、ユーザが入力した情報特有の有意な構造が抽出しにくくなることがあるという問題があった。
本発明は、上記事情に鑑みてなされたものであり、グラフ構造を持つ大量のデータの中からクエリグラフパターンが一致する情報を検索する際に、ユーザにより入力されたキーワードまたは概念などの情報に関連し且つ共通の意味合いの構造を持つ有意な情報を効率よく取得するクエリグラフパターンを自動的に生成可能な共通クエリグラフパターン生成装置、共通クエリグラフパターン生成方法、および共通クエリグラフパターン生成用プログラムを提供することを目的とする。
上記の課題を解決するための、本発明の共通クエリグラフパターン生成装置は、グラフ構造を持つデータが格納されているグラフ構造データベースに接続され、ユーザから入力された検索対象のキーワードおよび概念を入力する入力手段と、前記キーワードと同じラベルを持つアークにつながるノードと、前記概念のインスタンスであるノードとの間に存在するパスを検索するための検索クエリグラフパターンを生成する検索クエリグラフパターン生成手段と、生成された検索クエリグラフパターンにマッチする前記グラフ構造データ内の部分データである検索サブグラフを、前記グラフ構造データベースから取得する検索サブグラフ取得手段と、取得された検索サブグラフに含まれるグラフ構造から複数回出現する共通のグラフ構造を抽出し、この抽出したグラフ構造に含まる任意のノード名およびプロパティ名を変数にすることにより、前記ユーザにより入力されたキーワードおよび概念に関する情報を検索するための共通クエリグラフパターンを生成する共通クエリグラフパターン生成手段とを備えた共通クエリグラフパターン生成装置において、前記入力手段は、ユーザから入力された、前記検索クエリグラフパターンの、前記キーワードと同じラベルを持つアークにつながるノードと前記概念のインスタンスであるノードとの間に存在するノードである中間ノードの数を制限するための情報をさらに入力し、前記検索クエリグラフパターン生成手段は、前記入力手段で入力された中間ノードの数を制限するための情報に基づいて、前記検索クエリグラフパターンを生成することを特徴とする。
またこの共通クエリグラフパターン生成装置の前記入力手段では、ユーザから入力された、前記検索クエリグラフパターンの、前記キーワードと同じラベルを持つアークにつながるノードから前記概念のインスタンスとして存在するノードへのパスを辿っていく際に、連結するアークのサブジェクトからオブジェクトに向かう向きが変わるノードである中心ノードの数を制限するための情報をさらに入力し、前記検索クエリグラフパターン生成手段では、前記入力手段で入力された中心ノードの数を制限するための情報に基づいて、前記検索クエリグラフパターンを生成するようにしてもよい。
またこの共通クエリグラフパターン生成装置の前記共通クエリグラフパターン生成手段ではさらに、生成された複数の共通クエリグラフパターンの中から、異なるリソースに跨った連続するアークで構成されている共通クエリグラフパターンを抽出することで、生成された共通クエリグラフパターンの数を絞り込むようにしてもよい。
本発明の共通クエリグラフパターン生成装置、共通クエリグラフパターン生成方法、および共通クエリグラフパターン生成用プログラムによれば、グラフ構造を持つ大量のデータの中からクエリグラフパターンが一致する情報を検索する際に、ユーザにより入力されたキーワードまたは概念などの情報に関連し且つ共通の意味合いの構造を持つ有意な情報を効率よく取得するクエリグラフパターンを自動的に生成可能であるため、所望の情報を効率よく取得することができる。
本発明の一実施形態による共通クエリグラフパターン生成装置としてのクエリグラフパターン生成部を有する検索装置を利用した検索システムの構成を示すブロック図である。 本発明の一実施形態による共通クエリグラフパターン生成装置としてのクエリグラフパターン生成部を有する検索装置に接続されたグラフ構造データベース内のデータを示す説明図である。 (a)は、本発明の一実施形態による共通クエリグラフパターン生成装置としてのクエリグラフパターン生成部を有する検索装置に接続されたグラフ構造データベース内のデータの一部を示す説明図であり、(b)は、(a)のRDF表現をXML形式データで記述した状態を示す説明図である。 本発明の一実施形態による共通クエリグラフパターン生成装置としてのクエリグラフパターン生成部を有する検索装置で実行される処理を説明するフローチャートである。 本発明の一実施形態による共通クエリグラフパターン生成装置としてのクエリグラフパターン生成部を有する検索装置で生成された検索クエリグラフパターンの一例である。 従来の共通クエリグラフパターン生成装置で生成された検索クエリグラフパターンの一例である。
本発明の共通クエリグラフパターン生成装置の一実施形態を、図1〜図5を用いて説明する。
《一実施形態による検索システム1の構成》
図1は、本発明の一実施形態による共通クエリグラフパターン生成装置としてのクエリグラフパターン生成部32を有する検索装置30を用いた検索システム1の構成を示す全体図である。
本実施形態における検索システム1は、グラフ構造データベース10と、ユーザ端末20と、検索装置30とを有する。
グラフ構造データベース10には、図2に表すようなグラフ構造を持つデータが格納されている。このグラフ構造データはラベル付き有向グラフデータであり、データのアーク(ノード間をサブジェクトからオブジェクトに向けて結ぶ矢印)をRDFの仕様に基づいてプロパティと称する。
本実施形態においてグラフ構造データベース10に格納されているグラフ構造データは、人が所属する組織に関する組織データベース(DB)と、論文や著書に関する論文データベース(DB)と、SNS(Social Networking Service)コミュニティに関するSNSコミュニティデータベース(DB)との3つの異なるリソースのデータで構成されている。
例えば、組織DBのデータとしては、オブジェクトとしての「京都大学大学院」、「情報学研究所」、「知能情報学専攻」、「社会情報学専攻」、「NT研究所」等とともに、これらの組織に所属する人名がサブジェクトとして格納されている。また、論文DBのデータとしては、サブジェクトとしての「知能情報システムの課題」、「マルチエージェントシステム」、「探索アルゴリズムの研究」、「インタラクションの理解とデザイン」等とともに、これらの論文の著者である人名およびキーワードがオブジェクトとして格納されている。また、SNSコミュニティDBのデータとしては、サブジェクトとしての「人工知能技術は今」等とともに、このSNSコミュニティのキーワードおよびメンバの人名がオブジェクトとして格納されている。
図3は、これらのグラフ構造データがどのように既存のリレーショナルデータベースなどで管理されているデータから生成され、グラフ化されているかを示すための説明図である。図3(a)は図2のデータの一部を示したものであり、単語「人工知能」は、サブジェクトであるSNSコミュニティ「人工知能技術は今」のオブジェクトとなるキーワードであるとともに、サブジェクトである論文「アルゴリズムの研究」のオブジェクトとなるキーワードであることが示されている。
また、図3(b)は、図3(a)のグラフ構造データのRDF表現をXML形式データで記述したものであり、グラフ構造データベース10には、図2のデータのそれぞれを図3(b)に示すようなXML形式データで記述した情報が格納されている。このXML形式データには、各アークがどのリソースに由来するプロパティであるかを区別するために名前空間を利用しており、各名前空間の定義と、一のサブジェクトから一のオブジェクトに向かうアークの名前空間を用いたプロパティとが記載されている。
例えば図3(b)では、名前空間として、リソース(SNSコミュニティDB)に由来することを示すための「SNS」、リソース(論文DB)に由来することを示すための「PAPER」が定義され、サブジェクトであるSNSコミュニティ「人工知能技術は今」とオブジェクトである単語「人工知能」は、名前空間「SNS」を用いたプロパティ「SNS:キーワード」のアークで連結され、また、サブジェクトである論文「探索アルゴリズムの研究」とオブジェクトである単語「人工知能」は、名前空間「PAPER」を用いたプロパティ「PAPER:キーワード」のアークで連結されていることが記載されている。
ユーザ端末20は、検索システム1を利用するユーザにより操作される端末であり、ユーザにより入力された検索対象となるキーワード、概念、および検索クエリグラフパターンの複雑さにより検索クエリグラフパターンの数を制御するためのパラメータを検索装置30に送出するとともに、検索装置30で出力された検索結果を表示する。
検索装置30は、入力部31と、クエリグラフパターン生成部32と、サブグラフ検索部33と、出力部34とを有する。
入力部31は、ユーザ端末20から送出された検索対象となるキーワード、概念、および検索クエリグラフパターンの数を制御するためのパラメータを入力する。
クエリグラフパターン生成部32は、検索クエリグラフパターン生成部321と、検索クエリグラフパターン記憶部322と、共通クエリグラフパターン生成部323と、データ跨り検出部324と、パターン絞込み部325と、共通クエリグラフパターン記憶部326とを有する。
検索クエリグラフパターン生成部321は、入力部31から入力された検索対象となるキーワードおよび概念の情報に基づいて、当該キーワードを含むノードおよびそのノードと同じラベルを持つアークにつながるノードのそれぞれと、当該概念(クラス)のインスタンスとして存在するノードとの間にある共通の構造を検索し、この共通の構造を検索クエリグラフパターンとして生成する。
また検索クエリグラフパターン生成部321は、入力部31から入力された検索クエリグラフパターンの数を制御するためのパラメータに基づいて、生成した検索クエリグラフパターンの中から有効な検索クエリグラフパターンを抽出する。
検索クエリグラフパターン記憶部322は、検索クエリグラフパターン生成部321で抽出された検索クエリグラフパターンを記憶する。
共通クエリグラフパターン生成部323は、検索クエリグラフパターン記憶部322に記憶された検索クエリグラフパターンにマッチするグラフ構造データの部分データであるサブグラフを、グラフ構造データベース10から検索して抽出する。
また共通クエリグラフパターン生成部323は、検索した結果抽出されたサブグラフの構造からさらに複数回出現する共通のグラフ構造を抽出し、この抽出したグラフ構造に含まる任意のノード名およびプロパティ名を変数にすることにより、ユーザにより入力されたキーワードおよび概念に関する情報を検索するための共通クエリグラフパターンを生成する。
データ跨り検出部324は、共通クエリグラフパターン生成部323で生成された共通クエリグラフパターンから、異なるリソースに跨った連続するアークの構造を検出する。この際、異なるリソースに跨った連続するアークであるか否かの判断は、グラフ構造データベース10内のXML形式データに記載された各アークのプロパティの情報に基づいて行う。
パターン絞込み部325は、共通クエリグラフパターン生成部323で生成された複数の共通クエリグラフパターンの中から、データ跨り検出部324において異なるリソースに跨った連続するアークで構成されている共通クエリグラフパターンを抽出することで、共通クエリグラフパターンの数を絞り込む。
共通クエリグラフパターン記憶部326は、パターン絞込み部325で絞り込まれた共通クエリグラフパターンを記憶する。
サブグラフ検索部33は、クエリグラフパターン生成部32の共通クエリグラフパターン記憶部326に記憶された共通クエリグラフパターンにマッチするサブグラフを、グラフ構造データベースから検索して抽出する。
出力部34は、サブグラフ検索部33で抽出されたサブグラフの情報を、検索結果としてユーザ端末に出力する。
《一実施形態による検索システム1の動作》
次に、上記のように構成された検索システム1を用いて検索処理を実行するときの動作について説明する。図4は、検索処理を行うときの検索装置30の動作を示すフローチャートである。
まず、ユーザによりユーザ端末20が操作され、検索対象のキーワードが入力されるとともに概念としてリソースが選択される。例えば、「人工知能」に関係する組織を検索したいときには、キーワードとして単語「人工知能」を入力するとともに概念としてリソース「組織」が選択される。また、ユーザ端末20からさらに検索クエリグラフパターンの複雑さにより検索クエリグラフパターンの数を制御するためのパラメータが入力される。検索クエリグラフパターンの数を制御するためのパラメータとしては、ユーザにより入力されたキーワードを含むノードおよびそのノードと同じラベルを持つアークにつながるノードのそれぞれと、ユーザにより指定された概念(クラス)のインスタンスとして存在するノードとの間にある共通の構造である検索クエリグラフパターンの、両端のノードの間に存在する中間のノード(以下、「中間ノード」という)の数を制限するための「中間ノード数」と、当該キーワードまたは当該キーワードと同じラベルを持つアークにつながるノードから当該概念のインスタンスとして存在するノードへのパスを辿っていく際に連結するアークの矢印の向きが変わるノード(自身がサブジェクトからオブジェクトに変わるノード、またはオブジェクトからサブジェクトに変わるノード、以下「中心ノード」という)の数を制限するための「中心ノード数」が入力される。これらの「中間ノード数」と「中心ノード数」とは、数が多い程多様な構造の検索結果を得ることができるが計算量が多くなり、数が少ない程検索クエリグラフパターンの複雑さが低減し共通クエリグラフパターンを生成するときの計算量が少なくなるものであり、グラフ構造データベースに格納されたデータの量や所望の検索精度に基づいてユーザにより指定される。本実施形態においては、中間ノード数としては「2」が入力され、中心ノード数としては「0」および「1」が入力されたものとする。
これらのキーワード、概念、中間ノード、中心ノードの情報がユーザ端末20で入力されると検索装置30に送出され、入力部31から入力される(S1)。
入力部31からこれらの情報が入力されると、クエリグラフパターン生成部32の検索クエリグラフパターン生成部321において、当該キーワードを含むノードおよびそのノードと同じラベルを持つアークにつながるノードのそれぞれと、当該概念(クラス)のインスタンスとして存在するノードとの間にある共通の構造を検索して検索クエリグラフパターンが生成される。
ここで本実施形態においては、中間ノード数が「2」に指定されていることから、矢印の向きのパターンに基づいて最大で図5(a)〜(h)に示す8つの検索クエリグラフパターンが生成される。この検索クエリグラフパターンの生成については、特開2006−313501号公報に記載の方法を用いることができる。
さらに中心ノード数が「0」および「1」に指定されていることから、これら8つの検索クエリグラフパターンの中から中心ノード数が「0」または「1」のものが抽出される。図5においては中心ノードが太線枠で示されており、中心ノード数が「0」または「1」に該当する(a)、(b)、(d)、(e)、(f)、(h)の6つが有効な検索クエリグラフパターンとして抽出される(S2)。
そして、この抽出された6つの検索クエリグラフパターン(a)、(b)、(d)、(e)、(f)、(h)は、検索クエリグラフパターン記憶部322に記憶される(S3)。
次に、共通クエリグラフパターン生成部323において、検索クエリグラフパターン記憶部322に記憶された6つの検索クエリグラフパターン(a)、(b)、(d)、(e)、(f)、(h)にそれぞれマッチするグラフ構造データの部分であるサブグラフがグラフ構造データベース10から抽出される(S4)。
次に、共通クエリグラフパターン生成部323において、検索した結果抽出されたサブグラフの構造からさらに複数回出現する共通のグラフ構造が抽出され、この抽出されたグラフ構造に含まる任意のノード名およびプロパティ名を変数にすることにより、ユーザにより入力されたキーワードおよび概念に関する情報を検索するための共通クエリグラフパターンが生成される(S5)。この共通クエリグラフパターンの生成については、特開2006−313501号公報に記載の方法を用いることができる。
次に、データ跨り検出部324において、共通クエリグラフパターン生成部323で生成された共通クエリグラフパターンの構造の中から、異なるリソースに跨った連続するアークの構造が、グラフ構造データベース10内のXML形式データに記載された各アークのプロパティの情報に基づいて検出される(S6)。この異なるリソースに跨った連続するアークであるか否かは、本実施形態においては図3(b)に示すようなXML形式データ内のプロパティで用いられている名前空間で判断される。例えば、「SNS:キーワード」と「PAPER:キーワード」とは名前空間が異なるため、図3(a)のサブグラフにおいてノード「人工知能」を挟んで連続する2つのアークは、異なるリソースに跨っていると判断される。
次に、パターン絞込み部325において、共通クエリグラフパターン生成部323で生成された複数の共通クエリグラフパターンが、異なるリソースに跨った連続するアークで構成された共通クエリグラフパターンに絞り込まれる(S7)。それぞれのリソースはもともと異なる意図で作られているため、異なるリソースを跨った構造に絞り込まれることで、それぞれのリソースの作成時には意図していなかったような有意な情報である新たな情報、知識が得られる可能性が高くなる。
絞り込まれた共通クエリグラフパターンは、共通クエリグラフパターン記憶部326に記憶される(S8)。
次に、サブグラフ検索部33において、共通クエリグラフパターン記憶部326に記憶された共通クエリグラフパターンにマッチするサブグラフが、グラフ構造データベースから検索され抽出される(S9)。
そして、抽出されたサブグラフの情報が、入力したキーワードおよび概念に対する検索結果としてユーザ端末に出力される(S10)。
以上の本実施形態によれば、グラフ構造を持つ大量のデータの中からクエリグラフパターンが一致する情報を検索する際に、検索クエリグラフパターンの数を制御するためのパラメータを入力しておくことで検索処理の計算量を大幅に減らすことができ、また生成した複数の共通クエリグラフパターンを異なるリソースに跨った連続するアークで構成された共通クエリグラフパターンに絞り込むことで、さらに検索処理の計算量を減らすとともに共通の意味合いを持つ有意な情報を効率よく取得することができる。
本実施形態においては、検索クエリグラフパターン生成部321で生成された検索クエリグラフパターンを検索クエリグラフパターン記憶部322に記憶させた後、共通クエリグラフパターンを生成する場合について説明したが、検索クエリグラフパターン記憶部322に記憶させることなく、検索クエリグラフパターン生成部321で検索クエリグラフパターンを生成しながら共通クエリグラフパターン生成部323で共通クエリグラフパターンを生成するようにしてもよい。
1…検索システム
10…グラフ構造データベース
20…ユーザ端末
30…検索装置
31…入力部
32…クエリグラフパターン生成部
33…サブグラフ検索部
34…出力部
321…検索クエリグラフパターン生成部
322…検索クエリグラフパターン記憶部
323…共通クエリグラフパターン生成部
324…データ跨り検出部
325…パターン絞込み部
326…共通クエリグラフパターン記憶部

Claims (9)

  1. グラフ構造を持つデータが格納されているグラフ構造データベースに接続され、
    ユーザから入力された検索対象のキーワードおよび概念を入力する入力手段と、
    前記キーワードと同じラベルを持つアークにつながるノードと、前記概念のインスタンスであるノードとの間に存在するパスを検索するための検索クエリグラフパターンを生成する検索クエリグラフパターン生成手段と、
    生成された検索クエリグラフパターンにマッチする前記グラフ構造データ内の部分データである検索サブグラフを、前記グラフ構造データベースから取得する検索サブグラフ取得手段と、
    取得された検索サブグラフに含まれるグラフ構造から複数回出現する共通のグラフ構造を抽出し、この抽出したグラフ構造に含まる任意のノード名およびプロパティ名を変数にすることにより、前記ユーザにより入力されたキーワードおよび概念に関する情報を検索するための共通クエリグラフパターンを生成する共通クエリグラフパターン生成手段と、
    を備えた共通クエリグラフパターン生成装置において、
    前記入力手段は、ユーザから入力された、前記検索クエリグラフパターンの、前記キーワードと同じラベルを持つアークにつながるノードと前記概念のインスタンスであるノードとの間に存在するノードである中間ノードの数を制限するための情報をさらに入力し、
    前記検索クエリグラフパターン生成手段は、前記入力手段で入力された中間ノードの数を制限するための情報に基づいて、前記検索クエリグラフパターンを生成する
    ことを特徴とする共通クエリグラフパターン生成装置。
  2. 前記入力手段は、ユーザから入力された、前記検索クエリグラフパターンの、前記キーワードと同じラベルを持つアークにつながるノードから前記概念のインスタンスとして存在するノードへのパスを辿っていく際に、連結するアークのサブジェクトからオブジェクトに向かう向きが変わるノードである中心ノードの数を制限するための情報をさらに入力し、
    前記検索クエリグラフパターン生成手段は、前記入力手段で入力された中心ノードの数を制限するための情報に基づいて、前記検索クエリグラフパターンを生成する
    ことを特徴とする請求項1に記載の共通クエリグラフパターン生成装置。
  3. 前記共通クエリグラフパターン生成手段はさらに、生成された複数の共通クエリグラフパターンの中から、異なるリソースに跨った連続するアークで構成されている共通クエリグラフパターンを抽出することで、生成された共通クエリグラフパターンの数を絞り込む
    ことを特徴とする請求項1または2に記載の共通クエリグラフパターン生成装置。
  4. ユーザから入力された検索対象のキーワードおよび概念を入力する入力ステップと、
    前記キーワードと同じラベルを持つアークにつながるノードと、前記概念のインスタンスであるノードとの間に存在するパスを、グラフ構造を持つデータが格納されているグラフ構造データベースから検索するための検索クエリグラフパターンを生成する検索クエリグラフパターン生成ステップと、
    生成された検索クエリグラフパターンにマッチする前記グラフ構造データ内の部分データである検索サブグラフを、前記グラフ構造データベースから取得する検索サブグラフ取得ステップと、
    取得された検索サブグラフに含まれるグラフ構造から複数回出現する共通のグラフ構造を抽出し、この抽出したグラフ構造に含まる任意のノード名およびプロパティ名を変数にすることにより、前記ユーザにより入力されたキーワードおよび概念に関する情報を検索するための共通クエリグラフパターンを生成する共通クエリグラフパターン生成ステップと、
    を有する共通クエリグラフパターン生成方法において、
    前記入力ステップでは、ユーザから入力された、前記検索クエリグラフパターンの、前記キーワードと同じラベルを持つアークにつながるノードと前記概念のインスタンスであるノードとの間に存在するノードである中間ノードの数を制限するための情報をさらに入力し、
    前記検索クエリグラフパターン生成ステップでは、前記入力ステップで入力された中間ノードの数を制限するための情報に基づいて、前記検索クエリグラフパターンを生成する
    ことを特徴とする共通クエリグラフパターン生成方法。
  5. 前記入力ステップでは、ユーザから入力された、前記検索クエリグラフパターンの、前記キーワードと同じラベルを持つアークにつながるノードから前記概念のインスタンスとして存在するノードへのパスを辿っていく際に、連結するアークのサブジェクトからオブジェクトに向かう向きが変わるノードである中心ノードの数を制限するための情報をさらに入力し、
    前記検索クエリグラフパターン生成ステップでは、前記入力ステップで入力された中心ノードの数を制限するための情報に基づいて、前記検索クエリグラフパターンを生成する
    ことを特徴とする請求項4に記載の共通クエリグラフパターン生成方法。
  6. 前記共通クエリグラフパターン生成ステップではさらに、生成された複数の共通クエリグラフパターンの中から、異なるリソースに跨った連続するアークで構成されている共通クエリグラフパターンを抽出することで、生成された共通クエリグラフパターンの数を絞り込む
    ことを特徴とする請求項4または5に記載の共通クエリグラフパターン生成方法。
  7. ユーザから入力された検索対象のキーワードおよび概念を入力する入力機能と、
    前記キーワードと同じラベルを持つアークにつながるノードと、前記概念のインスタンスであるノードとの間に存在するパスを、グラフ構造を持つデータが格納されているグラフ構造データベースから検索するための検索クエリグラフパターンを生成する検索クエリグラフパターン生成機能と、
    生成された検索クエリグラフパターンにマッチする前記グラフ構造データ内の部分データである検索サブグラフを、前記グラフ構造データベースから取得する検索サブグラフ取得機能と、
    取得された検索サブグラフに含まれるグラフ構造から複数回出現する共通のグラフ構造を抽出し、この抽出したグラフ構造に含まる任意のノード名およびプロパティ名を変数にすることにより、前記ユーザにより入力されたキーワードおよび概念に関する情報を検索するための共通クエリグラフパターンを生成する共通クエリグラフパターン生成機能と、
    を有する共通クエリグラフパターン生成用プログラムにおいて、
    前記入力機能では、ユーザから入力された、前記検索クエリグラフパターンの、前記キーワードと同じラベルを持つアークにつながるノードと前記概念のインスタンスであるノードとの間に存在するノードである中間ノードの数を制限するための情報をさらに入力し、
    前記検索クエリグラフパターン生成機能では、前記入力機能により入力された中間ノードの数を制限するための情報に基づいて、前記検索クエリグラフパターンを生成する
    ことを特徴とする共通クエリグラフパターン生成用プログラム。
  8. 前記入力機能では、ユーザから入力された、前記検索クエリグラフパターンの、前記キーワードと同じラベルを持つアークにつながるノードから前記概念のインスタンスとして存在するノードへのパスを辿っていく際に、連結するアークのサブジェクトからオブジェクトに向かう向きが変わるノードである中心ノードの数を制限するための情報をさらに入力し、
    前記検索クエリグラフパターン生成機能では、前記入力機能により入力された中心ノードの数を制限するための情報に基づいて、前記検索クエリグラフパターンを生成する
    ことを特徴とする請求項7に記載の共通クエリグラフパターン生成用プログラム。
  9. 前記共通クエリグラフパターン生成機能ではさらに、生成された複数の共通クエリグラフパターンの中から、異なるリソースに跨った連続するアークで構成されている共通クエリグラフパターンを抽出することで、生成された共通クエリグラフパターンの数を絞り込む
    ことを特徴とする請求項7または8に記載の共通クエリグラフパターン生成用プログラム。
JP2009129100A 2009-05-28 2009-05-28 共通クエリグラフパターン生成装置、共通クエリグラフパターン生成方法、および共通クエリグラフパターン生成用プログラム Expired - Fee Related JP5271808B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009129100A JP5271808B2 (ja) 2009-05-28 2009-05-28 共通クエリグラフパターン生成装置、共通クエリグラフパターン生成方法、および共通クエリグラフパターン生成用プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009129100A JP5271808B2 (ja) 2009-05-28 2009-05-28 共通クエリグラフパターン生成装置、共通クエリグラフパターン生成方法、および共通クエリグラフパターン生成用プログラム

Publications (2)

Publication Number Publication Date
JP2010277322A JP2010277322A (ja) 2010-12-09
JP5271808B2 true JP5271808B2 (ja) 2013-08-21

Family

ID=43424230

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009129100A Expired - Fee Related JP5271808B2 (ja) 2009-05-28 2009-05-28 共通クエリグラフパターン生成装置、共通クエリグラフパターン生成方法、および共通クエリグラフパターン生成用プログラム

Country Status (1)

Country Link
JP (1) JP5271808B2 (ja)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8918418B2 (en) 2010-04-19 2014-12-23 Facebook, Inc. Default structured search queries on online social networks
US8732208B2 (en) 2010-04-19 2014-05-20 Facebook, Inc. Structured search queries based on social-graph information
US8185558B1 (en) 2010-04-19 2012-05-22 Facebook, Inc. Automatically generating nodes and edges in an integrated social graph
US8868603B2 (en) 2010-04-19 2014-10-21 Facebook, Inc. Ambiguous structured search queries on online social networks
US8782080B2 (en) 2010-04-19 2014-07-15 Facebook, Inc. Detecting social graph elements for structured search queries
US8180804B1 (en) 2010-04-19 2012-05-15 Facebook, Inc. Dynamically generating recommendations based on social graph information
US8751521B2 (en) 2010-04-19 2014-06-10 Facebook, Inc. Personalized structured search queries for online social networks
JP5747749B2 (ja) * 2011-09-06 2015-07-15 富士ゼロックス株式会社 検索装置及びプログラム
AU2013293332A1 (en) * 2012-07-23 2015-02-05 Facebook, Inc. Personalized structured search queries for online social networks
KR101270476B1 (ko) * 2012-07-30 2013-06-03 한국과학기술정보연구원 그래프 데이터 기반 인스턴스 경로 탐색 시스템 및 방법
US9361363B2 (en) 2012-12-31 2016-06-07 Facebook, Inc. Modifying structured search queries on online social networks
US9367607B2 (en) * 2012-12-31 2016-06-14 Facebook, Inc. Natural-language rendering of structured search queries
US9336300B2 (en) 2014-01-17 2016-05-10 Facebook, Inc. Client-side search templates for online social networks
JP6906419B2 (ja) * 2017-10-13 2021-07-21 ヤフー株式会社 情報提供装置、情報提供方法、およびプログラム

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3785150B2 (ja) * 2003-03-10 2006-06-14 株式会社ジャストシステム 頻出部分グラフ抽出装置、頻出部分グラフ抽出方法、ならびに、プログラム
JP4547300B2 (ja) * 2005-05-09 2010-09-22 日本電信電話株式会社 共通クエリグラフパターン生成装置、生成方法、生成用プログラム、およびこれらを用いた共通サブグラフ検索装置、検索方法、検索用プログラム

Also Published As

Publication number Publication date
JP2010277322A (ja) 2010-12-09

Similar Documents

Publication Publication Date Title
JP5271808B2 (ja) 共通クエリグラフパターン生成装置、共通クエリグラフパターン生成方法、および共通クエリグラフパターン生成用プログラム
US9372929B2 (en) Methods and systems for node and link identification
JP4547300B2 (ja) 共通クエリグラフパターン生成装置、生成方法、生成用プログラム、およびこれらを用いた共通サブグラフ検索装置、検索方法、検索用プログラム
KR100995861B1 (ko) 온톨로지 스키마와 결합된 개체명 사전 및 마이닝 규칙을 이용한 용어의 개체명 결정모듈 및 방법
KR101739540B1 (ko) 통합 지식베이스 구축 시스템 및 방법
KR20130098772A (ko) 토픽 기반 커뮤니티 인덱스 생성장치, 토픽 기반 커뮤니티 검색장치, 토픽 기반 커뮤니티 인덱스 생성방법 및 토픽 기반 커뮤니티 검색방법
Dyvak et al. Recognition of Relevance of Web Resource Content Based on Analysis of Semantic Components
Consoli et al. A quartet method based on variable neighborhood search for biomedical literature extraction and clustering
WO2017026303A1 (ja) 未来シナリオ生成装置及び方法、並びにコンピュータプログラム
KR101226162B1 (ko) 온톨로지 데이터를 그래프 데이터로 변환하기 위한 방법 및 그 장치
JP2013054602A (ja) グラフパターンマッチングシステムおよびグラフパターンマッチング方法
Swaminathan et al. A comparative study of recent ontology visualization tools with a case of diabetes data
Jain et al. Cawesumm: A contextual and anonymous walk embedding based extractive summarization of legal bills
KR20120097840A (ko) 벡터 공간 모델을 이용한 rdf 트리플 선택 방법, 장치, 및 그 방법을 실행하기 위한 프로그램 기록매체
Shafi et al. [WiP] Web Services Classification Using an Improved Text Mining Technique
JP2007140707A (ja) グラフ検索装置
JP5623023B2 (ja) アイデア整理支援装置、アイデア支援方法およびコンピュータプログラム
JP2013145508A (ja) グラフパターンマッチングシステムおよびグラフパターン代表元抽出方法
JP4547299B2 (ja) 反転クエリグラフパターン生成装置、生成方法、生成用プログラム、およびこれらを用いた反転サブグラフ検索装置、検索方法、検索プログラム
Consoli et al. A VNS-based quartet algorithm for biomedical literature clustering
CN114461815B (zh) 家谱知识图谱的噪音检测方法及其装置、电子设备
Jeon et al. Random forest algorithm for linked data using a parallel processing environment
JP7371989B1 (ja) 検索サーバー、検索システム、及び検索プログラム
JP5914186B2 (ja) 情報処理装置および情報処理方法
JP2010277438A (ja) グラフ検索装置およびその動作方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110921

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20120509

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20120511

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130213

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130219

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130408

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130507

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130513

R150 Certificate of patent or registration of utility model

Ref document number: 5271808

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees