JP5844824B2 - Sparqlクエリ最適化方法 - Google Patents
Sparqlクエリ最適化方法 Download PDFInfo
- Publication number
- JP5844824B2 JP5844824B2 JP2013555049A JP2013555049A JP5844824B2 JP 5844824 B2 JP5844824 B2 JP 5844824B2 JP 2013555049 A JP2013555049 A JP 2013555049A JP 2013555049 A JP2013555049 A JP 2013555049A JP 5844824 B2 JP5844824 B2 JP 5844824B2
- Authority
- JP
- Japan
- Prior art keywords
- query
- rdf data
- reduced
- contraction
- rdf
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2453—Query optimisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/211—Schema design and management
Description
select ?n ?a where {
?x <http://name> ?n. ?x <http://age> ?a. filter (?a > 30).
}
このクエリは、年齢が30歳以上の従業員の名前と年齢を取得するものである。なお、クエリ内では、リソースは<と>で囲い、リテラルは"で囲って記述する。また、?ではじまる文字列(ここでは?n、?xおよび?a)は変数を表す。クエリ内の?x <http://name> ?n. および?x <http://age> ?a.はトリプルパターンと呼ばれる条件節で、変数を適当な値に置き換えることで一致するトリプルを指定する。filter (?a > 30). はフィルタパターンと呼ばれる条件節で、変数の値が満たすべき制約を表す。
幅広くデータ分析を行うために、RDFストアに格納されるデータ量は年々大規模化している。一般にクエリの実行効率(検索効率)は、対象データ量が増えるにつれて低下する。特に高度なデータ分析を行うためのクエリは条件指定が複雑になるため、実行時間が長くなる傾向にある。そのため、SPARQLクエリを最適化し、実行効率を向上させる方法が求められている。
select ?l1 where {
?s1 degree ?d1. ?s1 label ?l1.
filter regex(?l1, "breast.*cancer").
?s2 degree ?d2. ?s2 label ?l2.
filter (?d1 < ?d2).
}
これは症例データベースから、乳がんより重度な症例を探すクエリである。このクエリでは、filter (?d1 < ?d2)という制約条件を満たす症例を探すために、すべての症例の重症度(degreeの値)を比較する必要があり、検索の対象範囲が広くなると急速に検索の効率が悪くなる。文献1の方法を用いることで、検索範囲をdegreeおよびlabelを含むものに限定することができる。しかしながら、これらは大半の症例データに含まれているため、検索範囲はほとんど狭まらない。
このように生成した縮約RDFデータは、RDFデータにおけるノード間のつながりを維持している。すなわち、RDFデータにトリプル(n1(主語),n2(述語),n3(目的語))が含まれており、複数のRDFデータに対するn1,n2,n3の縮約値がそれぞれa1,a2,a3であるならば、縮約RDFデータにはトリプル(a1,a2,a3)が含まれていることが保証される。
(1)縮約基準表107は、RDFデータにおける複数のリテラル(文字)又はリソース(数値)を縮約値と呼ぶひとつの値に対応づけるために定めた基準である。
(2)縮約表109は、RDFデータに含まれる複数のリソースをひとつの縮約値に対応づけるものである。
(3)変数束縛表115は、クエリ内の各変数と縮約値との対応関係を示すものである。縮約クエリ113は、入力された元クエリ内のリテラルを、縮約基準表を用いて対応する縮約値に置換したものである。
(4)展開クエリ117は、元クエリに各変数の持つ縮約値を指定した変数範囲制限節を追加したものである。
(5)縮約RDFデータ110は、縮約基準表および縮約表を用いて元のRDFデータの複数ノード(リソース及びリテラルの総称)をひとつのノードに集約したデータである。
処理の説明の前に、図9、10及び11に示した、処理で使用する各データを説明する。
本発明では、述語でないリソースの縮約値として、縮約基準表を用いて各基準述語における縮約値を、順次、図10Aの縮約表に格納する。これにより、図10Aの第5行〜第10行に示す述語でないリソースのように、ひとつでも縮約値の異なる基準述語を持つリソースを区別して扱うことができる。
以下では、具体例を用いて本発明の実施例を示す。
次にステップ807に進み、未処理の変数が残っているかを調べる。未処理の変数が残っているので、ステップ808に進み、ひとつ取り出す。ここでは変数「?s1」が取り出されたとする。次にステップ809に進み、変数束縛(図11B)から変数「?s1」の値を調べると、縮約値「cHdL」であることがわかる。そのためパターン「?s1 <abs> cHdL.」を新しいクエリqeのwhere節に追加する。
次にステップ810に進み、変数?s1を処理済リストdone2に追加し、ステップ807に戻る。
Claims (4)
- 計算機を用いてSPARQLクエリを最適化する方法であって、
RDFストアが保持するRDFデータにおける複数のリテラルを縮約値と呼ぶひとつの値に対応づける基準を定めた縮約基準表を入力装置から受け取るステップと、
前記縮約基準表を用いて前記RDFデータに含まれる複数のリソースをひとつの縮約値に対応づける縮約表を生成するステップと、
前記縮約基準表および前記縮約表を用いて、前記RDFデータの複数ノードをひとつのノードに集約した縮約RDFデータを生成し、前記RDFデータのノードと前記縮約RDFデータのノードの対応関係を表すトリプルを前記RDFデータに追加するステップと、
前記SPARQLクエリを入力装置から受け取り、入力された前記SPARQLクエリ内のリテラルを前記縮約基準表を用いて対応する縮約値に置換した縮約クエリを生成するステップと、
前記縮約クエリを用いて前記縮約RDFデータを検索して、前記SPARQLクエリ内の各変数の持つ縮約値を記録した変数束縛表を生成するステップと、
生成した前記変数束縛表を用いて、前記SPARQLクエリに、前記各変数の持つ前記縮約値を指定した変数範囲制限節を追加した展開クエリを生成するステップと、
生成した前記展開クエリを用いて前記RDFデータを検索して、検索結果を求めるステップと、
を有することを特徴とするSPARQLクエリ最適化方法。 - 計算機で読み取り可能な記憶媒体であって、請求項1に記載の方法を実行するためのプログラムを格納したことを特徴とする記憶媒体。
- 計算機システムにおいて、
RDFストアが保持するRDFデータにおける複数のリテラルを縮約値と呼ぶひとつの値に対応づける基準を定めた縮約基準表を受け取る入力装置と、
前記縮約基準表を用いて前記RDFデータに含まれる複数のリソースをひとつの縮約値に対応づける縮約表を生成する手段と、
前記縮約基準表および前記縮約表を用いて、前記RDFデータの複数ノードをひとつのノードに集約した縮約RDFデータを生成し、前記RDFデータのノードと縮約RDFデータのノードの対応関係を表すトリプルを前記RDFデータに追加する手段と、
SPARQLクエリを前記入力装置から受け取り、入力された前記SPARQLクエリ内のリテラルを前記縮約基準表を用いて対応する縮約値に置換した縮約クエリを生成する手段と、
前記縮約クエリを用いて前記縮約RDFデータを検索して、前記SPARQLクエリ内の各変数の持つ縮約値を記録した変数束縛表を生成する手段と、
生成した前記変数束縛表を用いて、前記クエリに、前記各変数の持つ前記縮約値を指定した変数範囲制限節を追加した展開クエリを生成する手段と、
生成した前記展開クエリを用いて前記RDFデータを検索して、検索結果を求める手段と、
を有することを特徴とする計算機システム。 - 計算機を用いてSPARQLクエリを最適化する方法であって、
RDFストアが保持するRDFデータにおける複数のリテラルを縮約値と呼ぶひとつの値に対応づける基準を定めた縮約基準表を用いて、前記RDFデータを縮約した前記縮約RDFデータを生成すると共に、前記RDFデータと前記縮約RDFデータとの対応関係を示す縮約表を生成し、
前記縮約表と前記縮約基準表を用いて前記SPARQLクエリから生成した縮約クエリを用いて、前記縮約RDFデータを検索し、
前記検索の結果得られる変数束縛表を用いて前記SPARQLクエリを変換した展開クエリを用いて前記RDFデータを検索する、
ことを特徴とするSPARQLクエリ最適化方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2012/051552 WO2013111287A1 (ja) | 2012-01-25 | 2012-01-25 | Sparqlクエリ最適化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2013111287A1 JPWO2013111287A1 (ja) | 2015-05-11 |
JP5844824B2 true JP5844824B2 (ja) | 2016-01-20 |
Family
ID=48873058
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013555049A Active JP5844824B2 (ja) | 2012-01-25 | 2012-01-25 | Sparqlクエリ最適化方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20140372408A1 (ja) |
JP (1) | JP5844824B2 (ja) |
WO (1) | WO2013111287A1 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9031933B2 (en) * | 2013-04-03 | 2015-05-12 | International Business Machines Corporation | Method and apparatus for optimizing the evaluation of semantic web queries |
JP6440542B2 (ja) * | 2014-03-18 | 2018-12-19 | 株式会社Nttドコモ | 大量の複雑な構造化データを管理するための知識エンジン |
JP6463240B2 (ja) * | 2015-09-10 | 2019-01-30 | 株式会社日立製作所 | クエリ作成支援方法および情報処理装置 |
CN109992658B (zh) * | 2019-04-09 | 2023-04-11 | 智言科技(深圳)有限公司 | 一种知识驱动的sparql查询构建方法 |
US11195046B2 (en) * | 2019-06-14 | 2021-12-07 | Huawei Technologies Co., Ltd. | Method and system for image search and cropping |
JP7360047B2 (ja) | 2020-02-26 | 2023-10-12 | 富士通株式会社 | 検索処理プログラム、検索処理方法および検索処理装置 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03141471A (ja) * | 1989-10-27 | 1991-06-17 | Hitachi Ltd | 関係データの記憶・検索方法 |
US7587394B2 (en) * | 2003-09-23 | 2009-09-08 | International Business Machines Corporation | Methods and apparatus for query rewrite with auxiliary attributes in query processing operations |
US7680862B2 (en) * | 2005-04-18 | 2010-03-16 | Oracle International Corporation | Rewriting table functions as SQL strings |
US8719250B2 (en) * | 2005-04-18 | 2014-05-06 | Oracle International Corporation | Integrating RDF data into a relational database system |
CN101436192B (zh) * | 2007-11-16 | 2011-03-16 | 国际商业机器公司 | 用于优化针对垂直存储式数据库的查询的方法和设备 |
US8484243B2 (en) * | 2010-05-05 | 2013-07-09 | Cisco Technology, Inc. | Order-independent stream query processing |
WO2012054860A1 (en) * | 2010-10-22 | 2012-04-26 | Daniel Paul Miranker | Accessing relational databases as resource description framework databases |
-
2012
- 2012-01-25 WO PCT/JP2012/051552 patent/WO2013111287A1/ja active Application Filing
- 2012-01-25 US US14/374,452 patent/US20140372408A1/en not_active Abandoned
- 2012-01-25 JP JP2013555049A patent/JP5844824B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
WO2013111287A1 (ja) | 2013-08-01 |
US20140372408A1 (en) | 2014-12-18 |
JPWO2013111287A1 (ja) | 2015-05-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4947245B2 (ja) | 情報検索装置、情報検索方法、コンピュータ・プログラムおよびデータ構造 | |
JP5392077B2 (ja) | オントロジ処理装置、オントロジ処理方法、及びオントロジ処理プログラム | |
US9390176B2 (en) | System and method for recursively traversing the internet and other sources to identify, gather, curate, adjudicate, and qualify business identity and related data | |
JP5844824B2 (ja) | Sparqlクエリ最適化方法 | |
Etcheverry et al. | Enhancing OLAP analysis with web cubes | |
JP2005521954A (ja) | リレーショナルデータベースをクエリーする方法および装置 | |
Xirogiannopoulos et al. | Extracting and analyzing hidden graphs from relational databases | |
CN105630881A (zh) | 一种rdf的数据存储方法和查询方法 | |
JP4207438B2 (ja) | Xml文書格納/検索装置及びそれに用いるxml文書格納/検索方法並びにそのプログラム | |
JP2006185408A (ja) | データベース構築装置及びデータベース検索装置及びデータベース装置 | |
JP2004030221A (ja) | 変更対象テーブル自動検出方法 | |
Tseng | Mining frequent itemsets in large databases: The hierarchical partitioning approach | |
CN110321446B (zh) | 相关数据推荐方法、装置、计算机设备及存储介质 | |
Alsarkhi et al. | An analysis of the effect of stop words on the performance of the matrix comparator for entity resolution | |
CN110990423B (zh) | Sql语句的执行方法、装置、设备和存储介质 | |
Doerr et al. | Integration of complementary archaeological sources | |
JP5210970B2 (ja) | 共通クエリグラフパターン生成方法、共通クエリグラフパターン生成装置及び共通クエリグラフパターン生成プログラム | |
JP2010272006A (ja) | 関係抽出装置、関係抽出方法、及びプログラム | |
JP5555238B2 (ja) | ベイジアンネットワーク構造学習のための情報処理装置及びプログラム | |
Margitus et al. | RDF versus attributed graphs: The war for the best graph representation | |
Ahmed et al. | Computing source-to-target shortest paths for complex networks in RDBMS | |
CN114911826A (zh) | 一种关联数据检索方法和系统 | |
JP6666312B2 (ja) | 多次元データ管理システム及び多次元データ管理方法 | |
KR102062139B1 (ko) | 지능형 자료구조 기반의 데이터 처리 방법 및 그를 위한 장치 | |
JP2018060379A (ja) | 検索手段選択プログラム、検索手段選択方法及び検索手段選択装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150908 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20151016 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20151110 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20151119 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5844824 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |