JP5352935B2 - 推論検証及び漸増的な推論のためのトリプルの格納方法及び装置、並びにこれらに適した推論依存性索引装置 - Google Patents

推論検証及び漸増的な推論のためのトリプルの格納方法及び装置、並びにこれらに適した推論依存性索引装置 Download PDF

Info

Publication number
JP5352935B2
JP5352935B2 JP2012541933A JP2012541933A JP5352935B2 JP 5352935 B2 JP5352935 B2 JP 5352935B2 JP 2012541933 A JP2012541933 A JP 2012541933A JP 2012541933 A JP2012541933 A JP 2012541933A JP 5352935 B2 JP5352935 B2 JP 5352935B2
Authority
JP
Japan
Prior art keywords
triple
inference
serial number
triples
dependency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2012541933A
Other languages
English (en)
Other versions
JP2013511788A (ja
Inventor
ウ イ,スン
キム,ピョン
ミン ジョン,ハン
キョン イ,ミ
ミン ソ,ドン
キョン ソン,ウォン
Original Assignee
コリア インスティテュート オブ サイエンス アンド テクノロジー インフォメイション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by コリア インスティテュート オブ サイエンス アンド テクノロジー インフォメイション filed Critical コリア インスティテュート オブ サイエンス アンド テクノロジー インフォメイション
Publication of JP2013511788A publication Critical patent/JP2013511788A/ja
Application granted granted Critical
Publication of JP5352935B2 publication Critical patent/JP5352935B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • G06N5/025Extracting rules from data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • G06N5/046Forward inferencing; Production systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9027Trees
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、推論によるトリプルの格納方法に係り、より詳しくは、推論によって提供されるサービスに対する根拠を提示し、トリプルの削除に際しても漸増的な推論を支援することのできるトリプルの格納方法及び装置、並びにこれらに適した推論依存性索引装置及び推論依存性検証方法に関する。
セマンティックウェブ(Semantic Web)において、知識はRDF(Resource Description Framework)及びOWL(Web Ontology Language)などのオントロジー(ontology)で表され、推論はオントロジーで表された知識を拡張加工する役割を果たす。オントロジーは、RDFトリプル(triple)の集まりであり、各トリプルは、<主語、述語、目的語>の対によって構成される。また、トリプルは、事実(fact)とも呼ばれる。
推論を行う時点によって、推論技術は、質疑が行われる前に予め全ての推論を行う前方推論(forward reasoning)と、質疑が行われた後にその質疑を処理するために必要とされる推論のみを行う後方推論(backward reasoning)とに大別できるが、オントロジーの規模が大きくなるに伴い、最近の推論技術は、即刻的な質疑応答を行うのに適した前方推論を主流とし、ここに後方推論を部分的に混用する傾向にある。また、推論技術は、基礎となる論理によって、記述論理(Description Logic)に基づく推論と、規則に基づく推論とに大別できるが、推論の実用性の側面では規則に基づく推論が有利であり、推論の完全性の側面では技術論理に基づく推論が有利である。
このように規則に基づく前方推論技術が、大容量のオントロジーを対象とする推論の実用的な側面で有利であるが、オントロジーの一部のトリプルが変更若しくは削除される場合には、このトリプルから既に推論されて拡張されたトリプルもそれ以上は有効ではなくなる。それ故に、このような問題を処理するために、一般に、全般的な推論を行い直すが、推論を行うのに長時間がかかるため、実用性の側面で妨げとなっている。
一方、セマンティックウェブに基づく推論サービスにおいては、オントロジー及び推論技術を適用して、オントロジーの明示的に表された知識から内部的な推論過程を経て推論された結果(例えば、特定の分野の研究専門家や研究者ネットワーク)を分析して提示するが、このような分析結果がどのような根拠に基づいて得られたかを説明することはできない。検索結果をみてそれが適合なものであるかどうかを直ちに判断できる一般的な検索情報とは異なり、推論サービスでは、そのサービス結果を見るだけでその結果が正しいものであるかどうかを直ちに判断することが不可能である。
これにより、ユーザーは、セマンティックウェブに基づく推論サービスの信頼性に疑問を抱き、当該サービスのユーザー満足度を低下させる原因となっている。
このため、トリプルの削除に際しても、全般的な推論を行い直すことなく漸増的に推論可能にし、ユーザーが希望する場合に、推論結果に対する根拠(推論検証)を提示可能にするトリプルの格納技術が望まれる。
明示的なトリプル及び推論されたトリプルを物理的に格納する方式は、図1に示すように、概ね3種類に分けられる。垂直設計方式では、全てのトリプルを一つの格納単位(例えば、DBMSのテーブル)に格納するが、設計が簡単であるためトリプルの規模が小さな時には有利であるものの、規模が大きくなるにつれて一つの格納単位に対する集中度が高くなって効率が低下する。これに対し、水平設計方式では、各トリプルを述語(property)とクラス(class)別に分散して格納し、トリプルの規模が大きな場合に、分散効果によるメリットを有する。混合設計は、垂直設計と水平設計との中間に相当する方式である。しかしながら、この設計だけでは、漸増的な推論及び推論検証を効率よく支援することができないため、別途の格納技術が望まれる。
本発明は前記のような問題点に鑑みてなされたものであって、本発明の目的は、セマンティックウェブ技術に基づく漸増的な推論及び推論サービスに対する根拠説明(すなわち、推論検証)を支援するためのセマンティックウェブに基づくトリプルの格納方法を提供することを目的とする。
本発明の他の目的は、上記の方法に適した推論依存性索引装置を提供することにある。
本発明のさらに他の目的は、上記の方法に適したトリプルの格納装置を提供することにある。
本発明のさらに他の目的は、上記のトリプルの格納装置を用いた推論依存性検証方法を提供することにある。
前記の目的を実現するために、本発明は、推論に関わるトリプル及び推論規則のそれぞれに通し番号を付して格納し、前記トリプル及び推論規則を適用して推論されたトリプルに対して、そこに適用されたトリプル及び推論規則の通し番号を用いて索引して格納しておき、ユーザーからの要請があるときに推論の根拠として提示することにより、推論の信頼性を向上させることを特徴とする。
また、任意の事実の削除に際して、削除された事実に依存する推論された事実を追跡しつつ削除することにより、漸増的な推論の効率を向上させることを特徴とする。
本発明に係るトリプルの格納方法は、推論された事実に対して適用された事実及び推論規則の通し番号を用いて索引して格納しておき、ユーザーの要請があるときに推論の根拠として提示することにより推論の信頼性を向上させることができ、且つ、任意の事実の削除に際し、削除された事実に依存する推論された事実を追跡しつつ削除することにより、漸増的な推論の効率を向上させることができるという効果を奏する。
トリプル格納先の例示図。 本発明に係る推論依存性索引装置のブロック図。 図2のトリプル及び規則通し番号割当部の実行結果を示す例示図。 図2の推論依存性索引部の実行結果を示す例示図。 図2のトリプルビュー生成部の実行結果を示す例示図。 本発明に係るトリプルの格納方法のフローチャート。 本発明に係る推論依存性索引装置において推論検証を行う方法のフローチャート。 本発明に係る推論依存性索引装置においてトリプル削除時の漸増的な推論を行う方法のフローチャート。
上記の目的を達成するための本発明に係るトリプルの格納方法は、トリプルに推論規則を適用して他のトリプルを生成する推論方法に関わるトリプル納方法において、(a)推論に関わるトリプル及び推論規則のそれぞれに通し番号を付して、複数のトリプルテーブル及び推論規則テーブルにそれぞれ格納する過程と、(b)前記トリプル及び推論規則を適用して推論されたトリプルに対して、推論に関わるトリプル及び推論規則の依存性を通し番号を用いて推論依存性索引テーブルを生成する過程と、(c)物理的に複数のトリプル格納単位に分散されて格納されるトリプルに、まるで仮想の一つの格納単位であるかのようにアクセス可能にするトリプルビューを生成する過程と、を含み、前記推論依存性索引テーブルを生成する過程は、推論されたトリプルの通し番号を索引のキーとし、且つ、推論に用いられた推論規則の通し番号及び推論に用いられたトリプルの通し番号を内容とする推論依存性逆索引テーブルと、推論に用いられたトリプルの通し番号を索引のキーとし、且つ、推論されたトリプルの通し番号を内容とする推論依存性順索引テーブルと、を生成することを特徴とする
前記トリプルの格納方法は、(d)トリプルの削除に際して、前記推論依存性順索引テーブル、推論依存性逆索引テーブル、及び前記トリプルビューを用いて漸増的な推論を行う過程をさらに含むことを特徴とする。
ここで、前記(d)トリプルの削除に際して漸増的な推論を行う過程は、削除を要求されたトリプルをトリプルテーブルから削除する過程と、削除を要求されたトリプルの通し番号を有する索引内容を前記推論依存性順索引テーブルから検索し、削除を要求されたトリプルに依存して推論されたトリプルの通し番号を取り出した後、検索された索引内容を前記推論依存性順索引テーブルから削除する過程と、削除を要求されたトリプルに依存して推論されたトリプルの通し番号を有する索引内容を前記推論依存性逆索引テーブルから検索し、検索された索引内容のうち、削除されたトリプルの通し番号が含まれている索引内容を前記推論依存性逆索引テーブルから削除する過程と、前記検索された索引内容のうち、削除されたトリプルの通し番号が含まれていない索引内容がなければ、削除を要求されたトリプルに依存して推論されたトリプルを前記トリプルテーブルから削除する過程と、を含むことを特徴とする。
上記の他の目的を達成するための本発明に係る推論依存性索引装置は、トリプル及び推論規則に通し番号を付して、複数のトリプルテーブル及び推論規則テーブルに格納するトリプル及び規則通し番号割当部と、明示的に存在するトリプルに推論規則を適用して新たなトリプルを誘導する推論実行部と、推論検証及び漸増的な推論を支援するために、推論に用いられたトリプルと、推論規則と、推論によって新たに推論されたトリプルとの間の依存関係を索引して格納する推論依存性テーブル生成部と、前記複数のトリプルテーブルに物理的に分散して格納されたトリプルに、まるで仮想の一つの格納単位に格納されたかのようにアクセス可能にするトリプルビューを生成するトリプルビュー生成部と、を備え、前記推論依存性テーブル生成部は、推論されたトリプルの通し番号を索引のキーとし、且つ、推論に用いられた推論規則の通し番号及び推論に用いられたトリプルの通し番号を内容とする推論依存性逆索引テーブルと、推論に用いられたトリプルの通し番号を索引のキーとし、且つ、推論されたトリプルの通し番号を内容とする推論依存性順索引テーブルと、を生成することを特徴とする
また、前記推論依存性テーブル生成部は、トリプルの削除要求に応じて、削除を要求されたトリプルを前記トリプルテーブルから削除し、削除を要求されたトリプルの通し番号を有する索引内容を前記推論依存性順索引テーブルから検索し、削除を要求されたトリプルに依存して推論されたトリプルの通し番号を取り出した後、検索された索引内容を前記推論依存性順索引テーブルから削除し、削除を要求されたトリプルに依存して推論されたトリプルの通し番号を有する索引内容を前記推論依存性逆索引テーブルから検索し、検索された索引内容のうち、削除されたトリプルの通し番号が含まれている索引内容を前記推論依存性逆索引テーブルから削除し、且つ、前記検索された索引内容のうち、削除されたトリプルの通し番号が含まれていない索引内容がなければ、削除を要求されたトリプルに依存して推論されたトリプルを前記トリプルテーブルから削除することを特徴とする。
上記のさらに他の目的を達成するための本発明に係るトリプルの格納装置は、トリプルに推論規則を適用して他のトリプルを生成する推論装置に関わるトリプル納装置において、それぞれに通し番号が付されたトリプルを格納する複数のトリプルテーブルと、それぞれに通し番号が付された推論規則を格納する推論規則テーブルと、トリプル及び推論規則を適用して推論された他のトリプルに対して、そこに適用されたトリプル及び推論規則の通し番号を用いて索引された結果を格納する推論依存性逆索引テーブル及び推論依存性順索引テーブルと、前記複数のトリプルテーブルに物理的に分散して格納されるトリプルに、まるで仮想の一つの格納単位であるかのようにアクセス可能にするトリプルビューと、を備えることを特徴とする
上記のさらに他の目的を達成するための本発明に係る推論依存性検証方法は、それぞれに通し番号が付されたトリプルを格納する複数のトリプルテーブルと、それぞれに通し番号が付された推論規則を格納する推論規則テーブルと、トリプル及び推論規則を適用して推論された他のトリプルに対して、そこに適用されたトリプル及び推論規則の通し番号を用いて索引された結果を格納する推論依存性索引テーブルと、前記複数のトリプルテーブルに物理的に分散されて格納されるトリプルに、まるで仮想の一つの格納単位であるかのようにアクセス可能にするトリプルビューと、を備えるトリプルの格納装置から推論されたトリプルについての推論検証を提供する方法において、推論検証を要求された推論されたトリプルに対する通し番号を取得する過程と、前記推論されたトリプルの通し番号を前記推論依存性索引テーブルから検索して、依存関係にある推論規則の通し番号及びトリプルの通し番号を取得する過程と、前記推論規則テーブルから前記推論規則の通し番号に見合う推論規則情報を取得し、前記トリプルビューからトリプルの通し番号に関するトリプル情報を取得する過程と、前記取得された推論規則情報及びトリプル情報を推論の根拠として提示する過程と、を含むことを特徴とする
ここで、前記推論依存性検証方法は、前記トリプルテーブルに記録されたトリプルの削除要求に応じて、削除を要求されたトリプルを前記トリプルテーブルから削除し、削除を要求されたトリプルの通し番号に関わる索引内容を前記推論依存性索引テーブルから削除し、且つ、削除を要求されたトリプルによってしか推論されないトリプルを前記トリプルテーブルから削除する過程をさらに含むことを特徴とする。
以下、添付図面に基づき、本発明の構成及び動作を詳述する。
トリプル(事実)は、一般に、図1に示す3種類の類型の一つで格納される。特に、大容量のオントロジーを対象として実用性の富む推論を支援するためには、図1の水平設計若しくは混合設計の方式が主として用いられ、且つ、実用性を考慮して、オントロジーに明示的に存在するトリプルだけではなく、前方推論によって推論されたトリプルまでプル格納先に格納する。しかしながら、このような格納構造だけでは、推論検証及び漸増的な推論を支援することができない。
推論とは、既存の[トリプル]に[推論規則]を適用して新たな(推論された)[トリプル]を得る過程をいう。本発明は、推論検証及び漸増的な推論を支援するためのトリプル格納先の機能を果たし、推論によって得られる推論された[トリプル]と、推論に用いられた既存の[トリプル]及び[推論規則]間の依存関係を索引して格納する。
図2は、本発明に係る推論依存性索引装置の構成を示す図である。図2を参照すると、推論依存性索引装置は、トリプル及び規則通し番号割当部100と、推論実行部200と、推論依存性索引部300と、トリプルビュー生成部400と、を備えている。
トリプル及び規則通し番号割当部100は、それぞれのトリプル及び推論規則に通し番号を付して格納する。図1に示す水平設計若しくは混合設計の方式のトリプル格納構造においては、それぞれのトリプルが類型別に分散されて格納されるが、通し番号は、各格納単位(テーブル)内における通し番号ではなく、全体のトリプル内における通し番号として割り当てる必要がある。すなわち、図3の4つのトリプルテーブル、すなわち、pテーブル102、qテーブル104、rテーブル106、sテーブル108の各IDカラムに全体のトリプルにおける通し番号が割り当てられていることを示している。なお、図3の推論規則テーブル(rule)109は、各推論規則にも推論規則内における通し番号が割り当てられていることを示している。各トリプルテーブルのFlagカラムは、当該トリプルが推論によって得られたトリプルであるか否かを表示するためのものであり、トリプルが推論によって得られたものであれば、T(真)と表示され、そうでなければ、F(偽)と表示される。
推論実行部200は、明示的に存在するトリプルに推論規則を適用して新たなトリプルを誘導する。推論されたトリプルもまた再帰的に推論規則に適用できる。
図3において、次の関係が成り立っていることが分かる。
1)[トリプル4]<==[トリプル1]+[トリプル3]+[規則1]
2)[トリプル7]<==[トリプル2]+[トリプル4]+[規則2]
3)[トリプル7]<==[トリプル5]+[トリプル6]+[規則3]
ここで、矢印(<==)の左側は、推論されたトリプル(推論の結果)であり、右側は、推論の結果に関する根拠情報であるトリプル及び推論規則である。図3の実線矢印は、各推論規則に適用(入力)されたトリプルであり、点線矢印は、推論規則が適用された結果として得られる新たなトリプル、すなわち、推論されたトリプルである。
図3から明らかなように、推論されたトリプル(例えば、[トリプル4])は、他の推論(例えば、[規則2]に適用される)のために使用できる。また、一つのトリプルは、複数の推論規則に適用でき、異なる推論規則によって同じ推論されたトリプルが得られることもある(例えば、[トリプル7]は、[規則2]及び[規則3]のそれぞれによって得られる)。
[トリプル]は、別名として事実(fact)とも呼ばれ、<主語、述語、目的語>によって構成される。[推論規則]は、[結論部]<==[条件部]により構成されるが、[条件部]は、一つ以上の[トリプルパターン]によって構成され、[結論部]は、一つの[トリプルパターン]によって構成される。[トリプルパターン]は、トリプルと同様に、<主語、述語、目的語>によって構成されるが、主語、述語、目的語のそれぞれが定数ではなく、変数であってもよい。ここで、[推論規則]の意味は、事実が[条件部]のトリプルパターンに適用できるとき、[結論部]に相当するトリプルが新たな事実として誘導(推論)できることを示す。
推論依存性索引部300は、推論検証及び漸増的な推論を支援するために、推論に用いられたトリプルと、推論規則と、推論によって新たに推論されたトリプルとの間の依存関係を索引して格納する。
図4は、図3のトリプル及び推論規則を用いて生成した推論依存性索引テーブルの例示図である。推論依存性索引テーブルは、2種類に分けられるが、先ず、推論検証のためには推論された結果トリプルがどのような根拠トリプル及び推論規則から誘導されたかを容易に検索できるように推論依存性逆索引テーブル(Backward Dependency Indexing table)301を生成する。
すなわち、推論されたトリプルID(InferredTripleID)を索引のキーとし、且つ、この推論に用いられた推論規則ID(RuleID)とそれぞれのトリプルIDである(TripleID1、TripleID2,...,TripleIDn)を内容として索引し且つ格納する。換言すると、推論されたトリプル番号別にこの推論に用いられた規則番号とトリプル番号を直ちに得られる構造で格納する。これは、通常の情報検索において検索語が現れる文書を速やかに探し出すように、検索語別にその検索語が現れた文書番号を索引する構造とほとんど同じである。
次いで、トリプル削除時の漸増的な推論のためには、削除されたトリプルからどのようなトリプルが推論されたかを容易に検索できるように推論依存性順索引テーブル(Forward Dependency Indexing table)303を生成する。すなわち、推論に用いられたトリプルID(TripleID)を索引のキーとし、且つ、この推論によって生成されたトリプルID(InferredTripleID)を内容として索引し且つ格納する。
図3のトリプル及び推論規則を用いて生成した図4の推論依存性索引テーブルを例にとって説明すると、[トリプル1]と[トリプル3]を[規則1]に適用して[トリプル4]が推論されたことは推論依存性逆索引テーブル301の1行目に表され、また、推論依存性順索引テーブル303の1行目及び3行目に表される。
図4の推論依存性逆索引テーブル301は、一つの推論規則に用いられるトリプルが2つ以下であることを想定して、TripleID1及びTripleID2といった2つのカラムによって表現したが、n個以下のトリプルが適用できる場合に、(TripleID1,TripleID2,...,TripleIDn)のように拡張できる。
トリプルビュー生成部400は、複数の格納単位(テーブル)に物理的に分散して格納されたトリプルに、まるで仮想の一つの格納単位に格納されたかのようにアクセスできるように全トリプルに対するビュー(例えば、DBMSのビュー)を生成する。
図1の水平設計及び混合設計の場合のように、トリプルが複数の格納単位(テーブル)に分散して格納される場合、トリプルIDが与えられるとき、このトリプルについての実際の内容(<主語、述語、目的語>)を知るためには、どのような格納単位(テーブル)に格納されたかを知っている必要があるが、トリプルビューを用いると、どのような格納単位(テーブル)であるかによらずアクセスできることとなる。
図5は、図3のトリプル格納単位(テーブル)に対するトリプルビューを生成した例を示す図である。すなわち、triple_view410は、4つのトリプル格納単位(テーブル)のpテーブル402、qテーブル404、rテーブル406、sテーブル408に、まるで一つの物理的な格納単位(テーブル)であるかのようにアクセス可能にした仮想の格納単位(テーブル)であるトリプルビュー(例えば、DBMSのview)である。このトリプルビューは、全てのトリプルにアクセスできるように、主語Subject、述語Predicate、目的語Objectのカラムのいずれをも有する。
pテーブル402は、トリプル格納単位(テーブル)の名前が述語Predicateに相当するため、トリプルビューを介してアクセスするときにはPredicateカラムの値は格納単位(テーブル)の名前であるpとして指定される。これと同様に、qテーブル404にトリプルビューを介してアクセスするときには、Predicateカラムの値は、格納単位(テーブル)の名前であるqとして指定される。rテーブル406及びsテーブル408は、各クラスのインスタンスを格納するためのものであり、格納単位(テーブル)の名前がクラスの名前であって、目的語Objectに相当し、述語Predicateはrdf:typeであるため、rテーブル406にトリプルビューを介してアクセスするときには、Predicateカラムの値はrdf:typeとして指定され、Objectカラムの値は格納単位(テーブル)の名前であるrとして指定され、sテーブル408にトリプルビューを介してアクセスするときには、Predicateカラムの値はrdf:typeとして指定され、Objectカラムの値は格納単位(テーブル)の名前であるsとして指定される。
推論検証は、推論された[トリプル(事実)]に対する根拠を提供するものであり、トリプル削除時の漸増的な推論とは、削除されたトリプルによって推論されたトリプルを再帰的に追跡しつつ削除することを意味する。本発明においては、推論検証及び削除時の漸増的な推論のために推論された[トリプル]と、推論に用いられた[トリプル]及び[推論規則]間の依存関係を索引する方法を提示する。
図6は、本発明に係るトリプルの格納方法のフローチャートである。図6を参照すると、推論依存性の索引のために、先ず、全トリプルのそれぞれにユニークな通し番号IDを付し(S501)、推論規則のそれぞれにもユニークな通し番号IDを付する(S503)。トリプルが類型別に分散されて格納される場合にも、ユニークな通し番号を全トリプルを対象として付する。
次いで、各推論規則をトリプルに適用して新たなトリプルを推論する推論過程を行う(S505)。ここで得られる推論されたトリプルに対してもトリプルの通し番号IDを付する。
次いで、推論に用いられたトリプルと、推論規則と、推論によって得られたトリプルとの間の依存関係を索引する(S507)。この索引過程は、2つに大別できるが、一つは、推論されたトリプルの通し番号(InferredTripleID)を索引のキーとし、且つ、推論に用いられた推論規則の通し番号(RuleID)と推論に用いられたトリプルの通し番号(TripleID1,TripleID2,...,TripleIDn)を内容とする推論依存性逆索引(Backward Dependency Indexing)であり、もう一つは、推論に用いられたトリプルの通し番号(TripleID)を索引のキーとし、且つ、推論されたトリプルの通し番号(InferredTripleID)を内容とする推論依存性順索引(Forward Dependency Indexing)である。
最後に、トリプルが類型別に複数の格納単位(テーブル)に分散されて格納された場合に、全トリプルに、格納単位(テーブル)の区分によらずアクセス可能にする仮想のトリプルビュー(例えば、DBMSview)を生成する(S509)。
推論依存性逆索引と、推論依存性順索引及びトリプルビューを用いて、推論検証と、トリプル削除時の漸増的な推論を行う方法を、それぞれ図7及び図8に示す。
図7を参照すると、ユーザーが推論検証を要求する推論されたトリプルが与えられると、先ず、このトリプルに対する通し番号を取得する(S601)。次いで、この通し番号を推論依存性逆索引から検索して、依存関係にある推論規則番号及びトリプル番号を取得する(S603)。
次いで、推論規則テーブルから推論規則情報を取得し(S605)、トリプルビューtriple_viewからは各トリプル番号に関するトリプル情報(主語、述語、目的語、Flag)を取得する(S607)。このとき各トリプル情報に対してFlagの値がT(真)であれば(S609)、このトリプルもまた他の推論規則とトリプルによって推論されたものであるため、推論依存性逆索引を検索する過程(S603)に戻る。Flagの値がT(真)ではなければ、先に得られた推論規則情報及びトリプル情報を推論の根拠としてユーザーに提示する(S611)。
図4の場合を例にとって説明すると、[トリプル7]の推論根拠として、[規則2]と、[トリプル2]と、[トリプル4]を提示することができるが、[トリプル4]もまた推論された事実であるため、これに対する推論根拠も提示する必要がある。完全な推論検証のためには、純粋な事実とこれらに適用された推論規則を根拠として提示することが求められるが、図4の推論依存性逆索引テーブル301を用いると、推論依存性を再帰的に探索することにより、純粋な事実と推論規則を得ることが可能である。すなわち、[トリプル7]に関する根拠情報は、[規則2]+[トリプル2]+([規則1]+[トリプル1]+[トリプル3])となる。
一つの推論された[トリプル]は、2以上の(トリプル+推論規則)組から得られる。図4の場合を例にとって説明すると、推論依存性逆索引テーブル301には、[トリプル7]が推論されたトリプル番号として2回(それぞれ2行目と3行目)に亘って現れる。
このように、推論依存性逆索引テーブル301は、一つの推論されたトリプル番号が2回以上索引でき、推論検証のための推論依存性逆索引テーブル301を探索するとき(S603)、多重の探索結果を得ることができる。すなわち、[トリプル7]に関する根拠情報として、上記に例示した[規則2]+[トリプル2]+([規則1]+[トリプル1]+[トリプル3])とともに、[規則3]+[トリプル5]+[トリプル6]も提示される。
トリプル削除時の漸増的な推論を行う方法について説明すると、図8を参照して、削除されるべきトリプルが与えられるとき、先ず、このトリプルに対する通し番号を取り出した後、このトリプルをトリプル格納先から削除する(S701)。
次いで、この通し番号を推論依存性順索引から検索して、削除されたトリプルに依存して推論されたトリプルの通し番号を全て取り出した後、推論依存性順索引から削除する(S703)。それぞれの推論されたトリプル通し番号を、今回は推論依存性逆索引から検索して、この推論されたトリプルが依存しているトリプルの通し番号を取り出した後、削除されたトリプルの通し番号が含まれている検索結果に対して推論依存性逆索引から削除する(S705)。
もし、検索結果のうち、未削除のもの(すなわち、削除されたトリプルに依存せずに推論された場合)が存在しなければ(S707)、推論されたトリプルは削除されたトリプルによってしか推論されず、このトリプルの削除によってそれ以上有効でなくなるため、この推論されたトリプルもまた削除すべきトリプルとして設定し、トリプルビューtriple_viewを介してこの推論されたトリプル番号に相当するトリプルをトリプル格納先から削除(S709)し、推論依存性順索引を検索する過程(S703)に戻る。
もし、検索結果のうち、未削除のものが存在すれば(S707)、この推論されたトリプルは、他のトリプルによってしか推論できないため依然として有効であり、削除されない。
以下、これを図3及び図4に基づいて説明する。
先ず、通し番号「1」を有するトリプルを削除する場合について説明する。通し番号「1」を有するトリプルの削除要求に応じて、先ず、pテーブル102から1行目が削除される。
次いで、推論依存性順索引から通し番号「1」をキーとして検索し、検索された索引内容(ここで、行(raw))を削除する。その結果、図4に示す推論依存性順索引から1行目が削除される。このとき、削除を要求されたトリプルに依存して推論されたトリプルの通し番号「4」が得られる。
次いで、推論されたトリプルの通し番号「4」をキーとし、且つ、推論依存性逆索引を検索して、検索結果のうち削除を要求されたトリプルを有する索引内容が削除される。その結果、図4に示す推論依存性逆索引から1行目が削除される。
一方で、推論依存性逆索引から削除を要求されたトリプル「1」が含まれていない他の行がないため、推論されたトリプル「4」は、削除を要求されたトリプル「1」によってしか推論されない。これにより、削除を要求されたトリプル「1」が削除され、自動的にそれによってしか推論されないトリプル「4」も削除される。
次いで、通し番号「2」を有するトリプルを削除する場合について説明する。通し番号「2」を有するトリプルの削除要求に応じて、先ず、qテーブル104から1行目が削除される。
次いで、推論依存性順索引から削除を要求されたトリプルの通し番号「2」をキーとして検索し、検索された索引内容を削除する。その結果、図4に示す推論依存性順索引から2行目が削除される。このとき、削除を要求されたトリプル「2」に依存して推論されたトリプルの通し番号「7」が得られる。
次いで、推論されたトリプルの通し番号「7」をキーとし、且つ、推論依存性逆索引を検索して、検索結果のうち削除を要求されたトリプル「2」を有する索引内容が削除される。その結果、図4に示す推論依存性逆索引から2行目が削除される。
一方で、推論依存性逆索引から削除を要求されたトリプル「2」を含んでいない他の索引内容(3行目)があるため、推論されたトリプル「7」は、削除を要求されたトリプル「2」に加えて、他のトリプルによっても推論可能なものとなる。これにより、削除を要求されたトリプル「2」が削除されても、トリプル「2」によって推論されたトリプル「7」は削除されてはならない。
100…トリプル及び規則通し番号割当部、
200…推論実行部、
300…推論依存性索引部、
400…トリプルビュー生成部、

Claims (8)

  1. トリプルに推論規則を適用して他のトリプルを生成する推論方法に関わるトリプル納方法において、
    (a)推論に関わるトリプル及び推論規則のそれぞれに通し番号を付して、複数のトリプルテーブル及び推論規則テーブルにそれぞれ格納する過程と、
    (b)前記トリプル及び推論規則を適用して推論されたトリプルに対して、推論に関わるトリプル及び推論規則の依存性を通し番号を用いて推論依存性索引テーブルを生成する過程と、
    (c)物理的に複数のトリプル格納単位に分散されて格納されるトリプルに、まるで仮想の一つの格納単位であるかのようにアクセス可能にするトリプルビューを生成する過程と、
    を含み
    前記推論依存性索引テーブルを生成する過程は、
    推論されたトリプルの通し番号を索引のキーとし、且つ、推論に用いられた推論規則の通し番号及び推論に用いられたトリプルの通し番号を内容とする推論依存性逆索引テーブルと、
    推論に用いられたトリプルの通し番号を索引のキーとし、且つ、推論されたトリプルの通し番号を内容とする推論依存性順索引テーブルと、
    を生成することを特徴とするトリプルの格納方法。
  2. (d)トリプルの削除に際して、前記推論依存性順索引テーブル、推論依存性逆索引テーブル、及び前記トリプルビューを用いて漸増的な推論を行う過程をさらに含むことを特徴とする請求項に記載のトリプルの格納方法。
  3. 前記(d)トリプルの削除に際して漸増的な推論を行う過程は、
    削除を要求されたトリプルをトリプルテーブルから削除する過程と、
    削除を要求されたトリプルの通し番号を有する索引内容を前記推論依存性順索引テーブルから検索し、削除を要求されたトリプルに依存して推論されたトリプルの通し番号を取り出した後、検索された索引内容を前記推論依存性順索引テーブルから削除する過程と、
    削除を要求されたトリプルに依存して推論されたトリプルの通し番号を有する索引内容を前記推論依存性逆索引テーブルから検索し、検索された索引内容のうち、削除されたトリプルの通し番号が含まれている索引内容を前記推論依存性逆索引テーブルから削除する過程と、
    前記検索された索引内容のうち、削除されたトリプルの通し番号が含まれていない索引内容がなければ、削除を要求されたトリプルに依存して推論されたトリプルを前記トリプルテーブルから削除する過程と、
    を含むことを特徴とする請求項に記載のトリプルの格納方法。
  4. トリプル及び推論規則に通し番号を付して、複数のトリプルテーブル及び推論規則テーブルに格納するトリプル及び規則通し番号割当部と、
    明示的に存在するトリプルに推論規則を適用して新たなトリプルを誘導する推論実行部と、推論検証及び漸増的な推論を支援するために、推論に用いられたトリプルと、推論規則と、推論によって新たに推論されたトリプルとの間の依存関係を索引して格納する推論依存性テーブル生成部と、
    前記複数のトリプルテーブルに物理的に分散して格納されたトリプルに、まるで仮想の一つの格納単位に格納されたかのようにアクセス可能にするトリプルビューを生成するトリプルビュー生成部と、
    を備え
    前記推論依存性テーブル生成部は、
    推論されたトリプルの通し番号を索引のキーとし、且つ、推論に用いられた推論規則の通し番号及び推論に用いられたトリプルの通し番号を内容とする推論依存性逆索引テーブルと、
    推論に用いられたトリプルの通し番号を索引のキーとし、且つ、推論されたトリプルの通し番号を内容とする推論依存性順索引テーブルと、
    を生成することを特徴とする推論依存性索引装置。
  5. 前記推論依存性テーブル生成部は、トリプルの削除要求に応じて、
    削除を要求されたトリプルを前記トリプルテーブルから削除し、
    削除を要求されたトリプルの通し番号を有する索引内容を前記推論依存性順索引テーブルから検索し、削除を要求されたトリプルに依存して推論されたトリプルの通し番号を取り出した後、検索された索引内容を前記推論依存性順索引テーブルから削除し、
    削除を要求されたトリプルに依存して推論されたトリプルの通し番号を有する索引内容を前記推論依存性逆索引テーブルから検索し、検索された索引内容のうち、削除されたトリプルの通し番号が含まれている索引内容を前記推論依存性逆索引テーブルから削除し、且つ、
    前記検索された索引内容のうち、削除されたトリプルの通し番号が含まれていない索引内容がなければ、削除を要求されたトリプルに依存して推論されたトリプルを前記トリプルテーブルから削除することを特徴とする請求項4に記載の推論依存性索引装置。
  6. トリプルに推論規則を適用して他のトリプルを生成する推論装置に関わるトリプル納装置において、
    それぞれに通し番号が付されたトリプルを格納する複数のトリプルテーブルと、
    それぞれに通し番号が付された推論規則を格納する推論規則テーブルと、
    トリプル及び推論規則を適用して推論された他のトリプルに対して、そこに適用されたトリプル及び推論規則の通し番号を用いて索引された結果を格納する推論依存性逆索引テーブル及び推論依存性順索引テーブルと、
    前記複数のトリプルテーブルに物理的に分散して格納されるトリプルに、まるで仮想の一つの格納単位であるかのようにアクセス可能にするトリプルビューと、
    を備えるトリプルの格納装置。
  7. それぞれに通し番号が付されたトリプルを格納する複数のトリプルテーブルと、それぞれに通し番号が付された推論規則を格納する推論規則テーブルと、トリプル及び推論規則を適用して推論された他のトリプルに対して、そこに適用されたトリプル及び推論規則の通し番号を用いて索引された結果を格納する推論依存性索引テーブルと、前記複数のトリプルテーブルに物理的に分散されて格納されるトリプルに、まるで仮想の一つの格納単位であるかのようにアクセス可能にするトリプルビューと、を備えるトリプルの格納装置から推論されたトリプルについての推論検証を提供する方法において、
    推論検証を要求された推論されたトリプルに対する通し番号を取得する過程と、
    前記推論されたトリプルの通し番号を前記推論依存性索引テーブルから検索して、依存関係にある推論規則の通し番号及びトリプルの通し番号を取得する過程と、
    前記推論規則テーブルから前記推論規則の通し番号に見合う推論規則情報を取得し、前記トリプルビューからトリプルの通し番号に関するトリプル情報を取得する過程と、
    前記取得された推論規則情報及びトリプル情報を推論の根拠として提示する過程と、
    を含む推論依存性検証方法。
  8. 前記トリプルテーブルに記録されたトリプルの削除要求に応じて、
    削除を要求されたトリプルを前記トリプルテーブルから削除し、
    削除を要求されたトリプルの通し番号に関わる索引内容を前記推論依存性索引テーブルから削除し、且つ、
    削除を要求されたトリプルによってしか推論されないトリプルを前記トリプルテーブルから削除する、
    過程をさらに含むことを特徴とする請求項に記載の推論依存性検証方法。
JP2012541933A 2010-11-02 2010-11-04 推論検証及び漸増的な推論のためのトリプルの格納方法及び装置、並びにこれらに適した推論依存性索引装置 Expired - Fee Related JP5352935B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
KR10-2010-0108381 2010-11-02
KR1020100108381A KR101133993B1 (ko) 2010-11-02 2010-11-02 추론 검증 및 점증적 추론을 위한 트리플 저장 방법 및 장치 그리고 이에 적합한 추론 의존성 색인 방법 및 장치
PCT/KR2010/007769 WO2012060490A1 (ko) 2010-11-02 2010-11-04 추론 검증 및 점증적 추론을 위한 트리플 저장 방법 및 장치 그리고 이에 적합한 추론 의존성 색인 방법 및 장치

Publications (2)

Publication Number Publication Date
JP2013511788A JP2013511788A (ja) 2013-04-04
JP5352935B2 true JP5352935B2 (ja) 2013-11-27

Family

ID=46024598

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012541933A Expired - Fee Related JP5352935B2 (ja) 2010-11-02 2010-11-04 推論検証及び漸増的な推論のためのトリプルの格納方法及び装置、並びにこれらに適した推論依存性索引装置

Country Status (4)

Country Link
US (1) US8688612B2 (ja)
JP (1) JP5352935B2 (ja)
KR (1) KR101133993B1 (ja)
WO (1) WO2012060490A1 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6636631B2 (ja) * 2015-10-30 2020-01-29 コンヴィーダ ワイヤレス, エルエルシー セマンティックiotのためのrestful動作
JP6721036B2 (ja) * 2016-03-15 2020-07-08 日本電気株式会社 推論システム、推論方法、及び、プログラム
KR20180058981A (ko) * 2016-11-25 2018-06-04 (주) 다이퀘스트 시맨틱 웹 기반의 스키마 정합성과 인스턴스 유효성 검증 방법 및 장치
WO2020039871A1 (ja) * 2018-08-23 2020-02-27 国立研究開発法人物質・材料研究機構 探索システムおよび探索方法
US11468342B2 (en) * 2018-09-14 2022-10-11 Jpmorgan Chase Bank, N.A. Systems and methods for generating and using knowledge graphs
US10482384B1 (en) 2018-11-16 2019-11-19 Babylon Partners Limited System for extracting semantic triples for building a knowledge base
US20210073655A1 (en) * 2019-09-11 2021-03-11 Sap Se Rule mining for rule and logic statement development

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8719250B2 (en) * 2005-04-18 2014-05-06 Oracle International Corporation Integrating RDF data into a relational database system
JP5056384B2 (ja) 2006-12-21 2012-10-24 富士通株式会社 検索プログラム、方法及び装置
EP1973053A1 (en) * 2007-03-19 2008-09-24 British Telecommunications Public Limited Company Multiple user access to data triples
US20080288442A1 (en) * 2007-05-14 2008-11-20 International Business Machines Corporation Ontology Based Text Indexing
US8401991B2 (en) * 2008-08-08 2013-03-19 Oracle International Corporation Database-based inference engine for RDFS/OWL constructs
US8078646B2 (en) * 2008-08-08 2011-12-13 Oracle International Corporation Representing and manipulating RDF data in a relational database management system
KR101010131B1 (ko) * 2008-10-09 2011-01-24 주식회사 케이티 시맨틱 색인 처리 장치 및 그 방법과 이를 이용한 대용량 시맨틱 레파지토리 시스템
KR100993288B1 (ko) * 2008-12-15 2010-11-09 한국과학기술정보연구원 Dbms 기반의 rdf 트리플 저장부에서의 뷰를 이용한 효율적인 추론 시스템 및 방법
EP2377041A4 (en) * 2008-12-15 2012-08-22 Korea Inst Sci & Tech HYBRID REASONING SYSTEM AND METHOD BASED ON MEMORY AND DBMS
US8250106B2 (en) * 2009-11-18 2012-08-21 Oracle International Corporation Incremental inference

Also Published As

Publication number Publication date
KR101133993B1 (ko) 2012-04-09
US20130212057A1 (en) 2013-08-15
JP2013511788A (ja) 2013-04-04
WO2012060490A1 (ko) 2012-05-10
US8688612B2 (en) 2014-04-01

Similar Documents

Publication Publication Date Title
JP5352935B2 (ja) 推論検証及び漸増的な推論のためのトリプルの格納方法及び装置、並びにこれらに適した推論依存性索引装置
US20170154122A1 (en) Flexible Graph System for Accessing Organization Information
US20090083314A1 (en) Method of Manipulating Information Objects and of Accessing Such Objects in a Computer Environment
Lin et al. Exploring characteristics of social classification
JP2010033197A (ja) 公開された検索エンジンを用いた検索装置、検索方法及び検索プログラム
US9971828B2 (en) Document tagging and retrieval using per-subject dictionaries including subject-determining-power scores for entries
JP2000090103A5 (ja)
Schraefel et al. CS AKTive space: representing computer science in the semantic web
CN106960020A (zh) 一种创建索引表的方法及设备
KR20080096004A (ko) 웹로그의 시계열 분석을 위한 데이터 저장 및 조회 방법그리고 상기 방법을 수행하는 시스템
JP2010055173A (ja) 情報検索システム、情報検索方法、プログラムおよび記録媒体
Safar et al. OntoRefiner, a user query refinement interface usable for Semantic Web Portals.
KR100991560B1 (ko) 카테고리 별 키워드의 입력 순위를 제공하기 위한 검색서비스 시스템 및 그 방법
Dijkshoorn et al. Personalization in crowd-driven annotation for cultural heritage collections.
JP2013134755A (ja) 情報検索システム及び情報検索方法
KR20160027455A (ko) 대용량 rdf 데이터 관리 방법 및 장치
KR20100070084A (ko) 대용량 온톨로지에서 사용자 질의 관련 지식을 실시간으로 검색하기 위한 장치 및 그 방법
CN109002502B (zh) 基于spo数据的搜索方法、装置、设备和存储介质
JP5430436B2 (ja) 情報蓄積検索方法及び情報蓄積検索プログラム
Kaporis et al. ISB-tree: A new indexing scheme with efficient expected behaviour
Xuan et al. Open biomedical ontology-based Medline exploration
Myriam et al. User modeling-based spatial web personalization
JP2005056223A (ja) テキストデータ検索システム、その方法及びそのプログラム
Macêdo Alexandrino et al. A focused crawler for web feature service and web map service discovering
KR20110055144A (ko) 소셜 메타데이터 관리 시스템 및 방법

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130213

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130312

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130611

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130709

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130711

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130809

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees