JP7036760B2 - オントロジー拡張支援装置及びオントロジー拡張支援方法 - Google Patents

オントロジー拡張支援装置及びオントロジー拡張支援方法 Download PDF

Info

Publication number
JP7036760B2
JP7036760B2 JP2019046183A JP2019046183A JP7036760B2 JP 7036760 B2 JP7036760 B2 JP 7036760B2 JP 2019046183 A JP2019046183 A JP 2019046183A JP 2019046183 A JP2019046183 A JP 2019046183A JP 7036760 B2 JP7036760 B2 JP 7036760B2
Authority
JP
Japan
Prior art keywords
ontology
class
mapping
extension
support device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019046183A
Other languages
English (en)
Other versions
JP2020149343A (ja
Inventor
暖 山本
圭 北原
修一 石田
延之 太田
正純 廣野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2019046183A priority Critical patent/JP7036760B2/ja
Publication of JP2020149343A publication Critical patent/JP2020149343A/ja
Application granted granted Critical
Publication of JP7036760B2 publication Critical patent/JP7036760B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、オントロジーの拡張を支援する技術に関する。
データ提供者(例えばデータベース)とデータ利用者(例えばアプリケーション)が固定的な関係にはなく、多様なデータ提供者によって提供されるデータが、あらかじめ想定し得ない多様なデータ利用者によって利用される、流動的・横断的なデータ活用の場が増えつつある。
データ提供者によって提供されるデータは、その属性名(項目名)及び属性の構造に、提供者固有の表記又は構造を採用しているものが多い。流動的・横断的なデータ活用に際して、データ利用者はこうした提供者固有の属性名又は構造を統一するための作業、いわゆるデータ準備作業に多くの工数を割くことを強いられる。
データ準備作業の負担を軽減する策として、代表的な属性名及び属性の構造を標準オントロジーとして整備し、これをデータ提供者とデータ利用者で共通して参照することで解決する方法が提案されている。例えば、データ提供者によって提供されるデータを、標準オントロジーに含まれるクラス及びプロパティを用いて表現しなおすことで、データ利用者によるデータ理解が用意になるとともに、標準オントロジーを利用可能なツール等を用いることでデータ準備作業の自動化すら可能となり得る。以後、データ提供者に固有の属性名と、標準オントロジーに含まれるクラスやプロパティとの対応関係を「マッピング」と呼ぶ。
データ準備作業の効率化・自動化に有効なマッピングを定義するためには、マッピング定義に用いる標準オントロジーが十分に整備されていることが必要である。標準オントロジーの表現力が不足している場合には、標準オントロジーを拡張することで、より記述可能なデータを増やしていくことが求められる。
標準オントロジーを再利用して独自のオントロジーを構築する作業に関しては、ユーザの不可を軽減する支援装置が提案されている(例えば特許文献1参照)。
特開2009-70133号公報
従来の技術には、標準オントロジーを用いた独自オントロジーの構築を支援できるものの、新たなクラス及びプロパティを追加して標準オントロジーを拡張することはできないという問題がある。
本発明はこのような事情に鑑みてなされたものであり、現状の標準オントロジーではカバーできないデータ属性の内、データ利用者にとって需要が高いものを優先的にカバーするために、標準オントロジーに対して最小限の拡張を行うためのオントロジー拡張作業を支援する、オントロジー拡張支援装置を提供することを目的とする。
上記課題を解決する本発明のオントロジー拡張支援装置は、プロセッサと、前記プロセッサに接続される記憶装置と、を有し、前記記憶装置は、オントロジーと、マッピング実績とを保持し、前記オントロジーは、各プロパティが付随するクラスを定義する情報を含み、前記マッピング実績は、前記オントロジーに基づいて、対象のデータセットの各属性をいずれかの前記プロパティにマッピングした結果を含み、前記プロセッサは、前記マッピング実績に含まれるデータセットの属性がマッピングされたプロパティが付随するクラスの不整合を検出したかを判定し、前記クラスの不整合を検出した場合、前記不整合を解消するように新たなクラスを追加した前記オントロジーの拡張案を生成することを特徴とする。
本発明の一態様によれば、標準オントロジーに対して新たなクラスを追加して標準オントロジーを拡張する作業を支援することができる。前述した以外の課題、構成及び効果は、以下の実施例の説明によって明らかにされる。
本発明の実施形態に係るオントロジー拡張支援装置が使用されるシステム全体のネットワーク構成を示すブロック図である。 本発明の実施形態に係る各装置のハードウェア構成例を示すブロック図である。 本発明の実施形態に係るオントロジー拡張支援装置の構成例を示す機能ブロック図である。 本発明の実施形態に係るクラス定義テーブル及びプロパティ定義テーブルの一例を示した説明図である。 本発明の実施形態に係るマッピング対象テーブルの一例を示した説明図である。 本発明の実施形態に係るマッピング実績テーブルの一例を示した説明図である。 本発明の実施形態に係るオントロジー拡張支援装置及びその他の装置の処理手順例を示すシーケンス図である。 本発明の実施形態に係るオントロジー拡張処理の詳細理の一例を示すフローチャートである。 本発明の実施形態に係るオントロジー拡張確定部によって提示されるオントロジーの拡張案の一例を示す説明図である。 本発明の実施形態に係るマッピング修正部によって作成されたマッピングの修正結果の一例を示す説明図である。 本発明の実施形態において、プロパティに関する拡張も実施した場合のオントロジーの拡張案の一例を示す説明図である。
以下、図面を用いて本発明の実施の形態について説明する。なお、これによって本発明が限定されるものではない。
図1は、本発明の実施形態に係るオントロジー拡張支援装置が使用されるシステム全体のネットワーク構成を示すブロック図である。
図1に示すシステムは、オントロジー拡張支援装置10、オントロジー管理装置20、データ提供装置30、マッピング装置40、データ利用装置50、およびこれらの間のネットワーク60で主に構成されている。なお、本実施形態では説明を簡易化するため、データ提供装置30およびデータ利用装置50がそれぞれ3台ずつ存在するような構成を示しているが、各装置の台数はこれに限定されるものではない。
当該実施形態における各装置のハードウェア構成は以下の如くとなる。
図2は、本発明の実施形態に係る各装置のハードウェア構成例を示すブロック図である。
図2に示すように、各装置は一般的なコンピュータ900によって実現される。コンピュータ900は、制御装置であるCPU901と、メモリ902と、例えばハードディスク等で構成した記憶装置である外部記憶装置903と、ネットワーク60に接続するためのNIC(Network Interface Card)等の送受信装置904と、モニタ等の出力装置905と、キーボード及びマウス等の入力装置906と、CD?ROM又はDVD?ROM等の可搬性を有する記憶媒体908から情報を読み取る読取装置907とを含んで構成される。
そして、各装置が処理に用いる記憶部は、CPU901がメモリ902または外部記憶装置903を利用することによって実現可能となる。また、各装置における機能部は、CPU901が、外部記憶装置903に記憶されている所定のプログラム909をメモリ902にロードし実行することによって実装される。この所定のプログラム909は、読取装置907を介して記憶媒体908から取得されてもよいし、送受信装置904を介してネットワーク60から外部記憶装置903にダウンロードされ、メモリ902にロードされてCPU901によって実行されてもよい。あるいは、プログラム909は、読取装置907を介して記憶媒体908から、または、送受信装置904を介してネットワーク60から、メモリ902に直接ロードされ、CPU901によって実行されてもよい。
続いて、上述のオントロジー拡張支援装置10の構成について説明する。
オントロジー拡張支援装置10は、オントロジー管理装置20から標準オントロジーを受け取り、データ提供装置30からマッピング実績を受け取り、当該マッピング実績を解析することで標準オントロジーへの拡張案を生成する装置である。
図3は、本発明の実施形態に係るオントロジー拡張支援装置10の構成例を示す機能ブロック図である。
オントロジー入力部101は、オントロジー管理装置20から受け取った標準オントロジーを受信する。
オントロジー記憶部102は、オントロジー入力部101によって受信された当該標準オントロジーを記憶するため、クラス定義テーブル1021とプロパティ定義テーブル1022とを備える。
図4は、本発明の実施形態に係るクラス定義テーブル1021及びプロパティ定義テーブル1022の一例を示した説明図である。
例示したクラス定義テーブル1021(図4(a))は、標準オントロジーに含まれる4つのクラスの定義情報を記憶している。具体的には、各クラスについて、クラスのIDと、クラスの名称と、クラスのスーパークラスとなる親クラスのIDと、をクラスの定義情報として格納する。例えば「施設」という概念を表すクラスとして、C001をIDとしてもつクラスが定義されている。当該クラスの親クラスは、C000をIDとしてもつ「事物」クラスである。
また、例示したプロパティ定義テーブル1022(図4(b))は、標準オントロジーに含まれる4つのプロパティの定義情報を記憶している。具体的には、各プロパティについて、プロパティのIDと、プロパティの名称と、プロパティの定義域(domain)となるクラスのIDと、をプロパティの定義情報として格納する。例えば「名称」という属性を表すプロパティとして、P001をIDとしてもつプロパティが定義されている。当該プロパティはC000をクラスIDとしてもつ「事物」クラスの属性として定義される。
図4の例では、クラス定義テーブル1021に示すように、「事物」クラスのサブクラスとして、「施設」クラス、「組織」クラスおよび「製品個品」クラスが定義されている。そのため、P001をIDとしてもつプロパティは、「施設」クラス、「組織」クラスおよび「製品個品」クラスの属性としても暗に定義される。
なお、クラス定義テーブル1021はクラスに関して前述の3つの定義情報の他にも、例えばクラスの説明文等のような、追加の定義情報を含んでも良い。同様に、プロパティ定義テーブル1022はプロパティに関して前述の定義情報の他にも、追加の定義情報を含んで良い。
また、本実施形態では説明を簡便にするため、クラスのIDおよびプロパティのIDとしてそれぞれC001およびP001といった記号を用いているが、これに代わってURI(Uniform Resource Identifier)またはIRI(Internationalized Resource Identifier)のような、国際的に広く利用されている識別子を用いることも可能である。
また、本実施形態では標準オントロジーの具体的な表現方法について限定をしていないが、例えばRDF(Resource Description Framework)もしくはOWL(Web Ontology Language)を用いた表現、または、XML Schemaを用いた表現など、用途に応じて種々の方法を用いてもよい。
図3に示すマッピング実績入力部103は、データ提供装置30からマッピング実績を受信する。
マッピング実績記憶部104は、マッピング実績入力部103によって受信された当該マッピング実績を記憶するため、マッピング対象テーブル1041とマッピング実績テーブル1042とを備える。
図5は、本発明の実施形態に係るマッピング対象テーブル1041の一例を示した説明図である。
図6は、本発明の実施形態に係るマッピング実績テーブル1042の一例を示した説明図である。
これらのテーブルの内容については後述する。
マッピング実績解析部105は、マッピング実績記憶部104に記憶されたマッピング実績を解析する機能部である。
オントロジー拡張部107は、マッピング実績解析部105の解析結果に基づいて、オントロジーの拡張候補を生成する機能部である。
オントロジー拡張確定部108は、オントロジー拡張部107によって生成されたオントロジーの拡張候補について、作業者へ提示するとともに、作業者による確定処理を可能とする機能部である。
マッピング修正部106は、拡張候補が確定した場合に、その拡張したオントロジーに基づいて、マッピング実績の修正を実施する機能部である。
以下、本実施形態におけるオントロジー拡張支援装置10及びその他の装置の処理手順について、図7および図8に基づき説明する。以下で説明する各種動作は、オントロジー拡張支援装置10、オントロジー管理装置20、データ提供装置30、マッピング装置40およびデータ利用装置50がそれぞれメモリ等に読み出して実行するプログラムによって実現される。そして、これらのプログラムは、以下に説明される各種の動作を行うためのコードから構成されている。
以降の処理手順における事前条件として、オントロジー拡張支援装置10は、オントロジー管理装置20によって管理されている標準オントロジーの内、拡張可能性のある標準オントロジーを、オントロジー入力部101を介して受け取り、オントロジー記憶部102に記憶済みであるものとする。
図7は、本発明の実施形態に係るオントロジー拡張支援装置10及びその他の装置の処理手順例を示すシーケンス図である。
まず、オントロジー管理装置20は、標準オントロジーをデータ提供装置30へ提供する(ステップS1)。当該処理は、オントロジー管理装置20からデータ提供装置30に対する配信であっても、データ提供装置30からオントロジー管理装置20に対するオントロジー取得要求に基づくものであってもよい。なお、ここでは標準オントロジーが提供される例を示したが、例えば既に拡張されたオントロジーをさらに拡張するために図7の処理が実行される場合には、前回までの処理によって拡張されたオントロジーが提供されてもよい。
次に、データ提供装置30は、受信した標準オントロジーを用いて、自身の提供するデータの各属性に対して、標準オントロジーを対応づけることでマッピングを定義する(ステップS2)。
ここで、データ提供装置30が提供するデータの一例は図5に示したものと同様である。本実施形態では、提供データの例として「B市内学校一覧」(データセットID:D001)と「B市内避難所一覧」(データセットID:D002)の2つのデータセットを示している。「B市内学校一覧」データセットは、「学校名」「所在地」「生徒数」の3つの属性によって、B市内にある学校の名称、所在地、生徒の数をそれぞれ表している。同様に、「B市内避難所一覧」データセットは、「避難所名」「場所」「備蓄品期限」の3つの属性によって、B市内にある避難所の名称、所在地、備蓄物資の消費期限をそれぞれ表している。
また、当該データに対して標準オントロジーを対応づけたマッピング定義の一例は図6に示したものと同様である。本実施形態では、マッピング定義の例として、「B市内避難所一覧」(データセットID:D001)の「学校名」属性に対して、標準オントロジーの「施設」クラスの「名称」プロパティを対応づけている。同様に、「所在地」属性に対しては「施設」クラスの「住所」プロパティを対応づけている。また、「生徒数」属性に対しては「組織」クラスに属する「人数」プロパティを対応づけている。
本実施形態では、マッピング定義の具体的な方法については限定を加えない。データ提供装置30の利用者が手作業で定義しても良いし、ツールなどを用いた機械的な定義をしてもよい。
次に、データ提供装置30は定義した当該マッピング定義をオントロジー拡張支援装置10へ送信する。オントロジー拡張支援装置10は受信した当該マッピング定義をマッピング実績として記憶する(ステップS3)。その後、オントロジー拡張支援装置10はマッピング実績記憶部104に蓄積されたマッピング実績に基づいて、オントロジーの拡張処理を実行する(ステップS4)。
ここで、図8を用いて、オントロジー拡張支援装置10による当該オントロジー拡張処理(ステップS4)の詳細について説明する。
図8は、本発明の実施形態に係るオントロジー拡張処理の詳細の一例を示すフローチャートである。
まず、マッピング実績記憶部104に記憶されたマッピング実績をマッピング実績解析部105が読み込み、マッピング定義の中で不整合と思われる対応付けを特定する(ステップS401)。例えば図6に示したマッピング定義では、「B市内学校一覧」(データセットID:D001)の3つの属性に対するマッピングの内、2つの属性(すなわち「学校名」および「所在地」)に対しては「施設」クラスのプロパティが対応づけられている一方で、残りの一つである「生徒数」属性に対してのみ、「組織」クラスに属するプロパティが対応づけられている点が不整合であると判断される。
マッピングの誤りまたは不整合の判断にあたっては、このように同一データセット内での対応付けに現れるクラスの偏りを参考にすることも可能である。あるいは、データ提供装置30の利用者が手作業で定義した際に対応付けに関する疑義または確信の度合いを明示しておけば、それを参考にすることも可能である。また、ツールなどを用いた機械的な定義を実施した場合には、当該ツールが出力する確率的なスコアを参考にすることも可能となる。
不整合と判断された対応付けが存在する場合(ステップS402でYesの場合)、マッピング実績解析部105は、不整合でないと判断したクラス(図6の例では「施設」クラス)を基底クラスとして分類し、不整合であると判断したクラス(図6の例では「組織」クラス)を不整合クラスとして分類する(ステップS403)。
続いて、マッピング実績解析部105は、基底クラスと不整合クラスが親子関係、すなわちいずれかのクラスが他方のクラスのサブクラスになっているか否かを判定する(ステップS404)。
基底クラスと不整合クラスが親子の関係にある場合(ステップS404でYesの場合)には、オントロジー拡張処理は実施せず終了する。
基底クラスと不整合クラスが親子の関係にない場合(ステップS404でNoの場合)には、マッピング実績解析部105は、基底クラスのサブクラスを新たに定義する(ステップS405)。ここで、新たに定義するサブクラスは、既存のクラスと衝突しない一意のクラスIDを有し、親クラス(スーパークラス)として基底クラスをもつような新しいクラスである。
新たに定義するサブクラスの名称は、マッピング対象テーブル1041に格納されているデータセットのメタデータである、データセットの名称(例えば「B市内学校一覧」)、データセットの特徴を表すキーワードまたはタグ(例えば「学校」)を参考に、候補を作成することが可能である。ここでは、「学校」というサブクラスを新たに定義した場合について説明する。なお、候補を作成できない場合には、具体的なクラス名の候補は決定せずに、後に作業者による命名を促すようなプレースホルダを仮に置くことも可能である。
次に、マッピング実績解析部105は、不整合クラスに付随するプロパティ(図6の例では、「生徒数」属性にマッピングされた、「組織」クラスに付随する「人数」プロパティ)を、当該新規に定義したサブクラス(ここでは「学校」クラス)に付随するプロパティとして再定義する(ステップS406)。
マッピング実績解析部105は、データセット「B市内避難所一覧」(データセットID:D002)の3つの属性に対するマッピングについても上記と同様の処理を行い、「施設」クラスを基底クラスとして、「製品個品」クラスを不整合クラスとして、それぞれ分類する(ステップS403)。
そして、基底クラスである「施設」クラスを親クラスとする「避難所」クラスを新たに定義する(ステップS405)。このクラス名の候補である「避難所」は、データセット「B市内避難所一覧」(データセットID:D002)のメタデータのうちのデータセット名又はキーワードに基づいて生成されたものである。
そして、マッピング実績解析部105は、不整合クラスに付随するプロパティ(図6の例では、「備蓄品期限」属性にマッピングされた、「製品個品」クラスに付随する「消費期限」プロパティ)を、当該新規に定義したサブクラス(ここでは「避難所」クラス)に付随するプロパティとして再定義する(ステップS406)。
基底クラスと不整合クラスの分類と、新規に定義したサブクラスの作成、さらに当該サブクラスへ付随させるべきプロパティの再定義処理が完了すると、オントロジー拡張部107は処理結果をまとめて、当該結果をオントロジー拡張確定部108がオントロジー拡張支援装置10の利用者(作業者)に提示する(ステップS407)。
図9は、本発明の実施形態に係るオントロジー拡張確定部108によって提示されるオントロジーの拡張案の一例を示す説明図である。
ここでは、「施設」クラスのサブクラスとして新たに「学校」クラス(クラスID:C004)と「避難所」クラス(クラスID:C005)を定義するとともに、「人数」プロパティの定義域に「学校」クラスを追加し、「消費期限」プロパティの定義域に「避難所」クラスを追加する案を示している。
当該作業者はオントロジーの拡張案を確認し、拡張案の確定もしくは却下の判断をオントロジー拡張確定部108へ入力する。作業者によって拡張案が確定された場合(ステップS408でYesの場合)には、マッピング修正部106が拡張後のオントロジーに基づいてマッピングの修正を実施するとともに、拡張後のオントロジーをオントロジー管理装置20へ送信する(ステップS409)。
図10は、本発明の実施形態に係るマッピング修正部106によって作成されたマッピングの修正結果の一例を示す説明図である。
図10の例では、データセットID「D001」に対応する属性「学校名」、「所在地」及び「生徒数」のクラスがいずれも「C004(学校)」に修正される。同様に、データセットID「D002」に対応する属性「避難所名」、「場所」及び「備蓄品期限」のクラスがいずれも「C005(避難所)」に修正される。
なお、オントロジー拡張支援装置10は、確定した拡張後のオントロジーに基づいてマッピング修正部106がマッピングを修正した結果をステップS409において拡張後のオントロジーとともに送信してもよい。この場合、後述する処理によってオントロジー管理装置20が拡張後のオントロジーとともにマッピングの修正結果を各データ提供装置30に提供し、各データ提供装置30はマッピングの修正結果をそのまま利用することができる。
あるいは、マッピング修正部106は、確定前の拡張案に基づいてマッピングを修正し、その修正結果をオントロジー拡張確定部108がオントロジーの拡張案とともに作業者に提示してもよい(ステップS407)。その場合、作業者は、拡張案に基づいて修正されたマッピングを参照して、拡張案を確定するか判定することができる。
ここまで、オントロジー拡張部107がクラスに関してのみオントロジーの拡張を実施する例を示したが、同様の方法によって、プロパティに関する拡張も実施することが可能である。
図11は、本発明の実施形態において、プロパティに関する拡張も実施した場合のオントロジーの拡張案の一例を示す説明図である。
ここでは、新たなプロパティとして「生徒数」プロパティ(プロパティID:P005)と「備蓄品期限」プロパティ(プロパティID:P006)を定義し、それぞれ「学校」クラスと「避難所」クラスに付随するプロパティとして位置付けている。すなわち、「生徒数」プロパティの定義域は「学校」クラス(クラスID:C004)、「備蓄品期限」プロパティの定義域は「避難所」クラス(クラスID:C005)となる。
「生徒数」および「備蓄品期限」といったプロパティの名称は、クラス名称の候補抽出と同様に、マッピング対象テーブル1041に格納されているデータセットのメタデータである、データセットの名称(例えば「B市内学校一覧」)、データセットの特徴を表すキーワード又はタグ(例えば「学校」)を参考に、候補を作成することが可能である。さらに、マッピング実績テーブル1042に格納されている属性名(例えば「生徒数」)を参考に、候補を作成することが可能である。
図11の例では、それぞれのデータセットのメタデータのうち、不整合クラスのプロパティに対応する属性名(例えば「生徒数」および「備蓄品期限」)がプロパティの名称の候補として作成される。なお、候補を作成できない場合には、具体的なプロパティ名の候補は決定せずに、後に作業者による命名を促すようなプレースホルダを仮に置くことも可能である。
図11に示したように拡張されたオントロジーに基づいてマッピングが修正された場合、修正結果の図示は省略するが、クラスは図10の例と同様に修正される。さらに、図10の例におけるプロパティ「P003(人数)」が「P005(生徒数)」に、プロパティ「P004(消費期限)」が「P006(備蓄品期限)」に、それぞれ修正される。
以上がオントロジー拡張支援装置10による当該オントロジー拡張処理(図7のステップS4)の詳細である。
オントロジー管理装置20は、オントロジー拡張支援装置10からオントロジーの拡張案を受信すると、標準オントロジーの更新処理を実施する(ステップS5)。
その後、オントロジー管理装置20は、更新後の標準オントロジーをデータ提供装置30に提供する(ステップS6)。データ提供装置30は、当該更新後の標準オントロジーに基づいてマッピングの再定義を実施する(ステップS7)。なお、データ提供装置30によるマッピングの再定義にあたっては、マッピング修正部106が作成したマッピングの修正案が提供された場合は、そのまま利用することも可能である。
データ提供装置30は修正後のマッピング定義をマッピング装置40に送付し、マッピング装置40は当該修正後のマッピング定義を記憶する(ステップS8)。
マッピング定義がマッピング装置40へ登録された後には、データ提供装置30からデータが提供される都度(ステップS9)、マッピング装置40によって当該マッピング定義に基づくデータ変換が実施され(ステップS10)、データ利用装置50は標準オントロジーで表現されたデータを活用することが可能となる(ステップS11)。
なお、本実施形態では、データ提供装置30によるマッピング定義処理(ステップS2)からオントロジー拡張支援装置10によるマッピング実績登録処理(ステップS3)、オントロジー拡張処理(ステップS4)、さらにその先のオントロジー管理装置20によるオントロジー更新処理(ステップS5))とデータ提供装置30によるマッピングの再定義処理(ステップS7)などの処理を連続して実行する例を示しているが、これらの処理は不連続であっても構わない。
以上が本発明の実施形態におけるオントロジー拡張支援装置10およびその他の装置の処理手順についての説明である。
以上に説明した本発明の態様の代表的な例をまとめると次の通りとなる。すなわち、プロセッサ(例えばCPU901)と、プロセッサに接続される記憶装置(例えばメモリ902及び外部記憶装置903)と、を有するオントロジー拡張支援装置であって、記憶装置は、オントロジー(例えばオントロジー記憶部102)と、マッピング実績(例えばマッピング実績記憶部104)とを保持し、オントロジーは、各プロパティが付随するクラスを定義する情報(例えばプロパティ定義テーブル1022)を含み、マッピング実績は、オントロジーに基づいて、対象のデータセットの各属性をいずれかの前記プロパティにマッピングした結果(例えばマッピング実績テーブル1042)を含み、プロセッサは、マッピング実績に含まれるデータセットの属性がマッピングされたプロパティが付随するクラスの不整合を検出したかを判定し(例えばステップS402)、クラスの不整合を検出した場合、不整合を解消するように新たなクラスを追加したオントロジーの拡張案を生成する(例えばステップS405)。
これによって、オントロジー(例えば標準オントロジー)を拡張する作業を支援することができる。
ここで、プロセッサは、マッピング実績に含まれる一つのデータセットの複数の属性が2以上のクラスのプロパティにマッピングされる場合(例えば、図6に示すように、一つのデータセットの三つの属性のうち「学校名」及び「所在地」が「施設」クラスの「名称」プロパティ及び「住所」プロパティにマッピングされ、「生徒数」が「組織」クラスの「人数」プロパティにマッピングされる場合)に、クラスの不整合を検出してもよい。
これによって、オントロジーの修正範囲を適切に絞り込むことができる。
また、オントロジーは、クラス間の親子関係を定義する情報をさらに含み、プロセッサは、2以上のクラスのうち、それに付随するプロパティにマッピングされた属性の数が最も多いクラス(上記の例では「施設」クラス)を基底クラス、その他のクラス(上記の例では「組織」クラス)を不整合クラスと分類し、基底クラスと不整合クラスとの間に親子関係がない場合(例えばステップS404)、基底クラスを親クラスとする新たなクラスを生成する(例えばステップS405で図9の「学校」クラス等を生成する)ことによって、前記オントロジーの拡張案を生成してもよい。
さらに、プロセッサは、不整合クラスに対応する属性がマッピングされたプロパティ(例えば「名称」プロパティ及び「住所」プロパティ)を新たなクラス(例えば「学校」クラス)に付随するプロパティとして定義してもよい。
さらに、プロセッサは、クラスの不整合を検出したデータセットのメタデータ(例えばマッピング対象テーブル1041内のデータセット名、キーワード、又はそれぞれのデータの属性名等、図9の例では、データセットID:D001のキーワードから抽出された「学校」等)に含まれる情報を前記新たなクラスの名称として定義してもよい。
これによって、妥当性の高いオントロジーの拡張案を生成することができる。
また、プロセッサは、不整合クラスに対応する属性(例えば「組織」クラスに対応する「生徒数」属性)がマッピングされる新たなプロパティ(例えば「生徒数」プロパティ)を生成し、新たなプロパティを新たなクラスに追加してもよい。
さらに、プロセッサは、クラスの不整合を検出したデータセットのメタデータ又はマッピング実績に含まれる情報に基づいて新たなプロパティの名称を定義してもよい。例えば、プロセッサは、図11に示すデータセットID:D001の属性名、又は、マッピング実績テーブル1042に格納されている属性名に基づいて、新たなプロパティの名称(例えば「生徒数」等)を定義してもよい。
これによって、妥当性の高いオントロジーの拡張案を生成することができる。
また、プロセッサは、オントロジーの拡張案を出力し(例えばステップS407)、オントロジーの拡張案を確定する指示が入力された場合(ステップS408:Yes)、オントロジーの拡張案を新たなオントロジーとして出力してもよい(ステップS409)。
これによって、利用者の意図が反映されたオントロジーの拡張が行われる。
また、プロセッサは、オントロジーの拡張案に基づいて対象のデータをマッピングすることによって新たなマッピング実績を生成し、生成した新たなマッピング実績を出力してもよい。
このようなマッピング実績の生成及び出力を、オントロジーの拡張案が確定する前に行えば、利用者が当該オントロジーの拡張案の妥当性を判断するために利用することができる。また、このようなマッピング実績の生成及び出力を、オントロジーの拡張案が確定した後に行えば、利用者の意図を反映したマッピングを行うことができる。
なお、本発明は上記した実施例に限定されるものではなく、様々な変形例が含まれる。例えば、上記した実施例は本発明のより良い理解のために詳細に説明したのであり、必ずしも説明の全ての構成を備えるものに限定されるものではない。
また、上記の各構成、機能、処理部、処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等によってハードウェアで実現してもよい。また、上記の各構成、機能等は、プロセッサがそれぞれの機能を実現するプログラムを解釈し、実行することによってソフトウェアで実現してもよい。各機能を実現するプログラム、テーブル、ファイル等の情報は、不揮発性半導体メモリ、ハードディスクドライブ、SSD(Solid State Drive)等の記憶デバイス、または、ICカード、SDカード、DVD等の計算機読み取り可能な非一時的データ記憶媒体に格納することができる。
また、制御線及び情報線は説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線及び情報線を示しているとは限らない。実際にはほとんど全ての構成が相互に接続されていると考えてもよい。
10:オントロジー拡張支援装置、
20:オントロジー管理装置、
30:データ提供装置、
40:マッピング装置、
50:データ利用装置、
60:ネットワーク

Claims (10)

  1. プロセッサと、前記プロセッサに接続される記憶装置と、を有するオントロジー拡張支援装置であって、
    前記記憶装置は、オントロジーと、マッピング実績とを保持し、
    前記オントロジーは、各プロパティが付随するクラスを定義する情報を含み、
    前記マッピング実績は、前記オントロジーに基づいて、対象のデータセットの各属性をいずれかの前記プロパティにマッピングした結果を含み、
    前記プロセッサは、
    前記マッピング実績に含まれるデータセットの属性がマッピングされたプロパティが付随するクラスの不整合を検出したかを判定し、
    前記クラスの不整合を検出した場合、前記不整合を解消するように新たなクラスを追加した前記オントロジーの拡張案を生成することを特徴とするオントロジー拡張支援装置。
  2. 請求項1に記載のオントロジー拡張支援装置であって、
    前記プロセッサは、前記マッピング実績に含まれる一つのデータセットの複数の属性が2以上のクラスのプロパティにマッピングされる場合に、前記クラスの不整合を検出することを特徴とするオントロジー拡張支援装置。
  3. 請求項2に記載のオントロジー拡張支援装置であって、
    前記オントロジーは、前記クラス間の親子関係を定義する情報をさらに含み、
    前記プロセッサは、
    前記2以上のクラスのうち、それに付随するプロパティにマッピングされた属性の数が最も多いクラスを基底クラス、その他のクラスを不整合クラスと分類し、
    前記基底クラスと前記不整合クラスとの間に親子関係がない場合、前記基底クラスを親クラスとする新たなクラスを生成することによって、前記オントロジーの拡張案を生成することを特徴とするオントロジー拡張支援装置。
  4. 請求項3に記載のオントロジー拡張支援装置であって、
    前記プロセッサは、前記不整合クラスに対応する属性がマッピングされたプロパティを前記新たなクラスに付随するプロパティとして定義することによって、前記オントロジーの拡張案を生成することを特徴とするオントロジー拡張支援装置。
  5. 請求項3に記載のオントロジー拡張支援装置であって、
    前記プロセッサは、前記クラスの不整合を検出したデータセットのメタデータに含まれる情報を前記新たなクラスの名称として定義することによって、前記オントロジーの拡張案を生成することを特徴とするオントロジー拡張支援装置。
  6. 請求項3に記載のオントロジー拡張支援装置であって、
    前記プロセッサは、
    前記不整合クラスに対応する属性がマッピングされる新たなプロパティを生成し、
    前記新たなプロパティを前記新たなクラスに追加することによって、前記オントロジーの拡張案を生成することを特徴とするオントロジー拡張支援装置。
  7. 請求項6に記載のオントロジー拡張支援装置であって、
    前記プロセッサは、前記クラスの不整合を検出したデータセットのメタデータ又は前記マッピング実績に含まれる情報に基づいて前記新たなプロパティの名称を定義することによって、前記オントロジーの拡張案を生成することを特徴とするオントロジー拡張支援装置。
  8. 請求項1に記載のオントロジー拡張支援装置であって、
    前記プロセッサは、
    前記オントロジーの拡張案を出力し、
    前記オントロジーの拡張案を確定する指示が入力された場合、前記オントロジーの拡張案を新たなオントロジーとして出力することを特徴とするオントロジー拡張支援装置。
  9. 請求項1に記載のオントロジー拡張支援装置であって、
    前記プロセッサは、
    前記オントロジーの拡張案に基づいて前記対象のデータをマッピングすることによって新たなマッピング実績を生成し、
    生成した前記新たなマッピング実績を出力することを特徴とするオントロジー拡張支援装置。
  10. プロセッサと、前記プロセッサに接続される記憶装置と、を有する計算機システムが実行するオントロジー拡張支援方法であって、
    前記記憶装置は、オントロジーと、マッピング実績とを保持し、
    前記オントロジーは、各プロパティが付随するクラスを定義する情報を含み、
    前記マッピング実績は、前記オントロジーに基づいて、対象のデータセットの各属性をいずれかの前記プロパティにマッピングした結果を含み、
    前記オントロジー拡張支援方法は、
    前記プロセッサが、前記マッピング実績に含まれるデータセットの属性がマッピングされたプロパティが付随するクラスの不整合を検出したかを判定する手順と、
    前記プロセッサが、前記クラスの不整合を検出した場合、前記不整合を解消するように新たなクラスを追加した前記オントロジーの拡張案を生成する手順と、を含むことを特徴とするオントロジー拡張支援方法。
JP2019046183A 2019-03-13 2019-03-13 オントロジー拡張支援装置及びオントロジー拡張支援方法 Active JP7036760B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019046183A JP7036760B2 (ja) 2019-03-13 2019-03-13 オントロジー拡張支援装置及びオントロジー拡張支援方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019046183A JP7036760B2 (ja) 2019-03-13 2019-03-13 オントロジー拡張支援装置及びオントロジー拡張支援方法

Publications (2)

Publication Number Publication Date
JP2020149343A JP2020149343A (ja) 2020-09-17
JP7036760B2 true JP7036760B2 (ja) 2022-03-15

Family

ID=72430591

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019046183A Active JP7036760B2 (ja) 2019-03-13 2019-03-13 オントロジー拡張支援装置及びオントロジー拡張支援方法

Country Status (1)

Country Link
JP (1) JP7036760B2 (ja)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005339119A (ja) 2004-05-26 2005-12-08 Nippon Telegr & Teleph Corp <Ntt> 情報管理装置、情報管理方法および情報管理プログラム
JP2006309446A (ja) 2005-04-27 2006-11-09 Toshiba Corp 分類辞書更新装置、分類辞書更新プログラムおよび分類辞書更新方法
JP2008242836A (ja) 2007-03-27 2008-10-09 Toshiba Corp 辞書更新装置およびプログラム
JP2010086437A (ja) 2008-10-02 2010-04-15 Agra Corp 検索システム
JP2014153938A (ja) 2013-02-08 2014-08-25 Toshiba Corp 情報処理装置およびその方法、ならびにプログラム
JP2017517069A (ja) 2014-05-30 2017-06-22 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation リレーショナル・データベースに対するセマンティック・マッピングの自動生成
JP2017521748A (ja) 2014-05-12 2017-08-03 セマンティック・テクノロジーズ・プロプライエタリー・リミテッド 推定オントロジを生成する方法及び装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005339119A (ja) 2004-05-26 2005-12-08 Nippon Telegr & Teleph Corp <Ntt> 情報管理装置、情報管理方法および情報管理プログラム
JP2006309446A (ja) 2005-04-27 2006-11-09 Toshiba Corp 分類辞書更新装置、分類辞書更新プログラムおよび分類辞書更新方法
JP2008242836A (ja) 2007-03-27 2008-10-09 Toshiba Corp 辞書更新装置およびプログラム
JP2010086437A (ja) 2008-10-02 2010-04-15 Agra Corp 検索システム
JP2014153938A (ja) 2013-02-08 2014-08-25 Toshiba Corp 情報処理装置およびその方法、ならびにプログラム
JP2017521748A (ja) 2014-05-12 2017-08-03 セマンティック・テクノロジーズ・プロプライエタリー・リミテッド 推定オントロジを生成する方法及び装置
JP2017517069A (ja) 2014-05-30 2017-06-22 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation リレーショナル・データベースに対するセマンティック・マッピングの自動生成

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
中辻 真、外2名,ユーザ興味オントロジ抽出によるブログコミュニティ形成手法,日本データベース学会Letters,日本,日本データベース学会,2006年06月22日,第5巻,第1号,p.33-36
海谷 治彦、外5名,ソフトウェア工学,情報処理学会論文誌 論文誌ジャーナル Vol.53 No.2,日本,一般社団法人情報処理学会,2012年02月15日,第53巻,第2号,p.495-509

Also Published As

Publication number Publication date
JP2020149343A (ja) 2020-09-17

Similar Documents

Publication Publication Date Title
CN109062952B (zh) 一种数据查询方法、装置及电子设备
CN107122368B (zh) 一种数据校验方法、装置及电子设备
US7870163B2 (en) Implementation of backward compatible XML schema evolution in a relational database system
US9405532B1 (en) Integrated cloud platform translation system
CN111596965B (zh) 项目工程初始化方法、装置、计算机设备和存储介质
CN108762743B (zh) 一种数据表操作代码生成方法及装置
CN111399853A (zh) 机器学习模型与自定义算子的模板化部署方法
US8607217B2 (en) Incremental upgrade of entity-relationship systems
US10769143B1 (en) Composite index on hierarchical nodes in the hierarchical data model within case model
JP2014149564A (ja) 情報処理装置、情報処理方法及びプログラム
CN111984659B (zh) 数据更新方法、装置、计算机设备和存储介质
US20080022263A1 (en) Identifying The Origin Of Application Resources
US10782942B1 (en) Rapid onboarding of data from diverse data sources into standardized objects with parser and unit test generation
US20110307243A1 (en) Multilingual runtime rendering of metadata
Gómez et al. An approach to the co-creation of models and metamodels in Enterprise Architecture Projects.
JP5634374B2 (ja) 仕様作成支援装置、及び、プログラム
US10366069B1 (en) Systems and methods for database management and administration
JP7036760B2 (ja) オントロジー拡張支援装置及びオントロジー拡張支援方法
JP6588988B2 (ja) 業務プログラム生成支援システムおよび業務プログラム生成支援方法
JP5641901B2 (ja) Sql検証システムとその方法およびプログラム
JP6705482B2 (ja) システム構築パラメータ管理装置、システム構築パラメータ管理システム、システム構築パラメータ管理方法、及び、システム構築パラメータ管理プログラム
JP6330257B2 (ja) 設計書データ作成支援プログラム、設計書データ作成支援方法および情報処理装置
JP6677809B2 (ja) アダプタ生成装置及び方法
JP6497087B2 (ja) 情報処理装置及び情報処理プログラム
CN116451795B (zh) 一种量子线路图处理方法、装置及电子设备和存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210409

TRDD Decision of grant or rejection written
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220209

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220222

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220303

R150 Certificate of patent or registration of utility model

Ref document number: 7036760

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150