JP4899295B2 - メタデータエディタプログラム、メタデータエディタ装置およびメタデータエディタ方法 - Google Patents

メタデータエディタプログラム、メタデータエディタ装置およびメタデータエディタ方法 Download PDF

Info

Publication number
JP4899295B2
JP4899295B2 JP2004196043A JP2004196043A JP4899295B2 JP 4899295 B2 JP4899295 B2 JP 4899295B2 JP 2004196043 A JP2004196043 A JP 2004196043A JP 2004196043 A JP2004196043 A JP 2004196043A JP 4899295 B2 JP4899295 B2 JP 4899295B2
Authority
JP
Japan
Prior art keywords
metadata
integration
column
data
database
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004196043A
Other languages
English (en)
Other versions
JP2006018607A (ja
Inventor
美穂 村田
泰彦 金政
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2004196043A priority Critical patent/JP4899295B2/ja
Priority to US10/997,042 priority patent/US20060004815A1/en
Publication of JP2006018607A publication Critical patent/JP2006018607A/ja
Application granted granted Critical
Publication of JP4899295B2 publication Critical patent/JP4899295B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/80Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
    • G06F16/84Mapping; Conversion
    • G06F16/86Mapping to a database
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

この発明は、複数のデータベースに分散しているデータを仮想的に一つの統合データベースとして参照可能とするデータベース統合参照装置がデータの統合に用いる統合用メタデータを編集するメタデータエディタプログラムおよびその記録媒体、メタデータ編集方法ならびにメタデータ編集装置に関し、特に、統合用メタデータの効率的な作成を可能とするメタデータエディタプログラムおよびその記録媒体、メタデータ編集方法ならびにメタデータ編集装置に関するものである。
複数のデータベース上に関連するデータが散在していて、それらをまとめて参照したい場合、それらのデータベースに対してそれぞれ問い合わせを行い、その結果を合成することによって、あたかも一つのデータベースを参照しているかのように見せる、分散クエリーによるデータベース統合が近年行われるようになってきた。
この分散クエリーによるデータベース統合には、データ参照者からデータの要求があった時点で、各データベースに問い合わせを行って結果を得るため、リアルタイムにデータを参照することができるという利点がある。
このような分散クエリーによるデータベース統合の場合、あたかも一つのデータベースを参照しているかのように見せるために、データ参照者にはタグ付き文書というビューを提供する方法がある。このタグ付き文書のビューを提供するためには、ビューを定義するメタデータを予め用意しておく必要がある。
例えば、特願2004−012306に記載されたデータベース統合参照装置では、データ参照者にXMLビューを提供し、データ参照者がそのXMLビューに対して、XMLに対する問い合わせ言語であるXQueryを用いて問い合わせを行うと、問い合わせ結果がXML形式で返ってくる。このデータベース統合参照装置では、XMLビューを定義するために、メタデータの中に統合のルールをXML形式で記述している。
また、非特許文献1では、統合対象の各データベースのスキーマをそのまま反映したデフォルトのXMLビューを提供し、さらにユーザ独自のXMLビューを定義するために、XQueryを用いてメタデータを記述している。
このように、タグ付き文書のビューを定義するメタデータの中に統合のルールを記述しておくことで、データの分散を隠蔽することができる。
IBM Almaden Research Center "Querying XML Views of Relational Data"、[online]、[平成16年6月10日検索]、インターネット<http://www.almaden.ibm.com/software/dm/Xperanto/Xperanto.2001.pdf>
しかし、タグ付き文書のビューを定義するメタデータ(以降、「統合用メタデータ」と呼ぶ)の編集は、従来手作業で行われていたため、非常に手間がかかるという問題があった。すなわち、統合用メタデータの中には統合対象のデータベースの情報を記述する必要があるため、統合メタデータを作成する統合メタデータ作成者は、各データベースのスキーマに精通している必要がある。
また、統合メタデータ作成者は、各データベースのメタ情報を個別に集めていたが、複数のデータベースを扱うため、メタ情報が散在していたり、形式が統一されていない場合もあり、全データベースの情報を把握するのに非常に手間がかかっていた。また、手作業による編集では記述を間違える可能性があるが、統合用メタデータの記述が間違っていると、そもそも問い合わせができないという問題があった。
また、複数のデータベースを扱うため、統合用メタデータでは、各データベースのどの要素とどの要素で対応を取るのかという定義をする必要がある。ある要素同士で対応を取れるのかどうかは、それぞれが属している各データベースのスキーマを把握し、両要素のカラム名・データ型などの情報を集め、様々な情報を総合して判断する必要がある。
しかし、上記の情報だけでは判断を間違える場合もあり、間違えると問い合わせ条件に該当するデータが存在しないことになり、意味のない統合用メタデータになってしまう。従って、どの要素同士で対応を取るのかを定義する際は、慎重に定義する必要があった。
さらに、統合対象のデータベースが多くなると、各データベースのスキーマと統合用メタデータの間の整合性や、統合用メタデータ自身の中での整合性を取るのが難しくなる。また、データベースに変更が生じると、統合用メタデータもそれに合わせて修正する必要があり、修正漏れがあると、それらの整合性を保てないという問題もあった。
また、複数のデータベースを統合して複数の部署で参照する場合などは、部署毎に異なるタグ付き文書のビューを用意することがある。このようなときに、他の部署には見せたくないデータが存在する場合もあるため、ビュー毎に利用できるデータ参照者を制限したいという要望がある。しかし、従来は、用意された全てのビューが、全てのデータ参照者に見えてしまうという問題もあった。
この発明は、上述した従来技術による問題点を解消するためになされたものであり、統合用メタデータの効率的な作成を可能とするメタデータエディタプログラムおよびその記録媒体、メタデータ編集方法ならびにメタデータ編集装置を提供することを目的とする。
上述した課題を解決し、目的を達成するため、本発明は、複数のデータベースに分散しているデータを仮想的に一つの統合データベースとして参照可能とするデータベース統合参照装置がデータの統合に用いる統合用メタデータを編集するメタデータエディタプログラムであって、前記複数のデータベースのスキーマを表示し、該表示したスキーマを構成する要素から統合用メタデータ作成者により選択されて木構造に配置された要素に基づいて前記統合用メタデータを編集する編集手順と、前記編集手順により編集された統合用メタデータを前記データベース統合参照装置に送信する送信手順と、をコンピュータに実行させることを特徴とする。
また、本発明は、複数のデータベースに分散しているデータを仮想的に一つの統合データベースとして参照可能とするデータベース統合参照装置がデータの統合に用いる統合用メタデータを編集するメタデータエディタプログラムを記録したコンピュータ読み取り可能な記録媒体であって、前記複数のデータベースのスキーマを表示し、該表示したスキーマを構成する要素から統合用メタデータ作成者により選択されて木構造に配置された要素に基づいて前記統合用メタデータを編集する編集手順と、前記編集手順により編集された統合用メタデータを前記データベース統合参照装置に送信する送信手順と、をコンピュータに実行させるメタデータエディタプログラムを記録したことを特徴とする。
また、本発明は、複数のデータベースに分散しているデータを仮想的に一つの統合データベースとして参照可能とするデータベース統合参照装置がデータの統合に用いる統合用メタデータを編集するメタデータ編集方法であって、前記複数のデータベースのスキーマを表示し、該表示したスキーマを構成する要素から統合用メタデータ作成者により選択されて木構造に配置された要素に基づいて前記統合用メタデータを編集する編集工程と、前記編集工程により編集された統合用メタデータを前記データベース統合参照装置に送信する送信工程と、を含んだことを特徴とする。
また、本発明は、複数のデータベースに分散しているデータを仮想的に一つの統合データベースとして参照可能とするデータベース統合参照装置がデータの統合に用いる統合用メタデータを編集するメタデータ編集装置であって、前記複数のデータベースのスキーマを表示し、該表示したスキーマを構成する要素から統合用メタデータ作成者により選択されて木構造に配置された要素に基づいて前記統合用メタデータを編集する編集手段と、前記編集手段により編集された統合用メタデータを前記データベース統合参照装置に送信する送信手段と、を備えたことを特徴とする。
かかる発明によれば、複数のデータベースのスキーマを表示し、表示したスキーマを構成する要素から統合用メタデータ作成者により選択されて木構造に配置された要素に基づいて統合用メタデータを編集し、編集した統合用メタデータをデータベース統合参照装置に送信するよう構成したので、統合用メタデータ作成者はスキーマや統合用メタデータの記述ルールに精通する必要がなくなる。
また、本発明は、複数のデータベースに分散しているデータを仮想的に一つの統合データベースとして参照可能とする場合に用いられる統合用メタデータを編集するメタデータエディタプログラムであって、前記複数のデータベースのスキーマを表示し、該表示したスキーマを構成する要素から統合用メタデータ作成者により選択されて木構造に配置された要素に基づいて前記統合用メタデータを編集する編集手順と、前記編集手順により編集された統合用メタデータを記憶装置に格納する格納手順と、をコンピュータに実行させることを特徴とする。
この発明によれば、複数のデータベースのスキーマを表示し、表示したスキーマを構成する要素から統合用メタデータ作成者により選択されて木構造に配置された要素に基づいて統合用メタデータを編集し、編集した統合用メタデータを記憶装置に格納するよう構成したので、統合用メタデータ作成者はスキーマや統合用メタデータの記述ルールに精通する必要がなくなる。
また、本発明は、上記発明において、前記編集手順は、統合用メタデータ作成者がアクセス権限を有する範囲のスキーマを表示することを特徴とする。
この発明によれば、統合用メタデータ作成者がアクセス権限を有する範囲のスキーマを表示するので、統合用メタデータをアクセス権限を有する範囲で作成することができる。
また、本発明は、上記発明において、データベースはリレーショナルデータベースであり、前記編集手順は、編集中の統合用メタデータに含まれるテーブルとは異なるテーブルのカラムが新たに統合用メタデータに追加された場合に、異なるテーブルに属するカラム間の関連付けが可能な組み合わせ候補を表示することを特徴とする。
この発明によれば、編集中の統合用メタデータに含まれるテーブルとは異なるテーブルのカラムが新たに統合用メタデータに追加された場合に、異なるテーブルに属するカラム間の関連付けが可能な組み合わせ候補を表示するので、統合用メタデータ作成者は、関連付けを容易に行うことができる。
また、本発明は、上記発明において、前記編集手順は、異なる要素間の関連付けが指定された場合に、該指定された関連付けが正しいか否かを判定して表示することを特徴とする。
この発明によれば、異なる要素間の関連付けが指定された場合に、指定された関連付けが正しいか否かを判定して表示するので、統合用メタデータ作成者は、関連付けを容易に行うことができる。
また、本発明は、上記発明において、前記編集手順は、統合用メタデータの作成に用いられたスキーマに変更があった場合に、統合用メタデータのうち変更されたスキーマに対応する箇所の修正が必要であるという情報を提供することを特徴とする。
この発明によれば、統合用メタデータの作成に用いられたスキーマに変更があった場合に、統合用メタデータのうち変更されたスキーマに対応する箇所の修正が必要であるという情報を提供するので、統合用メタデータ作成者は、統合用メタデータの修正を容易に行うことができる。
本発明によれば、統合用メタデータ作成者は、スキーマや統合用メタデータの記述ルールに精通する必要がなくなるので、統合用メタデータを効率良く作成することができるという効果を奏する。
すなわち、従来は、統合用メタデータを用意するためには、各データベースの所在・メタ情報を個別に調べる必要があったが、本発明によれば、必要な情報が表示されているため、表示された各データベースのスキーマの中の要素を選択するだけでよい。また、正確な統合用メタデータを作成しないとそもそも問い合わせができないが、本発明によれば、記述ルールに従ったタグ付き文書の木構造を組み立てることが可能であるため、記述ルールに精通していない統合用メタデータ作成者でも、正確な統合用メタデータを作成することができる。
また、複数のデータベースを統合し、複数の部署で利用する場合などは、ビュー毎に利用できるデータ参照者を制限したい場合がある。従来は、用意された全てのビューが、全てのデータ参照者から利用できるようになっていたが、本発明によれば、アクセス可能なデータのみを使って統合用メタデータを作成できるため、その統合用メタデータで定義されるビューを利用できるデータ参照者も、制限することができるという効果を奏する。
また、複数のデータベースに分散したデータを扱う場合には、各データベースの各要素間の関連付けを定義する必要があるが、従来は、そのために各データベースのメタ情報を個別に調べる必要があった。本発明によれば、関連付け可能な要素の組み合わせの候補を知ることができ、既存の関連付け情報を利用することもできるため、それらの作業を大幅に削減することができるという効果を奏する。さらに、本発明によれば、関連付けの可能性をチェックできるため、統合用メタデータ作成者は、定義した関連付けが正しいのかどうかを知ることができるという効果を奏する。
また、データベースに変更が生じた場合、従来は統合用メタデータの中のどこがその変更によって影響を受けるかを探し出して修正する必要があったが、本発明によれば、変更を簡単に知ることができ、修正箇所を探し出す手間も省くことができるという効果を奏する。
以下に添付図面を参照して、この発明に係るメタデータエディタプログラムおよびその記録媒体、メタデータ編集方法ならびにメタデータ編集装置の好適な実施例を詳細に説明する。なお、本実施例では、本発明をリレーショナルデータベース(RDB)に適用した場合について説明する。また、タグ付き文書としてはXMLを採用した。
まず、本実施例に係るメタデータエディタが提供する画面について説明する。図1は、本実施例に係るメタデータエディタが提供する画面の一例を示す図である。同図に示すように、このメタデータエディタは、利用可能なデータベースの所在・メタ情報を取得してそのスキーマを表示するDB情報パネル画面11と、タグ付き文書というビューを定義するための木構造を表示する編集パネル画面12を提供する。
統合用メタデータ作成者は、DB情報パネル画面11に表示された各データベースのスキーマから必要な要素を選択し、その要素を編集パネル画面12のXMLビューの木構造の中にドラッグ&ドロップするだけでよい。なお、ここで要素とは、リレーショナルデータベースのカラムである。
必要な要素が木構造の中にドラッグ&ドロップされると、本実施例に係るメタデータエディタが、統合用メタデータの記述ルールに従ってその要素を木構造の中に配置する。また、要素が木構造の中に配置されると、その要素が属しているデータベースの情報が、木構造の要素の情報として保存される。
このように、本実施例に係るメタデータエディタは、統合用メタデータ作成者がDB情報パネル画面11に表示されたスキーマから必要な要素を選択し、その要素を編集パネル画面12のタグ付き文書の木構造の中にドラッグ&ドロップするだけで、統合用メタデータを自動的に作成する。従って、統合用メタデータ作成者は、各データベースのメタ情報を収集する必要がなく、効率的に統合用メタデータを作成することができる。
次に、本実施例に係るメタデータ編集システムのシステム構成について説明する。図2は、本実施例に係るメタデータ編集システムのシステム構成を示す機能ブロック図である。同図に示すように、このメタデータ編集システムは、メタデータエディタ100が動作するクライアント10と、統合用メタデータをメタデータ格納用リポジトリ21に格納し、格納した統合用メタデータを用いて分散クエリーによるデータベース統合を行う統合参照サーバ20とがネットワークで接続されて構成される。なお、ここでは説明の便宜上、1台のクライアントのみを示したが、このメタデータ編集システムは多数のクライアントから構成される。
統合参照サーバ20は、メタデータエディタ100からの要求に応答してメタデータ格納用リポジトリ21からの統合用メタデータの読み出し、メタデータ格納用リポジトリ21への統合用メタデータの保存を行う。また、この統合参照サーバ20は、統合対象のデータベース「RDB1」〜「RDB3」からスキーマの情報を集め、メタデータエディタ100が要求する情報をクライアント10へ送信する。
なお、ここでは、統合対象のデータベースとして三つのデータベース「RDB1」〜「RDB3」を示したが、このメタデータ編集システムは、任意の数のデータベースを統合する統合用メタデータを編集することができる。
メタデータエディタ100は、情報問合部110と、DB情報パネル120と、編集パネル130と、編集処理部140と、関連付け部150と、関連付けチェック部160と、整合性チェック部170とを有する。
情報問合部110は、DB情報パネル画面11に表示されるスキーマについての情報や、編集パネル画面12で編集される統合用メタデータについての情報を統合参照サーバ20から取得する処理部である。また、この情報問合部110は、編集した統合用メタデータに関する情報を統合参照サーバ20に送信する。
DB情報パネル120は、情報問合部110が統合参照サーバ20から取得したスキーマについての情報を記憶するとともに、DB情報パネル画面11にスキーマを表示するパネルである。すなわち、DB情報パネル120は、DB情報パネル画面11に利用可能なデータベース名、テーブル名およびカラム名を表示する。
また、このDB情報パネル120は、利用可能なデータの情報のみを表示する。すなわち、このDB情報パネル120は、統合参照サーバ20にスキーマについての情報を要求するとき、統合用メタデータ作成者のアカウント情報も一緒に送る。すると、統合参照サーバ20は、そのアカウントでアクセス可能なデータベースの情報を、データベースリスト情報として返す。
そして、DB情報パネル120は、返ってきた情報の全てのデータベース・テーブル・カラムに対して利用可否フラグを調べ、利用可能なデータのみを画面上に表示する。このとき、統合対象のRDBの構造をそのまま表示する。
図3は、DB情報パネル画面11に表示されるスキーマとデータベースリスト情報の関係を説明するための説明図である。同図に示すように、統合参照サーバ20から取得したデータベースリスト情報には利用不可能なデータベース、テーブルおよびカラムの情報が含まれる。ここで、利用不可能なデータベース、テーブル、カラムとは、過去に存在したデータベース、テーブル、カラムが削除されたり名前が変更された結果、利用不可能になったデータベース、テーブル、カラムである。
DB情報パネル120は、統合参照サーバ20から取得したデータベースリスト情報に含まれる、これら利用不可能なデータを除いて、データベースのスキーマをDB情報パネル画面11に表示する。
編集パネル130は、統合用メタデータに関する情報を記憶するとともに、編集パネル画面12にXMLビューの木構造を表示するパネルである。この編集パネル130は、統合用メタデータとして、仮想XMLスキーマ情報と、スキーマ・データベース対応関係情報と、要素間関連付け情報とを記憶する。
仮想XMLスキーマ情報は、XMLビューの木構造を定義する情報である。この仮想XMLスキーマ情報は、複数のデータベースに存在するデータを、データ参照者にどのような構造で見せるかということを定義している。編集パネル130は、この情報を基に木構造を編集パネル画面12に表示する。
スキーマ・データベース対応関係情報は、XMLビューの木構造の各要素が、どのデータベースのどの要素と対応しているのかを定義している。編集パネル130は、統合用メタデータが編集される間この情報を保持しており、木構造が作成・変更される度にこの情報を更新する。
要素間関連付け情報は、複数のデータベースの要素同士を関連付けて一つのタグ付き文書とする場合、それぞれのテーブルのどの要素とどの要素で対応を取るのかを定義している。編集パネル130は、統合用メタデータが編集される間この情報を保持しており、木構造が作成・変更される度にこの情報を更新する。
編集パネル130が統合参照サーバ20に統合用メタデータを要求すると、統合参照サーバ20は、該当する統合用メタデータの情報をメタデータ格納用リポジトリ21から抽出して返す。
そして、編集パネル130は、統合用メタデータの情報を受け取ると、その中からXMLビューの木構造を定義している仮想XMLスキーマ情報の部分を抽出し、木構造を画面上に表示する。このとき、木構造を構成する構成要素の配置位置は、木構造の階層構造をそのまま反映している。
なお、この編集パネル130が表示する木構造は、必ずしもデータ参照者に見せるXMLビューの構造と完全に一致していない。この木構造の中には、木構造を組み立てるために必要であるが、データ参照者に見せるXMLビューとしては見せる必要がない要素も含まれているためである。
図4は、木構造とXMLビューの関係の一例を示す図である。同図において、「order_num」は「order_id」に関連付けられたカラムであり、「code」は「item_code」に関連付けられたカラムである。
従って、「order_num」や「code」などは、「order_id」や「item_code」が表示されていれば、データ参照者には見せる必要のない要素であり、これらの各要素に対してデータ参照者には見せる必要のない要素であることを設定することによって、木構造から削除して表示することも可能となっている。なお、要素間の関連付けの詳細については、後述する。
編集パネル130は、同じ統合用メタデータで定義されている木構造を、編集したままの形で表示することも、データ参照者には見せない要素を削って見せることも可能である。後者の構造は、データ参照者に見せるXMLビューの構造と一致する。
編集処理部140は、統合用メタデータの編集処理を行う処理部である。すなわち、この編集処理部140は、統合用メタデータ作成者によるドラッグ&ドロップ動作を受け付け、編集パネル130が記憶する、仮想XMLスキーマ情報、スキーマ・データベース対応関係情報および要素間関連付け情報を編集する。
関連付け部150は、既に配置されている要素と異なるテーブルの要素がドラッグ&ドロップされた場合に、異なるテーブルの要素間での関連付けが可能な要素組み合わせを表示し、統合用メタデータ作成者が表示された要素組み合わせに基づいて指定した要素組み合わせを関連付ける処理部である。なお、この関連付け部150の詳細については後述する。
関連付けチェック部160は、統合用メタデータ作成者が指定した要素組み合わせの妥当性を統計的に判定する処理部である。なお、この関連付けチェック部160の詳細についても後述する。
整合性チェック部170は、データベースのスキーマの変更に起因して、過去に編集された統合用メタデータが利用不可能なデータベース、テーブルまたはカラムを使用しているか否かをチェックする処理部である。なお、この整合性チェック部170の詳細についても後述する。
次に、本実施例に係るメタデータ編集システムにおけるアクセス制御について説明する。分散クエリーによるデータベース統合では、ある統合用メタデータで定義されるXMLビューについて、それを利用できるデータ参照者を制限したいという要望がある。
これを実現することは簡単で、統合用メタデータにアクセス権を設定して、問い合わせを処理する際にデータ参照者のアクセス権を確認すれば済む。しかし、これだけでは次のような問題が残る。
統合用メタデータの作成やアクセス権の設定に失敗すると、想定外のデータが参照されてしまう。また、そうならないように気を付けなければならないので、統合用メタデータの作成に余計な労力が必要となる。
また、統合用メタデータ作成者には、システムの扱える全てのデータベーススキーマが見え、それらへのアクセス権が設定できてしまう。これは個々のデータベースの立場から見ると、多くのデータにアクセスできる権限の大きなユーザが外部に存在することになり、セキュリティ管理が甘くなることを意味する。例えば、悪意のある統合用メタデータ作成者が一人でもいると、想定外のデータを参照されてしまうことになる。
そこで、本実施例に係るメタデータ編集システムでは、統合用メタデータを作成する際に、DB情報パネル画面11に表示するデータベース情報(データベース名・テーブル名・カラム名)を、その統合用メタデータ作成者のアクセス権に応じたものに制限することによって、これらの問題を解決している。その手順は以下のようになっている。
まず予め、アカウント設定ファイルを準備する。このアカウント設定ファイルには、メタデータエディタ100から送信されるアカウント名と、データベース名と、そのアカウントがそのデータベースを参照する際に使用するDBアカウント名とが記述されている。このアカウント設定ファイルを編集する権限は統合参照サーバ20全体の管理者のみが保有し、統合用メタデータの作成者では編集できない。
統合参照サーバ20の中のDB監視デーモンは、常に一定間隔で全てのデータベースへアクセスし、その時点でのデータスキーマ情報(全テーブル名とそのカラム名)を獲得し、それをデータベースリスト情報として管理している。
この時に、通常はグリッド用の一般アカウント「grid_anonymous」でデータスキーマ情報を獲得するが、前述のアカウント設定ファイルに記述がある場合は、それら記述されているデータベースに関しては記述されているアカウントでもデータスキーマ情報を獲得する。こうして獲得されたデータスキーマ情報は、そのアカウントでのみ参照が許されているデータスキーマとして、「grid_anonymous」の分とは区別して管理される。
図5は、GRID一般アカウントでのデータスキーマ収集を示す図である。同図に示すように、統合参照サーバ20の中のDB監視デーモンが、「grid_anonymous」アカウントで定期的に、例えば「RDB1」や「RDB2」へアクセスし、その時点でのデータスキーマ情報を獲得し、それを「grid_anonymous」がアクセス可能なデータスキーマ一覧として管理している。ここで、データベースへのアクセスには、従来型の問い合わせ型データベース統合である「Globus Toolkit 3.2 + OGSA-DAI4.0」をそのまま利用している。
図6は、個別指定アカウントでのデータスキーマ収集を示す図である。同図に示すように、統合参照サーバ20が保持するアカウント設定ファイルに、DBアカウント名として「grid_user1」、「grid_user2」の二つがあるため、図5で示したGRID一般アカウントでのデータスキーマ収集と同時に、それぞれのアカウントでアクセス可能な「RDB1」、「RDB2」にアクセスし、データスキーマ情報を獲得し、それらをそれぞれ「grid_user1」、「grid_user2」がアクセス可能なデータスキーマ一覧として管理している。
そして、統合用メタデータの作成者がメタデータエディタ100にログインすると、その時点でメタデータエディタ100はDB監視デーモンが管理しているデータベースリスト情報を統合参照サーバ20に要求するが、同時にそのときにログインしたアカウントの情報を送り、統合参照サーバ20はアカウント設定ファイルを参照してそのアカウントに相当するデータベースリスト情報のみを返す。なお、アカウント設定ファイルに記述が無い場合は、グリッド一般アカウント「grid_anonymous」が指定されたものとみなす。
図7は、user1アカウントで利用可能なデータベースリスト情報を示す図である。同図に示すように、user1アカウントでメタデータエディタ100にログインすると、アカウント設定ファイルに記述されている「RDB1」に関しては、それに対応するDBアカウント「grid_user1」でアクセス可能なデータスキーマ一覧を、それ以外のデータベース(ここでは「RDB2」)に関しては、「grid_anonymous」でアクセス可能なデータスキーマ一覧をメタデータエディタ100に返す。
図8は、user3アカウントで利用可能なデータベースリスト情報を示す図である。同図に示すように、user3アカウントでメタデータエディタ100にログインすると、「RDB1」に関しては、アカウント設定ファイルに記述されている「grid_user1」でアクセス可能なデータスキーマ一覧を、「RDB2」に関しては、同じくアカウント設定ファイルに記述されている「grid_user2」でアクセス可能なデータスキーマ一覧をメタデータエディタ100に返す。
メタデータエディタ100は、統合参照サーバ20によって送り返されたデータベースリスト情報をDB情報パネル画面11に表示し、統合用メタデータ作成者にその情報で統合用メタデータを作成させる。
このように、統合参照サーバ20がアカウント設定ファイルを参照して統合用メタデータ作成者のアカウントに相当するデータベースリスト情報のみを返すことによって、メタデータエディタ100が表示するデータベース情報を、その統合用メタデータ作成者のアクセス権に応じたものに制限することができる。
次に、編集処理部140による統合用メタデータの作成手順について説明する。図9は、木構造の作成の概要を説明するための説明図である。同図に示すように、統合用メタデータ作成者は、DB情報パネル画面11から木構造に含めたいカラム要素をドラッグし、編集パネル画面12上の木構造の任意の要素の上にドロップすることにより、木構造を組み立てていく。
ここで、DB情報パネル画面11では、カラム要素のみがドラッグ可能となっており、このカラム要素を編集パネル画面12上の木構造の上にドロップする。なお、DB情報パネル画面11上の要素の名前と、編集パネル画面12上の要素の名前が必ずしも一致していないのは、編集パネル画面12上の要素の名前は変更することができるためである。
編集処理部140は、統合用メタデータ作成者がこの木構造を組み立てることに対応して、以下の手順で統合用メタデータを作成する。
統合用メタデータ作成者が木構造を初めて作成するときは、編集処理部140は、編集パネル画面12上に、カラム要素をドラッグ&ドロップするための要素を一つだけ配置する(図10)。
そして、統合用メタデータ作成者が、DB情報パネル画面11から、必要な要素を上記の要素にドラッグ&ドロップすると(図11(1))、編集処理部140は、最初の要素の横にドロップしたカラム要素を配置する(図11(2))。
これは、あるXMLエレメントの一段下位の階層に新たなXMLエレメントが追加されたことに相当する。カラム要素が追加されると、編集処理部140は、統合用メタデータの仮想XMLスキーマ情報を更新し、追加されたカラムがDB情報パネル画面11に表示されているスキーマの中のどの要素に対応しているのかという情報を、統合用メタデータのスキーマ・データベース対応関係情報に追加する。
さらに、統合用メタデータ作成者が新たなカラム要素を同様にドラッグ&ドロップすると(図12(3))、編集処理部140は、既に配置されているカラム要素のテーブルと、追加したカラム要素のテーブルを調べる。その結果、両者が同じテーブルなら、追加したカラム要素を、既に配置されているカラム要素と同じ階層に配置する(図12(4))。
一方、両者が違うテーブルなら、追加したカラム要素を、既に配置されているカラム要素の一段下位の階層に配置する(図13(5)、(6))。これは、図11の(2)と同様、既に配置されているカラム要素に相当するXMLエレメントの一段下位の階層に、さらに新たなXMLエレメントが追加されたことに相当する。
また、統合用メタデータ作成者が、既に配置されているカラム要素のテーブルと違うテーブルのカラム要素を追加した場合(図13(5))、両テーブルのどの要素とどの要素を関連付けるのか定義する必要があるため、編集処理部140は、関連付け部150を用いて、関連付け可能な要素の組み合わせ候補をリストアップする。
そして、統合用メタデータ作成者が、リストアップされた候補の中からある組み合わせを選ぶと、編集処理部140は、必要なカラム要素を自動的に追加・配置し、両者を関連付けの接続線で接続する(図13(7))。同時に、要素間関連付け情報を追加する。
そして、統合用メタデータ作成者が編集した統合用メタデータを保存すると、編集パネル画面12上の木構造を反映した仮想XMLスキーマ情報、編集中更新されたスキーマ・データベース対応関係情報、要素間関連付け情報をまとめ、情報問合部110を介して統合参照サーバ20に送る。
統合参照サーバ20がその情報を受け取ると、その情報からXMLファイルを生成し、統合用メタデータとしてメタデータ格納用リポジトリ21に保存する。なお、本実施例では、統合用メタデータの情報をXMLファイルに変換して保存しているが、ファイルではなくオブジェクトのまま保存しても同じことが実現できる。
このようにして組み立てられる木構造の階層構造はXMLの階層構造に相当し、木構造の各要素はXMLの各エレメントに相当する。通常は、木構造の要素一つが各データベースの要素一つに対応しているが、同種のデータが複数のデータベースに分かれて格納されていて、ある一つの値を持つデータに関してはそれらのいずれに格納されているか分からないような場合、それらのデータベースの各カラム要素を、木構造の一つのカラム要素に対応させることができる。
図14は、複数のデータを含むカラム要素を示す図である。同図において、製品コード「034564」の製品と製品コード「063200」の製品の在庫情報はstock1データベースのitem_stockテーブルに格納されているが、製品コード「087245」の製品の在庫情報はstock2データベースのstockテーブルに格納されている場合、両テーブルの製品コードのカラム要素「item_code, code」を木構造のstock_code要素に、両テーブルの在庫量のカラム「item_quantity, quantity」を木構造のstock_quantity要素にまとめて定義できる。
このように定義しておくことで、データ参照者がどの製品コードの製品がどのデータベースにあるかを知らなくても、統合参照サーバ20がstock1、stock2データベース両方にアクセスして、データを集めてくる。こうすることによって、別々のテーブルの別々のカラムに分かれて格納されているデータも、データ参照者には一つのカラムに格納されているように見える。
次に、統合参照サーバ20が生成するXML形式の統合用メタデータについて図15〜18を用いて説明する。図15は、XMLによる木構造の定義例を示す図である。同図に示すように、XMLによる木構造の定義は、編集パネル画面12上で表示される木構造の各要素をそのままXMLエレメントに置き換えた形になっており、各XMLエレメントにはIDが振られている。
図16および図17は、XMLによるスキーマ・データベース対応関係情報の例を示す図(1)および(2)である。図16および図17に示すように、このスキーマ・データベース対応関係情報は、木構造の各要素が各データベースのどの要素に対応しているかを示している。
また、このスキーマ・データベース対応関係情報は、データベース・テーブルごとにまとめられ、各データベース・テーブル・カラムはそれぞれIDで識別される。対応関係は、カラムのIDと図15で振られているXMLエレメントのIDで定義されている。カラムの実際の名前やデータ型は、そのIDを基に、統合参照サーバ20から取得したデータベースリスト情報から知ることができる。
図18は、XMLによる要素間の関連付け情報の例を示す図である。同図に示すように、要素間の関連付け情報は、どの要素とどの要素を関連付けているかを示し、対応関係は、XMLエレメントのID同士で定義されている。
次に、関連付け部150による要素間関連付けの詳細について説明する。複数のテーブルの要素同士の関連付けの際、関連付け部150は、以下の手順によって、統合用メタデータ作成者に関連付けの候補となる情報を提供し、関連付けを行う。
まず、関連付け部150は、既に配置されているカラム要素が属するテーブルと、追加しようとしたカラム要素が属するテーブルに対して、含まれるカラムを全て抽出する。例えば、図19に示すように、orderデータベースのORDER_ITEMテーブルとorderデータベースのORDERテーブルを関連付けようとしている場合、関連付け部150は、両テーブルの全カラムの名前、データ型を抽出する。
ここで、それぞれのカラム要素が属しているテーブル、およびそのテーブルに含まれるカラムの情報は、DB情報パネル画面11の表示時に取得した、データベースリスト情報の中に含まれている。
そして、抽出した全てのカラムのデータ型を調べる。ここで、カラムのデータ型は、DB情報パネル画面11の表示時に取得した、データベースリストの情報に含まれている。そして、二つのカラム群から、関連付けが可能なカラムの組み合わせを抽出する。このとき、カラムのデータ型を基に、関連付けが可能な組み合わせを絞り込む。
すなわち、ORDER_ITEMテーブルのカラム数「3」とORDERテーブルのカラム数「4」から、両者のカラム同士の組み合わせは12通りあるが、ORDER_ITEMテーブルのQUANTITYカラムのデータ型だけがINTEGERで他のカラムのデータ型CHARと異なるため、QUANTITYカラムを組み合わせから除外する。従って、組み合わせ候補は、図20に示すように、CHAR型のカラム同士の8通りである。
そして、上記組み合わせに含まれるカラムに対して、それらのカラムに関係する既存の関連付け情報がないか、統合参照サーバ20に問い合わせ、既存の関連付け情報が返ってきた場合はその情報を強調して関連付けが可能な組み合わせを表示し、既存の関連付け情報がなかった場合は関連付けが可能な組み合わせを表示する。
例えば、図21では、ORDER_ITEMテーブルのORDER_NOカラムとORDERテーブルのORDER_IDカラムの組み合わせに対して既存の関連付け情報があったため、ORDER_NOカラムとORDER_IDカラムの組み合わせを、確実に関連付け可能な組み合わせとしている。
そして、統合用メタデータ作成者が、表示された候補の中からある組み合わせを選ぶと、その組み合わせの中の二つのカラム要素が、編集パネル画面12上に既に配置されているか、もしくは統合用メタデータ作成者がドラッグ&ドロップしたカラム要素なのかを調べる。
その結果、両カラム要素の片方が編集パネル画面12上に既に配置されており、もう片方は統合用メタデータ作成者がドラッグ&ドロップしたカラム要素であった場合、両者を関連付けの接続線で接続する。一方、両カラム要素のいずれかが、編集パネル画面12上に配置されておらず、統合用メタデータ作成者がドラッグ&ドロップしたカラム要素でもない場合、DB情報パネル画面11から編集パネル画面12上にカラム要素を自動的に追加・配置し、両者を関連付けの接続線で接続する。
次に、関連付け部150による関連付け処理の処理手順をフローチャートを用いて説明する。図22は、関連付け部150による関連付け処理の処理手順を示すフローチャートである。なお、この関連付け処理は、既に配置されているカラム要素と異なるテーブルのカラム要素が編集パネル画面12上にドラッグ&ドロップされた場合に起動される。
同図に示すように、この関連付け処理では、既に配置されているカラム要素が属するテーブルAを求めてテーブルAが含んでいる全カラムを抽出し(ステップS101)、ドラッグ&ドロップされたカラム要素が属するテーブルBを求めて、テーブルBが含んでいる全カラムを抽出する(ステップS102)。
そして、テーブルAの全カラムとテーブルBの全カラムのデータ型を比較し(ステップS103)、データ型が一致したカラム同士を、関連付け可能な組み合わせ候補とする(ステップS104)。
そして、既存の関連付け情報問合せルーチンを呼び出し(ステップS105)、組み合わせ候補の中に既存の関連付け情報が存在するか否かを判定する(ステップS106)。その結果、組み合わせ候補の中に既存の関連付け情報が存在する場合には、その組み合わせ候補を強調して組み合わせ候補を表示し(ステップS107)、組み合わせ候補の中に既存の関連付け情報が存在しない場合には、全ての組み合わせ候補を同じ形態で表示する(ステップS108)。
そして、組み合わせ候補の中から統合用メタデータ作成者により選択された組み合わせを受け付け(ステップS109)、選択された組み合わせ中のテーブルAに属するカラムが、編集パネル画面12上に配置されているか否かを判定し(ステップS110)、配置されていない場合には、該当するカラム要素を自動配置する(ステップS111)。
そして、ドラッグ&ドロップされたカラム要素を自動配置し(ステップS112)、選択された組み合わせ中のテーブルBに属するカラムが、ドラッグ&ドロップしたカラム要素であるか否かを判定し(ステップS113)、ドラッグ&ドロップしたカラム要素でない場合には、該当するカラム要素を自動配置する(ステップS114)。
そして、選択された組み合わせ中の両カラムに相当する要素同士を、関連付けの接続線で接続し(ステップS115)、関連付けの接続線で接続したカラム要素の情報を統合用メタデータの要素間関連付け情報として保存する(ステップS116)。
このように、関連付け部150がデータ型に基づいて、関連付け可能なカラムの組み合わせ候補を抽出して表示するとともに、組み合わせ候補の中に既存の関連付けがある場合には、その候補を強調して表示することによって、統合用メタデータ作成者の関連付け作業を容易にすることができる。
なお、統合参照サーバ20は、以下のような手順で既存の関連付け情報を蓄積し、必要なときに情報を提供する。まず、作成された統合用メタデータを使って実際の問い合わせを行い、問い合わせ結果が返ってきた場合、その統合用メタデータの中で定義された関連付け情報を抽出する。
そして、抽出した関連付け情報をカラム毎にまとめ、カラムを識別する情報(データベース・テーブル・カラムの名前かIDもしくは両者)をキー、組み合わせ相手のカラムを識別する情報を値として保存する。
そして、カラムを識別する情報をキーとして関連付け情報の要求があった場合は、そのキーに対応する値を抽出し、指定されたカラムに関係する既存の関連付け情報として返す。
次に、既存の関連付け情報問い合わせルーチンの処理手順について説明する。図23は、既存の関連付け情報問い合わせルーチンの処理手順を示すフローチャートである。同図に示すように、既存の関連付け情報問い合わせルーチンは、組み合わせ候補の中のテーブルAのカラムを一つ選択し(ステップS201)、選択したカラムのDB・テーブル・カラムIDを統合参照サーバ20に送り、そのカラムに関係する、既存の関連付け情報がないか問い合わせる(ステップS202)。
その結果、統合参照サーバ20が既存の関連付け情報が存在すると回答した場合には(ステップS203、Yes)、統合参照サーバ20から既存の関連付け情報を受け取り(ステップS204)、受け取った情報の中の組み合わせで、かつ組み合わせ候補の中に存在するものを、組み合わせ候補に関係する既存の関連付け情報とする(ステップS205)。
そして、組み合わせ候補の中のテーブルAの全カラムについて問い合わせたか否かを判定し(ステップS206)、全カラムについて問い合わせていない場合には、ステップS201に戻って次のカラムを選択し、全カラムについて問い合わせた場合には、処理を終了する。
このように、この既存の関連付け情報問い合わせルーチンが、統合参照サーバ20に既存の関連付け情報を問い合わせ、組み合わせ候補の中にある既存の関連付け情報を確認することによって、実績のある関連付けを統合用メタデータに示し、統合用メタデータ作成者の関連付け作業を容易にすることができる。
次に、関連付けチェック部160の関連付けチェック処理の詳細について説明する。関連付けチェック部160は、統合用メタデータの編集中に関連付けが指定された際に、その関連付けが妥当であるか否かをチェックする。
関連付けが指定されると、統合されたデータを提供する際に指定された両テーブルのレコード同士をジョインすることになるので、関連付けで指定された両テーブルのカラム同士は同じ値の集合を取らなければならない。もし、両カラムが全く別々の値を取るものであると、統合されたデータを作成する過程でジョインができず、該当する統合データが存在しないことになり、その統合用メタデータが意味の無いものになる。従って、この関連付けチェック部160による関連付けチェック処理は、重要な処理となる。
具体的には、関連付けチェック部160は、指定された両テーブルから実際のデータをサンプリングしてきて、そのサンプリングしてきたデータを統計学的に分析し、両カラムの値が関連しているかどうかをチェックする。
図24は、関連付けチェック処理の概要を説明するための説明図である。同図は、注文商品テーブルの商品コードと取扱商品テーブルのコードを関連付ける場合の関連付けチェック処理を示している。同図に示すように、関連付けチェック部160は、注文商品テーブルの商品コードおよび取扱商品テーブルのコードから実際のデータをサンプリングし、サンプリングしたデータ間の関連性を統計分析によって判定することによって、関連付けをチェックする。
ここで、関連付けチェックを単純に実行するならば、片方のテーブルからサンプリングしてきたデータがもう片方に含まれているかどうかを調べ、その割合で判断するということが考えられる。しかし、これでは以下の点で上手くいかないことが考えられる。
偶然の一致:例えば両カラムのデータ型が数字2桁でデータ数が十分に多いとすると、00〜99の100種類の値全てが存在することがあり、その場合は(意味的には関係なくても)データが偶然一致することになる。
冗長性によるサンプル数の変動:例えば、1万件のデータの中から100件をサンプリングしてきても、その中に冗長なものが多くて、実際には10種類しかデータが無かった場合、その10種類のデータのみで、関連付けしようとする相手のデータと比較をすると、偶然に含まれる確率が高まる。サンプリングしたデータのうち冗長を省いたデータの数が少ないほど、その確率は高くなる。
そこで、関連付けチェック部160は、以下の手順で関連付けのチェックを行っている。まず、図25に示すように、Aから一定件数をサンプリングし、サンプリングした個々についてBに含まれているかどうかを調べ、その割合を求める。
また、Bから適当な数のデータをサンプリングし、冗長を省いたデータ数を数える。そして、この操作を、サンプル数を段階的に増加させて何回か行う。すると、図26に示すように、あるサンプル数の時の冗長を省いたデータ件数はある漸化式で表わすことができ、その漸化式から、全データをサンプルした時の冗長を省いたデータ件数、すなわち冗長を省いた全データ件数を推定する。ここで、冗長を省いた全データ件数を推定するのは、全データをサンプルすることがネットワーク性能上非現実的であるためであり、冗長を省いた全データ件数は、なるべく少ないサンプル量で推定する必要がある。また、冗長を省いた全データ件数の推定に用いる漸化式は、図27に示すように、繰り返しコンピュータで計算して最適値を求める方法と、値の取り得る範囲を求める方法がある。なお、Bのカラムにデータベースのユニーク制約が付いている場合は冗長なデータは存在しないので、全データ件数が冗長を省いた全データ件数となり、冗長を省いた全データ件数の推定は必要ない。
そして、冗長を省いたBのデータ数から、Bの濃度(データのカバー率)を推定する。ここで、
Bの濃度=冗長を省いたBのデータ数/集合の大きさ
集合の大きさ=1桁のデータの種類^桁数
であり、Bの濃度は、Aから抽出したデータがBに偶然に含まれる確率を表わしている。
例えば、図28に示す集合A、Bのようにデータが4桁の数値の場合、値の1桁のデータの種類は0〜9の10種類であり、それが4桁あるため、集合全体の大きさは10の4乗の10,000となる。つまり、集合Bは最大10,000通りの値を含んでいる可能性がある。しかし実際には、そもそも集合Bの全データ数が10,000未満であったり、冗長があった場合、集合Bの冗長を省いたデータ数は10,000より低くなる。その割合が集合Bの濃度、つまり任意の4桁の数値が集合Bに含まれている確率である。図28では、0.14がBの濃度である。
そして、図29に示すように、Aから抽出したサンプルがBに含まれている割合とBの濃度を比較し、統計的に関連があると言えるか検定する。そして、検定結果を表示することによって、統合用メタデータ作成者は指定した関連付けが妥当であるか否かを知ることができる。
なお、本実施例では統合用メタデータ作成者が関連付けを指定したタイミングでチェックすることにしているが、同様にして、統合用メタデータ作成者が一つの統合用メタデータを作成し終わったタイミングで、一括してチェックを行うことも可能である。
次に、関連付けチェック部160による関連付けチェック処理の処理手順をフローチャートを用いて説明する、図30は、関連付けチェック部160による関連付けチェック処理の処理手順を示すフローチャートである。
同図に示すように、この関連付けチェック部160は、Aからデータサンプルを抽出し(ステップS301)、統合参照サーバ20を介してBのデータベースに問い合わせを行い、抽出したAのサンプルデータがBに含まれる割合を求める(ステップS302)。
一方、Bにユニーク制約があるか否かを調べ(ステップS303)、Bにユニーク制約がない場合には、統合参照サーバ20を介してBのデータベースに問い合わせを行い、Bから特定個数のデータを抜き出して、冗長なものを取り除いた個数を調べる(ステップS304)。そして、冗長を省いたBの全データ数を推定し(ステップS305)、Bの濃度を求める(ステップS306)。なお、Bにユニーク制約がある場合には、Bの全データ件数を用いてBの濃度を求める(ステップS306)。
そして、ステップS302で求めた、AのサンプルデータがBに含まれる割合がBの濃度に比べて有意であるか否かを判定し(ステップS307)、有意である場合には、関連付けは妥当と判定し(ステップS308)、有意でない場合には、関連付けは妥当であるとは言えないと判定する(ステップS309)。
このように、関連付けチェック部160が、AのサンプルデータがBに含まれる割合がBの濃度に比べて有意であるか否かを判定して関連付けの妥当性を判定することによって、メタデータエディタ100は、統合用メタデータ作成者に対して関連付けの妥当性を表示することができる。
次に、整合性チェック部170による統合用メタデータの整合性チェックについて説明する。統合対象のデータベースに変更が生じると、統合用メタデータの方もそれに合わせて修正する必要がある。木構造は、作成時に利用可能である(利用可否フラグ=true)データのみを使って作成される。一方、データベースに変更が生じると、そのデータの利用可否フラグがfalseになる。名前が変わっただけの場合でも、名前が変わる前のデータの利用可否フラグをfalseとし、名前が変わった後のデータを新規のデータ(利用可否フラグ=true)として登録する。
そこで、整合性チェック部170は、木構造とデータベースリスト情報を比較して整合性をチェックし、矛盾する箇所があれば、そこが修正するべき箇所であることを表示する。以下、図31を用いてその手順を説明する。
統合用メタデータのスキーマ・データベース対応関係情報(図31(1))を基に、木構造のあるカラム要素に関して、データベースリスト情報の中から、そのカラムに該当する情報を探し出す(図31(2))。
そして、抽出した情報から、そのカラム、そのカラムを含むテーブル、そのテーブルを含むデータベースの利用可否フラグを調べる(図31(3))。その結果、いずれの利用可否フラグも利用可能なら、木構造の中のそのカラム要素について、修正は必要ないと判断する。一方、いずれかの利用可否フラグが利用不可なら、木構造の中のそのカラム要素について、修正が必要と判断する。
このような操作を木構造の中の全てのカラム要素に対して行い、修正が必要と判断されたカラム要素に対して修正が必要であることを表示する(図31(4))。そして、編集パネル画面12上の木構造の該当部分が統合用メタデータ作成者によって修正されると、統合用メタデータの中の、仮想XMLスキーマ情報、スキーマ・データベース対応関係情報、要素間関連付け情報、全てを更新する。従って、統合用メタデータ作成者は、表示された情報を基に、編集パネル上の木構造の該当部分を修正するだけでよい。
このように、整合性チェック部170が、木構造の中の全てのカラム要素に対して利用可否を判定し、利用不可の場合には、そのカラム要素に対して修正が必要であることを表示することによって、統合用メタデータ作成者は、データベースと整合のとれていない統合用メタデータを容易に修正することができる。
次に、本実施例に係るメタデータエディタを実行するコンピュータシステムについて説明する。図32は、本実施例に係るメタデータエディタを実行するコンピュータシステムを示す図である。
同図に示すように、このコンピュータシステム200は、本体部201と、本体部201からの指示により表示画面202aに情報を表示するディスプレイ202と、このコンピュータシステム200に種々の情報を入力するためのキーボード203と、ディスプレイ202の表示画面202a上の任意の位置を指定するマウス204と、LAN206または広域エリアネットワーク(WAN)に接続するLANインタフェースと、公衆回線207に接続するモデムとを有する。
ここで、LAN206は、統合参照サーバ20や他のコンピュータシステム(PC)211、サーバ212、プリンタ213などとコンピュータシステム200とを接続している。
また、図33は、図32に示した本体部201の構成を示す機能ブロック図である。同図に示すように、この本体部201は、CPU221と、RAM222と、ROM223と、ハードディスクドライブ(HDD)224と、CD−ROMドライブ225と、FDドライブ226と、I/Oインタフェース227と、LANインタフェース228と、モデム229とを有する。
そして、このコンピュータシステム200において実行されるメタデータエディタ100は、フロッピィディスク(FD)208、CD−ROM209、DVDディスク、光磁気ディスク、ICカードなどの可搬型記憶媒体に記憶され、これらの記憶媒体から読み出されてコンピュータシステム200にインストールされる。
あるいは、このメタデータエディタ100は、LANインタフェース228を介して接続された統合参照サーバ20やサーバ212のデータベース、他のコンピュータシステム(PC)211のデータベースなどに記憶され、これらのデータベースから読み出されてブラウザのプラグインプログラムなどとしてコンピュータシステム200にインストールされる。
そして、インストールされたメタデータエディタ100は、HDD224に記憶され、RAM222、ROM223などを利用してCPU221により実行される。
上述してきたように、本実施例では、統合用メタデータ作成者がDB情報パネル画面11および編集パネル画面12を用いて行うドラッグ&ドロップ操作に対応して編集処理部140が統合用メタデータの情報を編集し、カラム同士の関連付けが可能になると関連付け部150が関連付け組み合わせ候補を表示し、統合用メタデータ作成者が関連付け組み合わせを指定すると関連付けチェック部160が関連付けの妥当性を統計的に判定して表示し、統合用メタデータがデータベースと整合性がとれていないときは整合性チェック部170が修正の必要なカラム要素に対して修正が必要であることを表示することとしたので、統合用メタデータ作成者は、効率良く統合用メタデータを作成することができる。
なお、本実施例では、メタデータエディタ100が統合用メタデータ情報を統合参照サーバ20へ送信し、統合参照サーバ20がXML形式の統合用メタデータに変換してメタデータ格納用リポジトリ21に格納する場合について説明したが、本発明はこれに限定されるものではなく、例えば、メタデータエディタ100が統合用メタデータ情報をXML形式の統合用メタデータに変換して統合参照サーバ20へ送信する場合にも同様に適用することができる。
また、本実施例では、メタデータエディタ100をクライアント10で動作させる場合について説明したが、本発明はこれに限定されるものではなく、例えば、メタデータエディタ100を統合参照サーバ20で動作させる場合にも同様に適用することができる。
また、本実施例では、メタデータエディタ100は、統合参照サーバ20を介してデータベースのスキーマ情報を取得する場合について説明したが、本発明はこれに限定されるものではなく、例えば、メタデータエディタ100が直接データベースのスキーマ情報を取得する場合にも同様に適用することができる。
(付記1)複数のデータベースに分散しているデータを仮想的に一つの統合データベースとして参照可能とするデータベース統合参照装置がデータの統合に用いる統合用メタデータを編集するメタデータエディタプログラムであって、
前記複数のデータベースのスキーマを表示し、該表示したスキーマを構成する要素から統合用メタデータ作成者により選択されて木構造に配置された要素に基づいて前記統合用メタデータを編集する編集手順と、
前記編集手順により編集された統合用メタデータを前記データベース統合参照装置に送信する送信手順と、
をコンピュータに実行させることを特徴とするメタデータエディタプログラム。
(付記2)前記データベースは、リレーショナルデータベースであり、前記要素は、リレーショナルデータベースのカラムであることを特徴とする付記1に記載のメタデータエディタプログラム。
(付記3)前記編集手順は、画面上に表示したスキーマを構成する要素から統合用メタデータ作成者によりドラッグされ、統合用メタデータを編集する画面にドロップされて木構造に配置された要素に基づいて前記統合用メタデータを編集することを特徴とする付記1または2に記載のメタデータエディタプログラム。
(付記4)前記編集手順は、統合用メタデータ作成者がアクセス権限を有する範囲のスキーマを表示することを特徴とする付記1または2に記載のメタデータエディタプログラム。
(付記5)前記編集手順は、編集中の統合用メタデータに含まれるテーブルとは異なるテーブルのカラムが新たに統合用メタデータに追加された場合に、異なるテーブルに属するカラム間の関連付けが可能な組み合わせ候補を表示することを特徴とする付記2に記載のメタデータエディタプログラム。
(付記6)前記編集手順は、過去に作成された統合用メタデータにおいて関連付けられた組み合わせ候補がある場合には、該組み合わせ候補の情報を提供することを特徴とする付記5に記載のメタデータエディタプログラム。
(付記7)前記編集手順は、カラムのデータ型が同じ場合にカラム間の関連付けが可能な組み合わせ候補とすることを特徴とする付記5または6に記載のメタデータエディタプログラム。
(付記8)前記編集手順は、異なる要素間の関連付けが指定された場合に、該指定された関連付けが正しいか否かを判定して表示することを特徴とする付記1または2に記載のメタデータエディタプログラム。
(付記9)前記編集手順は、関連付けが指定されたそれぞれの要素の実データ間の関連性を統計的に分析することによって、指定された関連付けが正しいか否かを判定することを特徴とする付記8に記載のメタデータエディタプログラム。
(付記10)前記編集手順は、一方の要素の実データが他方の要素の実データに含まれる確率が有意であるか否かによって、指定された関連付けが正しいか否かを判定することを特徴とする付記9に記載のメタデータエディタプログラム。
(付記11)前記編集手順は、一方の要素の実データをサンプリングして該サンプリングした実データが他方の要素の実データに含まれる確率と、該他方の要素の値域の集合の濃度とを算出し、該算出した二つの値に基づいて該確率が有意であるか否かを判定することを特徴とする付記10に記載のメタデータエディタプログラム。
(付記12)前記編集手順は、統合用メタデータの作成に用いられたスキーマに変更があった場合に、統合用メタデータのうち変更されたスキーマに対応する箇所の修正が必要であるという情報を提供することを特徴とする付記1または2に記載のメタデータエディタプログラム。
(付記13)前記編集手順は、前記データベース統合参照装置から過去に作成された統合用メタデータを受け取って編集を開始する際に、該受け取った統合用メタデータの作成に用いられたスキーマに変更があったか否かを判定することを特徴とする付記12に記載のメタデータエディタプログラム。
(付記14)複数のデータベースに分散しているデータを仮想的に一つの統合データベースとして参照可能とする場合に用いられる統合用メタデータを編集するメタデータエディタプログラムであって、
前記複数のデータベースのスキーマを表示し、該表示したスキーマを構成する要素から統合用メタデータ作成者により選択されて木構造に配置された要素に基づいて前記統合用メタデータを編集する編集手順と、
前記編集手順により編集された統合用メタデータを記憶装置に格納する格納手順と、
をコンピュータに実行させることを特徴とするメタデータエディタプログラム。
(付記15)前記格納手順は、統合用メタデータをXML形式で格納することを特徴とする付記14に記載のメタデータエディタプログラム。
(付記16)前記複数のデータベースから所定の時間間隔でスキーマに関する情報を取得するデータベース監視手順をさらにコンピュータに実行させ、
前記編集手順は、前記データベース監視手順により取得されたスキーマに関する情報を用いてスキーマを表示することを特徴とする付記14または15に記載のメタデータエディタプログラム。
(付記17)前記データベース監視手順は、統合用メタデータ作成者が各データベースに対して有するアクセス権限の範囲でスキーマに関する情報を取得し、前記編集手順は、統合用メタデータ作成者が各データベースに対して有するアクセス権限の範囲でスキーマを表示することを特徴とする付記16に記載のメタデータエディタプログラム。
(付記18)複数のデータベースに分散しているデータを仮想的に一つの統合データベースとして参照可能とするデータベース統合参照装置がデータの統合に用いる統合用メタデータを編集するメタデータエディタプログラムを記録したコンピュータ読み取り可能な記録媒体であって、
前記複数のデータベースのスキーマを表示し、該表示したスキーマを構成する要素から統合用メタデータ作成者により選択されて木構造に配置された要素に基づいて前記統合用メタデータを編集する編集手順と、
前記編集手順により編集された統合用メタデータを前記データベース統合参照装置に送信する送信手順と、
をコンピュータに実行させるメタデータエディタプログラムを記録したことを特徴とするコンピュータ読み取り可能な記録媒体。
(付記19)複数のデータベースに分散しているデータを仮想的に一つの統合データベースとして参照可能とするデータベース統合参照装置がデータの統合に用いる統合用メタデータを編集するメタデータ編集方法であって、
前記複数のデータベースのスキーマを表示し、該表示したスキーマを構成する要素から統合用メタデータ作成者により選択されて木構造に配置された要素に基づいて前記統合用メタデータを編集する編集工程と、
前記編集工程により編集された統合用メタデータを前記データベース統合参照装置に送信する送信工程と、
を含んだことを特徴とするメタデータ編集方法。
(付記20)複数のデータベースに分散しているデータを仮想的に一つの統合データベースとして参照可能とするデータベース統合参照装置がデータの統合に用いる統合用メタデータを編集するメタデータ編集装置であって、
前記複数のデータベースのスキーマを表示し、該表示したスキーマを構成する要素から統合用メタデータ作成者により選択されて木構造に配置された要素に基づいて前記統合用メタデータを編集する編集手段と、
前記編集手段により編集された統合用メタデータを前記データベース統合参照装置に送信する送信手段と、
を備えたことを特徴とするメタデータ編集装置。
以上のように、本発明に係るメタデータエディタプログラムおよびその記録媒体、メタデータ編集方法ならびにメタデータ編集装置は、複数のデータベースに分散しているデータを仮想的に一つの統合データベースとして参照可能とするデータベースシステムに有用である。
本実施例に係るメタデータエディタが提供する画面の一例を示す図である。 本実施例に係るメタデータ編集システムのシステム構成を示す機能ブロック図である。 DB情報パネル画面に表示されるスキーマとデータベースリスト情報の関係を説明するための説明図である。 木構造とXMLビューの関係の一例を示す図である。 GRID一般アカウントでのデータスキーマ収集を示す図である。 個別指定アカウントでのデータスキーマ収集を示す図である。 user1アカウントで利用可能なデータベースリスト情報を示す図である。 user3アカウントで利用可能なデータベースリスト情報を示す図である。 木構造の作成の概要を説明するための説明図である。 木構造の作成手順を示す図(その1)である。 木構造の作成手順を示す図(その2)である。 木構造の作成手順を示す図(その3)である。 木構造の作成手順を示す図(その4)である。 複数のデータを含むカラム要素を示す図である。 XMLによる木構造の定義例を示す図である。 XMLによるスキーマ・データベース対応関係情報の例を示す図(1)である。 XMLによるスキーマ・データベース対応関係情報の例を示す図(2)である。 XMLによる要素間の関連付け情報の例を示す図である。 関連付けの手順を示す図(その1)である。 関連付けの手順を示す図(その2)である。 関連付けの手順を示す図(その3)である。 関連付け部による関連付け処理の処理手順を示すフローチャートである。 既存の関連付け情報問い合わせルーチンの処理手順を示すフローチャートである。 関連付けチェック処理の概要を説明するための説明図である。 関連付けのチェック手順を示す図(その1)である。 関連付けのチェック手順を示す図(その2)である。 関連付けのチェック手順を示す図(その3)である。 関連付けのチェック手順を示す図(その4)である。 関連付けのチェック手順を示す図(その5)である。 関連付けチェック部による関連付けチェック処理の処理手順を示すフローチャートである。 整合性チェック部による統合用メタデータの整合性チェックを説明するための説明図である。 本実施例に係るメタデータエディタを実行するコンピュータシステムを示す図である。 図32に示した本体部の構成を示す機能ブロック図である。
符号の説明
10 クライアント
11 DB情報パネル画面
12 編集パネル画面
20 統合参照サーバ
21 メタデータ格納用リポジトリ
100 メタデータエディタ
110 情報問合部
120 DB情報パネル
130 編集パネル
140 編集処理部
150 関連付け部
160 関連付けチェック部
170 整合性チェック部
200,211 コンピュータシステム
201 本体部
202 ディスプレイ
202a 表示画面
203 キーボード
204 マウス
206 LAN
207 公衆回線
208 フロッピィディスク
209 CD−ROM
212 サーバ
213 プリンタ
221 CPU
222 RAM
223 ROM
224 ハードディスクドライブ
225 CD−ROMドライブ
226 フロッピィディスクドライブ
227 I/Oインタフェース
228 LANインタフェース
229 モデム

Claims (9)

  1. 複数のリレーショナルデータベースに分散しているデータを仮想的に一つの統合データベースとして参照可能とするデータベース統合参照装置がデータの統合に用いる統合用メタデータを作成するメタデータエディタプログラムであって、
    前記複数のリレーショナルデータベースのスキーマを表示し、該表示したスキーマを構成するリレーショナルデータベースのカラムから統合用メタデータ作成者により選択されて木構造に配置されたカラムに基づいて、当該木構造を示す前記統合用メタデータを作成する作成手順と、
    前記作成手順により作成された統合用メタデータを前記データベース統合参照装置に送信する送信手順と、
    前記木構造に既に配置されているカラムが属するテーブルから該テーブルに含まれる一つ又は複数のカラムを抽出し、抽出した一つ又は複数のカラムのデータ型を識別する第1の識別手順と、
    前記統合用メタデータに既に含まれていたカラムが属するテーブルとは異なるテーブルに属するカラムを含む当該統合用メタデータが新たに作成されると、新たに追加されたカラムが属するテーブルから該テーブルに含まれる一つ又は複数のカラムを抽出し、抽出した一つ又は複数のカラムのデータ型を識別する第2の識別手順と、
    前記作成手順により作成中の前記統合用メタデータに異なるテーブルのカラムが追加されると、前記第1の識別手順によりデータ型が識別されたカラムと、前記第2の識別手順によりデータ型が識別されたカラムとの組み合わせのうち、識別されたデータ型が同一となるカラムの組み合わせを表示する組み合わせ表示手順と、
    をコンピュータに実行させることを特徴とするメタデータエディタプログラム。
  2. 複数のデータベースに分散しているデータを仮想的に一つの統合データベースとして参照可能とするデータベース統合参照装置がデータの統合に用いる統合用メタデータを作成するメタデータエディタプログラムであって、
    前記複数のデータベースのスキーマを表示し、該表示したスキーマを構成するカラムから統合用メタデータ作成者により選択されて木構造に配置されたカラムに基づいて、当該木構造を示す前記統合用メタデータを作成する作成手順と、
    前記作成手順により作成された統合用メタデータを前記データベース統合参照装置に送信する送信手順と、
    前記作成手順により作成された前記統合用メタデータにて、それぞれ異なるテーブルに含まれる二つのカラムが、意味が同じものであると前記統合用メタデータ作成者により関連付けられると、前記統合用メタデータ作成者により関連づけられたカラムのうち一方のカラムについて、当該カラムの属するテーブルの当該カラムのデータのうち所定数のデータをサンプリングし、サンプリングしたデータが他方のカラムのデータに含まれる確率を算出する第1の算出手順と、
    前記他方のカラムについて、該他方のカラムの属するテーブルの該他方のカラムのデータから所定数のデータをサンプリングして冗長を省くことで、該他方のカラムの冗長を省いたデータ数を算出する第2の算出手順と、
    前記第2の算出手順により算出されたデータ数を分子とし、前記他方のカラムにおいて実データがとり得る値の総数を分母とする値を算出することで、前記一方のカラムの実データが該他方のカラムに偶然に含まれる確率を算出する第3の算出手順と、
    前記第3の算出手順により算出された確率と前記第1の算出手順により算出された確率とを比較することで2つの該確率が統計的に関連があるか否かを判定し、関連がある場合には前記統合用メタデータ作成者による関連付けが正しいと判定し、関連がない場合には該関連付けが正しくないと判定する判定手順と、
    前記判定手順による判定結果を表示する判定結果表示手順と、
    をコンピュータに実行させることを特徴とするメタデータエディタプログラム。
  3. 複数のデータベースに分散しているデータを仮想的に一つの統合データベースとして参照可能とするデータベース統合参照装置がデータの統合に用いる統合用メタデータを作成するメタデータエディタプログラムであって、
    前記複数のデータベースのスキーマを表示し、該表示したスキーマを構成するカラムから統合用メタデータ作成者により選択されて木構造に配置されたカラムに基づいて、当該木構造を示す前記統合用メタデータを作成する作成手順と、
    前記作成手順により作成された統合用メタデータを前記データベース統合参照装置に送信する送信手順と、
    前記データベースのカラムごとに変更が生じたか否かを示す可否フラグを管理する管理手順と、
    前記木構造に配置されているカラムについて前記管理手順により管理された可否フラグを取得し、変更が生じた旨を示す可否フラグに対応付けられたカラムについて修正が必要であると判断する判断手順と、
    前記判断手順により修正が必要であると判断されたカラムについて、修正が必要である旨を表示する修正表示手順と、
    をコンピュータに実行させることを特徴とするメタデータエディタプログラム。
  4. 複数のリレーショナルデータベースに分散しているデータを仮想的に一つの統合データベースとして参照可能とするデータベース統合参照装置がデータの統合に用いる統合用メタデータを作成するメタデータエディタ装置であって、
    前記複数のリレーショナルデータベースのスキーマを表示し、該表示したスキーマを構成するリレーショナルデータベースのカラムから統合用メタデータ作成者により選択されて木構造に配置されたカラムに基づいて、当該木構造を示す前記統合用メタデータを作成する作成部と、
    前記作成部により作成された統合用メタデータを前記データベース統合参照装置に送信する送信部と、
    前記木構造に既に配置されているカラムが属するテーブルから該テーブルに含まれる一つ又は複数のカラムを抽出し、抽出した一つ又は複数のカラムのデータ型を識別する第1の識別部と、
    前記統合用メタデータに既に含まれていたカラムが属するテーブルとは異なるテーブルに属するカラムを含む当該統合用メタデータが新たに作成されると、新たに追加されたカラムが属するテーブルから該テーブルに含まれる一つ又は複数のカラムを抽出し、抽出した一つ又は複数のカラムのデータ型を識別する第2の識別部と、
    前記作成部により作成中の前記統合用メタデータに異なるテーブルのカラムが追加されると、前記第1の識別部によりデータ型が識別されたカラムと、前記第2の識別部によりデータ型が識別されたカラムとの組み合わせのうち、識別されたデータ型が同一となるカラムの組み合わせを表示する組み合わせ表示部と、
    を備えたことを特徴とするメタデータエディタ装置。
  5. 複数のデータベースに分散しているデータを仮想的に一つの統合データベースとして参照可能とするデータベース統合参照装置がデータの統合に用いる統合用メタデータを作成するメタデータエディタ装置であって、
    前記複数のデータベースのスキーマを表示し、該表示したスキーマを構成するカラムから統合用メタデータ作成者により選択されて木構造に配置されたカラムに基づいて、当該木構造を示す前記統合用メタデータを作成する作成部と、
    前記作成部により作成された統合用メタデータを前記データベース統合参照装置に送信する送信部と、
    前記作成部により作成された前記統合用メタデータにて、それぞれ異なるテーブルに含まれる二つのカラムが、意味が同じものであると前記統合用メタデータ作成者により関連付けられると、前記統合用メタデータ作成者により関連づけられたカラムのうち一方のカラムについて、当該カラムの属するテーブルの当該カラムのデータのうち所定数のデータをサンプリングし、サンプリングしたデータが他方のカラムのデータに含まれる確率を算出する第1の算出部と、
    前記他方のカラムについて、該他方のカラムの属するテーブルから該他方のカラムの実データから所定数のデータをサンプリングして冗長を省くことで、該他方のカラムの冗長を省いたデータ数を算出する第2の算出部と、
    前記第2の算出部により算出されたデータ数を分子とし、前記他方のカラムにおいて実データがとり得る値の総数を分母とする値を算出することで、前記一方のカラムの実データが該他方のカラムに偶然に含まれる確率を算出する第3の算出部と、
    前記第3の算出部により算出された確率と前記第1の算出部により算出された確率とを比較することで2つの該確率が統計的に関連があるか否かを判定し、関連がある場合には前記統合用メタデータ作成者による関連付けが正しいと判定し、関連がない場合には該関連付けが正しくないと判定する判定部と、
    前記判定部による判定結果を表示する判定結果表示部と、
    を備えたことを特徴とするメタデータエディタ装置。
  6. 複数のデータベースに分散しているデータを仮想的に一つの統合データベースとして参照可能とするデータベース統合参照装置がデータの統合に用いる統合用メタデータを作成するメタデータエディタ装置であって、
    前記複数のデータベースのスキーマを表示し、該表示したスキーマを構成するカラムから統合用メタデータ作成者により選択されて木構造に配置されたカラムに基づいて、当該木構造を示す前記統合用メタデータを作成する作成部と、
    前記作成部により作成された統合用メタデータを前記データベース統合参照装置に送信する送信部と、
    前記データベースのカラムごとに変更が生じたか否かを示す可否フラグを管理する管理部と、
    前記木構造に配置されているカラムについて前記管理部により管理された可否フラグを取得し、変更が生じた旨を示す可否フラグに対応付けられたカラムについて修正が必要であると判断する判断部と、
    前記判断部により修正が必要であると判断されたカラムについて、修正が必要である旨を表示する修正表示部と、
    を備えたことを特徴とするメタデータエディタ装置。
  7. 複数のリレーショナルデータベースに分散しているデータを仮想的に一つの統合データベースとして参照可能とするデータベース統合参照装置がデータの統合に用いる統合用メタデータを作成するメタデータエディタ方法であって、
    コンピュータが
    前記複数のリレーショナルデータベースのスキーマを表示し、該表示したスキーマを構成するリレーショナルデータベースのカラムから統合用メタデータ作成者により選択されて木構造に配置されたカラムに基づいて、当該木構造を示す前記統合用メタデータを作成する作成工程と、
    前記作成工程により作成された統合用メタデータを前記データベース統合参照装置に送信する送信工程と、
    前記木構造に既に配置されているカラムが属するテーブルから該テーブルに含まれる一つ又は複数のカラムを抽出し、抽出した一つ又は複数のカラムのデータ型を識別する第1の識別工程と、
    前記統合用メタデータに既に含まれていたカラムが属するテーブルとは異なるテーブルに属するカラムを含む当該統合用メタデータが新たに作成されると、新たに追加されたカラムが属するテーブルから該テーブルに含まれる一つ又は複数のカラムを抽出し、抽出した一つ又は複数のカラムのデータ型を識別する第2の識別工程と、
    前記作成工程により作成中の前記統合用メタデータに異なるテーブルのカラムが追加されると、前記第1の識別工程によりデータ型が識別されたカラムと、前記第2の識別工程によりデータ型が識別されたカラムとの組み合わせのうち、識別されたデータ型が同一となるカラムの組み合わせを表示する組み合わせ表示工程と、
    を実行することを特徴とするメタデータエディタ方法。
  8. 複数のデータベースに分散しているデータを仮想的に一つの統合データベースとして参照可能とするデータベース統合参照装置がデータの統合に用いる統合用メタデータを作成するメタデータエディタ方法であって、
    コンピュータが、
    前記複数のデータベースのスキーマを表示し、該表示したスキーマを構成するカラムから統合用メタデータ作成者により選択されて木構造に配置されたカラムに基づいて、当該木構造を示す前記統合用メタデータを作成する作成工程と、
    前記作成工程により作成された統合用メタデータを前記データベース統合参照装置に送信する送信工程と、
    前記作成工程により作成された前記統合用メタデータにて、それぞれ異なるテーブルに含まれる二つのカラムが、意味が同じものであると前記統合用メタデータ作成者により関連付けられると、前記統合用メタデータ作成者により関連づけられたカラムのうち一方のカラムについて、当該カラムの属するテーブルの当該カラムのデータのうち所定数のデータをサンプリングし、サンプリングしたデータが他方のカラムのデータに含まれる確率を算出する第1の算出工程と、
    前記他方のカラムについて、該他方のカラムの属するテーブルから該他方のカラムの実データから所定数のデータをサンプリングして冗長を省くことで、該他方のカラムの冗長を省いたデータ数を算出する第2の算出工程と、
    前記第2の算出工程により算出されたデータ数を分子とし、前記他方のカラムにおいて実データがとり得る値の総数を分母とする値を算出することで、前記一方のカラムの実データが該他方のカラムに偶然に含まれる確率を算出する第3の算出工程と、
    前記第3の算出工程により算出された確率と前記第1の算出工程により算出された確率とを比較することで2つの該確率が統計的に関連があるか否かを判定し、関連がある場合には前記統合用メタデータ作成者による関連付けが正しいと判定し、関連がない場合には該関連付けが正しくないと判定する判定工程と、
    前記判定工程による判定結果を表示する判定結果表示工程と、
    を実行することを特徴とするメタデータエディタ方法。
  9. 複数のデータベースに分散しているデータを仮想的に一つの統合データベースとして参照可能とするデータベース統合参照装置がデータの統合に用いる統合用メタデータを作成するメタデータエディタ方法であって、
    コンピュータが、
    前記複数のデータベースのスキーマを表示し、該表示したスキーマを構成するカラムから統合用メタデータ作成者により選択されて木構造に配置されたカラムに基づいて、当該木構造を示す前記統合用メタデータを作成する作成工程と、
    前記作成工程により作成された統合用メタデータを前記データベース統合参照装置に送信する送信工程と、
    前記データベースのカラムごとに変更が生じたか否かを示す可否フラグを管理する管理工程と、
    前記木構造に配置されているカラムについて前記管理工程により管理された可否フラグを取得し、変更が生じた旨を示す可否フラグに対応付けられたカラムについて修正が必要であると判断する判断工程と、
    前記判断工程により修正が必要であると判断されたカラムについて、修正が必要である旨を表示する修正表示工程と、
    を実行することを特徴とするメタデータエディタ方法。
JP2004196043A 2004-07-01 2004-07-01 メタデータエディタプログラム、メタデータエディタ装置およびメタデータエディタ方法 Expired - Fee Related JP4899295B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2004196043A JP4899295B2 (ja) 2004-07-01 2004-07-01 メタデータエディタプログラム、メタデータエディタ装置およびメタデータエディタ方法
US10/997,042 US20060004815A1 (en) 2004-07-01 2004-11-24 Method and apparatus for editing metadata, and computer product

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004196043A JP4899295B2 (ja) 2004-07-01 2004-07-01 メタデータエディタプログラム、メタデータエディタ装置およびメタデータエディタ方法

Publications (2)

Publication Number Publication Date
JP2006018607A JP2006018607A (ja) 2006-01-19
JP4899295B2 true JP4899295B2 (ja) 2012-03-21

Family

ID=35515283

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004196043A Expired - Fee Related JP4899295B2 (ja) 2004-07-01 2004-07-01 メタデータエディタプログラム、メタデータエディタ装置およびメタデータエディタ方法

Country Status (2)

Country Link
US (1) US20060004815A1 (ja)
JP (1) JP4899295B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022003480A (ja) * 2020-06-23 2022-01-11 エヌ・ティ・ティ・ビズリンク株式会社 データ管理装置、データ管理方法及びプログラム

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7415672B1 (en) * 2003-03-24 2008-08-19 Microsoft Corporation System and method for designing electronic forms
US7913159B2 (en) * 2003-03-28 2011-03-22 Microsoft Corporation System and method for real-time validation of structured data files
US7406660B1 (en) 2003-08-01 2008-07-29 Microsoft Corporation Mapping between structured data and a visual surface
US7430711B2 (en) * 2004-02-17 2008-09-30 Microsoft Corporation Systems and methods for editing XML documents
US7716168B2 (en) * 2005-06-29 2010-05-11 Microsoft Corporation Modifying table definitions within a database application
US8135755B2 (en) * 2005-06-29 2012-03-13 Microsoft Corporation Templates in a schema editor
US7546291B2 (en) * 2004-02-19 2009-06-09 Microsoft Corporation Data source task pane
US7546286B2 (en) * 2004-02-19 2009-06-09 Microsoft Corporation Offline multi-table data editing and storage
US7743026B2 (en) 2006-01-31 2010-06-22 Microsoft Corporation Redirection to local copies of server-based files
US8712973B2 (en) * 2006-04-11 2014-04-29 International Business Machines Corporation Weighted determination in configuration management systems
US20070294246A1 (en) * 2006-06-16 2007-12-20 Microsoft Corporation Associating metadata on a per-user basis
EP1973300B1 (en) * 2007-03-23 2010-07-07 Research In Motion Limited Method and system for orchestration of content processing in mobile delivery frameworks
US7743075B2 (en) 2007-03-23 2010-06-22 Research In Motion Limited Method and system for orchestration of content processing in mobile delivery frameworks
US7765188B2 (en) * 2007-06-08 2010-07-27 Hewlett-Packard Develoment Company, L.P. Taxonomy editor
JP2009003549A (ja) * 2007-06-19 2009-01-08 Japan Lucida Co Ltd データ管理装置およびデータ管理方法、データ管理プログラム、データ管理プログラム記憶媒体
US7788207B2 (en) * 2007-07-09 2010-08-31 Blackboard Inc. Systems and methods for integrating educational software systems
US8271420B2 (en) * 2007-07-09 2012-09-18 Blackboard Inc. Systems and methods for integrating educational software systems
JP5458480B2 (ja) * 2007-08-08 2014-04-02 富士通株式会社 タグ付き文書データ問い合わせ処理システムに対する問い合わせ画面生成装置
JP5136133B2 (ja) * 2007-08-29 2013-02-06 富士通株式会社 統合ルール作成支援プログラム、統合ルール作成支援システムおよび統合ルール作成支援方法
US8903842B2 (en) * 2007-10-26 2014-12-02 Microsoft Corporation Metadata driven reporting and editing of databases
US8955016B2 (en) * 2008-02-22 2015-02-10 Tvworks, Llc Method and system for customizing metadata in TV network
JP5077430B2 (ja) * 2008-03-31 2012-11-21 富士通株式会社 管理装置および管理装置のプログラム
KR101305510B1 (ko) * 2008-10-23 2013-09-05 삼성전자주식회사 메타데이터를 이용한 문서의 로그정보 전송방법, 이를 적용한 호스트장치, 화상형성장치 및 화상형성시스템
US8296303B2 (en) * 2008-11-20 2012-10-23 Sap Ag Intelligent event query publish and subscribe system
EP2369492A4 (en) * 2008-12-11 2014-06-18 Fujitsu Ltd CONFIGURATION MANAGEMENT DEVICE, CONFIGURATION MANAGEMENT PROGRAM, AND METHOD THEREFOR
WO2010116475A1 (ja) 2009-03-30 2010-10-14 富士通株式会社 情報管理装置および情報管理プログラム
US8959113B2 (en) * 2011-03-30 2015-02-17 Open Text S.A. System, method and computer program product for managing tabulated metadata
US9508083B2 (en) * 2012-07-02 2016-11-29 Oracle International Corporation Extensibility for sales predictor (SPE)
JP6229997B2 (ja) * 2013-11-14 2017-11-15 富士ゼロックス株式会社 データ管理システム及びプログラム
US9661054B2 (en) * 2013-12-04 2017-05-23 PowWow, Inc. Systems and methods to configure applications
JP7093244B2 (ja) * 2018-07-03 2022-06-29 株式会社日立製作所 データ利用支援装置、及びデータ利用支援方法
US11966568B2 (en) * 2018-10-22 2024-04-23 Tableau Software, Inc. Generating data visualizations according to an object model of selected data sources
KR102141640B1 (ko) * 2020-04-13 2020-08-05 주식회사 데이터월드 실시간 네트워크 데이터 관리 방법 및 이를 실행하는 서버
JP2021189569A (ja) * 2020-05-26 2021-12-13 富士通株式会社 データ更新プログラム、データ更新装置及びデータ更新方法

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3192898B2 (ja) * 1994-12-16 2001-07-30 三菱電機株式会社 データベース装置
JPH09167163A (ja) * 1995-12-18 1997-06-24 Nec Corp リレーショナルデータベースのテーブル作成方式
JPH1131094A (ja) * 1997-07-09 1999-02-02 Just Syst Corp データベース管理方法
JP2001076005A (ja) * 1999-06-30 2001-03-23 Hitachi Ltd データベースシステム
US6631497B1 (en) * 1999-07-19 2003-10-07 International Business Machines Corporation Binding data from data source to cells in a spreadsheet
JP2002175327A (ja) * 2000-12-05 2002-06-21 Web I Laboratories Inc データベース管理方法
US20040093559A1 (en) * 2001-05-25 2004-05-13 Ruth Amaru Web client for viewing and interrogating enterprise data semantically
US6915305B2 (en) * 2001-08-15 2005-07-05 International Business Machines Corporation Restructuring view maintenance system and method
JP2004164363A (ja) * 2002-11-14 2004-06-10 Nobuhiko Nagamori リレーショナル・データベース構造を樹状図で表示する方法
US7162473B2 (en) * 2003-06-26 2007-01-09 Microsoft Corporation Method and system for usage analyzer that determines user accessed sources, indexes data subsets, and associated metadata, processing implicit queries based on potential interest to users
JP4227033B2 (ja) * 2004-01-20 2009-02-18 富士通株式会社 データベース統合参照装置、データベース統合参照方法およびデータベース統合参照プログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022003480A (ja) * 2020-06-23 2022-01-11 エヌ・ティ・ティ・ビズリンク株式会社 データ管理装置、データ管理方法及びプログラム

Also Published As

Publication number Publication date
JP2006018607A (ja) 2006-01-19
US20060004815A1 (en) 2006-01-05

Similar Documents

Publication Publication Date Title
JP4899295B2 (ja) メタデータエディタプログラム、メタデータエディタ装置およびメタデータエディタ方法
US7925672B2 (en) Metadata management for a data abstraction model
US10311040B2 (en) Method and system for matching appropriate content with users by matching content tags and profiles
US7194524B2 (en) Information processing system, information disclosing server, and portal server
CN101878461B (zh) 分析用于匹配数据记录的系统的方法和系统
US20090204588A1 (en) Method and apparatus for determining key attribute items
US8180789B1 (en) Techniques for query generation, population, and management
US20050131902A1 (en) File system and file transfer method between file sharing devices
US20040122849A1 (en) Assignment of documents to a user domain
JP2005302029A (ja) パラメータ化照会を提示するための方法、システム及びコンピュータ可読媒体
KR101573561B1 (ko) X500 데이터 모델을 관계형 데이터베이스에 매핑하는 방법
US20070067370A1 (en) Information processing apparatus, information displaying apparatus, and information processing method
US20110219028A1 (en) Automatic generation of virtual database schemas
JP4700462B2 (ja) データベース利用システム
JPH11353313A (ja) 情報検索方法及び情報自動分類方法並びに情報分析方法
CA2705688A1 (en) Searching categorized marketing assets
JP2007133452A (ja) データ収集プログラムおよびデータ収集装置
US20080263138A1 (en) Method and system for managing specimen data
JP7125322B2 (ja) 属性抽出装置および属性抽出方法
JP3786233B2 (ja) 情報検索方法および情報検索システム
US20080288307A1 (en) Project management support device and method thereof
JP2003022270A (ja) 情報管理辞書、データ検索用サーバ、データベース検索方法、データ複写方法およびデータ検索プログラム
CN114298525A (zh) 一种数据库风险评估方法及装置
JP2002014971A (ja) 指定単語関係者情報抽出装置,及び指定単語関係者情報抽出プログラムを記録したコンピュータ読み取り可能な記録媒体
JP4135330B2 (ja) 人物紹介システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070629

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20091228

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100202

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100405

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110104

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111206

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111219

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150113

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees