JP2007188343A - Schema integration support device, schema integration support method, and schema integration support program - Google Patents
Schema integration support device, schema integration support method, and schema integration support program Download PDFInfo
- Publication number
- JP2007188343A JP2007188343A JP2006006596A JP2006006596A JP2007188343A JP 2007188343 A JP2007188343 A JP 2007188343A JP 2006006596 A JP2006006596 A JP 2006006596A JP 2006006596 A JP2006006596 A JP 2006006596A JP 2007188343 A JP2007188343 A JP 2007188343A
- Authority
- JP
- Japan
- Prior art keywords
- similarity
- information
- database
- schema
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本発明は、異なるデータベース間のスキーマ統合作業を支援するスキーマ統合支援装置、スキーマ統合支援方法およびスキーマ統合支援プログラムに関するものである。 The present invention relates to a schema integration support apparatus, a schema integration support method, and a schema integration support program that support schema integration work between different databases.
同一概念を表すデータが異なる表現形式で定義されているような複数の異なるデータベースを統合する際に使用する、異なるデータベース間のスキーマ(データベースの構造)の対応付け(マッピング)作業を支援する従来の方法には以下の方法があった。
従来の方法の一つは、データの中でマッピングに使用する属性のドメイン情報(実際のデータ値の集合)を使って、評価関数により一致度を判定し、マッピング候補の導出を行う(例えば、特許文献1)。
また別の方法では、マッピングに使用する属性の名称を標準化し、属性名から類似度を算出することによりマッピング候補を提示する(例えば、特許文献2)。
One of the conventional methods is to use the domain information (actual data value set) of attributes used for mapping in the data, determine the degree of matching by an evaluation function, and derive mapping candidates (for example, Patent Document 1).
In another method, the name of the attribute used for mapping is standardized, and the mapping candidate is presented by calculating the similarity from the attribute name (for example, Patent Document 2).
従来のスキーマ統合支援方法のうち、マッピング候補の判定に“ドメイン情報”を使用する方法(特許文献1)では、統合処理においてスキーマ情報だけでなく、実際のデータ値が必要になるという課題点があった。さらに、一致度の判定にデータ値を使用するため、統合対象のデータベース間で、事前にデータ値を標準化(統一)する必要があるという課題点があった。
また、マッピング候補の判定に“属性名”を使用する方法(特許文献2)では、属性名は自由形式で任意に設定される情報であるため、統合対象のそれぞれのデータベースにおいて、類似度の算出に適切な属性名が設定されていなければマッピング候補を提示できないという課題点があった。
Among the conventional schema integration support methods, the method of using “domain information” for determining mapping candidates (Patent Document 1) has a problem that not only schema information but also actual data values are required in the integration process. there were. Furthermore, since the data value is used for the determination of the degree of coincidence, there is a problem that it is necessary to standardize (unify) the data value between the databases to be integrated.
In addition, in the method of using “attribute name” for determining a mapping candidate (Patent Document 2), since the attribute name is information that is arbitrarily set in a free format, the similarity is calculated in each database to be integrated. There is a problem that a mapping candidate cannot be presented unless an appropriate attribute name is set in.
本発明は、“ドメイン情報”や“属性名”を使用せずにマッピング候補を作成できるようにすることなどを目的とする。 An object of the present invention is to make it possible to create a mapping candidate without using “domain information” or “attribute name”.
本発明のスキーマ統合支援装置は、第1のデータベースと第2のデータベースとの統合を支援する情報として第1のデータベースと第2のデータベースとでマッピングするテーブルについてのマッピング情報を出力するスキーマ統合支援装置であり、第1のデータベースが有するテーブルAのデータ構造情報と第2のデータベースが有するテーブルBのデータ構造情報とを記憶したスキーマ情報記憶装置と、前記スキーマ情報記憶装置に記憶された第1のデータベースが有するテーブルAのデータ構造情報と第2のデータベースが有するテーブルBのデータ構造情報とを中央処理装置を用いて比較して第1のデータベースが有するテーブルAと第2のデータベースが有するテーブルBとの類似度を算出し算出した類似度をマッピング情報として出力装置に出力する類似度評価部とを備えたことを特徴とする。 The schema integration support apparatus of the present invention outputs schema mapping information about tables mapped between the first database and the second database as information supporting the integration of the first database and the second database. A schema information storage device that stores the data structure information of the table A of the first database and the data structure information of the table B of the second database, and the first information stored in the schema information storage device. The data structure information of the table A included in the first database and the data structure information of the table B included in the second database are compared using the central processing unit, and the table A included in the first database and the table included in the second database Calculate the similarity with B and use the calculated similarity as mapping information It characterized by comprising a similarity evaluation unit for outputting to an output device.
本発明のスキーマ統合支援装置によれば、例えば、データ間の制約条件・従属関係といったテーブルのデータ構造に着目することで、類似度を算出することができ、類似するテーブルを選択してマッピング候補を作成することができる。 According to the schema integration support device of the present invention, for example, similarity can be calculated by paying attention to the data structure of a table such as constraint conditions and dependency relationships between data. Can be created.
実施の形態1.
以下、統合対象のデータベースシステム(以下、データベースとする)として「リレーショナルデータベース」を例に、データベースの統合を支援するための情報として、「テーブルのデータ構造情報(スキーマ情報)」に基づいて「テーブルの類似度(マッピング情報)」を生成するスキーマ統合支援装置、スキーマ統合支援方法およびスキーマ統合支援プログラムについて説明する。
In the following, “relational database” is used as an example of a database system to be integrated (hereinafter referred to as database), and “table data structure information (schema information)” is used as information for supporting database integration. Schema integration support apparatus, schema integration support method, and schema integration support program for generating “similarity (mapping information)” will be described.
図1は、実施の形態1におけるスキーマ統合支援装置102の外観を示す図である。
図1において、スキーマ統合支援装置102は、システムユニット910、表示装置901、キーボード(K/B)902、マウス903、コンパクトディスク装置(CDD)905、プリンタ装置906、スキャナ装置907を備え、これらはケーブルで接続されている。
さらに、スキーマ統合支援装置102は、FAX機932、電話器931とケーブルで接続され、また、ローカルエリアネットワーク(LAN)942、ウェブサーバ941を介してインターネット940に接続されている。
FIG. 1 is a diagram illustrating an appearance of the schema
In FIG. 1, the schema
Further, the schema
図2は、実施の形態1におけるスキーマ統合支援装置102のハードウェア構成図である。
図2において、実施の形態1におけるスキーマ統合支援装置102は、プログラムを実行するCPU(Central Processing Unit:中央処理装置)911を備えている。CPU911は、バス912を介してROM913、RAM914、通信ボード915、表示装置901、K/B902、マウス903、FDD(Flexible Disk Drive)904、磁気ディスク装置920、CDD905、プリンタ装置906、スキャナ装置907、光ディスク装置908と接続されている。
表示装置901には液晶ディスプレイ、CRT(Cathode Ray Tube)ディスプレイなどがある。
RAM914は、揮発性メモリの一例である。ROM913、FDD904、CDD905、磁気ディスク装置920、光ディスク装置908は、不揮発性メモリの一例である。これらは、記憶機器、記憶装置あるいは記憶部の一例であり、以下で説明する“スキーマ情報記憶装置104”、“データ型辞書記憶装置106”、“特徴情報記憶装置107”、“重み付け変数記憶装置109”および“マッピングモデル記憶装置110”を構成する。
通信ボード915は、FAX機932、電話器931、LAN942等に接続されている。
例えば、通信ボード915、K/B902、スキャナ装置907、FDD904などは、入力機器、入力装置あるいは入力部の一例である。
また、例えば、通信ボード915、表示装置901などは、出力機器、出力装置あるいは出力部の一例である。
FIG. 2 is a hardware configuration diagram of the schema
In FIG. 2, the schema
The
The
The
For example, the
Further, for example, the
ここで、通信ボード915は、LAN942に限らず、直接、インターネット940、或いはISDN等のWAN(ワイドエリアネットワーク)に接続されていても構わない。直接、インターネット940、或いはISDN等のWANに接続されている場合、スキーマ統合支援装置102は、インターネット940、或いはISDN等のWANに接続され、ウェブサーバ941は不用となる。また、スキーマ統合支援装置102の備える通信ボード915は統合対象のデータベースとスキーマ情報などのデータを送受信する。
磁気ディスク装置920には、オペレーティングシステム(OS)921、ウィンドウシステム922、プログラム群923、ファイル群924が記憶されている。プログラム群923は、CPU911、OS921、ウィンドウシステム922により実行される。
Here, the
The
上記プログラム群923には、実施の形態の説明において「〜部」として説明する機能を実行するプログラムが記憶されている。プログラムは、CPU911により読み出され実行される。
ファイル群924には、実施の形態の説明において、「〜情報」として説明するデータ、「〜部」として説明する機能を実行した際の判定結果や演算結果を示すデータ、「〜部」として説明する機能を実行するプログラム間で受け渡しするデータなどが「〜ファイル」として記憶されている。例えば、以下に説明する“スキーマ情報”、“データ型辞書”、“特徴情報”、“重み付け変数”、“マッピング情報”が「〜ファイル」として記憶される。
また、実施の形態の説明において、フローチャートや構成図の矢印の部分は主としてデータの入出力を示し、そのデータの入出力のためにデータは、磁気ディスク装置920、FD(Flexible Disk cartridge)、光ディスク、CD(コンパクトディスク)、MD(ミニディスク)、DVD(Digital Versatile Disk)、その他の記憶媒体に記憶される。あるいは、信号線やその他の伝送媒体により伝送される。
The
In the
Also, in the description of the embodiments, the arrows in the flowcharts and configuration diagrams mainly indicate input / output of data, and the data for the input / output of the data includes a
また、実施の形態の説明において「〜部」として説明するものは、ROM913に記憶されたファームウェアで実現されていても構わない。或いは、ソフトウェアのみ、或いは、ハードウェアのみ、或いは、ソフトウェアとハードウェアとの組み合わせ、さらには、ファームウェアとの組み合わせで実施されても構わない。
Also, what is described as “˜unit” in the description of the embodiment may be realized by firmware stored in the
また、実施の形態を実施するプログラムは、磁気ディスク装置920、FD、光ディスク、CD、MD、DVD、その他の記憶媒体による記憶装置を用いて記憶されても構わない。
The program for implementing the embodiment may be stored using a storage device such as a
図3は、実施の形態1におけるスキーマ統合支援装置102の機能要素を示す機能構成図である。
図3において、第1のデータベース100、第2のデータベース101はスキーマ統合対象のデータベースである。
また、図3において、スキーマ統合支援装置102は以下の機能を備える。
スキーマ統合支援処理で利用する「スキーマ情報」を統合対象のデータベースから取得するスキーマ情報抽出部103。
スキーマ情報抽出部103が取得した「スキーマ情報」を格納するスキーマ情報記憶装置104。
「スキーマ情報」を元にテーブルの「特徴情報」を生成する特徴情報生成部105。
「特徴情報」を生成の際に、統合対象の各データベースが使用するデータ型属性を標準化するための「データ型辞書」を格納するデータ型辞書記憶装置106。
特徴情報生成部105が生成した「特徴情報」を格納する特徴情報記憶装置107。
「特徴情報」に基づいてテーブルの類似度を評価する類似度評価部108。
類似度評価部108がテーブルの類似度を評価する際に使用する定義値(以下、「重み付け変数」とする)を格納する重み付け変数記憶装置109。
類似度評価部108が類似度を元に導出した統合対象のデータベース間でのテーブルの「マッピング情報」を格納するマッピングモデル記憶装置110を有する。
FIG. 3 is a functional configuration diagram showing functional elements of the schema
In FIG. 3, the
In FIG. 3, the schema
A schema
A schema
A feature
A data type
A feature
A
A weighting
The
第1のデータベース100、第2のデータベース101は一般的なデータベース管理システムにより管理され、スキーマ統合支援装置102とLAN等のネットワークにより接続される。あるいは、第1のデータベース100、第2のデータベース101の両方または片方が、スキーマ統合支援装置102と同一の計算機システム上に存在していてもよい。
The
また、スキーマ情報記憶装置104、データ型辞書記憶装置106、特徴情報記憶装置107、重み付け変数記憶装置109およびマッピングモデル記憶装置110は、一つの記憶装置にまとめて実装してもよいし、個別の記憶装置で実装してもよい。
In addition, the schema
次に、スキーマ情報記憶装置104が格納する「スキーマ情報」、データ型辞書記憶装置106が格納する「データ型辞書」、特徴情報記憶装置107が格納する「特徴情報」、重み付け変数記憶装置109が格納する「重み付け変数」およびマッピングモデル記憶装置110が格納する「マッピング情報」について説明する。
Next, “schema information” stored in the schema
スキーマ情報抽出部103が統合対象のデータベースから取得しスキーマ情報記憶装置104に格納する「スキーマ情報」は、データベースの構造を表わすデータであり、データベースで記憶管理する「テーブルのデータ構造情報」が含まれる。
また、「テーブルのデータ構造情報」にはテーブルを構成するデータ項目(“列”や“データフィールド”を示す)ごとに定義された「データ属性」が含まれる。
「データ属性」は、同一テーブル内の他のデータ項目を一意に識別する属性や他のテーブルとの関連付けを示す属性などの「従属関係に関する情報(従属関係を示す属性)」、データ型・データサイズなどデータ項目に設定されるデータの「制約条件に関する情報(制約条件を示す属性)」などを示す。
「従属関係に関する情報(従属関係を示す属性)」には、「主キー属性(従属属性項目のデータを一意に識別する属性)」、「従属属性(自テーブルの主キー属性項目のデータに関連付ける属性)」、「外部キー属性(他テーブルの主キー属性項目のデータに関連付ける属性)」などがある。
The “schema information” acquired by the schema
The “table data structure information” includes a “data attribute” defined for each data item (indicating “column” or “data field”) constituting the table.
“Data attribute” is an attribute that uniquely identifies another data item in the same table, an attribute that indicates an association with another table, and other information related to the dependency (attribute indicating the dependency), data type / data Indicates “constraint condition information (attributes indicating constraint conditions)” of data set in data items such as size.
“Information about dependency (attribute indicating dependency)” includes “primary key attribute (attribute for uniquely identifying data of dependent attribute item)”, “subordinate attribute (related to data of primary key attribute item of own table) Attribute) ”,“ foreign key attribute (attribute to be associated with data of primary key attribute item of other table) ”and the like.
図4は、実施の形態1における「スキーマ情報」の一例を示すデータ構造図である。
図4において、テーブル情報140は1つのテーブルについての「テーブルのデータ構造情報」を示し、「スキーマ情報」はテーブル情報140をテーブル数分有する。各テーブル情報140はID、テーブル名、主キーカラム情報141、主キー参照先情報142、従属カラム情報143および外部キー情報144を有する。
IDとテーブル名はテーブルを一意に識別する情報である。
主キーカラム情報141は「主キー属性」を示す情報であり、主キーを構成する全てのデータ項目のカラムについて「カラム名」と「データ型」を有する。
従属カラム情報143は「従属属性」を示す情報であり、主キー以外の全てのデータ項目のカラムについて「カラム名」と「データ型」を有する。
外部キー情報144は「外部キー属性」を示す情報であり、外部キーである全てのデータ項目について「外部キーID」と「外部キーカラム情報145」を有する。「外部キーID」は「外部キーカラム情報145」を一意に識別する情報であり、「外部キーカラム情報145」は外部キーを構成する全てのデータ項目のカラムについて「カラム名」と「データ型」を有する。
主キー参照先情報142は自テーブルの主キーに関連付いた外部キーを持つ他のテーブルの全てについて「参照先ID(他テーブルのID)」を有する。
図4に示したテーブル情報140のうちIDと外部キーIDは、スキーマ情報抽出部103が、統合対象のデータベースシステムから取得したスキーマ情報をスキーマ情報記憶装置104に格納する際に付加する情報である。
FIG. 4 is a data structure diagram showing an example of “schema information” in the first exemplary embodiment.
In FIG. 4, table information 140 indicates “table data structure information” for one table, and “schema information” has table information 140 corresponding to the number of tables. Each table information 140 has an ID, a table name, primary
The ID and table name are information for uniquely identifying the table.
The primary
The
The foreign
The primary key
The ID and the foreign key ID in the table information 140 shown in FIG. 4 are information added when the schema
図5は、実施の形態1における「データ型辞書」の一例を示す図である。
データ型辞書記憶装置106には、スキーマ統合支援装置102がスキーマ統合支援処理に使用するデータ型(以下、標準データ型とする)と統合対象のデータベースが使用しているデータ型(以下、固有データ型とする)との対応関係を図5に示すような「データ型辞書」として登録する。つまり、スキーマ統合支援装置102は、スキーマ統合支援処理の前処理として、第1のデータベース100と第2のデータベース101の固有データ型について、標準データ型との対応関係を事前にデータ型辞書記憶装置106に登録する。
図5に示す「データ型辞書」は、統合対象のデータベースである第1のデータベース100“DBMS1”と第2のデータベース101“DBMS2”とのそれぞれの固有データ型を標準データ型に対応付けている。図5に示す「データ型辞書」は、例えば、“DBMS1”の固有データ型である“char”型と“integer”型とをそれぞれ標準データ型である“文字型”と“真数型”とに対応付け、“DBMS2”の固有データ型である“char”型と“nchar”型とを標準データ型である“文字型”に対応付けている。
第1のデータベース100と第2のデータベース101が同一のデータベース管理システムを使用している場合、つまり、同一のデータ型を使用している場合、「データ型辞書」はどちらか片方の固有データ型に標準データ型を対応付けたデータであってもよい。
標準データ型には、例えば文字型、真数型、概数型、日時型、バイナリ型などを定義し、「データ型辞書」は、スキーマ統合支援装置102のデータ型辞書記憶装置106に、予め用意してもよいし、あるいはシステム管理者(ユーザ)が入力装置を用いて随時に定義可能にしておきスキーマ統合支援処理の際に固有データ型と標準データ型との対応関係の定義を変更してもよい。
FIG. 5 is a diagram illustrating an example of a “data type dictionary” in the first embodiment.
The data type
The “data type dictionary” shown in FIG. 5 associates specific data types of the
When the
For example, a character type, an exact number type, an approximate number type, a datetime type, and a binary type are defined as standard data types, and a “data type dictionary” is prepared in advance in the data type
図6は、実施の形態1における「特徴情報」の項目の一例を示す図である。
特徴情報記憶装置107に格納する「特徴情報」は特徴情報生成部105が「スキーマ情報」からテーブル毎に導出する定量的な値を持つ項目の集まりであり、「特徴情報」が類似する2つのテーブルをマッピング候補とする。「特徴情報」を構成する図6に示すような各項目はスキーマ統合支援装置102の記憶装置(例えば、特徴情報記憶装置107)に予め定義しておく。
図6では、「ID」、「主キー属性数」、「主キーのデータ型構成」、「主キーの参照先テーブル数」、「従属属性数」、「従属属性のデータ型構成」、「外部キー属性数」、「外部キーのデータ型構成」を「特徴情報」の項目として定義している。
「ID」は当該「特徴情報」に対応するテーブルを一意に識別する情報である。
「主キー属性数」は主キー属性が定義されたデータ項目の数を示し、「従属属性数」は主キー属性が定義されていないデータ項目の数を示し、「外部キー属性数」は外部キー属性が定義されたデータ項目の数を示す。
「主キーのデータ型構成」は標準データ型毎の「主キー属性数」、つまり、主キー属性が定義された各データ項目を標準データ型の属性で分類した数を示し、「従属属性のデータ型構成」は標準データ型毎の「従属属性数」を示し、「外部キーのデータ型構成」は標準データ型毎の「外部キー属性数」を示す。
「主キーの参照先テーブル数」は当該「特徴情報」に対応するテーブルの主キーに関連付いた外部キーを持つ他のテーブルの数を示す。
図6に示す「特徴情報」の項目「ID」、「主キーの参照先テーブル数」は、それぞれ図4に示すテーブル情報140のID、主キー参照先情報142に対応する情報である。
また、図6に示す「特徴情報」の項目「主キー属性数」と「主キーのデータ型構成」は図4に示すテーブル情報140の主キーカラム情報141に対応し、図6に示す「特徴情報」の項目「従属属性数」と「従属属性のデータ型構成」は図4に示すテーブル情報140の従属カラム情報143に対応し、図6に示す「特徴情報」の項目「外部キー属性数」と「外部キーのデータ型構成」は図4に示すテーブル情報140の外部キー情報144に対応する。
以下、「特徴情報」の各項目を特徴情報項目とする。
FIG. 6 is a diagram illustrating an example of the item “feature information” in the first exemplary embodiment.
The “feature information” stored in the feature
In FIG. 6, “ID”, “number of primary key attributes”, “data type configuration of primary key”, “number of primary key referenced tables”, “number of dependent attributes”, “data type configuration of dependent attributes”, “ “Number of foreign key attributes” and “Data type configuration of foreign key” are defined as items of “feature information”.
“ID” is information for uniquely identifying a table corresponding to the “feature information”.
“Number of primary key attributes” indicates the number of data items for which primary key attributes are defined, “Number of subordinate attributes” indicates the number of data items for which primary key attributes are not defined, and “Number of foreign key attributes” indicates external Indicates the number of data items for which key attributes are defined.
“Primary key data type composition” indicates the number of “primary key attributes” for each standard data type, that is, the number of each data item in which the primary key attribute is defined, classified by the attributes of the standard data type. “Data type configuration” indicates “number of subordinate attributes” for each standard data type, and “Data type configuration of foreign key” indicates “number of foreign key attributes” for each standard data type.
“Number of primary key reference destination tables” indicates the number of other tables having foreign keys associated with the primary key of the table corresponding to the “feature information”.
The items “ID” and “number of primary key reference destination tables” of “feature information” shown in FIG. 6 are information corresponding to the ID of the table information 140 and primary key
6 correspond to the primary
Hereinafter, each item of “feature information” is referred to as a feature information item.
次に、「重み付け変数」について説明する。
重み付け変数記憶装置109には類似度評価部108が類似度を評価する際に使用するパラメータ(重み付け変数)を設定する。
パラメータ(重み付け変数)には、各“特徴情報項目”に対するパラメータである「類似許容範囲」と「変動率」と「比重」、また、“特徴情報”に対するパラメータである「類似判定閾値」、“データ型”に対するパラメータである「標準データ型間での類似度」等がある。
「類似許容範囲」は、統合対象のデータベースが有する各テーブル間で各特徴情報項目の値を比較するときに類似かどうかを判定するための境界値である。類似度評価部108は、2つのテーブル間で特徴情報項目A(例えば、主キー属性数)の差分値が「類似許容範囲」以内であれば当該2つのテーブルの特徴情報項目Aは“類似”、「類似許容範囲」を超えていれば特徴情報項目Aは“類似していない(非類似)”と判定する。“類似”している“特徴情報項目”が多いほど“特徴情報”が類似し、類似する“特徴情報”に対応する2つのテーブルはマッピング候補となる。
「変動率」は、類似度評価部108が“類似”と判定した特徴情報項目について、類似度評価部108が2つのテーブル間での特徴情報項目の差分値に応じて当該特徴情報項目の類似度の算出に使用する値で、類似度を減少させる割合(差分値当たりの類似度減少値)を示す。例えば、類似度を0(完全不一致)〜1(完全一致)とし、「変動率」を0.1とした場合、差分値が2である特徴情報項目の類似度は0.8(=1−0.1×2)になる。
「比重」は、類似度評価部108が特徴情報全体の類似度、つまり、比較した2つのテーブルの類似度、を算出する際に使用する各特徴情報項目の類似度に対する重み付けを示す。例えば、全ての特徴情報項目で類似度の重みを均等に扱う場合は全ての特徴情報項目の「比重」を1とする。また、ある特定の特徴情報項目を重く扱う場合は、他の特徴情報項目の「比重」が1であれば、重く扱う特徴情報項目の「比重」を1より大きい値にする。
「標準データ型間での類似度」は、2つのテーブル間で異なる標準データ型のデータ項目を対応付ける場合の当該データ項目分の特徴情報項目の類似度を示す。例えば、標準データ型間の類似度を0(完全不一致)〜1(完全一致)としたときの「標準データ型間での類似度」の一例を図7に示す。図7において、文字型のデータ項目同士の類似度は1、文字型のデータ項目と真数型のデータ項目との類似度は0.4を示す。
「類似判定閾値」は、特徴情報全体として類似か、つまり、テーブルが類似かどうか、を判定するための境界値である。類似度評価部108は各特徴情報項目の類似度に「比重」を掛けて合計した値が「類似判定閾値」以上であれば“類似”、「類似判定閾値」未満であれば“非類似”と判定する。
各パラメータの設定値は、スキーマ統合支援装置102で予め定義しておき、必要に応じてシステム管理者(ユーザ)により入力装置で変更することが可能である。また、パラメータは特徴情報項目の内容に応じて追加あるいは削除してもよい。
Next, the “weighting variable” will be described.
In the weighting
The parameters (weighting variables) include “similar allowable range”, “variation rate”, and “specific gravity”, which are parameters for each “feature information item”, and “similarity determination threshold”, “parameters for“ feature information ”, “Similarity between standard data types”, which is a parameter for “data type”.
The “similar allowable range” is a boundary value for determining whether or not the values of the feature information items are compared between the tables of the integration target database. The
The “variation rate” is the similarity of the feature information item for the feature information item determined by the
“Specific gravity” indicates a weight for the similarity of each feature information item used when the
“Similarity between standard data types” indicates the similarity of feature information items corresponding to the data items when data items of different standard data types are associated between two tables. For example, FIG. 7 shows an example of “similarity between standard data types” when the similarity between standard data types is 0 (completely unmatched) to 1 (completely matched). In FIG. 7, the similarity between character-type data items is 1, and the similarity between a character-type data item and an integer data item is 0.4.
The “similarity determination threshold” is a boundary value for determining whether the entire feature information is similar, that is, whether the table is similar. The
The setting value of each parameter is defined in advance by the schema
図8は、実施の形態1における「マッピング情報」の一例を示す図である。
類似度評価部108は、「特徴情報」が類似でありマッピング候補と判定した2つのテーブルについて、図8に示すような「マッピング情報」をマッピングモデル記憶装置110に格納する。「マッピング情報」は、例えば、第1のデータベース100と第2のデータベース101とでマッピング候補と判定したそれぞれのテーブルの名前とその類似度を示す。
図8では、テーブル名を“スキーマ名.テーブル名”で表わし、各行にマッピング候補を示している。図8において、第1のデータベース100の“HAN”スキーマの“URIAGE”テーブル(第1のデータベースが有するテーブルAの一例)に対する第2のデータベース101のテーブルのマッピング候補(第2のデータベースが有するテーブルBの一例)は、“販売”スキーマの“売上実績”テーブル、“販売”スキーマの“売上明細”テーブル、“在庫”スキーマの“出庫実績”テーブルの3テーブルである。また、それぞれの類似度は“4.23”、“5.65”、“3.72”であり、データベースを統合するユーザやスキーマ統合支援装置102は類似度を参照することで、第1のデータベース100の“HAN”スキーマの“URIAGE”テーブルにマッピングする第2のデータベース101のテーブルの一番の候補は一番類似度が高い“販売”スキーマの“売上明細”テーブルであることが判定できる。
FIG. 8 is a diagram illustrating an example of “mapping information” in the first embodiment.
The
In FIG. 8, the table name is represented by “schema name.table name”, and mapping candidates are shown in each row. In FIG. 8, mapping candidates (tables of the second database) of the
図9は、実施の形態1におけるスキーマ統合支援処理(スキーマ統合支援方法)を示すフローチャートである。
スキーマ統合支援装置102が実行するスキーマ統合支援処理(スキーマ統合支援方法)を図9のフローチャートを用いて以下に説明する。
なお、以下に説明するスキーマ統合支援処理(スキーマ統合支援方法)はコンピュータに実行させることができ、スキーマ統合支援処理(スキーマ統合支援方法)をコンピュータに実行させるプログラムがスキーマ統合支援プログラムである。
FIG. 9 is a flowchart showing schema integration support processing (schema integration support method) in the first embodiment.
The schema integration support process (schema integration support method) executed by the schema
A schema integration support process (schema integration support method) described below can be executed by a computer, and a program that causes a computer to execute the schema integration support process (schema integration support method) is a schema integration support program.
<ステップ120:データ構造情報抽出処理工程>
まず、スキーマ情報抽出部103は、統合対象のデータベースシステムのいずれか(第1のデータベース100あるいは第2のデータベース101)から「スキーマ情報」を取得する。そして、スキーマ情報抽出部103は、取得した「スキーマ情報」に基づいて各テーブルのテーブル情報140を生成し、全テーブルのテーブル情報140を「スキーマ情報(以降のスキーマ統合支援処理で使用するスキーマ情報)」としてスキーマ情報記憶装置104に格納する。
取得する「スキーマ情報」としては、データベースに存在するテーブルの“テーブル名一覧情報”、各テーブルの“主キー属性の情報”、各テーブルの“従属属性の情報”、各テーブルの“外部キー属性の情報”などがある。
スキーマ情報抽出部103は、第1のデータベース100および第2のデータベース101を管理するデータベース管理システムが提供する「スキーマ情報」へのアクセス機能を使用して「スキーマ情報」を収集する。「スキーマ情報」にアクセスする方法としては、システムテーブル等と呼ばれるデータベースの「スキーマ情報」の格納されているデータを通常のデータと同様にアクセスする方法や、「スキーマ情報」をアクセスするための専用API(アプリケーションインタフェース)を使用する方法等があるが、いずれの方法を使用してもよい。
スキーマ情報抽出部103は特徴情報生成部105が生成する「特徴情報」に依存して必要となる「スキーマ情報」を収集し、テーブル情報140を生成する。
例えば、特徴情報生成部105が図6に示すような特徴情報項目を有する「特徴情報」を生成することに依存して図4に示すようなテーブル情報140を生成する場合、スキーマ情報抽出部103のテーブル情報140(スキーマ情報の一部)の生成処理は次のようになる。
ユニークなIDを生成しテーブル情報140の“ID”に設定する。
また、取得した「スキーマ情報」の“テーブル名一覧情報”に基づいてテーブル情報140の“テーブル名”を設定する。
また、取得した「スキーマ情報」の“主キー属性の情報”に基づいてテーブル情報140の“主キーカラム情報141”を生成する。
また、取得した「スキーマ情報」の“従属属性の情報”に基づいてテーブル情報140の“従属カラム情報143”を生成する。
また、取得した「スキーマ情報」の“外部キー属性の情報”に基づいてテーブル情報140の“主キー参照先情報142”と“外部キー情報144”とを生成する。
<Step 120: Data structure information extraction process>
First, the schema
“Schema information” to be acquired includes “table name list information” of tables existing in the database, “primary key attribute information” of each table, “subordinate attribute information” of each table, “foreign key attribute of each table Information ”.
The schema
The schema
For example, when the table information 140 shown in FIG. 4 is generated depending on the feature
A unique ID is generated and set in “ID” of the table information 140.
Further, the “table name” of the table information 140 is set based on the “table name list information” of the acquired “schema information”.
Further, “primary
Further, “
Further, “primary key
<ステップ121:特徴情報生成処理工程>
次に、特徴情報生成部105は、スキーマ情報抽出部103が生成してスキーマ情報記憶装置104に格納した「スキーマ情報(テーブル情報140の集合)」に基づいて各テーブルの「特徴情報」を生成して特徴情報記憶装置107に格納する。
例えば、図4のテーブル情報140に基づいて図6に示す特徴情報項目を有する「特徴情報」を生成する場合の特徴情報生成部105の「特徴情報」の生成処理は次のようになる。
特徴情報項目の「ID」にはテーブル情報140のIDを設定する。
特徴情報項目の「主キー属性数」、「主キーの参照先テーブル数」、「従属属性数」、「外部キー属性数」には、それぞれテーブル情報140の主キーカラム情報141の個数、主キー参照先情報142の個数、従属カラム情報143の個数、外部キー情報144の個数を設定する。
また、特徴情報生成部105は、テーブル情報140の主キーカラム情報141、従属カラム情報143、外部キーカラム情報145の各データ型を、図5に示すようなデータ型辞書を使用して標準データ型に変換し、主キーカラム情報141、従属カラム情報143、外部キーカラム情報145のそれぞれについて標準データ型毎のデータ項目数を集計する。そして、特徴情報生成部105は、特徴情報項目の「主キーのデータ型構成」には主キーカラム情報141のデータ型について集計した各標準データ型のデータ項目数を設定し、特徴情報項目の「従属属性のデータ型構成」には従属カラム情報143のデータ型について集計した各標準データ型のデータ項目数を設定し、特徴情報項目の「外部キーのデータ型構成」には外部キーカラム情報145のデータ型について集計した各標準データ型のデータ項目数を設定する。
<Step 121: Feature information generation process>
Next, the feature
For example, the “feature information” generation process of the feature
The ID of the table information 140 is set in the “ID” of the feature information item.
In the feature information item “number of primary key attributes”, “number of primary key reference destination tables”, “number of dependent attributes”, and “number of foreign key attributes”, the number of primary
Further, the feature
<ステップ122>
スキーマ統合支援装置102は統合対象の全てのデータベースについて「特徴情報」を生成したか判定する。
例えば、スキーマ情報抽出部103が、第1のデータベース100と第2のデータベース101の二つのデータベースに対して上記ステップ120と上記ステップ121とを実施済みか確認し、実施済みの場合はステップ123に処理を移し、未実施のデータベースがある場合はステップ120に処理を移す。
<Step 122>
The schema
For example, the schema
<ステップ123:類似度評価処理工程>
そして、類似度評価部108は、特徴情報記憶装置107に格納された「特徴情報」に基づいて統合対象のデータベース間での各テーブルの類似度を算出する。そして、「マッピング情報」を生成してマッピングモデル記憶装置110(出力装置の一例)に格納しスキーマ統合支援処理を終了する。
また、類似度評価部108は表示装置901やプリンタ装置906などの出力装置、第1のデータベース100と第2のデータベース101とのデータをマージするプログラムなどに「マッピング情報」を出力する。出力された「マッピング情報」に基づいてデータベースの統合作業をユーザに行わせることで、スキーマ統合支援装置102はユーザのデータベース統合作業の効率を向上することができる。
類似度評価部108は、類似度評価処理工程において、統合対象のデータベース間で2つのデータベースのテーブルを組み合わせて全テーブルの組み合わせについてテーブルの類似度を算出する。また、テーブルの類似度を算出する際、類似度評価部108は、各特徴情報項目について類似度を算出し、各特徴情報項目の類似度を合計した値を「特徴情報」の類似度、つまり、テーブルの類似度とする。
<Step 123: Similarity Evaluation Process>
Then, the
Further, the
In the similarity evaluation processing step, the
図10は、実施の形態1における類似度評価部108の類似度評価処理の流れを示すフローチャートである。
類似度評価部108が実行する上記ステップ123(類似度評価処理工程)について図10に基づいて以下に説明する。
FIG. 10 is a flowchart showing the flow of the similarity evaluation process of the
The step 123 (similarity evaluation processing step) executed by the
<類似度算出処理工程:ステップ181〜ステップ184、ステップ187、ステップ188>
<ステップ181>
類似度評価部108は、統合対象のデータベースの一方を選定し、選定した方のデータベースを類似度評価する際の比較元のデータベースとする。例えば、第1のデータベース100と第2のデータベース101とで定義されているそれぞれのテーブル数を比較してテーブル数が多い方を比較元のデータベースとする。ここでは、第1のデータベース100を選定したものとする。なお選定方法は任意の方法でよく、例えば、データベースとして指定された順番に基づいて比較元・比較先を選定する。
<Similarity calculation process: Step 181 to Step 184,
<Step 181>
The
<ステップ182>
類似度評価部108は比較元のデータベース(第1のデータベース100)が有する各テーブルに対応する「特徴情報」を特徴情報記憶装置107から一つ取り出す。
<Step 182>
The
<ステップ183>
類似度評価部108は比較先のデータベース(第2のデータベース101)が有する各テーブルに対応する「特徴情報」を特徴情報記憶装置107から一つ取り出す。
<Step 183>
The
<ステップ184:類似度計算処理>
類似度評価部108はステップ182で取得した比較元のデータベース(第1のデータベース100)の「特徴情報」とステップ183で取得した比較先のデータベース(第2のデータベース101)の「特徴情報」とを比較して「特徴情報」の類似度、つまり、テーブルの類似度を計算する。
<Step 184: Similarity calculation processing>
The
<マッピング情報生成処理工程:ステップ185〜ステップ186>
<ステップ185>
類似度評価部108はステップ184で計算した類似度と重み付け変数記憶装置109に記憶された「類似判定閾値」とを比較する。比較した結果、類似度が「類似判定閾値」以上(類似)の場合はステップ186に処理を移し、類似度が「類似判定閾値」未満(非類似)の場合はステップ187に処理を移す。
<Mapping information generation process: Step 185 to Step 186>
<Step 185>
The
<ステップ186>
類似度評価部108はステップ185で類似と判定した1組の「特徴情報」についてマッピング候補を生成しマッピングモデル記憶装置110に格納された「マッピング情報」に設定する。
このとき、類似度評価部108はステップ185で類似と判定した1組の「特徴情報」のそれぞれについてスキーマ情報記憶装置104に記憶された「スキーマ情報」を検索して「ID」が一致するテーブル情報140を取得し、取得したテーブル情報140のテーブル名とステップ184で計算した類似度とをマッピング候補として図8に示すようにマッピングモデル記憶装置110に格納する。
<Step 186>
The
At this time, the
<ステップ187>
類似度評価部108は比較先のデータベース(第2のデータベース101)の「特徴情報」で未評価のものがないか確認し、未評価の「特徴情報」がある場合はステップ183に処理を移し、未評価の「特徴情報」がない場合はステップ188に処理を移す。
<Step 187>
The
<ステップ188>
類似度評価部108は比較元のデータベース(第1のデータベース100)の「特徴情報」で未評価のものがないか確認し、未評価の「特徴情報」がある場合はステップ182に処理を移し、未評価の「特徴情報」がない場合は類似度評価処理を終了する。
<Step 188>
The
上記の類似度評価処理により、類似度評価部108は比較元のデータベースが有する全てのテーブルを比較先の全てのテーブルと比較して各テーブル間の類似度を計算し、マッピング情報を作成する。
Through the similarity evaluation process described above, the
上記類似度評価処理は統合対象のデータベースが2つである場合を説明した。統合対象のデータベースが3つ以上ある場合は、各データベースを比較先のデータベースとしてステップ183〜ステップ187をデータベース数分処理し、各データベースを比較元のデータベースとしてステップS182〜ステップ188をデータベース数分処理する。 The case where the similarity evaluation process has two databases to be integrated has been described. If there are three or more databases to be integrated, steps 183 to 187 are processed for the number of databases using each database as a comparison target database, and steps S182 to 188 are processed for the number of databases using each database as a comparison source database. To do.
図11は、実施の形態1における類似度評価部108の類似度計算処理の流れを示すフローチャートである。
類似度評価部108が実行する上記ステップ184(類似度計算処理)について図11に基づいて以下に説明する。
類似度評価部108は、上記ステップ184(類似度計算処理)において、特徴情報項目毎に類似度を算出し、各特徴情報項目の類似度の合計値を「特徴情報」の類似度(テーブルの類似度)として算出する。
FIG. 11 is a flowchart showing a flow of similarity calculation processing of the
The step 184 (similarity calculation process) executed by the
In step 184 (similarity calculation processing), the
<ステップ201:特徴情報項目の類似度計算処理>
類似度評価部108は、上記ステップ182で取得した比較元のデータベース(第1のデータベース100)が有するテーブルの「特徴情報」と上記ステップ183で取得した比較先のデータベース(第2のデータベース101)が有するテーブルの「特徴情報」とから特徴情報項目を一つ選択して、選択した特徴情報項目の値を比較して選択した特徴情報項目の類似度を計算する。
<Step 201: Feature Information Item Similarity Calculation Processing>
The
<ステップ202>
類似度評価部108は、全ての特徴情報項目の類似度を計算したか確認し、類似度を算出していない特徴情報項目がある場合はステップ201に処理を移し、全ての特徴情報項目の類似度を計算済みである場合はステップ203に処理を移す。
<Step 202>
The
<ステップ203>
類似度評価部108は、各特徴情報項目の類似度に重み付け変数記憶装置109に記憶された各特徴情報項目の「比重」を掛けて合計した合計値を「特徴情報」の類似度(テーブルの類似度)として算出し類似度計算処理を終了する。
<Step 203>
The
次に、類似度評価部108が実行する上記ステップ201(特徴情報項目の類似度計算処理)について説明する。
特徴情報項目の類似度の計算には、“単一の項目値(各従属関係を示す属性が定義されたデータ項目の数を示す特徴情報項目値)”を比較して計算する場合と、“データ型の構成(データ型属性毎のデータ項目数を示す特徴情報項目値)”を比較する場合の二通りある。図6に示す特徴情報項目の場合、“単一の項目値”による類似度計算で比較する特徴情報項目は「主キー属性数」、「主キーの参照先テーブル数」、「従属属性数」、「外部キー属性数」が該当し、“データ型の構成”による類似度計算で比較する特徴情報項目は、「主キーのデータ型構成」、「従属属性のデータ型構成」、「外部キーのデータ型構成」が該当する。
以下に、“単一の項目値”による特徴情報項目の類似度計算処理と“データ型の構成”による特徴情報項目の類似度計算処理とを説明する。
Next, step 201 (feature information item similarity calculation processing) executed by the
The similarity of feature information items is calculated by comparing “single item values (feature information item values indicating the number of data items in which attributes indicating each dependency are defined)” and “ There are two ways to compare “data type configurations (feature information item values indicating the number of data items for each data type attribute)”. In the case of the feature information item shown in FIG. 6, the feature information items to be compared in the similarity calculation by “single item value” are “number of primary key attributes”, “number of primary key reference destination tables”, and “number of dependent attributes”. , “Number of foreign key attributes”, and feature information items to be compared in the similarity calculation by “data type configuration” are “primary key data type configuration”, “subordinate attribute data type configuration”, “foreign key "Data type configuration of".
The feature information item similarity calculation process using “single item value” and the feature information item similarity calculation process using “data type configuration” will be described below.
図12は、実施の形態1における特徴情報項目の類似度計算処理(単一の項目値)の流れを示すフローチャートである。
まず、上記ステップ201における類似度評価部108の“単一の項目値”による特徴情報項目の類似度計算処理について図12に基づいて以下に説明する。
“単一の項目値”による類似度計算で比較する特徴情報項目は「主キー属性数」、「主キーの参照先テーブル数」、「従属属性数」、「外部キー属性数」が該当する。
FIG. 12 is a flowchart showing the flow of the feature information item similarity calculation process (single item value) in the first embodiment.
First, the similarity calculation processing of the feature information item by the “single item value” of the
The feature information items to be compared in the similarity calculation using “single item value” correspond to “number of primary key attributes”, “number of primary key reference tables”, “number of dependent attributes”, and “number of foreign key attributes” .
<ステップ150>
類似度評価部108は比較元の特徴情報項目値が0かどうか調べる。0の場合はステップ151に処理を移し、0でない場合はステップ152に処理を移す。
<ステップ151>
比較元の特徴情報項目値が0である場合、類似度評価部108は比較先の特徴情報項目値が0かどうか調べる。0の場合はステップ157に処理を移し、0でない場合はステップ156に処理を移す。
<ステップ157>
比較元と比較先の特徴情報項目値が共に0である場合、類似度評価部108は当該特徴情報項目の類似度を1(類似)として特徴情報項目の類似度計算処理を終了する。
<Step 150>
The
<Step 151>
When the feature information item value of the comparison source is 0, the
<Step 157>
When both the comparison source and comparison target feature information item values are 0, the
<ステップ152>
比較元の特徴情報項目値が0でない場合、類似度評価部108は比較先の特徴情報項目値が0かどうか調べる。0の場合はステップ156に処理を移し、0でない場合はステップ153に処理を移す。
<ステップ153>
比較元と比較先の特徴情報項目値が共に0でない場合、類似度評価部108は減算処理を行い比較元の特徴情報項目値と比較先の特徴情報項目値との差の絶対値を計算する。
<ステップ154>
類似度評価部108はステップ153で比較した特徴情報項目に対応する「類似許容範囲」を重み付け変数記憶装置109から取得し、ステップ153で計算した比較元と比較先との特徴情報項目値の差の絶対値(以下、差分とする)と取得した「類似許容範囲」とを比較する。差分が「類似許容範囲」以下の場合はステップ155に処理を移し、「類似許容範囲」を超える場合はステップ156に処理を移す。
<ステップ155>
類似度評価部108はステップ153で比較した特徴情報項目に対応する「変動率」を重み付け変数記憶装置109から取得し、ステップ153で計算した差分と取得した「変動率」とに基づいて当該特徴情報項目の類似度を計算して特徴情報項目の類似度計算処理を終了する。特徴情報項目の類似度は「1−(変動率×差分)」の式で計算する。
<ステップ156>
差分が類似度許容範囲より大きい場合(ステップ154)、または、比較元と比較先との一方の特徴情報項目値が0で他方の特徴情報項目値が0でない場合(ステップ151、ステップ152)、類似度評価部108は当該特徴情報項目の類似度を0(非類似)として特徴情報項目の類似度計算処理を終了する。
以上の処理により類似度評価部108は“単一の項目値”の比較により特徴情報項目の類似度を計算する。
<Step 152>
If the comparison-source feature information item value is not 0, the
<Step 153>
If both the comparison source and comparison target feature information item values are not 0, the
<Step 154>
The
<Step 155>
The
<Step 156>
When the difference is larger than the similarity allowable range (step 154), or when one feature information item value of the comparison source and the comparison destination is 0 and the other feature information item value is not 0 (
Through the above processing, the
図13は、実施の形態1における特徴情報項目の類似度計算処理(データ型の構成)の流れを示すフローチャートである。
まず、上記ステップ201における類似度評価部108の“データ型の構成”による特徴情報項目の類似度計算処理について図13に基づいて以下に説明する。
“データ型の構成”による類似度計算で比較する特徴情報項目は、「主キーのデータ型構成」、「従属属性のデータ型構成」、「外部キーのデータ型構成」が該当する。
FIG. 13 is a flowchart showing the flow of the feature information item similarity calculation process (data type configuration) according to the first embodiment.
First, the similarity calculation processing of feature information items by the “data type configuration” of the
The feature information items to be compared in the similarity calculation based on “data type configuration” correspond to “primary key data type configuration”, “subordinate attribute data type configuration”, and “foreign key data type configuration”.
類似度評価部108は、“データ型の構成”による特徴情報項目の類似度計算処理において、標準データ型が一致するデータ項目同士は互いに“対応するデータ項目(類似するデータ項目)”であると判定し、“対応するデータ項目”以外の“対応しないデータ項目”の数に基づいて類似度を算出する。また、類似度評価部108は、標準データ型が一致しない“対応しないデータ項目”を他の標準データ型(代替対応データ型)に置き換えることで、元の標準データ型が一致しなかった“対応しないデータ項目”を“対応するデータ項目”として扱う。このとき、類似度評価部108は、元の標準データ型と代替対応データ型との類似度(標準データ型間での類似度)に応じて“対応するデータ項目”の数および“対応しないデータ項目”の数を設定し類似度を算出する。
The
<ステップ160>
類似度評価部108は元の標準データ型同士で“対応するデータ項目”が幾つ有るか算出する。
そこで、類似度評価部108は、標準データ型毎に特徴情報項目の比較先のデータ項目数(文字型属性数、真数型属性数など)から比較元のデータ項目数を減算して標準データ型の差分値を計算する。
<ステップ161>
類似度評価部108は、全ての標準データ型について全てのデータ項目が“対応するデータ項目”であるか、つまり、“対応しないデータ項目”が無いかを判定する。
そこで、類似度評価部108は、すべての標準データ型について、ステップ160で計算した差分値が0かどうか調べる。すべての標準データ型の差分値が0であるとき、比較元と比較先ですべてのデータ項目が対応付けられたことを示す。すべての差分値が0の場合はステップ162に処理を移し、そうでない場合はステップ163に処理を移す。
<ステップ162>
全ての標準データ型の差分値が0である場合、類似度評価部108は当該特徴情報項目の類似度を1(類似)として特徴情報項目の類似度計算処理を終了する。
<ステップ163>
差分値が0である標準データ型が全ての標準データ型でない場合、類似度評価部108は、比較元と比較先のいずれか一方について全てのデータ項目が“対応するデータ項目”であるか、つまり、各データ型のデータ項目数について、比較元と比較先との一方のデータ項目数が他方のデータ項目数より全てのデータ型で多いかを判定する。
そこで、類似度評価部108は、ステップ160で計算した差分値のすべての値が正(+)または負(−)であるか調べる。すべての差分値が正(+)または0であるとき、比較元のデータ項目がすべて対応付けられたことを示す。すべての差分値が負(−)または0であるとき、比較先のデータ項目がすべて対応付けられたことを示す。すべての差分値が正か負の場合はステップ164に処理を移し、そうでない場合はステップ167に処理を移す。
図14に比較元のデータ項目が全て対応付けられる場合のデータ項目数の例を示し、図15に比較先のデータ項目が全て対応付けられる場合の例を示し、図16に比較元・比較先共に未対応のデータ項目がある場合の例を示す。
<ステップ164>
全ての差分値が正か負の場合、類似度評価部108はステップ160で計算した各標準データ型での差分値の絶対値を合計する。合計した値は、比較元と比較先とで“対応しないデータ項目”の数である。
図14または図15に示す差分値の場合、合計は“5=3+2+0”である
<ステップ165>
類似度評価部108は当該特徴情報項目に対応する「類似許容範囲」を重み付け変数記憶装置109から取得し、ステップ164で計算した合計(“対応しないデータ項目”の数)と取得した「類似許容範囲」とを比較する。合計が「類似許容範囲」以下の場合はステップ166に処理を移し、「類似許容範囲」を超える場合はステップ174に処理を移す。
<ステップ166>
合計が「類似許容範囲」以下の場合、類似度評価部108は当該特徴情報項目に対応する「変動率」を重み付け変数記憶装置109から取得し、ステップ164で計算した合計と取得した「変動率」とに基づいて当該特徴情報項目の類似度を計算して特徴情報項目の類似度計算処理を終了する。特徴情報項目の類似度は「1−(変動率×合計)」の式で計算する。
<Step 160>
The
Therefore, the
<Step 161>
The
Therefore, the
<Step 162>
When the difference values of all the standard data types are 0, the
<Step 163>
If the standard data type with a difference value of 0 is not all standard data types, the
Therefore, the
FIG. 14 shows an example of the number of data items when all the comparison source data items are associated, FIG. 15 shows an example when all the comparison destination data items are associated, and FIG. 16 shows the comparison source / comparison destination. An example in which there are unsupported data items is shown.
<Step 164>
If all the difference values are positive or negative, the
In the case of the difference values shown in FIG. 14 or FIG. 15, the total is “5 = 3 + 2 + 0” <Step 165>
The
<Step 166>
When the total is equal to or less than the “similar allowable range”, the
以下、ステップ160で計算した差分値が図17に示す値である場合を例に説明する。
Hereinafter, a case where the difference value calculated in
<ステップ167>
正の差分値と負の差分値とがある場合(ステップ163)、代替対応データ型でなく元の標準データ型で“対応するデータ項目”になっているデータ項目の数を算出する。
そこで、類似度評価部108は、まず、比較元の各データ型の値の合計(A)を計算する。つまり、類似度評価部108は比較元の全データ項目数を求める。図17の場合、“合計(A)=5+5+2+2+1=15”である(ステップ167a)。
次に、ステップ160で計算した差分値の中で、負の値になっているものの合計(B)を計算する。このとき、「差分値=比較先のデータ項目数−比較元のデータ項目数」なので、値が負の差分値は、比較先に対応するデータ項目が無い比較元のデータ項目の数となる。図17の場合、“合計(B)=(−2)+(−1)=−3”である(ステップ167b)。
そして、合計Aと合計Bを加算して、比較元と比較先とで“対応するデータ項目”の数を求める。図17の場合、“対応するデータ項目数=15+(−3)=12”である(ステップ167c)。
<Step 167>
If there is a positive difference value and a negative difference value (step 163), the number of data items that are “corresponding data items” in the original standard data type instead of the alternative corresponding data type is calculated.
Therefore, the
Next, the sum (B) of negative values among the difference values calculated in
Then, the total A and the total B are added to determine the number of “corresponding data items” between the comparison source and the comparison destination. In the case of FIG. 17, “the number of corresponding data items = 15 + (− 3) = 12” (step 167c).
<ステップ168〜ステップ170>
類似度評価部108は、“対応しないデータ項目”の標準データ型を代替対応データ型に置き換える際、“対応しないデータ項目”を有する他の標準データ型のうちから代替対応データ型を選択する。代替対応データ型の選択は「標準データ型間での類似度」に基づいて行う。
<Step 168 to Step 170>
When replacing the standard data type of “non-corresponding data item” with an alternative correspondence data type, the
以下、「標準データ型間での類似度」が図7に示す値である場合を例に説明する。 Hereinafter, a case where “similarity between standard data types” is the value shown in FIG. 7 will be described as an example.
<ステップ168>
類似度評価部108は、ステップ160で計算した差分値が負のデータ型について、代替対応データ型がないか調べる。図17の場合、真数型(差分値=−2)とバイナリ型(差分値=−1)について代替対応データ型が無いか調べる。以下、真数型を例に説明する。
類似度評価部108は、まず、重み付け変数記憶装置109に記憶された「標準データ型間での類似度」において、差分値が負の標準データ型との類似度が0でない標準データ型を調べる。図7に示す「標準データ型間の類似度」の場合、真数型との類似度が0でない標準データ型は文字型と概数型と日付型である。類似度が0でない標準データ型がない場合は代替対応データ型もない(ステップ168a)。
次に、差分値が正のデータ型を調べる。図17に示す差分値の場合、文字型と概数型と日付型のうち差分値が正のデータ型は文字型と概数型である。差分値が正のデータ型がない場合は代替対応データ型もない(ステップ168b)。
そして、「標準データ型間での類似度」が大きい標準データ型から順番に代替対応データ型を選択する。図7に示す「標準データ型間の類似度」の場合、文字型と概数型とで真数型との類似度が大きいのは概数型であるため代替対応データ型は概数型である(ステップ168c)。
類似度評価部108は代替対応データ型が有る場合はステップ169に処理を移し、無い場合はステップ170に処理を移す(ステップ168d)。
<Step 168>
The
The
Next, the data type with a positive difference value is examined. In the case of the difference value shown in FIG. 17, the data type having a positive difference value among the character type, the approximate number type, and the date type is the character type and the approximate number type. If there is no data type with a positive difference value, there is no alternative corresponding data type (step 168b).
Then, the alternative corresponding data types are selected in order from the standard data type having the largest “similarity between standard data types”. In the case of the “similarity between standard data types” shown in FIG. 7, it is the round type that has a large similarity between the character type and the round type, and the alternative data type is the round type (step 168c).
The
<ステップ169>
類似度評価部108は、ステップ168で代替対応データ型を選択することにより“対応するデータ項目”として扱うデータ項目について、ステップ160で計算した差分値に反映する。
そこで、類似度評価部108は、まず、負の値でありデータ型を代替対応データ型に置き換える元の標準データ型の差分値と正の値であり代替対応データ型の差分値を加算する。図17に示す差分値の場合、“(−2){真数型の差分値}+1{概数型の差分値}=−1”である(ステップ169a)。
加算した結果が正の値の場合、元の標準データ型の差分値の絶対値を代替対応済データ項目数とし、元の標準データ型の差分値を0とし、代替対応データ型の差分値をステップ169aの加算結果として設定する。つまり、加算した結果が正の値nの場合、“代替対応済データ項目数=元の標準データ型の差分値の絶対値”、“元の標準データ型の差分値=0”、“代替対応データ型の差分値=n”である。加算した結果が負の値の場合、代替対応データ型の差分値を代替対応済データ項目数とし、元の標準データ型の差分値をステップ169aの加算結果とし、代替対応データ型の差分値を0として設定する。つまり、図17に示す差分値の場合、“代替対応済データ項目数=1”、“真数型の差分値=(−1)”、“概数型の差分値=0”である。加算した結果が0のときは、代替対応データ型の差分値を代替対応済データ項目数とし、元の標準データ型と代替対応データ型の両方の差分値を0にする。つまり、加算した結果が0の場合、“代替対応済データ項目数=代替対応データ型の差分値”、“元の標準データ型の差分値=0”、“代替対応データ型の差分値=0”である(ステップ169b)。
次に、重み付け変数記憶装置109の「標準データ型間での類似度」が示す元の標準データ型と代替対応データ型との類似度と代替対応済データ項目数とを掛け合わせステップ167で算出した“対応するデータ項目”の数に加算する。図17に示す差分値の場合、“1{真数型の代替対応済データ項目数}×0.8{真数型と概数型との類似度}+12{代替対応データ型で置き換える前の対応するデータ項目数}=12.8{代替対応データ型で置き換えた後の対応するデータ項目数}”である(ステップ169c)
<Step 169>
The
Therefore, the
When the result of addition is a positive value, the absolute value of the difference value of the original standard data type is set as the number of data items that can be replaced, the difference value of the original standard data type is set to 0, and the difference value of the replacement corresponding data type is set to Set as the addition result of step 169a. That is, if the result of addition is a positive value n, “number of alternative supported data items = absolute value of difference value of original standard data type”, “difference value of original standard data type = 0”, “substitution support” Data type difference value = n ″. If the result of addition is a negative value, the difference value of the substitution corresponding data type is set as the number of data items corresponding to substitution, the difference value of the original standard data type is set as the addition result of step 169a, and the difference value of the substitution corresponding data type is Set as 0. That is, in the case of the differential values shown in FIG. 17, “the number of substitution-corresponding data items = 1”, “the true type differential value = (− 1)”, and “the approximate type differential value = 0”. When the result of addition is 0, the difference value of the alternative correspondence data type is set as the number of data items corresponding to the alternative correspondence, and the difference values of both the original standard data type and the alternative correspondence data type are set to 0. That is, if the result of addition is 0, “the number of substitution-supported data items = difference value of substitution-compatible data type”, “difference value of original standard data type = 0”, “difference value of substitution-compatible data type = 0” "(Step 169b).
Next, in
<ステップ170>
類似度評価部108は代替対応データ型の探索(ステップ168)をしていない“対応しないデータ項目”が残っているか判定する。
そこで、類似度評価部108は、ステップ160で計算した差分値が負の標準データ型のうち、代替対応データ型の探索をしていないものがないか調べ、未探索の標準データ型がある場合はステップ168に処理を移し、ない場合はステップ171に処理を移す。図17に示す差分値の場合、一回目のステップ169の結果は図18になる。図18に示す結果の場合、差分値が負で代替対応データ型を探索していないものがあるか調べると、差分値が負のものは、真数型とバイナリ型であり、このうち真数型は探索済みなので、バイナリ型についてステップ168に処理を移す。バイナリ型の処理も完了すると、未探索のものはなくなるので、ステップ171に処理を移す。
<Step 170>
The
Therefore, the
<ステップ171>
類似度評価部108は“対応しないデータ項目”の数を計算する。
このとき、類似度評価部108は、正である差分値の合計と負である差分値の合計の絶対値を比較し、値が大きい方を“対応しないデータ項目”の数とする。差分値がすべてのデータ型で0になった場合の“対応しないデータ項目”の数は0である。図17に示す差分値の場合、ステップ170の結果は図18になる。図18に示す結果の場合、“正である差分値の合計=1”、“負である差分値の合計の絶対値=2”であるため、“対応しないデータ項目の数=2”である。
<Step 171>
The
At this time, the
<ステップ172>
類似度評価部108は当該特徴情報項目に対応する「類似許容範囲」を重み付け変数記憶装置109から取得し、ステップ171で計算した合計(“対応しないデータ項目”の数)と取得した「類似許容範囲」とを比較する。合計が「類似許容範囲」以下の場合はステップ173に処理を移し、「類似許容範囲」を超える場合はステップ174に処理を移す。ステップ170の結果が図18であり合計が2である場合、「類似許容範囲」=3とすると“2{合計}≦3{類似許容範囲}”であるからステップ173に処理を移す。また、「類似許容範囲」=1とすると“2{合計}>1{類似許容範囲}”となるためステップ174に処理を移す。
<Step 172>
The
<ステップ173>
合計が「類似許容範囲」以下の場合、類似度評価部108は、当該特徴情報項目に対応する「変動率」を重み付け変数記憶装置109から取得し、ステップ171で計算した合計と取得した「変動率」とに基づいて当該特徴情報項目の類似度を計算して特徴情報項目の類似度計算処理を終了する。特徴情報項目の類似度は「(1−(変動率×合計))×(対応するデータ項目数÷全データ項目数)」の式で計算する。
このとき、類似度評価部108は、まず、比較元と比較先それぞれについて、各データ型の値の合計を計算し、合計が小さい方、つまり、少ない方のデータ項目数を全データ項目数とする。ステップ170の結果が図18の場合、“比較元のデータ型の値の合計=5+5+2+2+1=15”、“比較先のデータ型の値の合計=6+3+3+2+0=14”であるため、“全データ項目数=14(<15)”である(ステップ173a)。
そして、ステップ167およびステップ169で算出した“対応するデータ項目”の数とステップ171で計算した合計と重み付け変数記憶装置109から取得した「変動率」とに基づいて特徴情報項目の類似度を計算する。「変動率」が0.1、ステップ170の結果が図18、合計が2、“対応するデータ項目”の数が12.8の場合、“類似度=0.73≒(1−(0.1×2))×(12.8÷14)”である(ステップ173b)。
<Step 173>
When the total is equal to or less than the “similar allowable range”, the
At this time, the
Then, the similarity of the feature information item is calculated based on the number of “corresponding data items” calculated in
<ステップ174>
合計が「類似許容範囲」を超える場合(ステップ165、ステップ172)、類似度評価部108は当該特徴情報項目の類似度を0(非類似)として特徴情報項目の類似度計算処理を終了する。
以上の処理により類似度評価部108は“データ型の構成”の比較による特徴情報項目の類似度を計算する。
<Step 174>
When the total exceeds the “similar allowable range” (
With the above processing, the
上記実施の形態において、異なるデータベース間のスキーマ統合支援処理で、データベースの固有データ型を標準データ型に対応付けるデータ型辞書と、類似度の計算や評価基準に使用する重み付け変数を備え、データベースからスキーマ情報を抽出する手段(スキーマ情報抽出部103)と、抽出したスキーマ情報からデータの特徴情報を生成する手段(特徴情報生成部105)と、生成した特徴情報から類似度を評価しマッピングモデルを作成する手段(類似度評価部108)を有することを特徴とするスキーマ統合支援方法について説明した。 In the above embodiment, the schema integration support process between different databases includes a data type dictionary that associates the unique data type of the database with the standard data type, and a weighting variable that is used for similarity calculation and evaluation criteria. Means for extracting information (schema information extracting unit 103), means for generating feature information of data from the extracted schema information (feature information generating unit 105), and creating a mapping model by evaluating similarity from the generated feature information A schema integration support method characterized by having means (similarity evaluation unit 108) for performing the above has been described.
また、スキーマ情報として主にデータ間の制約条件・従属関係を使用して特徴情報を生成することを特徴とするスキーマ統合支援方法について説明した。 In addition, a schema integration support method characterized by generating feature information mainly using constraint conditions and dependency relationships between data as schema information has been described.
以上のように、データベースのスキーマ情報からデータ間の制約条件・従属関係に着目してテーブルの特徴情報を作成し、特徴情報を比較してテーブルの類似度を計算することで、一定基準の類似度(「類似判定閾値」以上の類似度)を持つテーブルのマッピング候補を生成することができる。
また、マッピング候補毎に類似度が計算されるため、類似度を比較することによりマッピング候補の順位付けを行うことができる。
さらに、特徴情報には外部キー属性や主キーの参照先テーブル数といった他のテーブルとの関連性の情報を含んでいるため、構造が似ているテーブルが複数存在している場合にも、他のテーブルとの関連性から類似度の違いを判別できる。
また、属性のデータ型は標準データ型に対応付けられ、異なる標準データ型間での類似度を評価できるので、同一の意味のデータ項目を異なるデータ型で定義しているようなスキーマ同士(例えば、日付データを片や文字型でもう一方は日付型で定義)についても対応できる。
さらに、特徴情報は数値項目の集合として定義されており、各項目について共通の方法により類似度を評価するので、特徴情報の項目の追加、削除に容易に対応できる。
また、特徴情報はデータベースのスキーマ情報から作成するので、データベースの実データにアクセスすることなしに、マッピング候補を作成できる。
さらに、マッピング候補の判定に実データを使用しないため、統合対象のデータベース間でのデータ内容の標準化(統一)といった前処理が不要である。
そして、特徴情報の項目としてデータの属性名を使用しないため、属性名が適切に設定されていないデータベースに対してもマッピング候補を作成できる。
As described above, the feature information of the table is created from the schema information of the database by paying attention to the constraint condition and dependency relationship between the data, and the similarity of the table is calculated by comparing the feature information, and the similarity of the fixed criteria Table mapping candidates having a degree (similarity greater than or equal to “similarity determination threshold”) can be generated.
Also, since the similarity is calculated for each mapping candidate, the mapping candidates can be ranked by comparing the similarities.
In addition, since the feature information includes information related to other tables such as foreign key attributes and the number of primary key reference tables, other information can be used even when there are multiple tables with similar structures. The difference in similarity can be determined from the relationship with the table.
In addition, attribute data types are associated with standard data types, and the similarity between different standard data types can be evaluated. Therefore, schemas in which data items having the same meaning are defined with different data types (for example, , Date data is defined as a single or character type and the other is defined as a date type).
Furthermore, the feature information is defined as a set of numerical items, and the similarity is evaluated by a common method for each item. Therefore, addition and deletion of feature information items can be easily handled.
Further, since the feature information is created from the schema information of the database, mapping candidates can be created without accessing the actual data of the database.
Furthermore, since actual data is not used for determining mapping candidates, preprocessing such as standardization (unification) of data contents between databases to be integrated is not required.
Since the attribute name of the data is not used as the feature information item, mapping candidates can be created even for a database in which the attribute name is not properly set.
上記実施の形態において、「リレーショナルデータベース」を例に挙げて説明したが、階層データベース、ネットワークデータベース、オブジェクト指向データベースなどの他のデータベースが統合対象のデータベースであっても構わない。上記実施の形態における「テーブル」とは特定のデータ構造を有するデータの集合を意味し、「リレーショナルデータベース」以外のデータベースにおいても、上記実施の形態と同様に、データ構造(特に、データ間の従属関係やデータ型)に基づいて類似度を算出し、マッピング情報を生成すればよい。 In the above embodiment, the “relational database” has been described as an example. However, other databases such as a hierarchical database, a network database, and an object-oriented database may be databases to be integrated. The “table” in the above embodiment means a set of data having a specific data structure, and in a database other than the “relational database”, the data structure (particularly, the dependency between data) is similar to the above embodiment. Similarity may be calculated based on the relationship and data type) to generate mapping information.
100 第1のデータベース、101 第2のデータベース、102 スキーマ統合支援装置、103 スキーマ情報抽出部、104 スキーマ情報記憶装置、105 特徴情報生成部、106 データ型辞書記憶装置、107 特徴情報記憶装置、108 類似度評価部、109 重み付け変数記憶装置、110 マッピングモデル記憶装置、140 テーブル情報、141 主キーカラム情報、142 主キー参照先情報、143 従属カラム情報、144 外部キー情報、145 外部キーカラム情報、901 表示装置、902 K/B、903 マウス、904 FDD、905 CDD、906 プリンタ装置、907 スキャナ装置、908 光ディスク装置、910 システムユニット、911 CPU、912 バス、913 ROM、914 RAM、915 通信ボード、920 磁気ディスク装置、921 OS、922 ウィンドウシステム、923 プログラム群、924 ファイル群、931 電話器、932 FAX機、940 インターネット、941 ウェブサーバ、942 LAN。
DESCRIPTION OF
Claims (9)
第1のデータベースが有するテーブルAのデータ構造情報と第2のデータベースが有するテーブルBのデータ構造情報とを記憶したスキーマ情報記憶装置と、
前記スキーマ情報記憶装置に記憶された第1のデータベースが有するテーブルAのデータ構造情報と第2のデータベースが有するテーブルBのデータ構造情報とを中央処理装置を用いて比較して第1のデータベースが有するテーブルAと第2のデータベースが有するテーブルBとの類似度を算出し算出した類似度をマッピング情報として出力装置に出力する類似度評価部と
を備えたことを特徴とするスキーマ統合支援装置。 A schema integration support device that outputs mapping information about a table to be mapped between the first database and the second database as information for supporting integration between the first database and the second database;
A schema information storage device that stores data structure information of table A included in the first database and data structure information of table B included in the second database;
The first database is obtained by comparing the data structure information of the table A of the first database stored in the schema information storage device with the data structure information of the table B of the second database using the central processing unit. What is claimed is: 1. A schema integration support apparatus comprising: a similarity evaluation unit that calculates a similarity between a table A and a table B included in a second database and outputs the calculated similarity as mapping information to an output device.
前記類似度評価部は前記データ構造情報に含まれる当該テーブルが有するデータ項目の従属関係を示す属性について比較して類似度を算出する
ことを特徴とする請求項1記載のスキーマ統合支援装置。 The schema information storage device stores an attribute indicating a dependency of data items included in the table in the data structure information,
The schema integration support apparatus according to claim 1, wherein the similarity evaluation unit calculates a similarity by comparing attributes indicating data item dependency included in the table included in the data structure information.
前記類似度評価部は前記データ構造情報に含まれる主キー属性と従属属性と外部キー属性との少なくともいずれかの属性について比較して類似度を算出する
ことを特徴とする請求項2記載のスキーマ統合支援装置。 The schema information storage device stores at least one of a primary key attribute, a subordinate attribute, and a foreign key attribute, and stores a subordinate relationship of data items of the table;
3. The schema according to claim 2, wherein the similarity evaluation unit compares at least one of a primary key attribute, a subordinate attribute, and a foreign key attribute included in the data structure information to calculate a similarity. Integrated support device.
主キー属性を持つデータ項目の数と従属属性を持つデータ項目の数と外部キー属性を持つデータ項目の数との少なくともいずれかのデータ項目の数を比較して類似度を算出する
ことを特徴とする請求項3記載のスキーマ統合支援装置。 The similarity evaluation unit
The similarity is calculated by comparing the number of data items having at least one of the number of data items having a primary key attribute, the number of data items having a dependent attribute, and the number of data items having a foreign key attribute. The schema integration support apparatus according to claim 3.
前記類似度評価部は前記データ構造情報に含まれる当該テーブルが有するデータ項目のデータ型を示す属性について比較して類似度を算出する
ことを特徴とする請求項1記載のスキーマ統合支援装置。 The schema information storage device stores an attribute indicating a data type of a data item included in the table in the data structure information,
The schema integration support apparatus according to claim 1, wherein the similarity evaluation unit compares the attribute indicating the data type of the data item included in the table included in the data structure information and calculates the similarity.
データ項目のデータ型毎の数を比較して類似度を算出する
ことを特徴とする請求項5記載のスキーマ統合支援装置。 The similarity evaluation unit
6. The schema integration support apparatus according to claim 5, wherein the similarity is calculated by comparing the number of data items for each data type.
前記類似度評価部は主キー属性を持つデータ項目のデータ型毎の数と従属属性を持つデータ項目のデータ型毎の数と外部キー属性を持つデータ項目のデータ型毎の数との少なくともいずれかのデータ項目のデータ型毎の数を比較して類似度を算出する
ことを特徴とする請求項6記載のスキーマ統合支援装置。 The schema information storage device stores at least one of a primary key attribute, a dependent attribute, and a foreign key attribute of a data item included in the table in the data structure information,
The similarity evaluation unit includes at least one of the number of data items having a primary key attribute for each data type, the number of data items having a dependent attribute for each data type, and the number of data items having a foreign key attribute for each data type. 7. The schema integration support apparatus according to claim 6, wherein the similarity is calculated by comparing the number of each data item for each data type.
第1のデータベースが有するテーブルAのデータ構造情報と第2のデータベースが有するテーブルBのデータ構造情報とをスキーマ情報記憶装置に記憶し、
類似度評価部が前記スキーマ情報記憶装置に記憶された第1のデータベースが有するテーブルAのデータ構造情報と第2のデータベースが有するテーブルBのデータ構造情報とを中央処理装置を用いて比較して第1のデータベースが有するテーブルAと第2のデータベースが有するテーブルBとの類似度を算出し算出した類似度をマッピング情報として出力装置に出力する類似度評価処理を
行うことを特徴とするスキーマ統合支援方法。 A schema integration support method of a schema integration support apparatus that outputs mapping information about tables mapped in the first database and the second database as information supporting the integration of the first database and the second database;
Storing the data structure information of the table A included in the first database and the data structure information of the table B included in the second database in the schema information storage device;
The similarity evaluation unit compares the data structure information of the table A included in the first database stored in the schema information storage device with the data structure information of the table B included in the second database using the central processing unit. Schema integration characterized by calculating similarity between table A of the first database and table B of the second database and performing similarity evaluation processing for outputting the calculated similarity to the output device as mapping information Support method.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006006596A JP4855080B2 (en) | 2006-01-13 | 2006-01-13 | Schema integration support apparatus, schema integration support method of schema integration support apparatus, and schema integration support program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006006596A JP4855080B2 (en) | 2006-01-13 | 2006-01-13 | Schema integration support apparatus, schema integration support method of schema integration support apparatus, and schema integration support program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007188343A true JP2007188343A (en) | 2007-07-26 |
JP4855080B2 JP4855080B2 (en) | 2012-01-18 |
Family
ID=38343464
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006006596A Expired - Fee Related JP4855080B2 (en) | 2006-01-13 | 2006-01-13 | Schema integration support apparatus, schema integration support method of schema integration support apparatus, and schema integration support program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4855080B2 (en) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010224799A (en) * | 2009-03-23 | 2010-10-07 | Ntt Comware Corp | Semantic associating device and method for processing the same, and program |
JP2011028379A (en) * | 2009-07-22 | 2011-02-10 | Toshiba Corp | Program and device for converting data structure |
JP5187308B2 (en) * | 2007-08-01 | 2013-04-24 | 日本電気株式会社 | Conversion program search system and conversion program search method |
WO2014192116A1 (en) * | 2013-05-30 | 2014-12-04 | 三菱電機株式会社 | Data link assistance device and data link assistance method |
JP2015165366A (en) * | 2014-03-03 | 2015-09-17 | 富士通株式会社 | Database reconstruction method, database reconstruction program, and database reconstruction apparatus |
WO2017064769A1 (en) * | 2015-10-14 | 2017-04-20 | 株式会社ターボデータラボラトリー | Information processing system and computer program |
JP2021519964A (en) * | 2018-04-16 | 2021-08-12 | オラクル・インターナショナル・コーポレイション | Learning ETL rules by example |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004086782A (en) * | 2002-08-29 | 2004-03-18 | Hitachi Ltd | Apparatus for supporting integration of heterogeneous database |
JP2004227037A (en) * | 2003-01-20 | 2004-08-12 | Sangaku Renkei Kiko Kyushu:Kk | Field matching device, program therefor, computer readable recording medium, and identical field determination method |
JP2006004411A (en) * | 2004-05-14 | 2006-01-05 | Microsoft Corp | Method and system for schema matching of web database |
JP2006099236A (en) * | 2004-09-28 | 2006-04-13 | Toshiba Corp | Classification support device, classification support method, and classification support program |
-
2006
- 2006-01-13 JP JP2006006596A patent/JP4855080B2/en not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004086782A (en) * | 2002-08-29 | 2004-03-18 | Hitachi Ltd | Apparatus for supporting integration of heterogeneous database |
JP2004227037A (en) * | 2003-01-20 | 2004-08-12 | Sangaku Renkei Kiko Kyushu:Kk | Field matching device, program therefor, computer readable recording medium, and identical field determination method |
JP2006004411A (en) * | 2004-05-14 | 2006-01-05 | Microsoft Corp | Method and system for schema matching of web database |
JP2006099236A (en) * | 2004-09-28 | 2006-04-13 | Toshiba Corp | Classification support device, classification support method, and classification support program |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5187308B2 (en) * | 2007-08-01 | 2013-04-24 | 日本電気株式会社 | Conversion program search system and conversion program search method |
JP2010224799A (en) * | 2009-03-23 | 2010-10-07 | Ntt Comware Corp | Semantic associating device and method for processing the same, and program |
JP2011028379A (en) * | 2009-07-22 | 2011-02-10 | Toshiba Corp | Program and device for converting data structure |
WO2014192116A1 (en) * | 2013-05-30 | 2014-12-04 | 三菱電機株式会社 | Data link assistance device and data link assistance method |
GB2529095A (en) * | 2013-05-30 | 2016-02-10 | Mitsubishi Electric Corp | Data link assistance device and data link assistance method |
JP5972461B2 (en) * | 2013-05-30 | 2016-08-17 | 三菱電機株式会社 | Data linkage support apparatus and data linkage support method |
JP2015165366A (en) * | 2014-03-03 | 2015-09-17 | 富士通株式会社 | Database reconstruction method, database reconstruction program, and database reconstruction apparatus |
WO2017064769A1 (en) * | 2015-10-14 | 2017-04-20 | 株式会社ターボデータラボラトリー | Information processing system and computer program |
JP2021519964A (en) * | 2018-04-16 | 2021-08-12 | オラクル・インターナショナル・コーポレイション | Learning ETL rules by example |
JP7419244B2 (en) | 2018-04-16 | 2024-01-22 | オラクル・インターナショナル・コーポレイション | Learning ETL rules by example |
Also Published As
Publication number | Publication date |
---|---|
JP4855080B2 (en) | 2012-01-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5392077B2 (en) | Ontology processing apparatus, ontology processing method, and ontology processing program | |
US8886617B2 (en) | Query-based searching using a virtual table | |
US8209407B2 (en) | System and method for web service discovery and access | |
US9043365B2 (en) | Peer to peer (P2P) federated concept queries | |
Scharffe et al. | Rdf-ai: an architecture for rdf datasets matching, fusion and interlink | |
US8375046B2 (en) | Peer to peer (P2P) federated concept queries | |
Chakaravarthy et al. | Efficiently linking text documents with relevant structured information | |
US7487174B2 (en) | Method for storing text annotations with associated type information in a structured data store | |
US20240126815A1 (en) | Data Preparation Using Semantic Roles | |
US7269593B2 (en) | Data processing apparatus and method | |
US10095766B2 (en) | Automated refinement and validation of data warehouse star schemas | |
JP4855080B2 (en) | Schema integration support apparatus, schema integration support method of schema integration support apparatus, and schema integration support program | |
US20130325881A1 (en) | Supplementing Structured Information About Entities With Information From Unstructured Data Sources | |
US20050149538A1 (en) | Systems and methods for creating and publishing relational data bases | |
US6915303B2 (en) | Code generator system for digital libraries | |
JP2008033931A (en) | Method for enrichment of text, method for acquiring text in response to query, and system | |
US20120066580A1 (en) | System for extracting relevant data from an intellectual property database | |
US8086568B2 (en) | Peer to peer (P2P) concept query notification of available query augmentation within query results | |
US20170116306A1 (en) | Automated Definition of Data Warehouse Star Schemas | |
US7587407B2 (en) | System and method for creation, representation, and delivery of document corpus entity co-occurrence information | |
US20030110175A1 (en) | Deploying predefined data warehouse process models | |
US8290950B2 (en) | Identifying locale-specific data based on a total ordering of supported locales | |
US20080250003A1 (en) | Peer to peer (p2p) concept query abstraction model augmentation with federated access only elements | |
JP2007304796A (en) | Database analysis system, database analysis method and program | |
CN109213830B (en) | Document retrieval system for professional technical documents |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080610 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110223 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110308 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110414 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110809 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110915 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20111025 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111026 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141104 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |