JP4859456B2 - データスキーマのマッピングプログラム及び計算機システム - Google Patents

データスキーマのマッピングプログラム及び計算機システム Download PDF

Info

Publication number
JP4859456B2
JP4859456B2 JP2005374359A JP2005374359A JP4859456B2 JP 4859456 B2 JP4859456 B2 JP 4859456B2 JP 2005374359 A JP2005374359 A JP 2005374359A JP 2005374359 A JP2005374359 A JP 2005374359A JP 4859456 B2 JP4859456 B2 JP 4859456B2
Authority
JP
Japan
Prior art keywords
data
data item
relationship
schema
item names
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005374359A
Other languages
English (en)
Other versions
JP2007179146A (ja
Inventor
敦子 小泉
勝 竹内
敏子 相薗
康嗣 森本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2005374359A priority Critical patent/JP4859456B2/ja
Priority to US11/642,828 priority patent/US7996437B2/en
Publication of JP2007179146A publication Critical patent/JP2007179146A/ja
Application granted granted Critical
Publication of JP4859456B2 publication Critical patent/JP4859456B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/80Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
    • G06F16/84Mapping; Conversion

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、複数のデータスキーマ間でデータ項目名を対応付ける技術に関する。
近年、インターネットを基盤としたBtoB(企業間)サービスへのニーズが高まり、企業間の情報・サービスの相互運用性を向上させるための国際標準化、業界標準化が進んでいる。例えばEDI(電子データ交換)についてはebXML(electronic business XML) 仕様の業界標準XML/EDIが主流になっており、また、財務情報についてはXBRL(eXtensible Business Reporting Language)が主流となっており、各企業独自の仕様で記述されたデータの項目を標準仕様の項目に対応付ける必要がある。対応付けのためのツールとしては、各種独自フォーマットファイルとEDI標準フォーマットファイルの相互変換を行うツールがいくつか存在するが、いずれも複数のデータベースのフォーマット間のデータ項目の対応関係の定義はGUIを使って人手で行う必要がある。そのため、データベースシステムや情報検索システムの新規導入や業界標準へのバージョンアップなどの変化への対応に手間がかかり、さらに、項目名をマッピングするノウハウが属人的に蓄積されるなどの問題が生じている。
上記データ項目名の対応付けに関する従来技術としては、あらかじめ用意した辞書やオントロジ(仕様記述に使用される語彙の関係)を用いる方法が知られている。例えば、特許文献1には、辞書を用いてデータ項目名を「修飾語+主要語+区分語」に分解し、各要素が辞書に一致するかどうかに基づいてデータ項目名の類似度を計算する方法が開示されている。
また、特許文献2には、情報検索の手段として、オントロジに概念間の階層関係や類義関係を記述し、オントロジを使って近似的な検索条件を生成する方法が開示されている。
また、特許文献3には、電子文書を取り込んで、2個の形態素間の概念関係を示すデータを出力する技術が開示されている。
特開平8−249338号 特開2003−345821号 特開2005−157823号
上記従来技術では、データ項目名の対応付けのためにあらかじめ辞書やオントロジに概念間の階層関係や類義関係を記述しておく必要がある。また、データ項目名の対応付けでは、同じような構成要素語からなるデータ項目名の中から対応するものを選ぶ必要があるため、従来の「類似度」を計算する方法では候補を絞りきれないという問題がある。例えば、あるデータスキーマにおける「注文日付」というデータ項目名が別のデータスキーマにおけるどのデータ項目名に対応するかという対応付けをする際に、類似度だけでは「注文年月日」、「注文番号」などの候補が得られるが、絞りこみが難しい。
そこで本発明は、上記問題点に鑑みてなされたもので、異なるデータスキーマ間で項目名の対応付けを行う際に、関係はあるが区別すべき語彙を抽出し、意味のある弁別関係を構築することでデータ項目名の対応付けの候補を高精度で絞りこむことを目的とする。
本発明は、データ構造を記述した第1のデータスキーマと第2のデータスキーマを参照して、前記第1のデータスキーマを構成するデータ項目名と第2のデータスキーマを構成するデータ項目名の対応付けを行うプログラムであって、前記第1のデータスキーマを構成するデータ項目名を抽出し、前記第2のデータスキーマを構成するデータ項目名を抽出し、前記抽出した第1のデータスキーマと第2のデータスキーマのそれぞれのデータ項目名に含まれる要素概念を抽出し、前記抽出した要素概念からデータ項目名間の弁別関係を設定し、前記第1のデータスキーマのデータ項目名と第2のデータスキーマからデータ項目名をそれぞれ読み込んで、前記弁別関係に基づいて前記読み込んだ2つのデータ項目名について対応関係を設定し、前記データ項目名の対応関係を蓄積する。
また、前記要素概念の抽出は、前記第1のデータスキーマまたは第2のデータスキーマについて、それぞれ2つのデータ項目名を読み込み、前記2つのデータ項目名の文字列を比較して同義の文字列を含むときに、前記2つのデータ項目名を構成する文字列のうち共通する1組の文字列を第1の要素概念として抽出し、前記2つのデータ項目名の文字列を比較して同義の文字列を含むときに、前記2つのデータ項目名を構成する文字列のうち共通する文字列を除いた1組の文字列を第2の要素概念として抽出する。
したがって、本発明は、データ項目名を構成する語彙の概念間の弁別関係および時間的順序関係を利用することにより、データ項目名の対応付け候補を絞ることができる。例えば、「『番号』と『日付』は弁別性のある概念(区別すべき概念)である」という知識に基づいて、「『注文日付』に対応するデータ項目名候補のうち、『注文番号』は『注文日付』とは弁別性のある概念なので候補から除外する」と判断することができる。換言すれば、複合語にしたときに意味の異なる項目として扱うことができる概念を弁別関係とし、この弁別関係を付加することで、項目名の絞り込みを高精度で行うことが可能となる。
また、項目名の時間的順序関係を利用することにより、データ項目名の対応関係の候補選択をより高精度で行うことができる。
以下、本発明の一実施形態を添付図面に基づいて説明する。
第1の実施形態では、ターゲットとなるデータベースの項目名をソースとなるデータベースの項目名に対応付けるため、2つのデータベースのデータスキーマ定義およびインスタンス文書から概念間の弁別関係(区別すべき概念で同義または類義にはなり得ない関係)および時間的順序関係を抽出してオントロジに格納する機能と、オントロジを用いてデータ項目名の対応関係の絞込みを行う機能とを備えたデータスキーママッピング定義支援システムの一例を示す。
図1は、第1の実施形態を示し、企業内や企業間でのデータ連携のために、異なるデータスキーマ間でのデータ項目の対応関係を示す「データスキーママッピング定義ファイル」の作成を支援する計算機システムのブロック図を示す。
計算機システムは、演算処理を行うCPU101と、キーボードやマウス等で構成される入力装置102と、演算結果等を表示する表示装置103と、各データやプログラムを格納するストレージ装置110と、一時的にデータ(テーブル等)を格納するメモリ108とから構成される。
ストレージ装置110には、入力されたデータを格納する入力データ格納部104と、後述するオントロジ構築用データ格納部105と、仕様記述に使用される語彙の関係を定義したオントロジを格納するオントロジ格納部106と、生成したデータスキーママッピング定義を格納するデータスキーママッピング定義ファイル格納部107とが含まれる。
入力データ格納部104は、ソースデータスキーマ定義文書格納部1041、ソースインスタンス文書格納部1042、ターゲットデータスキーマ定義文書格納部1043、ターゲットインスタンス文書格納部1044によって構成されている。
ソースデータスキーマ定義文書格納部1041には、ソースとなるデータベースのスキーマを定義した文書が格納される。ソースインスタンス文書格納部1042には、基準となるデータベースの実際のデータが格納される。
ターゲットデータスキーマ定義文書格納部1043には、ソースとなるデータベースに項目名を対応付けるターゲットのデータベースのスキーマを定義した文書が格納される。ターゲットインスタンス文書格納部1044には、ターゲットとなるデータベースの実際のデータが格納される。なお、
図2(a)〜(d)は、入力データ格納部104のソースデータスキーマ定義文書格納部1041、ソースインスタンス文書格納部1042、ターゲットデータスキーマ定義文書格納部1043、およびターゲットインスタンス文書格納部1044に格納された文書の記述例を示す。なお、これらの文書は、上述のebXML(electronic business XML) 仕様のXML/EDIや、財務情報の場合にはXBRL(eXtensible Business Reporting Language)等で記述されるものである。
図2(a)は、ソースデータスキーマ定義文書10411の一例を示し、データ項目名(element name)として「注文日付」が、日付のデータタイプで定義され、データ項目名として「取引番号」が整数のデータタイプで定義された例を示す。
図2(b)は、ソースデータインスタンス文書10421の一例を示し、「注文日付」のデータとして「20050923」が格納され、「取引番号」のデータとして「00020033」が格納された例を示す。
図2(c)は、ターゲットデータスキーマ定義文書10431の一例を示し、データ項目名(element name)として「注文年月日」が、日付のデータタイプで定義され、データ項目名として「注文番号」が整数のデータタイプで定義された例を示す。
図2(d)は、ターゲットデータインスタンス文書10441の一例を示し、「注文年月日」のデータとして「20040512」が格納され、「注文番号」のデータとして「000101123」が格納された例を示す。
次に、オントロジ構築用データ格納部105は、ソースデータスキーマデータ項目情報格納部1051、ターゲットデータスキーマデータ項目情報格納部1052、および概念情報格納部1053によって構成されている。オントロジ格納部106には、オントロジ1061が格納されている。
図3(a)、(b)に、ソースデータスキーマデータ項目関係格納部1051およびターゲットデータスキーマデータ項目関係格納部1052のデータ構造を示す。
図3(a)のソースデータスキーマデータ項目情報格納部1051は、図2(a)、(b)に示したソースデータスキーマ定義文書10411とソースデータインスタンス文書10421から後述するように抽出したデータを格納する。ソースデータスキーマデータ項目情報格納部1051は、一つのエントリに、ソースデータスキーマ定義文書の項目名を格納するデータ項目名10511と、ソースデータスキーマ定義文書に付与されたスキーマ名10512と、データ項目名10511の親(上位概念)となるデータ項目名を格納する親項目名10513と、データ項目名10511に定義されたデータタイプを格納するデータ属性10514と、データ項目名10511に対応するインスタンスを頻度順に格納するインスタンスリスト10515から構成される。
図3(b)のターゲットデータスキーマデータ項目情報格納部1052は、図2(c)、(d)に示したターゲットデータスキーマ定義文書10431とターゲットデータインスタンス文書10441から後述するように抽出したデータを格納する。ターゲットデータスキーマデータ項目情報格納部1052は、一つのエントリに、ターゲットデータスキーマ定義文書の項目名を格納するデータ項目名10521と、ターゲットデータスキーマ定義文書に付与されたスキーマ名10522と、データ項目名10521の親(上位概念)となるデータ項目名を格納する親項目名10523と、データ項目名10521に定義されたデータタイプを格納するデータ属性10524と、データ項目名10521に対応するインスタンスを格納するインスタンスリスト10525から構成される。
また、概念情報格納部1053は、ソースデータスキーマ定義文書格納部1041およびターゲットデータスキーマ定義文書格納部1043のデータ項目名を構成する概念が後述するように格納される。また、オントロジ1061には、項目名間の概念関係が後述するように格納される。
データスキーママッピング定義ファイル格納部107には、ソースデータスキーマ定義文書とターゲットデータスキーマ定義文書におけるデータ項目の対応付けの結果がデータスキーママッピング定義ファイル1071が格納されている。
メモリ108には、語彙の概念間の弁別関係および時間的順序関係を記述したオントロジ1061を利用してデータ項目名の対応付けを行うプログラムとして、データ項目情報取り込み手段1081、概念抽出手段1082、弁別関係抽出手段1083、同義関係抽出手段1084、順序関係抽出手段1085、オントロジ構築支援手段1086、データ項目マッピング定義支援手段1087がロードされ、CPU101により実行される。
(データ項目情報の取り込み)
以下、メモリ108にロードされたオントロジ構築支援とデータマッピング(データ項目名の対応関係の絞り込み)を行う各プログラムの動作について、以下に説明する。
まず、データ項目情報取り込み手段1081は、入力データ格納部104のソースデータスキーマ定義文書格納部1041からデータスキーマ定義文書を読み込んで、ソースデータスキーマデータ項目関係格納部1051にデータ項目情報を取り込み、ターゲットデータスキーマ定義文書格納部1043からデータスキーマ定義文書を読み込んで、ターゲットデータスキーマデータ項目関係格納部1052にデータ項目情報を取り込む。
このデータ項目情報取り込み手段1081の処理手順を図6のフローチャートに沿って説明する。
データ項目情報取り込み手段1081は、ソースデータスキーマ定義文書格納部1041からデータ項目情報を取り込み、ソースデータスキーマデータ項目情報格納部1051のデータ項目名10511、データスキーマ名10512、親項目名10513、データ属性10514に格納する(S601)。
さらにデータ項目情報取り込み手段1081は、ソースインスタンス文書格納部1042から各データ項目のインスタンスを抽出してインスタンスの頻度を集計し、ソースデータスキーマデータ項目情報格納部1051のインスタンスリスト10515に頻度順に格納する(S602)。
同様に、ターゲットデータスキーマ定義文書格納部1043からデータ項目情報を取り込み、ターゲットデータスキーマデータ項目情報格納部1052のデータ項目名10521、データスキーマ名10522、親項目名10523、データ属性10524に格納する(S603)。さらにデータ項目情報取り込み手段1081はターゲットインスタンス文書格納部1044から各データ項目のインスタンスを抽出してインスタンスの頻度を集計し、ターゲットデータスキーマデータ項目情報格納部1052のインスタンスリスト10525に頻度順にインスタンスを格納する(S604)。
上記処理により、基準となるソースデータスキーマ定義文書格納部1041に格納されたデータベースのデータスキーマ定義文書(以下、単にソースデータスキーマとする)と、このソースデータスキーマと相互変換を行いたいターゲットデータスキーマ定義文書格納部1043に格納されたデータベースのデータスキーマ定義文書(以下、単にターゲットデータスキーマとする)の項目名と頻度順のインスタンスがソースデータスキーマデータ項目情報格納部1051とターゲットデータスキーマデータ項目情報格納部1052にそれぞれ格納される。
(要素概念および概念関係の抽出)
相互変換を行う2つのデータスキーマ(ソースデータスキーマとターゲットデータスキーマ)の項目名の概念情報抽出の処理は、概念抽出手段1082により実行される。概念抽出手段1082は、上記図6の処理により、項目名と頻度順のインスタンスがソースデータスキーマデータ項目情報格納部1051とターゲットデータスキーマデータ項目情報格納部1052に格納された後に実行される。
概念抽出手段1082は、ソースデータスキーマおよびターゲットデータスキーマのデータ項目名を構成する概念を抽出し、概念情報格納部1053に格納する。概念情報格納部1053のデータ構造を図4に示す。
概念情報格納部1053は、一つのエントリにデータ項目名に含まれる概念を示す概念名10531と、概念名が存在するデータ項目名内の位置10532と、概念名10531に対応付けられたデータ項目名のうち名称が異なるデータ項目名の数10533と、概念名10531に対応付けられたデータ項目名の一覧を格納するデータ項目名リスト10534から構成される。
概念抽出手段1082の処理手順を図7のフローチャートに従って説明する。
概念抽出手段1082は、ソースデータスキーマデータ項目情報格納部1051からデータ項目名10511を2つ取り出してデータ項目名10511の文字列を比較する(S701〜S704)。
S704の比較の結果、2つのデータ項目名10511が異なるときには、2つのデータ項目名A、データ項目名Bとしたとき、項目名A、項目名Bを構成する要素概念を以下のように切り出す(S705)。
(1)概念1=項目名A、項目名Bの先頭からの共通文字列
(2)概念2=項目名A、項目名Bの末尾からの共通文字列
(3)概念3=項目名Aから上記共通文字列を除いたもの
(4)概念4=項目名Bから上記共通文字列を除いたもの
次に、データ項目名Aおよびデータ項目名Bにおける概念1〜4の使われ方に関する情報を概念情報格納部1053に登録する(S706)。例えば、データ項目名Aが「要求番号」、データ項目名Bが「要求年月日」のとき、概念1〜概念4は以下のようになる。
(1)概念1=「要求」
(2)概念2=nil(無し)
(3)概念3=「番号」
(4)概念4=「年月日」
そこで、概念1、概念3、概念4の概念名とデータ項目名における使われ方に関する情報を概念情報格納部1053の概念名10531、データ項目名における位置10532、データ項目名異なり数10533、データ項目名リスト10534に格納する。
最後に、概念3と概念4(すなわち、データ項目名Aとデータ項目名Bの差異)の概念関係を抽出しオントロジ1061に登録する(S707)。以上の処理をデータ項目名10511のすべての組み合わせについて行う(S708〜S711)。
また、概念抽出手段1082は、上記図7の処理をターゲットデータスキーマデータ項目情報格納部1052についても実行する。
以上の処理により、ソースデータスキーマおよびターゲットデータスキーマのデータ項目名を構成する要素概念が抽出されて概念情報格納部1053に格納される。加えて、ソースデータスキーマおよびターゲットデータスキーマのそれぞれのデータ項目名Aとデータ項目名Bの差異がオントロジ1061に格納されることになる。
また、上記要素概念は、項目名A、項目名Bが共通文字列を含む第1の要素概念と、項目名A、項目名Bから共通文字列を除いた差分で構成される第2の要素概念とから構成されることになる。
(概念関係抽出手順の詳細)
上記図7の概念関係抽出のステップ(S707)では、弁別関係抽出手段1083および順序関係抽出手段1085により、上述の概念3と概念4(すなわち、データ項目名Aとデータ項目名Bの差異)の関係を抽出し、オントロジ1061に格納する。オントロジ1061のデータ構造を図5に示す。
図5において、オントロジ1061は、一つのエントリに概念3(項目名Aから共通文字列を除いた文字列)を格納する概念名10541と、概念4(項目名Bから共通文字列を除いた文字列)を格納する概念名10542と、2つの概念名10541、10542の概念の関係を格納する概念関係10543と、データ項目名Aまたはデータ項目名Bにおける概念名10541、10542の位置10544と、抽出されたデータ項目名A及びBの一覧を格納する例10545と、オペレータや管理者などが当該エントリを確認したことを示す確認フラグ10546とを含む。
次に、概念関係抽出手段1085と弁別関係抽出手段1083の処理手順を図8のフローチャートに従って以下に説明する。
(1)順序関係の抽出
上記概念2(すなわち、データ項目名Aとデータ項目名Bの末尾からの共通文字列)が「年月日」のとき(S801)、概念3と概念4(すなわち、データ項目名Aとデータ項目名Bの差異)の時間的な順序関係を抽出する。まず、インスタンス文書格納部1042または1044からデータ項目名Aとデータ項目名Bの時系列的な順序関係を抽出する(S802)。
データ項目名Aが常に順序が先であれば(S803)、概念3は概念4よりも順序が先であると判定する(S804)。例えば、「見積年月日」が「出荷年月日」よりも常に先であれば、「見積」は「出荷」よりも順序が「先」であると判定する。逆にデータ項目名Bが常に順序が先であれば(S805)、概念4は概念3よりも順序が「先」であると判定する(S806)。
順序関係抽出手段1085は、時間軸上の位置を示すようなデータ項目名を対象に行う。したがって、データ項目末尾の文字列の条件としては、「年月日」の他に、「日付」「年月」「月・年・時刻」などが考えられる。
例えば、「納品番号」のマッピング先候補として「見積番号」「出荷番号」「着荷番号」があるとき、時間的な順序関係に関して以下の情報が得られたとする。
(1)「見積 - 出荷 - 着荷」という順序関係
(2)「出荷 - 納品」という順序関係
この例では、「納品」は「出荷」より後であるという情報を利用することにより、「見積」「出荷」を「納品」の同義語候補からはずすことができる。これにより、「納品番号」のマッピング先の候補から「見積番号」と「出荷番号」をはずし、「着荷番号」に絞ることができる。
また、データ項目名のデータ属性10514、10524が「時間」や「年月日」であることを条件にして上記と同様の処理を実施してもよい。
(2)弁別関係の抽出
概念3と概念4(すなわち、項目名Aと項目名Bの差異)に順序関係がないとき、弁別関係抽出手段1083が、概念3と概念4は弁別関係にあると判定する(S807)。例えば、データ項目名Aが「要求番号」、データ項目名Bが「要求年月日」の時、概念3は「番号」、概念4は「年月日」となり、これらの概念は「弁別関係」にあると判定する。なお、上記S801で概念2が「年月日」でないときにもこのS807に進んで弁別関係を設定する。
ここで、「弁別関係」関係は、同義語にはなり得ない語彙の関係であって、特に、データベースの項目名としたときに違う項目としてあげられ得る関係や、複合語にしたときに意味の異なる項目として扱うことができる概念関係を示す。
以上の手順で抽出した概念間の順序関係および弁別関係の情報を、オントロジ1061の概念名10541、概念名10542、概念関係10543、データ項目名における位置10544、例10545に格納する(S808)。
(データ項目マッピング定義支援)
データ項目マッピング定義支援手段1087は、オントロジ1061に格納された概念間の弁別関係および順序関係を利用することにより、ソースデータスキーマとターゲットデータスキーマにおけるデータ項目名の対応付けを支援する。対応付けの結果は図12に示すデータスキーママッピング定義ファイル1071に格納される。
図12において、データスキーママッピング定義ファイル1071は、ソースデータスキーマデータ項目情報格納部1051におけるデータ項目名の位置を示すポインタを格納するソースポインタ107111と、ターゲットデータスキーマデータ項目情報格納部1052におけるデータ項目名の位置を示すポインタを格納するターゲットポインタ107112が一対となって構成される。
上記データスキーママッピング定義ファイル1071を構築するデータ項目マッピング定義支援手段1087の処理について、図9のフローチャートを用いて以下に説明する。
ソースデータスキーマとターゲットデータスキーマの2つのデータスキーマ間でのデータ項目名の対応付けの方法としては、「注文日付」と「注文年月日」のように共通文字列を含むデータ項目を候補として抽出することが考えられる。
そこで、データ項目マッピング定義支援手段1087は、ソースデータスキーマデータ項目情報格納部1051およびターゲットデータスキーマデータ項目情報格納部1052からデータ項目を1つずつ取り出してデータ項目名10511,10521の文字列を比較する(S901〜S904)。ソースデータスキーマのデータ項目名10511をデータ項目名A、ターゲットデータスキーマのデータ項目名10521をデータ項目名Bとした時、データ項目名A、データ項目名Bを構成する要素概念を以下のように切り出す(S905)。
(1)概念1=項目名A、項目名Bの先頭からの共通文字列
(2)概念2=項目名A、項目名Bの末尾からの共通文字列
(3)概念3=項目名Aから上記の共通文字列を除いたもの
(4)概念4=項目名Bから上記の共通文字列を除いたもの
本システムの特徴は、データ項目名A、Bを構成する概念の弁別関係および時間的な順序関係に関する情報を利用して対応付け候補を絞る点にある。すなわち、データ項目名Aとデータ項目名Bに共通文字列がある場合、オントロジ1061を参照し、概念3と概念4(すなわち、項目名Aと項目名Bの差異)が“弁別関係”にないことを条件に(S906)、 概念3と概念4を同義語候補とする(S907)。そして、概念間の同義関係をオントロジ1061の概念名10611、概念名10612、概念関係10613、データ項目名における位置10614、例10615に格納する(S908)。このS908の処理が、図1に示した同義関係抽出手段1084に相当する。
次に、データ項目マッピング定義支援手段1087は、データスキーママッピング定義ファイル1071のデータ項目名Aのマッピング先候補にデータ項目名Bを追加する(S909)。以上の処理をデータ項目名のすべての組み合わせについて行う(S910〜S913)。
同様に、データ項目マッピング定義支援手段1087は、概念3と概念4(すなわち、項目名Aと項目名Bの差異)の時間的な順序関係の情報を利用してマッピング先候補の絞り混みを行う。例えば、「納品番号」のマッピング先候補として「見積番号」「出荷番号」「着荷番号」があるとき、図5に示すように、オントロジ1061から以下の順序関係に関する情報が得られたとする。
(1)「出荷」は「納品」より先という順序関係
(2)「見積」は「出荷」より先という順序関係
この場合、「見積」「出荷」を「納品」の同義語候補からはずすことができる。これにより、「納品番号」のマッピング先の候補から「見積番号」と「出荷番号」をはずすことができる。
このように、本システムのデータ項目マッピング定義支援手段1087は、以上の手順で2つのデータベース(データスキーマ)の項目名に関するマッピング先候補を絞った上で、マッピング先候補を表示装置103の画面に表示する。データ項目マッピング定義支援画面の表示例を図10に示す。
図10において、データ項目マッピング定義支援画面1001は、対応付けを行うターゲットデータスキーマのデータ項目名を表示するターゲットスキーマ表示部10011と、基準となるソースデータスキーマのデータ項目名を表示するソーススキーマ表示部10012と、2つのデータスキーマで同義となるデータ項目名の構成要素の候補を表示する同義概念候補表示部10013と、2つのデータスキーマで弁別関係となるデータ項目名の構成要素の候補を表示する弁別概念候補表示部10014と、オペレータの操作を受け付ける登録ボタン10015からなる。同義概念候補表示部10013および弁別概念候補表示部10014には、当該データ項目名に含まれる概念の同義概念候補および弁別概念候補が表示される。
ソーススキーマ表示部10012に表示されたデータ項目名に対して、ターゲットスキーマ表示部10011には関連付け(マッピング)を行う候補がマッピング先候補として表示される。そして、このマッピング先候補の中からユーザが適切な候補を選択して登録ボタン10015を入力装置102により選択(クリック)すると、選択されたマッピング先候補がデータスキーママッピング定義ファイル1071に格納される。
例えば、図10において、画面右側の表示領域に設定されたソーススキーマ表示部10012に「注文日付」というソースデータスキーマのデータ項目名が表示されると、左側の表示領域に設定されたターゲットスキーマ表示部10011には、「注文日付」に関連付けられる候補として「注文年月日」が表示される。オペレータは、データ項目マッピング定義支援手段1087が絞り込んだ結果について、承認するため登録ボタン10015を操作すればよい。また、画面1001の下部左側の同義概念候補表示部10013には、ターゲットスキーマ表示部10011に表示されたデータ項目名「注文年月日」に対する同義語が表示される。また、画面1001の下部右側の弁別概念候補表示部10014には、ソースデータスキーマとターゲットデータスキーマのマッピング先候補の語彙から区別すべき弁別関係となる語句が表示される。
同様に、同義概念候補、弁別概念候補の中からユーザが適切な候補を選択して登録ボタン10015をクリックすると、選択内容に従ってオントロジ1061の同義概念および弁別概念の情報を更新し、図5に示した確認フラグ10546に確認済みであることを示す値「1」が設定される。
なお、上記ではオペレータの操作により2つのデータスキーマのデータ項目名の対応付け(マッピング)を承認する例を示したが、データ項目マッピング定義支援手段1087が絞り込んだマッピング先候補を、データスキーママッピング定義ファイル1071へ自動的に登録するようにしても良い。
(オントロジ構築支援手段)
最後に、オントロジ構築支援手段1086について述べる。本実施形態では、前述のデータ項目マッピング定義支援手段1087の処理過程で部分的にオントロジ1061を構築していくが、オントロジ構築支援手段1086は、概念ごとに弁別概念および同義概念を確認する手段を提供する。オントロジ構築支援画面の一例を図11に示す。オントロジ構築支援画面901は、選択された概念に対応する語句を表示する概念表示部9011と、概念表示部9011に表示された語句に対して弁別関係となる概念と同義関係となる概念とを表示する概念関係表示部9012と、概念関係表示部9012に表示された概念に対して弁別関係となる語句と、同義関係となる語句とを表示する概念関係候補表示部9013と、オペレータの操作を受け付ける登録ボタン9014からなる。概念関係表示部9012には同義概念、弁別概念、および時間的順序関係が表示される。概念関係候補表示部9013には、概念関係格納部1054に格納されている同義概念候補、弁別概念候補、および順序関係候補が表示される。ユーザが概念関係候補の中から適切なものを選択して登録ボタン1094をクリックすると、選択された同義概念候補、弁別概念候補、および順序関係候補がオントロジ1061に格納され、確認フラグ10616に確認済みであることを示す値「1」が設定される。
なお、オントロジ1061の構築も、優先度の高い弁別概念候補と同義概念候補を自動的に選択して登録するようにしても良い。
(データスキーママッピング定義ファイル)
上記データスキーママッピング定義支援システムにより作成されたデータスキーママッピング定義ファイル1071は、ターゲットデータスキーマで定義されるデータベースと、ソースデータスキーマで定義されるデータベースの統合を行うことができる。
例えば、ターゲットデータスキーマで定義されるデータベースで「注文年月日」で検索を行う場合、データベースシステム(図示省略)がデータスキーママッピング定義ファイル1071を参照して、ターゲットデータスキーマのデータ項目名が「注文年月日」に対応するソースデータスキーマのデータ項目名を参照する。図12に示したデータスキーママッピング定義ファイル1071からソースデータスキーマのデータ項目名のポインタを取得し、ソースデータスキーマデータ項目情報格納部1051から「注文日付」を得る。これによりデータベースシステムは、ソースデータスキーマで定義されるデータベースに対して、「注文日付」で同様の検索を行うことで、2つのデータベースを仮想的に統合して運用することが可能となる。
また、ソースデータスキーマで定義されるデータベースを、ターゲットデータスキーマで定義されるデータベースに統合する場合では、データスキーママッピング定義ファイル1071で対応付けられたデータ項目名間でデータの転送を行えばよい。例えば、図10で示したように、ソースデータスキーマで定義されるデータベースのデータ項目名「注文日付」のデータ(インスタンス)を、ターゲットデータスキーマデータ項目名定義されるデータベースのデータ項目名「注文年月日」のデータ(インスタンス)として書き込めばよい。
(まとめ)
以上のように、本発明では、複数のデータスキーマ間で、データ項目名の対応付け候補を絞るために、概念間の弁別関係をオントロジに記述する。また、オントロジ構築を自動化するため、データスキーマにおけるデータ項目名間の関係から概念の弁別関係を抽出する。すなわち、「同じ親を持つデータ項目には、違う項目として区別できるような弁別性のある名前がつけられる」という性質を利用して、同じ親を持つデータ項目の語句から概念間の弁別関係を抽出する。例えば、「要求番号」と「要求日付」というデータ項目名が兄弟関係にある場合には、「『要求番号』と『要求日付』は弁別性のある概念(区別すべき概念)である」という知識を抽出する。さらに、「『要求番号』と『要求日付』の違いを表す『番号』と『日付』は弁別性のある概念(区別すべき概念)である」という知識を抽出する。
そして、本発明では、データ項目名の対応付け候補を絞るために、概念間の時間的順序関係をオントロジに記述する。また、オントロジ構築を自動化するため、インスタンス文書から時間的順序関係を抽出する。例えば、インスタンス文書において、「出荷日付」が「着荷日付」よりも常に早いことから、「『出荷』は『着荷』よりも早い」という時間的順序関係を抽出する。
以上のように、本発明によれば、概念間の弁別関係および時間的順序関係を記述したオントロジを利用して複数のデータスキーマ間のデータ項目名を対応付けることにより、データ項目名の対応付け候補を正確かつ容易に絞ることができる。特に、前記従来例のように、手作業に頼っていたデータ項目名の対応付けを、自動化することが可能となるのである。これにより、異なるデータベース間の統合(仮想統合や物理的な統合)や、データベースの新規導入や更新、または業界標準に対応したデータベースのバージョンアップなどの変化に迅速に対応することが可能となる。
<第2実施形態>
(弁別関係を利用した情報検索システム)
前記第1実施例形態では、データスキーマから「弁別関係」という概念関係を抽出し、データスキーマ間のデータ項目名の対応付けに利用する方法について述べた。「弁別関係」は2つのデータスキーマのデータ項目名の対応関係を絞り込む際に有効であるため、複数の情報サーバから適切な情報を検索するための検索条件の変換にも適用しうる。情報検索において、検索漏れを少なくする手段として、質問拡張という手法が知られている。
質問拡張とは、検索質問中の単語と関連のある単語を検索質問に自動的に追加することである。例えば、検索質問が「自動車」であるとき、「車」「乗用車」「自家用車」などを追加する。質問拡張で追加する単語は、異表記(コンピュータ→コンピューター)・同義語(コンピュータ→計算機)・上位語(パソコン→コンピュータ)・下位語(コンピュータ→パソコン)などである。
追加すべき単語を見つける方法としては、辞書やシソーラスをあらかじめ作っておく方法が一般的である。例えば、特許文献2では、オントロジを用いて近似的な検索条件に変換する方法が開示されている。「類似度」という尺度で検索条件を拡張すると検索漏れは少なくなるが、ノイズが生じやすい。そこで、本第2実施形態では、「弁別関係」の知識を使って候補を条件に絞ることにより、より適切な検索条件に変換することが可能となる。例えば、「自家用車」という検索質問に対して、「乗用車」「車」などの上位語を付加するだけでなく、「自家用」と「商用」が弁別関係にあるという知識を用いて「商用車」を除外することにより、ノイズを減らすことができる。
以下、図13のフローチャートに従って、オントロジに記述された階層関係および弁別関係の情報を用いた情報検索システムの検索の手順を示す。なお、図13のフローチャートは、図1と同様の計算機で実行されるものである。この検索システムは、複数の会社の製品体系を参照して、ユーザが探したい製品の情報を検索するシステムである。本システムは単語間の概念関係を記録する辞書と、本発明による単語間の弁別関係を記録する辞書とを保持することを前提とする。まず、ユーザが探したい製品カテゴリ名として「福祉車両」と入力すると(S1301)、システムは参考情報として、「福祉車両」に関する製品部品体系の例、たとえば図14(a)に示すようなA社の製品分類体系を画面に表示する(S1302)。表示の形式は図14に限らず、入力単語に関連している単語が明示されれば良い。ユーザが製品分類名として「昇降シート車」を選択すると、システムは「昇降シート車」を検索キーワードとして認識する(S1303)。さらに、「昇降シート車」の上位概念、すなわち「介護式福祉車両」と「福祉車両」を検索キーワードに追加する(S1304)。
次に、図14(b)に示すような弁別関係に関する情報を参照し、検索キーワードの構成語の弁別概念を除外キーワードとして設定する(S1305)。例えば、「昇降シート車」の弁別概念「車いす移動車」、「ストレッチャー移動車」、「昇降」の弁別概念「回転」、および「介護式」の弁別概念「自操式」、「公共交通」を除外キーワードとして設定する。このように検索キーワードの拡張と除外キーワードの設定を行った上で、複数の会社の製品体系を対象に、「昇降シート車」に対応しうる製品の情報を検索する(S1306)。例えば、「『昇降シート車』あるいは『介護式福祉車両』あるいは『福祉車両』に分類されるものであって、かつ、『車いす移動車』『ストレッチャー移動車』『回転』『自操式』『公共交通』のいずれも含まない」というものを検索する。この方法により、図15(a)、(b)に示すように、B社には「昇降シート車」という製品分類名がない場合でも、「福祉車両」のうち「自操式仕様車」と「回転シート仕様車」を「車いす移動車」除外し、「リフトアップシート仕様車」だけを検索結果として表示する(S1307)。本発明における弁別関係を用いなければ、検索キーワードを上位概念である「福祉車両」に拡張することはできるが、「自操式仕様車」と「回転シート仕様車」「車いす移動車」を候補から除外することができない。
このように、本発明によれば弁別関係の知識を使って検索条件を絞ることにより、より適切な検索条件に変換でき、検索漏れを防ぎながらノイズの少ない検索結果を得ることができる。
本発明は、異なるデータベースの統合に適用することができ、特に、データベースの新規企業内/企業間での情報連携やサービス連携を実現するためのデータベースの仮想統合に適用することができる。また、本発明は、語句の概念を判定する情報検索システムなどに適用することもできる。
本発明の一実施形態によるデータスキーママッピング定義支援システムのシステム構成図である。 スキーマ文書の一例を示す説明図で、(a)はソースデータスキーマ定義文書を示し、(b)はソースインスタンス文書を示し、(c)はターゲットデータスキーマ定義文書を示し、(d)はターゲットインスタンス文書の記述例を示す説明図である。 ソースデータスキーマデータ項目情報格納部およびターゲットデータスキーマデータ項目情報格納部のデータ構造を示す説明図で、(a)はソースデータスキーマデータ項目情報格納部を示し、(b)ターゲットデータスキーマデータ項目情報格納部を示す。 概念情報格納部のデータ構造を示す説明図である。 オントロジのデータ構造を示す説明図である。 データ項目情報取り込み処理の一例を示すフローチャートである。 概念抽出処理の一例を示すフローチャートである。 概念関係抽出処理の一例を示すフローチャートである。 データ項目マッピング定義支援処理の一例を示すフローチャートである。 データ項目マッピング定義支援画面を示す画面イメージである。 オントロジ構築支援画面を示す画面イメージである。 データスキーママッピング定義格納部のデータ構造を示す説明図である。 情報検索システムの一例を示す処理のフローチャートである。 単語間の階層関係と弁別関係の一例を示す説明図で、(a)はA社における単語の階層関係を示し、(b)はA社における単語間の弁別関係を示す。 単語間の階層関係と弁別関係の他の例を示す説明図で、(a)はB社における単語の階層関係を示し、(b)はB社における単語間の弁別関係を示す。
符号の説明
101 CPU
102 入力装置
103 表示装置
104 入力データ格納部
105 オントロジ構築用データ格納部
106 オントロジ格納部
107 データスキーママッピング定義格納部
108 メモリ108
1041 ソースデータスキーマ定義文書格納部
1042 ソースインスタンス文書格納部
1043 ターゲットデータスキーマ定義文書格納部
1044 ターゲットインスタンス文書格納部
1051 ソースデータスキーマデータ項目情報格納部
1052 ターゲットデータスキーマデータ項目情報格納部
1053 概念情報格納部
1061 オントロジ
1071 データスキーママッピング定義ファイル
1081 データ項目情報取り込み手段
1082 概念抽出手段
1083 弁別関係抽出手段
1084 順序関係抽出手段
1085 同義関係抽出手段
1086 オントロジ構築支援手段
1087 データ項目マッピング定義支援手段

Claims (11)

  1. データ構造を記述した第1のデータスキーマと第2のデータスキーマを参照して、前記第1のデータスキーマを構成するデータ項目名と第2のデータスキーマを構成するデータ項目名の対応付けを行うプログラムであって、
    前記第1のデータスキーマを構成するデータ項目名を抽出する手順と、
    前記第2のデータスキーマを構成するデータ項目名を抽出する手順と、
    前記抽出した第1のデータスキーマと第2のデータスキーマのそれぞれのデータ項目名に含まれる要素概念を抽出する手順と、
    前記抽出した要素概念からデータ項目名間の弁別関係を設定する手順と、
    前記第1のデータスキーマのデータ項目名と第2のデータスキーマからデータ項目名をそれぞれ読み込んで、前記弁別関係に基づいて前記読み込んだ2つのデータ項目名について対応関係を設定する手順と、
    前記データ項目名の対応関係を蓄積する手順と、
    を計算機に実行させることを特徴とするプログラム。
  2. 前記要素概念を抽出する手順は、
    前記第1のデータスキーマまたは第2のデータスキーマについて、それぞれ2つのデータ項目名を読み込む手順と、
    前記2つのデータ項目名の文字列を比較して同義の文字列を含むときに、前記2つのデータ項目名を構成する文字列のうち共通する1組の文字列を第1の要素概念として抽出する手順と、
    前記2つのデータ項目名の文字列を比較して同義の文字列を含むときに、前記2つのデータ項目名を構成する文字列のうち共通する文字列を除いた1組の文字列を第2の要素概念として抽出する手順と、
    を含むことを特徴とする請求項1に記載のプログラム。
  3. 前記弁別関係を設定する手順は、
    前記第2の要素概念に対応する2つの項目名について、時系列的な順序関係を判定する手順と、
    前記第2の要素概念に時系列的な順序関係が含まれない場合には、当該第2の要素概念を構成する1組の文字列が弁別関係であることを設定する手順と、
    を含むことを特徴とする請求項2に記載のプログラム。
  4. 前記対応付けを行う手順は、
    前記読み込んだ2つのデータ項目名の文字列を比較して、同義の文字列を含みかつ弁別関係にない場合に、これら2つのデータ項目名が対応関係にあることを設定することを特徴とする請求項1に記載のプログラム。
  5. データ構造を記述した第1のデータスキーマと第2のデータスキーマを参照して、前記第1のデータスキーマを構成するデータ項目名と第2のデータスキーマを構成するデータ項目名の弁別関係を生成するプログラムであって、
    前記第1のデータスキーマを構成するデータ項目名を抽出する手順と、
    前記第2のデータスキーマを構成するデータ項目名を抽出する手順と、
    前記第1のデータスキーマまたは第2のデータスキーマについて、それぞれ2つのデータ項目名を読み込む手順と、
    前記2つのデータ項目名の文字列を比較して同義の文字列を含むときに、前記2つのデータ項目名を構成する文字列のうち共通する文字列を除いた1組の文字列を第2の要素概念として抽出する手順と、
    前記第2の要素概念に対応する2つの項目名について、時系列的な順序関係を判定する手順と、
    前記第2の要素概念に時系列的な順序関係が含まれない場合には、当該第2の要素概念を構成する1組の文字列が弁別関係であることを設定する手順と、
    を含むことを特徴とするプログラム。
  6. 前記弁別関係であることを設定する手順は、
    前記1組の文字列と、これら1組の文字列の概念関係が弁別関係であることを示す値をオントロジに格納する手順を含むことを特徴とする請求項5に記載のプログラム。
  7. 前記2つのデータ項目名の文字列を比較して同義の文字列を含むときに、前記2つのデータ項目名を構成する文字列のうち共通する1組の文字列を第1の要素概念として抽出する手順と、
    前記1組の文字列と、これら1組の文字列の概念関係が同義関係であることを示す値をオントロジに格納する手順と、
    をさらに含むことを特徴とする請求項6に記載のプログラム。
  8. 入力された第1のデータスキーマを格納する第1データスキーマ格納部と、
    入力された第2のデータスキーマを格納する第2データスキーマ格納部と、
    前記第1データスキーマ格納部から第1のデータスキーマを構成するデータ項目名を抽出して第1データ項目格納部へ格納し、前記第2データスキーマ格納部から第2のデータスキーマを構成するデータ項目名を抽出して第2データ項目格納部へ格納するデータ項目名取り込み部と、
    前記第1データ項目格納部と第2データ項目格納部のそれぞれのデータ項目名に含まれる要素概念を抽出する概念抽出部と、
    前記抽出した要素概念からデータ項目名間の弁別関係を抽出してオントロジに格納する弁別関係抽出部と、
    前記抽出した要素概念からデータ項目名間の同義関係を抽出してオントロジに格納する同義関係抽出部と、
    前記第1データ項目格納部と、前記第2データ項目格納部からデータ項目名をそれぞれ読み込んで、前記オントロジに基づいて前記読み込んだ2つのデータ項目名について対応関係を判定し、この対応関係をマッピングファイルに格納するマッピング定義部と、
    を備えたことを特徴とする計算機システム。
  9. 前記概念抽出部は、
    前記第1データ項目格納部または第2データ項目格納部から、それぞれ2つのデータ項目名を読み込んで当該2つのデータ項目名の文字列を比較する比較部と、
    前記2つのデータ項目名が同義の文字列を含むときに、前記2つのデータ項目名を構成する文字列のうち共通する1組の文字列を第1の要素概念として抽出し、前記2つのデータ項目名が同義の文字列を含むときに、前記2つのデータ項目名を構成する文字列のうち共通する文字列を除いた1組の文字列を第2の要素概念として抽出する要素概念抽出部と、
    を有することを特徴とする請求項8に記載の計算機システム。
  10. 前記弁別関係抽出部は、
    前記第2の要素概念に対応する2つの項目名について、時系列的な順序関係を抽出する手順順序関係抽出部と、
    前記第2の要素概念に時系列的な順序関係が含まれない場合には、当該第2の要素概念を構成する1組の文字列が弁別関係であると判定する弁別関係判定部と、
    を有することを特徴とする請求項9に記載の計算機システム。
  11. 入力された単語について検索を実行する検索プログラムであって、
    検索キーとなる単語の入力を受け付ける手順と、
    単語間の概念関係を記録する辞書に基いて、前記入力された単語の上位概念である単語を上記検索キーとして追加する手順と、
    単語間の弁別関係を記録する辞書に基いて、前記検索キーの各単語および該単語の構成要素と弁別関係にある単語を除外キーとして設定する手順と、
    前記検索キーを用いて検索を行う手順と、
    該検索結果から前記除外キーを含むものを除外して検索結果を出力する手順と、
    を計算機に実行させることを特徴とする検索プログラム。
JP2005374359A 2005-12-27 2005-12-27 データスキーマのマッピングプログラム及び計算機システム Expired - Fee Related JP4859456B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2005374359A JP4859456B2 (ja) 2005-12-27 2005-12-27 データスキーマのマッピングプログラム及び計算機システム
US11/642,828 US7996437B2 (en) 2005-12-27 2006-12-21 Program for mapping of data schema

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005374359A JP4859456B2 (ja) 2005-12-27 2005-12-27 データスキーマのマッピングプログラム及び計算機システム

Publications (2)

Publication Number Publication Date
JP2007179146A JP2007179146A (ja) 2007-07-12
JP4859456B2 true JP4859456B2 (ja) 2012-01-25

Family

ID=38195184

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005374359A Expired - Fee Related JP4859456B2 (ja) 2005-12-27 2005-12-27 データスキーマのマッピングプログラム及び計算機システム

Country Status (2)

Country Link
US (1) US7996437B2 (ja)
JP (1) JP4859456B2 (ja)

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7865519B2 (en) * 2004-11-17 2011-01-04 Sap Aktiengesellschaft Using a controlled vocabulary library to generate business data component names
CA2593233A1 (en) * 2007-07-06 2009-01-06 Cognos Incorporated System and method for federated member-based data integration and reporting
US8041746B2 (en) * 2007-10-30 2011-10-18 Sap Ag Mapping schemas using a naming rule
JP5327230B2 (ja) * 2008-12-05 2013-10-30 富士通株式会社 運用管理支援プログラム、該プログラムを記録した記録媒体、運用管理支援装置、および運用管理支援方法
WO2010067295A1 (en) 2008-12-12 2010-06-17 Koninklijke Philips Electronics N.V. A method and module for linking data of a data source to a target database
JP5250463B2 (ja) * 2009-03-23 2013-07-31 エヌ・ティ・ティ・コムウェア株式会社 意味的対応付け装置及びその処理方法とプログラム
EP2246810A1 (en) 2009-04-30 2010-11-03 Collibra NV/SA Method for ontology evolution
FR2946208B1 (fr) * 2009-05-26 2012-02-10 Thales Sa Procede d'adaptation de donnees dans un systeme de transmission de donnees et systeme associe
JP2011028379A (ja) * 2009-07-22 2011-02-10 Toshiba Corp データ構造変換プログラムおよびデータ構造変換装置
JP5423489B2 (ja) 2010-03-08 2014-02-19 富士通株式会社 構成情報管理装置、構成情報管理装置の辞書生成方法及び構成情報管理装置の辞書生成プログラム
EP2365447A1 (en) * 2010-03-11 2011-09-14 British Telecommunications Data integration system
US8355905B2 (en) * 2010-05-14 2013-01-15 International Business Machines Corporation Mapping of relationship entities between ontologies
US9037615B2 (en) 2010-05-14 2015-05-19 International Business Machines Corporation Querying and integrating structured and unstructured data
US8489639B2 (en) * 2011-03-04 2013-07-16 Accenture Global Services Limited Information source alignment
JP5851962B2 (ja) * 2011-09-19 2016-02-03 株式会社東芝 中継サーバ
WO2013128611A1 (ja) * 2012-03-01 2013-09-06 株式会社日立製作所 データ管理システム、データ管理方法、及び計算機読み取り可能な記憶媒体
US20130325867A1 (en) * 2012-06-04 2013-12-05 Sap Ag Ide integrated catalog and ddic-bridge for in-memory database views
WO2013183143A1 (ja) * 2012-06-07 2013-12-12 株式会社日立製作所 管理システム及び管理方法
US9659042B2 (en) * 2012-06-12 2017-05-23 Accenture Global Services Limited Data lineage tracking
WO2014010029A1 (ja) 2012-07-10 2014-01-16 富士通株式会社 プログラム、マッピング装置およびマッピング方法
JP6012120B2 (ja) * 2013-03-22 2016-10-25 京セラドキュメントソリューションズ株式会社 営業支援システムおよび営業支援プログラム
JP6268435B2 (ja) * 2014-03-03 2018-01-31 富士通株式会社 データベースの再構成方法、データベースの再構成プログラム、及び、データベースの再構成装置
US10545955B2 (en) 2016-01-15 2020-01-28 Seven Bridges Genomics Inc. Methods and systems for generating, by a visual query builder, a query of a genomic data store
US10454497B1 (en) 2018-10-22 2019-10-22 Dell Products L. P. Reducing a size of multiple data sets
US11675752B2 (en) * 2019-09-27 2023-06-13 Atlassian Pty Ltd. Systems and methods for generating schema notifications
US20220147568A1 (en) * 2020-11-10 2022-05-12 Sap Se Mapping expression generator

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06214865A (ja) * 1993-01-12 1994-08-05 Fujitsu Ltd オブジェクト・ベース・データ処理装置
US5510978A (en) * 1994-01-26 1996-04-23 Vera Institute Of Justice Electronic apparatus for implementing community policing program and method therefor
JPH08249338A (ja) * 1995-03-08 1996-09-27 Nippon Telegr & Teleph Corp <Ntt> データベース概念スキーマ統合支援装置
US5778373A (en) * 1996-07-15 1998-07-07 At&T Corp Integration of an information server database schema by generating a translation map from exemplary files
JP3779935B2 (ja) * 2002-04-23 2006-05-31 株式会社ジャストシステム 文書検索装置、文書検索方法およびその方法をコンピュータに実行させるプログラム
JP3908090B2 (ja) 2002-05-30 2007-04-25 日本電信電話株式会社 情報検索システムおよび情報検索方法、情報検索プログラム並びにそのプログラムを記録した記録媒体
US7254581B2 (en) * 2002-11-13 2007-08-07 Jerry Johnson System and method for creation and maintenance of a rich content or content-centric electronic catalog
US7739223B2 (en) * 2003-08-29 2010-06-15 Microsoft Corporation Mapping architecture for arbitrary data models
JP2005157823A (ja) 2003-11-27 2005-06-16 Nippon Telegr & Teleph Corp <Ntt> 知識ベースシステム、および同システムにおける単語間の意味関係判別方法、ならびにそのコンピュータプログラム

Also Published As

Publication number Publication date
JP2007179146A (ja) 2007-07-12
US7996437B2 (en) 2011-08-09
US20070150495A1 (en) 2007-06-28

Similar Documents

Publication Publication Date Title
JP4859456B2 (ja) データスキーマのマッピングプログラム及び計算機システム
US8417513B2 (en) Representation of objects and relationships in databases, directories, web services, and applications as sentences as a method to represent context in structured data
AU2011205296B2 (en) Matching metadata sources using rules for characterizing matches
JP5367947B2 (ja) 用語データベース拡張のための方法およびシステム
US20050149538A1 (en) Systems and methods for creating and publishing relational data bases
US20150100542A1 (en) Automatic generation of an extract, transform, load (etl) job
EP1536326A2 (en) Multi-language support at runtime and design
US8161061B2 (en) Module and method for searching named entity of terms from the named entity database using named entity database and mining rule merged ontology schema
US8209346B2 (en) Named entity database or mining rule database update apparatus and method using named entity database and mining rule merged ontology schema
US20120221324A1 (en) Document Processing Apparatus
US20090228794A1 (en) Business specification comprehension assistance system and method
Pan et al. Natural language aided visual query building for complex data access
CN112560418A (zh) 从自由形式的表格式数据创建行项目信息
US10896227B2 (en) Data processing system, data processing method, and data structure
US20060294050A1 (en) Retrieving server-based help content
JP2785317B2 (ja) ソフトウェア標準化方法
JP2002007177A (ja) マルチデータベース定義方法
JP2019164557A (ja) 検索システム
JP7319475B1 (ja) メタデータ管理システム、メタデータ管理方法、プログラム
JP2011221797A (ja) 提案仕様書作成支援方法、プログラムおよび提案仕様書作成支援装置
Bargui et al. Multidimensional concept extraction and validation from OLAP requirements in NL
Lawrence et al. Integrating data sources using a standardized global dictionary
JP6172447B2 (ja) 関連性判定システム、方法、およびプログラム
JP3498926B2 (ja) 文書データベース管理システム
JP4889964B2 (ja) 規則文章作成装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080724

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111025

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111101

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141111

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees