JP2003271656A - 関係付候補生成装置,関係付候補生成方法,関係付システム,関係付候補生成プログラムおよび同プログラムを記録したコンピュータ読取可能な記録媒体 - Google Patents

関係付候補生成装置,関係付候補生成方法,関係付システム,関係付候補生成プログラムおよび同プログラムを記録したコンピュータ読取可能な記録媒体

Info

Publication number
JP2003271656A
JP2003271656A JP2002076578A JP2002076578A JP2003271656A JP 2003271656 A JP2003271656 A JP 2003271656A JP 2002076578 A JP2002076578 A JP 2002076578A JP 2002076578 A JP2002076578 A JP 2002076578A JP 2003271656 A JP2003271656 A JP 2003271656A
Authority
JP
Japan
Prior art keywords
information
similarity
unit
candidate generation
similarity calculation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2002076578A
Other languages
English (en)
Inventor
Akira Sato
陽 佐藤
Aoshi Okamoto
青史 岡本
Hiroya Inakoshi
宏弥 稲越
Noboru Ozaki
暢 尾崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2002076578A priority Critical patent/JP2003271656A/ja
Priority to US10/282,074 priority patent/US20030182296A1/en
Publication of JP2003271656A publication Critical patent/JP2003271656A/ja
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data

Abstract

(57)【要約】 【課題】 複数の情報源にそれぞれ存在する情報を関係
付けるための関係付候補を容易に生成することができる
ようにする。 【解決手段】 複数の情報源30からそれぞれ情報を取
得する情報取得部110と、この情報取得部110によ
ってそれぞれ取得された情報どうしの類似度を算出する
類似度算出部106と、この類似度算出部106によっ
て算出された類似度に基づいて、対応関係にある情報対
を抽出する抽出部110と、この抽出部110によって
抽出された情報対を出力する出力部102とをそなえる
ように構成する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、例えばEAI(En
terprise Application Integration)のように、複数の
情報源を連携・統合させるに際して、各情報源にそれぞ
れ存在する情報を関係付ける関係付候補の生成に用いて
好適な、関係付候補生成装置,関係付候補生成方法,関
係付システム, 関係付候補生成プログラムおよび同プ
ログラムを記録したコンピュータ読取可能な記録媒体に
関する。
【0002】
【従来の技術】従来、複数の情報源(例えば情報システ
ム等)の連携や統合を行なう、いわゆる情報統合やコン
テンツ管理は、これらの複数の情報源にそれぞれ存在す
る情報どうしを相互に関係付ける必要がある。一般に、
複数の情報システムを統合する場合には、企業のもつ既
存資産をうまくその枠組みに合わせたり、企業の内部だ
けでは制御できない外部の情報との関係を保持したり、
更に、一度構築した情報システムを、組織の変更や環境
の変化,システムの改版等によって別の形に変えたりし
ながら、各情報システムに管理される情報どうしの関係
付けを行なう。
【0003】そして、このような散在する情報を関係付
けるための技術として、情報アクセスの仕方の違いを吸
収するアダプタ,分散する情報にアクセスするためのネ
ットワークシステムおよび情報の内容同どうし士をマッ
ピングする支援ツール等の技術が開発されている。例え
ば、EAI(Enterprise Application Integration)
は、企業内および企業間の情報システムを連携・統合さ
せる手法であって、企業内の異なる業務システムの連携
・統合や、B to B(Business to Business)といった
企業間の電子商取引(EC:Electronic Commerce)に
伴う情報システム結合を実現するためのものである。
【0004】図5は従来の関係付装置の画面の表示例を
示す図であって、複数の情報システムの内容(項目)ど
うしをマッピングする(関係付ける)支援ツールの表示
画面の例を示す図である。この図5においては、Aメー
カにおける工場の在庫管理システムと物流システムとを
連携する場合に、各システムを構成する項目どうしの関
係付けを行なう例について示している。
【0005】この図5に示すように、物流システム(図
5の右側部分参照)は、例えば、「カテゴリ」という項
目の下に「テレビ」という項目をそなえ、更に、この
「テレビ」の下に「ハイビジョンテレビ」,「ワイドテ
レビ」および「普通型テレビ」という項目をそなえてい
る。なお、物流システムにおいては、「テレビ」以下の
各項目名は全角の漢字およびカタカナによって表記され
ている。
【0006】一方、在庫管理システム(図5の左側部分
参照)は、例えば、「カテゴリ」という項目の下に「T
VSET」という項目をそなえ、この「TVSET」の
下に「TV」,「HDTV」および「WTV」という項
目をそなえている。なお、在庫管理システムにおいて
は、「TVSET」以下の各項目名は全角の英文字によ
って表記されている。
【0007】そして、物流システムにおける「カテゴ
リ」,「テレビ」,「ハイビジョンテレビ」,「ワイド
テレビ」および「普通型テレビ」と、在庫管理システム
における「カテゴリ」,「TVSET」,「TV」,
「HDTV」および「WTV」とは、それぞれ、互いに
同一もしくは略同一の内容の項目であると考えられる。
これらの在庫管理システムの情報と物流システムとを連
携・統合する場合には、利用者(システム管理者等)
は、図5に示す関係付装置の表示画面において、在庫管
理システムの項目と物流システムの項目との内、相互に
関係付けることができると判断する項目どうしを選択し
て一つ一つ線で結びつける(関係付ける)ことにより、
各項目どうしを視覚的に関係付けることができるように
なっている。これにより、利用者は、プログラム等を記
述することなく視覚的な作業で関係付け作業を行なうこ
とができ、容易に関係付けを行なうことができる。
【0008】そして、このようにして2つの情報システ
ム(物流システム,在庫管理システム)を関係付けるこ
とにより、これらの2つの情報システムを1つの情報シ
ステムとして取り扱うことができるのである。
【0009】
【発明が解決しようとする課題】しかしながら、このよ
うな従来の関係付け手法においては、利用者は、情報
(項目)の関係付けを行なうために、各情報システムに
管理されている情報どうしの関係についての詳細な知識
を有している必要がある。すなわち、利用者は、関係付
けを希望する情報システムのそれぞれについて、システ
ム仕様等を予め調査・確認を行なう必要があり、システ
ムの規模や管理する情報量が増大している近年において
は、このような事前の調査・確認のために大変な時間や
コストがかかるという課題がある。
【0010】また、上述した関係付け作業は、一度だけ
行なえば良いものではなく、システムの外部環境の変化
や組織の変化,システムの改版等に応じて適宜行なう必
要があり、又、情報の質そのものの変化に対する適応も
求められている。本発明は、このような課題に鑑み創案
されたもので、複数の情報源にそれぞれ存在する情報を
関係付けるための関係付候補を容易に生成することがで
きるようにした、関係付候補生成装置,関係付候補生成
方法,関係付候補生成プログラムおよび同プログラムを
記録したコンピュータ読取可能な記録媒体、並びに、か
かる情報の関係付けを容易に行なうことができる関係付
システムを提供することを目的とする。
【0011】
【課題を解決するための手段】このため、本発明の関係
付候補生成装置(請求項1)は、複数の情報源にそれぞ
れ存在する情報を関係付けた情報対を関係付候補として
生成する関係付候補生成装置であって、複数の情報源か
らそれぞれ情報を取得する情報取得部と、この情報取得
部によってそれぞれ取得された情報どうしの類似度を算
出する類似度算出部と、この類似度算出部によって算出
された類似度に基づいて、対応関係にある情報対を抽出
する抽出部と、この抽出部によって抽出された情報対を
出力する出力部とをそなえることを特徴としている。
【0012】なお、類似度算出部が、情報の項目名どう
しの類似性に基づいて、情報の類似度を算出してもよく
(請求項2)、又、情報の属性値の分布の類似性に基づ
いて、情報の類似度を算出してもよい(請求項3)。ま
た、類似度算出部が、情報の属性値の文字素の分布類似
性に基づいて、情報の類似度を算出してもよく(請求項
4)、又、類似度算出部が、情報の属性値の文字列長の
分布の類似性に基づいて、情報の類似度を算出してもよ
い(請求項5)。
【0013】さらに、類似度算出部が類似度を算出する
前に、所定の処理を事前処理として実行する事前処理部
をそなえてもよい(請求項6)。また、本発明の関係付
候補生成方法(請求項7)は、複数の情報源にそれぞれ
存在する情報を関係付けた情報対を関係付候補として生
成する関係付候補生成方法であって、複数の情報源から
それぞれ該情報を取得する情報取得ステップと、この情
報取得ステップにおいてそれぞれ取得された情報どうし
の類似度を算出する類似度算出ステップと、この類似度
算出ステップにおいて算出された類似度に基づいて、対
応関係にある情報対を抽出する抽出ステップと、この抽
出ステップによって抽出された情報対を出力する出力ス
テップとをそなえることを特徴としている。
【0014】さらに、本発明の関係付システム(請求項
8)は、複数の情報源にそれぞれ存在する情報を関係付
ける関係付システムであって、複数の情報源からそれぞ
れ情報を取得する情報取得部と、この情報取得部によっ
てそれぞれ取得された情報どうしの類似度を算出する類
似度算出部と、この類似度算出部によって算出された類
似度に基づいて、対応関係にある情報対を抽出する抽出
部と、この抽出部によって抽出された該情報対を出力す
る出力部と、この出力部によって出力された情報対に基
づいて、情報対を関係付ける関係付部とをそなえること
を特徴としている。
【0015】また、本発明の関係付候補生成プログラム
(請求項9)は、複数の情報源にそれぞれ存在する情報
を関係付けた情報対を関係付候補として生成する関係付
候補生成機能をコンピュータに実行させるための関係付
候補生成プログラムであって、複数の情報源からそれぞ
れ情報を取得する情報取得部と、この情報取得部によっ
てそれぞれ取得された情報どうしの類似度を算出する類
似度算出部と、この類似度算出部によって算出された類
似度に基づいて、対応関係にある情報対を抽出する抽出
部と、この抽出部によって抽出された情報対を出力する
出力部として、コンピュータを機能させることを特徴と
している。
【0016】さらに、本発明のコンピュータ読取可能な
記録媒体(請求項10)は、上述した関係付候補生成プ
ログラムを記録したものである。
【0017】
【発明の実施の形態】以下、図面を参照して本発明の実
施の形態を説明する。図1は本発明の一実施形態として
の関係付システム1の構成を模式的に示す図、図2は本
関係付システム1によって関係付けを行なう2つのデー
タベースの例を示す図である。本関係付システム1は、
複数の情報システム(情報源30)にそれぞれ存在する
情報を関係付けるものであって、図1に示すように、関
係付候補生成装置100および関係付部20をそなえて
構成されている。
【0018】情報源30は、本関係付システム1によっ
て関係付けを行なう情報をそなえるものであって、例え
ば、データベースシステムやXML(eXtensible Marku
p Language)等のマークアップ言語を用いて構成された
構造化文書等によって構成される情報システムである。
そして、例えば、情報源30がデータベースシステムで
ある場合には、本関係付システム1は、これらのデータ
ベースの項目どうしをそれぞれ関係付けることによっ
て、複数のデータベースどうしを連携・統合するように
なっている。以下、本実施形態においては、図2に示す
ような社員DB(Data Base)30aと研究所DB30
bとの2つのデータベース(情報源30)を連携・統合
する場合について説明する。
【0019】なお、以下、本関係付システム1によって
統合する情報源としては、情報源30として示すが、任
意の情報源(データベース)を指す場合には社員DB3
0aおよび研究所DB30bを用いる場合もある。関係
付部20は、後述する関係付候補生成装置100によっ
て生成された関係付候補に基づいて、複数の情報源30
にそれぞれ存在する情報を関係付けるものであり、例え
ば、関係付候補を利用者が一つ一つ手動で関係付けるこ
とによって実現してもよく、又、関係付候補を、予め用
意したプログラム等によって自動的に関係付けることに
より実現してもよい。なお、このような関係付候補の関
係付けを自動的に行なう場合には、バッチ処理によって
行なってもよい。
【0020】また、この関係付部20は、項目(情報)
どうしの関係付けを行なった場合に、その内容(結果)
を関係付候補成装置100(関係付確定入力部103)
に通知するようになっている。関係付候補生成装置10
0は、複数の情報源30にそれぞれ存在(散在)する情
報を関係付けた情報対を関係付候補として生成して、関
係付部20に対して出力するものである。具体的には、
関係付候補生成装置100は、特定の情報源30に存在
する情報(項目)と他の情報源30に存在する情報(項
目)とを比較して、それらの項目が類似する度合いを類
似度として算出するとともに、その比較の結果(計算結
果)に基づいて、互いに類似すると判断する項目ついて
は、それらの項目の対(情報対)を関係付候補として出
力するようになっている。
【0021】すなわち、類似度は、複数の情報源30に
それぞれ存在する項目どうしが類似するか否かの目安に
なるものであり、例えば、類似度を点数等によって表わ
すことにより、利用者は、この点数(類似度)が高い項
目どうしは類似度が高く、又、点数が低い項目どうしは
類似度が低いと判断することができる。そして、関係付
候補生成装置100は、この類似度が高い(予め所定さ
れた閾値よりも高い)項目どうし(情報対)を関係付候
補として出力するとともに、その類似の度合いを類似度
として示すことができるのである。
【0022】例えば、関係付候補生成装置100は、社
員DB30aの「研究員名」(図2参照)という項目に
類似する項目を散在する情報源30中から探し、研究所
DB30bの「氏名」という項目が、社員DB30aの
「研究員名」という項目に類似していることを、その度
合い(類似度)も含めて示すようになっている。関係付
候補生成装置100は、図1に示すように、問題入力部
101,関係付候補提示部(出力部)102,関係付確
定入力部103,動作確定部104,関係付実行部10
5,類似度計算部(類似度算出部)106,類似度計算
補助部109および情報源アクセス部(情報取得部,抽
出部)110をそなえて構成されている。
【0023】なお、この関係付候補生成装置100は、
例えばコンピュータによって実現される。なお、本実施
形態においては、コンピュータとは、ハードウェアとオ
ペレーションシステムとを含む概念であり、オペレーシ
ョンシステムの制御の下で動作するハードウェアを意味
している。又、オペレーションシステムが不要でアプリ
ケーションプログラム単独でハードウェアを動作させる
ような場合には、そのハードウェア自体がコンピュータ
に相当する。ハードウェアは、少なくとも、CPU(Ce
ntral Processing Unit:中央処理装置)等のマイクロ
プロセッサと、記録媒体に記録されたコンピュータプロ
グラムを読み取るための手段とをそなえている。
【0024】情報源アクセス部(情報取得部)110
は、関係付けを行なう複数の情報源30にアクセスし
て、これらの情報源30にそれぞれ存在する情報を取得
するためのものであり、情報取得部として機能するよう
になっている。又、この情報源アクセス部110は、各
情報源30に関する情報(例えば、アクセス方法や使用
されたアプリケーションの種類,関係付けを行なうか否
か等)を記録するようになっている。
【0025】なお、この情報源アクセス部110による
情報源30に関する情報の登録処理は、通常、利用者
が、各情報源30へのアクセス方法のみを入力すること
により自動的に行なわれるようになっている。具体的に
は、利用者は、先ず、各情報源30へのアクセス方法を
登録するとともに、その情報源30の名前や種類などの
注釈を入力する。
【0026】また、利用者がこのような入力を行なった
時点で、例えば同一ネットワーク上に存在し、アクセス
可能な情報源30の一覧をブラウジングできるようにす
るとともに、標準として全ての情報源30を登録の対象
とすることが望ましい。そして、表示された情報源30
の一覧の中から、特定の情報源30を選択することによ
り、その情報源30を自動的に、登録したり、逆に、登
録しないように設定してもよく、更に、対象の情報源3
0に対して自動的にアクセスできない場合には、登録処
理のみを手動で行なってもよい。
【0027】さらに、情報源30へのアクセス方法の登
録や、情報源30に関する情報の入力は、予め行なう代
わりに、随時、必要に応じて追加してもよい。更に、情
報源30の定義(登録)手法としては、データベースを
直接登録する以外に、抽出文を情報源30に依存する特
定の言語で記述することによって間接的に行なってもよ
く、その場合には、情報源30とその抽出方法との組合
わせを一つの表のように表示させて、エージェントにお
いてその抽出文を利用してもよい。
【0028】問題入力部101は、関係付けを行なう際
の参考となる情報を取得するための問題(以下、単に問
題という場合もある)を利用者が入力するためのもので
ある。この問題入力部101は、例えば、利用者が、図
示しないキーボードやマウス等の入力手段を用いて問題
を直接入力したり、図示しない種々のインターフェース
(例えば、通信ネットワークやバス等)を介して外部か
ら入力することによって実現される。
【0029】また、この問題入力部101からの問題の
入力は、例えば、「社員DBの項目「研究員名」(項目
[社員DB.研究員名])に類似する項目は何か?」とい
った内容をキーボード等を用いて入力することによって
行なう。そして、この問題入力部101から入力された
問題は、類似度計算部106(もしくは類似度計算補助
部109)に入力されるようになっている。
【0030】なお、本実施形態においては、問題を関係
付部20から受け取る(入力する)こともでき、このよ
うに問題を関係付候補生成装置100の外部から入力す
る場合には、問題は、問題入力部101を介して関係付
候補生成装置100に入力されるようになっている。ま
た、問題入力部101においては、本関係付システム1
に予め登録された各データベース(情報源30)の項目
の一覧を、関係付けを行なうきっかけとして利用者に提
示して、利用者がこれらの一覧の中から特定の項目を選
択・入力し、この選択された項目に類似する項目を問題
として扱ってもよい。なお、項目の一覧を表示させる場
合には、後述する前処理実行部107によって類似度が
高いものどうしであると判断されたものを優先的に提示
してもよく、又、仮想テーブル(後述)に含まれる項目
を順に示してもよい。
【0031】関係付確定入力部103は、関係付けの決
定を関係付候補生成装置100の外部から入力するため
のものであって、本関係付システム1においては、関係
付部20から入力された関係付けに関する情報がこの関
係付確定入力部103を介して関係付候補生成装置10
0に入力されるようになっている。又、この関係付確定
入力部103から入力された情報は類似度計算部106
に受け渡されるようになっている。
【0032】類似度計算部106は、関係付候補を生成
するために必要な類似度計算を行なうものであって、情
報源アクセス部110によって取得された項目どうしの
類似度を算出するものである。なお、本実施形態におい
ては、類似度計算部106は、問題入力部101から入
力された問題に基づいて、各類似度計算補助部109に
対して、各アルゴリズムに応じた類似度の計算を行なわ
せ、その計算結果を取得するようになっている。又、類
似度計算部106は、各類似度計算補助部109によっ
て行なわれた類似度の計算内容を取得し、それらの結果
を組み合わせて処理し、総合的な類似度を計算するよう
になっている。
【0033】また、類似度計算部106は、算出した類
似度や各観点からの特徴的な類似性等に基づいて、類似
性に応じた関係付候補を生成し、関係付候補提示部10
2に渡すようになっている。例えば、類似度計算部10
6は、特定の項目(情報)の組み合わせ(項目対;情報
対)について算出された類似度を、予め設定した閾値と
比較して、算出された類似度が閾値以上の場合に、その
項目対を関係付候補として特定するようになっている。
【0034】また、類似度計算部106は、関係付確定
入力部103から入力された関係付けの内容を履歴保存
部108に渡して履歴として保存させるようになってい
る。又、類似度計算部106は、その入力を元に関係付
候補を提示するための計算を行なうようになっている。
また、類似度計算部106による類似性算出処理は、関
係付候補生成装置100の外部からの指定をきっかけに
計算を行なってもよく、又、事前処理として計算の全部
もしくは一部を行なっておいてもよい。
【0035】なお、事前処理が必要な場合には、関係付
候補生成装置100の外部からの指定などによって前処
理実行部107(詳細は後述)が起動され、予め計算の
全部もしくは一部を行なう。又、その計算は、類似度計
算補助部109の各部分装置ごとに行なう。類似度計算
補助部109は、類似度計算部106の計算を補助的に
行なうものであって、項目どうしの類似度計算を部分的
に行なうものである。すなわち、類似度計算補助部10
9は類似度計算の部分計算を行なうようになっている。
具体的には、類似度計算補助部109は、問題入力部1
01から入力された問題について、指定された項目に類
似する項目について、類似度を計算し、その計算結果と
して、各項目を類似度に応じて順序付けたり、各項目に
対して点数付けを行なったりして類似度計算部106に
返すようになっている。
【0036】本実施形態においては、後述する、(1)
項目名の類似,(2)項目の型の類似,(3)項目の属
性値の分布の類似,(4)項目の属性値の文字素の分布
の類似,(5)項目の属性値のサイズの分布の類似およ
び(6)項目の属性値の類似、の6種類の類似度計算手
法のアルゴリズムに応じて、6つの類似度計算補助部1
09がそれぞれそなえられており、これらの類似度計算
手法のアルゴリズム毎に類似度計算補助部109がそれ
ぞれ設けられているのである。以下に、本関係付システ
ム1における類似度算出手法のアルゴリズムについて説
明する。
【0037】(1)項目名の類似データベース(情報源
30)の項目名どうしを比較してそれらの類似性(類似
度)を計算する手法であって、項目名が単純に一致する
か否かを判断するだけでなく、項目名を構成する文字列
を複数の部分に分離させ、これらの各部分についても類
似性を判断する。例えば図2(a),(b)に示す例に
おいては、社員DB30aの項目名「研究員名」を「研
究員」と「名」とに分離して、研究所DB30bの項目
名「氏名」との類似性を調べている。
【0038】なお、文字列の分離には、例えば形態素解
析(Morphological analysis)技術を用いる方法や、
「名」や「番号」のような、項目の意味を特徴づける言
葉のみを抽出する方法などを用いることができる。又、
「名」と「氏名」との類似性を算出するには、例えば類
似性をはかるための辞書を使う方法がある。本実施形態
においては、これらの技術の組み合わせにより、単なる
項目名の一致に限定されない類似性を算出することがで
きるようになっている。
【0039】(2)項目の型の類似 一般に、データベース(情報源)を構成する各項目に対
して、それぞれその項目を特徴づける型(例えば、日
付、数字、文字列等)を定義することができる。又、そ
れぞれの精度を表す属性も型の一部として扱うことがで
きる。このような特徴を利用して、各項目の型が互いに
類似しているか否かを判断することにより(例えば、日
付どうしなので類似している等)、類似性を算出するこ
とができる。
【0040】(3)項目の属性値の分布の類似 項目に属する属性値の分布の類似を調べることによって
類似性(類似度)を計算する手法である。例えば、項目
の属性値が大小関係のある数値である場合に、その最大
値や最小値によって決定される値の範囲の類似性や、そ
れら平均値の類似性,各値の分布の類似性を調べ、それ
らの結果に基づいて類似性を算出する。なお、値が入っ
ていない(ブランク)レコードがある場合には、そのブ
ランクレコードが定義される頻度も類似性判断の指標と
してもよい。
【0041】(4)項目の属性値の文字素の分布の類似 項目に属する属性値の文字素の分布の類似性を調べるこ
とによって類似性(類似度)を計算する手法である。具
体的には、項目の属性値をそれぞれ文字素に分解し、そ
の文字としての最大値や最小値,平均値等の分布の類似
を調べ、それらの結果に基づいて類似性を算出する。
【0042】(5)項目の属性値のサイズの分布の類似 項目に属する属性値のサイズの分布の類似性を調べるこ
とによって、類似性(類似度)を計算する手法である。
例えば文字列のように、属性値のサイズが格納する情報
の内容によって大きく異なる場合には、その属性値のサ
イズの分布を調べることによって、類似性を判断するこ
とができる。すなわち、項目の属性値のサイズを値にし
て、その最大値や最小値,平均値等の分布の類似性を調
べ、それらの結果に基づいて類似性を算出する。
【0043】(6)項目の属性値の類似 項目に属する属性値どうしを直接比較して一致する要素
の割合を調べることによって類似性を算出する手法であ
る。なお、本計算手法においては、情報源30の全ての
項目に対してその属性値を比較することは時間がかかる
おそれがあるので、前処理実行部107によって事前処
理として行なったり、又、他の類似性算出の処理によっ
てある程度類似性が確認できたものに対して絞り込んで
行なうことにより、より効果的に類似性を算出すること
ができる。
【0044】さて、本関係付システム1においては、上
述した各類似度計算補助部109によって行なわれる種
々の類似性算出処理としては、そのアルゴリズムの種類
によって、リアルタイムに行なうことが適している場合
と、リアルタイムに行なわずに後述する前処理実行部
(事前処理部)107によって事前処理として行なうこ
とが適している場合とがある。
【0045】すなわち、各類似度計算補助部109によ
って行なわれる種々の類似性算出処理の内、基本的に、
個々の項目についての比較(マッチング)を行なう度に
必要となる処理(計算等)であるが、個々の項目のマッ
チングを行なう前に(事前に)一度だけ行なうことによ
って、個々のマッチング時に行なう必要が無くなるもの
については、事前処理として行なうことにより、同じ計
算を何度も行なう必要がなくなり効果的である。
【0046】具体的には、関係付けを行なうべく登録さ
れた各データベース(情報源30)からそれぞれの項目
の特徴をアルゴリズム毎に抽出したり(第1段階)、そ
れらの項目の属性値どうしを比較したりすることによ
り、ある項目に対して関係付けることが可能な項目の候
補をある程度まで絞り込む処理を行なう(第2段階)。
なお、この第2段階目の絞り込み処理は、全ての項目の
組合わせについて行なうのではなく、第1段階において
抽出した特徴に基づいて、各項目についての他との類似
性を粗く見積もることによって対象とする項目の組を発
見し、その組のセットに対して処理を行なうことが望ま
しい。
【0047】換言すれば、プログラムや人間による確認
作業が必要な部分だけを残して、それ以外の処理を全て
事前に処理することができる。本実施形態においては、
類似度計算部106にそなえられた前処理実行部107
が、この事前処理を行なったり、各類似度計算補助部1
09に対して事前処理として処理を行なわせたりするよ
うになっている。
【0048】例えば、この前処理実行部107は、事前
処理として、例えば、上述の(6)項目の属性値の類似
に関する類似性算出において述べたように、処理に時間
のかかる処理については、類似度計算補助部109に対
して事前処理として、組み合わせ数を削減するための絞
り込み処理を行なわせるようになっており、これにより
処理に要する時間を低減することができる。
【0049】なお、前処理実行部107は、全てのデー
タベース(情報源30)の項目についての相互の類似度
を、事前処理として、類似度計算部106や類似度計算
補助部109に算出させてもよい。類似度計算部106
による類似度の算出に際しては、既に関係付けされた情
報対に基づいて、それぞれの情報源30における同一イ
ンスタンスにある他の項目についても類似性を算出する
ようになっている。図3は本発明の一実施形態としての
関係付システム1における、既に関係付けされた情報対
に基づいて類似度を算出する手法を説明するための図で
ある。この図3においては社員DB30aと研究所DB
30bとを関係付ける例を示しており、関係付部20に
よって、既に、社員DB30aの項目「従業員番号」
と、研究所DB30bの項目「番号」とが関係付けられ
ている(図3の矢印参照)。
【0050】類似度計算部106は、これらの関係付け
が行なわれている複数の情報源30(社員DB30aと
研究所DB30b)から、関係付けが行なわれた各項目
の属性値が一致(もしくはほぼ一致)するインスタンス
(レコード)をそれぞれ取得する。図3に示す例におい
ては、類似度計算部106は、社員DB30aにおける
従業員番号が920033のインスタンスと、研究所D
B30bにおける、番号が920033のインスタンス
とをそれぞれ取得する(図3の矢印参照)。
【0051】そして、類似度計算部106は、これらの
インスタンスにおいて、一方の情報源30(社員DB3
0a)におけるインスタンス内の既に関係付けが行なわ
れている項目以外の項目(例えば、「年齢」;図3の矢
印参照)の属性値について、他方の情報源30(研究
所DB30b)におけるインスタンス内に、同一の属性
値が含まれているか否かを調べる。ここで、一方のイン
スタンスにおける関係付けがまだ行なわれていない項目
の属性値と、他方のインスタンスにおける関係付けがま
だ行なわれていない項目の属性値とが一致した場合には
(図3の矢印参照)、これらの項目どうしが一致する
可能性が高い(図3の矢印参照)。
【0052】そこで、類似度計算部106は、次に、各
情報源30(社員DB30a,研究所DB30b)か
ら、それぞれ他の属性値を含むインスタンスを複数取得
し、これらの複数のインスタンスについても、同様に、
それらの項目(「年齢」,「Age」)の属性値がそれ
ぞれ一致するか否かを確認し(図3の矢印参照)、例
えば、属性値が一致した回数が予め設定した閾値よりも
多くなった場合に、それらの新しい項目どうしの類似性
が高いと判断する。このような手法により、より効果的
に関係付候補を見つけることができる。
【0053】関係付実行部105は、関係付部20によ
って決定(入力)された関係付けに基づいて実際に各情
報源30の情報(項目)の関係付けを行なうものであ
る。この関係付実行部105は、後述する動作確認部1
04による動作確認(シミュレーション)時に、動作確
認部104からの指示に従って各項目を対応付け、その
結果を動作確認部104に渡すようになっている。これ
により、関係付けが正しいものであるかどうかを、実際
の情報源30を用いて確認(動作確認)することができ
る。又、関係付実行部105が、複数の情報源30の項
目(情報)どうしを関係付けることにより、上述したご
とく、類似度計算部106によって、既に関係付けされ
た情報対に基づいて類似度を算出する際に、関係付けら
れた結果を利用することができるのである。
【0054】関係付候補提示部102は、類似度計算部
106によって特定された関係付候補を関係付候補生成
装置100の外部に提示するものであって、本実施形態
においては、関係付部20にその関係付候補を通知する
ようになっている。この対応付候補提示部102は、例
えば、利用者が関係部20によって関係付けを行なう際
に、利用者が関係付けを行なう項目を選ぶと、その項目
に関係付けることができる候補を関係付候補として提示
するようになっている。
【0055】なお、関係付候補提示部102による関係
付候補の提示手法は、これに限定されるものではなく、
例えば、事前処理などで高い類似度が設定された項目ど
うしを提示したり、仮想的に設けたテーブル(仮想テー
ブル;図示省略)として、情報源30に含まれる項目を
類似度に従って並べた一覧を提示したりする等、利用者
が関係付けを始めるきっかけとなるような項目を提示し
てもよい。
【0056】また、関係付候補提示部102は、前処理
実行部107による事前処理として事前に項目どうしの
類似度が計算されている場合には、関係付候補ととも
に、その計算結果(類似度)も提示するようになってい
る。又、事前処理として項目の特徴抽出までが行なわれ
ている場合には、関係付候補提示部102は、関係付候
補とともにそれらの特徴値を提示するようになってお
り、利用者は、それらの特徴値を他の項目と比較しなが
ら、リアルタイムに関係付処理を行なう。
【0057】なお、類似度計算部106は、類似度の計
算結果を利用者に提示する際に、各類似度計算補助部1
09によって設定された類似度(点数)を組み合わせて
計算したトータルスコアをランキングとして表示させた
り、各類似度計算補助部109によって算出された類似
度が予め設定した閾値を越えたものをその説明とともに
表示させたりしてもよい。
【0058】また、類似度計算部106による類似度の
集計の手法としては、利用者がカスタマイズできるよう
にしてもよく、又、利用者が関係付部20から関係付け
を進めるうちに、データの特徴や関係付けに対する利用
者の意図を取得し、類似度の設定等に反映するようにし
て、より的確な集計方法に変更することができるように
してもよい。
【0059】さらに、関係付候補提示部102は、類似
度の計算結果を利用者に提示する際に、関係付候補が複
数ある場合には、特に類似性の高いものから先に提示す
るようにし、又、それ以外の関係付候補についても、1
つの表示画面内に数個の関係付候補を類似度が高いもの
から順番に表示させてもよく、これにより、利用者が一
度に大量の関係付候補を見る必要がなく、又、利用者が
類似度が高く関係付けることができる可能性が高いもの
を迅速に知ることができる。
【0060】またさらに、情報源30が、例えば、表形
式のデータベースである場合には、関係付候補提示部1
02は、データベースどうしの対応付けを容易に行なう
ことができるように、関係付けを行なう複数のデータベ
ースの項目をそれぞれ並べて表示させるとともに、類似
度が高い項目どうしを線等で連結させて示すことによ
り、利用者は、容易に関係付けを行なうことができる。
一般に、データベースどうしは、その一部の項目が類似
している場合には、表単位でも類似していることが多い
ので、各データベースどうしを対応付ける際には、この
ような手法が効果的であると考えられる。
【0061】特に、同一のデータベースの項目について
は、利用者が既に着目している部分に関係する項目であ
るので、一度にまとめて関係付けるようにすることによ
り、利用者の意識の飛躍等が生じることなく効率的に作
業を進められる。また、既に一部の項目について関係付
けが行なわれたデータベースどうしについては、それら
のデータベースどうしの中で他の関係付けを行なうこと
ができる項目が見つかる確度が高い。
【0062】従って、本実施形態においては、関係付候
補提示部102は、データベースの一つの項目について
関係付けが完了した時点で、同一のデータベースに含ま
れる他の項目についての関係付候補を提示するようにな
っている。さらに、利用者が項目の関係付けを変更した
場合には、その変更に会わせてデータベース全体の関係
付け候補を、利用者が指定した項目以外の項目につい
て、類似度の計算をし直すことが望ましい。
【0063】またさらに、関係付候補提示部102は、
関係付候補を提示する場合に、類似度計算補助部109
のアルゴリズムに合わせた説明(例えば、「定義域が一
致した」等)を、関係付候補とともに表示させることが
望ましい。さらにまた、利用者が、関係付候補を確認す
るために、例えば、各情報源30のインスタンス等を実
際にディスプレイ等に表示させて確認することができる
ことが望ましく、これにより、利用者が関係付けの的確
性を判断することができ、利便性が向上する。
【0064】また、関係付候補提示部102は、関係付
けを行なうデータベースの内、一方のデータベースの項
目に類似する第3のデータベースの項目についての情報
を関係付候補として提示してもよい。この第3のデータ
ベースの項目が、関係付けを行なうデータベースの内、
他方のデータベースの項目についての関係付候補となり
うるからである。
【0065】なお、かかる手法においては、関係付候補
提示部102は、関係付候補を、利用者が関係付候補の
検討を行なう時点に提示するほか、それ以降の他のタイ
ミングにおいて利用者が関係付けを行なおうとしたとき
に関係付候補として提示してもよい。関係付候補提示部
102は、利用者の関係付け作業の流れを監視して、そ
の利用者の作業の傾向を調べ、その傾向に合った関係付
候補を優先的に表示させるようにしてもよい。例えば、
利用者がID的な項目を優先的に関係付ける傾向がある
場合には、そのようなID的な項目を関係付候補として
優先的に表示させるようにすることにより、利用者の作
業性を高めることができる。
【0066】定義保持部111は、本関係付候補生成装
置100によって関係付候補として生成される関係付候
補の関係付けの結果としての関係付定義を保持するもの
である。この定義保持部111は、本関係付候補生成装
置100によって生成された関係付候補を利用する他の
システム等との間で関係付定義を共用できるように、こ
の関係付定義を記録するようになっている。
【0067】関係付情報管理部112は、関係付け時に
用いられる対応表(例えば郵便番号と住所とを対応付け
るようなもの)や、関係付候補生成装置100における
種々の処理の履歴を保持して管理するものである。動作
確認部104は、関係付候補として生成した情報対が実
際に関係がある情報どうしであるか否かを、実行時と同
じライブラリや定義を利用して、その関係付候補の実動
作を関係付実行部105によってシミュレートさせるこ
とで動作確認を行なうものである。
【0068】利用者は、例えば、関係付部20等の関係
付候補生成装置100の外部から関係付けを確認するた
めの入力を行なうことができるようになっており、この
ような入力が行なわれると、関係付候補生成装置100
においては、その入力を動作確認部104によって受け
取り、関係付実行部105によって関係付けを行なっ
て、その結果を外部に返すようになっている。
【0069】本関係付システム1(関係付候補生成装置
100)においては、この動作確認部104にシミュレ
ーションを実行させることによって、例えば複数のデー
タベースに並行にアクセスして結果が統合される様子を
確認しながら、関係付けを進めることができる。これに
より、利用者は、関係付けの定義がうまく行っているか
どうかを確認することができ、関係付候補生成装置10
0によって生成される関係付候補生成の信頼性を向上さ
せることができる。
【0070】なお、関係付け時に、上述の如き対応表を
用いる必要がある場合には、動作確認部104は、その
対応表を関係付情報管理部112から取得して、その対
応表を用いて関係付候補のシミュレーションを実行する
ようになっている。また、この動作確認部104による
シミュレーションは、実際のシステムの動作とできるだ
け同じであることがその役割上も望ましい。ところが、
データベースに対して直接アクセスするのと、いわゆる
エージェントのような分散システムを介してアクセスす
るのとでは、アクセス手順が異なるため、どうしても動
作の違いが生じる可能性がある。
【0071】一方で、分散システムを構築する初期にお
いて、システムの構築を先に行なった後に分散システム
を介してデータベースにアクセスすることは、動作の確
認に時間がかかる他、システムの仕様が決定する前にシ
ステム構築を強いられたりするので、利用者に対する負
担が大きい。そこで、本実施形態においては、動作確認
部104は、各情報源30に対して直接アクセスする手
法と、エージェントなどの分散システムを介してアクセ
スして確認する手法であって、より実行環境に近い手法
との両方の手法を実現することができるようになってい
る。
【0072】そして、システムを構築する課程におい
て、実際のシステムを用いてシミュレートを行なう代わ
りに、動作確認部104によって関係付候補のシミュレ
ートを行なうことにより、スムーズにシステムの移行を
行なったり、システムを介したアクセスと直接アクセス
の結果とを比較したりすることができる。また、本関係
付システム1においては、分散システムと直接アクセス
とで同じことを可能とするため、データベースへのアク
セス定義や、関係付定義などは、関係付システムとエー
ジェントなどの分散システムとで同じものを用いるよう
になっている。
【0073】なお、本関係付システム1においては、上
述した問題入力部101,関係付候補提示部102、関
係付確定入力部103および動作確認部104が、関係
付部20との間で情報をやりとりするインタフェースと
して機能するようになっている。上述の如く構成された
本発明の一実施形態としての関係付システム1の動作
を、図4に示すフローチャート(ステップA10〜A8
0)に従って説明する。
【0074】本関係付システム1によって関係付けを行
なう情報(項目)は、複数の情報システム(データベー
ス:情報源30)に分散しているので、利用者は、先
ず、連携・統合させる対象となる情報源30に関する情
報の登録を行なう(ステップA10)。本関係付システ
ム1においては、この登録処理は、利用者が情報源30
へのアクセス方法を入力することによって自動的に行な
われるようになっている。そこで、利用者は、先ず、ア
クセス方法を登録し、更に、必要に応じて、情報源30
の名前や種類等の注釈を入力する。
【0075】関係付候補生成装置100においては、類
似度計算部106の前処理実行部107が、連携・統合
を行なうデータベース(情報源30)を構成する各項目
をそれぞれ取得し、それらの項目についての特徴を抽出
する(ステップA20;情報取得ステップ)。又、この
ステップA20において抽出した特徴に基づいて、関係
付けを可能な項目の候補の絞り込みを行なう(ステップ
A30)。なお、本関係付システム1においては、これ
らのステップA10〜A30が前処理として行なわれる
ものである。
【0076】利用者は、キーボード等(問題入力部10
1,関係付部20)から、関係付けを行なう際の参考と
なる情報を取得するための問題を入力する。すなわち、
関係付けの一方の対象とすべき項目を入力もしくは選択
する(ステップA40)。関係付候補生成装置100
は、入力された項目に対する他の項目の類似度を、種々
のアルゴリズムに基づいて、類似度計算部106および
類似度計算補助部109によって算出する(ステップA
50;類似度算出ステップ,事前処理ステップ)。な
お、前処理実行部107が、この類似度の算出を事前処
理として行なっている場合には、このステップA50は
不要である。
【0077】次に、類似度計算部106は、ステップA
40において入力された項目に対して類似度が高い項目
を関係付候補として特定し、関係付候補提示部102に
よって提示させる(ステップA60;抽出ステップ,出
力ステップ)。利用者は、提示された関係付候補の中か
ら特定の候補を選択し、その関係付候補について動作確
認を行なう(ステップA70)。すなわち、動作確認部
107および関係付実行部105によって、実行時と同
じライブラリや定義を利用して実動作をシミュレートす
ることによって動作確認を行なう。
【0078】利用者は、その動作確認の結果に基づい
て、その関係付候補が問題として選択した項目に関係付
けることができるものであるか否かを判断し(ステップ
A80)、その関係付候補が選択した候補に関係付ける
ことができる場合には(ステップA80のYESルート
参照)、そのまま処理を終了する。又、動作確認の結
果、マン連付けることができないと判断した場合には
(ステップA80のNOルート参照)ステップA70に
戻る。
【0079】このように、本発明の一実施形態としての
関係付システム1によれば、複数のデータベース(情報
源30)にそれぞれ存在する項目どうしの類似度に基づ
いて特定された関係付候補を容易に取得することがで
き、データベース(情報源30)どうしを容易に統合・
連携させることができる。すなわち、利用者は、類似度
に基づいて抽出された関係付候補の中から関係付けを行
なう情報対を選択することにより、各情報源30を構成
する膨大な項目についての詳細な知識や調査、確認等を
必要とせずに項目どうしの関係付けを容易に行なうこと
ができ、利便性が高いほか、調査や確認等に要する時間
やコストを低減することもできる。
【0080】また、各情報源30にシステム変更等が生
じた場合においても、変更後の各情報源30の項目につ
いても、容易に関係付候補を生成することができるの
で、それらの情報源30においてシステム変更や改版等
が行なわれた場合においても、容易に対応することがで
き利便性が高く、又、情報の質そのものの変化に対して
柔軟に対応することができる。
【0081】さらに、動作確認部104および関係付実
行部105によって、関係付候補についての動作のシミ
ュレーションを行なうことができ、生成された関係付候
補について、関係付けが正しいか否かを確認することが
でき、信頼性を向上させることができる。また、前処理
実行部107により、プログラムや人間による確認作業
が必要な処理以外の特定の処理を事前処理として行なう
ことにより、処理に要する時間を低減することができ利
便性が高い。
【0082】なお、上述した実施形態に関わらず、本発
明の趣旨を逸脱しない範囲で種々変形して実施すること
ができる。例えば、上述した実施形態では、2つの情報
源30(社員DB30a,研究所DB30b)を関係付
ける場合について説明しているが、かかる関係付けを行
なう情報源30の数は2つに限定されるものではなく、
3以上の情報源30を関係付けてもよい。その場合、3
以上の情報源30に対して同時に関係付けを行なっても
よく、又、3以上の情報源30から2つの情報源30を
選択して関係付けを行なうことを、全ての情報源30に
対して繰り返し行なってもよい。
【0083】また、上述した実施形態では、統合・連携
を行なう情報源30としてデータベース(社員DB30
a,研究所DB30b)を用いて説明しているが、これ
に限定されるものではなく、情報源30は、例えば、X
ML等のマークアップ言語を用いて構成された構造化文
書であってもよい。さらに、上述した実施形態では、6
種類の類似度計算手法のアルゴリズムに合わせて6つの
類似度計算補助部109がそなえられているが、これに
限定されるものではなく、上記以外のアルゴリズムを用
いてもよく、又、一部のアルゴリズムを用いなくてもよ
い。
【0084】なお、本発明の各実施形態が開示されてい
れば、当業者によって製造することが可能である。ま
た、上述の実施形態にかかる関係付システム,関係付候
補生成装置,関係付候補生成方法,関係付候補生成プロ
グラムおよび同プログラムを記録したコンピュータ読取
可能な記録媒体は、以下の付記に示す特徴を有すること
になる。
【0085】(付記1) 複数の情報源にそれぞれ存在
する情報を関係付けた情報対を関係付候補として生成す
る関係付候補生成装置であって、前記複数の情報源から
それぞれ該情報を取得する情報取得部と、該情報取得部
によってそれぞれ取得された該情報どうしの類似度を算
出する類似度算出部と、該類似度算出部によって算出さ
れた該類似度に基づいて、対応関係にある情報対を抽出
する抽出部と、該抽出部によって抽出された該情報対を
出力する出力部とをそなえることを特徴とする、関係付
候補生成装置。
【0086】(付記2) 該類似度算出部が、該情報の
項目名どうしの類似性に基づいて、前記情報の類似度を
算出することを特徴とする、付記1記載の関係付候補生
成装置。 (付記3) 該類似度算出部が、該情報の属性値の分布
の類似性に基づいて、前記情報の類似度を算出すること
を特徴とする、付記1又は付記2記載の関係付候補生成
装置。
【0087】(付記4) 該類似度算出部が、該情報の
属性値の文字素の分布類似性に基づいて、前記情報の類
似度を算出することを特徴とする、付記1〜付記3のい
ずれか1項に記載の関係付候補生成装置。 (付記5) 該類似度算出部が、該情報の属性値の文字
列長の分布の類似性に基づいて、前記情報の類似度を算
出することを特徴とする、付記1〜付記4のいずれか1
項に記載の関係付候補生成装置。
【0088】(付記6) 該類似度算出部が、該情報の
型の類似性に基づいて、前記情報の類似度を算出するこ
とを特徴とする、付記1〜付記5のいずれか1項に記載
の関係付候補生成装置。 (付記7) 該類似度算出部が、該情報の属性値どうし
が一致する割合に基づいて該類似度を算出することを特
徴とする、付記1〜付記6のいずれか1項に記載の関係
付候補生成装置。
【0089】(付記8) 該類似度算出部が該類似度を
算出する前に、所定の処理を事前処理として実行する事
前処理部をそなえることを特徴とする、付記1〜付記7
のいずれか1項に記載の関係付候補生成装置。 (付記9) 該事前処理部が、該類似度算出部によって
類似度の算出を行なう該情報の組み合わせを限定し、該
類似度算出部が、該事前処理部によって限定された前記
情報の組合わせに対して該類似度の算出を行なうことを
特徴とする、付記8記載の関係付候補生成装置。
【0090】(付記10) 該類似度算出部が、既に対
応付けを行なった情報を含むインスタンスどうしの類似
度に基づいて、当該インスタンス内の他の情報について
の該類似度を算出することを特徴とする、付記1〜付記
9のいずれか1項に記載の関係付候補生成装置。 (付記11) 該抽出部によって抽出された該情報対に
ついての動作確認を行なう動作確認部をそなえることを
特徴とする、付記1〜付記10のいずれか1項に記載の
関係付候補生成装置。
【0091】(付記12) 関係付けを行なう際の参考
となる情報を取得するための問題を入力可能な問題入力
部をそなえ、該類似度算出部が、該問題入力部によって
入力された問題に基づいて該類似度の算出を行なうこと
を特徴とする、付記1〜付記11のいずれか1項に記載
の関係付候補生成装置。
【0092】(付記13) 所定の処理を、該抽出部が
情報対の抽出を行なう前に事前処理として行なう前処理
実行部をそなえることを特徴とする、付記1〜付記12
のいずれか1項に記載の関係付候補生成装置。 (付記14) 複数の情報源にそれぞれ存在する情報を
関係付けた情報対を関係付候補として生成する関係付候
補生成方法であって、前記複数の情報源からそれぞれ該
情報を取得する情報取得ステップと、該情報取得ステッ
プにおいてそれぞれ取得された該情報どうしの類似度を
算出する類似度算出ステップと、該類似度算出ステップ
において算出された該類似度に基づいて、対応関係にあ
る情報対を抽出する抽出ステップと、該抽出ステップに
おいて抽出された該情報対を出力する出力ステップとを
そなえることを特徴とする、関係付候補生成方法。
【0093】(付記15) 該類似度算出ステップが、
該情報の項目名どうしの類似性に基づいて、前記情報の
類似度を算出することを特徴とする、付記14記載の関
係付候補生成方法。 (付記16) 該類似度算出ステップが、該情報の属性
値の分布の類似性に基づいて、前記情報の類似度を算出
することを特徴とする、付記14又は付記15記載の関
係付候補生成方法。
【0094】(付記17) 該類似度算出ステップが、
該情報の属性値の文字素の分布類似性に基づいて、前記
情報の類似度を算出することを特徴とする、付記14〜
付記16のいずれか1項に記載の関係付候補生成方法。 (付記18) 該類似度算出ステップが、該情報の属性
値の文字列長の分布の類似性に基づいて、前記情報の類
似度を算出することを特徴とする、付記14〜付記17
のいずれか1項に記載の関係付候補生成方法。
【0095】(付記19) 該類似度算出ステップが、
該情報の型の類似性に基づいて、前記情報の類似度を算
出することを特徴とする、付記14〜付記18のいずれ
か1項に記載の関係付候補生成方法。 (付記20) 該類似度算出ステップが、該情報の属性
値どうしが一致する割合に基づいて該類似度を算出する
ことを特徴とする、付記14〜付記19のいずれか1項
に記載の関係付候補生成方法。
【0096】(付記21) 該類似度算出ステップが該
類似度を算出する前に、所定の処理を事前処理として実
行する事前処理ステップをそなえることを特徴とする、
付記14〜付記20のいずれか1項に記載の関係付候補
生成方法。 (付記22) 該事前処理ステップが、該類似度算出部
によって類似度の算出を行なう該情報の組み合わせを限
定し、該類似度算出ステップが、該事前処理ステップに
おいて限定された前記情報の組合わせに対して該類似度
の算出を行なうことを特徴とする、付記21記載の関係
付候補生成方法。
【0097】(付記23) 該類似度算出ステップが、
既に対応付けを行なった情報を含むインスタンスどうし
の類似度に基づいて、当該インスタンス内の他の情報に
ついての類似度を算出することを特徴とする、付記14
〜付記22のいずれか1項に記載の関係付候補生成方
法。 (付記24) 該抽出ステップにおいて抽出された該情
報対についての動作確認を行なう動作確認ステップをそ
なえることを特徴とする、付記14〜付記23のいずれ
か1項に記載の関係付候補生成方法。
【0098】(付記25) 関係付けを行なう際の参考
となる情報を取得するための問題を入力可能な問題入力
ステップをそなえ、該類似度算出ステップが、該問題入
力ステップにおいて入力された問題に基づいて該類似度
の算出を行なうことを特徴とする、付記14〜付記24
のいずれか1項に記載の関係付候補生成方法。
【0099】(付記26) 所定の処理を、該抽出部が
情報対の抽出を行なう前に事前処理として行なう前処理
実行部をそなえることを特徴とする、付記14〜付記2
5のいずれか1項に記載の関係付候補生成方法。 (付記27) 複数の情報源にそれぞれ存在する情報を
関係付ける関係付システムであって、前記複数の情報源
からそれぞれ該情報を取得する情報取得部と、該情報取
得部によってそれぞれ取得された該情報どうしの類似度
を算出する類似度算出部と、該類似度算出部によって算
出された該類似度に基づいて、対応関係にある情報対を
抽出する抽出部と、該抽出部によって抽出された該情報
対を出力する出力部と、該出力部によって出力された該
情報対に基づいて、当該情報対を関係付ける関係付部と
をそなえることを特徴とする、関係付システム。
【0100】(付記28) 該類似度算出部が、該情報
の項目名どうしの類似性に基づいて、前記情報の類似度
を算出することを特徴とする、付記27記載の関係付シ
ステム。 (付記29) 該類似度算出部が、該情報の属性値の分
布の類似性に基づいて、前記情報の類似度を算出するこ
とを特徴とする、付記27又は付記28記載の関係付シ
ステム。
【0101】(付記30) 該類似度算出部が、該情報
の属性値の文字素の分布類似性に基づいて、前記情報の
類似度を算出することを特徴とする、付記27〜付記2
9のいずれか1項に記載の関係付システム。 (付記31) 該類似度算出部が、該情報の属性値の文
字列長の分布の類似性に基づいて、前記情報の類似度を
算出することを特徴とする、付記27〜付記30のいず
れか1項に記載の関係付システム。
【0102】(付記32) 該類似度算出部が、該情報
の型の類似性に基づいて、前記情報の類似度を算出する
ことを特徴とする、付記27〜付記31のいずれか1項
に記載の関係付システム。 (付記33) 該類似度算出部が、該情報の属性値どう
しが一致する割合に基づいて該類似度を算出することを
特徴とする、付記27〜付記32のいずれか1項に記載
の関係付システム。
【0103】(付記34) 該類似度算出部が該類似度
を算出する前に、所定の処理を事前処理として実行する
事前処理部をそなえることを特徴とする、付記27〜付
記33のいずれか1項に記載の関係付システム。 (付記35) 該事前処理部が、該類似度算出部によっ
て類似度の算出を行なう該情報の組み合わせを限定し、
該類似度算出部が、該事前処理部によって限定された前
記情報の組合わせに対して該類似度の算出を行なうこと
を特徴とする、付記34記載の関係付システム。
【0104】(付記36) 該類似度算出部が、既に対
応付けを行なった情報を含むインスタンスどうしの類似
度に基づいて、当該インスタンス内の他の情報について
の該類似度を算出することを特徴とする、付記27〜付
記35のいずれか1項に記載の関係付システム。 (付記37) 該抽出部によって抽出された該情報対に
ついての動作確認を行なう動作確認部をそなえることを
特徴とする、付記27〜付記36のいずれか1項に記載
の関係付システム。
【0105】(付記38) 関係付けを行なう際の参考
となる情報を取得するための問題を入力可能な問題入力
部をそなえ、該類似度算出部が、該問題入力部によって
入力された問題に基づいて該類似度の算出を行なうこと
を特徴とする、付記27〜付記37のいずれか1項に記
載の関係付システム。
【0106】(付記39) 所定の処理を、該抽出部が
情報対の抽出を行なう前に事前処理として行なう前処理
実行部をそなえることを特徴とする、付記27〜付記3
8のいずれか1項に記載の関係付システム。 (付記40) 複数の情報源にそれぞれ存在する情報を
関係付けた情報対を関係付候補として生成する関係付候
補生成機能をコンピュータに実行させるための関係付候
補生成プログラムであって、前記複数の情報源からそれ
ぞれ該情報を取得する情報取得部と、該情報取得部によ
ってそれぞれ取得された該情報どうしの類似度を算出す
る類似度算出部と、該類似度算出部によって算出された
該類似度に基づいて、対応関係にある情報対を抽出する
抽出部と、該抽出部によって抽出された該情報対を出力
する出力部として、該コンピュータを機能させることを
特徴とする、関係付候補生成プログラム。
【0107】(付記41) 該類似度算出部が、該情報
の項目名どうしの類似性に基づいて、前記情報の類似度
を算出することを特徴とする、付記40記載の関係付候
補生成プログラム。 (付記42) 該類似度算出部が、該情報の属性値の分
布の類似性に基づいて、前記情報の類似度を算出するこ
とを特徴とする、付記40又は付記41記載の関係付候
補生成プログラム。
【0108】(付記43) 該類似度算出部が、該情報
の属性値の文字素の分布類似性に基づいて、前記情報の
類似度を算出することを特徴とする、付記40〜付記4
2のいずれか1項に記載の関係付候補生成プログラム。 (付記44) 該類似度算出部が、該情報の属性値の文
字列長の分布の類似性に基づいて、前記情報の類似度を
算出することを特徴とする、付記40〜付記43のいず
れか1項に記載の関係付候補生成プログラム。
【0109】(付記45) 該類似度算出部が、該情報
の型の類似性に基づいて、前記情報の類似度を算出する
ことを特徴とする、付記40〜付記44のいずれか1項
に記載の関係付候補生成プログラム。 (付記46) 該類似度算出部が、該情報の属性値どう
しが一致する割合に基づいて該類似度を算出することを
特徴とする、付記40〜付記45のいずれか1項に記載
の関係付候補生成プログラム。
【0110】(付記47) 該類似度算出部が該類似度
を算出する前に、所定の処理を事前処理として実行する
事前処理部をそなえることを特徴とする、付記40〜付
記46のいずれか1項に記載の関係付候補生成プログラ
ム。 (付記48) 該事前処理部が、該類似度算出部によっ
て類似度の算出を行なう該情報の組み合わせを限定し、
該類似度算出部が、該事前処理部によって限定された前
記情報の組合わせに対して該類似度の算出を行なうこと
を特徴とする、付記47記載の関係付候補生成プログラ
ム。
【0111】(付記49) 該類似度算出部が、既に対
応付けを行なった情報を含むインスタンスどうしの類似
度に基づいて、当該インスタンス内の他の情報について
の該類似度を算出することを特徴とする、付記40〜付
記48のいずれか1項に記載の関係付候補生成プログラ
ム。 (付記50) 該抽出部によって抽出された該情報対に
ついての動作確認を行なう動作確認部として、該コンピ
ュータを機能させることを特徴とする、付記40〜付記
49のいずれか1項に記載の関係付候補生成プログラ
ム。
【0112】(付記51) 関係付けを行なう際の参考
となる情報を取得するための問題を入力可能な問題入力
部として、該コンピュータを機能させるとともに、該類
似度算出部が、該問題入力部によって入力された問題に
基づいて該類似度の算出を行なうことを特徴とする、付
記40〜付記50のいずれか1項に記載の関係付候補生
成プログラム。
【0113】(付記52) 所定の処理を、該抽出部が
情報対の抽出を行なう前に事前処理として行なう前処理
実行部として、該コンピュータを機能させることを特徴
とする、付記40〜付記51のいずれか1項に記載の関
係付候補生成プログラム。 (付記53) 複数の情報源にそれぞれ存在する情報を
関係付けた情報対を関係付候補として生成する関係付候
補生成機能をコンピュータに実行させるための関係付候
補生成プログラムを記録したコンピュータ読取可能な記
録媒体であって、該関係付候補生成プログラムが、前記
複数の情報源からそれぞれ該情報を取得する情報取得部
と、該情報取得部によってそれぞれ取得された該情報ど
うしの類似度を算出する類似度算出部と、該類似度算出
部によって算出された該類似度に基づいて、対応関係に
ある情報対を抽出する抽出部と、該抽出部によって抽出
された該情報対を出力する出力部として、該コンピュー
タを機能させることを特徴とする、関係付候補生成プロ
グラムを記録したコンピュータ読取可能な記録媒体。
【0114】(付記54) 該類似度算出部が、該情報
の項目名どうしの類似性に基づいて、前記情報の類似度
を算出することを特徴とする、付記53記載の関係付候
補生成プログラムを記録したコンピュータ読取可能な記
録媒体。 (付記55) 該類似度算出部が、該情報の属性値の分
布の類似性に基づいて、前記情報の類似度を算出するこ
とを特徴とする、付記53又は付記54記載の関係付候
補生成プログラムを記録したコンピュータ読取可能な記
録媒体。
【0115】(付記56) 該類似度算出部が、該情報
の属性値の文字素の分布類似性に基づいて、前記情報の
類似度を算出することを特徴とする、付記53〜付記5
5のいずれか1項に記載の関係付候補生成プログラムを
記録したコンピュータ読取可能な記録媒体。 (付記57) 該類似度算出部が、該情報の属性値の文
字列長の分布の類似性に基づいて、前記情報の類似度を
算出することを特徴とする、付記53〜付記56のいず
れか1項に記載の関係付候補生成プログラムを記録した
コンピュータ読取可能な記録媒体。
【0116】(付記58) 該類似度算出部が、該情報
の型の類似性に基づいて、前記情報の類似度を算出する
ことを特徴とする、付記53〜付記57のいずれか1項
に記載の関係付候補生成プログラムを記録したコンピュ
ータ読取可能な記録媒体。 (付記59) 該類似度算出部が、該情報の属性値どう
しが一致する割合に基づいて該類似度を算出することを
特徴とする、付記53〜付記58のいずれか1項に記載
の関係付候補生成プログラムを記録したコンピュータ読
取可能な記録媒体。
【0117】(付記60) 該類似度算出部が該類似度
を算出する前に、所定の処理を事前処理として実行する
事前処理部をそなえることを特徴とする、付記53〜付
記59のいずれか1項に記載の関係付候補生成プログラ
ムを記録したコンピュータ読取可能な記録媒体。(付記
61) 該事前処理部が、該類似度算出部によって類似
度の算出を行なう該情報の組み合わせを限定し、該類似
度算出部が、該事前処理部によって限定された前記情報
の組合わせに対して該類似度の算出を行なうことを特徴
とする、付記60記載の関係付候補生成プログラムを記
録したコンピュータ読取可能な記録媒体。
【0118】(付記62) 該類似度算出部が、既に対
応付けを行なった情報を含むインスタンスどうしの類似
度に基づいて、当該インスタンス内の他の情報について
の該類似度を算出することを特徴とする、付記53〜付
記61のいずれか1項に記載の関係付候補生成プログラ
ムを記録したコンピュータ読取可能な記録媒体。 (付記63) 該抽出部によって抽出された該情報対に
ついての動作確認を行なう動作確認部として、該コンピ
ュータを機能させることを特徴とする、付記53〜付記
62のいずれか1項に記載の関係付候補生成プログラム
を記録したコンピュータ読取可能な記録媒体。
【0119】(付記64) 関係付けを行なう際の参考
となる情報を取得するための問題を入力可能な問題入力
部として、該コンピュータを機能させるとともに、該類
似度算出部が、該問題入力部によって入力された問題に
基づいて該類似度の算出を行なうことを特徴とする、付
記53〜付記63のいずれか1項に記載の関係付候補生
成プログラムを記録したコンピュータ読取可能な記録媒
体。
【0120】(付記65) 所定の処理を、該抽出部が
情報対の抽出を行なう前に事前処理として行なう前処理
実行部として、該コンピュータを機能させることを特徴
とする、付記53〜付記64のいずれか1項に記載の関
係付候補生成プログラムを記録したコンピュータ読取可
能な記録媒体。
【0121】
【発明の効果】以上詳述したように、本発明の関係付候
補生成装置,関係付候補生成方法,関係付システム,関
係付候補生成プログラムおよび同プログラムを記録した
コンピュータ読取可能な記録媒体によれば、以下の効果
ないし利点がある。 (1)複数の情報源にそれぞれ存在する情報どうしの類
似度を算出し、この類似度に基づいて対応関係にある情
報対を抽出して関係付候補候補として生成するので、類
似度が高い情報対を関係付候補として取得することがで
きる。これにより、各情報源を構成する膨大な項目につ
いての詳細な知識や調査、確認等を必要とせずに情報ど
うしの関係付けを容易に行なうことができ、複数の情報
源を容易に連携・統合することができるので利便性が高
く、又、それらの調査や確認等に要する時間やコストを
低減することもできる(請求項1〜請求項5,請求項7
〜請求項10)。 (2)各情報源にシステム変更等が生じた場合において
も、変更後の各情報源の項目についても、容易に関係付
候補を生成することができるので、それらの情報源にお
いてシステム変更や改版等が行なわれた場合において
も、容易に対応することができ利便性が高く、又、情報
の質そのものの変化に対して柔軟に対応することができ
る(請求項1〜請求項5,請求項7〜請求項10)。
【0122】(3)類似度を算出する前に、所定の処理
を事前処理として実行することにより、関係付候補の生
成に要する時間を低減することができる(請求項6)。 (4)類似度の算出を行なう該情報の組み合わせを限定
した後に、これらの限定された情報の組合わせに対して
類似度の算出を行なうことによっても、関係付候補の生
成に要する時間を低減することができる。
【0123】(5)抽出された情報対についての動作確
認を行なうことにより、生成された関係付候補につい
て、関係付けが正しいか否かを確認することができ、信
頼性を向上させることができる。 (6)関係付けを行なう際の参考となる情報を取得する
ために入力された問題に基づいて類似度の算出を行なう
ことにより、入力した問題に類似する情報を得ることが
でき利便性が高い。
【0124】(7)所定の処理を、情報対の抽出を行な
う前に事前処理として行なうことにより、関係付候補の
生成に要する時間を低減することができる。
【図面の簡単な説明】
【図1】本発明の一実施形態としての関係付システムの
構成を模式的に示す図である。
【図2】(a),(b)は本関係付システムによって関
係付けを行なう2つのデータベースの例を示す図であ
る。
【図3】本発明の一実施形態としての関係付システムに
おける、既に関係付けされた情報対に基づいて類似度を
算出する手法を説明するための図である。
【図4】本発明の一実施形態としての関係付システムの
動作を説明するためのフローチャートである。
【図5】従来の関係付装置の画面の表示例を示す図であ
る。
【符号の説明】
1 関係付システム 20 関係付部 30 情報源(データベース) 100 関係付候補生成装置 101 問題入力部 102 関係付候補提示部(出力部) 103 関係付確定入力部 104 動作確認部 105 関係付実行部 106 類似度計算部(類似度算出部) 107 前処理実行部(事前処理部) 108 履歴保存部 109 類似度計算補助部 110 情報源アクセス部(情報取得部,抽出部) 111 定義保持部 112 関係付情報管理部
───────────────────────────────────────────────────── フロントページの続き (72)発明者 稲越 宏弥 神奈川県川崎市中原区上小田中4丁目1番 1号 富士通株式会社内 (72)発明者 尾崎 暢 神奈川県川崎市中原区上小田中4丁目1番 1号 富士通株式会社内 Fターム(参考) 5B075 QM08 5B082 GA04 GA08

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 複数の情報源にそれぞれ存在する情報を
    関係付けた情報対を関係付候補として生成する関係付候
    補生成装置であって、 前記複数の情報源からそれぞれ該情報を取得する情報取
    得部と、 該情報取得部によってそれぞれ取得された該情報どうし
    の類似度を算出する類似度算出部と、 該類似度算出部によって算出された該類似度に基づい
    て、対応関係にある情報対を抽出する抽出部と、 該抽出部によって抽出された該情報対を出力する出力部
    とをそなえることを特徴とする、関係付候補生成装置。
  2. 【請求項2】 該類似度算出部が、該情報の項目名どう
    しの類似性に基づいて、前記情報の類似度を算出するこ
    とを特徴とする、請求項1記載の関係付候補生成装置。
  3. 【請求項3】 該類似度算出部が、該情報の属性値の分
    布の類似性に基づいて、前記情報の類似度を算出するこ
    とを特徴とする、請求項1又は請求項2記載の関係付候
    補生成装置。
  4. 【請求項4】 該類似度算出部が、該情報の属性値の文
    字素の分布類似性に基づいて、前記情報の類似度を算出
    することを特徴とする、請求項1〜請求項3のいずれか
    1項に記載の関係付候補生成装置。
  5. 【請求項5】 該類似度算出部が、該情報の属性値の文
    字列長の分布の類似性に基づいて、前記情報の類似度を
    算出することを特徴とする、請求項1〜請求項4のいず
    れか1項に記載の関係付候補生成装置。
  6. 【請求項6】 該類似度算出部が該類似度を算出する前
    に、所定の処理を事前処理として実行する事前処理部を
    そなえることを特徴とする、請求項1〜請求項5のいず
    れか1項に記載の関係付候補生成装置。
  7. 【請求項7】 複数の情報源にそれぞれ存在する情報を
    関係付けた情報対を関係付候補として生成する関係付候
    補生成方法であって、 前記複数の情報源からそれぞれ該情報を取得する情報取
    得ステップと、 該情報取得ステップにおいてそれぞれ取得された該情報
    どうしの類似度を算出する類似度算出ステップと、 該類似度算出ステップにおいて算出された該類似度に基
    づいて、対応関係にある情報対を抽出する抽出ステップ
    と、 該抽出ステップにおいて抽出された該情報対を出力する
    出力ステップとをそなえることを特徴とする、関係付候
    補生成方法。
  8. 【請求項8】 複数の情報源にそれぞれ存在する情報を
    関係付ける関係付システムであって、 前記複数の情報源からそれぞれ該情報を取得する情報取
    得部と、 該情報取得部によってそれぞれ取得された該情報どうし
    の類似度を算出する類似度算出部と、 該類似度算出部によって算出された該類似度に基づい
    て、対応関係にある情報対を抽出する抽出部と、 該抽出部によって抽出された該情報対を出力する出力部
    と、 該出力部によって出力された該情報対に基づいて、当該
    情報対を関係付ける関係付部とをそなえることを特徴と
    する、関係付システム。
  9. 【請求項9】 複数の情報源にそれぞれ存在する情報を
    関係付けた情報対を関係付候補として生成する関係付候
    補生成機能をコンピュータに実行させるための関係付候
    補生成プログラムであって、 前記複数の情報源からそれぞれ該情報を取得する情報取
    得部と、 該情報取得部によってそれぞれ取得された該情報どうし
    の類似度を算出する類似度算出部と、 該類似度算出部によって算出された該類似度に基づい
    て、対応関係にある情報対を抽出する抽出部と、 該抽出部によって抽出された該情報対を出力する出力部
    として、該コンピュータを機能させることを特徴とす
    る、関係付候補生成プログラム。
  10. 【請求項10】 複数の情報源にそれぞれ存在する情報
    を関係付けた情報対を関係付候補として生成する関係付
    候補生成機能をコンピュータに実行させるための関係付
    候補生成プログラムを記録したコンピュータ読取可能な
    記録媒体であって、 該関係付候補生成プログラムが、 前記複数の情報源からそれぞれ該情報を取得する情報取
    得部と、 該情報取得部によってそれぞれ取得された該情報どうし
    の類似度を算出する類似度算出部と、 該類似度算出部によって算出された該類似度に基づい
    て、対応関係にある情報対を抽出する抽出部と、 該抽出部によって抽出された該情報対を出力する出力部
    として、該コンピュータを機能させることを特徴とす
    る、関係付候補生成プログラムを記録したコンピュータ
    読取可能な記録媒体。
JP2002076578A 2002-03-19 2002-03-19 関係付候補生成装置,関係付候補生成方法,関係付システム,関係付候補生成プログラムおよび同プログラムを記録したコンピュータ読取可能な記録媒体 Withdrawn JP2003271656A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2002076578A JP2003271656A (ja) 2002-03-19 2002-03-19 関係付候補生成装置,関係付候補生成方法,関係付システム,関係付候補生成プログラムおよび同プログラムを記録したコンピュータ読取可能な記録媒体
US10/282,074 US20030182296A1 (en) 2002-03-19 2002-10-29 Association candidate generating apparatus and method, association-establishing system, and computer-readable medium recording an association candidate generating program therein

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002076578A JP2003271656A (ja) 2002-03-19 2002-03-19 関係付候補生成装置,関係付候補生成方法,関係付システム,関係付候補生成プログラムおよび同プログラムを記録したコンピュータ読取可能な記録媒体

Publications (1)

Publication Number Publication Date
JP2003271656A true JP2003271656A (ja) 2003-09-26

Family

ID=28035452

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002076578A Withdrawn JP2003271656A (ja) 2002-03-19 2002-03-19 関係付候補生成装置,関係付候補生成方法,関係付システム,関係付候補生成プログラムおよび同プログラムを記録したコンピュータ読取可能な記録媒体

Country Status (2)

Country Link
US (1) US20030182296A1 (ja)
JP (1) JP2003271656A (ja)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007304796A (ja) * 2006-05-10 2007-11-22 Mitsubishi Electric Corp データベース解析システム及びデータベース解析方法及びプログラム
JP2011232879A (ja) * 2010-04-26 2011-11-17 Mitsubishi Electric Corp 同義カラム検出装置及び同義カラム検出方法
JP2011248661A (ja) * 2010-05-27 2011-12-08 Sharp Corp データベース制御装置、データベース制御方法、プログラム及び記録媒体
JP2012181605A (ja) * 2011-02-28 2012-09-20 Toshiba Corp データ分析支援装置およびプログラム
WO2013021875A1 (ja) * 2011-08-08 2013-02-14 日本電気株式会社 データ間の関連性判定システム、データ間の関連性判定方法、および記録媒体
JP2013517569A (ja) * 2010-01-13 2013-05-16 アビニシオ テクノロジー エルエルシー 適合を特徴付けるルールを用いたメタデータソースの照合
JP2016076145A (ja) * 2014-10-08 2016-05-12 株式会社日立製作所 データ処理システム、データ処理方法、及びプログラム
JP2016081526A (ja) * 2014-10-10 2016-05-16 富士通株式会社 テーブル再構成装置と方法
US9442901B2 (en) 2011-04-28 2016-09-13 Fujitsu Limited Resembling character data search supporting method, resembling candidate extracting method, and resembling candidate extracting apparatus
JP2017021634A (ja) * 2015-07-13 2017-01-26 トヨタ自動車株式会社 データ処理装置およびデータ処理方法
JP2017224240A (ja) * 2016-06-17 2017-12-21 富士通株式会社 表データ検索装置、表データ検索方法、及び表データ検索プログラム
JP2018170008A (ja) * 2017-03-09 2018-11-01 タタ コンサルタンシー サービシズ リミテッドTATA Consultancy Services Limited エンティティの属性をマッピングする方法及びシステム
JP2018169822A (ja) * 2017-03-30 2018-11-01 日本電信電話株式会社 管理装置、管理方法および管理プログラム
JP2019139577A (ja) * 2018-02-13 2019-08-22 日立Geニュークリア・エナジー株式会社 データ検索方法、データ検索装置及びプログラム
KR102102276B1 (ko) * 2018-12-28 2020-04-22 동국대학교 산학협력단 딥러닝 기반의 표 유사도 측정 방법

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004348706A (ja) * 2003-04-30 2004-12-09 Canon Inc 情報処理装置及び情報処理方法ならびに記憶媒体、プログラム
AU2003279999A1 (en) * 2003-10-21 2005-06-08 Nielsen Media Research, Inc. Methods and apparatus for fusing databases
JP5729001B2 (ja) * 2011-02-18 2015-06-03 ソニー株式会社 情報提供システム、情報提供方法およびプログラム
WO2020169211A1 (en) 2019-02-22 2020-08-27 Telefonaktiebolaget Lm Ericsson (Publ) Managing telecommunication network event data
CN115378856B (zh) * 2022-08-15 2023-07-14 中国科学院深圳先进技术研究院 通讯检测方法、设备及存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU631276B2 (en) * 1989-12-22 1992-11-19 Bull Hn Information Systems Inc. Name resolution in a directory database
US6460036B1 (en) * 1994-11-29 2002-10-01 Pinpoint Incorporated System and method for providing customized electronic newspapers and target advertisements
US6742003B2 (en) * 2001-04-30 2004-05-25 Microsoft Corporation Apparatus and accompanying methods for visualizing clusters of data and hierarchical cluster classifications
US6941325B1 (en) * 1999-02-01 2005-09-06 The Trustees Of Columbia University Multimedia archive description scheme
US6728728B2 (en) * 2000-07-24 2004-04-27 Israel Spiegler Unified binary model and methodology for knowledge representation and for data and information mining

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007304796A (ja) * 2006-05-10 2007-11-22 Mitsubishi Electric Corp データベース解析システム及びデータベース解析方法及びプログラム
JP2013517569A (ja) * 2010-01-13 2013-05-16 アビニシオ テクノロジー エルエルシー 適合を特徴付けるルールを用いたメタデータソースの照合
KR101758669B1 (ko) * 2010-01-13 2017-07-18 아브 이니티오 테크놀로지 엘엘시 매치를 특징화하는 규칙을 사용하는 메타데이터 소스의 매칭
US9031895B2 (en) 2010-01-13 2015-05-12 Ab Initio Technology Llc Matching metadata sources using rules for characterizing matches
JP2011232879A (ja) * 2010-04-26 2011-11-17 Mitsubishi Electric Corp 同義カラム検出装置及び同義カラム検出方法
JP2011248661A (ja) * 2010-05-27 2011-12-08 Sharp Corp データベース制御装置、データベース制御方法、プログラム及び記録媒体
JP2012181605A (ja) * 2011-02-28 2012-09-20 Toshiba Corp データ分析支援装置およびプログラム
US9442901B2 (en) 2011-04-28 2016-09-13 Fujitsu Limited Resembling character data search supporting method, resembling candidate extracting method, and resembling candidate extracting apparatus
WO2013021875A1 (ja) * 2011-08-08 2013-02-14 日本電気株式会社 データ間の関連性判定システム、データ間の関連性判定方法、および記録媒体
JPWO2013021875A1 (ja) * 2011-08-08 2015-03-05 日本電気株式会社 データ間の関連性判定システム、データ間の関連性判定方法、および記録媒体
JP2016076145A (ja) * 2014-10-08 2016-05-12 株式会社日立製作所 データ処理システム、データ処理方法、及びプログラム
JP2016081526A (ja) * 2014-10-10 2016-05-16 富士通株式会社 テーブル再構成装置と方法
JP2017021634A (ja) * 2015-07-13 2017-01-26 トヨタ自動車株式会社 データ処理装置およびデータ処理方法
JP2017224240A (ja) * 2016-06-17 2017-12-21 富士通株式会社 表データ検索装置、表データ検索方法、及び表データ検索プログラム
JP2018170008A (ja) * 2017-03-09 2018-11-01 タタ コンサルタンシー サービシズ リミテッドTATA Consultancy Services Limited エンティティの属性をマッピングする方法及びシステム
JP2018169822A (ja) * 2017-03-30 2018-11-01 日本電信電話株式会社 管理装置、管理方法および管理プログラム
JP2019139577A (ja) * 2018-02-13 2019-08-22 日立Geニュークリア・エナジー株式会社 データ検索方法、データ検索装置及びプログラム
KR102102276B1 (ko) * 2018-12-28 2020-04-22 동국대학교 산학협력단 딥러닝 기반의 표 유사도 측정 방법

Also Published As

Publication number Publication date
US20030182296A1 (en) 2003-09-25

Similar Documents

Publication Publication Date Title
JP6664784B2 (ja) 表示装置
JP2003271656A (ja) 関係付候補生成装置,関係付候補生成方法,関係付システム,関係付候補生成プログラムおよび同プログラムを記録したコンピュータ読取可能な記録媒体
KR101758669B1 (ko) 매치를 특징화하는 규칙을 사용하는 메타데이터 소스의 매칭
CN109670054B (zh) 知识图谱构建方法、装置、存储介质及电子设备
US6263329B1 (en) Method and apparatus for cross-linguistic database retrieval
US8521561B2 (en) Database system, program, image retrieving method, and report retrieving method
JP2021007031A (ja) 電子診療レコードからの医学的状態および事実の自動的特定および抽出
US8234248B2 (en) Tracking changes to a business object
US7996437B2 (en) Program for mapping of data schema
JP4962967B2 (ja) Webページ検索サーバ及びクエリ推薦方法
JP7313069B2 (ja) 検索用資料情報記憶装置
KR20180042710A (ko) 유사도 분석 기반 이음 동의 항목 관리 방법 및 장치
CN110633393A (zh) 显示系统、程序以及存储介质
US20170220549A1 (en) Information processing apparatus and display method
JP2019032704A (ja) 表データ構造化システムおよび表データ構造化方法
US20130254225A1 (en) Device, method, and non-transitory computer-readable medium for medical information search
US20220004885A1 (en) Computer system and contribution calculation method
TW201421387A (zh) 文件管理系統及文件管理方法以及文件管理程式
US10521507B2 (en) Information processing apparatus and registration method
JP5017046B2 (ja) バリアンス原因フィルタリングシステム
US10896227B2 (en) Data processing system, data processing method, and data structure
JP2019061522A (ja) 文書推薦システム、文書推薦方法および文書推薦プログラム
WO2022079593A1 (en) A system and a way to automatically monitor clinical trials - virtual monitor (vm) and a way to record medical history
JP4169618B2 (ja) テキスト情報管理装置
US20080065370A1 (en) Support apparatus for object-oriented analysis and design

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20050607