JPH05127959A - 異種データベース間のデータ結合装置 - Google Patents

異種データベース間のデータ結合装置

Info

Publication number
JPH05127959A
JPH05127959A JP3291387A JP29138791A JPH05127959A JP H05127959 A JPH05127959 A JP H05127959A JP 3291387 A JP3291387 A JP 3291387A JP 29138791 A JP29138791 A JP 29138791A JP H05127959 A JPH05127959 A JP H05127959A
Authority
JP
Japan
Prior art keywords
data
database
items
item
databases
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP3291387A
Other languages
English (en)
Other versions
JP2922347B2 (ja
Inventor
Haruko Maesaki
治子 前崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP3291387A priority Critical patent/JP2922347B2/ja
Publication of JPH05127959A publication Critical patent/JPH05127959A/ja
Application granted granted Critical
Publication of JP2922347B2 publication Critical patent/JP2922347B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【目的】 本発明は異種データベース間のデータ結合装
置に係り,とくに属性の異なる項目をキーにして,2つ
のデータベースから類似情報即ち同意データの集計を自
動的に行うようにしたものである。 【構成】 第1のデータベースとこの第1のデータベー
スの項目と異なる属性の項目を有する第2のデータベー
スと,これらのデータベースからそれぞれの項目を抽出
する抽出手段1と,これらのデータベースから抽出した
項目のキー項目を比較して同意データか否かを識別する
結合識別手段2と,同意データの場合これらのデータベ
ースから抽出した項目を結合する集計手段3と,これら
の結合した項目を出力する出力手段4を具備したことを
特徴とする。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は異種データベース間のデ
ータ結合装置に係り,とくに属性の異なる項目をキーに
して,2つのデータベースから類似情報の集計を自動的
に行うようにしたものである。
【0002】
【従来の技術】例えば,データ処理装置において,CE
が対象とするハードウェア部門のユーザ障害情報と,S
Eが対象とするソフトウェア部門のユーザ障害情報と
は,図10に示すように,異なるデータベースA,Bに
格納されている。これはハードウェアとソフトウェアと
では作成しているところが別であることによる。
【0003】従って同一ユーザの特定のデータ処理装置
に障害が時々発生するような場合には,ハードウェアの
障害情報のみとか,ソフトウェアの障害情報のみより
は,これらの障害情報を一緒にして検討することが有効
である。
【0004】しかしながら,上記のようにこれらの障害
情報は別々のデータベースA,Bに格納されているため
に,異なる属性,即ち項目長が異なったり,文字タイプ
が異なったりして格納されてとることがある。このため
に同一ユーザでもキー項目,たとえば名称がデータベー
スAでは「日本株式会社」と記入され,データベースB
では「(株)日本」と記入されていることがある。
【0005】
【発明が解決しようとする課題】そのため従来では,上
記データベースAとデータベースBから日本株式会社の
障害情報を集計するとき,オペレータが人手によりこれ
ら異なるユーザ名により照合して集計していた。
【0006】従って、オペレータが,例えばデータベー
スAのユーザ名の項目をサーチして「日本株式会社」又
は「(株)日本」の項目の抽出してこれを保持し,つぎ
にデータベースBのユーザ名の項目をサーチして「日本
株式会社」又は「(株)日本」の項目の抽出してこれを
保持し,これらをプリントアウトなどで出力していた。
【0007】このように,属性が異なる項目をキーにし
て2つのデータベースから類似情報(同一ユーザ情報)
の集計を行う場合,それぞれのデータベースから別々に
該当情報を検索し,2つの情報をオペレータが照合し,
同意項目と判断して集計していた。このために手間がか
かるのみならず,間違いが起こり易かった。
【0008】従って本発明の目的は,異なる属性を持つ
2つ以上のデータベースの類似データーを,自動的に1
つのデータとして集計する異種データベース間のデータ
結合装置を提供することである。
【0009】
【課題を解決するための手段】上記目的を達成するため
に,本発明では,図1に示すように,抽出部1,結合識
別部2,集計部3,出力部4を設ける。結合識別部2
は,異種データベースAとデータベースBから抽出した
異なるデータ項目が類似情報即ち同意データの場合,こ
れらを結合するものである。
【0010】データベースAにはレコードa・・・が格
納され,データベースBにはレコードb・・・が格納さ
れている。そして同意項目を示すキー項目として,デー
タベースAについては項目a1´, データベースBにつ
いては項目b1´を予め結合識別部2に指示しておく。
なおレコードaは項目a1,a2,a3・・・により構
成され,レコードbは項目b1,b2,b3・・・によ
り構成される。
【0011】
【作用】抽出部1はデータベースAからレコードa・・
・を読出してこれらを結合識別部2に送出する。結合識
別部2は各レコードのキー項目(レコードaでは項目a
1)を上記a1´と比較して,一致するものを集計部3
に送出する。
【0012】同様に抽出部1はデータベースBからレコ
ードb・・・を読出してこれらを結合識別部2に送出す
る。結合識別部2は各レコードのキー項目(レコードb
では項目b1)を上記b1´と比較して,一致するもの
を集計部3に送出する。
【0013】このとき項目a1とa1´が一致し,項目
b1とb1´が一致すれば,集計部3には,レコードa
とレコードbとが送出されるので,集計部3は,レコー
ドaとレコードbとを結合する。このときレコードaと
レコードbとの統一名称を予め指示しておけば,その名
称で結合される。例えばa1を統一名称に指定してあれ
ば,図1の点線枠に示すように結合され,出力部4から
出力される。
【0014】
【実施例】本発明の一実施例を図2〜図4により説明す
る。図2は本発明の第一実施例の動作説明図,図3は本
発明の一実施例構成図,図4は本発明の各情報説明図で
ある。まず図2により本発明の第一実施例の動作を説明
する。
【0015】キーボードの如き入力手段により,予め
共通認識情報及びデータベースと共通認識情報の項目対
応データを作成しておく。共通認識情報は,統一名称毎
に,2つのデータベースA,Bでキーとなる項目(項目
a1´,b1´)を持っている。統一名称とは2つのデ
ータベースA,Bでそれぞれキーとなる項目が「同意」
となる項目である。この例では図4(B)に示すよう
に,項目a1´として「日本株式会社」,項目b1´と
して「(株)日本」,統一名称として「日本株式会社」
を入力する。そして検索指示を行う。
【0016】これにより検索指示で渡された統一名称
「日本株式会社」と,項目a1´「日本株式会社」にも
とずき,図2のデータベースと共通認識情報の項目対応
データに示すように,データベースAのレコードのキー
項目をこの項目a1´(認識情報対応項目)「日本株式
会社」と比較して項目認識をする。そしてレコードaの
キー項目a1(対応項目)がこれと一致することを検出
する。
【0017】同様にデータベースBについては,各レ
コードのキー項目をこの項目b1´「(株)日本」と比
較する。そしてレコードbのキー項目b1がこれと一致
することを検出する。そして項目a2,a3・・・と項
目b2,b3・・・を結合して統一名称「日本株式会
社」を付けて出力する。
【0018】尚、図4(A)は,データベースのレコー
ドaの項目a1の内容が「日本株式会社」であり,デー
タベースのレコードbの項目b1の内容が「(株)日
本」であることを示し,(B)は,共通認識情報の内容
として項目a1´が「日本株式会社」,項目b1´が
「(株)日本」,統一名称が「日本株式会社」であるこ
とを示している。
【0019】そして図4(C)は,データベースと共通
認識情報の項目対応データの内容としてデータベースA
では認識情報対応項目が「日本株式会社」で対応項目が
a1であり,データベースBでは認識情報対応項目が
「(株)日本」で対応項目がb1であることを示してい
る。
【0020】図3において,他図と同一記号は同一部を
示し,6は項目対応データ保持部,7は共通認識情報
部,10は制御部である。抽出部1はデータベースAま
たはBよりレコードを順次抽出して結合識別部2に送出
するものである。
【0021】結合識別部2は抽出部1から順次伝達され
たかくレコードの対応項目a1又はb1を,共通認識情
報部7より伝達されている項目a1´又は項目b1´
と比較して,一致するか否かを識別し,一致したレコー
ドを集計部3に送出するものである。
【0022】集計部3は,結合識別部2から伝達される
レコードの対応項目を外して結合しこれに統一名称を付
加して出力部4に伝達するものである。出力部4は集計
部3から伝達されたデータを例えば可視出力するもので
あって,表示器或いはプリンター等で構成される。
【0023】項目対応データ保持部6は図2に示すよう
な,認識情報対応項目と,データベース名と,対応項目
を保持するものである。共通認識情報部7は,図2に示
すような共通認識情報の項目対応データ及び統一名称を
保持するものであり,例えば図4に示す例では,認識情
報対応項目である項目a1´又は項目b1´ として
「日本株式会社」又は「(株)日本」を,統一名称とし
て「日本株式会社」を示している。制御部10は,図3
に示す本発明のデータ結合装置を総合的に制御するもの
である。
【0024】次に図3の動作を説明する。先ず図示省略
した入力手段から項目対応データ保持部6及び共通認識
情報部7に上記データベースと共通認識情報の項目対応
データ及び共通認識情報等を入力する。そして検索指示
を入力する。
【0025】これにより,抽出部1はデータベースAか
らレコードa・・・を順次読出て,結合識別部2に送出
する。この時結合識別部2には統一名称(例えば「日本
株式会社」)と,項目a1´が伝達されている。結合識
別部2では対応項目a1・・・が項目a1´(例えば
「日本株式会社」)と一致するか否か識別して,一致し
たレコードaを統一名称とともに集計部3に送出する。
【0026】次に抽出部1はデータベースBからレコー
ドb・・・を順次読出て,結合識別部2に送出し,結合
識別部2は対応項目b1・・・が項目b1´(例えば
「(株)日本」)と一致するか否か識別して,一致した
レコードbを集計部3に送出する。
【0027】集計部3はこれらのレコードaとレコード
bとをそれぞれ対応項目a1,対応項目b1を除いて結
合し,これに統一名称を付加して出力部4におくる。出
力部4ではこれを例えばプリント出力する。これにより
異種データベース上の類似データを自動的に結合して出
力することが出来る。
【0028】本発明の第二実施例を図5〜図7に基づき
説明する。図5は本発明の第二実施例構成図,図6,図
7はその動作説明図である。予め共通認識情報を作成し
ておく。共通認識情報は,図7(A)に示すように,統
一名称として「日本株式会社」を,項目a1´として
「日本株式会社」を,項目b1´として「(株)日本」
を入力する。
【0029】抽出部1がデータベースAから出力したレ
コードaの項目a1と共通認識情報の項目a1´を結合
識別部2で照合する。同時にデータベースBから出力し
たレコードbの項目b1と共通認識情報の項目b1´を
結合識別部2で照合する。この場合,項目a1と項目a
1´とが一致し,また項目b1と項目b1´とが一致す
ることにより,結合識別部2ではこれらが結合可能デー
タであることを自動認識する。
【0030】データ結合部8で項目a1と項目b1を統
一名称に変換し,レコードaとレコードbを結合し,結
合データとして集計部3に送出する。あるいはレコード
aとレコードbを結合してデータ結合部8から出力して
もよい。
【0031】このようなことをデータベースAおよびデ
ータベースBから結合対象レコードがなくなるまで繰り
返す。このようにして図6に示すような結合データを得
ることが出来る。そして図7に示す(A)のような共通
認識情報を使用して,(B)のような結合データを得
る。
【0032】本発明の第三実施例を図8,図9に基づ
き,他図を参照して説明する。図8は本発明の第三実施
例構成図,図9はその動作説明図である。本発明の第三
実施例では,結合すべきデータを認識するためにデータ
認識部9においてエキスパート解析を行う。エキスパー
ト解析については本発明の第三実施例の動作説明におい
て詳述する。
【0033】イ.検索指示を入力すると,制御部10は
データベースから各レコードの読出を指示する。これに
より抽出部1はデータベースAおよびデータベースBか
らレコードを読み出して,データ認識部9に送出する。
【0034】ロ.データ認識部9は,データベースAか
ら出力したレコードaの項目a1と,データベースBか
ら出力したレコードbの項目b1とを以下に説明するエ
キスパート解析処理により,同意データかどうかの解析
を行う。
【0035】文字データの切り分けを行う。項目a1
は「日本株式会社」であり項目b1は「(株)日本」で
ある。従って 項目a1を1文字ずつ切り分けると6文
字になり,項目b1は3文字になる。
【0036】次に辞書11と照合して,会社の種類を
示す言葉を全て除去する。辞書11と照合して,除外デ
ータに一致したものは文字列から除外される。これによ
り項目a1の日本株式会社は「株式会社」が除外され
「日本」が残り,項目b1の(株)日本は「(株)」が
除外され「日本」が残る。それからこれらの残った文字
の一致度をみると100パーセントであり,閾値を越え
ており,これらのレコードは同意データとみなすことが
できる。
【0037】もし辞書11と照合せずに上記除外データ
をそのまま残して一致度をみれば,「日本」の2文字が
一致しているので,項目a1では33.3パーセントの
一致度となり50パーセント以下のため,同意データと
みることは出来ない。
【0038】ハ.このようにデータ認識部9が項目a1
と項目b1とを同意とみなした場合,データ結合部8で
項目a1と項目b1を「項目a1」に変更し,これらを
結合して図9に示すような結合データを作る。以降,結
合対象レコードがなくなるまで,この様なことを繰り返
す。このようにして図7(B)に示すような,結合デー
タが得られる。
【0039】
【発明の効果】このようにして本発明により,異なる属
性(文字タイプ,項目長),又は異なる内容の項目であ
っても,統一名称又は同意データとして,検索・結合が
可能になる。従って従来は手作業で照合していた2つ以
上のデータベース(またはフアイル)の結合を自動的に
行うことが可能になり,データ集計の能率向上を図るこ
とが出来る。
【図面の簡単な説明】
【図1】本発明の原理説明図である。
【図2】本発明の第一実施例の動作説明図である。
【図3】本発明の一実施例構成図である。
【図4】本発明の各情報説明図である。
【図5】本発明の第二実施例構成図である。
【図6】本発明の第二実施例の動作説明図である。
【図7】本発明の第二実施例の動作説明図である。
【図8】本発明の第三実施例構成図である。
【図9】本発明の第三実施例の動作説明図である。
【図10】従来例説明図である。
【符号の説明】
1 抽出部 2 結合識別部 3 集計部 4 出力部

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 第1のデータベースとこの第1のデータ
    ベースの項目と異なる属性の項目を有する第2のデータ
    ベースと,これらのデータベースからそれぞれの項目を
    抽出する抽出手段(1)と,これらのデータベースから
    抽出した項目のキー項目を比較して同意データか否かを
    識別する結合識別手段(2)と,同意データの場合これ
    らのデータベースから抽出した項目を結合する集計手段
    (3)と,これらの結合した項目を出力する出力手段
    (4)を具備したことを特徴とする異種データベース間
    のデータ結合装置。
  2. 【請求項2】 第1のデータベースとこの第1のデータ
    ベースの項目と異なる属性の項目を有する第2のデータ
    ベースと,これらのデータベースからそれぞれの項目を
    抽出する抽出手段(1)と,共通認識情報を保持する共
    通認識情報保持手段(7)と,データベースから抽出し
    たキー項目と上記共通認識情報とを比較して同意データ
    か否かを識別する識別手段(2)と,結合可能データの
    項目を統一名称に変換するデータ結合手段(8)を具備
    し,上記第1のデータベースから出力したレコードと共
    通認識情報とを照合し,同時に上記第2のデータベース
    から出力したレコードと共通認識情報とを照合し,それ
    ぞれが一致したことにより結合可能データであることを
    自動認識して2つのレコードを結合し,統一名称を付与
    することを特徴とする異種データベース間のデータ結合
    装置。
  3. 【請求項3】 第1のデータベースと,この第1のデー
    タベースの項目と異なる属性の項目を有する第2のデー
    タベースと,これらのデータベースからそれぞれのレコ
    ードを抽出する抽出手段(1)と,エキスパート解析を
    行うデータ認識手段(9)と,このデータ認識手段
    (9)から同意データと認識されたレコードを結合する
    データ結合手段(8)を具備し,第1のデータベースか
    ら出力したレコードの項目と,第1のデータベースから
    出力したレコードの項目とをエキスパート解析により同
    意データか否かを識別して,同意データと識別されたレ
    コードに対してはこれらの特定項目をその一方の項目に
    変更してこれらのレコードを結合することを特徴とする
    異種データベース間のデータ結合装置。
JP3291387A 1991-11-07 1991-11-07 異種データベース間のデータ結合装置及びデータ結合方法 Expired - Fee Related JP2922347B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3291387A JP2922347B2 (ja) 1991-11-07 1991-11-07 異種データベース間のデータ結合装置及びデータ結合方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3291387A JP2922347B2 (ja) 1991-11-07 1991-11-07 異種データベース間のデータ結合装置及びデータ結合方法

Publications (2)

Publication Number Publication Date
JPH05127959A true JPH05127959A (ja) 1993-05-25
JP2922347B2 JP2922347B2 (ja) 1999-07-19

Family

ID=17768259

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3291387A Expired - Fee Related JP2922347B2 (ja) 1991-11-07 1991-11-07 異種データベース間のデータ結合装置及びデータ結合方法

Country Status (1)

Country Link
JP (1) JP2922347B2 (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10162008A (ja) * 1996-11-28 1998-06-19 Nippon Telegr & Teleph Corp <Ntt> 情報検索方法及び装置
JPH11296532A (ja) * 1998-04-08 1999-10-29 Nippon Telegr & Teleph Corp <Ntt> 異種データ項目結合検索方法および装置と異種データ項目検索プログラムを記録した記録媒体
JP2000200288A (ja) * 1999-01-07 2000-07-18 Nec Corp 検索結果解析方式
JP2005092855A (ja) * 2003-09-12 2005-04-07 Kanazawa Inst Of Technology ソフトウエア開発支援装置およびソフトウエア開発支援方法
WO2005109190A1 (ja) * 2004-05-11 2005-11-17 Kanazawa Institute Of Technology ソフトウエア開発支援装置およびソフトウエア開発支援方法
WO2005124541A1 (ja) * 2004-06-15 2005-12-29 Kanazawa Institute Of Technology ソフトウエアライフサイクル管理方法およびソフトウエアライフサイクル管理装置
JP2006501529A (ja) * 2001-12-28 2006-01-12 ジェフリー ジェームズ ジョナス, リアルタイムデータ保管

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10162008A (ja) * 1996-11-28 1998-06-19 Nippon Telegr & Teleph Corp <Ntt> 情報検索方法及び装置
JPH11296532A (ja) * 1998-04-08 1999-10-29 Nippon Telegr & Teleph Corp <Ntt> 異種データ項目結合検索方法および装置と異種データ項目検索プログラムを記録した記録媒体
JP2000200288A (ja) * 1999-01-07 2000-07-18 Nec Corp 検索結果解析方式
JP2006501529A (ja) * 2001-12-28 2006-01-12 ジェフリー ジェームズ ジョナス, リアルタイムデータ保管
US8615521B2 (en) 2001-12-28 2013-12-24 International Business Machines Corporation Real time data warehousing
JP2005092855A (ja) * 2003-09-12 2005-04-07 Kanazawa Inst Of Technology ソフトウエア開発支援装置およびソフトウエア開発支援方法
WO2005109190A1 (ja) * 2004-05-11 2005-11-17 Kanazawa Institute Of Technology ソフトウエア開発支援装置およびソフトウエア開発支援方法
WO2005124541A1 (ja) * 2004-06-15 2005-12-29 Kanazawa Institute Of Technology ソフトウエアライフサイクル管理方法およびソフトウエアライフサイクル管理装置

Also Published As

Publication number Publication date
JP2922347B2 (ja) 1999-07-19

Similar Documents

Publication Publication Date Title
US7242302B2 (en) Systems and methods for capturing workflow information
US20090006482A1 (en) Electronic image filing method, electronic image filing device and electronic image filing system
CN114117171B (zh) 一种基于赋能思维的工程档案智能收整方法及系统
JP2005018678A (ja) 帳票データ入力処理装置、帳票データ入力処理方法及びプログラム
JPWO2019202711A1 (ja) ログ分析システム、ログ分析方法及びプログラム
MXPA04006390A (es) Creacion de depositos de datos en tiempo real.
EP2028598A1 (en) Information classification device, information classification method, and information classification program
JP2001134576A (ja) 事実データ統合方法および装置
WO2022021400A1 (zh) 一种电商评论鉴别标记系统
JPH05127959A (ja) 異種データベース間のデータ結合装置
JP4973738B2 (ja) 業務フロー処理プログラム、方法及び装置
JP4185399B2 (ja) 顧客データ管理装置、顧客データ管理方法および顧客データ管理用プログラムならびに顧客データ管理用プログラムを格納した記録媒体
KR20120003567A (ko) 로그 관리 시스템과 이의 로그 처리방법 및 이의 로그 처리방법을 저장하는 기록매체
US20010014919A1 (en) Method for dialing from computer applications
US20200242121A1 (en) Method and apparatus for analyzing data
KR20200036333A (ko) 문서 분석 기반 주요 요소 추출 시스템 및 방법
TWI766360B (zh) 文字候補提案裝置、手寫文字識別系統、手寫文字識別方法及程式
JP3735313B2 (ja) イメージ管理システム、イメージ管理方法及びイメージ管理プログラム
JP2002014971A (ja) 指定単語関係者情報抽出装置,及び指定単語関係者情報抽出プログラムを記録したコンピュータ読み取り可能な記録媒体
JP6773144B2 (ja) コンテンツ選択装置、コンテンツ選択方法、コンテンツ選択システム及びプログラム
JP2008152357A (ja) テキスト認識システム、テキスト認識方法、テキスト認識プログラム
US11829706B1 (en) Document assembly with the help of training data
JP2001005831A (ja) ファイリング方法及びそれを格納した記録媒体
JPH09265509A (ja) 合わせ読み住所認識方式
CN116108239A (zh) 一种信息提取的方法、装置及电子设备

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19990413

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080430

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090430

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees