JP2922347B2 - 異種データベース間のデータ結合装置及びデータ結合方法 - Google Patents

異種データベース間のデータ結合装置及びデータ結合方法

Info

Publication number
JP2922347B2
JP2922347B2 JP3291387A JP29138791A JP2922347B2 JP 2922347 B2 JP2922347 B2 JP 2922347B2 JP 3291387 A JP3291387 A JP 3291387A JP 29138791 A JP29138791 A JP 29138791A JP 2922347 B2 JP2922347 B2 JP 2922347B2
Authority
JP
Japan
Prior art keywords
database
data
record
item
items
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP3291387A
Other languages
English (en)
Other versions
JPH05127959A (ja
Inventor
治子 前崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP3291387A priority Critical patent/JP2922347B2/ja
Publication of JPH05127959A publication Critical patent/JPH05127959A/ja
Application granted granted Critical
Publication of JP2922347B2 publication Critical patent/JP2922347B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は異種データベース間のデ
ータ結合装置及びデータ結合方法に係り,とくに属性の
異なる項目をキーにして,2つのデータベースから類似
情報の集計を自動的に行うようにしたものである。
【0002】
【従来の技術】例えば,データ処理装置において,CE
が対象とするハードウェア部門のユーザ障害情報と,S
Eが対象とするソフトウェア部門のユーザ障害情報と
は,図10に示すように,異なるデータベースA,Bに
格納されている。これはハードウェアとソフトウェアと
では作成しているところが別であることによる。
【0003】従って同一ユーザの特定のデータ処理装置
に障害が時々発生するような場合には,ハードウェアの
障害情報のみとか,ソフトウェアの障害情報のみより
は,これらの障害情報を一緒にして検討することが有効
である。
【0004】しかしながら,上記のようにこれらの障害
情報は別々のデータベースA,Bに格納されているため
に,異なる属性,即ち項目長が異なったり,文字タイプ
が異なったりして格納されてとることがある。このため
に同一ユーザでもキー項目,たとえば名称がデータベー
スAでは「日本株式会社」と記入され,データベースB
では「(株)日本」と記入されていることがある。
【0005】
【発明が解決しようとする課題】そのため従来では,上
記データベースAとデータベースBから日本株式会社の
障害情報を集計するとき,オペレータが人手によりこれ
ら異なるユーザ名により照合して集計していた。
【0006】従って、オペレータが,例えばデータベー
スAのユーザ名の項目をサーチして「日本株式会社」又
は「(株)日本」の項目の抽出してこれを保持し,つぎ
にデータベースBのユーザ名の項目をサーチして「日本
株式会社」又は「(株)日本」の項目の抽出してこれを
保持し,これらをプリントアウトなどで出力していた。
【0007】このように,属性が異なる項目をキーにし
て2つのデータベースから類似情報(同一ユーザ情報)
の集計を行う場合,それぞれのデータベースから別々に
該当情報を検索し,2つの情報をオペレータが照合し,
同意項目と判断して集計していた。このために手間がか
かるのみならず,間違いが起こり易かった。
【0008】従って本発明の目的は,異なる属性を持つ
2つ以上のデータベースの類似データーを,自動的に1
つのデータとして集計する異種データベース間のデータ
結合装置及びデータ結合方法を提供することである。
【0009】
【課題を解決するための手段】上記目的を達成するため
に,本発明の原理構成では,図1の原理説明図に示すよ
うに,抽出部1,結合識別部2,集計部3,出力部4を
設ける。結合識別部2は,異種データベースAとデータ
ベースBから抽出した異なるデータ項目が類似情報即ち
同意データの場合,これらを結合するものである。
【0010】データベースAにはレコードa・・・が格
納され,データベースBにはレコードb・・・が格納さ
れている。そして同意項目を示すキー項目として,デー
タベースAについては項目a1´, データベースBにつ
いては項目b1´を予め結合識別部2に指示しておく。
なおレコードaは項目a1,a2,a3・・・により構
成され,レコードbは項目b1,b2,b3・・・によ
り構成される。
【0011】
【作用】抽出部1はデータベースAからレコードa・・
・を読出してこれらを結合識別部2に送出する。結合識
別部2は各レコードのキー項目(レコードaでは項目a
1)を上記a1´と比較して,一致するものを集計部3
に送出する。
【0012】同様に抽出部1はデータベースBからレコ
ードb・・・を読出してこれらを結合識別部2に送出す
る。結合識別部2は各レコードのキー項目(レコードb
では項目b1)を上記b1´と比較して,一致するもの
を集計部3に送出する。
【0013】このとき項目a1とa1´が一致し,項目
b1とb1´が一致すれば,集計部3には,レコードa
とレコードbとが送出されるので,集計部3は,レコー
ドaとレコードbとを結合する。このときレコードaと
レコードbとの統一名称を予め指示しておけば,その名
称で結合される。例えばa1を統一名称に指定してあれ
ば,図1の点線枠に示すように結合され,出力部4から
出力される。
【0014】
【実施例】先ず本発明の関連技術を図2〜図4により説
明する。図2は本発明の関連技術の動作説明図,図3は
本発明の関連技術の構成図,図4は本発明に関連する
情報説明図である。まず図2により本発明の関連技術
動作を説明する。
【0015】キーボードの如き入力手段により,予め
共通認識情報及びデータベースと共通認識情報の項目対
応データを作成しておく。共通認識情報は,統一名称毎
に,2つのデータベースA,Bでキーとなる項目(項目
a1´,b1´)を持っている。統一名称とは2つのデ
ータベースA,Bでそれぞれキーとなる項目が「同意」
となる項目である。この例では図4(B)に示すよう
に,項目a1´として「日本株式会社」,項目b1´と
して「(株)日本」,統一名称として「日本株式会社」
を入力する。そして検索指示を行う。
【0016】これにより検索指示で渡された統一名称
「日本株式会社」と,項目a1´「日本株式会社」にも
とずき,図2のデータベースと共通認識情報の項目対応
データに示すように,データベースAのレコードのキー
項目をこの項目a1´(認識情報対応項目)「日本株式
会社」と比較して項目認識をする。そしてレコードaの
キー項目a1(対応項目)がこれと一致することを検出
する。
【0017】同様にデータベースBについては,各レ
コードのキー項目をこの項目b1´「(株)日本」と比
較する。そしてレコードbのキー項目b1がこれと一致
することを検出する。そして項目a2,a3・・・と項
目b2,b3・・・を結合して統一名称「日本株式会
社」を付けて出力する。
【0018】尚、図4(A)は,データベースのレコー
ドaの項目a1の内容が「日本株式会社」であり,デー
タベースのレコードbの項目b1の内容が「(株)日
本」であることを示し,(B)は,共通認識情報の内容
として項目a1´が「日本株式会社」,項目b1´が
「(株)日本」,統一名称が「日本株式会社」であるこ
とを示している。
【0019】そして図4(C)は,データベースと共通
認識情報の項目対応データの内容としてデータベースA
では認識情報対応項目が「日本株式会社」で対応項目が
a1であり,データベースBでは認識情報対応項目が
「(株)日本」で対応項目がb1であることを示してい
る。
【0020】図3において,他図と同一記号は同一部を
示し,6は項目対応データ保持部,7は共通認識情報
部,10は制御部である。抽出部1はデータベースAま
たはBよりレコードを順次抽出して結合識別部2に送出
するものである。
【0021】結合識別部2は抽出部1から順次伝達され
たかくレコードの対応項目a1又はb1を,共通認識情
報部7より伝達されている項目a1´又は項目b1´
と比較して,一致するか否かを識別し,一致したレコー
ドを集計部3に送出するものである。
【0022】集計部3は,結合識別部2から伝達される
レコードの対応項目を外して結合しこれに統一名称を付
加して出力部4に伝達するものである。出力部4は集計
部3から伝達されたデータを例えば可視出力するもので
あって,表示器或いはプリンター等で構成される。
【0023】項目対応データ保持部6は図2に示すよう
な,認識情報対応項目と,データベース名と,対応項目
を保持するものである。共通認識情報部7は,図2に示
すような共通認識情報の項目対応データ及び統一名称を
保持するものであり,例えば図4に示す例では,認識情
報対応項目である項目a1´又は項目b1´ として
「日本株式会社」又は「(株)日本」を,統一名称とし
て「日本株式会社」を示している。制御部10は,図3
に示す本発明の関連技術のデータ結合装置を総合的に制
御するものである。
【0024】次に図3の動作を説明する。先ず図示省略
した入力手段から項目対応データ保持部6及び共通認識
情報部7に上記データベースと共通認識情報の項目対応
データ及び共通認識情報等を入力する。そして検索指示
を入力する。
【0025】これにより,抽出部1はデータベースAか
らレコードa・・・を順次読出て,結合識別部2に送出
する。この時結合識別部2には統一名称(例えば「日本
株式会社」)と,項目a1´が伝達されている。結合識
別部2では対応項目a1・・・が項目a1´(例えば
「日本株式会社」)と一致するか否か識別して,一致し
たレコードaを統一名称とともに集計部3に送出する。
【0026】次に抽出部1はデータベースBからレコー
ドb・・・を順次読出て,結合識別部2に送出し,結合
識別部2は対応項目b1・・・が項目b1´(例えば
「(株)日本」)と一致するか否か識別して,一致した
レコードbを集計部3に送出する。
【0027】集計部3はこれらのレコードaとレコード
bとをそれぞれ対応項目a1,対応項目b1を除いて結
合し,これに統一名称を付加して出力部4におくる。出
力部4ではこれを例えばプリント出力する。これにより
異種データベース上の類似データを自動的に結合して出
力することが出来る。
【0028】本発明の第一実施例を図5〜図7に基づき
説明する。図5は本発明の第一実施例構成図,図6,図
7はその動作説明図である。予め共通認識情報を作成し
ておく。共通認識情報は,図7(A)に示すように,統
一名称として「日本株式会社」を,項目a1´として
「日本株式会社」を,項目b1´として「(株)日本」
を入力する。
【0029】抽出部1がデータベースAから出力したレ
コードaの項目a1と共通認識情報の項目a1´を結合
識別部2で照合する。同時にデータベースBから出力し
たレコードbの項目b1と共通認識情報の項目b1´を
結合識別部2で照合する。この場合,項目a1と項目a
1´とが一致し,また項目b1と項目b1´とが一致す
ることにより,結合識別部2ではこれらが結合可能デー
タであることを自動認識する。
【0030】データ結合部8で項目a1と項目b1を統
一名称に変換し,レコードaとレコードbを結合し,結
合データとして集計部3に送出する。あるいはレコード
aとレコードbを結合してデータ結合部8から出力して
もよい。
【0031】このようなことをデータベースAおよびデ
ータベースBから結合対象レコードがなくなるまで繰り
返す。このようにして図6に示すような結合データを得
ることが出来る。そして図7に示す(A)のような共通
認識情報を使用して,(B)のような結合データを得
る。
【0032】本発明の第二実施例を図8,図9に基づ
き,他図を参照して説明する。図8は本発明の第二実施
例構成図,図9はその動作説明図である。本発明の第二
実施例では,結合すべきデータを認識するためにデータ
認識部9においてエキスパート解析を行う。エキスパー
ト解析については本発明の第二実施例の動作説明におい
て詳述する。
【0033】イ.検索指示を入力すると,制御部10は
データベースから各レコードの読出を指示する。これに
より抽出部1はデータベースAおよびデータベースBか
らレコードを読み出して,データ認識部9に送出する。
【0034】ロ.データ認識部9は,データベースAか
ら出力したレコードaの項目a1と,データベースBか
ら出力したレコードbの項目b1とを以下に説明するエ
キスパート解析処理により,同意データかどうかの解析
を行う。
【0035】文字データの切り分けを行う。項目a1
は「日本株式会社」であり項目b1は「(株)日本」で
ある。従って 項目a1を1文字ずつ切り分けると6文
字になり,項目b1は3文字になる。
【0036】次に辞書11と照合して,会社の種類を
示す言葉を全て除去する。辞書11と照合して,除外デ
ータに一致したものは文字列から除外される。これによ
り項目a1の日本株式会社は普通名詞部分の「株式会
社」が除外され固有名詞部分の「日本」が残り,項目b
1の(株)日本は普通名詞部分の「(株)」が除外され
固有名詞部分の「日本」が残る。それからこれらの残っ
た文字の一致度をみると100パーセントであり,閾値
を越えており,これらのレコードは同意データとみなす
ことができる。
【0037】もし辞書11と照合せずに上記除外データ
をそのまま残して一致度をみれば,「日本」の2文字が
一致しているので,項目a1では33.3パーセントの
一致度となり50パーセント以下のため,同意データと
みることは出来ない。
【0038】ハ.このようにデータ認識部9が項目a1
と項目b1とを同意とみなした場合,データ結合部8で
項目a1と項目b1を「項目a1」に変更し,これらを
結合して図9に示すような結合データを作る。以降,結
合対象レコードがなくなるまで,この様なことを繰り返
す。このようにして図7(B)に示すような,結合デー
タが得られる。
【0039】
【発明の効果】このようにして本発明により,異なる属
性(文字タイプ,項目長),又は異なる内容の項目であ
っても,統一名称又は同意データとして,検索・結合が
可能になる。従って従来は手作業で照合していた2つ以
上のデータベース(またはフアイル)の結合を自動的に
行うことが可能になり,データ集計の能率向上を図るこ
とが出来る。しかも共通認識情報入力の1回の入力のみ
でよいため、キー入力ミスが減少し,信頼性が向上す
る。 さらに本発明によるエキスパート解析により簡単な
制御工程によって完全マッチングをさせることができる
ので,この点からも信頼性が向上するものとなる。
【図面の簡単な説明】
【図1】本発明の原理説明図である。
【図2】本発明の関連技術の動作説明図である。
【図3】本発明の関連技術の構成図である。
【図4】本発明に関連する各情報説明図である。
【図5】本発明の第一実施例構成図である。
【図6】本発明の第一実施例の動作説明図である。
【図7】本発明の第一実施例の動作説明図である。
【図8】本発明の第二実施例構成図である。
【図9】本発明の第二実施例の動作説明図である。
【図10】従来例説明図である。
【符号の説明】
1 抽出部 2 結合識別部 3 集計部 4 出力部
フロントページの続き (58)調査した分野(Int.Cl.6,DB名) G06F 12/00 G06F 15/40

Claims (4)

    (57)【特許請求の範囲】
  1. 【請求項1】 第1のデータベース及び第2のデータベ
    ースからそれぞれの項目を抽出する抽出手段と, 異なる属性間の統一名称毎に共通認識情報を保持する共
    通認識情報保持手段と, 統一名称の入力に応答して、データベースから抽出した
    キー項目と当該統一名称に対応する上記共通認識情報と
    を比較して同意データか否かを識別する識別手段と,結合可能データに統一名称を付与し、結合するデータ結
    合手段と、 を具備し、前記識別手段は、 上記第1のデータベースから出力した
    レコードと共通認識情報及び上記第2のデータベースか
    ら出力したレコードと共通認識情報とを照合し,前記デ
    ータ結合手段は、それぞれが一致したことにより結合可
    能データであることを自動認識して2つのレコードを結
    して統一名称を付与することを特徴とする異種データ
    ベース間のデータ結合装置。
  2. 【請求項2】 第1のデータベース及び第2のデータベ
    ースからそれぞれのレコードを抽出する抽出手段と, 普通名詞部分を削除して固有名詞部分のみを照合するエ
    キスパート解析を行うデータ認識手段と, このデータ認識手段から同意データと認識されたレコー
    ドを結合するデータ結合手段を具備し, 第1のデータベースから出力したレコードの項目と,第
    2のデータベースから出力したレコードの項目とを普通
    名詞部分を削除して固有名詞部分のみを照合するエキス
    パート解析により同意データか否かを識別して,同意デ
    ータと識別されたレコードに対してはこれらの特定項目
    をその一方の項目に変更してこれらのレコードを結合す
    ることを特徴とする異種データベース間のデータ結合装
    置。
  3. 【請求項3】 第1のデータベース及び第2のデータベ
    ースからそれぞれの項目を抽出し、異なる属性間の統一
    名称毎に共通認識情報を保持し、 統一名称の入力に応答して、データベースから抽出した
    キー項目と当該統一名称に対応する上記共通認識情報と
    を比較して同意データか否かを識別し、 上記第1のデータベースから出力したレコードと共通認
    識情報及び上記第2のデータベースから出力したレコー
    ドとを共通認識情報が一致したことにより2つのレコー
    ドを結合し、統一名称を付与することを特徴とする異種
    データベース間のデータ結合方法。
  4. 【請求項4】 第1のデータベース及び第2のデータベ
    ースからそれぞれのレコードを抽出し、 普通名詞部分を削除して固有名詞部分のみを照合するエ
    キスパート解析を行ってデータ認識し, このデータ認識により同意データと認識されたレコード
    を結合し, 第1のデータベースから出力したレコードの項目と,第
    2のデータベースから出力したレコードの項目とをエキ
    スパート解析により同意データか否かを識別して,同意
    データと識別されたレコードに対してはこれらの特定項
    目をその一方の項目に変更してこれらのレコードを結合
    することを特徴とする異種データベース間のデータ結合
    方法。
JP3291387A 1991-11-07 1991-11-07 異種データベース間のデータ結合装置及びデータ結合方法 Expired - Fee Related JP2922347B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3291387A JP2922347B2 (ja) 1991-11-07 1991-11-07 異種データベース間のデータ結合装置及びデータ結合方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3291387A JP2922347B2 (ja) 1991-11-07 1991-11-07 異種データベース間のデータ結合装置及びデータ結合方法

Publications (2)

Publication Number Publication Date
JPH05127959A JPH05127959A (ja) 1993-05-25
JP2922347B2 true JP2922347B2 (ja) 1999-07-19

Family

ID=17768259

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3291387A Expired - Fee Related JP2922347B2 (ja) 1991-11-07 1991-11-07 異種データベース間のデータ結合装置及びデータ結合方法

Country Status (1)

Country Link
JP (1) JP2922347B2 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10162008A (ja) * 1996-11-28 1998-06-19 Nippon Telegr & Teleph Corp <Ntt> 情報検索方法及び装置
JP3437441B2 (ja) * 1998-04-08 2003-08-18 日本電信電話株式会社 検索方法、検索装置、および検索プログラムを記録した記録媒体
JP2000200288A (ja) * 1999-01-07 2000-07-18 Nec Corp 検索結果解析方式
PL374305A1 (en) 2001-12-28 2005-10-03 Jeffrey James Jonas Real time data warehousing
JP2005092855A (ja) * 2003-09-12 2005-04-07 Kanazawa Inst Of Technology ソフトウエア開発支援装置およびソフトウエア開発支援方法
WO2005109190A1 (ja) * 2004-05-11 2005-11-17 Kanazawa Institute Of Technology ソフトウエア開発支援装置およびソフトウエア開発支援方法
JP2006003939A (ja) * 2004-06-15 2006-01-05 Kanazawa Inst Of Technology ソフトウエアライフサイクル管理方法およびソフトウエアライフサイクル管理装置

Also Published As

Publication number Publication date
JPH05127959A (ja) 1993-05-25

Similar Documents

Publication Publication Date Title
US5590317A (en) Document information compression and retrieval system and document information registration and retrieval method
US6549913B1 (en) Method for compiling an image database, an image database system, and an image data storage medium
US20090006482A1 (en) Electronic image filing method, electronic image filing device and electronic image filing system
US20020059215A1 (en) Data search apparatus and method
US5815829A (en) Job cost accounting data compression and indexing system and methods for doing the same
EP2028598A1 (en) Information classification device, information classification method, and information classification program
US20040260979A1 (en) Information mining system
JP2922347B2 (ja) 異種データベース間のデータ結合装置及びデータ結合方法
JP2003173280A (ja) データベース生成装置、データベース生成方法及びデータベース生成プログラム
US20010014919A1 (en) Method for dialing from computer applications
KR20120003567A (ko) 로그 관리 시스템과 이의 로그 처리방법 및 이의 로그 처리방법을 저장하는 기록매체
JP3915443B2 (ja) レセプト処理システム
JP3347477B2 (ja) 単語辞書登録装置及び文書認識装置
JPH06139124A (ja) インバーテッドファイル方式データベース内不整合削除方式
JPH05108689A (ja) 為替振込処理装置
JP3735313B2 (ja) イメージ管理システム、イメージ管理方法及びイメージ管理プログラム
JPH09244945A (ja) 情報提示装置
JP6773144B2 (ja) コンテンツ選択装置、コンテンツ選択方法、コンテンツ選択システム及びプログラム
JP2000200278A (ja) テキストフィルタリングシステム及びテキストフィルタリング方法
JPH04153879A (ja) 文書管理情報の自動検索方式
JPH06103402A (ja) 名刺認識装置
JP2001092831A (ja) 文書検索装置及び文書検索方法
WO2023045345A1 (zh) 一种话题挖掘方法及相关装置
JP2549745B2 (ja) 文書検索装置
JP3419425B2 (ja) 認識文字補正装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19990413

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080430

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090430

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees