JP2008027072A - データベース分析プログラム、データベース分析装置、データベース分析方法 - Google Patents

データベース分析プログラム、データベース分析装置、データベース分析方法 Download PDF

Info

Publication number
JP2008027072A
JP2008027072A JP2006197294A JP2006197294A JP2008027072A JP 2008027072 A JP2008027072 A JP 2008027072A JP 2006197294 A JP2006197294 A JP 2006197294A JP 2006197294 A JP2006197294 A JP 2006197294A JP 2008027072 A JP2008027072 A JP 2008027072A
Authority
JP
Japan
Prior art keywords
item
relation
score
destination
source
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006197294A
Other languages
English (en)
Other versions
JP4997856B2 (ja
Inventor
Yoshihide Nomura
佳秀 野村
Takeshi Kanai
剛 金井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2006197294A priority Critical patent/JP4997856B2/ja
Priority to US11/591,967 priority patent/US7818351B2/en
Priority to EP07112564A priority patent/EP1881427A1/en
Publication of JP2008027072A publication Critical patent/JP2008027072A/ja
Application granted granted Critical
Publication of JP4997856B2 publication Critical patent/JP4997856B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24553Query execution of query operations
    • G06F16/24558Binary matching operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2216/00Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
    • G06F2216/11Patent retrieval

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】複数のテーブルにおける項目間の関連を検出するデータベース分析プログラム、データベース分析装置、データベース分析方法を提供する。
【解決手段】テーブルにおける項目毎に、該項目中の値毎の出現回数に基づく値である項目スコアを算出する項目評価ステップと、複数のテーブルの中から互いに異なるテーブルを関連元テーブル及び関連先テーブルとして選択し、関連元テーブル中の項目である関連元項目と関連先テーブル中の項目である関連先項目とを選択し、関連元項目と関連先項目の組み合わせを関連として生成する関連生成ステップと、関連生成ステップにより生成された関連毎に、関連先項目における関連元項目中の値毎の出現回数と関連元項目の項目スコアと関連先項目の項目スコアとに基づく値である関連スコアを算出する関連評価ステップとをコンピュータに実行させる。
【選択図】図1

Description

本発明は、複数のデータベースの分析を行うデータベース分析プログラム、データベース分析装置、データベース分析方法に関するものである。
業務プロセスのモニタリングを行う際、業務DB(Database)の更新や通信内容の取得により、業務の進捗を示すイベントが取得される。業務プロセスとは、複数の業務システムを跨って遂行される業務の流れを示すものである。1つのイベントは、DBのテーブルにおける1つのレコードとして保管される。また、1つのイベントは、イベントの発生時刻などの項目(フィールド)毎の値がセットになって保管される。
なお、本発明の関連ある従来技術として、イベントを収集し、イベントを業務データ単位にまとめ、業務データ間の関連付けを行い、検索条件に従って、業務データ間の関連をツリー形式で出力する業務プロセストラッキング装置がある(例えば、特許文献1参照)。
特開2005−115494号公報
しかしながら、特許文献1のような従来の技術は、DB間の関連を設定する場合、ユーザがデータのスキーマや内容をチェックすることにより、関連する項目をキーとして設定する必要があった。更に、スキーマの定義が得られない場合や業務システムによって項目が異なる場合などがあるため、ユーザは、分析対象の業務に対する知識や経験がなければ、どの項目をキーとして扱い、どの項目によりDB間が関連しているかの判断が難しい。また、異なるDB間の関連を設定する場合、ユーザは、実際に関連があるかどうかを判断するために、DB内のデータを確認する必要がある。
従来、異なるDB間におけるレコードの一致を検出する仕組みとして名寄せがある。名寄せは、特定のDBの1つのレコードの値のセットと共通する値のセットを持つ別のDBのレコードを検出するものである。この名寄せは、例えば、注文書に対応する入金書の消し込み処理などに利用されている。しかし、業務の流れの可視化のために、データ全体の関連を検出することはできない。
本発明は上述した問題点を解決するためになされたものであり、複数のテーブルにおける項目間の関連を検出するデータベース分析プログラム、データベース分析装置、データベース分析方法を提供することを目的とする。
上述した課題を解決するため、本発明は、複数のテーブルの分析をコンピュータに実行させるデータベース分析プログラムであって、前記テーブルにおける項目毎に、該項目中の値毎の出現回数に基づく値である項目スコアを算出する項目評価ステップと、前記複数のテーブルの中から互いに異なるテーブルを関連元テーブル及び関連先テーブルとして選択し、前記関連元テーブル中の項目である関連元項目と前記関連先テーブル中の項目である関連先項目とを選択し、前記関連元項目と前記関連先項目の組み合わせを関連として生成する関連生成ステップと、前記関連生成ステップにより生成された関連毎に、前記関連先項目における前記関連元項目中の値毎の出現回数と前記関連元項目の項目スコアと前記関連先項目の項目スコアとに基づく値である関連スコアを算出する関連評価ステップとをコンピュータに実行させるものである。
また、本発明に係るデータベース分析プログラムにおいて、前記関連生成ステップは、更に前記関連元テーブル中の項目であるキー項目を選択し、前記関連元項目と前記関連先項目とキー項目の組み合わせを関連として生成し、前記関連評価ステップは、前記関連生成ステップにより生成された関連について、前記関連先項目における前記関連元項目中の値毎の出現回数と前記関連元項目の項目スコアと前記関連先項目の項目スコアと前記キー項目の項目スコアとに基づく関連スコアを算出することを特徴とする。
また、本発明に係るデータベース分析プログラムにおいて、前記項目中の値毎の出現回数が小さいほど前記項目スコアは小さく、前記関連生成ステップは、前記項目スコアが所定の項目スコア閾値より小さい項目から前記関連元項目を選択することを特徴とする。
また、本発明に係るデータベース分析プログラムにおいて、前記関連先項目における前記関連元項目中の値毎の出現回数が1に近いほど前記関連スコアは大きく、前記関連に含まれる各項目の項目スコアと前記キー項目の項目スコアが小さいほど前記関連スコアは大きく、前記関連評価ステップは、更に前記関連スコアが大きい順に所定の数の関連を選択することを特徴とする。
また、本発明に係るデータベース分析プログラムにおいて、更に、前記関連評価ステップにより選択された複数の関連の組み合わせを選択し、該組み合わせを関連構造として生成する関連構造生成ステップをコンピュータに実行させることを特徴とする。
また、本発明に係るデータベース分析プログラムにおいて、前記関連構造生成ステップは、所定のルールに基づいて前記複数の関連の組み合わせを選択することを特徴とする。
また、本発明に係るデータベース分析プログラムにおいて、更に、前記関連構造生成ステップにより生成された関連構造に含まれる関連の関連スコアに基づく値である関連構造スコアを算出する関連構造評価ステップをコンピュータに実行させることを特徴とする。
また、本発明に係るデータベース分析プログラムにおいて、前記関連構造評価ステップは、前記関連構造スコアが最も大きい関連構造を選択することを特徴とする。
また、本発明に係るデータベース分析プログラムにおいて、前記関連構造評価ステップは、前記関連構造スコアが大きい順に所定の数の前記関連構造を表示することを特徴とする。
また、本発明に係るデータベース分析プログラムにおいて、前記関連構造評価ステップは、前記関連構造中の関連に含まれる項目の値を表示することを特徴とする。
また、本発明は、複数のテーブルの分析を行うデータベース分析装置であって、前記テーブルにおける項目毎に、該項目中の値毎の出現回数に基づく値である項目スコアを算出する項目評価部と、前記複数のテーブルの中から互いに異なるテーブルを関連元テーブル及び関連先テーブルとして選択し、前記関連元テーブル中の項目である関連元項目と前記関連先テーブル中の項目である関連先項目とを選択し、前記関連元項目と前記関連先項目の組み合わせを関連として生成する関連生成部と、前記関連生成部により生成された関連毎に、前記関連先項目における前記関連元項目中の値毎の出現回数と前記関連元項目の項目スコアと前記関連先項目の項目スコアとに基づく値である関連スコアを算出する関連評価部とを備えたものである。
また、本発明に係るデータベース分析装置において、前記関連生成部は、更に前記関連元テーブル中の項目であるキー項目を選択し、前記関連元項目と前記関連先項目とキー項目の組み合わせを関連として生成し、前記関連評価部は、前記関連生成部により生成された関連について、前記関連先項目における前記関連元項目中の値毎の出現回数と前記関連元項目の項目スコアと前記関連先項目の項目スコアと前記キー項目の項目スコアとに基づく関連スコアを算出することを特徴とする。
また、本発明に係るデータベース分析装置において、前記項目中の値毎の出現回数が小さいほど前記項目スコアは小さく、前記関連生成部は、前記項目スコアが所定の項目スコア閾値より小さい項目から前記関連元項目を選択することを特徴とする。
また、本発明に係るデータベース分析装置において、前記関連先項目における前記関連元項目中の値毎の出現回数が1に近いほど前記関連スコアは大きく、前記関連に含まれる各項目の項目スコアと前記キー項目の項目スコアが小さいほど前記関連スコアは大きく、前記関連評価部は、更に前記関連スコアが大きい順に所定の数の関連を選択することを特徴とする。
また、本発明に係るデータベース分析装置において、更に、前記関連評価部により選択された複数の関連の組み合わせを選択し、該組み合わせを関連構造として生成する関連構造生成部を備えることを特徴とする。
また、本発明に係るデータベース分析装置において、前記関連構造生成部は、所定のルールに基づいて前記複数の関連の組み合わせを選択することを特徴とする。
また、本発明に係るデータベース分析装置において、更に、前記関連構造生成部により生成された関連構造に含まれる関連の関連スコアに基づく値である関連構造スコアを算出する関連構造評価部を備えることを特徴とする。
また、本発明に係るデータベース分析装置において、前記関連構造評価部は、前記関連構造スコアが最も大きい関連構造を選択することを特徴とする。
また、本発明に係るデータベース分析装置において、前記関連構造評価部は、前記関連構造スコアが大きい順に所定の数の前記関連構造を表示することを特徴とする。
また、本発明は、複数のテーブルの分析を行うデータベース分析プログラムであって、前記テーブルにおける項目毎に、該項目中の値毎の出現回数に基づく値である項目スコアを算出する項目評価ステップと、前記複数のテーブルの中から互いに異なるテーブルを関連元テーブル及び関連先テーブルとして選択し、前記関連元テーブル中の項目である関連元項目と前記関連先テーブル中の項目である関連先項目とを選択し、前記関連元項目と前記関連先項目の組み合わせを関連として生成する関連生成ステップと、前記関連生成ステップにより生成された関連毎に、前記関連先項目における前記関連元項目中の値毎の出現回数と前記関連元項目の項目スコアと前記関連先項目の項目スコアとに基づく値である関連スコアを算出する関連評価ステップとを実行するものである。
本発明によれば、複数のテーブルにおける項目間の関連を検出することができる。
以下、本発明の実施の形態について図面を参照しつつ説明する。
実施の形態1.
まず、本実施の形態に係るデータベース分析装置の構成について説明する。
図1は、本実施の形態に係るデータベース分析装置の構成の一例を示すブロック図である。このデータベース分析装置70は、複数のDB(テーブル)と関連ツリー記憶部79に接続される。本実施の形態において、複数のDBは、それぞれ受注DB80a、生産DB80b、手配DB80c、配送DB80dである。また、データベース分析装置1は、イベント収集部71、重複度算出部72(項目評価部)、関連度算出部73、関連生成部74、関連評価部75、関連ツリー生成部77(関連構造生成部)、関連ツリー評価部78(関連構造評価部)を備える。なお、関連評価部は、実施の形態における関連度算出部73と関連評価部75に対応する。
まず、本実施の形態に係るデータベース分析装置の動作について説明する。
図2は、本実施の形態に係るデータベース分析装置の動作の一例を示すフローチャートである。まず、イベント収集部71は、複数のDBからイベントを収集するイベント収集ステップを行う(S111)。次に、重複度算出部72は、項目毎の重複度(項目スコア)を算出する重複度算出ステップ(項目評価ステップ)を行う(S112)。次に、関連度算出部73は、あるDBの項目から別のDBの項目への関連度を算出する関連度算出ステップを行う(S113)。
次に、関連生成部74は、あるDBの項目から別のDBの項目への関連の候補である関連候補を生成すると共に、関連候補の評価指標である関連スコアを算出する関連生成評価ステップを行う(S114)。次に、関連ツリー生成部77は、複数の関連候補をツリー上に結びつけた関連ツリー(関連構造)の候補である関連ツリー候補を生成する関連ツリー生成ステップを行う(S117)。次に、関連ツリー評価部78は、関連ツリー候補の評価指標である関連ツリースコア(関連構造スコア)を算出し、関連ツリー候補の中から関連ツリースコアに基づいて関連ツリーを選択して関連ツリー記憶部79へ出力する関連ツリー評価ステップを行い(S118)、このフローは終了する。なお、関連評価ステップは、実施の形態における関連度算出ステップと関連評価ステップに対応する。
次に、イベント収集ステップについて説明する。
ここで、イベント収集部71は、受注DB80a、生産DB80b、手配DB80c、配送DB80dからイベントを収集する。図3は、本実施の形態に係る受注DB80aの内容の一例を示すテーブルである。受注DB80aは、項目として、日時(イベント発生日時)、受注番号、地域、担当を持つ。図4は、本実施の形態に係る生産DB80bの内容の一例を示すテーブルである。生産DB80bは、項目として、日時(イベント発生日時)、生産番号、受注番号、品番、納期を持つ。図5は、本実施の形態に係る手配DB80cの内容の一例を示すテーブルである。手配DB80cは、項目として、日時(イベント発生日時)、手配番号、受注番号、品番、納品先を持つ。図6は、本実施の形態に係る配送DB80dの内容の一例を示すテーブルである。配送DB80dは、項目として、日時(イベント発生日時)、手配番号、配送便、納品先を持つ。上述した受注DB80a、生産DB80b、手配DB80c、配送DB80dの各テーブルにおける1つのレコードが1つのイベントに対応する。
次に、重複度算出ステップについて説明する。
重複度は、項目毎に算出される値であり、同一値の出現回数が小さいほど小さくなる。ここで、重複度算出部72は、あるDBのある項目を1つ選択し、値毎の出現回数をカウントする。次に、重複度算出部72は、次に示す第1の重複度算出式により重複度を算出する。
第1の重複度算出式:
重複度
=(イベント毎の値の(出現回数^2)の総和)/(イベント数)^2
×100
更に、重複度算出部72は、全てのDBにおける全ての項目について重複度を算出する。図7は、本実施の形態に係る重複度算出ステップの一例を示す表である。ここでは、重複度算出部72が生産DB80bにおける生産番号、受注番号、品番、納期の各項目について出現回数をカウントした結果を示す。この結果に従って、生産DB80bにおける生産番号の重複度及び受注番号の重複度は、第1の重複度算出式により次のように算出される。
生産番号の重複度
=(S01の出現回数^2+S02の出現回数^2+S03の出現回数^2+S04の出現回数^2+S05の出現回数^2+S06の出現回数^2)/(イベント数^2)×100
=((1^2)×6)/(6^2)×100
=0.17×100=17
受注番号の重複度
=(A01の出現回数^2+A02の出現回数^2+A03の出現回数^2+A04の出現回数^2)/(イベント数^2)×100
=((2^2)×2+(1^2)×2)/(6^2)×100
=0.28×100=28
次に、別の重複度算出式の例について説明する。
第2の重複度算出式:
重複度
=−イベント毎の値の((出現回数)×log2(出現回数))の総和
図7の例において、生産DB80bにおける生産番号の重複度及び受注番号の重複度は、第2の重複度算出式により次のように算出される。
生産番号の重複度
=−(S01の出現回数×log2(S01の出現回数)+S02の出現回数×log2(S02の出現回数)+S03の出現回数×log2(S03の出現回数)+S04の出現回数×log2(S04の出現回数)+S05の出現回数×log2(S05の出現回数)+S06の出現回数×log2(S06の出現回数))
=−6×(1×log(1))
=0
受注番号の重複度
=−(A01の出現回数×log2(A01の出現回数)+A02の出現回数×log2(A02の出現回数)+A03の出現回数×log2(A03の出現回数)+A04の出現回数×log2(A04の出現回数))
=−(2×2×log(2)+2×1×log(1))
=−4
第3の重複度算出式:
重複度
=−イベント毎の値の((出現回数/イベント数)×log(出現回数/イベント数))の総和
図7の例において、生産DB80bにおける生産番号の重複度及び受注番号の重複度は、第3の重複度算出式により次のように算出される。
生産番号の重複度
=−(S01の出現回数/イベント数×log2(S01の出現回数/イベント数)+S02の出現回数/イベント数×log2(S02の出現回数/イベント数)+S03の出現回数/イベント数×log2(S03の出現回数/イベント数)+S04の出現回数/イベント数×log2(S04の出現回数/イベント数)+S05の出現回数/イベント数×log2(S05の出現回数/イベント数)+S06の出現回数/イベント数×log2(S06の出現回数/イベント数))
=−6×(1/6×log(1/6))
=2.58
生産番号の重複度
=−(A01の出現回数/イベント数×log2(A01の出現回数/イベント数)+A02の出現回数/イベント数×log2(A02の出現回数/イベント数)+A03の出現回数/イベント数×log2(A03の出現回数/イベント数)+A04の出現回数/イベント数×log2(A04の出現回数/イベント数))
=−(2×(2/6×log(2/6))+2×(1/6×log(1/6)))
=1.92
このような重複度を用いることにより、重複度が低い項目から関連を検出する、重複度が低い項目をキーとして用いる、などの処理を行うことができる。
次に、関連度算出ステップの動作について説明する。
後の関連生成ステップにおいて、関連生成部74は、あるDBを関連元DBとし、関連元DB中のある項目を関連元項目とし、関連元DBと異なるあるDBを関連先DBとし、関連先DB中のある項目を関連先項目とする。関連度算出ステップにおいて、関連度算出部73は、関連生成ステップで用いられる関連元項目から関連先項目への関連度を算出する。
関連度は、関連元項目と関連先項目の組み合わせ毎に算出される。関連度が1である場合、関連元項目の値と関連先項目の値とが1対1に対応することを示し、関連度が1より小さくなるほど、関連元項目の値に対して関連先項目の値が一致する数が少ないことを示し、関連度が1より大きくなるほど、関連元項目の値に対して関連先項目の値の重複が多いことを示す。
図8は、本実施の形態に係る関連度算出ステップの動作の一例を示すフローチャートである。まず、関連度算出部73は、全てのDBから関連元DBと関連先DBを選択し、関連元DBにおける項目から関連元項目を選択し、関連先DBにおける項目から関連先項目を選択する(S132)。次に、関連度算出部73は、関連元項目の重複度が所定の重複度閾値未満であるか否かの判断を行う(S133)。ここで、重複度閾値は、第1の重複度算出式の場合、例えば30とする。
重複度が重複度閾値以上である場合(S133,N)、処理S131へ戻り、関連度算出部73は、次の関連元項目と関連先項目を選択する。一方、重複度が重複度閾値未満である場合(S133,Y)、関連度算出部73は、関連先項目において関連元項目の値毎の出現回数をカウントし、その結果を関連先出現回数とする(S134)。次に、関連度算出部73は、関連先出現回数を累積し、累積出現回数とする(S135)。次に、関連度算出部73は、関連元項目の全ての値について累積が終了したか否かの判断を行う(S136)。
累積が終了していない場合(S136、N)、処理S134へ戻り、関連度算出部73は、次の値の処理を行う。一方、累積が終了した場合(S136、Y)、関連度算出部73は、累積出現回数を関連元項目のイベント数で除算し、その結果を関連元項目から関連先項目への関連度とする(S142)。次に、関連度算出部73は、まだ対象として処理されていない項目があるか否かの判断を行う(S143)。まだ対象として処理されていない項目がある場合(S143,Y)、処理S131へ戻り、関連度算出部73は、次の対象のDBと項目を選択する。一方、全てのDBと項目を対象として処理した場合(S143,N)、このフローは終了する。
つまり、関連元項目から関連先項目への関連度は、次の関連度算出式により算出される。
関連元項目から関連先項目への関連度
=(関連元項目のイベント毎の値の関連先出現回数の総和)
/(関連元項目のイベント数)
図9は、本実施の形態に係る関連度算出ステップの第1の例を示す表である。ここでは、受注DB80aを関連元DBとし、生産DB80bを関連先DBとする。また、受注DB80aの受注番号を関連元項目とし、生産DB80bの受注番号を関連先項目とする。この表において、受注DB80aの受注番号の値から生産DB80bの受注番号の値へ引いた矢印は、対応する値が一致していることを示す。また、関連元項目の値毎に関連元出現回数と関連先出現回数を示す。受注DB80aの受注番号から生産DB80bの受注番号への関連度は、次のように算出される。
受注DB80aの受注番号から生産DB80bの受注番号への関連度
=(1×2+1×1+1×2+1×1)/4
=1.5
図10は、本実施の形態に係る関連度算出ステップの第2の例を示す表である。ここでは、受注DB80aを関連先DBとし、生産DB80bを関連元DBとする。また、受注DB80aの受注番号を関連先項目とし、生産DB80bの受注番号を関連元項目とする。この表において、生産DB80bの受注番号から受注DB80aの受注番号の値へ引いた矢印は、対応する値が一致していることを示す。また、関連元項目の値毎に関連元出現回数と関連先出現回数を示す。関連度は、次のように算出される。
生産DB80bの受注番号から受注DB80aの受注番号への関連度
=(関連元項目のイベント毎の値の(関連元出現回数×関連先出現回数)の総和)
/(関連元項目のイベント数)
=(2×1+1×1+2×1+1×1)/6
=1
このような関連度を用いることにより、関連元項目と関連先項目が1対1の対応に近いか否かを判断することができる。
次に、関連生成評価ステップについて説明する。
関連は、関連元DBのキー項目、関連元DBの関連元項目、関連先DBの関連先項目の組み合わせで表される。
図11は、本実施の形態に係る関連生成評価ステップの動作の一例を示すフローチャートである。まず、関連生成部74は、キー項目、関連元項目、関連先項目の組み合わせを選択し、その組み合わせを関連候補とする(S150)(関連生成ステップ)。次に、関連評価部75は、後述する関連スコア算出式を用いて関連候補の関連スコアを算出する(S152)(関連評価ステップ)。関連スコアは、関連候補における関連元項目、関連先項目、キー項目の組み合わせの確からしさを表すものである。次に、関連生成部74は、まだ関連候補としていない組み合わせがあるか否かの判断を行う(S153)。まだ関連候補としていない組み合わせがある場合(S153、Y)、処理S150へ戻り、関連生成部74は、次の組み合わせを選択する。一方、もう関連候補としていない組み合わせがない場合(S153、N)、関連評価部75は、関連元のDB毎に関連スコアの高いものから所定の数の関連候補を絞り込み(S154)、このフローは終了する。
この関連生成評価ステップによれば、関連候補毎に関連スコアを算出することにより、確からしい関連候補を使用することができる。更に、関連スコアに基づいて関連候補を絞り込むことにより、その後の処理時間を短縮することができる。
次に、関連ツリー生成ステップについて説明する。
ここで、関連は、2つのノードの接続として表され、関連元DBを関連元ノードとし、関連先DBを関連先ノードとする。関連ツリーは、複数の関連が共通するノードで接続されることにより、ツリー状に表されるものであり、関連先ノードを親とし、関連元ノードを子とする。
図12は、本実施の形態に係る関連ツリー生成ステップの動作の一例を示すフローチャートである。まず、関連ツリー生成部77は、選択した関連候補の中から1つを選択して初期関連候補とし(S155)、初期関連候補を関連ツリー候補の初期状態とする(S156)。ここで、初期関連候補における関連元DB及び関連先DBはそれぞれ、関連ツリー候補におけるノードとなる。次に、関連ツリー生成部77は、関連候補の中から1つの関連候補を選択して追加関連候補とする(S161)。
次に、追加関連候補中のDBが関連ツリー候補中のDBとして存在し、かつ、それらのDBのキー項目が異なる場合(S162,Y)、処理S161へ戻り、関連ツリー生成部77は、次の追加関連候補を選択する。一方、追加関連候補中のDBが関連ツリー候補中のDBとして存在し、かつ、それらのDBのキー項目が一致する場合、または、追加関連候補中のDBが関連ツリー候補中のDBとして存在しない場合(S162,N)、関連ツリー生成部77は、追加関連候補と同一の関連候補が関連ツリー候補内に存在するか否かの判断を行う(S163)。
同一の関連候補が関連ツリー候補内に存在する場合(S163,Y)、処理S161へ戻り、関連ツリー生成部77は、次の追加関連候補を選択する。一方、同一の関連候補が関連ツリー候補内に存在しない場合(S163,N)、関連ツリー生成部77は、追加関連候補における関連元項目とキー項目が同一の項目であるか否かの判断を行う(S164)。同一の項目である場合(S164,Y)、処理S173へ移行する。一方、同一の項目でない場合(S164,N)、関連ツリー生成部77は、関連ツリー候補において追加関連候補の関連元項目と関連先項目を検索し(S165)、追加関連候補が関連ツリー候補と整合するか否かの判断を行う(S166)。ここで、関連ツリー生成部77は、所定の関連ツリールールに従う場合、追加関連候補が関連ツリー候補と整合すると判断を行う。
関連ツリー候補と整合しない場合(S166、N)、処理S161へ戻り、関連ツリー生成部77は、次の追加関連候補を選択する。一方、関連ツリー候補と整合する場合(S166、Y)、関連ツリー生成部77は、関連ツリー候補において追加関連候補の関連先DBに対応するノードがなければ、関連ツリー候補において追加関連候補の関連先DBに対応するノードを作成する(S171)。
次に、関連ツリー生成部77は、関連ツリー候補において追加関連候補の関連元DBに対応するノードがなければ、関連ツリー候補において追加関連候補の関連元DBに対応するノードを作成する(S173)。次に、関連ツリー生成部77は、追加関連候補を関連ツリー候補中の対応する2つのノードに追加する(S175)。ここで、関連ツリー候補においてキー項目が同じノードは、グループ化され、1つのノードとなる。
次に、関連ツリー生成部77は、まだ追加関連候補として選択されていない関連候補があるか否かの判断を行う(S176)。まだ追加関連候補として選択されていない関連候補がある場合(S176,Y)、処理S161へ戻り、関連ツリー生成部77は、次の追加関連候補を選択する。一方、追加関連候補として選択されていない関連候補がない場合(S176,N)、関連ツリー評価部78は、関連ツリー候補を構成する関連候補の関連スコアの合計を関連ツリースコアとし、関連ツリー生成部77は、関連ツリー候補とその関連ツリースコアを保存する(S177)。
次に、関連ツリー生成部77は、まだ初期関連候補として選択されていない関連候補があるか否かの判断を行う(S178)。まだ追加関連候補として選択されていない関連候補がある場合(S178,Y)、処理S155へ戻り、関連ツリー生成部77は、次の初期関連候補を選択する。一方、初期関連候補として選択されていない関連候補がない場合(S178,N)、このフローは終了する。
この関連ツリー生成ステップによれば、適切な関連候補を接続して関連ツリー候補を生成することができる。
次に、処理S166における関連ツリールールについて説明する。
第1の関連ツリールールは、「親(関連先DBのノード)が同一のノード間の関連は許可されない。」である。図13は、本実施の形態に係る第1の関連ツリールールの一例を示す図である。ノードBからノードAへの関連が存在し、ノードBは関連元DBであり、ノードAは関連先DBである。また、ノードCからノードAへの関連が存在し、ノードCは関連元DBであり、ノードAは関連先DBである。つまり、ノードBとノードCがいずれもノードAを関連先とするため、ノードBとノードCの間の関連は許可されない。
第2の関連ツリールールは、「既に存在する関連と逆の関連は許可されない。」である。図14は、本実施の形態に係る第2の関連ツリールールの一例を示す図である。ノードCからノードAへの関連が存在し、ノードCは関連元DBであり、ノードAは関連先DBである。従って、ノードAを関連元DBとし、ノードCを関連先DBとする関連は許可されない。
これらの関連ツリールールを適用することにより、関連ツリー候補を生成する処理時間を短縮することができる。
図15は、本実施の形態に係る関連ツリー生成ステップの第1の例を示す図である。この関連ツリー候補において、受注DB80aをノードAとし、生産DB80bをノードBとし、手配DB80cをノードCとする。また、ノードB(子)からノードA(親)への関連候補が存在し、関連元項目は、生産DB80bの受注番号であり、関連先項目は、受注DB80aの受注番号である。また、ノードCからノードAへの関連候補が存在し、関連元項目は、手配DB80cの受注番号であり、関連先項目は、受注DB80aの受注番号である。
ここで、ノードAからノードCへの関連候補が存在し、関連元項目は、受注DB80aの地域であり、関連先項目は、手配DB80cの納品先である。しかし、第2の関連ツリールールにより、この関連候補がこの関連ツリー候補へ追加されることは許可されない。
図16は、本実施の形態に係る関連ツリー生成ステップの第2の例を示す図である。この関連ツリー候補において、受注DB80aをノードAとし、生産DB80bをノードBとし、手配DB80cをノードCとする。また、ノードBからノードAへの関連候補が存在し、関連元項目は、生産DB80bの受注番号であり、関連先項目は、受注DB80aの受注番号である。また、ノードCからノードAへの関連候補が存在し、関連元項目は、手配DB80cの受注番号であり、関連先項目は、受注DB80aの受注番号である。
ここで、ノードCからノードBへの関連候補が存在し、関連元項目は、手配DB80cの品番であり、関連先項目は、生産DB80bの品番である。しかし、第1の関連ツリールールにより、この関連候補がこの関連ツリー候補へ追加されることは許可されない。
図17は、本実施の形態に係る関連ツリー生成ステップの第3の例を示す図である。この関連ツリー候補において、受注DB80aをノードAとし、生産DB80bをノードBとし、手配DB80cをノードCとし、配送DB80dをノードDとする。また、ノードBからノードAへの関連候補が存在し、関連元項目は、生産DB80bの受注番号であり、関連先項目は、受注DB80aの受注番号である。また、ノードCからノードAへの関連候補が存在し、関連元項目は、手配DB80cの受注番号であり、関連先項目は、受注DB80aの受注番号である。また、ノードDからノードCへの関連候補が存在し、キー項目と関連元項目は、配送DB80dの手配番号であり、関連先項目は、手配DB80cの手配番号である。
また、ノードBからノードAへの関連候補の関連スコアは73であり、ノードCからノードAへの関連候補の関連スコアは60であり、ノードDからノードCへの関連候補の関連スコアは80である。従って、この関連ツリー候補の関連ツリースコアは213である。
次に、関連ツリー評価ステップの動作について説明する。
ここで、まず、関連ツリー評価部78は、関連ツリー候補を関連ツリースコアの高い順に表示する。関連ツリー候補が表示された画面において、1つの関連候補が選択されると、関連ツリー評価部78は、選択された関連候補について、キー項目の値、関連元項目の値、関連先項目の値と対応付けを示す矢印を表示する。
図18は、本実施の形態に係る関連ツリー評価ステップによる表示内容の第1の例を示す画面である。この例において、まず、関連ツリー評価部78は、図17の関連ツリー候補を表示する。次に、ユーザによりノードBからノードAへの関連候補を示す矢印が選択されると、関連ツリー評価部78は、選択された関連候補について、キー項目である生産DB80bの生産番号の値、その値が含まれたイベント中の関連元項目である生産DB80bの受注番号の値、その値に対応する関連先項目である受注DB80aにおける受注番号の値、関連元項目の値と関連先項目の値との対応付けを示す矢印がそれぞれ表示される。
図19は、本実施の形態に係る関連ツリー評価ステップによる表示内容の第2の例を示す画面である。この例において、まず、関連ツリー評価部78は、図17の関連ツリー候補を表示する。次に、ユーザによりノードCからノードAへの関連候補を示す矢印が選択されると、関連ツリー評価部78は、選択された関連候補について、キー項目である手配DB80cの手配番号の値、その値が含まれたイベント中の関連元項目である手配DB80cの受注番号の値、その値に対応する関連先項目である受注DB80aにおける受注番号の値、関連元項目の値と関連先項目の値との対応付けを示す矢印がそれぞれ表示される。
上述した表示により、ユーザは、関連ツリー候補を見ることができると共に、関連ツリー候補中の関連候補に含まれる具体的な値を見ることにより、関連候補が妥当であるか否かを確認することができる。
次に、関連ツリー評価部78は、関連ツリー候補の中から関連ツリースコアの最も高いものを関連ツリーとして選択し、関連ツリー記憶部79へ出力する。
なお、関連ツリー評価部78は、ユーザに対して、関連ツリー候補表示処理により表示された関連ツリー候補の確認の要求を行うようにしても良い。ここで、ユーザが関連ツリー候補、その中の関連元項目、キー項目、関連先項目の値を参照することにより、その関連ツリー候補が正しいと確認した場合、関連ツリー出力部73は、その関連ツリー候補を関連ツリーとして選択する。
この関連ツリー評価ステップによれば、関連ツリースコアが最も高い関連ツリー候補、またはユーザにより確認された関連ツリー候補を、関連ツリーとして出力することにより、信頼性の高い関連ツリーを得ることができる。
本実施の形態によれば、DB毎のスキーマの情報や業務知識を用いなくとも、データから複数のDB間の関連を決定し、図示することができる。
また、本発明を特許文献1のような業務トラッキング装置に適用することにより、従来はユーザによる複数のDB間の関連付けが必要であった業務プロセスのトラッキングを、自動的に行うことができる。また、本発明を、BPM(Business Process Management)ツールに適用することにより、従来はユーザによる記述の必要があったBPMモデルの作成や復元を、自動的に行うことができる。
なお、本実施の形態においては、関連ツリールールを用いて関連ツリーを生成したが、他のルールを用いることにより、ツリー上ではない関連構造を生成しても良い。また、本実施の形態におけるデータベース分析装置は、関連ツリースコアやユーザによる選択に基づいて複数の関連からなる関連ツリーを出力するが、関連スコアやユーザによる選択に基づいて単一の関連を出力するようにしても良い。
また、本実施の形態に係るデータベース分析装置は、情報処理装置に容易に適用することができ、情報処理装置の性能をより高めることができる。ここで、情報処理装置には、例えばサーバ、PC(Personal Computer)等が含まれ得る。
更に、データベース分析装置を構成するコンピュータにおいて上述した各ステップを実行させるプログラムを、データベース分析プログラムとして提供することができる。上述したプログラムは、コンピュータにより読取り可能な記録媒体に記憶させることによって、データベース分析装置を構成するコンピュータに実行させることが可能となる。ここで、上記コンピュータにより読取り可能な記録媒体としては、ROMやRAM等のコンピュータに内部実装される内部記憶装置、CD−ROMやフレキシブルディスク、DVDディスク、光磁気ディスク、ICカード等の可搬型記憶媒体や、コンピュータプログラムを保持するデータベース、或いは、他のコンピュータ並びにそのデータベースや、更に回線上の伝送媒体をも含むものである。
(付記1) 複数のテーブルの分析をコンピュータに実行させるデータベース分析プログラムであって、
前記テーブルにおける項目毎に、該項目中の値毎の出現回数に基づく値である項目スコアを算出する項目評価ステップと、
前記複数のテーブルの中から互いに異なるテーブルを関連元テーブル及び関連先テーブルとして選択し、前記関連元テーブル中の項目である関連元項目と前記関連先テーブル中の項目である関連先項目とを選択し、前記関連元項目と前記関連先項目の組み合わせを関連として生成する関連生成ステップと、
前記関連生成ステップにより生成された関連毎に、前記関連先項目における前記関連元項目中の値毎の出現回数と前記関連元項目の項目スコアと前記関連先項目の項目スコアとに基づく値である関連スコアを算出する関連評価ステップと
をコンピュータに実行させるデータベース分析プログラム。
(付記2) 付記1に記載のデータベース分析プログラムにおいて、
前記関連生成ステップは、更に前記関連元テーブル中の項目であるキー項目を選択し、前記関連元項目と前記関連先項目とキー項目の組み合わせを関連として生成し、
前記関連評価ステップは、前記関連生成ステップにより生成された関連について、前記関連先項目における前記関連元項目中の値毎の出現回数と前記関連元項目の項目スコアと前記関連先項目の項目スコアと前記キー項目の項目スコアとに基づく関連スコアを算出することを特徴とするデータベース分析プログラム。
(付記3) 付記1または付記2に記載のデータベース分析プログラムにおいて、
前記項目中の値毎の出現回数が小さいほど前記項目スコアは小さく、
前記関連生成ステップは、前記項目スコアが所定の項目スコア閾値より小さい項目から前記関連元項目を選択することを特徴とするデータベース分析プログラム。
(付記4) 付記1乃至付記3のいずれかに記載のデータベース分析プログラムにおいて、
前記関連先項目における前記関連元項目中の値毎の出現回数が1に近いほど前記関連スコアは大きく、前記関連に含まれる各項目の項目スコアと前記キー項目の項目スコアが小さいほど前記関連スコアは大きく、
前記関連評価ステップは、更に前記関連スコアが大きい順に所定の数の関連を選択することを特徴とするデータベース分析プログラム。
(付記5) 付記4に記載のデータベース分析プログラムにおいて、
更に、前記関連評価ステップにより選択された複数の関連の組み合わせを選択し、該組み合わせを関連構造として生成する関連構造生成ステップをコンピュータに実行させることを特徴とするデータベース分析プログラム。
(付記6) 付記5に記載のデータベース分析プログラムにおいて、
前記関連構造生成ステップは、所定のルールに基づいて前記複数の関連の組み合わせを選択することを特徴とするデータベース分析プログラム。
(付記7) 付記5または付記6に記載のデータベース分析プログラムにおいて、
更に、前記関連構造生成ステップにより生成された関連構造に含まれる関連の関連スコアに基づく値である関連構造スコアを算出する関連構造評価ステップをコンピュータに実行させることを特徴とするデータベース分析プログラム。
(付記8) 付記7に記載のデータベース分析プログラムにおいて、
前記関連構造評価ステップは、前記関連構造スコアが最も大きい関連構造を選択することを特徴とするデータベース分析プログラム。
(付記9) 付記7または付記8に記載のデータベース分析プログラムにおいて、
前記関連構造評価ステップは、前記関連構造スコアが大きい順に所定の数の前記関連構造を表示することを特徴とするデータベース分析プログラム。
(付記10) 付記7乃至付記9のいずれかに記載のデータベース分析プログラムにおいて、
前記関連構造評価ステップは、前記関連構造中の関連に含まれる項目の値を表示することを特徴とするデータベース分析プログラム。
(付記11) 複数のテーブルの分析を行うデータベース分析装置であって、
前記テーブルにおける項目毎に、該項目中の値毎の出現回数に基づく値である項目スコアを算出する項目評価部と、
前記複数のテーブルの中から互いに異なるテーブルを関連元テーブル及び関連先テーブルとして選択し、前記関連元テーブル中の項目である関連元項目と前記関連先テーブル中の項目である関連先項目とを選択し、前記関連元項目と前記関連先項目の組み合わせを関連として生成する関連生成部と、
前記関連生成部により生成された関連毎に、前記関連先項目における前記関連元項目中の値毎の出現回数と前記関連元項目の項目スコアと前記関連先項目の項目スコアとに基づく値である関連スコアを算出する関連評価部と
を備えるデータベース分析装置。
(付記12) 付記11に記載のデータベース分析装置において、
前記関連生成部は、更に前記関連元テーブル中の項目であるキー項目を選択し、前記関連元項目と前記関連先項目とキー項目の組み合わせを関連として生成し、
前記関連評価部は、前記関連生成部により生成された関連について、前記関連先項目における前記関連元項目中の値毎の出現回数と前記関連元項目の項目スコアと前記関連先項目の項目スコアと前記キー項目の項目スコアとに基づく関連スコアを算出することを特徴とするデータベース分析装置。
(付記13) 付記11または付記12に記載のデータベース分析装置において、
前記項目中の値毎の出現回数が小さいほど前記項目スコアは小さく、
前記関連生成部は、前記項目スコアが所定の項目スコア閾値より小さい項目から前記関連元項目を選択することを特徴とするデータベース分析装置。
(付記14) 付記11乃至付記13のいずれかに記載のデータベース分析装置において、
前記関連先項目における前記関連元項目中の値毎の出現回数が1に近いほど前記関連スコアは大きく、前記関連に含まれる各項目の項目スコアと前記キー項目の項目スコアが小さいほど前記関連スコアは大きく、
前記関連評価部は、更に前記関連スコアが大きい順に所定の数の関連を選択することを特徴とするデータベース分析装置。
(付記15) 付記14に記載のデータベース分析装置において、
更に、前記関連評価部により選択された複数の関連の組み合わせを選択し、該組み合わせを関連構造として生成する関連構造生成部を備えることを特徴とするデータベース分析装置。
(付記16) 付記15に記載のデータベース分析装置において、
前記関連構造生成部は、所定のルールに基づいて前記複数の関連の組み合わせを選択することを特徴とするデータベース分析装置。
(付記17) 付記15または付記16に記載のデータベース分析装置において、
更に、前記関連構造生成部により生成された関連構造に含まれる関連の関連スコアに基づく値である関連構造スコアを算出する関連構造評価部を備えることを特徴とするデータベース分析装置。
(付記18) 付記17に記載のデータベース分析装置において、
前記関連構造評価部は、前記関連構造スコアが最も大きい関連構造を選択することを特徴とするデータベース分析装置。
(付記19) 付記17または付記18に記載のデータベース分析装置において、
前記関連構造評価部は、前記関連構造スコアが大きい順に所定の数の前記関連構造を表示することを特徴とするデータベース分析装置。
(付記20) 複数のテーブルの分析を行うデータベース分析プログラムであって、
前記テーブルにおける項目毎に、該項目中の値毎の出現回数に基づく値である項目スコアを算出する項目評価ステップと、
前記複数のテーブルの中から互いに異なるテーブルを関連元テーブル及び関連先テーブルとして選択し、前記関連元テーブル中の項目である関連元項目と前記関連先テーブル中の項目である関連先項目とを選択し、前記関連元項目と前記関連先項目の組み合わせを関連として生成する関連生成ステップと、
前記関連生成ステップにより生成された関連毎に、前記関連先項目における前記関連元項目中の値毎の出現回数と前記関連元項目の項目スコアと前記関連先項目の項目スコアとに基づく値である関連スコアを算出する関連評価ステップと
を実行するデータベース分析方法。
本実施の形態に係るデータベース分析装置の構成の一例を示すブロック図である。 本実施の形態に係るデータベース分析装置の動作の一例を示すフローチャートである。 本実施の形態に係る受注DB80aの内容の一例を示すテーブルである。 本実施の形態に係る生産DB80bの内容の一例を示すテーブルである。 本実施の形態に係る手配DB80cの内容の一例を示すテーブルである。 本実施の形態に係る配送DB80dの内容の一例を示すテーブルである。 本実施の形態に係る重複度算出ステップの一例を示す表である。 本実施の形態に係る関連度算出ステップの動作の一例を示すフローチャートである。 本実施の形態に係る関連度算出ステップの第1の例を示す表である。 本実施の形態に係る関連度算出ステップの第2の例を示す表である。 本実施の形態に係る関連生成評価ステップの動作の一例を示すフローチャートである。 本実施の形態に係る関連ツリー生成ステップの動作の一例を示すフローチャートである。 本実施の形態に係る第1の関連ツリールールの一例を示す図である。 本実施の形態に係る第2の関連ツリールールの一例を示す図である。 本実施の形態に係る関連ツリー生成ステップの第1の例を示す図である。 本実施の形態に係る関連ツリー生成ステップの第2の例を示す図である。 本実施の形態に係る関連ツリー生成ステップの第3の例を示す図である。 本実施の形態に係る関連ツリー評価ステップによる表示内容の第1の例を示す画面である。 本実施の形態に係る関連ツリー評価ステップによる表示内容の第2の例を示す画面である。
符号の説明
70 データベース分析装置、71 イベント収集部、72 重複度算出部、73 関連度算出部、74 関連生成部、75 関連評価部、77 関連ツリー生成部、78 関連ツリー評価部、79 関連ツリー記憶部、80a 受注DB、80b 生産DB、80c 手配DB、80d 配送DB。

Claims (5)

  1. 複数のテーブルの分析をコンピュータに実行させるデータベース分析プログラムであって、
    前記テーブルにおける項目毎に、該項目中の値毎の出現回数に基づく値である項目スコアを算出する項目評価ステップと、
    前記複数のテーブルの中から互いに異なるテーブルを関連元テーブル及び関連先テーブルとして選択し、前記関連元テーブル中の項目である関連元項目と前記関連先テーブル中の項目である関連先項目とを選択し、前記関連元項目と前記関連先項目の組み合わせを関連として生成する関連生成ステップと、
    前記関連生成ステップにより生成された関連毎に、前記関連先項目における前記関連元項目中の値毎の出現回数と前記関連元項目の項目スコアと前記関連先項目の項目スコアとに基づく値である関連スコアを算出する関連評価ステップと
    をコンピュータに実行させるデータベース分析プログラム。
  2. 請求項1に記載のデータベース分析プログラムにおいて、
    更に、前記関連評価ステップにより選択された複数の関連の組み合わせを選択し、該組み合わせを関連構造として生成する関連構造生成ステップをコンピュータに実行させることを特徴とするデータベース分析プログラム。
  3. 請求項2に記載のデータベース分析プログラムにおいて、
    更に、前記関連構造生成ステップにより生成された関連構造に含まれる関連の関連スコアに基づく値である関連構造スコアを算出する関連構造評価ステップをコンピュータに実行させることを特徴とするデータベース分析プログラム。
  4. 複数のテーブルの分析を行うデータベース分析装置であって、
    前記テーブルにおける項目毎に、該項目中の値毎の出現回数に基づく値である項目スコアを算出する項目評価部と、
    前記複数のテーブルの中から互いに異なるテーブルを関連元テーブル及び関連先テーブルとして選択し、前記関連元テーブル中の項目である関連元項目と前記関連先テーブル中の項目である関連先項目とを選択し、前記関連元項目と前記関連先項目の組み合わせを関連として生成する関連生成部と、
    前記関連生成部により生成された関連毎に、前記関連先項目における前記関連元項目中の値毎の出現回数と前記関連元項目の項目スコアと前記関連先項目の項目スコアとに基づく値である関連スコアを算出する関連評価部と
    を備えるデータベース分析装置。
  5. 複数のテーブルの分析を行うデータベース分析プログラムであって、
    前記テーブルにおける項目毎に、該項目中の値毎の出現回数に基づく値である項目スコアを算出する項目評価ステップと、
    前記複数のテーブルの中から互いに異なるテーブルを関連元テーブル及び関連先テーブルとして選択し、前記関連元テーブル中の項目である関連元項目と前記関連先テーブル中の項目である関連先項目とを選択し、前記関連元項目と前記関連先項目の組み合わせを関連として生成する関連生成ステップと、
    前記関連生成ステップにより生成された関連毎に、前記関連先項目における前記関連元項目中の値毎の出現回数と前記関連元項目の項目スコアと前記関連先項目の項目スコアとに基づく値である関連スコアを算出する関連評価ステップと
    を実行するデータベース分析方法。
JP2006197294A 2006-07-19 2006-07-19 データベース分析プログラム、データベース分析装置、データベース分析方法 Expired - Fee Related JP4997856B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2006197294A JP4997856B2 (ja) 2006-07-19 2006-07-19 データベース分析プログラム、データベース分析装置、データベース分析方法
US11/591,967 US7818351B2 (en) 2006-07-19 2006-11-01 Apparatus and method for detecting a relation between fields in a plurality of tables
EP07112564A EP1881427A1 (en) 2006-07-19 2007-07-16 Database analysis program, database analysis apparatus, and database analysis method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006197294A JP4997856B2 (ja) 2006-07-19 2006-07-19 データベース分析プログラム、データベース分析装置、データベース分析方法

Publications (2)

Publication Number Publication Date
JP2008027072A true JP2008027072A (ja) 2008-02-07
JP4997856B2 JP4997856B2 (ja) 2012-08-08

Family

ID=38616309

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006197294A Expired - Fee Related JP4997856B2 (ja) 2006-07-19 2006-07-19 データベース分析プログラム、データベース分析装置、データベース分析方法

Country Status (3)

Country Link
US (1) US7818351B2 (ja)
EP (1) EP1881427A1 (ja)
JP (1) JP4997856B2 (ja)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010020634A (ja) * 2008-07-11 2010-01-28 Fujitsu Ltd 業務フロー処理プログラム、方法及び装置
JP2010271806A (ja) * 2009-05-20 2010-12-02 Fujitsu Ltd 業務フロー処理プログラム、方法及び装置
JP2012064053A (ja) * 2010-09-16 2012-03-29 Toshiba Tec Corp ワークフロー管理装置、及びワークフロー管理プログラム
US8712817B2 (en) 2008-03-27 2014-04-29 Fujitsu Limited Process information structuring support method
JP2015534682A (ja) * 2012-09-25 2015-12-03 ビズダイナミクス・プロプライエタリー・リミテッドVizdynamics Pty Ltd デジタルトラフィックメトリックを処理するためのシステムおよび方法
JP2017076286A (ja) * 2015-10-15 2017-04-20 富士通株式会社 検査装置、検査プログラムおよび検査方法
JP2017188137A (ja) * 2016-03-31 2017-10-12 スマートインサイト株式会社 異種データソース混在環境におけるフィールド間の関係性の自動的発見のための方法、プログラム、および、システム
JP2017207927A (ja) * 2016-05-18 2017-11-24 富士通株式会社 評価プログラム、評価方法、及び情報処理装置
JP2019082816A (ja) * 2017-10-30 2019-05-30 富士通株式会社 情報処理装置、情報処理方法およびプログラム
JP2019219771A (ja) * 2018-06-15 2019-12-26 富士ゼロックス株式会社 情報処理装置及びプログラム
JP2021002292A (ja) * 2019-06-24 2021-01-07 富士通株式会社 データ処理装置、データ処理方法及びプログラム

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008032393A1 (en) * 2006-09-15 2008-03-20 Fujitsu Limited Information processing method and device for work process analysis
WO2009098766A1 (ja) 2008-02-07 2009-08-13 Fujitsu Limited 業務フロー処理プログラム、方法及び装置
JP5024451B2 (ja) * 2008-07-11 2012-09-12 富士通株式会社 業務フロー分析プログラム、方法及び装置
JP5251623B2 (ja) * 2009-03-10 2013-07-31 富士通株式会社 フロー比較処理方法及び装置
US8321435B2 (en) 2009-08-12 2012-11-27 Apple Inc. Quick find for data fields
US20190005086A1 (en) * 2017-07-02 2019-01-03 Equalum Ltd. System and method for system for determining database relations based on data monitoring
KR102033151B1 (ko) * 2017-11-10 2019-10-16 (주)위세아이텍 빅데이터 분석을 위한 데이터 병합 장치 및 방법
CN110909003B (zh) * 2019-11-25 2022-06-10 车智互联(北京)科技有限公司 一种创建数据表的方法及计算设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01194028A (ja) * 1988-01-29 1989-08-04 Hitachi Ltd データベース処理方法および装置
JPH11238073A (ja) * 1998-02-23 1999-08-31 Mitsubishi Electric Corp 属性圧縮装置および方法
JP2000276386A (ja) * 1999-03-25 2000-10-06 Hitachi Ltd リレーショナルデータベースの関連を利用したプログラム生成方法及び装置
JP2005250699A (ja) * 2004-03-02 2005-09-15 Toshiba Corp 階層型データベース装置および階層型データベース装置における製品選定方法およびプログラム
JP2006099236A (ja) * 2004-09-28 2006-04-13 Toshiba Corp 分類支援装置、分類支援方法及び分類支援プログラム

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5615367A (en) * 1993-05-25 1997-03-25 Borland International, Inc. System and methods including automatic linking of tables for improved relational database modeling with interface
US6513041B2 (en) * 1998-07-08 2003-01-28 Required Technologies, Inc. Value-instance-connectivity computer-implemented database
US6631380B1 (en) * 1999-07-29 2003-10-07 International Business Machines Corporation Counting and displaying occurrences of data records
US7031969B2 (en) * 2002-02-20 2006-04-18 Lawrence Technologies, Llc System and method for identifying relationships between database records
CA2374298A1 (en) * 2002-03-01 2003-09-01 Ibm Canada Limited-Ibm Canada Limitee Computation of frequent data values
JP4287234B2 (ja) 2003-10-03 2009-07-01 富士通株式会社 業務プロセストラッキング装置,業務プロセストラッキング方法,業務プロセストラッキングプログラム,業務プロセストラッキングプログラムを記録した記録媒体

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01194028A (ja) * 1988-01-29 1989-08-04 Hitachi Ltd データベース処理方法および装置
JPH11238073A (ja) * 1998-02-23 1999-08-31 Mitsubishi Electric Corp 属性圧縮装置および方法
JP2000276386A (ja) * 1999-03-25 2000-10-06 Hitachi Ltd リレーショナルデータベースの関連を利用したプログラム生成方法及び装置
JP2005250699A (ja) * 2004-03-02 2005-09-15 Toshiba Corp 階層型データベース装置および階層型データベース装置における製品選定方法およびプログラム
JP2006099236A (ja) * 2004-09-28 2006-04-13 Toshiba Corp 分類支援装置、分類支援方法及び分類支援プログラム

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8712817B2 (en) 2008-03-27 2014-04-29 Fujitsu Limited Process information structuring support method
JP2010020634A (ja) * 2008-07-11 2010-01-28 Fujitsu Ltd 業務フロー処理プログラム、方法及び装置
JP2010271806A (ja) * 2009-05-20 2010-12-02 Fujitsu Ltd 業務フロー処理プログラム、方法及び装置
JP2012064053A (ja) * 2010-09-16 2012-03-29 Toshiba Tec Corp ワークフロー管理装置、及びワークフロー管理プログラム
JP2015534682A (ja) * 2012-09-25 2015-12-03 ビズダイナミクス・プロプライエタリー・リミテッドVizdynamics Pty Ltd デジタルトラフィックメトリックを処理するためのシステムおよび方法
JP2017076286A (ja) * 2015-10-15 2017-04-20 富士通株式会社 検査装置、検査プログラムおよび検査方法
JP2017188137A (ja) * 2016-03-31 2017-10-12 スマートインサイト株式会社 異種データソース混在環境におけるフィールド間の関係性の自動的発見のための方法、プログラム、および、システム
JP2017207927A (ja) * 2016-05-18 2017-11-24 富士通株式会社 評価プログラム、評価方法、及び情報処理装置
JP2019082816A (ja) * 2017-10-30 2019-05-30 富士通株式会社 情報処理装置、情報処理方法およびプログラム
JP7003574B2 (ja) 2017-10-30 2022-01-20 富士通株式会社 情報処理装置、情報処理方法およびプログラム
JP2019219771A (ja) * 2018-06-15 2019-12-26 富士ゼロックス株式会社 情報処理装置及びプログラム
JP7176243B2 (ja) 2018-06-15 2022-11-22 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム
JP2021002292A (ja) * 2019-06-24 2021-01-07 富士通株式会社 データ処理装置、データ処理方法及びプログラム
JP7322544B2 (ja) 2019-06-24 2023-08-08 富士通株式会社 データ処理装置、データ処理方法及びプログラム

Also Published As

Publication number Publication date
JP4997856B2 (ja) 2012-08-08
US7818351B2 (en) 2010-10-19
EP1881427A1 (en) 2008-01-23
US20080021867A1 (en) 2008-01-24

Similar Documents

Publication Publication Date Title
JP4997856B2 (ja) データベース分析プログラム、データベース分析装置、データベース分析方法
JP6357161B2 (ja) データストレージシステムにおけるデータソースを特徴付けるための方法
Silverstein et al. Scalable techniques for mining causal structures
CN104756107B (zh) 采用位置信息剖析数据
US8332366B2 (en) System and method for automatic weight generation for probabilistic matching
WO2017216980A1 (ja) 機械学習装置
US7882128B2 (en) Data mining by determining patterns in input data
US9792388B2 (en) Pattern extraction apparatus and control method therefor
CN110442516B (zh) 信息处理方法、设备及计算机可读存储介质
US20160307113A1 (en) Large-scale batch active learning using locality sensitive hashing
US20060179050A1 (en) Probabilistic model for record linkage
US20240168963A1 (en) Mining patterns in a high-dimensional sparse feature space
AU2014201516A1 (en) Resolving similar entities from a transaction database
JP2007287139A (ja) 消費者に製品を推奨するためのコンピュータ実施方法及びシステム
KR20100106464A (ko) 데이터 클러스터와 유의어의 탐색과 수정에 대한 방법 및 시스템
TW201421395A (zh) 用以遞迴檢閱網際網路及其他來源以識別、收集、管理、判定及鑑定商業身分與相關資料之系統及方法
US11714869B2 (en) Automated assistance for generating relevant and valuable search results for an entity of interest
CN107844533A (zh) 一种智能问答系统及分析方法
CN107077413A (zh) 数据驱动的测试框架
Thabtah et al. A new Classification based on Association Algorithm
Jiang et al. Holistic primary key and foreign key detection
CN110659282A (zh) 数据路由的构建方法、装置、计算机设备和存储介质
US20160063394A1 (en) Computing Device Classifier Improvement Through N-Dimensional Stratified Input Sampling
US8250024B2 (en) Search relevance in business intelligence systems through networked ranking
JP5954742B2 (ja) 文書を検索する装置及び方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20081117

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110722

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110802

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111003

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120417

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120430

R150 Certificate of patent or registration of utility model

Ref document number: 4997856

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150525

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees