JP4832523B2 - 業務プロセス分析のための情報処理方法及び装置 - Google Patents

業務プロセス分析のための情報処理方法及び装置 Download PDF

Info

Publication number
JP4832523B2
JP4832523B2 JP2008534195A JP2008534195A JP4832523B2 JP 4832523 B2 JP4832523 B2 JP 4832523B2 JP 2008534195 A JP2008534195 A JP 2008534195A JP 2008534195 A JP2008534195 A JP 2008534195A JP 4832523 B2 JP4832523 B2 JP 4832523B2
Authority
JP
Japan
Prior art keywords
field
event
data
probability
processing target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2008534195A
Other languages
English (en)
Other versions
JPWO2008032393A1 (ja
Inventor
旭 川村
佳秀 野村
健一 小林
剛 金井
裕貴 原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of JPWO2008032393A1 publication Critical patent/JPWO2008032393A1/ja
Application granted granted Critical
Publication of JP4832523B2 publication Critical patent/JP4832523B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Operations Research (AREA)
  • Marketing (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Game Theory and Decision Science (AREA)
  • Data Mining & Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、業務プロセス分析のためのデータ生成技術に関する。
業務プロセス・リエンジニアリング(BPR:Business Process Re-engineering)のために現在企業で運用中の業務システムの分析を行う必要がある。このため、例えば特開2005−115494号公報記載のような技術が用いられる。この公報には、以下のような事項が開示されている。
すなわち、(1)異なる業務システムに配置される各アプリケーションの実行状態を示す情報であるイベントデータを、各アプリケーションに応じた方法で収集し、イベントキューにキューイングする。なお、この公報でイベントとは、業務システム内で、ある業務が実行されたことを示すものであり、業務の開始、終了時間、および関連属性を含んだデータである。イベントデータは、各業務システムに配置されたイベント抽出定義に従って、業務システム毎のイベントデータ抽出用のアプリケーションによって抽出される。各業務システム内で、抽出されたイベント情報を共通のXML(eXtensible Markup Language)形式に変換し、イベントデータを管理するイベント管理装置のイベントキューにキューイングする。このキューイングには、例えばJMS(Java(登録商標) Message Service)等が利用される。
(2)イベント管理装置内で、イベントキュー内にキューイングされたイベント情報について、業務データ毎にまとめ、業務データ間を関連付けてイベント管理データベース(DB)内に蓄積する。この公報で、業務データとは、あるまとまった単位の業務の間で共有されるデータを意味する。(3)入力された検索条件(例えば、イベント発生期間、関連属性等)に基づいて、業務データの絞込みを行う。(4)絞り込まれた業務データに関連するデータをツリーで展開して表示し、任意のデータからの処理の追跡を行う。(5)ツリーで展開された業務データに関連するイベントを検索し、このイベントに関連する業務をトラッキングビューで図示して、現在の業務の流れの実行状況を表示する。この公報で、トラッキングとは、あらかじめ定義された業務システム間を跨ぐ業務全体の流れである業務プロセスのうち、どの業務が実行され、どの業務が実行されていないかを確認する手法をいう。
このような公報記載の技術では、業務システム毎にイベントデータ抽出用のアプリケーションを導入する必要があり、業務システムに改変を加えるか又は業務実行に不要な負荷を与えることとなる。
特開2005−115494号公報
しかしながら、業務システムに改変を加えたり、業務実行に不要な負荷を与えることは、現在使用中の業務システムに悪影響を及ぼすため、たとえBPRのためといっても避けるべきである。
従って、本発明の目的は、現在使用中の業務システムに悪影響を及ぼすことなく、業務プロセス分析のためのデータを生成するための技術を提供することである。
本発明の第1の態様に係る、業務プロセス分析のための情報処理方法は、解析対象システムにより生成され且つデータ格納部に格納されているレコードにおける処理対象フィールドを特定するステップと、データ格納部に格納されている、レコードにおける各フィールドの定義データを用いて、当該処理対象フィールドがイベントのタイムスタンプである蓋然性を表すデータを特定する蓋然性データ特定ステップとを含む。
業務システムに悪影響を与えることなく既に存在するデータから、イベントのタイムスタンプ、すなわちイベントの発生日時について可能性を表すデータ(例えば、確度やA、B、Cといったランク付け)を特定することができるようになる。すなわち、業務プロセス分析に必要なイベントに関するデータを特定できるようになる。
なお、上で述べた定義データが、データベースのスキーマ情報である場合もある。その場合、上で述べた蓋然性データ特定ステップが、スキーマ情報から、処理対象フィールドのデータ型を特定するステップと、処理対象フィールドのデータ型が、タイムスタンプを表すデータ型であるか判断するステップとを含むようにしてもよい。
また、上で述べた定義データが、フィールド名を含む場合もある。その場合、上で述べた蓋然性データ特定ステップが、処理対象フィールドのフィールド名に含まれる文字列に基づき、イベントのタイムスタンプである蓋然性を表すデータを特定するステップを含むようにしてもよい。定義データは、スキーマ情報の場合もあれば、CSV(Comma Separated Values)データのラベルデータであってもよい。例えば、タイムスタンプであればフィールド名の末尾などに徴を有するためである。
さらに、上で述べた蓋然性データ特定ステップが、処理対象フィールドのフィールド値に基づき、イベントのタイムスタンプである蓋然性を表すデータを特定するステップを含むようにしてもよい。タイムスタンプであるフィールド値の形式は、例えばYYYY/MM/DD hh:mm:ssといった特徴のある文字列の形式を有するためである。
さらに、処理対象フィールドのフィールド名に含まれる文字列にいて、時刻を表す文字列、日を表す文字列、将来の時期を表す文字列の順番にてより低い上記蓋然性を表すデータが特定されるようにしてもよい。将来の時刻を表す文字列は、例えば納期、予定といった文字列であって、イベントの発生日時を特定する目的においてはタイムスタンプである蓋然性は低く判断されるものである。
また、上で述べた蓋然性データ特定ステップが、データ格納部に格納されている、レコードにおける各フィールドの定義データ及びフィールド値から、処理対象フィールドの該当データを特定するステップと、予め定められた、フィールド名又はフィールド値の特性と対応する蓋然性を表すデータとを格納するスコア表を参照して、処理対象フィールドの該当データに対応する上記蓋然性を表すデータを特定するステップとを含む。スコア表において上記蓋然性を表すデータは具体的な数値の場合もあるが、定のレベル分けに従ってレベルを特定するようにしてもよい。
なお、本発明の第1の態様においては、イベントのタイムスタンプである蓋然性を表すデータを、各フィールドに対応させてユーザに提示するステップをさらに含むようにしてもよい。この提示によって、ユーザはいずれのフィールドをイベントのタイムスタンプのフィールドであるかを最終的に特定するようにしてもよい。この場合、イベントのタイムスタンプであるフィールドのフィールド値を収集して、後の処理に利用するようにしてもよい。なお、最も蓋然性の高いフィールドを自動的に抽出して、当該フィールド名又はフィールド値若しくはその両方を提示するようにしてもよい。さらに、イベントのタイムスタンプは、他の手法で特定されるイベント名、イベントID、存在する場合には関連IDなどと共にイベント候補データとしてイベント候補データ格納部に格納される場合もある。また、イベント候補データからID間の関連付けが行われてイベントデータが生成され、イベントデータ格納部に格納される場合もある。
本発明の第2の態様に係る、業務プロセス分析のための情報処理方法は、解析対象システムにより生成され且つデータ格納部に格納されているレコードにおける処理対象フィールドを特定するステップと、データ格納部に格納されている、処理対象フィールドのフィールド値の特性を特定するステップと、処理対象フィールドのフィールド値の特性が予め定められた特性を有するか否かに基づき、当該処理対象フィールドがイベントのイベントIDである蓋然性を表すデータを特定するステップとを含む。
業務システムに悪影響を与えることなく既に存在するデータから、イベントのイベントID、すなわちイベントの識別データについて可能性を表すデータ(例えば、確度やA、B、Cといったランク付け)を特定することができるようになる。すなわち、業務プロセス分析に必要なイベントに関するデータを特定できるようになる。
また、本発明の第2の態様において、イベントのイベントIDである蓋然性を表すデータが否定を表すデータでない場合、データ格納部に格納されている、レコードにおける各フィールドの定義データを用いて、当該処理対象フィールドがイベントのイベントIDである蓋然性を表すデータを特定する第2蓋然性データ特定ステップをさらに含むようにしてもよい。例えば処理対象フィールドのフィールド値の特性が予め定められた特性を有しない場合には、フィールドの定義データに基づきさらに判断するものである。
なお、上で述べた定義データが、各フィールドのデータ型のデータを含む場合もある。また、上で述べた定義データが、キー設定データを含む場合もある。スキーマ情報を入手できる場合には、例えば主キーであるか否かについてのデータも含まれるので、当該データを用いればよい。
また、上で述べた第2蓋然性データ特定ステップが、データ格納部に格納されている、レコードにおける各フィールドの定義データから、処理対象フィールドの該当データを特定するステップと、予め定められた、フィールドのデータ型又はフィールドの特性と対応する蓋然性を表すデータとを格納するスコア表を参照して、処理対象フィールドの該当データに対応する蓋然性を表すデータを特定するステップとを含むようにしてもよい。スコア表において上記蓋然性を表すデータは具体的な数値の場合もあるが、定のレベル分けに従ってレベルを特定するようにしてもよい。また、スコア表に該当する項目がない場合には、予め定められた値を設定するようにしてもよい。
さらに、本発明の第2の態様においては、イベントのイベントIDである蓋然性を表すデータを、各フィールドに対応させてユーザに提示するステップをさらに含むようにしてもよい。この提示によって、ユーザはいずれのフィールドをイベントのイベントIDのフィールドであるかを最終的に特定するようにしてもよい。この場合、イベントのイベントIDであるフィールドのフィールド値を収集して、後の処理に利用するようにしてもよい。なお、最も蓋然性の高いフィールドを自動的に抽出して、当該フィールド名又はフィールド値若しくはその両方を提示するようにしてもよい。さらに、イベントIDは、他の手法で特定されるイベント名、タイムスタンプ、存在する場合には関連IDなどと共にイベント候補データとしてイベント候補データ格納部に格納される場合もある。また、イベント候補データからID間の関連付けが行われてイベントデータが生成され、イベントデータ格納部に格納される場合もある。
さらに、上で述べた第1蓋然性データ特定ステップが、処理対象フィールドのフィールド値が全てのレコードで一意であるか否かを判断するステップと、処理対象フィールドのフィールド値にNULLが含まれているか判断するステップとを含むようにしてもよい。イベントIDのフィールド値の特性として、フィールド値が全てのレコードで一意であり、NULLが含まれないという特性があるためである。
本発明の第3の態様に係る、業務プロセス分析のための情報処理方法は、解析対象システムにより生成され且つデータ格納部に格納されているレコードにおける処理対象フィールドを特定するステップと、データ格納部に格納されている、処理対象フィールドのフィールド値の特性を特定するステップと、処理対象フィールドのフィールド値の特性が予め定められた特性を有するか否かに基づき、当該処理対象フィールドがイベントの関連IDである蓋然性を表すデータを特定するステップとを含む。
業務システムに悪影響を与えることなく既に存在するデータから、イベントの関連ID、すなわちイベントIDに関連するIDである可能性を表すデータ(例えば、確度やA、B、Cといったランク付け)を特定することができるようになる。すなわち、業務プロセス分析に必要なイベントに関するデータを特定できるようになる。
また、イベントの関連IDである蓋然性を表すデータが否定を表すデータでない場合、データ格納部に格納されている、レコードにおける各フィールドの定義データを用いて、当該処理対象フィールドがイベントの関連IDである蓋然性を表すデータを特定する第2蓋然性データ特定ステップをさらに含むようにしてもよい。例えば処理対象フィールドのフィールド値の特性が予め定められた特性を有しない場合には、フィールドの定義データに基づきさらに判断するものである。
なお、上で述べた定義データが、各フィールドのデータ型のデータを含む場合もある。また、上で述べた定義データが、キー設定データを含む場合もある。スキーマ情報を入手することができ、例えば副キーという指定があればそれを用いることができる。
また、上で述べた第2蓋然性データ特定ステップが、データ格納部に格納されている、レコードにおける各フィールドの定義データから、処理対象フィールドの該当データを特定するステップと、予め定められた、フィールドのデータ型又はフィールドの特性と対応する蓋然性を表すデータとを格納するスコア表を参照して、処理対象フィールドの該当データに対応する上記蓋然性を表すデータを特定するステップとを含むようにしてもよい。スコア表において上記蓋然性を表すデータは具体的な数値の場合もあるが、その数値を所定のレベル分けに従ってレベルを特定するようにしてもよい。また、スコア表に該当する項目がない場合には、予め定められた値又はレベルを設定するようにしてもよい。また、複数の項目に該当する場合には、例えば高い値を有する項目又は中央値からはずれた値を採用するようにしてもよい。
さらに、本発明の第3の態様においては、イベントの関連IDである蓋然性を表すデータを、各フィールドに対応させてユーザに提示するステップをさらに含むようにしてもよい。この提示によって、ユーザはいずれのフィールドをイベントの関連IDのフィールドであるかを最終的に特定するようにしてもよい。この場合、イベントの関連IDであるフィールドのフィールド値を収集して、後の処理に利用するようにしてもよい。なお、最も蓋然性の高いフィールドを自動的に抽出して、当該フィールド名又はフィールド値若しくはその両方を提示するようにしてもよい。さらに、他の手法で特定されるイベント名、タイムスタンプ、イベントIDなどと共にイベント候補データとしてイベント候補データ格納部に格納される場合もある。また、イベント候補データからID間の関連付けが行われてイベントデータが生成され、イベントデータ格納部に格納される場合もある。
さらに、上で述べた第1蓋然性データ特定ステップが、処理対象フィールドのフィールド値がNULLを除き2以上の値を有するか判断するステップを含むようにしてもよい。関連IDの場合、フィールド値はNULLを除き2以上の値を有するめである。
本発明の第4の態様に係る業務プロセス分析のための情報処理方法は、解析対象システムにより生成され且つデータ格納部に格納されているレコードにおける各フィールドについて、データ格納部に格納されている、レコードにおける各フィールドの定義データを用いて、当該フィールドがイベントのタイムスタンプである蓋然性を表すデータを特定するステップと、イベントのタイムスタンプである蓋然性を表すデータが所定のデータであるフィールド又はイベントのタイムスタンプである蓋然性を表すデータに基づきユーザによってタイムスタンプであると指定されたフィールドを特定するステップと、特定されたフィールドの数に基づき、イベント名を特定するイベント名特定ステップとを含む。
このようにタイムスタンプとみなされるフィールドの数によって元のテーブルの性質が定まるため、イベント名をも特定することができるようになる。
例えば、上で述べたイベント名特定ステップが、フィールドの数が単数である場合には、テーブル名をイベント名として特定するステップを含むようにしてもよい。例えば受注DBであれば、イベント名は「受注」となる。
また、上で述べたイベント名特定ステップが、フィールドの数が複数である場合には、特定された上記フィールドのフィールド名に基づきイベント名を特定するステップを含むようにしてもよい。例えば、1レコードに複数のイベントを含むようなテーブルの場合、受注日時、起票日時、納品日時、検品日時などのタイムスタンプが存在する。このような場合には、「受注」「起票」「納品」「検品」といったイベント名を特定する。
なお、本発明の第4の態様においては、データ格納部に格納されている、各フィールドのフィールド値の特性を特定するステップと、各フィールドのフィールド値の特性が予め定められた特性を有するか否かに基づき、当該フィールドがイベントのイベントIDである蓋然性を表すデータを特定するステップと、イベントのイベントIDである蓋然性を表すデータが否定を表すデータでない場合、データ格納部に格納されている、レコードにおける各フィールドの定義データを用いて、当該フィールドがイベントのイベントIDである蓋然性を表すデータを特定するステップとをさらに含むようにしてもよい。これによって、イベントIDをも特定することができるようになる。
さらに、本発明の第4の態様において、フィールドのフィールド値の特性が予め定められた第2の特性を有するか否かに基づき、当該フィールドがイベントの関連IDである蓋然性を表すデータを特定するステップと、イベントの関連IDである蓋然性を表すデータが否定を表すデータでない場合、データ格納部に格納されている、レコードにおける各フィールドの定義データを用いて、当該フィールドがイベントの関連IDである蓋然性を表すデータを特定するステップとをさらに含むようにしてもよい。これによって、さらに関連IDをも特定することができるようになる。
なお、本発明に係る方法をコンピュータに実行させるためのプログラムを作成することができ、当該プログラムは、例えばフレキシブル・ディスク、CD−ROM、光磁気ディスク、半導体メモリ、ハードディスク等の記憶媒体又は記憶装置に格納される。また、ネットワークを介してディジタル信号にて頒布される場合もある。なお、処理途中のデータについては、コンピュータのメモリ等の記憶装置に一時保管される。
図1は、本発明の実施の形態における業務システム分析装置の機能ブロック図である。 図2(a)乃至(d)は、本発明の実施の形態の概要を説明するための図である。 図3は、本発明の実施の形態におけるメインの処理フローを示す図である。 図4(a)は、受注DBのスキーマ情報、図4(b)は、受注DBのレコード群を示す図である。 図5(a)は、生産DBのスキーマ情報、図5(b)は、生産DBのレコード群を示す図である。 図6(a)は、手配DBのスキーマ情報、図6(b)は、手配DBのレコード群を示す図である。 図7(a)は、配送DBのスキーマ情報、図7(b)は、配送DBのレコード群を示す図である。 図8(a)は、品番DBのスキーマ情報、図8(b)は、品番DBのレコード群を示す図である。 図9(a)は、CSV形式の受注DBのデータ例を示し、図9(b)は、受注DBのデータをテーブル化した例を示す図である。 図10(a)は、CSV形式の生産DBのデータ例を示し、図10(b)は、生産DBのデータをテーブル化した例を示す図である。 図11(a)は、CSV形式の手配DBのデータ例を示し、図11(b)は、手配DBのデータをテーブル化した例を示す図である。 図12(a)は、CSV形式の配送DBのデータ例を示し、図12(b)は、配送DBのデータをテーブル化した例を示す図である。 図13(a)は、CSV形式の品番DBのデータ例を示し、図13(b)は、品番DBのデータをテーブル化した例を示す図である。 図14は、タイムスタンプ判定処理の処理フローを示す図である。 図15は、タイムスタンプ確度スコア表の一例を示す図である。 図16は、イベントID及び関連ID候補判定処理の処理フローを示す図である。 図17は、イベントID・関連ID候補確度スコア表の一例を示す図である。 図18は、イベント名判定処理の処理フローを示す図である。 図19は、タイムスタンプが複数含まれるテーブルの一例を示す図である。 図20(a)乃至(e)は、図19を構成する元のテーブルの一例を示す図である。 図21は、スキーマ情報が存在する場合における、受注DBのイベント候補データの各要素に対する判定表示の一例を示す図である。 図22は、CSV形式のデータの場合における、受注DBのイベント候補データの各要素に対する判定表示の一例を示す図である。 図23は、スキーマ情報が存在する場合における、生産DBのイベント候補データの各要素に対する判定表示の一例を示す図である。 図24は、CSV形式のデータの場合における、生産DBのイベント候補データの各要素に対する判定表示の一例を示す図である。 図25は、スキーマ情報が存在する場合における、手配DBのイベント候補データの各要素に対する判定表示の一例を示す図である。 図26は、CSV形式のデータの場合における、手配DBのイベント候補データの各要素に対する判定表示の一例を示す図である。 図27は、スキーマ情報が存在する場合における、配送DBのイベント候補データの各要素に対する判定表示の一例を示す図である。 図28は、CSV形式のデータの場合における、配送DBのイベント候補データの各要素に対する判定表示の一例を示す図である。 図29は、スキーマ情報が存在する場合における、品番DBのイベント候補データの各要素に対する判定表示の一例を示す図である。 図30は、CSV形式のデータの場合における、品番DBのイベント候補データの各要素に対する判定表示の一例を示す図である。 図31は、イベント候補データの各要素に対する選択結果の一例を示す図である。 図32は、スキーマ情報が存在する場合において受注DBのデータから生成したイベント候補データの一例を示す図である。 図33は、CSV形式のデータの場合において受注DBのデータから生成したイベント候補データの一例を示す図である。 図34は、スキーマ情報が存在する場合において生産DBのデータから生成したイベント候補データの一例を示す図である。 図35は、CSV形式のデータの場合において生産DBのデータから生成したイベント候補データの一例を示す図である。 図36は、スキーマ情報が存在する場合において手配DBのデータから生成したイベント候補データの一例を示す図である。 図37は、CSV形式のデータの場合において手配DBのデータから生成したイベント候補データの一例を示す図である。 図38は、スキーマ情報が存在する場合において配送DBのデータから生成したイベント候補データの一例を示す図である。 図39は、CSV形式のデータの場合において配送DBのデータから生成したイベント候補データの一例を示す図である。 図40は、図19の起票に関するイベント候補データの一例を示す図である。 図41は、図19の承認に関するイベント候補データの一例を示す図である。 図42は、図19の発注に関するイベント候補データの一例を示す図である。 図43は、図19の納品に関するイベント候補データの一例を示す図である。 図44は、図19の検収に関するイベント候補データの一例を示す図である。 図45は、イベントデータ及びイベント間関係ツリーの一例を示す図である。 図46は、イベントデータからのプロセスインスタンス生成を説明するための図である。 図47は、プロセスインスタンスの一例を示す図である。 図48は、プロセスフロー分析結果の表示例を示す図である。 図49は、プロセスフロー分析結果の他の表示例を示す図である。 図50は、本発明の実施の形態におけるメインの処理フローの他の例を示す図である。 図51は、コンピュータ装置の機能ブロック図である。
図1に、本発明の一実施の形態に係る業務システム分析装置の機能ブロック図を示す。本実施の形態に係る業務システム分析装置は、単数または複数の解析対象システムから収集されたデータ(所定期間において生成されたデータベースのレコード群、ログデータ、ネットワークDB(NDB)のレコード群、ジャーナルなど)を格納する分析対象データ格納部1と、分析対象データ格納部1からイベント候補データを生成するイベント候補データ生成部3と、イベント候補データ生成部3により生成されたイベント候補データを格納するイベント候補データ格納部5と、ユーザとのインターフェースとなる入出力部11と、入出力部11を介してユーザの指示を受け付けイベントデータを生成するイベントデータ生成部7と、イベントデータ生成部7により生成されたイベントデータを格納するイベントデータ格納部9と、イベントデータ格納部9に格納されているイベントデータからプロセスインスタンスを生成するプロセスインスタンス生成部13と、プロセスインスタンス生成部13によって生成されたプロセスインスタンスのデータを格納するプロセスインスタンスデータ格納部15と、プロセスインスタンスデータ格納部15に格納されているプロセスインスタンスのデータを用いてプロセスフローを生成するプロセスフロー生成部17と、プロセスフロー生成部17によって生成されたプロセスフローのデータを格納するプロセスフローデータ格納部19と、プロセスフローデータ格納部19に格納されているデータを用いて各種プロセス分析処理を実施するプロセス分析部21と、プロセス分析部21による分析結果を格納する分析結果格納部23とを含む。
なお、入出力部11は、イベント候補データ生成部3、プロセスインスタンス生成部13、プロセスフロー生成部17及びプロセス分析部21についても、ユーザとのインターフェースとして動作する。また、各処理部は、処理結果などを読み出して入出力部11を介してユーザに提示するなどの処理も実施することもある。但し、イベントデータからプロセスフローデータを生成する処理は自動的に行われる場合もあり、この場合には、プロセスインスタンス生成部13及びプロセスフロー生成部17については、各処理結果の中間結果表示を行う場合を除き、インタフェースは不要である。
また、本実施の形態における主要構成部分であるイベント候補データ生成部3は、タイムスタンプ処理部31と、イベントID・関連ID候補処理部32と、イベント名処理部34と、スコア表格納部35とを有する。
次に、業務システム分析装置の大まかな処理内容について図2(a)乃至(d)を用いて説明する。まず、イベント候補データ生成部3は、分析対象データ格納部1に格納された業務システムについてのデータからイベント候補データを生成する。イベント候補データの一例を図2(a)に示す。図2(a)の例では、例えば1つのテーブル(例えばデータベース)から、イベント名と、時刻(イベントの発生日時であるタイムスタンプ)と、それ以外の第1の値(値1)と、第2の値(値2)などを含むレコード群が抽出されるようになっている。すなわち、イベント名やタイムスタンプ、それ以外にイベントIDや関連IDの候補となるデータ・フィールドが特定される。
次に、イベントデータ生成部7は、イベント候補データ格納部5に格納されているイベント候補データからイベントデータを生成する。イベントデータの一例を図2(b)に示す。図2(b)の例では、複数のテーブル(例えばデータベース)から、イベント名、時刻(イベントの発生日時であるタイムスタンプ)、イベントID(ここではID1)及び他の値を含むレコード群と、イベント名、時刻(タイムスタンプ)、ID1及びID2などを含むレコード群とが抽出され、第2のイベントクラス(すなわち、イベントの種類)のレコードの関連IDであるID2のフィールド値が、第1のイベントクラス(すなわち、イベントの種類)のレコードのイベントIDであるID1のフィールド値のいずれかの値をとることにより、第2のイベントクラスの各々のレコード(すなわちイベントインスタンス)が、第1のイベントクラスのどのレコード(すなわちイベントインスタンス)と関連しているかが特定される。このようなイベント間の関連などを抽出する処理自体は、本実施の形態における主要部ではなく、例えば日本国の特願2006−197294号(2006年7月19日出願)及びその対応外国出願に開示されている
その後、プロセスインスタンス生成部13は、イベントデータ格納部9に格納されているイベントデータからプロセスインスタンスのデータを生成する。プロセスインスタンスの一例を図2(c)に示す。図2(c)の例では、4つのプロセスインスタンスが例示されており、各々のプロセスインスタンスには、一連のイベントインスタンス(具体的なイベント)が含まれている。すなわち、例えば「受注」「起票」「納品」「検品」といったイベントクラスに属する連続するイベントインスタンス(具体的なイベントであり特定のレコードに対応するイベント)でプロセスインスタンスが構成される。ただし、プロセスインスタンスに含まれるイベントインスタンスは、すべてのイベントクラスに由来する必要はなく、ひとつのイベントクラスに属するイベントインスタンスが複数含まれていても良い。
そして、プロセスフロー生成部17は、プロセスインスタンスデータ格納部15に格納されているプロセスインスタンスのデータからプロセスフローのデータを生成する。プロセスフローの一例を図2(d)に示す。図2(d)の例では、プロセスインスタンスが抽象化されて特定される業務フローが示されている。図2(c)及び(d)のデータを生成する処理自体は、本実施の形態における主要部ではなく、例えば日本国の特願2006−136518号(2006年5月16日出願)及びその対応外国出願に開示されている
さらに、プロセス分析部21は、プロセスフローデータ格納部19に格納されているプロセスフローのデータに対して各種分析処理を実施する。プロセスフローに対する分析処理については、本実施の形態における主要部ではなく、様々な分析処理が存在しており、ここではその詳細については省略する。なお、分析処理についても、例えば日本国の特願2006−136518号(2006年5月16日出願)及びその対応外国出願に開示されている
次に、図1に示した業務システム分析装置の処理の詳細を図3乃至図51を用いて説明する。まず、ユーザは、業務システムにおける解析対象テーブルの指定を行い、そのデータをコピーして分析対象データ格納部1に格納させる(図3:ステップS1)。例えば、受注DB、生産DB、手配DB、配送DB、品番DBが指定され、所定期間において生成され蓄積されていたレコード群をコピーして、分析対象データ格納部1に格納する。なお、これらのDBがリレーショナルデータベースであれば、スキーマ情報をもコピーして、分析対象データ格納部1に格納しておく。本ステップについては、予めユーザがコンピュータを操作して行う処理であるから、図3では点線ブロックで示している。
例えば受注DBがリレーショナルデータベースである場合には、図4(a)のようなスキーマ情報と図4(b)に示すようなレコード群とが分析対象データ格納部1に格納される。図4(a)に示したスキーマ情報の例では、フィールド1乃至4のそれぞれについて、フィールド名、キー設定データ、データ型、レコード長及びコメントが登録されるようになっている。図4(a)から、フィールド1には日時が登録され、フィールド2には主キーである受注番号が登録され、フィールド3には地域が登録され、フィールド4には受注内容が登録されることが分かる。具体的には図4(b)のようなレコード群となるが、図4(a)のようなスキーマ情報を得れば、図4(b)のようなレコード群の内容を容易に解釈することができる。
同様に、生産DBがリレーショナルデータベースである場合には、図5(a)のようなスキーマ情報と図5(b)に示すようなレコード群とが分析対象データ格納部1に格納される。図5(a)に示したスキーマ情報の例では、フィールド1乃至5のそれぞれについて、フィールド名、キー設定データ、データ型、レコード長及びコメントが登録されるようになっている。図5(a)から、フィールド1には日時が登録され、フィールド2には主キーである生産番号が登録され、フィールド3には副キーである受注番号が登録され、フィールド4には副キーである品番が登録され、フィールド5には納期が登録されることが分かる。具体的には図5(b)のようなレコード群となるが、図5(a)のようなスキーマ情報を得れば、図5(b)のようなレコード群の内容を容易に解釈することができる。
また、手配DBがリレーショナルデータベースである場合には、図6(a)のようなスキーマ情報と図6(b)に示すようなレコード群とが分析対象データ格納部1に格納される。図6(a)に示したスキーマ情報の例では、フィールド1乃至5のそれぞれについて、フィールド名、キー設定データ、データ型、レコード長及びコメントが登録されるようになっている。図6(a)から、フィールド1には日時が登録され、フィールド2には主キーである手配番号が登録され、フィールド3には副キーである受注番号が登録され、フィールド4には副キーである品番が登録され、フィールド5には納品先が登録されることが分かる。具体的には図6(b)のようなレコード群となるが、図6(a)のようなスキーマ情報を得れば、図6(b)のようなレコード群の内容を容易に解釈することができる。
さらに、配送DBがリレーショナルデータベースである場合には、図7(a)のようなスキーマ情報と図7(b)に示すようなレコード群とが分析対象データ格納部1に格納される。図7(a)に示したスキーマ情報の例では、フィールド1乃至4のそれぞれについて、フィールド名、キー設定データ、データ型、レコード長及びコメントが登録されるようになっている。図7(a)から、フィールド1には日時が登録され、フィールド2には主キーである手配番号が登録され、フィールド3には副キーである配送便が登録され、フィールド4に納品先が登録されることが分かる。具体的には図7(b)のようなレコード群となるが、図7(a)のようなスキーマ情報を得れば、図7(b)のようなレコード群の内容を容易に解釈することができる。
また、品番DBがリレーショナルデータベースである場合には、図8(a)のようなスキーマ情報と図8(b)に示すようなレコード群とが分析対象データ格納部1に格納される。図8(a)に示したスキーマ情報の例では、フィールド1及び2のそれぞれについて、フィールド名、キー設定データ、データ型、レコード長及びコメントが登録されるようになっている。図8(a)から、フィールド1には主キーである品番が登録され、フィールド2には品名が登録されることが分かる。具体的には図8(b)のようなレコード群となるが、図8(a)のようなスキーマ情報を得れば、図8(b)のようなレコード群の内容を容易に解釈することができる。
一方、受注DBのデータをCSV形式で取得した場合には、図9(a)に示すようなデータが分析対象データ格納部1に格納される。図9(a)の例では、日時、受注番号、地域及び受注内容というラベルデータが先頭に含まれ、その後は上記ラベルの順番にデータが羅列され、データ間はカンマにて区切られている。図9(a)をわかりやすくするためにテーブル形式にすると図9(b)に示すようになる。すなわち、日時の列と、受注番号の列と、地域の列と、受注内容の列とを含むテーブルとなる。スキーマ情報はないので、データは皆文字列として格納される。また、キー設定データはない。
同様に、生産DBのデータをCSV形式で取得した場合には、図10(a)に示すようなデータが分析対象データ格納部1に格納される。図10(a)の例では、日時、生産番号、受注番号、品番及び納期というラベルデータが先頭に含まれ、その後は上記ラベルの順番にデータが羅列され、データ間はカンマにて区切られている。図10(a)をわかりやすくするためにテーブル形式にすると図10(b)に示すようになる。すなわち、日時の列と、生産番号の列と、受注番号の列と、品番の列と、納期の列とを含むテーブルとなる。
また、手配DBのデータをCSV形式で取得した場合には、図11(a)に示すようなデータが分析対象データ格納部1に格納される。図11(a)の例では、日時、手配番号、受注番号、品番及び納品先というラベルデータが先頭に含まれ、その後は上記ラベルの順番にデータが羅列され、データ間はカンマにて区切られている。図11(a)をわかりやすくするためにテーブル形式にすると図11(b)に示すようになる。すなわち、日時の列と、手配番号の列と、受注番号の列と、品番の列と、納品先の列とを含むテーブルとなる。
さらに、配送DBのデータをCSV形式で取得した場合には、図12(a)に示すようなデータが分析対象データ格納部1に格納される。図12(a)の例では、日時、手配番号、配送便及び納品先というラベルデータが先頭に含まれ、その後は上記ラベルの順番にデータが羅列され、データ間はカンマにて区切られている。図12(a)をわかりやすくするためにテーブル形式にすると図12(b)に示すようになる。すなわち、日時の列と、手配番号の列と、配送便の列と、納品先の列とを含むテーブルとなる。
また、品番DBのデータをCSV形式で取得した場合には、図13(a)に示すようなデータが分析対象データ格納部1に格納される。図13(a)の例では、品番及び品名というラベルデータが先頭に含まれ、その後は上記ラベルの順番にデータが羅列され、データ間はカンマにて区切られている。図13(a)をわかりやすくするためにテーブル形式にすると図13(b)に示すようになる。すなわち、品番の列と、品名の列とを含むテーブルとなる。
業務システム分析装置の例えばイベント候補データ生成部3は、全ての解析対象テーブルについて処理したか判断する(ステップS3)。未処理の解析対象テーブルが存在する場合には、未処理の解析対象ーブルを1つ特定する(ステップS5)。そして、タイムスタンプ判定処理を実施する(ステップS7)。このタイムスタンプ判定処理については図14及び図15を用いて説明する。
まず、イベント候補データ生成部3のタイムスタンプ処理部31は、分析対象データ格納部1を参照して、解析対象テーブルにおいて未処理のフィールドを1つ特定する(図14:ステップS31)。そして、分析対象データ格納部1において解析対象テーブルのスキーマ情報が使用可能となっているか判断する(ステップS33)。
スキーマ情報が使用可能となっている場合には、スキーマ情報において処理対象フィールドについてのデータ部分を特定し、その中で処理対象フィールドのデータ型がタイムスタンプ型であるか判断する(ステップS35)。処理対象フィールのデータ型がタイムスタンプ型ではない場合にはステップS39に移行する。例えば、図9(a)乃至図13(a)のようなデータを処理する場合にはスキーマ情報はないので、ステップS39に移行する。
一方、処理対象フィールドのデータ型がタイムスタンプ型であると判断された場合には、処理対象フィールドのタイムスタンプ判定を「確定」と設定し、例えばメインメモリなどの記憶装置に格納する(ステップS37)。そして、処理はステップS43に移行する。
例えば、図4(a)のようなスキーマ情報の場合、フィールド1のデータ型がタイムスタンプ型であるので、フィールド1が処理対象フィールドであれば、タイムスタンプ判定=「確定」と設定される。図5(a)のようなスキーマ情報の場合、フィールド1のデータ型がタイムスタンプ型であるので、フィールド1が処理対象フィールドであれば、タイムスタンプ判定=「確定」と設定される。図6(a)及び図7(a)についても同様である。図8(a)の場合には、ステップS35からステップS39に移行する。
ステップS33でスキーマ情報が使用不能と判断された場合又は処理対象フィールドのデータ型がタイムスタンプ型でない場合、スコア表格納部35に格納されているタイムスタンプ確度スコア表を参照して、スキーマ情報における処理対象フィールドの該当データ部分、処理対象フィールドのフィールド名を表すラベルデータ、及び処理対象フィールドのフィールド値から確度を特定する(ステップS39)。
タイムスタンプ確度スコア表の一例を図15に示す。図15の例では、「フィールドのデータ型が可変長文字列」であれば確度スコアは1(%)と設定され、「フィールドのデータ型が実数」であれば確度スコアは5(%)と設定され、フィールド名の末尾が「時刻」「時間」などであれば確度スコアは90(%)と設定され、フィールド名の末尾が「月日」「日」などであって時刻などが含まれない場合であれば確度スコアは70(%)と設定され、フィールド名に「予定」「納期」など将来の時期が含まれる場合であれば確度スコアは10(%)と設定され、フィールド値の文字列に年号(記号)、「/」「:」「’」「.」「−」、数字、空白といった時間に関連する文字以外の文字が含まれている場合には確度スコアは5(%)と設定され、フィールド値の文字列が「YYYY/MM/DD hh:mm:ss」の形式であれば確度スコアは90(%)と設定され、フィールド値の文字列が「YYYY/MM/DD」の形式であれば確度スコアは70(%)と設定され、フィールド値に同一となるものが含まれていれば確度スコアは30(%)と設定され、該当する項目がなければ確度スコアは50(%)と設定される。
例えば、図4(a)のようなスキーマ情報で図4(b)のようなレコード群の場合、フィールド2については、フィールド値に時間に関連する文字以外の文字が含まれているとして確度スコア5(%)と特定される。フィールド3についても同様に、フィールド値に時間に関連する文字以外の文字が含まれているとして確度スコア5(%)と特定される。さらに、フィールド4については、データ型が可変長文字列であるので、確度スコア1(%)と特定される。なお、フィールド4については、フィールド値に時間に関連する文字以外の文字も含まれているので、タイムスタンプ確度スコア表において複数項目に該当しているが、本実施の形態では、50(%)という中央値からより乖離した値の方を採用する。すなわち、フィールド値に時間に関連する文字以外の文字が含まれている場合の確度スコア5(%)よりも1(%)を採用する。
一方、スキーマ情報が存在しない図9(a)の場合には、フィールド1については、フィールド値の文字列が「YYYY/MM/DD hh:mm:ss」の形式であるので、確度スコア90(%)と特定される。フィールド2及び3については同様であるが、フィールド4については、当該フィールドのデータ型が特定できないので、フィールド値に時間に関連する文字以外の文字が含まれている場合に該当すると判断され、確度スコア5(%)と特定される。
また、図5(a)のようなスキーマ情報で図5(b)のようなレコード群の場合にも、フィールド2乃至4については、フィールド値に時間に関連する文字以外の文字が含まれているとして確度スコア5(%)と特定される。フィールド5については、フィールド名の文字列に「納期」が含まれているので、確度スコア10(%)と特定される。なお、フィールド5については、フィールド値の文字列が「YYYY/MM/DD」の形式であるので、タイムスタンプ確度スコア表において複数項目に該当しているが、本実施の形態では、50(%)という中央値からより乖離した値の方を採用する。すなわち、フィールド値の文字列が「YYYY/MM/DD」の形式である場合の確度スコア70(%)よりも10(%)を採用する。スキーマ情報が存在しない図10(a)の場合には、フィールド1については、フィールド値の文字列が「YYYY/MM/DD hh:mm:ss」の形式であるので、確度スコア90(%)と特定される。フィールド2乃至5については、データ型が関係しないので、スキーマ情報が存在する場合と同様の結果が得られる。
さらに、図6(a)のようなスキーマ情報で図6(b)のようなレコード群の場合、フィールド2乃至5については、フィールド値に時間に関連する文字以外の文字が含まれているとして確度スコア5(%)と特定される。スキーマ情報が存在しない図11(a)の場合には、フィールド1については、フィールド値の文字列が「YYYY/MM/DD hh:mm:ss」の形式であるので、確度スコア90(%)と特定される。フィールド2乃至5については、データ型が関係しないので、スキーマ情報が存在する場合と同様の結果が得られる。
また、図7(a)のようなスキーマ情報で図7(b)のようなレコード群の場合、フィールド2乃至4については、フィールド値に時間に関連する文字以外の文字が含まれているとして確度スコア5(%)と特定れる。スキーマ情報が存在しない図12(a)の場合は、フィールド1については、フィールド値の文字列が「YYYY/MM/DD hh:mm:ss」の形式であるので、確度スコア90(%)と特定される。フィールド2乃至4については、データ型が関係しないので、スキーマ情報が存在する場合と同様の結果が得られる。
さらに、図8(a)のようなスキーマ情報で図8(b)のようなレコード群の場合、フィールド1及び2については、フィールド値に時間に関連する文字以外の文字が含まれているとして確度スコア5(%)と特定れる。スキーマ情報が存在しない図13(a)の場合も、データ型が関係しないので、スキーマ情報が存在する場合と同様の結果が得られる。
図14の説明に戻って、処理対象フィールドのタイムスタンプ判定を特定された確度スコアに設定する(ステップS41)。上で述べた数値が特定される。
そして、処理対象テーブルにおいて全てのフィールドについて処理したか判断する(ステップS43)。未処理のフィールドが存在する場合にはステップS31に戻る。一方、全てのフィールドを処理した場合には元の処理に戻る。
このように、イベントのタイムスタンプとして蓋然性の高いフィールドに高い値の確度スコアが設定される。また、データ型からタイムスタンプであることが明らかであれば「確定」という蓋然性を表すデータが設定される。
図3の説明に戻って、次に、イベント候補データ生成部3のイベントID・関連ID候補処理部32は、イベントID及び関連ID候補判定処理を実施する(ステップS9)。このイベントID及び関連ID候補判定処理については、図16及び図17を用いて説明する。
イベントID・関連ID候補処理部32は、分析対象データ格納部1に格納されている解析対象テーブルのうち未処理のフィールドを1つ特定する(ステップS51)。そして、分析対象データ格納部1に格納されている、処理対象フィールドのフィールド値が、全レコードで一意となっているか判断する(ステップS53)。処理対象フィールドのフィールド値が、全レコードで一意となっていない、すなわち値が重複しているレコードが存在する場合には、ステップS62に移行する。
イベントIDのフィールドはイベントの識別子の格納フィールドであるので、そのフィールド値が互いに重複することはない。したがって、処理対象フィールドに重複する値が存在すれば、それはイベントIDのフィールドではないと判断できる
一方、処理対象フィールドのフィールド値が、全レコードで一意である場合には、分析対象データ格納部1に格納されている、処理対象フィールドのフィールド値にNULLが含まれているか判断する(ステップS55)。処理対象フィールドのフィールド値にNULLが含まれている場合には、ステップS62に移行する。イベントIDのフィールドはイベントの識別子の格納フィールドであるので、そのフィールド値がNULLということはあり得ない処理対象フィールドのフィールド値が全レコードで一意とは言えない場合、又は処理対象フィールドのフィールド値にNULLを含む場合、分析対象データ格納部1に格納されている、処理対象フィールドのフィールド値が、NULLを除いて2以上あるか判断する(ステップS62)。処理対象フィールドのフィールド値が、NULLを除いて2種類以上ない場合には、イベントID・関連ID候補判定に「否定」を設定し、例えばメインメモリなどの記憶装置に格納する(ステップS63)。そして処理はステップS61に移行する。関連IDはあるイベント他のイベントのどれに対応しているかを表す値であるので、そのフィールド値がNULLを除き2以上の値を有しない場合は、意味がある結果が得られない
例えば図4(b)や図9(b)のようなテーブルの場合、フィールド1とフィールド2とフィールド4とについては、フィールド値に重複が存在せず、フィールド3ついてはフィールド値に重複が存在するが、NULL以外の2種類以上の値をとるので、イベントID・関連ID候補判定に「否定」は設定されない。
また図5(b)や図10(b)のようなテーブルの場合、フィールド1とフィールド2については、フィールド値に重複が存在せず、フィールド3乃至5については重複が存在するが、NULL以外の2種類以上の値をとるので、イベントID・関連ID候補判定に「否定」は設定されない。
さらに図6(b)や図11(b)のようなテーブルの場合、フィールド1とフィールド2については、フィールド値に重複が存在せず、フィールド3乃至5については重複が存在するが、NULL以外の2種類以上の値をとるので、イベントID・関連ID候補判定に「否定」は設定されない。
また図7(b)や図12(b)のようなテーブルの場合、フィールド1とフィールド2については、フィールド値に重複が存在せず、フィールド3及び4については重複が存在するが、NULL以外の2種類以上の値をとるので、イベントID・関連ID候補判定に「否定」は設定されない。
さらに図8(b)や図13(b)のようなテーブルの場合、フィールド1とフィールド2について、フィールド値に重複が存在しないので、イベントID・関連ID候補判定に「否定」は設定されない。
ステップS55において処理対象フィールドのフィールド値にNULLが含まれていないと判断された場合、又はステップS62において処理対象フィールドのフィールド値が、NULLを除いて2種類以上値を有すると判断された場合には、スコア表格納部35に格納されているイベントID・関連ID候補確度スコア表を参照して、スキーマ情報における処理対象フィールドの該当データ部分、処理対象フィールドのフィールド名を表すラベルデータ、及び処理対象フィールドのフィールド値から確度を特定する(ステップS57)。但し、イベントID・関連ID候補確度スコア表に該当項目が存在しない場合には、確度スコア50(%)が特定されるものとする。
イベントID・関連ID候補確度スコア表の一例を図17に示す。図17の例では、フィールドのデータ型が可変長文字列であれば確度スコアは1(%)と設定され、フィールドのデータ型が実数であれば確度スコアは5(%)と設定され、フィールドのデータ型が整数であれば確度スコアは80(%)と設定され、フィールドのデータ型が固定長文字列であれば確度スコアは70(%)と設定され、フィールドのデータ型がタイムスタンプ又は日付であれば確度スコアは10(%)と設定され、フィールド名が主キー指定されていれば確度スコアは80(%)と設定される。フィールド値又はフィールド名の文字列についての項目はここでは定義されていないが、定義されることもある。フィールド値についての項目が定義される場合にはステップS57で参照される。
例えば図4(a)のようなスキーマ情報の場合、フィールド1についてはデータ型がタイムスタンプであるので確度スコア10(%)と特定され、フィールド2についてはデータ型が固定長文字列であって且つ主キー指定されているので50%からの乖離の大きい確度スコア80(%)が採用され、フィールド3についてはデータ型が固定長文字列であるので確度スコア70(%)と特定され、フィールド4についてはデータ型が可変長文字列であるので確度スコア1(%)と特定される。図9(a)のようなスキーマ情報が存在しない例の場合、フィールド1乃至フィールド4について、イベントID・関連ID候補確度スコア表には該当項目が存在しないので確度スコア50(%)が特定される。
例えば図5(a)のようなスキーマ情報の場合、フィールド1についてはデータ型がタイムスタンプであるので確度スコア10(%)と特定され、フィールド2についてはデータ型が固定長文字列であって且つ主キー指定されているので50%からの乖離の大きい確度スコア80(%)が採用され、フィールド3乃至フィールド4についてはデータ型が固定長文字列であるので確度スコア70(%)が特定され、フィールド5についてはデータ型が日付となっているので確度スコア10(%)が特定される。図10(a)のようなスキーマ情報が存在しない例の場合、フィールド1乃至フィールド5について、イベントID・関連ID候補確度スコア表には該当項目が存在しないので確度スコア50(%)が特定される。
例えば図6(a)のようなスキーマ情報の場合、フィールド1についてはデータ型がタイムスタンプであるので確度スコア10(%)と特定され、フィールド2についてはデータ型が固定長文字列であって且つ主キー指定されているので50%からの乖離の大きい確度スコア80(%)が採用され、フィールド3乃至フィールド5についてはデータ型が固定長文字列であるので確度スコア70(%)が特定される。図11(a)のようなスキーマ情報が存在しない例の場合、フィールド1至フィールド5について、イベントID・関連ID候補確度スコア表には該当項目が存在しないので確度スコア50(%)が特定される。
例えば図7(a)のようなスキーマ情報の場合、フィールド1についてはデータ型がタイムスタンプであるので確度スコア10(%)と特定され、フィールド2についてはデータ型が固定長文字列であって且つ主キー指定されているので50%からの乖離の大きい確度スコア80(%)が採用され、フィールド3及びフィールド4についてはデータ型が固定長文字列であるので確度スコア70(%)が特定される。図12(a)のようなスキーマ情報が存在しない例の場合、フィールド1乃至フィールド4について、イベントID・関連ID候補確度スコア表には該当項目が存在しないので確度スコア50(%)が特定される。
例えば図8(a)のようなスキーマ情報の場合、フィールド1についてはデータ型が固定長文字列であって且つ主キー指定されているので50%からの乖離の大きい確度スコア80(%)が採用され、フィールド2についてはデータ型が固定長文字列であるので確度スコア70(%)が採用される。図13(a)のようなスキーマ情報が存在しない例の場合、フィールド1及び2について、イベントID・関連ID候補確度スコア表には該当項目が存在しないので確度スコア50(%)が特定される。
そして、イベントID・関連ID候補処理部32は、イベントID・関連ID候補判定に、ステップS57で特定された確度スコアを設定して、例えばメインメモリなどの記憶装置に格納する(ステップS59)。
その後、処理対象テーブルにおいて全てのフィールドについて処理したか判断し(ステップS61)、未処理のフィールドが存在する場合にはステップS51に戻る。一方、全てのフィールドについて処理した場合には元の処理に戻る。
このようにすれば、イベントID又は関連IDの蓋然性が高いものについては高い確度スコアが特定されるようになる。また、イベントID又は関連IDの可能性が完全にないものについては「否定」という蓋然性を表すデータが特定される。
図3の説明に戻って、次に、イベント候補データ生成部3のイベント名処理部34は、イベント名判定処理を実施する(ステップS13)。このイベント名判定処理については、図18乃至図20を用いて説明する。
まず、イベント名処理部34は、タイムスタンプ判定処理の処理結果として所定の確度スコア以上でタイムスタンプのフィールドとしてみなすことができるフィールドの数をカウントする(ステップS91)。例えば確度スコア70(%)以上などの閾値を設定する。当然ながら「確定」と特定されているフィールドはタイムスタンプのフィールドである。上で述べた例では、品番DBを除き、フールド名が日時であるフィールドがタイムスタンプのフィールドと判断され、フィールド数は「1」となる。品番DBでは、タイムスタンプとみなすことができるフィールドはないので、フィールド数は「0」となる。
そして、タイムスタンプのフィールド数が0であるか判断する(ステップS93)。フィールド数が0であれば、解析対象テーブルを以下の処理の対象外として設定する(ステップS95)。タイムスタンプがないテーブル(例えば品番DB)は、業務プロセス中に発生するイベントに対応しているテーブルではないと判断される。そして元の処理に戻る。
一方、タイムスタンプのフィールド数が0ではない場合には、フィールド数が1であるか判断する(ステップS97)。タイムスタンプのフィールド数が1であれば、イベント名にテーブル名を設定し、例えばメインメモリなどの記憶装置に格納する(ステップS99)。上の例では、受注DBであれば、イベント名は「受注」と特定され、生産DBであれば、イベント名は「生産」と特定され、手配DBであれば、イベント名は「手配」と特定され、配送DBであれば、イベント名は「配送」と特定される。そして元の処理に戻る。
また、タイムスタンプのフィールド数が複数である場合には、タイムスタンプとみなされたフィールドのフィールド名をイベント名に設定し、例えばメインメモリなどの記憶装置に格納する(ステップS101)。そして元の処理に戻る。
例えば図19のようなテーブルが処理対象テーブルである場合にステップS101が実行される。図19の例では、起票日時、承認日時、発注日時、納品日時、検収日時がそれぞれイベントのタイムスタンプとみなされるフィールドとなり、1レコードにイベントが複数記録される形式となっている。このようなテーブルは、図20(a)乃至(e)に示したような起票テーブル、承認テーブル、発注テーブル、納品テーブル及び検収テーブルを1つに統合したテーブルと考えられる。従って、このような場合には、「起票」「承認」「発注」「納品」「検収」がそれぞれイベント名として特定される。
以上のような処理を実施することによって、業務プロセス中に発生するイベントに対応しているテーブルを特定すると共に、イベント名を抽出することができるようになる。
図3の説明に戻って、次に、イベント候補データ生成部3は、判定結果を入出力部11を介してユーザに提示する(ステップS15)。例えば、図4(a)及び(b)に示したようなリレーショナルデータベース形式の受注DBの場合には、図21に示すようなデータがユーザに提示される。図21の例では、日時フィールド、受注番号フィールド、地域フィールド、受注内容フィールドのそれぞれにつき、ステップS7乃至S13の判定結果が提示されている。なお、イベント名についてはテーブル名がイベント名とされるので、全て「否定」とされている。これを見れば、日時フィールドがタイムスタンプのフィールドで「確定」となっており、受注番号フィールド及び地域フィールドがイベントIDまたは関連IDの可能性が高いことが分かる。
また、図9(a)に示したCSV形式の受注DBの場合には、図22に示すようなデータがユーザに提示される。図22の例では、日時フィールド、受注番号フィールド、地域フィールド、受注内容フィールドのそれぞれにつき、ステップS7乃至S13の判定結果が提示されている。なお、イベント名についてはテーブル名がイベント名とされるので、全て「否定」とされている。これを見れば、日時フィールドがタイムスタンプの可能性が高く、イベントIDまたは関連IDである可能性はいずれのフィールドも同等であることが分かる。
例えば、図5(a)及び(b)に示したようなリレーショナルデータベース形式の生産DBの場合には、図23に示すようなデータがユーザに提示される。図23の例では、日時フィールド、生産番号フィールド、受注番号フィールド、品番フィールド、納期フィールドのそれぞれにつき、ステップS7乃至S13の判定結果が提示されている。なお、イベント名についてはテーブル名がイベント名とされるので、全て「否定」とされている。これを見れば、日時フィールドがタイムスタンプのフィールドで「確定」となっており、生産番号フィールドと受注番号フィールドと品番フィールドがイベントIDまたは関連IDの可能性が高いことが分かる。
また、図10(a)に示したCSV形式の生産DBの場合には、図24に示すようなデータがユーザに提示される。図24の例では、日時フィールド、生産番号フィールド、受注番号フィールド、品番フィールド、納期フィールドのそれぞれにつき、ステップS7乃至S13の判定結果が提示されている。なお、イベント名についてはテーブル名がイベント名とされるので、全て「否定」とされている。これを見れば、日時フィールドがタイムスタンプの可能性が高く、イベントIDまたは関連IDである可能性はいずれのフィールドも同等であることが分かる。
例えば、図6(a)及び(b)に示したようなリレーショナルデータベース形式の手配DBの場合には、図25に示すようなデータがユーザに提示される。図25の例では、日時フィールド、手配番号フィールド、受注番号フィールド、品番フィールド、納品先フィールドのそれぞれにつき、ステップS7乃至S13の判定結果が提示されている。なお、イベント名についてはテーブル名がイベント名とされるので、全て「否定」とされている。これを見れば、日時フィールドがタイムスタンプのフィールドで「確定」となっており、手配番号フィールドと受注番号フィールドと品番フィールドと納品先フィールドがイベントIDまたは関連IDの可能性が高いことが分かる。
また、図11(a)に示したCSV形式の手配DBの場合には、図26に示すようなデータがユーザに提示される。図26の例では、日時フィールド、手配番号フィールド、受注番号フィールド、品番フィールド、納品先フィールドのそれぞれにつき、ステップS7乃至S13の判定結果が提示されている。なお、イベント名についてはテーブル名がイベント名とされるので、全て「否定」とされている。これを見れば、日時フィールドがタイムスタンプの可能性が高く、イベントIDまたは関連IDである可能性はいずれのフィールドも同等であることが分かる。
例えば、図7(a)及び(b)に示したようなリレーショナルデータベース形式の配送DBの場合には、図27に示すようなデータがユーザに提示される。図27の例では、日時フィールド、手配番号フィールド、配送便フィールド、納品先フィールドのそれぞれにつき、ステップS7乃至S13の判定結果が提示されている。なお、イベント名についてはテーブル名がイベント名とされるので、全て「否定」とされている。これを見れば、日時フィールドがタイムスタンプのフィールドで「確定」となっており、手配番号フィールドと配送便フィールドと納品先フィールドがイベントIDまたは関連IDの可能性が高いことが分かる。
また、図12(a)に示したCSV形式の配送DBの場合には、図28に示すようなデータがユーザに提示される。図28の例では、日時フィールド、手配番号フィールド、配送便フィールド、納品先フィールドのそれぞれにつき、ステップS7乃至S13の判定結果が提示されている。なお、イベント名についてはテーブル名がイベント名とされるので、全て「否定」とされている。これを見れば、日時フィールドがタイムスタンプの可能性が高く、イベントIDまたは関連IDである可能性はいずれのフィールドも同等であることが分かる。
例えば、図8(a)及び(b)に示したようなリレーショナルデータベース形式の品番DBの場合には、図29に示すようなデータがユーザに提示される。図29の例では、品番フィールド、品名フィールドのそれぞれにつき、ステップS7乃至S13の判定結果が提示されている。なお、品番DBはタイムスタンプがないと判断され、以降の処理対象外とされているため、イベント名については全て「否定」とされている。これを見れば、タイムスタンプのフィールドが存在する可能性が非常に低く、品番フィールドと品名フィールドはイベントIDまたは関連IDの可能性が高いことが分かる。
また、図13(a)に示したCSV形式の品番DBの場合には、図30に示すようなデータがユーザに提示される。図30の例では、品番フィールド、品名フィールドのそれぞれにつき、ステップS7乃至S13の判定結果が提示されている。なお、品番DBはタイムスタンプがないと判断され、以降の処理対象外とされているため、イベント名については全て「否定」とされている。これを見れば、タイムスタンプのフィールドが存在する可能性は非常に低く、イベントIDまたは関連IDである可能性はいずれのフィールドも同等であることが分かる。
図3の説明に戻って、ステップS15が終了すると、ユーザは、入出力部11を介して、イベント名、タイムスタンプ、イベントID・関連ID候補などについて修正入力又は確定入力を行い、レコードのコピーなどを行って又は命じて、イベント候補データを生成し、イベント候補データ生成部3にイベント候補データ格納部5へ格納させる(ステップS16)。この作業は主に又は一部ユーザによって実施されるので、図3では点線ブロックで描かれている。そして処理はステップS3に戻る。
例えば図21の判定結果に従って、図31に示すようにイベント名についてはテーブル名である「受注」を確定させ、タイムスタンプについては日時フィールドを確定させ、イベントID・関連ID候補については受注番号フィールド及び地域フィールドを確定させる場合、例えば図32に示すようなデータが、イベント候補データ格納部5に格納される。図32に示す例では、イベント名「受注」が全てのレコードに付加され、日時フィールドのフィールド値の全レコード分がタイムスタンプのフィールドにコピーされ、受注番号フィールド及び地域フィールドがイベントID・関連ID候補として、フィールド名とフィールド値の全レコード分がコピーされる。
例えば図22の判定結果に従って、イベント名についてはテーブル名である「受注」を確定させ、タイムスタンプについては日時フィールドを確定させ、イベントID・関連ID候補については受注番号フィールド及び地域フィールド及び受注内容フィールドを確定させる場合、例えば図33のようなデータが、イベント候補データ格納部5に格納される。
さらに例えば図23の判定結果に従って、イベント名についてはテーブル名である「生産」を確定させ、タイムスタンプについては日時フィールドを確定させ、イベントID・関連ID候補については生産番号フィールド及び受注番号フィールド及び品番フィールドを確定させる場合、例えば図34のようなデータが、イベント候補データ格納部5に格納される。
また例えば図24の判定結果に従って、イベント名についてはテーブル名である「生産」を確定させ、タイムスタンプについては日時フィールドを確定させ、イベントID・関連ID候補については生産番号フィールド及び受注番号フィールド及び品番フィールド及び納期フィールドを確定させる場合、例えば図35のようなデータが、イベント候補データ格納部5に格納される。
さらに例えば図25の判定結果に従って、イベント名についてはテーブル名である「手配」を確定させ、タイムスタンプについては日時フィールドを確定させ、イベントID・関連ID候補については手配番号フィールド及び受注番号フィールド及び品番フィールド及び納品先フィールドを確定させる場合、例えば図36のようなデータが、イベント候補データ格納部5に格納される。
また例えば図26の判定結果に従って、イベント名についてはテーブル名である「手配」を確定させ、タイムスタンプについては日時フィールドを確定させ、イベントID・関連ID候補については手配番号フィールド及び受注番号フィールド及び品番フィールド及び納品先フィールドを確定させる場合、例えば図37のようなデータが、イベント候補データ格納部5に格納される。
さらに例えば図27の判定結果に従って、イベント名についてはテーブル名である「配送」を確定させ、タイムスタンプについては日時フィールドを確定させ、イベントID・関連ID候補については手配番号フィールド及び配送便フィールド及び納品先フィールドを確定させる場合、例えば図38のようなデータが、イベント候補データ格納部5に格納される。
また例えば図28の判定結果に従って、イベント名についてはテーブル名である「配送」を確定させ、タイムスタンプについては日時フィールドを確定させ、イベントID・関連ID候補については手配番号フィールド及び配送便フィールド及び納品先フィールドを確定させる場合、例えば図39のようなデータが、イベント候補データ格納部5に格納される。
また、例えば図19のようなテーブル内に複数のタイムスタンプのフィールドが存在するようなテーブルを処理対象とする場合は、例えば図40乃至図44に示すようなデータが、イベント候補データ格納部5に格納される。図40乃至図44に示す例では、タイムスタンプとして確定されたフィールドである起票日時、承認日時、発注日時、納品日時、検収日時を元に、それらのフィールド毎に、各々イベント名を「起票」、「承認」、「発注」、「納品」、「検収」と確定させたイベント候補データを作成する。タイムスタンプについては、起票日時フィールド、承認日時フィールド、発注日時フィールド、納品日時フィールド、検収日時フィールドのフィールド値の全レコード分が各々のイベント候補データのタイムスタンプのフィールドにコピーされる。さらに、全てのイベント候補データ共通に、起票日時フィールド、承認日時フィールド、発注日時フィールド、納品日時フィールド、検収日時フィールド以外のフィールドについては、イベントID・関連ID候補として、フィールド名とフィールド値の全レコード分がコピーされる。
このようにして以下の処理で用いるイベント候補データがイベント候補データ格納部5に格納されるようになる。以上が本実施の形態の主要部である。なお、以下は後処理となる。後処理については人間が手動で行うようにしてもよい。
ステップS3で全ての解析対象テーブルを処理したと判断された場合には、イベントデータ生成部7は、イベント候補データ格納部5に格納されているイベント候補データを用いて、イベントデータ生成処理を実施し、処理結果をイベントデータ格納部9に格納する(ステップS17)。
受注イベント、生産イベント、手配イベント、配送イベントに対応して、各々、図32、図34、図36、図38に示されたイベント候補データのセット、または、各々、図33、図35、図37、図39に示されたイベント候補データのセットを用いて生成したイベントデータの例を図45に示す。その生成方法としては、上で述べた日本国の特願2006−197294記載のようなイベントデータの関連情報の自動抽出方式を用いても良いし、人手によって、各イベント候補データのイベントID・関連ID候補のフィールド値の対応関係を調査・分析することによって、イベント間の関連性を確定しても良い。
図45では、受注イベントのイベントIDは受注番号であり、生産イベントのイベントIDは生産番号、関連IDは受注番号であり、手配イベントのイベントIDは手配番号、関連IDは受注番号であり、配送イベントのイベントIDは手配番号、関連IDは配送便であることが確定されている。また、生産イベントの関連IDのフィールド値が、受注イベントのイベントIDのフィールド値のどれかの値をとることにより、生産イベントの各々のレコード(すなわち、イベントインスタンス)が、受注イベントのどのレコード(すなわち、イベントインスタンス)と関連しているかが特定されるというイベント間の関連性が確定されている。同様の関連性が、手配イベントの関連IDと受注イベントのイベントIDとの間、配送イベントのイベントIDと手配イベントのイベントIDとの間に確定されている。
また、プロセスインスタンス生成部13は、イベントデータ格納部9に格納されているイベントデータを用いてプロセスインスタンス生成処理を実施し、処理結果をプロセスインスタンスデータ格納部15に格納する(ステップS19)。その生成方法としては、米国特許公開公報2005/076059A1のような業務プロセストラッキング方法等を用いることができる
図45のイベントデータを用いて、受注番号:JT01の受注イベントインスタンスを起点とするプロセスインスタンスを生成する処理過程の概略説明を図46に示す。最初に、関連IDのフィールド値受注イベントのイベントIDである受注番号のフィールド値:JT01をとるレコード(すなわち、イベントインスタンス)として、生産イベントから2つ、手配イベントから3つのイベントインスタンスが確定される。次に、記確定された手配イベントのイベントIDである手配番号:TH01,TH02,TH03を関連IDのフィールド値としてとるレコード(すなわち、イベントインスタンス)として、配送イベントから3つのイベントインスタンスが確定される。最後に、前記確定された、受注番号:JT01の受注イベントインスタンスを起点として、直接・間接的に関連性をもつイベントインスタンスを、そのタイムスタンプの値に基いて時間経過の順につなぎ合わせることによって、プロセスインスタンスが生成される。
同様にして、図5のイベントデータを用いて、生成した全プロセスインスタンスを図47に示す。
さらに、プロセスフロー生成部17は、プロセスインスタンスデータ格納部15に格納されているデータを用いてプロセスフロー生成処理を実施し、処理結果をプロセスフローデータ格納部19に格納する(ステップS21)。その生成方法としては、上で述べた特願2006−136518記載のような業務モデル生成プログラムの処理方法等を用いることができる。
図47の全プロセスインスタンスを重ね合わせて生成したプロセスフローを図48に示す。図の丸はイベントクラス(すなわち、イベントの種類)を示し、矢印は業務プロセスの中で発生したイベント間の遷移を示す。
最後に、プロセス分析部21は、プロセスフローデータ格納部19に格納されているデータを用いてプロセス分析処理を実施し、処理結果を分析結果格納部23に格納する(ステップS23)。その分析方法としては、上で述べた特願2006−136518記載のような業務モデル生成プログラムの分析方法等を用いることができる。
図47の全プロセスインスタンスを元に、業務プロセスの分析を行た例を図49に示す。出現頻度が高いプロセスインスタンスの上位から50%の重ね合わせ即ち、図47のプロセスインスタンスの2番目と3番目を重ね合わせることで、解析対象の業務プロセスの主要フローの分析のための表示を行ことができる。また、その主要フロー表示に、例外フローとして、図47のプロセスインスタンスの1番目を重ね合わせることによって、想定外のイベント間の遷移を発見するための表示を行ことができる。図49の表示からは、配送イベントから生産イベントへの手戻り発生を疑わせるイベント間の遷移を発見することができる。
以上のような処理を実施し、入出力部11は、各処理部の処理結果をユーザに対して提示する(ステップS25)。
このような処理を実施することによって、ユーザは、業務システムに手を加えることなく、その業務システムのデータをコピーするだけで業務プロセスの分析を実施できるようになる。また、業務システムのデータは、RDBであってもCSVであってもよい。さらに他の形式であっても、上で述べたような技術思想に基づき対処可能である。
また、図3の処理フローにおいて、ステップS7乃至S1については順番の入れ替えが可能であり、また並列に実施するようにしてもよい。
また、判定結果の出力では、各判定項目において「確定」判定や所定の閾値以上の確度スコアとなっているフィールドを自動的に選択してユーザに提示し、自動選択できない判定項目についてユーザに選択又は入力を促すようにしてもよい。
さらに、処理対象フィールドについてのループは、ステップS7乃至S1内の各々で構成されているが、ステップS7乃至S1の外側に処理対象フィールドについてのループを出すようにしてもよい。
図3の変形例を図50に示す。まず、ユーザは、業務システムにおける解析対象テーブルの指定を行い、そのデータをコピーして分析対象データ格納部1に格納させる(図50:ステップS111)。ユーザの動作であるから図50においては点線ブロックで表されている。次に、例えばイベント候補データ生成部3は、全ての解析対象テーブルについて処理したか判断する(ステップS113)。
未処理の解析対象テーブルが存在する場合には、例えばイベント候補データ生成部3は、未処理の解析対象テーブルを特定する(ステップS115)。そして、タイムスタンプ処理部31は、タイムスタンプ判定処理を実施する(ステップS117)。この処理は図14の処理フローと同様である。さらに、イベント名処理部34は、イベント名判定処理を実施する(ステップS119)。この処理も図18の処理フローと同じである。このように本実施の形態では、イベント名判定処理の実施タイミングを繰り上げている。
その後、イベントID・関連ID候補処理部32は、イベントID及び関連ID候補判定処理を実施する(ステップS121)。この処理も図16の処理フローと同様である。
そして、イベント候補データ生成部3は、入出力部11を介してステップS117乃至S121の判定結果をユーザに提示する(ステップS125)。提示する内容についても、上で述べた例と同様である。ステップS125が終了すると、ユーザは、入出力部11を介して、イベント名、タイムスタンプ、イベントID・関連ID候補などについて修正入力又は確定入力を行い、レコードのコピーなどを行って又は命じて、イベント候補データを生成し、イベント候補データ生成部3にイベント候補データ格納部5へ格納させる(ステップS127)。この作業は主に又は一部ユーザによって実施されるので、図50では点線ブロックで描かれている。そして処理はステップS113に戻る。
ステップS113で全ての解析対象テーブルを処理したと判断された場合には、イベントデータ生成部7は、イベント候補データ格納部5に格納されているイベント候補データを用いて、イベントデータ生成処理を実施し、処理結果をイベントデータ格納部9に格納する(ステップS129)。
また、プロセスインスタンス生成部13は、イベントデータ格納部9に格納されているイベントデータを用いてプロセスインスタンス生成処理を実施し、処理結果をプロセスインスタンスデータ格納部15に格納する(ステップS131)。
さらに、プロセスフロー生成部17は、プロセスインスタンスデータ格納部15に格納されているデータを用いてプロセスフロー生成処理を実施し、処理結果をプロセスフローデータ格納部19に格納する(ステップS133)。
最後に、プロセス分析部21は、プロセスフローデータ格納部19に格納されているデータを用いてプロセス分析処理を実施し、処理結果を分析結果格納部23に格納する(ステップS135)。
以上のような処理を実施し、入出力部11は、各処理部の処理結果をユーザに対して提示する(ステップS137)。
このような処理を実施することによって、ユーザは、業務システムに手を加えることなく、本来業務のためのデータ処理の結果及び運用管理のために記録しているデータを業務システムから収集するだけで業務プロセスの分析を実施できるようになる。また、業務システムのデータは、RDBであってもCSVであってもよい。さらに他の形式であっても、上で述べたような思想に基づき対処可能である。
また、判定結果の出力では、各判定項目において「確定」判定や所定の閾値以上の確度スコアとなっているフィールドを自動的に選択してユーザに提示し、自動選択できない判定項目についてユーザに選択又は入力を促すようにしてもよい。
さらに、処理対象フィールドについてのループは、ステップS121内で構成されているが、ステップS121の外側に処理対象フィールドについてのループを出すようにしてもよい。
さらに、図3の場合も図50の場合も、自動的にイベント候補データからイベントデータを生成するのではなく(すなわちステップS17又はステップS129を実施するのではなく)、ユーザが例えばステップS15又はS125の出力をベースに検討して、ステップS16又はS127において、イベント候補データを経ずにイベントデータを生成するようにしてもよい。すなわち、ID間の関連付けまでユーザが自らのスキルをもって指定入力して、当該データをイベントデータ格納部9に格納するようにしてもよい。
以上本発明の一実施の形態について説明したが、本発明はこれに限定されるものではない。例えば図1に示した機能ブロック図は一例であって、必ずしも実際のプログラムモジュールに対応しない。また、各スコア表も一例であって、確度スコア値の設定の仕方は、経験的にさらに細かく決定される場合もある。さらに、スコア表の項目についても、より少ない項目が設定される場合もあれば、より多くの項目が設定される場合もある。
なお、業務システム分析装置は、コンピュータ装置であって、図51に示すように、メモリ2501とCPU2503とハードディスク・ドライブ(HDD)2505と表示装置2509に接続される表示制御部2507とリムーバブル・ディスク2511用のドライブ装置2513と入力装置2515とネットワークに接続するための通信制御部2517とがバス2519で接続されている。オペレーティング・システム(OS:Operating System)及び本実施例における処理を実施するためのアプリケーション・プログラムは、HDD2505に格納されており、CPU2503により実行される際にはHDD2505からメモリ2501に読み出される。必要に応じてCPU2503は、表示制御部2507、通信制御部2517、ドライブ装置2513を制御して、必要な動作を行わせる。また、処理途中のデータについては、メモリ2501に格納され、必要があればHDD2505に格納される。本発明の実施例では、上で述べた処理を実施するためのアプリケーション・プログラムはリムーバブル・ディスク2511に格納されて頒布され、ドライブ装置2513からHDD2505にインストールされる。インターネットなどのネットワーク及び通信制御部2517を経由して、HDD2505にインストールされる場合もある。このようなコンピュータ装置は、上で述べたCPU2503、メモリ2501などのハードウエアとOS及び必要なアプリケーション・プログラムとが有機的に協働することにより、上で述べたような各種機能を実現する。

Claims (8)

  1. 解析対象システムにより生成され且つデータ格納部に格納されているレコードにおける処理対象フィールドを特定するステップと、
    前記処理対象フィールドがイベントのタイムスタンプである蓋然性を表す確度スコアを特定する蓋然性データ特定ステップと、
    を含み、コンピュータに実行され
    前記蓋然性データ特定ステップが、
    フィールドのフィールド値が有する特性と、当該特性を有するフィールド値を含むフィールドがイベントのタイムスタンプである蓋然性を表す確度スコアとを対応付けて格納する確度スコア表から、前記処理対象フィールドのフィールド値が有する特性に対応する確度スコアを特定する、
    情報処理方法。
  2. 解析対象システムにより生成され且つデータ格納部に格納されているレコードにおける処理対象フィールドを特定するステップと、
    前記処理対象フィールドのフィールド値が全てのレコードで一意であり、且つ、前記処理対象フィールドのフィールド値にNULLが含まれていない場合、当該処理対象フィールドがイベントのイベントIDである蓋然性を表す確度スコアを特定する蓋然性データ特定ステップと、
    を含み、コンピュータにより実行され
    前記蓋然性データ特定ステップが、
    フィールドのデータ型又はフィールドが有する特性と、当該データ型のフィールド又は当該特性を有するフィールドがイベントのイベントIDである蓋然性を表す確度スコアとを対応付けて格納する確度スコア表から、前記処理対象フィールドのデータ型又は前記処理対象フィールドが有する特性に対応する確度スコアを特定する、
    情報処理方法。
  3. 解析対象システムにより生成され且つデータ格納部に格納されているレコードにおける処理対象フィールドを特定するステップと、
    前記処理対象フィールドのフィールド値がNULLを除いて2以上の値を有する場合、当該処理対象フィールドがイベントの関連IDである蓋然性を表す確度スコアを特定する蓋然性データ特定ステップと、
    を含み、コンピュータにより実行され
    前記蓋然性データ特定ステップが、
    フィールドのデータ型又はフィールドが有する特性と、当該データ型のフィールド又は当該特性を有するフィールドがイベントの関連IDである蓋然性を表す確度スコアとを対応付けて格納する確度スコア表から、前記処理対象フィールドのデータ型又は前記処理対象フィールドが有する特性に対応する確度スコアを特定する、
    情報処理方法。
  4. 解析対象システムにより生成され且つデータ格納部に格納されているレコードにおける各フィールドについて、当該各フィールドがイベントのタイムスタンプである蓋然性を表す確度スコアを特定する蓋然性データ特定ステップと、
    前記イベントのタイムスタンプである蓋然性を表す確度スコア所定値以上であるフィールド又は前記イベントのタイムスタンプである蓋然性を表す確度スコアに基づきユーザによってタイムスタンプであると指定されたフィールドを特定するステップと、
    特定された前記フィールドの数が単数である場合は、当該フィールドが含まれるテーブル名をイベント名として特定し、複数である場合は、当該フィールドのフィールド名の少なくとも一部の文字列によりイベント名を特定するイベント名特定ステップと、
    を含み、コンピュータにより実行され
    前記蓋然性データ特定ステップが、
    フィールドのデータ型又はフィールドが有する特性と、当該データ型のフィールド又は当該特性を有するフィールドがイベントのタイムスタンプである蓋然性を表す確度スコアとを対応付けて格納する確度スコア表から、前記処理対象フィールドのデータ型又は前記処理対象フィールドが有する特性に対応する確度スコアを特定する、
    情報処理方法。
  5. 解析対象システムにより生成され且つデータ格納部に格納されているレコードにおける処理対象フィールドを特定する手段と、
    前記処理対象フィールドがイベントのタイムスタンプである蓋然性を表す確度スコアを特定する蓋然性データ特定手段と、
    を有し、
    前記蓋然性データ特定手段が、
    フィールドのフィールド値が有する特性と、当該特性を有するフィールド値を含むフィールドがイベントのタイムスタンプである蓋然性を表す確度スコアとを対応付けて格納する確度スコア表から、前記処理対象フィールドのフィールド値が有する特性に対応する確度スコアを特定する、
    情報処理装置。
  6. 解析対象システムにより生成され且つデータ格納部に格納されているレコードにおける処理対象フィールドを特定する手段と、
    前記処理対象フィールドのフィールド値が全てのレコードで一意であり、且つ、前記処理対象フィールドのフィールド値にNULLが含まれていない場合、当該処理対象フィールドがイベントのイベントIDである蓋然性を表す確度スコアを特定する蓋然性データ特定手段と、
    を有し、
    前記蓋然性データ特定手段が、
    フィールドのデータ型又はフィールドが有する特性と、当該データ型のフィールド又は当該特性を有するフィールドがイベントのイベントIDである蓋然性を表す確度スコアとを対応付けて格納する確度スコア表から、前記処理対象フィールドのデータ型又は前記処理対象フィールドが有する特性に対応する確度スコアを特定する、
    情報処理装置。
  7. 解析対象システムにより生成され且つデータ格納部に格納されているレコードにおける処理対象フィールドを特定する手段と、
    前記処理対象フィールドのフィールド値がNULLを除いて2以上の値を有する場合、当該処理対象フィールドがイベントの関連IDである蓋然性を表す確度スコアを特定する蓋然性データ特定手段と、
    を有し、
    前記蓋然性データ特定手段が、
    フィールドのデータ型又はフィールドが有する特性と、当該データ型のフィールド又は当該特性を有するフィールドがイベントの関連IDである蓋然性を表す確度スコアとを対応付けて格納する確度スコア表から、前記処理対象フィールドのデータ型又は前記処理対象フィールドが有する特性に対応する確度スコアを特定する、
    情報処理装置。
  8. 解析対象システムにより生成され且つデータ格納部に格納されているレコードにおける各フィールドについて、当該各フィールドがイベントのタイムスタンプである蓋然性を表す確度スコアを特定する蓋然性データ特定手段と、
    前記イベントのタイムスタンプである蓋然性を表す確度スコアが所定値以上であるフィールド又は前記イベントのタイムスタンプである蓋然性を表す確度スコアに基づきユーザによってタイムスタンプであると指定されたフィールドを特定する手段と、
    特定された前記フィールドの数が単数である場合は、当該フィールドが含まれるテーブル名をイベント名として特定し、複数である場合は、当該フィールドのフィールド名の少なくとも一部の文字列によりイベント名を特定するイベント名特定手段と、
    を有し、
    前記蓋然性データ特定手段が、
    フィールドのデータ型又はフィールドが有する特性と、当該データ型のフィールド又は当該特性を有するフィールドがイベントのタイムスタンプである蓋然性を表す確度スコアとを対応付けて格納する確度スコア表から、前記処理対象フィールドのデータ型又は前記処理対象フィールドが有する特性に対応する確度スコアを特定する、
    情報処理装置。
JP2008534195A 2006-09-15 2006-09-15 業務プロセス分析のための情報処理方法及び装置 Active JP4832523B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2006/318334 WO2008032393A1 (en) 2006-09-15 2006-09-15 Information processing method and device for work process analysis

Publications (2)

Publication Number Publication Date
JPWO2008032393A1 JPWO2008032393A1 (ja) 2010-01-21
JP4832523B2 true JP4832523B2 (ja) 2011-12-07

Family

ID=39183464

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008534195A Active JP4832523B2 (ja) 2006-09-15 2006-09-15 業務プロセス分析のための情報処理方法及び装置

Country Status (5)

Country Link
US (1) US8224762B2 (ja)
EP (1) EP2063384A4 (ja)
JP (1) JP4832523B2 (ja)
KR (1) KR101125911B1 (ja)
WO (1) WO2008032393A1 (ja)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7631019B2 (en) * 2007-05-31 2009-12-08 Red Hat, Inc. Distributing data across different backing data stores
JP5169560B2 (ja) * 2008-07-11 2013-03-27 富士通株式会社 業務フロー処理プログラム、方法及び装置
WO2010004643A1 (ja) * 2008-07-11 2010-01-14 富士通株式会社 業務フロー分析プログラム、方法及び装置
EP2325791A4 (en) * 2008-08-15 2012-08-01 Fujitsu Ltd SYSTEM AND METHOD FOR DISTRIBUTED WORKFLOW PROCESSING
US8032550B2 (en) * 2009-05-11 2011-10-04 Red Hat, Inc. Federated document search by keywords
US8032551B2 (en) * 2009-05-11 2011-10-04 Red Hat, Inc. Searching documents for successive hashed keywords
US8037076B2 (en) * 2009-05-11 2011-10-11 Red Hat, Inc. Federated indexing from hashed primary key slices
JP5316216B2 (ja) * 2009-05-18 2013-10-16 富士通株式会社 対応付け処理方法及びフロー比較処理装置
JP5246031B2 (ja) * 2009-05-20 2013-07-24 富士通株式会社 業務フロー処理プログラム、方法及び装置
US8739125B2 (en) * 2009-06-16 2014-05-27 Red Hat, Inc. Automated and unattended process for testing software applications
US8560481B2 (en) * 2009-11-17 2013-10-15 Gregory P. Naifeh Method and apparatus for analyzing system events
US8375352B2 (en) * 2010-02-26 2013-02-12 GM Global Technology Operations LLC Terms management system (TMS)
EP2682904A1 (en) * 2011-12-28 2014-01-08 IPS Co., Ltd. Portable terminal management server and portable terminal management program
US20160071043A1 (en) * 2014-09-04 2016-03-10 International Business Machines Corporation Enterprise system with interactive visualization
US11567929B2 (en) * 2020-02-06 2023-01-31 Adobe Inc. Stitching event data using identity mappings
CN113095064A (zh) * 2021-03-18 2021-07-09 杭州数梦工场科技有限公司 代码字段识别方法、装置、电子设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63217465A (ja) * 1987-03-03 1988-09-09 インターナシヨナル・ビジネス・マシーンズ・コーポレーシヨン 情報抽出方法
JP2005115494A (ja) * 2003-10-03 2005-04-28 Fujitsu Ltd 業務プロセストラッキング装置,業務プロセストラッキング方法,業務プロセストラッキングプログラム,業務プロセストラッキングプログラムを記録した記録媒体
JP2005165826A (ja) * 2003-12-04 2005-06-23 Nippon Telegr & Teleph Corp <Ntt> データ入力支援方法とそのシステム、プログラム及び端末装置
JP2005173847A (ja) * 2003-12-10 2005-06-30 Fujitsu Ltd 情報検索装置、情報検索方法、プログラム及び該プログラムを記録した記録媒体
JP2006134106A (ja) * 2004-11-05 2006-05-25 Hammock:Kk 帳票認識システム、帳票認識方法及びコンピュータプログラム

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4965763A (en) 1987-03-03 1990-10-23 International Business Machines Corporation Computer method for automatic extraction of commonly specified information from business correspondence
US5809500A (en) * 1997-02-26 1998-09-15 Century Technology Services, Inc. System for converting programs and databases to correct year 2000 processing errors
US6195622B1 (en) * 1998-01-15 2001-02-27 Microsoft Corporation Methods and apparatus for building attribute transition probability models for use in pre-fetching resources
US6457014B1 (en) * 1999-03-26 2002-09-24 Computer Associates Think, Inc. System and method for extracting index key data fields
US7032816B2 (en) * 2001-12-28 2006-04-25 Kimberly-Clark Worldwide, Inc. Communication between machines and feed-forward control in event-based product manufacturing
US7380213B2 (en) * 2001-12-28 2008-05-27 Kimberly-Clark Worldwide, Inc. User interface for reporting event-based production information in product manufacturing
US20040254919A1 (en) * 2003-06-13 2004-12-16 Microsoft Corporation Log parser
JP2006197294A (ja) 2005-01-14 2006-07-27 Epson Toyocom Corp 対称インバーター対圧電発振器
WO2007132547A1 (ja) 2006-05-16 2007-11-22 Fujitsu Limited 業務モデル生成プログラム、業務モデル生成方法および業務モデル生成装置
JP4997856B2 (ja) 2006-07-19 2012-08-08 富士通株式会社 データベース分析プログラム、データベース分析装置、データベース分析方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63217465A (ja) * 1987-03-03 1988-09-09 インターナシヨナル・ビジネス・マシーンズ・コーポレーシヨン 情報抽出方法
JP2005115494A (ja) * 2003-10-03 2005-04-28 Fujitsu Ltd 業務プロセストラッキング装置,業務プロセストラッキング方法,業務プロセストラッキングプログラム,業務プロセストラッキングプログラムを記録した記録媒体
JP2005165826A (ja) * 2003-12-04 2005-06-23 Nippon Telegr & Teleph Corp <Ntt> データ入力支援方法とそのシステム、プログラム及び端末装置
JP2005173847A (ja) * 2003-12-10 2005-06-30 Fujitsu Ltd 情報検索装置、情報検索方法、プログラム及び該プログラムを記録した記録媒体
JP2006134106A (ja) * 2004-11-05 2006-05-25 Hammock:Kk 帳票認識システム、帳票認識方法及びコンピュータプログラム

Also Published As

Publication number Publication date
WO2008032393A1 (en) 2008-03-20
JPWO2008032393A1 (ja) 2010-01-21
EP2063384A1 (en) 2009-05-27
US20090177610A1 (en) 2009-07-09
KR101125911B1 (ko) 2012-03-26
EP2063384A4 (en) 2011-07-13
KR20090033274A (ko) 2009-04-01
US8224762B2 (en) 2012-07-17

Similar Documents

Publication Publication Date Title
JP4832523B2 (ja) 業務プロセス分析のための情報処理方法及び装置
JP3302522B2 (ja) データベースシステムおよびその情報活用支援装置
US8024305B2 (en) Updating a data warehouse schema based on changes in an observation model
US20110161132A1 (en) Method and system for extracting process sequences
US9223815B2 (en) Method, apparatus, and program for supporting creation and management of metadata for correcting problem in dynamic web application
US10915563B2 (en) Analysis server device, data analysis system, and data analysis method
JP5012911B2 (ja) 業務フロー処理プログラム、方法及び装置
JP5169560B2 (ja) 業務フロー処理プログラム、方法及び装置
Kruse et al. Estimating Data Integration and Cleaning Effort.
US8335759B2 (en) Work analysis device and recording medium recording work analysis program
JP2010271806A (ja) 業務フロー処理プログラム、方法及び装置
US20110078218A1 (en) Event history storage device, event history tracking device, event history storage method, event history storage program, and data structure
JP4954674B2 (ja) ソフトウェア開発支援方法、ソフトウェア開発支援装置、ソフトウェア開発支援プログラム、及び計算機システム
JP6336922B2 (ja) 業務バリエーションに基づく業務影響箇所抽出方法および業務影響箇所抽出装置
US11816112B1 (en) Systems and methods for automated process discovery
WO2019012674A1 (ja) プログラムの統合解析管理装置及びその統合解析管理方法
WO2023199871A1 (ja) 情報管理システム及び選択肢管理装置
US11704370B2 (en) Framework for managing features across environments
JP4181330B2 (ja) 要約作成プログラム及びシステム並びにコンピュータによる要約作成方法
Lee Can an LLM find its way around a Spreadsheet?
CN118154031A (zh) 一种多模态的创业项目产品独特性评估与产品改进方法
JP2023164078A (ja) 故障復旧支援システム、および、故障復旧支援方法
CN115860010A (zh) 一种话题挖掘方法及相关装置
AU2012202032A1 (en) A web server, client computing device, computer implemented method and computer readable storage medium for processing intellectual property data

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110531

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110729

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110920

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110920

R150 Certificate of patent or registration of utility model

Ref document number: 4832523

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140930

Year of fee payment: 3