JP2010271959A - 業務プロセス間の類似度算出方法、プログラム及び装置 - Google Patents
業務プロセス間の類似度算出方法、プログラム及び装置 Download PDFInfo
- Publication number
- JP2010271959A JP2010271959A JP2009123659A JP2009123659A JP2010271959A JP 2010271959 A JP2010271959 A JP 2010271959A JP 2009123659 A JP2009123659 A JP 2009123659A JP 2009123659 A JP2009123659 A JP 2009123659A JP 2010271959 A JP2010271959 A JP 2010271959A
- Authority
- JP
- Japan
- Prior art keywords
- group
- business
- event
- data
- events
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
【課題】並列且つ独立に実施された業務イベントを含む業務プロセス間の適切な類似度を算出する。
【解決手段】比較元となる業務プロセスと比較先となる業務プロセスとの各々について、当該業務プロセスに含まれる業務イベントを、業務イベントの属性に基づくグループ別に時刻順でソートし、グループ毎に当該グループに対する直前グループ及び直後グループのうち少なくともいずれかを特定する。そして、グループのソート結果と、当該グループに対する直前グループ及び直後グループのうち少なくともいずれかを表すデータとの対を、比較元の業務プロセスと比較先の業務プロセスとで比較することにより、業務プロセス間で一致するグループ数を計数し、計数されたグループ数から業務プロセス間の類似度を算出する。
【選択図】図6
【解決手段】比較元となる業務プロセスと比較先となる業務プロセスとの各々について、当該業務プロセスに含まれる業務イベントを、業務イベントの属性に基づくグループ別に時刻順でソートし、グループ毎に当該グループに対する直前グループ及び直後グループのうち少なくともいずれかを特定する。そして、グループのソート結果と、当該グループに対する直前グループ及び直後グループのうち少なくともいずれかを表すデータとの対を、比較元の業務プロセスと比較先の業務プロセスとで比較することにより、業務プロセス間で一致するグループ数を計数し、計数されたグループ数から業務プロセス間の類似度を算出する。
【選択図】図6
Description
本技術は、業務プロセス分析技術に関する。
例えば、業務プロセスの分析を行う場合、図27に示すように、最も多く発生した業務イベント(以下、単にイベントと呼ぶ場合もある)の流れを把握するため、業務プロセス間の同一性を判断する必要がある。なお、ここでイベントとは、ある業務が実施されたことを示すものであり、イベント名、発生日時、業務上のキーなどの情報を持つ。
例えば、実施されたイベントを業務プロセス毎に時系列に並べ、イベントの並びが初めから終わりまで完全に一致するか否かによって業務プロセス間の同一性を判断する技術が存在する。すなわち、この技術では、図28に示すような直列的なフローに従って業務プロセス間の同一性を判断する。
しかしながら、実際には、図29に示すように、イベントaの後に、イベントb及びcと、イベントd及びe(プロセス2では、イベントd及びf)とが並列に実施されているかもしれない。例えば、図29において、分岐後の左側のフロー(「b」−>「c」)に着目してみると、受注工程からの一連のフロー(「a」−>「b」−>「c」)は、プロセス1とプロセス2において一致している。すなわち、この場合、プロセス1とプロセス2は、受注工程から生産工程までの一連のフローについて、一部一致しているものと考えられる。しかしながら、上で述べた技術では、このような並列実施部分を識別することは非常に困難であるため、プロセス1とプロセス2は全体として不一致と判断されてしまう。また、上で述べた技術では、業務プロセス間に、一致する一連のフローがあるか否かを適切に判断できないため、業務プロセス間の適切な類似度を算出することもできない。
以上のように、従来技術では、並列且つ独立に実施されたイベントを含む業務プロセス間の適切な類似度を算出することができない。
従って、本技術の目的は、並列且つ独立に実施されたイベントを含む業務プロセス間の適切な類似度を算出するための技術を提供することである。
本業務プロセス間の類似度算出方法は、並列且つ独立に実施されたイベントを含む複数の業務イベントで表される業務プロセス間の類似度を算出する方法であり、業務イベント毎に当該業務イベントが属する業務プロセスの識別子と当該業務イベントの所定属性名及び当該所定属性名の属性値に基づくグループの識別子と時刻情報とを格納するイベントデータ格納部から、比較元となる第1の業務プロセスに属する業務イベントを抽出し、抽出した業務イベントのグループである第1のグループ毎に、抽出した業務イベントを時刻順にソートするステップと、第1のグループの所定属性名と、第1のグループ内の業務イベントの時刻情報とによって特定される、第1のグループ間の関係に基づき、各第1のグループについて、当該第1のグループに対する直前グループ及び直後グループのうち少なくともいずれかを特定し、特定された直前グループを表すデータと特定された直後グループを表すデータとのうち少なくともいずれかを第1の付加データとして、当該第1のグループのソート結果に対応付けて記憶装置に格納する第1前後グループ特定ステップと、イベントデータ格納部から、比較先となる第2の業務プロセスに属する業務イベントを抽出し、抽出した業務イベントのグループである第2のグループ毎に、抽出した業務イベントを時刻順にソートするステップと、第2のグループの所定属性名と、第2のグループ内の業務イベントの時刻情報とによって特定される、第2のグループ間の関係に基づき、各第2のグループについて、当該第2のグループに対する直前グループ及び直後グループのうち少なくともいずれかを特定し、特定された直前グループを表すデータと特定された直後グループを表すデータとのうち少なくともいずれかを第2の付加データとして、当該第2のグループのソート結果に対応付けて記憶装置に格納する第2前後グループ特定ステップと、記憶装置に格納された、第1のグループのソート結果と第1の付加データとの対と、記憶装置に格納された、第2のグループのソート結果と第2の付加データとの対とを比較することにより一致グループ数を計数し、一致グループ数から第1の業務プロセスと第2の業務プロセス間の類似度を算出する類似度算出ステップとを含む。
並列且つ独立に実施されたイベントを含む業務プロセス間の適切な類似度を算出することができる。
例えば図1に示すような、並列実施部分を含む業務フローを想定した場合に、業務プロセス間の類似度を算出する方法として、次のような方法が考えられる。第1の方法として、図2に示すような、イベントをノードとするフロー図を生成し、ノードのトポロジを比較することにより、一致するノードの割合を類似度として算出する方法がある。本方法によれば、図2に示すように、5ノード中、4ノードが一致する(類似度=4/5)と判断される。
また、第2の方法として、例えば業務上のキーなどに従って、図3に示すようにイベントをグループ化し、一致するグループの割合を類似度として算出する方法がある。なお、図3は、プロセスX内のイベントを、グループ301とグループ302とグループ303とに分類し、プロセスY内のイベントを、グループ304とグループ305とグループ306とに分類した例を示す。図3では、グループ302とグループ305とが一致しており、さらにグループ303とグループ306とが一致している。すなわち、本方法によれば、3グループ中、2グループが一致する(類似度=2/3)と判断される。
しかしながら、図1に示した業務フローでは、生産工程同士は一致しているが、直前の受注工程のイベント(「受注」と「計画」)は異なっているので、受注工程から生産工程までの一連のフローは、いずれも一致していない。上で述べた第1の方法及び第2の方法では、分岐前のイベントを考慮するようにはなっておらず、一致する一連のフローが業務プロセス間に全く存在しない場合にも、一部一致することを示す値が類似度として算出されてしまう。すなわち、上で述べた第1の方法及び第2の方法では、必ずしも適切な類似度を算出できるとは言えない。
そこで、本実施の形態では、例えば業務上のキーなどに従ってイベントをグループ化し、各グループについて、前後のグループや前後のイベントを含めて業務プロセス間で一致するか否かを判断する。例えば、前後のイベントを含めてグループの一致判断を行う場合の一例を図4及び図5に示す。図4に示すようにイベントが受注グループと生産グループとにグループ化された場合、受注グループについては、受注グループ内のイベントと、直後のグループである生産グループ内の先頭イベントとを比較用データとして抽出する。また、生産グループについては、生産グループ内のイベントと、直前のグループである受注グループ内の最後尾イベントとを比較用データとして抽出する。例えば図5に示すようなデータが抽出される。そして、図5に示す比較用データに基づき、各グループが一致するか否か判断する。図5の例では、比較元プロセスにおける受注グループの比較用データ(すなわち、「受注」−>「設計」−>「生産」というイベントの並びを示すデータ)と一致するデータが、比較先プロセスにも存在するため、受注グループは一致すると判断される。また、比較元プロセスにおける生産グループの比較用データ(すなわち、「設計」−>「生産」−>「配送」というイベントの並びを示すデータ)と一致するデータは、比較先プロセスには存在しないため、生産グループは不一致と判断される。図4及び図5の例では、一致グループ数は1であり、グループの総数で除した値を類似度として算出する。その後、一致グループ数を、比較元プロセス又は比較先プロセス内のグループの総数で除した値を業務プロセス間の類似度として算出する。例えば図4及び5の例では、類似度=1/2となる。以下、本技術の一実施の形態を説明する。
図6に、本技術の一実施の形態に係るプロセス類似度算出装置の機能ブロック図の一例を示す。図6の例では、プロセス類似度算出装置は、CSV(Comma Separated Value)ファイル格納部1と、イベントデータ管理部3と、プロセステーブル格納部5と、イベントテーブル格納部7と、グループ管理部9と、グループテーブル格納部11と、入力部13と、比較用データ生成部15と、比較用データ格納部17と、類似度算出部19と、類似度格納部21と、出力部23とを有する。
なお、イベントデータ管理部3は、CSVファイル格納部1に格納され且つイベントデータを含むCSVファイルからイベントデータを読み出し、プロセステーブル格納部5及びイベントテーブル格納部7にレコードを追加する。また、イベントデータ管理部3は、読み出したイベントデータをグループ管理部9に出力する。グループ管理部9は、イベントデータ管理部3からイベントデータを受信すると、グループテーブル格納部11に格納されているデータに基づきイベントが属するグループを特定し、グループIDをイベントテーブル格納部7に登録する。また、グループ管理部9は、イベントがいずれのグループにも属さない場合には、そのイベントに対応する新たなグループをグループテーブル格納部11に登録する。入力部13は、ユーザから比較元プロセス及び比較先プロセスの選択入力を受け付け、選択データを比較用データ生成部15に出力する。比較用データ生成部15は、入力部13から選択データを受信すると、後で説明する比較用データ生成処理を実施し、生成した比較用データを比較用データ格納部17に格納する。また、比較用データ生成部15は、比較用データ生成処理が完了すると、類似度算出部19に類似度算出指示を出力する。類似度算出部19は、比較用データ生成部15から類似度算出指示を受信すると、イベントテーブル格納部7とグループテーブル格納部11と比較用データ格納部17とに格納されているデータを用いて業務プロセス間の類似度を算出し、算出した類似度を類似度格納部21に格納する。出力部23は、プロセステーブル格納部5に格納されているデータに基づきプロセス一覧データを生成して出力したり、類似度格納部21に格納されているデータに基づき類似度一覧データを生成して出力したりする。
また、比較用データ生成部15は、グループ内のイベントを時刻順にソートするイベントソート部151と、直前グループ及び直後グループを特定する前後グループ特定部153とを有する。
CSVファイル格納部1に格納されるデータの一例を図7(a)及び(b)に示す。なお、CSVファイル格納部1には、図7(a)に示すような、カンマで区切られたデータが格納されるが、見やすいように図7(b)に示すようなテーブルで表すものとする。図7(b)に示すテーブルには、CSVファイル格納部1には、プロセスIDの列と、キー名の列と、キー値の列と、イベント名の列と、時刻情報の列とが含まれる。その他の属性情報がさらに含まれる場合もある。なお、実施されたイベントのデータがCSVファイルに次々と書き込まれる。
また、プロセステーブル格納部5に格納されるプロセステーブルの一例を図8に示す。図8の例では、プロセステーブルには、プロセスIDが格納される。
また、イベントテーブル格納部7に格納されるイベントテーブルの一例を図9に示す。図9の例では、イベントテーブルには、イベントIDの列と、プロセスIDの列と、グループIDの列と、イベント名の列と、時刻情報の列とが含まれる。なお、その他の属性情報がさらに含まれる場合もある。詳細は後で説明するが、プロセスID、イベント名及び時刻情報の各列には、CSVファイル格納部1から読み出されたデータが設定される。また、イベントIDの列には、各イベントを識別可能な番号が設定される。さらに、グループIDの列には、以下で説明するグループテーブル(図10)におけるグループIDのいずれかが設定される。
また、グループテーブル格納部11に格納されるグループテーブルの一例を図10に示す。図10の例では、グループテーブルには、グループIDの列と、プロセスIDの列と、キー名の列と、キー値の列とが含まれる。なお、キー名及びキー値の列には、CSVファイル格納部1から読み出されたデータが設定される。また、グループIDの列には、各グループを識別可能な番号が設定される。
次に、図6に示したプロセス類似度算出装置の処理内容を図11乃至図26を用いて説明する。プロセス類似度算出装置は、類似度算出処理の前処理として図11に示すような処理を周期的又は任意のタイミングで実施する。まず、イベントデータ管理部3が、CSVファイル格納部1に格納されているCSVファイルの未処理の1行を特定し(図11:ステップS1)、特定した行からプロセスID、キー名、キー値、イベント名及び時刻情報を抽出する(ステップS3)。なお、図11に示す処理を過去に実施している場合には、前回の処理から今回の処理までの間にCSVファイルに書き込まれた行を未処理の行とみなして処理する。
そして、イベントデータ管理部3は、抽出したプロセスIDがプロセステーブル格納部5のプロセステーブルに登録済みであるか判断する(ステップS5)。抽出したプロセスIDがプロセステーブルに登録済みである場合(ステップS5:Yesルート)、以下で説明するステップS7の処理をスキップし、ステップS9の処理に移行する。
一方、抽出したプロセスIDがプロセステーブルに登録されていなければ(ステップS5:Noルート)、イベントデータ管理部3は、抽出したプロセスIDをプロセステーブルに追加登録する(ステップS7)。その後、ステップS9の処理に移行する。
そして、イベントデータ管理部3は、抽出したプロセスID、イベント名及び時刻情報を含むレコードをイベントテーブル格納部7のイベントテーブルに追加する(ステップS9)。この際、イベントデータ管理部3は、イベントを識別可能な番号(イベントID)を割り当て、レコードに設定する。なお、イベントテーブルにおけるグループIDの列には、この時点では、まだ何も設定されない。その後、イベントデータ管理部3は、抽出したプロセスID、キー名及びキー値をグループ管理部9に出力する。
そして、グループ管理部9は、イベントデータ管理部3からプロセスID、キー名及びキー値を受信すると、当該キー名及びキー値に対応するグループがグループテーブル格納部11のグループテーブルに登録済みであるか判断する(ステップS11)。キー名及びキー値に対応するグループがグループテーブルに登録済みである場合(ステップS11:Yesルート)、以下で説明するステップS13の処理をスキップし、ステップS15の処理に移行する。
一方、キー名及びキー値に対応するグループがグループテーブルに登録されていなければ(ステップS11:Noルート)、グループ管理部9は、プロセスID、キー名及びキー値を含むレコードをグループテーブルに追加する(ステップS13)。この際、グループ管理部9は、グループを識別可能な番号(グループID)を割り当て、レコードに設定する。その後、ステップS15の処理に移行する。
そして、グループ管理部9は、イベントデータ管理部3から受信したキー名及びキー値を基にグループテーブルを検索し、当該キー名及びキー値に対応するグループIDを特定する。そして、グループ管理部9は、特定したグループIDを、イベントテーブルにおけるグループIDの列に設定する(ステップS15)。なお、ステップS13の処理を実施している場合には、キー名及びキー値に対応するグループIDが分かっているので、グループテーブルを検索する処理は省略可能である。その後、グループ管理部9は、グループIDの設定が完了した旨をイベントデータ管理部3に通知する。
そして、イベントデータ管理部3は、グループ管理部9から、グループIDの設定が完了した旨の通知を受信すると、CSVファイルの全行について処理が完了したか判断する(ステップS17)。CSVファイルの全行について処理が完了していなければ(ステップS17:Noルート)、ステップS1に戻り、次の行について上で述べた処理を実施する。一方、CSVファイルの全行について処理が完了した場合(ステップS17:Yesルート)、類似度算出処理の前処理を終了する。なお、処理終了時、今回最後に処理した行(すなわち、現時点のCSVファイルの末尾行)の位置を、次回の処理のために保持しておく。
次に、プロセス類似度算出装置の類似度算出処理を図12乃至図17を用いて説明する。例えば、出力部23は、ユーザからのプロセス一覧表示要求に応じて、プロセステーブル格納部5のプロセステーブルに基づきプロセス一覧データを生成し、表示装置等に表示する。そして、ユーザは、表示されたプロセス一覧の中から、比較元プロセス及び比較先プロセスを選択する。そして、入力部13は、ユーザから比較元プロセス及び比較先プロセスの選択入力を受け付ける(図12:ステップS21)。そして、入力部13は、選択データを比較用データ生成部15に出力する。
そして、比較用データ生成部15は、入力部13から選択データを受信すると、イベントテーブル格納部7及びグループテーブル格納部11に格納されているデータに基づき、比較元プロセスについて比較用データ生成処理を実施する(ステップS23)。また、比較用データ生成部15は、同じくイベントテーブル格納部7及びグループテーブル格納部11に格納されているデータに基づき、比較先プロセスについて比較用データ生成処理を実施する(ステップS25)。なお、ステップS23及びステップS25については処理順序を入れ替えることが可能である。また、並列に実行することも可能である。ステップS23及びステップS25の比較用データ生成処理については、図13を用いてまとめて説明する。
まず、比較用データ生成部15のイベントソート部151が、イベントテーブル格納部7から処理対象プロセスに含まれるイベントを抽出し、グループ毎に、当該グループに属するイベントを時刻順にソートしてソート結果を比較用データ格納部17に格納する(図13:ステップS51)。例えば図9に示したようなデータがイベントテーブル格納部7に格納されている際に、比較元プロセス「P001」及び比較先プロセス「P002」の各々について本ステップの処理を実施した場合、図14に示すようなソート結果となる。
その後、比較用データ生成部15の前後グループ特定部153が、処理対象プロセスに含まれるグループのうち未処理のグループを特定する(ステップS53)。そして、前後グループ特定部153は、グループテーブル格納部11に格納されているキー名とイベントテーブル格納部7に格納されている時刻情報とを基に、特定されたグループに対する直前グループを探索する(ステップS55)。具体的には、まず、処理対象プロセス内のグループのうち、キー名が、特定されたグループとは異なるグループを候補グループとして抽出する。そして、抽出した候補グループの中から、特定されたグループ内の先頭イベントの直前に実施されたとみなされるイベントが属するグループが存在するか判断し、該当するグループが存在すれば、直前グループとして抽出する。なお、特定されたグループ内の先頭イベントの直前に実施されたとみなされるイベントが存在しない場合には、直前グループは存在しないものと判断する。
例えば、図9及び図10に示したようなデータがイベントテーブル格納部7及びグループテーブル格納部11にそれぞれ格納されている場合、グループ「G001」、グループ「G002」及びグループ「G003」については、以下のように判断される。すなわち、グループ「G001」については、候補グループとしてグループ「G002」及びグループ「G003」が抽出される。しかし、グループ「G001」内のイベント「受注」の直前に実施されたとみなされるイベントが候補グループ中に存在しないため、グループ「G001」に対する直前グループは存在しないものと判断される。また、グループ「G002」については、候補グループとしてグループ「G001」が抽出される。そして、グループ「G002」内のイベント「生産」の直前に実施されたとみなされるイベント「受注」が候補グループであるグループ「G001」に存在している。従って、グループ「G001」が、グループ「G002」に対する直前グループとして特定される。さらに、グループ「G003」も同様に、候補グループとしてグループ「G001」が抽出され、グループ「G001」が、グループ「G003]に対する直前グループとして特定される。なお、キー名及び時刻情報の他の情報を用いてグループ間の関係を特定するようにしてもよい。
そして、直前グループを検出した場合には(ステップS57:Yesルート)、前後グループ特定部153は、直前グループのハッシュ値を算出し、特定されたグループのソート結果に対応付けて比較用データ格納部17に格納する(ステップS59)。例えば直前グループに含まれるイベントを時系列に並べ、時系列データに対して、SHA1(Secure Hash Algorithm 1)などの技術を用いてハッシュ値を算出する。例えば、イベント「受注」を含むグループ「G001」又はグループ「G004」が直前グループとして特定された場合には、図15(a)に示すようなハッシュ値「6b・・・」が算出される。
一方、直前グループを検出しなければ(ステップS57:Noルート)、ステップS59の処理をスキップし、ステップS61の処理に移行する。
そして、前後グループ特定部153は、グループテーブル格納部11に格納されているキー名とイベントテーブル格納部7に格納されている時刻情報とを基に、特定されたグループに対する直後グループを探索する(ステップS61)。具体的には、まず、処理対象プロセス内のグループのうち、キー名が、特定されたグループとは異なるグループを抽出する。そして、抽出したグループの中から、特定されたグループ内の最後尾イベントの直後に実施されたとみなされるイベントが属するグループを直後グループとして抽出する。なお、直後グループが複数抽出される場合もある。また、特定されたグループ内の最後尾イベントの直後に実施されたとみなされるイベントが存在しない場合には、直後グループは存在しないものと判断する。
例えば、図9及び図10に示したようなデータがイベントテーブル格納部7及びグループテーブル格納部11にそれぞれ格納されている場合、グループ「G001」、グループ「G002」及びグループ「G003」については、以下のように判断される。すなわち、グループ「G001」については、候補グループとしてグループ「G002」及びグループ「G003」が抽出される。そして、グループ「G001」内のイベント「受注」の直後に実施されたとみなされるイベント「生産」が候補グループであるグループ「G002」及び「G003」に存在している。従って、グループ「G002」及びグループ「003」が、グループ「G001」に対する直後グループとして特定される。また、グループ「G002」については、候補グループとしてグループ「G001」が抽出される。しかし、グループ「G002」内のイベント「配送」の直後に実施されたとみなされるイベントが候補グループ内に存在しないため、グループ「G002」に対する直後グループは存在しないものと判断される。なお、グループ「G003」についても同様に、直後グループは存在しないものと判断される。
そして、直後グループを検出した場合には(ステップS63:Yesルート)、前後グループ特定部153は、直後グループのハッシュ値を算出し、特定されたグループのソート結果に対応付けて比較用データ格納部17に格納する(ステップS65)。例えば、イベント「生産」及び「配送」を含むグループ「G002」、グループ「G003」又はグループ「G005」が直後グループとして特定された場合には、図15(b)に示すようなハッシュ値「1d・・・」が算出される。また、例えば、イベント「生産」及び「キャンセル」を含むグループ「G006」が直後グループとして特定された場合には、図15(c)に示すようなハッシュ値「1a・・・」が算出される。
一方、直後グループを検出しなければ(ステップS63:Noルート)、ステップS65の処理をスキップし、ステップS67の処理に移行する。
そして、前後グループ特定部153は、処理対象プロセスに含まれる全てのグループについて処理が完了したか判断する(ステップS67)。処理対象プロセスに含まれる全てのグループについて処理が完了していなければ(ステップS67:Noルート)、ステップS53の処理に戻り、上で述べた処理を繰り返す。一方、処理対象プロセスに含まれる全てのグループについて処理が完了した場合(ステップS67:Yesルート)、比較用データ生成処理を終了し、元の処理に戻る。
図16に、比較用データ格納部17に格納されるデータの一例を示す。例えば、プロセス「P001」のグループ「G001」については、自グループのソート結果と直後グループであるグループ「G002」のハッシュ値との対が格納されている。なお、グループ「G002」のハッシュ値とグループ「G003」のハッシュ値とは同じ値「1d・・・」であるため、図16では、ソート結果とハッシュ値との対を1組のみ示しているが、ハッシュ値が異なる直後グループが複数存在する場合には、ソート結果とハッシュ値との対も複数格納されることとなる。また、グループ「G002」については、自グループのソート結果と直前グループであるグループ「G001」のハッシュ値との対が格納されている。さらに、グループ「G003」についても、自グループのソート結果と直前グループであるグループ「G001」のハッシュ値との対が格納されている。また、プロセス「P002」のグループ「G004」については、自グループのソート結果と直後グループであるグループ「G005」のハッシュ値との対と、自グループのソート結果と直後グループであるグループ「G006」のハッシュ値との対との2つが格納されている。さらに、グループ「G005」については、自グループのソート結果と直前グループであるグループ「G004」のハッシュ値との対が格納されている。また、グループ「G006」についても、自グループのソート結果と直前グループであるグループ「G004」のハッシュ値との対が格納されている。
以上のような処理を実施することにより、業務プロセス間でグループが一致するかを前後グループを含めて判断できるようになる。
図12の説明に戻って、比較用データ生成処理(ステップS23及びステップS25)が完了すると、比較用データ生成部15は、類似度算出指示を類似度算出部19に出力する。そして、類似度算出部19は、比較用データ生成部15から類似度算出指示を受信すると、一致グループ数を0に設定する(ステップS27)。
そして、類似度算出部19は、比較元プロセスに含まれるグループのうち未処理のグループを特定する(ステップS29)。そして、類似度算出部19は、比較用データ格納部17に格納されているデータに従って、比較先プロセス内に、特定されたグループと一致するグループが存在するか判断する(ステップS31)。なお、比較用データ格納部17に格納されている、グループのソート結果と前後グループのハッシュ値との対のうち、比較元プロセス内のグループに係る対を第1の対と呼び、比較先プロセス内のグループに係る対を第2の対と呼ぶこととする。すなわち、ステップS31では、特定されたグループに係る第1の対が、第2の対のいずれかと一致するか判断し、一致すると判断された場合には、特定されたグループと一致するグループが比較先プロセス内に存在すると判断する。なお、第1の対と一致した第2の対については、既に照合済みであることを示すフラグを設定するなどして、判断対象から除外するようにする。
また、あるグループに対する直前グループ又は直後グループが複数特定された場合には、当該グループに係る第1の対又は第2の対が複数存在することとなる。例えば、グループ「G001」の直後グループとしてグループ「G002」とグループ「G003」とが特定され、グループ「G002」とグループ「G003」とが異なるハッシュ値を持つ場合、グループ「G002」のハッシュ値を含む第1の対と、グループ「G003」のハッシュ値を含む第1の対との2つが存在することとなる。この場合、本実施の形態では、いずれかの第1の対が、第2の対のいずれかと一致すれば、そのグループ(グループ「G001」)については、一致するグループが比較先プロセス内に存在するものと判断する。
そして、比較先プロセス内に、特定されたグループと一致するグループが存在すると判断された場合(ステップS31:Yesルート)、類似度算出部19は、一致グループ数を1インクリメントする(ステップS33)。その後、ステップS35の処理に移行する。
一方、比較先プロセス内に、特定されたグループと一致するグループは存在しないと判断された場合(ステップS31:Noルート)、ステップS33の処理をスキップし、ステップS35の処理に移行する。
そして、類似度算出部19は、比較元プロセスに含まれる全てのグループについて処理が完了したか判断する(ステップS35)。比較元プロセスに含まれる全てのグループについて処理が完了した場合(ステップS35:Yesルート)、端子Aを介してステップS37(図17)に以降する。
一方、比較元プロセスに含まれる全てのグループについて処理が完了していなければ(ステップS35:Noルート)、ステップS29の処理に戻り、上で述べた処理を繰り返す。
例えば、図16に示したようなデータが比較用データ格納部17に格納されている場合、グループ「G001」に係る第1の対は、グループ「G004」に係る第2の対と一致するため、グループ「G001」に一致するグループが比較先プロセス内に存在すると判断される。また、グループ「G002」に係る第1の対は、グループ「G005」に係る第2の対と一致するため、グループ「G002」に一致するグループが比較先プロセス内に存在すると判断される。なお、グループ「G003」に係る第1の対は、グループ「G005」に係る第2の対と一致するが、既に照合済みであるため、グループ「G003」に係る第1の対と一致するものは存在しない。従って、グループ「G003」に一致するグループは存在しないと判断される。すなわち、一致グループ数は2となる。
図17の説明に移行して、端子Aの後、類似度算出部19は、一致グループ数を比較元プロセス又は比較先プロセスに含まれるグループの総数で除することにより、比較元プロセスと比較先プロセス間の類似度を算出し、類似度格納部21に格納する(図17:ステップS37)。この際、比較元プロセスのプロセスID及び比較先プロセスのプロセスIDに対応付けて類似度格納部21に格納する。
そして、類似度算出部19は、比較元プロセスと比較先プロセスとの組み合わせ全てについて処理が完了したか判断する(ステップS39)。比較元プロセスと比較先プロセスとの組み合わせ全てについて処理が完了していなければ(ステップS39:Noルート)、端子Bを介してステップS23(図12)に戻り、未処理の組み合わせについて上で述べた処理を繰り返す。なお、新たな組み合わせに係る比較元プロセス又は比較先プロセスについて比較用データ生成処理(ステップS23又はステップS25)を過去に実施している場合には、2回目以降の比較用データ生成処理は省略可能である。
一方、比較元プロセスと比較先プロセスとの組み合わせ全てについて処理が完了した場合(ステップS39:Yesルート)、出力部23が、類似度算出処理の算出結果を出力する(ステップS41)。例えば、表示装置等に類似度の一覧を表示する。例えば類似度の高いものから表示する。そして、類似度算出処理を終了する。
以上のような処理を実施することにより、直前グループ及び直後グループのうち少なくともいずれかを含めて各グループの比較を行うので、分岐前又は分岐後のイベントを考慮した類似度を算出することができるようになる。
なお、図18乃至図24を用いて別の具体例を説明する。ここでは、図18(a)に示すようなデータがCSVファイル格納部1に格納されているものとする。図18(a)は、CSV形式のCSVファイル格納部1のデータを示す。なお、図18(a)に示したCSV形式のデータを見やすいようにテーブル形式にすると、例えば図18(b)に示すようなテーブルとなる。
図18(a)に示したようなデータがCSVファイル格納部1に格納されている場合に、類似度算出処理の前処理(図11)が実施されると、プロセステーブル格納部5には、図19に示すようなデータが設定される。さらに、イベントテーブル格納部7には、図20に示すようなデータが設定される。また、グループテーブル格納部11には、図21に示すようなデータが設定される。
例えば、類似度算出処理(図12)におけるステップS21において、プロセス「P003」を比較元プロセス、プロセス「P004」を比較先プロセスとする選択入力を受け付けたものとする。そうすると、これらのプロセスについて、上で説明した比較用データ生成処理(ステップS23及びステップS25)が実施され、以下のようなデータが生成される。
具体的には、まず、比較用データ生成処理におけるステップS51(図13)の処理が実施されると、図22に示すようなソート結果が得られる。図22は、グループ「G011」乃至グループ「G016」の各グループについてのソート結果を示す。
その後、比較用データ生成処理におけるステップS53乃至ステップS67(図13)の処理が実施されると、直前グループ及び直後グループのうち少なくともいずれかが特定され、直前グループ又は直後グループとして特定されたグループのハッシュ値が算出される。
図23(a)乃至(c)に、ハッシュ値の一例を示す。例えば、イベント「受注」を含むグループ「G011」が直前グループとして特定された場合には、図23(a)に示すようなハッシュ値「6b・・・」が算出される。また、イベント「計画」を含むグループ「G014」が直前グループとして特定された場合には、図23(b)に示すようなハッシュ値「76・・・」が算出される。さらに、イベント「生産」及び「配送」を含むグループ「G012」、グループ「G013」、グループ「G015」又はグループ「G016」が直後グループとして特定された場合には、図23(c)に示すようなハッシュ値「1d・・・」が算出される。
そして、比較用データ格納部17には、図24に示すようなデータが格納される。例えば、プロセス「P003」のグループ「G011」については、自グループのソート結果と直後グループであるグループ「G012」(もしくはグループ「G013」)のハッシュ値との対が格納される。また、グループ「G012」については、自グループのソート結果と直前グループであるグループ「G011」のハッシュ値との対が格納される。さらに、グループ「G013」についても、自グループのソート結果と直前グループであるグループ「G011」のハッシュ値との対が格納される。また、プロセス「P004」のグループ「G014」については、自グループのソート結果と直後グループであるグループ「G015」(もしくはグループ「G016」)のハッシュ値との対が格納される。さらに、グループ「G015」については、自グループのソート結果と直前グループであるグループ「G014」のハッシュ値との対が格納される。また、グループ「G016」についても、自グループのソート結果と直前グループであるグループ「G014」のハッシュ値との対が格納される。
そして、類似度算出処理におけるステップS29乃至ステップS35では、図24に示したデータを基に、一致グループ数がカウントされる。なお、図24に示したデータを比較した場合、プロセス「P003」とプロセス「P004」とで一致するグループは存在しないため、一致グループ数は0となる。すなわち、3グループ全て不一致(類似度=0/3)と判断する。図2に示した第1の方法、図3に示した第2の方法では、一致する一連のフローが業務プロセス間に全く存在しない場合にも、一部一致することを示す類似度を算出していたが、本実施の形態によれば、一致する一連のフローが存在しないことを示す適切な類似度を算出することができる。
以上本技術の一実施の形態を説明したが、本技術はこれに限定されるものではない。例えば、上で説明したプロセス類似度算出装置の機能ブロック図は必ずしも実際のプログラムモジュール構成に対応するものではない。
また、上で説明した各テーブルの構成は一例であって、必ずしも上記のような構成でなければならないわけではない。さらに、処理フローにおいても、処理結果が変わらなければ処理の順番を入れ替えることも可能である。さらに、並列に実行させるようにしても良い。
また、上では、ソート結果と直前グループ及び直後グループのハッシュ値との対を比較することで、一致するグループが存在するか否かを判断する例を説明したが、必ずしもハッシュ値を用いらなければならないわけではない。例えば図25に示すように、直前グループ及び直後グループのキー名をハッシュ値の代わりに用いることも可能である。また、例えば図26に示すように、直前グループ内の最後尾イベント及び直後グループの先頭イベントをハッシュ値の代わりに用いることも可能である。なお、直前グループ及び直後グループ内のイベントの時系列データを用いるようにしてもよい。また、直前グループと直後グループとが両方存在する場合には、予め定められた設定によってどちらか一方のみを考慮するような構成にすることも可能である。さらに、前方の全てのグループや、後方の全てのグループを考慮したりするような構成を採用することも可能である。
以上本実施の形態をまとめると以下のようになる。
本業務プロセス間の類似度算出方法は、並列且つ独立に実施されたイベントを含む複数の業務イベントで表される業務プロセス間の類似度を算出する方法であり、業務イベント毎に当該業務イベントが属する業務プロセスの識別子と当該業務イベントの所定属性名及び当該所定属性名の属性値に基づくグループの識別子と時刻情報とを格納するイベントデータ格納部から、比較元となる第1の業務プロセスに属する業務イベントを抽出し、抽出した業務イベントのグループである第1のグループ毎に、抽出した業務イベントを時刻順にソートするステップと、第1のグループの所定属性名と、第1のグループ内の業務イベントの時刻情報とによって特定される、第1のグループ間の関係に基づき、各第1のグループについて、当該第1のグループに対する直前グループ及び直後グループのうち少なくともいずれかを特定し、特定された直前グループを表すデータと特定された直後グループを表すデータとのうち少なくともいずれかを第1の付加データとして、当該第1のグループのソート結果に対応付けて記憶装置に格納する第1前後グループ特定ステップと、イベントデータ格納部から、比較先となる第2の業務プロセスに属する業務イベントを抽出し、抽出した業務イベントのグループである第2のグループ毎に、抽出した業務イベントを時刻順にソートするステップと、第2のグループの所定属性名と、第2のグループ内の業務イベントの時刻情報とによって特定される、第2のグループ間の関係に基づき、各第2のグループについて、当該第2のグループに対する直前グループ及び直後グループのうち少なくともいずれかを特定し、特定された直前グループを表すデータと特定された直後グループを表すデータとのうち少なくともいずれかを第2の付加データとして、当該第2のグループのソート結果に対応付けて記憶装置に格納する第2前後グループ特定ステップと、記憶装置に格納された、第1のグループのソート結果と第1の付加データとの対と、記憶装置に格納された、第2のグループのソート結果と第2の付加データとの対とを比較することにより一致グループ数を計数し、一致グループ数から第1の業務プロセスと第2の業務プロセス間の類似度を算出する類似度算出ステップとを含む。
このようにすれば、直前グループ及び直後グループのうち少なくともいずれかを含めて各グループの比較を行うので、分岐前又は分岐後のイベントを考慮した類似度を算出することができるようになる。
また、上で述べた第1前後グループ特定ステップが、第1のグループのうち所定属性名が処理対象の第1のグループとは異なるグループである第1の候補グループの中から、処理対象の第1のグループ内の先頭の業務イベントの直前に実施されたとみなされる業務イベントが属するグループを直前グループとして特定するステップと、第1の候補グループの中から、処理対象の第1のグループ内の最後尾の業務イベントの直後に実施されたとみなされる業務イベントが属するグループを直後グループとして特定するステップとを含むようにしてもよい。そして、上で述べた第2前後グループ特定ステップが、第2のグループのうち所定属性名が処理対象の第2のグループとは異なるグループである第2の候補グループの中から、処理対象の第2のグループ内の先頭の業務イベントの直前に実施されたとみなされる業務イベントが属するグループを直前グループとして特定するステップと、第2の候補グループの中から、処理対象の第2のグループ内の最後尾の業務イベントの直後に実施されたとみなされる業務イベントが属するグループを直後グループとして特定するステップとを含むようにしてもよい。例えば同一属性名のグループは、並列実施部分と考えられ、以上のように処理することで、並列実施部分を除いたグループの中から、直前グループ又は直後グループを適切に特定することができるようになる。
さらに、上で述べた類似度算出ステップが、一致グループ数を第1のグループ又は第2のグループの総数で除した値を類似度として算出するステップを含むようにしてもよい。これにより、業務プロセス全体のうちどのぐらい一致しているかを容易に把握できるようになる。
また、上で述べた類似度算出ステップが、各第1のグループについて、当該第1のグループのソート結果と第1の付加データとの対が第2のグループのソート結果と第2の付加データとの対のいずれかと一致するか判断し、当該第1のグループのソート結果と第1の付加データとの対が第2のグループのソート結果と第2の付加データとの対のいずれかと一致すると判断された場合に、一致グループ数を1インクリメントするステップを含むようにしてもよい。
さらに、直前グループを表すデータが、当該直前グループの所定属性名と、当該直前グループ内の業務イベントの時系列データから計算されるハッシュ値と、当該直前グループ内の最後尾の業務イベントのデータとのうちのいずれかである場合もある。さらに、直後グループを表すデータが、当該直後グループの所定属性名と、当該直後グループ内の業務イベントの時系列データから計算されるハッシュ値と、当該直後グループ内の先頭の業務イベントのデータとのうちのいずれかである場合もある。例えばハッシュ値を用いるようにすれば、直前グループ又は直後グループ内のイベントの並びを容易に比較できるようになる。
なお、上記処理をコンピュータに実行させるためのプログラムを作成することができ、当該プログラムは、例えばフレキシブルディスク、CD−ROM、光磁気ディスク、半導体メモリ、ハードディスク等の記憶媒体又は記憶装置に格納される。なお、中間的な処理結果はメインメモリ等の記憶装置に一時保管される。
また、プロセス類似度算出装置は、図30に示すように、メモリ2501(記憶部)とCPU2503(処理部)とハードディスク・ドライブ(HDD)2505と表示装置2509に接続される表示制御部2507とリムーバブル・ディスク2511用のドライブ装置2513と入力装置2515とネットワークに接続するための通信制御部2517とがバス2519で接続されている。OS及びWebブラウザを含むアプリケーション・プログラムは、HDD2505に格納されており、CPU2503により実行される際にはHDD2505からメモリ2501に読み出される。必要に応じてCPU2503は、表示制御部2507、通信制御部2517、ドライブ装置2513を制御して、必要な動作を行わせる。また、処理途中のデータについては、メモリ2501に格納され、必要があればHDD2505に格納される。このようなコンピュータは、上で述べたCPU2503、メモリ2501などのハードウエアとOS及び必要なアプリケーション・プログラムとが有機的に協働することにより、上で述べたような各種機能を実現する。
以上の実施例を含む実施形態に関し、さらに以下の付記を開示する。
(付記1)
並列且つ独立に実施されたイベントを含む複数の業務イベントで表される業務プロセス間の類似度を算出する方法であって、
前記業務イベント毎に当該業務イベントが属する前記業務プロセスの識別子と当該業務イベントの所定属性名及び当該所定属性名の属性値に基づくグループの識別子と時刻情報とを格納するイベントデータ格納部から、比較元となる第1の業務プロセスに属する前記業務イベントを抽出し、抽出した前記業務イベントの前記グループである第1のグループ毎に、抽出した前記業務イベントを時刻順にソートするステップと、
前記第1のグループの前記所定属性名と、前記第1のグループ内の前記業務イベントの前記時刻情報とによって特定される、前記第1のグループ間の関係に基づき、各前記第1のグループについて、当該第1のグループに対する直前グループ及び直後グループのうち少なくともいずれかを特定し、特定された前記直前グループを表すデータと特定された前記直後グループを表すデータとのうち少なくともいずれかを第1の付加データとして、当該第1のグループのソート結果に対応付けて記憶装置に格納する第1前後グループ特定ステップと、
前記イベントデータ格納部から、比較先となる第2の業務プロセスに属する前記業務イベントを抽出し、抽出した前記業務イベントの前記グループである第2のグループ毎に、抽出した前記業務イベントを時刻順にソートするステップと、
前記第2のグループの前記所定属性名と、前記第2のグループ内の前記業務イベントの前記時刻情報とによって特定される、前記第2のグループ間の関係に基づき、各前記第2のグループについて、当該第2のグループに対する直前グループ及び直後グループのうち少なくともいずれかを特定し、特定された前記直前グループを表すデータと特定された前記直後グループを表すデータとのうち少なくともいずれかを第2の付加データとして、当該第2のグループのソート結果に対応付けて前記記憶装置に格納する第2前後グループ特定ステップと、
前記記憶装置に格納された、前記第1のグループのソート結果と前記第1の付加データとの対と、前記記憶装置に格納された、前記第2のグループのソート結果と前記第2の付加データとの対とを比較することにより一致グループ数を計数し、前記一致グループ数から前記第1の業務プロセスと前記第2の業務プロセス間の類似度を算出する類似度算出ステップと、
を含み、コンピュータにより実行される業務プロセス間の類似度算出方法。
並列且つ独立に実施されたイベントを含む複数の業務イベントで表される業務プロセス間の類似度を算出する方法であって、
前記業務イベント毎に当該業務イベントが属する前記業務プロセスの識別子と当該業務イベントの所定属性名及び当該所定属性名の属性値に基づくグループの識別子と時刻情報とを格納するイベントデータ格納部から、比較元となる第1の業務プロセスに属する前記業務イベントを抽出し、抽出した前記業務イベントの前記グループである第1のグループ毎に、抽出した前記業務イベントを時刻順にソートするステップと、
前記第1のグループの前記所定属性名と、前記第1のグループ内の前記業務イベントの前記時刻情報とによって特定される、前記第1のグループ間の関係に基づき、各前記第1のグループについて、当該第1のグループに対する直前グループ及び直後グループのうち少なくともいずれかを特定し、特定された前記直前グループを表すデータと特定された前記直後グループを表すデータとのうち少なくともいずれかを第1の付加データとして、当該第1のグループのソート結果に対応付けて記憶装置に格納する第1前後グループ特定ステップと、
前記イベントデータ格納部から、比較先となる第2の業務プロセスに属する前記業務イベントを抽出し、抽出した前記業務イベントの前記グループである第2のグループ毎に、抽出した前記業務イベントを時刻順にソートするステップと、
前記第2のグループの前記所定属性名と、前記第2のグループ内の前記業務イベントの前記時刻情報とによって特定される、前記第2のグループ間の関係に基づき、各前記第2のグループについて、当該第2のグループに対する直前グループ及び直後グループのうち少なくともいずれかを特定し、特定された前記直前グループを表すデータと特定された前記直後グループを表すデータとのうち少なくともいずれかを第2の付加データとして、当該第2のグループのソート結果に対応付けて前記記憶装置に格納する第2前後グループ特定ステップと、
前記記憶装置に格納された、前記第1のグループのソート結果と前記第1の付加データとの対と、前記記憶装置に格納された、前記第2のグループのソート結果と前記第2の付加データとの対とを比較することにより一致グループ数を計数し、前記一致グループ数から前記第1の業務プロセスと前記第2の業務プロセス間の類似度を算出する類似度算出ステップと、
を含み、コンピュータにより実行される業務プロセス間の類似度算出方法。
(付記2)
前記第1前後グループ特定ステップが、
前記第1のグループのうち前記所定属性名が処理対象の前記第1のグループとは異なるグループである第1の候補グループの中から、処理対象の前記第1のグループ内の先頭の前記業務イベントの直前に実施されたとみなされる前記業務イベントが属するグループを前記直前グループとして特定するステップと、
前記第1の候補グループの中から、処理対象の前記第1のグループ内の最後尾の前記業務イベントの直後に実施されたとみなされる前記業務イベントが属するグループを前記直後グループとして特定するステップと、
を含み、
前記第2前後グループ特定ステップが、
前記第2のグループのうち前記所定属性名が処理対象の前記第2のグループとは異なるグループである第2の候補グループの中から、処理対象の前記第2のグループ内の先頭の前記業務イベントの直前に実施されたとみなされる前記業務イベントが属するグループを前記直前グループとして特定するステップと、
前記第2の候補グループの中から、処理対象の前記第2のグループ内の最後尾の前記業務イベントの直後に実施されたとみなされる前記業務イベントが属するグループを前記直後グループとして特定するステップと、
を含む、付記1記載の業務プロセス間の類似度算出方法。
前記第1前後グループ特定ステップが、
前記第1のグループのうち前記所定属性名が処理対象の前記第1のグループとは異なるグループである第1の候補グループの中から、処理対象の前記第1のグループ内の先頭の前記業務イベントの直前に実施されたとみなされる前記業務イベントが属するグループを前記直前グループとして特定するステップと、
前記第1の候補グループの中から、処理対象の前記第1のグループ内の最後尾の前記業務イベントの直後に実施されたとみなされる前記業務イベントが属するグループを前記直後グループとして特定するステップと、
を含み、
前記第2前後グループ特定ステップが、
前記第2のグループのうち前記所定属性名が処理対象の前記第2のグループとは異なるグループである第2の候補グループの中から、処理対象の前記第2のグループ内の先頭の前記業務イベントの直前に実施されたとみなされる前記業務イベントが属するグループを前記直前グループとして特定するステップと、
前記第2の候補グループの中から、処理対象の前記第2のグループ内の最後尾の前記業務イベントの直後に実施されたとみなされる前記業務イベントが属するグループを前記直後グループとして特定するステップと、
を含む、付記1記載の業務プロセス間の類似度算出方法。
(付記3)
前記類似度算出ステップが、
前記一致グループ数を前記第1のグループ又は前記第2のグループの総数で除した値を前記類似度として算出するステップ
を含む、付記1又は2記載の業務プロセス間の類似度算出方法。
前記類似度算出ステップが、
前記一致グループ数を前記第1のグループ又は前記第2のグループの総数で除した値を前記類似度として算出するステップ
を含む、付記1又は2記載の業務プロセス間の類似度算出方法。
(付記4)
前記類似度算出ステップが、
各前記第1のグループについて、当該第1のグループのソート結果と前記第1の付加データとの対が前記第2のグループのソート結果と前記第2の付加データとの対のいずれかと一致するか判断し、当該第1のグループのソート結果と前記第1の付加データとの対が前記第2のグループのソート結果と前記第2の付加データとの対のいずれかと一致すると判断された場合に、前記一致グループ数を1インクリメントするステップ
を含む、付記1乃至3のいずれか1つ記載の業務プロセス間の類似度算出方法。
前記類似度算出ステップが、
各前記第1のグループについて、当該第1のグループのソート結果と前記第1の付加データとの対が前記第2のグループのソート結果と前記第2の付加データとの対のいずれかと一致するか判断し、当該第1のグループのソート結果と前記第1の付加データとの対が前記第2のグループのソート結果と前記第2の付加データとの対のいずれかと一致すると判断された場合に、前記一致グループ数を1インクリメントするステップ
を含む、付記1乃至3のいずれか1つ記載の業務プロセス間の類似度算出方法。
(付記5)
前記直前グループを表すデータが、当該直前グループの前記所定属性名と、当該直前グループ内の前記業務イベントの時系列データから計算されるハッシュ値と、当該直前グループ内の最後尾の前記業務イベントのデータとのうちのいずれかであり、
前記直後グループを表すデータが、当該直後グループの前記所定属性名と、当該直後グループ内の前記業務イベントの時系列データから計算されるハッシュ値と、当該直後グループ内の先頭の前記業務イベントのデータとのうちのいずれかである
付記1乃至4のいずれか1つ記載の業務プロセス間の類似度算出方法。
前記直前グループを表すデータが、当該直前グループの前記所定属性名と、当該直前グループ内の前記業務イベントの時系列データから計算されるハッシュ値と、当該直前グループ内の最後尾の前記業務イベントのデータとのうちのいずれかであり、
前記直後グループを表すデータが、当該直後グループの前記所定属性名と、当該直後グループ内の前記業務イベントの時系列データから計算されるハッシュ値と、当該直後グループ内の先頭の前記業務イベントのデータとのうちのいずれかである
付記1乃至4のいずれか1つ記載の業務プロセス間の類似度算出方法。
(付記6)
並列且つ独立に実施されたイベントを含む複数の業務イベントで表される業務プロセス間の類似度を算出するプログラムであって、
前記業務イベント毎に当該業務イベントが属する前記業務プロセスの識別子と当該業務イベントの所定属性名及び当該所定属性名の属性値に基づくグループの識別子と時刻情報とを格納するイベントデータ格納部から、比較元となる第1の業務プロセスに属する前記業務イベントを抽出し、抽出した前記業務イベントの前記グループである第1のグループ毎に、抽出した前記業務イベントを時刻順にソートするステップと、
前記第1のグループの前記所定属性名と、前記第1のグループ内の前記業務イベントの前記時刻情報とによって特定される、前記第1のグループ間の関係に基づき、各前記第1のグループについて、当該第1のグループに対する直前グループ及び直後グループのうち少なくともいずれかを特定し、特定された前記直前グループを表すデータと特定された前記直後グループを表すデータとのうち少なくともいずれかを第1の付加データとして、当該第1のグループのソート結果に対応付けて記憶装置に格納する第1前後グループ特定ステップと、
前記イベントデータ格納部から、比較先となる第2の業務プロセスに属する前記業務イベントを抽出し、抽出した前記業務イベントの前記グループである第2のグループ毎に、抽出した前記業務イベントを時刻順にソートするステップと、
前記第2のグループの前記所定属性名と、前記第2のグループ内の前記業務イベントの前記時刻情報とによって特定される、前記第2のグループ間の関係に基づき、各前記第2のグループについて、当該第2のグループに対する直前グループ及び直後グループのうち少なくともいずれかを特定し、特定された前記直前グループを表すデータと特定された前記直後グループを表すデータとのうち少なくともいずれかを第2の付加データとして、当該第2のグループのソート結果に対応付けて前記記憶装置に格納する第2前後グループ特定ステップと、
前記記憶装置に格納された、前記第1のグループのソート結果と前記第1の付加データとの対と、前記記憶装置に格納された、前記第2のグループのソート結果と前記第2の付加データとの対とを比較することにより一致グループ数を計数し、前記一致グループ数から前記第1の業務プロセスと前記第2の業務プロセス間の類似度を算出する類似度算出ステップと、
をコンピュータに実行させるためのプログラム。
並列且つ独立に実施されたイベントを含む複数の業務イベントで表される業務プロセス間の類似度を算出するプログラムであって、
前記業務イベント毎に当該業務イベントが属する前記業務プロセスの識別子と当該業務イベントの所定属性名及び当該所定属性名の属性値に基づくグループの識別子と時刻情報とを格納するイベントデータ格納部から、比較元となる第1の業務プロセスに属する前記業務イベントを抽出し、抽出した前記業務イベントの前記グループである第1のグループ毎に、抽出した前記業務イベントを時刻順にソートするステップと、
前記第1のグループの前記所定属性名と、前記第1のグループ内の前記業務イベントの前記時刻情報とによって特定される、前記第1のグループ間の関係に基づき、各前記第1のグループについて、当該第1のグループに対する直前グループ及び直後グループのうち少なくともいずれかを特定し、特定された前記直前グループを表すデータと特定された前記直後グループを表すデータとのうち少なくともいずれかを第1の付加データとして、当該第1のグループのソート結果に対応付けて記憶装置に格納する第1前後グループ特定ステップと、
前記イベントデータ格納部から、比較先となる第2の業務プロセスに属する前記業務イベントを抽出し、抽出した前記業務イベントの前記グループである第2のグループ毎に、抽出した前記業務イベントを時刻順にソートするステップと、
前記第2のグループの前記所定属性名と、前記第2のグループ内の前記業務イベントの前記時刻情報とによって特定される、前記第2のグループ間の関係に基づき、各前記第2のグループについて、当該第2のグループに対する直前グループ及び直後グループのうち少なくともいずれかを特定し、特定された前記直前グループを表すデータと特定された前記直後グループを表すデータとのうち少なくともいずれかを第2の付加データとして、当該第2のグループのソート結果に対応付けて前記記憶装置に格納する第2前後グループ特定ステップと、
前記記憶装置に格納された、前記第1のグループのソート結果と前記第1の付加データとの対と、前記記憶装置に格納された、前記第2のグループのソート結果と前記第2の付加データとの対とを比較することにより一致グループ数を計数し、前記一致グループ数から前記第1の業務プロセスと前記第2の業務プロセス間の類似度を算出する類似度算出ステップと、
をコンピュータに実行させるためのプログラム。
(付記7)
並列且つ独立に実施されたイベントを含む複数の業務イベントで表される業務プロセス間の類似度を算出するプロセス類似度算出装置であって、
前記業務イベント毎に当該業務イベントが属する前記業務プロセスの識別子と当該業務イベントの所定属性名及び当該所定属性名の属性値に基づくグループの識別子と時刻情報とを格納するイベントデータ格納部から、比較元となる第1の業務プロセスに属する前記業務イベントを抽出し、抽出した前記業務イベントの前記グループである第1のグループ毎に、抽出した前記業務イベントを時刻順にソートし、前記イベントデータ格納部から、比較先となる第2の業務プロセスに属する前記業務イベントを抽出し、抽出した前記業務イベントの前記グループである第2のグループ毎に、抽出した前記業務イベントを時刻順にソートするイベントソート手段と、
前記第1のグループの前記所定属性名と、前記第1のグループ内の前記業務イベントの前記時刻情報とによって特定される、前記第1のグループ間の関係に基づき、各前記第1のグループについて、当該第1のグループに対する直前グループ及び直後グループのうち少なくともいずれかを特定し、特定された前記直前グループを表すデータと特定された前記直後グループを表すデータとのうち少なくともいずれかを第1の付加データとして、当該第1のグループのソート結果に対応付けて記憶装置に格納し、前記第2のグループの前記所定属性名と、前記第2のグループ内の前記業務イベントの前記時刻情報とによって特定される、前記第2のグループ間の関係に基づき、各前記第2のグループについて、当該第2のグループに対する直前グループ及び直後グループのうち少なくともいずれかを特定し、特定された前記直前グループを表すデータと特定された前記直後グループを表すデータとのうち少なくともいずれかを第2の付加データとして、当該第2のグループのソート結果に対応付けて前記記憶装置に格納する前後グループ特定手段と、
前記記憶装置に格納された、前記第1のグループのソート結果と前記第1の付加データとの対と、前記記憶装置に格納された、前記第2のグループのソート結果と前記第2の付加データとの対とを比較することにより一致グループ数を計数し、前記一致グループ数から前記第1の業務プロセスと前記第2の業務プロセス間の類似度を算出する類似度算出手段と、
を有するプロセス類似度算出装置。
並列且つ独立に実施されたイベントを含む複数の業務イベントで表される業務プロセス間の類似度を算出するプロセス類似度算出装置であって、
前記業務イベント毎に当該業務イベントが属する前記業務プロセスの識別子と当該業務イベントの所定属性名及び当該所定属性名の属性値に基づくグループの識別子と時刻情報とを格納するイベントデータ格納部から、比較元となる第1の業務プロセスに属する前記業務イベントを抽出し、抽出した前記業務イベントの前記グループである第1のグループ毎に、抽出した前記業務イベントを時刻順にソートし、前記イベントデータ格納部から、比較先となる第2の業務プロセスに属する前記業務イベントを抽出し、抽出した前記業務イベントの前記グループである第2のグループ毎に、抽出した前記業務イベントを時刻順にソートするイベントソート手段と、
前記第1のグループの前記所定属性名と、前記第1のグループ内の前記業務イベントの前記時刻情報とによって特定される、前記第1のグループ間の関係に基づき、各前記第1のグループについて、当該第1のグループに対する直前グループ及び直後グループのうち少なくともいずれかを特定し、特定された前記直前グループを表すデータと特定された前記直後グループを表すデータとのうち少なくともいずれかを第1の付加データとして、当該第1のグループのソート結果に対応付けて記憶装置に格納し、前記第2のグループの前記所定属性名と、前記第2のグループ内の前記業務イベントの前記時刻情報とによって特定される、前記第2のグループ間の関係に基づき、各前記第2のグループについて、当該第2のグループに対する直前グループ及び直後グループのうち少なくともいずれかを特定し、特定された前記直前グループを表すデータと特定された前記直後グループを表すデータとのうち少なくともいずれかを第2の付加データとして、当該第2のグループのソート結果に対応付けて前記記憶装置に格納する前後グループ特定手段と、
前記記憶装置に格納された、前記第1のグループのソート結果と前記第1の付加データとの対と、前記記憶装置に格納された、前記第2のグループのソート結果と前記第2の付加データとの対とを比較することにより一致グループ数を計数し、前記一致グループ数から前記第1の業務プロセスと前記第2の業務プロセス間の類似度を算出する類似度算出手段と、
を有するプロセス類似度算出装置。
1 CSVファイル格納部 3 イベントデータ管理部
5 プロセステーブル格納部 7 イベントテーブル格納部
9 グループ管理部 11 グループテーブル格納部
13 入力部 15 比較用データ生成部
17 比較用データ格納部 19 類似度算出部
21 類似度格納部 23 出力部
151 イベントソート部 153 前後グループ特定部
5 プロセステーブル格納部 7 イベントテーブル格納部
9 グループ管理部 11 グループテーブル格納部
13 入力部 15 比較用データ生成部
17 比較用データ格納部 19 類似度算出部
21 類似度格納部 23 出力部
151 イベントソート部 153 前後グループ特定部
Claims (5)
- 並列且つ独立に実施されたイベントを含む複数の業務イベントで表される業務プロセス間の類似度を算出する方法であって、
前記業務イベント毎に当該業務イベントが属する前記業務プロセスの識別子と当該業務イベントの所定属性名及び当該所定属性名の属性値に基づくグループの識別子と時刻情報とを格納するイベントデータ格納部から、比較元となる第1の業務プロセスに属する前記業務イベントを抽出し、抽出した前記業務イベントの前記グループである第1のグループ毎に、抽出した前記業務イベントを時刻順にソートするステップと、
前記第1のグループの前記所定属性名と、前記第1のグループ内の前記業務イベントの前記時刻情報とによって特定される、前記第1のグループ間の関係に基づき、各前記第1のグループについて、当該第1のグループに対する直前グループ及び直後グループのうち少なくともいずれかを特定し、特定された前記直前グループを表すデータと特定された前記直後グループを表すデータとのうち少なくともいずれかを第1の付加データとして、当該第1のグループのソート結果に対応付けて記憶装置に格納する第1前後グループ特定ステップと、
前記イベントデータ格納部から、比較先となる第2の業務プロセスに属する前記業務イベントを抽出し、抽出した前記業務イベントの前記グループである第2のグループ毎に、抽出した前記業務イベントを時刻順にソートするステップと、
前記第2のグループの前記所定属性名と、前記第2のグループ内の前記業務イベントの前記時刻情報とによって特定される、前記第2のグループ間の関係に基づき、各前記第2のグループについて、当該第2のグループに対する直前グループ及び直後グループのうち少なくともいずれかを特定し、特定された前記直前グループを表すデータと特定された前記直後グループを表すデータとのうち少なくともいずれかを第2の付加データとして、当該第2のグループのソート結果に対応付けて前記記憶装置に格納する第2前後グループ特定ステップと、
前記記憶装置に格納された、前記第1のグループのソート結果と前記第1の付加データとの対と、前記記憶装置に格納された、前記第2のグループのソート結果と前記第2の付加データとの対とを比較することにより一致グループ数を計数し、前記一致グループ数から前記第1の業務プロセスと前記第2の業務プロセス間の類似度を算出する類似度算出ステップと、
を含み、コンピュータにより実行される業務プロセス間の類似度算出方法。 - 前記第1前後グループ特定ステップが、
前記第1のグループのうち前記所定属性名が処理対象の前記第1のグループとは異なるグループである第1の候補グループの中から、処理対象の前記第1のグループ内の先頭の前記業務イベントの直前に実施されたとみなされる前記業務イベントが属するグループを前記直前グループとして特定するステップと、
前記第1の候補グループの中から、処理対象の前記第1のグループ内の最後尾の前記業務イベントの直後に実施されたとみなされる前記業務イベントが属するグループを前記直後グループとして特定するステップと、
を含み、
前記第2前後グループ特定ステップが、
前記第2のグループのうち前記所定属性名が処理対象の前記第2のグループとは異なるグループである第2の候補グループの中から、処理対象の前記第2のグループ内の先頭の前記業務イベントの直前に実施されたとみなされる前記業務イベントが属するグループを前記直前グループとして特定するステップと、
前記第2の候補グループの中から、処理対象の前記第2のグループ内の最後尾の前記業務イベントの直後に実施されたとみなされる前記業務イベントが属するグループを前記直後グループとして特定するステップと、
を含む、請求項1記載の業務プロセス間の類似度算出方法。 - 前記類似度算出ステップが、
各前記第1のグループについて、当該第1のグループのソート結果と前記第1の付加データとの対が前記第2のグループのソート結果と前記第2の付加データとの対のいずれかと一致するか判断し、当該第1のグループのソート結果と前記第1の付加データとの対が前記第2のグループのソート結果と前記第2の付加データとの対のいずれかと一致すると判断された場合に、前記一致グループ数を1インクリメントするステップ
を含む、請求項1又は2記載の業務プロセス間の類似度算出方法。 - 並列且つ独立に実施されたイベントを含む複数の業務イベントで表される業務プロセス間の類似度を算出するプログラムであって、
前記業務イベント毎に当該業務イベントが属する前記業務プロセスの識別子と当該業務イベントの所定属性名及び当該所定属性名の属性値に基づくグループの識別子と時刻情報とを格納するイベントデータ格納部から、比較元となる第1の業務プロセスに属する前記業務イベントを抽出し、抽出した前記業務イベントの前記グループである第1のグループ毎に、抽出した前記業務イベントを時刻順にソートするステップと、
前記第1のグループの前記所定属性名と、前記第1のグループ内の前記業務イベントの前記時刻情報とによって特定される、前記第1のグループ間の関係に基づき、各前記第1のグループについて、当該第1のグループに対する直前グループ及び直後グループのうち少なくともいずれかを特定し、特定された前記直前グループを表すデータと特定された前記直後グループを表すデータとのうち少なくともいずれかを第1の付加データとして、当該第1のグループのソート結果に対応付けて記憶装置に格納する第1前後グループ特定ステップと、
前記イベントデータ格納部から、比較先となる第2の業務プロセスに属する前記業務イベントを抽出し、抽出した前記業務イベントの前記グループである第2のグループ毎に、抽出した前記業務イベントを時刻順にソートするステップと、
前記第2のグループの前記所定属性名と、前記第2のグループ内の前記業務イベントの前記時刻情報とによって特定される、前記第2のグループ間の関係に基づき、各前記第2のグループについて、当該第2のグループに対する直前グループ及び直後グループのうち少なくともいずれかを特定し、特定された前記直前グループを表すデータと特定された前記直後グループを表すデータとのうち少なくともいずれかを第2の付加データとして、当該第2のグループのソート結果に対応付けて前記記憶装置に格納する第2前後グループ特定ステップと、
前記記憶装置に格納された、前記第1のグループのソート結果と前記第1の付加データとの対と、前記記憶装置に格納された、前記第2のグループのソート結果と前記第2の付加データとの対とを比較することにより一致グループ数を計数し、前記一致グループ数から前記第1の業務プロセスと前記第2の業務プロセス間の類似度を算出する類似度算出ステップと、
をコンピュータに実行させるためのプログラム。 - 並列且つ独立に実施されたイベントを含む複数の業務イベントで表される業務プロセス間の類似度を算出するプロセス類似度算出装置であって、
前記業務イベント毎に当該業務イベントが属する前記業務プロセスの識別子と当該業務イベントの所定属性名及び当該所定属性名の属性値に基づくグループの識別子と時刻情報とを格納するイベントデータ格納部から、比較元となる第1の業務プロセスに属する前記業務イベントを抽出し、抽出した前記業務イベントの前記グループである第1のグループ毎に、抽出した前記業務イベントを時刻順にソートし、前記イベントデータ格納部から、比較先となる第2の業務プロセスに属する前記業務イベントを抽出し、抽出した前記業務イベントの前記グループである第2のグループ毎に、抽出した前記業務イベントを時刻順にソートするイベントソート手段と、
前記第1のグループの前記所定属性名と、前記第1のグループ内の前記業務イベントの前記時刻情報とによって特定される、前記第1のグループ間の関係に基づき、各前記第1のグループについて、当該第1のグループに対する直前グループ及び直後グループのうち少なくともいずれかを特定し、特定された前記直前グループを表すデータと特定された前記直後グループを表すデータとのうち少なくともいずれかを第1の付加データとして、当該第1のグループのソート結果に対応付けて記憶装置に格納し、前記第2のグループの前記所定属性名と、前記第2のグループ内の前記業務イベントの前記時刻情報とによって特定される、前記第2のグループ間の関係に基づき、各前記第2のグループについて、当該第2のグループに対する直前グループ及び直後グループのうち少なくともいずれかを特定し、特定された前記直前グループを表すデータと特定された前記直後グループを表すデータとのうち少なくともいずれかを第2の付加データとして、当該第2のグループのソート結果に対応付けて前記記憶装置に格納する前後グループ特定手段と、
前記記憶装置に格納された、前記第1のグループのソート結果と前記第1の付加データとの対と、前記記憶装置に格納された、前記第2のグループのソート結果と前記第2の付加データとの対とを比較することにより一致グループ数を計数し、前記一致グループ数から前記第1の業務プロセスと前記第2の業務プロセス間の類似度を算出する類似度算出手段と、
を有するプロセス類似度算出装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009123659A JP2010271959A (ja) | 2009-05-22 | 2009-05-22 | 業務プロセス間の類似度算出方法、プログラム及び装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009123659A JP2010271959A (ja) | 2009-05-22 | 2009-05-22 | 業務プロセス間の類似度算出方法、プログラム及び装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2010271959A true JP2010271959A (ja) | 2010-12-02 |
Family
ID=43419924
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009123659A Withdrawn JP2010271959A (ja) | 2009-05-22 | 2009-05-22 | 業務プロセス間の類似度算出方法、プログラム及び装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2010271959A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012243268A (ja) * | 2011-05-24 | 2012-12-10 | Nec Corp | 業務フロー検索装置、業務フロー検索方法、およびプログラム |
JP2020052451A (ja) * | 2018-09-21 | 2020-04-02 | 株式会社日立製作所 | 計算機システム及び業務フローのパターン生成方法 |
-
2009
- 2009-05-22 JP JP2009123659A patent/JP2010271959A/ja not_active Withdrawn
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012243268A (ja) * | 2011-05-24 | 2012-12-10 | Nec Corp | 業務フロー検索装置、業務フロー検索方法、およびプログラム |
JP2020052451A (ja) * | 2018-09-21 | 2020-04-02 | 株式会社日立製作所 | 計算機システム及び業務フローのパターン生成方法 |
JP7041603B2 (ja) | 2018-09-21 | 2022-03-24 | 株式会社日立製作所 | 計算機システム及び業務フローのパターンの生成方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106355506B (zh) | 一种在线社会网络中影响力最大化初始节点选取方法 | |
US20150032759A1 (en) | System and method for analyzing result of clustering massive data | |
US20170140309A1 (en) | Database analysis device and database analysis method | |
US10002142B2 (en) | Method and apparatus for generating schema of non-relational database | |
TWI621989B (zh) | Graph-based method and system for analyzing users | |
CN111506608A (zh) | 一种结构化文本的比较方法和装置 | |
CN111966900A (zh) | 基于局部敏感哈希的用户冷启动产品推荐方法及系统 | |
US10346450B2 (en) | Automatic datacenter state summarization | |
JP4973738B2 (ja) | 業務フロー処理プログラム、方法及び装置 | |
JP4992301B2 (ja) | 検索処理方法及び装置 | |
KR102243794B1 (ko) | 데이터 통합 장치 및 데이터 통합 방법 | |
WO2018205391A1 (zh) | 信息检索准确性评估方法、系统、装置及计算机可读存储介质 | |
US20110113006A1 (en) | Business process control apparatus, businesses process control method and business process control program | |
JP2010271959A (ja) | 業務プロセス間の類似度算出方法、プログラム及び装置 | |
CN104573132A (zh) | 歌曲查找方法及装置 | |
CN112258244A (zh) | 确定目标物品所属任务的方法、装置、设备及存储介质 | |
JP5928446B2 (ja) | 情報検索システム、情報検索方法および情報検索プログラム | |
CN109949090A (zh) | 客户推荐方法、装置、电子设备及介质 | |
JP5353641B2 (ja) | 業務プロセス構造推定方法、プログラム及び装置 | |
JP2019148859A (ja) | フローダイアグラムを用いたモデル開発環境におけるデザインパターンの発見を支援する装置および方法 | |
CN113656466A (zh) | 保单数据查询方法、装置、设备及存储介质 | |
JP2013008237A (ja) | 関連情報抽出プログラム、関連情報抽出方法及び関連情報抽出装置 | |
JPWO2017175375A1 (ja) | データクレンジングシステム、方法、及び、プログラム | |
CN110929207A (zh) | 数据处理方法、装置和计算机可读存储介质 | |
JP5718256B2 (ja) | システム性能解析装置、システム性能解析方法、およびシステム性能解析プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20120807 |