JP6064734B2 - ワークフロー制御プログラム、装置および方法 - Google Patents

ワークフロー制御プログラム、装置および方法 Download PDF

Info

Publication number
JP6064734B2
JP6064734B2 JP2013066847A JP2013066847A JP6064734B2 JP 6064734 B2 JP6064734 B2 JP 6064734B2 JP 2013066847 A JP2013066847 A JP 2013066847A JP 2013066847 A JP2013066847 A JP 2013066847A JP 6064734 B2 JP6064734 B2 JP 6064734B2
Authority
JP
Japan
Prior art keywords
workflow
execution
exclusive
resource
state
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2013066847A
Other languages
English (en)
Other versions
JP2014191604A5 (ja
JP2014191604A (ja
Inventor
孝昌 大橋
孝昌 大橋
章一 小木曽
章一 小木曽
雄介 口脇
雄介 口脇
古川 正和
正和 古川
雅広 福田
雅広 福田
崇 池▲崎▼
崇 池▲崎▼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2013066847A priority Critical patent/JP6064734B2/ja
Priority to US14/222,740 priority patent/US9940598B2/en
Publication of JP2014191604A publication Critical patent/JP2014191604A/ja
Publication of JP2014191604A5 publication Critical patent/JP2014191604A5/ja
Application granted granted Critical
Publication of JP6064734B2 publication Critical patent/JP6064734B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • G06Q10/06316Sequencing of tasks or work
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0633Workflow analysis

Landscapes

  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Operations Research (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • Educational Administration (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、ワークフロー制御プログラム、装置および方法に関する。
業務システムは、サーバ、ストレージ、ネットワーク機器などの多数の装置や、それらの装置に搭載されたOS(Operating System)、ミドルウェア、アプリケーションなどのプログラムといった、多くの資源によって構成されている。このような業務システムが複数稼働している状況において、データセンタは、それらの業務システムの監視や保守作業などの運用作業を行う。
近年、業務システムの運用作業をワークフロー化して自動化を進める技術として、RBA(Runbook Automation)技術が注目されている。RBA技術により、単純作業による運用負荷の軽減、ヒューマンエラーの削減、運用コストの低減といった様々な効果が期待できる。
また、ワークフローに関する技術としては、例えば、ドキュメントに対して作業を行うユーザに付与されたアクセス権を管理テーブルにて管理し、フロー管理者がドキュメントフローを定義画面から設定する際、管理テーブルに基づいて当該ドキュメントに対してアクセス権が付与されたユーザのみが設定されるように制御するデータフロー管理システムがある。
特開2003−256630号公報
ところで、同一のリソースを用いた処理をそれぞれ含む第1,第2のワークフローが実行されている状況では、各ワークフローに含まれる上記リソースを用いた処理は排他的に実行される。ここで、例えば第1のワークフローに含まれる上記リソースを用いた処理に異常が発生した場合、第1のワークフローの実行を中断し、排他権を第2のワークフローに移すことで、第2のワークフローの処理を続行させることができる。しかしながら、第1のワークフローの実行を中断するだけでは、その後に第2のワークフローに含まれる上記リソースを用いた処理が実行される際に異常が発生する可能性がある。
1つの側面では、ワークフローの実行が中断した後に他のワークフローを正常に実行できるようにしたワークフロー制御プログラム、装置および方法を提供することを目的とする。
1つの案では、同一のリソースを用いた処理をそれぞれ含む第1のワークフローおよび第2のワークフローの実行を制御するためのワークフロー制御プログラムが提供される。コンピュータは、このワークフロー制御プログラムに従って次のような処理を実行する。コンピュータは、第1のワークフローに含まれる処理のうち、上記のリソースを用いた1つ以上の処理を含む第1の処理群を実行する。また、コンピュータは、第1の処理群に含まれるいずれかの処理が中断したとき、上記のリソースの状態を第1の処理群の実行開始前の状態に戻す。そして、コンピュータは、上記のリソースの状態が第1の処理群の実行開始前の状態に戻ると、第2のワークフローに含まれる処理のうち、上記のリソースを用いた1つ以上の処理を含む第2の処理群の実行を開始する。
また、1つの案では、上記のワークフロー制御プログラムを実行するコンピュータと同様の処理を実行するワークフロー制御装置およびワークフロー制御方法が提供される。
1態様によれば、第1のワークフローの実行が中断した後に第2のワークフローを正常に実行できる。
第1の実施の形態に係る運用システムの構成例および動作例を示す図である。 第2の実施の形態に係る運用システムの構成例を示す図である。 運用自動化サーバのハードウェア構成例を示す図である。 運用自動化サーバの処理機能の構成例を示すブロック図である。 運用自動化サーバの処理全体の例を示すフローチャートである。 ワークフローに定義されている運用操作部品のモデル化について説明するための図である。 同一の操作対象/同一の変数利用に基づいて排他区間を決定する処理について説明するための図である。 排他区間のロックの競合関係を説明するための図である。 排他区間の結合の例を示す図である。 排他区間の分割の例を示す図である。 最も大きい実行優先度を持つ排他区間の抽出処理、および次に実行させる排他区間の判断処理の例を示す図である。 最も大きい実行優先度を持つ排他区間の抽出処理、および次に実行させる排他区間の判断処理の例を示す図である。 ワークフロー実行中に実行優先度が変更された場合のワークフローの排他権(実行権)獲得例を示す図である。 ワークフロー実行中に実行優先度が変更された場合のワークフローの排他権(実行権)獲得例を示す図である。 排他区間の処理を中断させた場合の他の排他区間への影響について説明するための図である。 ロールバック処理の手順を示す図である。 ロールバック処理により他のワークフローの実行が再開される例を示す図である。 人の承認処理待ちにより排他区間の処理が進行しなくなるケースについて説明するための図である。 並列分岐の分岐先の処理で異常が発生した場合について説明するための図である。 運用操作部品の実行が省略された場合のロールバック処理について説明するための図である。 ワークフロー管理テーブルの例を示す図である。 運用操作部品定義テーブルの例を示す図である。 変数管理テーブルの例を示す図である。 インスタンス管理テーブルの例を示す図である。 排他情報管理テーブルの例を示す図である。 排他獲得履歴テーブルの例を示す図である。 ユーザ係数テーブルの例を示す図である。 起動方式係数テーブルの例を示す図である。 時間係数テーブルの例を示す図である。 部品対定義テーブルの例を示す図である。 ワークフロー実行部の処理例を示すフローチャートである。 排他制御部の処理例を示すフローチャートである。 ワークフロー開始時の排他制御処理の例を示すフローチャートである。 排他情報の仮決定の処理例を示すフローチャートである。 排他情報の実行優先度の計算処理例を示すフローチャートである。 ワークフロー動作中の排他制御処理の例を示すフローチャートである。 排他アクション決定処理の例を示すフローチャートである。 計時処理の例を示すフローチャートである。 応答情報受信時の処理例を示すフローチャートである。 ロールバック処理の例を示すフローチャートである。
以下、本発明の実施の形態について図面を参照して説明する。
〔第1の実施の形態〕
図1は、第1の実施の形態に係る運用システムの構成例および動作例を示す図である。図1に示す運用システムは、ワークフロー制御装置1と、1つ以上のリソース(資源)とを有する。図1では例として、1つのリソース5を示す。
ワークフロー制御装置1は、複数のワークフローの実行を制御する。各ワークフローには、1つ以上の処理が含まれている。ワークフローに含まれる個々の処理とは、例えば、リソースの監視や保守などのためにそのリソースに何らかの操作を行う処理である。リソースとは、例えば、ワークフロー制御装置1の外部の装置、外部の装置で実行されるプログラムなどである。
なお、各ワークフローに含まれる処理の内容や処理順は、例えば、図示しないワークフロー定義情報に定義されている。この場合、「ワークフローを実行する」とは、ワークフロー定義情報に定義された情報に従って処理を実行することである。
ワークフロー制御装置1は、第1の実行部2、第2の実行部3およびロールバック処理部4を有する。第1の実行部2、第2の実行部3およびロールバック処理部4の処理は、例えば、ワークフロー制御装置1が備えるプロセッサが所定のプログラムを実行することによって実現される。
第1の実行部2は、ワークフロー11を実行する。第2の実行部2は、ワークフロー12を実行する。ワークフロー11,12のそれぞれには、同一のリソース5を用いた処理が含まれている。図1の例では、ワークフロー11には、それぞれリソース5を用いた処理11a〜11cを含む処理群11−1が含まれている。また、ワークフロー12には、それぞれリソース5を用いた処理12a〜12cを含む処理群12−1が含まれている。
なお、例えば、それぞれ同一のリソース5を用いて実行される処理群11−1と処理群12−1は排他的に実行される。これにより、各処理群における処理の整合性が保たれる。
ロールバック処理部4は、あるワークフローの処理群に含まれるいずれかの処理が中断したとき、その処理群の処理対象のリソースの状態を、中断した処理が含まれる処理群の実行開始前の状態に戻す。リソースの状態が、この処理群の実行開始前の状態に戻されると、同じリソースを用いて処理を行う他のワークフローの処理群の実行が開始される。
次に、ワークフロー11の処理群11−1が実行されている場合の処理例について説明する。第1の実行部2は、処理群11−1の各処理を順に実行する(ステップS1)。ここで、処理群11−1に含まれる処理11bの実行が中断したものとする(ステップS2)。なお、処理11bの実行が中断されるケースとしては、例えば、処理11bの実行時に異常が発生した場合などが考えられる。
ロールバック処理部4は、処理11bの実行が中断したとき、リソース5の状態を、処理群11−1の実行開始前の状態に戻す(ステップS3)。リソース5の状態が処理群11−1の実行前の状態に戻ると、第2の実行部3は、第2のワークフロー12の処理群12−1の実行を開始する(ステップS4)。
上記処理では、処理11bの実行が中断したとき、リソース5の状態が処理群11−1の実行前の状態に戻るまで、他のワークフロー12の処理群12−1の実行が開始されない。これにより、処理群12−1の実行時に異常が発生する確率を低減することができる。
例えば、処理群の実行が中断されて、処理群の処理のうちその中断位置より後に存在する処理が実行されないことが、その後に同じリソースを用いて処理する他のワークフローの処理群の実行に悪影響を与えるケースがある。その例として、処理が中断した処理群の中に対になって実行される2つの処理が含まれているケースがある。ここでは、このように対になって実行される処理のうち、先に実行される処理を「前処理」と呼び、後に実行される処理を「後処理」と呼ぶ。以下、処理11aが前処理であり、処理11cが後処理であるものとする。また、ワークフロー12の処理12aの処理内容は、処理11aと同様であるものとする。
前処理(処理11a)の実行後に後処理(処理11c)が実行されることにより、例えば、その後に他のワークフローに含まれる同じリソースを用いた同じ前処理(処理12a)が行われる際に、リソースの状態がその前処理(処理12a)を正常に実行可能な状態になることが保証される。また、後処理(処理11c)は、対応する前処理(処理11a)とこの後処理(処理11c)との間の処理(処理11b)によってリソースに施された設定変更やプログラムの変更を、リソースに正しく適用して、リソースを安定的に動作させるような処理であることもある。
上記の例のように、ワークフロー11の処理群11−1の処理が正常に完了せずに途中で中断すると、処理群11−1に含まれる後処理が実行されない場合があり得る。この場合、処理が中断したときに処理群11−1について何の処置も施さずに、ワークフロー12の処理群12−1の実行を開始させてしまうと、処理群12−1の実行時に異常が発生する可能性が高まる。例えば、処理群12−1に、処理群11−1に含まれていた前処理(処理11a)と同じ処理(処理12a)が含まれる場合、この処理(処理12a)が正常に実行されない可能性が生じる。また、処理群11−1の後処理(処理11c)が実行されないことでリソース5が不安定な状態のままになり、その結果、処理群12−1の実行時に異常が発生することもあり得る。
これに対し、本実施の形態のワークフロー制御装置1は、処理11bの実行が中断したとき、リソース5の状態を処理群11−1の実行前の状態に戻す。これにより、リソース5の状態は、少なくとも、対応する後処理(処理11c)の実行が必要となる前処理(処理11a)が実行される前の状態に確実に戻る。この状態は、例えば、処理群11−1内の前処理(処理11a)を正常に実行可能な状態であるとともに、処理群12−1内の同じ前処理(処理12a)を正常に実行可能な状態でもある。このため、この後に処理群12−1内の同じ前処理(処理12a)が実行された場合でも、この前処理(処理12a)は正常に実行可能となる。また、例えば、リソース5の状態が処理群11−1の実行前の状態に戻ることで、リソース5の状態が不安定な状態から安定した状態に戻ることもある。
従って、リソース5の状態が処理群11−1の実行前の状態に戻った後、他のワークフロー12の処理群12−1の実行が開始されることで、処理群12−1の実行時に異常が発生する確率が低くなる。
〔第2の実施の形態〕
図2は、第2の実施の形態に係る運用システムの構成例を示す図である。図2に示す運用システムは、運用自動化サーバ100と、1つ以上の業務サーバ210とを含む。運用自動化サーバ100と業務サーバ210とは、ネットワーク200を介して接続されている。業務サーバ210は、各種の業務処理を実行する。運用自動化サーバ100は、業務サーバ210の監視や保守作業などの運用作業を自動化して管理する。運用自動化サーバ100は、RBA技術を用いて、業務サーバ210の運用作業手順が記述されたワークフローに従って業務サーバ210の運用を管理する。
図3は、運用自動化サーバのハードウェア構成例を示す図である。運用自動化サーバ100は、例えば、図3に示すようなコンピュータとして実現される。
運用自動化サーバ100は、プロセッサ101によって装置全体が制御されている。プロセッサ101には、バス108を介して、RAM(Random Access Memory)102と複数の周辺機器が接続されている。プロセッサ101は、マルチプロセッサであってもよい。プロセッサ101は、例えばCPU(Central Processing Unit)、MPU(Micro Processing Unit)、DSP(Digital Signal Processor)、ASIC(Application Specific Integrated Circuit)、またはPLD(Programmable Logic Device)である。またプロセッサ101は、CPU、MPU、DSP、ASIC、PLDのうちの2以上の要素の組み合わせであってもよい。
RAM102は、運用自動化サーバ100の主記憶装置として使用される。RAM102には、プロセッサ101に実行させるOSのプログラムやアプリケーションプログラムの少なくとも一部が一時的に格納される。また、RAM102には、プロセッサ101による処理に必要な各種データが格納される。
バス108に接続されている周辺機器としては、HDD(Hard Disk Drive)103、グラフィック処理装置104、入力インタフェース105、読み取り装置106および通信インタフェース107がある。
HDD103は、運用自動化サーバ100の補助記憶装置として使用される。HDD103には、OSのプログラム、アプリケーションプログラム、および各種データが格納される。なお、補助記憶装置としては、SSD(Solid State Drive)などの他の種類の不揮発性記憶装置を使用することもできる。
グラフィック処理装置104には、表示装置104aが接続されている。グラフィック処理装置104は、プロセッサ101からの命令に従って、画像を表示装置104aの画面に表示させる。表示装置104aとしては、CRT(Cathode Ray Tube)を用いた表示装置や液晶表示装置などがある。
入力インタフェース105には、入力装置105aが接続されている。入力インタフェース105は、入力装置105aから出力される信号をプロセッサ101に送信する。入力装置105aとしては、キーボードやポインティングデバイスなどがある。ポインティングデバイスとしては、マウス、タッチパネル、タブレット、タッチパッド、トラックボールなどがある。
読み取り装置106には、可搬型記録媒体106aが脱着される。読み取り装置106は、可搬型記録媒体106aに記録されたデータを読み取ってプロセッサ101に送信する。可搬型記録媒体106aとしては、光ディスク、光磁気ディスク、半導体メモリなどがある。
通信インタフェース107は、ネットワーク200を介して、業務サーバ210などの他の装置との間でデータの送受信を行う。
以上のようなハードウェア構成によって、運用自動化サーバ100の処理機能を実現することができる。なお、図2に示した業務サーバ210、および図1に示したワークフロー制御装置1も、図3に示したハードウェアを有するコンピュータとして実現することができる。
図4は、運用自動化サーバの処理機能の構成例を示すブロック図である。運用自動化サーバ100は、排他制御部110およびワークフロー実行部120を備える。排他制御部110およびワークフロー実行部120の処理は、例えば、運用自動化サーバ100が備えるプロセッサ101が所定のプログラムを実行することによって実現される。
排他制御部110は、ワークフローの実行を管理する。ここで、排他区間とは、ワークフローにおいて排他制御を行う所定の区間をいう。排他制御とは、複数のワークフローが同時に動作して、共通の資源を同時に使用すると競合状態になる場合に、いずれかのワークフローを優先して動作させ、その他のワークフローを処理待ち状態にして、競合を回避させることをいう。
排他制御部110は、ワークフローの実行時に排他区間を動的に決定する。排他制御部110は、排他区間の決定に際して、未来を予測した操作の実行優先度に従ってワークフローの実行順を制御する。
また、排他制御部110は、排他区間に含まれる処理が異常発生などによって中断した場合、その排他区間の先頭位置までロールバックを行った上で、排他状態を解除する。これにより、この排他区間における操作対象の資源を、中断した処理が含まれるワークフローとは別のワークフローが利用して処理を行うことができるようにし、処理の停滞を防止する。
ワークフロー実行部120は、排他制御部110の制御の下でワークフローを実行する。ワークフロー実行部120は、ワークフローごとに個別に設けられる。従って、複数のワークフローが実行される場合、ワークフロー実行部120も複数存在する。
また、運用自動化サーバ100は、排他制御部110およびワークフロー実行部120の処理時に利用される各種の情報を記憶する記憶部130を備える。記憶部130には、ワークフロー管理テーブル131、運用操作部品定義テーブル132、変数管理テーブル133、インスタンス管理テーブル134、排他情報管理テーブル135、排他獲得履歴テーブル136、ユーザ係数テーブル137、起動方式係数テーブル138、時間係数テーブル139および部品対定義テーブル140が記憶される。
ワークフロー管理テーブル131には、各ワークフローに含まれる運用操作部品の情報が格納される。運用操作部品定義テーブル132には、運用操作部品の定義情報が格納される。
変数管理テーブル133には、インスタンスで利用される変数名や変数値が格納される。インスタンス管理テーブル134には、インスタンス単位で管理される情報が格納される。
排他情報管理テーブル135には、排他区間に関する情報が格納される。排他獲得履歴テーブル136には、排他区間の排他権(実行権)の獲得の履歴情報が格納される。
ユーザ係数テーブル137には、ユーザごとのユーザ係数が格納される。起動方式係数テーブル138には、ワークフローの起動方法ごとの起動方式係数が格納される。時間係数テーブル139には、処理が完了するまでの残り時間ごとの時間係数が格納される。
部品対定義テーブル140には、対となる運用操作部品に関する情報が格納される。この部品対定義テーブル140は、ロールバック時に排他制御部110によって参照される。
次に、運用自動化サーバ100の処理について詳しく説明する。以下の説明では、まず、運用自動化サーバ100の基本的な処理である「ワークフロー実行時における動的な排他制御」について説明し、その後に「処理中断時のロールバック処理」について説明する。
<ワークフロー実行時における動的な排他制御>
運用自動化サーバ100は、複数のワークフローの実行時において、各ワークフローの進捗状況に応じて適切な排他区間を動的に決定する。
排他制御部110は、ワークフローの動作開始時に、運用操作部品の種類と利用している資源(操作対象や変数)とから排他区間を仮決定する。排他制御部110は、仮決定した排他区間を基準として、ワークフローの動作中に他のワークフローの実行状況と排他状況を考慮して排他区間を動的に決定する。ここで、運用操作部品とは、ワークフローに含まれる各処理を業務サーバ210に自動的に実行させるように、業務サーバ210に対する運用操作を自動的に実行するよう記述したスクリプトである。
また、排他制御部110は、排他を獲得する際に、獲得済みの排他と、排他を獲得していない他のワークフローの排他取得予定情報、実行優先度を考慮することで、予測に基づいた排他制御を行う。そのために、排他制御部110は、ワークフローの作業の順序を適宜変更する。
図5は、運用自動化サーバの処理全体の例を示すフローチャートである。運用自動化サーバ100へのワークフローの登録時に、排他制御部110は、モデル化処理(ステップS11)、排他区間の初期設定処理(ステップS12)を行う。また、ワークフローの動作時に、排他制御部110は、排他区間の再設定処理(ステップS13)を行う。
まず、ワークフロー登録時の処理について説明する。モデル化処理(ステップS11)では、次のような処理が行われる。
排他制御部110は、登録されたワークフローの運用操作部品の内容に基づいて、運用操作部品をグループ分けし、操作重要度を定義する。例えば、排他制御部110は、業務サーバ210への情報の登録、ネットワークの設定などの設定系の運用操作部品の操作重要度を、「高(または「3」)」に設定する。また、排他制御部110は、OSの再起動、サービスの起動などの操作系の運用操作部品の操作重要度を、例えば、「中(または「2」)」に設定する。また、排他制御部110は、サーバ/サービスの状態確認などの参照・確認・通知系の運用操作部品の操作重要度を、例えば、「低(または「1」)」に設定する。これにより、次の図6で説明するように、ワークフローに定義されている運用操作部品をモデル化することができる。モデル化したワークフローによって、各運用操作部品の操作重要度が決定される。
図6は、ワークフローに定義されている運用操作部品のモデル化について説明するための図である。図6の例では、ワークフローAには、「操作対象、資源の取得」21、「サービスの停止」22、「サービスの停止確認」23、「サーバ停止」24、「サーバ起動」25、「サーバの起動確認」26、「エラー通知メール」27,28の各運用操作部品が定義されている。また、ワークフローBには、「操作対象、資源の取得」31、「ソフトウェアのインストール」32、「情報登録」33、「サーバ再起動」34、「サーバの起動確認」35、「メール送信」36、「エラー通知メール」37の各運用操作部品が定義されている。
ワークフローAがモデル化されると、「操作対象、資源の取得」21は「参照系」21−1にモデル化され、重要度:1が設定される。「サービスの停止」22は「操作系」22−1にモデル化され、重要度:2が設定される。「サービスの停止確認」23は「参照系」23−1にモデル化され、重要度:1が設定される。「サーバ停止」24は「操作系」24−1にモデル化され、重要度:2が設定される。「サーバ起動」25は「操作系」25−1にモデル化され、重要度:2が設定される。「サーバの起動確認」26は「参照系」26−1にモデル化され、重要度:1が設定される。「エラー通知メール」27,28は通知系27−1,28−1にそれぞれモデル化される。
また、ワークフローBがモデル化されると、「操作対象、資源の取得」31は「参照系」31−1にモデル化され、重要度:1が設定される。「ソフトウェアのインストール」32は「設定系」32−1にモデル化され、重要度:3が設定される。「情報登録」33は「設定系」33−1にモデル化され、重要度:3が設定される。「サーバ再起動」34は「操作系」34−1にモデル化され、重要度:2が設定される。「サーバの起動確認」35は「参照系」35−1にモデル化され、重要度:1が設定される。「メール送信」36および「エラー通知メール」37は、「通知系」36−1,37−1にそれぞれモデル化される。
次に、排他区間の初期設定処理(図5のステップS12)では、次のような処理が行われる。
排他制御部110は、次の図7および図8で説明するように、(i)同一の操作対象/同一の変数利用、および(ii)各運用操作部品で利用する資源の流れ(変数の受け渡し)に基づいて、排他区間を自動的に決定する。具体的には、排他制御部110は、連続する運用操作部品について、操作対象サーバが同じか否か、または操作対象サーバと操作内容(サービス、インストールするソフトウェア)が同じか否かに基づいて、排他区間を決定する。なお、[排他区間:A]の“A”を「排他区間名」と定義する。
例えば、操作対象がサーバAの区間は、[排他区間:A]で定義される。操作対象がサーバBの区間は、[排他区間:B]で定義される。また、[排他区間:A]において、ServiceXに対する操作の区間は[排他区間:A+X]で定義される。また、[排他区間:A]において、InstallSoftYに対する操作の区間は[排他区間:A+Y]で定義される。また、運用操作部品の出力情報が後続の運用操作部品の入力となっている区間は、[排他区間:C]で定義される。
図7は、同一の操作対象/同一の変数利用に基づいて排他区間を決定する処理について説明するための図である。
図7(A)において、運用操作部品22−1,23−1について、操作対象サーバは「サーバA」で同じであり、サービスも「サービスX」で同じである。この場合、排他制御部110は、運用操作部品22−1,23−1について[排他区間:A+X]と決定する。運用操作部品24−1について、操作対象サーバはサーバAである。この場合、排他制御部110は、運用操作部品24−1について[排他区間:A]と決定する。運用操作部品25−1,26−1について、操作対象サーバはサーバBである。この場合、排他制御部110は、運用操作部品25−1,26−1について[排他区間:B]と決定する。
図7(B)において、排他制御部110は、運用操作部品32−1,33−1について[排他区間:A+Y]と決定し、運用操作部品34−1,35−1について[排他区間:A]と決定する。
なお、排他制御部110は、各運用操作部品で利用する資源の流れ(変数の受け渡し)に基づいて、排他区間を決定することもできる。この処理では、排他制御部110は、運用操作部品の出力値が後続の運用操作部品の入力値になっているか否かに基づいて、排他制御の範囲を選定する。例えば、あるサーバ(サーバCとする)から取得したイベントログ(ログ情報)がデータベースサーバに格納される場合、排他制御部110は、その区間について[排他区間:C]と定義する。
各排他区間におけるロックの競合関係は、排他区間名が以下のいずれかの場合である。
・排他を獲得する排他区間名が、排他獲得済みの排他区間名と少なくとも部分一致する。
・排他獲得済みの排他区間名が、排他を獲得する排他区間名と少なくとも部分一致する。
従って、排他制御部110は、排他を獲得する排他区間名が、排他獲得済みの排他区間名と少なくとも部分一致するか、または、排他獲得済みの排他区間名が、排他を獲得する排他区間名と少なくとも部分一致するかを判定する。排他を獲得する排他区間名が、排他獲得済みの排他区間名と少なくとも部分一致すると判定した場合、排他制御部110は、排他ロックが競合関係にあると判定する。また、排他獲得済みの排他区間名が、排他を獲得する排他区間名と少なくとも部分一致すると判定した場合、排他制御部110は、排他ロックが競合関係にあると判定する。
図8は、排他区間のロックの競合関係を説明するための図である。例えば、排他獲得済みの排他区間が[排他区間:A]の場合であって、排他を獲得する排他区間が[排他区間:A]、[排他区間: A+X]または[排他区間: A+Y]の場合、排他ロックは競合関係になる。一方、排他獲得済みの排他区間が[排他区間:A]の場合であって、排他を獲得する排他区間が[排他区間:B]、または[排他区間:C]の場合、排他ロックは競合関係にならない。
次に、ワークフロー動作時の処理について説明する。排他区間の再設定処理(図5のステップS13)では、次のような処理が行われる。
ワークフローが起動すると、排他制御部110は、ワークフローの内容を取得して分析する。そして、ワークフローに含まれるすべての運用操作部品について次の処理が実行される。排他制御部110は、起動したワークフローにおいて、排他区間の調整および決定を行い、また、動作中のワークフローにおいて、排他区間の調整および決定を行う。ワークフロー実行部120は、その調整および決定結果に基づいて、運用操作部品を実行するように、業務サーバ210に命令する。
以下、ワークフロー動作時の上記処理について詳細を示す。
(1−1)ワークフローの内容を取得・分析の詳細
ワークフロー起動時に、排他制御部110は、実行優先度を以下の処理により決定する。まず、排他制御部110は、あらかじめ運用自動化サーバ100の記憶装置に登録された、ワークフローに定義されている運用操作部品および利用する資源の情報を取得する。次に、排他制御部110は、各運用操作部品で利用する資源の情報(操作対象の情報/変数の内容)に基づいて、図5のステップS12と同様の処理を再度実行し、次の場合に排他区間を再設定する。すなわち、排他制御部110は、異なる変数が入力される排他区間において、その変数が同じ値に変更された場合にはその排他区間を結合する。また、排他制御部110は、同じ変数で設定した排他区間において、その変数の内容が変更された場合にその排他区間を分割する。
図9は、排他区間の結合の例を示す図である。この図9の例は、異なる変数で設定した排他区間において、その変数が同じ値に変更された場合に、その排他区間が結合されることを示す。排他区間の結合前では、運用操作部品22−1〜24−1については[排他区間:A]が設定され、運用操作部品25−1〜26−1については[排他区間:B]が設定されている。
その後、ワークフローが実行されて、変数の値に変化が生じたとする。このとき、運用操作部品22−1〜24−1に設定された変数Aの値は「ServerA」であり、運用操作部品25−1〜26−1に設定された変数Bの値も「ServerA」である。この場合、隣接する[排他区間:A]と[排他区間:B]において変数Aの値と変数Bの値が同じなので、排他制御部110は、[排他区間:A]と[排他区間:B]とを結合し、[排他区間:A]とする。
図10は、排他区間の分割の例を示す図である。この図10の例は、同じ変数で設定した排他区間において、変数の内容が変更された場合に、排他区間が分割されることを示す。排他区間の分割前では、運用操作部品22−1〜26−1については[排他区間:A]が設定されている。
その後、ワークフローが実行されて、変数の値に変化が生じたとする。このとき、運用操作部品22−1〜23−1に設定された変数Aの値は「ServerA」である。一方、運用操作部品24−1〜26−1に設定された変数Aの値は「ServerB」である。この場合、運用操作部品22−1〜23−1と運用操作部品24−1〜26−1の間で変数Aの値が異なるので、排他制御部110は、[排他区間:A]を分割し、[排他区間:A]と[排他区間:B]を形成する。
次に、排他制御部110は、以下の式(1)に従い、ワークフローを起動したユーザと、ワークフローの起動の仕方と、完了予定時刻までの残り時間とに応じて、操作緊急度を決定する。
操作緊急度=ユーザ係数×起動方式係数×時間係数 ・・・(1)
ユーザ係数は、ワークフローを起動したユーザのユーザ係数である。ユーザ係数としては、例えば、管理者ユーザの場合にはユーザ係数=3.0が設定され、一般ユーザの場合にはユーザ係数=2.0が設定される。
起動方式係数としては、例えば、ワークフローの起動が手動起動の場合には、起動方式係数=2.0が設定される。ワークフローの起動が時間指定によるスケジュール起動の場合には、起動方式係数=3.0が設定される。ワークフローの起動が監視製品からの通知による起動の場合には、起動方式係数=3.0が設定される。
時間係数としては、例えば、完了予定時刻までの残り時間が10分以内の場合には時間係数=1.5が設定され、それ以外、または、完了予定時刻指定なしの場合には時間係数=1.0が設定される。
次に、排他制御部110は、以下の式(2)に従い、ワークフローの実行優先度を仮決定する。
実行優先度=(Σ操作重要度)×操作緊急度 ・・・(2)
ここで、例として、操作系の運用操作部品[1]および参照系の運用操作部品[2]に排他区間が設定されたワークフローAについて、仮決定される実行優先度の計算例を示す。ワークフローAについては、ユーザ係数=2.0、起動方式係数=1.0、時間係数=1.5が設定されているものとする。
運用操作部品[1]の操作重要度は「2」であり、運用操作部品[2]の操作重要度は「1」であるから、Σ操作重要度=2+1=3となる。また、式(1)から、操作緊急度=2.0×1.0×1.5=3.0と算出される。よって、式(2)から、実行優先度=3.0×3.0=9.0と算出される。
(1−2)ワークフローの動作中に仮決定されたワークフローの排他区間の調整・決定
次に、排他制御部110は、ワークフローの動作中に仮決定されたワークフローの排他区間の調整・決定を行う。ワークフローが動作した場合、排他制御部110は、ワークフローの分岐や運用操作部品の処理結果によって、実行優先度を変更する。また、排他制御部110は、実行優先度に応じて、実行している運用操作部品の次の運用操作部品を、即時実行させるか待たせるかを決定する。これらの処理は、以下の手順(I)〜(V)により実行される。
(I)排他制御部110は、ワークフロー実行部120から所定の通知を受信する。
(II)排他制御部110は、前述した「(1―1)ワークフローの内容を取得・分析の詳細」の処理を実行し、排他区間と実行優先度を決定し直す。
(III)排他制御部110は、上記(II)で再決定した排他区間と実行優先度を記憶装置に格納する。
(IV)排他制御部110は、実行中のワークフローから、最も大きい実行優先度を持つ排他区間を抽出する。
(V)排他制御部110は、次の運用操作部品を即時実行するか待たせるかを判断する。ここでは、排他制御部110は、対象となるワークフローの排他取得が決定した場合、運用操作部品を実行する。また、他のワークフローの排他取得が優先となった場合、排他制御部110は、その実行作業を遅延させる。
上記(IV),(V)の処理について、以下の図11〜図16を用いて説明する。
図11,図12は、最も大きい実行優先度を持つ排他区間の抽出処理、および次に実行させる排他区間の判断処理の例を示す図である。図11,図12では、ワークフローA,B,Cを並列に実行させる場合について説明する。図11,図12の各ワークフローにおいて、下向きの三角マークは、現在の処理位置を示す。また、後述する排他権(実行権)を獲得している間、そのワークフローは、処理を実行することができる。
図11において、ワークフローAの[排他区間:A+X]について処理しようとした場合、ワークフローCの[排他区間:A+X]の実行優先度が高いため、ワークフローAはワークフローCの排他が解放されるまで待ち状態になる(ステップS21)。
ワークフローBの[排他区間:A+Y]は[排他区間:A+X]と競合関係にないため、ワークフローBは排他権(実行権)を獲得する(ステップS22)。
ワークフローCの[排他区間:A+X]については、現時点でのワークフローA,B,Cの排他区間で最も実行優先度が高いため、ワークフローCは、排他権(実行権)を獲得する(ステップS23)。
次に、図12に示すように、ワークフローCの[排他区間:A+X]の処理が完了した場合、[排他区間:A+X]の排他状態が解放される。その結果、ワークフローAの[排他区間:A+X]が最も実行優先度が高いため、ワークフローAは、排他権(実行権)を獲得する(ステップS24)。
ワークフローCの[排他区間:A]について、ワークフローCは、ワークフローAの[排他区間:A+X]の排他状態が解放されるまで、待ち状態になる(ステップS25)。
この後、図示しないが、ワークフローAの[排他区間:A+X]の処理が完了した場合、[排他区間:A+X]の排他状態が解放される。ここで、ワークフローB,Cの[排他区間:A]において実行優先度が同じである場合、管理者権限のため(すなわち、ユーザ係数が最も大きいため)、ワークフローCが優先して排他権(実行権)を獲得する。
図13,図14は、ワークフロー実行中に実行優先度が変更された場合のワークフローの排他権(実行権)獲得例を示す図である。
図13に示すように、ワークフローAの[排他区間:A]について、ワークフローAが排他権(実行権)を獲得した場合、ワークフローBは[排他区間:A]の排他権(実行権)の獲得前であるが、ワークフローBの実行優先度が最も高い。このため、ワークフローAの[排他区間:A]については、ワークフローBが[排他区間:A]の排他権(実行権)を獲得して実行し、その排他状態が解放されるまで、ワークフローAは待ち状態となる(ステップS31)。
その後、図14に示すように、時間経過により時間係数が変化する。その結果、ワークフローAの[排他区間:A]の実行優先度が変更される。このとき、ワークフローAの[排他区間:A]の実行優先度が最も高くなるため、ワークフローAは、排他権(実行権)を獲得して処理を行う(ステップS32)。
以上の図11〜図14に示したように、各ワークフローにおける同一資源についての排他区間の処理は、実行優先度が高い順に実行される。また、実行優先度が変更されると、ワークフロー間で実行優先度が再度比較され、その時点で最も大きい実行優先度を有する排他区間の処理が先に実行される。
<処理中断時のロールバック処理>
上記処理により、同一資源を操作する排他区間を含むワークフローが複数存在する場合には、実行優先度の高い排他区間が排他権を獲得して、この排他区間の処理が優先的に実行される。そして、実行された排他区間の処理が完了するまで、他のワークフローの排他区間の処理は待ち状態となる。
しかしながら、排他権を獲得した排他区間の処理の途中で異常が発生し、排他区間の処理が最後まで正常に完了しない場合があり得る。あるいは、排他権を獲得した排他区間の処理の実行が大幅に遅延する場合もあり得る。後者の例としては、排他区間に人の承認を必要とする処理が含まれ、この処理において長時間人の承認待ち状態が続いているというケースがある。
これらの場合、排他権を獲得している排他区間の処理を中断させて、排他権を他の排他区間に付与しないと、他の排他区間を含むワークフローの処理を継続することができない。しかし、単に排他区間の処理を中断させて、その他の排他区間の処理を実行させるだけでは、中断させた排他区間以外の排他区間においても処理の異常が発生する可能性がある。
図15は、排他区間の処理を中断させた場合の他の排他区間への影響について説明するための図である。
図15において、ワークフローAの[排他区間:A]に含まれる運用操作部品41と、ワークフローBの[排他区間:A]に含まれる運用操作部品44は、ともに同じ操作を行うものである。また、ワークフローAの[排他区間:A]に含まれる運用操作部品のうち、末尾に位置する運用操作部品43の処理内容は、それより前(この例では先頭)に位置する運用操作部品41に対応する後処理であるものとする。
後処理は、例えば、操作対象資源の状態を前処理とは逆の状態に変化させるものである。例えば、運用操作部品41がサービスを停止させるものである場合、後処理である運用操作部品43はサービスを起動させるものである。このような運用操作部品43が実行されることで、サービスの状態を「サービスを停止させる」という処理の実行時に想定される正しい状態、すなわち起動状態に変化させることができる。従って、運用操作部品43が実行された後、運用操作部品41と同じ内容の運用操作部品(例えば運用操作部品44)が実行されたときに、サービスの状態が、その運用操作部品の実行時に想定される正しい状態であることが保証される。
また、後処理は、操作対象資源の動作が安定していることを保証するための処理である場合もある。例えば、運用操作部品41がサービスを停止させるものであり、運用操作部品43はサービスを起動させるものであるとする。また、これらの間に実行される運用操作部品42が、サービスの設定変更、あるいはプログラムの更新を行うものであるとする。
この場合、運用操作部品41の実行によりサービスは停止し、その状態で運用操作部品42の実行により設定変更やプログラムの更新が行われる。そして、運用操作部品43の実行によりサービスが起動することで、変更された設定情報や更新されたプログラムがサービスに適用され、サービスが安定的に動作するようになる。
ここで、ワークフローAが排他資源Aの排他権を獲得して、ワークフローAの[排他区間:A]が実行された場合を考える。この場合、ワークフローBの[排他区間:A]の処理は、ワークフローAの[排他区間:A]の処理が完了するまで実行されない。
そして、ワークフローAの[排他区間:A]の処理全体が正常に完了すると、次にワークフローBが排他資源Aの排他権を獲得して、ワークフローBの[排他区間:A]の処理が実行される。この場合、運用操作部品43に基づく後処理が操作対象のサービスについて行われているので、ワークフローBの[排他区間:A]の実行開始時点では操作対象のサービスは正常に動作している。従って、ワークフローBの[排他区間:A]の処理も正常に実行される。
一方、例えば、ワークフローAの[排他区間:A]に含まれる運用操作部品42の実行により異常が発生したと判定されて、運用操作部品43が実行されないまま、ワークフローAの[排他区間:A]の処理が終了してしまったものとする。この場合、ワークフローBの処理を継続させるために、排他資源Aの排他権をワークフローBに移す必要がある。しかしながら、単に排他権をワークフローBに移してワークフローBの[排他区間:A]の処理を実行させてしまうと、操作対象のサービスは運用操作部品43による後処理が実行されていない状態となる。このため、ワークフローBの[排他区間:A]の処理でも異常が発生する可能性が高くなる。
例えば、ワークフローAの[排他区間:A]の処理全体が正常に完了した場合、ワークフローBの[排他区間:A]の開始時点において操作対象のサービスは起動状態となる。一方、ワークフローAの運用操作部品42において実行が停止した場合、ワークフローBの[排他区間:A]の開始時点において操作対象のサービスは停止状態となる。運用操作部品42の異常発生時に排他権をワークフローBに移してワークフローBの[排他区間:A]の処理を実行させてしまうと、サービスを停止させる運用操作部品44の実行時においてサービスはすでに停止状態となってしまう。このことが原因となって、運用操作部品44の実行の際に異常が発生する可能性が生じる。
また、後処理である運用操作部品43が実行されないことにより、操作対象のサービスが不安定な状態のままワークフローBの[排他区間:A]が実行されることも考えられる。この場合も、ワークフローBの[排他区間:A]の実行の際に異常が発生する可能性が生じる。
このような事態を回避するために、運用自動化サーバ100は、排他区間の途中において処理が停止した場合、操作対象資源の状態が少なくとも排他区間の開始直前の状態に戻るように、その排他区間の先頭までロールバックを行う。
排他区間の先頭までロールバックが行われることで、操作対象のサービスの状態は、前述した後処理が必要となる前処理(ここでは運用操作部品41)が実行される前の状態に戻る。これにより、操作対象のサービスの状態は、運用操作部品41の実行時に想定される正しい状態になるとともに、運用操作部品44の実行時に想定される正しい状態にもなる。また、操作対象のサービスの状態は、後処理(ここでは運用操作部品43)によって動作を安定化させる必要のない、安定的な状態に戻る。従って、次に実行される排他区間の処理において異常が発生する確率が低減される。
また、異なるワークフローそれぞれに含まれる、同じ資源を操作する排他区間の処理は、基本的に、互いに他のワークフローの排他区間の処理に影響を及ぼさないように設計される。例えば、前述したように実行優先度の変化に応じて排他区間の実行順序を入れ替えても異常が生じないのは、このような設計方針によるものである。このため、ある排他区間の処理が中断したとしても、操作対象資源の状態を、その排他区間の実行直前の状態に戻すことができれば、その資源を他のワークフローが操作したときに異常が発生する確率は低くなる。
図16は、ロールバック処理の手順を示す図である。以下、図16を用いてロールバックの基本的な処理手順について説明する。
ロールバック処理とは、実行済みの処理を逆順に辿っていって、操作対象資源の状態を処理の実行前の状態に戻すための処理を行うことである。このようなロールバック処理を実現するためには、各処理の実行前における操作対象資源の状態を示す情報を保存しておく仕組みが必要となる。
ここで、本実施の形態では、各ワークフローに含まれる処理の内容とその処理順の情報が、ワークフロー管理テーブル131に定義されている。図16に示すように、ワークフロー管理テーブル131には、「部品No.」、「運用操作部品名」、「操作対象」および「バックアップ資源」の各データ項目が含まれる。
「部品No.」には、そのワークフローに含まれる運用操作部品の番号が格納される。「運用操作部品名」には、運用操作部品の名称(操作内容)が格納される。「操作対象」には、操作対象となるサーバ、デバイスなどの資源の名称に対応する変数が入力値として格納される。そして、ワークフロー実行部120は、ワークフロー管理テーブル131に定義された情報を基に、ワークフローに含まれる処理を実行していく。
そこで、上記のようなロールバック処理を実現するために、ワークフロー実行部120は、ワークフローに含まれる各処理を実行する際に、その実行前の操作対象資源の状態を示す情報を、ワークフロー管理テーブル131において各処理に対応付けて保存しておく。具体的には、ワークフロー管理テーブル131に、「バックアップ資源」というデータ項目を設ける。そして、ワークフロー実行部120は、該当する運用操作部品を実行する際に、その実行前における操作対象資源の情報を「バックアップ資源」の項目に格納する。
「バックアップ資源」の項目に格納される情報は、処理の内容によって異なる。例えば、「ホスト名変更」など、データを変更する処理については、その変更前のデータが「バックアップ資源」の項目に格納される。「ファイルの削除」など、ある程度大きな容量のデータを変更する処理については、変更前のデータが一時データ用に別途確保された記憶領域(例えば、tmpディレクトリ)に格納されるとともに、その格納場所を示す情報が「バックアップ資源」の項目に格納される。「サービスの起動」など、操作対象の状態を変化させる処理については、その処理の実行前に操作対象資源から取得した、資源の状態を示す情報が「バックアップ資源」の項目に格納される。
また、操作対象資源の状態を処理の実行前の状態に戻すためには、元の処理とは異なる処理の実行が必要な場合がある。例えば、元の処理が「サービスの停止」の場合、サービスの状態を元の処理の実行前の状態に戻すためには、元の処理とは相反する「サービスの起動」という処理を行う必要がある。
本実施の形態では、相反する処理を行う運用操作部品を対応付けて記憶した部品対定義テーブル140を用意しておく。そして、排他制御部110は、ロールバックの対象の運用操作部品が部品対定義テーブル140に登録されている場合、部品対定義テーブル140においてその運用操作部品に対応付けられた運用操作部品の処理を実行する。これにより、操作対象資源の状態を処理の実行前の状態に戻すことが可能になる。
また、例えば、設定されたデータを読み出す、あるいは資源の状態を確認するといった参照系の処理については、処理前と処理後で操作対象資源の状態に変化がない。このため、操作対象資源の状態を処理の実行前の状態に戻すためには、特に何も処理を行う必要がない。従って、ワークフロー実行部120は、ロールバックの対象とする元の処理が参照系の処理である場合には、その処理について何の処理も行わずに、ロールバックの対象を次の処理に移行する。
ここで、例として、図16に示したワークフローAをロールバックする処理について説明する。図16に示すワークフローAの[排他区間:A]には、先頭から順に、サービスを停止させる運用操作部品51、サービスの停止を確認する運用操作部品52、サービスについての設定変更を行う運用操作部品53、および、サービスを起動する運用操作部品54が含まれる。
ワークフロー実行部120によって運用操作部品51,52が正常に実行された後、運用操作部品53の実行時に異常が発生して、その実行が停止したものとする。運用操作部品53の実行が停止したことを認識した排他制御部110は、運用操作部品53,52,51の順にロールバックを行う。
ワークフロー管理テーブル131において、運用操作部品53に対応する「バックアップ資源」の項目には、設定変更前のデータが格納されている。排他制御部110は、ワークフロー管理テーブル131から設定変更前のデータを読み出し、読み出したデータを操作対象に設定し直すという設定変更操作53aを実行する。これにより、操作対象の状態は運用操作部品53の実行前の状態に戻る。
次に、運用操作部品52は参照系の部品であることから、排他制御部110は、運用操作部品52に対応する処理としては何も行わない。この時点で、操作対象の状態は運用操作部品52の実行前の状態と同じになっている。
次に、運用操作部品51については、「サービスを起動」という、「サービスを停止」とは相反する操作を行う操作51aが存在する。そこで、排他制御部110は、「サービスを起動」という操作51aを実行する。これにより、操作対象の状態は、運用操作部品51の実行前の状態、すなわち、サービスが起動した状態に戻る。
以上の処理により、ワークフローAの[排他区間:A]についてのロールバックが完了し、操作対象の状態は、ワークフローAの[排他区間:A]の実行直前の状態に戻る。
図17は、ロールバック処理により他のワークフローの実行が再開される例を示す図である。この図17では、図15に示したワークフローA,Bを例示する。
まず、ワークフローAの[排他区間:A]の処理が実行されているものとする。このとき、ワークフローBの[排他区間:A]の先頭に位置する運用操作部品44は、排他解除待ちの状態となっている。ここで、ワークフローAに含まれる運用操作部品42の処理において異常が発生したものとする(ステップS41)。
排他制御部110は、ワークフローAの処理について、ワークフローAの[排他区間:A]の先頭位置までロールバックを行う(ステップS42)。これにより、操作対象資源の状態は、運用操作部品41の実行前の状態に戻る。排他制御部110は、ロールバックが完了すると、ワークフローAに付与されていた、排他資源Aに対する排他権を解除する(ステップS43)。これにより、ワークフローBの[排他区間:A]が排他権を獲得し、運用操作部品44の処理が開始される(ステップS44)。
このように、処理が中断された運用操作部品42を含む排他区間の先頭位置までロールバックが行われた後、同じ排他資源を操作する他のワークフローBの処理が開始されることで、ワークフローBの処理の実行時に異常が発生する確率を低減することができる。
次に、ロールバックの必要が生じるケースの他の例について説明する。図15の例のように、処理の異常発生によって排他区間の処理が停止した場合の他、次の図18の例のように、処理の異常が発生したとは必ずしも言えない場合でも、排他区間の処理を停止させてロールバックを行った方がよいケースがある。
図18は、人の承認処理待ちにより排他区間の処理が進行しなくなるケースについて説明するための図である。
図18において、ワークフローAの[排他区間:A]が、ワークフローBの[排他区間:A]より先に排他権を獲得したものとする。また、ワークフローAの[排他区間:A]には、人の入力操作に応じた処理(例えば承認処理)を伴うアクティビティ45が含まれる。すなわち、アクティビティ45には、承認などを行うための入力操作を受け付けないと次の処理に進めない処理が含まれている。なお、このようなアクティビティ45の処理は「フォーム」とも呼ばれる。
このような承認処理においては、人の入力操作が行われないことによって長時間承認待ち状態にある場合がある。この場合、ワークフローBの[排他区間:A]も長時間排他解放待ちの状態となる。例えば、運用自動化サーバ100によってデータセンタの運用が行われている場合、このようにアクティビティ45において長時間承認待ち状態が続くと、決められたスケジュールに沿ってデータセンタを運用できなくなる。
そこで、排他制御部110は、人の入力操作に応じた処理を伴うアクティビティがワークフロー実行部120により実行されることを検知すると、タイマのカウントを開始する。そして、そのアクティビティの実行が所定時間以内に完了しない場合には、処理を中断してロールバックすべきと判断する。このとき、排他制御部110は、そのアクティビティが含まれる排他区間の先頭まで、上記手順に従ってロールバック処理を行い、そのワークフローの排他状態を解放する。そして、別のワークフローに排他権を付与して、そのワークフローの処理を進めさせる。
図18の例では、排他制御部110は、アクティビティ45の処理が開始されるとともに計時を開始し、アクティビティ45の実行が所定時間以内に完了しない場合に、アクティビティ45の処理を中断させる。排他制御部110は、ワークフローAの[排他区間:A]の先頭位置までロールバック処理を行った後、排他資源Aに対する排他権を、ワークフローAの[排他区間:A]からワークフローBの[排他区間:A]に移す。これにより、ワークフローBの[排他区間:A]の処理が開始される。
また、人の入力操作に応じた処理を伴うアクティビティの実行を検知可能にするために、そのようなアクティビティが運用操作部品と同等にワークフロー管理テーブル131に定義される。そして、ワークフロー実行部120は、このようなアクティビティを実行する際に、その旨を排他制御部110に通知する。通知を受けた排他制御部110は、タイマのカウントを監視して、通知元のワークフロー実行部120からのアクティビティの完了通知を監視する。
次に、ワークフローに並列分岐が含まれる場合のロールバック処理について説明する。図19は、並列分岐の分岐先の処理で異常が発生した場合について説明するための図である。
図19の上側に示すワークフローAには並列分岐が含まれ、一方の分岐先には運用操作部品61〜63が含まれ、他方の分岐先には運用操作部品64〜66が含まれる。また、一方の分岐先の運用操作部品61〜63は、排他資源Aに対応する[排他区間:A]に含まれている。また、他方の分岐先の運用操作部品64〜66のうち運用操作部品65,66は、排他資源Bに対応する[排他区間:B]に含まれている。
また、図19の下側に示すワークフローBには、ワークフローAに含まれる運用操作部品61と同様の操作を行う運用操作部品61aが含まれている。さらに、ワークフローBにも排他資源Aに対応する[排他区間:A]が含まれ、運用操作部品61aは、ワークフローBの[排他区間:A]に含まれる。
そして、ワークフローAの[排他区間:A]が、ワークフローBの[排他区間:A]より先に排他権を獲得したものとする。なお、ワークフローBの[排他区間:B]も排他権を獲得しているものとする。このとき、運用操作部品61〜63と、運用操作部品64〜66とがそれぞれ並列に実行される。一方、ワークフローBについては、運用操作部品61aの開始前において排他待ち状態となる。
ワークフローに並列分岐が含まれる場合、その分岐先の一方の処理において異常が発生すると、並列分岐の終了位置まで処理が正常に完了できなくなるため、他方の分岐先の処理も中断される。例えば、図19における運用操作部品65の処理において異常が発生した場合、運用操作部品61〜63の処理も中断される。この場合、ワークフローBの運用操作部品61aの実行時に異常が発生しないように、ワークフローAの[排他区間:A]の開始前の位置、すなわち並列分岐の開始位置までロールバックする必要が生じる。
また、ワークフローAにおいては、並列分岐の一方の分岐先の処理について分岐開始位置までロールバックする場合には、他方の分岐先の処理についても分岐開始位置、すなわち運用操作部品64の実行前の位置までロールバックする必要が生じる。この例では、異常が発生した運用操作部品65が属する[排他区間:B]の先頭位置ではなく、それより前の位置までロールバックする必要が生じることになる。
上記のような処理を実現するために、排他制御部110は、並列分岐の分岐先の処理が中断した場合には、その処理が排他区間に含まれているか否かに関係なく、並列分岐の開始位置までロールバックを行う。これにより、他方の分岐先に排他区間が存在した場合でもその排他区間の開始前の位置まで確実にロールバックされるようになり、その排他区間に対応する排他資源を他のワークフローが操作した場合に処理の異常が発生することが防止される。
ところで、前述のように、ロールバック処理とは、実行された処理を逆順に辿っていき、操作対象資源の状態を処理の実行前の状態に戻すことである。しかしながら、単に実行された処理を逆順に辿っていくだけでは、操作対象資源の状態を処理の実行前の状態に戻せないケースがある。その例として、運用操作部品の実行が省略されたケースがある。
図20は、運用操作部品の実行が省略された場合のロールバック処理について説明するための図である。図20に示すワークフローAの[排他区間:A]には、図16の例と同様に、サービスを停止させる運用操作部品51、サービスの停止を確認する運用操作部品52、サービスについての設定変更を行う運用操作部品53、および、サービスを起動する運用操作部品54が含まれる。
ここで、運用操作部品51の実行前において、操作対象のサービスの状態が停止状態であったとする。この場合、運用操作部品51の操作を実行しても意味がないことから、ワークフロー実行部120は、運用操作部品51の実行を省略することができる。
その後、運用操作部品53の処理で異常が発生した場合、運用操作部品51の処理までロールバックする必要が生じる。このとき、図16に示したように、運用操作部品51に対応する処理として「サービスを起動」が実行されると、実行後のサービスの状態は起動状態となり、運用操作部品51の実行前とは異なる状態となってしまう。
そこで、ワークフロー実行部120は、運用操作部品の実行を省略する場合、実行を省略したことを示す情報を記憶装置に記憶しておく。そして、排他制御部110は、ロールバックの際に記憶されたその情報を参照して運用操作部品の実行が省略されたことを判別し、その運用操作部品について何の処理も行わずに、ロールバックの対象を次の処理に移行する。
本実施の形態では例として、ワークフロー実行部120は、運用操作部品の実行を省略した場合、ワークフロー管理テーブル131においてその運用操作部品に対応する「バックアップ資源」の項目に、何も情報を格納しないようにする。図20の例では、排他制御部110は、運用操作部品51に対応する「バックアップ資源」の項目には情報が設定されない。そして、排他制御部110は、ロールバックの処理対象が運用操作部品51となったとき、対応する「バックアップ資源」の項目に何も情報が設定されていないことから、運用操作部品51の実行が省略されたことを判別する。この場合、排他制御部110は、運用操作部品51について何の処理も行わない。これにより、ロールバック処理の結果、操作対象のサービスの状態を、ワークフローAの[排他区間:A]の前と同じ「サービス停止状態」に戻すことができる。
次に、運用自動化サーバ100の処理において利用される情報テーブルの例について説明する。
図21は、ワークフロー管理テーブルの例を示す図である。ワークフロー管理テーブル131は、各ワークフローに含まれる運用操作部品を管理するためのテーブルであり、ワークフローの登録時に生成される。
ワークフロー管理テーブル131は、「ワークフローNo.」のデータ項目を含む。「ワークフローNo.」には、ワークフローを識別する番号が格納される。ワークフロー管理テーブル131においては、「ワークフローNo.」に対応付けて、「部品No.」、「運用操作部品名」、「操作対象」、「操作サービス、資源」、「バックアップ資源」、「出力」および「次の部品No.」の各データ項目を含むレコードが設定される。なお、以下の説明では、1つの「部品No.」に対応するレコードを、単に「ワークフロー管理テーブル131のレコード」と呼ぶ。
「部品No.」には、そのワークフローにおける運用操作部品の番号が格納される。「運用操作部品名」には、運用操作部品の名称(操作内容)が格納される。「操作対象」には、操作対象となるサーバ、デバイスなどの名称に対応する変数が入力値として格納される。「操作サービス、資源」には、操作するサービス名、資源名に対応する変数が入力値として格納される。
「バックアップ資源」には、対応する運用操作部品の実行前における操作対象資源の状態を示す情報が格納される。格納される情報の内容については図16で説明した通りである。なお、「バックアップ資源」には、対応する運用操作部品の実行前に情報が格納される。
「出力」には、出力値が設定される変数が格納される。「次の部品No.」には、そのワークフローにおいて、次に実行する運用操作部品を示す番号が格納される。
以上のワークフロー管理テーブル131においては、人の入力操作に応じた処理を伴うアクティビティや、並列分岐の開始および終了についても、1つのレコードが設定される。そして、設定されたレコードの「運用操作部品名」の項目には、アクティビティの名称(処理内容)や、並列分岐の開始または終了を示すことが登録される。これにより、排他制御部110は、ワークフローに含まれる処理が実行される際に、その処理が人の入力操作に応じた処理を伴うアクティビティであることを判別できる。また、排他制御部110は、ロールバック処理の際に、並列分岐の開始位置を判別することが可能となる。
図22は、運用操作部品定義テーブルの例を示す図である。運用操作部品定義テーブル132には、運用操作部品の定義情報が予め格納されている。運用操作部品定義テーブル132は、「運用操作部品名」、「部品種別」、「操作/確認対象」および「操作重要度」の各データ項目を含む。
「運用操作部品名」には、運用操作部品の名称(操作内容)が格納される。「部品種別」には、運用操作部品の種別が格納される。種別には、操作系部品、確認系部品、通知系部品、設定系部品などがある。「操作/確認対象」には、その運用操作部品の操作の対象または確認の対象が格納される。「操作重要度」には、その運用操作部品の操作重要度が格納される。
図23は、変数管理テーブルの例を示す図である。変数管理テーブル133は、定義されたワークフロー情報の実体を識別する情報であるインスタンスで利用される変数名および変数値を管理するためのテーブルである。変数管理テーブル133は、「インスタンスNo.」、「ワークフローNo.」、「変数名」および「変数値」の各データ項目を含む。
「インスタンスNo.」には、インスタンスを識別するNo.が格納される。「ワークフローNo.」には、ワークフローを識別する番号が格納される。「変数名」には、変数名が格納される。「変数値」には、その変数に設定されている値が格納される。
図24は、インスタンス管理テーブルの例を示す図である。インスタンス管理テーブル134は、インスタンス単位で管理される情報が格納される。インスタンス管理テーブル134は、「インスタンスNo.」、「ワークフローNo.」、「部品No.(現在)」、「ホスト名」、「サービス名」、「ユーザID」、「起動方式係数」、「排他区間No.」および「完了予定時刻」の各データ項目を含む。
「インスタンスNo.」には、インスタンスを識別する番号が格納される。「ワークフローNo.」には、ワークフローを識別する番号が格納される。「部品No.(現在)」には、そのワークフローの現在の処理位置に対応する運用操作部品を識別する番号が格納される。
「ホスト名」には、ホストの名称が格納される。「サービス名」には、サービスの名称が格納される。「ユーザID」には、ユーザを識別する情報(ユーザID)が格納される。「起動方式係数」には、起動方式係数が格納される。「排他区間No.」には、排他区間を識別する番号が格納される。「完了予定時刻」には、ワークフローの完了予定時刻が格納される。
図25は、排他情報管理テーブルの例を示す図である。排他情報管理テーブル135は、排他区間に関する情報を管理するためのテーブルである。排他情報管理テーブル135は、「排他区間No.」、「部品No.(ロック開始)」、「部品No.(ロック解除)」、「実行優先度」および「操作緊急度」の各データ項目を含む。
「排他区間No.」には、排他区間を識別する番号が格納される。「部品No.(ロック開始)」には、その排他区間の最初の運用操作部品を識別する番号が格納される。「部品No.(ロック解除)」には、その排他区間の最後の運用操作部品を識別する番号が格納される。「実行優先度」には、その排他区間の実行優先度が格納される。「操作緊急度」には、その排他区間の操作緊急度が格納される。
図26は、排他獲得履歴テーブルの例を示す図である。排他獲得履歴テーブル136は、排他区間の排他権(実行権)の獲得履歴情報を管理する。排他獲得履歴テーブル136は、「インスタンスNo.」、「ワークフローNo.」、「排他区間No.」、「開始待ち時間」、「開始時刻」および「完了時刻」の各データ項目を含む。
「インスタンスNo.」には、インスタンスを識別する番号が格納される。「ワークフローNo.」には、ワークフローを識別する番号が格納される。「排他区間No.」には、排他区間を識別する番号が格納される。
「開始待ち時間」には、その排他区間が排他権(実行権)を獲得するまでの待ち時間が格納される。「開始時刻」には、その排他区間が排他権(実行権)を獲得する時刻が格納される。「完了時刻」には、その排他区間が排他権(実行権)を獲得して、処理を実行した場合の完了時刻が格納される。
図27は、ユーザ係数テーブルの例を示す図である。ユーザ係数テーブル137には、ユーザごとのユーザ係数があらかじめ格納されている。ユーザ係数テーブル137は、「ユーザID」および「ユーザ係数」の各データ項目を含む。「ユーザID」には、ユーザを識別する情報(ユーザID)が格納される。「ユーザ係数」には、そのユーザIDのユーザ係数が格納される。
図28は、起動方式係数テーブルの例を示す図である。起動方式係数テーブル138には、起動方法ごとの起動方式係数があらかじめ格納されている。起動方式係数テーブル138は、「起動方法」および「起動方式係数」の各データ項目を含む。「起動方法」には、ワークフローの起動方法が格納される。「起動方式係数」には、その起動方法に対応する起動方式係数が格納される。
図29は、時間係数テーブルの例を示す図である。時間係数テーブル139には、時間ごとの時間係数があらかじめ格納されている。時間係数テーブル139は、「残り時間」および「時間係数」の各データ項目を有する。「残り時間」には、完了予定時刻までの残り時間が格納される。「時間係数」には、その残り時間に対応する時間係数が格納される。
図30は、部品対定義テーブルの例を示す図である。部品対定義テーブル140には、運用操作部品のそれぞれに対応付けて、ロールバック処理時に実行すべき運用操作部品があらかじめ格納されている。部品対定義テーブル140は、「Go」および「Back」の各データ項目を含み、「Go」および「Back」のそれぞれに「運用操作部品」および「オプション」の各データ項目が設けられる。
「運用操作部品」は、対象となる運用操作部品の名称(操作内容)が格納される。「オプション」には、対応する運用操作部品に対して設定可能な変数が格納される。「オプション」は、各運用操作部品に複数対応付けることができる。「Back」に登録された運用操作部品の操作内容は、対応する「Go」に登録された運用操作部品とは相反する内容となっている。排他制御部110は、ロールバックの対象とする運用操作部品が部品対定義テーブル140の「Go」に登録されていた場合、その運用操作部品に対応付けて「Back」に登録された運用操作部品を実行する。
次に、運用自動化サーバ100の処理についてフローチャートを用いて説明する。
図31は、ワークフロー実行部の処理例を示すフローチャートである。図31の処理は、ワークフローごとに、そのワークフローに対応するワークフロー実行部120によって行われる。
[ステップS51]ワークフローの処理を開始する際、ワークフロー実行部120は、排他制御部110に対して、ワークフローの開始、およびワークフローの実行に際して用いる変数の情報を通知する。変数に関する情報は、例えば、ワークフローを起動したユーザのユーザID、ワークフローの起動方式などの情報を含む。
[ステップS52]ワークフロー実行部120は、ワークフロー管理テーブル131から該当ワークフローに対応付けられた1つのレコードを選択する。ワークフロー実行部120は、選択したレコードに基づいて次に実行する運用操作部品を判別し、排他制御部110に対してその運用操作部品の実行開始を通知する。このとき、ワークフロー実行部120は、排他制御部110に対して、実行する運用操作部品の識別番号と、その運用操作部品が用いる変数の情報を通知する。ワークフロー実行部120は、これらの情報を通知した後、排他制御部110からの指示待ち状態となる。
このステップS52では、「運用操作部品名」にアクティビティや並列分岐の開始または終了を示す情報が登録されている場合もあるが、これらの場合でも上記と同様に、処理の内容を示す情報(例えば識別番号)と、その処理で用いられる変数の情報が排他制御部110に通知される。
[ステップS53]ワークフロー実行部120は、排他制御部110からの指示を受け取る。ワークフロー実行部120は、指示された内容を判別し、指示内容に応じた処理を行う。通常は、排他制御部110から処理を継続する旨の通知(Action)が出力され、ワークフロー実行部120は、Actionの受信に応じてステップS54以降の処理を実行する。また、排他制御部110からActionが出力されるまでの間、ワークフロー実行部120は処理待ち状態となる。
[ステップS54]ワークフロー実行部120は、処理の実行前における操作対象資源の状態を示す情報を、ワークフロー管理テーブル131におけるステップS52で選択したレコード内の「バックアップ資源」の項目に登録する。
[ステップS55]ワークフロー実行部120は、ステップS52で選択したレコードに定義された処理を業務サーバ210に実行させる。
[ステップS56]ワークフロー実行部120は、処理が正常に完了したか否かを示す応答情報を排他制御部110に通知する。
なお、選択したレコードに定義された処理が並列分岐の開始または終了の場合、ステップS55では特に何の処理も実行されない。
また、ワークフロー実行部120は、定義された処理を業務サーバ210に実行させる際、その実行前における操作対象資源の状態に基づいて、定義された処理の実行を省略可能かを判定する。そして、省略可能である場合、ワークフロー実行部120は、ステップS54での「バックアップ資源」への情報登録をスキップし、ステップS55でも特に何の処理も行わずに、ステップS56で処理の完了を通知する。
なお、定義された処理の実行を省略可能かは、排他制御部110によって判定されてもよい。この場合、ワークフロー実行部120は、ステップS53において、定義された処理を実行するか、あるいはその実行を省略するかの指示を排他制御部110から受ける。
[ステップS57]ワークフロー実行部120は、ワークフロー管理テーブル131に基づき、該当ワークフローに次の運用操作部品が登録されているかを判定する。この判定は、該当ワークフローに対応する未選択のレコードが存在するかによって行われる。次の運用操作部品がある場合、その運用操作部品についてステップS52からの処理が実行される。一方、次の運用操作部品がない場合、ワークフロー実行部120は、排他制御部110に対してワークフローの終了を通知し、処理を終了する。
図32は、排他制御部の処理例を示すフローチャートである。図32の処理は、ワークフローごとに実行される。
[ステップS71]排他制御部110は、ワークフロー実行部120からの通知を待つ。排他制御部110がワークフロー実行部120からの通知を受信すると、次のステップS72の処理が実行される。
[ステップS72]排他制御部110が、図31のステップS51で出力されるワークフロー開始通知を受けた場合、ステップS73の処理が実行され、それ以外の通知を受けた場合、ステップS74の処理が実行される。
[ステップS73]排他制御部110は、ワークフロー開始時の排他制御処理を実行する。処理の詳細については図33において説明する。
[ステップS74]排他制御部110が、図31のステップS52で出力される、ワークフローに含まれる処理の開始通知を受けた場合、ステップS75の処理が実行される。一方、排他制御部110が、図31のステップS56で出力される、ワークフローに含まれる処理についての応答情報を受けた場合、ステップS78の処理が実行される。
[ステップS75]排他制御部110は、ワークフロー動作中の排他制御処理を実行する。処理の詳細については図36において説明する。
[ステップS76]排他制御部110は、ステップS74で開始が通知された処理が、入力操作に応じた処理を伴うアクティビティかを判定する。通知された処理がこのようなアクティビティである場合、ステップS77の処理が実行され、このようなアクティビティでない場合、ステップS79の処理が実行される。
[ステップS77]排他制御部110は、アクティビティが所定時間以内に完了するかを判定するための計時処理を開始する。なお、このときに開始される計時処理については図38において説明する。
[ステップS78]排他制御部110は、応答情報受信時の処理を実行する。処理の詳細については図39において説明する。
[ステップS79]ワークフローが終了していない場合、ステップS71に戻る。一方、ワークフローが終了した場合、排他制御部110は、該当ワークフローについての処理を終了する。ワークフローの終了は、図31のステップS57で出力されるワークフローの終了通知を受けたことによって判定される。
図33は、ワークフロー開始時の排他制御処理の例を示すフローチャートである。この図33の処理は、図32のステップS73の処理に対応する。
[ステップS91]排他制御部110は、ワークフロー管理テーブル131から、実行対象のワークフロー(図32のステップS71で実行開始が通知されたワークフロー)の情報を取得する。
[ステップS92]排他制御部110は、運用操作部品定義テーブル132から、実行対象のワークフロー情報に含まれる「運用操作部品名」に対応する「部品種別」を取得する。これにより、排他制御部110は、実行対象のワークフロー情報に含まれる運用操作部品の種別を決定する。
[ステップS93]排他制御部110は、ワークフロー開始時に確定済みの変数情報を変数管理テーブル133に記録する。ワークフロー開始時に確定済みの変数情報とは、例えば、あらかじめ値が設定された変数、またはワークフロー実行部120より渡された変数などである。
[ステップS94]排他制御部110は、開始するワークフローの排他情報を仮決定する。処理の詳細については図34において説明する。
[ステップS95]排他制御部110は、仮決定した排他情報の実行優先度を計算する。処理の詳細については図35において説明する。
図34は、排他情報の仮決定の処理例を示すフローチャートである。この図34の処理は、図33のステップS94、および後述する図36のステップS133の各処理に対応する。
[ステップS101]排他制御部110は、ワークフロー管理テーブル131から、実行対象のワークフローの運用操作部品の情報を取得する。
[ステップS102]排他制御部110は、運用操作部品定義テーブル132に基づいて、実行対象のワークフローに含まれる運用操作部品をモデル化する。すなわち、排他制御部110、運用操作部品定義テーブル132に基づいて、実行対象のワークフローに含まれる運用操作部品を、対応する部品種別に変換する。
[ステップS103]排他制御部110は、ワークフロー管理テーブル131および変数管理テーブル133を用いて、実行対象のワークフローにおいて変数の値または変数名が連続している運用操作部品を抽出する。すなわち、排他制御部110は、ワークフロー管理テーブル131の「部品No.」および「次の部品No.」から、実行対象のワークフロー内での部品種別(モデル化した運用管理部品)の処理順を判定する。そして、排他制御部110は、変数管理テーブル133に基づいて、その処理順において同じ部品種別の変数の値または同じ変数名が連続するか否かを判定する。その結果、排他制御部110は、ワークフロー管理テーブル131から、その処理順において同じ部品種別の変数の値または同じ変数名が連続する運用操作部品の区間を抽出する。
[ステップS104]排他制御部110は、ワークフロー管理テーブル131の「操作対象」、「操作サービス、資源」、「出力」のデータ項目を用いて、その処理順に基づいて、運用操作部品の出力値(実行結果)が後続の運用操作部品の入力値になっている運用操作部品の区間を抽出する。
[ステップS105]排他制御部110は、ステップS103またはステップS104において抽出した区間を、排他区間として仮決定する。
[ステップS106]排他制御部110は、運用操作部品定義テーブル132、ユーザ係数テーブル137、起動方式係数テーブル138および時間係数テーブル139に基づいて、仮決定した排他区間の実行優先度を仮決定する。
すなわち、排他制御部110は、運用操作部品定義テーブル132から、仮決定した排他区間に含まれる部品種別に対応する操作重要度を取得し、操作重要度同士を加算する。また、排他制御部110は、ユーザ係数テーブル137から、ワークフローを起動したユーザのユーザIDに対応するユーザ係数を取得する。また、排他制御部110は、起動方式係数テーブル138から、ワークフローの起動方法に対応する起動方式係数を取得する。
また、排他制御部110は、ワークフローの完了予定時刻と現在時刻との差分から、完了予定時刻までの残り時間を算出する。ここで、排他制御部110は、あらかじめ登録されている各運用操作部品の完了までにかかる時間に基づいて、ワークフローの完了予定時刻を算出してもよい。また、排他制御部110は、過去に実行したワークフローの履歴情報(例えば、排他獲得履歴テーブル136)から取得した完了時刻を完了予定時刻としてもよい。
排他制御部110は、時間係数テーブル139から、その算出した残り時間に対応する時間係数を取得する。そして、排他制御部110は、上述した式(1)を用いて操作緊急度を算出し、上述した式(2)を用いて実行優先度を算出する。
[ステップS107]排他制御部110は、インスタンス管理テーブル134および排他情報管理テーブル135に、仮決定した排他区間に関する情報(仮決定した排他区間、実行優先度、ユーザ係数、起動方式係数、操作緊急度などのステップS103〜S106で用いた情報)を格納する。
図35は、排他情報の実行優先度の計算処理例を示すフローチャートである。この図35の処理は、図33のステップS95、および後述する図36のステップS134の各処理に対応する。
[ステップS111]排他制御部110は、インスタンス管理テーブル134およびユーザ係数テーブル137から、仮決定した排他区間に関する情報(ユーザ係数、起動方式係数、排他区間No.、完了予定時刻など)を取得する。
[ステップS112]排他制御部110は、運用操作部品定義テーブル132から、その排他区間No.に対応する排他区間に含まれる部品種別を取得する。
[ステップS113]排他制御部110は、運用操作部品定義テーブル132から、その排他No.に対応する排他区間に含まれる操作重要度情報を取得する。
なお、ステップS112,S113の処理順は逆でもよい。
[ステップS114]排他制御部110は、ステップS111で取得した完了予定時刻から現在の時刻を差し引いて、完了予定時刻までの残り時間を算出し、時間係数テーブル139から、その算出した残り時間に対応する時間係数を取得する。排他制御部110は、上述した式(1)を用いて操作緊急度を算出し、上述した式(2)を用いて、その排他区間の実行優先度を算出する。
[ステップS115]排他制御部110は、算出した操作緊急度および実行優先度を排他情報管理テーブル135に格納する。
図36は、ワークフロー動作中の排他制御処理の例を示すフローチャートである。この図36の処理は、図32のステップS75の処理に対応する。
[ステップS131]排他制御部110は、ワークフロー実行部120から通知された情報に含まれる変数の情報(確定した変数の情報)、またはあらかじめ値が設定された変数を、変数管理テーブル133に格納する。
[ステップS132]排他制御部110は、インスタンス管理テーブル134から、ワークフローの定義情報を取得する。
[ステップS133]排他制御部110は、仮決定した排他区間に関する情報を更新する。このステップS133の処理の詳細は、図34と同様である。
[ステップS134]排他制御部110は、実行優先度情報を更新する。このステップS134の処理の詳細は、図35と同様である。
[ステップS135]排他制御部110は、排他アクション動作を決定する。処理の詳細については図37において説明する。
図37は、排他アクション決定処理の例を示すフローチャートである。この図37の処理は、図36のステップS135の処理に対応する。
[ステップS141]排他制御部110は、実行対象のワークフローについて仮決定した排他区間に関する情報と実行優先度情報を取得する。ここでは、排他制御部110は、インスタンス管理テーブル134から、実行対象のワークフローについて仮決定した排他区間に関する情報(排他区間No.など)を取得する。排他制御部110は、その排他区間No.をキーとして、排他情報管理テーブル135から実行優先度を取得する。
[ステップS142]排他制御部110は、実行中のワークフローについて、ワークフローの実行状況、現在の排他区間に関する情報と実行優先度情報、仮決定された排他区間に関する予定情報と実行優先度情報を取得する。ここでは、排他制御部110は、インスタンス管理テーブル134を読み込んで、ワークフローの実行状況を取得する。
排他制御部110は、インスタンス管理テーブル134および排他情報管理テーブル135から、実行中のワークフロー(ただし、図32のステップS71の初回処理において実行開始が通知された、実行対象のワークフローを除く)について現在の排他区間に関する情報を取得する。具体的には、排他制御部110は、まず、インスタンス管理テーブル134の「部品No.(現在)」から、ワークフローで現在の対象となっている運用操作部品(現在の処理位置)を判定する。次に、排他制御部110は、インスタンス管理テーブル134およびワークフロー管理テーブル131に基づいて、その運用操作部品(現在の処理位置)がどの排他区間に含まれるかを判定する。排他制御部110は、判定した排他区間の排他No.をキーとして、排他情報管理テーブル135から実行優先度を取得する。
[ステップS143]排他制御部110は、インスタンス管理テーブル134および排他情報管理テーブル135から、実行中のワークフロー(ただし、図32のステップS71の初回処理において実行開始が通知された、実行対象のワークフローを除く)について仮決定した排他区間に関する情報を取得する。具体的には、排他制御部110は、まず、インスタンス管理テーブル134から、ワークフローで現在の対象となっている運用操作部品(現在の処理位置)が属する排他区間以外の排他区間の情報を取得する。次に、排他制御部110は、その排他区間の排他No.をキーとして、排他情報管理テーブル135から実行優先度を取得する。排他制御部110は、実行対象のワークフローおよびステップS142において情報を取得したワークフローに含まれる、実行優先度を取得した排他区間の中から、実行優先度情報が最も大きい排他区間を抽出する。
[ステップS144]ステップS143で抽出された排他区間が属するワークフローが、図32のステップS71の初回処理において実行開始が通知された、実行対象のワークフローである場合、ステップS145の処理が実行される。一方、抽出されたワークフローが実行対象のワークフローでない場合、ステップS146の処理が実行される。
[ステップS145]排他制御部110は、実行対象のワークフローの処理を継続する旨の通知(Action)を、実行対象のワークフローに対応するワークフロー実行部120に出力する。
[ステップS146]排他制御部110は、ワークフロー実行部120にActionを出力しないことにより、実行対象のワークフローを処理待ち状態にする。この後、図36のステップS134の処理が再度実行され、さらにステップS135の処理(すなわち図37の処理)が実行される。図37のステップS144において、ステップS143で抽出された排他区間が属するワークフローが実行対象のワークフローであると判定されるまで、対応するワークフロー実行部120が処理待ち状態とされて、ステップS134,S135の処理が繰り返される。
なお、このステップS146では、ステップS143で抽出された排他区間に付与された排他権が解除されたとき、図36のステップS134の処理が実行されるようにしてもよい。
なお、ステップS145,S146では、排他制御部110は、排他獲得履歴テーブル136に対して、必要に応じて情報の新規登録または更新を行う。例えば、排他権を獲得し、その排他区間の処理が完了された場合、排他制御部110は「完了時刻」の情報を更新する。また、実行対象の運用操作部品が含まれる排他区間が排他解除待ちである場合、排他制御部110は「開始待ち時間」の情報を更新する。
図38は、計時処理の例を示すフローチャートである。この図38の処理は、図32のステップS77において、図32の処理とは独立して開始されるものである。
[ステップS161]排他制御部110は、時刻のカウント値を「0」にリセットして計時を開始する。それ以後、排他制御部110は、対応するワークフロー実行部120からの、処理対象のアクティビティが正常に完了したことを示す完了通知を監視する。
[ステップS162]排他制御部110が完了通知を受信すると、ステップS168の処理が実行される。一方、排他制御部110が完了通知を受信していない場合、ステップS163の処理が実行される。
[ステップS163]排他制御部110は、時刻のカウント値が所定のしきい値に達したかを判定する。カウント値がしきい値に達した場合にはステップS164の処理が実行され、カウント値がしきい値に達していない場合にはステップS162の処理が実行される。
[ステップS164]排他制御部110は、処理対象のアクティビティが含まれる排他区間についての実行優先度、この排他区間と同一資源を操作する他のワークフローの排他区間についての実行優先度を取得し、これらの実行優先度を比較する。
処理対象のアクティビティが含まれる排他区間についての実行優先度が、他の排他区間についての実行優先度より低くなった場合、ステップS166の処理が実行される。一方、処理対象のアクティビティが含まれる排他区間についての実行優先度が、他の排他区間についての実行優先度以上である場合、ステップS165の処理が実行される。
[ステップS165]排他制御部110は、時刻のカウント値を「0」にリセットする。
[ステップS166]排他制御部110は、対応するワークフロー実行部120に、アクティビティの実行中止を要求する。これにより、アクティビティの処理が強制的に終了される。
[ステップS167]排他制御部110は、処理対象のアクティビティが含まれている排他区間の先頭位置まで、ロールバック処理を行う。なお、図示しないが、このステップS167でのロールバック対象区間は、実際には図39のステップS182〜S184と同様に決定される。例えば、処理対象のアクティビティが含まれている排他区間より前に並列分岐の開始位置がある場合には、その並列分岐の分岐先のそれぞれの処理系列について、並列分岐の開始位置までロールバック処理が行われる。
ロールバック処理が完了すると、排他制御部110は、処理対象のアクティビティが含まれているワークフローに与えていた排他権を解除する。なお、ロールバック処理の詳細については図40で説明する。
[ステップS168]排他制御部110は、計時を終了する。
以上の図38の処理によれば、排他制御部110は、人の入力操作に応じた処理を伴うアクティビティの実行指示をワークフロー実行部120に与えたとき、計時を開始して、アクティビティが一定時間以内に正常に完了するかを監視する。アクティビティが一定時間以内に完了しない場合、長時間、人の入力操作待ちの状態になっていると推定される。この場合、排他制御部110は、アクティビティの実行を強制的に終了させることで、アクティビティの実行遅延が他のワークフローの実行スケジュールに影響を与えることを回避する。
ただし、アクティビティが一定時間以内に完了しない場合であっても、アクティビティが含まれる排他区間の実行優先度が最も高ければ、アクティビティの実行遅延は他のワークフローの実行スケジュールに特に影響を与えないと考えられる。そこで、このような場合、排他制御部110は、アクティビティの実行を終了させずに、さらに一定時間が経過するまで、アクティビティの実行が完了するかを監視し続ける。
図39は、応答情報受信時の処理例を示すフローチャートである。この図39の処理は、図32のステップS78の処理に対応する。
[ステップS181]排他制御部110は、ワークフロー実行部120からの応答情報が、正常に処理が完了したことを通知するものか、あるいは異常が発生したことを通知するものかを判定する。正常に処理が完了したことが通知された場合、図39の処理は終了されて、図32のステップS79の処理が実行される。一方、異常が発生したことが通知された場合、ステップS182の処理が実行される。
[ステップS182]排他制御部110は、異常が発生した処理が含まれる排他区間の先頭位置を確認する。具体的には、排他制御部110は、排他獲得履歴テーブル136を参照して、実行中の排他区間の中から、異常が発生した処理が含まれるワークフローの番号に対応付けられた排他区間の番号を抽出する。次に、排他制御部110は、排他情報管理テーブル135を参照し、排他獲得履歴テーブル136から抽出した排他区間の番号に対応する「部品No.(ロック開始)」の項目から、該当排他区間の先頭の処理を示す部品番号を抽出する。
[ステップS183]排他制御部110は、ワークフロー管理テーブル131を参照して、異常が発生した処理が含まれるワークフローにおいて、異常が発生した処理より前に最初に現れる並列分岐の位置を確認する。
なお、ステップS182,S183の処理順は逆でもよい。
[ステップS184]ステップS182で確認された排他区間の先頭位置より前に、並列分岐の開始位置がある場合には、ステップS186の処理が実行される。一方、ステップS182で確認された排他区間の先頭位置より前に、並列分岐の開始位置がない場合には、ステップS185の処理が実行される。
[ステップS185]排他制御部110は、異常が発生した処理が含まれる排他区間の先頭位置まで、ロールバック処理を行う。ロールバック処理が完了すると、排他制御部110は、異常が発生した処理が含まれているワークフローに与えていた排他権を解除する。なお、ロールバック処理の詳細については図40で説明する。
[ステップS186〜S188]ステップS183で確認された並列分岐の開始位置から分岐して、並列に実行される複数の処理系列それぞれについて、ステップS187のロールバック処理が行われる。すなわち、ステップS187の処理が並列に実行される処理系列の数だけループされる。
各処理系列についてのロールバック処理が完了すると、排他制御部110は、異常が発生した処理が含まれているワークフローに与えていた排他権を解除する。なお、ロールバック処理の詳細については図40で説明する。
以上の図39の処理によれば、ワークフロー実行部120から処理の異常発生が通知されたとき、その処理が含まれる排他区間の先頭位置より前に並列分岐の開始位置がない場合には、排他区間の先頭位置までロールバック処理が行われる。これにより、操作対象資源の状態は、排他区間の実行直前の状態まで戻される。そして、この状態から、ロールバックされた排他区間から排他権が解除され、他のワークフローによって操作対象資源を操作することが可能になる。
また、ワークフロー実行部120から処理の異常発生が通知されたとき、その処理が含まれる排他区間の先頭位置より前に並列分岐の開始位置がある場合には、その並列分岐による分岐先のそれぞれの処理系列について、ロールバック処理が行われる。これにより、操作対象資源の状態は、並列分岐の開始前の状態まで確実に戻される。従って、異常が発生した処理が含まれる排他区間だけでなく、この排他区間と並列に実行される他の排他区間における処理の中断が原因となって、他のワークフローの処理に異常が発生するという事態の発生確率を低減できる。
図40は、ロールバック処理の例を示すフローチャートである。この図40の処理は、図38のステップS167,図39のステップS185,S187のそれぞれに対応する。
[ステップS201]排他制御部110は、ワークフロー管理テーブル131からロールバック対象区間に含まれる処理名(「運用操作部品名」に登録された情報)を取得して、処理リストに逆順に登録する。処理リストは、運用自動化サーバ100のRAM102などに一時的に生成される。
[ステップS202]排他制御部110は、処理リストからロールバックの対象処理を選択し、その処理の情報を取得する。
[ステップS203]排他制御部110は、選択された処理が参照系の運用操作部品の処理かを判定する。対象処理が参照系の運用操作部品の処理である場合、ステップS205の処理が実行され、対象処理がそれ以外の処理である場合、ステップS204の処理が実行される。
[ステップS204]排他制御部110は、ワークフロー管理テーブル131において、選択された処理に対応する「バックアップ資源」の項目に情報が格納されているかを判定する。当該項目に情報が格納されている場合、ステップS206の処理が実行され、格納されていない場合、ステップS205の処理が実行される。
[ステップS205]選択された処理が参照系の運用操作部品の処理である場合(ステップS203:Yes)、操作対象資源の状態を戻すための処理は特に必要とならない。また、「バックアップ資源」の項目に情報が格納されていない場合(ステップS204:No)、選択された処理は実際には実行されていないことから、同様に操作対象資源の状態を戻すための処理は特に必要とならない。
このため、排他制御部110は、選択された処理に関する情報を処理リストから削除する。これにより、後のステップS210において、選択された処理について操作対象資源の状態を戻すための処理が特に何も行われなくなり、操作対象資源の状態を、ロールバック対象区間の前の状態に確実に戻すことが可能になる。
[ステップS206]排他制御部110は、選択された処理とは相反する処理を行う運用操作部品が、部品対定義テーブル140に登録されているかを判定する。相反する処理を行う運用操作部品が部品対定義テーブル140に登録されていた場合、ステップS207の処理が実行され、登録されていない場合、ステップS208の処理が実行される。
[ステップS207]排他制御部110は、選択された処理とは相反する処理を行う運用操作部品の名称を、部品対定義テーブル140から抽出する。排他制御部110は、選択された処理についての処理リスト上の「運用操作部品名」の情報を、部品対定義テーブル140から抽出した運用操作部品名によって入れ替える。
[ステップS208]排他制御部110は、ワークフロー管理テーブル131において、選択された処理に対応する「バックアップ資源」の項目に登録されている情報を読み出し、処理リストにおいて該当処理に対応付けて設定する。
[ステップS209]排他制御部110は、選択された処理が処理リスト上の最後の処理かを判定する。選択された処理が処理リスト上の最後の処理でない場合、未選択の処理についてステップS202以降の処理が実行される。選択された処理が処理リスト上の最後の処理である場合、ステップS210の処理が実行される。
[ステップS210]排他制御部110は、処理リストを順に辿りながらロールバック処理を行う。排他制御部110は、処理リストの先頭から順にレコードを選択し、選択されたレコードに対してステップS208の処理により登録された情報を用いて、選択されたレコードに登録された処理名に対応する処理を、業務サーバ210に実行させる。
[ステップS211]ロールバック処理が完了すると、排他制御部110は、ロールバック対象区間に設定されていた排他権を解除する。具体的には、排他制御部110は、ロールバック対象区間に設定されていた排他区間に対応するレコードを、インスタンス管理テーブル134、排他情報管理テーブル135および排他獲得履歴テーブル136から削除する。
これにより、対応する排他資源に対する操作を他のワークフローが行うことができるようになる。例えば、他のワークフローに含まれる、対応する排他資源を操作する運用操作部品が、図37のステップS146に対応する排他待ち状態となっている場合に、この運用操作部品が実行されるようになる。
なお、上記の各実施の形態に示した装置(ワークフロー制御装置1、運用自動化サーバ100など)の処理機能は、コンピュータによって実現することができる。その場合、各装置が有すべき機能の処理内容を記述したプログラムが提供され、そのプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、磁気記憶装置、光ディスク、光磁気記録媒体、半導体メモリなどがある。磁気記憶装置には、ハードディスク装置(HDD)、フレキシブルディスク(FD)、磁気テープなどがある。光ディスクには、DVD(Digital Versatile Disc)、DVD−RAM、CD−ROM(Compact Disc−Read Only Memory)、CD−R(Recordable)/RW(ReWritable)などがある。光磁気記録媒体には、MO(Magneto-Optical disk)などがある。
プログラムを流通させる場合には、例えば、そのプログラムが記録されたDVD、CD−ROMなどの可搬型記録媒体が販売される。また、プログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することもできる。
プログラムを実行するコンピュータは、例えば、可搬型記録媒体に記録されたプログラムまたはサーバコンピュータから転送されたプログラムを、自己の記憶装置に格納する。そして、コンピュータは、自己の記憶装置からプログラムを読み取り、プログラムに従った処理を実行する。なお、コンピュータは、可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することもできる。また、コンピュータは、ネットワークを介して接続されたサーバコンピュータからプログラムが転送されるごとに、逐次、受け取ったプログラムに従った処理を実行することもできる。
以上の各実施の形態に関し、さらに以下の付記を開示する。
(付記1) 同一のリソースを用いた処理をそれぞれ含む第1のワークフローおよび第2のワークフローの実行を制御するためのワークフロー制御プログラムにおいて、
コンピュータに、
前記第1のワークフローに含まれる処理のうち、前記リソースを用いた1つ以上の処理を含む第1の処理群を実行し、
前記第1の処理群に含まれるいずれかの処理が中断したとき、前記リソースの状態を前記第1の処理群の実行開始前の状態に戻し、
前記リソースの状態が前記第1の処理群の実行開始前の状態に戻ると、前記第2のワークフローに含まれる処理のうち、前記リソースを用いた1つ以上の処理を含む第2の処理群の実行を開始する、
処理を実行させることを特徴とするワークフロー制御プログラム。
(付記2) 前記コンピュータに、
前記第1の処理群に含まれる処理のうち、入力操作の受け付け処理を含む処理の実行が、所定時間以内に完了しない場合に、当該処理の実行を中断する、
処理をさらに実行させることを特徴とする付記1記載のワークフロー制御プログラム。
(付記3) 前記コンピュータに、
前記第1のワークフローに含まれる処理それぞれについて、それぞれの処理の実行前における前記リソースの状態を示す情報を記憶部に記憶する、
処理をさらに実行させ、
前記リソースの状態を戻す処理では、前記第1の処理群に含まれる実行された処理それぞれの内容と、前記記憶部に記憶された、当該実行された処理それぞれの実行前における前記リソースの状態を示す情報とに基づいて、前記リソースの状態を前記第1の処理群の実行開始前の状態に戻す、
ことを特徴とする付記1または2記載のワークフロー制御プログラム。
(付記4) 前記リソースの状態を戻す処理では、前記第1の処理群に含まれる処理のうち、実行が中断した位置から前記第1の処理群の先頭位置までの処理それぞれについて、前記リソースの状態をそれぞれの処理の実行前の状態に戻すための状態復元処理を実行することを特徴とする付記3記載のワークフロー制御プログラム。
(付記5) 前記状態復元処理は、対応する処理に対して相反する処理であることを特徴とする付記4記載のワークフロー制御プログラム。
(付記6) 前記記憶部への記憶では、前記第1のワークフローに含まれる処理のうち、前記リソースに格納されたデータを更新する更新処理については、当該処理の実行前における前記リソースの状態を示す情報として、更新前のデータを前記記憶部に記憶し、
前記リソースの状態を戻す処理では、実行が中断した位置から前記第1の処理群の先頭位置までに前記更新処理が含まれる場合、前記記憶部から当該更新処理に対応する前記更新前のデータを読み出し、読み出した前記更新前のデータによって前記リソースに格納された更新後のデータを更新する処理を、当該更新処理に対応する前記状態復元処理として実行する、
ことを特徴とする付記4記載のワークフロー制御プログラム。
(付記7) 前記記憶部への記憶では、前記第1のワークフローに含まれる処理の中に、実行が省略された処理がある場合、当該処理について実行が省略されたことを前記記憶部に記憶し、
前記リソースの状態を戻す処理では、前記記憶部に記憶された情報に基づき、実行が中断した位置から前記第1の処理群の先頭位置までに実行が省略された処理がある場合には、当該処理に対応する前記状態復元処理をスキップする、
ことを特徴とする付記4記載のワークフロー制御プログラム。
(付記8) 前記記憶部への記憶では、前記第1のワークフローが第1のリソースを用いた処理と第2のリソースを用いた処理とを含む場合、前記第1のワークフローに含まれる前記第1のリソースを用いた処理それぞれについて、それぞれの処理の実行前における前記第1のリソースの状態を示す情報を前記記憶部に記憶するとともに、前記第1のワークフローに含まれる前記第2のリソースを用いた処理それぞれについて、それぞれの処理の実行前における前記第2のリソースの状態を示す情報を前記記憶部に記憶し、
前記リソースの状態を戻す処理では、前記第1のワークフローが並列分岐を含み、前記並列分岐による第1の分岐先に、前記第1のリソースを用いた1つ以上の処理を含む前記第1の処理群が含まれ、前記並列分岐による第2の分岐先に、前記第2のリソースを用いた1つ以上の処理を含む第3の処理群が含まれる場合に、前記第3の処理群に含まれるいずれかの処理が中断したとき、前記記憶部に記憶された情報に基づいて、前記第1のリソースの状態と前記第2のリソースの状態とを前記並列分岐の実行開始前の状態に戻す、
ことを特徴とする付記3記載のワークフロー制御プログラム。
(付記9) 同一のリソースを用いた処理をそれぞれ含む第1のワークフローおよび第2のワークフローの実行を制御するワークフロー制御装置において、
前記第1のワークフローに含まれる処理のうち、前記リソースを用いた1つ以上の処理を含む第1の処理群を実行する第1の実行部と、
前記第1の処理群に含まれるいずれかの処理が中断したとき、前記リソースの状態を前記第1の処理群の実行開始前の状態に戻すロールバック処理部と、
前記リソースの状態が前記第1の処理群の実行開始前の状態に戻ると、前記第2のワークフローに含まれる処理のうち、前記リソースを用いた1つ以上の処理を含む第2の処理群の実行を開始する第2の実行部と、
を有することを特徴とするワークフロー制御装置。
(付記10) 前記ロールバック処理部は、前記第1の処理群に含まれる処理のうち、入力操作の受け付け処理を含む処理の実行が、所定時間以内に完了しない場合に、当該処理の実行を中断させて、前記リソースの状態を前記第1の処理群の実行開始前の状態に戻すことを特徴とする付記9記載のワークフロー制御装置。
(付記11) 前記第1の実行部は、前記第1のワークフローに含まれる処理それぞれを実行するとともに、それぞれの処理の実行前における前記リソースの状態を示す情報を記憶部に記憶し、
前記ロールバック処理部は、前記第1の処理群に含まれる実行された処理それぞれの内容と、前記記憶部に記憶された、当該実行された処理それぞれの実行前における前記リソースの状態を示す情報とに基づいて、前記リソースの状態を前記第1の処理群の実行開始前の状態に戻す、
ことを特徴とする付記9または10記載のワークフロー制御装置。
(付記12) 前記ロールバック処理部は、前記第1の処理群に含まれる処理のうち、実行が中断した位置から前記第1の処理群の先頭位置までの処理それぞれについて、前記リソースの状態をそれぞれの処理の実行前の状態に戻すための状態復元処理を実行することを特徴とする付記11記載のワークフロー制御装置。
(付記13) 前記状態復元処理は、対応する処理に対して相反する処理であることを特徴とする付記12記載のワークフロー制御装置。
(付記14) 前記第1の実行部は、前記第1のワークフローに含まれる処理のうち、前記リソースに格納されたデータを更新する更新処理については、当該処理の実行前における前記リソースの状態を示す情報として、更新前のデータを前記記憶部に記憶し、
前記ロールバック処理部は、実行が中断した位置から前記第1の処理群の先頭位置までに前記更新処理が含まれる場合、前記記憶部から当該更新処理に対応する前記更新前のデータを読み出し、読み出した前記更新前のデータによって前記リソースに格納された更新後のデータを更新する処理を、当該更新処理に対応する前記状態復元処理として実行する、
ことを特徴とする付記12記載のワークフロー制御装置。
(付記15) 前記第1の実行部は、前記第1のワークフローに含まれる処理の中に、実行が省略された処理がある場合、当該処理について実行が省略されたことを前記記憶部に記憶し、
前記ロールバック処理部は、前記記憶部に記憶された情報に基づき、実行が中断した位置から前記第1の処理群の先頭位置までに実行が省略された処理がある場合には、当該処理に対応する前記状態復元処理をスキップする、
ことを特徴とする付記12記載のワークフロー制御装置。
(付記16) 前記第1の実行部は、前記第1のワークフローが第1のリソースを用いた処理と第2のリソースを用いた処理とを含む場合、前記第1のワークフローに含まれる前記第1のリソースを用いた処理それぞれについて、それぞれの処理の実行前における前記第1のリソースの状態を示す情報を前記記憶部に記憶するとともに、前記第1のワークフローに含まれる前記第2のリソースを用いた処理それぞれについて、それぞれの処理の実行前における前記第2のリソースの状態を示す情報を前記記憶部に記憶し、
前記ロールバック処理部は、前記第1のワークフローが並列分岐を含み、前記並列分岐による第1の分岐先に、前記第1のリソースを用いた1つ以上の処理を含む前記第1の処理群が含まれ、前記並列分岐による第2の分岐先に、前記第2のリソースを用いた1つ以上の処理を含む第3の処理群が含まれる場合に、前記第3の処理群に含まれるいずれかの処理が中断したとき、前記記憶部に記憶された情報に基づいて、前記第1のリソースの状態と前記第2のリソースの状態とを前記並列分岐の実行開始前の状態に戻す、
ことを特徴とする付記11記載のワークフロー制御装置。
(付記17) 同一のリソースを用いた処理をそれぞれ含む第1のワークフローおよび第2のワークフローの実行を制御するワークフロー制御方法において、
コンピュータが、
前記第1のワークフローに含まれる処理のうち、前記リソースを用いた1つ以上の処理を含む第1の処理群を実行し、
前記第1の処理群に含まれるいずれかの処理が中断したとき、前記リソースの状態を前記第1の処理群の実行開始前の状態に戻し、
前記リソースの状態が前記第1の処理群の実行開始前の状態に戻ると、前記第2のワークフローに含まれる処理のうち、前記リソースを用いた1つ以上の処理を含む第2の処理群の実行を開始する、
ことを特徴とするワークフロー制御方法。
1 ワークフロー制御装置
2 第1の実行部
3 第2の実行部
4 ロールバック処理部
5 リソース
11,12 ワークフロー
11a〜11c,12a〜12c 処理
11−1,12−1 処理群

Claims (11)

  1. 第1のワークフローおよび第2のワークフローの実行を制御するためのワークフロー制御プログラムにおいて、
    コンピュータに、
    前記第1のワークフローの実行をモニタし、
    前記第1のワークフローに含まれる処理のうち第1の処理が中断したとき、前記第1のワークフローに含まれる処理のうち、それぞれ同一のリソースを用いた2以上の処理を含み、かつ、前記第1の処理を含む、連続する複数の処理の中から、先頭の処理を特定し、
    前記リソースの状態を前記先頭の処理の実行開始前の状態に戻し、
    前記第2のワークフローに含まれる処理のうち、前記複数の処理と排他的に実行される、前記リソースを用いた第2の処理の実行を開始する、
    処理を実行させることを特徴とするワークフロー制御プログラム。
  2. 前記コンピュータに、
    前記第1のワークフローに含まれる処理のうち、入力操作の受け付け処理を含む前記第1の処理の実行が、所定時間以内に完了しない場合に、前記第1の処理の実行を中断する、
    処理をさらに実行させることを特徴とする請求項1記載のワークフロー制御プログラム。
  3. 前記コンピュータに、
    前記第1のワークフローに含まれる処理それぞれについて、それぞれの処理の実行前における前記リソースの状態を示す情報を記憶部に記憶する、
    処理をさらに実行させ、
    前記リソースの状態を戻す処理では、前記複数の処理に含まれる実行された処理それぞれの内容と、前記記憶部に記憶された、当該実行された処理それぞれの実行前における前記リソースの状態を示す情報とに基づいて、前記リソースの状態を前記先頭の処理の実行開始前の状態に戻す、
    ことを特徴とする請求項1または2記載のワークフロー制御プログラム。
  4. 前記リソースの状態を戻す処理では、前記複数の処理に含まれる処理のうち、実行が中断した位置から前記先頭の処理までの処理それぞれについて、前記リソースの状態をそれぞれの処理の実行前の状態に戻すための状態復元処理を実行することを特徴とする請求項3記載のワークフロー制御プログラム。
  5. 前記状態復元処理は、対応する処理に対して相反する処理であることを特徴とする請求項4記載のワークフロー制御プログラム。
  6. 前記記憶部への記憶では、前記第1のワークフローに含まれる処理のうち、前記リソースに格納されたデータを更新する更新処理については、当該処理の実行前における前記リソースの状態を示す情報として、更新前のデータを前記記憶部に記憶し、
    前記リソースの状態を戻す処理では、実行が中断した位置から前記先頭の処理までに前記更新処理が含まれる場合、前記記憶部から当該更新処理に対応する前記更新前のデータを読み出し、読み出した前記更新前のデータによって前記リソースに格納された更新後のデータを更新する処理を、当該更新処理に対応する前記状態復元処理として実行する、
    ことを特徴とする請求項4記載のワークフロー制御プログラム。
  7. 前記記憶部への記憶では、前記第1のワークフローに含まれる処理の中に、実行が省略された処理がある場合、当該処理について実行が省略されたことを前記記憶部に記憶し、
    前記リソースの状態を戻す処理では、前記記憶部に記憶された情報に基づき、実行が中断した位置から前記先頭の処理までに実行が省略された処理がある場合には、当該処理に対応する前記状態復元処理をスキップする、
    ことを特徴とする請求項4記載のワークフロー制御プログラム。
  8. 前記記憶部への記憶では、前記第1のワークフローが第1のリソースを用いた処理と第2のリソースを用いた処理とを含む場合、前記第1のワークフローに含まれる前記第1のリソースを用いた処理それぞれについて、それぞれの処理の実行前における前記第1のリソースの状態を示す情報を前記記憶部に記憶するとともに、前記第1のワークフローに含まれる前記第2のリソースを用いた処理それぞれについて、それぞれの処理の実行前における前記第2のリソースの状態を示す情報を前記記憶部に記憶し、
    前記リソースの状態を戻す処理では、前記第1のワークフローが並列分岐を含み、前記並列分岐による第1の分岐先に、前記第1のリソースを用いた第1の連続する処理列が含まれ、前記並列分岐による第2の分岐先に、前記第2のリソースを用いた第2の連続する処理列が含まれる場合に、前記第2の連続する処理列に含まれるいずれかの処理が中断したとき、前記記憶部に記憶された情報に基づいて、前記第1のリソースの状態と前記第2のリソースの状態とを前記並列分岐の実行開始前の状態に戻す、
    ことを特徴とする請求項3記載のワークフロー制御プログラム。
  9. 前記2以上の処理は、前記リソースでの処理のうち少なくとも一部の処理の状態を変更する処理と、前記状態を元に戻す処理とを含むことを特徴とする請求項1乃至8のいずれか1項に記載のワークフロー制御プログラム。
  10. 第1のワークフローおよび第2のワークフローの実行を制御するワークフロー制御装置において、
    前記第1のワークフローを実行する第1の実行部と、
    前記第1のワークフローの実行をモニタし、前記第1のワークフローに含まれる処理のうち第1の処理が中断したとき、前記第1のワークフローに含まれる処理のうち、それぞれ同一のリソースを用いた2以上の処理を含み、かつ、前記第1の処理を含む、連続する複数の処理の中から、先頭の処理を特定し、前記リソースの状態を前記先頭の処理の実行開始前の状態に戻すロールバック処理部と、
    前記リソースの状態が前記先頭の処理の実行開始前の状態に戻ると、前記第2のワークフローに含まれる処理のうち、前記複数の処理と排他的に実行される、前記リソースを用いた第2の処理の実行を開始する第2の実行部と、
    を有することを特徴とするワークフロー制御装置。
  11. 第1のワークフローおよび第2のワークフローの実行を制御するワークフロー制御方法において、
    コンピュータが、
    前記第1のワークフローの実行をモニタし、
    前記第1のワークフローに含まれる処理のうち第1の処理が中断したとき、前記第1のワークフローに含まれる処理のうち、それぞれ同一のリソースを用いた2以上の処理を含み、かつ、前記第1の処理を含む、連続する複数の処理の中から、先頭の処理を特定し、
    前記リソースの状態を前記先頭の処理の実行開始前の状態に戻し、
    前記第2のワークフローに含まれる処理のうち、前記複数の処理と排他的に実行される、前記リソースを用いた第2の処理の実行を開始する、
    ことを特徴とするワークフロー制御方法。
JP2013066847A 2013-03-27 2013-03-27 ワークフロー制御プログラム、装置および方法 Expired - Fee Related JP6064734B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2013066847A JP6064734B2 (ja) 2013-03-27 2013-03-27 ワークフロー制御プログラム、装置および方法
US14/222,740 US9940598B2 (en) 2013-03-27 2014-03-24 Apparatus and method for controlling execution workflows

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013066847A JP6064734B2 (ja) 2013-03-27 2013-03-27 ワークフロー制御プログラム、装置および方法

Publications (3)

Publication Number Publication Date
JP2014191604A JP2014191604A (ja) 2014-10-06
JP2014191604A5 JP2014191604A5 (ja) 2014-11-27
JP6064734B2 true JP6064734B2 (ja) 2017-01-25

Family

ID=51621738

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013066847A Expired - Fee Related JP6064734B2 (ja) 2013-03-27 2013-03-27 ワークフロー制御プログラム、装置および方法

Country Status (2)

Country Link
US (1) US9940598B2 (ja)
JP (1) JP6064734B2 (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10698767B1 (en) * 2014-12-22 2020-06-30 Amazon Technologies, Inc. Decentralized management of multi-service workflows
JP6481463B2 (ja) * 2015-03-30 2019-03-13 富士通株式会社 管理支援プログラム、方法及び装置
WO2017046939A1 (ja) * 2015-09-18 2017-03-23 三菱電機株式会社 ジョブ管理装置及びジョブ管理方法及びジョブ管理プログラム
CN106611297A (zh) * 2015-10-21 2017-05-03 中兴通讯股份有限公司 工作流异常处理方法及系统
JP2017097796A (ja) * 2015-11-27 2017-06-01 富士通株式会社 ワークフローの切替プログラム、切替方法及び切替装置
US10768975B2 (en) * 2016-03-04 2020-09-08 Ricoh Company, Ltd. Information processing system, information processing apparatus, and information processing method
US10725816B2 (en) 2017-01-13 2020-07-28 International Business Machines Corporation Optimizing pipeline execution scheduling based on commit activity trends, priority information, and attributes
CN109978290A (zh) * 2017-12-27 2019-07-05 中国移动通信集团广东有限公司 一种业务流程回退处理方法、流程引擎和业务系统
US10365826B1 (en) 2018-01-24 2019-07-30 Micron Technology, Inc. Command processing for a storage system
JP6897866B2 (ja) * 2018-03-29 2021-07-07 日本電気株式会社 システム更新装置およびシステム更新方法
WO2019187975A1 (ja) * 2018-03-29 2019-10-03 日本電気株式会社 システム更新装置およびシステム更新方法
JP7421267B2 (ja) * 2019-02-21 2024-01-24 日本電信電話株式会社 サービス提供用アプリケーションの保守管理システム、保守管理装置、保守管理方法、および、保守管理用プログラム
CN111080250B (zh) * 2019-12-10 2023-04-18 东软集团股份有限公司 流程回退补偿方法、装置、存储介质及电子设备

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06309213A (ja) * 1993-04-26 1994-11-04 Nec Corp ロールバック制御方式
JP3052908B2 (ja) * 1997-09-04 2000-06-19 日本電気株式会社 トランザクションプログラム並列実行方法およびトランザクションプログラム並列実行方式
JP2001257699A (ja) 2000-03-13 2001-09-21 Toshiba Corp 伝送装置およびこの伝送装置のリブート方式
US7296056B2 (en) * 2001-07-30 2007-11-13 International Business Machines Corporation Method, system, and program for selecting one user to assign a work item in a workflow
JP2003256630A (ja) 2002-02-28 2003-09-12 Fuji Xerox Information Systems Co Ltd データフロー管理システム
US7107293B2 (en) * 2003-04-30 2006-09-12 International Business Machines Corporation Nested recovery scope management for stateless recovery agents
JP4291060B2 (ja) * 2003-07-01 2009-07-08 富士通株式会社 トランザクション処理方法,トランザクション制御装置およびトランザクション制御プログラム
US20060069605A1 (en) * 2004-09-29 2006-03-30 Microsoft Corporation Workflow association in a collaborative application
US7634687B2 (en) * 2005-01-13 2009-12-15 Microsoft Corporation Checkpoint restart system and method
US7680683B2 (en) * 2005-12-29 2010-03-16 Microsoft Corporation Dynamically repositioning workflow by end users
US8284423B2 (en) * 2006-04-07 2012-10-09 Ricoh Production Print Solutions LLC Customer-configurable print workflow system
US8181150B2 (en) * 2006-05-12 2012-05-15 The Mathworks, Inc. System and method for synchronized workflow management
US20080172669A1 (en) * 2007-01-12 2008-07-17 Carefx Corporation System capable of executing workflows on target applications and method thereof
JP4807382B2 (ja) 2008-06-25 2011-11-02 富士ゼロックス株式会社 処理フロー制御プログラム、処理フロー制御装置及びデータ処理システム
US9244730B2 (en) * 2009-02-11 2016-01-26 International Business Machines Corporation Application workflow integration subsystem
US8812403B2 (en) * 2010-11-08 2014-08-19 Microsoft Corporation Long term workflow management

Also Published As

Publication number Publication date
US20140297355A1 (en) 2014-10-02
US9940598B2 (en) 2018-04-10
JP2014191604A (ja) 2014-10-06

Similar Documents

Publication Publication Date Title
JP6064734B2 (ja) ワークフロー制御プログラム、装置および方法
JP6152675B2 (ja) ワークフロー制御プログラム、装置および方法
JP5334226B2 (ja) スケジュール管理方法及びスケジュール管理サーバ
JP6241144B2 (ja) 制御プログラム、制御方法および制御装置
US8516499B2 (en) Assistance in performing action responsive to detected event
JP6260130B2 (ja) ジョブ遅延検知方法、情報処理装置、およびプログラム
JP2014191604A5 (ja)
JP6597360B2 (ja) コネクション管理プログラム、コネクション管理方法、および情報処理装置
US9244718B2 (en) Virtual machine resource allocation based on connection time coverage exceeding a minimum threshold
US20150370593A1 (en) System construction device and system construction method
JP2013045313A (ja) ログ収集管理装置、システム、および方法
JP2010176303A (ja) バッチ処理システムおよびこれに用いる情報端末装置、バッチ処理のリカバリ方法
JP2016200981A (ja) 運用管理プログラム、運用管理方法、および運用管理装置
US20130347001A1 (en) Computer-readable recording medium, exclusion control apparatus, and exclusion control method
CN107450793A (zh) 数据处理设备和数据处理方法
US10904324B2 (en) Computer system and method of controlling data processing
JP2010237901A (ja) 監視制御システム、監視制御方法、監視制御サーバ及び監視制御プログラム
US20150242786A1 (en) Integrating process context from heterogeneous workflow containers to optimize workflow performance
JP2010211574A (ja) 情報処理システム、監視方法及び監視プログラム
JP2008135054A (ja) ワークフロー管理方法及びその実施システム
CN106959888B (zh) 云存储系统中的任务处理方法及装置
JP6497278B2 (ja) ログ管理プログラム、ログ管理方法およびログ管理装置
Werfs et al. Towards resilient adaptive socio-technical systems
JP7116318B2 (ja) 処理システム、処理方法、上位システム、下位システム、上位プログラムおよび下位プログラム
JP7196262B1 (ja) サービス提供システムおよびサービス提供方法

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20141010

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20151106

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160711

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160830

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161031

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20161122

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20161205

R150 Certificate of patent or registration of utility model

Ref document number: 6064734

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees