JP2009199213A - プロセス監視方法、情報処理装置、及びプログラム - Google Patents

プロセス監視方法、情報処理装置、及びプログラム Download PDF

Info

Publication number
JP2009199213A
JP2009199213A JP2008038544A JP2008038544A JP2009199213A JP 2009199213 A JP2009199213 A JP 2009199213A JP 2008038544 A JP2008038544 A JP 2008038544A JP 2008038544 A JP2008038544 A JP 2008038544A JP 2009199213 A JP2009199213 A JP 2009199213A
Authority
JP
Japan
Prior art keywords
health check
child
processes
grandchild
parent
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008038544A
Other languages
English (en)
Other versions
JP5056464B2 (ja
Inventor
Shoki Hayashi
昇輝 林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2008038544A priority Critical patent/JP5056464B2/ja
Publication of JP2009199213A publication Critical patent/JP2009199213A/ja
Application granted granted Critical
Publication of JP5056464B2 publication Critical patent/JP5056464B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】マルチプロセス機能を有する情報処理装置において、複数の被管理プロセスのヘルスチェックに要する演算処理量が1つの管理プロセスに集中することを軽減する。
【解決手段】マルチプロセス機能を有する情報処理装置1は、階層的に生成されるプロセスPA、PC及びPGを含む複数のプロセスを並列実行する。親プロセスPAは、親プロセスPAによって生成された子プロセスPCのヘルスチェックを実行する。子プロセスPCは、子プロセスPCによって生成された孫プロセスPGのヘルスチェックを実行する。
【選択図】図5

Description

本発明は、複数のプロセスを並列的に実行するマルチプロセス機能を有する情報処理装置に関し、特にこのような情報処理装置におけるプロセス監視技術に関する。
組み込みシステム等の情報処理装置は、リアルタイム性の確保、プログラムのソフトウェア部品化による生産性向上等を実現するため、一般にマルチプロセス機能を備えている。マルチプロセス機能とは、複数のプロセスを定期的に切り替えて実行したり、あるイベントの発生に応じて実行するプロセスを切り替えたりすることによって、複数のプロセスがあたかも並列実行されているような環境を実現する機能である。マルチプロセス環境は、プロセスを実行するCPU(Central Processing Unit)と、CPUで実行されるプロセスのスケジューリングを担うオペレーティングシステムプログラム(OS:Operating System Program)等のプログラムによって実現される。
マルチプロセス機能を有する情報処理装置では、複数のプロセスの各々が正常に実行されていることを確認するためのヘルスチェックが行なわれる(例えば、特許文献1〜4を参照)。
特許文献1は、1つのプロセスが他の1つのプロセスのヘルスチェックを行なう技術を開示している。具体的に述べると、特許文献1は、ソフトウェアエミュレーション方式による仮想計算機システムを開示している。当該仮想計算機システムは、2つのエミュレーションプログラムを並列に起動し、一方のエミュレーションプログラムを現用系、他方を待機系とする。具体的には、先に起動されたエミュレーションプログラムが現用系となり、待機系エミュレーションプログラムを生成する。そして、親プロセスである現用系エミュレーションプログラム及び子プロセスである待機系エミュレーションプログラムが、お互いのヘルスチェックを行なう。子プロセスである待機系エミュレーションプログラムが現用系エミュレーションプログラムの障害発生を検知すると、現用系エミュレーションプログラムを強制終了して自身を現用系に切り替えると共に、新たなエミュレーションプログラムを生成してこれを待機系とする。
また、特許文献2〜4は、1つのプロセスが他の複数のプロセスのヘルスチェックを行う技術を開示している。このうち、特許文献2は、UNIX(登録商標)オペレーティングシステムにおけるプロセス監視技術を開示している。具体的には、1つのプロセス管理部が、複数のプロセスグループのヘルスチェックを行うことが開示されている。ここで、プロセスグループとは、複数のプロセスを予め分類した単位である。特許文献1は、課金処理のための複数のプロセスが属する課金グループ、呼処理のための複数のプロセスが属する呼処理グループ等、複数のプロセスを機能毎に予め分類することを開示している。
特許文献3に開示されたヘルスチェック方法は、概略以下の手順により実行される。まず、始めに、ヘルスチェックを行なう管理プロセス(特許文献3では、システムヘルスチェックプログラム)が、起点プロセスに対してチェックデータを送信する。そして、起点プロセス、中間プロセス、終点プロセスの順にプロセス間通信によって当該チェックデータの受け渡しが行なわれる。チェックデータの受け渡しが正常に行なわれると、終点プロセスからヘルスチェック要求元プロセスに対して完了通知が送信される。ヘルスチェック要求元プロセスは、終点プロセスからの完了通知の受信の有無によって、障害発生を検知する。
特許文献4は、複数のサーバ上で分散して実行される複数のプロセスが連携して特定の業務を実行するサーバシステムを開示している。当該サーバシステムに含まれる複数のサーバの各々では管理プロセスが起動され、各管理プロセスが各サーバで生成されるプロセス群のヘルスチェックを行なう。1つの管理プロセスは、自身が起動されているサーバで生成されているプロセス群のヘルスチェックを行い、プロセス障害を検出した場合には、障害発生プロセスと関連する複数のプロセスの再起動を行なうために、他のサーバ上で起動されている管理プロセスに対して関連プロセスの再起動を要求する。このように、複数のサーバの各々で起動されている管理プロセス間の連携によって、複数のサーバに跨って定義されたプロセスグループ単位でのプロセス再開を可能としている。
なお、特許文献5は、広義のヘルスチェック機能を開示しているが、汎用コンピュータに接続されてオペレータによって使用されるシステムコンソールの障害を検知するためのヘルスチェック機能を開示するのみである。具体的には、汎用サーバからシステムコンソールに対して定期的にヘルスチェックデータを送信し、これに対するシステムコンソールからの応答データを汎用コンピュータが受信することによって、システムコンソールのヘルスチェックを行なう。つまり、特許文献5は、マルチプロセス機能を有する情報処理装置において起動されているプロセスのヘルスチェックを行なう技術を何ら開示していない。
特開2006−178552号公報 特開平8−297587号公報 特開2004−86574号公報 特開2004−102492号公報 特開平10−116211号公報 特開2007−102332号公報
上述した組み込みシステムで実行されるファームウェア等には、並行処理されるプロセス数が動的に増減し、かつ、並行処理されるプロセス数が膨大になるものがある。例えば、通信機器で実行されるファームウェアの中には、ユーザのアクセス数やトランザクション数に比例してプロセス数が増加するものがある。一般的に、ファームウェアは常時稼働かつ高信頼性が要求されることが多いため、ファームウェア障害の検知のために、精度の高いプロセス監視を行なうことが求められている。
特許文献2〜5に開示されているような、1つの管理プロセスが複数の被管理プロセスのヘルスチェックを行なう方法では、複数の被管理プロセスのヘルスチェックに要する演算処理量が1つの管理プロセスに集中するという問題がある。
このうち、特許文献3に開示された技術によれば、被管理プロセス間でのプロセス間通信によって、管理プロセスが直接的にチェックデータを送信するプロセス数を削減できる。しかしながら、管理プロセスは、多数の終点プロセスのヘルスチェックを行なうために、終点プロセス数に応じた回数だけ繰り返しチェックデータを送信する必要がある。このため、特許文献3に開示された技術では、被管理プロセスの増加に比例して管理プロセスのヘルスチェックに要する演算処理量が増大する状況に変わりは無いため、残念ながら、プロセス数の増大に適応できる十分なスケーラビリティを有するものではない。
また、特許文献4に開示された技術は、複数のサーバの各々にて管理プロセスが生成されるが、各サーバで起動されるプロセスは全て1つの管理プロセスがヘルスチェックを行なう構成である。このため、当該技術もまた、プロセス数の増大に適応できる十分なスケーラビリティを有するものではない。
なお、特許文献6は、複数の情報処理装置において、複数のプロセスを分散実行するロードバランサ型のクラスタシステムを開示している。つまり、特許文献6に開示された技術は、複数のプロセスを複数の情報処理装置で実行することにより、1つの情報処理装置にプロセス実行負荷が集中することを軽減するものである。しかしながら、特許文献6は、複数の被管理プロセスのヘルスチェックに要する演算処理量が1つの管理プロセスに集中することを軽減するための技術を何ら開示するものではない。
本発明は、上述した知見に基づいてなされたものであって、マルチプロセス機能を有する情報処理装置において、複数の被管理プロセスのヘルスチェックに要する演算処理量が1つの管理プロセスに集中することを軽減する技術の提供を目的とする。
本発明の第1の態様は、マルチプロセス機能を有する情報処理装置におけるプロセス監視方法である。当該方法は、親プロセスによって生成された子プロセスのヘルスチェックを前記親プロセスが実行するステップ(a)と、前記子プロセスによって生成された孫プロセスのヘルスチェックを前記子プロセスが実行するステップ(b)とを含む。
本発明の第2の態様は、マルチプロセス機能を有する情報処理装置である。当該情報処理装置は、ファームウェアを記憶する記憶部と、前記ファームウェアに基づいて生成される複数のプロセスを並列的に実行する命令実行部とを備える。さらに、前記複数のプロセスは、親プロセス、前記親プロセスによって生成される子プロセス、及び前記子プロセスによって生成される孫プロセスを含み、前記親プロセスが前記子プロセスのヘルスチェックを実行し、前記子プロセスが前記孫プロセスのヘルスチェックを実行する。
本発明の第3の態様は、コンピュータにより並列的に実行される複数のプロセスを含むプログラムである。当該プログラムに含まれる前記複数のプロセスは、親プロセス、前記親プロセスによって生成される子プロセス、及び前記子プロセスによって生成される孫プロセスを含む。さらに、前記複数のプロセスは、前記親プロセスが前記子プロセスのヘルスチェックを行い、前記子プロセスが前記孫プロセスのヘルスチェックを行う階層化されたプロセス監視を前記コンピュータに実行させることを特徴とする。
上述した本発明の第1乃至第3の態様では、階層的に生成される複数の被管理プロセスの障害監視を行うに際して、子プロセスが孫プロセスのヘルスチェックを行なうため、親プロセスは子プロセスのヘルスチェックのみを行えばよい。すなわち、被管理プロセスのヘルスチェックに要する演算処理量を、被管理プロセス(つまり子プロセス)を含む複数のプロセス間(つまり親プロセス及び子プロセスの間)で分散できる。したがって、本発明の第1乃至第3の態様によれば、複数の被管理プロセス(つまり、子プロセス及び孫プロセス)のヘルスチェックに要する演算処理量が1つの管理プロセス(つまり、親プロセス)に集中することを軽減できる。
以下では、本発明を適用した具体的な実施の形態について、図面を参照しながら詳細に説明する。各図面において、同一要素には同一の符号が付されており、説明の明確化のため、必要に応じて重複説明は省略される。
<発明の実施の形態1>
本実施の形態にかかる情報処理装置1の構成を図1に示す。図1において、CPU(Central Processing Unit)10は、不揮発性記憶装置11に保存されたファームウェア110を主記憶装置12に読み出し、ファームウェア110に含まれる命令をデコードし、命令に応じた処理、例えば、算術演算論理演算等の演算処理や、不揮発性記憶装置11及び主記憶装置12に対するアクセスを実行する。また、情報処理装置1は、マルチプロセス機能を有しており、ファームウェア110に含まれる複数のプロセスを並列的に実行可能である。なお、情報処理装置1にマルチプロセス機能を持たせるためには、例えば、CPU10との連携によってマルチプロセス環境をもたらすOS(不図示)を不揮発性記憶装置11に保存しておき、CPU10に当該OSを実行させればよい。
不揮発性記憶装置11は、例えば、PROM(Programmable Read Only Memory)、EEPROM(electrically erasable PROM)等である。
主記憶装置12は、不揮発性記憶装置11から読み出されたOS(不図示)及びファームウェア110の格納領域、並びにOS(不図示)及びファームウェア110によって使用されるデータの格納領域として使用される。
図2は、ファームウェア110を実行することによって生成される複数のプロセスの階層構成を示す図である。図1において、プロセスPAが最上位のプロセス(以下、ルートプロセスと呼ぶ)である。
図1に示す5つのプロセスPB、PC、PD、PE及びPFは、ルートプロセスであるプロセスPAによって生成される。つまり、これら5つのプロセスPB、PC、PD、PE及びPFは、プロセスPAの「子プロセス」である。
図1に示すプロセスPG及びPHは、プロセスPCによって生成される。つまり、プロセスPG及びPHは、プロセスPCの「子プロセス」であり、かつプロセスPAの「孫プロセス」である。
図1に示すプロセスPI及びPJは、プロセスPEによって生成される。つまり、プロセスPI及びPHは、プロセスPEの「子プロセス」であり、かつプロセスPAの「孫プロセス」である。
最後に、図1に示すプロセスPKは、プロセスPIによって生成される。つまり、プロセスPKは、プロセスPIの「子プロセス」であり、かつプロセスPAの「曾孫プロセス」である。
また、図1に破線で示したプロセスグループ201、202、301、401、及び501は、複数のプロセスを便宜上グループ分けしたものである。プロセスグループへのグループ化は、例えば、あるプロセスの動作に他のプロセスの動作を必要とするためにプロセス実行上の依存関係がある複数のプロセスを単位として行えばよい。また、プロセスグループへのグループ化は、使用するリソースが共通する複数のプロセス等を単位として行ってもよい。
続いて、本実施の形態におけるプロセス監視について説明する。図2のプロセスPAは、自身が生成した子プロセスPB〜PFとの間でプロセス間通信を行ない、これら子プロセスPB〜PFのヘルスチェックを実行する。また、図2のプロセスPCは、自身が生成した子プロセスPG及びPHとの間でプロセス間通信を行ない、これら子プロセスPG及びPHのヘルスチェックを実行する。同様に、プロセスPEは子プロセスであるプロセスPI及びPJのヘルスチェックを行い、プロセスPIは子プロセスであるプロセスPKのヘルスチェックを行なう。すなわち、本実施の形態では、ルートプロセスであるプロセスPAが配下の子プロセス、孫プロセス、及び曾孫プロセスの全てのヘルスチェックを行なうのではなく、各々のプロセスが自身の子プロセスに対するヘルスチェックを行なうことを特徴としている。
子プロセスを生成した親プロセスは、ヘルスチェックの実行のために、ヘルスチェックテーブルを生成するとよい。ヘルスチェックテーブルは、子プロセスに関するヘルスチェックの定義情報を格納するテーブルである。図3にヘルスチェックテーブルの具体例を示す。
図3(a)のヘルスチェックテーブル31は、プロセスPAによって生成されるヘルスチェックテーブルの具体例である。図3(a)の例では、子プロセスPB〜PFの各々について、プロセスグループ識別情報、プロセス識別情報、タイムアウト時間、シーケンス番号が管理されている。ここで、プロセスグループ識別情報とは、プロセスが属するプロセスグループを識別するための情報である。図3の例では、図2に示したプロセスグループの符号をプロセスグループ識別情報としている。プロセス識別情報は、各プロセスを識別するための情報である。図3の例では、図2に示した各プロセスの符号をプロセス識別情報としている。
図3(a)のタイムアウト時間は、子プロセスに対して後述するヘルスチェック要求データD1を送信してからこれに対する子プロセスからのヘルスチェック応答データD2を受信するまでの上限時間を示す。タイムアウト時間内にヘルスチェック応答データD2が到達しない場合、親プロセスであるプロセスPAは、子プロセスの障害発生と判定する。
図3(a)のシーケンス番号は、ヘルスチェック要求データD1に付与される番号である。子プロセスは、ヘルスチェック応答データD2に親プロセスから受信したシーケンス番号を付与して送信する。つまり、シーケンス番号は、要求データD1と応答データD2とを対応付けるために使用される。プロセスPAは、子プロセスにヘルスチェック要求を行なう度に、ヘルスチェックテーブル31上のシーケンス番号を1つずつ増加させる。
一方、図3(b)のヘルスチェックテーブル32は、プロセスPCによって生成されるヘルスチェックテーブルの具体例である。ヘルスチェックテーブル32は、プロセスPCの子プロセスPG及びPHについて、図3(a)のヘルスチェックテーブル31と同様の項目を管理している。
続いて、ヘルスチェックために親子プロセス間で送受信されるデータについて説明する。図4(a)〜(f)は、プロセス間通信によって親子プロセス間で送受信されるヘルスチェック用データの具体例を示している。
図4(a)に示すヘルスチェック要求データD1は、ヘルスチェックの要求を行なう親プロセスから子プロセスに対して送信される。ヘルスチェック要求データD1は、送信先の子プロセスの識別情報が指定される「宛先フィールド」、送信元の親プロセスを示す識別情報が指定される「送信元フィールド」、ヘルスチェック要求であることを示す「データ種別フィールド」、並びに上述した「シーケンス番号フィールド」及び「タイムアウト時間フィールド」を含む。
図4(b)に示すヘルスチェック応答データD2は、ヘルスチェック要求データD1を受信した子プロセスから親プロセスに対して送信される。ヘルスチェック応答データD2は、送信先の親プロセスの識別情報が指定される「宛先フィールド」、送信元の子プロセスを示す識別情報が指定される「送信元フィールド」、ヘルスチェック応答であることを示す「データ種別フィールド」、要求データD1に含まれていた「シーケンス番号フィールド」、及び「ヘルスチェック結果フィールド」を含む。ヘルスチェック結果は、ヘルスチェックの結果がOKであるかNGであるかを示す。
図4(c)に示すヘルスチェック停止要求データD3は、プロセス終了のためにヘルスチェックの終了を要求する子プロセスから親プロセスに対して送信される。ヘルスチェック停止要求データD3は、送信先の親プロセスの識別情報が指定される「宛先フィールド」、送信元の子プロセスを示す識別情報が指定される「送信元フィールド」、及びヘルスチェック停止要求であることを示す「データ種別フィールド」を含む。
図4(d)に示すヘルスチェック停止応答データD4は、ヘルスチェックを停止したことを通知するために、ヘルスチェック停止要求データD3を受信した親プロセスから子プロセスに対して送信される。ヘルスチェック停止要求データD3は、送信先の子プロセスの識別情報が指定される「宛先フィールド」、送信元の親プロセスを示す識別情報が指定される「送信元フィールド」、及びヘルスチェック停止応答であることを示す「データ種別フィールド」を含む。
図4(e)に示すタイムアウト時間変更要求データD5は、自身の障害判定のために親プロセスが設定しているタイムアウト時間の変更を要求する子プロセスから親プロセスに対して送信される。タイムアウト時間変更要求データD5は、送信先の親プロセスの識別情報が指定される「宛先フィールド」、送信元の子プロセスを示す識別情報が指定される「送信元フィールド」、タイムアウト時間変更要求であることを示す「データ種別フィールド」、及び希望のタイムアウト時間示す「タイムアウト時間フィールド」を含む。
図4(f)に示すタイムアウト時間変更応答データD6は、タイムアウト時間を変更したことを通知するために、タイムアウト時間変更要求データD5を受信した親プロセスから子プロセスに対して送信される。タイムアウト時間変更応答データD6は、送信先の子プロセスの識別情報が指定される「宛先フィールド」、送信元の親プロセスを示す識別情報が指定される「送信元フィールド」、及びタイムアウト時間変更応答であることを示す「データ種別フィールド」を含む。
続いて以下では、図5を参照して、本実施の形態におけるヘルスチェックの基本シーケンスを説明する。図5は、プロセスPAによるヘルスチェック周期1回分の動作を表している。なお、説明簡略化のために、図5においてプロセスPI、PJ及びPKの記載を省略するとともに、プロセスPEは子プロセスを有していないものとして説明する。
図5において、プロセス間通信によって、子プロセスPB〜PFに対してヘルスチェック要求データD1を送信する(S11〜S15)。ここで、プロセスPAは、周期的に子プロセスPB〜PFに対して要求データD1の送信を周期的に行えばよい。
子プロセスを有していないプロセスPB並びにPD〜PF(上述の通り、プロセスPEは説明便宜上子プロセスを有していないと仮定する)は、親プロセスPAからヘルスチェック要求データD1を受信したことに応じて、自身のヘルスチェック結果を含むヘルスチェック応答データD2をプロセスPAに対して送信する(S21、S23〜S25)。
一方、子プロセスPG及びPHを有するプロセスPCは、プロセスPAからヘルスチェック要求データD1を受信したことに応じて、子プロセスPG及びPHに対してヘルスチェック要求データD1を送信する(S16及びS17)。
プロセスPG及びPHは、子プロセスを有していない。このため、プロセスPG及びPHは、親プロセスPCからヘルスチェック要求データD1を受信したことに応じて、自身のヘルスチェック結果を含むヘルスチェック応答データD2をプロセスPCに対して送信する(S26及びS27)。
プロセスPCは、ヘルスチェック結果OKを示すヘルスチェック応答データD2をヘルスチェックテーブル32に規定されたタイムアウト時間内に子プロセスPG及びPHからの受信した場合、プロセスPAに対してヘルスチェック結果OKを示すヘルスチェック応答データD2を送信する(S22)。
なお、例えば、プロセスPCは、S16におけるヘルスチェック要求データD1の送信時刻とS26におけるヘルスチェック応答データD2の受信時刻との差が、ヘルスチェックテーブル32に規定されたプロセスPGに対するタイムアウト時間より小さい場合に、所定のタイムアウト時間内に子プロセスPGからヘルスチェック応答データD2を受信したと判定すればよい。ここで、ヘルスチェック要求データD1とヘルスチェック応答データD2の対応付けは、上述したシーケンス番号により行えばよい。プロセスPHに対するヘルスチェック判定もプロセスPGと同様とすればよい。
続いて、新たな子プロセスが生成されてから親プロセスのヘルスチェック対象に追加されるまでの処理手順について、図6のシーケンス図を参照して説明する。図6は、プロセスPAが新たな子プロセスPLを生成し、プロセスPLをヘルスチェック対象に追加する処理手順を示すシーケンス図である。
ステップS31では、プロセスPAが新たな子プロセスPLを生成する。次に、ステップS32では、プロセスPAのヘルスチェック対象にプロセスPLを追加するため、プロセスPAが、ヘルスチェックテーブル31にプロセスPLに関するエントリを追加する。その後、プロセスPAは、次のヘルスチェック周期において、ヘルスチェック要求データD1をプロセスPLに送信する(S33)。ステップS34では、ヘルスチェック要求データD1に応答して、自身のヘルスチェック結果を示すヘルスチェック応答データD2を送信する。
なお、新たに生成される子プロセスPLをヘルスチェック対象とする必要がない場合には、親プロセスPAは、プロセスPLをヘルスチェックテーブル31に登録する必要はない。また、ここではプロセスPAが子プロセスPLを生成する場合について例示したが、ヘルスチェック対象となっている他のプロセスが新たな子プロセスを生成する場合の手順も同様とすればよい。図6に示したように、動的に生成される新たなプロセスをヘルスチェック対象とすることによって、動的に生成されるプロセスのヘルスチェック管理が可能になる。
続いて、ヘルスチェック対象とされているプロセスの終了に伴うヘルスチェック停止手順の具体例について説明する。図7のシーケンス図は、プロセスPEの終了時に、親プロセスPAのヘルスチェック対象からプロセスPEを除外する際の処理手順を示している。
ステップS41では、プロセスPEがプロセスPAに対してヘルスチェック停止要求データD3を送信する。ステップS42では、ヘルスチェック停止要求データD3を受信したプロセスPAが、ヘルスチェックテーブル31からプロセスPEのエントリを削除する。ステップS43では、プロセスPAがプロセスPEに対してヘルスチェック停止応答データD4を送信する。ステップS44では、ヘルスチェック停止応答データD4を受信したプロセスPEが、プロセス終了する。ステップS45では、プロセスPAが、プロセスPEの子孫プロセス、すなわち図1に示したプロセスPI、PJ及びPKを終了させる。
図7に示したように、子プロセスPEが停止する前に、親プロセスPAに対してヘルスチェック停止要求データD3を送信しておくことによって、プロセスPAが、プロセスPEからのヘルスチェック結果OKを示すヘルスチェック応答データD2が得られないために、プロセスPEのヘルスチェック結果がNGと判定することがなくなる。つまり、図7の処理手順によって、動的に削除されるプロセスのヘルスチェック管理が可能になる。
続いて、タイムアウト時間の変更手順の具体例について説明する。図8のシーケンス図は、プロセスPCが管理しているプロセスPGのタイムアウト時間の変更手順を示している。
ステップS51では、プロセスPGが、プロセスPCに対してタイムアウト時間変更要求データD5を送信する。ステップS52では、タイムアウト時間変更要求データD5を受信したプロセスPCが、プロセスPGのタイムアウト時間変更に伴って、親プロセスPAによって管理されている自身のタイムアウト時間の変更が必要か否かを判定する。具体的には、プロセスPCは、プロセスPAにより管理されている自身のタイムアウト時間を、子プロセスPG及びPHのタイムアウト時間と、ヘルスチェック要求データD1及び応答データD2の送受信に要する処理時間の合計と比較して、自身のタイムアウト時間が処理に必要十分な長さであるか否かを判定すればよい。
プロセスPCは、自身のタイムアウト時間の変更が必要で有ると判定した場合、プロセスPAに対してタイムアウト時間変更要求データD5を送信する(S53)。ステップS54では、プロセスPAが、ヘルスチェックテーブル31に記録されたプロセスCのタイムアウト時間を、ステップS53にて受信したタイムアウト時間変更要求データD5のタイムアウト時間フィールドに指定された値に変更する。ステップS55では、プロセスPAが、プロセスPCに対してタイムアウト時間変更応答データD6を送信する。
ステップS56において、プロセスPCは、ヘルスチェックテーブル32に記録されたプロセスPGのタイムアウト時間を、ステップS51で受信したタイムアウト時間変更要求データD5のタイムアウト時間フィールドに指定された値に変更する。最後に、ステップS57では、プロセスPCが、プロセスPGに対してタイムアウト時間変更応答データD6を送信する。
図8に示した手順によって、子プロセス数の増減等によってヘルスチェック対象プロセスの負荷が変動した場合に、当該ヘルスチェック対象プロセスに対するタイムアウト時間を動的に変更することがきる。つまり、図8の処理手順によって、動的に負荷が変動するプロセスのヘルスチェック管理が可能になる。
続いて以下では、ヘルスチェック対象プロセスが障害状態に陥った場合の当該プロセスの再開手順について詳しく説明する。図9及び10は、プロセスPCがヘルスチェックNGとなり障害状態と判定された場合のプロセス再開手順の具体例を示すシーケンス図である。図9は、プロセス再開手順の前半を示し、図10は、プロセス再開手順の後半を示している。なお、図9及び図10では、上述した図5と同様に、プロセスPI、PJ及びPKの表示を省略している。
図9のステップS61では、プロセスPAがプロセスPCの障害を検知する。プロセスPAがプロセスPCのプロセス障害を検知するのは、プロセスPCから受信したヘルスチェック応答データD2に示されているヘルスチェック結果がNGである場合、又は、プロセスPCからのヘルスチェック応答データD2が所定のタイムアウト時間内に受信できない場合である。なお、図7のS41に示したように、プロセスPCがプロセスPAに対してヘルスチェック停止要求データD3を送った後に、プロセスPCから受信したヘルスチェック応答データD2に示されるヘルスチェック結果がNGである場合、又はヘルスチェック応答データD2が受信できない場合には、プロセスPAはプロセスPCの障害と判定しない。
ステップS62では、プロセスPAが、プロセスPC、並びにプロセスPCと同じプロセスグループ201に属するプロセスPB及びPDを自身のヘルスチェックテーブル31から削除する。
ステップS63において、プロセスPAは、プロセスPCの障害を検知したこと、これに応じてプロセスPCが属するプロセスグループ201内のプロセス群PB、PC及びPDを再起動させることを、外部に通知する。外部への通知は、例えば、システムログを残すことにより行なえばよい。また、外部への通知は、保守者が目視により確認できるLED(不図示)を情報処理装置1に設けておき、当該LEDを点灯させることによって行ってもよい。また、外部への通知は、情報処理装置1とネットワークを介して通信可能に接続された他の装置に対してSNMP(Simple Network Management Protocol)トラップを送ることにより行ってもよい。なお、このタイミングでは、プロセスPCが障害状態であるために正常に外部に障害発生を通知することができない可能性がある。しかしながら、万一、この後に説明するプロセスPB〜PDの強制終了及び再生成に失敗した場合、障害の範囲が広がってしまうおそれがある。このため、このタイミングで通知することによって、できる限り多くの障害情報を残せるという利点がある。
ステップS64〜S66では、プロセスPAが、プロセスグループ201に属するプロセスPB〜PDを強制的に終了させる。さらに、ステップS67及びS68では、終了させた子プロセスPB〜PDの子孫プロセス、具体的にはプロセスPG及びPHを強制的に終了させる。
図10のシーケンスは、図9の手順後に行なわれるプロセス再起動手順の具体例である。図10のステップS71〜73では、プロセスPAが、子プロセスPB〜PDを再起動する。ステップS74では、プロセスPAが、再起動させた子プロセスPB〜PDのエントリを自身のヘルスチェックテーブル31に追加する。
ステップS75及び76では、再起動されたプロセスPCが、子プロセスPG及びPHを再起動する。ステップS77では、プロセスPCが、再起動させた子プロセスPG及びPHのエントリを自身のヘルスチェックテーブル32に追加する。
ステップS78において、プロセスPAは、ステップS74でのヘルスチェックテーブル更新が完了し、プロセスPB〜PDの再起動が完了したことに応じて、プロセス障害が復旧したことを外部に通知する。
図9及び10に示したプロセス再開手順、すなわち親プロセスが子プロセスを再起動させる処理手順は、複数のプロセスが同時に障害になった場合に特に利点が大きい。例えば、図1に示したプロセスPC及びPKが同時に障害になった場合を考える。この場合、プロセスグループ201に属するプロセスPCを再起動させるのは、プロセスPAである。一方、プロセスグループ501に属するプロセスPKを再起動させるのは、プロセスPIである。つまり、同時に障害に陥った2つのプロセスの再起動処理を別々のプロセスが行うことになる。
つまり、親プロセスが子プロセスの障害を監視するとともに、プロセス障害時のプロセス再起動を親プロセスが実行する上述の手順は、プロセスの障害監視や再起動を1つの管理プロセス(例えば、プロセスPA)が行う場合に比べて、1つのプロセス(例えばプロセスPA)に対してプロセス管理の負荷が集中することを回避できる。また、プロセス障害のために強制終了された子プロセスの再起動を親プロセスが担うことによって、1つの管理プロセス(例えば、プロセスPA)が集中的にプロセス再起動を実行する場合に比べて、プロセス再起動に要する時間が減少することが期待できる。このため、並行して実行されるプロセス数が非常に多いファームウェアのプロセス障害監視、プロセス再起動方式として、図9及び図10に示した手順は特に有益である。
上述した本実施の形態にかかる情報処理装置1は、以下に述べる第1及び第2の効果を奏する。第1に、本実施の形態では、親プロセスが子プロセスのヘルスチェックを行なうため、ヘルスチェック処理の負荷が階層的に生成される複数のプロセス間で分散されるという効果がある。
この第1の効果によって、例えばルートプロセスPA等の特定のプロセスへのヘルスチェック処理負荷の集中を避けられる。このため、あるヘルスチェック対象プロセスのヘルスチェック間隔を短くして当該ヘルスチェック対象プロセスに対する精度の高い状態監視を行なうことも容易となる。
例えば、プロセスPDのヘルスチェック間隔を短くして詳細な監視を行なう場合、親プロセスPAの負荷が増大する。しかしながら、プロセスPAは、孫プロセスPG及びPHに対するヘルスチェック処理を直接的に行っておらず、その分の負荷がプロセスPCに分散されている。このため、親プロセスPAは、プロセスPDの詳細監視による負荷の増大を許容できる可能性が高まる。これは、情報処理装置1が、並行して実行されるプロセス数が膨大なファームウェアを実行する場合に、ヘルスチェック間隔を短くして詳細なプロセス監視を行なうことを可能にする。
また第2に、本実施の形態では、障害発生後のプロセス再開時に、親プロセスが子プロセスの再起動を行なうため、プロセス再起動処理の負荷が階層的に生成される複数のプロセス間で分散されるという効果がある。
プロセス障害の発生時には、本実施の形態でも述べたようなプロセスグループ単位でのプロセス再起動が有効である。プロセスグループに含まれる複数のプロセスの再起動を常に1つの管理プロセス(例えば、プロセスPA)が行なうのでは、負荷集中のために全てのプロセスの再起動までに要する時間が増大することが懸念される。本実施の形態は、プロセス再起動に要する負荷を複数のプロセス間で分散できるため、全プロセスの再起動の完了までに要する時間を縮小させることが期待できる。
<発明の実施の形態2>
本実施の形態と上述した実施の形態1との相違点は、図2に示したルートプロセスPAの監視を行なうために、プロセスPAの機能を2つのプロセスPP及びPQに分ける点である。
なお、本実施の形態にかかる情報処理装置の構成、ヘルスチェック手順、プロセス生成に伴うヘルスチェック開始手順、プロセス終了に伴うヘルスチェック停止手順、タイムアウト時間の変更手順、プロセス再開の手順等は、上述した発明の実施の形態1と同様とすれば良いため、ここでは重複説明を省略する。
図11に、本実施の形態にかかる情報処理装置において生成されるプロセス群の階層構成を示す。プロセスPP及びPQは、互いに相手のプロセスを監視し、相手のプロセスに障害が発生した場合にこれを再起動させる。これにより、プロセスPAの負荷がプロセスPP及びPQに分散されることになり、負荷分散の観点でさらに効果的である。また、図2ではプロセスPAに障害が発生した場合に障害復旧が困難であるが、本実施の形態では、プロセスPP及びプロセスPQの両方に障害が発生しない限り、プロセス障害を復旧することが。
<発明の実施の形態3>
上述した発明の実施の形態1では、例えば、プロセスPCは、ルートプロセスPAからのヘルスチェック要求データD1を受信したことに応じて子プロセスPG及びPHに対するヘルスチェックを行い、子プロセスに対するヘルスチェックが全て正常である場合に、ルートプロセスPAにヘルスチェックOKを示すヘルスチェック応答データD2を送信するものとして説明した。しかしながら、このように、階層化された各々のプロセスによるヘルスチェックの実行に依存関係をもたせた方式は、本発明の一例に過ぎない。例えば、プロセスPCによる子プロセスPG及びPHの監視をルートプロセスPAから一層独立させてもよい。
例えば、プロセスPCがプロセスPGの障害を検知した場合に、プロセスPCがプロセスPG及びPHを強制的に終了させ、これらを再起動してもよい。また、プロセスPCは、プロセスPAからのヘルスチェック要求データD1に対する応答を、自身のヘルスチェック結果に応じて返答すればよい。
このような実施形態によれば、プロセスPCがプロセスPAへのヘルスチェック応答データD2の送信を行なわないこと、又はヘルスチェックNGを示すヘルスチェック応答データD2を送信することによって生じるプロセスPAによるプロセスPB〜PD並びにPG及びPHの強制終了を待つこと無く、プロセスPCによってプロセスPG及びPHを再起動させることができる。図12に、プロセスPGの障害を検知したプロセスCによるプロセスPG及びPHの再開手順の具体例を示す。
図12のステップS81では、プロセスPCがプロセスPGの障害を検知する。ステップS82では、プロセスPCが、プロセスPG、及びプロセスPGと同じプロセスグループ301に属するプロセスPHを自身のヘルスチェックテーブル32から削除する。ステップS83では、プロセスPCが、プロセスPGの障害を検知したこと、これに応じてプロセスPGが属するプロセスグループ301内のプロセス群PG及びPHを再起動させることを、外部に通知する。
ステップS84及びS85では、プロセスPCが、プロセスグループ301に属するプロセスPG及びPHを強制的に終了させる。ステップS86及びS87では、プロセスPCが、プロセスPG及びPHを再起動する。ステップS88では、プロセスPCが、再起動させた子プロセスPG及びPHのエントリを自身のヘルスチェックテーブル32に追加する。最後に、ステップS89において、プロセスPCは、プロセス障害が復旧したことを外部に通知する。
<その他の実施の形態>
上述した発明の実施の形態1では、プロセス障害の発生に起因して複数のプロセスを再起動する場合に、親プロセスが子プロセスの再起動を担うことによって、プロセス再起動に要する負荷をプロセス間で分散する例を示した。しかしながら、プロセス障害の発生に起因する複数のプロセスの再起動を1つの管理プロセス(例えばプロセスPA)が集中的に行ってもよい。このような実施形態によっても、少なくともヘルスチェックに要する負荷をプロセス間で分散できるため、上述した第1の効果を奏することができる。
また、発明の実施の形態1では、プロセス障害時に、プロセスグループ単位でプロセスを強制的に終了し、これらを再起動するものとして説明した。しかしながら、プロセスグループ単位での再起動を行わずに、障害の発生したプロセスだけに限定して再起動してもよいし、複数のプロセス全体を再起動させてもよい。このような実施形態によっても、ヘルスチェックに要する負荷をプロセス間で分散できるため、上述した第1の効果を奏することができる。
また、プロセス障害発生の外部への通知は必ずしも行わなくてもよい。このような実施形態によっても、上述した第1及び第2の効果を奏することができる。
さらに、本発明は上述した実施の形態のみに限定されるものではなく、既に述べた本発明の要旨を逸脱しない範囲において種々の変更が可能であることは勿論である。
発明の実施の形態1にかかる情報処理装置の構成図である。 発明の実施の形態1にかかる情報処理装置で実行されるプロセスの階層構成を示す図である。 プロセスPA及びプロセスPCの各々によって生成されるヘルスチェックテーブルの一例を示す図である。 プロセス間通信によりプロセス間で送受信されるヘルスチェックに関するデータのデータ構造の具体例を示す図である。 上位プロセスにより実行される下位プロセスのヘルスチェックの手順を示すシーケンス図である。 新たなプロセスの生成が行なわれる場合のヘルスチェック開始手順を示すシーケンス図である。 プロセス終了時のヘルスチェック停止手順を示すシーケンス図である。 ヘルスチェックに関するタイムアウト時間の変更手順を示すシーケンス図である。 プロセス障害発生時のプロセス再開手順を示すシーケンス図である。 プロセス障害発生時のプロセス再開手順を示すシーケンス図である。 発明の実施の形態2にかかる情報処理装置で実行されるプロセスの階層構成を示す図である。 発明の実施の形態3にかかるプロセス障害発生時のプロセス再開手順を示すシーケンス図である。
符号の説明
1 情報処理装置
10 CPU(Central Processing Unit)
11 不揮発性記憶装置
110 ファームウェア
12 主記憶装置
31、32 ヘルスチェックテーブル
201、202、301、401、501 プロセスグループ
PA、PB、PC、PD、PE、PF、PG、PH、PI、PJ、PK プロセス

Claims (15)

  1. マルチプロセス機能を有する情報処理装置におけるプロセス監視方法であって、
    親プロセスによって生成された子プロセスのヘルスチェックを前記親プロセスが実行するステップ(a)と、
    前記子プロセスによって生成された孫プロセスのヘルスチェックを前記子プロセスが実行するステップ(b)と、
    を備えるプロセス監視方法。
  2. 前記ステップ(b)において、前記子プロセスは、監視対象とされた複数の前記孫プロセスのヘルスチェックを行なう、
    請求項1に記載のプロセス監視方法。
  3. 前記ステップ(b)において、前記子プロセスは、前記親プロセスからのヘルスチェック要求を受信したことに応じて、前記孫プロセスに対してヘルスチェック要求を送信するとともに、前記ヘルスチェック要求に応答して前記孫プロセスから正常応答が受信された場合に、前記親プロセスに対して正常応答を送信する、
    請求項1又は2に記載のプロセス監視方法。
  4. 前記ステップ(b)において、前記子プロセスは、前記親プロセスからのヘルスチェック要求を受信したことに応じて、複数の前記孫プロセスに対してヘルスチェック要求を送信する、請求項3に記載のプロセス監視方法。
  5. 前記親プロセスは、前記子プロセスからの前記正常応答が得られない場合に、前記子プロセス及び前記孫プロセスを強制的に終了させる、
    請求項2乃至4のいずれか1項に記載のプロセス監視方法。
  6. 前記親プロセスは、前記子プロセスからの前記正常応答が得られない場合に、前記子プロセスを再生成し、
    再生成された前記子プロセスは、前記孫プロセスを再生成する、
    請求項2乃至4のいずれか1項に記載のプロセス監視方法。
  7. 前記ステップ(a)において、前記親プロセスは、予め定められた第1のタイムアウト時間内に前記子プロセスから前記正常応答が得られるか否かによって、前記子プロセスの障害発生を検知し、
    前記ステップ(b)において、前記子プロセスは、予め定められた第2のタイムアウト時間内に前記孫プロセスから前記正常応答が得られるか否かによって、前記孫プロセスの障害発生を検知し、
    前記ステップ(b)において、前記子プロセスは、前記孫プロセスからの前記第2のタイムアウト時間の変更要求を受信したことに応じて、前記第1のタイムアウト時間の変更の要否を判定するとともに、変更必要と判定した場合に、前記親プロセスに前記第1のタイムアウト時間の変更要求を送信する、
    請求項1乃至6のいずれか1項に記載のプロセス監視方法。
  8. マルチプロセス機能を有する情報処理装置であって、
    ファームウェアを記憶する記憶部と、
    前記ファームウェアに基づいて生成される複数のプロセスを並列的に実行する命令実行部とを備え、
    前記複数のプロセスは、親プロセス、前記親プロセスによって生成される子プロセス、及び前記子プロセスによって生成される孫プロセスを含み、前記親プロセスが前記子プロセスのヘルスチェックを実行し、前記子プロセスが前記孫プロセスのヘルスチェックを実行する、情報処理装置。
  9. 前記子プロセスは、監視対象とされた複数の前記孫プロセスのヘルスチェックを行なう、
    請求項8に記載の情報処理装置。
  10. 前記子プロセスは、前記親プロセスからのヘルスチェック要求を受信したことに応じて、前記孫プロセスに対してヘルスチェック要求を送信するとともに、前記ヘルスチェック要求に応答して前記孫プロセスから正常応答が受信された場合に、前記親プロセスに対して正常応答を送信する、
    請求項8又は9に記載の情報処理装置。
  11. 前記子プロセスは、前記親プロセスからのヘルスチェック要求を受信したことに応じて、複数の前記孫プロセスに対してヘルスチェック要求を送信する、請求項10に記載の情報処理装置。
  12. 前記親プロセスは、前記子プロセスからの前記正常応答が得られない場合に、前記子プロセス及び前記孫プロセスを強制的に終了させる、
    請求項10又は11に記載の情報処理装置。
  13. 前記親プロセスは、前記子プロセスからの前記正常応答が得られない場合に、前記子プロセスを再生成し、
    再生成された前記子プロセスは、前記孫プロセスを再生成する、
    請求項10乃至12のいずれか1項に記載の情報処理装置。
  14. 前記親プロセスは、予め定められた第1のタイムアウト時間内に前記子プロセスから前記正常応答が得られるか否かによって、前記子プロセスの障害発生を検知し、
    前記子プロセスは、予め定められた第2のタイムアウト時間内に前記孫プロセスから前記正常応答が得られるか否かによって、前記孫プロセスの障害発生を検知し、
    前記子プロセスは、前記孫プロセスからの前記第2のタイムアウト時間の変更要求を受信したことに応じて、前記第1のタイムアウト時間の変更の要否を判定するとともに、変更必要と判定した場合に、前記親プロセスに前記第1のタイムアウト時間の変更要求を送信する、
    請求項8乃至13のいずれか1項に記載の情報処理装置。
  15. コンピュータにより並列的に実行される複数のプロセスを含むプログラムであって、
    前記複数のプロセスは、親プロセス、前記親プロセスによって生成される子プロセス、及び前記子プロセスによって生成される孫プロセスを含み、
    前記複数のプロセスは、前記親プロセスが前記子プロセスのヘルスチェックを行い、前記子プロセスが前記孫プロセスのヘルスチェックを行う階層化されたプロセス監視を前記コンピュータに実行させることを特徴とする、プログラム。
JP2008038544A 2008-02-20 2008-02-20 プロセス監視方法、情報処理装置、及びプログラム Expired - Fee Related JP5056464B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008038544A JP5056464B2 (ja) 2008-02-20 2008-02-20 プロセス監視方法、情報処理装置、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008038544A JP5056464B2 (ja) 2008-02-20 2008-02-20 プロセス監視方法、情報処理装置、及びプログラム

Publications (2)

Publication Number Publication Date
JP2009199213A true JP2009199213A (ja) 2009-09-03
JP5056464B2 JP5056464B2 (ja) 2012-10-24

Family

ID=41142662

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008038544A Expired - Fee Related JP5056464B2 (ja) 2008-02-20 2008-02-20 プロセス監視方法、情報処理装置、及びプログラム

Country Status (1)

Country Link
JP (1) JP5056464B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012234336A (ja) * 2011-04-28 2012-11-29 Internatl Business Mach Corp <Ibm> 監視対象プロセスを実行する装置及び方法
WO2017179604A1 (ja) * 2016-04-14 2017-10-19 コニカミノルタ株式会社 見守りシステム
JP2018046516A (ja) * 2016-09-16 2018-03-22 株式会社東芝 通信装置および通信方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07219790A (ja) * 1994-01-31 1995-08-18 Hokkaido Nippon Denki Software Kk マルチプロセス制御方式
JPH0895931A (ja) * 1994-09-26 1996-04-12 Mitsubishi Electric Corp 分散計算機システムの故障検出方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07219790A (ja) * 1994-01-31 1995-08-18 Hokkaido Nippon Denki Software Kk マルチプロセス制御方式
JPH0895931A (ja) * 1994-09-26 1996-04-12 Mitsubishi Electric Corp 分散計算機システムの故障検出方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012234336A (ja) * 2011-04-28 2012-11-29 Internatl Business Mach Corp <Ibm> 監視対象プロセスを実行する装置及び方法
US8914488B2 (en) 2011-04-28 2014-12-16 International Business Machines Corporation Method and system for monitoring a monitoring-target process
US10068015B2 (en) 2011-04-28 2018-09-04 International Business Machines Corporation Monitoring a monitoring-target process
WO2017179604A1 (ja) * 2016-04-14 2017-10-19 コニカミノルタ株式会社 見守りシステム
JPWO2017179604A1 (ja) * 2016-04-14 2019-02-21 コニカミノルタ株式会社 見守りシステム
JP2018046516A (ja) * 2016-09-16 2018-03-22 株式会社東芝 通信装置および通信方法

Also Published As

Publication number Publication date
JP5056464B2 (ja) 2012-10-24

Similar Documents

Publication Publication Date Title
KR101888029B1 (ko) 가상 머신 클러스터 모니터링 방법 및 모니터링 시스템
US9158610B2 (en) Fault tolerance for tasks using stages to manage dependencies
US11140029B1 (en) Server side filtering in hybrid cloud environments
US20170060671A1 (en) Anomaly recovery method for virtual machine in distributed environment
US8112518B2 (en) Redundant systems management frameworks for network environments
CN106980529B (zh) 基板管理控制器资源管理的电脑系统
US20200204620A1 (en) Systems and methods of monitoring software application processes
CN110618864A (zh) 一种中断任务恢复方法及装置
WO2013190694A1 (ja) 計算機の復旧方法、計算機システム及び記憶媒体
JP5425720B2 (ja) 仮想化環境監視装置とその監視方法およびプログラム
JP2009294837A (ja) 障害監視システム及びデバイスと監視装置並びに障害監視方法
JP5056464B2 (ja) プロセス監視方法、情報処理装置、及びプログラム
CN107071189B (zh) 一种通讯设备物理接口的连接方法
CN112737934B (zh) 一种集群式物联网边缘网关装置及方法
JP5329589B2 (ja) トランザクション処理システム及びトランザクション処理システムの動作方法
US20210011749A1 (en) Systems and methods to monitor a computing environment
EP3993353A2 (en) System and method for managing clusters in an edge network
CN114791900A (zh) 基于Operator的Redis运维方法、装置、系统及存储介质
CN115686831A (zh) 基于分布式系统的任务处理方法及装置、设备及介质
CN110673710B (zh) 一种服务器机箱复位方法、装置、设备、介质
JP7405260B2 (ja) サーバメンテナンス制御装置、システム、制御方法及びプログラム
US7634684B2 (en) Intelligent configuration for restarting failed application server instances
WO2014010021A1 (ja) 情報処理装置、情報処理システム、情報処理装置制御方法及び情報処理装置制御プログラム
WO2018173698A1 (ja) 監視システム、コンピュータ可読記憶媒体および監視方法
JP2016151965A (ja) 冗長構成システム及び冗長構成制御方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110107

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111104

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120508

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120618

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120703

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120716

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150810

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees