JP2009199213A - プロセス監視方法、情報処理装置、及びプログラム - Google Patents
プロセス監視方法、情報処理装置、及びプログラム Download PDFInfo
- Publication number
- JP2009199213A JP2009199213A JP2008038544A JP2008038544A JP2009199213A JP 2009199213 A JP2009199213 A JP 2009199213A JP 2008038544 A JP2008038544 A JP 2008038544A JP 2008038544 A JP2008038544 A JP 2008038544A JP 2009199213 A JP2009199213 A JP 2009199213A
- Authority
- JP
- Japan
- Prior art keywords
- health check
- child
- processes
- grandchild
- parent
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
【解決手段】マルチプロセス機能を有する情報処理装置1は、階層的に生成されるプロセスPA、PC及びPGを含む複数のプロセスを並列実行する。親プロセスPAは、親プロセスPAによって生成された子プロセスPCのヘルスチェックを実行する。子プロセスPCは、子プロセスPCによって生成された孫プロセスPGのヘルスチェックを実行する。
【選択図】図5
Description
本実施の形態にかかる情報処理装置1の構成を図1に示す。図1において、CPU(Central Processing Unit)10は、不揮発性記憶装置11に保存されたファームウェア110を主記憶装置12に読み出し、ファームウェア110に含まれる命令をデコードし、命令に応じた処理、例えば、算術演算論理演算等の演算処理や、不揮発性記憶装置11及び主記憶装置12に対するアクセスを実行する。また、情報処理装置1は、マルチプロセス機能を有しており、ファームウェア110に含まれる複数のプロセスを並列的に実行可能である。なお、情報処理装置1にマルチプロセス機能を持たせるためには、例えば、CPU10との連携によってマルチプロセス環境をもたらすOS(不図示)を不揮発性記憶装置11に保存しておき、CPU10に当該OSを実行させればよい。
本実施の形態と上述した実施の形態1との相違点は、図2に示したルートプロセスPAの監視を行なうために、プロセスPAの機能を2つのプロセスPP及びPQに分ける点である。
上述した発明の実施の形態1では、例えば、プロセスPCは、ルートプロセスPAからのヘルスチェック要求データD1を受信したことに応じて子プロセスPG及びPHに対するヘルスチェックを行い、子プロセスに対するヘルスチェックが全て正常である場合に、ルートプロセスPAにヘルスチェックOKを示すヘルスチェック応答データD2を送信するものとして説明した。しかしながら、このように、階層化された各々のプロセスによるヘルスチェックの実行に依存関係をもたせた方式は、本発明の一例に過ぎない。例えば、プロセスPCによる子プロセスPG及びPHの監視をルートプロセスPAから一層独立させてもよい。
上述した発明の実施の形態1では、プロセス障害の発生に起因して複数のプロセスを再起動する場合に、親プロセスが子プロセスの再起動を担うことによって、プロセス再起動に要する負荷をプロセス間で分散する例を示した。しかしながら、プロセス障害の発生に起因する複数のプロセスの再起動を1つの管理プロセス(例えばプロセスPA)が集中的に行ってもよい。このような実施形態によっても、少なくともヘルスチェックに要する負荷をプロセス間で分散できるため、上述した第1の効果を奏することができる。
10 CPU(Central Processing Unit)
11 不揮発性記憶装置
110 ファームウェア
12 主記憶装置
31、32 ヘルスチェックテーブル
201、202、301、401、501 プロセスグループ
PA、PB、PC、PD、PE、PF、PG、PH、PI、PJ、PK プロセス
Claims (15)
- マルチプロセス機能を有する情報処理装置におけるプロセス監視方法であって、
親プロセスによって生成された子プロセスのヘルスチェックを前記親プロセスが実行するステップ(a)と、
前記子プロセスによって生成された孫プロセスのヘルスチェックを前記子プロセスが実行するステップ(b)と、
を備えるプロセス監視方法。 - 前記ステップ(b)において、前記子プロセスは、監視対象とされた複数の前記孫プロセスのヘルスチェックを行なう、
請求項1に記載のプロセス監視方法。 - 前記ステップ(b)において、前記子プロセスは、前記親プロセスからのヘルスチェック要求を受信したことに応じて、前記孫プロセスに対してヘルスチェック要求を送信するとともに、前記ヘルスチェック要求に応答して前記孫プロセスから正常応答が受信された場合に、前記親プロセスに対して正常応答を送信する、
請求項1又は2に記載のプロセス監視方法。 - 前記ステップ(b)において、前記子プロセスは、前記親プロセスからのヘルスチェック要求を受信したことに応じて、複数の前記孫プロセスに対してヘルスチェック要求を送信する、請求項3に記載のプロセス監視方法。
- 前記親プロセスは、前記子プロセスからの前記正常応答が得られない場合に、前記子プロセス及び前記孫プロセスを強制的に終了させる、
請求項2乃至4のいずれか1項に記載のプロセス監視方法。 - 前記親プロセスは、前記子プロセスからの前記正常応答が得られない場合に、前記子プロセスを再生成し、
再生成された前記子プロセスは、前記孫プロセスを再生成する、
請求項2乃至4のいずれか1項に記載のプロセス監視方法。 - 前記ステップ(a)において、前記親プロセスは、予め定められた第1のタイムアウト時間内に前記子プロセスから前記正常応答が得られるか否かによって、前記子プロセスの障害発生を検知し、
前記ステップ(b)において、前記子プロセスは、予め定められた第2のタイムアウト時間内に前記孫プロセスから前記正常応答が得られるか否かによって、前記孫プロセスの障害発生を検知し、
前記ステップ(b)において、前記子プロセスは、前記孫プロセスからの前記第2のタイムアウト時間の変更要求を受信したことに応じて、前記第1のタイムアウト時間の変更の要否を判定するとともに、変更必要と判定した場合に、前記親プロセスに前記第1のタイムアウト時間の変更要求を送信する、
請求項1乃至6のいずれか1項に記載のプロセス監視方法。 - マルチプロセス機能を有する情報処理装置であって、
ファームウェアを記憶する記憶部と、
前記ファームウェアに基づいて生成される複数のプロセスを並列的に実行する命令実行部とを備え、
前記複数のプロセスは、親プロセス、前記親プロセスによって生成される子プロセス、及び前記子プロセスによって生成される孫プロセスを含み、前記親プロセスが前記子プロセスのヘルスチェックを実行し、前記子プロセスが前記孫プロセスのヘルスチェックを実行する、情報処理装置。 - 前記子プロセスは、監視対象とされた複数の前記孫プロセスのヘルスチェックを行なう、
請求項8に記載の情報処理装置。 - 前記子プロセスは、前記親プロセスからのヘルスチェック要求を受信したことに応じて、前記孫プロセスに対してヘルスチェック要求を送信するとともに、前記ヘルスチェック要求に応答して前記孫プロセスから正常応答が受信された場合に、前記親プロセスに対して正常応答を送信する、
請求項8又は9に記載の情報処理装置。 - 前記子プロセスは、前記親プロセスからのヘルスチェック要求を受信したことに応じて、複数の前記孫プロセスに対してヘルスチェック要求を送信する、請求項10に記載の情報処理装置。
- 前記親プロセスは、前記子プロセスからの前記正常応答が得られない場合に、前記子プロセス及び前記孫プロセスを強制的に終了させる、
請求項10又は11に記載の情報処理装置。 - 前記親プロセスは、前記子プロセスからの前記正常応答が得られない場合に、前記子プロセスを再生成し、
再生成された前記子プロセスは、前記孫プロセスを再生成する、
請求項10乃至12のいずれか1項に記載の情報処理装置。 - 前記親プロセスは、予め定められた第1のタイムアウト時間内に前記子プロセスから前記正常応答が得られるか否かによって、前記子プロセスの障害発生を検知し、
前記子プロセスは、予め定められた第2のタイムアウト時間内に前記孫プロセスから前記正常応答が得られるか否かによって、前記孫プロセスの障害発生を検知し、
前記子プロセスは、前記孫プロセスからの前記第2のタイムアウト時間の変更要求を受信したことに応じて、前記第1のタイムアウト時間の変更の要否を判定するとともに、変更必要と判定した場合に、前記親プロセスに前記第1のタイムアウト時間の変更要求を送信する、
請求項8乃至13のいずれか1項に記載の情報処理装置。 - コンピュータにより並列的に実行される複数のプロセスを含むプログラムであって、
前記複数のプロセスは、親プロセス、前記親プロセスによって生成される子プロセス、及び前記子プロセスによって生成される孫プロセスを含み、
前記複数のプロセスは、前記親プロセスが前記子プロセスのヘルスチェックを行い、前記子プロセスが前記孫プロセスのヘルスチェックを行う階層化されたプロセス監視を前記コンピュータに実行させることを特徴とする、プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008038544A JP5056464B2 (ja) | 2008-02-20 | 2008-02-20 | プロセス監視方法、情報処理装置、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008038544A JP5056464B2 (ja) | 2008-02-20 | 2008-02-20 | プロセス監視方法、情報処理装置、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009199213A true JP2009199213A (ja) | 2009-09-03 |
JP5056464B2 JP5056464B2 (ja) | 2012-10-24 |
Family
ID=41142662
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008038544A Expired - Fee Related JP5056464B2 (ja) | 2008-02-20 | 2008-02-20 | プロセス監視方法、情報処理装置、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5056464B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012234336A (ja) * | 2011-04-28 | 2012-11-29 | Internatl Business Mach Corp <Ibm> | 監視対象プロセスを実行する装置及び方法 |
WO2017179604A1 (ja) * | 2016-04-14 | 2017-10-19 | コニカミノルタ株式会社 | 見守りシステム |
JP2018046516A (ja) * | 2016-09-16 | 2018-03-22 | 株式会社東芝 | 通信装置および通信方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07219790A (ja) * | 1994-01-31 | 1995-08-18 | Hokkaido Nippon Denki Software Kk | マルチプロセス制御方式 |
JPH0895931A (ja) * | 1994-09-26 | 1996-04-12 | Mitsubishi Electric Corp | 分散計算機システムの故障検出方法 |
-
2008
- 2008-02-20 JP JP2008038544A patent/JP5056464B2/ja not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07219790A (ja) * | 1994-01-31 | 1995-08-18 | Hokkaido Nippon Denki Software Kk | マルチプロセス制御方式 |
JPH0895931A (ja) * | 1994-09-26 | 1996-04-12 | Mitsubishi Electric Corp | 分散計算機システムの故障検出方法 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012234336A (ja) * | 2011-04-28 | 2012-11-29 | Internatl Business Mach Corp <Ibm> | 監視対象プロセスを実行する装置及び方法 |
US8914488B2 (en) | 2011-04-28 | 2014-12-16 | International Business Machines Corporation | Method and system for monitoring a monitoring-target process |
US10068015B2 (en) | 2011-04-28 | 2018-09-04 | International Business Machines Corporation | Monitoring a monitoring-target process |
WO2017179604A1 (ja) * | 2016-04-14 | 2017-10-19 | コニカミノルタ株式会社 | 見守りシステム |
JPWO2017179604A1 (ja) * | 2016-04-14 | 2019-02-21 | コニカミノルタ株式会社 | 見守りシステム |
JP2018046516A (ja) * | 2016-09-16 | 2018-03-22 | 株式会社東芝 | 通信装置および通信方法 |
Also Published As
Publication number | Publication date |
---|---|
JP5056464B2 (ja) | 2012-10-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101888029B1 (ko) | 가상 머신 클러스터 모니터링 방법 및 모니터링 시스템 | |
US9158610B2 (en) | Fault tolerance for tasks using stages to manage dependencies | |
US11140029B1 (en) | Server side filtering in hybrid cloud environments | |
US20170060671A1 (en) | Anomaly recovery method for virtual machine in distributed environment | |
US8112518B2 (en) | Redundant systems management frameworks for network environments | |
CN106980529B (zh) | 基板管理控制器资源管理的电脑系统 | |
US20200204620A1 (en) | Systems and methods of monitoring software application processes | |
CN110618864A (zh) | 一种中断任务恢复方法及装置 | |
WO2013190694A1 (ja) | 計算機の復旧方法、計算機システム及び記憶媒体 | |
JP5425720B2 (ja) | 仮想化環境監視装置とその監視方法およびプログラム | |
JP2009294837A (ja) | 障害監視システム及びデバイスと監視装置並びに障害監視方法 | |
JP5056464B2 (ja) | プロセス監視方法、情報処理装置、及びプログラム | |
CN107071189B (zh) | 一种通讯设备物理接口的连接方法 | |
CN112737934B (zh) | 一种集群式物联网边缘网关装置及方法 | |
JP5329589B2 (ja) | トランザクション処理システム及びトランザクション処理システムの動作方法 | |
US20210011749A1 (en) | Systems and methods to monitor a computing environment | |
EP3993353A2 (en) | System and method for managing clusters in an edge network | |
CN114791900A (zh) | 基于Operator的Redis运维方法、装置、系统及存储介质 | |
CN115686831A (zh) | 基于分布式系统的任务处理方法及装置、设备及介质 | |
CN110673710B (zh) | 一种服务器机箱复位方法、装置、设备、介质 | |
JP7405260B2 (ja) | サーバメンテナンス制御装置、システム、制御方法及びプログラム | |
US7634684B2 (en) | Intelligent configuration for restarting failed application server instances | |
WO2014010021A1 (ja) | 情報処理装置、情報処理システム、情報処理装置制御方法及び情報処理装置制御プログラム | |
WO2018173698A1 (ja) | 監視システム、コンピュータ可読記憶媒体および監視方法 | |
JP2016151965A (ja) | 冗長構成システム及び冗長構成制御方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110107 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20111104 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120508 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120618 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120703 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120716 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150810 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |