JP4383757B2 - アプリケーションプロセス管理方法、分散サーバシステム及びアプリケーションプロセス管理プログラム - Google Patents

アプリケーションプロセス管理方法、分散サーバシステム及びアプリケーションプロセス管理プログラム Download PDF

Info

Publication number
JP4383757B2
JP4383757B2 JP2003054545A JP2003054545A JP4383757B2 JP 4383757 B2 JP4383757 B2 JP 4383757B2 JP 2003054545 A JP2003054545 A JP 2003054545A JP 2003054545 A JP2003054545 A JP 2003054545A JP 4383757 B2 JP4383757 B2 JP 4383757B2
Authority
JP
Japan
Prior art keywords
application process
server
application
group
client
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2003054545A
Other languages
English (en)
Other versions
JP2004265129A (ja
Inventor
伸宏 木村
祥 山田
茂樹 大上
一樹 渡辺
敦 内田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Nippon Telegraph and Telephone Corp
Original Assignee
Fujitsu Ltd
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd, Nippon Telegraph and Telephone Corp filed Critical Fujitsu Ltd
Priority to JP2003054545A priority Critical patent/JP4383757B2/ja
Publication of JP2004265129A publication Critical patent/JP2004265129A/ja
Application granted granted Critical
Publication of JP4383757B2 publication Critical patent/JP4383757B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Multi Processors (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、サーバ上で複数のアプリケーションプロセスが実行され、且つ、アプリケーションプロセス間で複数のアプリケーションプロセスが連携して業務を実行する場合に使用するに好適な、アプリケーションプロセス管理方法、分散サーバシステム及びアプリケーションプロセス管理プログラムに関する。
【0002】
【従来の技術】
従来のプロセス再開方法は、複数のサーバシステムから構成される分散サーバシステム上で動作する複数のアプリケーションプロセスを1つのグループと定義し、更にシステム内で複数のグループを定義することで、グループ内のいずれかのアプリケーションプロセスに故障が発生した場合、ダループ内の全アプリケーションプロセスの再起動による初期化処理のみでアプリケーションプロセス間の不整合を回避し、他のグループのアプリケーションプロセスによるサービス中断なしでシステムを復旧していた。
【0003】
また、あるサーバに故障が生じたとき、そのサーバに搭載されたアプリケーションプロセスが属するグループに属する、該アプリケーションプロセス以外の全アプリケーションプロセスの再起動による初期化処理のみでアプリケーションプロセス間の不整合を回避し、他のグループのアプリケーションプロセスによるサービス中断なしでシステムを復旧していた(例えば、非特許文献1参照。)。
【0004】
グループ内におけるアプリケーションプロセス(以下、APと記す。)が故障した場合の具体例を図1に示す。
AP1は、AP3に対して起動時に接続を行い連携してサービス1を提供し、AP2も、AP3に対して起動時に接続を行い連携してサービス2を提供する。そこで、従来方式では、AP1、AP2、AP3を1つのグループと定義し、グループ内のいずれかのAPが故障した場合、グループ内の全AP(AP1、AP2、AP3)の再開(再起動)を実施してきた。そのため、AP1が故障した場合、グループの全APの再開が実施された。
【0005】
【非特許文献1】
木村 伸宏 外2名、B-14-21「OSSにおけるグループ再開方式の検討」、電子情報通信学会、2002年総合大会講演論文集、通信-2、p.704、2002年3月7日発行
【0006】
【発明が解決しようとする課題】
図1に示した具体例のように、AP1は起動時AP3が起動していれば、AP3に再接続可能である。そのため、AP1のみの再開でサービス1の復旧が可能である。つまり、従来方式ではグループ内のAPの故障時は一律グループ再開を行うため、不要なサービス2(AP2,AP3)の中断が発生する、すなわち、一般化すれば、AP間の接続関係によって、接続する側のAPは、当該APのみ再起動すれば、他のAPと再接続が可能であるにも拘らず、グループ内の全APの再開を実施していたため、グループ内の他のAPによって提供されるサービスの中断が発生するという課題がある。
【0007】
本発明は、前述のプロセス再開方法を利用し、更に再起動対象グループ内においてもサービス中断するAPを限定することで、上述した課題を解決するアプリケーションプロセス管理方法、分散サーバシステム及びアプリケーションプロセス管理プログラムを提供することを目的とする。
【0008】
【課題を解決するための手段】
上記目的を達成するために請求項1に記載の発明は、複数のワークステーション上に分散配置された独自開発および市販のアプリケーションプロセスが連携して1つの機能を提供する分散サーバシステムにおけるアプリケーションプロセス管理方法において、
故障したアプリケーションプロセスを復旧するためにグループ情報定義された連携する個々のアプリケーションプロセスに対して、該アプリケーションプロセスの役割と該アプリケーションプロセスへの接続アプリケーションプロセス数から個々のアプリケーションプロセスのアプリケーションプロセス種別を定義し、該アプリケーションプロセス種別に基づいて、該グループ内での再起動するアプリケーションプロセスを特定することを特徴とする。
【0009】
例えば、APの役割には、以下のような分類が考えられる。
・他のAPへ接続するクライアントAP
・クライアントAPから接続されるサーバAP
・AP間で相互に接続するサーバ・クライアントAP
また上記のようなAPの役割に対して、当該役割に対する接続AP数を考慮すると、以下のようなAP種別を考えることができる。これらは単に組み合わせであり、下記に示すAP種別は一例である。
【0010】
・唯一のサーバAPに接続するクライアントAP
・複数のサーバAPに接続するクライアントAP
・接続するサーバ数に無関係なクライアントAP
・唯一のクライアントから接続されるサーバAP
・複数のクライアントから接続されるサーバAP
・接続されるクライアント数に無関係なサーバAP
・唯一のサーバークライアントAPから接続されるサーバークライアントAP
・複数のサーバークライアントAPから接続されるサーバークライアントAP
・ 接続されるサーバークライアントAP数に無関係なサーバークライアントAP
【0011】
また、それぞれのAPが故障した場合に対応する形で、
・故障APのみを再起動する。
・故障APおよび故障APに接続するクライアントAP全てを再起動する。
・故障APおよび該グループに属する全てのクライアントAPを再起動する。
・該グループに属する全てのクライアントAPを再起動する。
などのように、再起動するAPを特定する方法が考えうる。
【0012】
AP種別の定義にしても、APが故障した場合の再起動するAPを特定する方法にしても、本発明を適用するシステムや構成するグループに応じて最も適切なものをシステム対応に考えればよい。
なお、個々のAPは、あるクライアントAPからはサーバAPと定義できる場合があり、逆にあるサーバAPからはクライアントAPと定義できる場合があるが、これらに関しても、システムや構成するグループに応じて適切なAP種別および再起動するAPを特定する方法を決定すればよい。
【0013】
また、請求項2に記載の発明は、請求項1に記載のアプリケーションプロセス管理方法において、前記アプリケーションプロセス種別は、クライアントアプリケーションプロセス(C−AP)と、複数のクライアントアプリケーションプロセスから接続される共用型サーバアプリケーションプロセス(SS−AP)と、1つのクライアントアプリケーションプロセスから接続される独立型サーバアプリケーションプロセス(IS−AP)と、アプリケーションプロセス間で相互に接続するサーバ・クライアントアプリケーションプロセス(SC−AP)に分類したことを特徴とする。
【0014】
また、請求項3に記載の発明は、請求項2に記載のアプリケーションプロセス管理方法において、故障したアプリケーションプロセスが、前記クライアントアプリケーションプロセス(C−AP)である場合には、当該クライアントアプリケーションプロセスのみを再起動し、
故障したアプリケーションプロセスが、前記共用型サーバアプリケーションプロセス(SS−AP)である場合には、該共用型サーバアプリケーションプロセスが属するグループ内の全アプリケーションプロセスを再起動し、
故障したアプリケーションプロセスが、独立型サーバアプリケーションプロセス(IS−AP)である場合には、該独立型サーバアプリケーションプロセスが属するグループ内の当該独立型サーバアプリケーションプロセス及び該独立型サーバアプリケーションプロセスに接続される全クライアントアプリケーションプロセスを再起動し、
故障したアプリケーションプロセスが、サーバ・クライアントアプリケーションプロセス(SC−AP)である場合には、該サーバ・クライアントアプリケーションプロセスが属するグループ内の全アプリケーションプロセスを再起動することを特徴とする。
【0015】
また、請求項4に記載の発明は、複数のワークステーション上に分散配置された独白開発および市販のアプリケーションプロセスが連携して1つの機能を提供する分散サーバシステムにおいて、故障したアプリケーションプロセスを復旧するためにグループ情報定義された連携する個々のアプリケーションプロセスについて、プロセス名と、グループを特定するグループ番号と、アプリケーションプロセス種別との対応関係を示す管理テーブルを記憶する記憶手段と、いずれかのアプリケーションプロセスが故障した際に、前記記憶手段に記憶されている前記グループ情報およびアプリケーションプロセス種別情報に基づいて、再起動するアプリケーションプロセス群を特定する再起動アプリケーションプロセス特定手段とを有することを特徴とする。
【0016】
また、請求項5に記載の発明は、請求項4に記載の分散サーバシステムにおいて、前記アプリケーションプロセス種別は、クライアントアプリケーションプロセス(C−AP)と、複数のクライアントアプリケーションプロセスから接続される共用型サーバアプリケーションプロセス(SS−AP)と、1つのクライアントアプリケーションプロセスから接続される独立型サーバアプリケーションプロセス(IS−AP)と、アプリケーションプロセス間で相互に接続するサーバ・クライアントアプリケーションプロセス(SC−AP)に分類したことを特徴とする。
【0017】
また、請求項6に記載の発明は、請求項5に記載の分散サーバシステムにおいて、故障したアプリケーションプロセスが、前記クライアントアプリケーションプロセス(C−AP)である場合には、当該クライアントアプリケーションプロセスのみを再起動し、
故障したアプリケーションプロセスが、前記共用型サーバアプリケーションプロセス(SS−AP)である場合には、該共用型サーバアプリケーションプロセスが属するグループ内の全アプリケーションプロセスを再起動し、
故障したアプリケーションプロセスが、独立型サーバアプリケーションプロセス(IS−AP)である場合には、該独立型サーバアプリケーションプロセスが属するグループ内の当該独立型サーバアプリケーションプロセス及び該独立型サーバアプリケーションプロセスに接続される全クライアントアプリケーションプロセスを再起動し、
故障したアプリケーションプロセスが、サーバ・クライアントアプリケーションプロセス(SC−AP)である場合には、該サーバ・クライアントアプリケーションプロセスが属するグループ内の全アプリケーションプロセスを再起動することを特徴とする。
【0018】
また、請求項7に記載の発明は、複数のワークステーション上に分散配置された独自開発および市販のアプリケーションプロセスが連携して1つの機能を提供する分散サーバシステムにおいて実行されるアプリケーションプロセス管理プログラムであって、
アプリケーションプロセスが故障の際、その当該アプリケーションプロセスを復旧するために定義されたグループ情報および前記アプリケーションプロセス種別を定義する第1のステップと、
いずれかのアプリケーションプロセスが故障した際に、前記グループ情報および前記アプリケーションプロセス種別に基づいて、再開するアプリケーションプロセス群を特定する第2のステップとを有することを特徴とする。
【0019】
また、請求項8に記載の発明は、請求項7に記載のアプリケーションプロセス管理プログラムにおいて、前記アプリケーションプロセス種別は、クライアントアプリケーションプロセス(C−AP)と、複数のクライアントアプリケーションプロセスから接続される共用型サーバアプリケーションプロセス(SS−AP)と、1つのクライアントアプリケーションプロセスから接続される独立型サーバアプリケーションプロセス(IS−AP)と、アプリケーションプロセス間で相互に接続するサーバ・クライアントアプリケーションプロセス(SC−AP)に分類したことを特徴とする。
【0020】
また、請求項9に記載の発明は、請求項8に記載のアプリケーションプロセス管理プログラムにおいて、故障したアプリケーションプロセスが、前記クライアントアプリケーションプロセス(C−AP)である場合には、当該クライアントアプリケーションプロセスのみを再起動し、
故障したアプリケーションプロセスが、前記共用型サーバアプリケーションプロセス(SS−AP)である場合には、該共用型サーバアプリケーションプロセスが属するグループ内の全アプリケーションプロセスを再起動し、
故障したアプリケーションプロセスが、独立型サーバアプリケーションプロセス(IS−AP)である場合には、該独立型サーバアプリケーションプロセスが属するグループ内の当該独立型サーバアプリケーションプロセス及び該独立型サーバアプリケーションプロセスに接続される全クライアントアプリケーションプロセスを再起動し、
故障したアプリケーションプロセスが、サーバ・クライアントアプリケーションプロセス(SC−AP)である場合には、該サーバ・クライアントアプリケーションプロセスが属するグループ内の全アプリケーションプロセスを再起動することを特徴とする。
【0021】
【発明の実施の形態】
以下、本発明の実施形態を、図面を参照して詳細に説明する。
図3は、本発明を実施するAP管理システム上の管理構成を示すブロック図である。
図3において、AP管理システムは、サーバSV-1、サーバSV-2、サーバSV-3を具備する。
【0022】
サーバSV-1は、AP-1、AP-2、AP-3および管理プロセスMP-Xを起動する。サーバSV-2は、AP-4、AP-5および管理プロセスMP-Yを起動する。サーバSV-3は、AP-6、AP-7、AP-8、管理プロセスMP-Zを起動する。
AP-1、AP-2、AP-4は、APグループ1を構成する。AP-1およびAP-2は、ともにクライアント側のAPであり、サービスを提供するためサーバ側のAP-4に接続する。
【0023】
AP-3、AP-5およびAP-8は、APグループ2を構成する。AP-5は、クライアント側のAPであり、サービスを提供するためサーバ側のAP-3、AP-8に接続する。
AP-6、AP-7は、APグループ3を構成する。AP-6、AP-7は、サービスを提供するため、AP間で相互接続を行う。
【0024】
なお、APグループとは、起動管理を行うAPにおいて、運用上関係のあるAP群を、1つのグループとして見立てたものである。APグループの適用範囲は、1つのサーバ内に閉じたものではなく、システムを構成する全てのサーバ間で有効である。また、本発明の機能は、自作APに限ったものではなく、市販APについても有効である。
【0025】
次に、これらのAPをAP種別に分類して、それぞれのAP種別における再起動AP特定方法を例えば以下のように決める。なお、ここでのAP種別や再起動AP特定方法は一例であって、これが全てではない。
AP種別としては、次の4通りを考える。(図2参照)
・クライアントAP(以下、C-AP)
・複数C-APから接続される共用型サーバAP(以下、SS-AP)
・1つのC-APから接続される独立型サーバAP(以下、IS-AP)
・ AP間で相互に接続するサーバークライアントAP(以下、SC-AP)
【0026】
次に、故障APのAP種別による、グループ内APの再起動方法であるが、
1)C-APの故障:当該APのみを再起動
2)SS-APの故障:グループ内全AP再起動
3)IS-APの故障:グループ内当該IS-AP及び全C-AP再起動
4)SC-APの故障:グループ内全AP再起動
が適切であるとした。
【0027】
このような分類に従えば、前述のAP群においては、
AP-1、AP-2およびAP-5は、他のAPへ接続するクライアントAP(C-AP)
AP-4は、複数C-APから接続される共用型サーバAP(SS-AP)
AP-3、AP-8は、グループ内にサーバAPが複数存在するが1つのC-APから接続される独立型サーバAP(IS-AP)
AP-6、AP-7は、サーバ・クライアントAP(SC-AP)
となる。
【0028】
さらに本実施形態によるAP管理システムは、図4に示すAP管理ファイルを具備する。
当該AP管理ファイルには、AP管理システムに登録するAPの名前に対して、グループ名と前述のAP種別を定義する。管理APは、構成条件ファイルにしたがって、各APのグルーピングを行う。なお、グループの定数には上限を設けない。
【0029】
管埋対象サーバを管理する管理APは、任意のAPが故障した際に、AP管理ファイルを参照することにより、再開範囲を特定し、AP群の再開の処理を実施する。AP故障の再開範囲特定のステップを図5に示す。図5内の左側のフローは、APの故障が発生したサーバのフローである。
故障したAPは、グループ定義がしてあるか確認し、グループ定義があれば、APの種別を確認する。AP種別がSS-AP、IS-AP、SC-APの場合、サーバ内に同じグループ番号の付いた他のAPがあるか確認するとともに、同時に他サーバ上にある同じグループ番号のAPがあるか確認する必要があるため、他サーバヘグループ番号、および故障APのAP種別を通知する。
【0030】
図5内の右側のフローは、APの故障の通知に伴いグループ番号と故障APのAP種別を受信したサーバのフローである。
グループ定義の有無の確認、AP種別の確認を行い、該当するAPが存在する場合、AP種別に対応した再開を実施する。
次に、サーバ故障の再開範囲特定のステップを図6に示す。基本的な動作はAPに故障が発生した時の故障通知を受信したサーバと同じ動作を行う。
【0031】
AP故障通知の代わりにサーバとの通信が切れた時点で当該サーバの故障と認識し、そこで、故障したサーバ以外は、故障サーバ上で動作する各APのグループ定義があるかを確認し、故障サーバ上で動作していたAPのAP種別の確認を行う。自サーバ上の再開が必要となるAP種別であれば、自サーバ上の該グループ内の該当するAPの再開を実施する。各サーバは、故障したサーバ上のAP数分(グループ定義数分)繰り返す。
【0032】
本実施形態におけるC-AP故障の例を図7に示す。管理プロセスMP-Xは、AP-1が故障検出した(ステップ1)際、上記のAP管理ファイルを参照し、C-APと特定する。
それによりAP-1のみの個別停止(ステップ2)および再起動(ステップ3)を実施する。
【0033】
本実施形態におけるSS-AP故障の例を図8に示す。管理プロセスMP-Xは、AP-2が故障検出した(ステップ1)際、上記のAP管理ファイルを参照し、SS-APと特定する。SS-APの故障の場合、グループ定義された全てのAPが再開対象となるため、サーバ1上のAP-1、AP-2およびサーバ1から通知を受けたサーバ2、サーバ2上のAP-4を停止(ステップ2)および再起動(ステップ3)を実施する。管理プロセスMP−X、MP−Y,MP−Zは本発明の再起動アプリケーションプロセス特定手段に相当する。
【0034】
本実施形態におけるIS-AP故障の例を図9に示す。管理プロセスMP-Xは、AP-3が故障検出した(ステップ1)際、上記のAP管理ファイルを参照し、IS-APと特定する。IS-APの故障の場合、当該IS-APとそれに接続するC-APが再開対象となるため、サーバ1上のAP-3および、サーバ2上のAP-5を停止(ステップ2)および再起動(ステップ3)を実施する。
【0035】
本実施形態におけるSC-AP故障の例を図10に示す。管理プロセスMP-Zは、AP-6が故障検出した(ステップ1)際、上記のAP管理ファイルを参照し、SC-APと特定する。SC-APの故障の場合、グループ定義された全てのAPが再開対象となるため、サーバ3上のAP-6及びAP-7を停止(ステップ2)および再起動(ステップ3)を実施する。
【0036】
【発明の効果】
本発明を用いることにより、自主開発したAPおよび市販のAPを組み合わせて構築したシステムにおいてAPの障害が発生した場合、これまで一律グループ再開であったものに対して、グループ内でAP種別を定義することで、そのAP種別に合わせた再開の定義が可能となり、より局所化した再開が可能となる。
【図面の簡単な説明】
【図1】 従来のアプリケーションプロセスのグループ再開方式を示す説明図。
【図2】 グループ内のサーバ側アプリケーションプロセスとクライアント側アプリケーションプロセスの接続構成を示す説明図。
【図3】 本発明の実施形態に係る分散サーバシステムの構成を示す説明図。
【図4】 サーバ内のメモリに格納されるアプリケーションプロセス名とグループ定義、アプリケーションプロセス(AP)種別との対応関係を示す管理ファイルの内容を示す説明図。
【図5】 アプリケーションプロセス故障時の再開処理の内容を示すフローチャート。
【図6】 分散サーバシステムにおけるサーバ故障時の再開処理の内容を示すフローチャート。
【図7】 アプリケーションプロセス(AP)種別(C-AP)のアプリケーションプロセス故障時の再開処理の手順を示す説明図。
【図8】 アプリケーションプロセス(AP)(SS-AP)のアプリケーションプロセス故障時の再開処理の手順を示す説明図。
【図9】 アプリケーションプロセス(AP)種別(IS-AP)のアプリケーションプロセス故障時の再開処理の手順を示す説明図。
【図10】 アプリケーションプロセス(AP)種別(SC-AP)のアプリケーションプロセス故障時の再開処理の手順を示す説明図。
【符号の説明】
SV−1,SV−2,SV−3…サーバ
C−AP…クライアントアプリケーションプロセス
SS−AP…共用型サーバアプリケーションプロセス
IS−AP…独立型サーバアプリケーションプロセス
SC−AP…サーバ・クライアントアプリケーションプロセス
MP−X,MP−Y,MP−Z…管理プロセス

Claims (9)

  1. 複数のワークステーション上に分散配置された独自開発および市販のアプリケーションプロセスが連携して1つの機能を提供する分散サーバシステムにおけるアプリケーションプロセス管理方法において、
    第1のサーバは、故障したアプリケーションプロセスを復旧するために、起動管理を行うアプリケーションにおいて運用上関係のあるアプリケーション群を識別するためグループ情報定義され連携動作する個々のアプリケーションプロセスに対して、該アプリケーションプロセスの役割と該アプリケーションプロセスへの接続アプリケーションプロセス数から、適用するシステム又は前記グループに応じて個々のアプリケーションプロセスのアプリケーションプロセス種別を定義し、プロセス名と、グループを特定するグループ番号と、アプリケーションプロセス種別との対応関係を示す管理テーブルに基づいて該グループ内での再起動するアプリケーションプロセスを特定し、特定した再起動するアプリケーションプロセスの種別を識別するアプリケーションプロセス種別情報と、当該再起動するアプリケーションプロセスが属するアプリケーションプロセスを識別する前記グループ情報定義されたグループ情報とを他のサーバに通知し、
    前記他のサーバは、前記第1のサーバから受信したアプリケーションプロセス種別情報とグループ情報に基づいて、前記受信したグループ情報に属するアプリケーションプロセスであって、前記受信したアプリケーションプロセス種別に該当するアプリケーションプロセスが起動している場合は、当該アプリケーションプロセス種別に応じたアプリケーションプロセスの再起動を行うことを特徴とするアプリケーションプロセス管理方法。
  2. 前記アプリケーションプロセス種別は、クライアントアプリケーションプロセス(C−AP)と、複数のクライアントアプリケーションプロセスから接続される共用型サーバアプリケーションプロセス(SS−AP)と、1つのクライアントアプリケーションプロセスから接続される独立型サーバアプリケーションプロセス(IS−AP)と、アプリケーションプロセス間で相互に接続するサーバ・クライアントアプリケーションプロセス(SC−AP)に分類したことを特徴とする請求項1に記載のアプリケーションプロセス管理方法。
  3. 故障したアプリケーションプロセスが、前記クライアントアプリケーションプロセス(C−AP)である場合には、当該クライアントアプリケーションプロセスのみを再起動し、
    故障したアプリケーションプロセスが、前記共用型サーバアプリケーションプロセス(SS−AP)である場合には、該共用型サーバアプリケーションプロセスが属するグループ内の全アプリケーションプロセスを再起動し、
    故障したアプリケーションプロセスが、前記独立型サーバアプリケーションプロセス(IS−AP)である場合には、該独立型サーバアプリケーションプロセスが属するグループ内の当該独立型サーバアプリケーションプロセス及び該独立型サーバアプリケーションプロセスに接続される全クライアントアプリケーションプロセスを再起動し、
    故障したアプリケーションプロセスが、サーバ・クライアントアプリケーションプロセス(SC−AP)である場合には、該サーバ・クライアントアプリケーションプロセスが属するグループ内の全アプリケーションプロセスを再起動することを特徴とする請求項2に記載のアプリケーションプロセス管理方法。
  4. 複数のワークステーション上に分散配置された独自開発および市販のアプリケーションプロセスが連携して1つの機能を提供する分散サーバシステムにおいて、
    第1のサーバは、故障したアプリケーションプロセスを復旧するために、起動管理を行うアプリケーションにおいて運用上関係のあるアプリケーション群を識別するためグループ情報定義され連携動作する個々のアプリケーションプロセスについて、プロセス名と、グループを特定するグループ番号と、適用するシステム又は前記グループに応じて定義されたアプリケーションプロセス種別との対応関係を示す管理テーブルを記憶する記憶手段と、いずれかのアプリケーションプロセスが故障した際に、前記記憶手段に記憶されている前記グループ情報およびアプリケーションプロセス種別情報に基づいて、再起動するアプリケーションプロセス群を特定する再起動アプリケーションプロセス特定手段と、前記再起動アプリケーションプロセス特定手段が特定した前記グループ情報および再起動アプリケーションプロセス特定手段種別について他のサーバに通知する手段と、
    他のサーバは、前記第1のサーバから送信されたアプリケーションプロセス種別情報とグループ情報と受信し、受信したアプリケーションプロセス種別情報とグループ情報に基づいて、前記受信したグループ情報に属するアプリケーションプロセスであって、前記受信したアプリケーションプロセス種別に該当するアプリケーションプロセスが起動している場合は、当該アプリケーションプロセス種別に該当するアプリケーションプロセスが起動している場合は、当該アプリケーションプロセス種別に応じたアプリケーションプロセスの再起動を行う手段と、を有することを特徴とする分散サーバシステム。
  5. 前記アプリケーションプロセス種別は、クライアントアプリケーションプロセス(C−AP)と、複数のクライアントアプリケーションプロセスから接続される共用型サーバアプリケーションプロセス(SS−AP)と、1つのクライアントアプリケーションプロセスから接続される独立型サーバアプリケーションプロセス(IS−AP)と、アプリケーションプロセス間で相互に接続するサーバ・クライアントアプリケーションプロセス(SC−AP)に分類したことを特徴とする請求項4に記載の分散サーバシステム。
  6. 故障したアプリケーションプロセスが、前記クライアントアプリケーションプロセス(C−AP)である場合には、当該クライアントアプリケーションプロセスのみを再起動し、
    故障したアプリケーションプロセスが、前記共用型サーバアプリケーションプロセス(SS−AP)である場合には、該共用型サーバアプリケーションプロセスが属するグループ内の全アプリケーションプロセスを再起動し、
    故障したアプリケーションプロセスが、前記独立型サーバアプリケーションプロセス(IS−AP)である場合には、該独立型サーバアプリケーションプロセスが属するグループ内の当該独立型サーバアプリケーションプロセス及び該独立型サーバアプリケーションプロセスに接続される全クライアントアプリケーションプロセスを再起動し、
    故障したアプリケーションプロセスが、サーバ・クライアントアプリケーションプロセス(SC−AP)である場合には、該サーバ・クライアントアプリケーションプロセスが属するグループ内の全アプリケーションプロセスを再起動することを特徴とする請求項5に記載の分散サーバシステム。
  7. 複数のワークステーション上に分散配置された独自開発および市販のアプリケーションプロセスが連携して1つの機能を提供する分散サーバシステムにおいて実行されるアプリケーションプロセス管理プログラムであって、
    アプリケーションプロセスが故障の際、その当該アプリケーションプロセスを復旧するために、起動管理を行うアプリケーションにおいて運用上関係のあるアプリケーション群を識別するため定義されたグループ情報および適用するシステム又は前記グループに応じて定義されたアプリケーションプロセス種別を定義するための第1のステップと、
    いずれかのアプリケーションプロセスが故障した際に、プロセス名と、グループを特定するグループ番号と、アプリケーションプロセス種別との対応関係を示す管理テーブルに基づいて、再開するアプリケーションプロセス群を特定する第2のステップと、
    特定した再起動するアプリケーションプロセスの種別を識別するアプリケーションプロセス種別情報と、当該再起動するアプリケーションプロセスが属するアプリケーションプロセスを識別する前記グループ情報定義されたグループ情報とを他のサーバに通知する第3のステップと、
    他のサーバからアプリケーションプロセス種別情報とグループ情報とを受信した場合に、当該受信したアプリケーションプロセス種別情報とグループ情報とに基づいて、前記受信したグループ情報に属するアプリケーションプロセスであって、前記受信したアプリケーションプロセス種別に該当するアプリケーションプロセスが起動している場合は、当該アプリケーションプロセス種別に応じたアプリケーションプロセスの再起動を行う第4のステップ
    をコンピュータに実行させるためのアプリケーションプロセス管理プログラム。
  8. 前記アプリケーションプロセス種別は、クライアントアプリケーションプロセス(C−AP)と、複数のクライアントアプリケーションプロセスから接続される共用型サーバアプリケーションプロセス(SS−AP)と、1つのクライアントアプリケーションプロセスから接続される独立型サーバアプリケーションプロセス(IS−AP)と、アプリケーションプロセス間で相互に接続するサーバ・クライアントアプリケーションプロセス(SC−AP)に分類したことを特徴とする請求項7に記載のアプリケーションプロセス管理プログラム。
  9. 故障したアプリケーションプロセスが、前記クライアントアプリケーションプロセス(C−AP)である場合には、当該クライアントアプリケーションプロセスのみを再起動し、
    故障したアプリケーションプロセスが、前記共用型サーバアプリケーションプロセス(SS−AP)である場合には、該共用型サーバアプリケーションプロセスが属するグループ内の全アプリケーションプロセスを再起動し、
    故障したアプリケーションプロセスが、前記独立型サーバアプリケーションプロセス(IS−AP)である場合には、該独立型サーバアプリケーションプロセスが属するグループ内の当該独立型サーバアプリケーションプロセス及び該独立型サーバアプリケーションプロセスに接続される全クライアントアプリケーションプロセスを再起動し、
    故障したアプリケーションプロセスが、サーバ・クライアントアプリケーションプロセス(SC−AP)である場合には、該サーバ・クライアントアプリケーションプロセスが属するグループ内の全アプリケーションプロセスを再起動することを特徴とする請求項8に記載のアプリケーションプロセス管理プログラム。
JP2003054545A 2003-02-28 2003-02-28 アプリケーションプロセス管理方法、分散サーバシステム及びアプリケーションプロセス管理プログラム Expired - Lifetime JP4383757B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003054545A JP4383757B2 (ja) 2003-02-28 2003-02-28 アプリケーションプロセス管理方法、分散サーバシステム及びアプリケーションプロセス管理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003054545A JP4383757B2 (ja) 2003-02-28 2003-02-28 アプリケーションプロセス管理方法、分散サーバシステム及びアプリケーションプロセス管理プログラム

Publications (2)

Publication Number Publication Date
JP2004265129A JP2004265129A (ja) 2004-09-24
JP4383757B2 true JP4383757B2 (ja) 2009-12-16

Family

ID=33118859

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003054545A Expired - Lifetime JP4383757B2 (ja) 2003-02-28 2003-02-28 アプリケーションプロセス管理方法、分散サーバシステム及びアプリケーションプロセス管理プログラム

Country Status (1)

Country Link
JP (1) JP4383757B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007058679A (ja) * 2005-08-25 2007-03-08 Oki Electric Ind Co Ltd プロセス管理システム、プロセス管理方法及び冗長システム
JP5240192B2 (ja) * 2007-06-04 2013-07-17 富士通株式会社 支援プログラムおよび支援装置
JP7189104B2 (ja) * 2019-05-28 2022-12-13 株式会社日立製作所 情報処理システム、及び情報処理システムの制御方法

Also Published As

Publication number Publication date
JP2004265129A (ja) 2004-09-24

Similar Documents

Publication Publication Date Title
US9325757B2 (en) Methods and systems for fault-tolerant distributed stream processing
US7689862B1 (en) Application failover in a cluster environment
US6687849B1 (en) Method and apparatus for implementing fault-tolerant processing without duplicating working process
CN109151045B (zh) 一种分布式云系统及监控方法
CN106060088B (zh) 一种服务管理方法及装置
US20020133727A1 (en) Automated node restart in clustered computer system
US6629260B1 (en) Automatic reconnection of partner software processes in a fault-tolerant computer system
JP5948933B2 (ja) ジョブ継続管理装置、ジョブ継続管理方法、及び、ジョブ継続管理プログラム
EP3291487B1 (en) Method for processing virtual machine cluster and computer system
JP2008210412A (ja) マルチノード分散データ処理システムにおいてリモート・アクセス可能なリソースを管理する方法
US10331472B2 (en) Virtual machine service availability
CN109361542B (zh) 客户端的故障处理方法、装置、系统、终端和服务器
JP4491482B2 (ja) 障害回復方法、計算機、クラスタシステム、管理計算機及び障害回復プログラム
WO2017028375A1 (zh) 一种版本升级方法及系统
CN105812169A (zh) 一种主备机切换方法及装置
CN106572137A (zh) 一种分布式服务资源管理方法和装置
CN113206877A (zh) 一种会话保持方法及装置
CN110569124A (zh) 一种任务分配方法和装置
WO2017071384A1 (zh) 报文处理的方法及装置
US11544162B2 (en) Computer cluster using expiring recovery rules
CN114554593A (zh) 数据处理方法及装置
JP4383757B2 (ja) アプリケーションプロセス管理方法、分散サーバシステム及びアプリケーションプロセス管理プログラム
JP5285045B2 (ja) 仮想環境における故障復旧方法及びサーバ及びプログラム
WO2019178839A1 (zh) 为分布式应用创建一致性快照的方法、装置和分布式系统
US9015518B1 (en) Method for hierarchical cluster voting in a cluster spreading more than one site

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040622

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060727

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060801

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061002

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070109

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070308

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20070214

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20070316

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20070907

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20090804

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20090804

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20090909

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20090914

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090924

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121002

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4383757

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131002

Year of fee payment: 4

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313117

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term