JP3101353B2 - プロセスの親子関係引き継ぎ処理装置 - Google Patents

プロセスの親子関係引き継ぎ処理装置

Info

Publication number
JP3101353B2
JP3101353B2 JP03200138A JP20013891A JP3101353B2 JP 3101353 B2 JP3101353 B2 JP 3101353B2 JP 03200138 A JP03200138 A JP 03200138A JP 20013891 A JP20013891 A JP 20013891A JP 3101353 B2 JP3101353 B2 JP 3101353B2
Authority
JP
Japan
Prior art keywords
server
child
active server
parent
standby
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP03200138A
Other languages
English (en)
Other versions
JPH0546423A (ja
Inventor
隆久 山本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP03200138A priority Critical patent/JP3101353B2/ja
Publication of JPH0546423A publication Critical patent/JPH0546423A/ja
Application granted granted Critical
Publication of JP3101353B2 publication Critical patent/JP3101353B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Hardware Redundancy (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は,耐故障性コンピュータ
システムにおいて,現用サーバが異常終了した際に,現
用サーバが起動したプロセスの親プロセス識別子を,待
機サーバのプロセス識別子に変更する手段を設けること
により,待機サーバからの終了待ち合わせを可能とした
プロセスの親子関係引き継ぎ処理装置に関する。
【0002】コンピュータシステムの信頼性を向上させ
るのに必要不可欠な要素の一つとして,耐故障性(フォ
ールトトレラント)が挙げられる。そのためのコンピュ
ータシステムが,近年急速に普及してきているが,それ
らを動作させるオペレーティング・システム(OS)の
大半は独自のものであり,そのOSに関して特別な知識
を多く必要とする。
【0003】この対処として,このような耐故障性を有
するコンピュータシステムのOSインタフェースを,現
在,一般的に普及しつつあるUNIX(米国ATT社が
開発したOS)系のオペレーティング・システムに準拠
させることが考慮されているが,既存のインタフェース
に,耐故障性に適した処理を実現できる機能を追加する
必要がある。
【0004】
【従来の技術】図4は従来技術の説明図である。耐故障
性を有するコンピュータシステム30では,各種サービ
スを提供するサーバの無停止および処理の完全化の実現
が重要なポイントとなる。ここで,サーバを二重化する
場合,マルチプロセッサシステムでは,通常,プロセッ
サモジュールの故障に備えて,図4に示すように,耐故
障性のための現用サーバ11および待機サーバ13を,
それぞれ別のプロセッサ31a,31b上に配置する。
【0005】このような耐故障性コンピュータシステム
30において,現用サーバ11が,例えばUNIX系O
S等で周知のforkシステムコールにより,子プロセ
ス12を起動したとする(図4の)。現用サーバ11
は,子プロセス有りを示すプロセス識別子(以下,プロ
セスIDという)等の情報を,不揮発メモリ32に記憶
する(図4の)。
【0006】その後,現用サーバ11は,wait/w
aitpidシステムコールにより,子プロセス12の
終了を待ち合わせる(図4の)。この時点で,現用サ
ーバ11または現用サーバ11が動作しているプロセッ
サ31aに障害が発生した場合(図4の),その処理
を引き継ぐ待機サーバ13が,現用サーバ11の起動し
た子プロセス12を待ち合わせる必要がある。
【0007】ところで,図4に示す子プロセス12にお
ける親プロセスIDは,もともと現用サーバ11のプロ
セスID=Xになっている。しかし,現用サーバ11が
終了すると,子プロセス12の親プロセスIDは,図4
ののように,親がシステムであることを示す“1”に
変更される。
【0008】そのため,待機サーバ13が不揮発メモリ
32を参照して(図4の),現用サーバ11が起動し
た子プロセス12の終了を待ち合わせようとすると(図
4の),親プロセスIDに矛盾が生じるため,wai
t/waitpidシステムコールが,指定されたプロ
セスは子プロセスではないという理由によってエラー復
帰する。
【0009】また,子プロセス12が終了した場合に
は,親プロセスIDが“1”(システム)であるため,
wait待ち状態にならず,直ちに消滅してしまう。な
お,forkシステムコールやwait/waitpi
dシステムコールの処理機能等は周知であるため,ここ
での詳細な説明は省略する。
【0010】
【発明が解決しようとする課題】この対処として,現用
サーバ11と待機サーバ13のプロセスIDを同一に
し,現用サーバ11が終了しても,子プロセス12の親
プロセスIDを“1”にしない方法が考えられるが,こ
のようにした場合,これらのサーバに対するプロセスI
Dによる各種操作(プロセス状態表示やシグナル送信
等)で,現用サーバ11,待機サーバ13のいずれか一
方,または両方を選択することになり,例えばUNIX
系OS等の既存オペレーティング・システムと同一のビ
ューの実現が困難になる。
【0011】本発明は上記問題点の解決を図り,現用サ
ーバが異常終了した場合に,待機サーバから現用サーバ
が起動した子プロセスの待ち合わせを,既存のOSイン
タフェースと同一ビューのもとに可能とすることを目的
としている。
【0012】
【課題を解決するための手段】図1は本発明の原理説明
図である。図1において,10は1または複数のCPU
およびメモリ等からなるデータ処理装置,11は実サー
ビスを提供する現用サーバ,12は子プロセス,13は
現用サーバ11の障害時にその処理を引き継ぐ待機サー
バ,14はオペレーティング・システムの核であるカー
ネル,15はプロセスの終了を認識してその処理を行う
プロセス終了認識処理部,16は子プロセス有無判定
部,17は親プロセス識別子変更処理部を表す。
【0013】データ処理装置10は,現用サーバ11と
待機サーバ13とを備え,現用サーバ11の障害時に,
その処理を待機サーバ13が引き継ぐことにより,耐故
障性を実現するコンピュータシステムである。
【0014】本発明では,特に現用サーバ11に子プロ
セス12があり,現用サーバ11に障害が発生したと
き,待機サーバ13が子プロセス12の終了を待ち合わ
せることができるようにするため,カーネル14に子プ
ロセス有無判定部16と親プロセス識別子変更処理部1
7を設けている。
【0015】子プロセス有無判定部16は,プロセス終
了認識処理部15が,現用サーバ11の障害によってプ
ロセスの終了を認識すると,その現用サーバ11に子プ
ロセス12があるかどうかを判定する処理を行うもので
ある。
【0016】親プロセス識別子変更処理部17は,子プ
ロセス有無判定部16の判定結果により,終了プロセス
に子プロセス12があることがわかった場合,対応する
待機サーバ13のプロセスIDを調べ,その子プロセス
12の親プロセス識別子を,待機サーバ13のプロセス
識別子に変更する処理を行うものである。
【0017】これにより,待機サーバ13は,現用サー
バ11と子プロセス12の親子関係を引き継ぎ,現用サ
ーバ11の起動した子プロセス12の終了待ち合わせを
行う。
【0018】
【作用】現用サーバ11のプロセスIDがX,待機サー
バ13のプロセスIDがYであったとする。例えば,現
用サーバ11が障害になり,プロセス終了認識処理部1
5が現用サーバ11の終了を認識すると,子プロセス有
無判定部16は,現用サーバ11に子プロセス12があ
るかどうかを調べる。
【0019】子プロセス12があることがわかると,親
プロセス識別子変更処理部17により,子プロセス12
の親プロセスID=Xを,待機サーバ13のプロセスI
D=Yに変更する。これにより,子プロセス12の親プ
ロセスは待機サーバ13であると認識されるようにな
り,以後,待機サーバ13は,子プロセス12の終了を
待ち合わせることができるようになる。
【0020】以上のように,現用・待機を別プロセスと
し,現用サーバ11が異常終了した際に,その子プロセ
ス12の親プロセスIDを待機サーバ13に切り替える
ことにより,待機サーバ13から現用サーバ11の起動
した子プロセス12の待ち合わせが可能になる。
【0021】
【実施例】図2は,本発明の一実施例によるプロセス終
了認識処理部の処理フローを示す。以下の説明における
(a) 〜(i) は,図2に示す処理(a) 〜(i) に対応する。
【0022】(a) プロセスの終了を認識すると,以下の
処理を行う。 (b) 〜(c) 終了プロセスに子プロセスがあるかどうかを
調べる。子プロセスがない場合,従来と同様に通常のプ
ロセス終了処理を行う。
【0023】(d) 〜(e) 終了プロセスは耐故障性サーバ
であるかどうか,すなわち待機サーバが存在するかどう
かを判定する。耐故障性サーバでない場合,子プロセス
の親プロセス識別子を“1”(システム)とし,通常の
プロセス終了処理を行う。
【0024】(f) 終了プロセスが耐故障性サーバである
場合,その待機サーバが起動済みであるかどうかを判定
する。起動済みであれば,次の処理(g) をスキップす
る。 (g) 待機サーバが未起動であれば,処理を引き継ぐ待機
サーバを起動する。
【0025】(h) 待機サーバのプロセス識別子を調べ
る。 (i) 子プロセスの親プロセス識別子を,処理(h) で調べ
た待機サーバのプロセス識別子に変更する。
【0026】図3は,本発明の実施例説明図である。本
実施例では,耐故障性コンピュータ30は,複数のプロ
セッサ31a,31bを備えており,現用サーバ11を
プロセッサ31aに配置し,待機サーバ13をプロセッ
サ31bに配置している。
【0027】このような耐故障性コンピュータシステム
30において,現用サーバ11が,UNIX系OS等で
周知のforkシステムコールにより,子プロセス12
を起動したとする(図3の)。現用サーバ11は,子
プロセス有りを示すプロセスID等の情報を,不揮発メ
モリ32に記憶する(図3の)。
【0028】その後,現用サーバ11は,wait/w
aitpidシステムコールにより,子プロセス12の
終了を待ち合わせる(図3の)。この時点で,現用サ
ーバ11に何らかの原因で障害が発生した場合(図3の
),カーネル14aは,現用サーバ11の終了を認識
し,そのプロセスが耐故障性サーバであることを調べ,
現用サーバ11の起動した子プロセス12の親プロセス
IDをXから,待機サーバ13のプロセスIDであるY
に変更する(図3の)。
【0029】その後,待機サーバ13は,現用での処理
の引き継ぎを開始し,不揮発メモリ32内の情報を参照
する(図3の)。そして,不揮発メモリ32から,子
プロセス有りを示す情報を得て,現用サーバ11の起動
した子プロセス12の待ち合わせを,wait/wai
tpidシステムコールを発行することにより実施する
(図3の)。
【0030】ここでは,現用サーバ11から起動された
子プロセス12の親プロセスIDは,待機サーバ13の
プロセスID=Yを示しているため,子プロセス12が
終了した際に,待機サーバ13の要求が完遂する。
【0031】
【発明の効果】以上説明したように,本発明によれば,
UNIX系の耐故障性コンピュータシステム等における
耐故障性サーバの子プロセスの終了待ち合わせ処理を,
どのようなタイミングで障害が発生しても矛盾なく実施
することができるようになる。その結果,コンピュータ
システム全体の信頼性を向上させることが可能になる。
【図面の簡単な説明】
【図1】本発明の原理説明図である。
【図2】本発明の一実施例処理フローを示す図である。
【図3】本発明の実施例説明図である。
【図4】従来技術の説明図である。
【符号の説明】
10 データ処理装置 11 現用サーバ 12 子プロセス 13 待機サーバ 14 カーネル 15 プロセス終了認識処理部 16 子プロセス有無判定部 17 親プロセス識別子変更処理部
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G06F 11/16 - 11/20 G06F 9/46 G06F 15/16 - 15/177

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】 現用サーバ(11)と待機サーバ(13)とを備
    え,現用サーバ(11)の障害時に,待機サーバ(13)に処理
    を引き継ぐことにより,耐故障性を実現するデータ処理
    装置(10)において, 現用サーバ(11)のプロセスが終了した場合に,そのプロ
    セスに子プロセス(12)があるかどうかを判定する処理手
    段(16)と, 終了したプロセスに子プロセス(12)があるとき,その子
    プロセス(12)の親プロセス識別子を,待機サーバ(13)の
    プロセス識別子に変更する処理手段(17)とを備え, 待機サーバ(13)によって現用サーバ(11)の起動した子プ
    ロセス(12)の終了待ち合わせを行うようにしたことを特
    徴とするプロセスの親子関係引き継ぎ処理装置。
JP03200138A 1991-08-09 1991-08-09 プロセスの親子関係引き継ぎ処理装置 Expired - Fee Related JP3101353B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP03200138A JP3101353B2 (ja) 1991-08-09 1991-08-09 プロセスの親子関係引き継ぎ処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP03200138A JP3101353B2 (ja) 1991-08-09 1991-08-09 プロセスの親子関係引き継ぎ処理装置

Publications (2)

Publication Number Publication Date
JPH0546423A JPH0546423A (ja) 1993-02-26
JP3101353B2 true JP3101353B2 (ja) 2000-10-23

Family

ID=16419427

Family Applications (1)

Application Number Title Priority Date Filing Date
JP03200138A Expired - Fee Related JP3101353B2 (ja) 1991-08-09 1991-08-09 プロセスの親子関係引き継ぎ処理装置

Country Status (1)

Country Link
JP (1) JP3101353B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3604171B2 (ja) * 1994-03-31 2004-12-22 富士通株式会社 プロセス自動再起動処理方式
JP5446666B2 (ja) * 2009-09-28 2014-03-19 富士通株式会社 プロセス管理プログラム及びプロセス管理方法

Also Published As

Publication number Publication date
JPH0546423A (ja) 1993-02-26

Similar Documents

Publication Publication Date Title
JP3759410B2 (ja) クラスタ化された計算処理環境において実行する分散ネットワークアプリケーションの管理用リクエストを処理するための方法および装置
EP0319034B1 (en) Method of recovering failure of online control program
US5878205A (en) Method and system for processing complex recovery using polling signals in a shared medium
US6467050B1 (en) Method and apparatus for managing services within a cluster computer system
US20040083225A1 (en) Method and apparatus for handling failures of resource managers in a clustered environment
US7797292B2 (en) Apparatus, system, and method for an alternate lock facility connection path
JPH086840A (ja) サーバ回復のためのディレクトリ操作の完了を判定する機構
US5438675A (en) Initialization system for input/output processing units
JPS6375963A (ja) システム回復方式
JP3101353B2 (ja) プロセスの親子関係引き継ぎ処理装置
US8028189B2 (en) Recoverable machine check handling
JPH11272637A (ja) マルチプロセッサ・システムおよび方法
JP2004334863A (ja) 順番のある(in−order)キューをドレインする(drain)システムおよび方法
JP2999024B2 (ja) 子プロセスの終了待ち合わせ処理装置
JP2507534B2 (ja) 試験検証方式
KR930010289B1 (ko) 이중화 운용 하드웨어의 초기화 중복 방지방법
JP3226491B2 (ja) 二重化したトータリゼータ・システム
KR100243410B1 (ko) 에이치.에이.엔 비트 에이.씨. 에이 시스템용 분산 실시간 디비엠에스의 버전 검증방법
JPH0713792A (ja) ホットスタンバイシステムにおけるエラー制御方式
CN116166437A (zh) 数据库会话进程的处理方法、存储介质与设备
JPS5834858B2 (ja) デ−タ交換制御方式
JP3096760B2 (ja) 共通データ参照設定装置及び参照設定方法
JPH09282291A (ja) 共通記憶装置のロックフラグ解除方式および方法
JP3008646B2 (ja) 障害情報処理方式
JPS59178559A (ja) セミデユアルシステム

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20000808

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080818

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090818

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees