JP2002373085A - 多重化コンピュータシステム - Google Patents

多重化コンピュータシステム

Info

Publication number
JP2002373085A
JP2002373085A JP2001178572A JP2001178572A JP2002373085A JP 2002373085 A JP2002373085 A JP 2002373085A JP 2001178572 A JP2001178572 A JP 2001178572A JP 2001178572 A JP2001178572 A JP 2001178572A JP 2002373085 A JP2002373085 A JP 2002373085A
Authority
JP
Japan
Prior art keywords
computer
resource
restart
application program
slave
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001178572A
Other languages
English (en)
Inventor
Masao Ijiri
昌男 井尻
Taketomo Yamane
丈知 山根
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2001178572A priority Critical patent/JP2002373085A/ja
Publication of JP2002373085A publication Critical patent/JP2002373085A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 主系コンピュータに異常が実際に生じるま
で、主系従系の切り替えが起こらないので、障害発生時
には系切り替えのオーバーヘッドが発生するという課題
があった。 【解決手段】 ネットワーク8を介して相互接続された
コンピュータ1A、1Bを備え、各コンピュータは、ア
プリケーションプログラム、コンピュータ内のリソース
の消費量を監視するリソース監視手段、コンピュータを
再起動するための再起動手段、再起動条件を保持するリ
ソース限界定義領域、及びオペレーティングシステムを
有し、コンピュータ1Aが主系として動作している場
合、コンピュータ1Aは、リソース消費量がリソース限
界定義領域により予め保持された再起動条件を満たして
いるときには、従系のコンピュータ1Bへ処理の引継
ぎ、再起動手段により、コンピュータ1Aを再起動す
る。 【効果】 主系コンピュータと従系コンピュータで同時
にダウンする可能性が減る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、多重化コンピュ
ータシステムにおける障害検出、及びコンピュータ切り
替えに関するものである。
【0002】
【従来の技術】従来の多重化コンピュータシステムにつ
いて図面を参照しながら説明する。図11は、例えば特
開平10−021202号公報に示された従来の多重化
コンピュータシステムの構成を示す図である。
【0003】図11において、9A、9Bは主系、従系
となるコンピュータ(CPU)、9Cは共有の磁気ディ
スク装置である。また、7は他のコンピュータ、8はネ
ットワークである。なお、コンピュータ9A、9B間
は、相互監視用の信号線と、リモートリセット用の信号
線で接続されている。
【0004】つぎに、従来の多重化コンピュータシステ
ムの動作について図面を参照しながら説明する。
【0005】図12は、従来の多重化コンピュータシス
テムの動作を示すフローチャートである。
【0006】最初の起動時には、コンピュータ9Aが主
系となるように初期設定されている。主系と従系の切り
替えを、図12のフローチャートによって説明する。双
方のコンピュータ9A、9Bでは、同じフローチャート
にもとづいて、系の切り替えを行っている。
【0007】まず、相手が主系として動作しているか否
かを、相互監視用信号線の状態から確認する(ステップ
901)。
【0008】この確認で相手コンピュータが主系でなけ
れば、自ら主系となり(ステップ902)、ネットワー
ク8の初期設定をして(ステップ903)、アプリケー
ションの起動をする(ステップ904)。その後、相互
監視用信号線の状態を一定周期で変化させる(ステップ
905)。この信号により、主系コンピュータが正常動
作していることを従系コンピュータに通知しつづける。
【0009】判定ステップ901において、相手コンピ
ュータが主系である場合、自ら従系コンピュータとなり
(ステップ906)、相互監視用の信号線に一定時間で
の状態変化があるか否かで主系コンピュータの監視を続
け(ステップ907)、信号線に一定時間での状態変化
がなけれぼ、相手コンピュータに異常発生と判定し(ス
テップ908)、この異常発生の判定時にはリモートリ
セット信号線にリセット信号を送り、相手コンピュータ
をリモートリセットする(ステップ909)。
【0010】このリモートリセットにより、相手コンピ
ュータのネットワーク接続が無効になり、自らが主系コ
ンピュータとなり(ステップ902)、ネットワーク初
期設定(ステップ903)以下の処理を行なう。
【0011】
【発明が解決しようとする課題】上述したような従来の
多重化コンピュータシステムでは、以上のように構成さ
れているので、主系コンピュータと従系コンピュータ
で、同一のソフトウェア(OS、ミドルウェア、アプリ
ケーション)を使用して、定期的に同期をとっている場
合、共通に使われているソフトウェアに不具合(バグ)
があって、たとえば、1トランザクションごとに少量の
メモリを不正に消費する(メモリリーク)のようなと
き、主系コンピュータでのメモリの異常消費と同じぺ一
スで、従系コンピュータでも同期のたびにメモリの不正
消費がおこり、主系コンピュータでメモリ不足が起こっ
たときは、従系コンピュータもメモリ不足をおこしてコ
ンピュータシステム全体がダウンしてしまう。
【0012】このような共通コンポーネントの不具合に
よる障害は、ソースコードを持たずに利用しているOS
や、市販のアプリケーションプログラムを使用している
場合、深刻で、多重系を構成して可用性(システムの利
用可能時間)を向上させようとする際に、障害となって
いた。
【0013】このような障害は、メモリリークに限ら
ず、ファイル記述子の不足などの、他のコンピュータシ
ステム資源(リソース)不足で起こりうる。さらに、リ
ソース不足そのものが障害であるだけでなく、リソース
の欠乏は、条件のコーナーケースであるため、コンピュ
ータシステムの他の不具合が顕在化しやすく、高可用性
コンピュータシステムを構築する際の妨げとなってい
た。
【0014】また、主系のコンピュータに異常が実際に
生じるまで、主系従系の切り替えが起こらないので、障
害発生時には、系切り替えのオーバーヘッドが発生し、
さらに障害がすでに起こっているため、系切り替えに必
要な情報の一部が失われてしまう場合があるという問題
点があった。
【0015】この発明は、前述した問題点を解決するた
めになされたもので、多重化コンピュータシステムにお
いて、系切り替えシステムのオーバーヘッドを小さくし
ながら、適宜、系切り替えを行い、システム全体がダウ
ンしてしまうことを防ぐことができる多重化コンピュー
タシステムを得ることを目的とする。
【0016】
【課題を解決するための手段】この発明に係る多重化コ
ンピュータシステムは、ネットワークを介して相互に接
続された第1及び第2のコンピュータを備え、前記第1
のコンピュータは、業務処理を行なう第1のアプリケー
ションプログラムと、前記第1のコンピュータ内のリソ
ースの消費量を監視する第1のリソース監視手段と、前
記第1のコンピュータを再起動するための第1の再起動
手段と、再起動条件を保持する第1のリソース限界定義
領域と、第1のオペレーティングシステムとを有し、前
記第2のコンピュータは、業務処理を行なう第2のアプ
リケーションプログラムと、前記第2のコンピュータ内
のリソースの消費量を監視する第2のリソース監視手段
と、前記第2のコンピュータを再起動するための第2の
再起動手段と、再起動条件を保持する第2のリソース限
界定義領域と、第2のオペレーティングシステムとを有
し、前記第1のコンピュータが、主系として動作し、前
記第2のコンピュータが、従系として動作している場
合、前記第1のコンピュータは、前記第1のリソース監
視手段によりリソースの消費量を監視し、リソース消費
量が、前記第1のリソース限界定義領域により予め保持
された再起動条件を満たしているときには、従系として
動作している前記第2のコンピュータへ処理の引継ぎを
行うと共に、前記第1の再起動手段により、主系として
動作している前記第1のコンピュータを再起動し、その
後、前記再起動された前記第1のコンピュータが、従系
として動作し、前記第2のコンピュータが、主系として
動作するものである。
【0017】この発明に係る多重化コンピュータシステ
ムは、ネットワークを介して相互に接続された第1及び
第2のコンピュータを備え、前記第1のコンピュータ
は、業務処理を行なう第1のアプリケーションプログラ
ムと、前記第1のコンピュータ内のリソースの消費量を
監視する第1のリソース監視手段と、前記第1のコンピ
ュータを再起動するための第1の再起動手段と、再起動
条件を保持する第1のリソース限界定義領域と、第1の
オペレーティングシステムとを有し、前記第2のコンピ
ュータは、業務処理を行なう第2のアプリケーションプ
ログラムと、前記第2のコンピュータ内のリソースの消
費量を監視する第2のリソース監視手段と、前記第2の
コンピュータを再起動するための第2の再起動手段と、
再起動条件を保持する第2のリソース限界定義領域と、
第2のオペレーティングシステムとを有し、前記第1の
コンピュータが、主系として動作し、前記第2のコンピ
ュータが、従系として動作している場合、前記第1のコ
ンピュータは、前記第1のリソース監視手段によりリソ
ースの消費量を監視し、リソース消費量が、前記第1の
リソース限界定義領域により予め保持された再起動条件
を満たしているときには、前記第2の再起動手段へ再起
動条件を満たしている旨の通知を行い、前記第2の再起
動手段により、従系として動作している前記第2のコン
ピュータを再起動するものである。
【0018】この発明に係る多重化コンピュータシステ
ムは、ネットワークを介して相互に接続された第1及び
第2のコンピュータを備え、前記第1のコンピュータ
は、業務処理を行なう第1のアプリケーションプログラ
ムと、前記第1のアプリケーションプログラムのリソー
スの消費量を監視する第1のリソース監視手段と、前記
第1のアプリケーションプログラムを再起動するための
第1の再起動手段と、再起動条件を保持する第1のリソ
ース限界定義領域と、第1のオペレーティングシステム
とを有し、前記第2のコンピュータは、業務処理を行な
う第2のアプリケーションプログラムと、前記第2のア
プリケーションプログラムのリソースの消費量を監視す
る第2のリソース監視手段と、前記第2のアプリケーシ
ョンプログラムを再起動するための第2の再起動手段
と、再起動条件を保持する第2のリソース限界定義領域
と、第2のオペレーティングシステムとを有し、前記第
1のアプリケーションプログラムが、主系として動作
し、前記第2のアプリケーションプログラムが、従系と
して動作している場合、前記第1のコンピュータは、前
記第1のリソース監視手段によりリソースの消費量を監
視し、リソース消費量が、前記第1のリソース限界定義
領域により予め保持された再起動条件を満たしていると
きには、従系として動作している前記第2のアプリケー
ションプログラムへ処理の引継ぎを行うと共に、前記第
1の再起動手段により、主系として動作している前記第
1のアプリケーションプログラムを再起動し、その後、
前記再起動された前記第1のアプリケーションプログラ
ムが、従系として動作し、前記第2のアプリケーション
プログラムが、主系として動作するものである。
【0019】また、この発明に係る多重化コンピュータ
システムは、ネットワークを介して相互に接続された第
1及び第2のコンピュータを備え、前記第1のコンピュ
ータは、業務処理を行なう第1のアプリケーションプロ
グラムと、前記第1のアプリケーションプログラムのリ
ソースの消費量を監視する第1のリソース監視手段と、
前記第1のアプリケーションプログラムを再起動するた
めの第1の再起動手段と、再起動条件を保持する第1の
リソース限界定義領域と、第1のオペレーティングシス
テムとを有し、前記第2のコンピュータは、業務処理を
行なう第2のアプリケーションプログラムと、前記第2
のアプリケーションプログラムのリソースの消費量を監
視する第2のリソース監視手段と、前記第2のアプリケ
ーションプログラムを再起動するための第2の再起動手
段と、再起動条件を保持する第2のリソース限界定義領
域と、第2のオペレーティングシステムとを有し、前記
第1のアプリケーションプログラムが、主系として動作
し、前記第2のアプリケーションプログラムが、従系と
して動作している場合、前記第1のコンピュータは、前
記第1のリソース監視手段によりリソースの消費量を監
視し、リソース消費量が、前記第1のリソース限界定義
領域により予め保持された再起動条件を満たしていると
きには、前記第2の再起動手段へ再起動条件を満たして
いる旨の通知を行い、前記第2の再起動手段により、従
系として動作している前記第2のアプリケーションプロ
グラムを再起動するものである。
【0020】また、この発明に係る多重化コンピュータ
システムは、前記第1のコンピュータが、この第1のコ
ンピュータの最初の起動からの時間を計時する第1の遅
延タイマをさらに有し、前記第2のコンピュータが、こ
の第2のコンピュータの最初の起動からの時間を計時す
る第2の遅延タイマをさらに有し、前記第1のコンピュ
ータは、前記第1の遅延タイマにより計時した時間が所
定時間を超えているときには、従系として動作している
前記第2のコンピュータへ処理の引継ぎを行うと共に、
前記第1の再起動手段により、主系として動作している
前記第1のコンピュータを再起動するものである。
【0021】また、この発明に係る多重化コンピュータ
システムは、前記第1のコンピュータが、この第1のコ
ンピュータの最初の起動からの時間を計時する第1の遅
延タイマをさらに有し、前記第2のコンピュータが、こ
の第2のコンピュータの最初の起動からの時間を計時す
る第2の遅延タイマをさらに有し、前記第1のコンピュ
ータは、前記第1の遅延タイマにより計時した時間が所
定時間を超えているときには、前記第2の再起動手段へ
再起動条件を満たしている旨の通知を行い、前記第2の
再起動手段により、従系として動作している前記第2の
コンピュータを再起動するものである。
【0022】この発明に係る多重化コンピュータシステ
ムは、1台のコンピュータを備え、前記コンピュータ
は、業務処理を行なうアプリケーションプログラムと、
前記コンピュータ内のリソースの消費量を監視するリソ
ース監視手段と、前記コンピュータを再起動するための
再起動手段と、再起動条件を保持するリソース限界定義
領域と、オペレーティングシステムと、再起動する必要
があるかどうかを示す再起動フラグと、再起動可能かど
うかを判定する再起動可能判定手段とを有し、前記コン
ピュータは、前記リソース監視手段によりリソースの消
費量を監視し、リソース消費量が、前記リソース限界定
義領域により予め保持された再起動条件を満たしている
ときには、前記再起動フラグをONし、処理中におい
て、前記再起動可能判定手段により再起動可能であると
判断され、かつ前記再起動フラグがONの場合には、前
記再起動手段により前記コンピュータを再起動するもの
である。
【0023】
【発明の実施の形態】実施の形態1.この発明の実施の
形態1に係る多重化コンピュータシステムについて図面
を参照しながら説明する。図1は、この発明の実施の形
態1に係る多重化コンピュータシステムの構成を示す図
である。なお、各図中、同一符号は同一又は相当部分を
示す。
【0024】図1において、1A、1Bはコンピュー
タ、11A、11Bは業務処理を行なうアプリケーショ
ンプログラム(APP)、12A、12Bはコンピュー
タ1A、1B内のリソースの使用量を監視するリソース
監視手段(RM)、13A、13Bはコンピュータ1
A、1Bを再起動するための再起動手段(RB)、14
A、14Bは再起動のトリガーとなる条件を保持してお
くためのリソース限界定義領域(COND)、15A、
15Bはオペレーティングシステム(OS)である。な
お、8はコンピュータ1A、1B間の通信や、このコン
ピュータシステムと、クライアントコンピュータの間の
通信に用いるネットワークである。
【0025】つぎに、この実施の形態1に係る多重化コ
ンピュータシステムの動作について図面を参照しながら
説明する。
【0026】図2は、この発明の実施の形態1に係る多
重化コンピュータシステムの動作を示すフローチャート
である。
【0027】コンピュータ1A、1Bが起動されること
により、処理を開始する主系として起動されたコンピュ
ータ1Aは、ステップ101において、トランザクショ
ン処理として、アプリケーション本来の処理を行なう。
この処理には、クライアントコンピュータとの通信や、
従系コンピュータ1Bとのデータ等価作業等を含めてか
まわない。
【0028】次に、ステップ102において、メモリ不
足等のアプリケーション実行を継続できない異常が発生
していないか確認する。
【0029】異常が発生していない場合は、リソース監
視手段12Aは、リソース(メモリ、ディスク、その
他)の消費量を測定する(ステップ103)。
【0030】次に、リソース消費量が、あらかじめリソ
ース限界定義領域14Aに設定された再起動条件を満た
している(たとえば、メモリ消費量が全メモリの9割を
超えた)かどうか判断する(ステップ104)。
【0031】再起動条件を満たしていた揚合、従系へ処
理の引継ぎを行なった後(ステップ105)、再起動手
段13Aによって、主系コンピュータ1Aを再起動する
(ステップ106)。
【0032】再起動されたコンピュータ1Aは、従系コ
ンピュータとして起動し、コンピュータ1Bが、主系コ
ンピュータに切り替わる。コンピュータ1Aは、再起動
によってプログラムが最初から実行され、メモリリーク
が解消されたり、不要な一時ファイルが削除されたりす
るので、リソース限界ではなくなる。主系では、ステッ
プ101に戻って、処理を継続する。
【0033】ステップ104において、再起動条件を満
たしていない場合は、ステップ101に戻って、処理を
継続する。
【0034】ステップ102において、異常が発生して
いる場合は、ステップ105に進む。
【0035】以上のようにすることにより、未然に主系
と従系を切り替え、リソース不足や、蓄積する不具合に
よって主系と従系で同時に実行停止を起こす可能性が減
り、従来より可用性の高いコンピュータシステムを構成
することができる。また、リソースに余裕のあるうち
に、主系から従系への切り替えを行なうので、切り替え
時のデータ抜け等を防ぐことができる。さらに、リソー
スの消費量をみて再起動するかどうか判断しているの
で、不必要な主系と従系の切り替えを防ぐことができ
る。
【0036】また、リソース不足をおこしたり、蓄積す
る不具合によってシステムが停止する前に主系、従系を
切り替えるので、従来、そのような問題があって使用で
きなかった安価なS/Wコンポーネントを高可用性シス
テムに適用することができるようになる。
【0037】なお、上記説明では、再起動手段13A、
13Bが、コンピュータ1A、1B全体を再起動してい
たが、リソースの種類によっては、アプリケーションの
みを再起動することで問題点を解消する形態も可能であ
る。そのときは、より再起動のオーバヘッドが小さくな
る効果もある。
【0038】すなわち、この実施の形態1では、コンピ
ュータ1A、1Bに、リソース監視機能(メモリ消費量
監視等)を設け、リソース(メモリ等)の使用可能量
が、あらかじめ定められた条件を満たした(制限値を越
えた等)ときに、主系であるコンピュータ1Aの処理を
従系であるコンピュータ1Bに切り替える。コンピュー
タ1Bは、主系のコンピュータになる。コンピュータ1
Aは再起動し、従系のコンピュータとして動作する。再
起動されたコンピュータ1Aは、プログラムを最初から
実行するので、リソースもれ等は、解消される。その
後、主系であるコンピュータ1Bでリソース不足や蓄積
する不具合によってアプリケーションが実行継続できな
くなった場合、従系のコンピュータ1Aが機能を引き継
ぎ、主系のコンピュータとなる。コンピュータ1Bは再
起動し(メモリリークを解消し)従系のコンピュータと
なる。このように、実際に問題が発生する前に主系と従
系を切り替え、コンピュータを再起動するので、主系コ
ンピュータと従系コンピュータで同時にダウンする可能
性が減り、従来より可用性の高いコンピュータシステム
を構成することができる。
【0039】実施の形態2.この発明の実施の形態2に
係る多重化コンピュータシステムについて図面を参照し
ながら説明する。図3は、この発明の実施の形態2に係
る多重化コンピュータシステムの構成を示す図である。
【0040】上記実施の形態1では、リソースの不足を
検出したときに、主系コンピュータを再起動していた
が、この実施の形態2では、従系コンピュータを再起動
する。
【0041】図3において、2A、2Bはコンピュー
タ、21A、21Bは業務処理を行なうアプリケーショ
ンプログラム(APP)、22A、22Bはコンピュー
タ2A、2B内のリソースの使用量を監視するリソース
監視手段(RM)、23A、23Bはコンピュータ2
A、2Bを再起動するための再起動手段(RB)、24
A、24Bは再起動のトリガーとなる条件を保持してお
くためのリソース限界定義領域(COND)、25A、
25Bはオペレーティングシステム(OS)、26A、
26Bは従系を再起動したことを記憶しておくフラグ
(FLAG)である。なお、8はコンピュータ2A、2
B間の通信や、このコンピュータシステムと、クライア
ントコンピュータの間の通信に用いるネットワークであ
る。
【0042】つぎに、この実施の形態2に係る多重化コ
ンピュータシステムの動作について図面を参照しながら
説明する。
【0043】図4は、この発明の実施の形態2に係る多
重化コンピュータシステムの動作を示すフローチャート
である。
【0044】コンピュータ2A、2Bが起動されること
により、処理を開始する。まず、初期化処理として、主
系として起動されたコンピュータ2Aは、ステップ20
1において、再起動フラグを0にする。
【0045】次に、ステップ202において、トランザ
クション処理として、アプリケーション本来の処理を行
なう。この処理には、クライアントコンピュータとの通
信や、従系コンピュータ2Bとのデータ等価作業等を含
めてかまわない。
【0046】次に、ステップ203において、メモリ不
足等のアプリケーション実行を継続できない異常が発生
していないか確認する。
【0047】異常が発生していない場合は、リソース
(メモリ、ディスク、その他)の消費量を測定する(ス
テップ204)。リソース消費量が、あらかじめリソー
ス限界定義領域24Aに設定された再起動条件を満たし
ている(メモリ消費量が全メモリの9割を超えた等)か
どうか判断する(ステップ205)。
【0048】再起動条件を満たした場合、再起動フラグ
26Aをチェックする(ステップ206)。再起動フラ
グが1だった場合は、すでに従系が再起動されているの
で、何もせずステップ202に戻って処理を継続する。
【0049】再起動フラグが0だった場合、再起動手段
23Bへ通知することによって、従系コンピュータ2B
を再起動する(ステップ207)。
【0050】次に、再起動フラグ26Aを1にして、繰
り返して従系コンピュータ2Bを再起動しないようにす
る(ステップ208)。
【0051】再起動された従系コンピュータ2Bでは、
再起動によってプログラムが最初から実行されるため、
リソースの漏れや蓄積された不具合が解消される。主系
では、ステップ202に戻って、処理を継続する。
【0052】ステップ205において、再起動条件を満
たしていない場合には、ステップ202に戻って、処理
を継続する。
【0053】ステップ203において、異常が発生して
いる場合には、主系コンピュータは、従系コンピュータ
に処理を引き継ぎ(ステップ209)、従系コンピュー
タ2Bが主系コンピュータに切り替わる。その後、コン
ピュータ2Aを従系コンピュータとして再起動する(ス
テップ210)。
【0054】以上のようにすることにより、上記実施の
形態1と同様な効果をもたらす。また、従系の再起動処
理を実行している間でも主系の処理を継続できるので、
主系従系の引継ぎ時の処理時間の遅れを小さくすること
ができる。さらに、従系をあらかじめ再起動してあるの
で、従系が主系の処理を受け継いだ後、短時間のうちに
同じ問題点で再切り替えが発生するのを防ぐことができ
る。これは、主系が再起動している最中に再切り替えが
発生してシステムが停止するといった問題を未然に防ぐ
ことができる。
【0055】すなわち、上記実施の形態1では、主系の
コンピュータの機能を従系のコンピュータに切り替えて
から主系のコンピュータを再起動していたが、この実施
の形態2では、主系のコンピュータ2Aのリソース使用
可能量が一定の条件を満たしたとき、従系のコンピュー
タ2Bを再起動する。そうすれば、再起動処理は、主系
のコンピュータが動作中にバックグランドで実行される
ため、オーバーヘッドがなく、なおかつ上記実施の形態
1と同じ効果を得ることができる。
【0056】実施の形態3.この発明の実施の形態3に
係る多重化コンピュータシステムについて図面を参照し
ながら説明する。図5は、この発明の実施の形態3に係
る多重化コンピュータシステムの構成を示す図である。
【0057】上記実施の形態1では、コンピュータ全体
でリソース使用量を監視していたが、この実施の形態3
では、複数のアプリケーションが実行される環境におい
て、アプリケーションごとにリソース使用量を監視し、
アプリケーションごとに再起動と主系従系の切り替えを
行う。
【0058】図5において、3A、3Bはコンピュー
タ、31A、32A、31B、32Bは業務処理を行な
うアプリケーションプログラム(APP−1、APP−
2)、33A、33Bはコンピュータ3A、3B内や、
アプリケーションプログラムのリソースの使用量を監視
するリソース監視手段(RM)、34A、34Bはコン
ピュータ3A、3Bもしくは、特定のアプリケーション
を再起動するための再起動手段(RB)、35A、35
Bはコンピュータ再起動のトリガーとなる条件を保持し
ておくためのOSリソース限界定義領域(COND)、
36A、36Bはアプリケーションそれぞれの再起動の
トリガーとなる条件を保持しておくためのAPPリソー
ス限界定義領域(COND1、COND2)である。
【0059】また、同図において、37A、37Bは各
アプリケーションが主系モードで動作しているか、従系
モードで動作しているかを記憶しておくフラグ集合体
(FLAG1、FLAG2)である。38A、38Bは
オペレーティングシステム(OS)である。なお、8は
コンピュータ3A、3B間の通信や、このコンピュータ
システムと、クライアントコンピュータの間の通信に用
いるネットワークである。
【0060】つぎに、この実施の形態3に係る多重化コ
ンピュータシステムの動作について図面を参照しながら
説明する。
【0061】図6は、この発明の実施の形態3に係る多
重化コンピュータシステムの動作を示すフローチャート
である。
【0062】コンピュータ3A、3Bが起動されること
により、処理を開始する。まず、初期設定に基づいて、
複数のアプリケーションを起動する。アプリケーション
は、それぞれのコンピュータで主系または従系モードで
起動される。一方のコンピュータで主系モードのアプリ
ケーションは、別のコンピュータでは、従系モードで起
動され、ペアーで動作する。アプリケーションの動作モ
ードに対応して、フラグ集合体37A、37Bを設定す
る(ステップ301)。
【0063】次に、主系で動作するアプリケーション
は、ステップ302において、トランザクション処理と
して、アプリケーション本来の処理を行なう。この処理
には、クライアントコンピュータとの通信や、従系アプ
リケーションとのデータ等価作業等を含めてかまわな
い。
【0064】次に、ステップ303において、メモリ不
足等の全アプリケーション実行を継続できない異常が発
生していないか確認する。
【0065】異常が発生していない場合は、ステップ3
04に進み、コンピュータ3A内のリソース(メモリ、
ディスク、その他)消費量を測定する。コンピュータ内
リソース消費量が、あらかじめOSリソース限界定義領
域35Aに設定された再起動条件を満たしている(メモ
リ消費量が全メモリの9割を超えた等)かどうか判断す
る(ステップ305)。
【0066】再起動条件を満たしていた場合は、ステッ
プ306に進み、そのコンピュータ内で主系モードで動
作しているすべてのアプリケーションで、従系モードア
プリケーションヘの引継ぎを行なった後、自系コンピュ
ータ3Aを再起動手段34Aによって再起動する(ステ
ップ307)。再起動されたコンピュータ3Aでは、す
べてのアプリケーションを従系モードで起動する。
【0067】ステップ305において、再起動条件を満
たしていない場合には、ステップ308においてアプリ
ケーション単体のリソース消費量を測定する。
【0068】リソース消費量がアプリケーションごとに
APPリソース限界定義領域36Aに設定されている再
起動条件を満たしているかどうかを判断する(ステップ
309)。
【0069】再起動条件を満たしていない場合は、ステ
ップ302に戻り、処理を継続する。
【0070】再起動条件を満たしている場合には、ステ
ップ310に進み、別のコンピュータで動作している対
応する従系モードアプリケーションに引き継ぐ。その
後、アプリケーションを再起動手段34Aにより従系モ
ードとして再起動する。
【0071】以上のようにすることにより、より小さい
オーバーヘッドで、上記実施の形態1と同様の効果があ
る。また、アプリケーションごとに主系モードもしくは
従系モードで実行し、それを2つ以上のコンピュータで
組み合わせるので、リソース使用量を各コンピュータで
異なる量とすることができ、より一層、2つのコンピュ
ータで同時に障害をおこしてシステムがダウンする可能
性を下げることができる。
【0072】この実施の形態3では、アプリケーション
の再起動条件が満たされたときは、主系アプリケーショ
ンを再起動していたが、上記実施の形態2のように、再
起動条件が満たされたときに、従系アプリケーションを
再起動するような形態も可能であることは明白である。
この場合、この実施の形態3の効果に加えて、上記実施
の形態2の効果も得ることができる。
【0073】すなわち、上記実施の形態1では、コンピ
ュータ全体のリソース使用量を監視していたが、この実
施の形態3では、プログラム毎にリソース使用量を監視
し、プログラム毎に再起動と主系従系の切り替えを行う
ことで、より小さいオーバーヘッドで、上記実施の形態
2と同様の効果がある。また、プログラム毎に主系従系
を決め、それを2つ以上のコンピュータで組み合わせ
る。リソース消費を主系従系で異なる量とすることがで
き、上記実施の形態1と同等の効果をもたらすことがで
きる。
【0074】実施の形態4.この発明の実施の形態4に
係る多重化コンピュータシステムについて図面を参照し
ながら説明する。図7は、この発明の実施の形態4に係
る多重化コンピュータシステムの構成を示す図である。
【0075】上記実施の形態1では、主系コンピュータ
と従系コンピュータを同時に起動していたので、起動
後、主系と従系が同様な処理を行なっていた場合、主系
のリソース使用量と従系のリソース使用量とが、きわめ
て似かよったものになり、一番最初に主系が再起動処理
中に、従系がダウンしたりする可能性がある。そこで、
この実施の形態4では、上記実施の形態1に加えて、最
初に主系コンピュータを起動後、一定時間経過後(たと
えば1日後)に再起動することで、強制的にリソースの
消費量を主系従系で異なる量とし、上記実施の形態1に
おいて、再起動条件が発生する前にも、上記実施の形態
1と同等の効果をもたらす。
【0076】図7において、4A、4Bはコンピュー
タ、41A、41Bは業務処理を行なうアプリケーショ
ンプログラム(APP)、42A、42Bはコンピュー
タ4A、4B内のリソースの使用量を監視するリソース
監視手段(RM)、43A、43Bはコンピュータ4
A、4Bを再起動するための再起動手段(RB)、44
A、44Bは再起動のトリガーとなる条件を保持してお
くためのリソース限界定義領域(COND)、45A、
45Bはオペレーティングシステム(OS)である。
【0077】また、同図において、46A、46Bはコ
ンピュータの最初の起動からの時間を計時する遅延タイ
マ(DL)である。47A、47Bは一番最初の起動で
あるかどうかを示す初期フラグ(INI)で、最初に起
動された時点で1にセットされ、後は、値を変更されな
い限り、システムの再起動においても値を保持する。な
お、8はコンピュータ4A、4B間の通信や、このコン
ピュータシステムと、クライアントコンピュータの間の
通信に用いるネットワークである。
【0078】つぎに、この実施の形態4に係る多重化コ
ンピュータシステムの動作について図面を参照しながら
説明する。
【0079】図8は、この発明の実施の形態4に係る多
重化コンピュータシステムの動作を示すフローチャート
である。
【0080】コンピュータ4A、4Bが起動されること
により、処理を開始する。最初に起動された時点で、初
期フラグ(INI)は1にセットされる(ステップ40
1)。また、遅延タイマ(DL)を起動する。
【0081】主系として起動されたコンピュータ4A
は、ステップ402において、トランザクション処理と
して、アプリケーション本来の処理を行なう。この処理
には、クライアントコンピュータとの通信や、従系コン
ピュータ4Bとのデータ等価作業等を含めてかまわな
い。
【0082】次に、ステップ403において、メモリ不
足等のアプリケーション実行を継続できない異常が発生
していないか確認する。
【0083】異常が発生していない場合は、リソース監
視手段42Aは、リソース(メモリ、ディスク、その
他)の消費量を測定する(ステップ404)。
【0084】次に、リソース消費量が、あらかじめリソ
ース限界定義領域44Aに設定された再起動条件を満た
している(たとえば、メモリ消費量が全メモリの9割を
超えた)かどうか判断する(ステップ405)。
【0085】再起動条件を満たしていた場合は、初期フ
ラグ47Aを0にした(ステップ408)後、従系へ処
理の引継ぎを行い(ステップ409)、再起動手段43
Aによって、主系コンピュータ4Aを再起動する(ステ
ップ411)。再起動されたコンピュータ4Aは、従系
コンピュータとして起動し、コンピュータ4Bが、主系
コンピュータに切り替わる。コンピュータ4Aは、再起
動によってプログラムが最初から実行され、メモリリー
クが解消されたり、不要な一時ファイルが削除されたり
するので、リソース限界ではなくなる。主系では、図8
の右上のエントリからステップ402に戻って、処理を
継続する。
【0086】ステップ405において、再起動条件を満
たしていない場合には、遅延タイマ(DL)が、あらか
じめ指定していた時間を経過してタイムアウトし、なお
かつ初期フラグ47Aが1のとき、ステップ408へ進
む。そうでなければ、ステップ402に戻って、処理を
継続する。
【0087】ステップ403において、異常が発生して
いる場合には、ステップ408へ進む。
【0088】以上のようにすることにより、上記実施の
形態1と同様な効果をもたらす。また、最初の起動後、
遅延タイマ(DL)によって一定時間後に主系を再起動
することで、強制的にリソースの消費量を主系従系で異
なる量とし、上記実施の形態1において、再起動条件が
発生する前にも、上記実施の形態1と同等の効果をもた
らす。
【0089】なお、この実施の形態4では、最初の起動
後、遅延タイマ(DL)によって、一定時間後に主系を
再起動していたが、一定時間後に従系を再起動する構成
が可能であることは明白である。この場合、上記実施の
形態2において、再起動条件が発生する前にも、上記実
施の形態2と同等の効果をもたらす。
【0090】すなわち、この実施の形態4では、主系の
コンピュータを、一定時間経過後(たとえば1日後)に
再起動することで、リソースリークの量を主系従系で異
なる量とすることができ、上記実施の形態1と同等の効
果を、上記実施の形態1において、最初の再起動が起こ
る前にも得ることができる。
【0091】実施の形態5.この発明の実施の形態5に
係る多重化コンピュータシステムについて図面を参照し
ながら説明する。図9は、この発明の実施の形態5に係
る多重化コンピュータシステムの構成を示す図である。
【0092】上記実施の形態1〜4では、2台もしくは
それ以上のコンピュータを交互に再起動することによ
り、高可用性を実現していたが、高速再起動できるコン
ピュータを使用するか、もしくは、要求される処理がコ
ンピュータシステムの能力に比してそれほど頻繁でない
システムでは、コンピュータ異常の前兆現象を検出した
時点で、フラグをセットし、処理の合間にフラグを確認
して、次の処理が想定されるまでに再起動可能であれ
ば、再起動することで、上記実施の形態1〜4と同等の
効果をコンピュータ1台で実現することができる。
【0093】図9において、5はコンピュータ、51は
業務処理を行なうアプリケーションプログラム(AP
P)、52はコンピュータ5内のリソースの使用量を監
視するリソース監視手段(RM)、53はコンピュータ
5を再起動するための再起動手段(RB)、54は再起
動のトリガーとなる条件を保持しておくためのリソース
限界定義領域(COND)、55はオペレーティングシ
ステム(OS)である。また、56は再起動する必要が
あるかどうかを示す再起動フラグ(FLAG)、57は
再起動可能かどうかを判定する再起動可能判定手段(G
RANT)、58は再起動後にアプリケーションの状態
を復帰するための状態保持テーブル(STAT)であ
る。
【0094】つぎに、この実施の形態5に係る多重化コ
ンピュータシステムの動作について図面を参照しながら
説明する。
【0095】図10は、この発明の実施の形態5に係る
多重化コンピュータシステムの動作を示すフローチャー
トである。
【0096】コンピュータ5が起動されることにより、
処理を開始する。ステップ201において、再起動フラ
グ56を解除(OFF)する。さらに、ステップ502
において、状態保持テーブル58に復帰の必要な状態が
保存されているかどうか判断し、復帰が必要であれば復
帰する(ステップ503)。
【0097】次に、ステップ504において、トランザ
クション処理として、アプリケーション本来の処理を行
なう。この処理には、クライアントコンピュータとの通
信や、状態保持テーブル58のデータ更新等が含まれて
もよい。
【0098】次に、ステップ505において、メモリ不
足等のアプリケーション実行を継続できない異常が発生
していないか確認する。
【0099】異常が発生している場合は、ステップ51
0へ進む。
【0100】異常が発生していない場合には、リソース
監視手段52は、リソース(メモリ、ディスク、その
他)の消費量を測定する(ステップ506)。
【0101】次に、リソース消費量が、あらかじめリソ
ース限界定義領域54に設定された再起動条件を満たし
ている(たとえば、メモリ消費量が全メモリの9割を超
えた)かどうか判断する(ステップ507)。
【0102】再起動条件を満たしていた場合は、再起動
フラグ56をONにセットする(ステップ508)。そ
うでない場合には、そのままステップ509へ進む。
【0103】次に、ステップ509において、再起動可
能判定手段57によって再起動可能かどうか判断し、再
起動可能で、再起動フラグ56がONだったら、ステッ
プ510へ進む。再起動可能判定手段57は、たとえ
ば、OSの状態や、システムの運用状況(たとえば、深
夜の負荷軽減状況)等によって、コンピュータシステム
が再起動可能かどうか判断する。再起動可能でないか、
再起動フラグがOFFだった場合は、ステップ504に
もどって、処理を継続する。
【0104】ステップ510において、現在のアプリケ
ーションの状態を状態保持テーブル58に保存し、コン
ピュータシステムを再起動する(ステップ511)。再
起動されたら、プログラムが最初から実行され、メモリ
リークが解消されたり、不要な一時ファイルが削除され
たりするので、リソース限界ではなくなる。そして、ス
テップ501に戻って、処理を継続する。
【0105】以上のようにすることにより、上記実施の
形態1と同様な効果をコンピュータ1台で得ることがで
きる。
【0106】なお、この実施の形態5では、再起動手段
53が、コンピュータ全体を再起動していたが、リソー
スの種類によっては、アプリケーションのみを再起動す
ることで問題点を解消する形態も可能である。そのとき
は、より再起動のオーバヘッドが小さくなる効果もあ
る。
【0107】すなわち、上記実施の形態1〜4では、2
台もしくはそれ以上のコンピュータを交互に再起動する
ことにより高可用性を実現していたが、この実施の形態
5では、高速再起動できるコンピュータ(もしくは、要
求される処理がそれほど頻繁でないシステム)を使用
し、コンピュータ異常の前兆現象を検出した時点で、再
起動フラグ(FLAG)をセットし、処理の合間に再起
動フラグを確認して、次の処理が想定されるまでに再起
動可能であれば、再起動することで、上記実施の形態1
〜4と同等の効果をコンピュータ1台で実現できる。
【0108】上記実施の形態1〜5では、リソースの使
用量監視方法としては、1つのトランザクション処理毎
に毎回行う方法をあげたが、一定時間毎、プロセッサの
負荷状況に応じて、負荷が上がれば回数を増やすなどの
構成が可能であることも明白である。
【0109】また、上記実施の形態1〜5では、コンピ
ュータ異常の前兆現象として、リソース消費量をあげた
が、ほかにも、たとえば、あらかじめわかっている不具
合発生までの連続運転可能時間等を再起動条件とするな
ど、指定した条件を前兆現象としてコンピュータ・アプ
リケーションの再起動をすることにより、主系従系のコ
ンピュータが同時にダウンすることを防ぐことが可能で
ある。
【0110】
【発明の効果】この発明に係る多重化コンピュータシス
テムは、以上説明したとおり、ネットワークを介して相
互に接続された第1及び第2のコンピュータを備え、前
記第1のコンピュータは、業務処理を行なう第1のアプ
リケーションプログラムと、前記第1のコンピュータ内
のリソースの消費量を監視する第1のリソース監視手段
と、前記第1のコンピュータを再起動するための第1の
再起動手段と、再起動条件を保持する第1のリソース限
界定義領域と、第1のオペレーティングシステムとを有
し、前記第2のコンピュータは、業務処理を行なう第2
のアプリケーションプログラムと、前記第2のコンピュ
ータ内のリソースの消費量を監視する第2のリソース監
視手段と、前記第2のコンピュータを再起動するための
第2の再起動手段と、再起動条件を保持する第2のリソ
ース限界定義領域と、第2のオペレーティングシステム
とを有し、前記第1のコンピュータが、主系として動作
し、前記第2のコンピュータが、従系として動作してい
る場合、前記第1のコンピュータは、前記第1のリソー
ス監視手段によりリソースの消費量を監視し、リソース
消費量が、前記第1のリソース限界定義領域により予め
保持された再起動条件を満たしているときには、従系と
して動作している前記第2のコンピュータへ処理の引継
ぎを行うと共に、前記第1の再起動手段により、主系と
して動作している前記第1のコンピュータを再起動し、
その後、前記再起動された前記第1のコンピュータが、
従系として動作し、前記第2のコンピュータが、主系と
して動作するので、主系コンピュータと従系コンピュー
タで同時にダウンする可能性が減り、可用性の高いコン
ピュータシステムを構成することができるという効果を
奏する。
【0111】この発明に係る多重化コンピュータシステ
ムは、以上説明したとおり、ネットワークを介して相互
に接続された第1及び第2のコンピュータを備え、前記
第1のコンピュータは、業務処理を行なう第1のアプリ
ケーションプログラムと、前記第1のコンピュータ内の
リソースの消費量を監視する第1のリソース監視手段
と、前記第1のコンピュータを再起動するための第1の
再起動手段と、再起動条件を保持する第1のリソース限
界定義領域と、第1のオペレーティングシステムとを有
し、前記第2のコンピュータは、業務処理を行なう第2
のアプリケーションプログラムと、前記第2のコンピュ
ータ内のリソースの消費量を監視する第2のリソース監
視手段と、前記第2のコンピュータを再起動するための
第2の再起動手段と、再起動条件を保持する第2のリソ
ース限界定義領域と、第2のオペレーティングシステム
とを有し、前記第1のコンピュータが、主系として動作
し、前記第2のコンピュータが、従系として動作してい
る場合、前記第1のコンピュータは、前記第1のリソー
ス監視手段によりリソースの消費量を監視し、リソース
消費量が、前記第1のリソース限界定義領域により予め
保持された再起動条件を満たしているときには、前記第
2の再起動手段へ再起動条件を満たしている旨の通知を
行い、前記第2の再起動手段により、従系として動作し
ている前記第2のコンピュータを再起動するので、オー
バーヘッドがなく、かつ主系コンピュータと従系コンピ
ュータで同時にダウンする可能性が減り、可用性の高い
コンピュータシステムを構成することができるという効
果を奏する。
【0112】この発明に係る多重化コンピュータシステ
ムは、以上説明したとおり、ネットワークを介して相互
に接続された第1及び第2のコンピュータを備え、前記
第1のコンピュータは、業務処理を行なう第1のアプリ
ケーションプログラムと、前記第1のアプリケーション
プログラムのリソースの消費量を監視する第1のリソー
ス監視手段と、前記第1のアプリケーションプログラム
を再起動するための第1の再起動手段と、再起動条件を
保持する第1のリソース限界定義領域と、第1のオペレ
ーティングシステムとを有し、前記第2のコンピュータ
は、業務処理を行なう第2のアプリケーションプログラ
ムと、前記第2のアプリケーションプログラムのリソー
スの消費量を監視する第2のリソース監視手段と、前記
第2のアプリケーションプログラムを再起動するための
第2の再起動手段と、再起動条件を保持する第2のリソ
ース限界定義領域と、第2のオペレーティングシステム
とを有し、前記第1のアプリケーションプログラムが、
主系として動作し、前記第2のアプリケーションプログ
ラムが、従系として動作している場合、前記第1のコン
ピュータは、前記第1のリソース監視手段によりリソー
スの消費量を監視し、リソース消費量が、前記第1のリ
ソース限界定義領域により予め保持された再起動条件を
満たしているときには、従系として動作している前記第
2のアプリケーションプログラムへ処理の引継ぎを行う
と共に、前記第1の再起動手段により、主系として動作
している前記第1のアプリケーションプログラムを再起
動し、その後、前記再起動された前記第1のアプリケー
ションプログラムが、従系として動作し、前記第2のア
プリケーションプログラムが、主系として動作するの
で、リソース消費を主系従系で異なる量とすることがで
き、主系コンピュータと従系コンピュータで同時にダウ
ンする可能性が減り、可用性の高いコンピュータシステ
ムを構成することができるという効果を奏する。
【0113】また、この発明に係る多重化コンピュータ
システムは、以上説明したとおり、ネットワークを介し
て相互に接続された第1及び第2のコンピュータを備
え、前記第1のコンピュータは、業務処理を行なう第1
のアプリケーションプログラムと、前記第1のアプリケ
ーションプログラムのリソースの消費量を監視する第1
のリソース監視手段と、前記第1のアプリケーションプ
ログラムを再起動するための第1の再起動手段と、再起
動条件を保持する第1のリソース限界定義領域と、第1
のオペレーティングシステムとを有し、前記第2のコン
ピュータは、業務処理を行なう第2のアプリケーション
プログラムと、前記第2のアプリケーションプログラム
のリソースの消費量を監視する第2のリソース監視手段
と、前記第2のアプリケーションプログラムを再起動す
るための第2の再起動手段と、再起動条件を保持する第
2のリソース限界定義領域と、第2のオペレーティング
システムとを有し、前記第1のアプリケーションプログ
ラムが、主系として動作し、前記第2のアプリケーショ
ンプログラムが、従系として動作している場合、前記第
1のコンピュータは、前記第1のリソース監視手段によ
りリソースの消費量を監視し、リソース消費量が、前記
第1のリソース限界定義領域により予め保持された再起
動条件を満たしているときには、前記第2の再起動手段
へ再起動条件を満たしている旨の通知を行い、前記第2
の再起動手段により、従系として動作している前記第2
のアプリケーションプログラムを再起動するので、リソ
ース消費を主系従系で異なる量とすることができ、主系
コンピュータと従系コンピュータで同時にダウンする可
能性が減り、可用性の高いコンピュータシステムを構成
することができるという効果を奏する。
【0114】また、この発明に係る多重化コンピュータ
システムは、以上説明したとおり、前記第1のコンピュ
ータが、この第1のコンピュータの最初の起動からの時
間を計時する第1の遅延タイマをさらに有し、前記第2
のコンピュータが、この第2のコンピュータの最初の起
動からの時間を計時する第2の遅延タイマをさらに有
し、前記第1のコンピュータは、前記第1の遅延タイマ
により計時した時間が所定時間を超えているときには、
従系として動作している前記第2のコンピュータへ処理
の引継ぎを行うと共に、前記第1の再起動手段により、
主系として動作している前記第1のコンピュータを再起
動するので、リソースリークの量を主系従系で異なる量
とすることができ、最初の再起動が起こる前の主系コン
ピュータと従系コンピュータで同時にダウンする可能性
を減らすことができるという効果を奏する。
【0115】また、この発明に係る多重化コンピュータ
システムは、以上説明したとおり、前記第1のコンピュ
ータが、この第1のコンピュータの最初の起動からの時
間を計時する第1の遅延タイマをさらに有し、前記第2
のコンピュータが、この第2のコンピュータの最初の起
動からの時間を計時する第2の遅延タイマをさらに有
し、前記第1のコンピュータは、前記第1の遅延タイマ
により計時した時間が所定時間を超えているときには、
前記第2の再起動手段へ再起動条件を満たしている旨の
通知を行い、前記第2の再起動手段により、従系として
動作している前記第2のコンピュータを再起動するの
で、リソースリークの量を主系従系で異なる量とするこ
とができ、最初の再起動が起こる前の主系コンピュータ
と従系コンピュータで同時にダウンする可能性を減らす
ことができるという効果を奏する。
【0116】この発明に係る多重化コンピュータシステ
ムは、以上説明したとおり、1台のコンピュータを備
え、前記コンピュータは、業務処理を行なうアプリケー
ションプログラムと、前記コンピュータ内のリソースの
消費量を監視するリソース監視手段と、前記コンピュー
タを再起動するための再起動手段と、再起動条件を保持
するリソース限界定義領域と、オペレーティングシステ
ムと、再起動する必要があるかどうかを示す再起動フラ
グと、再起動可能かどうかを判定する再起動可能判定手
段とを有し、前記コンピュータは、前記リソース監視手
段によりリソースの消費量を監視し、リソース消費量
が、前記リソース限界定義領域により予め保持された再
起動条件を満たしているときには、前記再起動フラグを
ONし、処理中において、前記再起動可能判定手段によ
り再起動可能であると判断され、かつ前記再起動フラグ
がONの場合には、前記再起動手段により前記コンピュ
ータを再起動するので、コンピュータ1台で上記効果と
同等の効果を奏する。
【図面の簡単な説明】
【図1】 この発明の実施の形態1に係る多重化コンピ
ュータシステムの構成を示す図である。
【図2】 この発明の実施の形態1に係る多重化コンピ
ュータシステムの動作を示すフローチャートである。
【図3】 この発明の実施の形態2に係る多重化コンピ
ュータシステムの構成を示す図である。
【図4】 この発明の実施の形態2に係る多重化コンピ
ュータシステムの動作を示すフローチャートである。
【図5】 この発明の実施の形態3に係る多重化コンピ
ュータシステムの構成を示す図である。
【図6】 この発明の実施の形態3に係る多重化コンピ
ュータシステムの動作を示すフローチャートである。
【図7】 この発明の実施の形態4に係る多重化コンピ
ュータシステムの構成を示す図である。
【図8】 この発明の実施の形態4に係る多重化コンピ
ュータシステムの動作を示すフローチャートである。
【図9】 この発明の実施の形態5に係る多重化コンピ
ュータシステムの構成を示す図である。
【図10】 この発明の実施の形態5に係る多重化コン
ピュータシステムの動作を示すフローチャートである。
【図11】 従来の多重化コンピュータシステムの構成
を示す図である。
【図12】 従来の多重化コンピュータシステムの動作
を示すフローチャートである。
【符号の説明】
1A、1B コンピュータ、11A、11B アプリケ
ーションプログラム(APP)、12A、12B リソ
ース監視手段(RM)、13A、13B 再起動手段
(RB)、14A、14B リソース限界定義領域(C
OND)、15A、15B オペレーティングシステム
(OS)、8 ネットワーク。
フロントページの続き Fターム(参考) 5B034 BB02 5B045 JJ04 JJ22 JJ44 5B083 AA05 CD11 DD09 DD11 EE03 GG04

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 ネットワークを介して相互に接続された
    第1及び第2のコンピュータを備え、 前記第1のコンピュータは、業務処理を行なう第1のア
    プリケーションプログラムと、前記第1のコンピュータ
    内のリソースの消費量を監視する第1のリソース監視手
    段と、前記第1のコンピュータを再起動するための第1
    の再起動手段と、再起動条件を保持する第1のリソース
    限界定義領域と、第1のオペレーティングシステムとを
    有し、 前記第2のコンピュータは、業務処理を行なう第2のア
    プリケーションプログラムと、前記第2のコンピュータ
    内のリソースの消費量を監視する第2のリソース監視手
    段と、前記第2のコンピュータを再起動するための第2
    の再起動手段と、再起動条件を保持する第2のリソース
    限界定義領域と、第2のオペレーティングシステムとを
    有し、 前記第1のコンピュータが、主系として動作し、前記第
    2のコンピュータが、従系として動作している場合、 前記第1のコンピュータは、前記第1のリソース監視手
    段によりリソースの消費量を監視し、リソース消費量
    が、前記第1のリソース限界定義領域により予め保持さ
    れた再起動条件を満たしているときには、従系として動
    作している前記第2のコンピュータへ処理の引継ぎを行
    うと共に、 前記第1の再起動手段により、主系として動作している
    前記第1のコンピュータを再起動し、 その後、前記再起動された前記第1のコンピュータが、
    従系として動作し、前記第2のコンピュータが、主系と
    して動作することを特徴とする多重化コンピュータシス
    テム。
  2. 【請求項2】 ネットワークを介して相互に接続された
    第1及び第2のコンピュータを備え、 前記第1のコンピュータは、業務処理を行なう第1のア
    プリケーションプログラムと、前記第1のコンピュータ
    内のリソースの消費量を監視する第1のリソース監視手
    段と、前記第1のコンピュータを再起動するための第1
    の再起動手段と、再起動条件を保持する第1のリソース
    限界定義領域と、第1のオペレーティングシステムとを
    有し、 前記第2のコンピュータは、業務処理を行なう第2のア
    プリケーションプログラムと、前記第2のコンピュータ
    内のリソースの消費量を監視する第2のリソース監視手
    段と、前記第2のコンピュータを再起動するための第2
    の再起動手段と、再起動条件を保持する第2のリソース
    限界定義領域と、第2のオペレーティングシステムとを
    有し、 前記第1のコンピュータが、主系として動作し、前記第
    2のコンピュータが、従系として動作している場合、 前記第1のコンピュータは、前記第1のリソース監視手
    段によりリソースの消費量を監視し、リソース消費量
    が、前記第1のリソース限界定義領域により予め保持さ
    れた再起動条件を満たしているときには、前記第2の再
    起動手段へ再起動条件を満たしている旨の通知を行い、 前記第2の再起動手段により、従系として動作している
    前記第2のコンピュータを再起動することを特徴とする
    多重化コンピュータシステム。
  3. 【請求項3】 ネットワークを介して相互に接続された
    第1及び第2のコンピュータを備え、 前記第1のコンピュータは、業務処理を行なう第1のア
    プリケーションプログラムと、前記第1のアプリケーシ
    ョンプログラムのリソースの消費量を監視する第1のリ
    ソース監視手段と、前記第1のアプリケーションプログ
    ラムを再起動するための第1の再起動手段と、再起動条
    件を保持する第1のリソース限界定義領域と、第1のオ
    ペレーティングシステムとを有し、 前記第2のコンピュータは、業務処理を行なう第2のア
    プリケーションプログラムと、前記第2のアプリケーシ
    ョンプログラムのリソースの消費量を監視する第2のリ
    ソース監視手段と、前記第2のアプリケーションプログ
    ラムを再起動するための第2の再起動手段と、再起動条
    件を保持する第2のリソース限界定義領域と、第2のオ
    ペレーティングシステムとを有し、 前記第1のアプリケーションプログラムが、主系として
    動作し、前記第2のアプリケーションプログラムが、従
    系として動作している場合、 前記第1のコンピュータは、前記第1のリソース監視手
    段によりリソースの消費量を監視し、リソース消費量
    が、前記第1のリソース限界定義領域により予め保持さ
    れた再起動条件を満たしているときには、従系として動
    作している前記第2のアプリケーションプログラムへ処
    理の引継ぎを行うと共に、 前記第1の再起動手段により、主系として動作している
    前記第1のアプリケーションプログラムを再起動し、 その後、前記再起動された前記第1のアプリケーション
    プログラムが、従系として動作し、前記第2のアプリケ
    ーションプログラムが、主系として動作することを特徴
    とする多重化コンピュータシステム。
  4. 【請求項4】 ネットワークを介して相互に接続された
    第1及び第2のコンピュータを備え、 前記第1のコンピュータは、業務処理を行なう第1のア
    プリケーションプログラムと、前記第1のアプリケーシ
    ョンプログラムのリソースの消費量を監視する第1のリ
    ソース監視手段と、前記第1のアプリケーションプログ
    ラムを再起動するための第1の再起動手段と、再起動条
    件を保持する第1のリソース限界定義領域と、第1のオ
    ペレーティングシステムとを有し、 前記第2のコンピュータは、業務処理を行なう第2のア
    プリケーションプログラムと、前記第2のアプリケーシ
    ョンプログラムのリソースの消費量を監視する第2のリ
    ソース監視手段と、前記第2のアプリケーションプログ
    ラムを再起動するための第2の再起動手段と、再起動条
    件を保持する第2のリソース限界定義領域と、第2のオ
    ペレーティングシステムとを有し、 前記第1のアプリケーションプログラムが、主系として
    動作し、前記第2のアプリケーションプログラムが、従
    系として動作している場合、 前記第1のコンピュータは、前記第1のリソース監視手
    段によりリソースの消費量を監視し、リソース消費量
    が、前記第1のリソース限界定義領域により予め保持さ
    れた再起動条件を満たしているときには、前記第2の再
    起動手段へ再起動条件を満たしている旨の通知を行い、 前記第2の再起動手段により、従系として動作している
    前記第2のアプリケーションプログラムを再起動するこ
    とを特徴とする多重化コンピュータシステム。
  5. 【請求項5】 前記第1のコンピュータは、この第1の
    コンピュータの最初の起動からの時間を計時する第1の
    遅延タイマをさらに有し、 前記第2のコンピュータは、この第2のコンピュータの
    最初の起動からの時間を計時する第2の遅延タイマをさ
    らに有し、 前記第1のコンピュータは、前記第1の遅延タイマによ
    り計時した時間が所定時間を超えているときには、従系
    として動作している前記第2のコンピュータへ処理の引
    継ぎを行うと共に、 前記第1の再起動手段により、主系として動作している
    前記第1のコンピュータを再起動することを特徴とする
    請求項1記載の多重化コンピュータシステム。
  6. 【請求項6】 前記第1のコンピュータは、この第1の
    コンピュータの最初の起動からの時間を計時する第1の
    遅延タイマをさらに有し、 前記第2のコンピュータは、この第2のコンピュータの
    最初の起動からの時間を計時する第2の遅延タイマをさ
    らに有し、 前記第1のコンピュータは、前記第1の遅延タイマによ
    り計時した時間が所定時間を超えているときには、前記
    第2の再起動手段へ再起動条件を満たしている旨の通知
    を行い、 前記第2の再起動手段により、従系として動作している
    前記第2のコンピュータを再起動することを特徴とする
    請求項2記載の多重化コンピュータシステム。
  7. 【請求項7】 1台のコンピュータを備え、 前記コンピュータは、業務処理を行なうアプリケーショ
    ンプログラムと、前記コンピュータ内のリソースの消費
    量を監視するリソース監視手段と、前記コンピュータを
    再起動するための再起動手段と、再起動条件を保持する
    リソース限界定義領域と、オペレーティングシステム
    と、再起動する必要があるかどうかを示す再起動フラグ
    と、再起動可能かどうかを判定する再起動可能判定手段
    とを有し、 前記コンピュータは、前記リソース監視手段によりリソ
    ースの消費量を監視し、リソース消費量が、前記リソー
    ス限界定義領域により予め保持された再起動条件を満た
    しているときには、前記再起動フラグをONし、 処理中において、前記再起動可能判定手段により再起動
    可能であると判断され、かつ前記再起動フラグがONの
    場合には、前記再起動手段により前記コンピュータを再
    起動することを特徴とする多重化コンピュータシステ
    ム。
JP2001178572A 2001-06-13 2001-06-13 多重化コンピュータシステム Pending JP2002373085A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001178572A JP2002373085A (ja) 2001-06-13 2001-06-13 多重化コンピュータシステム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001178572A JP2002373085A (ja) 2001-06-13 2001-06-13 多重化コンピュータシステム

Publications (1)

Publication Number Publication Date
JP2002373085A true JP2002373085A (ja) 2002-12-26

Family

ID=19019249

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001178572A Pending JP2002373085A (ja) 2001-06-13 2001-06-13 多重化コンピュータシステム

Country Status (1)

Country Link
JP (1) JP2002373085A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6993453B2 (en) 2003-10-28 2006-01-31 International Business Machines Corporation Adjusted monitoring in a relational environment
JP2007004595A (ja) * 2005-06-24 2007-01-11 Hitachi Ltd コンピュータ制御方法、コンピュータ、情報処理システム、及びプログラム
JP2009290528A (ja) * 2008-05-29 2009-12-10 Kyocera Mita Corp 操作表示装置及び画像形成装置
JP2012118748A (ja) * 2010-11-30 2012-06-21 Fujitsu Ltd 計算システムおよび計算システム管理方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6993453B2 (en) 2003-10-28 2006-01-31 International Business Machines Corporation Adjusted monitoring in a relational environment
JP2007004595A (ja) * 2005-06-24 2007-01-11 Hitachi Ltd コンピュータ制御方法、コンピュータ、情報処理システム、及びプログラム
JP2009290528A (ja) * 2008-05-29 2009-12-10 Kyocera Mita Corp 操作表示装置及び画像形成装置
US8334875B2 (en) 2008-05-29 2012-12-18 Kyocera Document Solutions Inc. Operation displaying device and image forming device
JP2012118748A (ja) * 2010-11-30 2012-06-21 Fujitsu Ltd 計算システムおよび計算システム管理方法

Similar Documents

Publication Publication Date Title
US8935510B2 (en) System structuring method in multiprocessor system and switching execution environment by separating from or rejoining the primary execution environment
JP5405320B2 (ja) 仮想計算機制御装置、仮想計算機制御方法及び仮想計算機制御プログラム
US7992032B2 (en) Cluster system and failover method for cluster system
JP4420275B2 (ja) フェイルオーバクラスタシステム及びフェイルオーバクラスタシステムを用いたプログラムのインストール方法
EP1762932A2 (en) Method and an apparatus for controlling executables running on blade servers
US8015431B2 (en) Cluster system and failover method for cluster system
US20120066484A1 (en) Patching method and patching device in multi-core environment
JP2004030363A (ja) 論理計算機システム、論理計算機システムの構成制御方法および論理計算機システムの構成制御プログラム
EP1162536A1 (en) Multiple operating system control method
EP1187024A2 (en) A fault monitoring system
WO2019100589A1 (zh) 虚拟机快速扩容方法、装置、设备以及存储介质
JP2000076087A (ja) マルチオペレーティングシステム制御方法
JP2007304845A (ja) 仮想計算機システムおよびソフトウェア更新方法
EP1943593A1 (en) Methods and apparatus for automatically multi-booting a computer system
JP2755437B2 (ja) 通信制御プログラムの連続運転保証処理方法
JP5285045B2 (ja) 仮想環境における故障復旧方法及びサーバ及びプログラム
JP2002373085A (ja) 多重化コンピュータシステム
KR100336500B1 (ko) 상용 실시간 운영체제와 미들웨어를 통한 아이/오 기반고가용성 구현 방법
CN110266790B (zh) 边缘集群管理方法、装置、边缘集群及可读存储介质
WO2020224381A1 (zh) 应用状态控制方法、装置、终端及计算机可读存储介质
JP2004213122A (ja) クライアント/サーバによる制御システムの安定稼働方法及びそのプログラム
JP4703681B2 (ja) クラスタシステム及び引き継ぎ先ノード決定方法
JP2002149439A (ja) 分散処理システムにおけるサーバ切替え方法及びサーバ装置
CN117149095B (zh) 基于nas的集群管理方法、装置、计算机设备及介质
CN116360865A (zh) 集群管理方法、设备及计算系统

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050713

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050719

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20051129