JP3296378B2 - コンピュータバックアップシステム - Google Patents
コンピュータバックアップシステムInfo
- Publication number
- JP3296378B2 JP3296378B2 JP21289293A JP21289293A JP3296378B2 JP 3296378 B2 JP3296378 B2 JP 3296378B2 JP 21289293 A JP21289293 A JP 21289293A JP 21289293 A JP21289293 A JP 21289293A JP 3296378 B2 JP3296378 B2 JP 3296378B2
- Authority
- JP
- Japan
- Prior art keywords
- information
- computer
- load
- shared memory
- backup
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Hardware Redundancy (AREA)
- Debugging And Monitoring (AREA)
- Multi Processors (AREA)
Description
【0001】
【産業上の利用分野】この発明は、複数の計算機から構
成されるシステムにおけるコンピュータバックアップシ
ステムに関するものである。
成されるシステムにおけるコンピュータバックアップシ
ステムに関するものである。
【0002】
【従来の技術】従来は図9に示されるように、計算機#
0〜計算機#3から構成されるコンピュータシステム
が、共有メモリを介してダウン情報の送受を行い、1台
の計算機のダウン時には、他の計算機がダウンに係る計
算機の処理を代行する(切り換える)ように構成されて
いた。
0〜計算機#3から構成されるコンピュータシステム
が、共有メモリを介してダウン情報の送受を行い、1台
の計算機のダウン時には、他の計算機がダウンに係る計
算機の処理を代行する(切り換える)ように構成されて
いた。
【0003】上記において、その切り換えの手法として
は、第1に、単純に計算機番号に従って、処理を代行す
るものが知られている。例えば、図9の如く計算機#0
がダウンした時には、次の計算機番号が割り当てられて
いる計算機#1が処理を代行するものが知られている。
また、他の切り換えの手法としては、ダウン時の代行先
の計算機を各計算機に対応させて定義しておくものが知
られている。
は、第1に、単純に計算機番号に従って、処理を代行す
るものが知られている。例えば、図9の如く計算機#0
がダウンした時には、次の計算機番号が割り当てられて
いる計算機#1が処理を代行するものが知られている。
また、他の切り換えの手法としては、ダウン時の代行先
の計算機を各計算機に対応させて定義しておくものが知
られている。
【0004】
【発明が解決しようとする課題】しかしながら、上記の
手法のいずれにしても、代行する計算機の負荷が異常に
増加する虞があり、係る場合にはこの代行を行った計算
機の処理が遅くなり、システム上では局所的に性能が低
下するという問題点が生じていた。
手法のいずれにしても、代行する計算機の負荷が異常に
増加する虞があり、係る場合にはこの代行を行った計算
機の処理が遅くなり、システム上では局所的に性能が低
下するという問題点が生じていた。
【0005】本発明は上記のような従来のコンピュータ
バックアップシステムにおける問題点を解決せんとして
なされたもので、その目的は、ダウンした計算機の処理
を代行する時には、負荷を考慮して代行した計算機が過
負荷状態となる可能性を少なくし、システム上では局所
的に性能が低下することをなくし、自動的にシステムの
効率的な運用が継続され得るように代行を実現するコン
ピュータバックアップシステムを提供することである。
また、本発明の他の目的は、所望により所定計算機の性
能を落としたくないような場合に、この要望を考慮しつ
つ、自動的にシステムの効率的な運用が継続され得るよ
うに代行を行うコンピュータバックアップシステムを提
供することである。
バックアップシステムにおける問題点を解決せんとして
なされたもので、その目的は、ダウンした計算機の処理
を代行する時には、負荷を考慮して代行した計算機が過
負荷状態となる可能性を少なくし、システム上では局所
的に性能が低下することをなくし、自動的にシステムの
効率的な運用が継続され得るように代行を実現するコン
ピュータバックアップシステムを提供することである。
また、本発明の他の目的は、所望により所定計算機の性
能を落としたくないような場合に、この要望を考慮しつ
つ、自動的にシステムの効率的な運用が継続され得るよ
うに代行を行うコンピュータバックアップシステムを提
供することである。
【0006】
【課題を解決するための手段】そこで本発明では、複数
の計算機と、この複数の計算機のダウン情報及び負荷情
報が書き込まれる共有メモリと、各計算機毎にサポート
されている資源の重要度情報が記憶されている重みテー
ブルを有し、前記資源の稼働率と前記重みテーブルの重
要度情報とに基づき各計算機毎に自機の負荷情報を算出
し、算出した負荷情報を前記共有メモリに書き込む負荷
記録手段と、各計算機毎に自機のダウンを監視し、ダウ
ンを検出した場合にはダウン情報を前記共有メモリに書
き込むと共に、前記共有メモリのダウン情報を読み出し
他機のダウンを監視し、他機のダウンを検出した場合に
は、前記共有メモリの負荷情報に基づきバックアップ計
算機を決定してバックアップを実行する状態監視/バッ
クアップ手段とを具備させてコンピュータバックアップ
システムを構成した。
の計算機と、この複数の計算機のダウン情報及び負荷情
報が書き込まれる共有メモリと、各計算機毎にサポート
されている資源の重要度情報が記憶されている重みテー
ブルを有し、前記資源の稼働率と前記重みテーブルの重
要度情報とに基づき各計算機毎に自機の負荷情報を算出
し、算出した負荷情報を前記共有メモリに書き込む負荷
記録手段と、各計算機毎に自機のダウンを監視し、ダウ
ンを検出した場合にはダウン情報を前記共有メモリに書
き込むと共に、前記共有メモリのダウン情報を読み出し
他機のダウンを監視し、他機のダウンを検出した場合に
は、前記共有メモリの負荷情報に基づきバックアップ計
算機を決定してバックアップを実行する状態監視/バッ
クアップ手段とを具備させてコンピュータバックアップ
システムを構成した。
【0007】更に本発明では、複数の計算機と、この複
数の計算機のダウン情報及び負荷情報が書き込まれると
共に、他の計算機をバックアップしてはならない時刻情
報及び各計算機毎にバックアップすべき計算機の優先順
位情報が書き込まれた切換制限情報テーブルを有する共
有メモリと、各計算機毎にサポートされている資源の重
要度情報が記憶されている重みテーブルを有し、前記資
源の稼働率と前記重みテーブルの重要度情報とに基づき
各計算機毎に自機の負荷情報を算出し、算出した負荷情
報を前記共有メモリに書き込む負荷記録手段と、各計算
機毎に自機のダウンを監視し、ダウンを検出した場合に
はダウン情報を前記共有メモリに書き込むと共に、前記
共有メモリのダウン情報を読み出し他機のダウンを監視
し、他機のダウンを検出した場合には、前記共有メモリ
の負荷情報及び前記切換制限情報テーブルの情報に基づ
きバックアップ計算機を決定してバックアップを実行す
る状態監視/バックアップ手段とを具備させてコンピュ
ータバックアップシステムを構成した。
数の計算機のダウン情報及び負荷情報が書き込まれると
共に、他の計算機をバックアップしてはならない時刻情
報及び各計算機毎にバックアップすべき計算機の優先順
位情報が書き込まれた切換制限情報テーブルを有する共
有メモリと、各計算機毎にサポートされている資源の重
要度情報が記憶されている重みテーブルを有し、前記資
源の稼働率と前記重みテーブルの重要度情報とに基づき
各計算機毎に自機の負荷情報を算出し、算出した負荷情
報を前記共有メモリに書き込む負荷記録手段と、各計算
機毎に自機のダウンを監視し、ダウンを検出した場合に
はダウン情報を前記共有メモリに書き込むと共に、前記
共有メモリのダウン情報を読み出し他機のダウンを監視
し、他機のダウンを検出した場合には、前記共有メモリ
の負荷情報及び前記切換制限情報テーブルの情報に基づ
きバックアップ計算機を決定してバックアップを実行す
る状態監視/バックアップ手段とを具備させてコンピュ
ータバックアップシステムを構成した。
【0008】上記において、状態監視/バックアップ手
段は、自機の負荷が他機の負荷に比べて軽い場合に、ダ
ウンに係る計算機の処理を受け継ぐことを特徴とする。
段は、自機の負荷が他機の負荷に比べて軽い場合に、ダ
ウンに係る計算機の処理を受け継ぐことを特徴とする。
【0009】
【作用】上記構成に係る第1の発明では、各計算機毎に
サポートされている資源の重要度情報が記憶されている
重みテーブルを有し、前記資源の稼働率と前記重みテー
ブルの重要度情報とに基づき各計算機毎に自機の負荷情
報を算出し、算出した負荷情報を共有メモリに書き込
む。各計算機では、自機のダウンを監視し、ダウンを検
出した場合にはダウン情報を共有メモリに書き込む。ま
た、各計算機では、共有メモリのダウン情報を読み出し
他機のダウンを監視し、他機のダウンを検出した場合に
は、前記共有メモリの負荷情報に基づきバックアップ計
算機を決定してバックアップ(ダウンに係る計算機の処
理の代行)を実行する。斯して、各計算機の負荷情報に
基づきバックアップ計算機を決定することから、過負荷
によるシステムの局所的な性能低下を防止することがで
きる。
サポートされている資源の重要度情報が記憶されている
重みテーブルを有し、前記資源の稼働率と前記重みテー
ブルの重要度情報とに基づき各計算機毎に自機の負荷情
報を算出し、算出した負荷情報を共有メモリに書き込
む。各計算機では、自機のダウンを監視し、ダウンを検
出した場合にはダウン情報を共有メモリに書き込む。ま
た、各計算機では、共有メモリのダウン情報を読み出し
他機のダウンを監視し、他機のダウンを検出した場合に
は、前記共有メモリの負荷情報に基づきバックアップ計
算機を決定してバックアップ(ダウンに係る計算機の処
理の代行)を実行する。斯して、各計算機の負荷情報に
基づきバックアップ計算機を決定することから、過負荷
によるシステムの局所的な性能低下を防止することがで
きる。
【0010】また、上記の第2の発明では、上記第1の
発明に比して更に、共有メモリに他の計算機をバックア
ップしてはならない時刻情報及び各計算機毎にバックア
ップすべき計算機の優先順位情報が書き込まれた切換制
限情報テーブルが備えられる。バックアップ計算機の決
定は、共有メモリの負荷情報及び前記切換制限情報テー
ブルの情報に基づきなされる。つまり、所望により所定
計算機の性能を落としたくないような場合に、切換制限
情報テーブルにこの要望に係る情報を書き込んでおくこ
とにより、性能を落としたくない等の所定計算機を除外
して、自動的にシステムの効率的な運用が継続され得る
ように代行が行なわれる。
発明に比して更に、共有メモリに他の計算機をバックア
ップしてはならない時刻情報及び各計算機毎にバックア
ップすべき計算機の優先順位情報が書き込まれた切換制
限情報テーブルが備えられる。バックアップ計算機の決
定は、共有メモリの負荷情報及び前記切換制限情報テー
ブルの情報に基づきなされる。つまり、所望により所定
計算機の性能を落としたくないような場合に、切換制限
情報テーブルにこの要望に係る情報を書き込んでおくこ
とにより、性能を落としたくない等の所定計算機を除外
して、自動的にシステムの効率的な運用が継続され得る
ように代行が行なわれる。
【0011】上記第1、第2のいずれかの発明におい
て、状態監視/バックアップ手段が、自機の負荷が他機
の負荷に比べて軽い場合に、ダウンに係る計算機の処理
を受け継ぐように機能し、過負荷によるシステムの局所
的な性能低下を防止することができる。
て、状態監視/バックアップ手段が、自機の負荷が他機
の負荷に比べて軽い場合に、ダウンに係る計算機の処理
を受け継ぐように機能し、過負荷によるシステムの局所
的な性能低下を防止することができる。
【0012】
【実施例】以下、添付図面を参照して本発明の実施例に
係るコンピュータバックアップシステムを説明する。図
1には、本発明の実施例に係るコンピュータバックアッ
プシステムの構成図が示されている。このシステムにお
いては、計算機1〜計算機4が設けられており、この計
算機1〜計算機4は共有メモリ5を介して相互のダウン
に係る情報等を交換する。更に、計算機1〜計算機4は
夫々、ハードウエア資源及びソフトウエア資源を有して
おり、ここでは、磁気ディスク記憶装置6に制御回路7
を介して、オンライン回線9にオンライン切換回路8を
介して、夫々接続されている。また、各計算機1〜計算
機4には、計算機2に接続されている端末10の如き資
源が接続されるが、ここでは、説明の都合上図示されて
いない。
係るコンピュータバックアップシステムを説明する。図
1には、本発明の実施例に係るコンピュータバックアッ
プシステムの構成図が示されている。このシステムにお
いては、計算機1〜計算機4が設けられており、この計
算機1〜計算機4は共有メモリ5を介して相互のダウン
に係る情報等を交換する。更に、計算機1〜計算機4は
夫々、ハードウエア資源及びソフトウエア資源を有して
おり、ここでは、磁気ディスク記憶装置6に制御回路7
を介して、オンライン回線9にオンライン切換回路8を
介して、夫々接続されている。また、各計算機1〜計算
機4には、計算機2に接続されている端末10の如き資
源が接続されるが、ここでは、説明の都合上図示されて
いない。
【0013】各計算機1〜計算機4には、状態監視/バ
ックアップ手段1−1〜4−1と、負荷記録手段1−2
〜4−2とが備えられている。また、共有メモリ5に
は、各計算機1〜4対応の負荷情報テーブル5−1〜5
−4と、切換制限情報テーブル55とが備えられてい
る。計算機1〜計算機4の負荷記録手段1−2〜4−2
は、自機の負荷状態を監視し、検出した負荷情報を共有
メモリ5の対応する負荷情報テーブル5−1〜5−4に
書き込む。また、計算機1〜計算機4の状態監視/バッ
クアップ手段1−1〜4−1は、自機のダウンを監視
し、ダウンを検出した場合にはダウン情報を共有メモリ
5の対応する負荷情報テーブル5−1〜5−4に書き込
むと共に、共有メモリ5の負荷情報テーブル5−1〜5
−4のダウン情報を読み出して他機のダウンを監視し、
他機のダウンを検出した場合には、共有メモリ5の負荷
情報テーブル5−1〜5−4の負荷情報及び切換制限情
報テーブル55の情報に基づきバックアップ計算機を決
定してバックアップを実行する。切換制限情報テーブル
55には、例えば、図3に示すように、バックアップ時
の制限に関する情報が書き込まれる。即ち、計算機2の
性能低下を防止するため、図3の通りの時間帯AM.1
0:30〜PM.3:30には、計算機2を代行用とす
ることを禁じた情報(つまり、他の計算機をバックアッ
プしてはならない時刻情報)と、計算機2の代行を行う
計算機の優先順位に係る情報(つまり、各計算機毎にバ
ックアップすべき計算機の優先順位情報)とが、図の通
りに設定されている。この切換制限情報テーブル55に
設定する情報は、例えば、端末10から情報と共に切換
制限情報テーブル55に設定することの命令を入力する
と、計算機2により共有メモリ5に設定される。
ックアップ手段1−1〜4−1と、負荷記録手段1−2
〜4−2とが備えられている。また、共有メモリ5に
は、各計算機1〜4対応の負荷情報テーブル5−1〜5
−4と、切換制限情報テーブル55とが備えられてい
る。計算機1〜計算機4の負荷記録手段1−2〜4−2
は、自機の負荷状態を監視し、検出した負荷情報を共有
メモリ5の対応する負荷情報テーブル5−1〜5−4に
書き込む。また、計算機1〜計算機4の状態監視/バッ
クアップ手段1−1〜4−1は、自機のダウンを監視
し、ダウンを検出した場合にはダウン情報を共有メモリ
5の対応する負荷情報テーブル5−1〜5−4に書き込
むと共に、共有メモリ5の負荷情報テーブル5−1〜5
−4のダウン情報を読み出して他機のダウンを監視し、
他機のダウンを検出した場合には、共有メモリ5の負荷
情報テーブル5−1〜5−4の負荷情報及び切換制限情
報テーブル55の情報に基づきバックアップ計算機を決
定してバックアップを実行する。切換制限情報テーブル
55には、例えば、図3に示すように、バックアップ時
の制限に関する情報が書き込まれる。即ち、計算機2の
性能低下を防止するため、図3の通りの時間帯AM.1
0:30〜PM.3:30には、計算機2を代行用とす
ることを禁じた情報(つまり、他の計算機をバックアッ
プしてはならない時刻情報)と、計算機2の代行を行う
計算機の優先順位に係る情報(つまり、各計算機毎にバ
ックアップすべき計算機の優先順位情報)とが、図の通
りに設定されている。この切換制限情報テーブル55に
設定する情報は、例えば、端末10から情報と共に切換
制限情報テーブル55に設定することの命令を入力する
と、計算機2により共有メモリ5に設定される。
【0014】計算機1〜4は、制御回路7を介して磁気
ディスク記憶装置6をアクセスすることができ、例え
ば、現在実行中のプログラム名及び実行中のアドレス、
更に収集し或いは演算した結果のデータ等を対応のエリ
アに書き込む。このようにして、代行時のために備えて
情報が書き込まれた磁気ディスク記憶装置6のメモリマ
ップが図2に示されている。この磁気ディスク記憶装置
6には、上記のように各計算機1〜4が用いる4分割さ
れた代行時のために備えて情報が書き込まれたエリア6
1の他に、各業務を実行するための複数のプログラムが
記憶されたエリア62が設けられている。
ディスク記憶装置6をアクセスすることができ、例え
ば、現在実行中のプログラム名及び実行中のアドレス、
更に収集し或いは演算した結果のデータ等を対応のエリ
アに書き込む。このようにして、代行時のために備えて
情報が書き込まれた磁気ディスク記憶装置6のメモリマ
ップが図2に示されている。この磁気ディスク記憶装置
6には、上記のように各計算機1〜4が用いる4分割さ
れた代行時のために備えて情報が書き込まれたエリア6
1の他に、各業務を実行するための複数のプログラムが
記憶されたエリア62が設けられている。
【0015】更に、各計算機1〜4は、オンライン切換
回路8を制御信号線8Cを介して制御し、必要な場合に
オンライン回線9に接続されるようにする。各計算機1
〜4は、これらの磁気ディスク記憶装置6、オンライン
回線9以外に、ハードウエア資源に接続されている。ま
た、各計算機1〜4には、図4に示されるような重みテ
ーブル41を有している。この重みテーブル41には、
計算機1〜4が実行している処理に対応した資源(対
象)毎に、重要度情報が記憶されている。各計算機1〜
4には、図4に示されるような、資源(対象)対応にそ
の稼働率を書き込むためのレジスタ51が備えられてい
る。図6には、上記重みテーブル41とレジスタ51と
を並べて、負荷情報を算出するためのテーブル60が備
えられている。
回路8を制御信号線8Cを介して制御し、必要な場合に
オンライン回線9に接続されるようにする。各計算機1
〜4は、これらの磁気ディスク記憶装置6、オンライン
回線9以外に、ハードウエア資源に接続されている。ま
た、各計算機1〜4には、図4に示されるような重みテ
ーブル41を有している。この重みテーブル41には、
計算機1〜4が実行している処理に対応した資源(対
象)毎に、重要度情報が記憶されている。各計算機1〜
4には、図4に示されるような、資源(対象)対応にそ
の稼働率を書き込むためのレジスタ51が備えられてい
る。図6には、上記重みテーブル41とレジスタ51と
を並べて、負荷情報を算出するためのテーブル60が備
えられている。
【0016】上記構成を有する計算機1〜4には、図7
に示されているフローチャートのプログラムが備えられ
ており、負荷情報を算出するための用いる。以下に、こ
のフローチャートを参照して、負荷記録手段1−2〜4
−2が負荷情報を算出する動作を説明する。所定の時間
おきに、図7のフローチャートのプログラムがスタート
となり、負荷を計算する対象に係るCPU、ディスク、
I/O、オンライン等のハードウエア資源について、稼
働率の監視を開始する(71)。例えば、CPUが演算
等の処理を開始してから終了する間での時間を累積して
稼働時間とし、所定時間中にこの累積作業を継続する。
所定時間の経過を検出して(72)、当該所定時間が経
過すると、稼働率を上記所定時間内の稼動時間の割合と
して求め、レジスタに書き込む(73)。このようにし
て各対象について、稼働率を求め終わると、図6のテー
ブル60を用いて、各対象の負荷を重要度情報に稼働率
を乗じて求め、合計の負荷を算出する(74)。このよ
うにして、求めた負荷情報を共有メモリ5の対応する負
荷情報テーブルに書き込み(75)、終了する。この様
な処理が、所定時間間隔になされて、基本的には常に、
その時点の各計算機1〜4の付加情報が、共有メモリ5
の対応する負荷情報テーブル5−1〜5−4に書き込ま
れていることになる。
に示されているフローチャートのプログラムが備えられ
ており、負荷情報を算出するための用いる。以下に、こ
のフローチャートを参照して、負荷記録手段1−2〜4
−2が負荷情報を算出する動作を説明する。所定の時間
おきに、図7のフローチャートのプログラムがスタート
となり、負荷を計算する対象に係るCPU、ディスク、
I/O、オンライン等のハードウエア資源について、稼
働率の監視を開始する(71)。例えば、CPUが演算
等の処理を開始してから終了する間での時間を累積して
稼働時間とし、所定時間中にこの累積作業を継続する。
所定時間の経過を検出して(72)、当該所定時間が経
過すると、稼働率を上記所定時間内の稼動時間の割合と
して求め、レジスタに書き込む(73)。このようにし
て各対象について、稼働率を求め終わると、図6のテー
ブル60を用いて、各対象の負荷を重要度情報に稼働率
を乗じて求め、合計の負荷を算出する(74)。このよ
うにして、求めた負荷情報を共有メモリ5の対応する負
荷情報テーブルに書き込み(75)、終了する。この様
な処理が、所定時間間隔になされて、基本的には常に、
その時点の各計算機1〜4の付加情報が、共有メモリ5
の対応する負荷情報テーブル5−1〜5−4に書き込ま
れていることになる。
【0017】また、計算機1〜4には、図8に示されて
いるフローチャートのプログラムが備えられており、状
態監視並びに代行処理が実現される。以下に、このフロ
ーチャートを参照して、状態監視/バックアップ手段1
−1〜4−1が状態監視並びに代行処理をするときの動
作を説明する。状態監視の動作では、自機が異常でダウ
ンとなるか否かを、例えば、ウオッチドッグタイマ等に
より検出し(90)、自機のダウンを検出すると、共有
メモリ5の対応負荷情報テーブル5−1〜5−4にダウ
ンの旨を書き込み(99)、オペレータの介入を待つ待
機状態に入る。一方、自機がダウンでないときには、共
有メモリ5の負荷情報テーブル5−1〜5−4から、他
機の状態情報を取り出し(91)、ダウンとなった計算
機があるかを検出する(92)。ここでダウンとなった
計算機が検出できなければ、メインの処理ルーチンへ戻
るが、ダウンとなった計算機があるときには、共有メモ
リの各計算機対応の負荷情報テーブル5−1〜5−4か
ら負荷情報を取り出し(93)、負荷が一番軽い計算機
が自機であるか否かを検出することにより、ダウンに係
る計算機の処理を自機へ切り換えることになるのか否か
を判定する(94)。ここで、ダウンに係る計算機の処
理を自機へ切り換えることにならぬと判定したときに
は、メインの処理ルーチンへ戻るが、ダウンに係る計算
機の処理を自機へ切り換えるべきであると判定したとき
には、共有メモリ5の切換制限情報テーブル55にセッ
トされているバックアップ時の制限に関する情報を読み
出し(95)、自機へ切り換えることが制限を受けるこ
とになるかを検出する。例えば、図3に示されるような
情報が切換制限情報テーブル55にセットされている場
合において、計算機2がダウンした計算機1の処理を代
行する時には、時刻が午前10時30分から午後3時3
0分であると、代行ができないことになる。
いるフローチャートのプログラムが備えられており、状
態監視並びに代行処理が実現される。以下に、このフロ
ーチャートを参照して、状態監視/バックアップ手段1
−1〜4−1が状態監視並びに代行処理をするときの動
作を説明する。状態監視の動作では、自機が異常でダウ
ンとなるか否かを、例えば、ウオッチドッグタイマ等に
より検出し(90)、自機のダウンを検出すると、共有
メモリ5の対応負荷情報テーブル5−1〜5−4にダウ
ンの旨を書き込み(99)、オペレータの介入を待つ待
機状態に入る。一方、自機がダウンでないときには、共
有メモリ5の負荷情報テーブル5−1〜5−4から、他
機の状態情報を取り出し(91)、ダウンとなった計算
機があるかを検出する(92)。ここでダウンとなった
計算機が検出できなければ、メインの処理ルーチンへ戻
るが、ダウンとなった計算機があるときには、共有メモ
リの各計算機対応の負荷情報テーブル5−1〜5−4か
ら負荷情報を取り出し(93)、負荷が一番軽い計算機
が自機であるか否かを検出することにより、ダウンに係
る計算機の処理を自機へ切り換えることになるのか否か
を判定する(94)。ここで、ダウンに係る計算機の処
理を自機へ切り換えることにならぬと判定したときに
は、メインの処理ルーチンへ戻るが、ダウンに係る計算
機の処理を自機へ切り換えるべきであると判定したとき
には、共有メモリ5の切換制限情報テーブル55にセッ
トされているバックアップ時の制限に関する情報を読み
出し(95)、自機へ切り換えることが制限を受けるこ
とになるかを検出する。例えば、図3に示されるような
情報が切換制限情報テーブル55にセットされている場
合において、計算機2がダウンした計算機1の処理を代
行する時には、時刻が午前10時30分から午後3時3
0分であると、代行ができないことになる。
【0018】上記において、自機へ切り換えることが制
限を受けることになる場合には、メインの処理ルーチン
へ戻るが、自機へ切り換えることが制限を受けない場合
には、磁気ディスク記憶装置6のダウンに係る計算機の
使用エリアより、現在実行中のプログラム名及び実行中
のアドレス、更に収集し或いは演算した結果のデータ等
の情報を読み出し、必要な場合にはオンライン切換回路
8等の切り換え制御等を行って、必要な資源を受け継ぐ
べく動作を実行する(97)。ここにおいて各計算機1
〜4は、プログラム名の識別情報に対応して分類を行う
処理を備えており、ここで、プログラム名の識別情報に
応じて、当該プログラムをそのまま当該実行アドレスか
ら継続するか、当該プログラムの最初へ戻ってから実行
するか、或いは所定ステップ前から実行するか等を調べ
る。例えば、オンラインによりデータを収集するプログ
ラムが実行されているようなプログラムの場合には、当
該プログラムの最初から実行がなされ、単にデータ演算
を行っていた場合には、所定ステップ前からの処理実行
となる。いずれかの処理が決定されると、各種パラメー
タの設定等がなされ、実行の環境が整えられる。次に、
代行した計算機では、当該引継ぎに係る処理プログラム
が起動され、バックアップが完了し、自機が行っていた
原処理をも実行すると共に、受け継いだ処理に応じて、
図4に示した重要度情報を切り換えて処理を進める(9
8)。なお、処理を受け継いだ計算機は共有メモリ5の
対応する負荷情報テーブル5−1〜5−4へ、ダウンし
た計算機の処理を代行する旨を書き込み、他機へ通知す
る。
限を受けることになる場合には、メインの処理ルーチン
へ戻るが、自機へ切り換えることが制限を受けない場合
には、磁気ディスク記憶装置6のダウンに係る計算機の
使用エリアより、現在実行中のプログラム名及び実行中
のアドレス、更に収集し或いは演算した結果のデータ等
の情報を読み出し、必要な場合にはオンライン切換回路
8等の切り換え制御等を行って、必要な資源を受け継ぐ
べく動作を実行する(97)。ここにおいて各計算機1
〜4は、プログラム名の識別情報に対応して分類を行う
処理を備えており、ここで、プログラム名の識別情報に
応じて、当該プログラムをそのまま当該実行アドレスか
ら継続するか、当該プログラムの最初へ戻ってから実行
するか、或いは所定ステップ前から実行するか等を調べ
る。例えば、オンラインによりデータを収集するプログ
ラムが実行されているようなプログラムの場合には、当
該プログラムの最初から実行がなされ、単にデータ演算
を行っていた場合には、所定ステップ前からの処理実行
となる。いずれかの処理が決定されると、各種パラメー
タの設定等がなされ、実行の環境が整えられる。次に、
代行した計算機では、当該引継ぎに係る処理プログラム
が起動され、バックアップが完了し、自機が行っていた
原処理をも実行すると共に、受け継いだ処理に応じて、
図4に示した重要度情報を切り換えて処理を進める(9
8)。なお、処理を受け継いだ計算機は共有メモリ5の
対応する負荷情報テーブル5−1〜5−4へ、ダウンし
た計算機の処理を代行する旨を書き込み、他機へ通知す
る。
【0019】以上の実施例では、決定された1つの計算
機が、ダウンした計算機の全ての処理を受け継ぐように
したが、他の実施例では、ダウンした計算機が複数の処
理を実行しているような場合には、処理毎に異なる計算
機に代行させるようにする。この場合には、負荷情報は
処理毎に作成され、共有メモリ5の各計算機の対応する
負荷情報テーブル5−1〜5−4へ書き込まれる。この
実施例によれば、よりきめ細かく負荷を分散させてシス
テムが局所的に機能低下することを防止できる。
機が、ダウンした計算機の全ての処理を受け継ぐように
したが、他の実施例では、ダウンした計算機が複数の処
理を実行しているような場合には、処理毎に異なる計算
機に代行させるようにする。この場合には、負荷情報は
処理毎に作成され、共有メモリ5の各計算機の対応する
負荷情報テーブル5−1〜5−4へ書き込まれる。この
実施例によれば、よりきめ細かく負荷を分散させてシス
テムが局所的に機能低下することを防止できる。
【0020】
【発明の効果】以上説明したように第1の本発明によれ
ば、共有メモリに各計算機が各計算機毎にサポートされ
ている資源の重要度情報が記憶されている重みテーブル
を有し、前記資源の稼働率と前記重みテーブルの重要度
情報とに基づき各計算機毎に自機の負荷情報を算出し、
算出した負荷情報を書き込みながら動作すると共に、あ
る計算機がダウンした場合に、この計算機のバックアッ
プ処理を行う計算機を上記共有メモリの各計算機の負荷
情報に基づき決定するように構成されているため、過負
荷によるシステムの局所的な性能低下を防止することが
でき、システムの効率化を図ることができる。
ば、共有メモリに各計算機が各計算機毎にサポートされ
ている資源の重要度情報が記憶されている重みテーブル
を有し、前記資源の稼働率と前記重みテーブルの重要度
情報とに基づき各計算機毎に自機の負荷情報を算出し、
算出した負荷情報を書き込みながら動作すると共に、あ
る計算機がダウンした場合に、この計算機のバックアッ
プ処理を行う計算機を上記共有メモリの各計算機の負荷
情報に基づき決定するように構成されているため、過負
荷によるシステムの局所的な性能低下を防止することが
でき、システムの効率化を図ることができる。
【0021】更に第2の発明によれば、共有メモリには
他の計算機をバックアップしてはならない時刻情報及び
各計算機毎にバックアップすべき計算機の優先順位情報
が書き込まれた切換制限情報テーブルが備えられ、これ
により、バックアップ処理を行う計算機を決定するよう
に構成されているため、所望により所定計算機の性能を
落としたくないような場合に、切換制限情報テーブルに
この要望に係る情報を書き込んでおくことにより、性能
を落としたくない等の所定計算機を除外して、自動的に
システムの効率的な運用が継続され得るように代行が行
なわれる。即ち、ユーザの要望を適切に取り入れ、しか
も、自動的にシステムの効率的な運用が継続される効果
を奏する。
他の計算機をバックアップしてはならない時刻情報及び
各計算機毎にバックアップすべき計算機の優先順位情報
が書き込まれた切換制限情報テーブルが備えられ、これ
により、バックアップ処理を行う計算機を決定するよう
に構成されているため、所望により所定計算機の性能を
落としたくないような場合に、切換制限情報テーブルに
この要望に係る情報を書き込んでおくことにより、性能
を落としたくない等の所定計算機を除外して、自動的に
システムの効率的な運用が継続され得るように代行が行
なわれる。即ち、ユーザの要望を適切に取り入れ、しか
も、自動的にシステムの効率的な運用が継続される効果
を奏する。
【図1】本発明の実施例に係るコンピュータバックアッ
プシステムの構成図。
プシステムの構成図。
【図2】本発明の実施例に採用されている磁気ディスク
記憶装置のメモリマップを示す図。
記憶装置のメモリマップを示す図。
【図3】本発明の実施例に採用されている切換制限情報
テーブルのメモリマップを示す図。
テーブルのメモリマップを示す図。
【図4】本発明の実施例に採用されている資源対応の重
要度情報の重みテーブルの内容の一例を示す図。
要度情報の重みテーブルの内容の一例を示す図。
【図5】本発明の実施例に採用されている資源対応の稼
働率を書き込むレジスタを示す図。
働率を書き込むレジスタを示す図。
【図6】本発明の実施例に採用されている負荷情報算出
のためのテーブルの内容の一例を示す図。
のためのテーブルの内容の一例を示す図。
【図7】本発明の実施例に係るコンピュータバックアッ
プシステムの負荷情報書き込み動作を示すフローチャー
ト。
プシステムの負荷情報書き込み動作を示すフローチャー
ト。
【図8】本発明の実施例に係るコンピュータバックアッ
プシステムの状態監視並びに代行処理に係る動作を示す
フローチャート。
プシステムの状態監視並びに代行処理に係る動作を示す
フローチャート。
【図9】従来のコンピュータバックアップシステムの構
成図。
成図。
1〜4 計算機 5 共有メモリ 6 磁気ディスク記憶装置 7 制御回路 8 オンライン切換回路 9 オンライン
回線 10 端末 1−1〜4−1 状態監視/バックアップ手段 1−2〜4−2 負荷記録手段 5−1〜5−4 負荷情報記憶テーブル 55 切換制御情報記憶テーブル
回線 10 端末 1−1〜4−1 状態監視/バックアップ手段 1−2〜4−2 負荷記録手段 5−1〜5−4 負荷情報記憶テーブル 55 切換制御情報記憶テーブル
Claims (3)
- 【請求項1】 複数の計算機と、 この複数の計算機のダウン情報及び負荷情報が書き込ま
れる共有メモリと、各計算機毎にサポートされている資源の重要度情報が記
憶されている重みテーブルを有し、前記資源の稼働率と
前記重みテーブルの重要度情報とに基づき各計算機毎に
自機の負荷情報を算出し、算出した 負荷情報を前記共有
メモリに書き込む負荷記録手段と、 各計算機毎に自機のダウンを監視し、ダウンを検出した
場合にはダウン情報を前記共有メモリに書き込むと共
に、前記共有メモリのダウン情報を読み出し他機のダウ
ンを監視し、他機のダウンを検出した場合には、前記共
有メモリの負荷情報に基づきバックアップ計算機を決定
してバックアップを実行する状態監視/バックアップ手
段と を有することを特徴とするコンピュータバックアップシ
ステム。 - 【請求項2】 複数の計算機と、この複数の計算機のダ
ウン情報及び負荷情報が書き込まれると共に、他の計算
機をバックアップしてはならない時刻情報及び各計算機
毎にバックアップすべき計算機の優先順位情報が書き込
まれた切換制限情報テーブルを有する共有メモリと、各計算機毎にサポートされている資源の重要度情報が記
憶されている重みテーブルを有し、前記資源の稼働率と
前記重みテーブルの重要度情報とに基づき各計算機毎に
自機の負荷情報を算出し、算出した 負荷情報を前記共有
メモリに書き込む負荷記録手段と、 各計算機毎に自機のダウンを監視し、ダウンを検出した
場合にはダウン情報を前記共有メモリに書き込むと共
に、前記共有メモリのダウン情報を読み出し他機のダウ
ンを監視し、他機のダウンを検出した場合には、前記共
有メモリの負荷情報及び前記切換制限情報テーブルの情
報に基づきバックアップ計算機を決定してバックアップ
を実行する状態監視/バックアップ手段とを有すること
を特徴とするコンピュータバックアップシステム。 - 【請求項3】 状態監視/バックアップ手段は、自機の
負荷が他機の負荷に比べて軽い場合に、ダウンに係る計
算機の処理を受け継ぐことを特徴とする請求項1または
請求項2に記載のコンピュータバックアップシステム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP21289293A JP3296378B2 (ja) | 1993-08-27 | 1993-08-27 | コンピュータバックアップシステム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP21289293A JP3296378B2 (ja) | 1993-08-27 | 1993-08-27 | コンピュータバックアップシステム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH0764811A JPH0764811A (ja) | 1995-03-10 |
JP3296378B2 true JP3296378B2 (ja) | 2002-06-24 |
Family
ID=16629997
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP21289293A Expired - Fee Related JP3296378B2 (ja) | 1993-08-27 | 1993-08-27 | コンピュータバックアップシステム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3296378B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008004330A1 (fr) * | 2006-07-04 | 2008-01-10 | Fujitsu Limited | Système à processeurs multiples |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6990606B2 (en) | 2000-07-28 | 2006-01-24 | International Business Machines Corporation | Cascading failover of a data management application for shared disk file systems in loosely coupled node clusters |
JP4796086B2 (ja) * | 2008-03-14 | 2011-10-19 | 株式会社東芝 | クラスタシステム及び同システムにおいてマスタノードを選択する方法 |
DE112015006749T5 (de) | 2015-07-30 | 2018-04-12 | Mitsubishi Electric Corporation | Programmausführvorrichtung, Programmausführsystem und Programmausführverfahren |
-
1993
- 1993-08-27 JP JP21289293A patent/JP3296378B2/ja not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008004330A1 (fr) * | 2006-07-04 | 2008-01-10 | Fujitsu Limited | Système à processeurs multiples |
Also Published As
Publication number | Publication date |
---|---|
JPH0764811A (ja) | 1995-03-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5805790A (en) | Fault recovery method and apparatus | |
US5802345A (en) | Computer system with a reduced number of command end interrupts from auxiliary memory unit and method of reducing the number of command end interrupts | |
US7243266B2 (en) | Computer system and detecting method for detecting a sign of failure of the computer system | |
JP3481737B2 (ja) | ダンプ採取装置およびダンプ採取方法 | |
JP4155399B2 (ja) | コンピュータ処理方法及びその実施システム並びにその処理プログラム | |
JPH02297228A (ja) | 障害情報格納方式 | |
JPS6363933B2 (ja) | ||
US7849264B2 (en) | Storage area management method for a storage system | |
JP4992740B2 (ja) | マルチプロセッサシステム、障害検出方法および障害検出プログラム | |
JP3296378B2 (ja) | コンピュータバックアップシステム | |
NL8401557A (nl) | Rekenmachinesysteem met verwijderd opgestelde werkstations en een reservebatterijvoeding. | |
JPH0744413A (ja) | コンピュータバックアップシステム | |
JPH05314075A (ja) | オンラインコンピュータ装置 | |
JPH0895614A (ja) | 制御装置 | |
JPH0277943A (ja) | システムリカバリ方法 | |
JPH0793173A (ja) | コンピュータネットワークシステムおよびそのコンピュータネットワークシステムの計算機に対するプロセス割り当て方法 | |
JPH1040123A (ja) | ジョブ管理方式と方法 | |
JPH04324569A (ja) | マルチプロセッサシステム | |
JP2699291B2 (ja) | 電源異常処理装置 | |
JP3464768B2 (ja) | ファイルロードを有するプロセッサ装置 | |
JP2000357058A (ja) | ディスクアレイ装置 | |
JP3463696B2 (ja) | オンラインガーベッジコレクション処理方法 | |
JPH03231338A (ja) | メモリダンプ領域管理方式 | |
JPS62198944A (ja) | 装置異常検出方式 | |
JPH11237959A (ja) | 多重書き込み記憶装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20020319 |
|
LAPS | Cancellation because of no payment of annual fees |