JPH04147348A - 計算機システムの障害復旧方式 - Google Patents
計算機システムの障害復旧方式Info
- Publication number
- JPH04147348A JPH04147348A JP2271742A JP27174290A JPH04147348A JP H04147348 A JPH04147348 A JP H04147348A JP 2271742 A JP2271742 A JP 2271742A JP 27174290 A JP27174290 A JP 27174290A JP H04147348 A JPH04147348 A JP H04147348A
- Authority
- JP
- Japan
- Prior art keywords
- failure
- processing
- recovery
- computer
- fault
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000011084 recovery Methods 0.000 title claims abstract description 46
- 238000000034 method Methods 0.000 title claims description 14
- 238000012545 processing Methods 0.000 claims abstract description 58
- 238000001514 detection method Methods 0.000 claims description 10
- 238000012544 monitoring process Methods 0.000 claims 1
- 238000000926 separation method Methods 0.000 abstract 1
- 238000012423 maintenance Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 1
Landscapes
- Hardware Redundancy (AREA)
- Multi Processors (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
[産業上の利用分野〕
本発明は計算機システム障害復旧方式に関し、特に業務
処理計算機と待機用計算機とで構成されるデ1ブレクス
構成の計算機システムの障害復旧方式に関する。
処理計算機と待機用計算機とで構成されるデ1ブレクス
構成の計算機システムの障害復旧方式に関する。
従来、デJプレクス構成の計算機システj1においては
、常に保守員が業務処理計算機の動作状況を監視し、本
番業務を運用している業務処理計算機に障害が発生した
場合、保守員が計算機から表示されるメツセージを確認
しながら、障害時運用マニュアルに記述されている復旧
手順に従って復旧処理を行っている。
、常に保守員が業務処理計算機の動作状況を監視し、本
番業務を運用している業務処理計算機に障害が発生した
場合、保守員が計算機から表示されるメツセージを確認
しながら、障害時運用マニュアルに記述されている復旧
手順に従って復旧処理を行っている。
r発明が解決しようとする課題]
デュプレクス構成の計算機システムによる業務処理にお
いては、障害時の復旧時間は非常に重要な問題である3
、L述した従来の計算機システムの障害復旧方式では、
障害が発生した場合に保守員か計算機に表示されるメツ
セージを確認し、障害時運用マニュアルに従って手動で
復旧処理を行うため、保守員の不慣れや操作ミスによっ
て必要以上に時間がかかってしまう問題点があった。
いては、障害時の復旧時間は非常に重要な問題である3
、L述した従来の計算機システムの障害復旧方式では、
障害が発生した場合に保守員か計算機に表示されるメツ
セージを確認し、障害時運用マニュアルに従って手動で
復旧処理を行うため、保守員の不慣れや操作ミスによっ
て必要以上に時間がかかってしまう問題点があった。
本発明の目的は、保守員の経験に頼らずに復旧処理を自
動的に行う計算機システムの障害復旧方式を提供するこ
とである。
動的に行う計算機システムの障害復旧方式を提供するこ
とである。
本発明の計算機システムは、猶務処理計算機と待機用計
算機とを有する計算機システムの障害復旧方式において
、+nF記業務処理計算機の動作を監視し障害発生を検
出して障害情報を送出する障害情報検出手段と、+ij
r記障害情報検出手段から送出される各種障害情報に対
応して復旧対象計算機と対処すべき障害復旧処理情報と
が実施順に記憶された障害処理情報記憶部と、前記障害
情報検出手段から送出された障害情報をキーとして前記
障害処理情報記憶部を検索し対応する障害復旧処理情報
を得る検索手段と、得られた障害復旧処理情報に基づい
て復111対象計算機に対して順次障害復旧処理を行う
実行手段とを備えて構成されている。
算機とを有する計算機システムの障害復旧方式において
、+nF記業務処理計算機の動作を監視し障害発生を検
出して障害情報を送出する障害情報検出手段と、+ij
r記障害情報検出手段から送出される各種障害情報に対
応して復旧対象計算機と対処すべき障害復旧処理情報と
が実施順に記憶された障害処理情報記憶部と、前記障害
情報検出手段から送出された障害情報をキーとして前記
障害処理情報記憶部を検索し対応する障害復旧処理情報
を得る検索手段と、得られた障害復旧処理情報に基づい
て復111対象計算機に対して順次障害復旧処理を行う
実行手段とを備えて構成されている。
〔実施例〕
次に、本発明の実施例について図面を参照して説明する
。
。
第1図は本発明の一実施例の構成を示すブロック図であ
る。
る。
障害情報検出部11は常に業務処理計算機10から出力
されるメツセージを監視しており、障害メツセージを検
出すると障害処理レコード検索部12に障害情報を送出
する。例えば、業務処理計算機10にディスク障害が発
生すると、障害情報検出部11はディスク障害が発生し
たことを業務処理計算@10から出力されるメツセージ
により検出し、ディスク障害情報を障害処理レコード検
索部12に送出する。
されるメツセージを監視しており、障害メツセージを検
出すると障害処理レコード検索部12に障害情報を送出
する。例えば、業務処理計算機10にディスク障害が発
生すると、障害情報検出部11はディスク障害が発生し
たことを業務処理計算@10から出力されるメツセージ
により検出し、ディスク障害情報を障害処理レコード検
索部12に送出する。
障害処理1/コ一ド検索部12は、障害情報検出部】1
から受は取った障害情報をキーと1〜で、障害処理レコ
ード14を検索する。
から受は取った障害情報をキーと1〜で、障害処理レコ
ード14を検索する。
第3図は障害処理レコード14の内部形式を示す説明図
である。障害処理レコード14はあらかじめ利用者が作
成するものであり、第3図に示すように、各障害シー1
−ドには障害内容16に示す障害情報検出部]1からの
障害情報をキーとし、復旧処理の対象となる復旧対象計
算機17と、復旧のために行う障害復旧処理18が実行
する手順どうりに格納されている。障害復旧処理18は
、JI算機に投入する命令形式かそのままの形で格納さ
れている5、:こで復旧対象計算機17の情報が必要な
のは、障害の程度によっては必ずしも待機用計算機]5
を使用する必要がないからである。
である。障害処理レコード14はあらかじめ利用者が作
成するものであり、第3図に示すように、各障害シー1
−ドには障害内容16に示す障害情報検出部]1からの
障害情報をキーとし、復旧処理の対象となる復旧対象計
算機17と、復旧のために行う障害復旧処理18が実行
する手順どうりに格納されている。障害復旧処理18は
、JI算機に投入する命令形式かそのままの形で格納さ
れている5、:こで復旧対象計算機17の情報が必要な
のは、障害の程度によっては必ずしも待機用計算機]5
を使用する必要がないからである。
障害処理I/コート検索部12で、例えば、障害内容が
ディスク障害である障害レコードを検索したとする3、
復旧処理実行部]3では、検索した障害レコードから、
まず、どの計算機を復旧の対象にするかを決定する6そ
の後、決定した復旧対象の業務処理計算機10に対して
、最初の障害復旧処理で・ある営業店業務閉塞処理を実
行する。復旧処理実行部13は、営業店業務閉塞処理が
終了したことを業務処理計算機10が出力するメツセー
ジにより確認し、次の復旧処理である障害ディスクの切
り離し%理を実行する。
ディスク障害である障害レコードを検索したとする3、
復旧処理実行部]3では、検索した障害レコードから、
まず、どの計算機を復旧の対象にするかを決定する6そ
の後、決定した復旧対象の業務処理計算機10に対して
、最初の障害復旧処理で・ある営業店業務閉塞処理を実
行する。復旧処理実行部13は、営業店業務閉塞処理が
終了したことを業務処理計算機10が出力するメツセー
ジにより確認し、次の復旧処理である障害ディスクの切
り離し%理を実行する。
このようにして、検索l−た障害レコード中のすべての
障害復旧処理が完了するまで同様な処理を継続j〜、最
後の営業店業務再開処理を実行すると障害復旧が完了す
る。
障害復旧処理が完了するまで同様な処理を継続j〜、最
後の営業店業務再開処理を実行すると障害復旧が完了す
る。
以上詳細に説明[7たように、本発明は、障害情報の検
出から復旧処理までを一元的な管理のfで自動化するこ
とにより、障害復旧処理の高速化。
出から復旧処理までを一元的な管理のfで自動化するこ
とにより、障害復旧処理の高速化。
高信頼化を実現できる効果を有する。
第1−図は本発明の一実施例の構成を示すブロック図、
第2図は本実施例の障害処理レコードの内容を示す説明
図である。 10・・・・・・業務処理計算機、1−1・・・・・・
障害情報検出部、12・・・・・・障害処理レコード検
索部、]3・・・・・・復旧処理実行部、14・・・・
・・障害処理レコード、15・・・・・・待機用計算機
。
第2図は本実施例の障害処理レコードの内容を示す説明
図である。 10・・・・・・業務処理計算機、1−1・・・・・・
障害情報検出部、12・・・・・・障害処理レコード検
索部、]3・・・・・・復旧処理実行部、14・・・・
・・障害処理レコード、15・・・・・・待機用計算機
。
Claims (1)
- 業務処理計算機と待機用計算機とを有する計算機システ
ムの障害復旧方式において、前記業務処理計算機の動作
を監視し障害発生を検出して障害情報を送出する障害情
報検出手段と、前記障害情報検出手段から送出される各
種障害情報に対応して復旧対象計算機と対処すべき障害
復旧処理情報とが実施順に記憶された障害処理情報記憶
部と、前記障害情報検出手段から送出された障害情報を
キーとして前記障害処理情報記憶部を検索し対応する障
害復旧処理情報を得る検索手段と、得られた障害復旧処
理情報に基づいて復旧対象計算機に対して順次障害復旧
処理を行う実行手段とを備えたことを特徴とする計算機
システムの障害復旧方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2271742A JPH04147348A (ja) | 1990-10-09 | 1990-10-09 | 計算機システムの障害復旧方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2271742A JPH04147348A (ja) | 1990-10-09 | 1990-10-09 | 計算機システムの障害復旧方式 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH04147348A true JPH04147348A (ja) | 1992-05-20 |
Family
ID=17504200
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2271742A Pending JPH04147348A (ja) | 1990-10-09 | 1990-10-09 | 計算機システムの障害復旧方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH04147348A (ja) |
-
1990
- 1990-10-09 JP JP2271742A patent/JPH04147348A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10545807B2 (en) | Method and system for acquiring parameter sets at a preset time interval and matching parameters to obtain a fault scenario type | |
CN112506702B (zh) | 数据中心容灾方法、装置、设备及存储介质 | |
WO2016183967A1 (zh) | 一种关键组件的故障告警方法、装置及大数据管理系统 | |
CN110120983A (zh) | 基于inotify和rsync自动化安装部署实现SVN实时同步备份的方法和系统 | |
WO2022088861A1 (zh) | 数据库故障处理方法和装置 | |
CN109117317A (zh) | 一种集群故障恢复方法和相关装置 | |
US20220342788A1 (en) | Anomaly location estimating apparatus, method, and program | |
JPH10312321A (ja) | オンラインシステム障害解析方法 | |
CN115102838B (zh) | 服务器宕机风险的应急处理方法和装置、电子设备 | |
CN111162938A (zh) | 数据处理系统及方法 | |
JPH04147348A (ja) | 計算機システムの障害復旧方式 | |
CN109144815A (zh) | 一种实时检测的计算机故障处理系统 | |
JP2003085003A (ja) | 障害復旧援助方法、及び、障害復旧援助システム | |
JP3867868B2 (ja) | 障害統合管理装置 | |
JP2014078067A (ja) | データベースシステム、データベース装置、データベースの障害回復方法およびプログラム | |
CN102436397B (zh) | 一种基于windows服务控制器的系统自动运行方法 | |
CN117851520B (zh) | 证券核心交易引擎的数据同步方法、系统、设备及介质 | |
CN102968320A (zh) | 基于云备份的工控设备自动恢复系统及其运行方法 | |
JPH0955735A (ja) | 通信網故障診断システムおよび通信網故障診断方法 | |
JPH08249212A (ja) | 多重化されたコンピュータシステムにおける障害監視方法 | |
JPH06250953A (ja) | コンピュータネットワーク監視支援システム | |
CN114528156A (zh) | 异构容灾方案的数据库切换方法、电子设备和介质 | |
JPH07182032A (ja) | プラントデ−タ監視装置 | |
JP2000209202A (ja) | ネットワ―ク障害管理方式 | |
CN118860718A (zh) | 操作系统在线故障检测方法、装置及存储介质 |