JPH05342025A - 仮想計算機システムの障害処理方式 - Google Patents

仮想計算機システムの障害処理方式

Info

Publication number
JPH05342025A
JPH05342025A JP4177503A JP17750392A JPH05342025A JP H05342025 A JPH05342025 A JP H05342025A JP 4177503 A JP4177503 A JP 4177503A JP 17750392 A JP17750392 A JP 17750392A JP H05342025 A JPH05342025 A JP H05342025A
Authority
JP
Japan
Prior art keywords
failure
gos
fault
processor
operating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4177503A
Other languages
English (en)
Inventor
Akito Sasaki
章人 佐々木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP4177503A priority Critical patent/JPH05342025A/ja
Publication of JPH05342025A publication Critical patent/JPH05342025A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 プロセッサで発生した命令リトライ不可障害
が及ぼす影響範囲を最小限に抑制して、仮想計算機シス
テム全体を停止させなくてもよくする。 【構成】 第1プロセッサ11で命令リトライ不可障害
が発生すると、障害モード診断手段21は障害が発生し
た第1プロセッサ11の動作モードを採取する。また、
HOS(ホストオペレーティングシステム)31の障害
通知手段311は、仮想計算機システムの運用中の障害
であった場合には障害モード診断手段21により採取さ
れた動作モードに基づいてVMM(仮想計算機モニタ)
41の動作中であればVMM41をダウンさせ、GOS
(ゲストオペレーティングシステム)の動作中であれば
その旨をVMM41に通知する。通知を受けたVMM4
1の仮想計算機障害処理手段411は、障害発生時に動
作していたGOSに障害を通知する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は仮想計算機システムのR
AS(Reliability,Availabili
ty and Serviceability)機能に
関し、特に仮想計算機システムの障害処理方式に関す
る。
【0002】
【従来の技術】仮想計算機システムは、仮想計算機シス
テム上で動作するゲストオペレーティングシステム(G
est Operating System;以下、G
OSと略記する),GOSを管理制御する仮想計算機モ
ニタ(Virtual Machine Monito
r;以下、VMMと略記する)などから構成される。
【0003】このような仮想計算機システムが実計算機
システムを制御するホストオペレーティングシステム
(Host Operating System;以
下、HOSと略記する)上で1ジョブとして動作する場
合、HOSの管理の対象はVMMだけである。このた
め、仮想計算機システムの運用中に発生するプロセッサ
障害は、VMMの動作中であっても、GOSの動作中で
あっても、HOSからはVMMの動作中の障害にしか見
えない。
【0004】また、仮想計算機システムの運用中、特に
GOSの動作中にプロセッサに発生する命令のリトライ
不可能な障害(以下、命令リトライ不可障害という)
は、他のGOSが動作可能な場合には動作可能なGOS
やこれらGOSを管理するVMMには影響を与えないの
で、仮想計算機システムを正常なプロセッサに引き継い
で運用すれば問題は生じない。
【0005】しかし、仮想計算機システム全体をVMM
だけで管理している現状では、命令リトライ不可障害の
障害処理はVMMをHOS上の1ジョブとしてジョブア
ボートさせるだけであったので、GOSの動作中の命令
リトライ不可障害でも仮想計算機システム全体が停止し
てしまっていた。
【0006】
【発明が解決しようとする課題】上述した従来の仮想計
算機システムの障害処理方式では、VMMによって複数
のGOSが動作可能な仮想計算機システムがHOSの管
理のもとで運用されているマルチプロセッサシステム
で、あるGOSの動作中にプロセッサに命令リトライ不
可障害が発生すると、VMMをHOS上の1ジョブとし
てジョブアボートさせていたので、その命令リトライ不
可障害による影響範囲が障害発生時に動作中のGOS内
で閉じる場合であっても仮想計算機システム全体が停止
してしまうという問題点があった。
【0007】本発明の目的は、上述の点に鑑み、プロセ
ッサに命令リトライ不可障害が発生した場合に命令リト
ライ不可障害による影響範囲を認識し、影響範囲が障害
発生時に動作中のGOS内で閉じる場合にはマルチプロ
セッサシステムの正常系のプロセッサで仮想計算機シス
テムを継続して運用できるようにした仮想計算機システ
ムの障害処理方式を提供することにある。
【0008】
【課題を解決するための手段】本発明の仮想計算機シス
テムの障害処理方式は、VMMによってGOSを同時に
複数動作させることができる仮想計算機システムが実計
算機システムを制御するHOSの管理のもとで動作して
いるマルチプロセッサシステムにおいて、プロセッサが
命令リトライ不可障害となったときに障害が発生したプ
ロセッサから動作モードを採取する障害モード診断手段
と、プロセッサの命令リトライ不可障害を認識したとき
に仮想計算機システムが運用中であったか否かをチェッ
クし、仮想計算機システムが運用中の場合は前記障害モ
ード診断手段で採取した結果をもとに動作していたのが
VMMであったかGOSであったかをチェックして通知
する障害通知手段と、この障害通知手段からGOSの動
作中の障害であったことが通知されたときに障害発生時
に動作中のGOSを検索し該GOSに対して障害を通知
する仮想計算機障害処理手段とを有する。
【0009】
【作用】本発明の仮想計算機システムの障害処理方式で
は、障害モード診断手段がプロセッサが命令リトライ不
可障害となったときに障害が発生したプロセッサから動
作モードを採取し、障害通知手段がプロセッサの命令リ
トライ不可障害を認識したときに仮想計算機システムが
運用中であったか否かをチェックし、仮想計算機システ
ムが運用中の場合は障害モード診断手段で採取した結果
をもとに動作していたのがVMMであったかGOSであ
ったかをチェックして通知し、仮想計算機障害処理手段
が障害通知手段からGOSの動作中の障害であったこと
が通知されたときに障害発生時に動作中のGOSを検索
し該GOSに対して障害を通知する。
【0010】
【実施例】次に、本発明について図面を参照して詳細に
説明する。
【0011】図1は、本発明の一実施例に係る仮想計算
機システムの障害処理方式の構成を示すブロック図であ
る。本実施例の仮想計算機システムの障害処理方式は、
障害系実計算機(以下、第1プロセッサという)11
と、正常系実計算機(以下、第2プロセッサという)1
2と、障害モード診断手段21と、障害通知手段311
を含むHOS31と、仮想計算機障害処理手段411を
含むVMM41と、VMM41上で動作する第1GOS
51,第2GOS52および第3GOS53とから構成
されている。
【0012】第1プロセッサ11および第2プロセッサ
12は、マルチプロセッサシステムとして運用される。
【0013】障害モード診断手段21は、第1プロセッ
サ11または第2プロセッサ12で命令リトライ不可障
害が発生したときに、障害発生時に動作していたのがG
OSであるかVMM41であるかHOS31上の一般ジ
ョブであるかを認識するために、命令リトライ不可障害
が発生したプロセッサの動作モードを採取する。障害モ
ード診断手段21は、例えばサービスプロセッサ,監視
プロセッサ等の上に実現される。
【0014】HOS31は、第1プロセッサ11および
第2プロセッサ12からなるマルチプロセッサシステム
を制御する。また、HOS31は、VMM41によって
GOSを同時に複数動作させることができる仮想計算機
システムを管理する。しかし、HOS31にとって仮想
計算機システムの管理の対象はVMM41だけでしかな
く、たとえGOSの動作中であっても、どのGOSが動
作中であるかの認識はなく、すべてVMM41が動作中
であると認識する。
【0015】障害通知手段311は、第1プロセッサ1
1または第2プロセッサ12で命令リトライ不可障害が
発生したときに動作し、障害発生時にHOS31から見
てVMM41が動作中であったか否かに基づいて仮想計
算機システムが運用中であったか否かをチェックする。
仮想計算機システムが運用中であった場合、障害通知手
段311は、障害モード診断手段21で採取した動作モ
ードから障害発生時の第1プロセッサ11または第2プ
ロセッサ12の動作モードをチェックする。
【0016】VMM41は、実計算機システム上で複数
のGOSを動作させる手段である。
【0017】仮想計算機障害処理手段411は、GOS
の動作中にプロセッサで命令リトライ不可障害が発生し
た場合、障害発生時にプロセッサで動作していたGOS
を検索し、そのGOSに命令リトライ不可障害を通知す
る。
【0018】図2を参照すると、本実施例の仮想計算機
システムの障害処理方式における処理は、障害発生認識
ステップS1と、障害プロセッサ動作モード取得ステッ
プS2と、障害発生認識ステップS3と、仮想計算機シ
ステム運用中判断ステップS4と、一般ジョブ障害処理
ステップS5と、障害動作モード取得ステップS6と、
GOS動作中判断ステップS7と、VMMダウン処理ス
テップS8と、障害時GOS検索ステップS9と、障害
時GOS判断ステップS10と、第1GOS障害処理ス
テップS11と、第2GOS障害処理ステップS12
と、第3GOS障害処理ステップS13とからなる。
【0019】次に、このように構成された本実施例の仮
想計算機システムの障害処理方式の動作について説明す
る。
【0020】いま、マルチプロセッサシステムで運転中
の第1プロセッサ11で命令リトライ不可障害が発生し
たとすると、正常系として残った第2プロセッサ12で
HOS31が障害処理を行う。
【0021】このとき、障害モード診断手段21は、第
1プロセッサ11での命令リトライ不可障害の発生を認
識すると(ステップS1)、障害となった第1プロセッ
サ11の動作モードを採取する(ステップS2)。
【0022】また、HOS31は、障害発生時に第1プ
ロセッサ11で仮想計算機システムが運用中であったか
否かをチェックする(ステップS4)。
【0023】仮想計算機システムが運用中でなければ、
HOS31上の一般ジョブにおける障害の発生であるの
で、HOS31は、一般ジョブの障害処理を行う(ステ
ップS5)。
【0024】仮想計算機システムが運用中であれば、H
OS31は、さらに障害モード診断手段21で採取した
動作モードを取得して(ステップS6)、GOSの動作
中か否かをチェックする(ステップS7)。
【0025】動作モードがGOSの動作中以外であった
場合、すなわちVMM41の動作中であった場合には、
VMM41は複数の第1GOS51,第2GOS52お
よび第3GOS53を制御するものであるから、VMM
41の動作中の命令リトライ不可障害は第1GOS5
1,第2GOS52および第3GOS53のすべてに影
響を及ぼすことがあるので、HOS31は、VMM41
をダウンさせて仮想計算機システム全体を終了させる
(ステップS8)。
【0026】一方、動作モードがGOSの動作中であっ
た場合は、命令リトライ不可障害によって影響を受ける
範囲はそのときに動作中のGOSだけであるので、HO
S31は、障害通知手段311によりVMM41に命令
リトライ不可障害の発生を通知する。
【0027】VMM41は、命令リトライ不可障害の発
生通知を受けると、仮想計算機障害処理手段411によ
り障害発生時に動作中のGOSを検索し(ステップS
9)、検索されたGOSに対して命令リトライ不可障害
を通知する(ステップS10)。
【0028】命令リトライ不可障害の通知を受けたGO
Sは、一般に行われるGOSの障害処理を行う(ステッ
プS11〜S13)。
【0029】
【発明の効果】以上説明したように本発明は、マルチプ
ロセッサシステムを構成するプロセッサで命令リトライ
不可障害が発生した場合にその障害による影響範囲を認
識し、影響範囲が障害発生時に動作中のGOS内で閉じ
る場合にはマルチプロセッサシステムの正常系のプロセ
ッサで仮想計算機システムを継続して運用できるように
したことにより、プロセッサで命令リトライ不可障害が
発生してもその影響範囲を最小限に抑制することが可能
になるという効果がある。
【図面の簡単な説明】
【図1】本発明の一実施例に係る仮想計算機システムの
障害処理方式の構成を示すブロック図である。
【図2】本実施例の仮想計算機システムの障害処理方式
においてマルチプロセッサシステムの片系のプロセッサ
が命令リトライ不可障害になったときの障害処理の概要
を示す流れ図である。
【符号の説明】
11 第1プロセッサ 12 第2プロセッサ 21 障害モード診断手段 31 HOS 41 VMM 51 第1GOS 52 第2GOS 53 第3GOS 311 障害通知手段 411 仮想計算機障害処理手段

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 VMMによってGOSを同時に複数動作
    させることができる仮想計算機システムが実計算機シス
    テムを制御するHOSの管理のもとで運用されているマ
    ルチプロセッサシステムにおいて、 プロセッサが命令リトライ不可障害となったときに障害
    が発生したプロセッサから動作モードを採取する障害モ
    ード診断手段と、 プロセッサの命令リトライ不可障害を認識したときに仮
    想計算機システムが運用中であったか否かをチェック
    し、仮想計算機システムが運用中の場合は前記障害モー
    ド診断手段で採取した結果をもとに動作していたのがV
    MMであったかGOSであったかをチェックして通知す
    る障害通知手段と、 この障害通知手段からGOSの動作中の障害であったこ
    とが通知されたときに障害発生時に動作中のGOSを検
    索し該GOSに対して障害を通知する仮想計算機障害処
    理手段とを有することを特徴とする仮想計算機システム
    の障害処理方式。
JP4177503A 1992-06-11 1992-06-11 仮想計算機システムの障害処理方式 Pending JPH05342025A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4177503A JPH05342025A (ja) 1992-06-11 1992-06-11 仮想計算機システムの障害処理方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4177503A JPH05342025A (ja) 1992-06-11 1992-06-11 仮想計算機システムの障害処理方式

Publications (1)

Publication Number Publication Date
JPH05342025A true JPH05342025A (ja) 1993-12-24

Family

ID=16032049

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4177503A Pending JPH05342025A (ja) 1992-06-11 1992-06-11 仮想計算機システムの障害処理方式

Country Status (1)

Country Link
JP (1) JPH05342025A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010079587A1 (ja) * 2009-01-06 2010-07-15 三菱電機株式会社 管理装置及び管理方法及びプログラム
CN102693177A (zh) * 2011-03-23 2012-09-26 中国移动通信集团公司 虚拟机故障诊断方法、处理方法及其装置和系统
CN103440190A (zh) * 2013-08-20 2013-12-11 京东方科技集团股份有限公司 设备故障报警方法,装置与cim系统

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010079587A1 (ja) * 2009-01-06 2010-07-15 三菱電機株式会社 管理装置及び管理方法及びプログラム
JPWO2010079587A1 (ja) * 2009-01-06 2012-06-21 三菱電機株式会社 管理装置及び管理方法及びプログラム
JP5159898B2 (ja) * 2009-01-06 2013-03-13 三菱電機株式会社 管理装置及び管理方法及びプログラム
CN102693177A (zh) * 2011-03-23 2012-09-26 中国移动通信集团公司 虚拟机故障诊断方法、处理方法及其装置和系统
CN103440190A (zh) * 2013-08-20 2013-12-11 京东方科技集团股份有限公司 设备故障报警方法,装置与cim系统

Similar Documents

Publication Publication Date Title
JP3532289B2 (ja) 計算機システム解析装置
JPH05342025A (ja) 仮想計算機システムの障害処理方式
JPH0887341A (ja) 自動縮退立ち上げ機能を有したコンピュータシステム
JPS60100231A (ja) 情報処理装置におけるシステム構成制御方式
JPH07325730A (ja) マルチプロセッサ装置
JPH06342387A (ja) 情報処理装置に於ける障害情報採取方式
JP2643526B2 (ja) 周辺装置の試験装置
JPH0566958A (ja) 情報処理装置の擬似障害試験装置
JPS62286131A (ja) 情報処理装置の自動自己診断方式
JP2998793B2 (ja) 情報処理装置の試験方式
JPH0497445A (ja) 情報処理装置の診断方式
JPH0119180B2 (ja)
JPH01134637A (ja) 情報処理システムのストール監視方式
JPH01166140A (ja) 情報処理装置診断方式
JPH0895933A (ja) コンピュータシステム
JP2936170B2 (ja) 障害処理方式
JPS6155748A (ja) 電子計算機システム
JPH0667921A (ja) 障害処理機能を有する情報処理装置
JP3012491B2 (ja) 二重化装置のマイクロ診断方法
JPH0341528A (ja) 計算機における診断装置
JPS6312037A (ja) 診断装置付電子計算機システム
JPH0118460B2 (ja)
JPH05298157A (ja) 情報処理システムのログファイル格納方式
JPH04302342A (ja) 故障診断方法
JPH02293937A (ja) 障害報告方式