JPH0833835B2 - エラー回復制御装置 - Google Patents

エラー回復制御装置

Info

Publication number
JPH0833835B2
JPH0833835B2 JP62177690A JP17769087A JPH0833835B2 JP H0833835 B2 JPH0833835 B2 JP H0833835B2 JP 62177690 A JP62177690 A JP 62177690A JP 17769087 A JP17769087 A JP 17769087A JP H0833835 B2 JPH0833835 B2 JP H0833835B2
Authority
JP
Japan
Prior art keywords
channel
error
shared
virtual
shared channel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP62177690A
Other languages
English (en)
Other versions
JPS6421542A (en
Inventor
眞二 香川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP62177690A priority Critical patent/JPH0833835B2/ja
Publication of JPS6421542A publication Critical patent/JPS6421542A/ja
Publication of JPH0833835B2 publication Critical patent/JPH0833835B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/48Program initiating; Program switching, e.g. by interrupt
    • G06F9/4806Task transfer initiation or dispatching
    • G06F9/4843Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)

Description

【発明の詳細な説明】 〔概要〕 複数の仮想計算機からなる仮想計算機システムにおけ
るチャネル配下の入出力装置で発生したエラーの回復処
理を制御するエラー回復制御装置に関し、 仮想計算機システムにおける共用チャネルに対する障
害に対してチャネルリセット命令を発行して当該共用チ
ャネルの回復を行わせることを目的とし、共用チャネル
からのチャネルエラーの通知を受けたある仮想計算機機
からのチャネルリセット命令の発行に対応して、この共
用チャネルを使用する他の全ての仮想計算機に対して擬
似的なチャネルエラーを通知してこれに対応して発行さ
れたチャネルリセット命令の通知を全て受け取った後、
当該共用チャネルに対してチャネルリセット命令を通知
して装置のリセットを行うように構成する。
〔産業上の利用分野〕 本発明は、複数の仮想計算機からなる仮想計算機シス
テムにおけるチャネル配下の入出力装置で発生したエラ
ーの回復処理を制御するエラー回復制御装置に関するも
のである。
〔従来の技術と発明が解決しようとする問題点〕
従来、仮想計算機システムにおいて、排他制御の下、
任意のチャネルを共用チャネルでチャネル配下の共用DA
SDの資源を使用中、当該共用DASDに障害が発生した場
合、当該障害の事実の通知された一の仮想計算機のOSが
発行するチャネルリセット命令を実行すると、当該DASD
の資源を破壊してしまうことがあるため、チャネルリセ
ット命令の実行はできなかった。具体的にいうと、障害
発生の通知を受けたOSから発行されたチャネルリセット
命令を実行すると、障害発生時のリザーブ状態はクリア
されるにも係わらず、リザーブ状態にある他のOSには通
知されないため、第三のOSにより当該リザーブ状態にあ
った箇所へのI/O要求があった場合、勝手にその箇所に
データの更新をしてしまう場合がある。
この問題は、障害発生の事実が障害発生時に使用中の
仮想計算機にしか通知されない、換言すれば、リザーブ
状態にある他の仮想計算機のOSには、障害発生事実の通
知はされないため、リザーブ状態についての当該OSの認
識と現実の状態との不一致に起因している。
本発明は、仮想計算機システムにおける共用チャネル
に対する障害に対してチャネルリセット命令を発行して
当該共用チャネルの回復を行わせることを目的としてい
る。
〔問題点を解決するための手段〕
第1図を参照して問題点を解決するための手段を説明
する。
第1図において、VM(1)(仮想計算機)2-1ないし2
-3は、OS(オペレーティグシステム)1ないし3で動作
する仮想計算機である。
CP(仮想計算機システムの制御プログラム)3は、VM
(1)2-1ないし2-3を統轄するものである。
実チャネル群4は、共用チャネル4-1、4-2と、それ以
外の専用チャネルとから構成され、データの流れを制御
するものである。
〔作用〕
本発明は、例えば共用チャネル4-1からCP3を経由して
チャネルエラーの通知を受けた例えばVM(1)2-1がこ
れを回復するために共用チャネル4-1配下の装置を全て
リセットするためのチャネルリセット命令をCP3に対し
て発行した場合、CP3は、他のVM(2)2-2、2-3に対し
て擬似的なチャネルエラーを通知してチャネルリセット
命令の返答を受けた後、当該共用チャネル4-1に対して
チャネルリセット命令を実行して配下の全ての装置をリ
セットするようにしている。
これにより、他のVM(2)2-2、2-3は、共用チャネル
4-1配下のDASD装置などのリセットが行われることを意
識することができ、共用チャネル4-1配下のDASD装置の
排他制御情報の保全をはかってデータセットの破壊など
を防止した状態のもとで、障害が発生した共用チャネル
4-1配下の装置の回復をはかるとが可能となる。
〔実施例〕
次に第1図および第2図を用いて本発明の1実施例の
構成および動作を詳細に説明する。
第1図において、実計算機システム1は、2ない6か
ら構成されている。
VM(1)2-1ないし2-3は、仮想計算機システム2を構
成する仮想計算機であって、夫々OS1ないしOS3によって
動くものである。
CP3は、VM(1)2-1ないし2-3を統轄制御する制御プ
ログラムである。
実チャネル群4は、共用チャネル4-1、4-2と、それ以
外の専用チャネルから構成されている。共用チャネル4-
1、4-2は、VM(1)2-1ないし2-3によって共用されるも
のであって、当該共用チャネル4-1、4-2の配下の入出力
装置資源(入出力制御装置(DKC)5-1、5-2、VM間共用D
ASD6-1、6-2など)を分配して使用する形態のチャネル
である。
まず、第1図構成の動作を簡単に説明する。
第1図において、共用チャネル4-1あるいは配下のI/O
資源(入出力制御装置5-1、VM間共用DASD6-1、6-2)の
いずれかに間欠障害が発生し、共用チャネル4-1からCP3
を経由して例えばVM(1)2-1にチャネルエラーとして
通知されたことをOS1が検出した場合(図中)、OS1は
チャネル障害と判断して排他制御の保全を図る(図中
)。排他制御の保全とは、当該チャネル下におけるリ
ザーブ状態について、仮想計算機のOSの認識を現実の状
態に一致させ、チャネルリセット後にリザーブ状態にあ
った処理を再試行できるよう、当該リザーブ関係を保持
することをいう。この排他制御の保全により、リザーブ
状態にあるOSの認識と現実の状態が一致し、第三のOSか
らリザーブ状態にある箇所にI/O要求があったとして
も、リザーブ状態は保持される。保全した後、回復させ
るためにチャネルリセット命令(以下CLRCH命令とい
う)を発行する(図中)。このCLRCH命令の通知を受
けたCP3は、共用チャネル4-1を使用する他のVM(2)2-
2、2-3に対して擬似チャネルエラーを通知する(図中
)。この擬似チャネルエラーの通知を受けたVM(2)
2-2およびVM(3)2-3の夫々OS2、3は、チャネル障害
と判断して排他制御の保全を図る(図中、)。保全
した後、回復させるためにCLRCH命令を発行する(図中
、)。これらCLRCH命令の通知を受けたCP3は、全て
のOS1ないし3からのCLRCH命令をトリガーにして、間欠
障害の発生した共用チャネル4-1に対してCLRCH命令を発
行する(図中)。これにより、共用チャネル4-1およ
びこの配下の全ての装置(入出力制御装置5-1、VM間共
用DASD6-1、6-2など)がリセットされ、再使用可能とな
る。
以上のように、共用チャネルからVMに対して通知され
たチャネルエラーに対して発行されたCLRCH命令に対応
して、他のVMに対して擬似チャネルエラーを通知してCL
RCH命令を発行させた後、共用チャネルに対してCLRCH命
令を発行して当該共用チャネルおよび配下の装置のリセ
ットを行うことにより、排他制御で使用しているDASD装
置のデータセットの破壊を防止した状態で障害の回復を
図ることが可能となる。
次に、第2図を用いて第1図構成の動作を詳細に説明
する。図中左の欄“VM(1)(VM(2)、VM(3))”
は仮想計算機の動作を表し、中央の欄“AVM(CP)”
は、仮想計算機システムの動作を表し、右の欄“装置”
は共用チャネルおよび配下の装置の動作を表す。
第2図において、図中は、SIO(Start I/O)命令
(仮想装置アドレス)を発行する状態を示す。
図中は、AVM(CP)がSIO(実装置アドレス)を装置
に対して発行する状態を示す。
図中は、装置(DASD装置など)に間欠障害(エラ
ー)が発生したので、当該装置からの完了割込みによっ
てiCC(チャネルエラー)が通知される状態を示す。
図中は、VM(1)2-1のOS1に対してチャネルエラー
(仮想アドレス)を通知する状態を示す。
図中は、リカバリが実行され、再試行を行う状態を
示す。これは、RAS機能であるCCH(チャネルハンドラ
ー)が起動され、チャネルエラーに対応して障害を回復
するために複数回の再試行を行うことを意味している。
この再試行を行っても尚チャネルエラーが通知された場
合、もはや再試行によっては回復不可能能と判断し、次
の処理を実行する。
図中は、LCL27ビット目がオンかつiCC(チャネルエ
ラー)か否かを判別する状態を示す。ここで、LCL27ビ
ット目は、I/O INTERFACE HUNG-UP表示である。YESの場
合には、例えばVM(1)2-1がCLRCH命令を発行する。NO
の場合には、一般再試行を行う。
図中は、CLRCH命令が発行された装置が共用チャネ
ルか否かを判別する状態を示す。YESの場合には、擬似
チャネルエラー(iCCかつLCL27ビット目オン)を非同期
割込みで他のVM(2)、VM(3)などに対して通知す
る。この擬似チャネルエラーの通知を受けた他のVM
(2)、VM(3)などはリザーブなどに対して適切な処
理(例えば他のパスに切り換える)を行った後、CLRCH
命令を夫々発行する。このCLRCH命令の通知を全て受け
取った後、AVM(CP)は、障害の発生した共用チャネル
に対してCLRCH命令を通知して共用チャネルおよびその
ストリーム配下の装置の動作のリセットを行って回復を
行わせる。
〔発明の効果〕
以上説明したように、本発明によれば、共用チャネル
に対してチャネルエラーが発生した場合に、これを使用
する全ての仮想計算機の了解を得た後、チャネルリセッ
ト命令(CLRCH命令)を障害の発生した共用チャネルに
対して発行してリセットを行う構成を採用しているた
め、各仮想計算機は予め排他制御情報の保全などの処理
を行った後、障害の発生した共用チャネルおよび配下の
装置をリセットして回復をはかることができる。
【図面の簡単な説明】
第1図は本発明の1実施例構成図、第2図は本発明の動
作説明図を示す。 図中、2-1ないし2-3はVM(仮想計算機)、3はCP(仮想
計算機システムの制御プログラム)、4-1、4-2は共用チ
ャネル、5-1、5-2は入出力制御装置、6-1、6-2はVM間共
用DASDを表す。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】複数の仮想計算機からなる仮想計算機シス
    テムにおけるチャネル配下の入出力装置で発生したエラ
    ーの回復処理を制御するエラー回復制御装置において、 当該入出力装置から発せられるエラー通知を受けると、
    当該チャネルを使用している仮想計算機を特定する特定
    手段と、 当該特定手段により特定される全ての仮想計算機に疑似
    的なエラーを通知する疑似エラー通知手段と、 それら仮想計算機から疑似エラー通知に基づいて発せら
    れる疑似チャネルリセット命令に基づいて、前記チャネ
    ルに対し、チャネルリセット命令を発するチャネルリセ
    ット命令発行手段と、 を有することを特徴とするエラー回復制御装置。
JP62177690A 1987-07-15 1987-07-15 エラー回復制御装置 Expired - Fee Related JPH0833835B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62177690A JPH0833835B2 (ja) 1987-07-15 1987-07-15 エラー回復制御装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62177690A JPH0833835B2 (ja) 1987-07-15 1987-07-15 エラー回復制御装置

Publications (2)

Publication Number Publication Date
JPS6421542A JPS6421542A (en) 1989-01-24
JPH0833835B2 true JPH0833835B2 (ja) 1996-03-29

Family

ID=16035403

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62177690A Expired - Fee Related JPH0833835B2 (ja) 1987-07-15 1987-07-15 エラー回復制御装置

Country Status (1)

Country Link
JP (1) JPH0833835B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2764841B2 (ja) * 1992-03-19 1998-06-11 富士通株式会社 仮想計算機システムi/o制御方式
JP2007233687A (ja) * 2006-03-01 2007-09-13 Nec Corp 仮想計算機システム、仮想計算機の制御方法、および仮想計算機プログラム
JP5712714B2 (ja) * 2011-03-18 2015-05-07 日本電気株式会社 クラスタシステム、仮想マシンサーバ、仮想マシンのフェイルオーバ方法、仮想マシンのフェイルオーバプログラム

Also Published As

Publication number Publication date
JPS6421542A (en) 1989-01-24

Similar Documents

Publication Publication Date Title
KR100612715B1 (ko) 입/출력 패브릭 내의 하드웨어 에러로부터의 자율 복구
US5291605A (en) Arrangement and a method for handling interrupt requests in a data processing system in a virtual machine mode
US9501372B2 (en) Cluster system including closing a bus using an uncorrectable fault upon a fault detection in an active server
CN112306650B (zh) 虚拟机热迁移方法和通信设备
US10379931B2 (en) Computer system
JP2005242404A (ja) コンピュータシステムの系切替方法
JP2011243012A (ja) 仮想計算機システムのメモリダンプ取得方法
JPH0833835B2 (ja) エラー回復制御装置
JP2823230B2 (ja) 処理の継続実行方法
JPH05314075A (ja) オンラインコンピュータ装置
JPS62172437A (ja) 高信頼性システム
JP3903688B2 (ja) バンク切替システム
JPH07104837B2 (ja) プロセッサの制御方法
JPH0540643A (ja) 複数os同時動作時のh/w割込み制御方式
JPH0855040A (ja) システム運転方法
JP2815730B2 (ja) アダプタ及びコンピュータシステム
JPH10187473A (ja) 2重化情報処理装置
JP3098325B2 (ja) 障害情報格納方式
JPS62209627A (ja) デ−タ処理装置
JPS584365B2 (ja) リセツト制御システム
JPH04251340A (ja) 情報処理装置の保守制御方法
JPH0658637B2 (ja) マイクロプログラムのローディング方法
JPH08328989A (ja) 入出力制御装置の管理方式
JPS6290729A (ja) 仮想計算機システム制御方式
JPH03105540A (ja) 入出力制御方式

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees