JPH09330141A - Fault recovery processing system for dynamic reconstitution processing - Google Patents

Fault recovery processing system for dynamic reconstitution processing

Info

Publication number
JPH09330141A
JPH09330141A JP8150741A JP15074196A JPH09330141A JP H09330141 A JPH09330141 A JP H09330141A JP 8150741 A JP8150741 A JP 8150741A JP 15074196 A JP15074196 A JP 15074196A JP H09330141 A JPH09330141 A JP H09330141A
Authority
JP
Japan
Prior art keywords
input
output
information
configuration information
output configuration
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8150741A
Other languages
Japanese (ja)
Inventor
Hirochika Iinuma
博規 飯沼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP8150741A priority Critical patent/JPH09330141A/en
Publication of JPH09330141A publication Critical patent/JPH09330141A/en
Pending legal-status Critical Current

Links

Landscapes

  • Multi Processors (AREA)

Abstract

PROBLEM TO BE SOLVED: To restore input/output constitution information to the state before alteration and carry on the altering process of the input/output constitution information without stopping a virtual computer system in the case of hardware fault occurrence in system operation by storing the input/output constitution information before alteration in a stand-by storage area. SOLUTION: A main storage device (MS) 3 stores a hardware control area for a program, input/output constitution information, etc., and a control program (hypervisor) for the virtual computer. An input/output processor(IOP) 6 discriminates a request to alter the input/output constitution information from the hypervisor, saves the constitution information to be actually altered in the stand-by storage area in the MS4 prior to an actual altering process, and performs the actual altering process. If a fault occurs during this input/output constitution altering process, the IOP6 restores the altered input/output constitution information on the basis of the constitution information, saved in the stand-by storage area, with an instruction for fault recovering operation from the hypervisor.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】本発明は、計算機システムを
停止することなく入出力装置の構成情報の変更を可能と
する動的再構成処理方式に関し、システム稼働中におけ
る入出力構成情報の変更処理実行中のハードウェア障害
発生時に、仮想計算機システムを停止することなく、入
出力構成情報を変更前の状態に回復させ、入出力構成情
報の変更処理を続行させるのに好適な仮想計算機システ
ムに関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a dynamic reconfiguration processing method capable of changing the configuration information of an input / output device without stopping the computer system, and executing the changing process of the input / output configuration information during system operation. The present invention relates to a virtual computer system suitable for recovering the input / output configuration information to the state before the change and continuing the process of changing the input / output configuration information without stopping the virtual computer system when a hardware failure occurs.

【0002】[0002]

【従来の技術】近年、ネットワークの機能拡大および高
速化、ワークステーション/パーソナルコンピュータの
大幅な性能向上、エンドユーザ部門の処理増大、および
分散処理技術の高度化、といった情報システムの新たな
潮流の中で情報処理システムは企業の中枢システムとし
て重要な役割を担う。一方、取り扱う業務量の拡大に伴
い入出力装置の構成変更の機会も増加している。そのた
め、24時間運転、連続運転、あるいは稼働時保守とい
った要求が高まり、情報処理システムの稼働効率を向上
させることが重要な問題になってきている。
2. Description of the Related Art In recent years, in the new trend of information systems such as network function expansion and speed increase, workstation / personal computer performance improvement, end user department processing increase, and distributed processing technology sophistication. Therefore, the information processing system plays an important role as the central system of a company. On the other hand, the opportunities to change the configuration of the input / output device are also increasing with the increase in the amount of work handled. Therefore, there is an increasing demand for 24-hour operation, continuous operation, or maintenance during operation, and it has become an important issue to improve the operation efficiency of the information processing system.

【0003】このような要求への対応策として、従来の
情報処理システム、特に入出力経路の選択や入出力要求
の待ち行列制御をハードウェアが行う情報処理システム
では、システム稼働中の入出力変更をオペレーティング
システム(以下、OSと略す。)が主記憶上にロードさ
れている入出力構成情報を変更するためのオペレータコ
マンドをハードウェアに発行し、ハードウェアがその入
出力構成情報の変更を行うことにより実現している。し
かし、入出力構成情報の変更処理実行中にハードウェア
障害が発生した場合には、情報処理システムを一時停止
して、入出力構成情報の初期設定処理を行うことにより
入出力構成情報の回復を行っていた。
As a countermeasure against such a demand, in a conventional information processing system, particularly in an information processing system in which hardware controls input / output path selection and queuing of input / output requests, input / output change during system operation. The operating system (hereinafter abbreviated as OS) issues an operator command for changing the input / output configuration information loaded on the main memory to the hardware, and the hardware changes the input / output configuration information. It is realized by this. However, if a hardware failure occurs during the process of changing the I / O configuration information, the information processing system is temporarily stopped and the I / O configuration information is initialized to recover the I / O configuration information. I was going.

【0004】なお、この種の技術に関連のある公知文献
としては、例えば特開平1−255912号公報が挙げ
られる。
As a known document related to this type of technique, for example, Japanese Patent Application Laid-Open No. 1-255912 can be cited.

【0005】[0005]

【発明が解決しようとする課題】上記の従来方式では、
ハードウェアが入出力構成情報の変更処理実行中に障害
を検出した場合の回復手段としては、情報処理システム
を一時停止し、再度入出力構成情報の初期設定処理を行
い、主記憶装置上のハードウェア制御領域に入出力構成
情報を読み出すしかなかった。このため、初期設定時の
構成情報を制御プログラムの制御下で動作するプログラ
ム(以下、ゲストOS)にシミュレートすることによっ
て、制御プログラム上で複数のゲストOSが動作する仮
想計算機においては、前記障害発生時に、制御プログラ
ム上の全てのゲストOSを同時に停止させることになる
という問題点がある。
In the above conventional method,
When the hardware detects a failure during the process of changing the I / O configuration information, the recovery method is to suspend the information processing system, perform the initial setting process of the I / O configuration information again, and There was no choice but to read the I / O configuration information into the wear control area. Therefore, by simulating the configuration information at the time of initialization to a program (hereinafter referred to as guest OS) that operates under the control of the control program, in the virtual machine in which a plurality of guest OSs operate on the control program, the failure At the time of occurrence, there is a problem that all guest OSs on the control program are stopped at the same time.

【0006】一方、近年の企業における情報処理システ
ムの役割は益々重要になり、情報処理システムが停止す
ることによる社会に与える影響は大きく、システム稼働
中の入出力構成情報の変更作業における信頼性を向上さ
せることが重要である。
On the other hand, the role of the information processing system in a company in recent years has become more and more important, and the influence on society by the stoppage of the information processing system is great, and the reliability in the work of changing the input / output configuration information during system operation is improved. It is important to improve.

【0007】そこで、本発明はこのような従来の欠点を
解決するものであり、その目的とするところは、一つあ
るいは複数の情報処理装置上で仮想計算機が動作する計
算機システムにおいて、ハードウェアが入出力構成情報
の変更処理実行中に障害を検出した場合でも、仮想計算
機を停止することなく、制御プログラムの下でハードウ
ェアがそれまで行った入出力構成情報の障害回復処理を
行い、制御プログラムは変更処理の続行を可能とするこ
とができる。
Therefore, the present invention solves the above-mentioned conventional drawbacks, and an object of the present invention is to provide a hardware system in a computer system in which a virtual computer operates on one or a plurality of information processing devices. Even if a failure is detected during the process of changing the I / O configuration information, the hardware recovery process of the I / O configuration information performed by the hardware under the control program is performed without stopping the virtual machine. May allow the modification process to continue.

【0008】[0008]

【課題を解決するための手段】上記目的を達成するため
に、本発明の仮想計算機システムでは、ハードウェアが
入出力構成情報の変更内容を表す情報を記憶する予備記
憶領域を主記憶装置内に具備し、変更前の前記入出力構
成情報を前記予備記憶領域に格納する手段と、入出力構
成情報の変更処理実行中に障害が発生した場合に、制御
プログラムの要求に対して、前記主記憶装置上の入出力
構成情報をハードウェアに変更させる命令を新規に設定
し、ハードウェアが制御プログラムから前記命令を受け
付けた時に、前記予備記憶領域に格納されている変更内
容を表す情報に基づき入出力構成情報を変更前の状態に
回復させる手段と、制御プログラムがハードウェアから
の前記命令の処理報告内容に基づき、入出力構成情報の
変更処理を続行させるかを判断する手段とを備えたこと
を特徴とするものである。本発明においては、オペレー
タからの仮想計算機システム動作中に、各ゲストOSに
割り当てている入出力構成情報の変更が生じた場合、ハ
ードウェアは制御プログラムからの要求を受け付け、入
出力構成情報の変更を行う過程で変更内容を示す情報を
システム内の予備記憶領域に格納する。そして、入出力
構成情報の変更処理実行中に障害が発生した場合に、制
御プログラムは本発明で新設した新規命令を発行する。
本命令を受け付けると、前記予備記憶領域に格納されて
いる変更内容を表す情報に基づき、主記憶装置上の入出
力構成情報を変更前の状態に回復させる。そして、制御
プログラムはハードウェアからの前記命令の終了報告に
基づき、障害発生時からの入出力構成情報の変更処理を
続行させるかを判断する。
In order to achieve the above object, in the virtual computer system of the present invention, a hardware has a spare storage area for storing information indicating the contents of change of input / output configuration information in a main storage device. Means for storing the input / output configuration information before the change in the spare storage area, and the main memory in response to a request from the control program when a failure occurs during the process of changing the input / output configuration information. An instruction is newly set to change the input / output configuration information on the device to the hardware, and when the hardware receives the instruction from the control program, the instruction is input based on the information indicating the changed content stored in the spare storage area. The means for recovering the output configuration information to the state before the change and the control program continue the change processing of the input / output configuration information based on the processing report contents of the instruction from the hardware. It is characterized in further comprising a means for determining Luke. According to the present invention, when the operator changes the input / output configuration information assigned to each guest OS during operation of the virtual computer system, the hardware accepts a request from the control program and changes the input / output configuration information. In the process of performing, the information indicating the changed contents is stored in the spare storage area in the system. Then, when a failure occurs during execution of the input / output configuration information change processing, the control program issues a new instruction newly established in the present invention.
When this command is received, the input / output configuration information on the main storage device is restored to the state before the change, based on the information indicating the changed contents stored in the spare storage area. Then, the control program determines whether to continue the process of changing the input / output configuration information after the occurrence of the failure, based on the completion report of the instruction from the hardware.

【0009】[0009]

【発明の実施の形態】以下、本発明の実施例を、図面に
より詳細に説明する。
Embodiments of the present invention will be described below in detail with reference to the drawings.

【0010】図1は本実施例で述べる仮想計算機システ
ムの構成を示す。
FIG. 1 shows the configuration of the virtual computer system described in this embodiment.

【0011】本発明の計算機システムは、入出力命令等
の命令を発行する命令プロセッサ1〜2(以下、IPと
略す)、プログラム、入出力構成情報等のハードウェア
制御領域、および仮想計算機の制御プログラム(以下、
ハイパーバイザと略す)を格納する主記憶装置3(以
下、MSと略す)、オペレータと制御プログラムの仲介
をするサービスプロセッサ5(以下、SVPと略す)、
入出力命令を実行する入出力プロセッサ6(以下、IO
Pと略す)、これらのプロセッサとMSとを結合するた
めのシステム制御装置4(以下、SCと略す)、IOP
内の各チャネル(以下、CHと略す)に接続された入出
力装置100〜109(以下、IODと略す)および前
記SVP5に接続されるファイル装置40から構成され
る。
The computer system of the present invention includes instruction processors 1 and 2 (hereinafter abbreviated as IP) that issue instructions such as input / output instructions, programs, hardware control areas such as input / output configuration information, and control of virtual computers. Program (hereinafter,
A main storage device 3 (hereinafter abbreviated as MS) that stores a hypervisor, a service processor 5 (hereinafter abbreviated as SVP) that mediates between an operator and a control program,
The input / output processor 6 (hereinafter referred to as IO
Abbreviated as P), a system controller 4 (hereinafter abbreviated as SC) for connecting these processors and MS, IOP
The input / output devices 100 to 109 (hereinafter abbreviated as IOD) connected to the respective channels (hereinafter abbreviated as CH) and the file device 40 connected to the SVP5.

【0012】本実施例の仮想計算機システムでは、CH
を介してIODまでの入出力経路の選択をIOPを主と
したハードウェアが実行している。このため、計算機シ
ステムは、システム稼働に先立ってSVP5のファイル
装置40に格納されている、CHとIODの物理的な接
続関係等の入出力構成を定義した入出力構成情報を、シ
ステムの電源投入時や初期設定時(マイクロプログラム
のロード等)にMS3上の特定領域であるハードウェア
制御領域に格納する。そして、入出力構成情報は、IO
PやIPにより読み出されて使用される。
In the virtual computer system of this embodiment, CH
The hardware mainly including the IOP executes the selection of the input / output path to the IOD via the. Therefore, the computer system powers on the system by inputting / outputting configuration information that defines the input / output configuration such as the physical connection relationship between the CH and the IOD, which is stored in the file device 40 of the SVP 5 prior to system operation. It is stored in the hardware control area, which is a specific area on the MS 3, at the time of initial setting (loading of a microprogram, etc.). The input / output configuration information is IO
It is read and used by P or IP.

【0013】図2は、図1の仮想計算機システム構成に
おいて、プログラムに主眼を置いた論理的な仮想計算機
システムの構成を示す。IOD100〜109は、ハイ
パーバイザ9の制御下で、仮想計算機A(以下、LPA
R−Aと略す)および仮想計算機B(以下、LPAR−
Bと略す)とから構成され、ゲストOS1−7とゲスト
OS2−8に接続される。ゲストOS1−7およびゲス
トOS2−8は、ハイパバイザ9を介してIOD100
〜109のそれぞれと接続している。
FIG. 2 shows the configuration of a logical virtual computer system focusing on programs in the virtual computer system configuration of FIG. Under the control of the hypervisor 9, the IODs 100 to 109 are virtual computers A (hereinafter, LPA).
R-A) and virtual computer B (hereinafter, LPAR-
B) and is connected to the guest OS 1-7 and the guest OS 2-8. The guest OS 1-7 and the guest OS 2-8 receive the IOD 100 via the hypervisor 9.
To 109 respectively.

【0014】図3および図4は、ゲストOS1及びゲス
トOS2から見た仮想計算機システムの構成を示す。ゲ
ストOS1−7は、ハイパバイザ9がゲストOS1−7
に割り当てたIODと接続している。これは、ハイパバ
イザ9がハイパバイザ9の運用を開始する前にMS3に
設定されたハードウェア資源をゲストOS1−7および
ゲストOS2−8に割り当てた状態を示す。従来ハード
ウェア資源の割り当ては、ゲストOSが運用を開始する
ときにサービスプロセッサ5を介してオペレータからの
要求によりハイパバイザ9が行う。
3 and 4 show the configuration of the virtual computer system viewed from the guest OS 1 and the guest OS 2. In the guest OS 1-7, the hypervisor 9 is the guest OS 1-7.
Connected to the IOD assigned to. This shows a state in which the hypervisor 9 allocates the hardware resources set in the MS 3 to the guest OS 1-7 and the guest OS 2-8 before starting the operation of the hypervisor 9. Conventional hardware resource allocation is performed by the hypervisor 9 according to a request from the operator via the service processor 5 when the guest OS starts operation.

【0015】図5は、図1の主記憶装置に展開された入
出力構成情報のテーブルを示す。入出力構成情報は大別
して3つのテーブルに分けられており、それぞれチャネ
ル制御情報(以下、PCW略す)、論理入出力制御装置
情報(以下、LCUWと略す)、入出力装置制御情報
(以下、UCWと略す)等から構成される。
FIG. 5 shows a table of input / output configuration information expanded in the main memory of FIG. The input / output configuration information is roughly divided into three tables, which are channel control information (hereinafter abbreviated as PCW), logical input / output control device information (hereinafter abbreviated as LCUW), and input / output device control information (hereinafter UCW). Abbreviated) and the like.

【0016】PCWは、個々のCHに対応して設定され
ており、各CHを識別する番号(CHNO)、当該CH
に接続されるIOD数(UACNT)、当該CHの動作
タイプを識別する情報(CHTYP)およびそのCH情
報が有効か無効かを示す有効性フラグ(V)等のエント
リ情報を持っている。V=1の時は、そのエントリ情報
は有効であることを示し、V=0の時には、無効である
ことを示す。
The PCW is set corresponding to each CH, and the number (CHNO) for identifying each CH and the CH
It has entry information such as the number of IODs (UACNT) connected to the channel, information for identifying the operation type of the CH (CHTYPE), and a validity flag (V) indicating whether the CH information is valid or invalid. When V = 1, it indicates that the entry information is valid, and when V = 0, it indicates that the entry information is invalid.

【0017】LCUWは、CHからIODへの入出力経
路情報を保持し、ある物理的なIODを制御する1台な
いし複数台の入出力制御装置を1つの集合体で定義した
ものである。LCUWには、当該エントリ情報が有効か
無効かを示す有効性フラグ(V),LCUWをMSに格
納する際にハードウェアにより割当てられたシステム内
でユニークな番号(LCUNO),当該LCUに接続さ
れるIOD数(UCW数)、LCUを接続するチャネル
番号(CHNO)、各チャネルの番号が有効かどうかを
ビット対応に示すチャネル登録マスク(PIM),およ
び当該LCUを形成するゲストOSの番号(ゲストOS
NO)等が格納されている。V=1の時は、そのエント
リ情報は有効であることを示し、V=0の時には、無効
であることを示す。
The LCUW defines one or a plurality of input / output control devices that hold input / output path information from the CH to the IOD and control a certain physical IOD, as one aggregate. The LCUW has a validity flag (V) indicating whether the entry information is valid or invalid, a unique number (LCUNO) in the system assigned by the hardware when the LCUW is stored in the MS, and is connected to the LCU. Number of IODs (UCW numbers), channel numbers (CHNO) that connect LCUs, channel registration masks (PIM) that indicate whether or not each channel number is valid, and the number of the guest OS that forms the LCU (guest OS
NO) etc. are stored. When V = 1, it indicates that the entry information is valid, and when V = 0, it indicates that the entry information is invalid.

【0018】UCWは、個々のIOD毎に設定される特
定の情報を定義したものである。当該エントリ情報が有
効か無効かを示す有効性フラグ(V)、システム内でオ
ペレータがIODを特定する装置番号(DEVNO),
ハードウェアがIOD情報をMS3に格納する際に割り
当てるシステム内でユニークな入出力装置番号(UCW
NO)、当該IODが接続されるLCUの番号(LCU
NO)、当該IODを制御するLCUを接続するチャネ
ルのうち、当該IODをアクセスできるチャネルをビッ
ト対応に指定するチャネル登録マスク(PIM),PI
Mで指定されたチャネルが使用可能か否かをビット対応
に指定するチャネル使用可能マスク(PAM)、実際に
チャネルを使用してIODをアクセスした際に、そのチ
ャネルを介して入出力装置をアクセス出来たか否かを示
す動作可能マスク(POM)等がそれぞれ格納される。
The UCW defines specific information set for each IOD. A validity flag (V) indicating whether the entry information is valid or invalid, a device number (DEVNO) by which the operator identifies the IOD in the system,
A unique I / O device number (UCW) assigned in the system when the hardware stores the IOD information in the MS3.
NO), the number of the LCU to which the IOD is connected (LCU
NO), a channel registration mask (PIM), PI that designates, among the channels connecting the LCU that controls the IOD, the channels that can access the IOD in bit correspondence.
A channel availability mask (PAM) that specifies whether or not the channel specified by M can be used, in bit correspondence, and when the IOD is actually accessed using the channel, the I / O device is accessed via that channel An operable mask (POM) or the like indicating whether or not it is possible is stored.

【0019】図6は、図5で説明した入出力構成情報の
変更処理を行う際に退避する、MS3上に格納される予
備記憶領域の制御テーブルを示す。当該予備記憶領域は
図5と同じく、3つの領域の情報から構成され、チャネ
ル制御情報退避情報(以下、APCWと略す)、論理入
出力制御装置退避情報(以下、ALCUWと略す)、お
よび入出力装置退避情報(以下、AUCWと略す)から
成る。APCW、ALCUW、AUCWの各情報は、I
OPの入出力構成情報の変更処理開始時、実際に変更を
行う図5に示すエントリ情報が退避されたものである。
FIG. 6 shows a control table of the spare storage area stored on the MS 3, which is saved when the input / output configuration information change processing described in FIG. 5 is performed. The spare storage area is composed of information of three areas as in FIG. 5, and includes channel control information save information (hereinafter abbreviated as APCW), logical input / output control device save information (hereinafter abbreviated as ALCUW), and input / output. It consists of device evacuation information (hereinafter abbreviated as AUCW). The information of APCW, ALCUW, and AUCW is I
When the input / output configuration information change processing of the OP is started, the entry information shown in FIG. 5 that is actually changed is saved.

【0020】続いて、図7および図8により、IOP障
害発生報告時のハイパーバイザによるIOPへの障害発
生動作指示の処理概要を説明する。図8は、本発明の一
実施例を示す、ハイパーバイザにおける入出力構成変更
処理のフローチャートであり、図7はハイパーバイザか
らの障害回復処理動作を示す命令形式である。
Next, referring to FIG. 7 and FIG. 8, the outline of the processing of the failure occurrence operation instruction to the IOP by the hypervisor at the time of the IOP failure occurrence report will be described. FIG. 8 is a flowchart of the input / output configuration changing process in the hypervisor according to the embodiment of the present invention, and FIG. 7 is an instruction format showing a failure recovery process operation from the hypervisor.

【0021】図8に示すように、ハイパーバイザはOS
から入出力構成情報の変更要求があったかどうかを常時
監視しており(ステップ8−1)、ハイパーバイザから
の入出力構成変更要求を認識すると、ハイパーバイザが
保持する矛盾検出カウンタをクリアする(ステップ8−
2)。矛盾検出カウンタは、障害回復処理を特定回数指
示した場合に、OSに対して異常終了報告を行う時に判
定するためのものである。そして、OSからの入出力構
成変更要求をシミュレートして、ハードウェアに対し
て、入出力構成変更の要求を指示する(ステップ8−
3)。その後、ハイパーバイザがIOPからの終了報告
の待ち状態に入る(ステップ8−4)。IOPから入出
力構成変更の正常終了報告を認識した場合は、OSに対
して入出力構成変更処理の正常終了を報告する(ステッ
プ8−11)。IOPから障害報告を検出するか(ステ
ップ8−5)、あるいは異常終了報告を認識(ステップ
8−6)した場合は、矛盾検出カウンタがシステムであ
らかじめ設定した特定回数に一致したかどうかを判定し
(ステップ8−7)、特定回数に一致していれば、OS
に対して当該入出力構成変更が不可能であることを報告
する(ステップ8−12)。また、矛盾検出カウンタが
特定回数に一致していない場合は、矛盾検出カウンタを
カウントアップして(ステップ8−8)、IOPに対し
て障害回復動作指示命令を発行し(ステップ8−9)、
再びIOPからの終了報告待ち状態に入る。図7に示す
ように、ハイパーバイザが発行する入出力構成情報の障
害回復指示の命令語(ECSC命令)の形式は、命令コ
ードがx(B25F)のRRE形式で特権モード命令、
つまりOSしか使用できない命令である。また、オペラ
ンドは汎用レジスタを使用し、第1オペランドの汎用レ
ジスタ番号はビット24〜27で示す。第1オペランド
(R1)の内容は、ハイパーバイザ9とIOP6との通
信を行うための命令制御テーブル(以下、SCTと略
す)と呼ばれるMS3上のアドレスを示す。SCTの形
式は、ハイパーバイザ9からIOP6への動作指示の内
容を示す動作要求テーブル(以下、SCTREQと略
す)とIOP6からハイパーバイザ9への動作応答テー
ブル(以下、SCTRSPと略す)の2つから構成され
る。SCTREQの形式は、当該SCTREQの大きさ
(LNG1)、要求する動作を示す動作コード(COM
MAND)等から構成される。例えば、本実施例では、
LNG1はx(0010)に固定であり、COMMAN
Dは本実施例では、IOPの障害回復処理動作を指示す
る時はx(FF3D)を格納するものとする。SCTR
SPの形式は、当該SCTRSPの大きさ(LNG
2)、動作完了時の完了動作状態を示す理由コード(R
C)、および動作完了時の付加情報を示す(AINF
O)等から構成される。例えば、本実施例では、LNG
2はx(0008)に固定であり、RCはx(000
1)が正常終了を示し、x(0001)以外は以上終了
を示す。
As shown in FIG. 8, the hypervisor is an OS.
It constantly monitors whether or not there is a request to change the input / output configuration information from the hypervisor (step 8-1). When the input / output configuration change request from the hypervisor is recognized, the contradiction detection counter held by the hypervisor is cleared (step). 8-
2). The contradiction detection counter is for making a determination when an abnormal termination report is sent to the OS when the failure recovery processing is instructed a specific number of times. Then, the input / output configuration change request from the OS is simulated and the hardware is instructed of the input / output configuration change request (step 8-
3). After that, the hypervisor enters a waiting state for the end report from the IOP (step 8-4). When the IOP recognizes the normal end report of the I / O configuration change, it reports the normal end of the I / O configuration change process to the OS (step 8-11). When the failure report is detected from the IOP (step 8-5) or the abnormal termination report is recognized (step 8-6), it is determined whether or not the contradiction detection counter matches a specific number set in advance by the system. (Step 8-7), if the number of times matches the specified number of times, the OS
It is reported to the user that the input / output configuration cannot be changed (step 8-12). When the contradiction detection counter does not match the specific number of times, the contradiction detection counter is counted up (step 8-8), and the failure recovery operation instruction command is issued to the IOP (step 8-9).
The state of waiting for the completion report from the IOP is entered again. As shown in FIG. 7, the format of the instruction word (ECSC instruction) of the failure recovery instruction of the input / output configuration information issued by the hypervisor is a privileged mode instruction in the RRE format with the instruction code x (B25F),
That is, the instruction can be used only by the OS. The operand uses a general-purpose register, and the general-purpose register number of the first operand is shown by bits 24-27. The content of the first operand (R1) indicates an address on the MS3 called an instruction control table (hereinafter, abbreviated as SCT) for performing communication between the hypervisor 9 and the IOP6. The SCT has two formats: an operation request table (hereinafter abbreviated as SCTREQ) indicating the content of the operation instruction from the hypervisor 9 to the IOP 6 and an operation response table (hereinafter abbreviated as SCTRSP) from the IOP 6 to the hypervisor 9. Composed. The format of SCTREQ is the size of the SCTREQ (LNG1) and the operation code (COM
MAND) and the like. For example, in this embodiment,
LNG1 is fixed at x (0010), COMMAN
In this embodiment, D stores x (FF3D) when instructing the IOP failure recovery processing operation. SCTR
The SP format is the size of the SCTRSP (LNG
2), the reason code (R
C) and additional information when the operation is completed (AINF
O) etc. For example, in this embodiment, LNG
2 is fixed to x (0008), RC is x (000
1) indicates normal termination, and other than x (0001) indicates the above termination.

【0022】そして、IOP6からの障害回復処理報告
が正常終了報告の場合(ステップ8−10)には、再び
ハードウェアに対して、入出力構成情報の変更処理を起
動する(ステップ8−3)。この時には、ハイパーバイ
ザが保持する矛盾検出カウンタはクリアされない。従っ
て、障害回復処理および入出力構成情報変更の起動の繰
返し回数は、矛盾検出カウンタにカウントされ、当該処
理の繰返し回数が、先にシステムにおいて設定した特定
回数と一致した場合には、OSに対して、入出力構成情
報の変更が不可能であることを報告する(ステップ8−
12)。
When the failure recovery process report from the IOP 6 is a normal end report (step 8-10), the input / output configuration information change process is activated again for the hardware (step 8-3). . At this time, the contradiction detection counter held by the hypervisor is not cleared. Therefore, the number of times the failure recovery process and the activation of the input / output configuration information are repeated is counted by the contradiction detection counter, and when the number of times the process is repeated matches the specific number set in the system, the OS is notified. And reports that the input / output configuration information cannot be changed (step 8-
12).

【0023】続いて、図9により、本発明の一実施例を
示す、ハイパーバイザからIOPへの障害回復動作指示
に対するIOPにおける入出力構成変更処理を説明す
る。また、図10は、IOD104、105に関する入
出力構成情報のみを図3から抜き出した図であって、図
1の構成に対応している。以下、IOD104、105
を削除する場合の入出力構成情報変更処理例に基づき本
発明の実施例を説明する。
Next, with reference to FIG. 9, an input / output configuration changing process in the IOP in response to a failure recovery operation instruction from the hypervisor to the IOP, showing an embodiment of the present invention, will be described. Further, FIG. 10 is a diagram in which only the input / output configuration information regarding the IODs 104 and 105 is extracted from FIG. 3, and corresponds to the configuration of FIG. Below, IOD 104, 105
An embodiment of the present invention will be described based on an example of input / output configuration information change processing in the case of deleting.

【0024】図9に示す通りに、IOP6はハイパーバ
イザ9から入出力構成情報の変更要求があったかを常時
監視しており(ステップ9−1)、IP1または2が入
出力構成情報の変更処理を起動すると、IOP6はハイ
パーバイザ9から入出力構成情報の変更要求を識別す
る。実際には、IP1および2とIOP6との通信手段
であるサブチャネルを介して、IP1または2からIO
P6へ起動され、IOP6は前記サブチャネル情報を基
に一般の入出力命令か入出力構成変更命令かを識別する
が、本実施例では当該処理については触れない。続い
て、IOP6は入出力構成情報の変更要求なのか、入出
力構成情報の障害回復処理要求かを判定し(ステップ9
−2)、入出力構成情報の変更要求の場合には、実際の
変更処理に先立ち、変更処理を行うべき構成情報である
PCW情報(ここでは、PCW0)、LCUW(ここで
は、LCUW0)、UCW(ここではUCW0およびU
CW1)があったことを認識し、入出力構成情報の変更
処理を開始する。ここで、変更処理前に前記構成情報に
対する変更が可能であるかをチェックし(ステップ9−
3)、入出力構成情報の変更が不可能である場合には、
ハイパーバイザに対して異常終了報告を行う(ステップ
9−15)。実際の変更処理において、関連入出力構成
情報は同時に変更することは不可能であり、各情報の変
更を順次行う。まず、IOP6は、UCW0およびUC
W1を削除しなければならないことを認識して、UCW
の更新処理を行う(ステップ9−4)。そして、図10
のUCW情報に基づいて予備記憶領域への退避を行う
(ステップ9−5)。まず、AUCW制御領域の先頭エ
ントリのVを’1’、カウントを’1’に設定する。続
いて、AUCW0のエントリ情報として、Vを’1’、
ゲストOSNOを’1’、DEVNOを’104’、U
CWNOを’0’、LCUNOを’0’、PIMを’1
1000000’、PAMを’11000000’、P
OMを’11111111’に設定する。続いて、カウ
ントの値に’1’を加えてカウントを’2’に設定し、
AUCW1のエントリ情報として、Vを’1’、ゲスト
OSNOを’1’、DEVNOを’105’、UCWN
Oを’1’、LCUNOを’0’、PIMを’1100
0000’、PAMを’11000000’、POM
を’11111111’に設定する。そして、実際のU
CW情報であるUCW0およびUCW1を削除する。続
いて、LCUWおよびPCW情報を前記予備記憶領域へ
の退避処理と同様に図10の情報を基に行い、実際の変
更処理を行う(ステップ9−7および9−10)。これ
らの入出力構成変更処理過程中において、IOPは障害
が発生したかどうかを監視しており(ステップ9−6、
9−9および9−12)、障害が発生した場合には、ハ
イパーバイザに対して障害発生の報告を行う(ステップ
9−14)。障害が発生せず、前記入出力情報の変更処
理が正常に終了した場合には、ハイパーバイザに対して
正常終了報告を行う(ステップ9−13)。続いて、I
OPがハイパーバイザからの障害回復動作の指令を認識
した場合には、先の入出力構成情報の変更処理にて、M
S上の予備記憶領域に退避した構成情報に基づき、変更
処理を行ったUCW情報、LCUW情報、PCW情報を
図10に示す情報に回復処理を行う(ステップ9−1
6)。まず、IOPは、予備記憶領域に格納した情報に
AUCW,ALCUW、およびAPCW情報を順次読み
だし、それぞれの先頭エントリのVが’1’かどうかを
判定する。’0’の場合には、当該情報に関しての回復
処理は必要でないことを認識して、別の予備記憶領域を
読み出す。先頭エントリのVが’1’の場合には、カウ
ンタの値を読みだし、当該予備記憶領域の有効エントリ
数を認識して、カウンタに一致するエントリ数を読みだ
し、変更した入出力構成情報を回復する。そして、全て
の予備記憶領域の情報を回復し終わった場合には、ハイ
パーバイザに対して、正常終了報告を行う(ステップ9
−13)。また、回復処理が正常に終了できなかった場
合には、ハイパーバイザに対して異常終了報告を行う
(ステップ9−15)。
As shown in FIG. 9, the IOP 6 constantly monitors whether there is a request for changing the input / output configuration information from the hypervisor 9 (step 9-1), and the IP 1 or 2 executes the changing process of the input / output configuration information. Upon activation, the IOP 6 identifies a request for changing the input / output configuration information from the hypervisor 9. Actually, the IP1 or 2 is connected to the IO via the sub-channel which is a communication means between the IP1 and 2 and the IOP6.
When activated to P6, the IOP 6 discriminates a general input / output instruction or an input / output configuration change instruction based on the subchannel information, but this processing will not be described in this embodiment. Subsequently, the IOP 6 determines whether the request is a change request of the input / output configuration information or a failure recovery processing request of the input / output configuration information (step 9).
-2), in the case of a request to change the input / output configuration information, PCW information (here, PCW0), LCUW (here, LCUW0), UCW, which is the configuration information to be subjected to the change processing prior to the actual change processing. (Here UCW0 and U
CW 1) is recognized and the input / output configuration information change processing is started. Here, it is checked whether the configuration information can be changed before the change processing (step 9-
3) If the input / output configuration information cannot be changed,
An abnormal end report is sent to the hypervisor (step 9-15). In the actual change processing, the related input / output configuration information cannot be changed at the same time, and each information is changed sequentially. First, IOP6 has UCW0 and UC
Recognizing that W1 must be deleted, UCW
Is updated (step 9-4). And FIG.
Based on the UCW information of the above, the data is saved to the spare storage area (step 9-5). First, V of the head entry of the AUCW control area is set to "1" and the count is set to "1". Then, V is set to "1" as the entry information of AUCW0,
Guest OSNO is '1', DEVNO is '104', U
CWNO = '0', LCUNO = '0', PIM = '1'
1,000,000 ', PAM is '11, 000,000', P
Set the OM to '11111111'. Next, add "1" to the count value and set the count to "2",
As the entry information of AUCW1, V is "1", guest OSNO is "1", DEVNO is "105", UCWN
O is' 1 ', LCUNO is'0', PIM is' 1100.
0000 ', PAM is'11000000', POM
Is set to '11111111'. And the actual U
CW information UCW0 and UCW1 are deleted. Subsequently, the LCUW and PCW information is performed based on the information of FIG. 10 as in the save processing to the preliminary storage area, and the actual change processing is performed (steps 9-7 and 9-10). During the process of changing the input / output configuration, the IOP monitors whether a failure has occurred (step 9-6,
9-9 and 9-12), when a failure occurs, the failure occurrence is reported to the hypervisor (step 9-14). If no failure has occurred and the input / output information change processing has ended normally, a normal end report is sent to the hypervisor (step 9-13). Then I
When the OP recognizes the failure recovery operation command from the hypervisor, M is changed in the previous input / output configuration information change processing.
Based on the configuration information saved in the spare storage area on S, the UCW information, the LCUW information, and the PCW information that have been changed are restored to the information shown in FIG. 10 (step 9-1).
6). First, the IOP sequentially reads the AUCW, ALCUW, and APCW information from the information stored in the spare storage area, and determines whether V of each head entry is "1". In the case of "0", it is recognized that the recovery process for the information is not necessary, and another spare storage area is read. When V of the first entry is "1", the value of the counter is read, the number of valid entries in the spare storage area is recognized, the number of entries matching the counter is read, and the changed input / output configuration information is read. Recover. Then, when the information in all the spare storage areas has been recovered, a normal termination report is sent to the hypervisor (step 9).
-13). If the recovery process cannot be completed normally, an abnormal end report is sent to the hypervisor (step 9-15).

【0025】以上、本発明を実施例に基づき具体的に説
明したが、本発明は前記実施例に限定されるものではな
く、その要旨を逸脱しない範囲で種々変更可能であるこ
とは言うまでもない。
Although the present invention has been specifically described with reference to the embodiments, the present invention is not limited to the above embodiments, and it goes without saying that various modifications can be made without departing from the scope of the invention.

【0026】[0026]

【発明の効果】本発明によれば、ハードウェアが入出力
構成情報の変更を行う前に入出力構成情報の変更前の情
報をシステム内の予備記憶領域に格納する。そして、入
出力構成変更の処理実行中に障害が発生した場合に、前
記予備記憶領域に格納されている変更前の情報に基づき
入出力構成変更の回復を行う。従って、入出力構成情報
を回復させるために、再度システムの初期設定を行い主
記憶上に入出力構成情報をロードする必要がなく、シス
テムの運転停止も不要になり、計算機システムの高性能
が向上する効果がある。
According to the present invention, the information before the change of the input / output configuration information is stored in the spare storage area in the system before the hardware changes the input / output configuration information. Then, when a failure occurs during the process of changing the input / output configuration, the input / output configuration change is recovered based on the information before the change stored in the spare storage area. Therefore, in order to recover the I / O configuration information, it is not necessary to initialize the system again and load the I / O configuration information into the main memory, and it is not necessary to stop the system, improving the high performance of the computer system. Has the effect of

【図面の簡単な説明】[Brief description of drawings]

【図1】本実施例の仮想計算機システムの構成図であ
る。
FIG. 1 is a configuration diagram of a virtual computer system according to an embodiment.

【図2】図1の構成において、プログラムに主眼を置い
た論理的な仮想計算機システムの構成図である。
FIG. 2 is a configuration diagram of a logical virtual computer system focusing on a program in the configuration of FIG.

【図3】ゲストOS1から見た仮想計算機システムの構
成図である。
FIG. 3 is a configuration diagram of a virtual computer system viewed from a guest OS 1.

【図4】ゲストOS2から見た仮想計算機システムの構
成図である。
FIG. 4 is a configuration diagram of a virtual computer system viewed from a guest OS 2.

【図5】図1の主記憶装置に展開された、入出力構成情
報のテーブルを示す図である。
5 is a diagram showing a table of input / output configuration information expanded in the main storage device of FIG.

【図6】図1の主記憶装置に格納される予備記憶領域の
制御テーブルを示す図である。
6 is a diagram showing a control table of a spare storage area stored in the main storage device of FIG. 1. FIG.

【図7】ハイパーバイザからの障害回復動作を示す命令
形式を示す図である。
FIG. 7 is a diagram showing an instruction format showing a failure recovery operation from a hypervisor.

【図8】本発明の一実施例を示す、ハイパーバイザにお
ける入出力構成変更処理のフローチャートである。
FIG. 8 is a flowchart of an input / output configuration changing process in the hypervisor according to the embodiment of the present invention.

【図9】本発明の一実施例を示す、入出力プロセッサに
おける入出力構成処理のフローチャートである。
FIG. 9 is a flowchart of an input / output configuration process in the input / output processor showing the embodiment of the present invention.

【図10】図3の入出力構成情報中の、特定の入出力装
置に関する情報テーブルを示す図である。
10 is a diagram showing an information table regarding a specific input / output device in the input / output configuration information of FIG.

【図11】本実施例における入出力構成変更処理で、図
1の主記憶装置に格納される予備記憶領域の制御テーブ
ルを示す図である。
FIG. 11 is a diagram showing a control table of a spare storage area stored in the main storage device of FIG. 1 in the input / output configuration change processing in this embodiment.

【符号の説明】[Explanation of symbols]

1〜2…命令プロセッサ、3…主記憶装置、 4…
システム制御装置、5…サービスプロセッサ、6…入出
力プロセッサ、7…ゲストOS1、8…ゲストOS2、
9…ハイパーバイザ、 40…ファイル装置、1
00〜109入出力装置。
1-2: instruction processor, 3 ... main memory, 4 ...
System control device, 5 ... Service processor, 6 ... Input / output processor, 7 ... Guest OS1, 8 ... Guest OS2,
9 ... Hypervisor, 40 ... File device, 1
00-109 input / output devices.

Claims (1)

【特許請求の範囲】[Claims] 【請求項1】一つ以上の命令プロセッサ(IP)と、主
記憶装置(MS)と、一つ以上の入出力プロセッサ(I
OP)と、これらのプロセッサと主記憶装置とを結合す
るシステム制御装置(SC)と、該入出力プロセッサに
含まれる複数の入出力チャネル(CH)と、該入出力制
御装置(IOC)に接続される一つ以上の入出力装置
(IOD)と、入出力チャネル、入出力制御装置、入出
力装置を構成定義する入出力構成定義情報を保持するサ
ービスプロセッサ(SVP)から成る処理装置で、該処
理装置上の制御プログラムの制御下で、仮想計算機シス
テムが処理装置上で動作し、システム稼働中に入出力構
成情報の変更を行う機能を持つ仮想計算機システムにお
いて、前記入出力構成情報の制御情報を格納する予備記
憶領域を前記主記憶装置上に具備し、前記入出力構成情
報の動的再構成処理過程において、前記入出力構成情報
を前記予備記憶領域に格納する手段と、入出力構成情報
の変更処理実行中に前記制御プログラムが前記入出力プ
ロセッサから障害発生報告を受付けた時に、前記制御プ
ログラムが前記入出力プロセッサに対して、回復処理の
動作指令を発行する手段と、前記制御プログラムより前
記入出力プロセッサに回復処理動作指令が発行された時
に、前記予備記憶領域に格納されている変更内容を表す
情報に基づき入出力構成情報を変更前の状態に回復させ
る手段と、前記入出力プロセッサによる入出力構成情報
の回復処理後に、前記制御プログラムにより障害発生時
からの入出力構成変更処理を続行させる手段とを備えた
ことを特徴とする障害回復処理方式。
1. One or more instruction processors (IP), a main memory (MS), and one or more input / output processors (I).
OP), a system controller (SC) that couples these processors to the main memory, a plurality of input / output channels (CH) included in the input / output processor, and the input / output controller (IOC). A processing device including one or more input / output devices (IODs), an input / output channel, an input / output control device, and a service processor (SVP) that holds input / output configuration definition information that defines the input / output device. In a virtual computer system having a function of changing the input / output configuration information during operation of the virtual computer system under the control of the control program on the processing device, the control information of the input / output configuration information A spare storage area for storing the input / output configuration information in the main storage device, and the input / output configuration information is stored in the spare storage area in the process of dynamically reconfiguring the input / output configuration information. Means for storing, and when the control program receives a failure occurrence report from the input / output processor during execution of change processing of the input / output configuration information, the control program issues an operation command for recovery processing to the input / output processor. Issuing means, and when the recovery processing operation command is issued from the control program to the input / output processor, the input / output configuration information is set to the state before the change based on the information indicating the change contents stored in the spare storage area. A failure recovery processing method comprising means for recovering, and means for continuing the input / output configuration change processing by the control program after recovery processing of the input / output configuration information by the input / output processor. .
JP8150741A 1996-06-12 1996-06-12 Fault recovery processing system for dynamic reconstitution processing Pending JPH09330141A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8150741A JPH09330141A (en) 1996-06-12 1996-06-12 Fault recovery processing system for dynamic reconstitution processing

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8150741A JPH09330141A (en) 1996-06-12 1996-06-12 Fault recovery processing system for dynamic reconstitution processing

Publications (1)

Publication Number Publication Date
JPH09330141A true JPH09330141A (en) 1997-12-22

Family

ID=15503410

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8150741A Pending JPH09330141A (en) 1996-06-12 1996-06-12 Fault recovery processing system for dynamic reconstitution processing

Country Status (1)

Country Link
JP (1) JPH09330141A (en)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010045586A (en) * 1999-11-05 2001-06-05 이계철 Device for security against deleting a file in UNIX series Operating System and Method thereof
KR100319852B1 (en) * 1997-12-26 2002-04-22 윤종용 Computer system having failover function and method thereof
KR100413195B1 (en) * 2000-11-22 2004-01-07 소프트온넷(주) A system and method for recovering/protecting of computer file system using invisible file technology
KR100424236B1 (en) * 2000-04-20 2004-03-24 인터내셔널 비지네스 머신즈 코포레이션 Mechanism for automated, generic application damage detection and repair in strongly encapsulated applications
KR100458550B1 (en) * 2002-10-07 2004-12-03 주식회사 파이널데이터 Data delete detecting and recovering system and methode thereof
WO2005085974A1 (en) * 2004-03-04 2005-09-15 Hitachi, Ltd. Information processing device
US7389442B1 (en) 1997-12-26 2008-06-17 Samsung Electronics Co., Ltd. Apparatus and method for self diagnosis, repair, removal by reversion of computer problems from desktop and recovery from booting or loading of operating system errors by removable media

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100319852B1 (en) * 1997-12-26 2002-04-22 윤종용 Computer system having failover function and method thereof
US7389442B1 (en) 1997-12-26 2008-06-17 Samsung Electronics Co., Ltd. Apparatus and method for self diagnosis, repair, removal by reversion of computer problems from desktop and recovery from booting or loading of operating system errors by removable media
KR20010045586A (en) * 1999-11-05 2001-06-05 이계철 Device for security against deleting a file in UNIX series Operating System and Method thereof
KR100424236B1 (en) * 2000-04-20 2004-03-24 인터내셔널 비지네스 머신즈 코포레이션 Mechanism for automated, generic application damage detection and repair in strongly encapsulated applications
KR100413195B1 (en) * 2000-11-22 2004-01-07 소프트온넷(주) A system and method for recovering/protecting of computer file system using invisible file technology
KR100458550B1 (en) * 2002-10-07 2004-12-03 주식회사 파이널데이터 Data delete detecting and recovering system and methode thereof
WO2005085974A1 (en) * 2004-03-04 2005-09-15 Hitachi, Ltd. Information processing device

Similar Documents

Publication Publication Date Title
US5386565A (en) Method and system for controlling/monitoring computer system having plural operating systems to run thereon
US5805790A (en) Fault recovery method and apparatus
US7313637B2 (en) Fabric and method for sharing an I/O device among virtual machines formed in a computer system
JP4921384B2 (en) Method, apparatus and system for dynamically reallocating memory from one virtual machine to another
US4347565A (en) Address control system for software simulation
KR100612715B1 (en) Autonomic recovery from hardware errors in an input/output fabric
US5437033A (en) System for recovery from a virtual machine monitor failure with a continuous guest dispatched to a nonguest mode
US6275893B1 (en) Method and apparatus for providing seamless hooking and intercepting of selected kernel and HAL exported entry points in an operating system
US7203808B2 (en) Isolation and protection of disk areas controlled and for use by virtual machine manager in firmware
JPS61206043A (en) Interruption control method in virtual computer system
US20100332722A1 (en) Virtual machine system and control method thereof
JPH10283210A (en) Virtual machine movement control system between virtual machine systems
US5537598A (en) System for installing processor control code
US4977500A (en) System recovery method for computer system having a standby system with a wait job operation capability
US5003468A (en) Guest machine execution control system for virutal machine system
JPH09330141A (en) Fault recovery processing system for dynamic reconstitution processing
JP2556018B2 (en) Channel path group management method
JP2543640B2 (en) Virtual computer system
JPH0285938A (en) Memory dump system
JP2708636B2 (en) Information processing device maintenance control method
JPH09282196A (en) Program run control system for complex logic processor system
US7688840B2 (en) Method for incorporating new device in information processing apparatus, information processing apparatus and computer readable information recording medium
JPH0567973B2 (en)
JP2682746B2 (en) Virtual computer system
JPH06242975A (en) Virtual computer dispatch system of multiple information processing system