JPH04257035A - Fault information processing system under virtual computer system - Google Patents

Fault information processing system under virtual computer system

Info

Publication number
JPH04257035A
JPH04257035A JP3018543A JP1854391A JPH04257035A JP H04257035 A JPH04257035 A JP H04257035A JP 3018543 A JP3018543 A JP 3018543A JP 1854391 A JP1854391 A JP 1854391A JP H04257035 A JPH04257035 A JP H04257035A
Authority
JP
Japan
Prior art keywords
information
guest
machine number
virtual machine
virtual
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3018543A
Other languages
Japanese (ja)
Inventor
Takanori Shimizu
孝紀 清水
Hideo Goto
秀夫 後藤
Kunio Yajima
矢島 邦夫
Kazutori Takashita
高下 千酉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP3018543A priority Critical patent/JPH04257035A/en
Publication of JPH04257035A publication Critical patent/JPH04257035A/en
Pending legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

PURPOSE:To operate the early confirmation and deal of an abnormal surrounding device, in a fault information processing system under a virtual computer system. CONSTITUTION:At the time of the occurrence of the fault of a surrounding device 4, a surrounding device abnormality informing system under an operating system(OS) 20 of each guest virtual computer (guest VM) 2 receives both logging information detected by the OS 20 under each guest VM 2 and the logging information detected by a host system 1, by an interface between the OS 20 and the host system 1, and analyzes the logging information by each virtual equipment number. Then, the error code information of the virtual equipment number is converted into that of a real equipment number by each degree of importance, based on an equipment number management table equipped with virtual equipment number/real equipment number corresponding information preliminarily received from the host system 1, and it is automatically transferred to a maintenance center 3.

Description

【発明の詳細な説明】[Detailed description of the invention]

【0001】0001

【産業上の利用分野】最近、電子計算機のシステム移行
や、ハードウェアの有効利用を図る為、益々、仮想計算
機システムの需要は高まっている。
[Industrial Application Field] Recently, there has been an increasing demand for virtual computer systems in order to migrate electronic computer systems and to make effective use of hardware.

【0002】該仮想計算機システムにおいては、ホスト
システムのオペレーティングシステム(OS)の配下で
、複数個のゲスト仮想計算機 (以下、ゲストVMとい
う) が、それぞれのオペレーティングシステム(OS
)の配下で、恰も、独立した計算機のように動作してお
り、該ゲストVMの配下で動作する周辺装置に障害が発
生すると、該周辺装置に割り当てられている仮想機番で
、障害情報が、それぞれ、独立したロギングファイルに
記録される。
[0002] In the virtual computer system, a plurality of guest virtual machines (hereinafter referred to as guest VMs) operate under the operating system (OS) of the host system.
), it operates like an independent computer, and when a failure occurs in a peripheral device running under the guest VM, the failure information is displayed in the virtual machine number assigned to the peripheral device. , each recorded in a separate logging file.

【0003】このような仮想計算機システムでは、最近
のシステムの大規模化に伴い、上記ロギング情報も膨大
になると共に、該障害情報が全て、仮想機番で記録され
ている為、従来の人手による調査方式では、重大な障害
の見落としとか,実装置機番とのスリ合わせが必要とな
る等の問題があり、システムの大規模化, 多様化に適
した、効果的な障害情報処理方式が必要とされるように
なってきた。
[0003] In such a virtual computer system, as the scale of the system increases recently, the amount of logging information described above becomes enormous, and all of the failure information is recorded using virtual machine numbers, so it is difficult to manually The investigation method has problems such as overlooking serious failures and the need to match the machine number with the actual equipment, so there is a need for an effective failure information processing method that is suitable for increasing the scale and diversification of systems. It has come to be said that

【0004】0004

【従来の技術】図10は、従来の仮想計算機システム配
下における障害情報処理方式を示した図である。
2. Description of the Related Art FIG. 10 is a diagram showing a conventional fault information processing method under a virtual computer system.

【0005】従来は、障害発生後,又は、定期保守時,
又は、業務終了時に、各々のゲストVM 2のオペレー
ティングシステム(OS)配下のロギング情報■,及び
、ホストシステム 1のロギング情報■を、該ゲストV
M2のオペレーティングシステム(OS)配下のエラー
情報編集システム25 が編集し、編集リストとして保
守センタ 3に転送して出力する。
Conventionally, after a failure occurs or during regular maintenance,
Or, at the end of the business, the logging information ■ under the operating system (OS) of each guest VM 2 and the logging information ■ of the host system 1 are transferred to the guest VM 2.
The error information editing system 25 under the operating system (OS) of M2 edits the information, and transfers the edited list to the maintenance center 3 for output.

【0006】[0006]

【発明が解決しようとする課題】該保守センタ 3にお
いては、保守技術員が該出力された編集リストを見て、
障害調査, 及び予防保守を行っていたが、この従来方
式では、該仮想計算機システムの大規模化に伴う膨大な
量のロギング情報編集リストを人手で調査するため、保
守技術員のスキルの違いとか、見落とし等により、重大
な障害を見落としてしまう問題があった。
[Problem to be Solved by the Invention] At the maintenance center 3, a maintenance engineer looks at the output edit list and
Although fault investigation and preventive maintenance were carried out, in this conventional method, the huge amount of logging information edit list that comes with the increase in the scale of the virtual computer system is manually investigated, so there are differences in the skills of maintenance engineers, etc. There was a problem in which serious failures were overlooked due to oversight.

【0007】又、各ゲストVM 2配下のオペレーティ
ングシステム(OS)に対しては、周辺装置の機番は、
仮想アドレスで表現されているため、該周辺装置の障害
が検出されたときに記録されるロギング情報には、該障
害の周辺装置の機番が全て、上記仮想アドレス (仮想
機番) で出力されることになり、実装置機番とのスリ
合わせが必要であった。
[0007] Furthermore, for the operating system (OS) under each guest VM 2, the machine number of the peripheral device is
Since it is expressed as a virtual address, in the logging information that is recorded when a failure in the peripheral device is detected, all machine numbers of the peripheral device in question are output as the above virtual address (virtual machine number). Therefore, it was necessary to match the actual machine number.

【0008】又、該仮想計算機システムのホストシステ
ム 1が検出したロギング情報■と、該仮想計算機シス
テムを構成している複数のゲストVM 2配下のオペレ
ーティングシステム(OS)が検出したロギング情報■
を、個々に編集しなければならないという問題があった
[0008] Also, logging information (■) detected by the host system 1 of the virtual computer system, and logging information (■) detected by the operating systems (OS) under the plurality of guest VMs 2 constituting the virtual computer system.
There was a problem in that the files had to be edited individually.

【0009】即ち、従来の仮想計算機システム配下にお
ける障害情報処理方式においては、 (1) 保守技術員が大量のロギング情報編集結果をチ
ェックするときの見落としがある。
That is, in the conventional failure information processing method under a virtual computer system, (1) there is an oversight when a maintenance engineer checks a large amount of logging information editing results;

【0010】(2) 仮想計算機システムの大規模化,
 多様化に伴う保守技術員の不足。 (3) 仮想計算機システムにおいては、周辺装置のロ
ギング情報が仮想機番で書き込まれることによる障害発
生装置の判断ミスの発生。
(2) Increase in scale of virtual computer system,
Shortage of maintenance engineers due to diversification. (3) In a virtual computer system, logging information for peripheral devices is written using the virtual machine number, resulting in a misjudgment of the faulty device.

【0011】(4) 分析作業工数や, 資源 (各仮
想計算機システムで分析するために使用する資源、例え
ば、出力リストの紙) の無駄が多い。 (5) 総合的で、且つ、正確な分析, 及び、把握が
、保守技術者の持ち得るスキルに依存する。
(4) There is a lot of waste in analysis work man-hours and resources (resources used for analysis in each virtual computer system, such as paper for output lists). (5) Comprehensive and accurate analysis and understanding depends on the skills of maintenance engineers.

【0012】等の問題点があった。本発明は上記従来の
欠点に鑑み、仮想計算機システム配下における障害情報
処理方式において、異常周辺装置の早期確認,早期対処
を実現することができる方式を提供することを目的とす
るものである。
There were problems such as [0012]. SUMMARY OF THE INVENTION In view of the above-mentioned conventional drawbacks, it is an object of the present invention to provide a fault information processing method under a virtual computer system that can quickly identify and deal with abnormal peripheral devices.

【0013】[0013]

【課題を解決するための手段】図1, 図2, 図3は
本発明の原理構成図であり、(a) は各ゲストVMの
オペレーティングシステム配下の周辺装置異常通報シス
テムが障害情報を編集して保守センタに通報する場合を
示し、(b1),(b2) はサーバVMが一括管理し
て、保守センタに通報する場合を示している。上記の問
題点は下記の如くに構成した仮想計算機システム配下に
おける障害情報処理方式によって解決される。
[Means for Solving the Problems] Figures 1, 2, and 3 are diagrams showing the principle structure of the present invention, and (a) shows how the peripheral device abnormality reporting system under the operating system of each guest VM edits failure information. (b1) and (b2) show cases in which the server VM collectively manages and reports to the maintenance center. The above problem is solved by a failure information processing method under a virtual machine system configured as follows.

【0014】(1) 仮想計算機システムにおいて、周
辺装置 4の障害が発生したとき、各ゲスト仮想計算機
 (ゲストVM) 2 配下のオペレーティングシステ
ム(OS) 20 が検出したロギング情報■,及び、
ホストシステム 1が検出したロギング情報■を、各ゲ
スト仮想計算機 (ゲストVM) 2 のオペレーティ
ングシステム(OS) 20 配下の周辺装置異常通報
システム 21 が、該障害の発生時点でオペレイティ
ングシステム(OS) 20,及びホストシステム 1
とのインタフェースにより受け取り、各仮想機番による
ロギング情報を解析し、予め、上記ホストシステム 1
から受信している仮想機番/実機番対応情報を備えた装
置管理テーブル■に基づいて、重要度別に、仮想機番→
実機番のエラーコード情報に変換して、保守センタ 3
に自動転送するように構成する。{図1 (a)参照}
(2) 仮想計算機システムにおいて、各ゲスト仮想計
算機 (ゲストVM) 2 配下のオペレーティングシ
ステム(OS) 20 が検出したロギング情報■, 
及び、ホストシステム(1) が検出したロギング情報
■を、特定のゲスト仮想計算機 (ゲストVM) 2a
が収集して、一括管理する手段を設けて、該特定のゲス
ト仮想計算機 (ゲストVM) 2aが、予め、上記ホ
ストシステム 1から受信している仮想機番/実機番対
応情報を備えた装置管理テーブル■に基づいて、各仮想
機番による障害情報を解析し、仮想機番→実機番のエラ
ーコード情報に変換, 編集して、出力するように構成
する。{図2 (b1),図3 (b2) 参照}
(1) In the virtual computer system, when a failure occurs in the peripheral device 4, the logging information detected by the operating system (OS) 20 under each guest virtual machine (guest VM) 2, and
The logging information detected by the host system 1 is sent to the operating system (OS) 20 of each guest virtual machine (guest VM) 2 by the peripheral device error reporting system 21 at the time of occurrence of the failure. , and host system 1
The above host system 1
Based on the device management table with the virtual machine number/real machine number correspondence information received from the virtual machine number→
Convert it to the error code information of the actual machine number and send it to the maintenance center 3
Configure automatic forwarding to {See Figure 1 (a)}
(2) In the virtual computer system, logging information detected by each guest virtual machine (guest VM) 2 and the underlying operating system (OS) 20
The logging information detected by the host system (1) is sent to a specific guest virtual machine (guest VM) 2a
A device management system is provided in which the specific guest virtual machine (guest VM) 2a is equipped with the virtual machine number/actual machine number correspondence information that has been received from the host system 1 in advance. Based on table ■, it is configured to analyze the failure information for each virtual machine number, convert it into error code information from virtual machine number to real machine number, edit it, and output it. {See Figure 2 (b1), Figure 3 (b2)}

【0
015】
0
015]

【作用】即ち、本発明によれば、先ず、仮想計算機シス
テムを構成している複数個のゲストVMのそれぞれに、
ホストシステムから各ゲストVMの接続情報(VM固有
情報)を送信し、各ゲストVMは、該ホストシステムか
ら受信した該VM固有情報に基づいて、装置管理テーブ
ル■を生成する。
[Operation] That is, according to the present invention, first, each of the plurality of guest VMs constituting the virtual computer system is
Connection information (VM-specific information) of each guest VM is transmitted from the host system, and each guest VM generates a device management table (2) based on the VM-specific information received from the host system.

【0016】該装置管理テーブル■には、該ゲストVM
配下の装置と、いつ該装置が接続されたという時刻と、
各装置の実機番と仮想機番との対応情報等が記載されて
いる。  又、各ゲストVMの内、特定のゲストVMは
、ホストシステムが検出したロギング情報■と、自己の
オペレーティングシステムが検出したロギング情報■と
を、他のゲストVMは自己のオペレーティングシステム
が検出したロギング情報■のみを、それぞれの周辺装置
異常通報システムがシステムエラーロギングファイル■
から、最新の仮想機番対応の障害情報を、例えば、約1
0件を取り出し、主記憶上に展開しておく。
[0016] In the device management table (2), the guest VM
The subordinate device, the time when the device was connected,
Correspondence information between the real machine number and virtual machine number of each device is described. Also, among each guest VM, a specific guest VM receives the logging information detected by the host system and the logging information detected by its own operating system, and other guest VMs receive the logging information detected by their own operating system. Only information ■ is stored in the system error logging file by each peripheral device abnormality reporting system ■
For example, the failure information corresponding to the latest virtual machine number is about 1
Extract 0 items and expand them on main memory.

【0017】このとき、新しい障害が発生すると、本発
明の場合、該障害情報は上記システムエラーロギングフ
ァイル■に格納されると共に、該周辺装置異常通報シス
テムにも転送され、上記展開されている、最新の障害情
報に組込まれると共に、最も、古い障害情報は除外され
、常時、最新の障害情報が展開されているように動作す
る。
At this time, when a new failure occurs, in the case of the present invention, the failure information is stored in the system error logging file (2), and is also transferred to the peripheral device abnormality reporting system, and the information is expanded as described above. The latest fault information is incorporated, and the oldest fault information is excluded, so that the latest fault information is always expanded.

【0018】又、本周辺装置異常通報システムは、前回
までの一時的エラーを集計している集計ファイル■を読
み出し、主記憶上に展開する。該集計ファイル■には、
例えば、ディスク装置(DASD)の場合、そのシリン
ダ/ヘッド毎の一時障害の累積カウンタが格納されてい
る。
The present peripheral device abnormality notification system also reads out the tally file (2) that tallies the temporary errors up to the previous time, and expands it on the main memory. The tally file ■ has the following information:
For example, in the case of a disk device (DASD), a cumulative counter of temporary failures is stored for each cylinder/head.

【0019】又、本周辺装置異常通報システムは、閾値
ファイル■から、上記各一時的エラーの情報を保守セン
タ,及び、担当保守拠点に転送するか否かを判定する為
の閾値(エラー回数)を読み出し、主記憶上に展開する
[0019] Also, this peripheral device abnormality reporting system uses a threshold value (number of errors) for determining whether or not to transfer the information of each temporary error mentioned above to the maintenance center and the maintenance base in charge from the threshold value file (2). is read and expanded onto main memory.

【0020】該周辺装置異常通報システムは、該主記憶
上に展開されている、上記最新の障害情報を解析し、重
要度別に分類し、永久的な固定障害の場合には、即、コ
ード化し、一時的なエラーの場合には、集計データとし
て蓄積すると共に、上記閾値データと比較して、該閾値
を越えた場合には、はじめて、コード化して、上記保守
センタ等に転送する。このとき、該障害情報内の仮想機
番は、上記主記憶上に展開されている上記装置管理テー
ブル■に基づいて、実装置機番に変換し転送する。
[0020] The peripheral device abnormality reporting system analyzes the latest failure information stored in the main memory, classifies it by importance, and immediately encodes it into a code in the case of a permanent fixed failure. In the case of a temporary error, the data is accumulated as aggregated data, and compared with the threshold data, and if the threshold is exceeded, it is coded and transmitted to the maintenance center or the like. At this time, the virtual machine number in the fault information is converted into a real machine number and transferred based on the device management table (2) developed on the main memory.

【0021】次に、本発明の他の障害情報処理方式の作
用動作について説明する。この方式は、該仮想計算機シ
ステムを構成している複数個のゲストVM配下のオペレ
ーティングシステムが検出したロギング情報■,及び、
ホストシステムが検出しているロギング情報■を、該複
数個のゲストVMの内の特定のゲストVMが、サーバV
Mとなって、一括収集,管理して、各仮想機番対応の障
害情報を実装置機番対応の障害情報に編集して出力装置
に出力するものである。
Next, the operation of another fault information processing method of the present invention will be explained. This method collects logging information detected by the operating system under multiple guest VMs that make up the virtual machine system, and
A specific guest VM among the plurality of guest VMs stores the logging information detected by the host system on the server V.
M, which collectively collects and manages the fault information corresponding to each virtual machine number, edits it into fault information corresponding to the real machine number, and outputs it to an output device.

【0022】具体的には、該サーバVMからの要求によ
り、各ゲストVMの一括収集プログラムが自己のシステ
ムエラーロギングファイル■から障害情報を読み出し、
システム共通のデータ形式に変換して、一時ファイルに
格納した後、交信データ形式に変換して、上記サーバV
M(サーバシステム)に転送する。
Specifically, in response to a request from the server VM, the batch collection program of each guest VM reads failure information from its own system error logging file (■),
After converting it into a data format common to the system and storing it in a temporary file, it is converted into a communication data format and then
Transfer to M (server system).

【0023】該サーバVMに転送されてきた各障害情報
は、前もって、ホストシステムから転送されている上記
VM固有情報に基づいて生成されている、上記装置管理
テーブル■が参照され、該障害情報中の仮想機番を実機
番に置換して、例えば、累積ファイルに格納する。
[0023] Each fault information transferred to the server VM is referenced to the device management table (1), which is generated in advance based on the VM-specific information transferred from the host system, and the fault information is Replace the virtual machine number with the real machine number and store it in the cumulative file, for example.

【0024】該累積ファイルに格納された障害情報は、
該サーバシステムが実行するログ編集プログラムによっ
て、例えば、装置機番,エラー事象,エラー発生日付け
情報の形式に編集された後、分析編集リストとして、保
守センタ等に転送され出力される。
[0024] The failure information stored in the cumulative file is
The log editing program executed by the server system edits the information into the format of, for example, device number, error event, and error occurrence date information, and then transfers and outputs it to a maintenance center or the like as an analysis editing list.

【0025】即ち、この場合の障害情報の出力形式は、
該障害情報内の仮想機番を実装置機番に変換して出力す
る点は、前述の各ゲストVMが、それぞれが管理してい
るロギング情報■等を編集して、個別に出力するときと
同じであるが、本方式の場合は、特定のサーバVMが、
各ゲストVMがロギングしている障害情報(この中には
、ホストシステムが検出しているロギング情報も含まれ
る)を一括収集して、実機番対応の障害情報リストとし
て一括編集して出力する所が異なる。
That is, the output format of the failure information in this case is as follows:
Converting the virtual machine number in the fault information to the real device machine number and outputting it is different from when each guest VM mentioned above edits the logging information etc. that it manages and outputs it individually. However, in the case of this method, a specific server VM
A place where you can collect all the fault information logged by each guest VM (this includes the logging information detected by the host system) and edit and output it as a fault information list corresponding to the actual machine number. are different.

【0026】このように、従来方式が、各システム、即
ち、ゲストVM毎に編集された仮想機番対応の該システ
ム分毎の分析編集リストを保守員が見て、自己のスキル
でもって総合的に障害状況を把握し、保守作業を進めな
ければならなかったのに対して、本発明による障害情報
処理方式においては、仮想機番でなく、実機番で、固定
障害と、一時障害とに分類されて通知されるので、該障
害の発生した装置の正確な割り出しが可能になると共に
、特定のサーバVMで一括管理されて出力される場合に
は、障害情報が一括されているので、一つの分析編集リ
ストで正確で総合的な情報が得られる。従って、被疑部
品の早期摘出,早期対処等に役立ち、品質の高い保守サ
ービスの提供が可能となる効果が得られる。
[0026] In this way, in the conventional method, maintenance personnel look at the analysis and editing list for each system corresponding to the virtual machine number edited for each system, that is, each guest VM, and perform a comprehensive analysis using their own skills. In contrast, in the fault information processing method according to the present invention, it is necessary to understand the fault situation immediately and proceed with maintenance work.However, in the fault information processing method according to the present invention, the fault is classified into fixed faults and temporary faults based on the actual machine number, not the virtual machine number. This makes it possible to accurately identify the device where the failure occurred, and if the failure information is collectively managed and output by a specific server VM, the failure information is consolidated, so it is possible to accurately identify the device where the failure has occurred. Get accurate and comprehensive information with the analysis compilation list. Therefore, the present invention is useful for early detection and early treatment of suspect parts, and has the effect of making it possible to provide high-quality maintenance services.

【0027】[0027]

【実施例】以下本発明の実施例を図面によって詳述する
。前述の図1,図2,図3は、本発明の原理構成図であ
り、図4,図5は本発明の一実施例を模式的に示した図
であり、(a) はVM固有情報の形式を示し、(b)
 は機番毎の障害情報の展開例を示し、(c) は集計
ファイルの展開例を示し、(d) は閾値ファイルの展
開例を示し、(e) はコード情報のフォーマット例を
示しており、図6〜図8は、本発明の他の実施例を模式
的に示した図であり、(a) は障害データをサーバV
Mに転送する例を示し、(b) は装置管理テーブルの
構成例を示し、(c) は動作フローを示しており、図
9は本発明の仮想機番→実機番変換方式を示した図であ
る。
DESCRIPTION OF THE PREFERRED EMBODIMENTS Examples of the present invention will be described below in detail with reference to the drawings. The aforementioned FIGS. 1, 2, and 3 are diagrams showing the principle configuration of the present invention, and FIGS. 4 and 5 are diagrams schematically showing an embodiment of the present invention, and (a) shows VM-specific information. (b)
shows an example of developing failure information for each machine number, (c) shows an example of developing a total file, (d) shows an example of developing a threshold file, and (e) shows an example of the format of code information. , FIGS. 6 to 8 are diagrams schematically showing other embodiments of the present invention, in which (a) the fault data is transferred to the server V
(b) shows an example of the configuration of the device management table, (c) shows the operation flow, and FIG. 9 is a diagram showing the virtual machine number → real machine number conversion method of the present invention. It is.

【0028】本発明においては、仮想計算機システムが
稼働中に、磁気ディスク装置などの周辺装置が一時的,
 又は、永久的な障害が発生した時点で、各ゲストVM
 2配下のオペレーティングシステム(OS)が検出し
たロギング情報■, 及び、ホストシステムが検出した
ロギング情報■を、各ゲストVM 2配下の周辺装置異
常通報システム 21 が分析, 分類して、実機番で
保守センタ 3に自動通知する手段, 又は、該仮想計
算機システムを構成しているゲストVM 2の一つが、
サーバVM 2a として機能し、上記各ゲストVM 
2でのロギング情報■を一括して収集して累積したもの
を分析して、実機番対応のエラー情報に編集し、分析編
集リストとして、保守センタ 3に出力する手段が本発
明を実施するのに必要な手段である。尚、全図を通して
同じ符号は同じ対象物を示している。
In the present invention, while the virtual computer system is operating, peripheral devices such as magnetic disk devices are temporarily disabled.
Or, upon a permanent failure, each guest VM
The logging information detected by the operating system (OS) under 2 and the logging information detected by the host system are analyzed and classified by the peripheral device error reporting system 21 under each guest VM 2, and maintained based on the actual machine number. Means for automatically notifying the center 3, or one of the guest VMs 2 configuring the virtual computer system,
Functions as server VM 2a, and each of the above guest VMs
The present invention is implemented by means of collecting the logging information in step 2 all at once, analyzing the accumulated information, editing it into error information corresponding to the actual machine number, and outputting it to the maintenance center 3 as an analysis and editing list. It is a necessary means. Note that the same reference numerals indicate the same objects throughout the figures.

【0029】以下、図1〜図3を参照しながら、図4,
図5,及び、図6〜図8,図9によって、本発明の仮想
計算機システム配下における障害情報処理方式を説明す
る。先ず、図1に示した、周辺装置異常通報システム 
21 は、各オペレーティングシステムが初期プログラ
ムローディング(IPL) された後、自動的に起動さ
れ、該オペレーティングシステム (以下、OSという
)が停止するまで動作し続ける。
Hereinafter, while referring to FIGS. 1 to 3, FIGS.
A fault information processing method under the virtual computer system of the present invention will be explained with reference to FIG. 5, FIGS. 6 to 8, and FIG. 9. First, the peripheral device abnormality reporting system shown in Figure 1
21 is automatically started after each operating system is initial program loaded (IPL), and continues to operate until the operating system (hereinafter referred to as OS) is stopped.

【0030】(1) 該周辺装置異常通報システム 2
1 は、ホストシステム 1から、例えば、図4(a)
 に示したVM固有情報受信形式に基づいて受信したV
M固有情報■に基づき、現状の実/仮想機番の対応情報
を読込み、主記憶上に、図7(b) に示した装置管理
テーブル■の形式でテーブル展開しておく。又、このテ
ーブルは実/仮想機番の対応が変更されるごとに更新し
ていく。
(1) Peripheral device abnormality reporting system 2
1 is from the host system 1, for example, as shown in FIG. 4(a).
V received based on the VM-specific information reception format shown in
Based on the M-specific information (■), the current real/virtual machine number correspondence information is read and expanded into the main memory in the form of the device management table (■) shown in FIG. 7(b). Further, this table is updated every time the correspondence between real and virtual machine numbers is changed.

【0031】(2) システムエラーロギングファイル
■の情報を、装置毎に、最新ロギング情報から必要な件
数、例えば、約10件分を読み出し、図4(b) に示
した形式で、主記憶上に展開しておく。
(2) For each device, read out the necessary number of information from the system error logging file ■, for example, about 10 items from the latest logging information, and store it in the main memory in the format shown in Figure 4(b). Let's expand it.

【0032】該システムエラーロギングファイル■には
、当該仮想計算機システムの周辺装置に関する過去の全
てのエラー情報が格納されている。本発明の上記周辺装
置異常通報システム 21 は、その中から、最新の情
報を、例えば、10件読み出し、上記のように、主記憶
上に展開する。
[0032] The system error logging file (2) stores all past error information regarding the peripheral devices of the virtual computer system. The peripheral device abnormality reporting system 21 of the present invention reads out the latest information, for example, 10 pieces of information, and expands it on the main memory as described above.

【0033】(3) 前回までの一時的エラーの集計フ
ァイル■の内容を、図4(c) に示した形式で、主記
憶上に展開する。ファイル記憶装置(DASD)の場合
、例えば、シリンダ/ヘッド毎にエラーカウンタを持ち
、一時的なエラーが検出される度に、該展開されている
カウンタ上でカウントされる。
(3) The contents of the previous temporary error summary file ■ are developed on the main memory in the format shown in FIG. 4(c). In the case of a file storage device (DASD), for example, each cylinder/head has an error counter, and each time a temporary error is detected, it is counted on the expanded counter.

【0034】(4) 又、閾値ファイル■を、図5(d
) に示した形式で、主記憶上に展開する。これは、一
時的エラーの回数の閾値となるもので、上記主記憶上に
展開されている集計データの一時的エラーの回数が、上
記閾値を越えた時、はじめて該障害情報はコード化され
、保守センタ, 及び、担当保守拠点 3に転送される
。このとき、当該カウンタは“0”クリアされる。
(4) In addition, the threshold file ■ is shown in FIG.
) is expanded in the main memory in the format shown in . This is a threshold for the number of temporary errors, and only when the number of temporary errors in the aggregated data expanded on the main memory exceeds the threshold, the fault information is encoded. Transferred to the maintenance center and the responsible maintenance base 3. At this time, the counter is cleared to "0".

【0035】(5) 周辺装置の新たな障害情報, 又
は、統計情報(消耗品情報や、DASDなどでは、シー
クカウント情報, リードデータバイト数情報) など
をOSが検出すると、上記システムエラーロギングファ
イル■に書き込むと同時に、本周辺装置異常通報システ
ム 21 にも転送され、上記主記憶上に展開されてい
る機番ごとの障害情報(図4(b) 参照) に反映さ
れる。具体的には、前述のように、該新規なエラー情報
が追加されると、最も古い障害情報は消去される。
(5) When the OS detects new failure information of peripheral devices or statistical information (consumables information, seek count information, read data byte information for DASD, etc.), the above system error logging file is At the same time, it is also transferred to the peripheral device abnormality notification system 21 and reflected in the failure information for each machine number expanded in the main memory (see FIG. 4(b)). Specifically, as described above, when the new error information is added, the oldest failure information is deleted.

【0036】(6) 当該仮想計算機システムのホスト
システム 1が検出して、ホストログ■としてファイル
装置に格納されているログ情報も、ゲストVM 2−ホ
スト間のインタフェースにより、特定のゲストVM 2
の、上記周辺装置異常通報システム 21 に渡される
(6) The log information detected by the host system 1 of the virtual machine system and stored in the file device as the host log ■ is also stored in a specific guest VM 2 through the interface between the guest VM 2 and the host.
The information is passed to the peripheral device abnormality reporting system 21.

【0037】(7) 該周辺装置異常通報システム 2
1 は、該主記憶上に、上記図4(b) に示した形式
で展開されているロギング情報を、重要度別に分類し、
永久的なエラーの場合には、即、コード化する。又、一
時的なエラーは集計データとして蓄積されると共に、上
記主記憶上に展開されている{図5 (d)参照}閾値
データと比較され、該閾値を越えたとき、はじめて、該
一時的エラーはコード化される。該コード化データのフ
ォーマットを図5(e) に示す。
(7) Peripheral device abnormality reporting system 2
1 classifies the logging information developed in the format shown in Figure 4(b) above on the main memory by importance level,
In the case of a permanent error, code it immediately. In addition, temporary errors are accumulated as aggregated data and compared with the threshold data stored in the main memory (see Figure 5 (d)), and only when the threshold is exceeded is the temporary error detected. Errors are coded. The format of the encoded data is shown in FIG. 5(e).

【0038】ここで、装置区分は、例えば、DASD/
MT 等の装置の種別を示し、状況認識コードは、エラ
ーの重要度、例えば、固定障害か、一時的障害かを示し
、通報対象装置判別コードは実装置機番を示し、異常状
態 (概要/詳細)は、上記システムエラーロギングフ
ァイル■にロギングされている障害情報を示し、装置タ
イプ詳細は、装置の種類を示している。
[0038] Here, the device classification is, for example, DASD/
The situation recognition code indicates the severity of the error, for example, whether it is a fixed failure or a temporary failure.The notification target device identification code indicates the actual device number, and indicates the abnormal state (overview/ details) indicates the failure information logged in the system error logging file (2), and device type details indicates the type of device.

【0039】上記 DASD を例にして説明すると、
発生したロギング情報により、訂正可能なエラー (一
時的エラー) と、訂正不可能なエラー (永久的なエ
ラー) とに分け、訂正不可能なエラーの場合は、発生
したロギング情報をもとに即座にコード化して、保守セ
ンタ 3等に転送する。訂正可能なエラーの場合は、発
生箇所 (シリンダ/ヘッド) をもとに集計していく
。該集計した値が、上記閾値を越えたとき、はじめてコ
ード化して転送する。 このとき、上記集計データの対応するカウンタを“0”
クリアする。又、障害の度合いにより過去の事象も付帯
する。又、このとき、予め、主記憶上に展開されている
上記装置管理テーブル■{図7(b) 参照}をもとに
、実装置機番を該コード内に設定する。
[0039] Taking the above DASD as an example,
Based on the logging information that occurs, errors are classified into correctable errors (temporary errors) and uncorrectable errors (permanent errors). code and transfer it to maintenance center 3, etc. In the case of correctable errors, the total is calculated based on the location (cylinder/head) where the error occurred. When the total value exceeds the threshold value, it is encoded and transmitted. At this time, set the corresponding counter of the above aggregated data to “0”.
clear. Also, past events may be included depending on the degree of disability. Also, at this time, the actual device machine number is set in the code based on the device management table {see FIG. 7(b)} expanded in advance on the main memory.

【0040】(8) 該コード化された情報は、回線 
7を経由して、即座に、保守センタ, 担当保守拠点 
3に通知される。{図1(a) 参照} (9) 該コード化された情報をもとに、該センタ側の
ディスプレイ 3a 上に被疑箇所と被疑重要度を表示
する。
(8) The coded information is
7, immediately to the maintenance center and the responsible maintenance base.
3 will be notified. {See FIG. 1(a)} (9) Based on the coded information, the suspected location and the severity of the suspected problem are displayed on the display 3a on the center side.

【0041】(10)  本周辺装置異常通報システム
 21 の動作が停止される時、主記憶上に展開されて
いる上記集計データは集計ファイル■に記録される。上
記の実施例は、複数個のゲストVMから構成されている
仮想計算機システムにおいて、各ゲストVMのOSの配
下で動作する周辺装置異常通報システム 21 が、該
OS及び、ホストシステムが検出したロギング情報■,
 ■を読み出し、重要度別に分類して、固定障害の場合
には、即座に、コード化し、一時的な障害の時には、集
計して、該集計値が、予め、定められている閾値を越え
たとき、はじめて、コード化して、保守センタ等に通知
するようにした所に特徴がある。
(10) When the operation of the peripheral device abnormality reporting system 21 is stopped, the above-mentioned tally data developed on the main memory is recorded in the tally file (2). In the above embodiment, in a virtual computer system composed of a plurality of guest VMs, a peripheral device abnormality reporting system 21 that operates under the OS of each guest VM collects logging information detected by the OS and the host system. ■,
■ Read out, classify by importance, code immediately in the case of a fixed failure, aggregate it in the case of a temporary failure, and if the total value exceeds a predetermined threshold. It is unique in that it is coded and notified to a maintenance center etc. for the first time.

【0042】次に、図6〜図8によって、本発明の他の
実施例について説明する。本実施例では、例えば、仮想
計算機システムの配下で、3つのゲストVM(システム
)2 が稼働しているものとする。
Next, another embodiment of the present invention will be described with reference to FIGS. 6 to 8. In this embodiment, for example, it is assumed that three guest VMs (systems) 2 are operating under the virtual computer system.

【0043】先ず、ホストシステム(仮想計算機システ
ムを意味する)1 は、稼働中のシステム数(ゲストV
M数),システム名の情報,およびシステムに組み込ま
れている装置 (周辺装置) の実機番と,各システム
で固有に定義されている論理機番(仮想機番)の対応情
報を稼働システム管理情報■として作成し管理している
First, the host system (meaning a virtual computer system) 1 has the number of operating systems (guest V
M number), system name information, and correspondence information between the actual machine numbers of devices (peripheral devices) built into the system and logical machine numbers (virtual machine numbers) uniquely defined for each system. Created and managed as information ■.

【0044】該ホストシステムでは、常に、該稼働シス
テム管理情報■を監視しており、情報の追加,変更等が
ある毎に、装置管理テーブル{図7 (b)参照}■を
作成する。
The host system constantly monitors the operating system management information (2), and creates a device management table {see FIG. 7(b)} each time information is added or changed.

【0045】該作成された装置管理テーブル■は、ホス
トシステム 1のエラー情報格納ファイル (ホストロ
グ) ■に管理情報として記録され、上記稼働システム
管理情報と一緒に、ログ情報累積時の参照情報として使
用される。
The created device management table ■ is recorded as management information in the error information storage file (host log) ■ of the host system 1, and is used as reference information when accumulating log information together with the above operating system management information. used.

【0046】各ゲストVM 2が稼働中に、配下の各装
置でハードウェアエラーが発生すると、該装置が接続さ
れているゲストVMでエラー情報が作成され、システム
エラーロギングファイル(LOGREC)■に格納され
る。
[0046] When a hardware error occurs in each subordinate device while each guest VM 2 is operating, error information is created in the guest VM to which the device is connected and stored in the system error logging file (LOGREC). be done.

【0047】本発明の場合、各ゲストVM 2内に、ロ
グ一括収集プログラム 22 が用意されており、ある
ゲストVM 2がサーバVMとして立候補して、ホスト
システム 1に認識されると、該ゲストVM 2がサー
バVM (サーバシステム) 2aとなり、上記ログ一
括収集プログラム 22 が起動される。{図8 (c
)の処理ステップ 200参照}該サーバVM 2a 
のログ一括収集プログラム 22 が起動されると、図
6(a) に示したように、該サーバVM 2a と各
ゲストVM 2間のデータ通信路を確立し、現在稼働中
の各ゲストVM2内のログ一括収集プログラム 22 
を起動する。{図8 (c)の処理ステップ 201〜
203 参照}該サーバVM 2a により起動された
各ゲストVM 2のログ一括収集プログラム22 は、
自己のシステムエラーロギングファイル(LOGREC
)■内のデータを、各システムに共通なデータ形式に変
換して、一時ファイルに格納する。
In the case of the present invention, a log batch collection program 22 is prepared in each guest VM 2, and when a certain guest VM 2 stands as a server VM and is recognized by the host system 1, the guest VM 2 becomes a server VM (server system) 2a, and the log batch collection program 22 is started. {Figure 8 (c
) Processing step 200} The server VM 2a
When the log batch collection program 22 is started, it establishes a data communication path between the server VM 2a and each guest VM 2, as shown in FIG. Bulk log collection program 22
Start. {Processing step 201 in FIG. 8(c)
203 Reference} The log batch collection program 22 of each guest VM 2 started by the server VM 2a is
Own system error logging file (LOGREC)
) Convert the data in ■ into a data format common to each system and store it in a temporary file.

【0048】その後、該各一時ファイルに格納されてい
るデータを交信データの形式に変換して、上記サーバV
M 2a に、上記データ通信路を介してデータ転送を
行う。{図8 (c)の処理ステップ 208〜210
,206 参照}一方、サーバVM 2a のログ一括
収集プログラム 22 は、自己のシステムエラーロギ
ングファイル(LOGREC)■内のデータ, 及び、
ホストシステム 1のエラー情報格納ファイル (ホス
トログ) ■内のデータを転送する。{図8 (c)の
処理ステップ 204,205参照}該サーバVM 2
a の上記ログ一括収集プログラム 22 に転送され
たデータは、ホストシステム 1から受信している稼働
システム管理情報■, 及び、装置管理テーブル■を参
照して、各ゲストVM 2のエラー情報中の装置機番情
報 (論理機番) を実機番に置換し、累積ファイルに
格納する。{図8 (c)の処理ステップ 207参照
) 該累積ファイルに格納されたデータは、該サーバV
M 2a に用意されているログ編集プログラム 23
 によって分析編集される。
[0048] After that, the data stored in each temporary file is converted into the communication data format, and the data stored in the above-mentioned server V
M 2a , data transfer is performed via the data communication path. {Processing steps 208 to 210 in FIG. 8(c)
, 206} On the other hand, the log batch collection program 22 of the server VM 2a collects the data in its own system error logging file (LOGREC), and
Transfer the data in the host system 1 error information storage file (host log) ■. {See processing steps 204 and 205 in FIG. 8(c)} The server VM 2
The data transferred to the log batch collection program 22 of a is determined by referring to the operating system management information ■ received from the host system 1 and the device management table ■, and identifying the devices in the error information of each guest VM 2. Replace the machine number information (logical machine number) with the actual machine number and store it in the cumulative file. {See processing step 207 in FIG. 8(c)) The data stored in the cumulative file is stored in the server V.
Log editing program provided in M2a 23
Analyzed and edited by.

【0049】このとき、図3 (b2) に示されてい
る如くに、例えば、実装置機番,エラー種別,発生日付
の形式の分析編集リストとして出力され、保守センタ 
3等に転送される。
At this time, as shown in FIG. 3 (b2), an analysis and editing list is output in the form of, for example, actual device machine number, error type, and date of occurrence, and is sent to the maintenance center.
Transferred to 3rd class.

【0050】該保守センタ 3の保守技術員(CE)は
、該出力された分析編集リストにより、ハードウェアの
稼働状況, 及び、障害状況を実機番で的確に把握し、
保守作業を行うことができる。
[0050] The maintenance engineer (CE) of the maintenance center 3 accurately grasps the operating status of the hardware and the failure status using the actual machine number based on the output analysis and editing list.
Can perform maintenance work.

【0051】次に、図9によって、ゲストVM 2の配
下で記録されている仮想機番対応のエラー情報を実機番
対応のエラー情報に変換する手段を説明する。前述のよ
うに、ホストシステム 1は、稼働中のシステム (ゲ
ストVM) 数, システム (ゲストVM)名の情報
を稼働システム管理情報■として、及び、該システム(
ゲストVM)に組み込まれている装置の実機番と各シス
テムで固有に定義されている論理機番(仮想機番)との
対応情報をVM固有情報■として持っている。
Next, referring to FIG. 9, a means for converting error information corresponding to a virtual machine number recorded under the guest VM 2 into error information corresponding to a real machine number will be explained. As mentioned above, the host system 1 stores information such as the number of systems (guest VMs) in operation and the names of the systems (guest VMs) as operating system management information ■, and the system (guest VM).
The VM-specific information (2) contains correspondence information between the actual machine number of the device incorporated in the guest VM (guest VM) and the logical machine number (virtual machine number) uniquely defined for each system.

【0052】ホストシステム 1では、常に、該稼働シ
ステム (ゲストVM), 及び、そのシステム(ゲス
トVM)に接続された装置機番情報を監視しており、情
報の変更,追加がある毎に、ホストシステム 1内の、
前述のエラー情報格納ファイル (ホストログ) ■に
格納する。
[0052] The host system 1 always monitors the operating system (guest VM) and the device machine number information connected to that system (guest VM), and updates the information every time there is a change or addition of information. In host system 1,
Store in the error information storage file (host log) described above.

【0053】該ホストシステム 1は、あるゲストVM
 2がサーバVMに立候補していることを、例えば、電
源投入, ユーザからの指示を契機として認識すると、
該サーバVM 2a に、上記エラー情報格納ファイル
 (ホストログ) ■に格納されているVM固有情報■
を転送すると共に、新たな、変更,追加があると、該エ
ラー情報格納ファイル (ホストログ) ■に格納する
と共に、該変更,追加情報を直接、該サーバVM 2a
 に転送する。
[0053] The host system 1 is a certain guest VM.
2 is running as a server VM, for example, when the power is turned on or an instruction from the user is triggered.
The VM-specific information ■ stored in the above error information storage file (host log) ■ on the server VM 2a
In addition, if there is a new change or addition, it is stored in the error information storage file (host log), and the change or addition information is directly transferred to the server VM 2a.
Transfer to.

【0054】該サーバVM 2a は、該ホストシステ
ム 1から転送されてきたVM固有情報を基に、前述の
装置管理テーブル■{図7 (b)参照}を作成する。 サーバVM 2a においては、ログ編集プログラム2
3 によって分析編集リストを作成する時において、各
ゲストVM 2から転送されてきているログ情報中の仮
想機番を、上記装置管理テーブル■を参照して実装置機
番に変換し、上記分析編集リストを作成し、保守センタ
 3に転送する。
The server VM 2a creates the device management table {see FIG. 7(b)} based on the VM-specific information transferred from the host system 1. In server VM 2a, log editing program 2
3. When creating the analysis edit list using step 3, convert the virtual machine number in the log information transferred from each guest VM 2 to a real device machine number by referring to the device management table Create a list and forward it to Maintenance Center 3.

【0055】該仮想機番→実装置機番の変換処理は、図
4,図5で説明した障害情報処理方式、即ち、各ゲスト
VM 2で、ロギング情報から固定情報は、即、コード
化して、一時的エラーはエラー発生回数を集計して、閾
値を越えたとき、コード化して、保守センタ 3に転送
する際にも、各ゲストVM 2内で、予め、ホストシス
テム1から転送されているVM固有情報■に基づいて作
成されている仮想/実機番対応テーブル■に基づいて行
われる。
The conversion process from the virtual machine number to the real machine number is performed using the fault information processing method explained in FIGS. , Temporary errors are transferred from the host system 1 in each guest VM 2 in advance, even when the number of error occurrences is counted, and when the threshold is exceeded, the code is coded and transferred to the maintenance center 3. This is performed based on the virtual/actual machine number correspondence table (2) created based on the VM-specific information (2).

【0056】[0056]

【発明の効果】以上、詳細に説明したように、本発明は
、仮想計算機システム配下における障害情報処理方式に
おいて、該仮想計算機システムが稼働中に、磁気ディス
ク装置などの周辺装置が一時的, 又は、永久的な障害
が発生した時点で、各ゲスト仮想計算機 (ゲストVM
) 配下のOSが検出したロギング情報■,及び、ホス
トシステムが検出したロギング情報■を、各ゲストVM
配下の周辺装置異常通報システムが分析, 分類して、
実機番で保守センタに自動通知する。又は、該仮想計算
機システムを構成しているゲストVMの一つが、サーバ
VMとして機能し、上記各ゲストVM,及び、ホストシ
ステムで検出したロギング情報■, ■を一括して収集
して累積したものを分析して、実機番対応のエラー情報
に編集し、分析編集リストとして、保守センタに出力す
るようにしたものであるので、仮想計算機システムにお
ける磁気ディスク装置等の周辺装置の障害に伴う被疑部
品の早期摘出,早期対処,該周辺装置の消耗部品の早期
検出に役立つ。又、従来、システム毎に編集されたシス
テム分の仮想機番対応の分析編集リストを見て、保守員
のスキルでもって総合的に状況を把握し、保守作業をす
すめなければならなかったのに対して、本発明によって
、情報が一括され、一部の分析編集リストで、正確で、
総合的な情報が容易に得られるようになった。又、仮想
機番ではなく実機番で通知されるため、障害が発生した
装置の正確な割り出しが可能となる。さらに、上記の機
能により、保守作業時間の削減及び総合的判断の強化に
より、より品質の高い保守サービスの提供が可能となる
効果がある。
[Effects of the Invention] As explained above in detail, the present invention provides a failure information processing method under a virtual computer system, when a peripheral device such as a magnetic disk device temporarily or , each guest virtual machine (guest VM
) The logging information detected by the underlying OS and the logging information detected by the host system are sent to each guest VM.
The subordinate peripheral device abnormality reporting system analyzes and classifies the information.
Automatically notify the maintenance center with the actual machine number. Or, one of the guest VMs configuring the virtual computer system functions as a server VM, and the logging information detected by each of the above guest VMs and the host system is collectively collected and accumulated. is analyzed, edited into error information corresponding to the actual machine number, and output to the maintenance center as an analysis edit list, so it is possible to identify suspect parts due to failures in peripheral devices such as magnetic disk devices in virtual computer systems. It is useful for early extraction, early treatment, and early detection of consumable parts of the peripheral device. Additionally, in the past, maintenance staff had to use their skills to comprehensively grasp the situation and proceed with maintenance work by looking at the analysis and editing list corresponding to virtual machine numbers for each system, which was edited for each system. On the other hand, according to the present invention, the information is consolidated, and some analysis and editing lists are accurate and accurate.
Comprehensive information is now easily available. Furthermore, since the actual machine number is notified rather than the virtual machine number, it is possible to accurately identify the device in which the failure has occurred. Furthermore, the above functions have the effect of reducing maintenance work time and strengthening comprehensive judgment, thereby making it possible to provide higher quality maintenance services.

【図面の簡単な説明】[Brief explanation of the drawing]

【図1】本発明の原理構成図(その1)[Figure 1] Principle configuration diagram of the present invention (Part 1)

【図2】本発明
の原理構成図(その2)
[Figure 2] Principle configuration diagram of the present invention (Part 2)

【図3】本発明の原理構成図(
その3)
[Figure 3] Principle configuration diagram of the present invention (
Part 3)

【図4】本発明の一実施例を示した図(その1
[Fig. 4] A diagram showing one embodiment of the present invention (Part 1)
)

【図5】本発明の一実施例を示した図(その2)[Fig. 5] Diagram showing one embodiment of the present invention (Part 2)

【図
6】本発明の他の実施例を示した図(その1)
[Fig. 6] Diagram showing another embodiment of the present invention (Part 1)

【図7】
本発明の他の実施例を示した図(その2)
[Figure 7]
Diagram showing another embodiment of the present invention (Part 2)

【図8】本発
明の他の実施例を示した図(その3)
[Fig. 8] Diagram showing another embodiment of the present invention (Part 3)

【図9】本発明の
仮想機番→実機番変換方式を示した図
[Figure 9] Diagram showing the virtual machine number → real machine number conversion method of the present invention

【図10】従来の
仮想計算機システム配下における障害処理方式を示した
[Figure 10] Diagram showing a failure handling method under a conventional virtual computer system

【符号の説明】[Explanation of symbols]

1   ホストシステム 2   ゲスト仮想計算機 (ゲストVM,システム)
2a  サーバVM(サーバシステム)20  オペレ
ーティングシステム(OS)  21    周辺装置
異常通報システム 25  エラー情報編集システム ■  ホストシステムのエラー情報格納ファイル,又は
、ロギング情報 ■  システムエラーロギングファイル,又は、ロギン
グ情報 ■  集計ファイル                
  ■    閾値ファイル ■  稼働システム管理情報          ■ 
   VM固有情報 ■  装置管理テーブル,又は、仮想/実機番対応テー
ブル
1 Host system 2 Guest virtual machine (guest VM, system)
2a Server VM (server system) 20 Operating system (OS) 21 Peripheral device error reporting system 25 Error information editing system ■ Host system error information storage file or logging information ■ System error logging file or logging information ■ Total file
■ Threshold file ■ Operating system management information ■
VM-specific information ■ Device management table or virtual/actual machine number correspondence table

Claims (2)

【特許請求の範囲】[Claims] 【請求項1】仮想計算機システムにおいて、周辺装置(
4) に障害が発生したとき、各ゲスト仮想計算機 (
ゲストVM)(2)配下のオペレーティングシステム(
OS)(20)が検出したロギング情報 (■),及び
、ホストシステム(1) が検出したロギング情報 (
■)を、各ゲスト仮想計算機 (ゲストVM)(2)の
オペレーティングシステム(OS)(20)配下の周辺
装置異常通報システム(21)が、該障害の発生時点で
オペレイティングシステム(OS)(20), 及び、
ホストシステム(1) とのインタフェースにより受け
取り、各仮想機番によるロギング情報を解析し、予め、
上記ホストシステム(1) から受信している仮想機番
/実機番対応情報を備えた装置管理テーブル (■) 
に基づいて、重要度別に、仮想機番→実機番のエラーコ
ード情報に変換して、保守センタ(3) に自動転送す
ることを特徴とする仮想計算機システム配下における障
害情報処理方式。
Claim 1: In a virtual computer system, a peripheral device (
4) When a failure occurs in each guest virtual machine (
Guest VM) (2) The underlying operating system (
Logging information (■) detected by OS) (20) and logging information (■) detected by host system (1)
■) The peripheral device error reporting system (21) under the operating system (OS) (20) of each guest virtual machine (guest VM) (2) ), as well as,
It receives it through the interface with the host system (1), analyzes the logging information for each virtual machine number, and
Device management table with virtual machine number/actual machine number correspondence information received from the above host system (1) (■)
A failure information processing method under a virtual computer system characterized by converting error code information from virtual machine number to real machine number based on the degree of importance and automatically transmitting the error code information to a maintenance center (3).
【請求項2】仮想計算機システムにおいて、各ゲスト仮
想計算機 (ゲストVM)(2)配下のオペレーティン
グシステム(OS)(20)が検出したロギング情報 
(■),及び、ホストシステム(1) が検出したロギ
ング情報 (■) を、特定のゲスト仮想計算機 (ゲ
ストVM)(2a) が収集して、一括管理する手段を
設けて、該特定のゲスト仮想計算機 (ゲストVM)(
2a) が、予め、上記ホストシステム(1) から受
信している仮想機番/実機番対応情報を備えた装置管理
テーブル (■) に基づいて、各仮想機番による障害
情報を解析し、仮想機番→実機番のエラーコード情報に
変換, 編集し、分析編集リストとして、出力すること
を特徴とする仮想計算機システム配下における障害情報
処理方式。
[Claim 2] Logging information detected by each guest virtual machine (guest VM) (2) under an operating system (OS) (20) in a virtual computer system.
(■), and the logging information (■) detected by the host system (1) is collected by a specific guest virtual machine (guest VM) (2a), and a means is provided for collective management. Virtual machine (guest VM) (
2a) analyzes the failure information for each virtual machine number based on the device management table (■) with the virtual machine number/real machine number correspondence information received from the host system (1) above in advance, and A fault information processing method under a virtual computer system characterized by converting and editing error code information from machine number to actual machine number, and outputting it as an analysis and editing list.
JP3018543A 1991-02-12 1991-02-12 Fault information processing system under virtual computer system Pending JPH04257035A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3018543A JPH04257035A (en) 1991-02-12 1991-02-12 Fault information processing system under virtual computer system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3018543A JPH04257035A (en) 1991-02-12 1991-02-12 Fault information processing system under virtual computer system

Publications (1)

Publication Number Publication Date
JPH04257035A true JPH04257035A (en) 1992-09-11

Family

ID=11974553

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3018543A Pending JPH04257035A (en) 1991-02-12 1991-02-12 Fault information processing system under virtual computer system

Country Status (1)

Country Link
JP (1) JPH04257035A (en)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009075877A (en) * 2007-09-20 2009-04-09 Toshiba Corp Information processing system and monitoring method
JP2009151509A (en) * 2007-12-20 2009-07-09 Mitsubishi Electric Corp Computer apparatus
JP2010134557A (en) * 2008-12-02 2010-06-17 Nec Corp Virtual machine operation management system, operation management method therefor and program
US7917811B2 (en) 2007-04-19 2011-03-29 Hitachi, Ltd. Virtual computer system
US8006134B2 (en) 2008-09-04 2011-08-23 Hitachi, Ltd Method for analyzing fault caused in virtualized environment, and management server
US8189458B2 (en) 2008-06-06 2012-05-29 Fujitsu Limited Monitoring system, monitoring device, monitored device, and monitoring method
JP2012530295A (en) * 2009-06-12 2012-11-29 インターナショナル・ビジネス・マシーンズ・コーポレーション Method, apparatus, and program for monitoring computer activity of a plurality of virtual computing devices

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62144254A (en) * 1985-12-19 1987-06-27 Fujitsu Ltd Notification information processing system
JPS63109542A (en) * 1986-10-27 1988-05-14 Nec Corp Message display system for virtual computer system

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62144254A (en) * 1985-12-19 1987-06-27 Fujitsu Ltd Notification information processing system
JPS63109542A (en) * 1986-10-27 1988-05-14 Nec Corp Message display system for virtual computer system

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7917811B2 (en) 2007-04-19 2011-03-29 Hitachi, Ltd. Virtual computer system
JP2009075877A (en) * 2007-09-20 2009-04-09 Toshiba Corp Information processing system and monitoring method
JP2009151509A (en) * 2007-12-20 2009-07-09 Mitsubishi Electric Corp Computer apparatus
US8189458B2 (en) 2008-06-06 2012-05-29 Fujitsu Limited Monitoring system, monitoring device, monitored device, and monitoring method
US8006134B2 (en) 2008-09-04 2011-08-23 Hitachi, Ltd Method for analyzing fault caused in virtualized environment, and management server
JP2010134557A (en) * 2008-12-02 2010-06-17 Nec Corp Virtual machine operation management system, operation management method therefor and program
JP2012530295A (en) * 2009-06-12 2012-11-29 インターナショナル・ビジネス・マシーンズ・コーポレーション Method, apparatus, and program for monitoring computer activity of a plurality of virtual computing devices

Similar Documents

Publication Publication Date Title
JP4318643B2 (en) Operation management method, operation management apparatus, and operation management program
KR101951526B1 (en) Interface Middleware System for Smart Factory Platform and Method for Operating The Same
CN102597962A (en) Method and system for fault management in virtual computing environments
CN113836044A (en) Method and system for collecting and analyzing software faults
CN112152823B (en) Website operation error monitoring method and device and computer storage medium
US20050188269A1 (en) System and method for providing a health model for software
CN111130840A (en) Unattended service center management method, system, medium and electronic device
JPH04257035A (en) Fault information processing system under virtual computer system
JP2003216457A (en) Error log collecting and analyzing agent system
JP2004178296A (en) Knowledge based operation management system, method and program
JP5746565B2 (en) Maintenance management system, work priority calculation method and program
JP2011215917A (en) Apparatus information management system
JP2003241999A (en) Maintenance management system
US20040078783A1 (en) Tool and system for software verification support
JP2004094701A (en) Monitoring information display system, monitoring information display method, program, and monitoring device
US6009246A (en) Method and system for evaluating intrusive repair for plurality of devices
JPH11296480A (en) Remote fault monitoring system
JP2000187585A (en) Device and method for managing remote failure information
JP3867868B2 (en) Fault integrated management device
JPH04149749A (en) System for collecting log data
JP2004086278A (en) Method and system for monitoring device fault
JP2003085003A (en) Fault restoration assist method and fault restoration assist system
JP5380386B2 (en) Device information management system and method
JPH01274545A (en) Multi-layer tracer
CN111061609A (en) Log monitoring method and system

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 19970225