JP2008217728A - Fault information collecting method for virtual computer system - Google Patents

Fault information collecting method for virtual computer system Download PDF

Info

Publication number
JP2008217728A
JP2008217728A JP2007057971A JP2007057971A JP2008217728A JP 2008217728 A JP2008217728 A JP 2008217728A JP 2007057971 A JP2007057971 A JP 2007057971A JP 2007057971 A JP2007057971 A JP 2007057971A JP 2008217728 A JP2008217728 A JP 2008217728A
Authority
JP
Japan
Prior art keywords
virtual machine
control
virtual
external storage
storage device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007057971A
Other languages
Japanese (ja)
Inventor
Yasuhiro Shinohara
靖弘 篠原
Mitsuo Yamamoto
三雄 山本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2007057971A priority Critical patent/JP2008217728A/en
Publication of JP2008217728A publication Critical patent/JP2008217728A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a structure for appropriately collecting fault information of an application for controlling a virtual computer system and an OS operated by a virtual computer for controlling the virtual computer system in order to improve maintainability of the virtual computer system, and recovering the virtual computer for control at the occurrence of a fault. <P>SOLUTION: A virtual computer control code is provided with a method of monitoring the fault of the virtual computer for control, a method of guaranteeing consistency of information in a virtual external storage device, and a method of outputting information in the virtual external storage device to a real external storage device. When the fault occurs in the virtual computer for control, consistency of information in the virtual external storage device is guaranteed to output the information to the real external storage device. <P>COPYRIGHT: (C)2008,JPO&INPIT

Description

本発明は、仮想計算機システムの障害情報採取方法に係り、特に制御用仮想計算機で動作するOSと、仮想計算機システムを制御するためのアプリケーションの障害情報を、適切に採取する技術に関するものである。   The present invention relates to a fault information collecting method for a virtual machine system, and more particularly to a technique for appropriately collecting fault information of an OS operating on a control virtual machine and an application for controlling the virtual machine system.

仮想計算機システムの保守性を向上させるためには、障害要因を解析するための情報を適切に採取出来ることが重要である。   In order to improve the maintainability of the virtual machine system, it is important to be able to appropriately collect information for analyzing the cause of failure.

仮想計算機システムの制御方法として、仮想計算機システムを制御するために使用する制御用仮想計算機を設け、制御用仮想計算機でOSと、仮想計算機システムを制御するためのアプリケーションを走行させて、仮想計算機システムを制御する方法が、例えば非特許文献1に記載されている。   As a control method of a virtual machine system, a virtual machine for control used for controlling the virtual machine system is provided, and an OS and an application for controlling the virtual machine system are run on the virtual machine for control to run the virtual machine system For example, Non-Patent Document 1 discloses a method for controlling the above.

また、仮想計算機制御コードの異常を検出した時に、仮想計算機が使用しているメモリ領域の情報を外部記憶装置に転送するダンプ採取方法が、特許文献1に記載されている。   Patent Document 1 discloses a dump collection method for transferring information on a memory area used by a virtual machine to an external storage device when an abnormality of the virtual machine control code is detected.

特開2002-32244号公報JP 2002-32244 JP 「Xen and the Art of Virtualization」 Paul Barham他著http://www.cl.cam.ac.uk/netos/papers/2003-xensosp.pdf"Xen and the Art of Virtualization" by Paul Barham et al. Http://www.cl.cam.ac.uk/netos/papers/2003-xensosp.pdf

しかしながら、上述のダンプ採取方法では、仮想計算機制御コードが制御用仮想計算機に対してメモリ領域を仮想的に外部記憶装置として見せる仮想外部記憶装置に対して、制御用仮想計算機で走行するOSと仮想計算機システムを制御するためのアプリケーションが書き込む障害情報の採取には、適用できないという問題がある。   However, in the dump collection method described above, the virtual machine control code and the virtual external storage device that virtually shows the memory area to the control virtual machine as an external storage device, the OS running on the control virtual machine and the virtual There is a problem that it cannot be applied to collecting failure information written by an application for controlling a computer system.

本発明の課題は、制御用仮想計算機の障害発生時、および外部からのコマンド操作を契機として、制御用仮想計算機の障害情報を適切に採取する方法を提供することにある。   An object of the present invention is to provide a method for appropriately collecting failure information of a control virtual computer when a failure occurs in the control virtual computer and triggered by an external command operation.

実計算機に複数の仮想計算機が走行する仮想計算機システムにおいて、仮想計算機システムを制御するために使用する制御用仮想計算機と、仮想計算機制御コードが制御用仮想計算機に対してメモリ領域を仮想的に外部記憶装置として見せる仮想外部記憶装置とを有し、前記制御用仮想計算機にはオペレーティングシステム(OS)と、仮想計算機システムを制御するためのアプリケーションが走行し、OSとアプリケーションは障害情報を仮想外部記憶装置に書き込み、仮想計算機制御コードには制御用仮想計算機の障害を監視する手段と、仮想外部記憶装置内の障害情報の整合性を保証する手段と、仮想外部記憶装置内の障害情報を実外部記憶装置に出力する手段とを設け、仮想計算機制御コードが制御用仮想計算機の障害を検出した時に、仮想外部記憶装置内の障害情報の整合性を保証して実外部記憶装置に出力する。   In a virtual machine system in which multiple virtual machines run on a real machine, the virtual machine for control used to control the virtual machine system and the virtual machine control code are virtually external to the control virtual machine. An operating system (OS) and an application for controlling the virtual computer system run on the control virtual machine, and the OS and the application store fault information in a virtual external storage. Write to the device, the virtual machine control code means to monitor the fault of the control virtual machine, means to guarantee the consistency of the fault information in the virtual external storage device, and the fault information in the virtual external storage device to the actual external When the virtual machine control code detects a failure of the control virtual machine And outputs to ensure the integrity of the fault information in a virtual external storage device to a real external storage device.

さらに、仮想計算機制御コードに制御用仮想計算機を回復させる手段も設け、仮想計算機制御コードは制御用仮想計算機の障害を検出した場合に、仮想外部記憶装置内の障害情報の整合性を保証して実外部記憶装置に出力した後、制御用仮想計算機を回復させる。   In addition, a means for recovering the control virtual machine is provided in the virtual machine control code. When the virtual machine control code detects a fault in the control virtual machine, it guarantees the consistency of the fault information in the virtual external storage device. After outputting to the real external storage device, the control virtual machine is recovered.

さらに、仮想計算機制御コードに仮想計算機システム外部からコマンドにより操作出来る手段も設け、仮想計算機システム外部からのコマンド操作を契機として、仮想外部記憶装置内の障害情報の整合性を保証して実外部記憶装置に出力する。   In addition, the virtual machine control code is provided with a means that can be operated by commands from outside the virtual machine system, and triggered by command operations from outside the virtual machine system, guarantees the consistency of the fault information in the virtual external storage device and performs real external storage. Output to the device.

本発明の障害情報採取方法により、制御用仮想計算機で走行するOSと仮想計算機システムを制御するためのアプリケーションの障害情報を適切に採取することが可能となり、仮想計算機システムの保守性を向上させる効果がある。   According to the fault information collection method of the present invention, it is possible to appropriately collect fault information of an OS running on a control virtual machine and an application for controlling the virtual machine system, and the effect of improving the maintainability of the virtual machine system There is.

以下、図面を使用して本発明を実施する場合の一形態を具体的に説明をする。   Hereinafter, an embodiment of the present invention will be specifically described with reference to the drawings.

図1は、本発明実施の一形態を示すシステム構成図である。実計算機(100)において、仮想計算機制御コード(180)が走行し、仮想計算機制御コード(180)は論理的な区画で構成される仮想計算機(110)(111)(112)を作り出す。このうち、仮想計算機(111)(112)はユーザ仮想計算機であり、OS(131)(132)とユーザアプリケーション(121)(122)が走行する。また仮想計算機(110)は仮想計算機システムを制御するために使用する制御用仮想計算機であり、OS(130)と制御アプリケーション(120)が走行し、仮想計算機制御コード(180)が制御用仮想計算機(110)に対してメモリ領域(140)を仮想的に外部記憶装置として見せる仮想外部記憶装置(150)を有しており、ここに制御用仮想計算機(110)で走行するOS(130)と制御アプリケーション(120)は障害情報を書き込む。また、仮想計算機制御コード(180)は状態監視部(160)を有し、常に制御用仮想計算機(110)の障害を監視している。状態監視部(160)は制御用仮想計算機(110)の障害を検知すると、障害処理部(170)に障害の発生を通知する、障害発生の通知を受けた障害処理部(170)は、仮想外部記憶装置(150)に書き込まれている障害情報の整合性を保証した後、仮想外部記憶装置(150)の障害情報を実外部記憶装置(190)に転送し、制御用仮想計算機(110)をディアクティベイト(論理的な電源断)させた後、アクティベイト(論理的な電源投入)させることにより障害となった制御用仮想計算機(110)を回復させる。   FIG. 1 is a system configuration diagram showing an embodiment of the present invention. In the real computer (100), the virtual computer control code (180) runs, and the virtual computer control code (180) creates virtual computers (110), (111), and (112) configured by logical partitions. Among these, the virtual machines (111) (112) are user virtual machines, and the OS (131) (132) and the user applications (121) (122) run. The virtual machine (110) is a control virtual machine used to control the virtual machine system, and the OS (130) and the control application (120) run, and the virtual machine control code (180) is the control virtual machine. A virtual external storage device (150) that virtually shows the memory area (140) as an external storage device with respect to (110), and an OS (130) running on the control virtual computer (110); The control application (120) writes failure information. The virtual machine control code (180) has a state monitoring unit (160), and always monitors the failure of the control virtual machine (110). When the state monitoring unit (160) detects a failure of the control virtual machine (110), the failure processing unit (170) notifies the failure processing unit (170) of the occurrence of the failure. After guaranteeing the consistency of the failure information written in the external storage device (150), the failure information of the virtual external storage device (150) is transferred to the real external storage device (190), and the control virtual computer (110) Is deactivated (logically powered off) and then activated (logically powered on) to recover the failed control virtual machine (110).

なお同図では、簡略化のため制御用仮想計算機は1つ、ユーザ仮想計算機は2つとして記述しているが、本発明において制御用仮想計算機、ユーザ仮想計算機はそれぞれ複数個とされ、この数に限定されるものではないことは勿論である。   In the figure, for simplification, one control virtual computer and two user virtual computers are described. However, in the present invention, a plurality of control virtual computers and user virtual computers are used. Of course, it is not limited to.

状態監視部(160)は、次に示す2つの方法で制御用仮想計算機の障害を監視する。   The state monitoring unit (160) monitors the failure of the control virtual machine by the following two methods.

まず第1に、制御用仮想計算機のOSが自発的に発行する障害通知を監視する方法である。図2はこの障害通知を監視する処理を示した図である。予め制御用仮想計算機(110)で走行するOS(130)内の致命的障害通知部(200)に対して、命令が実行された際に仮想計算機制御コードに割込みが発生する通知命令(210)を設定しておく。制御用仮想計算機(110)で走行するOS(130)は致命的障害を検知すると、致命的障害通知部(200)を呼び出し、その結果、通知命令(210)が実行されて割込み(220)が発生し、仮想計算機制御コードの状態監視部(160)は、この割込み(220)を検知して、制御用仮想計算機(110)に障害が発生したことを検知する。   First, there is a method of monitoring a failure notification that is voluntarily issued by the OS of the control virtual machine. FIG. 2 is a diagram showing processing for monitoring the failure notification. A notification command (210) that interrupts the virtual machine control code when a command is executed to the fatal failure notification unit (200) in the OS (130) that runs on the control virtual computer (110) in advance. Is set in advance. When the OS (130) running on the control virtual machine (110) detects a fatal fault, it calls the fatal fault notification unit (200). As a result, the notification command (210) is executed and the interrupt (220) is issued. The virtual machine control code status monitoring unit (160) detects this interruption (220) and detects that a failure has occurred in the control virtual machine (110).

第2に、制御用仮想計算機の正常動作を定期的に監視する方法である。図3はこの正常動作を定期的に監視する処理を示した図である。状態情報通知アプリケーション(300)は上述の制御アプリケーション(120)のうちの1つであり、一定時間毎に仮想計算機制御コード(180)に対して状態情報(320)を送信する。これを受信した仮想計算機制御コード(180)は、状態情報(320)の受信時刻を状態情報記憶部(310)に記録する。一方、状態監視部(160)は、一定時間毎に状態情報記憶部(310)に記録されている状態情報(320)の受信時刻を読み出す(330)。状態監視部(160)は、状態情報の受信時刻と現在の時刻の差分値を計算し、差分値が規定値よりも大きい場合、制御用仮想計算機(110)に障害が発生したことを検知する。   The second method is to regularly monitor the normal operation of the control virtual machine. FIG. 3 is a diagram showing processing for periodically monitoring the normal operation. The status information notification application (300) is one of the control applications (120) described above, and transmits status information (320) to the virtual machine control code (180) at regular intervals. The virtual machine control code (180) that has received this records the reception time of the status information (320) in the status information storage unit (310). On the other hand, the state monitoring unit (160) reads the reception time of the state information (320) recorded in the state information storage unit (310) at regular intervals (330). The state monitoring unit (160) calculates a difference value between the reception time of the state information and the current time, and detects that a failure has occurred in the control virtual computer (110) when the difference value is larger than a specified value. .

状態監視部(160)は、制御用仮想計算機(110)の障害を検知すると、障害処理部(170)に障害の発生を通知する(340)。   When detecting the failure of the control virtual machine (110), the state monitoring unit (160) notifies the failure processing unit (170) of the occurrence of the failure (340).

図4は、上述図3で示した制御用仮想計算機の正常動作を定期的に監視する方法で制御用仮想計算機の障害を検知した場合に、障害処理部が行う処理を示した図である。制御用仮想計算機(110)の障害発生通知を受けた障害処理部(170)は、ファイルシステム(400)を書き込み不可で再マウントさせる仮想割込みキー入力(410)を、制御用仮想計算機(110)のOS(130)に対して行う。この仮想割込みキー入力(410)を受け付けたOS(130)は、ファイルシステム(400)を書き込み不可で再マウントする。その後、障害処理部(170)は、マウントされているファイルシステムの同期を行わせる仮想割込みキー入力(420)を制御用仮想計算機(110)のOS(130)に対して行う。この仮想割込みキー入力(420)を受け付けたOS(130)は、メモリにキャッシュされているファイルシステム(400)の障害情報を仮想外部記憶装置(150)に対して全て書き込む(430)。以上により、制御アプリケーション(120)から仮想外部記憶装置(150)に対する障害情報の書き込みが無いことを保証できると共に、メモリにキャッシュされているファイルシステム(400)の障害情報が仮想外部記憶装置(150)に全て書き込まれていることを保証することができ、仮想外部記憶装置(150)内の障害情報の整合性を保証することができる。さらにこの後、障害処理部(170)は、仮想外部記憶装置(150)の障害情報を実外部記憶装置に転送し(440)、制御用仮想計算機(110)をディアクティベイト(論理的な電源断)させた後、アクティベイト(論理的な電源投入)させることにより障害となった制御用仮想計算機(110)を回復させる。   FIG. 4 is a diagram showing processing performed by the failure processing unit when a failure of the control virtual computer is detected by the method of periodically monitoring the normal operation of the control virtual computer shown in FIG. The failure processing unit (170) that has received the failure notification of the control virtual machine (110) receives a virtual interrupt key input (410) for remounting the file system (400) in a non-writable state, and the control virtual machine (110). For the OS (130). The OS (130) that has received this virtual interrupt key input (410) remounts the file system (400) without writing. Thereafter, the failure processing unit (170) performs a virtual interrupt key input (420) for synchronizing the mounted file system to the OS (130) of the control virtual machine (110). The OS (130) that has received this virtual interrupt key input (420) writes all the failure information of the file system (400) cached in the memory into the virtual external storage device (150) (430). As described above, it can be ensured that no failure information is written from the control application (120) to the virtual external storage device (150), and the failure information of the file system (400) cached in the memory is stored in the virtual external storage device (150). ) And the consistency of the failure information in the virtual external storage device (150) can be guaranteed. Thereafter, the failure processing unit (170) transfers the failure information of the virtual external storage device (150) to the real external storage device (440), and deactivates the control virtual computer (110) (logical power supply). After that, the virtual machine for control (110) that has failed is recovered by activating (logically turning on the power).

以上の通り、上述図3で示した制御用仮想計算機(110)の正常動作を定期的に監視する方法で制御用仮想計算機(110)の障害を検出した場合には、制御用仮想計算機(110)で動作するOS(130)、および制御アプリケーション(120)が完全に止まっていることが保証できないので、仮想外部記憶装置(150)内の障害情報の整合性の保証が必要となるが、一方、上述図2で示した制御用仮想計算機のOS(130)が自発的に発行する障害通知を監視する方法では、制御用仮想計算機(110)で動作するOS(130)、および制御アプリケーション(120)が完全に止まっていることが保証されるので、仮想外部記憶装置内の障害情報の整合性を保証する処理は必要なく、障害処理部(170)は、仮想外部記憶装置(150)の障害情報を実外部記憶装置に転送(440)する処理のみを行ない、その後、仮想外部記憶装置(150)の障害情報を実外部記憶装置に転送し(440)、制御用仮想計算機(110)をディアクティベイト(論理的な電源断)させた後、アクティベイト(論理的な電源投入)させることにより障害となった制御用仮想計算機(110)を回復させる。   As described above, when a failure of the control virtual machine (110) is detected by the method of periodically monitoring the normal operation of the control virtual machine (110) shown in FIG. 3, the control virtual machine (110 It is not possible to guarantee that the OS (130) and the control application (120) running on the virtual external storage device (150) are completely stopped. Therefore, it is necessary to guarantee the consistency of the failure information in the virtual external storage device (150). In the method of monitoring the failure notification spontaneously issued by the OS (130) of the control virtual machine shown in FIG. 2, the OS (130) operating on the control virtual machine (110) and the control application (120 ) Is completely stopped, there is no need to guarantee the consistency of the fault information in the virtual external storage device, and the fault processing unit (170) Only the process of transferring (440) the failure information of the storage device (150) to the real external storage device, and then transferring the failure information of the virtual external storage device (150) to the real external storage device (440). After the computer (110) is deactivated (logically powered off), the faulty virtual computer for control (110) is recovered by activating (logically powering on).

また、図5は、仮想計算機システム外部からのコマンド操作により、仮想外部記憶装置内の障害情報の整合性を保証して、実外部記憶装置に転送する処理を示した図である。外部コンソール(500)より、仮想外部記憶装置(150)内の障害情報を実外部記憶装置(190)に転送するコマンド要求(510)を受けた障害処理部(170)は、仮想外部記憶装置(150)内の障害情報の整合性を保証して、実外部記憶装置(190)に転送する。仮想計算機システム外部からのコマンド操作による仮想外部記憶装置(150)の障害情報整合性保証、および実外部記憶装置(190)への転送は、上述図4の障害発生を契機とする仮想外部記憶装置(150)の障害情報整合性保証、および実外部記憶装置(190)への転送と、開始する契機が異なるのみであり、処理内容は障害発生を契機とする場合と同様である。これにより、仮想計算機システム稼動中の任意の時点で、仮想外部記憶装置(150)内の障害情報を実外部記憶装置(190)に転送することも可能である。   FIG. 5 is a diagram showing a process of guaranteeing the consistency of failure information in the virtual external storage device and transferring it to the real external storage device by a command operation from outside the virtual computer system. Upon receiving a command request (510) for transferring failure information in the virtual external storage device (150) from the external console (500) to the real external storage device (190), the failure processing unit (170) receives the virtual external storage device (170). 150) guarantees the consistency of the failure information and transfers it to the real external storage device (190). The failure information consistency guarantee of the virtual external storage device (150) by the command operation from the outside of the virtual computer system and the transfer to the real external storage device (190) are the virtual external storage device triggered by the occurrence of the failure in FIG. (150) The failure information consistency guarantee and the transfer to the real external storage device (190) are only different in the trigger for starting, and the processing contents are the same as in the case when the failure occurs. As a result, it is possible to transfer the failure information in the virtual external storage device (150) to the real external storage device (190) at any time during the operation of the virtual computer system.

以上述べたように、本実施例によれば、実計算機で複数の仮想計算機が走行する仮想計算機システムにおいて、制御用仮想計算機における障害発生、および仮想計算機システム稼動中のコマンド操作を契機として、制御用仮想計算機で走行するOSと仮想計算機システムを制御するアプリケーションの障害情報を採取することができ、また、障害発生時には、制御用仮想計算機を回復させる方法を提供する事が出来る。   As described above, according to the present embodiment, in a virtual machine system in which a plurality of virtual machines run on a real machine, control is triggered by the occurrence of a fault in the control virtual machine and a command operation during operation of the virtual machine system. It is possible to collect failure information of the OS running on the virtual machine for the computer and the application that controls the virtual machine system, and to provide a method for recovering the control virtual machine when a failure occurs.

制御用仮想計算機で走行するOSと仮想計算機システムを制御するアプリケーションの障害情報を適切に採取することが可能となり、高い保守性が要求される仮想計算機システムに適用する事が出来る。   It is possible to appropriately collect failure information of the OS running on the control virtual machine and the application that controls the virtual machine system, and it can be applied to a virtual machine system that requires high maintainability.

本発明の仮想計算機システムで制御用仮想計算機の障害情報採取方法を実現する構成の一例を示す図である。It is a figure which shows an example of a structure which implement | achieves the failure information collection method of the virtual machine for control in the virtual machine system of this invention. 制御用仮想計算機のOSが発行する障害通知を監視する動作の一例を示す図である。It is a figure which shows an example of the operation | movement which monitors the failure notification which OS of a virtual machine for control issues. 制御用仮想計算機の正常動作を監視する動作の一例を示す図である。It is a figure which shows an example of the operation | movement which monitors normal operation | movement of the virtual machine for control. 制御用仮想計算機の障害発生通知を受けた障害処理部が行う動作の一例を示す図である。It is a figure which shows an example of the operation | movement which the failure process part which received the failure generation | occurrence | production notification of the virtual machine for control performs. 外部コンソールよりコマンド要求を受けた障害処理部が行う動作の一例を示す図である。It is a figure which shows an example of the operation | movement which the failure processing part which received the command request from the external console performs.

符号の説明Explanation of symbols

100…実計算機、110…制御用仮想計算機、111、112… ユーザ仮想計算機、120…制御アプリケーション、121、122…ユーザアプリケーション、130、131、132…OS、140…メモリ領域、150…仮想外部記憶装置、160…状態監視部、170…障害処理部、180…仮想計算機制御コード、190…実外部記憶装置、200…致命的障害通知部、210…通知命令、220…割込み、300…状態情報通知アプリケーション、310…状態情報記憶部、320…状態情報の送信、330…状態情報の読み出し、400…ファイルシステム、410…仮想割込みキー入力、420…仮想割込みキー入力、430…障害情報転送、440…障害情報転送、500…外部コンソール、510…コマンド要求。   DESCRIPTION OF SYMBOLS 100 ... Real computer, 110 ... Control virtual machine, 111, 112 ... User virtual machine, 120 ... Control application, 121, 122 ... User application, 130, 131, 132 ... OS, 140 ... Memory area, 150 ... Virtual external storage Device: 160 ... Status monitoring unit, 170: Fault processing unit, 180 ... Virtual machine control code, 190 ... Real external storage device, 200 ... Fatal fault notification unit, 210 ... Notification command, 220 ... Interrupt, 300 ... Status information notification Application, 310 ... Status information storage unit, 320 ... Transmission of status information, 330 ... Reading of status information, 400 ... File system, 410 ... Virtual interrupt key input, 420 ... Virtual interrupt key input, 430 ... Fault information transfer, 440 ... Failure information transfer, 500 ... external console, 510 ... command request.

Claims (3)

実計算機に複数の仮想計算機が走行する仮想計算機システムにおいて、仮想計算機システムを制御するために使用する制御用仮想計算機と、仮想計算機制御コードが制御用仮想計算機に対してメモリ領域を仮想的に外部記憶装置として見せる仮想外部記憶装置とを有し、前記制御用仮想計算機にはオペレーティングシステム(OS)と、仮想計算機システムを制御するためのアプリケーションが走行し、OSとアプリケーションは障害情報を仮想外部記憶装置に書き込み、仮想計算機制御コードには制御用仮想計算機の障害を監視する方法と、仮想外部記憶装置内の障害情報の整合性を保証する方法と、仮想外部記憶装置内の障害情報を実外部記憶装置に出力する方法とを設け、仮想計算機制御コードが制御用仮想計算機の障害を検出した時に、仮想外部記憶装置内の障害情報の整合性を保証して実外部記憶装置に出力することを特徴とする、制御用仮想計算機の障害情報採取方法。   In a virtual machine system in which multiple virtual machines run on a real machine, the virtual machine for control used to control the virtual machine system and the virtual machine control code are virtually external to the control virtual machine. An operating system (OS) and an application for controlling the virtual computer system run on the control virtual machine, and the OS and the application store fault information in a virtual external storage. A method for monitoring the failure of the control virtual machine in the virtual machine control code, a method for ensuring the consistency of the fault information in the virtual external storage device, and the fault information in the virtual external storage device are actually external When the virtual machine control code detects a failure of the control virtual machine. , Characterized that, the fault information collecting method of controlling a virtual computer to output to ensure the integrity of the fault information in a virtual external storage device to a real external storage device. 請求項1記載の制御用仮想計算機の障害情報採取方法において、さらに仮想計算機制御コードに制御用仮想計算機を回復させる方法も設け、仮想計算機制御コードは制御用仮想計算機の障害を検出した場合に、仮想外部記憶装置内の障害情報の整合性を保証して実外部記憶装置に出力した後、制御用仮想計算機を回復させることを特徴とする、制御用仮想計算機の障害情報採取方法。   In the fault information collecting method for the control virtual machine according to claim 1, a method for recovering the control virtual machine in the virtual machine control code is also provided, and when the virtual machine control code detects a fault in the control virtual machine, A fault information collection method for a control virtual machine, comprising: restoring a control virtual machine after guaranteeing consistency of fault information in the virtual external storage apparatus and outputting it to the real external storage apparatus. 請求項1記載の制御用仮想計算機の障害情報採取方法において、さらに仮想計算機制御コードに仮想計算機システム外部からコマンドにより操作出来る方法も設け、仮想計算機システム外部からのコマンド操作を契機として、仮想外部記憶装置内の障害情報の整合性を保証して実外部記憶装置に出力することを特徴とする、制御用仮想計算機の障害情報採取方法。   2. The fault information collecting method for a control virtual machine according to claim 1, further comprising a method for operating the virtual machine control code by a command from outside the virtual machine system, and a virtual external storage triggered by a command operation from outside the virtual machine system. A fault information collecting method for a virtual machine for control, which guarantees consistency of fault information in the apparatus and outputs it to a real external storage device.
JP2007057971A 2007-03-08 2007-03-08 Fault information collecting method for virtual computer system Pending JP2008217728A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007057971A JP2008217728A (en) 2007-03-08 2007-03-08 Fault information collecting method for virtual computer system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007057971A JP2008217728A (en) 2007-03-08 2007-03-08 Fault information collecting method for virtual computer system

Publications (1)

Publication Number Publication Date
JP2008217728A true JP2008217728A (en) 2008-09-18

Family

ID=39837653

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007057971A Pending JP2008217728A (en) 2007-03-08 2007-03-08 Fault information collecting method for virtual computer system

Country Status (1)

Country Link
JP (1) JP2008217728A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010086181A (en) * 2008-09-30 2010-04-15 Fujitsu Ltd Virtual machine system, method for managing thereof, program, and recording medium
WO2014174594A1 (en) * 2013-04-23 2014-10-30 株式会社日立製作所 Storage system and storage system fault administration method
US9176830B2 (en) 2013-05-24 2015-11-03 Hyundai Motor Company Method for determining software error in virtualization based integrated control system
US9959225B2 (en) 2013-01-31 2018-05-01 Mitsubishi Electric Corporation Computer apparatus and control method of computer apparatus

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010086181A (en) * 2008-09-30 2010-04-15 Fujitsu Ltd Virtual machine system, method for managing thereof, program, and recording medium
US8423997B2 (en) 2008-09-30 2013-04-16 Fujitsu Limited System and method of controlling virtual machine
US9959225B2 (en) 2013-01-31 2018-05-01 Mitsubishi Electric Corporation Computer apparatus and control method of computer apparatus
WO2014174594A1 (en) * 2013-04-23 2014-10-30 株式会社日立製作所 Storage system and storage system fault administration method
JP5959733B2 (en) * 2013-04-23 2016-08-02 株式会社日立製作所 Storage system and storage system failure management method
US9823955B2 (en) 2013-04-23 2017-11-21 Hitachi, Ltd. Storage system which is capable of processing file access requests and block access requests, and which can manage failures in A and storage system failure management method having a cluster configuration
US9176830B2 (en) 2013-05-24 2015-11-03 Hyundai Motor Company Method for determining software error in virtualization based integrated control system

Similar Documents

Publication Publication Date Title
US8990617B2 (en) Fault-tolerant computer system, fault-tolerant computer system control method and recording medium storing control program for fault-tolerant computer system
JP4839841B2 (en) How to restart snapshot
JP6130520B2 (en) MULTISYSTEM SYSTEM AND MULTISYSTEM SYSTEM MANAGEMENT METHOD
US20080189570A1 (en) I/o device fault processing method for use in virtual computer system
US10379931B2 (en) Computer system
JP2017187992A (en) Control device, control method and program
JP2005242404A (en) Method for switching system of computer system
CN101710252A (en) Power supply method and power supply device of storage system
JP2008217728A (en) Fault information collecting method for virtual computer system
JP2008203957A (en) Nas system
JPWO2010100757A1 (en) Arithmetic processing system, resynchronization method, and farm program
JP2016212506A (en) Information processing system, control apparatus, and control program
JP2010067115A (en) Data storage system and data storage method
JP6124644B2 (en) Information processing apparatus and information processing system
JP2011076344A (en) Information processing apparatus, method of controlling information processing apparatus and control program
CN103399807A (en) Dynamic scene spontaneous recovering method used for triplication redundancy computers
JP2007087088A (en) Information processor, information processing restoration method and information processing restoration program
JP2008262426A (en) Duplex controller system and controller
JP2010204885A (en) Disk array device and method for controlling the same
JP2011170680A (en) Fault tolerant server
JP6904918B2 (en) Control device and its data writing method
JP2010026830A (en) Data backup method for preventing load from being imposed on system
JP2009025967A (en) Backup system of duplicated firmware, method and operating system
JP4819116B2 (en) Control device, storage device, and control method
WO2014112039A1 (en) Information processing device, method for controlling information processing device and information processing device control program