JP5176837B2 - 情報処理システム及びその管理方法、制御プログラム並びに記録媒体 - Google Patents
情報処理システム及びその管理方法、制御プログラム並びに記録媒体 Download PDFInfo
- Publication number
- JP5176837B2 JP5176837B2 JP2008252904A JP2008252904A JP5176837B2 JP 5176837 B2 JP5176837 B2 JP 5176837B2 JP 2008252904 A JP2008252904 A JP 2008252904A JP 2008252904 A JP2008252904 A JP 2008252904A JP 5176837 B2 JP5176837 B2 JP 5176837B2
- Authority
- JP
- Japan
- Prior art keywords
- information
- virtual machine
- guest
- failure
- system information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims description 19
- 238000007726 management method Methods 0.000 title description 24
- 238000000034 method Methods 0.000 claims description 15
- 238000001514 detection method Methods 0.000 claims description 9
- 238000012544 monitoring process Methods 0.000 description 25
- 238000005192 partition Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 5
- 238000011835 investigation Methods 0.000 description 4
- 230000005856 abnormality Effects 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000005352 clarification Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 238000013024 troubleshooting Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/079—Root cause analysis, i.e. error or fault diagnosis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0706—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
- G06F11/0712—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a virtual computing platform, e.g. logically partitioned systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0766—Error or fault reporting or storing
- G06F11/0778—Dumping, i.e. gathering error/state information after a fault for later diagnosis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/36—Preventing errors by testing or debugging software
- G06F11/362—Software debugging
- G06F11/366—Software debugging using diagnostics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/455—Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
- G06F9/45533—Hypervisors; Virtual machine monitors
- G06F9/45558—Hypervisor-specific management and integration aspects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/455—Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
- G06F9/45533—Hypervisors; Virtual machine monitors
- G06F9/45558—Hypervisor-specific management and integration aspects
- G06F2009/45591—Monitoring or debugging support
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Computer Hardware Design (AREA)
- Mathematical Physics (AREA)
- Debugging And Monitoring (AREA)
Description
2 仮想計算機モニタ
3 ハードウェア
4 表示装置
5 磁気ディスク装置
6 ネットワーク
7 仮想計算機マネージャ
11 ホストOS
12 ゲストOS
13 ドライバOS
21 パニック監視管理部
22 ログ採取部
23 ダンプ及びログ解析環境部
31 ダンプ部
32、122 ログ部
111 ゲスト環境定義
112 ゲストシステム情報格納場所対応定義
121 メモリ部
Claims (8)
- 複数の仮想計算機と、前記複数の仮想計算機を制御するホスト仮想計算機とが動作する情報処理システムであって、
複数の仮想計算機の動作に用いられるメモリと、
前記ホスト仮想計算機がアクセス可能な、前記メモリと異なる記憶装置と、
前記複数の仮想計算機それぞれについて、前記メモリにおける仮想計算機についてのシステム情報が記憶される位置を示す情報と、前記記憶装置における前記システム情報を退避する退避位置を示す情報とを対応付けたシステム情報退避情報を記憶する記憶手段と、
前記複数の仮想計算機のいずれかに発生した障害を検出する検出手段と、
前記検出手段によって障害が検出された場合、障害が検出された仮想計算機を停止させる停止手段と、
障害が検出された前記仮想計算機が停止した場合、前記システム情報退避情報に基づいて、障害が検出された前記仮想計算機から、前記記憶装置における前記退避位置に、障害が検出された前記仮想計算機についてのシステム情報を退避する退避手段と、
前記退避位置に退避された前記システム情報を採取する採取手段と、を備える
ことを特徴とする情報処理システム。 - 前記システム情報退避情報と対応付けられた、前記複数の仮想計算機それぞれの動作環境を定義する環境定義情報を備え、
前記採取手段が、前記環境定義情報に基づいて、前記環境定義情報と対応付けられたシステム情報退避情報を参照する
ことを特徴とする請求項1記載の情報処理システム。 - 前記システム情報退避情報が、更に、前記複数の仮想計算機それぞれについてのシステム情報を格納する格納位置であって、前記複数の仮想計算機それぞれが使用する前記記憶装置における格納位置を含む
ことを特徴とする請求項1または2記載の情報処理システム。 - 前記システム情報退避情報が、更に、前記複数の仮想計算機それぞれについてのメモリダンプを取得するか否かについての指示情報を含み、
前記採取手段が、前記システム情報退避情報に基づいて、前記指示情報を実行した後に、前記システム情報を採取する
ことを特徴とする請求項1乃至3のいずれか1項記載の情報処理システム。 - 前記検出手段、前記停止手段、前記退避手段、前記採取手段により実行される処理は、前記情報処理システムを制御する仮想計算機モニタが実行する
ことを特徴とする請求項1乃至4のいずれか1項記載の情報処理システム。 - 複数の仮想計算機と、前記複数の仮想計算機の制御を行うホスト仮想計算機とが動作する情報処理システムの制御方法であって、
前記複数の仮想計算機それぞれについて、メモリにおける仮想計算機についてのシステム情報が記憶される位置を示す情報と、前記メモリと異なる記憶装置における前記システム情報を退避する退避位置を示す情報とを対応付けたシステム情報退避情報を定義する定義ステップと、
前記複数の仮想計算機のいずれかに発生した障害を検出する検出ステップと、
前記検出ステップで障害が検出された場合、障害が検出された仮想計算機を停止させる停止ステップと、
障害が検出された前記仮想計算機が停止した場合、前記システム情報退避情報に基づいて、障害が検出された前記仮想計算機から、前記記憶装置における前記退避位置に、障害が検出された前記仮想計算機についての前記システム情報を採取する採取ステップと、を実行する
ことを特徴とする情報処理システムの管理方法。 - 複数の仮想計算機と、前記複数の仮想計算機を制御するホスト仮想計算機とが動作する情報処理システムの制御プログラムであって、
前記情報処理システムが有するコンピュータに、
前記複数の仮想計算機それぞれについて、メモリにおける仮想計算機についてのシステム情報が記憶される位置を示す情報と、前記メモリと異なる記憶装置における前記システム情報を退避する退避位置を示す情報とを対応付けたシステム情報退避情報を定義する定義ステップと、
前記複数の仮想計算機のいずれかに発生した障害を検出する検出ステップと、
前記検出ステップで障害が検出された場合、障害が検出された仮想計算機を停止させる停止ステップと、
障害が検出された前記仮想計算機が停止した場合、前記システム情報退避情報に基づいて、障害が検出された前記仮想計算機から、前記記憶装置における前記退避位置に、障害が検出された前記仮想計算機についてのシステム情報を退避する退避ステップと、
前記退避位置に退避された前記システム情報を採取する採取ステップと、を実行させる
ことを特徴とする制御プログラム。 - 複数の仮想計算機と、前記複数の仮想計算機を制御するホスト仮想計算機とが動作する情報処理システムの制御プログラムを記録するコンピュータ読み取り可能な記録媒体であって、
前記制御プログラムは、前記情報処理システムが有するコンピュータに、
前記複数の仮想計算機それぞれについて、メモリにおける仮想計算機についてのシステム情報が記憶される位置を示す情報と、前記メモリと異なる記憶装置における前記システム情報を退避する退避位置を示す情報とを対応付けたシステム情報退避情報を定義する定義ステップと、
前記複数の仮想計算機のいずれかに発生した障害を検出する検出ステップと、
前記検出ステップで障害が検出された場合、障害が検出された仮想計算機を停止させる停止ステップと、
障害が検出された前記仮想計算機が停止した場合、前記システム情報退避情報に基づいて、障害が検出された前記仮想計算機から、前記記憶装置における前記退避位置に、障害が検出された前記仮想計算機についてのシステム情報を退避する退避ステップと、
前記退避位置に退避された前記システム情報を採取する採取ステップと、を実行させる
ことを特徴とする記録媒体。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008252904A JP5176837B2 (ja) | 2008-09-30 | 2008-09-30 | 情報処理システム及びその管理方法、制御プログラム並びに記録媒体 |
US12/461,254 US8423997B2 (en) | 2008-09-30 | 2009-08-05 | System and method of controlling virtual machine |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008252904A JP5176837B2 (ja) | 2008-09-30 | 2008-09-30 | 情報処理システム及びその管理方法、制御プログラム並びに記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010086181A JP2010086181A (ja) | 2010-04-15 |
JP5176837B2 true JP5176837B2 (ja) | 2013-04-03 |
Family
ID=42059089
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008252904A Active JP5176837B2 (ja) | 2008-09-30 | 2008-09-30 | 情報処理システム及びその管理方法、制御プログラム並びに記録媒体 |
Country Status (2)
Country | Link |
---|---|
US (1) | US8423997B2 (ja) |
JP (1) | JP5176837B2 (ja) |
Families Citing this family (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010079587A1 (ja) * | 2009-01-06 | 2010-07-15 | 三菱電機株式会社 | 管理装置及び管理方法及びプログラム |
US8527466B2 (en) * | 2009-05-31 | 2013-09-03 | Red Hat Israel, Ltd. | Handling temporary files of a virtual machine |
US8943498B2 (en) * | 2009-05-31 | 2015-01-27 | Red Hat Israel, Ltd. | Method and apparatus for swapping virtual machine memory |
US8352799B2 (en) * | 2010-02-12 | 2013-01-08 | Symantec Corporation | Data corruption prevention during application restart and recovery |
US20110225458A1 (en) * | 2010-03-09 | 2011-09-15 | Microsoft Corporation | Generating a debuggable dump file for an operating system kernel and hypervisor |
US20110225459A1 (en) * | 2010-03-09 | 2011-09-15 | Microsoft Corporation | Generating a debuggable dump file for a virtual machine |
US8365020B2 (en) | 2010-03-18 | 2013-01-29 | Red Hat Israel, Ltd. | Mechanism for saving crash dump files of a virtual machine on a designated disk |
US8671405B2 (en) * | 2010-03-31 | 2014-03-11 | Microsoft Corporation | Virtual machine crash file generation techniques |
JP2011243012A (ja) * | 2010-05-19 | 2011-12-01 | Hitachi Ltd | 仮想計算機システムのメモリダンプ取得方法 |
CN101887393B (zh) * | 2010-07-01 | 2014-07-02 | 中兴通讯股份有限公司 | 基于半虚拟化技术的设备故障复现方法及系统 |
US9015706B2 (en) | 2010-07-08 | 2015-04-21 | Symantec Corporation | Techniques for interaction with a guest virtual machine |
JP5648902B2 (ja) * | 2010-09-30 | 2015-01-07 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | 仮想サーバのスナップショットを管理する方法、及び該方法を具現化する装置 |
WO2012125392A1 (en) * | 2011-03-11 | 2012-09-20 | Skydesks, Incorporated | Methods and systems for persistent virtual application hosting |
EP2701063A4 (en) | 2011-04-22 | 2014-05-07 | Fujitsu Ltd | INFORMATION PROCESSING DEVICE, METHOD OF PROCESSING INFORMATION PROCESSING DEVICE |
CN103885863B (zh) * | 2012-12-24 | 2018-12-11 | 腾讯科技(深圳)有限公司 | 系统故障的处理方法及虚拟机 |
AU2014232838A1 (en) * | 2013-03-15 | 2015-09-24 | Nec Corporation | Information processing device |
US9350632B2 (en) * | 2013-09-23 | 2016-05-24 | Intel Corporation | Detection and handling of virtual network appliance failures |
US9256489B2 (en) | 2013-10-30 | 2016-02-09 | International Business Machines Corporation | Synchronized debug information generation |
CN103678036B (zh) * | 2013-11-15 | 2016-08-17 | 上海爱数信息技术股份有限公司 | 一种基于虚拟机运行信息数据发现的备份方法 |
JP6610094B2 (ja) * | 2015-08-28 | 2019-11-27 | 富士ゼロックス株式会社 | 仮想計算機システム及び仮想計算機プログラム |
WO2017107014A1 (zh) * | 2015-12-21 | 2017-06-29 | 华为技术有限公司 | 一种网络亚健康诊断方法及装置 |
US10042737B2 (en) | 2016-08-31 | 2018-08-07 | Microsoft Technology Licensing, Llc | Program tracing for time travel debugging and analysis |
US10031834B2 (en) | 2016-08-31 | 2018-07-24 | Microsoft Technology Licensing, Llc | Cache-based tracing for time travel debugging and analysis |
US10310963B2 (en) | 2016-10-20 | 2019-06-04 | Microsoft Technology Licensing, Llc | Facilitating recording a trace file of code execution using index bits in a processor cache |
US10489273B2 (en) | 2016-10-20 | 2019-11-26 | Microsoft Technology Licensing, Llc | Reuse of a related thread's cache while recording a trace file of code execution |
US10310977B2 (en) | 2016-10-20 | 2019-06-04 | Microsoft Technology Licensing, Llc | Facilitating recording a trace file of code execution using a processor cache |
US10318332B2 (en) * | 2017-04-01 | 2019-06-11 | Microsoft Technology Licensing, Llc | Virtual machine execution tracing |
US10387188B2 (en) * | 2017-11-09 | 2019-08-20 | International Business Machines Corporation | Virtual machine scoping of data on a hypervisor |
US11663064B1 (en) * | 2019-09-02 | 2023-05-30 | Virtuozzo International Gmbh | System and method for generating a guest operating system crash dump |
US12019504B1 (en) * | 2019-12-31 | 2024-06-25 | Virtuozzo International Gmbh | Automated software crash recovery in hyperconverged systems using centralized knowledge database |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0652130A (ja) | 1992-07-30 | 1994-02-25 | Mitsubishi Electric Corp | マルチプロセッサシステム |
JP2002082816A (ja) * | 2000-09-07 | 2002-03-22 | Hitachi Ltd | 障害監視システム |
US7343521B2 (en) * | 2004-05-28 | 2008-03-11 | International Business Machines Corporation | Method and apparatus to preserve trace data |
JP2006171995A (ja) * | 2004-12-14 | 2006-06-29 | Mitsubishi Electric Corp | 制御用計算機 |
JP4473766B2 (ja) * | 2005-04-04 | 2010-06-02 | 株式会社日立製作所 | 計算機システム、ログ収集方法、及びコンピュータプログラム |
US7669020B1 (en) * | 2005-05-02 | 2010-02-23 | Symantec Operating Corporation | Host-based backup for virtual machines |
US8375386B2 (en) * | 2005-06-29 | 2013-02-12 | Microsoft Corporation | Failure management for a virtualized computing environment |
US7634679B2 (en) * | 2005-11-30 | 2009-12-15 | Microsoft Corporation | Remote location failover server application |
JP2007226413A (ja) * | 2006-02-22 | 2007-09-06 | Hitachi Ltd | メモリダンプ方法、メモリダンププログラム、及び、計算機システム |
JP2007334403A (ja) * | 2006-06-12 | 2007-12-27 | Mitsubishi Electric Corp | 計算機システム障害対応方式及び計算機システム障害対応方法 |
JP2008171076A (ja) * | 2007-01-09 | 2008-07-24 | Vision Arts Kk | ジョブ実行装置及びその制御方法 |
JP2008217728A (ja) * | 2007-03-08 | 2008-09-18 | Hitachi Ltd | 仮想計算機システムの障害情報採取方法 |
US7685474B2 (en) * | 2007-03-16 | 2010-03-23 | Symantec Corporation | Failsafe computer support assistant using a support virtual machine |
JP5142629B2 (ja) * | 2007-08-22 | 2013-02-13 | 株式会社日立製作所 | 仮想ボリュームのバックアップを行うストレージシステム及び方法 |
US7917617B1 (en) * | 2008-08-14 | 2011-03-29 | Netapp, Inc. | Mitigating rebaselining of a virtual machine (VM) |
-
2008
- 2008-09-30 JP JP2008252904A patent/JP5176837B2/ja active Active
-
2009
- 2009-08-05 US US12/461,254 patent/US8423997B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2010086181A (ja) | 2010-04-15 |
US20100083250A1 (en) | 2010-04-01 |
US8423997B2 (en) | 2013-04-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5176837B2 (ja) | 情報処理システム及びその管理方法、制御プログラム並びに記録媒体 | |
US7574627B2 (en) | Memory dump method, memory dump program and computer system | |
EP2726977B1 (en) | Virtual machine image analysis | |
US7908521B2 (en) | Process reflection | |
US8132057B2 (en) | Automated transition to a recovery kernel via firmware-assisted-dump flows providing automated operating system diagnosis and repair | |
EP2867770B1 (en) | Methods, systems and apparatus to capture error conditions in lightweight virtual machine managers | |
US7774636B2 (en) | Method and system for kernel panic recovery | |
KR101393992B1 (ko) | 정보 처리 장치, 정보 처리 방법, 및 프로그램을 기록한 컴퓨터 판독가능한 기록 매체 | |
US20110004791A1 (en) | Server apparatus, fault detection method of server apparatus, and fault detection program of server apparatus | |
US20090276205A1 (en) | Stablizing operation of an emulated system | |
KR20040047209A (ko) | 네트워크 상의 컴퓨터 시스템의 자동 복구 방법 및 이를구현하기 위한 컴퓨터 시스템의 자동 복구 시스템 | |
JP2007133544A (ja) | 障害情報解析方法及びその実施装置 | |
US20050204199A1 (en) | Automatic crash recovery in computer operating systems | |
US11989539B2 (en) | Continuous integration and deployment system time-based management | |
US20160259578A1 (en) | Apparatus and method for detecting performance deterioration in a virtualization system | |
US20140189422A1 (en) | Information processing apparatus and stored information analyzing method | |
US9959225B2 (en) | Computer apparatus and control method of computer apparatus | |
JP5592828B2 (ja) | パッチ影響解析装置、方法及びプログラム | |
WO2018036318A1 (zh) | 一种在操作系统启动阶段收集异常信息的方法及装置 | |
Postolache et al. | Suspend feature for multiple devices of same type in bhyve | |
JP2006039763A (ja) | ゲストosデバッグ支援方法及び仮想計算機マネージャ | |
JP7389877B2 (ja) | ネットワークの最適なブートパスの方法及びシステム | |
CN109564533B (zh) | 一种支持即时恢复进程中执行引导进程的设备和方法 | |
JP2016076152A (ja) | エラー検出システム、エラー検出方法およびエラー検出プログラム | |
Jann et al. | Towards an immortal operating system in virtual environments |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110217 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120423 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120508 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120709 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120731 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121001 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121211 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121224 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5176837 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |