JPWO2016013199A1 - 仮想化基盤管理装置、仮想化基盤管理システム、仮想化基盤管理方法、及び、仮想化基盤管理プログラム - Google Patents

仮想化基盤管理装置、仮想化基盤管理システム、仮想化基盤管理方法、及び、仮想化基盤管理プログラム Download PDF

Info

Publication number
JPWO2016013199A1
JPWO2016013199A1 JP2016535788A JP2016535788A JPWO2016013199A1 JP WO2016013199 A1 JPWO2016013199 A1 JP WO2016013199A1 JP 2016535788 A JP2016535788 A JP 2016535788A JP 2016535788 A JP2016535788 A JP 2016535788A JP WO2016013199 A1 JPWO2016013199 A1 JP WO2016013199A1
Authority
JP
Japan
Prior art keywords
failure
physical machine
physical
machine
virtualization infrastructure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016535788A
Other languages
English (en)
Other versions
JP6288275B2 (ja
Inventor
亮太 油科
亮太 油科
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JPWO2016013199A1 publication Critical patent/JPWO2016013199A1/ja
Application granted granted Critical
Publication of JP6288275B2 publication Critical patent/JP6288275B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1415Saving, restoring, recovering or retrying at system level
    • G06F11/1438Restarting or rejuvenating
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1479Generic software techniques for error detection or fault masking
    • G06F11/1482Generic software techniques for error detection or fault masking by means of middleware or OS functionality
    • G06F11/1484Generic software techniques for error detection or fault masking by means of middleware or OS functionality involving virtual machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2023Failover techniques
    • G06F11/203Failover techniques using migration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5061Partitioning or combining of resources
    • G06F9/5077Logical partitioning of resources; Management or configuration of virtualized resources
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/4557Distribution of virtual machine instances; Migration and load balancing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/45591Monitoring or debugging support
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/81Threshold
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/815Virtual

Abstract

本願発明は、仮想化環境を構築するコンピュータシステムにおいて、使用可能な物理マシンを有効活用することを可能とする。仮想化基盤管理装置40は、仮想マシン51−iを実行可能な物理マシン50−iにおいて、物理的な固定障害ではない偶発障害が発生したことを検出する検出部41と、検出部41が係る偶発障害を検出した場合、物理マシン50−1乃至50−nの状態を記憶する管理情報記憶部44に、物理マシン50−iが待機状態であることを登録する登録部42と、物理マシン50−jにおいて障害が発生した場合、係る障害により停止した仮想マシン51−jを、管理情報記憶部44において待機状態であることが登録されている物理マシンの何れかに再配置する配置部43と、を備える。

Description

本願発明は、仮想化環境を構築するコンピュータシステムにおいて、仮想マシンを物理マシンへ配置することを管理する仮想化基盤管理装置等に関する。
近年、IaaS(Infrastructure as a Service)のようなクラウドサービスが世界的に広がってきている。このようなクラウドサービスにおいては、サービス事業者が仮想化環境を構築するコンピュータシステムを提供し、ユーザがそのコンピュータシステムに配置された仮想マシンを使用して様々なサービスを展開する。その一例として、NFV(Network Functions Virtualization)という概念が標準化団体であるETSI(European Telecommunications Standards Institute)において議論され、その標準化が徐々に進んでいる。NFVは、通信事業者がこれまで専用装置を用いて提供してきたサービスを、仮想マシンにより提供する方式である。このような背景から、係るコンピュータシステムを有効活用できるように仮想マシンを配置する技術に対する期待が高まってきている。
このような技術の一例として、特許文献1には、仮想サーバが設けられた複数の物理サーバを備える仮想化システムにおいて、設計思想に沿って仮想サーバを再配置可能な装置が開示されている。係る設計思想の一例として、「仮想サーバ2が仮想サーバ1の待機系のサーバであるので、これらを同一の物理サーバに配置しない」という思想がある。あるいは、係る設計思想の別の例として、「仮想サーバ3と仮想サーバ4とが処理する業務の負荷が小さいので、これらを同じ物理サーバに配置してもよい」という思想がある。
また、特許文献2には、物理マシンをメンテナンスする際、あるいは、物理マシンに障害が発生した際に、リソースプール総量を減らさずにシステム運用を継続する仮想化システムが開示されている。係る仮想化システムは、1以上の物理マシンが仮想マシンを作成する1以上のリソースプール、及び、リソースプール間において共有されるリソースプールであるリカバリプールを構成する。そして、この仮想化システムは、物理マシンをメンテナンスする際、あるいは、物理マシンに障害が発生した際に、係るリカバリプールを利用する。
特開2009-199395号公報 特開2013-210745号公報
一般的な仮想化システムは、複数の物理マシンを備えている。そして物理マシンにおいて動作する仮想マシンが各種サービスを提供する。係る仮想化システムは、何れかの物理マシンにおいて障害が発生した場合、当該物理マシンにおいて動作していた仮想マシンを、他の物理マシンに再配置することにより、サービスの提供を継続する。
物理マシンにおいて発生する障害には、ハードウェアに関する物理的な固定障害の他に、係る固定障害ではない偶発的な障害がある。この偶発的な障害(以降、偶発障害と称する)としては、例えば、BIOS(Basic Input/Output System)あるいはOS(Operating System)が包含するソフトウェアバグに起因して発生する障害がある。あるいは、係る偶発障害として、物理マシンに対する電源供給の一時的な停止、あるいは、温度異常による動作不良等がある。
これらの偶発障害は、ハードウェアに関する固定障害とは異なり、障害が発生した物理マシンを例えば再起動することにより復旧可能な障害である。したがって、発生した障害が偶発障害である場合、係る障害が発生した物理マシンは、本来は再起動により使用することができる。しかしながら、一般的な仮想化システムは、偶発障害が発生した物理マシンを障害マシンとして管理し、当該物理マシンに対する保守作業が完了するまで、当該物理マシンを使用しない。すなわち、一般的な仮想化システムでは、本来使用可能である物理マシンを使用できないため、使用可能な物理マシンが減少するという問題がある。特許文献1乃至2が開示した技術は、この問題を解決できない。
本願発明の主たる目的は、この問題を解決した、仮想化基盤装置等を提供することである。
本願発明の一態様に係る仮想化基盤管理装置は、1以上の仮想マシンを実行可能な1以上の物理マシンのうちの第一の物理マシンにおいて、物理的な固定障害ではない偶発障害が発生したことを検出する検出手段と、前記検出手段が前記偶発障害を検出した場合、前記物理マシンの状態を記憶する管理情報記憶手段に、前記第一の物理マシンが待機状態であることを登録する登録手段と、前記1以上の物理マシンのうちの第二の物理マシンにおいて障害が発生した場合、当該障害により停止した前記仮想マシンを、前記管理情報記憶手段において待機状態であることが登録されている前記物理マシンの何れかに再配置する配置手段と、を備える。
上記目的を達成する他の見地において、本願発明の一態様に係る仮想化基盤管理方法は、1以上の仮想マシンを実行可能な1以上の物理マシンのうちの第一の物理マシンにおいて、物理的な固定障害ではない偶発障害が発生したことを検出し、前記偶発障害を検出した場合、前記物理マシンの状態を記憶する管理情報記憶手段に、前記第一の物理マシンが待機状態であることを登録し、前記1以上の物理マシンのうちの第二の物理マシンにおいて障害が発生した場合、当該障害により停止した前記仮想マシンを、前記管理情報記憶手段において待機状態であることが登録されている前記物理マシンの何れかに再配置する。
また、上記目的を達成する更なる見地において、本願発明の一態様に係るコンピュータ読み取り可能な記録媒体は、1以上の仮想マシンを実行可能な1以上の物理マシンのうちの第一の物理マシンにおいて、物理的な固定障害ではない偶発障害が発生したことを検出する検出処理と、前記検出処理が前記偶発障害を検出した場合、前記物理マシンの状態を記憶する管理情報記憶手段に、前記第一の物理マシンが待機状態であることを登録する登録処理と、前記1以上の物理マシンのうちの第二の物理マシンにおいて障害が発生した場合、当該障害により停止した前記仮想マシンを、前記管理情報記憶手段において待機状態であることが登録されている前記物理マシンの何れかに再配置する配置処理と、をコンピュータに実行させる仮想化基盤管理プログラムを記録している。
更に、本願発明は、係る記録媒体に記録されているコンピュータプログラムによっても実現可能である。
本願発明は、仮想化環境を構築するコンピュータシステムにおいて、使用可能な物理マシンを有効活用することを可能とする。
本願発明の第1の実施形態に係る仮想化基盤管理システムの構成を示すブロック図である。 本願発明の第1の実施形態に係るサービス管理テーブルの構成例を示す図である。 本願発明の第1の実施形態に係る物理マシン管理テーブルの構成と、当該物理マシン管理テーブルが更新される流れとを例示する図である。 本願発明の第1の実施形態に係る物理マシンに関する状態遷移図を示す図である。 本願発明の第1の実施形態に係る仮想化基盤管理装置が、物理マシンにおいて障害が発生した際に、物理マシン管理テーブルを更新する動作を示すフローチャートである。 本願発明の第1の実施形態に係る仮想化基盤管理装置が、障害発生により停止した仮想マシンを、物理マシンに再配置する動作を示すフローチャートである。 本願発明の第2の実施形態に係る仮想化基盤管理装置の構成を示すブロック図である。 本願発明の各実施形態に係る仮想化基盤管理装置を実行可能な情報処理装置の構成を示すブロック図である。
以下、本願発明の実施の形態について図面を参照して詳細に説明する。
<第1の実施形態>
図1は、第1の実施形態に係る仮想化基盤管理システム1の構成を概念的に示すブロック図である。本実施形態に係る仮想化基盤管理システム1は、仮想化基盤管理装置10、n(nは2以上の整数)個の物理マシン20−1乃至20−n、及び、保守装置30を有する。
仮想化基盤管理装置10、物理マシン20−1乃至20−n、及び、保守装置30は、互いに通信可能に接続されている。そして、これらの構成要素は、例えば、HTML(Hyper Text Markup Language)、あるいは、XML(eXtensible Text Markup Language)を用いて通信する。
保守装置30は、仮想化基盤管理システム1における保守機能を管理する装置であり、例えば、OSS(Operations Support System)のような装置である。
物理マシン20−1乃至20−nは、例えば、Linux(登録商標) KVM(Kernel−based Virtual Machine)、及び、IPMI(Intelligent Platform Management Interface)を備えた汎用的なサーバ装置である。物理マシン20−1乃至20−nは、NFVを実装する場合もある。尚、物理マシン20−1乃至20−nは、それぞれ、個別の筐体あるいはモジュールを有する物理的に独立したサーバ装置であってもよい。物理マシン20−1乃至20−nは、あるいは、物理的なサーバ装置が備えるCPU(Central Processing Unit)、メモリ、及び、ディスク装置等のリソースのうちの一部を割り当てられることにより仮想的に構築されたサーバ装置であってもよい。
図1に示すように、物理マシン20−1は、仮想マシン21−1を実行し、障害情報収集部22−1を備える。物理マシン20−2乃至20−nも同様に、仮想マシン21−2乃至21−nを実行し、障害情報収集部22−2乃至22−nを備える。物理マシン20−1乃至20−nは、複数の仮想マシンを実行してもよい。障害情報収集部22−1(22−2乃至22−n)は、物理マシン20−1(20−2乃至20−n)において障害が発生した際に、発生した障害情報を収集して、収集した障害情報を仮想化基盤管理装置10へ送信する。
仮想化基盤管理装置10は、物理マシン20−1乃至20−nに、仮想マシンを配置する機能を備える。仮想化基盤管理装置10は、例えば、NFV標準において定義されているNFV_Management_and_Orchestrationである。仮想化基盤管理装置10は、検出部11、登録部12、配置部13、及び、管理情報記憶部14を備えている。検出部11、登録部12、及び、配置部13は、電子回路の場合もあれば、コンピュータプログラムとそのコンピュータプログラムに従って動作するプロセッサによって実現される場合もある。管理情報記憶部14は、メモリあるいは磁気ディスク等の記憶デバイスである。
検出部11は、障害が発生した物理マシン20−i(iは1乃至nの何れかの整数)における障害情報収集部22−iから、当該物理マシン20−iにおいて発生した障害情報を受信する。検出部11は、受信した障害情報を基に、物理マシン20−iにおいて、偶発障害が発生したことを検出する。係る障害情報が、例えば、物理マシン20−iが備えるメモリに関する2ビットエラーのような復旧不能なハードウェア障害を示している場合、検出部11は、発生した障害が固定障害であると判定する。これに対して、例えば、係る障害情報が、下記のいずれかを示している場合、検出部11は、発生した障害が偶発障害であると判定する。
・ソフトウェアバグに起因して発生した障害、
・物理マシン20−iに対する電源供給の一時的な停止、
・物理マシン20−iにおける何れかの箇所に関する温度異常による動作不良。
検出部11は、物理マシン20−iにおいて固定障害あるいは偶発障害が発生したことを、登録部12及び配置部13へ通知する。
登録部12は、検出部11から、物理マシン20−iにおいて障害が発生した旨の通知を受信した場合、受信した内容に基づいて、管理情報記憶部14が記憶している情報を更新する。管理情報記憶部14は、図1に示す通り、サービス管理テーブル140、及び、物理マシン管理テーブル141を記憶している。
サービス管理テーブル140の構成例を図2に示す。サービス管理テーブル140は、仮想マシンを識別可能な識別子と、復旧優先指示情報とを関連付けたレコードを包含している。復旧優先指示情報は、障害によって仮想マシン21−iが停止した場合に、仮想マシン21−iを迅速に復旧して、仮想マシン21−iが提供していたサービスを継続することを優先するか否かを示す情報である。すなわち、復旧優先指示情報が無効である場合、復旧優先指示情報は、仮想マシン21−iを迅速に復旧することよりも、仮想マシン21−iが提供するサービスが再び停止することがないように、係るサービスを着実に提供することを優先することを示している。サービス管理テーブル140は、仮想化基盤管理システム1を管理するシステム管理者等によって、数値あるいは文字を表す情報が予め設定されていることとする。
物理マシン管理テーブル141の構成例を図3に示す。物理マシン管理テーブル141は、物理マシンを識別可能な識別子と、物理マシンに関する状態を示す情報と、偶発障害発生回数と、当該物理マシンが実行している仮想マシンを識別可能な識別子とを関連付けたレコードを包含している。尚、図3における矢印は、物理マシン管理テーブル141の内容の遷移を表す。
本実施形態では、物理マシン20−1乃至20−nは、「運用中」、「故障中」、及び、「待機中」の3つの状態をとる。本実施形態に係る物理マシン20−1乃至20−nに関する状態遷移図を図4に示す。
図4に示す通り、物理マシン20−iが、仮想マシン21−iを実行している状態である運用中状態200であるときに障害が発生した場合、物理マシン20−iは、障害により停止した状態である故障中状態201に遷移する。発生した障害が固定障害である場合、物理マシン20−iは、故障中状態201を維持する。発生した障害が偶発障害である場合、物理マシン20−iは、再起動待ちの状態である待機中状態202に遷移する。待機中状態202である物理マシン20−iは、仮想化基盤管理装置10によって、仮想マシン21−j(jは1乃至nの何れかの整数)を配置された場合、仮想マシン21−jを起動したのち、運用中状態200に遷移する。
ここで、物理マシン20−1が図3(a)に示す物理マシン管理テーブル141が表す状態であったときに、物理マシン20−1において偶発障害が発生した場合に、登録部12が物理マシン管理テーブル141を更新する動作について説明する。図3(b)に示す通り、登録部12は、物理マシン20−1に関して、状態を「運用中」から「故障中」に変更し、動作仮想マシンとして登録されていた仮想マシン21−1を識別可能な識別子をクリアする。
図3(c)に示す通り、登録部12は、物理マシン20−1に関して、偶発障害発生回数が示す値を、1加算することによって”1”に設定し、状態を「故障中」から「待機中」に変更する。その後、配置部13が停止していた仮想マシン21−1を物理マシン20−1に再配置したのち、物理マシン20−1が仮想マシン21−1を起動する。そして、図3(d)に示す通り、登録部12は、物理マシン20−1に関して、状態を「待機中」から「運用中」に変更し、動作仮想マシンとして、仮想マシン21−1を登録する。
配置部13は、検出部11から、物理マシン20−iにおいて障害が発生したことを受信した場合、受信した内容、サービス管理テーブル140、及び、物理マシン管理テーブル141に基づき、係る障害によって停止した仮想マシン21−iを、何れかの物理マシン20−jに配置する。
ここで、物理マシン20−1において偶発障害が発生し、サービス管理テーブル140の内容が図2に示す通りであり、物理マシン管理テーブル141の内容が図3(c)に示す場合を考える。そしてこの場合において、配置部13が、停止した仮想マシン21−1を、何れかの物理マシン20−jに配置する動作について説明する。
配置部13は、サービス管理テーブル140を参照し、停止した仮想マシン21−1に関する復旧優先指示情報が示す値が「有効」であることを確認する。配置部13は、復旧優先指示情報が示す値が「有効」である仮想マシンに関しては、偶発障害が発生した実績があり、かつ、状態が「待機中」である物理マシンに、当該仮想マシンを配置することが可能である。配置部13は、一方、復旧優先指示情報が示す値が「無効」である仮想マシンに関しては、偶発障害が発生した実績があり、かつ、状態が「待機中」である物理マシンに、当該仮想マシンを配置することができない。したがって、この場合、配置部13は、偶発障害が発生した実績があり、かつ、状態が「待機中」である物理マシンに、停止した仮想マシン21−1を配置可能である。
配置部13は、物理マシン管理テーブル141を参照し、状態が「待機中」である物理マシンを検索する。図3(c)に示す通り、物理マシン20−1が「待機中」であり、状態が「待機中」である物理マシンがもし他に存在しない場合、配置部13は、停止した仮想マシン21−1を物理マシン20−1に再配置する。
配置部13は、状態が「待機中」である物理マシンに対して、停止した仮想マシンを再配置する際に、物理マシン管理テーブル141における偶発障害発生回数が所定の基準を満たす何れかの物理マシンに、係る仮想マシンを再配置するようにしてもよい。ここで、係る所定の基準としては、例えば、偶発障害発生回数が物理マシン20−1乃至20−nの中で最も少ない(小さい)ことであってもよいし、あるいは、偶発障害発生回数が所定の値以下であることであってもよい。
次に図5のフローチャートを参照して、本実施形態に係る仮想化基盤管理装置10が、何れかの物理マシンにおいて障害が発生した際に、仮想マシン管理テーブル141を更新する動作(処理)について詳細に説明する。
障害情報収集部22−iは、物理マシン20−iにおいて障害が発生したことによって、仮想マシン21−iが停止したことを検出する(ステップS101)。障害情報収集部22−iは、発生した障害情報を収集し、係る障害情報を、仮想化基盤管理装置10へ送信する(ステップS102)。登録部12は、物理マシン管理テーブル141において、物理マシン20−iの状態を「運用中」から「故障中」に更新する(ステップS103)。
検出部11は、障害情報収集部22−iから受信した障害情報の内容を確認し、確認した結果を登録部12へ入力する(ステップS104)。発生した障害が偶発障害でない(すなわち固定障害である)場合(ステップS105でNo)、全体の処理は終了する。発生した障害が偶発障害である場合(ステップS105でYes)、登録部12は、物理マシン管理テーブル141において、物理マシン20−iの状態を「故障中」から「待機中」に更新し(ステップS106)、全体の処理は終了する。
次に図6のフローチャートを参照して、本実施形態に係る仮想化基盤管理装置10が、障害の発生により停止した仮想マシンを、物理マシンに再配置する動作(処理)について詳細に説明する。
配置部13は、物理マシン20−iに関する障害情報を検出部11から入手したのち、物理マシン管理テーブル141を参照し、偶発障害発生回数が0回であり、かつ、状態が「待機中」である物理マシンを検索する(ステップS201)。何れかの物理マシン20−jをヒットした場合(ステップS202でYes)、配置部13は、物理マシン20−jに、障害の発生により停止した仮想マシン21−iを配置したのち、仮想マシン21−iを再起動する(ステップS203)。
仮想マシン21−iの再起動が成功した場合(ステップS204でYes)、登録部12は、物理マシン管理テーブル141において、物理マシン20−jの状態を「待機中」から「運用中」に更新し(ステップS205)、全体の処理は終了する。仮想マシン21−iの再起動が失敗した場合(ステップS204でNo)、配置部13は、仮想マシン21−iの再起動に失敗したことを、保守装置30に通知して(ステップS209)、全体の処理は終了する。
配置部13が物理マシン管理テーブル141を検索した結果、何れの物理マシンもヒットしなかった場合(ステップS202でNo)、配置部13は、サービス管理テーブル140を参照し、仮想マシン21−iに関する復旧優先指示情報が有効であるか否かを確認する。仮想マシン21−iに関する復旧優先指示情報が無効である場合(ステップS206でNo)、配置部13はステップS209の処理を行い、全体の処理は終了する。
仮想マシン21−iに関する復旧優先指示情報が有効である場合(ステップS206でYes)、配置部13は、物理マシン管理テーブル141において、偶発障害発生回数が1回以上であり、かつ、状態が「待機中」である物理マシンを検索する(ステップS207)。何れかの物理マシン20−jがヒットした場合(ステップS208でYes)、処理はS203へ進む。何れの物理マシンもヒットしなかった場合(ステップS208でNo)、配置部13はステップS209の処理を行い、全体の処理は終了する。
本実施形態に係る仮想化基盤管理システム1は、仮想化環境を構築するコンピュータシステムにおいて、使用可能な物理マシンを有効活用することができる。その理由は、検出部11が、物理マシンにおいて発生した障害が偶発障害であることを検出した場合、登録部12が、当該物理マシンを待機中のマシンとして管理情報記憶部14に登録し、配置部13は、待機中の状態にある物理マシンの何れかに、停止した仮想マシンを配置するからである。
以下に、本実施形態に係る仮想化基盤管理システム1によって実現される効果について、詳細に説明する。
一般に、物理マシンにおいて発生する障害には、ハードウェアに関する物理的な固定障害の他に、係る固定障害ではない偶発障害がある。係る固定障害が発生した物理マシンは、障害が発生した部品を交換するなどの保守作業を行うまでは、使用することができない。一方、偶発障害が発生した物理マシンは、このような保守作業を行わなくとも、例えば再立ち上げすることにより使用することが可能である。仮想化環境を構築するコンピュータシステムにおいては、通常、偶発障害が発生した物理マシンも、固定障害が発生した物理マシンと同様に、故障中として管理される。このため、係るコンピュータシステムでは、本来は使用可能である偶発障害が発生した物理マシンに対して、仮想マシンを配置できず、使用可能な物理マシンを有効活用できていない。
これに対して、本実施形態に係る仮想化基盤管理装置10は、物理マシンにおいて発生した障害が固定障害及び偶発障害の何れかであるのかを切り分けたのち、偶発障害の場合は、当該物理マシンを待機中として管理する。そして、仮想化基盤管理装置10は、偶発障害が発生したのち待機中の状態にある物理マシンに対して、新たに仮想マシンを配置する。これにより、本実施形態に係る仮想化基盤管理システム1は、使用可能な物理マシンを有効活用することができる。
また、本実施形態に係る管理情報記憶部14は、物理マシン20−1乃至20−nに関する偶発障害発生回数を含む情報を、物理マシン管理テーブル141として格納している。そして、仮想化基盤管理装置10は、偶発障害発生回数が最も少ない物理マシンに対して、あるいは、偶発障害発生回数が所定の値以下である物理マシンに対して、仮想マシンを配置することができる。したがって、本実施形態に係る仮想化基盤管理システム1は、障害が発生する可能性が低い物理マシンを優先的に使用することにより、可用性を向上することができる。
ここで、物理マシンを配置する基準として、偶発障害発生回数が最も少ない物理マシンではなく、所定の値以下とする場合の利点を説明する。この場合、例えば、偶発障害発生回数が最も少ない特定の物理マシンが、物理マシン管理テーブル141に「待機中」であると登録された場合であって、且つ、係る特定の物理マシンとは異なる他の物理マシンよりも最近に登録されたとする。このような場合、例えば、システム管理者は、係る特定の物理マシンの偶発障害発生回数が最も少ないとしても、直ちに仮想マシンを設定するのではなく、係る特定の物理マシンの稼働状況の様子を見たいと判断することも想定される。その理由は、係る特定の物理マシンに関する偶発障害発生回数が、一気に増加してしまう場合も想定されるからである。このような場合に、係る基準を所定の値以下とすれば、システムが選択する物理マシンの自由度を広げることができるので、当該システムの可用性をより現実的にすることができる。
さらに、本実施形態に係る管理情報記憶部14は、仮想マシン21−1乃至21−nに関する復旧優先指示情報を、サービス管理テーブル140として格納している。仮想マシンにより提供されるサービスには、障害により提供が中断した場合、そのサービスの内容により、迅速に復旧することを重視するサービスと、復旧後再び障害が発生しないことを重視するサービスとがある。例えば、仮想マシンにより提供されるサービスが、個々の情報処理量が少ないリクエストを頻繁に受け付けて処理するようなサービス(サービスA)である場合、頻繁に受け付けるリクエストに与える影響を小さくする必要がある。このため、この場合は、当該サービスを迅速に復旧することが重視される。一方、仮想マシンにより提供されるサービスが、個々の情報処理量が膨大であるリクエストを時折受け付けて処理するようなサービス(サービスB)である場合、処理時間が長いリクエストの処理が完了する前に再び障害が発生することによってそれまでの処理が無駄になることを回避する必要がある。このため、この場合は、当該サービスが復旧後再び障害が発生しないことが重視される。すなわち、本実施形態では、係る復旧優先指示情報は、上記サービスAを提供する仮想マシンに関しては有効に設定され、上記サービスBを提供する仮想マシンに関しては無効に設定されている。
偶発障害が発生した実績がある物理マシンは、偶発障害の発生実績が無い物理マシンと比較して、前回発生した偶発障害と同様の原因により、偶発障害が発生する可能性が高いといえる。したがって、本実施形態に係る仮想化基盤管理装置10は、迅速に復旧することが要求される、復旧優先指示情報が有効である仮想マシンに関してのみ、偶発障害が発生した実績がある物理マシンを、当該仮想マシンを配置する対象として加える。すなわち、仮想化基盤管理装置10は、復旧優先指示情報が無効である仮想マシンに関しては、偶発障害が発生した実績がある物理マシンを、当該仮想マシンを配置する対象にはしない。これにより、本実施形態に係る仮想化基盤管理システム1は、各仮想マシンが提供するサービスの特性を考慮した柔軟なシステム管理を行いながら、使用可能な物理マシンを有効活用することができる。尚、仮想化基盤管理システム1は、復旧優先指示情報が無効である仮想マシンに関して、偶発障害が発生した回数が所定の閾値以上である物理マシンを、当該仮想マシンを配置する対象から外すようにしてもよい。
また、特定の物理マシンにおいて、偶発障害が頻発する場合、当該物理マシンを使用することは、システム運用上困難であるので、係る偶発障害を固定障害として扱った方がよい。この場合、本実施形態に係る登録部12は、当該物理マシンについて、偶発障害が発生した回数が所定の閾値以上になったときに、当該物理マシンが故障状態であることを、物理マシン管理テーブル141に登録するようにしてもよい。
さらに、本実施形態に係る登録部12は、個々の物理マシンから、未使用である資源の量に関する情報を入手して、入手した情報を管理情報記憶部14に登録してもよい。係る未使用である資源の量としては、例えば、未使用であるプロセッサのコア数、未使用であるメモリ容量、及び、未使用であるディスク容量などがある。そして、この場合、本実施形態に係る配置部13は、管理情報記憶部14において、特定の物理マシンについて、未使用である資源の量と、配置する仮想マシンが必要とする資源の量とを比較する機能を備える。そして、未使用である資源の量が配置する仮想マシンが必要とする資源の量以上である場合、配置部13は、当該物理マシンが運用状態であっても、当該物理マシンに、当該仮想マシンを配置するようにしてもよい。これにより、本実施形態に係る仮想化基盤管理システム1は、使用可能な物理マシンをさらに有効活用することができる。
<第2の実施形態>
図7は、第2の実施形態に係る仮想化基盤管理装置40の構成を概念的に示すブロック図である。
本実施形態に係る仮想化基盤管理装置40は、検出部41、登録部42、配置部43、及び、管理情報記憶部44を備えている。
検出部41は、1以上の仮想マシンを実行可能な1以上の物理マシン50−1乃至50−nのうちの物理マシン50−i(iは1乃至nのいずれかの整数)において、物理的な固定障害ではない偶発障害が発生したことを検出する。尚、物理マシン50−1(50−2乃至50−n)は、仮想マシン51−1(51−2乃至51−n)を実行している。
登録部42は、検出部41が係る偶発障害を検出した場合、物理マシン50−1乃至50−nの状態を記憶する管理情報記憶部44に、物理マシン50−iが待機状態であることを登録する。
配置部43は、物理マシン50−j(jは1乃至nのいずれかの整数)において障害が発生した場合、係る障害により停止した仮想マシン51−jを、管理情報記憶部44において待機状態であることが登録されている物理マシンの何れかに再配置する。
本実施形態に係る仮想化基盤管理装置40は、仮想化環境を構築するコンピュータシステムにおいて、使用可能な物理マシンを有効活用することができる。その理由は、検出部41が、物理マシンにおいて発生した障害が偶発障害であることを検出した場合、登録部42が、当該物理マシンを待機中のマシンとして管理情報記憶部44に登録し、配置部43は、待機中の状態にある物理マシンの何れかに、停止した仮想マシンを配置するからである。
<ハードウェア構成例>
上述した各実施形態において図1、及び、図7に示した各部は、専用のHW(HardWare)(電子回路)によって実現することができる。また、少なくとも、検出部11及び41、登録部12及び42、及び、配置部13及び43は、ソフトウェアプログラムの機能(処理)単位(ソフトウェアモジュール)と捉えることができる。但し、これらの図面に示した各部の区分けは、説明の便宜上の構成であり、実装に際しては、様々な構成が想定され得る。この場合のハードウェア環境の一例を、図8を参照して説明する。
図8は、本願発明の模範的な実施形態に係る仮想化基盤管理装置を実行可能な情報処理装置900(コンピュータ)の構成を例示的に説明する図である。即ち、図8は、図1、及び、図7に示した仮想化基盤管理装置を実現可能なコンピュータ(情報処理装置)の構成であって、上述した実施形態における各機能を実現可能なハードウェア環境を表す。
図8に示した情報処理装置900は、構成要素として下記を備えている。
・CPU901、
・ROM(Read_Only_Memory)902、
・RAM(Random_Access_Memory)903、
・ハードディスク904(記憶装置)、
・外部装置との通信インタフェース905、
・CD−ROM(Compact_Disc_Read_Only_Memory)等の記録媒体907に格納されたデータを読み書き可能なリーダライタ908、
・入出力インタフェース909、
・バス906(通信線)。
即ち、上記構成要素を備える情報処理装置900は、これらの構成がバス906を介して接続された一般的なコンピュータである。
そして、上述した実施形態を例に説明した本願発明は、図8に示した情報処理装置900に対して、次の機能を実現可能なコンピュータプログラムを供給する。その機能とは、その実施形態の説明において参照したブロック構成図(図1、及び、図7)における、検出部11及び41、登録部12及び42、及び、配置部13及び43、或いはフローチャート(図5乃至6)の機能である。また、当該装置内に供給されたコンピュータプログラムは、読み書き可能な揮発性の記憶メモリ(RAM903)またはハードディスク904等の不揮発性の記憶デバイスに格納すれば良い。
また、前記の場合において、当該ハードウェア内へのコンピュータプログラムの供給方法は、現在では一般的な手順を採用することができる。その手順としては、例えば、CD−ROM等の各種記録媒体907を介して当該装置内にインストールする方法や、インターネット等の通信回線を介して外部よりダウンロードする方法等がある。そして、このような場合において、本願発明は、係るコンピュータプログラムを構成するコード或いは、そのコードが格納された記録媒体907によって構成されると捉えることができる。
以上、上述した実施形態を模範的な例として本願発明を説明した。しかしながら、本願発明は、上述した実施形態には限定されない。即ち、本願発明は、本願発明のスコープ内において、当業者が理解し得る様々な態様を適用することができる。
この出願は、2014年7月22日に出願された日本出願特願2014−148948を基礎とする優先権を主張し、その開示の全てをここに取り込む。
1 仮想化基盤管理システム
10 仮想化基盤管理装置
11 検出部
12 登録部
13 配置部
14 管理情報記憶部
140 サービス管理テーブル
141 物理マシン管理テーブル
20−1乃至20−n 物理マシン
21−1乃至21−n 仮想マシン
22−1乃至22−n 障害情報収集部
30 保守装置
200 運用中状態
201 故障中状態
202 待機中状態
40 仮想化基盤管理装置
41 検出部
42 登録部
43 配置部
44 管理情報記憶部
50−1乃至50−n 物理マシン
51−1乃至51−n 仮想マシン
900 情報処理装置
901 CPU
902 ROM
903 RAM
904 ハードディスク
905 通信インタフェース
906 バス
907 記録媒体
908 リーダライタ
909 入出力インタフェース

Claims (10)

  1. 1以上の仮想マシンを実行可能な1以上の物理マシンのうちの第一の物理マシンにおいて、物理的な固定障害ではない偶発障害が発生したことを検出する検出手段と、
    前記検出手段が前記偶発障害を検出した場合、前記物理マシンの状態を記憶する管理情報記憶手段に、前記第一の物理マシンが待機状態であることを登録する登録手段と、
    前記1以上の物理マシンのうちの第二の物理マシンにおいて障害が発生した場合、当該障害により停止した前記仮想マシンを、前記管理情報記憶手段において待機状態であることが登録されている前記物理マシンの何れかに再配置する配置手段と、
    を備える、仮想化基盤管理装置。
  2. 前記登録手段は、前記物理マシンについて、前記偶発障害が発生した回数を、前記管理情報記憶手段に登録し、
    前記配置手段は、前記管理情報記憶手段において待機状態であることが登録されている前記物理マシンのうち、前記偶発障害が発生した回数が所定の基準を満たす物理マシンに、前記障害により停止した前記仮想マシンを再配置する、
    請求項1に記載の仮想化基盤管理装置。
  3. 前記管理情報記憶手段は、前記仮想マシンについて、前記仮想マシンが行う処理の復旧を優先することが有効であるか否かを示す復旧優先指示情報を記憶しておき、
    前記配置手段は、前記障害により停止した前記仮想マシンに関する前記復旧優先指示情報が無効であることを示している場合に、前記偶発障害が発生した回数が第一の閾値以下である前記物理マシンに対して、当該仮想マシンを再配置する、
    請求項2に記載の仮想化基盤管理装置。
  4. 前記登録手段は、前記第一の物理マシンについて、前記偶発障害が発生した回数が第二の閾値以上になった場合、前記第一の物理マシンが故障状態であることを登録する、
    請求項2または3に記載の仮想化基盤管理装置。
  5. 前記登録手段は、前記物理マシンについて、未使用である資源の量に関する情報を、前記管理情報記憶手段に登録し、
    前記配置手段は、前記管理情報記憶手段において、前記未使用である資源の量が前記仮想マシンが必要とする資源の量以上である前記物理マシンについては、当該物理マシンが運用状態であっても、当該物理マシンに、前記障害により停止した前記仮想マシンを再配置可能である、
    請求項1乃至4のいずれかに記載の仮想化基盤管理装置。
  6. 前記登録手段は、前記物理マシンについて、未使用であるプロセッサのコア数、未使用であるメモリ容量、及び、未使用であるディスク容量の少なくともいずれかを、前記未使用である資源の量に関する情報として、前記管理情報記憶手段に登録する、
    請求項5に記載の仮想化基盤管理装置。
  7. 前記検出手段は、前記仮想マシンが実行するソフトウェアが包含する論理不正、あるいは、前記第一の物理マシンに対する電源供給の停止、あるいは、前記第一の物理マシンにおいて発生した温度異常により前記仮想マシンが停止した場合に、前記第一の物理マシンにおいて、前記偶発障害が発生したと判断する、
    請求項1乃至6のいずれかに記載の仮想化基盤管理装置。
  8. 請求項1乃至7のいずれかに記載の仮想化基盤管理装置と、前記1以上の物理マシンと、を有する仮想化基盤管理システム。
  9. 1以上の仮想マシンを実行可能な1以上の物理マシンのうちの第一の物理マシンにおいて、物理的な固定障害ではない偶発障害が発生したことを検出し、
    前記偶発障害を検出した場合、前記物理マシンの状態を記憶する管理情報記憶手段に、前記第一の物理マシンが待機状態であることを登録し、
    前記1以上の物理マシンのうちの第二の物理マシンにおいて障害が発生した場合、当該障害により停止した前記仮想マシンを、前記管理情報記憶手段において待機状態であることが登録されている前記物理マシンの何れかに再配置する、
    仮想化基盤管理方法。
  10. 1以上の仮想マシンを実行可能な1以上の物理マシンのうちの第一の物理マシンにおいて、物理的な固定障害ではない偶発障害が発生したことを検出する検出処理と、
    前記検出処理が前記偶発障害を検出した場合、前記物理マシンの状態を記憶する管理情報記憶手段に、前記第一の物理マシンが待機状態であることを登録する登録処理と、
    前記1以上の物理マシンのうちの第二の物理マシンにおいて障害が発生した場合、当該障害により停止した前記仮想マシンを、前記管理情報記憶手段において待機状態であることが登録されている前記物理マシンの何れかに再配置する配置処理と、
    をコンピュータに実行させる仮想化基盤管理プログラムが記録された、コンピュータ読み取り可能な記録媒体。
JP2016535788A 2014-07-22 2015-07-17 仮想化基盤管理装置、仮想化基盤管理システム、仮想化基盤管理方法、及び、仮想化基盤管理プログラム Active JP6288275B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2014148948 2014-07-22
JP2014148948 2014-07-22
PCT/JP2015/003628 WO2016013199A1 (ja) 2014-07-22 2015-07-17 仮想化基盤管理装置、仮想化基盤管理システム、仮想化基盤管理方法、及び、仮想化基盤管理プログラムが記録された記録媒体

Publications (2)

Publication Number Publication Date
JPWO2016013199A1 true JPWO2016013199A1 (ja) 2017-05-25
JP6288275B2 JP6288275B2 (ja) 2018-03-07

Family

ID=55162743

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016535788A Active JP6288275B2 (ja) 2014-07-22 2015-07-17 仮想化基盤管理装置、仮想化基盤管理システム、仮想化基盤管理方法、及び、仮想化基盤管理プログラム

Country Status (4)

Country Link
US (1) US10353786B2 (ja)
JP (1) JP6288275B2 (ja)
CN (1) CN106537354B (ja)
WO (1) WO2016013199A1 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9898321B2 (en) * 2015-07-23 2018-02-20 At&T Intellectual Property I, L.P. Data-driven feedback control system for real-time application support in virtualized networks
CN107179957B (zh) * 2016-03-10 2020-08-25 阿里巴巴集团控股有限公司 物理机故障分类处理方法、装置和虚拟机恢复方法、系统
KR102375064B1 (ko) * 2018-05-18 2022-03-17 주식회사 케이티 가상 머신과의 연결을 관리하는 서버 및 방법
US10769007B2 (en) * 2018-06-08 2020-09-08 Microsoft Technology Licensing, Llc Computing node failure and health prediction for cloud-based data center
JP7239828B2 (ja) * 2019-08-02 2023-03-15 富士通株式会社 システム管理方法、システム管理プログラム、およびシステム管理装置
JP7122332B2 (ja) * 2020-02-26 2022-08-19 株式会社日立製作所 情報処理システム及び方法
CN112395046B (zh) * 2020-07-30 2021-06-04 上海有孚智数云创数字科技有限公司 虚拟机迁移规划调度方法及其系统与介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004133496A (ja) * 2002-10-08 2004-04-30 Hitachi Ltd コンピュータシステム
JP2009217434A (ja) * 2008-03-10 2009-09-24 Fujitsu Ltd 資源割り当て方法及び装置並びにプログラム
JP2012014674A (ja) * 2010-06-04 2012-01-19 Nippon Telegr & Teleph Corp <Ntt> 仮想環境における故障復旧方法及びサーバ及びプログラム
JP2012173751A (ja) * 2011-02-17 2012-09-10 Nec Corp 共用リソース管理システム及びリソース管理サーバ装置

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7243267B2 (en) * 2002-03-01 2007-07-10 Avaya Technology Llc Automatic failure detection and recovery of applications
JP5035011B2 (ja) 2008-02-22 2012-09-26 日本電気株式会社 仮想サーバ管理装置および仮想サーバ管理方法
WO2009110111A1 (ja) * 2008-03-04 2009-09-11 三菱電機株式会社 サーバ装置及びサーバ装置の異常検知方法及びサーバ装置の異常検知プログラム
US20110078797A1 (en) * 2008-07-29 2011-03-31 Novell, Inc. Endpoint security threat mitigation with virtual machine imaging
CN102111303A (zh) 2009-12-28 2011-06-29 北京安码科技有限公司 无人值守系统自动监护方法及装置
JP5282046B2 (ja) * 2010-01-05 2013-09-04 株式会社日立製作所 計算機システム及びその可用化方法
JP2013210745A (ja) 2012-03-30 2013-10-10 Nec Corp 仮想化システム、制御サーバ、仮想マシン配置方法、仮想マシン配置プログラム
US20160357647A1 (en) * 2014-02-10 2016-12-08 Hitachi, Ltd. Computer, hypervisor, and method for allocating physical cores
TWI603266B (zh) * 2014-03-03 2017-10-21 廣達電腦股份有限公司 虛擬機器之資源調整方法及系統

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004133496A (ja) * 2002-10-08 2004-04-30 Hitachi Ltd コンピュータシステム
JP2009217434A (ja) * 2008-03-10 2009-09-24 Fujitsu Ltd 資源割り当て方法及び装置並びにプログラム
JP2012014674A (ja) * 2010-06-04 2012-01-19 Nippon Telegr & Teleph Corp <Ntt> 仮想環境における故障復旧方法及びサーバ及びプログラム
JP2012173751A (ja) * 2011-02-17 2012-09-10 Nec Corp 共用リソース管理システム及びリソース管理サーバ装置

Also Published As

Publication number Publication date
US10353786B2 (en) 2019-07-16
CN106537354B (zh) 2020-01-07
JP6288275B2 (ja) 2018-03-07
US20170212815A1 (en) 2017-07-27
CN106537354A (zh) 2017-03-22
WO2016013199A1 (ja) 2016-01-28

Similar Documents

Publication Publication Date Title
JP6288275B2 (ja) 仮想化基盤管理装置、仮想化基盤管理システム、仮想化基盤管理方法、及び、仮想化基盤管理プログラム
US9851996B2 (en) Applying firmware updates in a system with zero downtime by selectively offlining and onlining hardware using a scale-up hypervisor layer
US7574627B2 (en) Memory dump method, memory dump program and computer system
CN110083494B (zh) 在多核心环境中管理硬件错误的方法和装置
US9652326B1 (en) Instance migration for rapid recovery from correlated failures
US10956143B2 (en) Server updates
US10067692B2 (en) Method and apparatus for backing up and restoring cross-virtual machine application
CN102419803B (zh) 计算机病毒查杀方法、系统及装置
US20150074058A1 (en) Container-based processing method, apparatus, and system
US9912535B2 (en) System and method of performing high availability configuration and validation of virtual desktop infrastructure (VDI)
JP2010086516A (ja) 仮想化環境において生じる障害の解析方法、管理サーバ、及びプログラム
US9146818B2 (en) Memory degeneracy method and information processing device
JP6832291B2 (ja) アプリケーションサーバを並列起動するためのシステムおよび方法
CN109669822B (zh) 电子装置、备用存储池的创建方法和计算机可读存储介质
US9983988B1 (en) Resuming testing after a destructive event
JP2007133544A (ja) 障害情報解析方法及びその実施装置
JP5998577B2 (ja) クラスタ監視装置、クラスタ監視方法、及びプログラム
US20080294705A1 (en) Performance Improvement with Mapped Files
CN107145399B (zh) 一种共享内存管理方法及共享内存管理设备
JP2012208752A (ja) ライセンス管理装置、ライセンス管理方法、及びプログラム
US7673082B2 (en) Method and system to determine device criticality for hot-plugging in computer configurations
JP2017078998A (ja) 情報処理装置およびログ管理方法、並びにコンピュータ・プログラム
JP2009176146A (ja) マルチプロセッサシステム、障害検出方法および障害検出プログラム
CN110597613A (zh) 任务处理方法、装置、设备及计算机可读存储介质
CN116339908A (zh) 虚拟机启动方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161220

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20161220

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20171031

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20171221

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180109

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180122

R150 Certificate of patent or registration of utility model

Ref document number: 6288275

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150