JP2008276320A - Virtual system control method and computer system - Google Patents
Virtual system control method and computer system Download PDFInfo
- Publication number
- JP2008276320A JP2008276320A JP2007116029A JP2007116029A JP2008276320A JP 2008276320 A JP2008276320 A JP 2008276320A JP 2007116029 A JP2007116029 A JP 2007116029A JP 2007116029 A JP2007116029 A JP 2007116029A JP 2008276320 A JP2008276320 A JP 2008276320A
- Authority
- JP
- Japan
- Prior art keywords
- cpu
- blade
- cpu blade
- management table
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Hardware Redundancy (AREA)
Abstract
Description
本発明は仮想システム管理方法およびシステムに関し、特に、ブレードシステムのように複数のコンピューティングノードが同一筐体に混在するシステムにおいて、複数のCPUブレード間で仮想システムのマイグレーションを管理制御する方法およびシステムに関する。 The present invention relates to a virtual system management method and system, and more particularly to a method and system for managing and controlling migration of a virtual system between a plurality of CPU blades in a system in which a plurality of computing nodes are mixed in the same chassis, such as a blade system. About.
近年、同一筐体に複数のCPUブレードが収納されたブレードシステムなどのコンピュータシステムにおいて、システム障害などによりあるCPUブレードから別のCPUブレードへ仮想システムをマイグレーションする技術がある(例えば、特許文献1)。このマイグレーションは一般に、VM(仮想マシン)による仮想コンピュータシステムにおいて、予め指定したサーバを予備として待機させておき、あるサーバにて過負荷となったり軽障害が頻発した場合に、仮想化ソフトにより仮想システムのライブマイグレーション機能を用いて予備サーバへ仮想システムをマイグレーションさせる。これにより、負荷の平準化や障害によるシステムダウンを回避し、スムーズなシステム運用が実現されるようにしている。
しかしながら、従来のシステムでは、仮想システムの移動先が予め一意に定められているため、予備サーバを用いた負荷分散/障害回避の場合に限らず、運用中のサーバ間で仮想システムの移動を行う際、その時々で適切なサーバを移動先に選択することができない不都合がある。特に、CPUブレードは用途や実施環境に応じて、性能だけでなく、高可用性を訴求するもの、高信頼性を訴求するもの、大容量メモリ搭載を訴求するものなど、システムの付加価値を提供するバリエーションが増えているが、予め用意された予備サーバが必ずしも移動元のCPUブレードと同等のスペックとは限らないため、仮想システムを移動させた後に性能や安全性が低下してしまう可能性があった。このように、従来のシステムはより安全且つ堅牢なサーバをダイナミックに選択できず、各ブレードの特徴を活かしたシステムリソースの有効活用ができるものではなかった。 However, in the conventional system, since the movement destination of the virtual system is uniquely determined in advance, not only in the case of load distribution / failure avoidance using a spare server, the virtual system is moved between servers in operation. However, there is an inconvenience that an appropriate server cannot be selected as a destination at that time. In particular, CPU blades provide not only performance, but also high-availability, high-reliability, high-capacity memory, and other system-added values depending on applications and implementation environments. Although the number of variations has increased, the spare server prepared in advance does not necessarily have the same specifications as the source CPU blade, so there is a possibility that performance and safety will be reduced after moving the virtual system. It was. As described above, the conventional system cannot dynamically select a safer and more robust server, and cannot effectively utilize system resources utilizing the features of each blade.
本発明は上記のような問題に鑑み、複数のCPUブレードを有するコンピュータシステムで、あるブレード上の仮想システムを別のブレードにマイグレーションするにあたり、ブレードの特徴やファンや電源などの動作環境、障害発生状況なども考慮して最適のブレードを選択するようにして、高可用且つダイナミックなリソース配分を実現する方法およびシステムを提供することを目的とする。 In view of the above problems, the present invention is a computer system having a plurality of CPU blades. When a virtual system on one blade is migrated to another blade, the characteristics of the blade, the operating environment such as the fan and power supply, and the occurrence of a failure It is an object of the present invention to provide a method and system for realizing highly available and dynamic resource allocation by selecting an optimum blade in consideration of the situation and the like.
上記目的を達成するために、本発明は、複数のCPUブレードを具えて構成され1のCPUブレード上で動作する仮想システムを別のCPUブレードにマイグレーションするコンピュータシステムにおいて、
少なくとも各CPUブレードに関する情報が登録される管理テーブルを格納する記憶領域と、いずれかのCPUブレード上の仮想システムを別のCPUブレードにマイグレーションする必要が生じた場合に、前記管理テーブルを参照して移動元のCPUブレードとの比較において所定の条件を満たす別のCPUブレードを選択して前記仮想システムの移動先に設定する制御手段とを具えることを最も主要な特徴とする。
To achieve the above object, the present invention provides a computer system configured to migrate a virtual system configured with a plurality of CPU blades and operating on one CPU blade to another CPU blade.
Refer to the management table when there is a need to migrate a storage area that stores at least a management table in which information related to each CPU blade is registered, and a virtual system on any CPU blade to another CPU blade. The main feature is that it comprises control means for selecting another CPU blade that satisfies a predetermined condition in comparison with the migration source CPU blade and setting it as the migration destination of the virtual system.
このシステムにおいて、前記管理テーブルはさらに、各CPUブレードについて、対応する電源および/または冷却ファンの情報が登録されており、この情報が前記制御手段による設定時に考慮されることを特徴とする。 In this system, the management table further stores information on the corresponding power supply and / or cooling fan for each CPU blade, and this information is taken into account when setting by the control means.
また、前記制御手段は、予め所定の条件により、あるいは定期的に前記管理テーブルを参照し、各CPUブレードについて各登録項目に所定の重み付け演算を行って得たブレード毎のシステム運用環境指標を管理しており、移動元のCPUブレードと同等以上の指標を有する別のCPUブレードを移動先として選択することを特徴とする。 The control means manages the system operating environment index for each blade obtained by performing a predetermined weighting operation on each registered item for each CPU blade by referring to the management table in advance or periodically according to a predetermined condition. And another CPU blade having an index equal to or higher than that of the source CPU blade is selected as the destination.
また、前記管理テーブルがさらに、オペレータの入力により各CPUブレードをグループ分けして管理する欄を有するとともに、前記制御手段は、前記移動元のCPUブレードと同じグループから移動先のCPUブレードを選択することが好ましい。 In addition, the management table further includes a column for managing the CPU blades by grouping them according to an operator input, and the control unit selects a destination CPU blade from the same group as the source CPU blade. It is preferable.
本発明のコンピュータシステムによれば、利用可能なCPUブレードに関する情報を管理テーブルで管理しており、いずれかのCPUブレードで動作する仮想システムの移動が必要となった場合に、各CPUブレードの情報を比較してその時点で最も適切なCPUブレードを移動先としてダイナミックに選定するため、予備のブレードを用意するコストや手間が省けるとともに、移動先ブレードの性能や信頼性が異なることによる不具合を防止することができる。 According to the computer system of the present invention, information on available CPU blades is managed by the management table, and information on each CPU blade is required when a virtual system that operates on any of the CPU blades needs to be moved. By comparing these, the most appropriate CPU blade at that time is dynamically selected as the destination, so the cost and labor of preparing a spare blade can be saved, and problems due to different performance and reliability of the destination blade can be prevented. can do.
また、CPUブレードの性能のみならず、電源やファンの冗長性、省電力性まで移行判定条件に組み入れているため、電源やファンを要素とする信頼性を維持した状態で好適に仮想システムを移動させることができる。 In addition, not only the performance of the CPU blade, but also redundancy and power saving of the power supply and fan are incorporated in the migration judgment conditions, so the virtual system can be moved appropriately while maintaining reliability with the power supply and fan as elements. Can be made.
また、予め各CPUブレードについてのシステム運用環境指標を算出しておき、障害発生時には同等以上の指標を有するCPUブレードを移動先として決定する構成としたため、障害が発生してから各CPUブレードの数値を取得して移動先を選択するような構成に比して、障害発生から移行完了までに要する時間が飛躍的に短くなる。 In addition, since the system operating environment index for each CPU blade is calculated in advance and a CPU blade having an index equal to or higher than that is determined as a destination when a failure occurs, the numerical value of each CPU blade after the failure has occurred. The time required from the occurrence of a failure to the completion of the transition is drastically shortened as compared with the configuration in which the destination is selected by acquiring the destination.
さらに、オペレータの設定により各CPUブレードをグループ管理し、仮想システムの移動をグループ内で制限する構成により、よりユーザの意向に沿った仮想システム制御が可能となり、ユーザの意図する運用目的に応じた適材適所のリソース活用が可能となる。 In addition, each CPU blade is managed in groups according to operator settings, and the virtual system movement is restricted within the group, enabling virtual system control in line with the user's intentions, according to the user's intended operational purpose. It is possible to utilize resources in the right place for the right person
本発明を実施するための最良の実施形態について、図面を参照しながら以下に詳細に説明する。 The best mode for carrying out the present invention will be described in detail below with reference to the drawings.
図1は、本発明の一実施例を示す概略図である。本図に示すように、本発明の実施例は複数(2つ)のブレードシステム100、200にそれぞれ複数のCPUブレード、筐体マネジメントプロセッサ、複数の電源ユニット(PSU)および冷却ファンが搭載されている。各CPUブレードには仮想化ソフト(VM)が展開され、複数のシステムがVM上で動作する構成をとっている。ここで、例えば冷却ファンはブレード毎に設けられている必要はなく、1つのファンで複数のブレードをカバーする構成であってもよい。
FIG. 1 is a schematic view showing an embodiment of the present invention. As shown in the figure, in the embodiment of the present invention, a plurality (two) of
各CPUブレードはBMC(Baseboard Management Controller)とFRU情報(Field Replacement Unit Information)を格納する不揮発性メモリを有し(図示せず)、このメモリには予め製造工程において当該CPUブレードの種類、性能(例えば、CPUのコア数、周波数、キャッシュサイズなど)、ベンダーにより設定されたハードウェア(HW)耐障害性が登録されている。ここでHW耐障害性は、HWの信頼性予測・実績やサポートされている高可用性機能のレベルなどに応じてブレード間で比較表現できる指標であり、ブレードの出荷時に予めベンダーにより設定されるものとする。メモリの登録内容は、各ブレードの電源オン時に読み出されBMCから筐体マネジメントプロセッサ10に伝送される。 Each CPU blade has a non-volatile memory (not shown) for storing BMC (Baseboard Management Controller) and FRU information (Field Replacement Unit Information). In this memory, the CPU blade type and performance ( For example, the number of CPU cores, frequency, cache size, etc.) and hardware (HW) fault tolerance set by the vendor are registered. Here, HW fault tolerance is an index that can be compared and expressed between blades according to HW reliability prediction / results and the level of supported high availability functions, etc., and is preset by the vendor at the time of blade shipment And The registered contents of the memory are read when each blade is powered on and transmitted from the BMC to the chassis management processor 10.
筐体マネジメントプロセッサ10は、BMCからCPUブレードの相対的に比較可能な上記の情報を受け取る。また、各CPUブレードの管理下のPSUおよび/または冷却ファン(FAN)のFRU情報、各PSU/FANの冗長性や省電力機能の有無、VMの種類の情報などを取得して、これらの情報を記憶領域(図示せず)の管理テーブルに登録する。この管理テーブルの例を図2に示す。 The case management processor 10 receives the above-described relatively comparable information of the CPU blade from the BMC. Also, FRU information of PSU and / or cooling fan (FAN) under management of each CPU blade, redundancy of each PSU / FAN, presence / absence of power saving function, VM type information, etc. are acquired, and these information are acquired. Are registered in the management table of the storage area (not shown). An example of this management table is shown in FIG.
図2に示すように、管理テーブルには各筐体のCPUブレードごとに、可用性情報として、ベンダーが設定したHW耐障害性、VMの種類、冷却ファンの冗長性、電源の冗長性の指標値が登録される。また性能情報として、CPU性能、メモリ容量、IO、VM種類の指標値が登録される。さらに、CPU・ファン・電源の省電力性の指標値、グループ番号、最後にグループ内システム運用指標値が登録される。 As shown in FIG. 2, in the management table, for each CPU blade of each chassis, as the availability information, HW fault tolerance, VM type, cooling fan redundancy, power supply redundancy index values set by the vendor Is registered. Also, as performance information, CPU performance, memory capacity, IO, and VM type index values are registered. Further, an index value for power saving of the CPU, fan, and power source, a group number, and finally an in-group system operation index value are registered.
本実施例において、HW耐障害性の指標は「1」または「2」といった値をとり、図4のテーブルでは、例えば筐体100ではCPUブレード12,1nがFTブレードのような可用性の高い高信頼ブレードであることを示すレベル「2」の指標が登録されている。HW障害履歴は、例えば初期値にレベル5が設定され、所定期間で所定回数の障害が発生した場合に1レベル下がるよう設定される。この場合に障害発生の事象および回数の情報は各ブレードで管理され、上記のような条件を満たす場合にレベル変更通知がマネジメントプロセッサ10に通知されるようにすることができる。また、電源/ファンの冗長性としては、PSU/FANのFRU情報を読み出し、例えばN+1冗長である場合に「1」、2Nの冗長性を有する場合に「2」、UPS(無停電電源装置)を具える場合に「3」の指標を登録する。同様に性能情報は、例えばCPUのコア数、周波数、キャッシュサイズなどの数値範囲の組合せを性能指標に対応させた変換テーブルを別途有し(図示せず)、実際の数値をこのテーブルにマッピングして性能指標を導出する構成とすることができる。また、CPU・ファン・電源等が省電力電源またはファンであるか否かをFRU情報から判定し、例えば省電力でない場合に「0」が登録されるようにする。
In this embodiment, the HW fault tolerance index takes a value such as “1” or “2”. In the table of FIG. 4, for example, in the
筐体マネジメントプロセッサ10はまた、図4に示す管理テーブルに各CPUブレードのグループ番号を登録することにより、これらのCPUブレードをグループ管理している。このグループ番号は、筐体マネジメントプロセッサ10のコンソール(図示せず)を介してオペレータが直接設定できるように構成することができる。このグループ分けは、仮想システムをマイグレーションする際の移動先を特定のグループに制限するのに利用される。 The chassis management processor 10 also manages these CPU blades in groups by registering the group numbers of the CPU blades in the management table shown in FIG. This group number can be configured so that an operator can directly set it via a console (not shown) of the housing management processor 10. This grouping is used to limit the migration destination when migrating a virtual system to a specific group.
筐体マネジメントプロセッサ10はさらに、電源オン時に上記の指標データが揃ったら、あるいは定期的に、各CPUブレードの各指標データからシステム運用環境指標を算出し管理テーブルに登録するようにしてもよい。このシステム運用環境指標は、上述した管理テーブルの各項目を必要に応じてさらに個別に重み付け演算して導出することができる。本実施例の場合、例えば得られるシステム運用環境指標がレベル1−5となるよう各項目の重み付け値(係数)が予め定められており、これに従って重み付け演算を行っている。各項目の係数は実施環境や各種条件を勘案して、当業者であれば容易に定めることができる。 The case management processor 10 may further calculate a system operating environment index from each index data of each CPU blade and register it in the management table when the above index data is prepared when the power is turned on or periodically. The system operating environment index can be derived by further individually calculating each item of the management table as necessary. In the case of the present embodiment, for example, the weighting values (coefficients) of the respective items are determined in advance so that the obtained system operation environment index becomes level 1-5, and the weighting calculation is performed according to this. The coefficient of each item can be easily determined by those skilled in the art in consideration of the implementation environment and various conditions.
筐体マネジメントプロセッサ10はさらに、異なるブレード筐体200の筐体マネジメントプロセッサ20と情報交換し、利用可能なCPUブレードの管理テーブルを完成し、管理する。また、システム運用中に新規なCPUブレードが追加された場合にも、その挿入を筐体マネジメントプロセッサ10が検出し、CPUブレードの情報をそのBMCから即座に入手して管理テーブルに登録するとともに、システム運用環境指標を再算出して管理する。
The case management processor 10 further exchanges information with the
そして、筐体マネジメントプロセッサ10は、例えば軽障害が頻発した場合など所定の条件によりいずれかのCPUブレードの仮想システムを別のブレードにマイグレーションする必要が生じた場合は、管理テーブルのシステム運用環境指標を参照し、同一グループ内で移動元のCPUブレードと同等またはそれ以上のシステム運用環境指標を有するブレードから起動先を選択し、当該CPUブレードのBMCに通知する。この場合、筐体マネジメントプロセッサ10は継続的に各CPUブレードの負荷を監視しており、さらに負荷の少ないCPUブレードを選択するようにしてもよい。また、システム運用環境指標が移動元と同等以上のレベルの別のCPUブレードが存在しない場合、他のCPUブレードのうち指標が高いものから選択するように構成してもよく、また指標が所定値以上異なる場合はマイグレーションを実行せずに継続運用するように構成してもよい。 The case management processor 10 determines the system operation environment index of the management table when it is necessary to migrate the virtual system of any CPU blade to another blade under a predetermined condition such as when frequent frequent failures occur. , An activation destination is selected from blades having a system operating environment index equal to or higher than that of the movement source CPU blade in the same group, and notified to the BMC of the CPU blade. In this case, the chassis management processor 10 continuously monitors the load of each CPU blade, and may select a CPU blade having a smaller load. In addition, when there is no other CPU blade whose system operating environment index is equal to or higher than that of the movement source, it may be configured to select another CPU blade having a higher index, and the index is a predetermined value. If different from the above, the system may be configured to continue operation without performing migration.
各CPUブレードのVMは、筐体マネジメントプロセッサ10から移動先情報を入手すると、VM間制御による仮想システムの移動を実行する。これにより、例えばシステム運用指標が同等以上のCPUブレードに移動した場合は、仮想システムが動作するシステム環境レベルを落とさずに移動前と同等もしくは改善する移動が可能となり、ユーザの運用目的に応じた最適なシステムリソース配分と堅牢なシステム運用が実現する。 When the VM of each CPU blade obtains the movement destination information from the chassis management processor 10, it executes the movement of the virtual system by inter-VM control. As a result, for example, if the system operation index moves to a CPU blade with the same or higher, it is possible to move to the same or improved level before the movement without lowering the system environment level in which the virtual system operates. Realizes optimal system resource allocation and robust system operation.
このシステムのマイグレーション動作例について以下に説明する。筐体マネジメントプロセッサ10は、ACオン時に筐体内のCPUブレード11−1nのBMCより、各CPUブレードのCPU/メモリの詳細情報、HW障害履歴情報、FRU内のHW耐障害性指標情報を採取し、図2の管理テーブルに各個別指標に反映する。また、直接配下のPSU11−13、FAN11−13のFRU情報を読み出し、電源/ファンの冗長性や省電力指標を管理テーブルに登録する。さらに、CPUブレード11−1nのそれぞれがDCオンされたときに、VMの種類を示す情報をBMCが入手しておき、筐体マネジメントプロセッサ10がその情報をBMCから入手し管理テーブルに反映する。そして、これらの情報からシステム運用環境指標を算出し、管理テーブルに登録する。また、システムのオペレータは必要に応じて各CPUブレードのグループ分けをコンソール(図示せず)から入力し、これが管理テーブルに登録されている。 An example of the migration operation of this system will be described below. The chassis management processor 10 collects detailed CPU / memory information, HW failure history information, and HW fault tolerance index information in the FRU from the BMC of the CPU blade 11-1n in the chassis when AC is on. This is reflected in each individual index in the management table of FIG. Further, the FRU information of the directly subordinate PSUs 11-13 and FAN11-13 is read, and the power supply / fan redundancy and the power saving index are registered in the management table. Further, when each of the CPU blades 11-1n is DC-on, the BMC obtains information indicating the type of the VM, and the housing management processor 10 obtains the information from the BMC and reflects it in the management table. Then, a system operation environment index is calculated from these pieces of information and registered in the management table. Further, the system operator inputs the grouping of each CPU blade from a console (not shown) as necessary, and this is registered in the management table.
なお、ここでVMの種類とは、例えばある時点での複数のVMの測定結果やベンダにおける位置づけなどの情報に基づいて任意に定められる格付け情報であり、例えば「高−中−低」や「1〜5」といった指数で表すことができる。すなわち、VMは数社から多種の製品がリリースされており、各製品はそれぞれ可用性、拡張性、性能等に差があり、また同製品でもエディションやヴァージョン間でこれらの指標に違いがある。これらの違いを考慮してベンダ側がVMの種類を任意に決定し、製造時にこれを登録するものとする。 Here, the type of VM is rating information arbitrarily determined based on information such as measurement results of a plurality of VMs at a certain point in time and positioning in a vendor, for example, “high-medium-low”, “ It can be expressed by an index such as “1-5”. That is, various products of VM are released from several companies, and each product has a difference in availability, scalability, performance, etc., and even in the same product, there are differences in these indexes between editions and versions. In consideration of these differences, the vendor side arbitrarily determines the type of VM and registers it at the time of manufacture.
一方、筐体マネジメントプロセッサ20においても、ACオン時に筐体内のCPUブレード21−2mのBMCから同種の情報を入手し、同様の管理テーブルを作成してシステム運用環境指数を算出する。さらに、筐体間で通信を行い、これらの管理テーブルの情報を交換して、図2に示すような総ての情報を管理する。
On the other hand, the
このような状況において、図1に示すCPUブレード12にて例えば1ビットエラーなどの訂正可能エラーのようなHW軽障害が頻発したり、ブレードが過負荷状態になったことが検出された場合、CPUブレード12はBMCに障害履歴情報を登録する。筐体マネジメントプロセッサ10はBMCからの報告に基づき、所定のアルゴリズムに従って管理テーブルにおけるCPUブレード12の障害履歴指数を変更する。これは、例えば所定期間内に所定回数の軽障害が報告された場合や、所定期間以上過負荷状態が継続した場合に指数を1ランク下げるなど設定することができる。 In such a situation, when it is detected that a HW minor failure such as a correctable error such as a 1-bit error frequently occurs or the blade is overloaded in the CPU blade 12 shown in FIG. The CPU blade 12 registers failure history information in the BMC. The case management processor 10 changes the failure history index of the CPU blade 12 in the management table according to a predetermined algorithm based on the report from the BMC. This can be set, for example, by lowering the index by one rank when a predetermined number of minor faults are reported within a predetermined period or when an overload state continues for a predetermined period or longer.
このようにして、例えばCPUブレード12の障害履歴がレベル5からレベル3まで下がるなど、所定の条件が整った場合に、筐体マネジメントプロセッサ10はこのCPUブレード12の仮想システムをマイグレーションさせる必要ありと判定する。本実施例ではこの条件を例えば障害履歴指数が2ランク下がった場合としているが、これは本例に限らず他の基準を適用してもよい。
In this way, when a predetermined condition is met, for example, when the failure history of the CPU blade 12 decreases from
このとき筐体マネジメントプロセッサ10は、図2の管理テーブルを参照し、CPUブレード12と同一グループ#1に設定されているCPUブレード(筐体100のブレード1n、筐体200のブレード22、2m)の中から、システム運用環境指標が同じ高レベル5で、且つ負荷の少ないCPUブレードを移動先CPUブレードとして選択する。この際に、筐体マネジメントプロセッサ10は筐体200の筐体マネジメントプロセッサ20と通信を行い、各ブレードの負荷状況などの情報を取得して選定する。例えば図3には、移動元のCPUブレード12に仮想システムが2つある場合に、システム運用環境指標が同じレベル5でグループ#1に属するCPUブレードのうち、負荷の少ない筐体200のCPUブレード22、2mを移動先として選択する実施例が示されている。この情報が筐体マネジメントプロセッサ10、20間で通信され、CPUブレード12のBMCにその移動先の上方が通知される。これを受けたCPUブレード12のVMは、測材に当該BMCから移動先情報を入手し、図3に示すようなVM−VM間制御により2つの仮想システムの移動を実行する。
At this time, the chassis management processor 10 refers to the management table of FIG. 2 and the CPU blades are set to the
以上のステップにより、本発明は、各CPUブレードの性能や電源/ファンの特徴までをも考慮して、その時点で最適な仮想システムの移動先ブレードをダイナミックに選択できるようにしたため、専用のハードウェアを追加することなく、従来のシステム構成にて最適なシステムリソース配分と堅牢なシステム運用が可能となる。また、仮想システムが動作するシステム環境レベルを落とさずに移動先をダイナミックに定義可能としており、障害時や過負荷時に備えて予備の待機サーバを用意する必要がなくなるため、利用者のTCO(Total Cost of Ownership)を削減することができる。また、高性能、高可用性、高信頼性などHWの特徴をふまえた条件で仮想システムの展開を可能としており、さらにユーザが定義できるグループ内での移動に制限できるため、ユーザの意図する運用目的に応じた適材適所のリソース活用が可能となる。 Through the above steps, the present invention can dynamically select the optimal destination blade of the virtual system at that point in consideration of the performance of each CPU blade and the characteristics of the power supply / fan. It is possible to allocate the optimal system resources and operate the system robustly with the conventional system configuration without adding hardware. In addition, the destination can be dynamically defined without lowering the system environment level in which the virtual system operates, and there is no need to prepare a spare standby server in the event of a failure or overload, so the user's TCO (Total Cost of Ownership) can be reduced. In addition, the virtual system can be deployed on the basis of HW characteristics such as high performance, high availability, and high reliability, and can be restricted to movement within a group that can be defined by the user. It is possible to utilize resources in the right place for the right material.
次に、本発明の他の実施例について説明する。上記実施例では、各CPUブレードをグループ分けして、仮想システムの移動先を同一グループ内に制限するようにしたが、このグループ分けは必須の構成ではなく、例えば図1または図4に示すように、特にグループを考慮することなく、システム運用環境指標が同等以上であるCPUブレードから負荷が少ないものを選択するようにしてもよい。また、上記実施例では筐体マネジメントプロセッサが移動先を選定しているが、例えば各CPUブレードのシステム運用環境指標がVMの立ち上げ時や稼働中にBMCからVMに通知され、各CPUブレード上のVMがこれらの情報から仮想システム移動時の移動先選定を行うよう構成されていてもよい。 Next, another embodiment of the present invention will be described. In the above embodiment, the CPU blades are grouped to limit the migration destination of the virtual system within the same group. However, this grouping is not an essential configuration, for example, as shown in FIG. 1 or FIG. In addition, a CPU blade with a low system load may be selected from CPU blades having a system operation environment index equal to or higher than that without considering a group. In the above embodiment, the chassis management processor selects the destination. For example, the system operating environment index of each CPU blade is notified from the BMC to the VM when the VM is started up or in operation, and the CPU blade The VM may be configured to select a destination when moving the virtual system from these pieces of information.
さらに別の実施例を、図5を参照しながら説明する。図5の実施例では、筐体100、200を接続するネットワーク上に管理サーバ300が設けられており、この管理サーバ300が図2に示す管理テーブルを管理し、仮想システムの移動先の制御を実行する。本実施例では、各筐体マネジメントプロセッサは、管理サーバ300で動作する管理ソフトの指示に従い、CPUブレードに関する情報を各BMCに取り合わせて入手し、電源/ファンに関する情報は直接入手し、管理サーバ300に通知する。
Yet another embodiment will be described with reference to FIG. In the embodiment of FIG. 5, a management server 300 is provided on the network connecting the
各筐体の筐体マネジメントプロセッサ10、20は、ACオン時に各筐体内のCPUブレード11−1n、21−2mのBMCより、各CPUブレードのCPU/メモリの詳細情報、HW障害履歴情報、FRU内のHW耐障害性指標情報を採取し、管理サーバ300に転送する。また、電源/ファンのFRU情報から冗長性や省電力性の情報を取得して管理サーバ300に転送する。管理サーバ300で動作する管理ソフト(図示せず)は、図2に示す管理テーブルにこれらの情報を登録し、上記説明と同様にして氏sつえむうんよう環境指標を算出する。いずれかの筐体で新規にCPUブレードが追加された場合にも、筐体マネジメントプロセッサがCPUブレード挿入を検出し、管理サーバ300へ情報を送信する。管理ソフトは情報を受けると即座にシステム運用環境指標の再算出を行いその情報を管理する。
The
例えばCPUブレード12に軽障害が頻発したり過負荷となった場合には、これがCPUブレード12のBMCから筐体マネジメントプロセッサ10を介して管理サーバ300に通知され、管理テーブルが更新される。管理ソフトは、同一グループ#1に背手値されているCPUブレードのうち、システム運用環境指標が同じレベル5で、且つ負荷の少ないCPUブレード22、2mを仮想システムの移動先として選択肢、CPUブレード12のVMに対し、2つの仮想システムの移動を筐体マネジメントプロセッサ10を介さずに直接指示する。このようにして、複数の筐体にまたがる仮想システムの移動を円滑に行うことができる。
For example, when a minor failure frequently occurs or an overload occurs in the CPU blade 12, this is notified from the BMC of the CPU blade 12 to the management server 300 via the chassis management processor 10, and the management table is updated. The management software selects the
本発明に係る仮想システム制御方法およびコンピュータシステムは、ネットワーク産業を含む情報処理産業で好適に利用することができる。 The virtual system control method and computer system according to the present invention can be suitably used in the information processing industry including the network industry.
100、200 ブレード筐体
10、20 筐体マネジメントプロセッサ
11−1n、21−2m CPUブレード
PSU 電源ユニット
FAN 冷却ファン
300 管理サーバ
100, 200
Claims (8)
少なくとも各CPUブレードに関する情報が登録される管理テーブルを格納する記憶領域と、いずれかのCPUブレード上の仮想システムを別のCPUブレードにマイグレーションする必要が生じた場合に、前記管理テーブルを参照して移動元のCPUブレードとの比較において所定の条件を満たす別のCPUブレードを選択して前記仮想システムの移動先に設定する制御手段とを具えることを特徴とするコンピュータシステム。 In a computer system configured to migrate a virtual system configured with a plurality of CPU blades and operating on one CPU blade to another CPU blade,
Refer to the management table when there is a need to migrate a storage area that stores at least a management table in which information related to each CPU blade is registered, and a virtual system on any CPU blade to another CPU blade. A computer system comprising: a control unit that selects another CPU blade that satisfies a predetermined condition in comparison with a migration source CPU blade and sets it as a migration destination of the virtual system.
The method according to any one of claims 5 to 7, wherein the management table further includes a column for grouping and managing the CPU blades according to an input from an operator, and the control means includes the source of the movement. A virtual system control method comprising selecting a destination CPU blade from the same group as a CPU blade.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007116029A JP2008276320A (en) | 2007-04-25 | 2007-04-25 | Virtual system control method and computer system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007116029A JP2008276320A (en) | 2007-04-25 | 2007-04-25 | Virtual system control method and computer system |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008276320A true JP2008276320A (en) | 2008-11-13 |
Family
ID=40054234
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007116029A Pending JP2008276320A (en) | 2007-04-25 | 2007-04-25 | Virtual system control method and computer system |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2008276320A (en) |
Cited By (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010140183A1 (en) * | 2009-06-01 | 2010-12-09 | 富士通株式会社 | Server control program, control server, virtual server distribution method |
JP2011018198A (en) * | 2009-07-09 | 2011-01-27 | Hitachi Ltd | Management device and management method |
JP2011048548A (en) * | 2009-08-26 | 2011-03-10 | Nec Computertechno Ltd | Distributed processing system, job distribution method thereof, and program |
WO2011043317A1 (en) * | 2009-10-07 | 2011-04-14 | 日本電気株式会社 | Power saving system and power saving method |
JP2011118557A (en) * | 2009-12-02 | 2011-06-16 | Hitachi Ltd | Migration management method for virtual machine, computer using the same, virtualization mechanism using the same and computer system using the same |
JP2011134314A (en) * | 2009-12-22 | 2011-07-07 | Intel Corp | Dmi redundancy in multiple processor computer system |
JP2011253334A (en) * | 2010-06-02 | 2011-12-15 | Hitachi Ltd | Virtual machine and cpu allocation method |
WO2012033110A1 (en) * | 2010-09-06 | 2012-03-15 | 日本電気株式会社 | Application configuration system, method, and program |
WO2012046386A1 (en) * | 2010-10-07 | 2012-04-12 | 日本電気株式会社 | Server system, management device, server management method, and program |
WO2012053115A1 (en) * | 2010-10-22 | 2012-04-26 | 富士通株式会社 | Data center, information processing system, information processing device, method for controlling information processing device, and control program |
WO2012053243A1 (en) * | 2010-10-20 | 2012-04-26 | 株式会社日立製作所 | Virtual server management device |
JP2012141671A (en) * | 2010-12-28 | 2012-07-26 | Hitachi Ltd | Method for migrating virtual computer, virtual computer system and control server |
WO2012127641A1 (en) * | 2011-03-23 | 2012-09-27 | 株式会社日立製作所 | Information processing system |
JP2013037433A (en) * | 2011-08-04 | 2013-02-21 | Fujitsu Ltd | Server, server system, and server redundancy switch method |
WO2013132735A1 (en) * | 2012-03-08 | 2013-09-12 | 日本電気株式会社 | Virtual machine managing device and virtual machine managing method |
JP2013196538A (en) * | 2012-03-22 | 2013-09-30 | Hitachi Solutions Ltd | Virtual machine operation monitoring system |
JP2014038459A (en) * | 2012-08-15 | 2014-02-27 | Toshiba Corp | Virtual os controller, system, method and program |
JP2014127134A (en) * | 2012-12-27 | 2014-07-07 | Fujitsu Ltd | Information processing device, server management method and server management program |
JP2016527648A (en) * | 2013-08-05 | 2016-09-08 | アマゾン テクノロジーズ インコーポレイテッド | Move instance of virtual computer processing |
JP2017506775A (en) * | 2014-02-27 | 2017-03-09 | インテル・コーポレーション | Technologies for computing resource discovery and management |
JP6996602B1 (en) | 2020-09-23 | 2022-01-17 | 日本電気株式会社 | BMC, server system, device stability determination method and program |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0836502A (en) * | 1994-07-25 | 1996-02-06 | Fujitsu Ltd | Information processing system |
JP2005234917A (en) * | 2004-02-20 | 2005-09-02 | Hitachi Ltd | Method for determining server at occurrence of fault |
JP2005309644A (en) * | 2004-04-20 | 2005-11-04 | Hitachi Ltd | Resource control method and its system |
WO2005109195A2 (en) * | 2004-05-08 | 2005-11-17 | International Business Machines Corporation | Dynamic migration of virtual machine computer programs |
JP2005339528A (en) * | 2004-04-30 | 2005-12-08 | Hitachi Ltd | Computer system, management server, blade assignment method, blade assignment program, server system, and arrangement method of server |
JP2006163963A (en) * | 2004-12-09 | 2006-06-22 | Hitachi Ltd | Failover method due to disk takeover |
JP2006277033A (en) * | 2005-03-28 | 2006-10-12 | Nec Corp | Blade server system and its management method |
-
2007
- 2007-04-25 JP JP2007116029A patent/JP2008276320A/en active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0836502A (en) * | 1994-07-25 | 1996-02-06 | Fujitsu Ltd | Information processing system |
JP2005234917A (en) * | 2004-02-20 | 2005-09-02 | Hitachi Ltd | Method for determining server at occurrence of fault |
JP2005309644A (en) * | 2004-04-20 | 2005-11-04 | Hitachi Ltd | Resource control method and its system |
JP2005339528A (en) * | 2004-04-30 | 2005-12-08 | Hitachi Ltd | Computer system, management server, blade assignment method, blade assignment program, server system, and arrangement method of server |
WO2005109195A2 (en) * | 2004-05-08 | 2005-11-17 | International Business Machines Corporation | Dynamic migration of virtual machine computer programs |
JP2007536657A (en) * | 2004-05-08 | 2007-12-13 | インターナショナル・ビジネス・マシーンズ・コーポレーション | Dynamic migration of virtual machine computer programs |
JP2006163963A (en) * | 2004-12-09 | 2006-06-22 | Hitachi Ltd | Failover method due to disk takeover |
JP2006277033A (en) * | 2005-03-28 | 2006-10-12 | Nec Corp | Blade server system and its management method |
Cited By (38)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010140183A1 (en) * | 2009-06-01 | 2010-12-09 | 富士通株式会社 | Server control program, control server, virtual server distribution method |
JP5338906B2 (en) * | 2009-06-01 | 2013-11-13 | 富士通株式会社 | Server management program, management server, and virtual server placement method |
US8782652B2 (en) | 2009-06-01 | 2014-07-15 | Fujitsu Limited | Control server, virtual server distribution method |
JP2011018198A (en) * | 2009-07-09 | 2011-01-27 | Hitachi Ltd | Management device and management method |
JP2011048548A (en) * | 2009-08-26 | 2011-03-10 | Nec Computertechno Ltd | Distributed processing system, job distribution method thereof, and program |
WO2011043317A1 (en) * | 2009-10-07 | 2011-04-14 | 日本電気株式会社 | Power saving system and power saving method |
CN102549973B (en) * | 2009-10-07 | 2015-07-22 | 日本电气株式会社 | Power saving system and power saving method |
JP2011082799A (en) * | 2009-10-07 | 2011-04-21 | Nec Corp | Power saving system, method and program |
CN102549973A (en) * | 2009-10-07 | 2012-07-04 | 日本电气株式会社 | Power saving system and power saving method |
JP2011118557A (en) * | 2009-12-02 | 2011-06-16 | Hitachi Ltd | Migration management method for virtual machine, computer using the same, virtualization mechanism using the same and computer system using the same |
JP2011134314A (en) * | 2009-12-22 | 2011-07-07 | Intel Corp | Dmi redundancy in multiple processor computer system |
JP2011253334A (en) * | 2010-06-02 | 2011-12-15 | Hitachi Ltd | Virtual machine and cpu allocation method |
WO2012033110A1 (en) * | 2010-09-06 | 2012-03-15 | 日本電気株式会社 | Application configuration system, method, and program |
JP5729390B2 (en) * | 2010-09-06 | 2015-06-03 | 日本電気株式会社 | Application configuration system, method, and program |
WO2012046386A1 (en) * | 2010-10-07 | 2012-04-12 | 日本電気株式会社 | Server system, management device, server management method, and program |
US9319291B2 (en) | 2010-10-07 | 2016-04-19 | Nec Corporation | Server system, management device, server management method, and program |
JP5870927B2 (en) * | 2010-10-07 | 2016-03-01 | 日本電気株式会社 | Server system, management apparatus, server management method, and program |
WO2012053243A1 (en) * | 2010-10-20 | 2012-04-26 | 株式会社日立製作所 | Virtual server management device |
JP2012088943A (en) * | 2010-10-20 | 2012-05-10 | Hitachi Ltd | Virtual server management device |
WO2012053115A1 (en) * | 2010-10-22 | 2012-04-26 | 富士通株式会社 | Data center, information processing system, information processing device, method for controlling information processing device, and control program |
JP2012141671A (en) * | 2010-12-28 | 2012-07-26 | Hitachi Ltd | Method for migrating virtual computer, virtual computer system and control server |
JP5616523B2 (en) * | 2011-03-23 | 2014-10-29 | 株式会社日立製作所 | Information processing system |
WO2012127641A1 (en) * | 2011-03-23 | 2012-09-27 | 株式会社日立製作所 | Information processing system |
JPWO2012127641A1 (en) * | 2011-03-23 | 2014-07-24 | 株式会社日立製作所 | Information processing system |
US9032241B2 (en) | 2011-08-04 | 2015-05-12 | Fujitsu Limited | Server, server system, and method for controlling recovery from a failure |
JP2013037433A (en) * | 2011-08-04 | 2013-02-21 | Fujitsu Ltd | Server, server system, and server redundancy switch method |
US9600311B2 (en) | 2012-03-08 | 2017-03-21 | Nec Corporation | Virtual-machine managing device and virtual-machine managing method |
JPWO2013132735A1 (en) * | 2012-03-08 | 2015-07-30 | 日本電気株式会社 | Virtual machine management apparatus and virtual machine management method |
WO2013132735A1 (en) * | 2012-03-08 | 2013-09-12 | 日本電気株式会社 | Virtual machine managing device and virtual machine managing method |
JP2013196538A (en) * | 2012-03-22 | 2013-09-30 | Hitachi Solutions Ltd | Virtual machine operation monitoring system |
JP2014038459A (en) * | 2012-08-15 | 2014-02-27 | Toshiba Corp | Virtual os controller, system, method and program |
US9448904B2 (en) | 2012-12-27 | 2016-09-20 | Fujitsu Limited | Information processing apparatus and server management method |
JP2014127134A (en) * | 2012-12-27 | 2014-07-07 | Fujitsu Ltd | Information processing device, server management method and server management program |
JP2016527648A (en) * | 2013-08-05 | 2016-09-08 | アマゾン テクノロジーズ インコーポレイテッド | Move instance of virtual computer processing |
US9870268B2 (en) | 2013-08-05 | 2018-01-16 | Amazon Technologies, Inc. | Virtual computing instance migration |
JP2017506775A (en) * | 2014-02-27 | 2017-03-09 | インテル・コーポレーション | Technologies for computing resource discovery and management |
JP6996602B1 (en) | 2020-09-23 | 2022-01-17 | 日本電気株式会社 | BMC, server system, device stability determination method and program |
JP2022052504A (en) * | 2020-09-23 | 2022-04-04 | 日本電気株式会社 | Bmc, server system, device stabilization determination method, and program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2008276320A (en) | Virtual system control method and computer system | |
Sharma et al. | Reliability and energy efficiency in cloud computing systems: Survey and taxonomy | |
US9933843B2 (en) | Systems and methods for reducing energy storage requirements in a data center | |
JP5477602B2 (en) | Server reliability visualization method, computer system, and management server | |
US9537720B1 (en) | Topology discovery for fault finding in virtual computing environments | |
US9582377B1 (en) | Dynamic sizing of storage capacity for a remirror buffer | |
US11016819B2 (en) | Optimizing clustered applications in a clustered infrastructure | |
JP2009199395A (en) | Virtual server management device and virtual server management method | |
JP2013535745A (en) | Providing high availability for applications in highly available virtual machine environments | |
US11880287B2 (en) | Management of microservices failover | |
CN106980529B (en) | Computer system for managing resources of baseboard management controller | |
US8589728B2 (en) | Job migration in response to loss or degradation of a semi-redundant component | |
JP2014127134A (en) | Information processing device, server management method and server management program | |
JP2011186701A (en) | Resource allocation apparatus, resource allocation method and resource allocation program | |
EP4029197B1 (en) | Utilizing network analytics for service provisioning | |
JPWO2009081737A1 (en) | Degenerate configuration design system and method | |
EP2645635B1 (en) | Cluster monitor, method for monitoring a cluster, and computer-readable recording medium | |
US20200183725A1 (en) | Systems and methods for protecting virtual machines running on software-defined storage | |
WO2007148371A1 (en) | Performance management system and performance management method for virtual machine | |
US8151122B1 (en) | Power budget managing method and system | |
US11385972B2 (en) | Virtual-machine-specific failover protection | |
WO2011054642A1 (en) | Expanding memory size | |
KR20230091168A (en) | Techniques for creating configurations to electrically isolate fault domains in data centers | |
JP5626884B2 (en) | Power supply management system and power supply management method | |
Li et al. | Demand-aware erasure coding for distributed storage systems |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100316 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110711 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110719 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110916 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120403 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120530 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20120828 |