JP5632820B2 - Wide-area distributed configuration change system - Google Patents

Wide-area distributed configuration change system Download PDF

Info

Publication number
JP5632820B2
JP5632820B2 JP2011265417A JP2011265417A JP5632820B2 JP 5632820 B2 JP5632820 B2 JP 5632820B2 JP 2011265417 A JP2011265417 A JP 2011265417A JP 2011265417 A JP2011265417 A JP 2011265417A JP 5632820 B2 JP5632820 B2 JP 5632820B2
Authority
JP
Japan
Prior art keywords
data center
virtual server
server
configuration change
wide
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2011265417A
Other languages
Japanese (ja)
Other versions
JP2013117889A (en
Inventor
有里佳 板子
有里佳 板子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Systems Ltd
Original Assignee
Hitachi Systems Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Systems Ltd filed Critical Hitachi Systems Ltd
Priority to JP2011265417A priority Critical patent/JP5632820B2/en
Publication of JP2013117889A publication Critical patent/JP2013117889A/en
Application granted granted Critical
Publication of JP5632820B2 publication Critical patent/JP5632820B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、仮想サーバで構成される情報処理システム、データセンタ等の技術に関し、特に、仮想サーバで構成されるシステムを広域に分散するシステムにおいて適切にリソースを割り当てて構成変更を行う技術に関する。   The present invention relates to a technology such as an information processing system configured by virtual servers and a data center, and more particularly to a technology for appropriately allocating resources and performing configuration changes in a system in which a system configured by virtual servers is distributed over a wide area.

データセンタを利用したICTのサービス停止を防ぐためにシステムの冗長化構成が採られるようになっている。しかし、冗長化構成が採られたシステムが同一の地域に設置されている場合、大規模な災害が発生すると当該すべてのシステムが停止してしまい、サービスを提供することができなくなる。これを解決(対処)するために、システムを地理的に異なる複数の拠点間に分散した冗長化構成を採ることにより、サービスの停止を防ぐことができる。   In order to prevent an ICT service stop using a data center, a redundant system configuration is adopted. However, when systems with a redundant configuration are installed in the same region, when a large-scale disaster occurs, all the systems are stopped and services cannot be provided. In order to solve (or deal with) this, it is possible to prevent the service from being stopped by adopting a redundant configuration in which the system is distributed among a plurality of geographically different bases.

上記システムを構成するサーバを仮想サーバ等で構築し、データセンタに配置する。これらの仮想サーバは、各データセンタにバックアップを作成しコールドスタンバイとしておく。例えばあるデータセンタにて災害が発生した場合、被災していない別のデータセンタでサーバを起動することにより、サービスの停止を最低限に抑えることができる。このようなシステムを実現するためには、下記の課題が存在する。   A server constituting the system is constructed with a virtual server or the like and arranged in a data center. These virtual servers create backups at each data center and set them as cold standbys. For example, when a disaster occurs in a certain data center, the service can be stopped to a minimum by starting the server in another data center that is not damaged. In order to realize such a system, the following problems exist.

即ち、各拠点で仮想サーバのリソース使用状況をリモートから参照・表示できる機能、およびユーザシステムを分散配置する機能、を持つシステムが必要となる。   That is, a system having a function for remotely referring / displaying the resource usage status of the virtual server at each site and a function for distributing and arranging user systems is required.

仮想サーバのリソースの分散配置に関する先行技術例としては、特開2010−282420号公報(特許文献1)が挙げられる。特許文献1の技術では、物理サーバの性能情報から稼働する仮想サーバを稼働させる物理サーバを特定している。しかし、広域に分散する場合は、物理サーバの性能だけでなく、回線速度も考慮する必要があるため、不十分である。   JP-A 2010-282420 (Patent Document 1) can be cited as an example of prior art relating to the distributed arrangement of virtual server resources. In the technique of Patent Literature 1, a physical server that operates a virtual server that operates from the performance information of the physical server is specified. However, when it is distributed over a wide area, it is not sufficient because it is necessary to consider not only the performance of the physical server but also the line speed.

特開2010−282420号公報JP 2010-282420 A

上述のように、仮想サーバ等で構成されるデータセンタ(拠点)を広域に分散して配置し被災時などにもサービスを維持するシステム(冗長化システムをコールドスタンバイとして災害時には複数のデータセンタ間にシステムを分散配置するシステム等)の実現のためには、各拠点の仮想サーバのリソース使用状況などをリモートから参照・表示できる機能、及び適切にリソースを割り当てて構成変更を行うシステム構成変更の機能などが必要となる。   As mentioned above, data centers (bases) composed of virtual servers, etc. are distributed over a wide area and maintained in the event of a disaster (redundant system as a cold standby between multiple data centers in the event of a disaster In order to realize a system that distributes systems in a distributed manner, it is possible to remotely view and display the resource usage status of virtual servers at each site, and to change the system configuration by appropriately allocating resources. Functions are required.

本発明の主な目的は、仮想サーバで構成される情報処理システム(データセンタ等)の技術において、上記機能(拠点の仮想サーバのリソース使用状況のリモート参照機能、システム構成変更機能など)を持つシステムを実現でき、これにより例えば大規模な災害発生時にもデータセンタが提供するICTのサービスの停止時間を少なくすることができることである。   The main object of the present invention is the above-mentioned functions (such as a remote reference function of a resource usage status of a virtual server at a base, a system configuration change function, etc.) in the technology of an information processing system (such as a data center) composed of virtual servers. The system can be realized, and, for example, even when a large-scale disaster occurs, the downtime of the ICT service provided by the data center can be reduced.

本発明のうち代表的な形態は、複数のデータセンタ、そのシステム、及びその仮想サーバを対象として管理する情報処理システム(広域分散構成変更システム)等であって、以下に示す構成を有することを特徴とする。   A typical embodiment of the present invention is an information processing system (wide area distributed configuration change system) that manages a plurality of data centers, their systems, and their virtual servers, and has the following configuration. Features.

本システムでは、各拠点(データセンタ)のシステムの仮想サーバのリソース使用状況などをリモートから参照・表示できる機能、及びシステム(仮想サーバ)の構成変更の機能などを備え、例えばある第1のデータセンタ(拠点)で災害が発生した場合、被災していない他のデータセンタ(拠点)のリソースの使用状況を参照し、1つのデータセンタで第1の拠点のシステム(仮想サーバ)を全て稼働(起動)できる場合は、当該1つのデータセンタに集約して仮想サーバを起動し、上記集約できない場合は、複数のデータセンタに分散して仮想サーバを起動する。   This system has a function for remotely referring / displaying the resource usage status of the virtual server of the system at each site (data center), a function for changing the configuration of the system (virtual server), etc. For example, a certain first data When a disaster occurs at the center (base), refer to the resource usage status of other data centers (bases) that are not affected by the disaster, and operate all the systems (virtual servers) at the first base in one data center ( If it can be aggregated to the one data center, the virtual server is activated. If the aggregation is not possible, the virtual server is distributed to a plurality of data centers and activated.

本システムは、例えば、複数のデータセンタ、そのシステム、及びその仮想サーバを対象として管理する運用基盤システムを含んで成る。システム(ユーザシステム)を構成する1つ以上の仮想サーバは1つ以上のデータセンタに配置される。運用基盤システムは、複数の各々のデータセンタのシステムの仮想サーバの状態を監視する処理を行う監視部と、複数の各々のデータセンタのシステムの仮想サーバのリソース使用状況を第1のテーブルに管理する処理を行う広域分散リソース管理部と、複数の各々のデータセンタのシステムの仮想サーバに関する構成変更の処理を行う構成変更部とを有する。第1のテーブルは、各データセンタのリソースの使用量と空き容量と回線速度と、各システムの各仮想サーバのリソースの使用量とを管理する。監視部により第1のデータセンタの利用不可の状態を検知した時、リソース管理部によるリソースの使用状況の参照に基づいて、構成変更部により、第1のデータセンタのシステムの仮想サーバについて、移動先とする、1つ以上のデータセンタを検索して決定し、当該移動先のデータセンタで当該第1のデータセンタのシステムの仮想サーバを起動させる処理を行う。   The system includes, for example, an operation infrastructure system that manages a plurality of data centers, the system, and the virtual server. One or more virtual servers constituting the system (user system) are arranged in one or more data centers. The operation infrastructure system manages the resource usage status of the virtual server of each of the plurality of data center systems in a first table, and monitors the status of the virtual server of each of the plurality of data center systems. A wide-area distributed resource management unit that performs the process to perform, and a configuration change unit that performs a process of changing the configuration of the virtual server of each of the plurality of data center systems. The first table manages the resource usage, free capacity, line speed, and resource usage of each virtual server of each system in each data center. When the monitoring unit detects an unusable state of the first data center, the configuration change unit moves the virtual server of the first data center system based on the resource usage status reference by the resource management unit. One or more data centers as a destination are searched and determined, and the virtual server of the system of the first data center is activated in the data center of the movement destination.

本発明のうち代表的な形態によれば、仮想サーバで構成される情報処理システム(データセンタ等)の技術において、上記機能(拠点の仮想サーバのリソース使用状況のリモート参照機能など)を持つシステムを実現でき、これにより例えば大規模な災害発生時にもデータセンタが提供するICTのサービスの停止時間を少なくすることができることである。   According to a typical embodiment of the present invention, in the technology of an information processing system (such as a data center) configured by virtual servers, a system having the above functions (such as a remote reference function for resource usage status of a virtual server at a base) Thus, for example, even when a large-scale disaster occurs, the downtime of the ICT service provided by the data center can be reduced.

本発明の一実施の形態のシステムにおける正常稼働時のシステム全体構成を示す図である。It is a figure which shows the whole system structure at the time of normal operation in the system of one embodiment of this invention. 正常稼働時の各データセンタのリソース使用状況テーブルを示す図である。It is a figure which shows the resource usage condition table of each data center at the time of normal operation. 正常稼働時の各サーバのリソース使用状況テーブルを示す図である。It is a figure which shows the resource usage status table of each server at the time of normal operation. サーバ移動ポリシーテーブルを示す図である。It is a figure which shows a server movement policy table. 災害発生時の仮想サーバ起動先のデータセンタの決定方法の処理フローを示す図である。It is a figure which shows the processing flow of the determination method of the data center of the virtual server starting place at the time of a disaster occurrence. データセンタA災害発生後のシステム全体構成を示す図である。It is a figure which shows the system whole structure after the data center A disaster occurrence. 正常稼働時の各データセンタのリソース使用状況を示す図である。It is a figure which shows the resource usage condition of each data center at the time of normal operation. データセンタA災害発生後の各データセンタのリソース使用状況を示す図である。It is a figure which shows the resource usage condition of each data center after data center A disaster occurrence. 災害復旧直後の各データセンタのリソース使用状況テーブルを示す図である。It is a figure which shows the resource usage condition table of each data center immediately after disaster recovery. 災害復旧直後の各サーバのリソース使用状況テーブルを示す図である。It is a figure which shows the resource usage condition table of each server immediately after disaster recovery. 災害復旧時の仮想サーバ起動先のデータセンタの決定方法の処理フローを示す図である。It is a figure which shows the processing flow of the determination method of the data center of the virtual server starting place at the time of disaster recovery.

以下、本発明の実施の形態を図面に基づいて詳細に説明する。なお、実施の形態を説明するための全図において、同一部には原則として同一符号を付し、その繰り返しの説明は省略する。   Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings. Note that components having the same function are denoted by the same reference symbols throughout the drawings for describing the embodiment, and the repetitive description thereof will be omitted.

[システム]
図1において、本実施の形態のシステムにおける正常稼働時のシステム全体構成例を示している。本システム全体は、運用基盤システム40と、複数の各々の拠点のデータセンタ10とが通信ネットワークで接続される構成である。運用基盤システム40は、監視サーバ41と、広域分散リソース管理システム42と、仮想サーバ構成変更システム43とを含んで成る。なお図1では、運用基盤システム40をシングル構成で記載してあるが、冗長化構成とすることが望ましい。
[system]
In FIG. 1, the example of the whole system structure at the time of normal operation | movement in the system of this Embodiment is shown. The entire system is configured such that the operation infrastructure system 40 and a plurality of data centers 10 at each base are connected by a communication network. The operation infrastructure system 40 includes a monitoring server 41, a wide area distributed resource management system 42, and a virtual server configuration change system 43. In FIG. 1, the operation infrastructure system 40 is described in a single configuration, but it is desirable to have a redundant configuration.

各データセンタ10(10A,10B,10C)は、対応する各システム20(20A,20B,20C)を有する。各システム20(20A,20B,20C)は、対応するサーバ30(30A,30B,30C,30D,30E)を有する。各システム20のサーバ30は仮想サーバ(物理サーバ上に稼働される仮想サーバ)で構成されている。各システム20はユーザシステム等であり、仮想サーバ(30)を用いてクラウドコンピューティングサービス等を提供する。例えば「データセンタA」10Aは、「システムA」20Aを有し、「システムA」20Aは、「サーバA」30A,「サーバB」30Bで構成(起動、配置等)されている状態を示す。同様に、データセンタBのシステムBはサーバC,D、データセンタCのシステムCはサーバEで構成された状態である。   Each data center 10 (10A, 10B, 10C) has a corresponding system 20 (20A, 20B, 20C). Each system 20 (20A, 20B, 20C) has a corresponding server 30 (30A, 30B, 30C, 30D, 30E). The server 30 of each system 20 is configured by a virtual server (virtual server operated on a physical server). Each system 20 is a user system or the like, and provides a cloud computing service or the like using a virtual server (30). For example, the “data center A” 10A has a “system A” 20A, and the “system A” 20A indicates a state in which (server A) 30A and “server B” 30B are configured (started up, arranged, etc.). . Similarly, the system B of the data center B is configured by the servers C and D, and the system C of the data center C is configured by the server E.

運用基盤システム40の監視サーバ41(公知技術)により、各データセンタ10のサーバ30等の監視を行う。監視サーバ41と各データセンタ10の物理サーバ等の設備は、遠隔で通信接続される。なおデータセンタ10側に監視エージェントモジュール等を具備してもよい。   The server 30 of each data center 10 is monitored by the monitoring server 41 (known technology) of the operation infrastructure system 40. The monitoring server 41 and the equipment such as the physical server of each data center 10 are connected by remote communication. A monitoring agent module or the like may be provided on the data center 10 side.

また、広域分散リソース管理システム42では、各拠点(10)のシステム(20)のリソース使用状況を参照・表示する機能を有する。広域分散リソース管理システム42は、監視サーバ41による各拠点(10)の監視の処理に基づき、随時、全体的なリソース状況を把握し、テーブル(T1)の内容を更新する。   Further, the wide area distributed resource management system 42 has a function of referring to and displaying the resource usage status of the system (20) of each base (10). The wide-area distributed resource management system 42 grasps the overall resource status and updates the contents of the table (T1) as needed based on the monitoring processing of each site (10) by the monitoring server 41.

なお運用基盤システム40で、管理者等のユーザは、監視サーバ41の設定や、広域分散リソース管理システム42のリソース使用状況(T1)の表示や、仮想サーバ構成変更システム43のサーバ移動ポリシーテーブル(T2)の設定などが、所定のGUI(例えばWebインタフェース)で可能である。   In the operation infrastructure system 40, a user such as an administrator can set the monitoring server 41, display the resource usage status (T1) of the wide-area distributed resource management system 42, and the server migration policy table ( The setting of T2) and the like can be performed with a predetermined GUI (for example, a Web interface).

仮想サーバ構成変更システム43は、複数のデータセンタ10を対象とした、ユーザシステム(20)の広域分散配置のための仮想サーバ(30)の構成変更を決定する機能を有する。即ち、仮想サーバ構成変更システム43は、広域分散リソース管理システム42の処理を用いて各拠点(10)のリソース状況をみながら、システム20を構成するサーバ30をどの拠点(10)に配置(移動、起動等)するか決定し、当該構成変更を実行する。また、仮想サーバ構成変更システム43は、サーバ移動ポリシーテーブル(T2)を参照しつつ、回線速度を考慮して上記構成変更を決定する。   The virtual server configuration change system 43 has a function of determining a configuration change of the virtual server (30) for wide-area distributed arrangement of the user system (20) for a plurality of data centers 10. That is, the virtual server configuration change system 43 arranges (moves) the server 30 constituting the system 20 in which base (10) while monitoring the resource status of each base (10) using the processing of the wide area distributed resource management system 42. , Start up, etc.) and execute the configuration change. The virtual server configuration change system 43 determines the configuration change in consideration of the line speed while referring to the server movement policy table (T2).

各構成要素(41,42,43)は、サーバ装置(プロセッサ、メモリ、記憶装置、入力装置、出力装置、通信インタフェース装置、及びバスなどで構成される)によるソフトウェアプログラム処理などの一般的な技術によって実装可能である。   Each component (41, 42, 43) is a general technique such as software program processing by a server device (configured by a processor, a memory, a storage device, an input device, an output device, a communication interface device, and a bus). Can be implemented.

[リソース使用状況テーブル(T1)]
図2,図3は、広域分散リソース管理システム42が保持している管理情報の1つである、リソース使用状況テーブル(T1)のデータ例を示す。図2のT1aは、正常稼働時の各データセンタ10(拠点)のリソース使用状況を示す。図3のT1bは、正常稼働時の各サーバ30のリソース使用状況を示す。広域分散リソース管理システム42は、本データ(T1:T1a,T1b)を用いて、図7の例のように、リソースをグラフ表示(画面表示)することができる。管理者等のユーザは、運用基盤システム40の提供する当該画面で情報を確認する操作が可能である。
[Resource usage table (T1)]
2 and 3 show data examples of the resource usage status table (T1), which is one of the management information held by the wide area distributed resource management system 42. FIG. T1a in FIG. 2 indicates the resource usage status of each data center 10 (base) during normal operation. T1b in FIG. 3 indicates the resource usage status of each server 30 during normal operation. The wide area distributed resource management system 42 can display the resources in a graph (screen display) as shown in the example of FIG. 7 using the data (T1: T1a, T1b). A user such as an administrator can perform an operation of confirming information on the screen provided by the operation infrastructure system 40.

図2のT1aでは、図示のように、拠点(データセンタ10)、CPU使用量、CPU空き容量、メモリ使用量、メモリ空き容量、ディスク使用量、ディスク空き容量、回線速度、等の各情報を管理している。   In T1a of FIG. 2, each information such as a base (data center 10), CPU usage, CPU free capacity, memory usage, memory free capacity, disk usage, disk free capacity, line speed, and the like is shown. I manage.

図3のT1bでは、図示のように、拠点(データセンタ10)、サーバ(30)、CPU使用量、メモリ使用量、ディスク使用量、システム(20)、等の各情報を管理している。   In T1b of FIG. 3, information such as a base (data center 10), a server (30), a CPU usage amount, a memory usage amount, a disk usage amount, and a system (20) is managed as illustrated.

[サーバ移動ポリシーテーブル(T2)]
図4は、仮想サーバ構成変更システム43が保持する管理情報の1つである、サーバ移動ポリシーテーブル(T2)を示す。本テーブル(T2)は、サーバ(30)の起動先(移動先、配置先)を決定する際に利用するサーバ移動ポリシー情報を管理している。図示のように、サーバ30ごとに、回線速度優先度{低/中/高}が設定されている。
[Server migration policy table (T2)]
FIG. 4 shows a server migration policy table (T2) which is one piece of management information held by the virtual server configuration change system 43. This table (T2) manages server movement policy information used when determining the start destination (movement destination, arrangement destination) of the server (30). As illustrated, line speed priority {low / medium / high} is set for each server 30.

[仮想サーバ構成変更(被災時)]
監視サーバ41で、あるデータセンタ10(例えば10A)での災害を検知した場合(図6)、仮想サーバ構成変更システム43は、被災していない他のデータセンタ10(例えば10B,10C)で、当該被災したデータセンタ10(10A)のサーバ30(例えば30A,30B)を(代わりに)起動する。
[Virtual server configuration change (at disaster)]
When the monitoring server 41 detects a disaster in one data center 10 (for example, 10A) (FIG. 6), the virtual server configuration change system 43 is in another data center 10 (for example, 10B, 10C) that is not damaged. The server 30 (for example, 30A, 30B) of the affected data center 10 (10A) is activated (instead).

図5は、仮想サーバ構成変更システム43でのサーバ30の起動先のデータセンタ10の決定方法を示す処理フローである(S1等は処理ステップを示す)。   FIG. 5 is a processing flow showing a method of determining the data center 10 that is the activation destination of the server 30 in the virtual server configuration changing system 43 (S1 and the like indicate processing steps).

(S1) まず、被災したデータセンタ10(例えば10A)に存在するその時点のシステム20(例えば20A)を構成するサーバ30(例えば30A,30B)のすべてを稼働させることができる(対応するリソースを持つ)他のデータセンタ10(候補)を検索する(例えば10B,10Cがある)。   (S1) First, all of the servers 30 (for example, 30A, 30B) that constitute the system 20 (for example, 20A) at that time existing in the data center 10 (for example, 10A) affected by the disaster can be operated (corresponding resources). Other data centers 10 (candidates) are searched (for example, there are 10B and 10C).

(S2) 上記候補が有る場合(S1−Y)は、S2で、当該データセンタ10(候補の1つ)にて、当該被災したシステム20(20A)のサーバ30(30A,30B)を全て集約して起動させることに決定し、対応する起動を実行する(運用基盤システム40から該当のデータセンタ10へ起動を指示する)。   (S2) When there is the above candidate (S1-Y), all the servers 30 (30A, 30B) of the affected system 20 (20A) are aggregated in the data center 10 (one of the candidates) in S2. And the corresponding activation is executed (instructing activation to the corresponding data center 10 from the operation infrastructure system 40).

(S3) 上記候補が無い場合(S1−N)は、上記被災したシステム20(20A)を構成するサーバ30(30A,30B)を複数の拠点(10)に分散して起動する。このために、仮想サーバ構成変更システム43は、S3で、ポリシーテーブル(T2)を参照し、サーバ30の回線速度の優先度が高いものから順に検索する。ポリシーテーブル(T2)には、各サーバ30の回線速度の優先度が定義されている。43は、この回線速度の優先度が高いサーバから、起動先のデータセンタ10(候補)を決定する。   (S3) When there is no candidate (S1-N), the servers 30 (30A, 30B) constituting the damaged system 20 (20A) are distributed to a plurality of bases (10) and started. For this purpose, the virtual server configuration changing system 43 refers to the policy table (T2) in S3, and searches in order from the highest priority of the line speed of the server 30. In the policy table (T2), the priority of the line speed of each server 30 is defined. 43 determines a data center 10 (candidate) to be activated from a server having a high priority of the line speed.

(S4) そして、S4で、仮想サーバ構成変更システム43は、リソース使用状況テーブル(T1)を参照しつつ、データセンタ10のネットワークの回線速度とリソース(CPU,メモリ,ディスク)の空き状況から、サーバ30の起動先(移動先)を決定する。例えばリソースの空き容量がある拠点(10)のうち回線速度が一番大きい拠点(10)で当該移動先のサーバ30を起動することに決定する。   (S4) Then, in S4, the virtual server configuration change system 43 refers to the resource usage status table (T1), and from the network line speed of the data center 10 and the availability of resources (CPU, memory, disk), The activation destination (movement destination) of the server 30 is determined. For example, it is determined that the destination server 30 is started at the base (10) having the highest line speed among the bases (10) having the free capacity of resources.

(S5) S5で、仮想サーバ構成変更システム43は、リカバリ(起動)対象の仮想サーバ(30)が有る場合はS3へ戻り同様に繰り返し、無い場合は終了する。   (S5) In S5, the virtual server configuration changing system 43 returns to S3 if there is a virtual server (30) to be recovered (started) and repeats the same, and ends if there is no virtual server (30).

[具体例(1)]
上記処理に関して、以下、図6のようにデータセンタA(10A)にて災害が発生した場合のサーバの例で説明する。本具体例に対応して、図6は、被災に伴い各データセンタ10でサーバ30を起動後のシステム構成を示す。図7は、正常稼働時(被災前)の各拠点(10)のリソース使用状況、図8は、被災後(構成変更後)の各拠点(10)のリソース使用状況を示している。
[Specific example (1)]
The above processing will be described below with reference to an example of a server when a disaster occurs in the data center A (10A) as shown in FIG. Corresponding to this specific example, FIG. 6 shows a system configuration after starting the server 30 in each data center 10 due to the disaster. FIG. 7 shows the resource usage status of each site (10) during normal operation (before the disaster), and FIG. 8 shows the resource usage status of each site (10) after the disaster (after the configuration change).

データセンタAでの災害発生を検知した監視サーバ41は、仮想サーバ構成変更システム43に災害発生を通知する。仮想サーバ構成変更システム43は、広域分散リソース管理システム42のデータセンタのリソース使用状況テーブル(T1a,図2)とサーバのリソース使用状況テーブル(T1b,図3)から、データセンタAのシステムA(20A)を構成する全てのサーバ30(30A,30B)を起動することができるデータセンタ10を検索する。システムAのリソース使用量は、例えば図2,図3,図7に示すように、CPUが4GHz、メモリが5GB、ディスクが400GBである。また、データセンタB(10B)のリソースの空きは、CPUが3GHz、メモリが4GB、ディスクが300GBであり、データセンタC(10C)のリソースの空きは、CPUが3GHz、メモリが3GB、ディスクが900GBである。即ち、システムA(全サーバ)を起動するのに十分な空きリソースが有る1つのデータセンタは存在しないため、システムAを構成するサーバ30(30A,30B)を、データセンタBとデータセンタCとに分散配置することになる。   The monitoring server 41 that has detected the occurrence of a disaster in the data center A notifies the virtual server configuration change system 43 of the occurrence of the disaster. The virtual server configuration change system 43 uses the data center resource usage status table (T1a, FIG. 2) of the wide area distributed resource management system 42 and the server resource usage status table (T1b, FIG. 3) to determine the system A ( The data center 10 that can start all the servers 30 (30A, 30B) constituting the server 20A) is searched. The resource usage of the system A is 4 GHz for the CPU, 5 GB for the memory, and 400 GB for the disk as shown in FIGS. In addition, the resource free space of the data center B (10B) is 3 GHz for the CPU, the memory is 4 GB, and the disk is 300 GB. The free space of the data center C (10C) is 3 GHz for the CPU, the memory is 3 GB, and the disk is free. 900GB. That is, since there is no one data center having sufficient free resources to start up the system A (all servers), the servers 30 (30A, 30B) constituting the system A are connected to the data center B and the data center C. Will be distributed.

仮想サーバ構成変更システム43は、システムAを構成するサーバ30(30A,30B)で回線速度の優先度が一番大きいサーバAから、起動先のデータセンタ10を決定する。先ほどと同様に、広域分散リソース管理システム42のデータセンタのリソース使用状況テーブル(T1a)とサーバのリソース使用状況テーブル(T1b)から、空きリソースを検索する。サーバAのリソース使用量は、CPUが2GHz、メモリが3GB、ディスクが200GBであり、データセンタB、データセンタCともに、サーバAを起動するのに十分なリソースが存在する。よって、回線速度が大きいデータセンタCでサーバAを起動する。サーバBのリソース使用量は、CPUが2GHz、メモリが2GB、ディスクが200GBである。データセンタCはサーバAを起動したため、リソースの空きは、CPUが1GHz、メモリが2GB、ディスクが200GBとなり、サーバBを起動することはできない。サーバBを起動するのに十分なリソースが存在するのはデータセンタBのみであるため、データセンタBでサーバBを起動する。   The virtual server configuration change system 43 determines the data center 10 to be activated from the server A having the highest line speed priority among the servers 30 (30A, 30B) constituting the system A. In the same manner as before, a free resource is searched from the resource usage table (T1a) of the data center and the resource usage table (T1b) of the server of the wide area distributed resource management system 42. The resource usage of the server A is 2 GHz for the CPU, 3 GB for the memory, and 200 GB for the disk. Both the data center B and the data center C have sufficient resources to start the server A. Therefore, the server A is activated at the data center C having a high line speed. The resource usage of the server B is 2 GHz for the CPU, 2 GB for the memory, and 200 GB for the disk. Since the data center C has activated the server A, the available resources are 1 GHz for the CPU, 2 GB for the memory, and 200 GB for the disk, and the server B cannot be activated. Since only the data center B has sufficient resources to start the server B, the server B is started in the data center B.

[仮想サーバ構成変更(復旧時)]
また、監視サーバ41でデータセンタ10(例えば10A)の災害復旧を検知した場合、仮想サーバ構成変更システム43は、前述の分散して配置されているシステム20(サーバ30)を検索し、当該システム20(サーバ30)を、復旧したデータセンタ(10A)で起動させる。
[Change virtual server configuration (at recovery)]
When the monitoring server 41 detects a disaster recovery of the data center 10 (for example, 10A), the virtual server configuration change system 43 searches the system 20 (server 30) arranged in a distributed manner, and the system 20 (server 30) is activated in the restored data center (10A).

図9は、災害復旧直後の各データセンタのリソース使用状況テーブル(T1a)を示す(図2の状態からの変化後)。   FIG. 9 shows a resource usage table (T1a) of each data center immediately after disaster recovery (after change from the state of FIG. 2).

図10は、災害復旧直後の各サーバのリソース使用状況テーブル(T1b)を示す(図3の状態からの変化後)。   FIG. 10 shows the resource usage table (T1b) of each server immediately after the disaster recovery (after change from the state of FIG. 3).

図11は、仮想サーバ構成変更システム43での復旧したデータセンタ(10A)で起動するサーバ30の決定方法を示す処理フローである。   FIG. 11 is a processing flow showing a method of determining the server 30 to be started up in the restored data center (10A) in the virtual server configuration changing system 43.

(S11) まず、仮想サーバ構成変更システム43は、広域分散リソース管理システム42の処理(T1)をもとに、複数のデータセンタ10に分散して配置されているシステム20のサーバ30が存在しないかどうかを検索する(例えば30A,30Bが存在する)。   (S11) First, the virtual server configuration change system 43 does not include the servers 30 of the system 20 that are distributed and arranged in a plurality of data centers 10 based on the processing (T1) of the wide area distributed resource management system 42. (For example, 30A and 30B exist).

(S12) 上記存在する場合(S11−Y)は、43は、復旧したデータセンタ10(10A)で、上記分散配置されているシステム20を構成する全てのサーバ30(30A,30B)を起動することができるかどうか確認する。   (S12) If it exists (S11-Y), 43 is the restored data center 10 (10A), and activates all the servers 30 (30A, 30B) constituting the distributed system 20. Check if you can.

(S13) 上記起動が可能な場合(S12−Y)は、対応する起動を実行する(運用基盤システム40から該当のデータセンタ10へ起動を指示する)。   (S13) When the above-described activation is possible (S12-Y), the corresponding activation is executed (instruction for activation from the operation infrastructure system 40 to the corresponding data center 10).

[具体例]
上記処理に関して、以下、データセンタA(10A)にて復旧した場合(図6)の例で説明する。データセンタAの復旧を検知した監視サーバ41は、仮想サーバ構成変更システム43に通知する。仮想サーバ構成変更システム43は、広域分散リソース管理システム42の図9のデータセンタのリソース使用状況テーブル(T1a)と図10のサーバのリソース使用状況テーブル(T1b)から、分散配置されているシステム20(サーバ330)を検索すると、システムA(20A)が合致する。続いて、復旧したデータセンタAにてシステムAを起動すること可能か確認する。復旧したデータセンタAのリソースの空きは、CPUが8GHz、メモリが8GB、ディスクが800GBであり、システムAのリソース使用量は、CPUが4GHz、メモリが5GB、ディスクが400GBである。よって、データセンタAには、システムAを起動するのに十分なリソースが存在するため、データセンタCで起動しているサーバAと、データセンタBで起動しているサーバBを停止して、データセンタAでそれらサーバAとサーバBを起動させる。
[Concrete example]
The above processing will be described below using an example in the case where data center A (10A) is restored (FIG. 6). The monitoring server 41 that has detected the recovery of the data center A notifies the virtual server configuration change system 43. The virtual server configuration change system 43 is distributed from the resource usage table (T1a) of the data center in FIG. 9 of the wide area distributed resource management system 42 and the resource usage table (T1b) of the server in FIG. When searching (server 330), system A (20A) matches. Subsequently, it is confirmed whether the system A can be activated in the restored data center A. The resource vacancy in the restored data center A is 8 GHz for the CPU, 8 GB for the memory, and 800 GB for the disk. The resource usage of the system A is 4 GHz for the CPU, 5 GB for the memory, and 400 GB for the disk. Therefore, since there are sufficient resources in the data center A to start the system A, the server A running in the data center C and the server B running in the data center B are stopped, The server A and the server B are activated at the data center A.

[効果等]
以上説明したように、本実施の形態のシステムによれば、仮想サーバ(30)で構成されるシステム20を含むデータセンタ10(拠点)に関する仮想サーバ(30)のリソース使用状況のリモート参照機能やシステム構成変更機能などを持つシステム(運用基盤システム40)により、システム20の広域負荷分散、及び適切なリソース配置による構成変更が可能である。これにより例えばあるデータセンタ10での大規模な災害発生時にも当該データセンタ10のサービスを他のデータセンタ10へ移動(集約配置または分散配置)できるので、当該データセンタ10のサービスの停止時間を少なくすることができる。例えばコンテナ型データセンタを複数の拠点(地域)に分散して配置した場合、状況に応じてリソースを配分することが可能である。特に、本実施の形態では、前記図5のS3,S4のように、回線速度を考慮して移動先(配置)を決定するという特徴を有する。
[Effects]
As described above, according to the system of the present embodiment, the remote reference function of the resource usage status of the virtual server (30) related to the data center 10 (base) including the system 20 composed of the virtual server (30) A system having a system configuration change function (operation infrastructure system 40) can change the configuration of the system 20 by wide-area load distribution and appropriate resource arrangement. Thereby, for example, even when a large-scale disaster occurs in a certain data center 10, the service of the data center 10 can be moved to another data center 10 (aggregated arrangement or distributed arrangement). Can be reduced. For example, when container type data centers are distributed and arranged in a plurality of bases (regions), resources can be allocated according to the situation. In particular, the present embodiment has a feature that the destination (arrangement) is determined in consideration of the line speed as in S3 and S4 of FIG.

以上、本発明者によってなされた発明を実施の形態に基づき具体的に説明したが、本発明は前記実施の形態に限定されるものではなく、その要旨を逸脱しない範囲で種々変更可能であることは言うまでもない。   As mentioned above, the invention made by the present inventor has been specifically described based on the embodiment. However, the present invention is not limited to the embodiment, and various modifications can be made without departing from the scope of the invention. Needless to say.

本発明は、データセンタのアウトソーシングサービス、仮想サーバを利用したディザスタリカバリサービスの共通基盤などに利用可能である。   The present invention can be used as a common base for data center outsourcing services and disaster recovery services using virtual servers.

10…データセンタ、20…システム、30…サーバ(仮想サーバ)、40…運用基盤システム、41…監視サーバ、42…広域分散リソース管理システム、43…仮想サーバ構成変更システム、T1…リソース使用状況テーブル、T2…サーバ移動ポリシーテーブル。   DESCRIPTION OF SYMBOLS 10 ... Data center, 20 ... System, 30 ... Server (virtual server), 40 ... Operation infrastructure system, 41 ... Monitoring server, 42 ... Wide area distributed resource management system, 43 ... Virtual server configuration change system, T1 ... Resource usage status table , T2 ... Server movement policy table.

Claims (3)

複数のデータセンタ、そのシステム、及びその仮想サーバを対象として管理する運用基盤システムを含んで成る広域分散構成変更システムであって、
前記システムを構成する1つ以上の仮想サーバは1つ以上のデータセンタに配置され、
前記運用基盤システムは、
前記複数の各々のデータセンタのシステムの仮想サーバの状態を監視する処理を行う監視部と、
前記複数の各々のデータセンタのシステムの仮想サーバのリソース使用状況を第1のテーブルに管理する処理を行う広域分散リソース管理部と、
前記複数の各々のデータセンタのシステムの仮想サーバに関する構成変更の処理を行う構成変更部と、を有し、
前記第1のテーブルは、各データセンタのリソースの使用量と空き容量と回線速度と、各システムの各仮想サーバのリソースの使用量とを管理し、
前記監視部により第1のデータセンタの利用不可の状態を検知した時、
前記広域分散リソース管理部による前記リソースの使用状況の参照に基づいて、
前記構成変更部により、前記第1のデータセンタのシステムの仮想サーバについて、移動先とする、1つ以上のデータセンタを検索して決定し、当該移動先のデータセンタで当該第1のデータセンタのシステムの仮想サーバを起動させる処理を行い、
前記構成変更部は、前記仮想サーバと前記データセンタの回線速度の優先度との対応関係が設定された第2のテーブルを管理し、
前記構成変更部により、前記仮想サーバの移動先とする1つ以上のデータセンタを検索して決定する際に、前記第2のテーブルを参照し、当該仮想サーバに対応関係が付けられた前記データセンタの回線速度の優先度が高い仮想サーバから順に候補のデータセンタを検索し、当該候補のデータセンタのリソース使用状況で当該仮想サーバを稼動させる空きがあり回線速度が一番大きいデータセンタを移動先として選択すること、を特徴とする広域分散構成変更システム。
A wide-area distributed configuration change system including an operation infrastructure system that manages a plurality of data centers, their systems, and their virtual servers,
One or more virtual servers constituting the system are arranged in one or more data centers,
The operational infrastructure system is:
A monitoring unit that performs a process of monitoring a status of a virtual server of each of the plurality of data center systems;
A wide-area distributed resource management unit that performs processing for managing a resource usage status of a virtual server of each of the plurality of data center systems in a first table;
A configuration change unit that performs a configuration change process related to a virtual server of each of the plurality of data center systems,
The first table manages the resource usage, free capacity, line speed, and resource usage of each virtual server of each system in each data center;
When the monitoring unit detects that the first data center is unavailable,
Based on the resource usage status reference by the wide area distributed resource management unit,
The configuration changing unit searches and determines one or more data centers as a migration destination for the virtual server of the first data center system, and the first data center at the migration destination data center. There line processing to start the virtual server of the system,
The configuration change unit manages a second table in which a correspondence relationship between the virtual server and the priority of the line speed of the data center is set,
When the configuration changing unit searches for and determines one or more data centers to which the virtual server is to be moved, the data with which the virtual server is associated with reference to the second table Search for candidate data centers in order from the virtual server with the highest line speed of the center, and move to the data center with the highest line speed that has the space to operate the virtual server according to the resource usage status of the candidate data center. A wide-area distributed configuration change system characterized by selecting as a destination .
請求項1記載の広域分散構成変更システムにおいて、
記監視部により第1のデータセンタの災害発生を検知した時、
前記広域分散リソース管理部による前記リソースの空き容量と回線速度とに基づいて、
前記構成変更部により、前記第1のデータセンタのシステムの仮想サーバについて、移動先とする、1つ以上のデータセンタを検索して決定し、当該移動先のデータセンタで当該第1のデータセンタのシステムの仮想サーバを起動させる処理を行うこと、を特徴とする広域分散構成変更システム。
The wide-area distributed configuration change system according to claim 1,
When a disaster of the first data center is detected by the pre-Symbol monitoring unit,
Based on the free space and line speed of the resource by the wide area distributed resource management unit,
The configuration changing unit searches and determines one or more data centers as a migration destination for the virtual server of the first data center system, and the first data center at the migration destination data center. A wide-area distributed configuration change system, characterized in that a process of starting a virtual server of the system is performed.
請求項1記載の広域分散構成変更システムにおいて、
前記構成変更部により、前記第1のデータセンタのシステムの仮想サーバについて、移動先とする、1つ以上のデータセンタを検索して決定する際、前記リソース使用状況に基づき、前記システムを構成するすべての仮想サーバが起動可能な1つのデータセンタが有る場合は、当該1つのデータセンタに集約し、無い場合は、複数のデータセンタに分散し、当該複数のデータセンタとしてはリソース空き容量があり回線速度が大きいデータセンタを選択すること、を特徴とする広域分散構成変更システム。
The wide-area distributed configuration change system according to claim 1,
When the configuration changing unit searches and determines one or more data centers to be moved to the virtual server of the system of the first data center, the system is configured based on the resource usage status. When there is one data center that can start all virtual servers, it is aggregated into the one data center, and when there is no data center, it is distributed to a plurality of data centers, and the plurality of data centers have free resources. A wide-area distributed configuration change system characterized by selecting a data center having a high line speed.
JP2011265417A 2011-12-05 2011-12-05 Wide-area distributed configuration change system Expired - Fee Related JP5632820B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011265417A JP5632820B2 (en) 2011-12-05 2011-12-05 Wide-area distributed configuration change system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011265417A JP5632820B2 (en) 2011-12-05 2011-12-05 Wide-area distributed configuration change system

Publications (2)

Publication Number Publication Date
JP2013117889A JP2013117889A (en) 2013-06-13
JP5632820B2 true JP5632820B2 (en) 2014-11-26

Family

ID=48712399

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011265417A Expired - Fee Related JP5632820B2 (en) 2011-12-05 2011-12-05 Wide-area distributed configuration change system

Country Status (1)

Country Link
JP (1) JP5632820B2 (en)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015007901A (en) * 2013-06-25 2015-01-15 株式会社ゲットワークス Backup method, and container with built-in server
JP5949684B2 (en) * 2013-07-12 2016-07-13 日本電気株式会社 Inter-base service management system, management server, management method and management program
JP6413517B2 (en) * 2014-09-04 2018-10-31 富士通株式会社 Management device, migration control program, information processing system
JP6540072B2 (en) * 2015-02-16 2019-07-10 富士通株式会社 Management device, information processing system and management program
JP2017187813A (en) * 2015-02-24 2017-10-12 株式会社野村総合研究所 Operation state display system

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4609380B2 (en) * 2006-05-31 2011-01-12 日本電気株式会社 Virtual server management system and method, and management server device
JP5056346B2 (en) * 2007-10-29 2012-10-24 日本電気株式会社 Information processing apparatus, information processing system, virtual server movement processing control method, and program
JP5286135B2 (en) * 2009-03-31 2013-09-11 富士通エフ・アイ・ピー株式会社 Computer function disaster response migration system and method, computer program for executing the method, and storage medium storing the computer program

Also Published As

Publication number Publication date
JP2013117889A (en) 2013-06-13

Similar Documents

Publication Publication Date Title
US10509680B2 (en) Methods, systems and apparatus to perform a workflow in a software defined data center
US10609159B2 (en) Providing higher workload resiliency in clustered systems based on health heuristics
US7992032B2 (en) Cluster system and failover method for cluster system
JP6616827B2 (en) Scalable data storage pool
US9450700B1 (en) Efficient network fleet monitoring
US9329909B1 (en) Dynamically modifying a cluster of computing nodes used for distributed execution of a program
US8321558B1 (en) Dynamically monitoring and modifying distributed execution of programs
JP6079226B2 (en) Information processing apparatus, server management method, and server management program
JP6186787B2 (en) Data transfer device, data transfer system, data transfer method and program
US20120047394A1 (en) High-availability computer cluster with failover support based on a resource map
WO2014084922A1 (en) High availability for cloud servers
US9448615B2 (en) Managing power savings in a high availability system at a redundant component level of granularity
JP5632820B2 (en) Wide-area distributed configuration change system
US20190317824A1 (en) Deployment of services across clusters of nodes
US20140025909A1 (en) Large scale storage system
CN108369544A (en) The server delayed in computing system restores
JP2008217285A (en) Operation management apparatus and operation management method for information processing system
JP6123626B2 (en) Process resumption method, process resumption program, and information processing system
JP5998577B2 (en) Cluster monitoring apparatus, cluster monitoring method, and program
US9148430B2 (en) Method of managing usage rights in a share group of servers
CN111580753B (en) Storage volume cascade system, batch job processing system and electronic equipment
US10855521B2 (en) Efficient replacement of clients running large scale applications
US10365934B1 (en) Determining and reporting impaired conditions in a multi-tenant web services environment
CN108153484B (en) Shared storage system in virtualization environment and management method thereof
Astrova et al. Offering Hadoop as a cloud service

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140326

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140507

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140704

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140916

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20141010

R150 Certificate of patent or registration of utility model

Ref document number: 5632820

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees