JP5551967B2 - Cluster system, cluster system scale-out method, resource manager device, server device - Google Patents

Cluster system, cluster system scale-out method, resource manager device, server device Download PDF

Info

Publication number
JP5551967B2
JP5551967B2 JP2010119499A JP2010119499A JP5551967B2 JP 5551967 B2 JP5551967 B2 JP 5551967B2 JP 2010119499 A JP2010119499 A JP 2010119499A JP 2010119499 A JP2010119499 A JP 2010119499A JP 5551967 B2 JP5551967 B2 JP 5551967B2
Authority
JP
Japan
Prior art keywords
server
servers
scale
software
cluster system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010119499A
Other languages
Japanese (ja)
Other versions
JP2011248521A (en
Inventor
豪生 西村
道生 入江
雅志 金子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2010119499A priority Critical patent/JP5551967B2/en
Publication of JP2011248521A publication Critical patent/JP2011248521A/en
Application granted granted Critical
Publication of JP5551967B2 publication Critical patent/JP5551967B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Hardware Redundancy (AREA)
  • Computer And Data Communications (AREA)

Description

本発明は、通信サービスなどを提供する高可用クラスタシステム、クラスタシステムのスケールアウト方法、リソースマネージャ装置、サーバ装置に関する。   The present invention relates to a highly available cluster system that provides communication services, a cluster system scale-out method, a resource manager device, and a server device.

近年、インターネットにおいてはサービスの多様化が顕著である。また、新サービスは、利用者数を事前に明確に把握することが困難であるため、最初に小規模のサーバを用いてサービス提供を開始(スモールスタート)し、利用者の増加に応じてサーバを増強していくことがコスト面で有効である。   In recent years, service diversification has been remarkable on the Internet. In addition, since it is difficult to clearly grasp the number of users in advance, the new service starts service provision (small start) using a small server first, and the server increases as the number of users increases. It is effective in terms of cost to increase the power.

また、近年ではサーバ増強の手段として、ハードウェアをより強力なものに交換するのではなく、同じ処理を行うサーバを追加(スケールアウト)し、複数のサーバが並列動作するクラスタによって処理を行うことが一般的となりつつある。   Also, in recent years, as a means of augmenting servers, instead of replacing hardware with more powerful ones, adding servers that perform the same processing (scaling out) and performing processing in clusters in which multiple servers operate in parallel Is becoming common.

ただし、利用者数の増加時に速やかにスケールアウトを行うためには、稼働していない予備のサーバを常に待機させておく必要がある。そのような常に使用していない待機サーバを個々のサービス提供事業者が用意するのはコストが高い。   However, in order to quickly scale out when the number of users increases, it is necessary to always keep a standby server that is not operating in standby. It is costly for each service provider to prepare such a standby server that is not always used.

そこで、近年ではデータセンターのようなサーバ管理事業者が一括してサーバを管理し、サービス提供事業者をホスティングするIaaS(Infrastructure as a Service)などと呼ばれる形態が一般化している(非特許文献1)。IaaSでは、個々のサービス提供事業者にとって、サーバのハードウェアメンテナンスが不要なだけでなく、複数のサービス提供事業者が待機サーバを共有することにより、サーバ設備維持費の低減が期待できる。   Thus, in recent years, a form called IaaS (Infrastructure as a Service) or the like in which a server management company such as a data center collectively manages servers and hosts service providers has become common (Non-patent Document 1). ). In IaaS, not only hardware maintenance of a server is unnecessary for each service provider, but also a reduction in server facility maintenance costs can be expected by sharing a standby server among a plurality of service providers.

一方、近年では設備維持コスト低減を目的として通信網のIP化が進んでおり、従来の交換機のような専用ハードウェアではなく、汎用サーバを用いて通信ネットワーク・通信サービスを実現することが一般化している。また、通信サービスにおいてもサービスは多様化しているため、新サービスをスモールスタートし、利用者の拡大に応じてサーバ数をスケールアウトすることにより、設備コストを低減したいという要求がある。そのような要求に対して、各サービスをスモールスタートし、あるサービスの利用者拡大時に、余剰待機資源が集約されたリソースプールから必要なサーバを獲得し、スケールアウトを行う構成の適用が考えられる。   On the other hand, in recent years, IP of communication networks has been promoted for the purpose of reducing equipment maintenance costs, and it has become common to implement communication networks and communication services using general-purpose servers instead of dedicated hardware like conventional exchanges. ing. In addition, as communication services are diversified, there is a demand to reduce equipment costs by starting small new services and scaling out the number of servers according to the expansion of users. In response to such a request, it is possible to apply a configuration in which each service is started in a small manner, and when a user of a certain service is expanded, a necessary server is acquired from a resource pool in which surplus standby resources are aggregated and scaled out. .

Amazon Elastic Compute Cloud (Amazon EC2), http://aws.amazon.com/ec2/.Amazon Elastic Compute Cloud (Amazon EC2), http://aws.amazon.com/ec2/.

上述のような、個々のサービスにおけるスケールアウト時に、余剰資源が集約された共用のリソースプールからサーバを取得する構成においては、リソースプール内に保持されているサーバは共用であり、どのようなソフトウェア構成を取るかが事前にわからないため、ソフトウェアを何も有していない状態であることが一般的である。よって、スケールアウト時にサーバを取得した後、個々のサービスに対応したソフトウェア構成が含まれたソフトウェアイメージを、イメージを管理しているリポジトリからそのサーバに転送し、必要な設定を行ってクラスタに組み込む必要がある。   In a configuration in which a server is acquired from a shared resource pool in which surplus resources are aggregated at the time of scale-out of individual services as described above, the server held in the resource pool is shared, and what software Since it is not known in advance whether to take the configuration, it is common to have no software. Therefore, after acquiring the server at scale-out, transfer the software image containing the software configuration corresponding to each service from the repository that manages the image to the server, make the necessary settings, and incorporate it into the cluster There is a need.

ソフトウェアイメージはオペレーティングシステムや各種ミドルウェア、データ等を全て含んでいるため数〜数十GBに及ぶ大容量であり、転送にはある程度の時間を要する。複数のサービスを同時にスケールアウトするような場合、イメージを管理しているリポジトリがボトルネックとなり、さらにスケールアウト時間が増大するため、インフラとして公共性の高い通信サービスに求められる無停止性・即応性を満たすことができない。   Since the software image includes all of the operating system, various middleware, data, and the like, the software image has a large capacity ranging from several to several tens of GB, and transfer requires a certain amount of time. When multiple services are scaled out at the same time, the repository that manages the image becomes a bottleneck, and the scale-out time increases. Therefore, non-stop and responsiveness required for highly public communication services as infrastructure Can't meet.

上述の課題を鑑み、本発明の目的は、スケールアウト時のソフトウェアイメージ転送の負荷を軽減できるようにしたクラスタシステム、クラスタシステムのスケールアウト方法、リソースマネージャ装置、サーバ装置を提供することを目的とする。   In view of the above-described problems, an object of the present invention is to provide a cluster system, a cluster system scale-out method, a resource manager device, and a server device that can reduce the load of software image transfer during scale-out. To do.

上述の課題を解決するために、本発明に係るクラスタシステムは、サービスを提供する複数のサーバと、複数のサーバを管理するリソースマネージャとからなるクラスタシステムにおいて、リソースマネージャは、所定のサービスを行うためのサーバを追加するスケールアウトの要求があると、複数のサーバの中から待機状態にあるサーバをスケールアウトを行うサーバとして選出すると共に、複数のサーバの中で所定のサービスを既に作動している複数のサーバに対して所定のサービスのソフトウェアイメージの断片の転送を指示する手段を有し、ソフトウェアの転送を指示された複数のサーバは、所定のサービスのソフトウェアイメージの断片をスケールアウトを行うサーバとして選出されたサーバに転送する手段を有し、スケールアウトを行うサーバとして選出されたサーバは、ソフトウェアの転送を指示された複数のサーバから転送されてきた所定のサービスのソフトウェアイメージを受信して保存する手段を有することを特徴とする。 In order to solve the above-described problems, a cluster system according to the present invention is a cluster system including a plurality of servers that provide services and a resource manager that manages the plurality of servers. The resource manager performs a predetermined service. If there is a request for scale-out to add a server, a server in a standby state is selected as a server to be scaled out from among a plurality of servers, and a predetermined service is already activated in the plurality of servers. Means for instructing a plurality of servers to transfer software image fragments of a predetermined service, and the plurality of servers instructed to transfer software scale out software image fragments of a predetermined service A means for transferring to a server elected as the server, Server elected as a server for performing is characterized in that it comprises means for receiving and storing software image for a given service that has been transferred from a plurality of servers are instructed to transfer the software.

本発明に係るクラスタシステムのスケールアウト方法は、サービスを提供する複数のサーバと、複数のサーバを管理するリソースマネージャとからなるクラスタシステムのスケールアウト方法において、所定のサービスを行うためのサーバを追加するスケールアウトの要求があると、リソースマネージャが、複数のサーバの中から待機状態にあるサーバをスケールアウトを行うサーバとして選出すると共に、複数のサーバの中で所定のサービスを既に作動している複数のサーバに対して所定のサービスのソフトウェアイメージの断片の転送を指示する工程と、ソフトウェアの転送を指示された複数のサーバが、所定のサービスのソフトウェアイメージの断片をスケールアウトを行うサーバに転送する工程と、スケールアウトを行うサーバが、ソフトウェアの転送を指示された複数のサーバから転送されてきた所定のサービスのソフトウェアイメージを受信して保存する工程とを含むことを特徴とする。 The cluster system scale-out method according to the present invention adds a server for performing a predetermined service in the cluster system scale-out method including a plurality of servers providing services and a resource manager managing the plurality of servers. When a scale-out request is made, the resource manager selects a server in a standby state from a plurality of servers as a server to be scaled out, and a predetermined service is already operating in the plurality of servers. Instructing a plurality of servers to transfer software image fragments of a predetermined service, and a plurality of servers instructed to transfer software transfer software image fragments of a predetermined service to a server that performs scale-out And the server that performs the scale-out, Characterized in that it comprises a step of receiving and storing software image for a given service transferred from software plurality of servers that are instructed to transfer.

本発明に係るリソースマネージャ装置は、サービスを提供する複数のサーバと、複数のサーバを管理するリソースマネージャとからクラスタシステムを構成するためのリソースマネージャ装置において、サービス実行に必要なソフトウェアイメージを管理する手段と、複数のサーバの稼働状態を監視する手段と、所定のサービスを行うためのサーバを追加するスケールアウトの要求があると、複数のサーバの中から待機状態にあるサーバをスケールアウトを行うサーバとして選出すると共に、複数のサーバの中で所定のサービスを既に作動している複数のサーバに対して、スケールアウトを行うサーバに所定のサービスのソフトウェアイメージの断片を転送することを要求する手段とを備えることを特徴とする。 A resource manager device according to the present invention manages a software image necessary for service execution in a resource manager device for configuring a cluster system from a plurality of servers that provide services and a resource manager that manages the plurality of servers. If there is a scale-out request for adding a means, a means for monitoring the operating status of a plurality of servers, and a server for performing a predetermined service, the server in a standby state is scaled out from the plurality of servers. Means for selecting a server and requesting a plurality of servers already operating a predetermined service among the plurality of servers to transfer a piece of software image of the predetermined service to a server performing scale-out It is characterized by providing.

本発明に係るサーバ装置は、サービスを提供する複数のサーバと、複数のサーバを管理するリソースマネージャとからクラスタシステムを構成するためのサーバ装置において、ソフトウェアイメージの断片の転送及び取得を行う手段と、ソフトウェアイメージの格納手段と、個別設定情報の格納手段とを備え、他のサーバがスケールアウトを行うサーバとして設定されると、リソースマネージャの指示により、ソフトウェアイメージの格納手段に格納されているソフトウェアイメージの断片をスケールアウトを行うサーバに転送し、当該サーバがスケールアウトを行うサーバとして選定されると、既に所定のサービスを作動している他の複数のサーバから転送されてくるソフトウェアイメージを取得し、ソフトウェアイメージの格納手段に格納することを特徴とする。 A server device according to the present invention includes a means for transferring and acquiring software image fragments in a server device for configuring a cluster system from a plurality of servers that provide services and a resource manager that manages the plurality of servers. The software image storage means and the individual setting information storage means, and when the other server is set as a scale-out server, the software stored in the software image storage means according to the instruction of the resource manager transfer the pieces of image server for scale-out, when the server is selected as the server for scale-out, already acquired the software images transferred from a plurality of other servers are operating a predetermined service As a software image storage means. Characterized in that it.

本発明によれば、スケールアウト時に、既に稼働中の現用中のサーバが使用しているソフトウェアイメージが新規にスケールアウトを行うサーバに転送され、新規にスケールアウトを行うサーバの固有の設定が行われる。また、新規にスケールアウトを行うサーバには、クラスタを構成する複数のサーバからソフトウェアイメージが一部ずつ転送される。このため、特定の現用中サーバに転送負荷が集中することがなくなり、高速にスケールアウトすることが可能となる。   According to the present invention, at the time of scale-out, a software image used by an active server that is already in operation is transferred to a new scale-out server, and a unique setting of the new scale-out server is performed. Is called. In addition, a software image is partially transferred from a plurality of servers constituting the cluster to a new scale-out server. For this reason, the transfer load is not concentrated on a specific active server, and it is possible to scale out at high speed.

本発明の第1の実施形態に係るクラスタシステムの全体構成を示すブロック図である。1 is a block diagram illustrating an overall configuration of a cluster system according to a first embodiment of the present invention. ソフトウェアイメージの管理情報テーブルの構成の説明図である。It is explanatory drawing of a structure of the management information table of a software image. 本発明の第1の実施形態に係るクラスタシステムにおいてサービスが起動していないときのシステムの説明図である。It is explanatory drawing of a system when the service has not started in the cluster system which concerns on the 1st Embodiment of this invention. 本発明の第1の実施形態に係るクラスタシステムにおいてサービスが起動していないときのサーバ状態監視機能部のサーバ状態の説明図である。It is explanatory drawing of the server state of the server state monitoring function part when the service has not started in the cluster system which concerns on the 1st Embodiment of this invention. 本発明の第1の実施形態に係るクラスタシステムにおいてサービス「A」を起動するときの説明に用いるシーケンス図である。It is a sequence diagram used for description when starting service "A" in the cluster system which concerns on the 1st Embodiment of this invention. 本発明の第1の実施形態に係るクラスタシステムにおいてサービス「A」を起動したときのサーバ状態監視機能部のサーバ状態の説明図である。It is explanatory drawing of the server state of the server state monitoring function part when service "A" is started in the cluster system which concerns on the 1st Embodiment of this invention. 本発明の第1の実施形態に係るクラスタシステムにおいてサービス「B」を起動するときの説明に用いるシーケンス図である。It is a sequence diagram used for description when starting service "B" in the cluster system which concerns on the 1st Embodiment of this invention. 本発明の第1の実施形態に係るクラスタシステムにおいてサービス「B」を起動したときのシステムの説明図である。It is explanatory drawing of a system when service "B" is started in the cluster system which concerns on the 1st Embodiment of this invention. 本発明の第1の実施形態に係るクラスタシステムにおいてサービス「B」を起動したときのサーバ状態監視機能部のサーバ状態の説明図である。It is explanatory drawing of the server state of a server state monitoring function part when service "B" is started in the cluster system which concerns on the 1st Embodiment of this invention. 本発明の第1の実施形態に係るクラスタシステムにおいてサービス「B」をスケールアウトするときの説明に用いるシーケンス図である。FIG. 7 is a sequence diagram used for explanation when a service “B” is scaled out in the cluster system according to the first embodiment of the present invention. 本発明の第1の実施形態に係るクラスタシステムにおいてサービス「B」をスケールアウトしたときのシステムの説明図である。It is explanatory drawing of a system when the service "B" is scaled out in the cluster system which concerns on the 1st Embodiment of this invention. 本発明の第1の実施形態に係るクラスタシステムにおいてサービス「B」をスケールアウトしたときのサーバ状態監視機能部が持つサーバ状態の説明図である。It is explanatory drawing of the server state which the server state monitoring function part has when the service "B" is scaled out in the cluster system according to the first embodiment of the present invention.

以下、本発明の実施の形態について図面を参照しながら説明する。図1は、本発明の第1の実施形態に係るクラスタシステムの全体構成を示すブロック図である。   Hereinafter, embodiments of the present invention will be described with reference to the drawings. FIG. 1 is a block diagram showing the overall configuration of the cluster system according to the first embodiment of the present invention.

図1において、本発明の第1の実施形態に係るクラスタシステム102は、保守ネットワーク150によって保守者端末101と接続し、サービスネットワーク160によって利用者端末140と接続する。   In FIG. 1, the cluster system 102 according to the first embodiment of the present invention is connected to the maintenance person terminal 101 via the maintenance network 150 and is connected to the user terminal 140 via the service network 160.

サービス提供者は、クラスタシステム102に対する保守コマンドを、保守者端末101によって実施する。保守コマンドとしては、サービスを提供するためのサーバクラスタの構築や、スケールアウトによるクラスタの増強などが挙げられる。   The service provider executes a maintenance command for the cluster system 102 using the maintenance person terminal 101. Maintenance commands include building a server cluster to provide services and augmenting the cluster by scaling out.

ユーザは、利用者端末140を用い、クラスタシステム102上で提供されるサービスをサービスネットワーク160を介して利用する。クラスタシステム102は、計算資源が集約されているリソースプール120と、資源を管理する機能部であるリソースマネージャ103で構成され、両者は管理ネットワーク110によって接続される。リソースプール120は計算資源である複数のサーバ130によって構成される。   A user uses a service provided on the cluster system 102 via the service network 160 using the user terminal 140. The cluster system 102 includes a resource pool 120 in which calculation resources are aggregated, and a resource manager 103 that is a function unit for managing resources, and both are connected by a management network 110. The resource pool 120 is configured by a plurality of servers 130 that are computational resources.

次に、リソースマネージャ103の構成機能部について説明する。リソースマネージャ103は、管理インタフェース201と、ソフトウェアイメージ管理機能部202と、サーバ状態管理機能部203と、サーバ起動処理機能部204と、サーバ状態監視機能部205とから構成される。   Next, the configuration function unit of the resource manager 103 will be described. The resource manager 103 includes a management interface 201, a software image management function unit 202, a server state management function unit 203, a server activation processing function unit 204, and a server state monitoring function unit 205.

管理インタフェース201は、保守者端末101とのインタフェースを行い、保守者端末101からの保守コマンドを受け付けて、適切な処理を他の機能部と連携して実行する。ソフトウェアイメージは、サービスの提供に必要なソフトウェア構成を含んだファイルであり、サービス提供時にサーバ130に転送される。   The management interface 201 performs an interface with the maintenance person terminal 101, receives a maintenance command from the maintenance person terminal 101, and executes appropriate processing in cooperation with other function units. The software image is a file including a software configuration necessary for providing a service, and is transferred to the server 130 when the service is provided.

ソフトウェアイメージ管理機能部202は、所定のサービス実行に必要なソフトウェアイメージの種別、格納場所を管理する。図2にソフトウェアイメージ管理機能部202が持つソフトウェアイメージの管理情報テーブルの例を示す。ソフトウェアイメージは、サービス毎に一つ存在し、図2の例では、サービス「A」がイメージ「A」、サービス「B」がイメージ「B」を用いてサービスを開始する。また、イメージ「A」、イメージ「B」の格納場所は、リソースマネージャ103のファイルシステム上の”/path/to/imageDir”であることを示している。本実施形態では、格納場所はリソースマネージャ103上のディスク等を想定しているが、リソースマネージャ103からアクセス可能であれば、実際の格納場所は外部ストレージなどでもよい。   The software image management function unit 202 manages the type and storage location of a software image necessary for executing a predetermined service. FIG. 2 shows an example of a software image management information table held by the software image management function unit 202. One software image exists for each service. In the example of FIG. 2, the service “A” starts the service using the image “A”, and the service “B” uses the image “B”. Further, the storage location of the images “A” and “B” is “/ path / to / imageDir” on the file system of the resource manager 103. In this embodiment, the storage location is assumed to be a disk or the like on the resource manager 103. However, the actual storage location may be an external storage or the like as long as it can be accessed from the resource manager 103.

サーバ状態管理機能部203は、リソースプール120内の資源であるサーバ130が現在どのサービスの提供に用いられているか、などのサーバ130の状態情報を管理する。   The server state management function unit 203 manages state information of the server 130 such as which service the server 130 that is a resource in the resource pool 120 is currently used for.

サーバ起動処理機能部204は、サーバの起動要求があった場合、サーバ状態監視機能部205の情報を参照し、リソースプール120内のどのサーバ130を用いるかを決定すると共に、該当サーバ130に対してソフトウェアイメージ管理機能部202が管理するソフトウェアイメージを転送し、起動する機能を持つ。また、サーバ起動処理機能部204は、スケールアウトの要求があった場合、サーバ状態監視機能部205の情報を参照し、リソースプール120内のどのサーバ130をスケールアウトに用いるかを決定すると共に、同一のサービスを既に行っているサーバ130に、スケールアウトに用いるサーバ130に対してソフトウェアイメージの断片の転送を要求し、起動する機能を持つ。   When there is a server activation request, the server activation processing function unit 204 refers to the information of the server status monitoring function unit 205 to determine which server 130 in the resource pool 120 is to be used and The software image management function unit 202 has a function of transferring and starting a software image managed by the software image management function unit 202. In addition, when there is a scale-out request, the server activation processing function unit 204 refers to the information of the server state monitoring function unit 205 and determines which server 130 in the resource pool 120 is used for the scale-out. The server 130 having the same service has a function of requesting the server 130 used for scale-out to transfer a piece of software image and starting it.

サーバ状態監視機能部205は、常にリソースプール120内のサーバ130の状態を監視し、サーバ状態管理機能部203を更新する機能を持つ。図4、図6、図9、及び図12に、サーバ状態監視機能部205が持つサーバ状態の例を示す。図4では、サーバID「SV1」〜「SV6」の6つのサーバ130の状態は、全て待機中である。図6では、サーバIDが「SV1」、「SV2」のサーバ130がサービス「A」の実行中であり、他のサーバは、待機中である。図9では、サーバIDが「SV1」,「SV2」のサーバ130が「サービス「A」の実行中であり、サーバIDが「SV4」,「SV6」のサーバ130がサービス「B」の実行中であり、他のサーバは待機中である。図12では、サーバIDが「SV1」,「SV2」のサーバ130が「サービス「A」の実行中であり、サーバIDが「SV4」,「SV5」,「SV6」のサーバ130がサービス「B」の実行中であり、他のサーバは待機中である。   The server state monitoring function unit 205 has a function of constantly monitoring the state of the server 130 in the resource pool 120 and updating the server state management function unit 203. 4, 6, 9, and 12 show examples of server states that the server state monitoring function unit 205 has. In FIG. 4, the states of the six servers 130 with the server IDs “SV1” to “SV6” are all on standby. In FIG. 6, the server 130 with the server IDs “SV1” and “SV2” is executing the service “A”, and the other servers are waiting. In FIG. 9, the server 130 with server IDs “SV1” and “SV2” is executing “service“ A ”, and the server 130 with server IDs“ SV4 ”and“ SV6 ”is executing service“ B ”. And other servers are waiting. In FIG. 12, a server 130 with server IDs “SV1” and “SV2” is executing “service“ A ”, and a server 130 with server IDs“ SV4 ”,“ SV5 ”, and“ SV6 ”is service“ B ”. ”And other servers are waiting.

次に、リソースプール120内のサーバ130の構成機能部について述べる。サーバ130は、起動エージェント301と、ソフトウェアイメージ格納部302と、個別設定・データ格納部303と、計算処理機能部304とから構成される。   Next, the configuration function unit of the server 130 in the resource pool 120 will be described. The server 130 includes an activation agent 301, a software image storage unit 302, an individual setting / data storage unit 303, and a calculation processing function unit 304.

起動エージェント301は、リソースマネージャ103とサーバ130間の通信を行う。具体的には、サーバ起動処理機能部204からの起動指示を受け付けてソフトウェアイメージを取得する。また、サーバ状態監視機能部205からの状態問い合わせに対し、サーバ130上で実行中のサービス種別や待機中であることを伝える。また、サーバ起動処理機能部204からソフトウェアイメージの転送指示があると、他のサーバ130にソフトウェアイメージの断片を転送する。   The activation agent 301 performs communication between the resource manager 103 and the server 130. Specifically, it receives a start instruction from the server start processing function unit 204 and acquires a software image. Further, in response to the status inquiry from the server status monitoring function unit 205, the service type being executed on the server 130 or being in standby is notified. When a software image transfer instruction is issued from the server activation processing function unit 204, the software image fragment is transferred to another server 130.

ソフトウェアイメージ格納部302は、起動エージェント301が取得してきたソフトウェアイメージを格納する機能部である。ソフトウェアイメージは、サービス毎に存在するものであるが、サーバ130を起動してサービスを実行するために必要な設定情報は、個々のサーバ130毎に異なる場合がある。本システムでは、サーバ130個別の設定情報は取得したソフトウェアイメージを書き換えて保存するのではなく、個別設定・データ格納部303に格納する。また、サーバ130毎に違う出力を行うログ情報などのような個別データも、個別設定・データ格納部303に配置する。   The software image storage unit 302 is a functional unit that stores the software image acquired by the activation agent 301. The software image exists for each service, but the setting information necessary for starting the server 130 and executing the service may differ for each individual server 130. In this system, the setting information for each server 130 is stored in the individual setting / data storage unit 303 instead of rewriting and storing the acquired software image. Individual data such as log information that is output differently for each server 130 is also arranged in the individual setting / data storage unit 303.

計算処理機能部304は、通常の汎用サーバ130が持つCPU、主記憶などの演算装置であり、ソフトウェアイメージ格納部302と個別設定/データ格納部をディスクとしてシステムをブートし、サービス提供処理を行う。   The calculation processing function unit 304 is a calculation device such as a CPU or main memory of the normal general-purpose server 130, and boots the system using the software image storage unit 302 and the individual setting / data storage unit as disks to perform service providing processing. .

次に、本発明の第1の実施形態のクラスタシステム102の動作について説明する。図3は、6つのサーバ130(サーバID「SV1」〜「SV6」)から構成されるリソースプール120を持つクラスタシステム102において、サービスが何も起動していない状態を示す。クラスタシステム102において、サービスが何も起動していない状態では、サーバ状態監視機能部205が持つサーバ状態情報は、図4に示すように、サーバID「SV1」〜「SV6」の6つのサーバ130の状態は、全て待機中になっている。以下、この状態から、サービス「A」,サービス「B」が実行されている状態に遷移する際の処理について説明する。   Next, the operation of the cluster system 102 according to the first embodiment of this invention will be described. FIG. 3 shows a state in which no service is activated in the cluster system 102 having the resource pool 120 composed of six servers 130 (server IDs “SV1” to “SV6”). In the cluster system 102, when no service is activated, the server status information held by the server status monitoring function unit 205 includes six servers 130 having server IDs “SV1” to “SV6” as shown in FIG. All of the states are waiting. In the following, processing when transitioning from this state to a state in which service “A” and service “B” are being executed will be described.

図5は、6つのサーバ130(サーバID「SV1」〜「SV6」)が待機状態から、サービス「A」が実行されている状態に遷移するときの処理を示すシーケンス図である。   FIG. 5 is a sequence diagram showing processing when the six servers 130 (server IDs “SV1” to “SV6”) transition from the standby state to the state where the service “A” is being executed.

リソースマネージャ103は、保守者端末101から、管理インタフェース経由でサービス「A」のサーバ二台による起動要求を保守コマンドとして受け取ると(ステップS101)、サーバ起動処理機能部204がサーバ状態監視機能部205の情報を参照し、待機状態であるサーバ130を二つを選出する(ステップS102)。ここでは、サーバIDが「SV1」と「SV2」のサーバ130が選出されるとする。   When the resource manager 103 receives, from the maintenance person terminal 101, an activation request by the two servers of the service “A” via the management interface as a maintenance command (step S101), the server activation processing function unit 204 causes the server state monitoring function unit 205 to The two servers 130 that are in a standby state are selected (step S102). Here, it is assumed that servers 130 having server IDs “SV1” and “SV2” are selected.

サーバIDが「SV1」と「SV2」のサーバ130が選出されると、リソースマネージャ103のサーバ起動処理機能部204は、ソフトウェアイメージ管理機能部202からサービス「A」の実行に必要なソフトウェアイメージであるイメージ「A」を特定し、このイメージ「A」を、選出されたサーバ130(サーバID=SV1,SV2)の起動エージェント301に対して転送する(ステップS103a、S103b)。選出されたサーバ130(サーバID=SV1,SV2)上の起動エージェント301は、受信したイメージ「A」をソフトウェアイメージ格納部302に保存する(ステップS104a、S104b)。   When the servers 130 with the server IDs “SV1” and “SV2” are selected, the server activation processing function unit 204 of the resource manager 103 uses the software image necessary for executing the service “A” from the software image management function unit 202. An image “A” is specified, and this image “A” is transferred to the activation agent 301 of the selected server 130 (server ID = SV1, SV2) (steps S103a and S103b). The activation agent 301 on the selected server 130 (server ID = SV1, SV2) stores the received image “A” in the software image storage unit 302 (steps S104a and S104b).

リソースマネージャ103のサーバ起動処理機能部204は、IPアドレスやネットマスク、DNSサーバなどのIPアドレスなどのネットワーク設定、バッファサイズや同時接続数などミドルウェアやOSのパラメータなど、サーバ130の起動前に変更する必要がある個別設定情報を、サーバIDが「SV1」と「SV2」のサーバ130上の起動エージェント301に渡すと(ステップS105a、105b)、サーバIDが「SV1」と「SV2」のサーバ130上の起動エージェント301は、個別設定・データ格納部303にその個別設定情報を格納する(ステップS106a、106b)。   The server startup processing function unit 204 of the resource manager 103 changes the network settings such as the IP address, netmask, and DNS server IP address, and the middleware and OS parameters such as the buffer size and the number of simultaneous connections before starting the server 130. When the individual setting information that needs to be passed is passed to the activation agent 301 on the server 130 with the server IDs “SV1” and “SV2” (steps S105a and 105b), the server 130 with the server IDs “SV1” and “SV2”. The activation agent 301 above stores the individual setting information in the individual setting / data storage unit 303 (steps S106a and 106b).

その後、サーバIDが「SV1」と「SV2」のサーバ130の起動エージェント301は、計算処理機能部304に対してソフトウェアイメージと個別設定情報を用いてブートするように指示する。計算処理機能部304はブート後サービス「A」を提供するサーバ130として動作する。   Thereafter, the activation agent 301 of the server 130 with the server IDs “SV1” and “SV2” instructs the calculation processing function unit 304 to boot using the software image and the individual setting information. The calculation processing function unit 304 operates as the server 130 that provides the post-boot service “A”.

このように、サービス「A」を提供するサーバ130が設定されると、サーバ状態監視機能部205のサーバ状態情報は、図6に示すように、リソースプール120内の6個のサーバ130(サーバIDが「SV1」〜「SV6」)のうち、サーバIDが「SV1」、「SV2」のサーバ130がサービス「A」の実行中となり、他のサーバは、待機中となる。   As described above, when the server 130 that provides the service “A” is set, the server status information of the server status monitoring function unit 205 includes six servers 130 (servers) in the resource pool 120 as illustrated in FIG. Among the servers having IDs “SV1” to “SV6”), the servers 130 with the server IDs “SV1” and “SV2” are executing the service “A”, and the other servers are on standby.

次に、同様の手順で、サービス「B」の起動要求保守コマンドに対して、それぞれ、サーバIDが「SV4」,「SV6」上でサービス「B」を提供するサーバ130を起動すると、図7において、ステップS201〜ステップS206a、S206bに示すような処理が行われ、図8で示すような状態となる。このときのサーバ状態監視機能部205のサーバ状態情報は、図9に示すように、リソースプール120内の6個のサーバ130(サーバIDが「SV1」〜「SV6」)のうち、サーバIDが「SV1」,「SV2」のサーバ130がサービス「A」の実行中となり、サーバIDが「SV4」,「SV6」のサーバ130がサービス「B」の実行中となり、他のサーバは、待機中となる。   Next, when the server 130 that provides the service “B” on the server IDs “SV4” and “SV6” is activated in response to the activation request maintenance command for the service “B” in the same procedure, FIG. In step S201, steps S206a and S206b are performed, and the state shown in FIG. 8 is obtained. As shown in FIG. 9, the server status information of the server status monitoring function unit 205 at this time is the server ID among the six servers 130 (server IDs “SV1” to “SV6”) in the resource pool 120. Servers “SV1” and “SV2” are currently executing service “A”, servers 130 whose server IDs are “SV4” and “SV6” are currently executing service “B”, and other servers are waiting. It becomes.

続いて、この状態からサービス「B」をスケールアウトする手順について述べる。図10は、サービス「B」をスケールアウトするときの処理を示すシーケンス図である。   Next, the procedure for scaling out service “B” from this state will be described. FIG. 10 is a sequence diagram illustrating processing when the service “B” is scaled out.

リソースマネージャ103は、管理インタフェース経由でサービス「B」のスケールアウト要求の保守コマンドを受け取ると(ステップS301)、リソースマネージャ103のサーバ起動処理機能部204は、サーバ状態管理機能部203の情報を参照し、待機中のサーバ130を一つ選出する(ステップS302)。その選出方法としては、待機中状態のサーバ130を無作為に一つ選出する、テーブルのエントリーを順に確認していく中で最初に発見されたものを選出する等の単純な方法の他、サーバ起動処理機能部204が実ネットワークトポロジやリソースプール120内のサーバ130の物理的位置を把握しており、その情報を基に、現用中のサーバ130に対して最も通信遅延が少ないと判断できる(例えば、同一のハブに接続されている、または直接ネットワークケーブルで接続されている、など)サーバ130を選択するような方法も考えられる。   When the resource manager 103 receives the maintenance command for the scale-out request for the service “B” via the management interface (step S301), the server activation processing function unit 204 of the resource manager 103 refers to the information of the server state management function unit 203. Then, one waiting server 130 is selected (step S302). As a selection method, a simple method such as selecting one server 130 in a waiting state at random, selecting the first one found while checking the table entries in order, The activation processing function unit 204 knows the actual network topology and the physical location of the server 130 in the resource pool 120, and can determine that the communication delay is the smallest for the active server 130 based on the information ( For example, a method of selecting the server 130 (connected to the same hub or directly connected by a network cable) is also conceivable.

ここでは、待機中のサーバ130の中から、サーバIDが「SV5」のサーバ130がスケールアウトを行うサーバとして選ばれたとする。この場合、サーバIDが「SV5」のサーバ130は、イメージ「B」のソフトウェアイメージの転送が必要となる。通常のサーバ起動要求では、リソースマネージャ103のサーバ起動処理機能部204は、ソフトウェアイメージ管理機能部202からサービス「B」の実行に必要なソフトウェアイメージをサーバIDが「SV5」のサーバ130に直接転送しているが、スケールアウト時には、サーバ起動処理機能部204は、直接ソフトウェアイメージの転送を行わず、サービス「B」を提供しているサーバがイメージ「B」の断片を転送を要求する。   Here, it is assumed that the server 130 with the server ID “SV5” is selected as the server to be scaled out from the waiting servers 130. In this case, the server 130 with the server ID “SV5” needs to transfer the software image of the image “B”. In a normal server activation request, the server activation processing function unit 204 of the resource manager 103 directly transfers the software image necessary for executing the service “B” from the software image management function unit 202 to the server 130 with the server ID “SV5”. However, at the time of scale-out, the server activation processing function unit 204 does not directly transfer the software image, and the server providing the service “B” requests transfer of a fragment of the image “B”.

すなわち、この場合には、リソースマネージャ103のサーバ起動処理機能部204は、既にイメージ「B」を保有しているサーバ130(サーバID=SV4,SV6)に対して、起動エージェント301にイメージ「B」の断片をそれぞれ転送するように指示する(ステップS303a、303b)。   That is, in this case, the server activation processing function unit 204 of the resource manager 103 sends the image “B” to the activation agent 301 for the server 130 (server ID = SV4, SV6) that already has the image “B”. ") Is transferred (steps S303a and 303b).

イメージ「B」を保有しているサーバ130(サーバID=SV4,SV6)は、指示されたイメージ「B」の断片をサーバIDが「SV5」のサーバ130に転送する(ステップS304a、304b)。その際に、各サーバ130が転送する断片の量は、等分である方法と重み付けを行うような方法が考えられる。等分に転送する場合、イメージ「B」の容量が1GBであったとすると、サーバIDが「SV4」のサーバ130がイメージ「B」の先頭から半分である500MBまでのデータを、サーバIDが「SV6」のサーバ130がイメージ「B」の半分から末尾までの500MBをそれぞれサーバIDが「SV5」のサーバ130に対して転送する。   The server 130 (server ID = SV4, SV6) holding the image “B” transfers the instructed fragment of the image “B” to the server 130 whose server ID is “SV5” (steps S304a and 304b). At this time, the amount of fragments transferred by each server 130 can be divided equally and a method of weighting can be considered. In the case of equally transferring, assuming that the capacity of the image “B” is 1 GB, the server 130 with the server ID “SV4” stores data up to 500 MB, which is half the head of the image “B”, and the server ID is “ The server 130 with “SV6” transfers 500 MB from the half to the end of the image “B” to the server 130 with the server ID “SV5”.

重み付けを行うような場合は、静的な各サーバの情報を用いる方法と動的に各サーバの処理負荷を考慮する方法が考えられる。前者は、各サーバが平均的に行っている処理負荷および有休資源(CPU時間、ネットワーク帯域など)を、事前にサーバ起動処理機能部204が把握していることを前提とし、後者は起動エージェント301の申告によってその時のサーバの処理負荷及び有休資源をサーバ起動処理機能部204が把握する。そして、サーバIDが「SV4」のサーバ130の有休資源がサーバIDが「SV6」のサーバ130に比べて例えば3倍多かった場合、イメージ「B」の容量を1GBとすると、サーバIDが「SV4」のサーバ130は先頭から750MBを、サーバIDが「SV6」のサーバ130は残りの250MBを断片としてサーバIDが「SV5」のサーバ130に転送する。   When weighting is performed, a method of using static information of each server and a method of dynamically considering the processing load of each server can be considered. The former is based on the premise that the server activation processing function unit 204 knows in advance the processing load and idle resources (CPU time, network bandwidth, etc.) that each server is performing on average, and the latter is based on the activation agent 301. The server activation processing function unit 204 grasps the server processing load and availability resources at that time. Then, when the number of idle resources of the server 130 with the server ID “SV4” is, for example, three times that of the server 130 with the server ID “SV6”, and the capacity of the image “B” is 1 GB, the server ID is “SV4”. The server 130 with the server ID “SV6” transfers the remaining 250 MB to the server 130 with the server ID “SV5”.

サーバIDが「SV5」のサーバ130の起動エージェント301は、受信したイメージ「B」をソフトウェアイメージ格納部302に保存する(ステップS305)。そして、リソースマネージャ103のサーバ起動処理機能部204は、IPアドレスやネットマスク、DNSサーバなどのIPアドレスなどのネットワーク設定、バッファサイズや同時接続数などミドルウェアやOSのパラメータなど、サーバ130の起動前に変更する必要がある個別設定情報を、サーバIDが「SV5」のサーバ130上の起動エージェント301に渡すと(ステップS306)、サーバIDが「SV5」のサーバ130上の起動エージェント301は、個別設定・データ格納部303にその個別設定情報を格納する(ステップS307)。   The activation agent 301 of the server 130 with the server ID “SV5” stores the received image “B” in the software image storage unit 302 (step S305). Then, the server activation processing function unit 204 of the resource manager 103 performs network settings such as an IP address, a netmask, an IP address such as a DNS server, middleware and OS parameters such as a buffer size and the number of simultaneous connections, and the like before the server 130 is activated. Is passed to the activation agent 301 on the server 130 whose server ID is “SV5” (step S306), the activation agent 301 on the server 130 whose server ID is “SV5” The individual setting information is stored in the setting / data storage unit 303 (step S307).

その後、サーバIDが「SV5」のサーバ130の起動エージェント301は、計算処理機能部304に対してソフトウェアイメージと個別設定情報を用いてブートするように指示する。計算処理機能部304はブート後サービス「B」を提供するサーバ130として動作する。   Thereafter, the activation agent 301 of the server 130 with the server ID “SV5” instructs the calculation processing function unit 304 to boot using the software image and the individual setting information. The calculation processing function unit 304 operates as the server 130 that provides the post-boot service “B”.

スケールアウト時には、ステップS301〜ステップS307に示すような処理が行われ、図11で示すような状態となる。このときのサーバ状態監視機能部205のサーバ状態情報は、図12に示すように、リソースプール120内の6個のサーバ130(サーバIDが「SV1」〜「SV6」)のうち、サーバIDが「SV1」,「SV2」のサーバ130がサービス「A」の実行中となり、サーバIDが「SV4」,「SV5」,「SV6」のサーバ130がサービス「B」の実行中となり、他のサーバは、待機中となる。   At the time of scale-out, processing as shown in steps S301 to S307 is performed, and a state as shown in FIG. 11 is obtained. The server status information of the server status monitoring function unit 205 at this time is, as shown in FIG. 12, the server ID of the six servers 130 (server IDs “SV1” to “SV6”) in the resource pool 120. Servers “SV1” and “SV2” are executing service “A”, and servers 130 whose server IDs are “SV4”, “SV5”, and “SV6” are executing service “B”, and other servers Will be waiting.

以上のように、スケールアウト時にリソースマネージャ103にソフトウェアイメージの転送負荷をかけないことにより、複数のサービスのスケールアウトを同時に高速に行うことが可能となる。   As described above, it is possible to simultaneously scale out a plurality of services at high speed by not applying a software image transfer load to the resource manager 103 during scale-out.

本発明は、上述した実施形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。   The present invention is not limited to the above-described embodiments, and various modifications and applications can be made without departing from the gist of the present invention.

101:保守者端末
102:クラスタシステム
103:リソースマネージャ
110:管理ネットワーク
120:リソースプール
130:サーバ
140:利用者端末
150:保守ネットワーク
160:サービスネットワーク
201:管理インタフェース
202:ソフトウェアイメージ管理機能部
203:サーバ状態管理機能部
204:サーバ起動処理機能部
205:サーバ状態監視機能部
301:起動エージェント
302:ソフトウェアイメージ格納部
303:データ格納部
304:計算処理機能部
101: maintenance person terminal 102: cluster system 103: resource manager 110: management network 120: resource pool 130: server 140: user terminal 150: maintenance network 160: service network 201: management interface 202: software image management function unit 203: Server state management function unit 204: Server activation processing function unit 205: Server state monitoring function unit 301: Activation agent 302: Software image storage unit 303: Data storage unit 304: Calculation processing function unit

Claims (9)

サービスを提供する複数のサーバと、前記複数のサーバを管理するリソースマネージャとからなるクラスタシステムにおいて、
前記リソースマネージャは、所定のサービスを行うためのサーバを追加するスケールアウトの要求があると、前記複数のサーバの中から待機状態にあるサーバをスケールアウトを行うサーバとして選出すると共に、前記複数のサーバの中で前記所定のサービスを既に作動している複数のサーバに対して前記所定のサービスのソフトウェアイメージの断片の転送を指示する手段を有し、
前記ソフトウェアの転送を指示された複数のサーバは、前記所定のサービスのソフトウェアイメージの断片を前記スケールアウトを行うサーバとして選出されたサーバに転送する手段を有し、
前記スケールアウトを行うサーバとして選出されたサーバは、前記ソフトウェアの転送を指示された複数のサーバから転送されてきた所定のサービスのソフトウェアイメージを受信して保存する手段を有する
ことを特徴とするクラスタシステム。
In a cluster system comprising a plurality of servers that provide services and a resource manager that manages the plurality of servers,
When there is a request for scale-out to add a server for performing a predetermined service, the resource manager selects a server in a standby state from among the plurality of servers as a server to perform scale-out, and Means for instructing a plurality of servers already operating the predetermined service in the server to transfer a piece of the software image of the predetermined service;
The plurality of servers instructed to transfer the software includes means for transferring a piece of software image of the predetermined service to a server selected as the server that performs the scale-out,
The server selected as the server to perform the scale-out has means for receiving and storing a software image of a predetermined service transferred from a plurality of servers instructed to transfer the software. system.
前記ソフトウェアの転送を指示されたサーバは複数あり、前記ソフトウェアの転送を指示された複数のサーバは、それぞれ、等分の転送量で、前記所定のサービスのソフトウェアイメージの断片を前記スケールアウトを行うサーバに転送することを特徴とする請求項1に記載のクラスタシステム。   There are a plurality of servers instructed to transfer the software, and each of the plurality of servers instructed to transfer the software scales out a piece of the software image of the predetermined service with an equal amount of transfer. The cluster system according to claim 1, wherein the cluster system is transferred to a server. 前記ソフトウェアの転送を指示されたサーバは複数あり、前記ソフトウェアの転送を指示された複数のサーバは、それぞれ、重み付けした転送量で、前記所定のサービスのソフトウェアイメージの断片を前記スケールアウトを行うサーバに転送することを特徴とする請求項1に記載のクラスタシステム。   There are a plurality of servers instructed to transfer the software, and each of the plurality of servers instructed to transfer the software performs a scale-out of a piece of the software image of the predetermined service with a weighted transfer amount. The cluster system according to claim 1, wherein the data is transferred to the cluster system. 前記重み付けは、サーバの処理負荷及び有休資源に応じて行うことを特徴とする請求項3に記載のクラスタシステム。   The cluster system according to claim 3, wherein the weighting is performed according to a processing load of the server and a free resource. 前記サーバの処理負荷及び有休資源の情報は、前記リソースマネージャが各サーバの平均的な処理負荷及び有休資源に基づいて静的に管理することを特徴とする請求項4に記載のクラスタシステム。   5. The cluster system according to claim 4, wherein the processing load of the server and information on available resources are statically managed by the resource manager based on an average processing load and available resources of each server. 前記サーバの処理負荷及び有休資源の情報は、前記リソースマネージャが各サーバからの情報を取得して動的に管理することを特徴とする請求項4に記載のクラスタシステム。   The cluster system according to claim 4, wherein the processing load of the server and information on holidays are managed dynamically by the resource manager by acquiring information from each server. サービスを提供する複数のサーバと、前記複数のサーバを管理するリソースマネージャとからなるクラスタシステムのスケールアウト方法において、
所定のサービスを行うためのサーバを追加するスケールアウトの要求があると、前記リソースマネージャが、前記複数のサーバの中から待機状態にあるサーバをスケールアウトを行うサーバとして選出すると共に、前記複数のサーバの中で前記所定のサービスを既に作動している複数のサーバに対して前記所定のサービスのソフトウェアイメージの断片の転送を指示する工程と、
前記ソフトウェアの転送を指示された複数のサーバが、前記所定のサービスのソフトウェアイメージの断片を前記スケールアウトを行うサーバに転送する工程と、
前記スケールアウトを行うサーバが、前記ソフトウェアの転送を指示された複数のサーバから転送されてきた所定のサービスのソフトウェアイメージを受信して保存する工程と
を含むことを特徴とするスケールアウト方法。
In a cluster system scale-out method comprising a plurality of servers for providing services and a resource manager for managing the plurality of servers,
When there is a scale-out request to add a server for performing a predetermined service, the resource manager selects a server in a standby state from the plurality of servers as a server to perform scale-out, and the plurality of the plurality of servers. Instructing a plurality of servers already operating the predetermined service in the server to transfer a piece of the software image of the predetermined service;
A plurality of servers instructed to transfer the software, transferring a piece of software image of the predetermined service to the server performing the scale-out;
A scale-out method comprising: a server performing the scale-out receiving and storing a software image of a predetermined service transferred from a plurality of servers instructed to transfer the software.
サービスを提供する複数のサーバと、前記複数のサーバを管理するリソースマネージャとからクラスタシステムを構成するためのリソースマネージャ装置において、
サービス実行に必要なソフトウェアイメージを管理する手段と、
前記複数のサーバの稼働状態を監視する手段と、
所定のサービスを行うためのサーバを追加するスケールアウトの要求があると、前記複数のサーバの中から待機状態にあるサーバをスケールアウトを行うサーバとして選出すると共に、前記複数のサーバの中で前記所定のサービスを既に作動している複数のサーバに対して、前記スケールアウトを行うサーバに前記所定のサービスのソフトウェアイメージの断片を転送することを要求する手段と
を備えることを特徴とするリソースマネージャ装置。
In a resource manager device for configuring a cluster system from a plurality of servers that provide services and a resource manager that manages the plurality of servers,
A means of managing software images required for service execution;
Means for monitoring operating states of the plurality of servers;
When there is a request for scale-out to add a server for performing a predetermined service, a server in a standby state is selected as a server to perform scale-out from among the plurality of servers, and the server among the plurality of servers is selected. Means for requesting a plurality of servers already operating a predetermined service to transfer a piece of a software image of the predetermined service to a server that performs the scale-out. apparatus.
サービスを提供する複数のサーバと、前記複数のサーバを管理するリソースマネージャとからクラスタシステムを構成するためのサーバ装置において、
ソフトウェアイメージの断片の転送及び取得を行う手段と、
ソフトウェアイメージの格納手段と、
個別設定情報の格納手段とを備え、
他のサーバがスケールアウトを行うサーバとして設定されると、前記リソースマネージャの指示により、前記ソフトウェアイメージの格納手段に格納されているソフトウェアイメージの断片を前記スケールアウトを行うサーバに転送し、
当該サーバがスケールアウトを行うサーバとして選定されると、既に所定のサービスを作動している他の複数のサーバから転送されてくるソフトウェアイメージを取得し、前記ソフトウェアイメージの格納手段に格納する
ことを特徴とするサーバ装置。
In a server device for configuring a cluster system from a plurality of servers that provide services and a resource manager that manages the plurality of servers,
Means for transferring and obtaining pieces of software images;
Software image storage means;
Storage means for individual setting information,
When another server is set as a server to be scaled out, according to an instruction from the resource manager, a piece of software image stored in the software image storage means is transferred to the server to be scaled out,
When the server is selected as a server to be scaled out, a software image transferred from a plurality of other servers already operating a predetermined service is acquired and stored in the software image storage means. A server device as a feature.
JP2010119499A 2010-05-25 2010-05-25 Cluster system, cluster system scale-out method, resource manager device, server device Expired - Fee Related JP5551967B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010119499A JP5551967B2 (en) 2010-05-25 2010-05-25 Cluster system, cluster system scale-out method, resource manager device, server device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010119499A JP5551967B2 (en) 2010-05-25 2010-05-25 Cluster system, cluster system scale-out method, resource manager device, server device

Publications (2)

Publication Number Publication Date
JP2011248521A JP2011248521A (en) 2011-12-08
JP5551967B2 true JP5551967B2 (en) 2014-07-16

Family

ID=45413718

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010119499A Expired - Fee Related JP5551967B2 (en) 2010-05-25 2010-05-25 Cluster system, cluster system scale-out method, resource manager device, server device

Country Status (1)

Country Link
JP (1) JP5551967B2 (en)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10334058A (en) * 1997-05-27 1998-12-18 Shikoku Nippon Denki Software Kk On-line system and load dispersing system
JP4266786B2 (en) * 2003-11-19 2009-05-20 株式会社日立製作所 Information processing system and information processing apparatus

Also Published As

Publication number Publication date
JP2011248521A (en) 2011-12-08

Similar Documents

Publication Publication Date Title
JP6005795B2 (en) Reliable deterministic live migration of virtual machines
CN108737270B (en) Resource management method and device for server cluster
US7996525B2 (en) Systems and methods for dynamically provisioning cloud computing resources
TWI559153B (en) Distributed computing framework
US20170031622A1 (en) Methods for allocating storage cluster hardware resources and devices thereof
JP5557689B2 (en) Network system
US20130061220A1 (en) Method for on-demand inter-cloud load provisioning for transient bursts of computing needs
WO2016030973A1 (en) Multi-tenant resource coordination method
KR101474872B1 (en) Method for elastic virtual cluster management for efficient construction of virtual clusters on cloud, apparatus for elastic virtual cluster management and cloud system using the same
US9104488B2 (en) Support server for redirecting task results to a wake-up server
CN115665147A (en) Data plane API in a distributed computing network
US20230069240A1 (en) Dynamic cloning of application infrastructures
US8458702B1 (en) Method for implementing user space up-calls on java virtual machine before/after garbage collection
JP5151509B2 (en) Virtual machine system and virtual machine distribution method used therefor
CN106911741B (en) Method for balancing virtual network management file downloading load and network management server
JP5667506B2 (en) Cluster system and software update method
Wang et al. Provision of storage QoS in distributed file systems for clouds
JP5444257B2 (en) Software image distribution method, repository apparatus, server, and system
JP5551967B2 (en) Cluster system, cluster system scale-out method, resource manager device, server device
US11571618B1 (en) Multi-region game server fleets
Liu et al. Improving resource utilization of a cloud-based testing platform for android applications
JP6870390B2 (en) Resource allocation method, connection management server and connection management program in a system based on a virtual infrastructure
JP6657910B2 (en) Band setting method, band setting program, information processing apparatus and information processing system
JP4034712B2 (en) Network system, distributed processing method and program
US11571619B1 (en) Cross-region management of game server fleets

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20121004

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20130605

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20130725

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20131030

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131105

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131226

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140520

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140523

R150 Certificate of patent or registration of utility model

Ref document number: 5551967

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees