JP5551967B2 - Cluster system, cluster system scale-out method, resource manager device, server device - Google Patents
Cluster system, cluster system scale-out method, resource manager device, server device Download PDFInfo
- Publication number
- JP5551967B2 JP5551967B2 JP2010119499A JP2010119499A JP5551967B2 JP 5551967 B2 JP5551967 B2 JP 5551967B2 JP 2010119499 A JP2010119499 A JP 2010119499A JP 2010119499 A JP2010119499 A JP 2010119499A JP 5551967 B2 JP5551967 B2 JP 5551967B2
- Authority
- JP
- Japan
- Prior art keywords
- server
- servers
- scale
- software
- cluster system
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Hardware Redundancy (AREA)
- Computer And Data Communications (AREA)
Description
本発明は、通信サービスなどを提供する高可用クラスタシステム、クラスタシステムのスケールアウト方法、リソースマネージャ装置、サーバ装置に関する。 The present invention relates to a highly available cluster system that provides communication services, a cluster system scale-out method, a resource manager device, and a server device.
近年、インターネットにおいてはサービスの多様化が顕著である。また、新サービスは、利用者数を事前に明確に把握することが困難であるため、最初に小規模のサーバを用いてサービス提供を開始(スモールスタート)し、利用者の増加に応じてサーバを増強していくことがコスト面で有効である。 In recent years, service diversification has been remarkable on the Internet. In addition, since it is difficult to clearly grasp the number of users in advance, the new service starts service provision (small start) using a small server first, and the server increases as the number of users increases. It is effective in terms of cost to increase the power.
また、近年ではサーバ増強の手段として、ハードウェアをより強力なものに交換するのではなく、同じ処理を行うサーバを追加(スケールアウト)し、複数のサーバが並列動作するクラスタによって処理を行うことが一般的となりつつある。 Also, in recent years, as a means of augmenting servers, instead of replacing hardware with more powerful ones, adding servers that perform the same processing (scaling out) and performing processing in clusters in which multiple servers operate in parallel Is becoming common.
ただし、利用者数の増加時に速やかにスケールアウトを行うためには、稼働していない予備のサーバを常に待機させておく必要がある。そのような常に使用していない待機サーバを個々のサービス提供事業者が用意するのはコストが高い。 However, in order to quickly scale out when the number of users increases, it is necessary to always keep a standby server that is not operating in standby. It is costly for each service provider to prepare such a standby server that is not always used.
そこで、近年ではデータセンターのようなサーバ管理事業者が一括してサーバを管理し、サービス提供事業者をホスティングするIaaS(Infrastructure as a Service)などと呼ばれる形態が一般化している(非特許文献1)。IaaSでは、個々のサービス提供事業者にとって、サーバのハードウェアメンテナンスが不要なだけでなく、複数のサービス提供事業者が待機サーバを共有することにより、サーバ設備維持費の低減が期待できる。 Thus, in recent years, a form called IaaS (Infrastructure as a Service) or the like in which a server management company such as a data center collectively manages servers and hosts service providers has become common (Non-patent Document 1). ). In IaaS, not only hardware maintenance of a server is unnecessary for each service provider, but also a reduction in server facility maintenance costs can be expected by sharing a standby server among a plurality of service providers.
一方、近年では設備維持コスト低減を目的として通信網のIP化が進んでおり、従来の交換機のような専用ハードウェアではなく、汎用サーバを用いて通信ネットワーク・通信サービスを実現することが一般化している。また、通信サービスにおいてもサービスは多様化しているため、新サービスをスモールスタートし、利用者の拡大に応じてサーバ数をスケールアウトすることにより、設備コストを低減したいという要求がある。そのような要求に対して、各サービスをスモールスタートし、あるサービスの利用者拡大時に、余剰待機資源が集約されたリソースプールから必要なサーバを獲得し、スケールアウトを行う構成の適用が考えられる。 On the other hand, in recent years, IP of communication networks has been promoted for the purpose of reducing equipment maintenance costs, and it has become common to implement communication networks and communication services using general-purpose servers instead of dedicated hardware like conventional exchanges. ing. In addition, as communication services are diversified, there is a demand to reduce equipment costs by starting small new services and scaling out the number of servers according to the expansion of users. In response to such a request, it is possible to apply a configuration in which each service is started in a small manner, and when a user of a certain service is expanded, a necessary server is acquired from a resource pool in which surplus standby resources are aggregated and scaled out. .
上述のような、個々のサービスにおけるスケールアウト時に、余剰資源が集約された共用のリソースプールからサーバを取得する構成においては、リソースプール内に保持されているサーバは共用であり、どのようなソフトウェア構成を取るかが事前にわからないため、ソフトウェアを何も有していない状態であることが一般的である。よって、スケールアウト時にサーバを取得した後、個々のサービスに対応したソフトウェア構成が含まれたソフトウェアイメージを、イメージを管理しているリポジトリからそのサーバに転送し、必要な設定を行ってクラスタに組み込む必要がある。 In a configuration in which a server is acquired from a shared resource pool in which surplus resources are aggregated at the time of scale-out of individual services as described above, the server held in the resource pool is shared, and what software Since it is not known in advance whether to take the configuration, it is common to have no software. Therefore, after acquiring the server at scale-out, transfer the software image containing the software configuration corresponding to each service from the repository that manages the image to the server, make the necessary settings, and incorporate it into the cluster There is a need.
ソフトウェアイメージはオペレーティングシステムや各種ミドルウェア、データ等を全て含んでいるため数〜数十GBに及ぶ大容量であり、転送にはある程度の時間を要する。複数のサービスを同時にスケールアウトするような場合、イメージを管理しているリポジトリがボトルネックとなり、さらにスケールアウト時間が増大するため、インフラとして公共性の高い通信サービスに求められる無停止性・即応性を満たすことができない。 Since the software image includes all of the operating system, various middleware, data, and the like, the software image has a large capacity ranging from several to several tens of GB, and transfer requires a certain amount of time. When multiple services are scaled out at the same time, the repository that manages the image becomes a bottleneck, and the scale-out time increases. Therefore, non-stop and responsiveness required for highly public communication services as infrastructure Can't meet.
上述の課題を鑑み、本発明の目的は、スケールアウト時のソフトウェアイメージ転送の負荷を軽減できるようにしたクラスタシステム、クラスタシステムのスケールアウト方法、リソースマネージャ装置、サーバ装置を提供することを目的とする。 In view of the above-described problems, an object of the present invention is to provide a cluster system, a cluster system scale-out method, a resource manager device, and a server device that can reduce the load of software image transfer during scale-out. To do.
上述の課題を解決するために、本発明に係るクラスタシステムは、サービスを提供する複数のサーバと、複数のサーバを管理するリソースマネージャとからなるクラスタシステムにおいて、リソースマネージャは、所定のサービスを行うためのサーバを追加するスケールアウトの要求があると、複数のサーバの中から待機状態にあるサーバをスケールアウトを行うサーバとして選出すると共に、複数のサーバの中で所定のサービスを既に作動している複数のサーバに対して所定のサービスのソフトウェアイメージの断片の転送を指示する手段を有し、ソフトウェアの転送を指示された複数のサーバは、所定のサービスのソフトウェアイメージの断片をスケールアウトを行うサーバとして選出されたサーバに転送する手段を有し、スケールアウトを行うサーバとして選出されたサーバは、ソフトウェアの転送を指示された複数のサーバから転送されてきた所定のサービスのソフトウェアイメージを受信して保存する手段を有することを特徴とする。 In order to solve the above-described problems, a cluster system according to the present invention is a cluster system including a plurality of servers that provide services and a resource manager that manages the plurality of servers. The resource manager performs a predetermined service. If there is a request for scale-out to add a server, a server in a standby state is selected as a server to be scaled out from among a plurality of servers, and a predetermined service is already activated in the plurality of servers. Means for instructing a plurality of servers to transfer software image fragments of a predetermined service, and the plurality of servers instructed to transfer software scale out software image fragments of a predetermined service A means for transferring to a server elected as the server, Server elected as a server for performing is characterized in that it comprises means for receiving and storing software image for a given service that has been transferred from a plurality of servers are instructed to transfer the software.
本発明に係るクラスタシステムのスケールアウト方法は、サービスを提供する複数のサーバと、複数のサーバを管理するリソースマネージャとからなるクラスタシステムのスケールアウト方法において、所定のサービスを行うためのサーバを追加するスケールアウトの要求があると、リソースマネージャが、複数のサーバの中から待機状態にあるサーバをスケールアウトを行うサーバとして選出すると共に、複数のサーバの中で所定のサービスを既に作動している複数のサーバに対して所定のサービスのソフトウェアイメージの断片の転送を指示する工程と、ソフトウェアの転送を指示された複数のサーバが、所定のサービスのソフトウェアイメージの断片をスケールアウトを行うサーバに転送する工程と、スケールアウトを行うサーバが、ソフトウェアの転送を指示された複数のサーバから転送されてきた所定のサービスのソフトウェアイメージを受信して保存する工程とを含むことを特徴とする。 The cluster system scale-out method according to the present invention adds a server for performing a predetermined service in the cluster system scale-out method including a plurality of servers providing services and a resource manager managing the plurality of servers. When a scale-out request is made, the resource manager selects a server in a standby state from a plurality of servers as a server to be scaled out, and a predetermined service is already operating in the plurality of servers. Instructing a plurality of servers to transfer software image fragments of a predetermined service, and a plurality of servers instructed to transfer software transfer software image fragments of a predetermined service to a server that performs scale-out And the server that performs the scale-out, Characterized in that it comprises a step of receiving and storing software image for a given service transferred from software plurality of servers that are instructed to transfer.
本発明に係るリソースマネージャ装置は、サービスを提供する複数のサーバと、複数のサーバを管理するリソースマネージャとからクラスタシステムを構成するためのリソースマネージャ装置において、サービス実行に必要なソフトウェアイメージを管理する手段と、複数のサーバの稼働状態を監視する手段と、所定のサービスを行うためのサーバを追加するスケールアウトの要求があると、複数のサーバの中から待機状態にあるサーバをスケールアウトを行うサーバとして選出すると共に、複数のサーバの中で所定のサービスを既に作動している複数のサーバに対して、スケールアウトを行うサーバに所定のサービスのソフトウェアイメージの断片を転送することを要求する手段とを備えることを特徴とする。 A resource manager device according to the present invention manages a software image necessary for service execution in a resource manager device for configuring a cluster system from a plurality of servers that provide services and a resource manager that manages the plurality of servers. If there is a scale-out request for adding a means, a means for monitoring the operating status of a plurality of servers, and a server for performing a predetermined service, the server in a standby state is scaled out from the plurality of servers. Means for selecting a server and requesting a plurality of servers already operating a predetermined service among the plurality of servers to transfer a piece of software image of the predetermined service to a server performing scale-out It is characterized by providing.
本発明に係るサーバ装置は、サービスを提供する複数のサーバと、複数のサーバを管理するリソースマネージャとからクラスタシステムを構成するためのサーバ装置において、ソフトウェアイメージの断片の転送及び取得を行う手段と、ソフトウェアイメージの格納手段と、個別設定情報の格納手段とを備え、他のサーバがスケールアウトを行うサーバとして設定されると、リソースマネージャの指示により、ソフトウェアイメージの格納手段に格納されているソフトウェアイメージの断片をスケールアウトを行うサーバに転送し、当該サーバがスケールアウトを行うサーバとして選定されると、既に所定のサービスを作動している他の複数のサーバから転送されてくるソフトウェアイメージを取得し、ソフトウェアイメージの格納手段に格納することを特徴とする。 A server device according to the present invention includes a means for transferring and acquiring software image fragments in a server device for configuring a cluster system from a plurality of servers that provide services and a resource manager that manages the plurality of servers. The software image storage means and the individual setting information storage means, and when the other server is set as a scale-out server, the software stored in the software image storage means according to the instruction of the resource manager transfer the pieces of image server for scale-out, when the server is selected as the server for scale-out, already acquired the software images transferred from a plurality of other servers are operating a predetermined service As a software image storage means. Characterized in that it.
本発明によれば、スケールアウト時に、既に稼働中の現用中のサーバが使用しているソフトウェアイメージが新規にスケールアウトを行うサーバに転送され、新規にスケールアウトを行うサーバの固有の設定が行われる。また、新規にスケールアウトを行うサーバには、クラスタを構成する複数のサーバからソフトウェアイメージが一部ずつ転送される。このため、特定の現用中サーバに転送負荷が集中することがなくなり、高速にスケールアウトすることが可能となる。 According to the present invention, at the time of scale-out, a software image used by an active server that is already in operation is transferred to a new scale-out server, and a unique setting of the new scale-out server is performed. Is called. In addition, a software image is partially transferred from a plurality of servers constituting the cluster to a new scale-out server. For this reason, the transfer load is not concentrated on a specific active server, and it is possible to scale out at high speed.
以下、本発明の実施の形態について図面を参照しながら説明する。図1は、本発明の第1の実施形態に係るクラスタシステムの全体構成を示すブロック図である。 Hereinafter, embodiments of the present invention will be described with reference to the drawings. FIG. 1 is a block diagram showing the overall configuration of the cluster system according to the first embodiment of the present invention.
図1において、本発明の第1の実施形態に係るクラスタシステム102は、保守ネットワーク150によって保守者端末101と接続し、サービスネットワーク160によって利用者端末140と接続する。
In FIG. 1, the
サービス提供者は、クラスタシステム102に対する保守コマンドを、保守者端末101によって実施する。保守コマンドとしては、サービスを提供するためのサーバクラスタの構築や、スケールアウトによるクラスタの増強などが挙げられる。
The service provider executes a maintenance command for the
ユーザは、利用者端末140を用い、クラスタシステム102上で提供されるサービスをサービスネットワーク160を介して利用する。クラスタシステム102は、計算資源が集約されているリソースプール120と、資源を管理する機能部であるリソースマネージャ103で構成され、両者は管理ネットワーク110によって接続される。リソースプール120は計算資源である複数のサーバ130によって構成される。
A user uses a service provided on the
次に、リソースマネージャ103の構成機能部について説明する。リソースマネージャ103は、管理インタフェース201と、ソフトウェアイメージ管理機能部202と、サーバ状態管理機能部203と、サーバ起動処理機能部204と、サーバ状態監視機能部205とから構成される。
Next, the configuration function unit of the
管理インタフェース201は、保守者端末101とのインタフェースを行い、保守者端末101からの保守コマンドを受け付けて、適切な処理を他の機能部と連携して実行する。ソフトウェアイメージは、サービスの提供に必要なソフトウェア構成を含んだファイルであり、サービス提供時にサーバ130に転送される。
The
ソフトウェアイメージ管理機能部202は、所定のサービス実行に必要なソフトウェアイメージの種別、格納場所を管理する。図2にソフトウェアイメージ管理機能部202が持つソフトウェアイメージの管理情報テーブルの例を示す。ソフトウェアイメージは、サービス毎に一つ存在し、図2の例では、サービス「A」がイメージ「A」、サービス「B」がイメージ「B」を用いてサービスを開始する。また、イメージ「A」、イメージ「B」の格納場所は、リソースマネージャ103のファイルシステム上の”/path/to/imageDir”であることを示している。本実施形態では、格納場所はリソースマネージャ103上のディスク等を想定しているが、リソースマネージャ103からアクセス可能であれば、実際の格納場所は外部ストレージなどでもよい。
The software image
サーバ状態管理機能部203は、リソースプール120内の資源であるサーバ130が現在どのサービスの提供に用いられているか、などのサーバ130の状態情報を管理する。
The server state
サーバ起動処理機能部204は、サーバの起動要求があった場合、サーバ状態監視機能部205の情報を参照し、リソースプール120内のどのサーバ130を用いるかを決定すると共に、該当サーバ130に対してソフトウェアイメージ管理機能部202が管理するソフトウェアイメージを転送し、起動する機能を持つ。また、サーバ起動処理機能部204は、スケールアウトの要求があった場合、サーバ状態監視機能部205の情報を参照し、リソースプール120内のどのサーバ130をスケールアウトに用いるかを決定すると共に、同一のサービスを既に行っているサーバ130に、スケールアウトに用いるサーバ130に対してソフトウェアイメージの断片の転送を要求し、起動する機能を持つ。
When there is a server activation request, the server activation
サーバ状態監視機能部205は、常にリソースプール120内のサーバ130の状態を監視し、サーバ状態管理機能部203を更新する機能を持つ。図4、図6、図9、及び図12に、サーバ状態監視機能部205が持つサーバ状態の例を示す。図4では、サーバID「SV1」〜「SV6」の6つのサーバ130の状態は、全て待機中である。図6では、サーバIDが「SV1」、「SV2」のサーバ130がサービス「A」の実行中であり、他のサーバは、待機中である。図9では、サーバIDが「SV1」,「SV2」のサーバ130が「サービス「A」の実行中であり、サーバIDが「SV4」,「SV6」のサーバ130がサービス「B」の実行中であり、他のサーバは待機中である。図12では、サーバIDが「SV1」,「SV2」のサーバ130が「サービス「A」の実行中であり、サーバIDが「SV4」,「SV5」,「SV6」のサーバ130がサービス「B」の実行中であり、他のサーバは待機中である。
The server state
次に、リソースプール120内のサーバ130の構成機能部について述べる。サーバ130は、起動エージェント301と、ソフトウェアイメージ格納部302と、個別設定・データ格納部303と、計算処理機能部304とから構成される。
Next, the configuration function unit of the
起動エージェント301は、リソースマネージャ103とサーバ130間の通信を行う。具体的には、サーバ起動処理機能部204からの起動指示を受け付けてソフトウェアイメージを取得する。また、サーバ状態監視機能部205からの状態問い合わせに対し、サーバ130上で実行中のサービス種別や待機中であることを伝える。また、サーバ起動処理機能部204からソフトウェアイメージの転送指示があると、他のサーバ130にソフトウェアイメージの断片を転送する。
The
ソフトウェアイメージ格納部302は、起動エージェント301が取得してきたソフトウェアイメージを格納する機能部である。ソフトウェアイメージは、サービス毎に存在するものであるが、サーバ130を起動してサービスを実行するために必要な設定情報は、個々のサーバ130毎に異なる場合がある。本システムでは、サーバ130個別の設定情報は取得したソフトウェアイメージを書き換えて保存するのではなく、個別設定・データ格納部303に格納する。また、サーバ130毎に違う出力を行うログ情報などのような個別データも、個別設定・データ格納部303に配置する。
The software
計算処理機能部304は、通常の汎用サーバ130が持つCPU、主記憶などの演算装置であり、ソフトウェアイメージ格納部302と個別設定/データ格納部をディスクとしてシステムをブートし、サービス提供処理を行う。
The calculation
次に、本発明の第1の実施形態のクラスタシステム102の動作について説明する。図3は、6つのサーバ130(サーバID「SV1」〜「SV6」)から構成されるリソースプール120を持つクラスタシステム102において、サービスが何も起動していない状態を示す。クラスタシステム102において、サービスが何も起動していない状態では、サーバ状態監視機能部205が持つサーバ状態情報は、図4に示すように、サーバID「SV1」〜「SV6」の6つのサーバ130の状態は、全て待機中になっている。以下、この状態から、サービス「A」,サービス「B」が実行されている状態に遷移する際の処理について説明する。
Next, the operation of the
図5は、6つのサーバ130(サーバID「SV1」〜「SV6」)が待機状態から、サービス「A」が実行されている状態に遷移するときの処理を示すシーケンス図である。 FIG. 5 is a sequence diagram showing processing when the six servers 130 (server IDs “SV1” to “SV6”) transition from the standby state to the state where the service “A” is being executed.
リソースマネージャ103は、保守者端末101から、管理インタフェース経由でサービス「A」のサーバ二台による起動要求を保守コマンドとして受け取ると(ステップS101)、サーバ起動処理機能部204がサーバ状態監視機能部205の情報を参照し、待機状態であるサーバ130を二つを選出する(ステップS102)。ここでは、サーバIDが「SV1」と「SV2」のサーバ130が選出されるとする。
When the
サーバIDが「SV1」と「SV2」のサーバ130が選出されると、リソースマネージャ103のサーバ起動処理機能部204は、ソフトウェアイメージ管理機能部202からサービス「A」の実行に必要なソフトウェアイメージであるイメージ「A」を特定し、このイメージ「A」を、選出されたサーバ130(サーバID=SV1,SV2)の起動エージェント301に対して転送する(ステップS103a、S103b)。選出されたサーバ130(サーバID=SV1,SV2)上の起動エージェント301は、受信したイメージ「A」をソフトウェアイメージ格納部302に保存する(ステップS104a、S104b)。
When the
リソースマネージャ103のサーバ起動処理機能部204は、IPアドレスやネットマスク、DNSサーバなどのIPアドレスなどのネットワーク設定、バッファサイズや同時接続数などミドルウェアやOSのパラメータなど、サーバ130の起動前に変更する必要がある個別設定情報を、サーバIDが「SV1」と「SV2」のサーバ130上の起動エージェント301に渡すと(ステップS105a、105b)、サーバIDが「SV1」と「SV2」のサーバ130上の起動エージェント301は、個別設定・データ格納部303にその個別設定情報を格納する(ステップS106a、106b)。
The server startup
その後、サーバIDが「SV1」と「SV2」のサーバ130の起動エージェント301は、計算処理機能部304に対してソフトウェアイメージと個別設定情報を用いてブートするように指示する。計算処理機能部304はブート後サービス「A」を提供するサーバ130として動作する。
Thereafter, the
このように、サービス「A」を提供するサーバ130が設定されると、サーバ状態監視機能部205のサーバ状態情報は、図6に示すように、リソースプール120内の6個のサーバ130(サーバIDが「SV1」〜「SV6」)のうち、サーバIDが「SV1」、「SV2」のサーバ130がサービス「A」の実行中となり、他のサーバは、待機中となる。
As described above, when the
次に、同様の手順で、サービス「B」の起動要求保守コマンドに対して、それぞれ、サーバIDが「SV4」,「SV6」上でサービス「B」を提供するサーバ130を起動すると、図7において、ステップS201〜ステップS206a、S206bに示すような処理が行われ、図8で示すような状態となる。このときのサーバ状態監視機能部205のサーバ状態情報は、図9に示すように、リソースプール120内の6個のサーバ130(サーバIDが「SV1」〜「SV6」)のうち、サーバIDが「SV1」,「SV2」のサーバ130がサービス「A」の実行中となり、サーバIDが「SV4」,「SV6」のサーバ130がサービス「B」の実行中となり、他のサーバは、待機中となる。
Next, when the
続いて、この状態からサービス「B」をスケールアウトする手順について述べる。図10は、サービス「B」をスケールアウトするときの処理を示すシーケンス図である。 Next, the procedure for scaling out service “B” from this state will be described. FIG. 10 is a sequence diagram illustrating processing when the service “B” is scaled out.
リソースマネージャ103は、管理インタフェース経由でサービス「B」のスケールアウト要求の保守コマンドを受け取ると(ステップS301)、リソースマネージャ103のサーバ起動処理機能部204は、サーバ状態管理機能部203の情報を参照し、待機中のサーバ130を一つ選出する(ステップS302)。その選出方法としては、待機中状態のサーバ130を無作為に一つ選出する、テーブルのエントリーを順に確認していく中で最初に発見されたものを選出する等の単純な方法の他、サーバ起動処理機能部204が実ネットワークトポロジやリソースプール120内のサーバ130の物理的位置を把握しており、その情報を基に、現用中のサーバ130に対して最も通信遅延が少ないと判断できる(例えば、同一のハブに接続されている、または直接ネットワークケーブルで接続されている、など)サーバ130を選択するような方法も考えられる。
When the
ここでは、待機中のサーバ130の中から、サーバIDが「SV5」のサーバ130がスケールアウトを行うサーバとして選ばれたとする。この場合、サーバIDが「SV5」のサーバ130は、イメージ「B」のソフトウェアイメージの転送が必要となる。通常のサーバ起動要求では、リソースマネージャ103のサーバ起動処理機能部204は、ソフトウェアイメージ管理機能部202からサービス「B」の実行に必要なソフトウェアイメージをサーバIDが「SV5」のサーバ130に直接転送しているが、スケールアウト時には、サーバ起動処理機能部204は、直接ソフトウェアイメージの転送を行わず、サービス「B」を提供しているサーバがイメージ「B」の断片を転送を要求する。
Here, it is assumed that the
すなわち、この場合には、リソースマネージャ103のサーバ起動処理機能部204は、既にイメージ「B」を保有しているサーバ130(サーバID=SV4,SV6)に対して、起動エージェント301にイメージ「B」の断片をそれぞれ転送するように指示する(ステップS303a、303b)。
That is, in this case, the server activation
イメージ「B」を保有しているサーバ130(サーバID=SV4,SV6)は、指示されたイメージ「B」の断片をサーバIDが「SV5」のサーバ130に転送する(ステップS304a、304b)。その際に、各サーバ130が転送する断片の量は、等分である方法と重み付けを行うような方法が考えられる。等分に転送する場合、イメージ「B」の容量が1GBであったとすると、サーバIDが「SV4」のサーバ130がイメージ「B」の先頭から半分である500MBまでのデータを、サーバIDが「SV6」のサーバ130がイメージ「B」の半分から末尾までの500MBをそれぞれサーバIDが「SV5」のサーバ130に対して転送する。
The server 130 (server ID = SV4, SV6) holding the image “B” transfers the instructed fragment of the image “B” to the
重み付けを行うような場合は、静的な各サーバの情報を用いる方法と動的に各サーバの処理負荷を考慮する方法が考えられる。前者は、各サーバが平均的に行っている処理負荷および有休資源(CPU時間、ネットワーク帯域など)を、事前にサーバ起動処理機能部204が把握していることを前提とし、後者は起動エージェント301の申告によってその時のサーバの処理負荷及び有休資源をサーバ起動処理機能部204が把握する。そして、サーバIDが「SV4」のサーバ130の有休資源がサーバIDが「SV6」のサーバ130に比べて例えば3倍多かった場合、イメージ「B」の容量を1GBとすると、サーバIDが「SV4」のサーバ130は先頭から750MBを、サーバIDが「SV6」のサーバ130は残りの250MBを断片としてサーバIDが「SV5」のサーバ130に転送する。
When weighting is performed, a method of using static information of each server and a method of dynamically considering the processing load of each server can be considered. The former is based on the premise that the server activation
サーバIDが「SV5」のサーバ130の起動エージェント301は、受信したイメージ「B」をソフトウェアイメージ格納部302に保存する(ステップS305)。そして、リソースマネージャ103のサーバ起動処理機能部204は、IPアドレスやネットマスク、DNSサーバなどのIPアドレスなどのネットワーク設定、バッファサイズや同時接続数などミドルウェアやOSのパラメータなど、サーバ130の起動前に変更する必要がある個別設定情報を、サーバIDが「SV5」のサーバ130上の起動エージェント301に渡すと(ステップS306)、サーバIDが「SV5」のサーバ130上の起動エージェント301は、個別設定・データ格納部303にその個別設定情報を格納する(ステップS307)。
The
その後、サーバIDが「SV5」のサーバ130の起動エージェント301は、計算処理機能部304に対してソフトウェアイメージと個別設定情報を用いてブートするように指示する。計算処理機能部304はブート後サービス「B」を提供するサーバ130として動作する。
Thereafter, the
スケールアウト時には、ステップS301〜ステップS307に示すような処理が行われ、図11で示すような状態となる。このときのサーバ状態監視機能部205のサーバ状態情報は、図12に示すように、リソースプール120内の6個のサーバ130(サーバIDが「SV1」〜「SV6」)のうち、サーバIDが「SV1」,「SV2」のサーバ130がサービス「A」の実行中となり、サーバIDが「SV4」,「SV5」,「SV6」のサーバ130がサービス「B」の実行中となり、他のサーバは、待機中となる。
At the time of scale-out, processing as shown in steps S301 to S307 is performed, and a state as shown in FIG. 11 is obtained. The server status information of the server status
以上のように、スケールアウト時にリソースマネージャ103にソフトウェアイメージの転送負荷をかけないことにより、複数のサービスのスケールアウトを同時に高速に行うことが可能となる。
As described above, it is possible to simultaneously scale out a plurality of services at high speed by not applying a software image transfer load to the
本発明は、上述した実施形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。 The present invention is not limited to the above-described embodiments, and various modifications and applications can be made without departing from the gist of the present invention.
101:保守者端末
102:クラスタシステム
103:リソースマネージャ
110:管理ネットワーク
120:リソースプール
130:サーバ
140:利用者端末
150:保守ネットワーク
160:サービスネットワーク
201:管理インタフェース
202:ソフトウェアイメージ管理機能部
203:サーバ状態管理機能部
204:サーバ起動処理機能部
205:サーバ状態監視機能部
301:起動エージェント
302:ソフトウェアイメージ格納部
303:データ格納部
304:計算処理機能部
101: maintenance person terminal 102: cluster system 103: resource manager 110: management network 120: resource pool 130: server 140: user terminal 150: maintenance network 160: service network 201: management interface 202: software image management function unit 203: Server state management function unit 204: Server activation processing function unit 205: Server state monitoring function unit 301: Activation agent 302: Software image storage unit 303: Data storage unit 304: Calculation processing function unit
Claims (9)
前記リソースマネージャは、所定のサービスを行うためのサーバを追加するスケールアウトの要求があると、前記複数のサーバの中から待機状態にあるサーバをスケールアウトを行うサーバとして選出すると共に、前記複数のサーバの中で前記所定のサービスを既に作動している複数のサーバに対して前記所定のサービスのソフトウェアイメージの断片の転送を指示する手段を有し、
前記ソフトウェアの転送を指示された複数のサーバは、前記所定のサービスのソフトウェアイメージの断片を前記スケールアウトを行うサーバとして選出されたサーバに転送する手段を有し、
前記スケールアウトを行うサーバとして選出されたサーバは、前記ソフトウェアの転送を指示された複数のサーバから転送されてきた所定のサービスのソフトウェアイメージを受信して保存する手段を有する
ことを特徴とするクラスタシステム。 In a cluster system comprising a plurality of servers that provide services and a resource manager that manages the plurality of servers,
When there is a request for scale-out to add a server for performing a predetermined service, the resource manager selects a server in a standby state from among the plurality of servers as a server to perform scale-out, and Means for instructing a plurality of servers already operating the predetermined service in the server to transfer a piece of the software image of the predetermined service;
The plurality of servers instructed to transfer the software includes means for transferring a piece of software image of the predetermined service to a server selected as the server that performs the scale-out,
The server selected as the server to perform the scale-out has means for receiving and storing a software image of a predetermined service transferred from a plurality of servers instructed to transfer the software. system.
所定のサービスを行うためのサーバを追加するスケールアウトの要求があると、前記リソースマネージャが、前記複数のサーバの中から待機状態にあるサーバをスケールアウトを行うサーバとして選出すると共に、前記複数のサーバの中で前記所定のサービスを既に作動している複数のサーバに対して前記所定のサービスのソフトウェアイメージの断片の転送を指示する工程と、
前記ソフトウェアの転送を指示された複数のサーバが、前記所定のサービスのソフトウェアイメージの断片を前記スケールアウトを行うサーバに転送する工程と、
前記スケールアウトを行うサーバが、前記ソフトウェアの転送を指示された複数のサーバから転送されてきた所定のサービスのソフトウェアイメージを受信して保存する工程と
を含むことを特徴とするスケールアウト方法。 In a cluster system scale-out method comprising a plurality of servers for providing services and a resource manager for managing the plurality of servers,
When there is a scale-out request to add a server for performing a predetermined service, the resource manager selects a server in a standby state from the plurality of servers as a server to perform scale-out, and the plurality of the plurality of servers. Instructing a plurality of servers already operating the predetermined service in the server to transfer a piece of the software image of the predetermined service;
A plurality of servers instructed to transfer the software, transferring a piece of software image of the predetermined service to the server performing the scale-out;
A scale-out method comprising: a server performing the scale-out receiving and storing a software image of a predetermined service transferred from a plurality of servers instructed to transfer the software.
サービス実行に必要なソフトウェアイメージを管理する手段と、
前記複数のサーバの稼働状態を監視する手段と、
所定のサービスを行うためのサーバを追加するスケールアウトの要求があると、前記複数のサーバの中から待機状態にあるサーバをスケールアウトを行うサーバとして選出すると共に、前記複数のサーバの中で前記所定のサービスを既に作動している複数のサーバに対して、前記スケールアウトを行うサーバに前記所定のサービスのソフトウェアイメージの断片を転送することを要求する手段と
を備えることを特徴とするリソースマネージャ装置。 In a resource manager device for configuring a cluster system from a plurality of servers that provide services and a resource manager that manages the plurality of servers,
A means of managing software images required for service execution;
Means for monitoring operating states of the plurality of servers;
When there is a request for scale-out to add a server for performing a predetermined service, a server in a standby state is selected as a server to perform scale-out from among the plurality of servers, and the server among the plurality of servers is selected. Means for requesting a plurality of servers already operating a predetermined service to transfer a piece of a software image of the predetermined service to a server that performs the scale-out. apparatus.
ソフトウェアイメージの断片の転送及び取得を行う手段と、
ソフトウェアイメージの格納手段と、
個別設定情報の格納手段とを備え、
他のサーバがスケールアウトを行うサーバとして設定されると、前記リソースマネージャの指示により、前記ソフトウェアイメージの格納手段に格納されているソフトウェアイメージの断片を前記スケールアウトを行うサーバに転送し、
当該サーバがスケールアウトを行うサーバとして選定されると、既に所定のサービスを作動している他の複数のサーバから転送されてくるソフトウェアイメージを取得し、前記ソフトウェアイメージの格納手段に格納する
ことを特徴とするサーバ装置。 In a server device for configuring a cluster system from a plurality of servers that provide services and a resource manager that manages the plurality of servers,
Means for transferring and obtaining pieces of software images;
Software image storage means;
Storage means for individual setting information,
When another server is set as a server to be scaled out, according to an instruction from the resource manager, a piece of software image stored in the software image storage means is transferred to the server to be scaled out,
When the server is selected as a server to be scaled out, a software image transferred from a plurality of other servers already operating a predetermined service is acquired and stored in the software image storage means. A server device as a feature.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010119499A JP5551967B2 (en) | 2010-05-25 | 2010-05-25 | Cluster system, cluster system scale-out method, resource manager device, server device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010119499A JP5551967B2 (en) | 2010-05-25 | 2010-05-25 | Cluster system, cluster system scale-out method, resource manager device, server device |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011248521A JP2011248521A (en) | 2011-12-08 |
JP5551967B2 true JP5551967B2 (en) | 2014-07-16 |
Family
ID=45413718
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010119499A Expired - Fee Related JP5551967B2 (en) | 2010-05-25 | 2010-05-25 | Cluster system, cluster system scale-out method, resource manager device, server device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5551967B2 (en) |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10334058A (en) * | 1997-05-27 | 1998-12-18 | Shikoku Nippon Denki Software Kk | On-line system and load dispersing system |
JP4266786B2 (en) * | 2003-11-19 | 2009-05-20 | 株式会社日立製作所 | Information processing system and information processing apparatus |
-
2010
- 2010-05-25 JP JP2010119499A patent/JP5551967B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2011248521A (en) | 2011-12-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6005795B2 (en) | Reliable deterministic live migration of virtual machines | |
CN108737270B (en) | Resource management method and device for server cluster | |
US7996525B2 (en) | Systems and methods for dynamically provisioning cloud computing resources | |
TWI559153B (en) | Distributed computing framework | |
US20170031622A1 (en) | Methods for allocating storage cluster hardware resources and devices thereof | |
JP5557689B2 (en) | Network system | |
US20130061220A1 (en) | Method for on-demand inter-cloud load provisioning for transient bursts of computing needs | |
WO2016030973A1 (en) | Multi-tenant resource coordination method | |
KR101474872B1 (en) | Method for elastic virtual cluster management for efficient construction of virtual clusters on cloud, apparatus for elastic virtual cluster management and cloud system using the same | |
US9104488B2 (en) | Support server for redirecting task results to a wake-up server | |
CN115665147A (en) | Data plane API in a distributed computing network | |
US20230069240A1 (en) | Dynamic cloning of application infrastructures | |
US8458702B1 (en) | Method for implementing user space up-calls on java virtual machine before/after garbage collection | |
JP5151509B2 (en) | Virtual machine system and virtual machine distribution method used therefor | |
CN106911741B (en) | Method for balancing virtual network management file downloading load and network management server | |
JP5667506B2 (en) | Cluster system and software update method | |
Wang et al. | Provision of storage QoS in distributed file systems for clouds | |
JP5444257B2 (en) | Software image distribution method, repository apparatus, server, and system | |
JP5551967B2 (en) | Cluster system, cluster system scale-out method, resource manager device, server device | |
US11571618B1 (en) | Multi-region game server fleets | |
Liu et al. | Improving resource utilization of a cloud-based testing platform for android applications | |
JP6870390B2 (en) | Resource allocation method, connection management server and connection management program in a system based on a virtual infrastructure | |
JP6657910B2 (en) | Band setting method, band setting program, information processing apparatus and information processing system | |
JP4034712B2 (en) | Network system, distributed processing method and program | |
US11571619B1 (en) | Cross-region management of game server fleets |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20121004 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20130605 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20130725 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20131030 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20131105 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131226 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140520 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140523 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5551967 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |