WO2004092971A1 - Server allocation control method - Google Patents

Server allocation control method

Info

Publication number
WO2004092971A1
WO2004092971A1 PCT/JP2003/004679 JP0304679W WO2004092971A1 WO 2004092971 A1 WO2004092971 A1 WO 2004092971A1 JP 0304679 W JP0304679 W JP 0304679W WO 2004092971 A1 WO2004092971 A1 WO 2004092971A1
Authority
WO
Grant status
Application
Patent type
Prior art keywords
quantity
network
servers
predicted
service
Prior art date
Application number
PCT/JP2003/004679
Other languages
French (fr)
Japanese (ja)
Inventor
Yasuhiro Kokusho
Satoshi Tutiya
Tsutomu Kawai
Original Assignee
Fujitsu Limited
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network-specific arrangements or communication protocols supporting networked applications
    • H04L67/10Network-specific arrangements or communication protocols supporting networked applications in which an application is distributed across nodes in the network
    • H04L67/1002Network-specific arrangements or communication protocols supporting networked applications in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers, e.g. load balancing
    • H04L67/1004Server selection in load balancing
    • H04L67/1008Server selection in load balancing based on parameters of servers, e.g. available memory or workload
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L29/00Arrangements, apparatus, circuits or systems, not covered by a single one of groups H04L1/00 - H04L27/00 contains provisionally no documents
    • H04L29/02Communication control; Communication processing contains provisionally no documents
    • H04L29/06Communication control; Communication processing contains provisionally no documents characterised by a protocol
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network-specific arrangements or communication protocols supporting networked applications
    • H04L67/10Network-specific arrangements or communication protocols supporting networked applications in which an application is distributed across nodes in the network
    • H04L67/1002Network-specific arrangements or communication protocols supporting networked applications in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers, e.g. load balancing
    • H04L67/1004Server selection in load balancing
    • H04L67/1012Server selection in load balancing based on compliance of requirements or conditions with available server resources
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L29/00Arrangements, apparatus, circuits or systems, not covered by a single one of groups H04L1/00 - H04L27/00 contains provisionally no documents
    • H04L29/02Communication control; Communication processing contains provisionally no documents
    • H04L29/06Communication control; Communication processing contains provisionally no documents characterised by a protocol
    • H04L29/0602Protocols characterised by their application
    • H04L29/06047Protocols for client-server architecture
    • H04L2029/06054Access to distributed or replicated servers, e.g. using brokers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network-specific arrangements or communication protocols supporting networked applications
    • H04L67/10Network-specific arrangements or communication protocols supporting networked applications in which an application is distributed across nodes in the network
    • H04L67/1002Network-specific arrangements or communication protocols supporting networked applications in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers, e.g. load balancing

Abstract

Allocation of the servers in a data center to network services is automatically conducted by a load distributing device on real time without any manual operation. The variation in the quantity of requests arriving at each network service is monitored, the value of the quantity of requests after a predetermined elapsed time is predicted. Depending on the magnitude of the request quantity predicted value, the allocation quantity of servers to the network service can be controlled. The quantity of servers allocated to the network service is so determined that the average of response times to user terminals is a response time threshold or less predetermined by the operation manager when a traffic of a quantity indicated by the request quantity predicted value arrives at the network service. The server group can include a requisite minimum number of servers necessary for the operation of the network services so that it is judged whether or not the response times based on the predicted value are in a predetermined range each time the a server is added or eliminated.

Description

サーバ割当制御方法 技術分野 Server allocation control method TECHNICAL FIELD

本発明は、 ネットワークサービスを提供する複数のサーバが一定水準の応答 時間を達成するために、 そのネットワークサービスに割り当てるサーバ群の構 成を動的に変更する方法に関する。 The present invention, since a plurality of servers that provide network services to meet the response time of the predetermined level, to a method of dynamically changing the configuration of the servers to be assigned to that network service. 背景技術 BACKGROUND

現在インターネット等のネットワークを介して多様なネットワークサービス が提供されている。 Various network services currently through a network such as the Internet are provided. このネットワークサービスを提供する事業者である、 イン ターネットサービスプロバイダ(ISP)、 アプリケーションサービスプロバイダ (ASP)等のいわゆるサービスプロバイダ(xSP)は、 ネットワークサービスを提供 するためのサーバの維持、 管理を自社で行わず、 データセンタ事業者に外部委 託する場合がある。 It is a company that provides this network service, Internet service provider (ISP), the so-called service provider such as an application service provider (ASP) (xSP), the maintenance of the server to provide network services, the management company not done in, there is a case in which Takusuru external committee to data center operators.

データセンタ事業者は、 自社のデータセンタに複数のサーバを有し、 その一 部をネットワークサービス毎に割り当てる。 Data center operators have a plurality of servers in their data center, assign the part for each network service. すなわちネットワークサービズ毎 に複数のサーバからなるサーバ群が形成され、 ネットワークサービスへのサー ビス要求が対応するサーバ群に所属するいずれかのサーバにより処理される。 That is formed server group including a plurality of servers for each network service's, service requests to network services are processed by any of the servers belonging to the corresponding server group. またデータセンタ事業者は、 各 xSP との契約において信頼性、 保守性、 可用性 やサービス利用者への応答時間等のサービスレベルを一定水準以上に保証する。 The data center operators, reliability in agreement with each xSP, serviceability, to guarantee the service level of response time, such as to the availability and service users above a certain level. ネットワークサービスに割り当てられるサーバ台数が多すぎると、 稼働率の 低いサーバが存在することになり、 サーバの有効活用が図られない。 When the number of servers that are assigned to the network service is too large, will be underutilized servers exist, effective utilization of the server is not achieved. 逆に、 サ ーバ台数が少なすぎるとサービスレベルを一定以上に保証することができない。 On the other hand, it can not be guaranteed and servers the number is too small a service level higher than a certain level. また、 サーバに対する負荷は、 ネットワークに接続された複数の利用者端末か らのサービス要求数に応じて増減し時々刻々と変動するため、 データセンタで 提供されるネットワークサービスが複数であれば、 ネットワークサービス間で 負荷の大小に差が生じる。 Also, load on the server, in order to change and increases or decreases every moment depending on the number of service requests plurality of user terminals or we connected to the network, if the network services provided by the data center a plurality of networks difference in the magnitude of the load occurs between services. そこでデータセンタ事業者は、 保証したサービスレ ベルを下回らない程度に、 負荷の軽いネットワークサービスに割り当てられた サーバ、 あるいは未使用のサーバを負荷の重いネットワークサービスに再配置 することでサーバ群の構成を変更し、 保有するサーバを有効活用する。 Where the data center operators, so as not to fall below the service level which guarantees the configuration of the servers by relocating lightly loaded network service server assigned to, or the unused servers on the heavy network service load change the, to effectively use the server to be held.

このような構成変更を可能とするために、 データセンタ事業者はデータセン タ事業者の有する複数のサーバの前段に負荷分散装置を設置し、 その負荷分散 装置の設定を変更することで、 特定のサーバをあるネットワークサービスを提 供するサーバ群に追加し、 逆にあるネットワークサービスを提供するサーバ群 から特定のサーバを削除する。 To enable such configuration change, the data center operators set up load balancer in front of a plurality of servers included in the data center operators, by changing the setting of the load balancer, the specific the added network services in the server Hisage the servers to provide, to remove a specific server from servers that provide network services in reverse. また負荷分散装置は、 予め設定された振分率に 応じて、 利用者端末からのサービス要求を振り分けることで、 サーバ群に所属 するサーバへの負荷を分散させることも行う。 The load balancer, according to a preset distribution ratio, by distributing the service request from the user terminal, also performed to disperse the load on the servers belonging to the server group.

負荷分散装置の設定は、 データセンタの運用管理者の経験や判断に基づいて 手動で変更されたり、 また現在の動作状況に応じて (CPU稼働率から) サー ビスレベルが一定水準以上であるかが判定され、 負荷分散装置の設定が自動的 に変更されるものが提案されている (特許文献 1参照)。 Configuring load balancer or changed manually on the basis of the experience and judgment operations manager of the data center, also Do is in accordance with the current operating conditions (from the CPU operation rate) service level is above a certain level is determined, the setting of the load balancer have been proposed to be automatically changed (see Patent Document 1).

しかしながら、 ネットワークサービスへの負荷は時間帯や季節的要因、 人為的 要因などによって複雑に変動し、 その変動はネットワークサービス毎に異なるた め、 従来の負荷分散装置の設定を手動で設定する方法において、 運用管理者がそ の経験や判断だけでその変動パターンを正確に予測することは困難である。 However, the load time of day and seasonal factors to network services, varies intricately depending on the human factor, because the variation which differs for each network service, the method for setting the configuration of a conventional load balancer manually , it is difficult to predict the variation pattern in exactly the only operations manager pixels of experience and judgment. また、 従来の方法は、 負荷分散装置の設定を人手によらずリアルタイムに自動的に行う ことを可能にするものではあるが、 より多くのサーバを将来必要とするのか、 そ れともより少ないサーバで済むのか判断せずに、 現在の動作状況と設定されたサ 一ビスレベルのみに応じてサーバが割り当てられる。 Further, the conventional method is the setting of the load balancer is intended to enable the automatic be performed in real time without hands, or to require future more servers, less than both that its server without determine need for, the server is assigned in accordance with only the current operating status and the set mono Bisureberu. 従って、 現在の動作状況に 応じて割り当てられたサーバが必ずしも将来において最適なものとはなっていな いという課題を有していた。 Therefore, there is a problem that the assigned server you have not been necessarily optimal in the future in accordance with the current operating conditions.

(特許文献 1 ) 特開 2 0 0 2— 2 4 1 9 2号公報 発明の開示 Disclosure of (Patent Document 1) JP-2 0 0 2 2 4 1 9 2 JP invention

本発明の目的は、 ネットワークサービスに割り当てられた複数のサーバの構成 を利用者端末からの要求数に応じて動的に制御することを可能にする方法および プログラムを提供することにある。 An object of the present invention is to provide a method and a program makes it possible to dynamically controlled in accordance with arrangement of a plurality of assigned network service server to the number of requests from the user terminal. また、 各ネットワークサービスに到着する要 求数の変動の様子から、 一定時間経過後の到着要求数を予測し、 その予測値に応 じて各ネットワークサービスに対するサーバの割り当てを制御する方法およびプ 口グラムを提供することにある。 Further, the variation state of the request number to arrive at each network service, to predict the number of arriving requests after a predetermined time has elapsed, method and flop port to control the allocation of server for response Ji with each network service on the predicted value It is to provide a gram.

上記目的は、 ネットワークに接続された複数の利用者端末と、 前記ネットヮー クに接続され、 前記複数の利用者端末からの要求を処理する複数のサーバを含む サーバ群を有するネットワークシステムにおける前記サーバ群の台数調整方法で あって、 所定時間毎の前記複数の利用者端末からの要求数を蓄積し、 蓄積された 過去の要求数に基づいて、 時間と要求数の特性を関数として求め、 前記関数に将 来の時間を代入して将来の要求数を予測し、 前記複数の利用者端末からの要求数 が所定の確率分布に従うと仮定した場合の前記複数のサーバ 1台あたりの平均応 答時間と要求数の関係式に、 前記予測された要求数を代入して前記複数のサーバ The above object is achieved by a plurality of user terminals connected to the network, connected to the Nettowa click, the servers in the network system having a server group including a plurality of servers to handle requests from the plurality of user terminals a of number adjustment method, accumulating the number of requests from said plurality of user terminals for every predetermined time, based on the number of requests previously stored, seek time and the number of requests properties as a function, the function to predict the number of future requests by substituting the future time, the plurality of average response time per one of the plurality of servers when the number of requests from the user terminal is assumed to follow a predetermined probability distribution and the number of requests relationship, said by substituting the number of predicted request of the plurality of servers

1台あたりの第一の平均応答時間を求め、 前記第一の平均応答時間が正の値であ りかつ予め設定された閾値以下の範囲に含まれるかを判定し、 前記判定の結果に 応じて前記サーバ群に含まれるサーバの台数を増減させることを特徴とするサー バ群の台数調整方法を提供する請求の範囲 1に記載の発明により達成される。 It obtains a first average response time per one, determines whether said first average response time is included in the positive value Der Li Kui preset the range threshold, depending on the result of the determination the is achieved by the invention according to claim 1, wherein providing a server group number adjustment method characterized by increasing or decreasing the number of servers included in the server group Te. また、 上記目的は、 請求の範囲 1において、 前記判定の結果、 前記平均応答 時間が前記範囲に含まれる場合、 (a)前記サーバ群に含まれるサーバを 1台選択 し、 (b)前記選択されたサーバを除外したサーバ群を仮定し、 (c)前記仮定され たサーバ群に含まれる複数のサーバ 1台あたりの第二の平均応答時間を求め、 (d)前記第二の平均応答時間が前記範囲に含まれるか判定する新たな判定を行 い、 (e)前記新たな判定の結果、 前記第二の平均応答時間が前記範囲に含まれる 場合、 前記選択されたサーバを前記サーバ群の構成から除外する、 ことを特徴 とするサーバ群の台数調整方法を提供する請求の範囲 2に記載の発明により達 成される。 The above-described object, in claim 1, wherein, the result of the determination, if the average response time is included in the range, selecting one of the server included in the server group (a), (b) the selection has been assumed servers excluding the server, (c) the sought assumed per one plurality of servers included in the server group second average response time, (d) the second average response time There have line a new decision to determine if contained in the range, (e) the new result of the determination, if the second average response time is included in the range, the server group the selected server excluded from the configuration of, made it reaches the invention according to claim 2, wherein providing a number adjusting method of servers, characterized in that.

また、 上記目的は、 請求の範囲 2において、 前記 (e)の後、 再び前記 (a)から 前記 (e)を繰り返し行い、 前記新たな判定の結果、 前記第二の平均応答時間が前 記範囲に含まれなくなるまで、 前記サーバ群に含まれる複数のサーバを 1台ず つ構成から除外することを特徴とするサーバ群の台数調整方法を提供する請求 の範囲 3に記載の発明により達せされる。 The above-described object, in the range 2 claims, after the (e), repeatedly said (e) again from the (a), the result of the new determination, the second average response time of the previous SL range until that is no longer included in the is achieved by the invention according to claim 3, wherein providing a number adjusting method of a server group is characterized by excluding from one not a one constituting the plurality of servers included in the server group that.

また、 上記目的は、 請求の範囲 1において、 さらに、 前記ネットワークに接 続された複数の未使用サーバを含む未使用サーバ群を有し、 前記判定の結果、 前記平均応答時間が前記範囲に含まれなレ、場合、 前記未使用サーバ群に含まれ るサーバを 1台選択し、 前記選択されたサーバを前記サーバ群に追加すること を特徴とするサーバ群の台数調整方法を提供する請求の範囲 4に記載の発明に より達成される。 The above-described object, in claim 1, wherein, further comprising an unused server group including a plurality of unused servers that are connected to the network, the result of the determination is the average response time included in the range Renare, if the unused select one server that is part of the server group, the selected server claims to provide a number adjusting method of a server group, which comprises adding to the servers more is achieved to the invention described in the scope 4.

また、 上記目的は、 請求の範囲 4において、 (f)前記選択されたサーバが追加 された後の新たなサーバ群において、 該新たなサーバ群に含まれる複数のサー バ 1台あたりの第三の平均応答時間を求め、 (g)前記第三の平均応答時間が前記 範囲に含まれるか判定する新たな判定を行い、 (h)前記新たな判定の結果、 前記 第三の平均応答時間が前記範囲に含まれない場合、 前記未使用サーバ群に含ま れるサーバを 1台選択し、 (i)前記選択されたサーバを前記新たなサーバ群に追 加し、 前記 (i)の後、 再び前記 (f)から前記 (i)を繰り返し行い、 前記新たな判定 の結果、 前記第三の平均応答時間が前記範囲に含まれるまで、 前記サーバ群に' 前記未使用サーバ群に含まれるサーバを 1台ずつ追加することを特徴とするサ ーバ群の台数調整方法 The above-described object, in the range 4 claims, (f) said in the new group of servers after the selected server is added, the third per multiple servers included in the new servers the average seek response time, is (g) said third average response time makes a new decision to determine if contained in the range, (h) the results of the new determination, the third average response time If not included in the range, the server included in the unused servers select one, add the new server group the server that is the selected (i), after the (i), again said repeatedly performed (f) from said (i), the new result of the determination until said third average response time is included in the range, the server included in 'the unused servers on servers servers group number adjustment method characterized by adding one by one を提供する請求の範囲 5に記載の発明により達成される。 It is achieved by the invention according to claim 5, wherein providing a. また、 上記目的は、 ネットワ^"クに接続された複数の利用者端末と、 前記ネッ トワークに接続され、 前記利用者端末からの要求を処理する複数のサーバを含む サーバ群と、 前記ネットワークに接続され、 所定時間毎の前記利用者端末からの 要求数と前記要求数の振分率と前記サーバ群の構成情報とを蓄積する蓄積手段を 含む負荷分散装置と、 前記ネットワークに接続された資源割当制御装置を有する ネットワークシステムにおける資源割当制御装置に、 前記負荷分散装置に蓄積さ れた過去の要求数に基づいて、 時間と要求数の特性を関数として求めさせ、 前記 関数に将来の時間を代入して将来の要求数を予測させ、 前記複数の利用者端末か らの要求数が所定の確率分布に従うと仮定した場合の前記複数のサーバ 1台あた りの平均 The above-described object includes a plurality of user terminals connected to networks ^ "click, is connected to the network, a server group including a plurality of servers to handle requests from the user terminal, the network connected, load balancer and, resources connected to the network including a storage means for storing the configuration information of the server group and the request number and the request number of the distribution rate from the user terminal for each predetermined time the resource allocation control device in a network system having allocation control unit, the load balancer based on the number of requests previously stored in, let seek time and the number of requests properties as a function, a future time in the function assignment and by predicting the number of future requests, the plurality of servers one per Rino average when the number of requests of the plurality of user terminals or we were assumed to follow a predetermined probability distribution 答時間と要求数の関係式に、 前記予測された要求数を代入して前記複 数のサーバ 1台あたりの第一の平均応答時間を求めさせ、 前記第一の平均応答時 間が正の値でありかつ予め設定された閾値以下の範囲に含まれるかを判定させ、 前記判定の結果に応じて前記サーバ群に含まれるサーバの台数を増減させるよう 前記構成情報を変更させることを特徴とするプログラムを提供する請求の範囲 6 に記載の発明により達成される。 The response time and the requested number of relations, the allowed predicted by substituting the number of requests seeking first average response time per server of the multiple, the first average response time is positive and wherein the value a is and is determined either included in the preset the range threshold, changing the configuration information so as to increase or decrease the number of servers included in the server group according to the determination result It is achieved by the invention according to claim 6, wherein providing the program.

また、 上記目的は、 請求の範囲 6において、 前記判定の結果、 前記平均応答時 間が前記範囲に含まれる場合、(a)前記サーバ群に含まれるサーバを 1台選択させ、 (b)前記選択されたサーバを除外したサーバ群を仮定させ、(c)前記仮定されたサー バ群に含まれる複数のサーバ 1台あたりの第二の平均応答時間を求めさせ、 (d) 前記第二の平均応答時間が前記範囲に含まれるか判定する新たな判定を行わせ、 (e)前記新たな判定の結果、 前記第二の平均応答時間が前記範囲に含まれる場合、 前記選択されたサーバを前記構成情報から削除させる、 ことを特徴とするプログ ラムを提供する請求の範囲 7に記載の発明により達成される。 The above-described object, in the range 6, wherein said result of the determination, if the average response time is included in the range, (a) server to select one that is included in the server group, (b) the is assumed servers excluding the selected server, (c) allowed obtains the assumed second average response time per plural servers included in the server group and, (d) the second mean allowed response time is made a new decision to determine if contained in the range, (e) the new result of the determination, if the second average response time is included in the range, the selected server is deleted from the configuration information, it is achieved by the invention described in the scope 7 of claims to provide a program, characterized in that.

また、 上記目的は、請求の範囲 7において、前記 (e)の後、再び前記 (a)から前記 (e)を行い、 前記新たな判定の結果、前記第二の平均応答時間が前記範囲に含まれ なくなるまで、 前記サーバ群に含まれる複数のサーバを 1台ずつ前記構成情報か ら削除させることを特徴とするプログラムを提供する請求の範囲 8に記載の発明 により達成される。 The above-described object, in the range 7 claims, after the (e), is carried out again said (a) from said (e), the result of the new determination, the second average response time of the range until included disappears, the achieved by the invention described in the scope 8 claims provides a program for causing said configuration information delete from the plurality of servers one by one that is included in the server group.

また、 上記目的は、 請求の範囲 6においてく さらに、 前記ネットワークに接続 された複数の未使用サーバを含む未使用サーバ群を有し、 前記判定の結果、 前記 平均応答時間が前記範囲に含まれない場合、 前記未使用サーバ群に含まれるサー バを 1台選択させ、 前記選択されたサーバを前記構成情報に追加させることを特 徴とするプログラムを提供する請求の範囲 9に記載の発明により達成される。 The above-described object is further gradually at a range 6 claims, have unused server group including a plurality of unused server connected to the network, the determination result, the average response time is included in the range If no, the unused to select one of the servers included in the server group, by the invention described the selected server in the range 9 claims to provide a program to feature that is added to the configuration information It is achieved. また、 上記目的は、 請求の範囲 9において、 (f)前記選択されたサーバが追カロ された後の新たなサーバ群において、 該新たなサーバ群に含まれる複数のサー バ 1台あたりの第三の平均応答時間を求めさせ、 (g)前記第三の平均応答時間が 前記範囲に含まれるか判定する新たな判定を行わせ、 (h)前記新たな判定の結果、 前記第三の平均応答時間が前記範囲に含まれない場合、 前記未使用サーバ群に 含まれるサーバを 1台選択させ、 (i)前記選択されたサーバを前記新たなサーバ 群に追加させ、 前記 (i)の後、 再び前記 (f)から前記 (i)を行わせ、 前記新たな判 定の結果、 前記第三の平均応答時間が前記範囲に含まれるまで、 前記構成情報 に前記未使用サーバ群に含まれるサーバを 1台ずつ追加させることを特徴とす るプログラムを提 The above-described object, in the range 9 claims, (f) in the new servers after the selected server is additionally Caro, first of per multiple servers included in the new servers let determine the third average response time, (g) said to perform a new determination third average response time to determine whether included in the range, (h) the new determination result, the third average If the response time is not included in the range, the server included in the unused servers to select one, (i) by adding the selected server to the new server group wherein, after said (i) , included again said from (f) to perform the (i), the new determine constant results, until said third average response time is included in the range, the unused servers on the configuration information Hisage a program that is characterized in that to add a server one by one する請求の範囲 1 0に記載の発明により達成される。 It is achieved by the invention described in the scope 1 0 of claims to. 図面の簡単な説明 BRIEF DESCRIPTION OF THE DRAWINGS

図 1は、本発明の実施形態におけるシステム全体の構成例を説明する図である。 Figure 1 is a diagram illustrating an example of the overall configuration of a system according to an embodiment of the present invention. 図 2は、 負荷分散装置の構成例を示すブロック図である。 Figure 2 is a block diagram showing an example of the load balancer.

図 3は、利用者端末として使用される携帯電話、 PDA等の携帯端末の構成例を 示すブロック図である。 Figure 3 is a mobile phone that is used as a user terminal, is a block diagram showing a configuration example of a mobile terminal such as a PDA.

図 4は、 サーバの構成例を示すブロック図である。 Figure 4 is a block diagram showing an example of the configuration of the server.

図 5は、 負荷分散装置の RAMに格納されるサーバ群構成情報のデータ構成例 を示す図である。 Figure 5 is a diagram showing an example data configuration of a server group configuration information stored in the RAM of the load balancer.

図 6は、 負荷分散装置の RAMに格納される統計情報のデータ構成例を示す図 である。 Figure 6 is a diagram showing a data configuration example of the statistical information stored in the RAM of the load balancer.

図 7は、 資源割当制御装置の RAMに格納されるデータセンタ構成情報のデー タ構成例を示す図である。 Figure 7 is a diagram illustrating a data configuration of the data center configuration information stored in the RAM of the resource allocation control unit.

図 8は、資源割当制御装置の RAMに格納される、基準ク口ック周波数の CPU を搭載したサーバが毎秒処理する要求数をアプリケーション毎に格納した表のデ ータ構成例を示す図である。 Figure 8 is a view showing stored in the RAM of the resource allocation control unit, the data structure example of a table the number of requests stored in each application that reference clock port Tsu servers with clock frequency of the CPU to process per second is there.

図 9は、 サーバ群新規作成処理を説明するフローチャートである。 Figure 9 is a flowchart illustrating a server group New treatment.

図 1 0、 図 1 1は、 サーバ割当調整処理を説明するフローチャートである。 1 0, 1 1 is a flow chart illustrating a server allocation adjustment process. 図 1 2は、 最小二乗法を利用した予測の方法を説明する図である。 Figure 1 2 is a diagram for explaining a method of prediction using the least squares method. 発明を実施するための最良の形態 BEST MODE FOR CARRYING OUT THE INVENTION

以下、 本発明の実施の形態について図面に従って説明する。 It will be described below with reference to drawings, embodiments of the present invention. しかしながら、 本 発明の技術的範囲はかかる実施の形態に限定されるものではない。 However, the technical scope of the present invention is not limited to such embodiments.

本発明の実施形態を、 本発明の方法が適用されるシステム全体の構成例、 前記 システムに含まれる装置の構成例、 前記システムに含まれる装置に格納されるデ ータ構成例、 本発明の方法を説明する動作フローの順に説明する。 The embodiments of the present invention, a configuration example of the entire system in which the method of the present invention is applied, an example configuration of a device included in the system, data configuration example that is stored in the apparatus included in the system, the present invention illustrating the method in the order of the operation flow for explaining. まず本発明の 方法が適用されるシステム全体の構成例を説明する。 First will be described an example of the overall configuration of a system in which the method of the present invention is applied. 図 1は、 本発明の実施形態におけるシステム全体の構成例を説明する図であ る。 Figure 1 is a Ru FIG der illustrating a configuration example of the entire system in the embodiment of the present invention. 本発明の実施形態では簡単化のために、 ネ—ットワークサービスを提供する サーバはすべてウェブサーバが稼動するサーバとして説明する。 For simplicity in the embodiment of the present invention, Ne - server providing Tsu network service is described all as a server web server is running. 利用者端末は 閲覧したいホームページァドレスを含む httpリクエストをサービス要求として 送信し、 ウェブサーバは該当するホームページアドレスに対応するコンテンツ を利用者端末に送信する。 User terminal sends an http request containing the home page § dress you want to view as a service request, the web server sends the content corresponding to the appropriate home page address to the user terminal.

まず、 複数の利用者端末 1とデータセンタ 3内の複数のサーバ 1 0を接続す るネットワーク 2が存在する。 First, the network 2 that connects a plurality of servers 1 0 of the plurality of user terminals 1 and the data center 3 is present. ネットワーク 2は、 有線、 無 f泉を問わない。 Network 2 is not wired or non-f Izumi. ネ Vトワーク 2は LAN (Local Area Network)でも WAN (Wide Area Network)でも、 また、 ネットワーク 2は LANや WANを相互接続したィンターネットでも構わな い。 Ne V network 2 but LAN (Local Area Network) even WAN (Wide Area Network), also, the network 2 is not such may be in the I Internet interconnected the LAN or WAN.

利用者端末 1 と しては PC (パーソナルコンピュータ)や携帯電話、 PDA (Personal Digital Assistant)等の携帯端末が利用される。 It is a user terminal 1 PC (personal computer) or a mobile phone, a portable terminal such as a PDA (Personal Digital Assistant) is used. データセンタ 3 内の複数のサーバ 1 0は、 提供するネットワークサービス毎にグループ化され る。 A plurality of servers 1 in the data center 3 0, Ru are grouped for each network service provided.

例えば、 図 1にはネットワークサービスを提供するサーバ群 7 〜 7 3が存在 し、 サーバ群 7い 7 2はウェブサーバとして別々のネットワークサービスを提 供する。 For example, servers 7 to 7 3 to provide a network service exists in FIG. 1, the server group 7 have 7 2 provides separate network services as a web server. サーバ群 7 3はどのネットワークサービスにも割り当てられていない未 使用サーバ群である。 Server group 7 3 are unused servers that are not assigned to any network service. データセンタ内の複数のサーバ 1 0はそれぞれ、 センタ 内 LAN 6に接続される。 Each of the plurality of servers 1 0 in the data center, is connected to the center within the LAN 6. センタ内 LA 6は、 無線、 有,線を問わない。 Center in LA 6 may be either radio, Yes, a line.

利用者端末 1から送信される要求を、 その要求に対応するネットワークサー ビスを提供するサーバ群に所属するサーバ 1 0が処理し、 結果を利用者端末に 応答することでネットワークサービスが提供される。 The request sent from the user terminal 1 the network service is provided by the server 1 0 belonging to a server that provide processing the network services that correspond to the request, and responds the results to the user terminal . 例えば、 サーバ群 7 Α 社のホームページコンテンツを提供するものであれば、 利用者端末からの閲覧 要求 (http リクエスト) として A社のホームページアドレスを送信した利用者 端末に対して、 サーバ群 7! For example, if the present invention is to provide a home page content of the server group 7 Α, Inc., a user browsing request from the terminal to the user terminal that sent the A's home address as (http request), the server group 7! のいずれかのサーバがそのァドレスに対応するコン テンッを送信する。 One of the servers transmits the con Ten' corresponding to the Adoresu.

また、 データセンタ内のサーバの前段には負荷分散装置 4が備えられ、 その 負荷分散装置 4はセンタ内 LAN 6とネットワーク 2に接続される。 Further, in front of the servers in the data center provided with a load balancer 4, the load balancer 4 is connected to the center within the LAN 6 and the network 2. 負荷分散装置 4は、 利用者端末からの要求に対応するサーバ群を決定し、 そのサーバ群に所 属するサーバの負荷を特定のサーバに集中させないために、 後述する振分率に 応じて、 利用者端末からの要求を振り分ける。 Load balancer 4, in which the user determines the server group corresponding to a request from the terminal, not to concentrate the load on the servers belonging place to the servers on a particular server, depending on the split ratio to be described later, use It distributes the request from the terminal.

さらに、 負荷分散装置 4は、 ネットワーク 2を介して送信される要求 (http リクエスト) の個数をサーバ群 7ごとに一定時間間隔で集計し統計情報として 蓄積する。 Further, the load balancer 4, accumulates the number of request (http request) sent via the network 2 as an aggregate and statistical information at regular time intervals for each server group 7. また、 他にサーバ群 7に所属させるサーバ 1 0を追加、 削除してサ ーバ群 7の構成を制御するための資源割当制御装置 5がセンタ内 LAN 6に接続 される。 Also, adding a server 1 0 to belong to the server group 7 to another, the resource allocation control unit 5 for controlling the configuration of the servers group 7 is connected to the LAN 6 center delete.

なお、 図 1では、 図示しないが負荷分散装置 4とネットワーク 2の間にグー トウエイ、ルータ、ファイアウォール等を備えた構成とすることも可能である。 In FIG. 1, goo between but not shown in the load balancer 4 and the network 2 Toei, routers, it is also possible to adopt a configuration having a firewall or the like. また、 同じく図示しないが、 サーバの内部に備えられたハードディスクで不足 の場合、 サーバ 1 0の外部にディスクアレイ等の蓄積装置が接続されていても よい。 Further, likewise not shown, in the case of insufficient hard disk provided in the interior of the server, storage device, such as a disk array in an external server 1 0 may be connected.

次に図 1のシステムに含まれる装置の構成例を説明する。 Next will be described a configuration example of a device included in the system of FIG.

図 2は、 負荷分散装置 4の構成例を示すブロック図である。 Figure 2 is a block diagram showing an example of the load balancer 4. CPU 2 1は負荷分 散装置 4における制御を実行する。 CPU 2 1 executes a control in load balancing device 4. ROM (Read Only Memory) 2 2には、 負荷分散 装置 4の初期化時に実行されるプログラムや初期化に必要なデータ、 初期化時 に RAM 2 3に転送される制御プログラムが記録される。 ROM (Read Only Memory) 2 2, the program and initialization required for the data to be performed during initialization of the load balancer 4, a control program that is transferred during initialization to RAM 2 3 are recorded.

RAM (Random Access Memory) 2 3には、 制御プログラムや制御プログラム実行 時の作業結果等のデータが格納される。 The RAM (Random Access Memory) 2 3, data of the work results and the like at the time of the execution control program and a control program are stored. 通信装置 2 4は、 ネットワーク 2ゃセ ンタ内 LAN 6と接続するためのインタフェースを備え、ネットワーク 2やセンタ 内 LAN 6を介して接続された装置とのデータの送受信を可能にする。 The communication device 2 4 includes an interface for connecting to the network 2 Yase printer in LAN 6, to allow transmission and reception of data between the connected devices via the network 2 and center the LAN 6. これら力 図 2のように接続線 2 5により接続される。 They are connected by a connecting line 2 5 As these forces Figure 2.

図 3は、利用者端末 1として使用される携帯電話、 PDA等の携帯端末の構成例 を示すブロック図である。 Figure 3 is a mobile phone that is used as the user terminal 1 is a block diagram showing a configuration example of a mobile terminal such as a PDA. CPU 3 1は携帯端末における制御を実行する。 CPU 3 1 executes the control in the portable terminal. R0M 3 2には、 携帯端末の初期化時に実行されるプログラムや初期化に必要なデータ、 初期化時に MM 3 4に転送される制御プログラムが記録される。 The R0M 3 2, data necessary for program and initialization performed during initialization of the portable terminal, the control program to be transferred at initialization to MM 3 4 is recorded.

RAM 3 4には、 制御プログラムや制御プログラム実行時の作業結果等のデータ 力 S格納される。 The RAM 3 4, is the data power S stores the work results and the like at the time of the execution control program and a control program. 通信装置 3 5は、ネットワーク 2やセンタ内 LM 6と接続するた めのインタフェースを備え、ネットワーク 2やセンタ内 LAN 6を介して接続され た装置とのデータの送受信を可能にする。 The communication device 3-5 comprises an interface order to connect to the network 2 and the center in the LM 6, to allow transmission and reception of data between the connected devices via the network 2 and center the LAN 6.

入力装置 3 6は、 キーパッドやペン型入力装置等であり、 利用者が各種命令 やデータの入力に使用する。 The input device 3 6 is a key pad or pen-type input device, a user uses to input various instructions and data. 表示装置 3 3は、液晶画面等であり、利用者に CPU 3 1の制御結果等を表示する。 Display device 3 3 is a liquid crystal screen or the like, and displays the CPU 3 1 of the control results and the like to the user. これら力 図 3のように接続線 3 7により接続 される。 They are connected by a connecting line 3 7 As these forces Figure 3.

図 4は、 資源割当制御装置 5の構成例を示すブロック図である。 Figure 4 is a block diagram showing a configuration example of the resource allocation control unit 5. CPU 4 1は資 源割当制御装置 5における制御を実行する。 CPU 4 1 executes a control in resource allocation control device 5. ROM 4 2には、 資源割当制御装置 5 の初期化時に実行されるプログラムや初期化に必要なデータが格納される。 The ROM 4 2, data necessary for program and initialization performed during initialization of the resource allocation control unit 5 is stored. ハ 一ドデイスク 4 6には、 資源割当制御装置 5を制御するための OS (Operating System)ゃデータが格納される。 The Haiti Dodeisuku 4 6, OS for controlling the resource allocation control unit 5 (Operating System) Ya data is stored.

RAM 4 5には、 OS実行時の作業結果等のデータが格納される。 The RAM 4 5, data of the work results and the like at the time of OS execution is stored. 通信装置 4 8は、 ネットワーク 2やセンタ内 LAN 6と接続するためのィンタフェースを備え、ネッ トワーク 2やセンタ内 LA 6を介して接続された装置とのデータの送受信を可 能にする。 Communication device 4-8 comprises a I interface for connecting to the network 2 and center the LAN 6, the transmission and reception of data to and from a device connected via a network 2 and the center in LA 6 in possible.

入力装置 4 7は、 キーボ一ドゃマウス等であり、 利用者が各種命令やデータ の入力に使用する。 The input device 4-7 is keyboards one de Ya mouse, the user uses to input various instructions and data. 表示装置 4 3は、液晶モニタや CRT等であり、利用者に CPU の制御結果等を表示する。 Display device 4 3 is a liquid crystal monitor or CRT, and displays control results and the like of the CPU to the user. 光学ドライブ 4 4は、 CDや DVD、 M0といったメディ ァへのデータ書き込み、 あるいは読み出しに使用される。 Optical drive 4 4 ​​is used for data writing or reading, to a CD or DVD, M0 such media §.

ただし、 管理者がネットワークを介して接続されたサーバ 1 0から資源割当 制御装置 5にログインし遠隔操作ができるので、 入力装置 4 7、 表示装置 4 3 を備えていない構成でも構わない。 However, since the administrator can connect to a server 1 0 login remotely operated resource allocation control unit 5 via the network, an input device 4 7, it may be configured without a display device 4 3. なお、 サーバ 1 0や利用者端末 1として使 用される PCも、 その構成は、 図 4と同じである。 Even PC to be used as the server 1 0 and the user terminal 1, the configuration is the same as FIG.

次に、 システムに含まれる装置に格納されるデータ構成例を説明する。 Next, a data structure example which is stored in the device included in the system.

図 5は、負荷分散装置 4の MM 2 3に格納されるサーバ群構成情報のデータ構 成例を示す図である。 Figure 5 is a diagram showing a data usage scenario of server group configuration information stored in the MM 2 3 of the load balancer 4. サーバ群構成情報として、 サーバ群名 5 1、 代表 IPアド レス 5 2、 応答時間閾値 5 3、 所属サーバ情報であるサーバ名 5 4、 IP ァドレ ス 5 5、 振分率 5 6がサーバ群毎に格納される。 As servers configuration information, server group name 5 1, representative IP address 5 2, the response time threshold 5 3, server name 5 4 a division server information, IP Adore scan 5 5 split ratio 5 6 each server group It is stored in.

サーバ群名 5 1は、 サーバ群 7を特定するための管理名である。 Server group name 5 1 is the management name to identify the server group 7. 代表 IPアド レス 5 2は、 IPv4であれば 3 2ビット、 IPv6であれば 1 2 8ビットからなる数 字で、 そのサーバ群 7が提供するネットワークサービスのために外部に公開さ れる IP アドレスである。 Representative IP address 5 2 3 2 bits if IPv4, the number characters consisting of 1 2 8-bit, if IPv6, the IP address of the server group 7 is exposed externally for network services provided is there. すなわち、 サーバ群 7 が提供するネットワークサー ビスが利用される場合は、 利用者端末 1はサーバ群 7 の代表 IP アドレス 5 2 に対し要求 (httpリクエスト) を送信し、 サーバ群 7 2が提供するネットワーク サービスが利用される場合は、 利用者端末 1はサーバ群 7 2の代表 IPァドレス 5 2に対し要求を送信する。 That is, if the network services that the server group 7 is provided is used, the user terminal 1 transmits a request to the representative IP address 5 second server group 7 (http request), the server group 7 2 provides If the network service is available, the user terminal 1 transmits a request to the representative IP Adoresu 5 second server group 7 2.

代表 IPアドレス 5 2は、 グ口一バル IP了ドレスが使用されるが、 ネッ トヮ 一クサ一ビスが限られた組織内に対するものであればプライべ一ト IPアドレス が使用されることもできる。 Representative IP address 5 2 is grayed port one Val IP Ryo address is used, also one preparative IP address base ply as long as for the nets Wa one grasses one screw is limited in the tissue is used it can. 応答時間閾値 5 3は、 xSPがデータセンタとの契約 にあたり要求するサービスレベルの 1つで、 利用者端末 1への応答時間が応答 時間閾値' 5 3を下回らないようデータセンタ事業者はそのネットワークサービ スを提供するサーバ群 7にサーバ 1 0を割り当て、 データセンタ 3を管理する。 Response time threshold 5 3 is one of the service level xSP requires Upon agreement with the data center, user response time to the terminal 1 response time threshold '5 3 does not fall below as data center operators that network Assign the server 1 0 servers 7 to provide services, to manage the data center 3. 所属サーバ情報のサーバ名 5 4は、 各サーバ群 7に所属するサーバ 1 0を特 定するための管理名である。 Server Name 5 4 belongs server information is the server 1 0 belonging to the server group 7 a management name to specific. IPァドレス 5 5は、 サーバ名 5 4に対応するサー バの IP了ドレスである。 IP Adoresu 5 5 is an IP Ryo dress of the server corresponding to the server name 5 4. IPァドレス 5 5は、 プライべ一ト IPァドレスが使用 されるが、 保有するグローバル IPァドレスに余りがあるのであればグローバル IPアドレスが使用されることもできる。 IP Adoresu 5 5 is ply base one preparative IP Adoresu is used, it is also possible as long as there is a very global IP Adoresu held global IP address is used.

振分率 5 6は、 サーバ群 7の代表 IPアドレス 5 2に対する利用者端末 1から の要求を、 所属するサーバ 1 0が処理する割合である。 Split ratio 5 6 a request from the user terminal 1 for a representative IP address 5 second server group 7, which is the rate at which the server 1 0 processes belong. 負荷分散装置 4は、 こ のサーバ群構成情報を利用して、 利用者端末 1から送信される要求 (http リク エスト) のあて先 IPァドレスに一致する代表 IP了ドレスを検索してサーバ群 7を特定し、 そのサーバ群 7の所属サーバ情報の振分率 5 6を基にその要求を 処理するサーバを選択し、 その要求のあて先 IPァドレスを選択されたサーバの IP アドレス 5 5に変換することにより、 その要求を振分率を基に選択されたサ —パに転送する。 Load balancer 4 utilizes the server group configuration information of this, the user server group 7 to search a representative IP Ryo address that matches the destination IP Adoresu request transmitted from the terminal 1 (http requests) identified, that the the split ratio 5 6 affiliation server information of the server group 7 select the server to handle the request based on, it converts the IP address 5 5 of the server to the selected destination IP Adoresu of the request Accordingly, it selected the request based on the split ratio was Sa - transferring the path.

例えば、 図 5 は、 2つのサーバ群に関する情報が格納されている。 For example, FIG. 5, information on the two servers are stored. サーバ 群 Aは代表 IPアドレス 5 2が GIP1で、応答時間閾値 5 3力 ST 1、サーバ名 5 4 が WEB- A、 WEB- B、 WEB- C、 WEB- Dなる 4台のサーバが所属し、 IPアドレス 5 5は それぞれ PIP1、 PIP2、 PIP3、 PIP4、 振分率 5 6はそれぞれ 0. 5、 0. 3、 0. 1、 0. 1 である。 The server group A representative IP address 5 2 GIP1, response time threshold 5 3 forces ST 1, the server name 5 4 WEB- A, WEB- B, WEB- C, WEB- D consists of four servers belong each IP address 5 5 PIP1, PIP2, PIP3, PIP4, split ratio 5 6 each 0.5, 0.3, 0.1, and 0.1. すなわち、 1 0回の要求の内、 5回は WEB - A力 3回は WEB-B力 1 回は WEB-Cが 1回は WEB Dが処理することになる。 That is, of the 1 0 single request, five times WEB - A force three times WEB-B force once WEB-C once will be WEB D processes. 図 5には、 同様にサーバ群 Bの代表 IPアドレス 5 2や、 所属する 3台のサーバについての情報が格納され ている。 FIG 5, and a representative IP address 5 second server group B as well, information about the three belonging server is stored.

図 6は、負荷分散装置 4の RAM 2 3に格納される統計情報のデータ構成例を示 す図である。 Figure 6 is a view to view the data structure of the statistical information stored in the RAM 2 3 of the load balancer 4. 統計情報として、 到着した要求数を一定時間間隔で集計した値が サーバ群毎に格納される。 As statistical information, a value obtained by aggregating the number of arriving requests at regular time intervals is stored in each server group. 例えば、 図 6では、 毎秒の到着要求数が格納され、 時間 6 1 Ί〜Τ 2の間にサーバ群 Aに R u個の要求力 サーバ群 Bに R 21個の要求が 到着したことが格納される。 For example, in FIG. 6, contains the number of arriving requests per second, store that R 21 amino request arrives in R u number of requests force server group B in server group A during time 6 1 Ί~Τ 2 It is. 最新データは図 6の下方に追加される。 Latest data is added in the lower of FIG. こうして 現在時刻から見て直前 n秒分 ( nは自然数) の到着要求数 6 2の情報が格納さ れる。 In this way just before n seconds when viewed from the current time (n is a natural number) is stored arrival request number 6 2 information.

図 7は、資源割当制御装置 5の RAM 4 5に格納されるデータセンタ構成情報の データ構成例を示す図である。 Figure 7 is a diagram showing a data configuration example of a data center configuration information stored in the RAM 4 5 resource allocation control device 5. データセンタ構成情報には、 ネットワークサー ビスに割り当てられていない未使用サーバを含めた各サーバ 1 0のサーバ名 7 1、 IP アドレス 7 2、 CPU クロック速度 7 3、 所属サーバ群名 7 4が格納され る。 The data center configuration information, the network service server name 71 of the server 1 0, including the unused servers not assigned to screws, IP address, 7 2, CPU clock speed 7 3, affiliation server group name 7 4 stores Ru is. サーバ名 7 1、 IPアドレス 7 2については、 図 5のサーバ名 5 4、 IPアド レス 5 5と同じである。 The server name 7 1, IP address 7 2, the same as the server name 5 4, IP address 5 5 of FIG.

CPUクロック速度 7 3は、 サーバ 1 0に搭載された CPU 4 1のクロック周波数 を基準ク口ック周波数で割った値が格納される。 CPU clock speed 7 3, the value obtained by dividing the CPU 4 1 clock frequency which is mounted on the server 1 0 reference clock-locking frequency is stored. 本発明の実施形態においては、 基準ク口ック周波数を 1 GHzとする。 In embodiments of the present invention, a reference clock-locking frequency is 1 GHz. サーバ 1 0に搭載されたク口ック周波数が 基準クロック周波数の何倍かが CPU クロック速度 7 3からわかる。 Many times one of the click-locking frequency of the reference clock frequency, which is installed in the server 1 0 can be seen from the CPU clock speed 7 3. 複数の CPU 4 1を搭載しているサーバ 1 0については、 クロック周波数の合計値を基準ク ロック周波数で割つた値が格納される。 The server 1 0 mounted with the plurality of CPU 4 1, divided ivy value the total value of the clock frequency at the reference clock frequency is stored.

基準ク口ック周波数 ( 1 GHz) の CPUを搭載したサーバにおける平均要求処理 数を とすれば、 CPUクロック速度 7 3の値に //を掛けた値が、そのサーバにお ける平均要求処理数として算出される。 If the average required processing speed in mounting the server CPU of reference clock-locking frequency (1 GHz), a value obtained by multiplying the // the value of the CPU clock speed 7 3, Keru Contact to the server average required processing It is calculated as the number. 所属サーバ群名 7 4は、 各サーバ名 7 1のサーバ 1 0が所属するサーバ群 7を特定する。 Affiliation server group name 7 4 identifies the server group 7 server 1 0 belongs to each server name 7 1.

図 5のサーバ群構成情報と異なりデータセンタ構成情報には未使用サーバの 情報も格納される。 The server group configuration information and different data center configuration information of FIG. 5 is also stored information unused server. 例えば、 図 7では、 サーバ名 7 1が WEB- H、 WEB- 1、 WEB- J、 WEB- Kの 4台のサーバが未使用サーバであることがわかる。 For example, in Figure 7, the server name 7 1 WEB- H, WEB- 1, WEB- J, WEB- 4 servers of K is found to be unused server.

図 8は、資源割当制御装置 5の RAM 4 5に格納される、基準クロック周波数( 1 GHz) の CPU 4 1を搭載したサーバが毎秒処理する要求数を Webサーバソフト 8 1毎に格納した表のデータ構成例を示す図である。 Figure 8 is a table for storing is stored in the RAM 4 5 resource allocation control unit 5, CPU 4 1 equipped with servers of the reference clock frequency (1 GHz) is the number of requests processed per second in the Web server software 8 per example configuration of the data shows a. 例えば、 図 8では、 ウェブ サーバソフトとしてアプリケーション を使用した場合、 基準ク口ック周波数 ( 1 GHz)の CPU 4 1を搭載したサーバに複数の httpリクエストを送信した結果、 毎秒 個の要求が処理され、 アプリケーション A nを使用した場合、 基準クロッ ク周波数の CPU 4 1を搭載したサーバに複数の httpリクエストを送信した結果、 毎秒 c n個の要求が処理されることがわかる。 For example, in FIG. 8, when using the application as a web server software, reference clock-locking frequency (1 GHz) CPU 4 1 As a result of sending multiple http requests equipped with servers of every second number of requests processed is, when using the application a n, the result of sending multiple http requests CPU 4 1 reference clock frequency equipped with server, it can be seen that every second c n pieces of request is processed. このデータは事前に収集され、 予 め資源割当制御装置に入力される。 This data is collected in advance, it is inputted into the pre-Me resource allocation controller.

次に、 本発明の方法を説明する動作フローについて説明する。 Next, the operation flow for explaining a method of the present invention.

図 9は、 サーバ群新規作成処理を説明するフローチャートである。 Figure 9 is a flowchart illustrating a server group New treatment. 新たなネ ットワークサービスを提供する場合、 まずそのネットワークサービスを提供す るサーバ群が定義されないと運用が開始されない。 When providing a new Netw network service, first operation and servers that provide the network service is not defined is not started. そこで本処理が実行される。 The present process is executed. まず資源割当制御装置 5は、 サーバ群新規作成要求を受信する (S 9 1 )。 First resource allocation control unit 5 receives the server group New request (S 9 1). 通 常サーバ群 7の新規作成は、 運用管理者の発意によるものであり、 ここでは、 運用管理者が資源割当制御装置 5に備えられた入力装置 4 7にて入力したコマ ンドが受信される。 Creating a new normal server group 7 is by initiative of the operations manager, here, command input operation manager at the input device 4 7 provided in the resource allocation control unit 5 is received . コマンドの引数として、 新規作成するサーバ群の名前、 割 り当てるサーバの初期台数、 応答時間閾値も合わせて受信する。 As an argument to the command, the name of the server group to create a new, initial number of servers to assign, also receives along with response time threshold.

次に、 新規作成するサーバ群名、 割り当てるサーバの初期台数、 応答時間閾 値を記憶する (S 9 2 )。 Next, server group name to create a new, initial number of servers to be allocated, storing the response time threshold value (S 9 2). ステップ S 9 2は、 コマンドの引数として受信したこ れらの情報を資源割当制御装置 5に備えられた RAM 4 5に一時的に格納する。 Step S 9 2 temporarily stores in RAM 4 5 provided in the resource allocation control unit 5 to these information received as the argument of a command. 次に、 新規作成されたサーバ群にステップ S 9 1で受信した初期台数分のサ —バを追加するようデータセンタ構成情報を更新する (S 9 3 )。 Then, the initial number of times corresponding to the number of sub received in step S 9 1 to servers newly created - updates the data center configuration information to add the server (S 9 3). ステップ S 9 3は、 図 7のデータセンタ構成情報において、 所属サーバ群名 7 4が 「未使用」 となっているサーバのエントリからステップ S 9 1で受信した初期台数分のサ ーバを選択し、 選択されたサーバの所属サーバ群名 7 4の欄をステップ S 9 1 で受信した新規作成するサーバ群の名前に変更すればよい。 Step S 9 3, in the data center configuration information of FIG. 7, select the servers of the initial number fraction received from the entry of the server belonging server group name 7 4 is "not used" in Step S 9 1 and it may be changed to the column of affiliation server group name 7 4 of the selected server to the name of the server group to be newly created received in step S 9 1. そして、 新規作成したサーバ群に割り当てるべき代表 IPアドレスと、 サーバ 群に属する各サーバの振分率を決定する (S 9 4 )。 Then, to determine a representative IP address to be assigned to a server group that has been newly created, the split ratio of the servers belonging to the server group (S 9 4). 代表 IPァドレスと振分率 は負荷分散装置 4に設定されるが、 資源割当制御装置 5にて決定する。 Representative IP Adoresu and split ratio is set to the load balancer 4, but is determined by the resource allocation control device 5.

代表 IPアドレスの決定は、 資源割当制御装置 5のハードディスク内に (専ら 代表 IPァドレスとして使用されるために) 記憶されている未使用 IPァドレス の集合の中から任意の一つを選び出すことによって行う。 Determination of the representative IP address is performed by picking out one arbitrary from a set of unused IP Adoresu being (for the used exclusively as a representative IP Adoresu) stored in the resource allocation control unit 5 of the hard disk . 振分率の初期値の決 定法は、 振分率の和が 1であれば、 特に制限がないため、 例えば、 1をステツ プ S 9 1で受信した初期台数で割った をそれぞれのサーバの振分率として決 定すればよい。 Determine titration of the initial value of the distribution ratio, if the sum of the split ratio is 1, because there is no particular limitation, for example, each server divided by the initial number which has received the 1 Sutetsu flop S 9 1 it may be determine as the split ratio.

ステップ S 9 4が済むと、負荷分散装置に新たな構成情報を送信し(S 9 5 )、 サーバ群新規作成処理を終了する。 Step S 9 4 requires only transmits the new configuration information to the load balancer (S 9 5), and terminates the servers New treatment. ステップ S 9 5では、 ステップ S 9 2で記 憶された新規作成するサーバ群名、 代表 IPアドレス、 応答時間閾値、 ステップ S 9 3で選択された初期台数分のサーバ名、 そしてステップ S 9 4で決定され た振分率が資源割当制御装置により負荷分散装置に送信される。 In step S 9 5, Step S 9 2 at remembers been server group name to be newly created, a representative IP address, the response time threshold, Step S 9 3 Initial number of times corresponding to the number of the server name selected by, and Step S 9 4 in the determined distribution ratio is sent to the load balancer by the resource allocation control unit.

サーバ群を新規作成する場合は図 9の処理が実行されるが、 既存のサーバ群 に所属するサーバがネットワークサービスを提供するために最適かを判定する ために、 資源割当制御装置 5は次のサーバ割当調整処理を行う。 When creating a new server group is the process of FIG. 9 is performed, in order determine optimal for servers belonging to the existing servers to provide network services, resource allocation control unit 5 of the following perform a server allocation adjustment process. ここでは、 サ ーバ群の処理能力を測る数値として CPU クロック周波数を使用し、 サーバ群の 処理能力を向上させるために単純にサーバの台数を増加させるものとする。 Here, using the CPU clock frequency as a number to measure the servers group capacity, and those that increase the number of simply servers in order to improve the server group throughput. 図 1 0、 図 1 1は、 サーバ割当調整処理を説明するフローチャートである。 1 0, 1 1 is a flow chart illustrating a server allocation adjustment process. 資源割当制御装置 5は定期的にサーバ割当調整処理を実行し、 各ネットワーク サービスを提供するサーバ群に割り当てられたサーバが最適かを判定する。 Resource allocation control unit 5 periodically executes the server allocation adjustment process determines whether a server assigned to the server group best to provide each network service. 本 処理の前に予め図 8の表データが入力されているものとする。 In advance before the present processing table data in Fig. 8 is assumed to be input.

まず、ネットワークサービスを提供するサーバ群を 1つ選択する(S 1 0 1 )。 First selects one server that provide network services (S 1 0 1). 資源割当制御装置 5は、 図 7のデータセンタ構成情報の所属サーバ群名 7 4を 参照し、 「未使用」 以外のサーバ群名を 1つ選択する。 Resource allocation controller 5 refers to the affiliation server group name 7 4 data center configuration information of FIG. 7, selects one server group name other than "unused".

そしてステップ S 1 0 1で選択されたサーバ群の 6 0秒後の到着要求数を予 測する (S 1 0 2 )。 And the number of arrival request after 6 0 seconds Step S 1 0 1 selected by the server group to predict (S 1 0 2). ステップ S 1 0 2では、 まず、 資源割当制御装置 5力 負 荷分散装置 4に対し、 ステップ S 1 0 1で選択されたサーバ群の最新 3 0 0秒 3 004679 In Step S 1 0 2, first, to the resource allocation control unit 5 force load balancer 4, the latest 3 0 0 seconds 3 selected server group in Step S 1 0 1 004 679

分の到着要求数を要求し、 負荷分散装置 4は、 図 6の統計情報を参照し、 対応 するサーバ群の最新 3 0 0秒分の到着要求数 6 2を資源割当制御装置 5に送信 する。 Requesting the partial number of arrival request, load balancer 4 refers to the statistical information in Figure 6, and transmits the latest 3 0 0 seconds arrival request 6 2 of the corresponding servers in the resource allocation control unit 5 . そして、 現在から 6 0秒後の到着要求数を、 取得した 3 0 0秒分の到着 要求数を基に最小二乗法を利用し予測する。 Then, the number of arrival request after 6 0 seconds from the current, using the least squares method based on the number of arrival request acquired 3 0 0 seconds prediction.

図 1 2は、最小二乗法を利用した予測の方法を説明する図である。 Figure 1 2 is a diagram for explaining a method of prediction using the least squares method. 図 1 2は、 横軸に時間 (秒)、 縦軸に到着要求数 (個) を取り、 3 0 0秒分のデータを, 1秒 間隔で座標平面にプロットする。 1 2, the horizontal axis represents time (in seconds) and the vertical axis the arrival request count takes (number), the 3 0 0 seconds of data are plotted in the coordinate plane at one-second intervals. その座標平面上で、 プロットした各点から縦 軸方向の距離が最小となる直線を最小二乗法により求める。 On the coordinate plane, a straight line distance from each point plotted in the vertical axis direction is minimized determined by the least squares method.

即ち、 その直線を Y= c¾ *X+ i3と表した時の α、 ]3をそれぞれ求める。 That is, obtaining α when representing that linear and Y = c¾ * X + i3,] 3, respectively. そして求 められた直線の式に X= 6 0を代入したものが 6 0秒後の到着要求数の予測値で ある。 And those obtained by substituting X = 6 0 in the equation of the determined Me is linear is the predicted value of the arrival request number after 6 0 seconds. 計算された予測値が 0より小さくなる場合は、 6 0秒後の予測値は 0で あるとする。 If the calculated predicted value is smaller than 0, the predicted value after 6 0 seconds is assumed to be 0. なお図 1 2では、 各時間間隔の到着数を、 その時間間隔の中点に おける到着数としてプロットしてある。 In FIG. 1 2, the number of arrivals each time interval, is plotted as a definitive arrivals at the midpoint of the time interval.

なお、 ステップ S 1 0 2においては 6 0秒後の到着要求数を予測したが、 こ れに限定されるものではなく、 運用管理者の方針により決定することができる。 In the step S 1 0 2 was predicted number of arrival request after 6 0 seconds, but the invention is not limited to this, can be determined by the operations manager policies. また、 6 0秒後の到着要求数を予測するのに最新 3 0 0秒分のデータを使用し たが、 これに限定されるものではない。 Although we are using the data of the most recent 3 0 0 seconds to predict the number of arriving requests after 6 0 seconds, but is not limited thereto. 本実施形態では、 予測する将来時刻と 現在時刻との差の 5倍分のデータを目安として用いている。 In the present embodiment, using 5 times the data of the difference between the future time and the current time to predict as a guide.

図 1 0に戻り説明を続ける。 Figure 1 0 to return the description will be continued. 次に、,ステップ S 1 0 2で予測された到着要求 数に基づき、 ステップ S 1 0 1で選択されたサーバ群に所属するサーバ 1 台あ たりの 6 0秒後の平均応答時間 Tを算出する ( S 1 0 3 )。 Then ,, based on step S 1 0 2 Number arrival request that is predicted by, calculates the average response time T of the server 1 die or 6 0 seconds after belonging to the selected server group in Step S 1 0 1 to (S 1 0 3).

応答時間 Tは次式 (A) により算出される。 The response time T is calculated by the following formula (A).

ただし、 μはステップ S 1 0 1で選択されたサーバ群に所属するサーバで使用さ れる Webサーバソフトの基準ク口ック周波数における毎秒の平均要求処理数で あり、 図 8を参照すれば求まる値である。 However, mu is the average required number of processed per second in reference clock-locking the frequency of the Web server software used by servers belonging to the selected server group in Step S 1 0 1, obtained by referring to FIG. 8 is the value. Rは、 ステップ S 1 0 1で選択された サーバ群に対する 6 0秒後の到着要求数であり、 ステップ S 1 0 2で予測された 値である。 R is the number of arrival request after 6 0 seconds for the selected server group in Step S 1 0 1, a predicted value at step S 1 0 2. fiは、 ステップ S 1 0 1で選択されたサーバ群に所属する n台のサ ーバにおける i番目のサーバの相対クロック倍率であり、 図 7のデータセンタ構 成情報の CPUクロック速度 7 3から求まる値である。 fi is the relative clock multiplying the i th server in n number of servers belonging to the selected server group in Step S 1 0 1, a CPU clock speed 7 3 datacenter configuration information of FIG. 7 is a determined value.

式 (A) の導出法は以下の通りである。 Derivation of the formula (A) is as follows. ステップ S 1 0 1で選択されたサーバ 群全体を待ち行列理論における単一の窓口とすると、 その窓口における毎秒あた りの要求処理数は ∑Λ、 窓口への要求到着頻度は、 サーバ群全体に対する到着 要求数 Rとなる。 Step S 1 0 1 When a single window in the queuing theory has been an entire server group selected in every second per Rino request processing number in the window is Shigumaramuda, request arrival frequency to counter the entire server group the arrival number of requests R for.

待ち行列への要求到着がポアソンモデルに従うとすると、 到着した要求が待ち 行列の中で待たされる時間は、 When a request arrives to the queue and Poisson model, the time to wait in the arriving request queue,

P P

となる。 To become. ここで、 pは、 待ち行列理論における窓口稼働率であり、 任意の時点 において窓口がビジーである確率である。 Here, p is counter operating rate of queuing theory, the probability window is busy at any time.

ポアソンモデルにおいては、 pく 1の時に待ち行列が溢れない、 つまりどんな に時間が経過しても待ち行列の長さはある一定の長さ以下に保たれることが保証 されている。 In Poisson model, no overflow queue when p rather 1, that is, that the time for any is to be maintained is below a certain length with the length of the elapsed even queue is guaranteed. また、 この待ち日き間は、 ステップ S 1 0 1で選択されたサーバ群に 属するサーバの平均応答時間 τを意味する。 Moreover, during-out the waiting day means the average response time τ of the servers belonging to the selected server group in Step S 1 0 1. そこで、 前記サーバの平均応答時間 として最悪値をとると仮定すると、 pく 1であることから、 Therefore, assuming that take the worst value as the average response time of the server, since it is p rather 1,

とおくことができる。 It can be placed with. これが式 (A) である。 This is the formula (A).

なお、 ステップ S 1 0 1で選択されたサーバ群に属する i番目のサーバの応答 時間は以下のようにして導出できる。 Incidentally, Step S 1 0 1 response time of the i-th servers belonging to the selected servers in can be derived as follows. 前記サーバ群の i番目のサーバを待ち行列 理論における窓口とすると、 その窓口における毎秒あたりの要求処理数は、 f ; X μ、 窓口への要求数到着頻度は、 サーバ群全体に対する到着要求数 に、 i番 目のサーバの振分率 r;を掛けた r XRとなる。 If a window in the i-th wait for the server matrix theory of the servers, the request processing number per second at the window is f; X mu, Requests arrival frequency of the window is, the number of arrival request for the entire group of servers , the distribution of the i-th server r; the r XR multiplied by. 従って、 前述した式 (A) の導出手順と同様の導出法により、 前記サーバ群に 属する i番目のサーバの応答時間 1 は、 Therefore, the same derivation and derivation procedure of the formula (A) described above, the response time 1 of the i-th servers belonging to the server group,

^ ^ ~~ (Β) と求まる。 ^ ^ ~~ obtained and (Β).

そして、 ステップ S 103で算出された応答時間 Tが予め設定された応答時間 閾値 Tpに対し、 0≤T≤Tpを満たすか判定する (S 104) 。 Then, with respect to the response time threshold Tp response time T is set in advance, which is calculated in step S 103, determines whether satisfy 0≤T≤Tp (S 104). ステップ S 1 04で応答時間 Τがその範囲 (0≤T≤Tp) に入れば、 xSPとの契約において 保証したサービスレベルを満たしてはいるが、 もしかすると割り当てられたサー バが過剰であり、 サーバ削減の余地があるかもしれないことを意味する。 In Step S 1 04 in response time Τ is placed in that range (0≤T≤Tp), although the meet service level which guarantees in agreement with xSP, a excess server and assigned possibly, which means that there may be room for server reduction.

そこで、 ステップ S 104で応答時間 Tが所定の範囲内に入る場合、 そのサー バ群に所属する任意のサーバを 1台選択する (S 105) 。 Therefore, if the response time T in step S 104 is within a predetermined range, selecting one arbitrary servers belonging to the server group (S 105). そして、 ステップ S 105で選択されたサーバをステップ S 101で選択されたサーバ群から外した 構成を仮定し、 仮定した新たな構成において、 再度将来の応答時間 τを計算する Then, assuming a configuration disconnecting the server selected in step S 105 from the selected server group in step S 101, the assumed new configurations, calculating the τ again future response time

(S 106) 。 (S 106). ステップ S 106は、 ステップ S 103と同じく式 (A) を用い て算出できる。 Step S 106 may also calculated using the formula (A) and step S 103.

そして、 ステップ S 106で算出された応答時間が応答時間閾値 T に対し、 0≤T≤T を満たすか判定する(S 107)。 Then, with respect to the response time is the response time threshold T calculated in step S 106, determines whether satisfy 0≤T≤T (S 107). 仮定した新たな構成においては、 サーバが 1台減っているため、 分母の値が小さくなり、 応答時間 τは前回の計算 In the assumed new configurations, because the server is reduced one, the value of the denominator is decreased, the response time τ is previous calculation

, (ステップ S 103) より大きくなる。 , Greater than (Step S 103). 従って、 その大きくなつた値がまた 0≤ Τ≤Τρを満たせば、 サーバを 1台削除しても問題ないことになる。 Thus, satisfies the large Natsuta value is also 0≤ Tau≤tauro, thus not to delete one server problem.

そこで、 ステップ S 107で、 0 T≤Tpを満たす場合、 実際にステップ S 105で選択されたサーバを未使用サーバに追加し (S 108) 、 サーバの削減 を実行する。 Therefore, in step S 107, 0 if it meets T≤Tp, actually added to the unused server the selected server in step S 105 (S 108), executes the reduction of the server. ステップ S 108は、 図 7のデータセンタ構成情報において、 ステ ップ S 105で選択されたサーバに対応する所属サーバ群名 74を未使用に更新 することで、 ステップ S 101で選択されたサーバ群の構成からそのサーバを外 すことを意味する。 Step S 108, in the data center configuration information of FIG. 7, by updating the affiliation server group name 74 corresponding to the selected server stearyl-up S 105 in unused servers selected in step S 101 the server from the configuration refers to the outside Succoth of.

ステップ S 108が済むと、 さらなるサーバ削減の余地がないかを判定するた めステップ S 105に戻り処理を行う。 Step S 108 is completed, performs processing returns to fit the step S 105 was determined whether there is room for further server reduction. ステップ S 107で、 応答時間 Tが 0≤ T≤Tpを満たさない場合、 現在の構成が必要最小限であることがわかるため構 成変更を行わず、 次の処理に進み (図 11に移る) 、 振分率を算出する (S 10 9) 。 In step S 107, if the response time T does not satisfy the 0≤ T≤Tp, without changing configuration because it is understood that the current configuration is a necessary minimum, (Turning to Figure 11), the process proceeds to the next processing It calculates a distribution ratio (S 10 9).

図 11のステップ S 109では、 サーバ群に属する各サーバの振分率を後述す る方法で計算することにより、 同一サーバ群に属する各サーバの応答時間が互い に等しくなるようにする。 In step S 109 in FIG. 11, by calculating by how to later the split ratio of the servers belonging to the server group, the response time of each server belonging to the same server group is set to be equal to each other. 同一サーバ群に属する各サーバの応答時間がそろって いない場合、 サーバ群全体を平均して求めたサーバの平均応答時間は応答時間闘 値以下であっても、 一部のサーバの応答時間が応答時間閾値を越えてしまうこと がある。 If the response time of each server belonging to the same server group are not aligned, averaged across servers an average server response time determined is even less response time fighting value, the response time of some of the servers response it may exceed the time threshold. 従って、 同一サーバ群に属する各サーバの応答時間が互いに等しくなる ように、 各サーバの振分率を制御する必要がある。 Thus, as the response time of each server belonging to the same server group are equal to each other, it is necessary to control the split ratio of each server.

図 1 1のステップ S 109の振分率は、 式 (C) により算出される。 Split ratio of 1 1 of step S 109 is calculated by the equation (C).

^=-(1-^∑/,)+^ (c) ただし、 は i番目のサーバの振分率、 nはサーバ群に所属するサーバの台数、 μはステップ S 1 0 1で選択されたサーバ群に所属するサーバで使用される Webサーバソフトの基準ク口ック周波数における毎秒の平均要求処理数、 Rはス テツプ S 101で選択されたサーバ群全体に対する 60秒後の到着要求数であ り、 ステップ S 102で予測された値である。 ^ = - (1- ^ Σ /,) + ^ (c) However, the split ratio of the i-th server, n represents the number of servers belonging to the server group, mu is selected in step S 1 0 1 average required number of processing per second in reference clock-locking the frequency of the Web server software used by servers belonging to the server group, R represents the number of arrival request after 60 seconds for the entire a server group selected in the scan Tetsupu S 101 Ah is, a predicted value at step S 102. fiはステップ S 101で選択さ れたサーバ群に所属する n台のサーバにおける i番目のサーバの相対クロック 倍率であり、 図 7のデータセンタ構成情報の CPUクロック速度 73を参照すれ は まる。 fi is the relative clock multiplying the i th server in n number server belonging to the selected server group in step S 101, circles referring to CPU clock speed 73 of the data center configuration information of FIG.

式 (C) の導出法は以下の通りである。 Derivation of the formula (C) are as follows. 式 (B) より、 i番目のサーバの応答 時間 は、 The equation (B), the response time of the i-th server,

である。 It is. ここで、 n台のサーバの応答時間がすべて等しいと仮定すると、 Τ λ2 = ... =7 が成り立つから、 Here, the response time of the n number of servers is assumed that all equal, Τ λ = Τ 2 = ... = from 7 holds,

f^-r x R = f^-r 2 R= ... =/"〃一,'" R すなわち f ^ -r x R = f ^ -r 2 R = ... = / " 〃 one, '" R ie

¾二 + (/;. + /;) (D) が成り立つ。 ¾ two + (/ ;. + /;) (D) is satisfied.

式 (D) を変形し、 を で書き表すと、 Rearranging Equation (D), when expressed by the wo,

r x = J r x = J

Ή +|(/Β -Λ) = ^ +|(Λ Λ _ )= 'Ί + Λ - :) であるから、 結局 r t二 r fi一 f (E) が成り立つ。 Ή + | (/ Β -Λ) = ^ + | (Λ Λ _) = 'Ί + Λ - because it is :), eventually r t two r fi one f (E) is satisfied. 式 (E) の両辺を添え字について 1から nまでについて和を取る と、 Taking the sum for from 1 for subscript both sides of the equation (E) up to n,

であり であるから、 が以下のように求まる。 Since it is located in, but determined in the following manner.

^ = λ (ΐ-^∑( -Λ)) (F) そして、 式 (F) を式 (E) に代入すれば、 ひ一 έΛ) となり、 式 (C) が導出される。 ^ = Λ (ΐ- ^ Σ ( -Λ)) and (F), by substituting equation (F) into equation (E), shed one EL), and the formula (C) is derived.

ステップ S 10 9が済むと、 資源割当制御装置 5は新たな構成情報を負荷分散 装置 4に送信し、 負荷分散装置 4は受信した構成情報でサーバ群構成情報を更新 する (S 1 10) 。 Upon completion of step S 10 9, the resource allocation control unit 5 sends a new configuration information to the load balancer 4, the load balancer 4 updates the server group configuration information in the configuration information received (S 1 10). ステップ S 1 10は、 まず資源割当制御装置 5が、 ステップ S 1 0 1で選択されたサーバ群名、 図 7のデータセンタ構成情報を参照して得ら れるそのサーバ群に所属するサーバ名 7 1、 IPアドレス 7 2、 ステップ S 1 0 9で計算された振分率を負荷分散装置 4に送信する。 Step S 1 10, first the resource allocation control unit 5, step S 1 0 1 selected server group name, server name 7 belonging to the server group resulting et al are with reference to the data center configuration information of FIG. 7 1, IP address 7 2, transmits the calculated distribution ratio in step S 1 0 9 to the load balancer 4.

そして、 負荷分散装置 4が、 受信したサーバ群名に対応するサーバ所属情報を それぞれ受信した情報に対応する箇所を更新すればよい。 Then, the load balancer 4, the received server affiliation information corresponding to the server group name may be updated a location corresponding to the received information, respectively. そして、 すべてのサー バ群について、 そのサーバ群に所属するサーバの割当が妥当かを判定するステツ プ S 1 0 2以降の処理を完了した力判定し (S 1 1 1 ) 、 まだ未判定のサーバ群 が存在する場合、 ステップ S 1 0 1に戻り処理を続ける。 Then, for all servers group, its belonging to a server group server allocation is valid or determining Sutetsu flop S 1 0 2 with the force determined completed the following processes (S 1 1 1), yet undetermined If the server group exists, continue processing returns to step S 1 0 1. ステップ S 1 1 1です ベてのサーバ群について判定が完了していれば処理を終了する。 Step S 1 is determined for the 1 1 is a group of servers Te base to end the process if completed.

' 図 1 0のステップ S 1 0 4で、 応答時間 Tが 0≤T≤T pの範囲に入らない場 合、未使用サーバに所属する任意のサーバを 1台選択する(S 1 1 2 )。 'In Step S 1 0 4 in Fig. 1 0, if the response time T does not fall within the scope of 0≤T≤T p, selects one arbitrary servers belonging to the unused server (S 1 1 2) . そして、 ステップ S 1 1 2で選択されたサーバをそのサーバ群に追加する (S 1 1 3 ) 。 Then, add the server selected in step S 1 1 2 to the server group (S 1 1 3). ステップ S 1 0 4で所定の範囲に入らないのは、 到着要求数がサーバ群の処理 能力を超える場合、 つまり式 (Α) の分母が負になる場合か、 あるいは到着要求 数はサーバ群の処理能力の範囲內だが要求される応答時間を下回るほど負荷が高 い場合であり、いずれにせよサーバの台数を増やし処理能力を上げる必要がある。 No less fall within the predetermined range in Step S 1 0 4, when the number of arriving requests exceeds the processing capacity of the server group, or if the denominator of clogging formula (Alpha) is negative, or the number of arrival requested servers but the range 內 processing capability is the case as the load is not high below the response time required, it is necessary to increase the processing capacity to increase the number of servers anyway. そこで、 ステップ S 1 1 2で任意の未使用サーバが選択され、 ステップ S 1 1 3 でその選択されたサーバがステップ S 1 0 1で選択されたサーバ群に追加される。 Therefore, any unused server is selected in step S 1 1 2, is the selected server in step S 1 1 3 is added to the selected server group in Step S 1 0 1. ステップ S 1 1 3の処理は、 図 7のデータセンタ構成情報において、 ステップ S 1 1 2で選択されたサーバに対応する所属サーバ群名 7 4を 「未使用」 力 らス テツプ S 1 0 1で選択されたサーバ群名に資源割当制御装置 5が更新すればよレ、。 The processing of step S 1 1 3, in the data center configuration information of FIG. 7, step S 1 1 2 belongs server group name 7 4 corresponding to the selected server in the "unused" force las Tetsupu S 1 0 1 Les, yo if the resource allocation control unit 5 is updated to the selected server group name in. そして、新たな構成における将来の応答時間 Τを式(Α)により再度計算する (S 1 1 4 ) 。 Then, again calculated by equation (Alpha) to Τ future response time in the new configuration (S 1 1 4).

ステップ S 1 1 4で算出された応答時間 Τ力 所定の範囲 (0 T≤T p ) に 入るかを再度判定する (S 1 1 5 ) 。 Step S 1 1 4 again determines enters the calculated response time Τ force predetermined range (0 T≤T p) in (S 1 1 5). ステップ S 1 1 5において、 1台追加して もまだ所定の範囲に入らなければ未だ xSP との契約において保証したサービス レベルを満たしておらず、 更なるサーバ追加を行うためにステップ S 1 1 2に戻 り処理を続ける。 In step S 1 1 5, not yet satisfy the service level which guarantees in agreement with yet xSP have to be entered in the predetermined range be added one, step in order to make further server adds S 1 1 2 continue the return process. ステップ S 1 1 5で所定の範囲に入れば、 ステップ S 1 0 9に 進み振分率の計算を行う。 If placed in a predetermined range in step S 1 1 5, the calculation of the split ratio proceeds to Step S 1 0 9.

なお、 本処理を実行中にサーバ群新規作成要求があれば、 資源割当制御装置 5 1 図 9のサーバ群新規作成処理を割り込み処理として実行するよう設定するこ ともできる。 Incidentally, if there is servers New requests during this process, it can also be configured to perform resource allocation controller 5 1 servers New processing of FIG. 9 as an interrupt process.

以上説明した本発明の実施形態によれば、 本発明ではデータセンタ内のサーバ の各ネットワークサービスへの配分を負荷分散装置に対して人手によらずリアル タイムに自動的に行う方法を提供することができる。 According to an embodiment of the present invention described above, to provide a method for automatically performing a real-time without hands the allocation to each network service servers in the data center to the load balancer in the present invention can. また、 各ネットワークサー ビスに到着する要求量の変動の様子を監視し、 要求量の一定時間経過後の値を予 測し、 その要求量予測値の大きさに応じて当該ネットワークサービスに対するサ ーバの割当量を制御することができる。 It also monitors the state of variation of the demand to arrive at each network service, to predict a value after a certain time of demand, support over against the network service in response to the magnitude of the demand predicted value it is possible to control the quota server.

よって運用管理者の負担を軽減でぎ、 少ない運用管理者による運用を可能にす る。 Therefore, skill in reducing the burden of the operations manager, that enables you to operate due to reduced operational administrator. また、 経験の浅い運用管理者による運用も可能にする。 Also, to allow operation by the shallow operations manager of the experience. ここで、 当該ネット ワークサービスに対して割り当てられるサーバの量は、 要求量予測値が示す量の トラフィックが当該ネットワークサービスに到着した場合に、 利用者端末に対す る応答時間の平均が運用管理者が予め定めた応答時間閾ィ直以下となるように定め られる。 Wherein the amount of the server assigned to the network service demand when the amount of traffic prediction value indicates arrives to the network service, users average response time against the terminal operations manager There are determined to be equal to or less than the response time 閾Ijika a predetermined.

よって、 xSP等データセンタ事業者の顧客との契約等において守るべきサービ スレベルを一定水準以上に維持することを可能にする。 Thus, it makes it possible to maintain the service level should be followed more than a certain level in the contract, such as with customers of xSP such as a data center operators. また、 サーバの増減を 1 台ずつ行う度、 予測値に基づく応答時間が所定の範囲に入るかを判定するため、 ネットワークサービスの運用に必要な最低限のサーバ台数によりサーバ群を構成 することができ、 データセンタ事業者は保有するサーバ資源を最大限効率的に運 用することが可能である。 Also, every time performing changes in the server one by one, to determine the response time based on the predicted value falls within a predetermined range, is possible to configure the servers by minimum number of servers necessary for the operation of the network service can, data center operators can be a luck server resources held in maximum efficiency.

以上説明した本発明の実施形態においては、 サーバアプリケーションをウェブ サーバとし、利用者端末からの要求を ht¾)リクエストとした力 サーバにて他の アプリケーションプログラムが使用され、 利用者端末がそのアプリケーションプ ログラムに対するリクエストを送信し、 サーバがリクエストに対するリプライを 利用者端末に送信するものであれば、 その場合にも本発明の適用が可能である。 Above in the embodiment of the present invention described, the server application as a web server, another application program in force server that the request from the user terminal Ht¾) a request is used for the user terminal is the application program It sends a request, as long as the server sends a reply to the request to the user terminal, it is possible to apply the present invention is also applicable to this case. なお、本発明の実施形態においては、サーバ群の処理能力を測る数値として CPU ク口ック周波数を使用し、 サーバ群の処理能力を調整するために単純にサーバの 台数を増減させたが、 CPU、 メモリ、 ハードディスクといった計算機資源を個々 に数値ィ匕して個々の計算機資源を増減させる場合にも本発明の適用が可能である。 In the embodiment of the present invention, by using the CPU click-locking frequency as a number to measure the servers processing power, but simply increase or decrease the number of servers in order to adjust the servers processing power, CPU, memory, is applicable also present invention when numerically I spoon individually computer resources such as a hard disk to increase or decrease the individual computer resources. また、 本発明の実施形態においては、 基準クロック周波数を 1 GHz とした力 S、 これに限定されるものではない。 Further, in the embodiment of the present invention, the force of the reference clock frequency is 1 GHz S, but is not limited thereto. その場合基準ク口ック周波数として定めたク口 ック周波数を搭載したサーバにおけるアプリケーション毎の平均処理数を事前に 収集し、 図 8の様に予め資源割当制御装置に入力すれば、 本発明が適用可能であ る。 Collect average processing speed of each application in the server with the click-locking frequency determined as a case reference clock-locking frequency in advance, by inputting in advance the resource allocation control device as in FIG. 8, the present invention There Ru applicable der.

本発明の保護範囲は、 上記の実施の形態に限定されず、 特許請求の範囲に記載 された発明とその均等物に及ぶものである。 Protection scope of the present invention is not limited to the above embodiment, but extends to the invention and its equivalents as set forth in the appended claims. 産業上の利用の可能性 Industrial Applicability

以上説明した本発明の実施形態によれば、 本発明ではデータセンタ内のサーバ の各ネットワークサービスへの配分を負荷分散装置に対して人手によらずリアノレ タイムに自動的に行う方法を提供することができる。 According to an embodiment of the present invention described above, to provide a method for automatically performing the Rianore time without hands the allocation to each network service servers in the data center to the load balancer in the present invention can. また、 各ネットワークサー ビスに到着する要求量の変動の様子を監視し、 要求量の一定時間経過後の値を予 測し、 その要求量予測値の大きさに応じて当該ネットワークサービスに対するサ ーバの割当量を制御することができる。 It also monitors the state of variation of the demand to arrive at each network service, to predict a value after a certain time of demand, support over against the network service in response to the magnitude of the demand predicted value it is possible to control the quota server.

Claims

請求の範囲 The scope of the claims
1 . ネットワークに接続された複数の利用者端末と、 1. A plurality of user terminals connected to the network,
前記ネットワークに接続され、 前記複数の利用者端末からの要求を処理する複 数のサーバを含むサーバ群を有するネットワークシステムにおける前記サーバ群 の台数調整方法であって、 Connected to said network, said a group of servers number adjustment method in a network system having a server group including multiple servers to handle requests from the plurality of user terminals,
所定時間毎の前記複数の利用者端末からの要求数を蓄積し、 Accumulating the number of requests from said plurality of user terminals for predetermined time intervals,
蓄積された過去の要求数に基づいて、 時間と要求数の特性を関数として求め、 前記関数に将来の時間を代入して将来の要求数を予測し、 Based on the number of requests past accumulated, calculated time and the number of requests characteristic as a function to predict the number of future requests by substituting the future time to the function,
前記複数の利用者端末からの要求数が所定の確率分布に従うと仮定した場合の 前記複数のサーバ 1台あたりの平均応答時間と要求数の関係式に、 前記予測され た要求数を代入して前記複数のサーバ 1台あたりの第一の平均^答時間を求め、 前記第一の平均応答時間が正の値でありかつ予め設定された閾値以下の範囲に 含まれるかを判定し、 Wherein the plurality of user numbers request from the terminal and the average response time of the per multiple servers assuming that follow a predetermined probability distribution request number relationship, by substituting the number of the predicted required wherein the plurality of per server of the first average ^ seek response time, it is determined whether the first average response time is included in the positive a value and preset the range threshold,
前記判定の結果に応じて前記サーバ群に含まれるサーバの台数を増減させるこ とを特 ί敷とするサーバ群の台数調整方法。 Number adjustment method of a server group that that you increase or decrease the number of servers the included in the server group according to the determination result and JP ί insole.
2 . 請求の範囲 1において、 In 2. Claim 1, wherein,
前記判定の結果、 前記平均応答時間が前記範囲に含まれる場合、 (a)前記サー バ群に含まれるサーバを 1台選択し、 The result of the determination, the case where the average response time is included in the range, choose one of the servers included in (a) the server group,
(b)前記選択されたサーバを除外したサーバ群を仮定し、 (B) assuming the server group excluding the selected server,
(c)前記仮定されたサーバ群に含まれる複数のサーバ 1台あたりの第二の平 均応答時間を求め、 (C) determine the second average response time per plurality of servers included in the assumed servers,
(d)前記第二の平均応答時間が前記範囲に含まれるか判定する新たな判定を 行い、 (D) perform a new determination to determine whether the second average response time is included in the range,
(e)前記新たな判定の結果、 前記第二の平均応答時間が前記範囲に含まれる場 合、 前記選択されたサーバを前記サーバ群の構成から除外する、 ことを特徴と するサーバ群の台数調整方法。 (E) the result of the new judgment, the case where the second average response time is included in the range, the excluded selected server from the configuration of the servers, the servers, wherein the number adjustment method.
3 . 請求の範囲 2において、 In 3. Range 2 claims,
前記 (e)の後、 再び前記 (a)から前記 (e)を繰り返し行い、 前記新たな判定の結 果、 前記第二の平均応答時間が前記範囲に含まれなくなるまで、 前記サーバ群 に含まれる複数のサーバを 1台ずつ構成から除外することを特徴とするサーバ 群の台数調整方法。 After the (e), repeated again the said from (a) (e), the new determination of the result, to said second average response time is not included in the range, included in the server group server group number adjustment method characterized by excluding a plurality of servers from a configuration one by one to be.
4 . 請求の範囲 1において、 4. In claim 1, wherein,
さらに、 前記ネットワークに接続された複数の未使用サーバを含む未使用サ 一バ群を有し、 Further comprising an unused server group including a plurality of unused server connected to said network,
前記判定の結果、 前記平均応答時間が前記範囲に含まれない場合、 前記未使 用サーバ群に含まれるサーバを 1台選択し、 The result of the determination, the case where the average response time is not included in the range, selecting one of the server included in the unused servers,
前記選択されたサーバを前記サーバ群に追加することを特徴とするサーバ群 の台数調整方法。 Number adjustment method of a server group, which comprises adding the selected server in the server group.
5 . 請求の範囲 4において、 5. In the range 4 claims,
(f)前記選択されたサーバが追加された後の新たなサーバ群において、 該新た なサーバ群に含まれる複数のサーバ 1台あたりの第三の平均応答時間を求め、 In the new servers after (f) the selected server is added to obtain the third average response time per plural servers included in 該新 was Do servers,
(g)前記第三の平均応答時間が前記範囲に含まれるか判定する新たな判定を 行い、 (G) perform a new determination to determine whether the third average response time is included in the range,
(h)前記新たな判定の結果、 前記第三の平均応答時間が前記範囲に含まれない 場合、 前記未使用サーバ群に含まれるサーバを 1台選択し、 (H) the new result of the determination, if the third average response time is not included in the range, the selected one of the servers included in the unused servers,
(i)前記選択されたサーバを前記新たなサーバ群に追加し、 (I) adding the selected server to the new server group wherein,
前記 (i)の後、 再び前記 (f)から前記 (i)を繰り返し行い、 前記新たな判定の結 果、 前記第三の平均応答時間が前記範囲に含まれるまで、 前記サーバ群に前記 未使用サーバ群に含まれるサーバを 1台ずつ追加することを特徴とするサーバ 群の台数調整方法。 After the (i), repeated again the said from (f) (i), the new determination of the result, to said third average response time is included in the range, the non on the servers server group number adjustment method characterized by adding a server included in use server group one by one.
6 . ネットワークに接続された複数の利用者端末と、 6. A plurality of user terminals connected to the network,
前記ネットワークに接続され、 前記利用者端末からの要求を処理する複数の サーバを含むサーバ群と、 Connected to the network, a server group including a plurality of servers to handle requests from the user terminal,
前記ネットワークに接続され、 所定時間間隔毎の前記利用者端末からの要求 数と前記要求数の振分率と前記サーバ群の構成情報とを蓄積する蓄積手段を含む 負荷分散装置と、 Connected to the network, the load balancer comprising a storing means for storing the configuration information of the server group and the request number and the request number of the distribution rate from the user terminal for a predetermined time interval,
前記ネットワークに接続された資源割当制御装置を有するネットワークシス テムにおける資源割当制御装置に、 The resource allocation control device in a network system having connected resource allocation control device to the network,
前記負荷分散装置に蓄積された過去の要求数に基づいて、 時間と要求数の特性 を関数として求めさせ、 Based on the number of requests previously said accumulated in the load balancer, let seek time and the number of requests properties as a function,
前記関数に将来の時間を代入して将来の要求数を予測させ、 To predict the number of future requests by substituting the future time to the function,
前記複数の利用者端末からの要求数が所定の確率分布に従うと仮定した場合の 前記複数のサーバ 1台あたりの平均応答時間と要求数の関係式に、 前記予測され た要求数を代入して前記複数のサーバ 1台あたりの第一の平均応答時間を求めさ せ、 * Wherein the plurality of user numbers request from the terminal and the average response time of the per multiple servers assuming that follow a predetermined probability distribution request number relationship, by substituting the number of the predicted required to determine the first average response time per said plurality of servers, *
前記第一の平均応答時間が正の値でありかつ予め設定された閾値以下の範囲に 含まれるかを判定させ、 Wherein either is determined first average response time is included in the positive a value and preset the range threshold,
前記判定の結果に応じて前記サーバ群に含まれるサーバの台数を增減させるよ う前記構成情報を変更させることを特徴とするプログラム。 A program characterized by changing the configuration information earthenware pots by to 增減 the number of servers included in the server group according to the determination result.
7 . 請求の範囲 6において、 7. In the range 6 claims,
前記判定の結果、 前記平均応答時間が前記範囲に含まれる場合、 (a)前記サー バ群に含まれるサーバを 1台選択させ、 The result of the determination, if the average response time is included in the range, (a) server to select one that is included in the server group,
(b)前記選択されたサーバを除外したサーバ群を仮定させ、 (B) it is assumed servers excluding the selected server,
(c)前記仮定されたサーバ群に含まれる複数のサーバ 1台あたりの第二の平 均応答時間を求めさせ、 (C) allowed obtains a second average response time per plurality of servers included in the assumed servers,
(d)前記第二の平均応答時間が前記範囲に含まれるか判定する新たな判定を 行わせ、 (D) to perform a new determination to determine whether the second average response time is included in the range,
(e)前記新たな判定の結果、 前記第二の平均応答時間が前記範囲に含まれる場 合、 前記選択されたサーバを前記構成情報から削除させる、 ことを特徴とする (E) the result of the new determination, if the second average response time is included in the range, to delete the selected server from the configuration information, characterized in that
8 . 請求の範囲 7において、 8. In the scope 7 of claims,
前記 (e)の後、 再び前記 (a)から前記 (e)を行い、 前記新たな判定の結果、 前記 第二の平均応答時間が前記範囲に含まれなくなるまで、 前記サーバ群に含まれ る複数のサーバを 1台ずつ前記構成情報から削除させることを特徴とするプロ グラム。 After the (e), is carried out again said (a) from said (e), the result of the new determination, to said second average response time is not included in the range, Ru contained in the server group program for causing deleted from the configuration information multiple servers one by one.
9 . 請求の範囲 6において、 さらに、 前記ネットワークに接続された複数の未使用サーバを含む未使用サ 一バ群を有し、 9. In the range 6 claims, further comprising an unused server group including a plurality of unused server connected to said network,
前記判定の結果、 前記平均応答時間が前記範囲に含まれない場合、 前記未使 用サーバ群に含まれるサーバを 1台選択させ、 The result of the determination, the case where the average response time is not included in the range, the by selecting one of the servers included in the unused servers,
前記選択されたサーバを前記構成情報に追加させることを特徴とするプログ ラム。 Program, characterized in that to add the selected server to the configuration information.
1 0 . 請求の範囲 9において、 In 1 0. Range 9 claims,
(f)前記選択されたサーバが追加された後の新たなサーバ群において、 該新た なサーバ群に含まれる複数のサーバ 1台あたりの第三の平均応答時間を求めさ せ、 In the new servers after (f) the selected server is added, to determine the third average response time per plural servers included in 該新 was Do servers,
(g)前記第三の平均応答時間が前記範囲に含まれるか判定する新たな判定を 行わせ、 (G) to perform a new determination to determine whether the third average response time is included in the range,
(h)前記新たな判定の結果、 前記第三の平均応答時間が前記範囲に含まれない 場合、 前記未使用サーバ群に含まれるサーバを 1台選択させ、 (H) Results of the new determination, if the third average response time is not included in the scope, a server included in the unused servers to select one,
(i)前記選択されたサーバを前記新たなサーバ群に追加させ、 (I) by adding the selected server to the new server group wherein,
前記 (i)の後、 再び前記 (f)から前記(i)を行わせ、 前記新たな判定の結果、 前 記第三の平均応答時間が前記範囲に含まれるまで、 前記構成情報に前記未使用 サーバ群に含まれるサーバを 1台ずつ追加させることを特徴とするプログラム。 After the (i), is again the perform said from (f) (i), the new result of the determination before Symbol a third average response time included in the range, the non on the configuration information program for causing additional servers included in use server group one by one.
PCT/JP2003/004679 2003-04-14 2003-04-14 Server allocation control method WO2004092971A1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
PCT/JP2003/004679 WO2004092971A1 (en) 2003-04-14 2003-04-14 Server allocation control method

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2004570858A JP3964909B2 (en) 2003-04-14 2003-04-14 Server allocation control method
PCT/JP2003/004679 WO2004092971A1 (en) 2003-04-14 2003-04-14 Server allocation control method
US11099538 US20050193113A1 (en) 2003-04-14 2005-04-06 Server allocation control method

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US11099538 Continuation US20050193113A1 (en) 2003-04-14 2005-04-06 Server allocation control method

Publications (1)

Publication Number Publication Date
WO2004092971A1 true true WO2004092971A1 (en) 2004-10-28

Family

ID=33193209

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2003/004679 WO2004092971A1 (en) 2003-04-14 2003-04-14 Server allocation control method

Country Status (2)

Country Link
JP (1) JP3964909B2 (en)
WO (1) WO2004092971A1 (en)

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7664859B2 (en) 2005-03-30 2010-02-16 Hitachi, Ltd. Resource assigning management apparatus and resource assigning method
JP2010061261A (en) * 2008-09-02 2010-03-18 Fujitsu Ltd Authentication system and authentication method
US7693995B2 (en) 2005-11-09 2010-04-06 Hitachi, Ltd. Arbitration apparatus for allocating computer resource and arbitration method therefor
JP2010191603A (en) * 2009-02-17 2010-09-02 Kddi Corp Service providing server
JP2011076469A (en) * 2009-09-30 2011-04-14 Nomura Research Institute Ltd Load management device, information processing system and load management method
JP2011204128A (en) * 2010-03-26 2011-10-13 Nomura Research Institute Ltd Device and method for managing operation
JP2011204110A (en) * 2010-03-26 2011-10-13 Nomura Research Institute Ltd System and method for processing information
JP2011210225A (en) * 2010-07-14 2011-10-20 Nomura Research Institute Ltd System and method for information processing
JP2012053899A (en) * 2011-10-26 2012-03-15 Nomura Research Institute Ltd Operation management device and information processing system
JP2012518842A (en) * 2009-02-23 2012-08-16 マイクロソフト コーポレーション Server management with an awareness of energy
US8839254B2 (en) 2009-06-26 2014-09-16 Microsoft Corporation Precomputation for data center load balancing
US8849469B2 (en) 2010-10-28 2014-09-30 Microsoft Corporation Data center system that accommodates episodic computation
JP2015095149A (en) * 2013-11-13 2015-05-18 富士通株式会社 Management program, management method, and management device
US9063738B2 (en) 2010-11-22 2015-06-23 Microsoft Technology Licensing, Llc Dynamically placing computing jobs
WO2015092873A1 (en) * 2013-12-18 2015-06-25 株式会社日立製作所 Information processing system and information processing method
US9450838B2 (en) 2011-06-27 2016-09-20 Microsoft Technology Licensing, Llc Resource management for cloud computing platforms
US9595054B2 (en) 2011-06-27 2017-03-14 Microsoft Technology Licensing, Llc Resource management for cloud computing platforms
US9933804B2 (en) 2014-07-11 2018-04-03 Microsoft Technology Licensing, Llc Server installation as a grid condition sensor

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5928699B2 (en) * 2012-03-05 2016-06-01 日本電気株式会社 Job allocation method, apparatus and program

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6230183B1 (en) * 1998-03-11 2001-05-08 International Business Machines Corporation Method and apparatus for controlling the number of servers in a multisystem cluster
US6466980B1 (en) * 1999-06-17 2002-10-15 International Business Machines Corporation System and method for capacity shaping in an internet environment

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6230183B1 (en) * 1998-03-11 2001-05-08 International Business Machines Corporation Method and apparatus for controlling the number of servers in a multisystem cluster
US6466980B1 (en) * 1999-06-17 2002-10-15 International Business Machines Corporation System and method for capacity shaping in an internet environment

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Edwin R. Lassettre et al., "HotRod: An Automomic System for Dynamic Surge Protection", [online], IBM Research Division, 17 March, 2003 [retrieved on 30 May, 2003], Retrieved from the Internet: <URL: http://domino.watson.ibm.com/library/CyberDig.nsf/0/485bf8b1f6ef56fd85256cee0064cd4f?OpenDocument> *

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7664859B2 (en) 2005-03-30 2010-02-16 Hitachi, Ltd. Resource assigning management apparatus and resource assigning method
US7693995B2 (en) 2005-11-09 2010-04-06 Hitachi, Ltd. Arbitration apparatus for allocating computer resource and arbitration method therefor
JP2010061261A (en) * 2008-09-02 2010-03-18 Fujitsu Ltd Authentication system and authentication method
JP2010191603A (en) * 2009-02-17 2010-09-02 Kddi Corp Service providing server
JP2012518842A (en) * 2009-02-23 2012-08-16 マイクロソフト コーポレーション Server management with an awareness of energy
KR101624765B1 (en) * 2009-02-23 2016-05-26 마이크로소프트 테크놀로지 라이센싱, 엘엘씨 Energy-aware server management
US8839254B2 (en) 2009-06-26 2014-09-16 Microsoft Corporation Precomputation for data center load balancing
JP2011076469A (en) * 2009-09-30 2011-04-14 Nomura Research Institute Ltd Load management device, information processing system and load management method
JP2011204110A (en) * 2010-03-26 2011-10-13 Nomura Research Institute Ltd System and method for processing information
JP2011204128A (en) * 2010-03-26 2011-10-13 Nomura Research Institute Ltd Device and method for managing operation
JP2011210225A (en) * 2010-07-14 2011-10-20 Nomura Research Institute Ltd System and method for information processing
US9886316B2 (en) 2010-10-28 2018-02-06 Microsoft Technology Licensing, Llc Data center system that accommodates episodic computation
US8849469B2 (en) 2010-10-28 2014-09-30 Microsoft Corporation Data center system that accommodates episodic computation
US9063738B2 (en) 2010-11-22 2015-06-23 Microsoft Technology Licensing, Llc Dynamically placing computing jobs
US9450838B2 (en) 2011-06-27 2016-09-20 Microsoft Technology Licensing, Llc Resource management for cloud computing platforms
US9595054B2 (en) 2011-06-27 2017-03-14 Microsoft Technology Licensing, Llc Resource management for cloud computing platforms
JP2012053899A (en) * 2011-10-26 2012-03-15 Nomura Research Institute Ltd Operation management device and information processing system
JP2015095149A (en) * 2013-11-13 2015-05-18 富士通株式会社 Management program, management method, and management device
WO2015092873A1 (en) * 2013-12-18 2015-06-25 株式会社日立製作所 Information processing system and information processing method
US9933804B2 (en) 2014-07-11 2018-04-03 Microsoft Technology Licensing, Llc Server installation as a grid condition sensor

Also Published As

Publication number Publication date Type
JP3964909B2 (en) 2007-08-22 grant
JPWO2004092971A1 (en) 2006-07-06 application

Similar Documents

Publication Publication Date Title
Yao et al. Data centers power reduction: A two time scale approach for delay tolerant workloads
US7054943B1 (en) Method and apparatus for dynamically adjusting resources assigned to plurality of customers, for meeting service level agreements (slas) with minimal resources, and allowing common pools of resources to be used across plural customers on a demand basis
Zhang et al. Dynamic heterogeneity-aware resource provisioning in the cloud
US20110173626A1 (en) Efficient maintenance of job prioritization for profit maximization in cloud service delivery infrastructures
US8046765B2 (en) System and method for determining allocation of resource access demands to different classes of service based at least in part on permitted degraded performance
US6968379B2 (en) Latency-reducing bandwidth-prioritization for network servers and clients
US20050172291A1 (en) Method and apparatus for utility-based dynamic resource allocation in a distributed computing system
US8087025B1 (en) Workload placement among resource-on-demand systems
US20130185433A1 (en) Performance interference model for managing consolidated workloads in qos-aware clouds
US20050188075A1 (en) System and method for supporting transaction and parallel services in a clustered system based on a service level agreement
US20060280119A1 (en) Weighted proportional-share scheduler that maintains fairness in allocating shares of a resource to competing consumers when weights assigned to the consumers change
US20120136697A1 (en) Method and system for efficient deployment of web applications in a multi-datacenter system
US20030105797A1 (en) Dynamic load balancing among a set of servers
US6442165B1 (en) Load balancing between service component instances
US20050165925A1 (en) System and method for supporting transaction and parallel services across multiple domains based on service level agreenments
US20030236887A1 (en) Cluster bandwidth management algorithms
Yu et al. The design of qos broker algorithms for qos-capable web services
US20030055969A1 (en) System and method for performing power management on a distributed system
US20060019662A1 (en) Methods and apparatus for transmission scheduling in wireless networks
US6985937B1 (en) Dynamically modifying the resources of a virtual server
Xu et al. QoS and contention-aware multi-resource reservation
US20050088976A1 (en) Methods, apparatus and computer programs for managing performance and resource utilization within cluster-based systems
Bhoj et al. Web2K: Bringing QoS to web servers
Doulamis et al. Fair scheduling algorithms in grids
US20050138165A1 (en) Analytical cache performance model for a media server

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): JP US

WWE Wipo information: entry into national phase

Ref document number: 2004570858

Country of ref document: JP

WWE Wipo information: entry into national phase

Ref document number: 11099538

Country of ref document: US