JP2007179246A - Method, program and server for computer management - Google Patents

Method, program and server for computer management Download PDF

Info

Publication number
JP2007179246A
JP2007179246A JP2005376186A JP2005376186A JP2007179246A JP 2007179246 A JP2007179246 A JP 2007179246A JP 2005376186 A JP2005376186 A JP 2005376186A JP 2005376186 A JP2005376186 A JP 2005376186A JP 2007179246 A JP2007179246 A JP 2007179246A
Authority
JP
Japan
Prior art keywords
server
load
load distribution
upper limit
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005376186A
Other languages
Japanese (ja)
Inventor
Koji Ito
康志 伊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2005376186A priority Critical patent/JP2007179246A/en
Publication of JP2007179246A publication Critical patent/JP2007179246A/en
Pending legal-status Critical Current

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To accurately measure performance of servers used in a load balancing system without stopping the working load balancing system. <P>SOLUTION: A computer performs load balancing according to a priority in which the priority of a performance measurement target server is set high and the priorities of other servers are set low, and the maximum limit of the amount of processing that is distributed to the performance measurement target server is raised gradually by checking CPU loads of the performance measurement target server. The amount of processing distributed to the performance measurement target server becomes throughput for the server when CPU loads reach a prespecified permitted maximum limit, so that the value is recorded. <P>COPYRIGHT: (C)2007,JPO&INPIT

Description

本発明は、計算機管理方法、計算機管理プログラム、および、計算機管理サーバについての技術に関する。   The present invention relates to a technique for a computer management method, a computer management program, and a computer management server.

負荷分散は、要求されたリクエストを複数のサーバに分配することにより、複数のサーバにリクエストを並列で処理させる手法である。これにより、単位時間当たりでは、1台のサーバがリクエストを実行するよりも、複数のサーバが実行するリクエストの総和が大きくなることが期待されるので、単位時間当たりに処理できるリクエストの数を増やすことができる。   Load distribution is a technique in which a plurality of servers process requests in parallel by distributing requested requests to a plurality of servers. As a result, the total number of requests executed by multiple servers is expected to increase per unit time, rather than one server executing requests, so the number of requests that can be processed per unit time is increased. be able to.

要求されたリクエストを割り当てるサーバの選択アルゴリズムとして、ラウンドロビン、重み付け、優先順位といった静的な負荷分散アルゴリズム(非特許文献1参照)に始まり、特許文献1に記載されているような、負荷状況を見て処理を分散する方式などが開発されている。これらの負荷分散方式は、全てのサーバの負荷が均等になる、あるいは、全体の処理件数が最大になるように処理を分散することを目的としている。   As a selection algorithm of a server to which a requested request is allocated, a load situation as described in Patent Document 1 is started, starting with a static load distribution algorithm (see Non-Patent Document 1) such as round robin, weighting, and priority. A method of distributing processing by seeing has been developed. These load distribution methods are intended to distribute the processing so that the loads on all servers are equal or the total number of processing cases is maximized.

さらに、負荷分散を効率的に行うために、負荷分散の対象となるサーバを、各時点でのリクエスト量に応じて動的に増減させる技術(以下、動的な負荷分散とする)が提案されている。具体的には、サーバの負荷状況を監視して、負荷が増大してあらかじめ決めた上限閾値を上回った場合には、その時点で利用されていないサーバを追加して負荷の増大に対処するという制御が行われる。逆に、負荷が減少して下限閾値を下回った場合には、利用している少なくとも一つのサーバを削減して、削減したサーバを別の目的で利用できるようにする制御が行われる。これにより、過剰にサーバを稼働させることを抑制でき、サーバの利用効率を高めることができる。   Furthermore, in order to perform load distribution efficiently, a technique for dynamically increasing / decreasing the load distribution target server according to the request amount at each time point (hereinafter referred to as dynamic load distribution) has been proposed. ing. Specifically, the load status of the server is monitored, and if the load increases and exceeds a predetermined upper limit threshold, a server that is not used at that time is added to deal with the load increase. Control is performed. Conversely, when the load decreases and falls below the lower threshold, control is performed so that at least one server being used is reduced and the reduced server can be used for another purpose. Thereby, it can suppress operating a server excessively and can improve the utilization efficiency of a server.

例えば、特許文献2に記載された動的な負荷分散は、サーバを追加した直後は、追加されたサーバに対するリクエスト送出量を少なくし、時間経過と供に追加サーバへのリクエスト送出量を段階的に増加させることを特徴としている。これは、追加直後のサーバは必要な情報がキャッシュされていない等の原因で処理能力が低いため、追加直後のサーバの負担を軽減することで応答時間の悪化を防ぐことを目的としている。   For example, in the dynamic load distribution described in Patent Document 2, immediately after adding a server, the request transmission amount to the added server is reduced, and the request transmission amount to the additional server is gradually increased with time. It is characterized by increasing it. The purpose of this is to prevent the response time from deteriorating by reducing the load on the server immediately after the addition because the server immediately after the addition has a low processing capacity because the necessary information is not cached.

動的な負荷分散を効率的に実現するためには、負荷分散によりリクエストが割り当てられる各サーバの性能を計測する必要がある。特に、グリッドコンピューティングのシステムでは、サーバ等の計算機資源の有効活用も目的の一つとしているため、利用するサーバのスペックは均一ではなく、ばらつきがある場合が多い。特許文献3に記載された性能測定方法は、サーバから負荷分散装置に対して送信されるフィードバック情報に含まれるサーバの負荷の値を操作することで、負荷分散装置の分配比率を調整し、テスト対象のサーバに負荷を意図的に集中させて性能を測定しているが、利用する負荷分散装置としては、アクティブフィードバックによる負荷分散制御を行うことが前提となっている。
特開平10−312365号公報 特開2005−92862号公報 特開2005−100500号公報 株式会社アイアイジェイテクノロジー 川本信博著、「ロードバランシング技術〜高負荷に耐えるシステムの構築〜」、http://www.nic.ad.jp/ja/materials/iw/2002/proceeding/T19.pdf
In order to efficiently realize dynamic load balancing, it is necessary to measure the performance of each server to which a request is assigned by load balancing. In particular, in the grid computing system, since effective utilization of computer resources such as servers is one of the purposes, the specifications of the servers to be used are not uniform and often vary. The performance measurement method described in Patent Document 3 adjusts the distribution ratio of the load balancer by operating the load value of the server included in the feedback information transmitted from the server to the load balancer, and performs a test. Although the performance is measured by intentionally concentrating the load on the target server, the load distribution device to be used is premised on performing load distribution control by active feedback.
JP 10-31365 A JP 2005-92862 A JP 2005-100500 A IAI Technology, Inc. Nobuhiro Kawamoto, “Load Balancing Technology-Building a System That Can Withstand High Loads”, http://www.nic.ad.jp/en/materials/iw/2002/proceeding/T19.pdf

従来は、動的な負荷分散を効率的に実現するためのサーバの性能計測において、稼働中の負荷分散システムにサーバを含めずに行っていた。そのため、サーバの性能を高精度で測定することができなかった。なお、動的な負荷分散システムに限らず、多くのシステムは、既に稼働し運用されつづけている。それらの稼働中のシステムは、無停止の運用(24時間の運用)が求められている。   Conventionally, server performance measurement for efficiently realizing dynamic load balancing has been performed without including a server in an active load balancing system. Therefore, the server performance could not be measured with high accuracy. Not only dynamic load balancing systems, but many systems have already been operated and operated. These operating systems are required to operate without interruption (24-hour operation).

例えば、稼働中の負荷分散システムに接続せずにスタンドアロンで、CPU(Central Processing Unit)周波数などのハードウェアの性能を、ベンチマークソフトで計測する手法が考えられる。しかし、利用しているサーバが当該業務の処理をどれくらい処理できるのかというアプリケーションベースの性能を測定しなければ、サーバの性能を高精度で測定できたとはいえず、動的な負荷分散を効率的に実現することはできない。   For example, a method of measuring the performance of hardware such as a CPU (Central Processing Unit) frequency in a stand-alone manner without connecting to an operating load distribution system with benchmark software is conceivable. However, if you do not measure the application-based performance of how much processing the relevant server can handle, it cannot be said that the server performance could be measured with high accuracy, and dynamic load balancing is efficient. Can not be realized.

そこで本発明は、稼働中の負荷分散システムを停止させずに、その負荷分散システムに使用されるサーバの性能計測を高精度で行うことを、主な目的とする。なお、計測されたサーバの性能は、負荷分散のリクエストの増減に応じて増減されるサーバの選択に使用される。   Therefore, the main object of the present invention is to measure the performance of a server used in the load distribution system with high accuracy without stopping the load distribution system in operation. The measured server performance is used to select a server that is increased or decreased in accordance with an increase or decrease in load distribution requests.

前記課題を解決するために、本発明は、負荷分散管理テーブルに基づいて分配されたリクエストを実行する複数のサーバにおいて、性能測定対象である第1サーバの処理能力を測定する計算機管理方法であって、コンピュータが、リクエストを実行中である第2サーバよりも、前記第1サーバにリクエストが優先的に割り当てられるように、記憶手段に格納された前記負荷分散管理テーブルを変更する優先度制御手順と、前記第1サーバの性能が所定の許容上限に達した時点の処理量を、前記第1サーバの処理能力として記録する負荷状況監視手順と、を実行することを特徴とする。その他の手段は、後記する。   In order to solve the above problems, the present invention is a computer management method for measuring the processing capacity of a first server, which is a performance measurement target, in a plurality of servers that execute requests distributed based on a load distribution management table. A priority control procedure in which the computer changes the load distribution management table stored in the storage means so that the request is preferentially assigned to the first server over the second server that is executing the request. And a load status monitoring procedure for recording the processing amount when the performance of the first server reaches a predetermined allowable upper limit as the processing capacity of the first server. Other means will be described later.

本発明によれば、稼働中の負荷分散システムを停止させずに、その負荷分散システムに使用されるサーバの性能計測を高精度で行うことができる。例えば、グリッドコンピューティングのような高度な負荷分散を行うシステムにおいて必要となる各サーバの処理能力を、容易に計測することができる。   According to the present invention, it is possible to measure the performance of a server used in the load distribution system with high accuracy without stopping the load distribution system in operation. For example, it is possible to easily measure the processing capacity of each server required in a system that performs advanced load balancing such as grid computing.

以下、本発明を実施するための最良の形態を図面に基づいて詳細に説明する。図1は、負荷分散システムを示す構成図である。   The best mode for carrying out the present invention will be described below in detail with reference to the drawings. FIG. 1 is a configuration diagram illustrating a load distribution system.

利用者クライアント101からのリクエストは、ネットワーク102を介して、負荷分散装置103に届く。負荷分散装置103は、業務処理サーバ(業務処理サーバA104、業務処理サーバB105、業務処理サーバC106、および、業務処理サーバZ109)に対してリクエストを分配することにより、負荷分散を行う構成となっている。これら業務処理サーバは、例えばWebシステムにおけるWebサーバである。   A request from the user client 101 reaches the load balancer 103 via the network 102. The load balancer 103 is configured to distribute the load by distributing requests to the business processing servers (the business processing server A 104, the business processing server B 105, the business processing server C 106, and the business processing server Z 109). Yes. These business processing servers are Web servers in a Web system, for example.

管理サーバ111(計算機管理サーバ)は、計算センタ内のシステムの負荷状態を監視し、過負荷状態が発生している場合には、センタ内の未使用サーバを動的にシステムに追加するといった制御を実現している。なお、動的なシステムの追加は、例えば、あらかじめネットワーク102に接続された計算機システムが、管理サーバ111の指示により、未稼働の状態から稼働中の状態へと遷移することで、その計算機システムが負荷分散装置103からリクエストを割り当てられる業務処理サーバとなることである。   The management server 111 (computer management server) monitors the load state of the system in the calculation center, and if an overload condition has occurred, controls such as dynamically adding an unused server in the center to the system. Is realized. Note that the dynamic system addition is performed, for example, when a computer system connected in advance to the network 102 transitions from a non-operating state to an operating state in accordance with an instruction from the management server 111. This is to be a business processing server to which a request is assigned from the load balancer 103.

図2は、負荷分散装置103を示す構成図である。図2(a)は、負荷分散装置103と管理サーバ111とが別々の筐体に分離された構成例を示し、図2(b)は、負荷分散装置103と管理サーバ111とが同一の筐体に収容された構成例を示す。負荷分散装置103および管理サーバ111は、主記憶装置201、CPU202、通信管理203が存在し、図示しないバスで互いに接続されている。CPU202は、主記憶装置201に格納されたプログラムを実行する。   FIG. 2 is a configuration diagram showing the load balancer 103. FIG. 2A shows a configuration example in which the load balancer 103 and the management server 111 are separated into separate cases, and FIG. 2B shows the same case in which the load balancer 103 and the management server 111 are the same case. The structural example accommodated in the body is shown. The load balancer 103 and the management server 111 include a main storage device 201, a CPU 202, and a communication management 203, and are connected to each other via a bus (not shown). The CPU 202 executes a program stored in the main storage device 201.

図2(a)において、負荷分散装置103の主記憶装置201には、負荷分散処理部204、および、負荷分散参照テーブル216が格納され、管理サーバ111の主記憶装置201には、優先度制御部207、負荷状況監視部205、および、負荷分散管理テーブル206が格納される。図2(b)では、負荷分散管理テーブル206が負荷分散参照テーブル216の役割を兼任する。   In FIG. 2A, the load distribution processing unit 204 and the load distribution reference table 216 are stored in the main storage device 201 of the load distribution device 103, and priority control is performed in the main storage device 201 of the management server 111. A unit 207, a load status monitoring unit 205, and a load distribution management table 206 are stored. In FIG. 2B, the load distribution management table 206 also serves as the load distribution reference table 216.

負荷分散処理部204は、利用者クライアント101からのリクエストの受付を、各業務処理サーバに負荷を分散して転送する。負荷状況監視部205は、各業務処理サーバの負荷状態を監視する。負荷分散管理テーブル206は、各業務処理サーバの負荷状況および計測された各業務処理サーバの処理能力を記録する。優先度制御部207は、業務処理サーバの処理能力を計測するために、負荷分散管理テーブル206に格納される優先度307(図3参照)を制御する。負荷分散参照テーブル216は、負荷分散を実行する際に参照されるテーブルであり、負荷分散管理テーブル206に格納されるデータの少なくとも一部がコピーされる。   The load distribution processing unit 204 distributes a request received from the user client 101 to each business processing server while distributing the load. The load status monitoring unit 205 monitors the load status of each business processing server. The load distribution management table 206 records the load status of each business processing server and the measured processing capacity of each business processing server. The priority control unit 207 controls the priority 307 (see FIG. 3) stored in the load distribution management table 206 in order to measure the processing capability of the business processing server. The load distribution reference table 216 is a table that is referred to when executing load distribution, and at least a part of the data stored in the load distribution management table 206 is copied.

図3〜図6は、負荷分散管理テーブル206を示す構成図である。負荷分散管理テーブル206には、負荷分散先の業務処理サーバ名301、負荷状況監視部205が測定した最新の負荷状況である現在の処理量302、および、現在のCPU負荷303、当該サーバを優先度1にした場合の処理量の上限304、あらかじめ決めたCPU負荷許容上限305、性能測定で求められた処理能力306、優先順位による負荷分散を行う際の優先度307が記録されている。図3〜図6の各データの内容は、後記するフローチャートの説明にて、詳細に説明する。   3 to 6 are configuration diagrams showing the load distribution management table 206. In the load distribution management table 206, the load balancing destination business processing server name 301, the current processing amount 302 that is the latest load state measured by the load state monitoring unit 205, the current CPU load 303, and the server are given priority. The upper limit 304 of the processing amount when the degree is set to 1, the CPU load allowable upper limit 305 determined in advance, the processing capacity 306 obtained by performance measurement, and the priority 307 when performing load distribution according to priority are recorded. The content of each data of FIGS. 3-6 is demonstrated in detail by description of the flowchart mentioned later.

なお、負荷分散参照テーブル216は、少なくとも現在の処理量302、処理能力306、および、優先度307を有する。そして、負荷分散装置103は、優先度307の高い順に業務処理サーバを選択し、その選択した業務処理サーバの現在の処理量302が処理能力306となるまで、選択した業務処理サーバにリクエストを割り当てつづける。   Note that the load distribution reference table 216 has at least the current processing amount 302, processing capability 306, and priority 307. Then, the load balancer 103 selects the business processing servers in descending order of priority 307, and assigns requests to the selected business processing servers until the current processing amount 302 of the selected business processing servers reaches the processing capacity 306. Continue.

図7は、処理量とCPU負荷の関係の例を示す説明図である。管理サーバ111は、処理量の上限304に制限される現在の処理量302を徐々に上げながらCPU負荷を計測し、負荷分散管理テーブル206のCPU負荷許容上限305(本実施形態の場合は90%)を超えた時点の処理量が、当該業務処理サーバの処理能力306となる。   FIG. 7 is an explanatory diagram illustrating an example of the relationship between the processing amount and the CPU load. The management server 111 measures the CPU load while gradually increasing the current processing amount 302 limited to the processing amount upper limit 304, and the CPU load allowable upper limit 305 (90% in this embodiment) of the load distribution management table 206. ) Exceeds the processing capacity 306 of the business processing server.

図8は、負荷分散処理を示すフローチャートである。このフローチャートは、性能測定の開始とともに動作する。以下、業務処理サーバA104、業務処理サーバB105、および、業務処理サーバC106(前記3台が請求項の第2サーバの一例)の稼働中に、業務処理サーバZ109(請求項の第1サーバの一例)の処理能力を計測する場合について説明する。   FIG. 8 is a flowchart showing the load distribution process. This flowchart operates with the start of performance measurement. Hereinafter, during the operation of the business processing server A 104, the business processing server B 105, and the business processing server C 106 (the three are examples of the second server in the claims), the business processing server Z 109 (an example of the first server in the claims) ) Will be described.

まず、負荷状況監視部205は、負荷分散管理テーブル206を参照し、業務処理サーバZ109の現在の処理量302がn件/分であることを確認する(S501)。例えば、サーバZ追加前(図3)には、業務処理サーバZ109の現在の処理量302は、割り当てられていない。これは、業務処理サーバZ109の優先度307が規定されていないため、負荷分散装置103が業務処理サーバZ109にリクエストを割り当てないからである。   First, the load status monitoring unit 205 refers to the load distribution management table 206 and confirms that the current processing amount 302 of the business processing server Z109 is n cases / minute (S501). For example, before the server Z is added (FIG. 3), the current processing amount 302 of the business processing server Z109 is not allocated. This is because the priority 307 of the business processing server Z109 is not defined, and the load balancer 103 does not assign a request to the business processing server Z109.

次に、優先度制御部207は、負荷分散方法を変更する(S502)。優先度制御部207は、業務処理サーバZ109をそれまでの負荷分散対象から外し、業務処理サーバZ109を優先度1にした優先順位による負荷分散を開始する。例えば、サーバZの性能測定を実施中(図4)には、優先度307について、業務処理サーバZ109が1(高優先)、他の業務処理サーバが2(低優先)である。これにより、負荷分散装置103は業務処理サーバZ109に対して優先的にリクエストを割り当てる。   Next, the priority control unit 207 changes the load distribution method (S502). The priority control unit 207 removes the business process server Z109 from the load distribution target so far, and starts load distribution based on the priority order in which the business process server Z109 is set to the priority level 1. For example, during the performance measurement of the server Z (FIG. 4), with respect to the priority 307, the business processing server Z109 is 1 (high priority) and the other business processing servers are 2 (low priority). Thereby, the load balancer 103 preferentially assigns requests to the business processing server Z109.

ここで、業務処理サーバZ109の処理量の上限304の初期値は、S501で求めた現在の処理量302とする。なお、現在の処理量302が割り当てられていないときには、初期値は0である。そして、負荷分散装置103は、業務処理サーバZ109の処理量の上限304を超える処理については、業務処理サーバA104、業務処理サーバB105、および、業務処理サーバC106にて処理するようにリクエストを割り当てる。業務処理サーバA104、業務処理サーバB105、および、業務処理サーバC106における負荷分散方法は、それまで行っていた負荷分散方法でもよいし、別の負荷分散方法でもよい。   Here, the initial value of the upper limit 304 of the processing amount of the job processing server Z109 is the current processing amount 302 obtained in S501. When the current processing amount 302 is not assigned, the initial value is 0. Then, the load distribution apparatus 103 assigns a request so that the business processing server A 104, the business processing server B 105, and the business processing server C 106 process the processing exceeding the upper limit 304 of the processing amount of the business processing server Z 109. The load distribution method in the business processing server A 104, the business processing server B 105, and the business processing server C 106 may be the load distribution method that has been performed so far, or may be another load distribution method.

そして、負荷状況監視部205は、業務処理サーバZ109のCPU負荷と、負荷分散管理テーブル206に設定されているCPU負荷許容上限305との比較を行うことで、業務処理サーバZ109のCPU202に余裕が有るか否かを判定する(S503)。   The load status monitoring unit 205 compares the CPU load of the business processing server Z109 with the CPU load allowable upper limit 305 set in the load distribution management table 206, so that the CPU 202 of the business processing server Z109 has a margin. It is determined whether or not there is (S503).

まず、業務処理サーバZ109の現在のCPU負荷303が、負荷分散管理テーブル206に設定されているCPU負荷許容上限305よりも小さく、CPU202に余裕がある場合(S503,Yes)、S503Bに進む。例えば、サーバZの性能測定を実施中(図4)には、業務処理サーバZ109の現在のCPU負荷303が25%であり、CPU負荷許容上限305の90%までには、まだ余裕がある。そして、業務処理サーバZ109の現在の処理量302が処理量の上限304に達したら(S503B,Yes)、業務処理サーバZ109の処理量の上限304を増大させる(S504)。増大させる量については、それまでの処理量の何パーセント増大という方法でもよいし、固定的に何件/分増大という方法でもよい。その後、S503に戻る。   First, when the current CPU load 303 of the business processing server Z109 is smaller than the CPU load allowable upper limit 305 set in the load distribution management table 206 and the CPU 202 has a margin (S503, Yes), the process proceeds to S503B. For example, during the performance measurement of the server Z (FIG. 4), the current CPU load 303 of the business processing server Z109 is 25%, and there is still room for 90% of the CPU load allowable upper limit 305. When the current processing amount 302 of the business processing server Z109 reaches the processing amount upper limit 304 (S503B, Yes), the processing amount upper limit 304 of the business processing server Z109 is increased (S504). The amount to be increased may be a method of increasing the percentage of the processing amount so far, or may be a method of fixedly increasing the number of cases / minute. Thereafter, the process returns to S503.

一方、業務処理サーバZ109の現在のCPU負荷303が、負荷分散管理テーブル206に設定されているCPU負荷許容上限305よりも大きくなり、CPU202に余裕が無くなったら(S503,No)、現在の処理量302を当該業務サーバの処理能力306として記録する(S505)。例えば、サーバZの性能測定が完了(図5)したときには、現在のCPU負荷303が90%となり、CPU負荷許容上限305の90%に達した。このとき、管理サーバ111が、現在の処理量302の90件/分を処理能力306にコピーする。   On the other hand, when the current CPU load 303 of the business processing server Z109 becomes larger than the CPU load allowable upper limit 305 set in the load distribution management table 206 and the CPU 202 has no room (S503, No), the current processing amount 302 is recorded as the processing capability 306 of the business server (S505). For example, when the performance measurement of the server Z is completed (FIG. 5), the current CPU load 303 is 90%, reaching 90% of the CPU load allowable upper limit 305. At this time, the management server 111 copies 90 cases / minute of the current processing amount 302 to the processing capability 306.

なお、業務処理サーバZ109のCPU負荷が、負荷分散管理テーブル206に設定されているCPU負荷許容上限305を大きく上回った場合には、管理サーバ111が、CPU負荷許容上限305を超えたと推測される処理量を比例計算等で求め、当該業務サーバの処理能力306として記録してもよい(図7参照)。   When the CPU load of the business processing server Z109 greatly exceeds the CPU load allowable upper limit 305 set in the load distribution management table 206, it is estimated that the management server 111 has exceeded the CPU load allowable upper limit 305. The processing amount may be obtained by proportional calculation or the like and recorded as the processing capacity 306 of the business server (see FIG. 7).

最後に、優先度制御部207は、業務処理サーバA104、業務処理サーバB105、業務処理サーバC106、および、業務処理サーバZ109への負荷分散方法を、性能測定開始前の負荷分散方法に戻して(S506)、性能測定処理を終了する。例えば、サーバZ切り離し後(図6)には、優先度307について、業務処理サーバZ109が未定義、他の業務処理サーバが1(高優先)である。これにより、負荷分散装置103は業務処理サーバZ109に対してリクエストを割り当てなくなる。   Finally, the priority control unit 207 returns the load distribution method to the business processing server A 104, the business processing server B 105, the business processing server C 106, and the business processing server Z 109 to the load distribution method before starting the performance measurement ( S506), the performance measurement process is terminated. For example, after the server Z is disconnected (FIG. 6), for the priority 307, the business processing server Z109 is undefined and the other business processing servers are 1 (high priority). As a result, the load balancer 103 does not allocate requests to the business processing server Z109.

以上の処理により、業務処理サーバZ109の処理能力を求めることができる。   Through the above processing, the processing capability of the business processing server Z109 can be obtained.

同様の性能測定を業務処理サーバA104、業務処理サーバB105、業務処理サーバC106についても行い、負荷分散管理テーブル206内の処理能力306を求めておく。これにより、業務処理サーバの処理能力306の総和と、現在のリクエストとを比較することにより、利用者クライアント101からのリクエストが240件/分未満となれば業務処理サーバB105を削減することが可能であり、170件/分未満となれば業務処理サーバB105および業務処理サーバC106の2台を削減することが可能であることが分かる。   Similar performance measurement is performed for the business processing server A 104, the business processing server B 105, and the business processing server C 106, and the processing capability 306 in the load distribution management table 206 is obtained. Thus, by comparing the total processing capability 306 of the business processing server with the current request, the business processing server B 105 can be reduced if the number of requests from the user client 101 is less than 240 requests / minute. If the rate is less than 170 cases / minute, it can be seen that the number of the business processing server B 105 and the business processing server C 106 can be reduced.

以上説明した本発明は、以下のようにその趣旨を逸脱しない範囲で広く変形実施することができる。   The present invention described above can be widely modified without departing from the spirit thereof as follows.

例えば、計測するパラメータとして、CPU使用率だけでなく、メモリ使用率、および、ネットワーク回線使用率などのCPU以外の計算機資源に関するパラメータを、CPU使用率の代わりに、あるいはCPU使用率と併せて計測することとしてもよい。   For example, parameters related to computer resources other than the CPU, such as the memory usage rate and the network line usage rate, are measured instead of the CPU usage rate or in combination with the CPU usage rate as parameters to be measured. It is good to do.

また、本実施形態において、業務処理サーバを対象としたが、負荷分散の対象となる処理は、業務処理に限定されず、科学計算処理などの様々な計算機の処理としてもよい。   Further, in the present embodiment, the business processing server is targeted, but the processing to be subject to load distribution is not limited to business processing, and may be processing of various computers such as scientific computing processing.

本発明の一実施形態に関する負荷分散システムを示す構成図である。It is a block diagram which shows the load distribution system regarding one Embodiment of this invention. 本発明の一実施形態に関する負荷分散装置を示す構成図である。It is a block diagram which shows the load distribution apparatus regarding one Embodiment of this invention. 本発明の一実施形態に関する負荷分散管理テーブル(サーバZ追加前)を示す構成図である。It is a block diagram which shows the load distribution management table (before server Z addition) regarding one Embodiment of this invention. 本発明の一実施形態に関する負荷分散管理テーブル(サーバZの性能測定を実施中)を示す構成図である。It is a block diagram which shows the load distribution management table (during the performance measurement of the server Z) regarding one Embodiment of this invention. 本発明の一実施形態に関する負荷分散管理テーブル(サーバZの性能測定が完了)を示す構成図である。It is a block diagram which shows the load distribution management table (Performance measurement of the server Z is completed) regarding one Embodiment of this invention. 本発明の一実施形態に関する負荷分散管理テーブル(サーバZ切り離し後)を示す構成図である。It is a block diagram which shows the load distribution management table (after server Z isolation | separation) regarding one Embodiment of this invention. 本発明の一実施形態に関する処理量とCPU負荷の関係の例を示す説明図である。It is explanatory drawing which shows the example of the relationship between the processing amount regarding one Embodiment of this invention, and CPU load. 本発明の一実施形態に関する負荷分散処理を示すフローチャートである。It is a flowchart which shows the load distribution process regarding one Embodiment of this invention.

符号の説明Explanation of symbols

101 利用者クライアント
102 ネットワーク
103 負荷分散装置
104 業務処理サーバA
105 業務処理サーバB
106 業務処理サーバC
109 業務処理サーバZ
111 管理サーバ
201 主記憶装置
202 CPU
203 通信管理
204 負荷分散処理部
205 負荷状況監視部
206 負荷分散管理テーブル
207 優先度制御部
216 負荷分散参照テーブル
101 User client 102 Network 103 Load balancer 104 Business processing server A
105 Business processing server B
106 Business processing server C
109 Business processing server Z
111 Management Server 201 Main Storage Device 202 CPU
203 Communication Management 204 Load Distribution Processing Unit 205 Load Status Monitoring Unit 206 Load Distribution Management Table 207 Priority Control Unit 216 Load Distribution Reference Table

Claims (9)

負荷分散管理テーブルに基づいて分配されたリクエストを実行する複数のサーバにおいて、性能測定対象である第1サーバの処理能力を測定する計算機管理方法であって、
コンピュータが、
リクエストを実行中である第2サーバよりも、前記第1サーバにリクエストが優先的に割り当てられるように、記憶手段に格納された前記負荷分散管理テーブルを変更する優先度制御手順と、
前記第1サーバの性能が所定の許容上限に達した時点の処理量を、前記第1サーバの処理能力として記録する負荷状況監視手順と、
を実行することを特徴とする計算機管理方法。
A computer management method for measuring the processing capacity of a first server, which is a performance measurement target, in a plurality of servers executing requests distributed based on a load distribution management table,
Computer
A priority control procedure for changing the load distribution management table stored in the storage means so that the request is preferentially assigned to the first server over the second server that is executing the request;
A load status monitoring procedure for recording the processing amount at the time when the performance of the first server reaches a predetermined allowable upper limit as the processing capacity of the first server;
The computer management method characterized by performing.
前記負荷分散管理テーブルは、サーバごとに処理量の上限を格納し、前記第1サーバの処理量の上限を超えるリクエストについては、前記第2サーバに割り当てられるように構成されることを特徴とする請求項1に記載の計算機管理方法。   The load distribution management table stores an upper limit of the processing amount for each server, and a request exceeding the upper limit of the processing amount of the first server is configured to be allocated to the second server. The computer management method according to claim 1. 前記負荷分散管理テーブルは、前記第1サーバの処理量の上限の初期値を、性能測定開始前の前記第1サーバの処理量とすることを特徴とする請求項2に記載の計算機管理方法。   3. The computer management method according to claim 2, wherein the load distribution management table uses an initial value of an upper limit of a processing amount of the first server as a processing amount of the first server before starting performance measurement. 前記優先度制御手順は、前記負荷状況監視手順において前記第1サーバの処理能力を記録した後に、前記第1サーバにリクエストが割り当てられないように、前記負荷分散管理テーブルを変更することを特徴とする請求項1ないし請求項3のいずれか1項に記載の計算機管理方法。   The priority control procedure changes the load distribution management table so that a request is not assigned to the first server after recording the processing capability of the first server in the load status monitoring procedure. The computer management method according to any one of claims 1 to 3. 前記負荷状況監視手順は、前記第1サーバの性能が所定の許容上限に達したか否かを、前記第1サーバに関するCPU使用率、メモリ使用率、および、ネットワーク回線使用率のうち、少なくとも1つの使用率を参照して決定することを特徴とする請求項1ないし請求項4のいずれか1項に記載の計算機管理方法。   In the load status monitoring procedure, whether or not the performance of the first server has reached a predetermined allowable upper limit is determined based on at least one of a CPU usage rate, a memory usage rate, and a network line usage rate related to the first server. 5. The computer management method according to claim 1, wherein the computer management method is determined with reference to one usage rate. 6. 前記負荷分散管理テーブルは、前記第1サーバの現在の処理量が、前記第1サーバの処理量の上限に達したら、前記第1サーバの処理量の上限を増大させるように構成されることを特徴とする請求項2に記載の計算機管理方法。   The load distribution management table is configured to increase the upper limit of the processing amount of the first server when the current processing amount of the first server reaches the upper limit of the processing amount of the first server. The computer management method according to claim 2, wherein: 前記第1サーバおよび前記第2サーバは、Webサーバであることを特徴とする請求項1ないし請求項6のいずれか1項に記載の計算機管理方法。   The computer management method according to claim 1, wherein the first server and the second server are Web servers. 請求項1ないし請求項7のいずれか1項に記載の計算機管理方法を、コンピュータに実行させるための計算機管理プログラム。   A computer management program for causing a computer to execute the computer management method according to any one of claims 1 to 7. 負荷分散管理テーブルに基づいて分配されたリクエストを実行する複数のサーバにおいて、性能測定対象である第1サーバの処理能力を測定する計算機管理サーバであって、
リクエストを実行中である第2サーバよりも、前記第1サーバにリクエストが優先的に割り当てられるように、前記負荷分散管理テーブルを変更する優先度制御部と、
前記第1サーバの性能が所定の許容上限に達した時点の処理量を、前記第1サーバの処理能力として記録する負荷状況監視部と、
を有していることを特徴とする計算機管理サーバ。
In a plurality of servers that execute requests distributed based on a load distribution management table, a computer management server that measures the processing capacity of a first server that is a performance measurement target,
A priority control unit that changes the load distribution management table so that the request is preferentially assigned to the first server over the second server that is executing the request;
A load status monitoring unit for recording the processing amount at the time when the performance of the first server reaches a predetermined allowable upper limit as the processing capacity of the first server;
A computer management server characterized by comprising:
JP2005376186A 2005-12-27 2005-12-27 Method, program and server for computer management Pending JP2007179246A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005376186A JP2007179246A (en) 2005-12-27 2005-12-27 Method, program and server for computer management

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005376186A JP2007179246A (en) 2005-12-27 2005-12-27 Method, program and server for computer management

Publications (1)

Publication Number Publication Date
JP2007179246A true JP2007179246A (en) 2007-07-12

Family

ID=38304379

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005376186A Pending JP2007179246A (en) 2005-12-27 2005-12-27 Method, program and server for computer management

Country Status (1)

Country Link
JP (1) JP2007179246A (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011170751A (en) * 2010-02-22 2011-09-01 Nec Corp Bus system
JP2013101530A (en) * 2011-11-09 2013-05-23 Nec Corp Service cooperation device, service cooperation method, and service cooperation program
JP2014139845A (en) * 2008-12-01 2014-07-31 Nec Corp Data processing system, computer program thereof and data processing method
JP5933118B2 (en) * 2013-04-24 2016-06-08 三菱電機株式会社 Test apparatus, test method and program
JP2018036830A (en) * 2016-08-31 2018-03-08 日本電信電話株式会社 Processing system, processing method, processing server, processing program, evaluation server, and evaluation program

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014139845A (en) * 2008-12-01 2014-07-31 Nec Corp Data processing system, computer program thereof and data processing method
JP2011170751A (en) * 2010-02-22 2011-09-01 Nec Corp Bus system
JP2013101530A (en) * 2011-11-09 2013-05-23 Nec Corp Service cooperation device, service cooperation method, and service cooperation program
JP5933118B2 (en) * 2013-04-24 2016-06-08 三菱電機株式会社 Test apparatus, test method and program
JP2018036830A (en) * 2016-08-31 2018-03-08 日本電信電話株式会社 Processing system, processing method, processing server, processing program, evaluation server, and evaluation program

Similar Documents

Publication Publication Date Title
JP4313336B2 (en) Monitoring system and monitoring method
KR101781063B1 (en) Two-level resource management method and appratus for dynamic resource management
KR101651871B1 (en) Job Allocation Method on Multi-core System and Apparatus thereof
WO2012056596A1 (en) Computer system and processing control method
JP2010204876A (en) Distributed system
US8479038B1 (en) Method and apparatus for achieving high availability for applications and optimizing power consumption within a datacenter
JP2006285316A (en) Server performance measuring method, server performance measuring system and computer program used for the method and system
WO2015001850A1 (en) Task allocation determination device, control method, and program
JP2010238051A (en) Load balancing program and load balancing apparatus
JP4117299B2 (en) Method, control server, server, and program for controlling upper limit value of server multiplicity
JP2018180591A (en) Information processing apparatus, information processing system, information processing method, and information processing program
US20120233313A1 (en) Shared scaling server system
JP2007179246A (en) Method, program and server for computer management
WO2015165546A1 (en) Dynamically scaled web service deployments
JP2005092862A (en) Load distribution method and client-server system
TW201233097A (en) Method for load distribution
JP2017162059A (en) Information processing device, control method, and program
JP2009181249A (en) Virtual machine server, virtual machine system, virtual machine distribution method and program for use in the same
CN113268329A (en) Request scheduling method, device and storage medium
US11321143B2 (en) Information processing device and distributed system
JP5939620B2 (en) Computer system, server device, load balancing method, and program
JP2013127685A (en) Information processing system and operation management method
JP5082111B2 (en) Computer system, service utilization apparatus, control method, and program
US10375161B1 (en) Distributed computing task management system and method
JP2006107197A (en) Memory control method and program and terminal equipment