JP5549374B2 - Load balancer and the load sharing control method - Google Patents

Load balancer and the load sharing control method Download PDF

Info

Publication number
JP5549374B2
JP5549374B2 JP2010118036A JP2010118036A JP5549374B2 JP 5549374 B2 JP5549374 B2 JP 5549374B2 JP 2010118036 A JP2010118036 A JP 2010118036A JP 2010118036 A JP2010118036 A JP 2010118036A JP 5549374 B2 JP5549374 B2 JP 5549374B2
Authority
JP
Japan
Prior art keywords
host
virtual host
virtual
failure
distribution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010118036A
Other languages
Japanese (ja)
Other versions
JP2011248428A (en
Inventor
丈二 古谷
Original Assignee
富士通株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 富士通株式会社 filed Critical 富士通株式会社
Priority to JP2010118036A priority Critical patent/JP5549374B2/en
Publication of JP2011248428A publication Critical patent/JP2011248428A/en
Application granted granted Critical
Publication of JP5549374B2 publication Critical patent/JP5549374B2/en
Application status is Expired - Fee Related legal-status Critical
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、負荷分散装置及び負荷分散制御方法に関する。 The present invention relates to a load balancer and the load sharing control method. 本発明は、例えば、仮想ホスト等による処理システムにおいて、処理要求を分散させて振り分ける負荷分散装置及び負荷分散制御方法に適用することができる。 The present invention is, for example, be in the processing system by the virtual host such as is applied to the load balancer and the load sharing control method allocates by distributing processing request.

図9は負荷分散処理を行う処理システムの構成例を示す。 Figure 9 shows a configuration example of a processing system for performing load balancing process. 負荷分散処理を行う処理システムは、図9に示すように、負荷分散装置10、処理の分散振り分け先のリアルサーバとなる複数の物理ホスト21,22,23及び複数の端末31,32,3nを有する。 Processing system for performing load balancing process, as shown in FIG. 9, the load balancer 10, a plurality of physical hosts 21, 22, 23 and a plurality of terminals 31,32,3n to be distributed assignment destination real server process a. これらは、ネットワーク40を介して相互に接続される。 These are connected to each other via a network 40.

各物理ホスト21,22,23は、仮想化実行環境を有し、それぞれ複数の仮想ホストが稼動する。 Each physical host 21, 22, 23 has a virtual execution environment, each plurality of virtual hosts running. 例えば、第1の物理ホスト21は、仮想ホスト21−1,21−2,21−3の仮想ホスト群が稼動し、第2の物理ホスト22は、仮想ホスト22−1,22−2,22−3の仮想ホスト群が稼動し、第3の物理ホスト23は、仮想ホスト23−1,23−2,23−3の仮想ホスト群が稼動する。 For example, the first physical host 21, the virtual host group running virtual host 21-1, 21-2 and 21-3, the second physical host 22, the virtual host 22-1,22-2,22 virtual host group running -3, a third physical host 23, the virtual host group virtual host 23-1 is operated.

負荷分散装置10は、仮想サーバとしての複数の負荷分散グループ#1,#2,#3を有し、端末31〜3nから処理要求(サーバへのアクセス要求等)を受け付けると、複数の仮想ホスト21−1〜23−3の何れかに該処理要求を振り分ける。 Load balancer 10, a plurality of load balancing group # 1 as the virtual server, # 2, has a # 3, when receiving a processing request from the terminal 31 to 3n (request for access to a server, etc.), a plurality of virtual hosts distributing the processing request to one of 21-1~23-3. 該処理要求が振り分けられた仮想ホスト21−1〜23−3の何れかは、端末31〜3nから要求された処理を実行する。 Any virtual host 21-1~23-3 which the processing request has been distributed executes the processing requested by the terminal 31 to 3n. なお、図9に示した負荷分散の処理システムは、Webサーバやアプリケーションサーバ等のほか、その他の負荷分散環境で利用されるサーバシステムに適用される。 The processing system of load distribution shown in FIG. 9, Web servers and other application servers such as are applied to the server system utilized in other loads distributed environment.

ユーザトラフィックが少ない低負荷時のサーバリソースの利用効率化の要求の高まり、及び運用管理技術の向上等により、サーバ仮想化環境の処理システムが普及するものと予想される。 Growing user traffic utilization efficiency of small low-load server resource requests, and the improvement of the operation management technique, it is expected that the processing system of the server virtualization environment is widespread. また、サーバCPUのマルチコア化及びサーバ仮想化技術の向上等により、物理ホスト上で稼動する仮想ホストの数がますます増えていくものと予想される。 Moreover, the improvement of multi-core and server virtualization technology server CPU, the number of virtual hosts running on the physical host is expected to go increasingly.

また、ユーザトラフィックは、利用時期や利用時間帯により増減の幅が大きく、ユーザトラフィックの増減により、仮想ホストの増減や配置換えがダイナミックに行われ、物理ホストと仮想ホストとの対応付けの管理は、今後ますます複雑になっていくものと予想される。 The user traffic is larger width increases or decreases by the use time and use time zones, the increase or decrease in user traffic, made to increase or decrease rearrangement dynamic virtual host, the association management of the virtual host and physical host , it is expected that will become increasingly complex in the future.

ウェブサーバとアプリケーションサーバとが接続されるウェブシステムにおいて、各サーバの負荷状況に基づいてサービス構成を動的に変更する動的構成制御装置及び動的構成制御方法等について、例えば下記の特許文献1等に記載されている。 In a web system and a web server and application server are connected, the dynamic configuration controller and dynamic configuration control method or the like to dynamically change the service configuration based on the load status of each server, for example, the following Patent Document 1 It has been described in an equal. また、負荷分散装置によって端末からの要求を複数のアプリケーションサーバに均等に振り分ける構成については、例えば下記の特許文献2等に記載されている。 Further, the configuration for distributing evenly the request from the terminal by the load balancer to a plurality of application servers, are described for example in Patent Document 2 or the like below.

特開2003−281007号公報 JP 2003-281007 JP 特開2007−199829号公報 JP 2007-199829 JP

仮想化環境における負荷分散装置では、サーバへの処理要求を、物理ホストではなく仮想ホストを分散処理の振り分け先ホストとして振り分ける。 In load balancer in a virtualized environment, it distributes the processing request to the server, as the distribution destination host of the distributed processing virtual host rather than physical host. 負荷分散装置では、物理ホストと仮想ホストとの対応関係を特に管理しないのが一般である。 In load balancer, not particularly manage the physical host the correspondence between the virtual host is generally. しかしながら、実際には仮想ホストは物理ホスト上で稼動しているため、物理ホストがハードウェア障害等で機能停止状態となると、該物理ホスト上で稼働する仮想ホストへの処理要求の振り分け動作は、無駄な動作となる。 However, since the running actually on virtual host physical host, the physical host is stalled by hardware failure or the like, the distribution operation of the processing requests to the virtual host running on the physical host, an unnecessary operation.

負荷分散装置は、仮想ホストへの処理要求の振り分けを行った後、該振り分けを行った処理要求に対する無応答を検出することによってしか、振り分け先の仮想ホストの障害を検出することができない。 Load balancer after the allocation of the processing requests to the virtual host, only by detecting no response to the processing request subjected to the sorting, it is impossible to detect a failure of the virtual host assignment destination. そのため、物理ホストが故障している可能性が高い場合、該物理ホスト上で稼働する仮想ホストへの振り分けが失敗となる可能性が高いにも拘らず、無効な処理要求の振り分けを行ってしまう場合がある。 Therefore, if the physical host is likely to have failed, despite the likely distribution to the virtual host running on the physical host is unsuccessful, thus performing sorting invalid processing request If there is a.

振り分け先の仮想ホストの障害を検出する方法として、障害検出用の専用モジュールを振り分け先の仮想ホストにインストールし、負荷分散装置と独自連携することで振り分け先の仮想ホストの障害を検出する方法も考えられるが、この場合、振り分け先のホストで利用されるハードウェア、オペレーティングシステム(OS)、ソフトウェア、又は仮想化実行環境の特定技術に依存してしまうため、種々のホストを対象として汎用的に利用できないという課題がある。 As a method for detecting a failure of distribution destination virtual host, install the virtual host target allocation dedicated module for fault detection, a method of detecting a failure of the virtual host distribution destination by the load balancer and unique cooperation considered. in this case, the hardware utilized in the distribution destination host operating system (OS), software, or to become dependent on a particular technology virtualization execution environment, generically targeting various host there is a problem that can not be used.

処理要求の振り分け失敗時には、振り分け先の仮想ホストからの応答待ちの処理遅延や振り分けのリトライ動作等が発生するため、処理要求の振り分けの失敗は、アクセスレスポンスの遅延をもたらす等、サービス利用者への影響が発生する。 Processing at the time of request for allocation failure, for such response wait processing delays and distribution of retry operation from the distribution destination virtual host occurs, the failure of allocation of processing requests, etc. results in a delay in the access response, to the service user impact occurs of. また、振り分け先の仮想ホストからの応答待ちの処理遅延や振り分けのリトライ動作等は、それ自体で負荷分散装置の処理負荷の増大に繋がる。 Moreover, processing delay and retry operation or the like of the distribution of waiting for a response from the virtual host assignment destination leads itself to increase in the processing load of the load balancer. 本発明は、処理要求の振り分けに失敗する可能性が高い無駄な振り分け動作を減らし、負荷分散処理の効率化を図ることを目的とする。 The present invention reduces the likely wasted sorting operation to fail distribution processing request, and an object thereof is to improve the efficiency of load distribution processing.

上記課題を解決する一形態としての負荷分散装置は、複数の仮想ホストに処理要求を分散させて振り分ける負荷分散装置において、前記仮想ホストと該仮想ホストがそれぞれ稼働する物理ホストとを対応付け、処理要求の振り分けに失敗した仮想ホストの統計情報を、該仮想ホストに対応付けた物理ホスト毎に収集して管理する統計情報管理部と、前記振り分けに失敗した仮想ホストの統計情報が所定の閾値より大きい物理ホスト上で稼働する仮想ホストを、処理要求の振り分け先として閉塞する閉塞管理部と、を備えたものである。 Load distribution apparatus as an embodiment for solving the above problems is the load balancer to distribute by dispersing the processing request to a plurality of virtual hosts, correspondence between physical hosts the virtual host and the virtual host is running each process statistics for the virtual host that failed to distribution requests, and statistical information management unit for managing collected for each physical host associated with the virtual host, statistics for the virtual host that failed the distribution is than the predetermined threshold the virtual host running on large physical host, a closing control section for closing a distribution destination of the processing request, in which with a.

失敗する可能性が高い無駄な処理要求の振り分け動作を減らすことができ、処理要求の振り分け失敗によるレスポンスの遅延を低減し、端末(利用者)に対するレスポンスの向上を図ることができる。 Can fail possibility to reduces the sorting operation of the high wasteful processing request to reduce the delay of response by distributing processing failure request, it is possible to improve the response to the terminal (user). また、レスポンスの遅延や振り分けのリトライ動作に伴う負荷分散装置の処理負荷を軽減することができる。 Further, it is possible to reduce the processing load of the load balancer with the retry operation of the delay and sorting the responses.

開示の負荷分散装置の構成例を示す図である。 It is a diagram illustrating a configuration example of a load balancer disclosed. 負荷分散ポリシ情報テーブルの構成例を示す図である。 Is a diagram showing an example of the load-distribution policy information table. 統計情報テーブルの構成例を示す図である。 It is a diagram showing a configuration example of the statistical information table. 負荷分散制御部による処理要求の振り分けの失敗検出時の処理フロー例を示す図である。 Is a diagram showing a flow when the failure detection of the distribution of the processing request by the load balancing control unit. 閉塞管理部による障害時の仮想ホストの閉塞処理のフロー例を示す図である。 It is a diagram showing a flow example of a blocking process of the virtual host in case of failure due to blockage management unit. 処理要求の振り分けの動作例を示す図である。 Is a diagram showing an operation example of the distribution of the processing requests. 復旧確認監視部による障害復旧と判断する処理フロー例を示す図である。 It is a diagram illustrating a processing flow example of determining a failure recovery by restoration confirmation monitoring unit. 閉塞管理部による仮想ホストの閉塞を解除する処理フロー例を示す図である。 It is a diagram illustrating a processing flow example of releasing the blockage of the virtual host by occlusion management unit. 負荷分散処理を行う処理システムの構成例を示す図である。 It is a diagram illustrating a configuration example of a processing system for performing load balancing process.

開示の負荷分散装置は、仮想ホストと該仮想ホストが稼働する物理ホストとの対応関係を管理し、仮想ホストへの処理要求の振り分け失敗の統計情報を収集し、特定の物理ホスト上で稼動する仮想ホストへの振り分け失敗が多い場合に、該特定の物理ホストに障害が発生していると判断する。 Load balancer disclosed manages the correspondence between the physical host virtual host and the virtual host is running, it collects statistical information for sorting failure of processing requests to a virtual host, running on a particular physical host when sorting failure to a virtual host is large, it is determined that the said particular physical host has failed. そして、障害が発生していると判断された物理ホスト上で稼動する仮想ホスト群への処理要求の振り分けを停止し、無効な振り分け動作を回避する。 Then, stop the distribution of the processing requests to the virtual host group running on the physical host failure is determined to have occurred, to avoid invalid sorting operation.

上述の動作を行うための手段として、物理ホストと仮想ホストとの対応関係を管理し、仮想ホストへの処理要求の振り分け失敗の統計情報を管理する統計情報管理部と、物理ホスト上で稼動する仮想ホストへの処理要求の振り分け失敗の回数が所定の閾値を超えると、該物理ホスト上で稼働する仮想ホスト群を障害閉塞状態に変更する閉塞管理部とを備える。 As means for performing the above operation, manages the physical hosts the correspondence between the virtual host, a statistical information management unit for managing the statistical information sorting failure of processing requests to a virtual host, running on a physical host When the number of sorting failure of processing requests to the virtual host exceeds a predetermined threshold, and a closed management unit to change the virtual host group running on the physical host error shutdown state.

開示の負荷分散装置の構成例を図1に示す。 The example of the load-distribution device disclosed shown in FIG. 図1に示すように、負荷分散装置10は、仮想サーバ受付部11、負荷分散制御部12、負荷分散ポリシ情報格納部13、統計情報格納部14、閉塞管理部15、及び復旧確認監視部16を備える。 As shown in FIG. 1, the load balancer 10, the virtual server receiving unit 11, the load distribution control unit 12, the load balancing policy information storage unit 13, statistical information storage section 14, closed management unit 15 and the restoration confirmation monitoring unit 16, equipped with a.

仮想サーバ受付部11は、仮想サーバIPアドレスとポート番号とを負荷分散処理システムの外部に公開し、端末31〜3nからの処理要求(アクセス要求等)を受け付ける。 Virtual server receiving unit 11 exposes the virtual server IP address and port number to the outside of the load distribution processing system accepts a processing request from the terminal 31 to 3n (access request or the like). 負荷分散制御部12は、負荷分散ポリシ情報格納部13に格納された負荷分散ポリシ情報テーブルに従って負荷分散の振り分け制御を行う。 Load it balancing control unit 12 performs allocation control of the load distributed according to the load balancing policy information table stored in the load balancing policy information storage unit 13.

閉塞管理部15は、統計情報格納部14に格納された統計情報テーブルを参照し、処理要求の振り分け失敗の傾向を分析する。 Occlusion management unit 15 refers to the statistical information table stored in the statistical information storage section 14, it analyzes the trend of distribution failure processing request. そして、例えば特定の物理ホスト22上で稼働する例えば仮想ホスト22−1への振り分け失敗の割合が所定の閾値を越えると、該特定の物理ホスト22に障害が発生していると判断する。 Then, for example, the proportion of distribution failed to operate for example the virtual host 22-1 on a particular physical host 22 exceeds a predetermined threshold value, it is determined that the said particular physical host 22 has failed. そして、閉塞管理部15は、該特定の物理ホスト22上で稼動する仮想ホスト群22−1〜22−3への振り分けを閉塞するよう制御する。 The occlusion management unit 15 controls so as to close the distribution to the virtual host group 22-1 to 22-3 running on the particular physical host 22.

復旧確認監視部16は、閉塞管理部15で障害と判断され、振り分け先として閉塞された例えば物理ホスト22上で稼働する仮想ホスト群22−1〜22−3の障害の復旧の確認を行う。 Restoration confirmation monitoring unit 16, it is determined that the failure occlusion management unit 15, to confirm the failure recovery of virtual host groups 22-1 to 22-3 which runs on occluded example physical host 22 as a distribution destination.

図1では、負荷分散装置10と物理ホスト21〜23とがそれぞれ分離した構成例を示しているが、それらは、部分的に又は全体が1つに統合された構成であってもよい。 In Figure 1, although the load balancer 10 and the physical host 21 to 23 shows a configuration example in which separate each, they are whole part or may be an integrated structure together. また、負荷分散装置10内の各機能ブロックを部分的に別のシステムに分離し、又は全体を別のシステムと統合した構成としてもよい。 Furthermore, each function block of the load balancing apparatus 10 partially separated into another system, or the whole structure integrated with another system.

図2に負荷分散ポリシ情報テーブルの構成例を示す。 Figure 2 shows an example of the load-distribution policy information table. 負荷分散ポリシ情報格納部13は、図2に示すように、負荷分散グループ毎に、負荷分散グループ名、負荷分散グループID、及び仮想サーバIPアドレス/ポート番号を対応付けて負荷分散ポリシ情報テーブルに格納する。 Load balancing policy information storage unit 13, as shown in FIG. 2, each load balancing group, the load balancing group name, load balancing group ID, and the virtual server IP address / port number in association with the load balancing policy information table Store.

該負荷分散ポリシ情報テーブルには更に、各負荷分散グループの各仮想ホストについて、仮想ホストIPアドレス/ポート番号が格納され、また、各仮想ホストの稼働状態の情報が設定される。 Furthermore to the load balancing policy information table for each virtual host of each load balancing group, the virtual host IP address / port number is stored, also, information of the operating state of each virtual host is set. ここで、稼働状態の「オンライン」は、該当する仮想ホストが処理要求の振り分け先として有効な状態に設定されていることを表し、「障害閉塞」は、障害発生のため振り分け先として閉塞状態に設定されていることを表している。 Here, "line" of the operating state, indicates that the corresponding virtual host is set to a valid state as a distribution destination of the processing request, "error shutdown" is in a closed state as the distribution destination for the failure it represents that it is set. また、「保守閉塞」は、保守のために振り分け先として閉塞状態に設定されていることを表している。 Also, "Maintaining closed" represents that it is set in the closed state as the distribution destination for maintenance.

図3に統計情報テーブルの構成例を示す。 Figure 3 shows a configuration example of the statistical information table. 統計情報格納部14は、図3に示すように、物理ホスト毎に物理ホスト名及び物理ホストIPアドレスを対応付けて統計情報テーブルを格納する。 Statistical information storage unit 14, as shown in FIG. 3, stores the statistics information table in association with the physical host name and physical host IP addresses for each physical host. そして、該統計情報テーブルには更に、各物理ホスト上で稼働する各仮想ホストの仮想ホスト名、仮想ホストIPアドレス/ポート番号、振り分けの失敗を示す失敗検出フラグ、及び復旧確認監視状態の情報が設定される。 And, even in 該統 meter information table, the virtual host name of each virtual host running on each physical host, the virtual host IP address / port number, the failure detection flag indicating a failed allocation, and information of the restoration confirmation monitoring state It is set.

ここで、失敗検出フラグの「OFF」は、振り分けの失敗が検出されていないことを表し、「ON」は、振り分けの失敗が検出されたことを表している。 Here, "OFF" in the failure detection flag indicates that the failure of distribution is not detected, "ON" indicates that the failure of distribution was detected. また、復旧確認監視状態の「復旧済み」は、障害が復旧したことの確認が済んだことを表し、「未確認」は、障害が復旧したことの確認が未だ済んでいないことを表している。 In addition, the "pre-recovery" of the restoration confirmation monitoring state, indicates that having undergone a confirmation that the fault has recovered, "unconfirmed" represents that the confirmation of that the failure has been recovered have not already done so yet.

以下、負荷分散制御部12による処理要求の振り分け失敗検出時の処理と、閉塞管理部15による障害の物理ホスト上の仮想ホストを閉塞する処理と、復旧確認監視部16による障害復旧の判断処理と、閉塞管理部15による障害復旧物理ホスト上の仮想ホストの閉塞解除の処理について説明する。 Hereinafter, a load balancing control unit 12 by the processing at the time of distribution failure detection processing request, a process of closing the virtual host on a physical host failure due to blockage management unit 15, a determining process of the failure recovery due to the restoration confirmation monitoring unit 16 , it describes the processing of the unblocking of the virtual hosts on disaster recovery physical host by closed management unit 15.

<<負荷分散制御部による振り分け失敗検出時の処理>> << load distribution controller processing at the time of allocation failure detection by the >>
図4は、負荷分散制御部12による処理要求の振り分けの失敗検出時の処理フロー例を示している。 Figure 4 shows a flow when the failure detection of the distribution of the processing request by the load balancing control unit 12. 負荷分散制御部12は、仮想ホスト21−1〜23−3に対してアクセス要求等の処理要求を分散させて振り分ける。 Load balancing control unit 12 sorts by distributing the processing request such as a request to access the virtual host 21-1~23-3. そして、該振り分けた処理要求に対して仮想ホスト21−1〜23−3からエラー応答を受信し、又は仮想ホスト21〜23に送信した処理要求の応答待ちタイマの満了を検出したとき(4−1)、内部で保持している仮想ホスト毎の失敗回数を1つ加算(インクリメント)する(4−2)。 Then, receiving an error response from the virtual host 21-1~23-3 to the processing request sorting said, or when it detects the expiration of the response wait timer of the transmitted processing request to the virtual host 21 to 23 (4- 1), adds one to the number of failed each virtual host that is held in the (increment) (4-2).

失敗回数を加算(インクリメント)した結果、該失敗回数が予め定めたリトライ回数閾値以上か否かを判定する(4−3)。 Adding the failure count (increment) the result determines whether the failure count preset or retry count threshold (4-3). 該失敗回数が該リトライ回数閾値より少ない場合は、仮想ホストへの処理要求の振り分けのリトライ処理を実施する(4−4)。 If the failure count is less than the number of retries threshold performs retry processing of distributing the processing request to the virtual host (4-4). 該失敗回数が該リトライ回数閾値以上の場合は、統計情報テーブルの失敗検出フラグを「OFF」から「ON」に変更し(4−5)、閉塞管理部15へ失敗検出フラグを変更したことを通知する(4−6)。 That the failure count is equal to or larger than the retry count threshold, which changes the failure detection flag in the statistics information table from "OFF" to "ON" (4-5) was changed failure detection flag to the closed management unit 15 notification to (4-6).

続いて、負荷分散ポリシテーブルを参照し、次ぎの振り分け先候補となる仮想ホストを決定し(4−7)、決定した仮想ホストへ処理要求を送信し、該処理要求に対する応答待ちタイマを起動する(4−8)。 Subsequently, with reference to the load distribution policy table to determine the virtual host to which the next assignment destination candidate (4-7), determined by transmitting the processing request to the virtual host starts the response wait timer for the processing request (4-8).

<<閉塞管理部による仮想ホストの障害閉塞の処理>> << processing of error shutdown of the virtual host due to blockage management unit >>
図5は、閉塞管理部15による障害時の仮想ホストの閉塞処理のフロー例を示す。 Figure 5 illustrates a flow example of a blocking process of the virtual host in case of failure due to blockage management unit 15. 閉塞管理部15は、負荷分散制御部12から失敗検出フラグ更新を受信すると(5−1)、各物理ホスト上で稼働する仮想ホスト群毎に、失敗検出フラグONの数の割合を算出し、予め定めた物理ホスト障害判断閾値(例えば50%)以上か否かを判定する(5−2)。 Occlusion management unit 15 receives the failure detection flag update from the load distribution controller 12 (5-1), each virtual host group running on each physical host calculates the ratio of the number of failure detection flag ON, determining whether a predetermined physical host failure determination threshold value (e.g. 50%) or more (5-2).

失敗検出フラグONの数の割合が物理ホスト障害判断閾値以上の場合、当該仮想ホスト群の物理ホストに何らかの障害が発生していると判断し(5−3)、当該物理ホスト上で稼働する仮想ホストに対して、負荷分散ポリシ情報テーブルの稼動状態を「オンライン」から「障害閉塞」に変更する(5−4)。 If the ratio of the number of failure detection flag ON is equal to or higher than the physical host failure determination threshold, it determines that some failure on the physical host of the virtual host group is occurring (5-3), running on the physical host virtual to the host, to change the operating state of the load balancing policy information table from "online" to "error shutdown" (5-4).

閉塞管理部15は、負荷分散ポリシ情報テーブルの稼動状態を「障害閉塞」に変更した後、障害が発生していると判断した物理ホストの復旧確認を実施させるために、復旧確認障害が発生していると判断した物理ホストの復旧監視の要求を、復旧確認監視部16に通知する(5−5)。 Occlusion management unit 15, after changing the operating state of the load balancing policy information table "error shutdown", in order to implement the restoration confirmation physical host failure is determined to have occurred, the restoration confirmation failure the recovery request of monitoring the physical host is determined that notifies the restoration confirmation monitoring unit 16 (5-5).

図6に処理要求の振り分けの動作例を示す。 Figure 6 shows an operation example of the distribution of the processing requests. 図6に示すように、仮想ホスト22−1と仮想ホスト22−2に対する処理要求の振分けが失敗(NG)だったとすると、物理ホスト22が障害発生中であると判断する。 As shown in FIG. 6, when the distribution of the processing request and the virtual host 22-1 to the virtual host 22-2 was unsuccessful (NG), the physical host 22 is determined to be in failure. そして、負荷分散ポリシ情報を基に、物理ホスト22上で稼働する仮想ホスト22−1〜22−3の稼動状態を「障害閉塞」に変更する。 Then, based on the load balancing policy information, to change the operating state of the virtual hosts 22-1 to 22-3 running on the physical host 22 to the "error shutdown". こうすることにより、仮想ホスト22−1〜22−3が負荷分散制御部12による処理要求の振り分け先の選択対象から外され、振り分け失敗となる可能性が高い仮想ホスト22−3への振り分け動作が実施されなくなる。 By doing so, the virtual host 22-1 to 22-3 is disconnected from the distribution destination selection processing request by the load balancing control unit 12, the sorting operation to the virtual will likely be distributed failure host 22-3 There will not be implemented.

<<復旧確認監視部による障害復旧と判断する処理>> << processing it is determined that the disaster recovery due to the restoration confirmation monitoring unit >>
図7に復旧確認監視部16による障害復旧と判断する処理フロー例を示す。 It shows a processing flow example of determining a failure recovery by restoration confirmation monitoring unit 16 in FIG. 復旧確認監視部16は、閉塞管理部15から障害と判定した物理ホストの復旧監視要求の通知を受信すると(7−1)、統計情報テーブルの当該物理ホスト上で稼働する各仮想ホストの復旧確認監視状態を「未確認」に変更する(7−2)。 Restoration confirmation monitoring unit 16 receives the restoration monitoring requests notification of the physical host where it is determined that failure from the closed management unit 15 (7-1), the restoration confirmation of the virtual host running on the physical host statistics table to change the monitoring status to "unconfirmed" (7-2).

統計情報テーブルの仮想ホストの中から、復旧確認監視状態が「未確認」の仮想ホストを選択し(7−3)、選択した仮想ホストに対して復旧確認要求を示す信号を送信し、該復旧確認要求に対する応答待ちタイマを起動する(7−4)。 From the virtual host statistics table, the restoration confirmation monitoring status selects a virtual host "unconfirmed" (7-3), and transmits a signal indicating the restoration confirmation request to the virtual host selected, 該復 old check to start the response wait timer for the request (7-4). 復旧確認監視の具体的な手段としては、通信プロトコルによる復旧確認監視のほか、Ping応答監視、TCPポート応答監視、UDPポート応答監視、アプリケーションレベル応答監視(HTTP、FTP、SIP、TELNET、SSL 等)、SNMP監視等を用いることができる。 Specific means of restoration confirmation monitoring, in addition to the restoration confirmation monitored by the communication protocol, Ping response monitoring, TCP port response monitoring, UDP port response monitoring, application level response monitoring (HTTP, FTP, SIP, TELNET, SSL, etc.) , it can be used SNMP monitoring the like.

復旧確認監視部16は、仮想ホストから復旧確認要求に対する正常応答が受信されるか判定する(7−5)。 Restoration confirmation monitoring unit 16 determines whether normal response to restoration confirmation request from the virtual host is received (7-5). 正常応答が受信されず、仮想ホストからエラー応答を受信し、又は応答待ちタイマが満了すると(7−6)、一定時間待機した後(7−7)、仮想ホストに対し復旧確認要求の信号を送信し、応答待ちタイマを起動する(7−8)。 Is not received normal response, it receives an error response from the virtual host, or when the response waiting timer expires (7-6), after a certain period of time (7-7), a signal restoration confirmation request to the virtual host transmitted, to start the response waiting timer (7-8). この動作を、仮想ホストから正常応答を受信するまで繰り返す(7−5)。 This operation is repeated until it receives a normal response from the virtual host (7-5). 復旧確認要求の信号を繰り返して送信する際の送信先仮想ホストは、同一の仮想ホストとしても良いが、他の未確認中の仮想ホストに変更しても良い。 Destination virtual host in transmitting repeatedly a signal restoration confirmation request may be the same virtual host, it may be changed to the virtual host in other unconfirmed.

仮想ホストから復旧確認要求に対する正常応答を受信すると、該仮想ホストの障害が復旧したと判断し、統計情報テーブルの復旧確認監視状態を「復旧済み」に変更する(7−9)。 Upon receiving a normal response to the restoration confirmation request from the virtual host, failure of the virtual host is determined to have recovered to change the restoration confirmation monitoring status statistics table to "pre Recovery" (7-9). そして、「復旧済み」に変更した仮想ホストが稼働する物理ホストの仮想ホスト群の中で、復旧確認監視状態が「復旧済み」となっている仮想ホスト数の割合を算出する。 Then, in the virtual host group of physical host to virtual host is running was changed to "pre-recovery", the restoration confirmation monitoring state to calculate the percentage of the virtual host the number of which is a "pre-recovery". 「復旧済み」の仮想ホスト数の割合が、予め定めた物理ホスト復旧判断閾値(例えば50%)以上か否かを判定する(7−10)。 The proportion of the virtual host number of "completed recovery" it is determined whether the predetermined physical host recovery determination threshold (e.g. 50%) or more (7-10).

「復旧済み」の仮想ホスト数の割合が、該物理ホスト復旧判断閾値(例えば50%)以上の場合は、該当する物理ホストが復旧したと判断し(7−11)、負荷分散ポリシ情報テーブルの該当する物理ホスト上で稼働する仮想ホストの復旧確認監視状態を「復旧済み」に変更する(7−12)。 The proportion of the virtual host number of "completed restoration" is in the case of more than the physical host recovery determination threshold (e.g. 50%), it is determined that the corresponding physical host is restored (7-11), the load balancing policy information table the restoration confirmation monitoring the state of the virtual host running on the appropriate physical host to change to "pre-recovery" (7-12). 復旧確認監視部16は、その後、閉塞管理部15へ、復旧したと判断した物理ホストの復旧監視応答を通知する(7−13)。 Restoration confirmation monitoring unit 16, then to the closed management unit 15 notifies the recovery monitoring response of the physical host determines that it has recovered (7-13).

一方、前述の処理フロー7−10の判定において、「復旧済み」の仮想ホスト数の割合が、予め定めた物理ホスト復旧判断閾値(例えば50%)より少ない場合は、該「復旧済み」の仮想ホスト数の割合が、予め定めた物理ホスト復旧判断閾値(例えば50%)以上となるまで、処理フロー7−3に戻り、同様の処理を繰り返す。 On the other hand, in the determination of the foregoing process flow 7-10, the proportion of the virtual host number of "completed restoration" is, if less than a predetermined physical host recovery determination threshold (e.g. 50%), the virtual of the "pre Recovery" ratio of the number of hosts, until predetermined physical host recovery determination threshold (e.g. 50%) or more, the flow returns to the processing flow 7-3, the same process is repeated.

<<閉塞管理部による仮想ホストの閉塞を解除する処理>> << process to release the blockage of the virtual host due to blockage management unit >>
図8は、復旧確認監視部16が復旧したと判断した物理ホストに対して、閉塞管理部15により該物理ホスト上で稼働する仮想ホストの閉塞を解除し、「オンライン状態」に設定する処理フロー例を示す。 Figure 8 is a process flow restoration confirmation monitoring unit 16 with respect to the physical host determines that it has recovered, to release the blockage of virtual hosts running on the physical host by closed management unit 15 is set to "online" It shows an example.

閉塞管理部15では、復旧確認監視部16から障害が復旧したと判断した物理ホストの復旧監視応答を受信すると(8−1)、統計情報テーブルを参照して、障害が復旧したと判断した物理ホスト上で稼働する仮想ホストを抽出する(8−2)。 The occlusion management unit 15, when the restoration confirmation monitoring unit 16 fails to receive a recovery monitoring response of the physical host determines that it has recovered (8-1), by referring to the statistical information table, it determines that a fault has recovered physical to extract a virtual host running on the host (8-2). そして、抽出した仮想ホストの負荷分散ポリシ情報テーブルにおける稼動状態を「障害閉塞」から「オンライン」に変更する(8−3)。 Then, to change the extracted operating state in the load balancing policy information table for the virtual host from the "error shutdown" to "online" (8-3).

負荷分散ポリシ情報テーブルの稼動状態を「障害閉塞」から「オンライン」に変更することにより、「オンライン」に変更された仮想ホストが、負荷分散制御部12による処理要求の振り分け先候補の選択に組み込まれるようになる。 By changing the operating state of the load balancing policy information table to "online" from "error shutdown" virtual host is changed to "online", incorporated in the selection of distribution destination candidate as the process request by the load distribution control unit 12 made to be. また、稼動状態を「障害閉塞」から「オンライン」に変更した仮想ホストであって、統計情報の失敗検出フラグが「ON」となっているものに対して、該失敗検出フラグを「OFF」に設定する(8−4)。 Further, a virtual host changes the operating state from the "error shutdown" to "online", for what failure detection flag statistics is "ON", the failure detection flag to "OFF" set (8-4).

上述の実施形態では、仮想ホスト上に1つのサービスが稼動する形態を示したが、仮想ホスト上で稼動するサービスは1つに限定されることはなく、仮想IPアドレスやポート番号を複数設けることにより、仮想ホスト上に複数のサービスが稼動するシステムに適用することもできる。 In the above embodiment, although the configuration in which one service is running on the virtual host services running on the virtual host is not limited to one, providing a plurality of virtual IP addresses and port numbers the can also be applied to a system in which a plurality of services is running on the virtual host.

また、上述の実施形態では、物理ホストの障害判断閾値や復旧判断閾値として、システム毎に予め一定の値に定めておく形態を示したが、物理ホスト障害が多発している場合は、復旧判断閾値を下げるなど、物理ホスト障害が発生している状況に応じて判断閾値を動的に変更する構成とすることができる。 In the aforementioned embodiment, when a failure determination threshold and recovery determination threshold value of the physical hosts, although the configuration to be defined in advance constant value for each system, the physical host failure occur frequently, the recovery determination and decreasing the threshold value may be configured to dynamically change the determination threshold depending on the context in which the physical host failure has occurred.

また、負荷分散トラヒックの増大により、振り分け先のリソースの空きが少なくなった場合は復旧判断閾値を下げ、負荷分散トラヒックが少なく、余裕があるときは、障害判断閾値を下げてより厳密に障害状況を確認するなど、システム全体の稼働状況に応じて障害判断閾値又は復旧判断閾値を動的に変更する構成とすることができる。 Also, by increasing the load distribution traffic, if empty assignment destination resource is low lowered recovery determination threshold less the load distribution traffic, if there is room, more precisely fault status lower the failure determination threshold and confirm, can be configured to dynamically change the failure determination threshold or recovery determination threshold in accordance with the operational status of the entire system.

上述の負荷分散装置における閉塞制御方式は、処理要求の振り分け先のホストで利用されるハードウェア、オペレーティングシステム(OS)、ソフトウェア、又は仮想化実行環境の特定技術に依存しないため、種々のホストを対象として汎用的に利用可能である。 Closed control method in the above-described load balancer hardware utilized in the distribution destination host processing request, an operating system (OS), software, or does not depend on the particular technology virtualization execution environment, a variety of host it is a generic available as a target.

10 負荷分散装置 11 仮想サーバ受付部 12 負荷分散制御部 13 負荷分散ポリシ情報格納部 14 統計情報格納部 15 閉塞管理部 16 復旧確認監視部 21〜23 物理ホスト 21−1〜23−3 仮想ホスト 31〜3n 端末 40 ネットワーク 10 Load balancer 11 virtual server receiving unit 12 load balancing control unit 13 the load balancing policy information storage unit 14 statistical information storage section 15 closed management unit 16 restoration confirmation monitor 21 to 23 physical hosts 21-1~23-3 virtual host 31 ~3n terminal 40 network

Claims (5)

  1. 複数の仮想ホストに処理要求を分散させて振り分ける負荷分散装置において、 In the load balancing apparatus distributes the processing request is dispersed to a plurality of virtual hosts,
    前記仮想ホストと該仮想ホストがそれぞれ稼働する物理ホストとを対応付け、処理要求の振り分けに失敗した仮想ホストの統計情報を、該仮想ホストに対応付けた物理ホスト毎に収集して管理する統計情報管理部と、 Statistics the virtual host and the virtual host associating the physical host running respectively, statistics for the virtual host that failed to distribution processing request, and manages the collected every physical host associated with the virtual host a management unit,
    前記振り分けに失敗した仮想ホストの統計情報が所定の閾値より大きい物理ホスト上で稼働する仮想ホストを、処理要求の振り分け先として閉塞する閉塞管理部と、 The virtual host statistics for the virtual host that failed the allocation is run on larger physical host than a predetermined threshold, a closing control section for closing a distribution destination of the processing request,
    を備えたことを特徴とする負荷分散装置。 Load balancer, characterized in that it comprises a.
  2. 前記処理要求に対する仮想ホストからのエラー応答又は応答待ちタイマの満了の発生毎に失敗回数を仮想ホスト毎に累算し、該累算した値が所定の閾値を超えた仮想ホストに対して、処理要求の振り分けに失敗した仮想ホストであることを示す失敗検出フラグを設定し、該失敗検出フラグの設定状況を前記統計情報管理部に通知する負荷分散制御部を備えたことを特徴とする請求項1に記載の負荷分散装置。 For the virtual host that accumulates the failure count for each occurrence of the expiration of an error response or response waiting timer from the virtual host for each virtual host, a value obtained by 該累 calculated exceeds a predetermined threshold value for the processing request, the processing claims set the failure detection flag indicating that the distribution request is a virtual host that failed, characterized in that the setting of the failure detection flag with a load distribution control unit configured to notify the statistical information management unit load balancer according to 1.
  3. 前記閉塞管理部は、同一の物理ホストに対応付けられた仮想ホスト数に対し、前記失敗検出フラグが設定された仮想ホスト数の割合が所定の閾値より大きい物理ホストに対して、該物理ホスト上で稼働する仮想ホストを前記振り分け先として閉塞することを特徴とする請求項2に記載の負荷分散装置。 The blocking management unit, the virtual number of hosts to which associated with the same physical host, the failure to the detection ratio of the virtual host number flag is set is greater physical host than a predetermined threshold value, the physical host on in the load balancing apparatus according to claim 2, characterized in that for closing the virtual host running as the distribution destination.
  4. 前記振り分けに失敗した仮想ホストの統計情報が所定の閾値より大きい物理ホスト上で稼働する仮想ホストに対して、復旧確認要求を示す信号を送信し、該復旧確認要求に対して正常応答を示す信号を受信したとき、該仮想ホストの障害が復旧したと判定し、同一の物理ホストに対応付けられた仮想ホスト数に対し、前記障害が復旧したと判定した仮想ホスト数の割合が所定の閾値より大きい物理ホストに対して、該物理ホスト上で稼働する仮想ホストを障害復旧済みとして設定する復旧確認監視部を備え、 For the virtual host statistics for the virtual host that failed the allocation is run on larger physical host than a predetermined threshold, it transmits a signal indicating the restoration confirmation request, a signal indicating a normal response to 該復 old confirmation request when receiving the, determines that failure of the virtual host is restored, virtual host number to which associated with the same physical host, the proportion of the virtual host number which the failure is determined to have recovery than a predetermined threshold value for large physical host includes a restoration confirmation monitoring unit for setting a virtual host running on the physical host as a failure already restored,
    前記閉塞管理部は、前記障害復旧済みとして設定された仮想ホストに対して、前記処理要求の有効な振り分け先として設定することを特徴とする請求項1乃至3の何れかに記載の負荷分散装置。 The blocking management unit, the relative virtual host is configured as a fault has been recovered, the load distribution apparatus according to any one of claims 1 to 3, characterized in that to set as a valid distribution destination of the processing request .
  5. 複数の仮想ホストに処理要求を分散させて振り分ける負荷分散制御方法において、 The load sharing control method for distributing the processing request is dispersed to a plurality of virtual hosts,
    前記仮想ホストと該仮想ホストがそれぞれ稼働する物理ホストとを対応付け、処理要求の振り分けに失敗した仮想ホストの統計情報を、該仮想ホストに対応付けた物理ホスト毎に収集して管理するステップと、 A step in which the virtual host and the virtual host associating the physical host running respectively, statistics for the virtual host that failed to distribution processing request, and manages the collected every physical host associated with the virtual host ,
    前記振り分けに失敗した仮想ホストの統計情報が所定の閾値より大きい物理ホスト上で稼働する仮想ホストを、処理要求の振り分け先として閉塞するステップと、 The virtual host statistics for the virtual host that failed the allocation is run on larger physical host than a predetermined threshold value, the step of closing a distribution destination of the processing request,
    を含むことを特徴とする負荷分散制御方法。 Load balancing control method, which comprises a.
JP2010118036A 2010-05-24 2010-05-24 Load balancer and the load sharing control method Expired - Fee Related JP5549374B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010118036A JP5549374B2 (en) 2010-05-24 2010-05-24 Load balancer and the load sharing control method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010118036A JP5549374B2 (en) 2010-05-24 2010-05-24 Load balancer and the load sharing control method

Publications (2)

Publication Number Publication Date
JP2011248428A JP2011248428A (en) 2011-12-08
JP5549374B2 true JP5549374B2 (en) 2014-07-16

Family

ID=45413651

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010118036A Expired - Fee Related JP5549374B2 (en) 2010-05-24 2010-05-24 Load balancer and the load sharing control method

Country Status (1)

Country Link
JP (1) JP5549374B2 (en)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2819020A4 (en) * 2012-02-20 2015-06-24 Mitsubishi Electric Corp Information system management device and information system management method and program
WO2013168465A1 (en) * 2012-05-08 2013-11-14 ソニー株式会社 Information processing device, information processing method and program
JP2014026353A (en) * 2012-07-25 2014-02-06 Nec Engineering Ltd Server management system, load distribution device, and server management method
WO2014052099A2 (en) * 2012-09-25 2014-04-03 A10 Networks, Inc. Load distribution in data networks
JP6408500B2 (en) * 2016-02-05 2018-10-17 日本電信電話株式会社 Call processing system, the load balancer and the load distribution method

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003281007A (en) * 2002-03-20 2003-10-03 Fujitsu Ltd Dynamic configuration controller and dynamic configuration control method
JP2007164264A (en) * 2005-12-09 2007-06-28 Fuji Xerox Co Ltd Load distribution program, load distribution device and service system
JP4649341B2 (en) * 2006-01-24 2011-03-09 株式会社日立製作所 Computer control method, an information processing system and computer control program
JP4777285B2 (en) * 2007-03-27 2011-09-21 株式会社野村総合研究所 Process control system

Also Published As

Publication number Publication date
JP2011248428A (en) 2011-12-08

Similar Documents

Publication Publication Date Title
JP5284809B2 (en) Dynamically method and apparatus for allocating resources to a plurality of virtual machines
JP6047577B2 (en) System and method for providing flexibility for load balancing and data compression in the traffic director Environment
CN101207550B (en) Load balancing system and method for multi business to implement load balancing
US7475108B2 (en) Slow-dynamic load balancing method
JP5557590B2 (en) Load balancer and systems
KR100998418B1 (en) Methods for operating virtual networks, data network system, computer program and computer program product
CN101673283B (en) Management terminal and computer system
CN104468181B (en) Detection and treatment virtual network device failures
CN104756451B (en) An interface for the lag dynamic load balancing method for network flow
CN102158386B (en) Distributed load balance for system management program
US7418627B2 (en) Cluster system wherein failover reset signals are sent from nodes according to their priority
US7296268B2 (en) Dynamic monitor and controller of availability of a load-balancing cluster
US6986076B1 (en) Proactive method for ensuring availability in a clustered system
CN102187315B (en) Methods and apparatus to get feedback information in virtual environment for server load balancing
US8613085B2 (en) Method and system for traffic management via virtual machine migration
US20020087612A1 (en) System and method for reliability-based load balancing and dispatching using software rejuvenation
US8879396B2 (en) System and method for using dynamic allocation of virtual lanes to alleviate congestion in a fat-tree topology
US20130111467A1 (en) Dynamic Server Farms
JP2008517382A (en) The configuration of the resource group that contains the virtual machine, monitoring, and / or management
US6934768B1 (en) Dynamic modification of fragmentation size cluster communication parameter in clustered computer system
KR20090098812A (en) Using storage load information to balance clustered virtual machines
US9703608B2 (en) Variable configurations for workload distribution across multiple sites
JP2003023444A (en) Dynamic load distribution system utilizing virtual router
JP2004062535A (en) Method of dealing with failure for multiprocessor system, multiprocessor system and node
JP2013535745A (en) The provision of application high availability in the high-availability virtual machine environment

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20110915

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130403

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140414

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140422

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140505

R150 Certificate of patent or registration of utility model

Ref document number: 5549374

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees