JP5729179B2 - 振分制御装置、振分制御方法および振分制御プログラム - Google Patents

振分制御装置、振分制御方法および振分制御プログラム Download PDF

Info

Publication number
JP5729179B2
JP5729179B2 JP2011148585A JP2011148585A JP5729179B2 JP 5729179 B2 JP5729179 B2 JP 5729179B2 JP 2011148585 A JP2011148585 A JP 2011148585A JP 2011148585 A JP2011148585 A JP 2011148585A JP 5729179 B2 JP5729179 B2 JP 5729179B2
Authority
JP
Japan
Prior art keywords
command
unit
distributed server
processing status
distribution control
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2011148585A
Other languages
English (en)
Other versions
JP2013016041A (ja
Inventor
智 阿部
智 阿部
淳一 芳尾
淳一 芳尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2011148585A priority Critical patent/JP5729179B2/ja
Publication of JP2013016041A publication Critical patent/JP2013016041A/ja
Application granted granted Critical
Publication of JP5729179B2 publication Critical patent/JP5729179B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Computer And Data Communications (AREA)

Description

本発明は、振分制御装置、振分制御方法および振分制御プログラムに関する。
従来、ネットワーク上に存在するネットワーク機器にアクセスする処理を行う場合に、複数のサーバに処理を分散して実行する技術が知られている。例えば、複数のサーバに順番に処理を割り当てたり、最もレスポンスの早いサーバに処理を割り当てるなど、全体の負荷を均等にする制御が知られている。
図19は、従来技術に係る負荷分散を説明する図である。図19に示すように、このシステムは、管理サーバ1と、コマンドロードバランサ2と、分散サーバ5と、分散サーバ6と、イベントロードバランサ7と、管理対象機器とを有する。
管理サーバ1は、管理対象のネットワーク機器に対して、管理コマンドをコマンドロードバランサ2経由で発行する。コマンドロードバランサ2は、管理サーバ1から発行されたコマンドを分散サーバ5または分散サーバ6に振り分けて、分散サーバの負荷を分散させる。分散サーバ5または分散サーバ6は、コマンドロードバランサ2から受信したコマンドを管理対象のネットワーク機器に対して実行し、イベントロードバランサ7から受信したイベントを集約して管理サーバ1へ送信する。
イベントロードバランサ7は、管理対象のネットワーク機器から受信した各種イベントを分散サーバ5または分散サーバ6に振り分けて、分散サーバの負荷を分散させる。管理対象ネットワーク機器は、例えばルータ、L3スイッチ、スイッチングハブ、L2スイッチなどのネットワーク機器であり、障害通知やログ情報などのイベントを管理サーバ1に送信する。
このように、従来技術に係るシステムでは、コマンドロードバランサ2が管理サーバ1から発行されたコマンドを負荷分散し、イベントロードバランサ7が管理対象のネットワーク機器から発行されたイベントを負荷分散する。
特開昭62−175832号公報 特開2002−278776号公報
しかしながら、従来の技術では、緊急性がある緊急コマンドを緊急に実行できない場合があり、特定のコマンドの実行効率が劣化するという問題がある。
例えば、従来の負荷分散では、処理が増えるにつれて全体の負荷を平均的にする制御が働き、全体的に高負荷となるので、緊急コマンドを高負荷なサーバに割り振るしかなく、緊急コマンドなど特定のコマンドの実行待ち時間が長くなり、緊急に実行できない。また、常時負荷の低いサーバをシステム内に別途用意する方法も考えられるが、用意するサーバに対してコストがかかるので、好ましい方法ではない。
開示の技術は、上記に鑑みてなされたものであって、緊急コマンドなど特定のコマンドの実行効率の劣化を防止できる振分制御装置、振分制御方法および振分制御プログラムを提供することを目的とする。
本願の開示する振分制御装置、振分制御方法および振分制御プログラムは、一つの態様において、分散サーバ群を形成するいずれかの分散サーバ装置に、管理サーバ装置から発行されたコマンドを送信する振分制御装置である。振分制御装置は、前記管理サーバ装置によって特定のコマンドが発行された時間までの所定時間ごとに、前記分散サーバ群の処理状況を保持する保持部を有する。振分制御装置は、前記分散サーバ群の処理状況を前記所定時間ごとに収集する収集部と、前記収集部によって収集された処理状況と前記保持部に保持される処理状況とを比較して、前記特定のコマンドの発生を予測する予測部とを有する。振分制御装置は、前記予測部によって特定のコマンドの発生が予測された場合に、前記分散サーバ群を形成するいずれかの分散サーバ装置に対する、前記特定のコマンド以外のコマンドの送信を抑止する抑止制御部を有する。
本願の開示する振分制御装置、振分制御方法および振分制御プログラムの一つの態様によれば、特定のコマンドの実行効率の劣化を防止できるという効果を奏する。
図1は、実施例1に係るシステムの全体構成例を示す図である。 図2は、実施例1に係る振分制御装置の構成を示す機能ブロック図である。 図3は、緊急コマンド情報テーブルに記憶される情報の例を示す図である。 図4は、統計情報テーブルに記憶される情報の例を示す図である。 図5は、パターン情報テーブルに記憶される情報の例を示す図である。 図6は、緊急パターン情報テーブルに記憶される情報の例を示す図である。 図7は、重み付け情報テーブルに記憶される情報の例を示す図である。 図8は、予測結果テーブルに記憶される情報の例を示す図である。 図9は、構成情報テーブルに記憶される情報の例を示す図である。 図10は、予測処理におけるパターン情報の比較例を説明する図である。 図11は、予測処理における重み付けを説明する図である。 図12は、予測判定例を説明する図である。 図13は、実施例1に係る振分制御装置におけるコマンド実行時の処理の流れを示すフローチャートである。 図14は、実施例1に係る振分制御装置における予測処理の流れを示すフローチャートである。 図15は、実施例2に係る振分制御装置の構成を示す機能ブロック図である。 図16は、重みの学習例を示す図である。 図17は、実施例2に係る振分制御装置における学習処理の流れを示すフローチャートである。 図18は、振分制御プログラムを実行するコンピュータのハードウェア構成の例を示す図である。 図19は、従来技術に係る負荷分散を説明する図である。
以下に、本願の開示する振分制御装置、振分制御方法および振分制御プログラムの実施例を図面に基づいて詳細に説明する。なお、この実施例によりこの発明が限定されるものではない。
[全体構成]
図1は、実施例1に係るシステムの全体構成例を示す図である。図1に示すように、このシステムは、管理サーバ10と、振分制御装置20と、分散サーバ50と、分散サーバ60と、イベントロードバランサ70と、管理対象機器とを有する。なお、実施例では、特定のコマンドとして、通常のコマンドより優先して緊急に実行することが望まれる緊急コマンドを例にして説明する。なお、緊急コマンドに限定されるものではなく、管理者等が指定する他のコマンドにも同様に適用することができる。
管理サーバ10は、管理対象のネットワーク機器に対して、管理コマンドを振分制御装置20経由で発行するサーバ装置である。振分制御装置20は、管理サーバ10から発行されたコマンドを分散サーバ50または分散サーバ60に振り分けて、分散サーバの負荷を分散させる負荷分散装置である。分散サーバ50または分散サーバ60は、振分制御装置20から受信したコマンドを管理対象のネットワーク機器に対して実行し、イベントロードバランサ70から受信したイベントを集約して管理サーバ10へ送信するサーバ装置である。
イベントロードバランサ70は、管理対象のネットワーク機器から受信した各種イベントを分散サーバ50または分散サーバ60に振り分けて、分散サーバの負荷を分散させる負荷分散装置である。管理対象ネットワーク機器は、例えばルータ、L3スイッチ、スイッチングハブ、L2スイッチなどのネットワーク機器であり、障害通知やログ情報などのイベントを管理サーバ10に送信するサーバ装置である。
このようなシステムにおいて、振分制御装置20は、管理サーバ10によって緊急コマンドが発行された時間までの所定時間ごとに、分散サーバ群の処理状況を保持する。そして、振分制御装置20は、分散サーバ群の処理状況を所定時間ごとに収集し、収集された処理状況と保持される処理状況とを比較して、緊急コマンドの発生を予測する。その後、振分制御装置20は、緊急コマンドの発生が予測された場合に、分散サーバ群を形成するいずれかの分散サーバに対して、緊急コマンド以外のコマンドの送信を抑止する。
例えば、振分制御装置20は、管理サーバ10が緊急コマンドを発行すると予測した場合には、分散サーバ50への振分を抑止するとともに、分散サーバ50への振分を抑止する指示をイベントロードバランサ70に送信する。したがって、分散サーバ50への振分を抑止でき、分散サーバ50の負荷が高くなることを抑止できる。このため、振分制御装置20は、管理サーバ10から緊急コマンドが発行された場合でも、通常コマンドの分散先から除外されている分散サーバ50へ振り分けることができるので、緊急コマンドの実行効率の劣化を防止できる。
[装置の構成]
図2は、実施例1に係る振分制御装置の構成を示す機能ブロック図である。図2に示すように、この振分制御装置20は、通信制御I/F部21と記憶部22とプロセッサ25とを有する。
通信制御I/F部21は、他の通信との間を制御するインタフェースである。例えば、通信制御I/F部21は、通常コマンドや緊急コマンドを管理サーバ10から受信する。なお、緊急コマンドとは、例えば、管理対象機器からアラームを検知した場合に、トラフィック量の超過箇所を特定し、トラフィックの一部を迂回させるような経路を設定するコマンドであり、緊急に実行したいコマンドである。通常コマンドとは、緊急コマンド以外のコマンドであり、例えば経路情報の取得や負荷情報の取得を実行するコマンドなどである。
また、通信制御I/F部21は、通常コマンドや緊急コマンドを分散サーバ50または分散サーバ60に送信する。また、通信制御I/F部21は、分散サーバ50または分散サーバ60からイベント情報やコマンド実行結果を受信する。同様に、通信制御I/F部21は、イベント情報やコマンド実行結果を管理サーバ10に送信する。なお、イベント情報とは、例えばSNMP(Simple Network Management Protocol)で監視する監視情報、SNMPトラップで検出された障害情報、管理対象機器のイベントログなどである。
記憶部22は、半導体メモリ素子やハードディスクなどの記憶装置であり、緊急コマンド情報テーブル22aと統計情報テーブル22bとパターン情報テーブル22cとを有する。また、記憶部22は、緊急パターン情報テーブル22dと重み付け情報テーブル22eと予測結果テーブル22fと構成情報テーブル22gとを有する。
緊急コマンド情報テーブル22aは、管理者等によって設定された緊急コマンドに関する情報を記憶する。図3は、緊急コマンド情報テーブルに記憶される情報の例を示す図である。図3に示すように、緊急コマンド情報テーブル22aは、「コマンド名、緊急度e、適用日時帯」を対応付けて記憶する。ここで記憶される「コマンド名」は、緊急コマンドの名称である。「緊急度e」は、例えば0から7で表される緊急度であり、7が最も緊急性が高く、0が最も緊急性が低い。「適用日時帯」は、緊急コマンドとして扱われる日時帯を示す。
例えば、図3の場合、緊急度が「7」であるコマンド「ChangeRoute」は、終日緊急コマンドと認識されることを示す。また、緊急度が「5」であるコマンド「BlockTraffic」は、21:00〜24:00の間に発行されたものだけ緊急コマンドと認識され、それ以外の時間帯に発行されたものは通常コマンドとして扱われることを示す。
統計情報テーブル22bは、分散サーバに発行されたコマンドの数、分散サーバから受信したイベント数のうち所定の条件に一致する特定イベントの数、各分散サーバのCPU(Central Processing Unit)負荷を記憶する。図4は、統計情報テーブルに記憶される情報の例を示す図である。図4に示すように、統計情報テーブル22bは、「収集項目(実行コマンド数、実行コマンド種類数、特定イベント受信数、平均CPU負荷(A)、平均CPU負荷(B))、収集時間、収集値」を対応付けて記憶する。
ここで記憶される「実行コマンド数」は、管理サーバ10から発行されたコマンドの数、言い換えると、分散サーバ50または分散サーバ60が実行したコマンドの数を示す。「実行コマンド種類数」は、管理サーバ10から発行されたコマンドの種類の数、言い換えると、分散サーバ50または分散サーバ60が実行したコマンドの種類の数を示す。「特定イベント受信数」は、分散サーバ50または分散サーバ60から受信されたイベントのうち、特定の条件に一致するイベントの数を示す。「平均CPU負荷(A)」は、収集時間における分散サーバ50のCPU負荷の平均値を示し、「平均CPU負荷(B)」は、収集時間における分散サーバ60のCPU負荷の平均値を示す。
また、「収集値」は、各収集項目に対して収集された値であり、「収集時間」は、収集値が収集された時刻である。なお、実行コマンド数、実行コマンド種類数は、振分制御装置20内で収集され、特定イベント数、平均CPU負荷(A)、平均CPU負荷(B)は、分散サーバから収集される。また、実行コマンド数や実行コマンド種類数には、通常のコマンド以外に緊急コマンドを含んでもよい。
図4の場合、例えば、振分制御装置は、「10:06」に、5つの実行コマンドが分散サーバで実行され、実行されたコマンドの種類数が2であったことを示す。また、振分制御装置は、「10:06」に受信した特定イベントの数が400個であり、「10:06」における分散サーバ50の平均CPU負荷が80%、分散サーバ60の平均CPU負荷が80%であったことを示す。なお、図4では、収集時間を1分単位としているが、これに限定されるものではなく任意に設定できる。また、図4の場合、緊急コマンドの予測を開始した時間が「10:10」であることを示す。
パターン情報テーブル22cは、統計情報テーブル22bに記憶される情報から各収集項目の傾向を示した情報を記憶する。図5は、パターン情報テーブルに記憶される情報の例を示す図である。図5に示すように、パターン情報テーブル22cは、「収集項目(実行コマンド数、実行コマンド種類数、特定イベント受信数、平均CPU負荷(A)、平均CPU負荷(B))、収集時間、傾向」を対応付けて記憶する。ここで記憶される「収集項目(実行コマンド数、実行コマンド種類数、特定イベント受信数、平均CPU負荷(A)、平均CPU負荷(B))、収集時間」は、図4と同様なので説明を省略する。「傾向」は、各収集項目が全体からみてその時間にどのような傾向にあるかを示す。
図5の場合、例えば収集時間「10:08」に収集された「実行コマンド数」は、増加傾向にあり、「実行コマンド種類数」は、変化無しの「維持傾向」にあり、「特定イベント受信数」と「平均CPU負荷(A)」と「平均CPU負荷(B)」は、「減少傾向」にある。
緊急パターン情報テーブル22dは、緊急コマンドごとに、緊急コマンドが実行される一定時間前の変化傾向を示す情報を記憶する。図6は、緊急パターン情報テーブルに記憶される情報の例を示す図である。図6に示すように、緊急パターン情報テーブル22dは、「実行コマンド名、収集項目(実行コマンド数、実行コマンド種類数、特定イベント受信数、平均CPU負荷(A)、平均CPU負荷(B))、収集時間、傾向」を対応付けて記憶する。
ここで記憶される各収集項目の値は、緊急コマンドが実行される一定時間ごとに収集された値である。例えば、図6の場合、「ChangeRoute」が実行された1分前の「9:15」から3分前の「9:12」では、実行コマンド数が増加傾向、実行コマンド種類数が減少傾向、特定イベント受信数と平均CPU負荷(A)と平均CPU負荷(B)が増減傾向にあったことを示す。なお、実行コマンド数や実行コマンド種類数は、緊急コマンドを含んでいてもよい。また、収集時間の間隔は、任意に設定することができるが、図4や図5に示した収集時間の間隔と同じであることが望ましい。
重み付け情報テーブル22eは、緊急コマンドごとに重み付け情報を記憶する。図7は、重み付け情報テーブルに記憶される情報の例を示す図である。図7に示すように、重み付け情報テーブル22eは、各収集項目ごとの重みや収集時間に対する重みを記憶する。ここで記憶される「収集項目」や「収集時間」は、図4等で説明したので詳細な説明を省略する。「収集項目重み」は、各収集項目に対して与える重みを示し、「収集時間重み」は、各収集時間に与える重みを示す。
図7の場合、緊急コマンドの予測を開始した時間、言い換えると統計情報を生成した時間から1分前の時間には重み「1」、2分前の時間には重み「0.7」、3分前の時間には重み「0.5」が与えられることを示す。また、緊急コマンドの予測を開始した時間から4分前の時間には重み「0.3」、5分前の時間には重み「0.2」が与えられることを示す。また、収集項目である「実行コマンド」には重み「1」、「実行コマンド種類数」には重み「0.5」、「特定イベント受信数」には重み「1」、「平均CPU負荷(A)」には重み「0.2」、「平均CPU負荷(B)」には重み「0.2」が与えられることを示す。
予測結果テーブル22fは、緊急コマンドが実行されるか否かを予測した結果を記憶する。図8は、予測結果テーブルに記憶される情報の例を示す図である。図8に示すように、予測結果テーブル22fは、「実行コマンド名、過去判定回予測結果、予測成功率」を対応付けて記憶する。ここで記憶される「実行コマンド名」は、予測対象の緊急コマンドを示す情報である。「過去判定回予測結果」は、過去の所定回数の予測判定結果を示す情報である。例えば、予測が成功した場合つまり予測どおり緊急コマンドが発行された場合には「○」が格納され、予測が失敗した場合つまり緊急コマンドが発行されなかった場合には「×」が格納される。「予測成功率」は、過去判定回予測結果から算出した予測の成功率である。
例えば、図8の場合、緊急コマンド「ChangeRoute」については、予測された過去5回全てが成功しているので、予測成功率が1であることを示す。また、緊急コマンド(Shutdown)については、予測された過去5回のうち4回が成功しているので、予測成功率は4/5=0.8であることを示す。
構成情報テーブル22gは、図1に示したシステムを形成する各装置の構成情報を記憶する。図9は、構成情報テーブルに記憶される情報の例を示す図である。図9に示すように、構成情報テーブル22gは、「サーバ名、IP、役割、振り分け可否」を対応付けて記憶する。
ここで記憶される「サーバ名」は、例えばホスト名など装置の名称を示し、「IP」は、サーバのIP(Internet Protocol)アドレスを示し、「役割」は、装置が実行するシステム内の役割を示し、「振り分け可否」は、負荷分散可能か否かを示す。例えば、サーバ名「MNG」は、IP(A)が割り当てられた、負荷分散の対象外である管理サーバを示す。「DSP1」は、IP(B)が割り当てられた、負荷分散の対象であり、負荷分散可能な分散サーバ50を示す。
同様に、「DSP2」は、IP(C)が割り当てられた、負荷分散の対象であり、負荷分散可能な分散サーバ60を示す。また、「ELB」は、IP(D)が割り当てられた、負荷分散の対象外であるイベントロードバランサ70を示す。「CED」は、IP(E)が割り当てられた、負荷分散の対象外である振分制御装置20を示す。なお、「振り分け可否」に「○」が格納されている場合には振り分け可能なことを示し、「振り分け可否」に「−」が格納されている場合には振り分け対象外であることを示し、「×」が格納されている場合には振り分け不可能なことを示す。
プロセッサ25は、振分制御装置20全体の制御を司るCPUなどの電子回路であり、解析部25aと記録部25bと予測部25cと負荷回避部25dとタイマ制御部25eとを有する。
解析部25aは、管理サーバ10から受信したコマンドを負荷回避部25dに転送するとともに、受信したコマンドが緊急コマンドか通常コマンドかなどを判定するコマンド解析を実行して、記録部25bにコマンドの情報を通知する処理部である。
例えば、解析部25aは、管理サーバ10からコマンドを受信した場合に、当該コマンドのヘッダ等に記憶される情報と、緊急コマンド情報テーブル22aに記憶される情報を比較して、当該コマンドが緊急コマンドか否かを判定する。そして、解析部25aは、緊急コマンドであると判定した場合には、受信したコマンドに緊急コマンドフラグを付加して負荷回避部25dに転送する。また、解析部25aは、通常コマンドであると判定した場合には、受信したコマンドを負荷回避部25dに転送するとともに、受信したコマンドの種類等を特定して記録部25bに通知する。
一例を挙げると、解析部25aは、受信したコマンドに「ChangeRoute」を識別する識別子等が含まれている場合には、当該コマンドを緊急コマンドと判定する。また、解析部25aは、受信したコマンドに「ConfigBackup」を識別する識別子等が含まれているとともに、受信時刻が0:00から6:00の間である場合には、当該コマンドを緊急コマンドと判定する。また、解析部25aは、受信したコマンドに「BlockTraffic」を識別する識別子等が含まれているとともに、受信時刻が21:00から24:00の間でない場合には、当該コマンドを通常コマンドと判定する。
記録部25bは、解析部25aから通知されたコマンド情報の履歴を記憶し、分散サーバから統計情報を収集してパターン情報を生成する。例えば、記録部25bは、解析部25aから通知されたコマンド情報を記憶部22の作業領域等に順次格納する。そして、記録部25bは、タイマ制御部25eから予測開始指示を受信すると、記憶部22の作業領域に記憶されるコマンド情報を参照し、予測開始指示を受信した時間の1分前から5分前までの実行コマンド数と実行コマンド種類数を生成する。また、記録部25bは、各分散サーバから平均CPU負荷とともに特定イベント数を受信する。そして、記録部25bは、これらを対応付けた統計情報を生成して統計情報テーブル22bに格納する。なお、分散サーバは、監視ソフトウェア等を用いて、平均CPU負荷や特定イベント数を所定間隔で収集し、記録部25bは、分散サーバ各々が収集した情報を取得する。
その後、記録部25bは、統計情報として収集した各収集項目の5回分の収集値を2次の最小二乗法等を用いてフィッティングした結果から、この5回分の間で増加傾向か、減少傾向か、維持傾向か、増減傾向か、減増傾向かを示す変化パターンを判定する。そして、記録部25bは、上記した例では1分前から5分前までの各収集時間ごとに、判定結果を対応付けたパターン情報を生成して、パターン情報テーブル22cに格納する。なお、ここでは2次関数を用いた例を説明したが、1次関数を用いてもよく、その場合は判定結果が増加または減少のいずれかになる。
予測部25cは、タイマ制御部25eによって起動され、パターン情報テーブル22cに記憶される情報と緊急パターン情報テーブル22dに記憶される情報とを比較する。そして、予測部25cは、比較結果に重み付けを加味して類似度を算出し、パターン予測結果を評価して、緊急コマンドの発生を予測する処理部である。
例えば、予測部25cは、緊急コマンドごとに記憶される緊急パターン情報各々とパターン情報テーブル22cに記憶されるパターン情報とを比較し、収集時間ごとにどのくらい情報が一致するかを示した採点表を生成する。続いて、予測部25cは、生成した採点表に対して、重み付けテーブル22eに記憶される収集時間および収集項目ごとの重み付けを加算した重付採点表を生成する。その後、予測部25cは、緊急コマンドごとに算出した重付採点表から各緊急コマンドの重付類似度を算出し、算出した重付類似度各々に予測成功率を加味した予測評価値を算出する。そして、予測部25cは、予測評価値が所定値以上の緊急コマンドが存在する場合に、現時点以降に緊急コマンドの発生が起こりうると予測する。
図10から図12を用いて一例を説明する。図10は、予測処理におけるパターン情報の比較例を説明する図である。図11は、予測処理における重み付けを説明する図である。図12は、予測判定例を説明する図である。図10に示すように、予測部25cは、緊急コマンド「ChangeRoute」の過去のパターン情報と、現時点のパターン情報とを比較して、一致する時間には「1」を格納し、不一致の時間には「0」を格納した採点表を生成する。具体的には、予測部25cは、緊急コマンドが実行された時間から2分前の実行コマンド数が「増減」であり、現時点から2分前のパターン情報が「増加」であることから、現時点から2分前の採点結果を「0」とする。
続いて、図11に示すように、予測部25cは、図10の処理によって生成した採点表の収集時間と収集項目の各々に対して、重み付けテーブル22eに格納される重みを乗算した重付採点表を生成する。具体的には、予測部25cは、現時点から3分前の収集時間を示す「−3」の採点結果である「1」に対して、収集時間の重み「0.5」と収集項目の重み「0.5」を乗算して、重付採点結果として「0.25」を算出する。そして、予測部25cは、採点表に格納される各収集項目の各収集時間ごとに、上述した重みの乗算を実行して重付採点結果を生成し、重付採点結果各々を加算した値を「重付類似度」として算出する。図11の場合では、予測部25cは、「重付類似度」として「6.15」を算出する。なお、予測部25cは、図10から図11の各処理を、各緊急コマンドごとに実行する。
その後、図12に示すように、予測部25cは、各緊急コマンドごとに算出した重付類似度に対して、予測結果テーブル22fに格納される過去の予測成功率を乗算し、予測評価値を算出する。具体的には、予測部25cは、重付類似度が「6.15」と算出された「ChangeRoute」の予測成功率が「1」であることから、「6.15」に「1」を乗算した「6.15」を「ChangeRoute」の「予測評価値」として算出する。同様に、予測部25cは、重付類似度が「2.12」と算出された「Shutdown」の予測成功率が「0.8」であることから、「2.12」に「0.8」を乗算した「1.696」を四捨五入した「1.7」を「Shutdown」の「予測評価値」として算出する。
そして、予測部25cは、このようにして算出された「予測評価値」の最大値が、例えば「5」など所定値以上であれば、緊急コマンドが発生すると予測する。図12の場合、予測部25cは、「ChangeRoute」が発行される可能性が高いと予測する。そして、予測部25cは、緊急コマンドの発生を予測した場合に、負荷回避指示を負荷回避部25dに通知する。
図2に戻り、負荷回避部25dは、解析部25aから転送されたコマンドを振り分け可能な分散サーバに振り分ける処理部である。また、負荷回避部25dは、緊急コマンドが予測されたことが予測部25cから通知された場合には、振り分けを抑止する分散サーバを決定し、決定した分散サーバへの振り分けを抑止する。また、負荷回避部25dは、決定した分散サーバへのイベントの振り分けを抑止させる指示をイベントロードバランサ70へ通知する。
例えば、負荷回避部25dは、解析部25aからコマンドを受信した場合、構成情報テーブル22gを参照して、振り分け可否が「○」である分散サーバのいずれかにコマンドを送信する。そして、負荷回避部25dは、緊急コマンドが予測されたことが予測部25cから通知され、各分散サーバの振り分け可否が「○」である場合に、負荷回避を実行する。なお、負荷回避部25dは、緊急コマンドが予測されたことが予測部25cから通知され、いずれかの分散サーバの振り分け可否が「×」である場合に、既に負荷回避中であるので新たな負荷回避を実行しない。
負荷回避を具体的に説明すると、負荷回避部25dは、各分散サーバのCPU負荷を各分散サーバから取得し、最もCPU負荷が小さい分散サーバを負荷回避対象のサーバと特定する。ここでは、分散サーバ50を負荷回避対象サーバとする。すると、負荷回避部25dは、構成情報テーブル22gにおける分散サーバ50の振り分け可否を「○」から「×」に変更して、分散サーバ50を負荷回避中に変更する。また、負荷回避部25dは、分散サーバ50への振り分けを抑止することをイベントロードバランサ70へ通知する。こうすることで、負荷回避部25dは、分散サーバ50へ通常のコマンドが発行されることを抑止するとともに、イベントロードバランサ70がイベントを分散サーバ50に振り分けることを抑止する。
この状態で、つまり、分散サーバ50の振り分け可否が「×」かつ分散サーバ60の振り分け可否が「○」である状態でのコマンド振り分けについて説明する。例えば、負荷回避部25dは、解析部25aから通常コマンドを受信した場合、振り分け可否が「○」である分散サーバ60にコマンドを振り分ける。また、負荷回避部25dは、解析部25aから緊急コマンドを受信した場合、振り分け可否が「×」である分散サーバ50に緊急コマンドを振り分ける。また、上記状態で、例えば1分など一定時間が経過した後、負荷回避部25dは、分散サーバ50の振り分け可否を「○」に変更し、分散サーバ50の振り分け抑止を解除して、両分散サーバへの振り分けを可能にする。
なお、負荷回避部25dは、解析部25aから受信したコマンドが緊急コマンドであるか否かを、当該コマンドに緊急コマンドフラグが付加されているか否かによって判定する。つまり、負荷回避部25dは、コマンドに緊急コマンドフラグが付加されている場合は、当該コマンドを緊急コマンドと判定する。
タイマ制御部25eは、記録部25bや予測部25cの予測処理を定期的に起動する処理部である。例えば、タイマ制御部25eは、時間を計時し、例えば5分間隔など所定時間に到達したことを、記録部25bや予測部25cに通知する。この通知を受けることで、記録部25bや予測部25cは、統計情報の収集や予測処理を開始する。
[処理の流れ]
次に、図13と図14を用いて、実施例1に係る振分制御装置が実行する処理を説明する。ここでは、コマンド実行時の動作フローおよび予測処理時の動作フローについて説明する。
(コマンド実行時の動作フロー)
図13は、実施例1に係る振分制御装置におけるコマンド実行時の処理の流れを示すフローチャートである。図13に示すように、振分制御装置20の解析部25aは、緊急コマンド情報テーブル22aを参照し、管理サーバ10から受信したコマンドが緊急コマンドであるか否かを判定する(S101)。
そして、解析部25aは、緊急コマンドであると判定した場合(S101肯定)、当該コマンドに緊急コマンドフラグをセットする(S102)。一方、解析部25aが緊急コマンドでないと判定した場合(S101否定)、記録部25bは、当該コマンドの情報を記憶部22等に記録する(S103)。
その後、負荷回避部25dは、解析部25aから転送されたコマンドに緊急コマンドフラグがセットされている場合(S104肯定)、構成情報テーブル22gを参照して、負荷回避中の分散サーバが存在するか否かを判定する(S105)。
そして、負荷回避部25dは、負荷回避中の分散サーバが存在すると判定した場合(S105肯定)、緊急コマンドと判定されたコマンドを負荷回避中の分散サーバに振り分ける(S106)。一方、負荷回避部25dは、負荷回避中の分散サーバが存在しないと判定した場合(S105否定)、一般的な負荷分散処理を用いて特定されたいずれかの分散サーバに、緊急コマンドと判定されたコマンドを振り分ける(S107)。
また、負荷回避部25dは、解析部25aから転送されたコマンドに緊急コマンドフラグがセットされていない場合も(S104否定)、構成情報テーブル22gを参照して、負荷回避中の分散サーバが存在するか否かを判定する(S108)。
そして、負荷回避部25dは、負荷回避中の分散サーバが存在すると判定した場合(S108肯定)、通常コマンドと判定されたコマンドを、負荷回避中の分散サーバ以外の分散サーバに振り分ける(S109)。一方、負荷回避部25dは、負荷回避中の分散サーバが存在しないと判定した場合(S108否定)、一般的な負荷分散処理を用いて特定されたいずれかの分散サーバに、通常コマンドと判定されたコマンドを振り分ける(S107)。
(予測処理時の動作フロー)
図14は、実施例1に係る振分制御装置における予測処理の流れを示すフローチャートである。図14に示すように、振分制御装置20の記録部25bは、タイマ制御部25eから予測契機に到達したことが通知される(S201肯定)。すると、記録部25bは、統計情報テーブル22bに統計情報を生成し、生成した統計情報からパターン情報を生成してパターン情報テーブル22cに格納する(S202)。
続いて、予測部25cは、記録部25bによって生成されたパターン情報と、緊急パターン情報テーブル22dに格納される緊急パターン情報各々とを比較して、各緊急コマンドごとの採点表を生成する(S203)。そして、予測部25cは、重み付け情報テーブル22eに記憶される重み付け情報を用いて、S203で生成した各緊急コマンドごとの採点表に重み付けを実行し、各緊急コマンドごとに重付採点表を生成する(S204)。
続いて、予測部25cは、生成した各緊急コマンドごとの重付採点表の各項目を加算して、各緊急コマンドごとに重付類似度を算出する(S205)。そして、予測部25cは、各緊急コマンドごとの重付類似度各々に対して、予測結果テーブル22fに記憶される予測成功率を乗算して、各緊急コマンドごとの予測評価値を算出する(S206)。
その後、負荷回避部25dは、所定値以上の予測評価値がある場合(S207肯定)、構成情報テーブル22gを参照して、負荷回避中の分散サーバがあるか否かを判定する(S208)。そして、負荷回避部25dは、負荷回避中の分散サーバがない場合(S208否定)、各分散サーバからCPU負荷を取得して、CPU負荷が所定値未満の分散サーバがあるか否かを判定する(S209)。
そして、負荷回避部25dは、CPU負荷が所定値未満の分散サーバがある場合(S209肯定)、最もCPU負荷が小さい分散サーバへの負荷回避を実行する(S210)。つまり、負荷回避部25dは、構成情報テーブル22gにおいて、最もCPU負荷が小さい分散サーバの「振り分け可否」を「×」に変更する。
また、所定値以上の予測評価値がない場合(S207否定)、負荷回避中の分散サーバがある場合(S208肯定)、CPU負荷が所定値未満の分散サーバがない場合(S209否定)、振分制御装置20は、予測処理を終了する。
[実施例1による効果]
実施例1に係る振分制御装置20は、全体が高負荷な状況においても緊急コマンドが実行可能となるように、特定の分散サーバの処理負荷を他の分散サーバへ回避させ、特定の分散サーバで即時実行したいコマンドの実行を実現できる。また、実施例1に係る振分制御装置20は、緊急コマンド用の特別なサーバを用意することもないので、サーバリソースを有効活用でき、システム構築にかかるコストも削減することができる。
また、振分制御装置20は、採点表を生成する際に、処理負荷や処理状況そのものではなく、処理負荷の変化や処理状況の変化を比較するので、緊急コマンドが発生した状況だけでなく発生しそうな状況も検出することができる。この結果、振分制御装置20は、緊急コマンドの発生する可能性に幅を持たせて予測することができるので、緊急コマンドの発生回数が比較的少ない状況も検出することができ、緊急コマンドの発生する可能性が低くても漏れなく検出することができる。
実施例2では、実施例1で説明した予測が成功したか否かに基づいて予測結果や重みを学習する例を説明する。図15は、実施例2に係る振分制御装置の構成を示す機能ブロック図である。図15に示すように、振分制御装置20は、通信制御I/F部21と記憶部22とプロセッサ25とを有する。なお、通信制御I/F部21と記憶部22とプロセッサ25の解析部25aと記録部25bと予測部25cと負荷回避部25dとタイマ制御部25eは、実施例1と同様の機能を有するので、詳細な説明は省略する。
[装置の構成]
ここでは、実施例1とは異なる機能である学習部26について説明する。学習部26は、解析部25aからの通知を元に緊急パターン情報テーブル22dを更新し、予測部25cから通知された予測判定の成否を判定して予測成功率を再算出し、予測判定の成否に基づいて各種重みを最適化する処理部である。ここで、学習部26が実行する各学習を具体的に説明する。
(予測判定結果の更新)
学習部26は、解析部25aから緊急コマンドのコマンド情報として、例えばコマンド種別等を受信する。そして、学習部26は、受信したコマンド識別が緊急パターン情報テーブル22d等に格納される緊急コマンドと一致する場合には、予測成功と判定し、一致しない場合には、予測失敗と判定する。なお、学習部26は、予測部25cによって予測が完了してから、例えば1分など所定時間内に受信しなかった場合には、予測失敗と判定する。
そして、学習部26は、予測成功または予測失敗と判定した場合に、予測された時間を基準にして、予測結果テーブル22fを更新する。図8に示したテーブルの状態から更新する一例を挙げると、学習部26が予測成功と判定した場合に、実際に実行された緊急コマンドが「ChangeRoute」と「ConfigBachup」であったとする。この場合、学習部26は、「−1、○、×、×、○」を新たな予測結果とし、ここから4分前までの予測結果から予測成功率を算出する。
具体的には、学習部26は、「−1、ChangeRoute:○、BlockTraffic:×、Shutdown:×、ConfigBackup:○」、「−2、ChangeRoute:○、BlockTraffic:○、Shutdown:○、ConfigBackup:×」に更新する。同様に、学習部26は、「−3、ChangeRoute:○、BlockTraffic:○、Shutdown:○、ConfigBackup:×」、「−4、ChangeRoute:○、BlockTraffic:×、Shutdown:○、ConfigBackup:×」に更新する。同様に、学習部26は、「−5、ChangeRoute:○、BlockTraffic:○、Shutdown:×、ConfigBackup:×」に更新する。
そして、学習部26は、各緊急コマンドごとに、予測が成功した割合を算出する。上記例の場合、学習部26は、「ChangeRoute」については予測した5回中に5回とも予測が成功しているので、「予測成功率」を「1」とする。同様に、学習部26は、「BlockTraffic」については予測した5回中に3回だけ予測が成功しているので、「予測成功率」を「0.6」とする。同様に、学習部26は、「Shutdow」については予測した5回中に3回だけ予測が成功しているので、「予測成功率」を「0.6」とする。同様に、学習部26は、「ConfigBackup」については予測した5回中に1回だけ予測が成功しているので、「予測成功率」を「0.2」とする。なお、学習部26は、予測失敗と判定した場合には、「−1、×、×、×、×」を新たな予測結果とし、ここから4分前までの予測結果から予測成功率を算出する。そして、予測部25cは、学習部26によって更新された予測結果テーブル22fを用いて、以降の緊急コマンドの予測処理を実行する。
(緊急パターンの更新)
学習部26は、緊急コマンドが新たに実行された時間を基準にして、緊急パターン情報テーブル22dを更新する。例えば、学習部26は、負荷回避部25dによって「11:03」に緊急コマンドが分散サーバに分散された場合、または、分散サーバが「11:03」に緊急コマンドを実行した場合、「11:03」から5分前までの緊急パターンを生成する。
具体的には、学習部26は、「11:02」、「11:01」、「11:00」、「10:59」、「10:58」各々の実行コマンド数、実行コマンド種類数、特定イベント受信数、各平均CPU負荷を、記録部25bが記憶部22に格納した情報から収集する。そして、学習部26は、収集した情報を実施例1の記録部25bと同様の手法を用いてパターン化して、緊急パターン情報テーブル22dを更新する。その後、予測部25cは、学習部26によって更新された緊急パターン情報テーブル22dを用いて、以降の緊急コマンドの予測処理を実行する。
(重みの更新)
学習部26は、予測された緊急コマンドの予測成否に基づいて、重み付けテーブル22eの情報を更新する。例えば、学習部26は、予測部25cが予測処理時に生成した緊急コマンドごとの採点表を予測部25cから取得する。そして、学習部26は、予測が成功したと判定された場合、採点表の収集時間または収集項目のうち、最も一致していた項目の重みを重くし、最も一致していなかった項目の重みを軽くする。
図16は、重みの学習例を示す図である。例えば、学習部26は、重み情報が図16の左図に示す状態で、予測成功と判定したとする。そのときの採点表が図10の右図であったとする。この場合、学習部26は、図10の右図の収集時間を参照し、収集時間「−1」が全て1であるので最も比較結果が一致していたと判定し、収集時間「−5」が最も比較結果が一致していないと判定する。
すると、学習部26は、図16に示すように、収集時間「−1」の重みを「0.1」重くし、収集時間「−5」の重みを「0.1」軽くする。なお、ここでは、収集時間の重みを更新する例を説明したが、収集項目の重みを同様の手法で更新してもよい。
[処理の流れ]
図17は、実施例2に係る振分制御装置における学習処理の流れを示すフローチャートである。図17に示すように、学習部26は、緊急コマンドが実行されると、すなわち、緊急コマンドの情報を解析部25aが受信すると(S301肯定)、緊急パターン情報テーブル22dを再生成する(S302)。つまり、学習部26は、緊急コマンドが実行された時間を基準として新たな緊急パターン情報を生成して緊急パターン情報テーブル22dを更新する。
そして、学習部26は、実行された緊急コマンドが採点表が通知されているコマンド、言い換えると、当該緊急コマンドが採点表に記載されているコマンドである場合(S303肯定)、当該採点表の有効期限が経過していないかを判定する(S304)。
採点表の有効期限が経過していない場合(S304肯定)、学習部26は、予測成功として予測結果テーブル22fを更新し(S305)、重み付け情報テーブル22eを更新する(S306)。また、採点表の有効期限が経過している場合(S304否定)、学習部26は、予測失敗として予測結果テーブル22fを更新する(S307)。
なお、S303において、実行された緊急コマンドが採点表に記載されていないコマンドである場合(S303否定)、学習部26は、処理を終了する。
[実施例2による効果]
このように、実施例2に係る振分制御装置20は、緊急コマンドを予測するだけでなく、予測が成功したか失敗したかによって、緊急パターン、重み、予測判定結果など予測部25cが予測に使用する情報を更新する。この結果、予測処理の精度を随時向上させることができ、より精度の高い予測処理を実行できる。
さて、これまで本発明の実施例について説明したが、本発明は上述した実施例以外にも、種々の異なる形態にて実施されてよいものである。そこで、以下に異なる実施例を説明する。
(処理状況)
実施例1や2では、分散サーバの処理状況として「実行コマンド数、実行コマンド種類数、特定イベント受信数、平均CPU負荷」を収集する例を説明したが、処理状況はこれに限定されるものではない。例えば、処理状況としてメモリ使用率などを収集してもよく、分散サーバの処理負荷を検出できる任意の情報を収集することができる。
(数値等の指定)
実施例1や2では、収集時間として1分単位を例にして説明したが、これに限定されるものではなく、任意の時間間隔を設定することができる。また、収集項目の数や緊急コマンドの種別等を任意に設定することができる。また、学習する項目等は任意に設定することができる。例えば、重みだけを学習したり、重みと予測結果だけを学習するなど、任意の数、任意の組み合わせで学習することができる。
(緊急パターンとの比較)
実施例1では、予測回避時の統計情報のパターンと、過去の緊急コマンドの実行時のパターンとを比較する例を説明したが、これに限定されるものではない。例えば、予測回避時の統計情報そのものと、過去の緊急コマンドの実行時の統計情報そのものとを比較して、一致する数等を検索し、検索した結果が所定値以上であれば、緊急コマンドが実行されると予測することもできる。
(システム)
また、本実施例において説明した各処理のうち、自動的におこなわれるものとして説明した処理の全部または一部を手動的におこなうこともできる。あるいは、手動的におこなわれるものとして説明した処理の全部または一部を公知の方法で自動的におこなうこともできる。この他、上記文書中や図面中で示した処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られない。つまり、その全部または一部を、各種の負荷や使用状況などに応じて、例えば、タイマ制御部25eを有しない構成など、任意の単位で機能的または物理的に分散・統合して構成することができる。さらに、各装置にて行なわれる各処理機能は、その全部または任意の一部が、CPUおよび当該CPUにて解析実行されるプログラムにて実現され、あるいは、ワイヤードロジックによるハードウェアとして実現され得る。
(ハードウェア構成)
図18は、振分制御プログラムを実行するコンピュータのハードウェア構成の例を示す図である。図18に示すように、コンピュータ100は、CPU102、入力装置103、出力装置104、通信インタフェース105、媒体読取装置106、HDD(Hard Disk Drive)107、RAM(Random Access Memory)108を有する。また、図18に示した各部は、バス101で相互に接続される。
入力装置103は、マウスやキーボードであり、出力装置104は、ディスプレイなどであり、通信インタフェース105は、NIC(Network Interface Card)などのインタフェースである。HDD107は、図2に示した各テーブルに記憶される各情報を記憶する。記録媒体の例としてHDD107を例に挙げたが、ROM(Read Only Memory)、RAM、CD−ROM等の他のコンピュータ読み取り可能な記録媒体に各種プログラムを格納しておき、コンピュータに読み取らせることとしてもよい。なお、記憶媒体を遠隔地に配置し、コンピュータが、その記憶媒体にアクセスすることでプログラムを取得して利用してもよい。また、その際、取得したプログラムをそのコンピュータ自身の記録媒体に格納して用いてもよい。CPU102は、図2に示した各機能を実行する。
また、HDD107に、図2に示した各処理部の制御を実行する振分制御プログラム107aを格納しておく。そして、CPU102が、振分制御プログラム107aを読み出してRAM108に展開することで、図2等で説明した各機能を実行する振分制御プロセス108aを動作させることもできる。すなわち、振分制御プロセス108aは、図2や図5に記載した解析部25a、記録部25b、予測部25c、負荷回避部25d、タイマ制御部25e、学習部26と同様の機能を実行する。このようにコンピュータ100は、プログラムを読み出して実行することで振分制御装置の機能を実行する情報処理装置として動作する。
また、コンピュータ100は、媒体読取装置106によって記録媒体から振分制御プログラム107aを読み出し、読み出された振分制御プログラム107aを実行することで上記した実施例と同様の機能を実現することもできる。なお、この他の実施例でいうプログラムは、コンピュータ100によって実行されることに限定されるものではない。例えば、他のコンピュータまたはサーバがプログラムを実行する場合や、これらが協働してプログラムを実行するような場合にも、本発明を同様に適用することができる。
10 管理サーバ
20 振分制御装置
21 通信制御I/F部
22 記憶部
22a 緊急コマンド情報テーブル
22b 統計情報テーブル
22c パターン情報テーブル
22d 緊急パターン情報テーブル
22e 重み付け情報テーブル
22f 予測結果テーブル
22g 構成情報テーブル
25 プロセッサ
25a 解析部
25b 記録部
25c 予測部
25d 負荷回避部
25e タイマ制御部
26 学習部
50、60 分散サーバ
70 イベントロードバランサ

Claims (9)

  1. 分散サーバ群を形成するいずれかの分散サーバ装置に、管理サーバ装置から発行されたコマンドを送信する振分制御装置であって、
    前記管理サーバ装置によって特定のコマンドが発行された時間までの所定時間ごとに、前記分散サーバ群の処理状況を示す処理状況データを保持する保持部と、
    前記分散サーバ群の処理状況データを前記所定時間ごとに収集する収集部と、
    前記収集部によって収集された処理状況データと前記保持部に保持される処理状況データとを比較して、前記特定のコマンドが発生するか否かを予測する予測部と、
    前記予測部によって前記特定のコマンド発生すると予測された場合に、前記分散サーバ群を形成するいずれかの分散サーバ装置に処理を振り分ける負荷分散装置に対して、前記分散サーバ群を形成するいずれかの分散サーバ装置に対する、前記特定のコマンド以外のコマンドの送信を抑止する指示を送信する抑止制御部と、
    を有することを特徴とする振分制御装置。
  2. 前記保持部は、前記所定時間における前記分散サーバ群の処理状況データの変化を保持し、
    前記収集部は、前記分散サーバ群から収集した処理状況データから、収集された所定時間における処理状況データの変化を検出して保持し、
    前記予測部は、前記収集部によって保持される処理状況データの変化と前記保持部に保持される処理状況データの変化とを比較して、前記特定のコマンドが発生するか否かを予測することを特徴とする請求項1に記載の振分制御装置。
  3. 前記予測部は、複数の処理項目を有する各処理状況データを比較し、前記処理状況データが一致する時間および処理項目の組み合わせに設定される、一致することを示す値に、一致する処理項目または時間に対応する重みを乗算して前記処理状況データの類似度を算出し、算出した類似度に基づいて、前記特定のコマンドが発生するか否かを予測することを特徴とする請求項1に記載の振分制御装置。
  4. 前記予測部によって予測された特定のコマンドが、予測された時間から所定時間内に前記管理サーバ装置から発行された場合に、前記一致する処理項目または時間に対応する重みを重くするとともに、一致しない処理項目または時間に対応する重みを軽くする学習部をさらに有することを特徴とする請求項3に記載の振分制御装置。
  5. 前記予測部は、前記処理状況データの類似度に、前記特定のコマンドに対する過去の予測成功率を乗算した結果に基づいて、前記特定のコマンドが発生するか否かを予測することを特徴とする請求項に記載の振分制御装置。
  6. 前記予測部によって予測された前記特定のコマンドが、予測された時間から所定時間内に前記管理サーバ装置から発行されたか否かに基づいて、前記予測された時間を基準にして前記過去の予測成功率を算出しなおす学習部をさらに有することを特徴とする請求項5に記載の振分制御装置。
  7. 前記予測部によって予測された前記特定のコマンドが、予測された時間から所定時間内に前記管理サーバ装置から発行された否かに基づいて、前記保持部に保持される前記分散サーバ群の処理状況データを更新する学習部をさらに有することを特徴とする請求項1に記載の振分制御装置。
  8. 分散サーバ群を形成するいずれかの分散サーバ装置に、管理サーバ装置から発行されたコマンドを送信するコンピュータが、
    前記分散サーバ群の処理状況を示す処理状況データを所定時間ごとに収集し、
    前記収集した処理状況データと、前記管理サーバ装置によって特定のコマンドが発行された時間までの所定時間ごとに保持される前記分散サーバ群の処理状況を示す処理状況データとを比較して、前記特定のコマンドが発生するか否かを予測し、
    前記特定のコマンドが発生すると予測した場合に、前記分散サーバ群を形成するいずれかの分散サーバ装置に処理を振り分ける負荷分散装置に対して、前記分散サーバ群を形成するいずれかの分散サーバ装置に対する、前記特定のコマンド以外のコマンドの送信を抑止する指示を送信する
    処理を実行することを特徴とする振分制御方法。
  9. 分散サーバ群を形成するいずれかの分散サーバ装置に、管理サーバ装置から発行されたコマンドを送信するコンピュータに、
    前記分散サーバ群の処理状況を示す処理状況データを所定時間ごとに収集し、
    前記収集した処理状況データと、前記管理サーバ装置によって特定のコマンドが発行された時間までの所定時間ごとに保持される前記分散サーバ群の処理状況を示す処理状況データとを比較して、前記特定のコマンドが発生するか否かを予測し、
    前記特定のコマンドが発生すると予測した場合に、前記分散サーバ群を形成するいずれかの分散サーバ装置に処理を振り分ける負荷分散装置に対して、前記分散サーバ群を形成するいずれかの分散サーバ装置に対する、前記特定のコマンド以外のコマンドの送信を抑止する指示を送信する
    処理を実行させることを特徴とする振分制御プログラム。
JP2011148585A 2011-07-04 2011-07-04 振分制御装置、振分制御方法および振分制御プログラム Expired - Fee Related JP5729179B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011148585A JP5729179B2 (ja) 2011-07-04 2011-07-04 振分制御装置、振分制御方法および振分制御プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011148585A JP5729179B2 (ja) 2011-07-04 2011-07-04 振分制御装置、振分制御方法および振分制御プログラム

Publications (2)

Publication Number Publication Date
JP2013016041A JP2013016041A (ja) 2013-01-24
JP5729179B2 true JP5729179B2 (ja) 2015-06-03

Family

ID=47688671

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011148585A Expired - Fee Related JP5729179B2 (ja) 2011-07-04 2011-07-04 振分制御装置、振分制御方法および振分制御プログラム

Country Status (1)

Country Link
JP (1) JP5729179B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6167867B2 (ja) * 2013-11-13 2017-07-26 富士通株式会社 負荷分散装置、方法及びシステム
JP7191726B2 (ja) * 2019-03-04 2022-12-19 株式会社東芝 通信制御装置および通信システム
JP7278807B2 (ja) * 2019-03-04 2023-05-22 株式会社東芝 通信制御装置および通信システム
JP7191727B2 (ja) * 2019-03-04 2022-12-19 株式会社東芝 通信制御装置および通信システム

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000122985A (ja) * 1998-08-11 2000-04-28 Nippon Telegr & Teleph Corp <Ntt> アクセス予測方法および装置とアクセス負荷分散方法および装置と前記方法を実施するプログラムを記録した記録媒体
JP3633321B2 (ja) * 1998-10-23 2005-03-30 富士通株式会社 広域負荷分散装置及び方法
JP2007328413A (ja) * 2006-06-06 2007-12-20 Hitachi Ltd 負荷分散方法
JP2008009800A (ja) * 2006-06-30 2008-01-17 Nec Corp 負荷分散システム、監視制御装置、負荷分散方法及びプログラム
JP2008158996A (ja) * 2006-12-26 2008-07-10 Chugoku Electric Power Co Inc:The 情報処理装置及び情報処理方法
JP2011013870A (ja) * 2009-07-01 2011-01-20 Hitachi Ltd 負荷分散システム
JP4824807B2 (ja) * 2009-09-30 2011-11-30 株式会社野村総合研究所 負荷管理装置、情報処理システムおよび負荷管理方法

Also Published As

Publication number Publication date
JP2013016041A (ja) 2013-01-24

Similar Documents

Publication Publication Date Title
EP3133492B1 (en) Network service incident prediction
US20110208682A1 (en) Performance evaluating apparatus, performance evaluating method, and program
US20150189033A1 (en) Distributed Cache System
US8762304B2 (en) Policy scheduling
US20170155560A1 (en) Management systems for managing resources of servers and management methods thereof
EP2685380B1 (en) Operations management unit, operations management method, and program
US9448849B2 (en) Preventing oscillatory load behavior in a multi-node distributed system
EP2678783B1 (en) Network event management
JP5729179B2 (ja) 振分制御装置、振分制御方法および振分制御プログラム
WO2013037619A1 (en) Method and system for managing an elastic server farm
US9280741B2 (en) Automated alerting rules recommendation and selection
Rahmani et al. Burst‐aware virtual machine migration for improving performance in the cloud
WO2020090513A1 (ja) 監視保守方法、監視保守装置及び監視保守プログラム
US20230359514A1 (en) Operation-based event suppression
JP5874234B2 (ja) 機器管理装置、機器管理方法および機器管理プログラム
JP5331878B2 (ja) ネットワーク管理方法およびネットワーク
US11315693B2 (en) Method and system for managing operation associated with an object on IoT enabled devices
JP2009259005A (ja) リソース監視方法および装置
JP2006012065A (ja) 資源負荷適正化管理システム
JP2011065469A (ja) 分散ファイルシステム及び分散ファイルシステムにおけるノード起動方法
JP2019079120A (ja) 情報処理装置、情報処理方法、及びプログラム
JP7180394B2 (ja) 仮想基盤管理装置、仮想基盤管理方法および仮想基盤管理プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140304

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20141029

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20141111

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150113

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150310

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150323

R150 Certificate of patent or registration of utility model

Ref document number: 5729179

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees