WO2014080994A1

WO2014080994A1 - 輻輳制御システム、制御装置、輻輳制御方法およびプログラム

Info

Publication number: WO2014080994A1
Application number: PCT/JP2013/081440
Authority: WO
Inventors: 泰寛宮尾
Original assignee: 日本電気株式会社
Priority date: 2012-11-22
Filing date: 2013-11-21
Publication date: 2014-05-30
Also published as: JPWO2014080994A1; US20150304220A1

Abstract

　輻輳制御システムは、クライアントからのサービス要求メッセージを集約してサーバに振り分けるエッジ装置と、クライアントからのサービス要求を処理する複数のサーバと、制御装置とを備え、制御装置は、エッジ装置から観測されたサービス要求の生起率を取得し、取得した生起率に基づいて、サービス要求メッセージを規制する割合を規制率として決定するとともに、稼働すべきサーバ数を決定し、決定した規制率を前記エッジ装置に通知するとともに、決定したサーバ数に基づいて新たなサーバの稼働または稼働中のサーバのサービス停止を行う。サーバ増設に最大許容数があり、かつ輻輳崩壊が生じる可能性があるシステムにおいて、エッジ装置における入力規制とサーバ増設とを得られる収益が最大になるように統合的に制御する。

Description

輻輳制御システム、制御装置、輻輳制御方法およびプログラム

　［関連出願についての記載］
　本発明は、日本国特許出願：特願２０１２－２５６３５８号（２０１２年１１月２２日出願）に基づくものであり、同出願の全記載内容は引用をもって本書に組み込み記載されているものとする。
　本発明は、輻輳制御システム、制御装置、輻輳制御方法およびプログラムに関連し、特に、地理的に分散配置された複数のサーバに関する輻輳制御システム、制御装置、輻輳制御方法およびプログラムに関する。

＜輻輳状態と輻輳制御＞
　輻輳とは、システムの最大処理能力以上に処理要求のトラヒックが加わり、有効に処理されるトラヒックがシステムの最大処理能力を下回る状態をさす。これは、処理完了ができない要求に対してもシステムの処理能力の一部を割かなければならないことから発生する。以下では、具体的なシステムにおける輻輳制御について記述する。

＜通信ネットワークにおける輻輳制御について＞
　固定電話網では、非特許文献１にあるように、災害発生地域に着信呼が集中する場合に、制御系に輻輳崩壊が発生し、電話がつながり難くなる。これを防止するため、非特許文献１にあるように、一般的な電話交換網では着信側の交換機の状態を制御装置が随時監視して、輻輳状態を検出したら発信側の交換機に規制指示を出す。

　３ＧＰＰ（3rd Generation Partnership Project）のデータ通信網では、非特許文献２にあるように、ユーザ端末を無線回線で終端して、コア網への振り分けを行うeNodeBと呼処理装置のＭＭＥがそれぞれ複数ある場合、各eNodeBと各ＭＭＥの間は柔軟に接続できることが提案されている。この接続形態において、各ＭＭＥ（Mobility Management Entity）から通知を受けた相対容量に基づいてＭＭＥの選択をすることで、複数あるＭＭＥでの負荷バランスをとることができる。また、ＭＭＥは、つながっている無線終端集約装置eNodeBをランダムに選んで、規制率とともに過負荷状態であることを通知することができる。

　また、非特許文献３では、ＩＭＳ（IP Multimedia Subsystem）においてCSCF（Call Session Control Function）と総称されるＳＩＰサーバがＶＯＩＰの呼処理に使われることが述べられている。この場合、Interrrogating-CSCF（Ｉ－ＣＳＣＦ）は網の入り口に位置し、ユーザに対して最終的に呼処理を行うServing-CSCF(Ｓ－ＣＳＣＦ)を選択する。

　ＳＩＰサーバにおける輻輳制御については、非特許文献４にあるように、ＳＩＰサーバが輻輳を検知したら、輻輳通知を上流のノードに送信して、そこで入力規制を行う方法が示されている。こうした外部からの入力規制は、一般的なＳＩＰサーバが処理できない呼処理要求に対してエラー応答を返す内部的な制御が輻輳崩壊を根本的に解決できないことへの対処である。

　入力規制の具体的な方法として、サーバに対して送信するサービス要求を一定の割合で廃棄するパーセント廃棄や、一定時間内にサービス要求を送信できる最大数を規制するレート制御がある。

＜サーバ仮想化等における容量計画＞
　非特許文献５にもあるように、計算機資源の設定が迅速にできるサーバ仮想化においては、制御装置があって、それがサーバの性能を監視した結果に基づいて必要となるサーバ数を算出し、新たにサーバを増設することができる。これは容量計画とも呼ばれる。

　なお、非特許文献６には物理サーバのプロビジョニングを行うのみならず、振分け先として利用可能なサーバ情報を負荷分散装置に通知できる管理装置がある。それはさらに、特定のサーバが異常状態もしくは障害状態になる直前の場合、そのサーバ向けへのトラヒックを削減もしくは停止する指示を負荷分散装置に通知する仕組みがある。

<ネットワークレベルの遅延を考慮したサーバへの負荷分散>
　一つの負荷分散装置もしくはクライアントから複数のサーバへの負荷分散が非特許文献８に記載されている。これはサーバでの処理遅延に加えてネットワークレベルの処理遅延も含めた総合遅延を測定し、その逆数を各サーバへ振り分けるトラヒック量の比例係数としている。

K. Mase and H. Yamamoto,"Advanced Traffic Control Methods for Network Management,"IEEE Communication Magazine, pp. 82-88, October 1990. 3GPP　TS23.401 V11.1.0 (2012-03) TS 23.228 V11.4.0 (2012-03)　3GPP Technical Specification Group Services and System Aspects; IP Multimedia Subsystem (IMS); Stage 2 (Release 11) IETF　RFC6357　V. Hilt, E. Noel, C. Shen, and A. Abdelal, "Design consideration for Session Initiation Protocol (SIP) overload control" VMware vCenter Operations　(2011) F5 iControl White paper (2009) R. R. Pillai, "A distributed overload control algorithm for delay-bounded call setup,"IEEE/ACM ToN, Vol.9, No.6, Dec. 2001, pp. 780-789. A. Karakos, D. Patsas, A. Bornea, and S. Kontogiannis,"Balancing HTTP traffic using dynamically updated weights, an implementation approach,"the 10th Panhellenic Conference on Informatics, 2005, pp. 873-878.

　なお、上記非特許文献の全開示内容はその引用をもって本書に繰込み記載する。以下の分析は、本発明の観点から与えられる。
一般的な固定電話網では、それを構成する交換機においては、制御系と通話路系が一体となって構成されており、容易に制御系の処理能力を増加させることができない。よって、過負荷状態では入力規制のみによって輻輳回避が行われる。

　３ＧＰＰのＬＴＥ（Long Term Evolution）においては、特にモバイルコアにおいて、制御系とユーザデータ系に属するノードがＭＭＥおよびS-gatewayと分離され、eNodeBは複数のＭＭＥと接続されることが可能になった。このような構成において、輻輳制御に関する動作としては、eNodeBは接続している各ＭＭＥから個別にその処理容量もしくは輻輳状態の通知を受けるが、それらに基づいて、どういうタイミングで、どんな入力規制値を用いて入力規制するかの具体的な方法は規定されていない。

　ＩＭＳ／ＳＩＰにおいては、制御系とユーザ系は分離され、制御系はＳＩＰ（Session Initiation Protocol）サーバが担うことになっている。輻輳崩壊については、ＳＩＰサーバが自ら内部的に行う方法に加えて、前段のＳＩＰサーバで外部から行う方法がＩＥＴＦ（Internet Engineering Task Force）等で議論されている。

　しかし、上述のようにＬＴＥおよびＩＭＳ／ＳＩＰにおいては、制御系を担う装置がユーザデータ系から分離され、その資源を柔軟に増減させることが潜在的に可能となっているにも関わらず、それを上述の入力規制制御と統合化して、収容できるトラヒックをさらに増大化させる輻輳制御方法は知られていない。

　一方、ＩＴ系のサービスにおける物理サーバや仮想サーバの容量管理を行う制御装置においては、基本的にサーバ数の増減設と利用可能なサーバの負荷分散装置への通知を行うのみである。

　また、負荷分散装置とサーバ系の装置は異なるベンダーから提供されてきたことを背景に、負荷分散装置は、利用可能なサーバへのメッセージの割り振りを行うのみである。同一の背景で、サーバは、通常の処理ができない処理要求メッセージに対してはエラーを応答することでローカル規制を行うことができる。ただし、その実行自体がリソースを無駄に消費し、負荷が増大すると輻輳崩壊を免れないという問題がある。よって、サーバ群が過負荷になったときに各サーバへの入力規制を負荷分散装置において実行させるような仕組みは提供されてこなかった。

　トラヒックの増大に対して、上記のそれぞれで行われるエッジもしくは負荷分散装置での入力規制とサーバ増設とを効果的に統合できれば、より少ないサーバ数でより多くの処理要求に対してその処理を実行することが期待できるが、その統合的な輻輳制御方法はまだ知られていない。

　本発明の目的は、トラヒックの変化、増大に対して、入力規制およびサーバ増設を統合的に実行することで、それぞれ単独に行った場合に比べて、ある時間内で接続完了した呼の総数を最大させることである。また各サーバに共通の入力規制値を用いることで、制御コストを削減する。

　本発明の第１の視点に係る輻輳制御方法は、クライアントからのサービス要求メッセージを集約してサーバに振り分けるエッジ装置と、前記クライアントからのサービス要求を処理する複数のサーバとにネットワークで接続された制御装置が、前記エッジ装置から観測されたサービス要求の生起率を取得する工程と、前記生起率に基づいて、サービス要求メッセージを規制する割合を規制率として決定するとともに、稼働すべきサーバ数を決定する工程と、前記規制率を前記エッジ装置に通知するとともに、前記サーバ数に基づいて新たなサーバの稼働または稼働中のサーバのサービス停止を行う制御工程と、を含む。

　本発明の第２の視点に係る輻輳制御システムは、クライアントからのサービス要求メッセージを集約してサーバに振り分けるエッジ装置と、前記クライアントからのサービス要求を処理する複数のサーバと、制御装置とを備え、前記制御装置は、前記エッジ装置から観測されたサービス要求の生起率を取得する手段と、前記生起率に基づいて、サービス要求メッセージを規制する割合を規制率として決定するとともに、稼働すべきサーバ数を決定する手段と、前記規制率を前記エッジ装置に通知するとともに、前記サーバ数に基づいて新たなサーバの稼働または稼働中のサーバのサービス停止を行う制御手段と、を備える。
　本発明の第３の視点に係る制御装置は、クライアントからのサービス要求メッセージを集約してサーバに振り分けるエッジ装置と、前記クライアントからのサービス要求を処理する複数のサーバとにネットワークで接続された制御装置であって、前記エッジ装置から観測されたサービス要求の生起率を取得する手段と、前記生起率に基づいて、サービス要求メッセージを規制する割合を規制率として決定するとともに、稼働すべきサーバ数を決定する手段と、前記規制率を前記エッジ装置に通知するとともに、前記サーバ数に基づいて新たなサーバの稼働または稼働中のサーバのサービス停止を行う制御手段と、を備える。
　本発明の第４の視点に係るプログラムは、クライアントからのサービス要求メッセージを集約してサーバに振り分けるエッジ装置と、前記クライアントからのサービス要求を処理する複数のサーバとにネットワークで接続された制御装置に設けられたコンピュータに対して、前記エッジ装置から観測されたサービス要求の生起率を取得する処理と、前記生起率に基づいて、サービス要求メッセージを規制する割合を規制率として決定するとともに、稼働すべきサーバ数を決定する処理と、前記規制率を前記エッジ装置に通知するとともに、前記サーバ数に基づいて新たなサーバの稼働または稼働中のサーバのサービス停止を行う制御処理と、を実行させる。
　なお、プログラムは、非一時的なコンピュータ可読記録媒体（non-transitory computer-readable storage medium）に記録されたプログラム製品として提供することができる。

　サーバ増設に最大許容数があり、かつ輻輳崩壊が生じる可能性があるシステムにおいて、あるサービス完了できる客の総数（ある時間内における）から得られる収入からサーバ稼働によってかかるコストを引いて得られる収益をより増大させることができる。

　なぜなら、トラヒックが増加しつつある場合、サーバ増設が可能な限り規制率を０にしたまま、要求性能が満たされるようにサーバ数の増減を行い、サーバが増設限界に達したときは、要求性能が満たされるように規制率を増減するからである。

輻輳制御システムの構成を一例として示すブロック図である。制御装置の構成を一例として示すブロック図である。エッジ装置の構成を一例として示すブロック図である。収益最大化の最適化問題の解法を説明する図である。収益最大化の最適化問題の解法を説明する図である。制御装置の輻輳制御手段における動作を一例として示す流れ図である。制御装置の負荷分散制御手段における動作を一例として示す流れ図である。実施形態における、トラヒック量の変動に対する、廃棄率、サーバ数の軌跡を一例として示すグラフである。

　まず、図１を用いて、輻輳制御システムの全体の構成について説明する。輻輳制御システムは、クライアント１、フロントエンド網２、エッジ装置３、制御装置４、バックエンド網５、および、サーバ６を備えている。

　クライアント１は、サービス利用登録をエッジ装置３によって割り当てられたサーバ６に対して行うとともに、そのサーバ６へ向けてサービスの要求を送信する。サービスの登録に先立ってクライアント１はエッジ装置３を別の何らかの手段で割り当てられる。

　フロントエンド網２はクライアント１とエッジ装置３を接続するネットワークである。エッジ装置３はクライアントから受け取ったサービスへの利用登録に対してサーバ６を割り当て、その後クライアントから受け取ったサービス要求メッセージをすでに割り当てられているサーバ６に転送するという負荷分散の機能を持つ。また、エッジ装置３は、クライアント１からのサービス要求メッセージに対する入力規制を行い、サーバ６に加わるトラヒックを削減する。制御装置４は、エッジ装置３、サーバ６との間で輻輳制御、あるいは負荷分散制御に必要となるメッセージをやり取りする。

　バックエンド網５は、エッジ装置３、制御装置４、サーバ６の間を接続するネットワークである。サーバ６はエッジ装置３を経由してクライアント１から受信したサービスへの登録、およびその後受信するサービス要求メッセージを処理する。

　次に、図２を用いて制御装置４の構成について説明する。制御装置４は、入出力手段７と、輻輳制御手段８と、負荷分散制御手段１７と、プロビジョニング手段９と、記憶装置１０とからなる。

　輻輳制御手段８は、各サーバ６からサービス処理に関して観測された性能情報を受取り、それに基づいてエッジ装置３で用いる規制率、必要なサーバ数等を決定し、各エッジ装置３に規制率や、使用可能なサーバを通知するという資源管理を行う。

　負荷分散制御手段１７は、各エッジ装置３からサーバ６へのネットワークレベルの遅延の観測値を受信し、また各サーバ６からクライアント１の登録数を受信して、それに基づいて各サーバ６の最大許容生起率を決定して、各エッジ装置３に通知する。

　プロビジョニング手段９は、輻輳制御手段８から指定されたサーバ６に対して、サーバ６の起動、割当てを行うための指示メッセージをサーバ６に送る。

　記憶装置１０は、稼働中および待機中のサーバ６のアドレスと、サーバ６の処理率（単位時間当たりのサービス要求の処理可能数）と、およびエッジ装置３の各アドレスと、サーバでの観測性能、入力規制率、各エッジ装置３から受信した各サーバ６との間のネットワークレベルの遅延等を保持している。

　次に、図３を用いて、エッジ装置３の構成について説明する。エッジ装置３は、資源管理手段１１と、入出力手段１２と、入力規制手段１３と、負荷分散手段１４と、複数の転送キュー１５と、読み出し手段１６とを備えている。

　資源管理手段１１は、制御装置４から送られた規制値を入力規制手段１３に設定する。また制御装置４から送られた各サーバ６の最大許容生起率から割当て係数を決定して、負荷分散手段１４に設定する。さらに、読み出し手段１６で各転送キュー１５に対してシェイピングを行う場合は、そのレートとして前記（サーバの最大許容生起率）/（エッジ装置総数）を転送キュー１５に設定する。

　入力規制手段１３における入力規制の方法には次の２つが考えらえる。一つは、入力規制率φに基づいて、例えばサービス要求メッセージを受信するたびに乱数を振って、その値がφ未満の場合はそのサービス要求メッセージを廃棄もしくは要求拒否メッセージを返送し、乱数を振った値がφ以上のものはサービス要求メッセージの処理を行う。

　もうひとつは総量規制であり、リークレートrと、そこからの揺らぎを表すバケットサイズBを２つのパラメータにもつリーキーバケットアルゴリズムに基づいて規制を行う。リーキーバケットは、リークレートrでサイズBのバケツからデータを読み出すことを想定したもので、到着したメッセージのサイズがバケツの空き容量を超えた場合、それは廃棄される。

　負荷分散手段１４は、クライアント１からサービス利用登録要求のメッセージが到来すると、割当て係数に基づいて決定されたサーバ６をそのクライアント１に割当てる。一度割り当てられたサーバ６は、クライアント１がサービス利用登録を解除するまでそのクライアント１からのメッセージが転送される。また、予め各クライアント１に割当てられたサーバ６に対応する転送キュー１５にクライアント１からのサービス要求メッセージを振り分ける。

　負荷分散手段１４は、例えば、クライアント１からのサービス利用登録要求を、割当て係数に従ってサーバ６に割り当てる。そしてその後、そのクライアント１からその後転送されるメッセージはその割り当てられたサーバ６に対応する転送キュー１５に送る。このサービス利用登録は、例えば、３ＧＰＰのAttach、ＳＩＰのuser registrationであり、一度割り当てられたらその間のメッセージはすべて同一のサーバ６に送られる。転送キュー１５はサーバ毎に設定される。

　読み出し手段１６は、資源管理手段１１から設定された振分け係数に基づいてweighted fair queue形式で、転送キュー１５からサービス要求メッセージを読み出すか、あるいは（最大許容生起率）/(エッジ装置数)で決まるレートでシェイピングしてもよい。

［実施形態の動作）
　次に、制御装置４の輻輳制御手段８での動作について説明する。次のように与えられた目的関数を最適化するように決定する。

　いま、サーバのサービス要求メッセージの処理能力はすべて等しいものとする。先ず定数について説明する。aは一つの処理要求を処理完了できた場合に得られる収入、bは稼働中のサーバ１台で単位時間に発生するコストとする。コストは具体的には電力使用量やサーバ管理の手数等に係るものである。λ_Oはエッジ装置全体に加わるサービス要求のトラヒックとする。D_nはサーバnにおいて要求される遅延限界である。

　PG[λ,D]は生起率λのトラヒックが、1台のサーバに加わったとき、許容時間D以内にサービスが完了する確率を表す処理完了率を表す関数である。

　次に、変数について説明する。λ_nはエッジ装置全体に加わるサービス要求のトラヒックのうちサーバnに加わる生起率、Nはサーバ数、φは各エッジ装置における共通の入力規制率を表す。

　次に、目的関数について説明する。（１－φ）λ_nは各エッジ装置における入力規制後、サーバnに加わるトラヒックであり、これをスループットと呼ぶ。

　そして、（1－φ）λ_n*PG[（1－φ）λ_n,D_n]はサーバnにおいて単位時間あたりに処理完了するサービス要求メッセージ数を示し、これはグッドプットとも呼ばれる。すると、目的関数において、a*Σ_n=1 ^N（1－φ）λ_n*PG[（1－φ）λ_n,D_n]は単位時間当たりのサーバ全体での総収入を表す。一方bNは単位時間あたりサーバ全体に発生するコストになるので、式（１）の目的関数は単位時間当たりの総収益を最大化するものとみなせる。

　ここで、式（１）はλ_nについて非線形関数となるため、これを線形近似して、上記最適化問題を容易に解けるようにする。すなわち与えられたdに対して、PG[λ,d]はλに関する減少関数となるので、λ*PG[λ,D]はλに関して最大値をもつ。非特許文献７によれば、生起率λ、処理率μ最大許容遅延DをパラメータにしたM/M/1の待ち行列システムでの処理完了率はPG[λ, D]=1－exp{－(μ－λ)D}で与えられる。そして与えられたDに対して、グッドプットλ* [1－exp{－(μ－λ)D}]の最大値を与えるλ=λ^maxの値を示す表も与えられている。これはDが大きくなるほど大きくなることがわかる。また、一般にある待ち行列システムでのλ^maxを求めるのは上記のように解析的に導出するだけでなく、サーバに擬似的なトラヒックを加えていって与えられたλに対する遅延分布を求め、さらに、与えられたDに対してλに対するグッドプットのグラフを、加えてグッドプット算出して求めることも可能である。

　λ^maxはサーバにこれ以上の生起率を持つサービス要求のトラヒックを受け入れると、グッドプットが低下するので、輻輳崩壊を防ぐにはこれ以上の生起率を持つトラヒックを受け入れるべきではないことを示す値である。よって、λ^maxを最大収容生起率とも呼ぶことにする。

　上記の議論に基づいて式（１）を線形近似するため、0≦λ_n(1－φ)≦λ_n ^maxの範囲ではPG[λ_n(1－φ),D_n]＝1で近似する。これより式（１）、（２）から、
　　Σ_n=1 ^Nλ_n（1－φ）*PG[λ_n（1－φ）, D_n]
＝（1－φ）Σ_n=1 ^Nλ_n
＝ (1－φ)λ_O
となる。したがって、上記の最適化問題は、次のように簡略化できる。

　λ_n ^maxはサーバnの最大収容生起率とする。サーバ全体で最大収容可能なトラヒックを、以下の式（８）と定義する。

　すると、式（２）、（７）より、
Σ_n=1 ^Nλ_n (1－φ)＝(1－φ)λ_O≦Σ_n=1 ^Nλ_n ^max＝λ[N]、よって、これより新たな制約条件として、以下の式（９）を得る。

　これにより、上記の最適化問題は、さらに次のように表すことができる。

　ここで、D₁=,..,=D_Nであり、各サーバに振り分けられるサービス要求の生起率はすべて等しいとすれば、λ₁ ^max=,...,=λ_N ^max≡λ^maxが得られる。すると、式（８）はλ[N]＝λ^maxNとなり、式（５）はφ＋N/(λ_O/λ^max) ≧１となる。したがって、上記の最適化問題は、下記のように、入力規制率φとサーバ数Nから成る線形空間における線形関数の最大化問題となる。

　図４Ａおよび図４Ｂは、上記の（N、φ）の平面上で式（１０）、（４）、（７）の制約条件を満たす許容領域を斜線で示す。

　いま、目的関数（６）の値をｃと置いて、入力規制率φについて解くと、φ=－bN/(aλ_O）+(aλ_O－c)となってφ切片はaλ_O－cであるから、cを最大にするには、上記直線のφ切片を許容領域内で最小にすればよい。

　その際、以下に示す２つの場合に分けて考える必要がある。一つは、図４Ａに示されている場合、すなわちλ_O/λ^max＜N^maxならば、ceilを天井関数として、次の式（１１）となる。

　すなわち、エッジ装置３に加わるトラヒックがサーバ６側の最大容量を下回る場合は、規制率φは０にして、サーバ数Ｎは、そこに加わるトラヒックを収容できる最小分だけ用意する。

一方、許容領域が図４Ｂで示されている場合、すなわちλ_O/λ^max≧N^maxならば、次の式（１２）となる。

　すなわち、エッジ装置３に加わるトラヒックがサーバ６側の最大容量を上回る場合は、サーバ６は準備できる最大限N^maxを稼働させ、それによる容量を上回る分のトラヒックは入力規制することになる。

　ここで、本実施形態によって得られる効果について述べておく。式(１２)より、入力規制率φは与えられたサーバ台数に対して、規制されるトラヒックの割合を示している。これはN^maxが大きければ大きいほど小さくなる。よって、処理容量が固定であるシステムに比べて処理容量を増加させることができれば、入力規制されるトラヒック量を減少させる、あるいは疎通させるトラヒック量を増大させることができるという効果が得られる。

　また、目的関数の最適値は、上記のN,φの値を式（４）に入れ、さらにNが連続数を取ることができると近似するならば、
λ_O/λ^max＜N^max の場合は　a*λ_O－bλ_O/λ^max＝（a－b/λ^max）λ_O、でλとともに増加し、
λ_O/λ^max≧N^max, の場合は　(a*λ^max－b)N^max　と一定になる。

　上記の収益の最大値より、パラメータa,b に関して次のことがわかる。すなわち、与えられたλ_Oに対して収益が正の値をとるためには、aλ^max>bである必要がある。これは、サーバを一台用意して最大得られる収入がそのコストを上回る必要があることを意味する。これは、図４Ａおよび図４Ｂにおいて、それぞれ直線Ｌ２，Ｌ４に相当する。

　一方、a*λ^max≦bの場合は、N^maxを増やすと収益が減るので、収益最大化のためには、N ^max＝１とせざるを得ず、サーバを増設することの意味がない。これは図４Ａ及びＢにおいてそれぞれ直線Ｌ１，Ｌ３に相当する。

　上記のように最適化問題を設定しその解に基づいて輻輳制御をするならば、各エッジ装置で観測して得られる生起率λeの総和から得られるλ_O=Σ_e=1 ^Eλ_eに対して、式（１１）または（１２）からサーバ数Nと、各エッジ装置に共通の入力規制値であるφを決定するだけでよく、非特許文献２と違って、個別のサーバに対して輻輳検出してから個別に入力規制等の制御をかけるといったサーバ個別の対応を行う必要がなくなる。

　以上に基づいた制御装置４の輻輳制御手段８による動作を、図５の流れ図を用いて詳細に説明する。ここで、各サーバが最大収容可能なサービス要求の生起率は予め与えられているものとする。

　輻輳制御手段８は、各制御区間の終了時に各エッジ装置３から生起率の観測値を収集したら（ステップＳ１）、各サーバ６から受信した生起率の総和、および現在稼働中のエッジ装置３の数から、式（１１）、（１２）に基づいてサーバ数N、および入力規制パラメータ（入力規制率（廃棄率）φまたはリークレートm）を決定して記憶装置に格納し（ステップＳ２）、サーバを新たに増設する、もしくは既存サーバを減設する場合はサーバの起動、終了の指示をプロビジョニング手段９に指示してから、稼働中のサーバ６のアドレスを記憶装置１０上で更新する（ステップＳ３）。そして、輻輳制御手段８は、入力規制パラメータと利用可能なサーバのアドレスを記憶装置から読み出してエッジ装置に通知する（ステップＳ４）。

　なお、ステップＳ３に基づいてプロビジョニング手段９から終了の指示を受けたサーバ６は、実際に稼働を終了する前に、すでに登録されているユーザを他のサーバ６に振り替える必要がある。そのために、輻輳制御手段８は直接もしくは間接的に、終了指示をうけたサーバ６に指示して、そのサーバ６に登録されたクライアント１に他のサーバ６への再登録を促す。そして、すべてのクライアント１の他のサーバ６への再登録が終了したら稼働を終了する。

　次に、エッジ装置３における負荷分散に関する動作について説明する。その前に、定量的なモデル化について説明する。いま、サーバnにおけるサービス完了はエッジ装置３からサーバ６へのネットワーク遅延も含む総合遅延がd以下であれば実現されるとする。

　いま、エッジ装置e(=1,..,E)からサーバnへのネットワークレベルでの往復遅延RTT_e,nに加えてサーバ６での処理遅延t_n ^srvを加えた総合時間t_e,n ^total=t_n ^srv＋RTT_e,nが任意のエッジ装置３とサーバ６の組に対して共通のD以下であれば処理が完了したとみなす。すると、サーバnにおいて処理完了とみなせるためには、

　すべてのエッジ装置３に対してt_n ^srv≦D－RTT_e,n　　for all e=1,..E、

　すなわち、t_n ^srv≦D－max_e=1,..,ERTT_e,n　でなければならない。よって、サーバnにおける処理完了率Pはグッドプットを表す関数を用いて、PG[λ_n, D－max_e=1,..,ERTT_e,n]と書けるので、サーバnにおけるグッドプットはλ_n*PG[λ_n,D－max_e=1,..,ERTT_e,n]となる。ここで、先に述べたように、グッドプットGP[λ,τ]を最大化するためのλ=λ^maxは、予めサーバに生起率λの擬似トラヒックを加えて遅延を計測して、λに対する遅延分布を算出し、そこから各τに関するλ=λ^maxを求めて例えば表の形式で保持しておくことができる。

　上記のグッドプットを最大化するλ_n =λ_n ^maxを制御装置４でテーブルからひかせるためには、τ_nを算出する必要がある。

　これは、エッジ装置３とサーバ間６で測定したRTTを各エッジ装置から収集する。これより、τ_n=D－max_e=1,..,ERTT_e,n (n=1,..,N)、そしてτ_nより得られるλ_n ^max（n=1,..,N）をすべてのサーバ６についてエッジ装置３に通知すれば、エッジ装置３はサーバnへの振分け係数を次のように計算できる。

　エッジ装置は総数がE台あるので、各エッジ装置３では、最大収容生起率がλ_n ^maxであるサーバnからのサービス要求トラヒックに対してピークレートをm_n=λ_n ^max/E (n=1,..,N)の値でシェイピングするならば、サーバnには全エッジ装置から高々λ_n ^maxのトラヒックしか加わらないのでサーバnでの輻輳崩壊は防ぐことができる。

　なお、新規にサーバ６を増設した直後からは、接続要求の処理に関する負荷レベルを他のサーバ６と同等レベルにより早く持っていく必要がある。そこで新規クライアントの登録をそのサーバ６へ集中的に行わせるために次のように振分け係数のつけ方を通常とは違う方法にする。

　すなわち、制御装置４は、図５を用いて説明した輻輳制御方法に基づいて新規にサーバ６を増設して、プロビジョニング手段９から増設完了の応答を受けた場合は増設モードを設定する。そして新規サーバ６に対する最大許容生起率は例えば１００、他のサーバ６については０として、エッジ装置３に通知する。もしくは制御装置４が他のサーバ６に直接もしくは間接的に指示して、そのサーバ６にサービス登録済みのクライアントを新設したサーバ６へ再登録するように促す。こうした新設サーバ６への集中的なクライアント１の割当ては、例えば、新規サーバ６へのクライアント１の登録数が他のサーバ全体でのクライアント登録数の平均値を超えるまで続ける。前記の平均値を算出するために、制御装置４はサーバ６に定期的にアクセスして登録されているクライアント数の情報を受信する。

　以上を考慮して、エッジ装置３の資源管理手段１１は下記の動作を行う。すなわち、エッジ装置３は各サーバ６にIP pingを飛ばす等により、ネットワークレベルでの往復遅延ＲＴＴを測定する。そして、それが著しく変化した場合は、制御装置４に各サーバ６へのＲＴＴの最悪値のベクトルを送信する。

　エッジ装置３は制御装置４から各サーバ６の最大許容生起率λ^max=(λ₁ ^max,..,λ_N ^max)を受信した場合は、そこから式（１）に基づいて割当て係数を算出して負荷分散手段１４に設定し、またそれを直接転送キュー１５のシェイピングレートに設定する。

　次に、制御装置４の負荷分散制御手段１７における動作について、図６を用いて説明する。サーバプロビジョニング完了応答がプロビジョニング手段９から出力されたら(ステップＳ１１)、増設モードを設定して(ステップＳ１２)、ステップＳ１６に遷移する。

　一定時間後に各エッジ装置３からＲＴＴを受信したら（ステップＳ１３）、負荷分散制御手段１７は、増設モードであるかどうか調べ（ステップＳ１４）、増設モードである場合（ステップＳ１４のＹｅｓ）、ステップ１６に遷移する。ステップ１４で増設モードでない場合（ステップＳ１４のＮｏ）、負荷分散制御手段１７は利用可能な各サーバ６ついて、ＲＴＴに基づくλ^maxを算出して、利用可能なサーバのアドレスとともに各エッジ装置３に通知し（ステップＳ１５）して、ステップＳ１３に戻る。

　負荷分散制御手段１７は、ステップＳ１６では、一定時間後に各サーバから登録クライアント数を取得し、次に、新規サーバのクライアント数が新規サーバ以外の平均クライアント数を超えたかどうか調べ（ステップＳ１７）、超えた場合（ステップＳ１７のＹｅｓ）、増設モードを解除して最大許容生起率は先に説明したグッドプットを最大化するものに設定し（ステップＳ１８）、ステップＳ１３に遷移する。一方、ステップＳ１７で超えない場合（ステップＳ１７のＮｏ）、新設された以外の既存サーバは最大許容生起率についてλ_n ^max=0を設定、新設されたサーバに対してはλ_n ^max=100を設定して（ステップＳ１９）、ステップＳ１６に遷移する。

　上記の動作により、サーバ増設された状態においては、他の既稼働のサーバと同等レベルまでクライアント数が０から増加するまで、そのサーバに集中して新規クライアントが登録されるので、より早く他のサーバとの負荷レベルを等しくすることができる。

　また、各サーバに登録されたクライアント数が平準化されている場合は、各エッジ装置３と各サーバ６との間の総合遅延がすべて許容時間を満たすように新たなクライアント１の登録が振り分けられるようになる。

　次に、本実施形態に基づく実施例について説明する。

　図６は、λ_Oが時間的に変化したときの、制御変数である入力規制率φ、サーバ数Nの軌跡を表す。ただし、どのサーバ６の処理率も等しくμとし、エッジ装置３とサーバ６との間のネットワーク遅延はすべて等しいものとする。λ_Oが増加するにしたがって、入力規制率φ＝０のまま、サーバ数Nを増やす。N=N^maxになっても、さらにλが増えていったら、今度は、N=N^maxのままで、λ_Oの増加とともにφを増加させる。

　一方、この状態からλが減少を始めると、入力規制率φも減少させる。そして、入力規制率φが０になったところさらにλ_Oが減少すれば、入力規制率φ＝０のまま、サーバ数Nが削減されることを示している。

　本発明は、３ＧＰＰのＥＰＣにおいては、eNodeBとＭＭＥをそれぞれエッジ装置とサーバとみなすことで、適用することができる。また、ＳＩＰを用いたＩＭＳにおけるＶＯＩＰにおいて、Ｉ－ＣＳＣＦとＳ－ＣＳＣＦをそれぞれエッジ装置とサーバとみなした場合にも、本発明を適用することができる。

　次に、図７を用いて、複数のエッジ装置３全体に加わるトラヒックλ_Oが時間的に変化したときの、制御変数である入力規制率φ及びサーバ数Ｎの値の軌跡を説明する。ただし、どのサーバの処理率も等しくμとし、エッジ装置３とサーバ６との間のネットワーク遅延はすべて等しいものとする。

　図７の横軸は、時間変化を示す。つまり、横軸を右に行くに従い時間が経過していることを示す。左側の縦軸は、入力規制率φの値を示す。さらに、右側の縦軸は、λ_Oの値を示す。図７においては、サーバ数Ｎを示す軸は存在しないが、グラフの変化によりサーバ数が増減している様子を示す。

　図７のＬ１は、λ_Oが時間０から時間Ｔ２まで増加し、時間Ｔ２から時間Ｔ４まで減少している様子を示している。λ_Oが増加している時間０から時間Ｔ１までを低負荷状態とする。さらに、λ_Oが増加している時間Ｔ１からＴ２及びλ_Oが減少している時間Ｔ２からＴ３までを過負荷状態とする。さらに、λ_Oが減少している時間Ｔ３からＴ４までを低負荷状態とする。

　図７のＬ２は、サーバ数Ｎの推移を示している。時間０から時間Ｔ１までは、λ_Oが増加するに伴い、稼働するサーバ数Ｎを増加させている。ここで、時間Ｔ２において稼働するサーバ数ＮがＮ^maxに達した後、過負荷状態であるＴ３までは、サーバ数ＮがＮ^maxである状態が継続する。時間Ｔ３からＴ４までは、λ_Oが減少するに伴い稼働するサーバ数Ｎも減少させる。

　図７のＬ３は、入力規制率φの値を示している。入力規制率φは、時間０からＴ１までは０に設定されている。つまり、時間Ｔ１までは、入力規制率φを０に設定して稼働するサーバ数を増加させることにより、増加するトラヒックλ_Oに対応している。時間Ｔ１にサーバ数ＮがＮ^maxに達した後、増加するトラヒックλ_Oに対して入力規制率φを増加させることにより、１台のサーバ６に送信されるトラヒックの量を調整する。時間Ｔ２から時間Ｔ３の間は、トラヒックλ_Oの減少に伴い入力規制率φも減少させる。時間Ｔ３から時間Ｔ４の間は、入力規制率φを０に設定し、サーバ数Ｎを減少させることにより、減少するトラヒックλ_Oに対応している。

　このようにして、本発明における輻輳制御では、増加するトラヒックに対して稼働させるサーバ数を増加させることができる間においては、トラヒックの入力規制は行わず、稼働させるサーバ数が上限に達した場合に、トラヒックの入力規制を行うように制御される。このように制御することにより、処理するサービス要求の数を増加させることができる。

　なお、本発明において、下記の形態が可能である。
［形態１］
　上記第１の視点に係る輻輳制御方法のとおりである。
［形態２］
　前記制御工程において、稼働中のサーバ数が最大許容数未満である状態においては、前記規制率に基づく入力規制を行うことなく前記生起率の増減に従ってサーバの稼働または停止を行い、稼働中のサーバ数が最大許容数に達している場合、前記生起率の増減に従って前記規制率に基づく入力規制を行ようにしてもよい。
［形態３］
　前記エッジ装置は、３ＧＰＰのEvolved Packet System（ＥＰＳ）に準拠したｅＮｏｄｅＢであり、
　前記複数のサーバは、前記ＥＰＳに準拠したＭＭＥ（Mobility Management Entity）であってもよい。
［形態４］
　前記エッジ装置および前記複数のサーバは、３ＧＰＰのＩＭＳ（IP Multimedia Subsystem）に準拠したＣＳＣＦ（Call Session Control Function）であってもよい。
［形態５］
　上記第２の視点に係る輻輳制御システムのとおりである。
［形態６］
　前記制御手段は、稼働中のサーバ数が最大許容数未満である状態においては、前記規制率に基づく入力規制を行うことなく前記生起率の増減に従ってサーバの稼働または停止を行い、稼働中のサーバ数が最大許容数に達している場合、前記生起率の増減に従って前記規制率に基づく入力規制を行うようにしてもよい。
［形態７］
　前記エッジ装置は、３ＧＰＰのEvolved Packet System（ＥＰＳ）に準拠したｅＮｏｄｅＢであり、
　前記複数のサーバは、前記ＥＰＳに準拠したＭＭＥ（Mobility Management Entity）であってもよい。
［形態８］
　前記エッジ装置および前記サーバは、３ＧＰＰのＩＭＳ（IP Multimedia Subsystem）に準拠したＣＳＣＦ（Call Session Control Function）であってもよい。
［形態９］
　上記第３の視点に係る制御装置のとおりである。
［形態１０］
　前記制御手段は、稼働中のサーバ数が最大許容数未満である状態においては、前記規制率に基づく入力規制を行うことなく前記生起率の増減に従ってサーバの稼働または停止を行い、稼働中のサーバ数が最大許容数に達している場合、前記生起率の増減に従って前記規制率に基づく入力規制を行うようにしてもよい。
［形態１１］
　上記第４の視点に係るプログラムのとおりである。
［形態１２］
　前記制御処理において、稼働中のサーバ数が最大許容数未満である状態においては、前記規制率に基づく入力規制を行うことなく前記生起率の増減に従ってサーバの稼働または停止を行い、稼働中のサーバ数が最大許容数に達している場合、前記生起率の増減に従って前記規制率に基づく入力規制を行うようにしてもよい。

　また、本発明によると、以下に付記として記載する発明が提供される。
［付記１］
　複数のクライアントからのサービス要求メッセージを集約してサーバに振り分ける複数のエッジ装置と、クライアントからのサービス要求を処理する複数のサーバと、少なくとも一つの制御装置とがネットワークで接続された輻輳制御システムに用いられる輻輳制御方法であって、
　前記制御装置は、前記エッジ装置から観測されたサービス要求の生起率に関する情報を取得し、前記情報に基づいて、少なくとも、サービス要求メッセージを規制する割合および稼働すべきサーバの総数を決定し、それらに基づいて、前記エッジ装置に規制する割合に関する情報を通知し、新たなサーバの稼働、もしくは稼働中のサーバのサービス停止を行う、輻輳制御方法。
［付記２］
　稼働中のサーバ数が最大許容数未満である状態においては、入力規制はせずに生起率の増減に従ってサーバの稼働もしくは停止を行い、稼働中のサーバ数が最大許容数に達している場合は生起率の増減に従って入力規制を行う、付記１に記載の輻輳制御方法。
［付記３］
　前記エッジ装置は３ＧＰＰのEvolved Packet System（ＥＰＳ）に準拠したeNodeBであり、サーバは前記EPSに準拠したＭＭＥである、付記１または２に記載の輻輳制御方法。
［付記４］
　前記エッジ装置および前記サーバは３ＧＰＰのＩＭＳに準拠したＣＳＣＦである、付記１または２に記載の輻輳制御方法。
［付記５］
　複数のクライアントからのサービス要求メッセージを集約してサーバに振り分ける複数のエッジ装置と、クライアントからのサービス要求を処理する複数のサーバと、少なくとも一つの制御装置とがネットワークで接続された輻輳制御システムであって、
　前記制御装置は、前記エッジ装置から観測されたサービス要求の生起率に関する情報を取得し、前記情報に基づいて、少なくとも、サービス要求メッセージを規制する割合および稼働すべきサーバの総数を決定し、それらに基づいて、前記エッジ装置に規制する割合に関する情報を通知し、新たなサーバの稼働、もしくは稼働中のサーバのサービス停止を行う、輻輳制御システム。
［付記６］
　稼働中のサーバ数が最大許容数未満である状態においては、規制率は０のまま生起率の増減に従ってサーバの稼働もしくは停止を行い、稼働中のサーバ数が最大許容数に達している場合は生起率の増減に従って規制率を増減させる、付記５に記載の輻輳制御システム。
［付記７］
　前記エッジ装置は３ＧＰＰのEvolved Packet System（ＥＰＳ）に準拠したeNodeBであり、前記サーバは前記ＥＰＳに準拠したＭＭＥである、付記５または６に記載の輻輳制御システム。
［付記８］
　前記エッジ装置および前記サーバは３ＧＰＰのＩＭＳに準拠したＣＳＣＦである、付記５または６に記載の輻輳制御システム。

　なお、上記の非特許文献の各開示を、本書に引用をもって繰り込むものとする。本発明の全開示（請求の範囲及び図面を含む）の枠内において、さらにその基本的技術思想に基づいて、実施形態の変更・調整が可能である。また、本発明の請求の範囲の枠内において種々の開示要素（各請求項の各要素、各実施形態の各要素、各図面の各要素等を含む）の多様な組み合わせないし選択が可能である。すなわち、本発明は、請求の範囲及び図面を含む全開示、技術的思想にしたがって当業者であればなし得るであろう各種変形、修正を含むことは勿論である。特に、本書に記載した数値範囲については、当該範囲内に含まれる任意の数値ないし小範囲が、別段の記載のない場合でも具体的に記載されているものと解釈されるべきである。

　１　クライアント
　２　フロントエンド網
　３　エッジ装置
　４　制御装置
　５　バックエンド網
　６　サーバ
　７、１２　入出力手段
　８　輻輳制御手段
　９　プロビジョニング手段
　１０　記憶装置
　１１　資源管理手段
　１３　入力規制手段
　１４　負荷分散手段
　１５　転送キュー
　１６　読出し手段
　１７　負荷分散制御手段
　Ｎ　サーバ数
　φ　入力規制率

Claims

　クライアントからのサービス要求メッセージを集約してサーバに振り分けるエッジ装置と、前記クライアントからのサービス要求を処理する複数のサーバとにネットワークで接続された制御装置が、
　前記エッジ装置から観測されたサービス要求の生起率を取得する工程と、
　前記生起率に基づいて、サービス要求メッセージを規制する割合を規制率として決定するとともに、稼働すべきサーバ数を決定する工程と、
　前記規制率を前記エッジ装置に通知するとともに、前記サーバ数に基づいて新たなサーバの稼働または稼働中のサーバのサービス停止を行う制御工程と、を含む、輻輳制御方法。
　前記制御工程において、稼働中のサーバ数が最大許容数未満である状態においては、前記規制率に基づく入力規制を行うことなく前記生起率の増減に従ってサーバの稼働または停止を行い、稼働中のサーバ数が最大許容数に達している場合、前記生起率の増減に従って前記規制率に基づく入力規制を行う、請求項１に記載の輻輳制御方法。
　前記エッジ装置は、３ＧＰＰのEvolved Packet System（ＥＰＳ）に準拠したｅＮｏｄｅＢであり、
　前記複数のサーバは、前記ＥＰＳに準拠したＭＭＥ（Mobility Management Entity）である、請求項１または２に記載の輻輳制御方法。
　前記エッジ装置および前記複数のサーバは、３ＧＰＰのＩＭＳ（IP Multimedia Subsystem）に準拠したＣＳＣＦ（Call Session Control Function）である、請求項１または２に記載の輻輳制御方法。
　クライアントからのサービス要求メッセージを集約してサーバに振り分けるエッジ装置と、前記クライアントからのサービス要求を処理する複数のサーバと、制御装置とを備え、
　前記制御装置は、前記エッジ装置から観測されたサービス要求の生起率を取得する手段と、
　前記生起率に基づいて、サービス要求メッセージを規制する割合を規制率として決定するとともに、稼働すべきサーバ数を決定する手段と、
　前記規制率を前記エッジ装置に通知するとともに、前記サーバ数に基づいて新たなサーバの稼働または稼働中のサーバのサービス停止を行う制御手段と、を備える、輻輳制御システム。
　前記制御手段は、稼働中のサーバ数が最大許容数未満である状態においては、前記規制率に基づく入力規制を行うことなく前記生起率の増減に従ってサーバの稼働または停止を行い、稼働中のサーバ数が最大許容数に達している場合、前記生起率の増減に従って前記規制率に基づく入力規制を行う、請求項５に記載の輻輳制御システム。
　前記エッジ装置は、３ＧＰＰのEvolved Packet System（ＥＰＳ）に準拠したｅＮｏｄｅＢであり、
　前記複数のサーバは、前記ＥＰＳに準拠したＭＭＥ（Mobility Management Entity）である、請求項５または６に記載の輻輳制御システム。
　前記エッジ装置および前記サーバは、３ＧＰＰのＩＭＳ（IP Multimedia Subsystem）に準拠したＣＳＣＦ（Call Session Control Function）である、請求項５または６に記載の輻輳制御システム。
　クライアントからのサービス要求メッセージを集約してサーバに振り分けるエッジ装置と、前記クライアントからのサービス要求を処理する複数のサーバとにネットワークで接続された制御装置であって、
　前記エッジ装置から観測されたサービス要求の生起率を取得する手段と、
　前記生起率に基づいて、サービス要求メッセージを規制する割合を規制率として決定するとともに、稼働すべきサーバ数を決定する手段と、
　前記規制率を前記エッジ装置に通知するとともに、前記サーバ数に基づいて新たなサーバの稼働または稼働中のサーバのサービス停止を行う制御手段と、を備える、制御装置。
　前記制御手段は、稼働中のサーバ数が最大許容数未満である状態においては、前記規制率に基づく入力規制を行うことなく前記生起率の増減に従ってサーバの稼働または停止を行い、稼働中のサーバ数が最大許容数に達している場合、前記生起率の増減に従って前記規制率に基づく入力規制を行う、請求項９に記載の制御装置。
　クライアントからのサービス要求メッセージを集約してサーバに振り分けるエッジ装置と、前記クライアントからのサービス要求を処理する複数のサーバとにネットワークで接続された制御装置に設けられたコンピュータに対して、
　前記エッジ装置から観測されたサービス要求の生起率を取得する処理と、
　前記生起率に基づいて、サービス要求メッセージを規制する割合を規制率として決定するとともに、稼働すべきサーバ数を決定する処理と、
　前記規制率を前記エッジ装置に通知するとともに、前記サーバ数に基づいて新たなサーバの稼働または稼働中のサーバのサービス停止を行う制御処理と、を実行させる、プログラム。
　前記制御処理において、稼働中のサーバ数が最大許容数未満である状態においては、前記規制率に基づく入力規制を行うことなく前記生起率の増減に従ってサーバの稼働または停止を行い、稼働中のサーバ数が最大許容数に達している場合、前記生起率の増減に従って前記規制率に基づく入力規制を行う、請求項１１に記載のプログラム。