JP2008503008A - エンド・ツウ・エンド遅延保証を含む多層インフラストラクチャのコストを最小限度まで低減するための方法および装置 - Google Patents

エンド・ツウ・エンド遅延保証を含む多層インフラストラクチャのコストを最小限度まで低減するための方法および装置 Download PDF

Info

Publication number
JP2008503008A
JP2008503008A JP2007527185A JP2007527185A JP2008503008A JP 2008503008 A JP2008503008 A JP 2008503008A JP 2007527185 A JP2007527185 A JP 2007527185A JP 2007527185 A JP2007527185 A JP 2007527185A JP 2008503008 A JP2008503008 A JP 2008503008A
Authority
JP
Japan
Prior art keywords
capacity allocation
calculating
guarantees
service classes
capacity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007527185A
Other languages
English (en)
Inventor
リン、ウーキン
リュー、ヂェン
シア、キャシー、ホンフイ
チャン、リー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JP2008503008A publication Critical patent/JP2008503008A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/16Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5061Partitioning or combining of resources

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Computer And Data Communications (AREA)

Abstract

【課題】 多層コンピューティング・システムで容量割当てを決定するための技術を提供する。
【解決手段】 本発明のある態様においては、その各層が1つまたは複数のコンピューティング装置(例えばサーバ)を有する多層コンピューティング・システムのための容量割当てを設計するための技術は、下記のステップ/動作、すなわち、容量割当てに関する入力パラメータを入手するステップと、容量割当てを入力パラメータの少なくとも一部に基づいて計算するステップとを含む。容量割当ては、1つまたは複数のエンド・ツウ・エンド性能測定値が複数のサービス・クラスを実質的に満足させるように計算することができる。容量割当ての計算は、コスト関数を最小化することができる。容量割当て計算は、また、複数のサービス・クラスに対する1つまたは複数の平均遅延保証、複数のサービス・クラスに対する1つまたは複数のテール分布保証、または複数のサービス・クラスに対する1つまたは複数の平均遅延保証および1つまたは複数のテール分布保証の両方を満足させることができる。
【選択図】 図9

Description

本発明は、概して、データ・ネットワーク・インフラストラクチャ設計技術に関し、特にデータ・ネットワーク・インフラストラクチャに関連するコストを最小限度まで低減し、複数のクラスのサービスに対するエンド・ツウ・エンド遅延に対する特定の性能保証を行うための設計技術に関する。
インターネット(またはワールド・ワイド・ウェブ)に関連する帯域幅および接続性が増大するにつれて、電子ビジネスまたは「e-ビジネス」(すなわち、インターネットを通して行うビジネス)はますます広く行われるようになってきている。多くの従来のサービスは、ウェブをベースとするサービスに変換または変容してきている。e-ビジネスは、多くの従来のビジネスのコスト・パフォーマンスがよい解になっているばかりでなく、新しいビジネスの機会も創設している。現在、例えば、オンライン・ショッピング、オンライン・オークション、オンライン予約、オンライン・バンキングおよびオンライン取引から顧客関連管理、個人管理等に至るまで種々のe-ビジネスが行われている。e-ビジネスは、性能および利用度の保証が不可欠なものになってきている多くの会社の非常に重要なコンポーネントとなってきている。
それ故、e-ビジネス・インフラストラクチャの設計および開発は、2つの難問を解決しなければならない。一方では、e-ビジネス・インフラストラクチャの設計および開発は、サービスの品質(QoS)の点で顧客の期待を満たさなければならない。他方では、会社は、競合できるように情報技術(IT)コストを制御しなければならない。それ故、最もコスト・パフォーマンスがよいアーキテクチャおよびシステムを決定することができるように、コストとサービス・レベルとの間の折り合いを理解することが重要である。
e-ビジネス・インフラストラクチャの最も一般的なアーキテクチャのうちの1つは、多層アーキテクチャである。この場合、必ずしもすべての層を通さなくても、前の端部から後の端部へ、サーバのいくつかの層を通してシステムにより要求に対してサービスが提供される。アーキテクチャの点では簡単であっても、システムは非常に複雑なものであり、通常、大型であり、サーバの複数の層を含み、各層は多くのコンポーネントを有することができる。典型的なe-ビジネス・システムは、その上で稼働している数十のアプリケーションを含む数百のノードからなる。システム全体が非常に複雑なために、ITプラナーは、現在のインフラストラクチャ内の各層にどれだけ多くのサーバを設置すべきか、どんなレイアウトにしたらQoSが最善になるか、予想したビジネスの機会および将来の成長をサポートするのに十分な容量があるのかについての問題にいつでも頭を悩ましている。
現在のe-ビジネス環境のもう1つの重要な特徴は、1つのシステムがサポートすることができるサービスが種々様々であることである。複数のクラスのサービスが通常複数のクライアントに提供されるが、そのすべてが時分割であり、同じ一組のリソースに対して競合するものである。サービス・プロバイダは、個々の各クライアントと契約を結び、各クラスのサービスについてあるレベルのQoSを保証することに同意する。
エンド・ツウ・エンド性能を提供するためのリソース割当てを決定するための現在のアプローチは極めて少ない。これらの現在のアプローチの大部分は、1つの層に焦点を当てて、スケジュール作成または負荷のバランスの問題を処理している。
それ故、エンド・ツウ・エンド性能保証を満たしながら、インフラストラクチャ・コストを最小限度まで低減するために、複数のクラスのサービスを含む多層システムで容量割当てを決定する技術が求められている。
本発明は、多層システムで容量割当てを決定するための技術を提供する。
本発明のある態様においては、その各層が1つまたは複数のコンピューティング装置(例えば、サーバ)を有する多層コンピューティング・システムのための容量割当てを設計するための技術は、下記のステップ/動作を含む。容量割当てに関する入力パラメータを入手するステップ。この入力パラメータの少なくとも一部に基づいて容量割当てを計算するステップ、この場合、容量割当ては、1つまたは複数のエンド・ツウ・エンド性能測定値が複数のサービス・クラスを実質的に満足させるように計算することができる。
さらに、容量割当てを計算するステップ/動作は、さらに、コスト関数を実質的に最小化するステップを含むことができる。容量割当てを計算するステップ/動作は、さらに、複数のサービス・クラスに対する1つまたは複数の平均遅延保証を実質的に満足させるステップを含むことができる。容量割当てを計算するステップ/動作は、さらに、複数のサービス・クラスに対する1つまたは複数のテール分布保証を実質的に満足させるステップを含むことができる。
さらに、容量割当てを計算するステップ/動作は、さらに、複数のサービス・クラスに対する1つまたは複数の平均遅延保証および1つまたは複数のテール分布保証を実質的に満足させるステップを含むことができる。容量割当てを計算するステップ/動作は、さらに、複数のサービス・クラスに対する1つまたは複数の平均遅延保証および1つまたは複数のテール分布保証を実質的に満足させるために、容量割当て計算(または問題)を最適化問題として定式化するステップを含むことができる。最適化問題は、線形制約を含む分離可能な凸状計画問題(separable convex programming problem)として定式化することができる。分離可能な凸状計画問題は、この計画問題への実行可能な解を示す凸包(convex hull)の境界上で最適解を発見することにより解くことができる。分離可能な凸状計画問題は、多項式時間で解くことができる。
添付の図面を参照しながら本発明の例示としての実施形態の下記の詳細な説明を読めば、本発明のこれらおよび他の目的、機能および利点を理解することができるだろう。
以下に例示としてのe-ビジネス環境を使用して本発明について説明する。しかし、本発明は、任意の特定の環境での使用に限定されないことを理解されたい。それどころか、本発明は、もっと一般的に、例えば、エンド・ツウ・エンド性能保証を満たしながら、インフラストラクチャ・コストを最小限度まで低減するために容量割当てを決定することが望ましい任意のデータ・ネットワーク環境での使用に適用することができる。
詳細な説明の残りの部分は次のように構成されている。第1節においては、本発明の原理を紹介する。第2節においては、一般的なフィードフォワード・ネットワークにより考慮中の例示としての問題を説明し、当該2つの性能基準、すなわちエンド・ツウ・エンド応答時間の平均分布およびテール分布を紹介する。第3節においては、平均性能保証について重点的に説明する。第4節においては、エンド・ツウ・エンド応答時間のテール分布についての性能保証について重点的に説明する。次に、第3節および第4節の結果が結合され、第5節においては、両方のタイプのエンド・ツウ・エンド応答時間保証により、例示としてのアプローチについて説明する。第6節においては、本発明の技術の例示としての性能を実証するために数字による結果を使用する。第7節においては、いくつかの例示としてのケースについて説明する。第8節においては、例示としての設計システムおよび方法について説明する。
1.始めに
以下に例を挙げて説明するように、本発明は、エンド・ツウ・エンド応答時間の平均分布およびテール分布両方へのサービス保証を提供する。この場合、実際には、平均応答時間は平均遅延とも呼ばれ、テール分布は、予め指定した閾値より長いエンド・ツウ・エンド遅延を受ける要求の百分率を示す。例えば、平均遅延性能保証は、要求当たりの平均遅延が5秒より短くなるように要求することができ、テール分布保証は、要求の5%以上が15秒より長い遅延を受けないように要求することができる。
所与の容量割当てのコストは、容量割当てベクトルの凸状の分離可能な増大関数であると仮定する。すなわち、層tに容量cが割り当てられた場合には、f(c)のコストが発生し、T個の層を有するシステムへの割当ての全コスト(c,...,c)は、単に
Figure 2008503008
になる。このようなコスト関数は、多くのe-ビジネス・コスト構造に対して使用することができる。例えば、f(c)がcで線形である場合には、コスト構造はIT費用に関するものだけになる。また、層tのところの平均遅延または遅延のテール確率を表すように、f(c)を選択することもでき、この場合、f(c)はQoS契約(すなわち、サービス・プロバイダとサービス・クライアントの間の性能についての合意)に関連する利益または罰金を表す。
さらに、本発明は、非線形計画問題の定式化を提供し、その構造特性を処理する。平均応答時間保証だけの場合には、この解が有利な幾何学的解釈を有することが分かっている。本発明は、また、この問題を解くための種々の方法を提供する。
応答時間のテール分布に対する補償を含む問題はもっと複雑である。本発明は、エンド・ツウ・エンド遅延のテール分布の上下から境界となる近似方法を提供する。上限によりテール分布保証が確保される。それ故、対応する全コストも、最適解の上限である。コスト関数の下限も同様に入手することができる。本発明の解は、すべての層のところのジョブ・クラスのサービス要求から独立している一定の係数だけ最適状態から離れていることが分かっている。また、サービス要件が厳しかった場合、本発明の技術は漸近的最適状態を達成することができることも分かっている。最後に、エンド・ツウ・エンド応答時間保証の両方のタイプに関連して本発明を説明する。
2.問題
この例示としての説明の場合、フィードフォワード多層システムは、図1に示すものと見なされる。t=1,...,T個のサーバ・ステーション(または層)、およびk=1,...,K個のクラスのジョブが存在する。クラスkの到着はレートλのポアソンであると仮定する。クラスkのジョブは、決定性シーケンスである経路k:v(k,1),v(k,2),...,v(k,L)に沿ってステーションに行く。v(k,l)=tである場合には、クラスkのジョブは段階lのところでサーバ・ステーションtに行くと言われる。経路は、すべてのkに対して、
v(k, 1)<v(k, 2)<...<v(k, Tk)
であるという意味でフィードフォワードであると仮定する。
ここで、Tは、経路k内のホップ(層)の全数である。経路kがステーションtを通過する場合には、δ =1と表示し、そうでない場合には、δ =0と表示する。この場合、λ =δ λは、ステーションtへのクラスkジョブの到着レートである。
各サーバ・ステーションのところには、複数のサーバが位置することができる。個々の各サーバは単位容量を有し、ステーションtのところのサーバcの総数はまだ分かっていないと仮定する。
Figure 2008503008
は以降ライトアローcと記載する
=(c,c,..., c)はステーションtが容量cを有するような容量割当てであるとする。ステーションtに属するすべてのサーバは、プロセッサを共有(PS)する形で一緒に動作し、外部からの要件を実行するものと仮定する。
ステーションtのところでのクラスkのジョブの公称サービス要件は、独立していて、平均がm =E[S ]である同じように分布されたランダム変数S である。「公称」という用語を使用したのは、層tのところの容量cが、決定変数であるからである。それ故、容量cが層tに割り当てられた場合には、層tのところのクラスkのジョブに対する平均サービス時間はm /cである。
を下式のようになるようなステーションtのところでの公称サーバ使用としよう。
Figure 2008503008
それ故、容量cの場合には、ステーションtのところでのサーバの使用はρ=Σλ /c=q/cとなる。システムを安定にするために(すなわち、時間の経過により作業量が無限に蓄積しないように)、最小容量割当てcは下式を満足させなければならない。
>q(すべてのt=1,...,Tに対して)
プロセッサを共有するサービス方針の下で、すべてのサーバ・ステーションは、対称キューであり、そのため準可逆的である。準可逆ステーションの固定オープン・ネットワークの場合には、積形式が保持し、さらに下記の2つの特性を有することになることが分かっている。
i)各ステーションの状態変数は、他のステーションの状態変数から独立している。
ii)各ステーションのところの各クラスのジョブの到着プロセスは、PASTA特性を有する。この場合、PASTAは、Poisson Arrivals See Time Average(ポアソン到着チェック時間平均)を意味する。これは、任意の到着時間において、新しい到着は、いつでもシステムが平均状態(例えば、任意の新しい到着が見たキュー内のジョブ待ちの数が平均キュー長である等)にあるのを見ることを意味する。
さらに、バークの定理に基づいて、下記のようになる。
iii)フィードフォワード・ネットワーク内の各ステーションのところの到着プロセスもポアソンである。
をステーションtのところのクラスkのジョブに対する固定応答時間ランダム変数としよう。Rは、クラスkジョブの固定エンド・ツウ・エンド応答時間ランダム変数である。特性i〜iii)に基づいて、各kに対して、{R ,t=1,2,...,T}は独立ランダム変数になり、また
Figure 2008503008
となる。この場合、
Figure 2008503008
は分布の等価を示す。積形式に基づいて、ステーションtのところのジョブの数が、M/M/1キュー内のジョブ数と同じであることが分かる。それ故、下式のようになり、
Figure 2008503008
クラスkジョブの平均エンド・ツウ・エンド遅延は下式のようになる。
Figure 2008503008
下記の2つのタイプのサービス保証について考察する。
Figure 2008503008
および
P[R>U]≦ε(各kに対して) (2)
制約(1)は、クラスkジョブの平均エンド・ツウ・エンド応答時間が
Figure 2008503008
以下であることを保証し、制約(2)は、クラスkのエンド・ツウ・エンド遅延がU以上になる確率が∈以下であることを保証する。
コスト構造は、容量割当てc=(c,c,..., c)の分離可能な漸増関数であると仮定する。すなわち、すべてのt=1,...,Tに対して、f(・)は凸状漸増関数である。容量cが層tに割り当てられた場合には、f(c)のコストが発生する。この割当ての全コストは単に
Figure 2008503008
である。この問題は、これらのエンド・ツウ・エンド応答時間保証の一方または両方で、容量割当ての全コストを最小限度まで低減するためのものである。
3.平均遅延保証
最初に、(1)の形の平均遅延保証を含む問題を考察する。これは、顧客からのサービス・レベル要件の普通のまた自然の形である。平均遅延要件が保証されるような最もコスト・パフォーマンスがよい容量割当てを発見する問題は、下式のように定式化することができる。
Figure 2008503008
条件(5)はまさしく安定条件である。各層tが必要とする容量cは、システムを確実に安定させるために少なくともqでなければならないし、応答時間を有限にするために、qより大きくなければならない。それ故、c=q+1/xとなるように新しい変数xを割り当てることができる。この場合、1/xは、層tに割り当てられる余分な容量(最小要件qを超える)である。さらに、下記のようになる。
Figure 2008503008
この場合、W は、その必要な平均エンド・ツウ・エンド上限
Figure 2008503008
に対する層tのところのクラスkジョブに対する公称サービス時間の重量(または相対的比率)であると解釈することができる。
この時点で、この問題は下式のように簡単になる。
Figure 2008503008
ここで、g(x)=f(q+1/x)=f(c)である。この問題は、余分なシステム容量1/xにより生じる全コストを最小限度に低減する問題になる。当然、各tに対して関数fは漸減しないものと仮定する。それ故、gは漸増しない関数である。さらに、この節の残りの部分においては、gは凸状関数であると仮定する。fが凸状である場合には、この仮定が満たされることを容易に理解することができる。しかし、このことは必要ではない。また、例えばf(c)=ln(c)のようないくつかの周知の凹状コスト関数の場合にもこの仮定は満たされる。
また、実行可能な領域がコンパクトになるように、最後の制約(5)が>から≧に緩和されることに留意されたい。x=0が決して最適解にならないことは明らかである。
表記を簡単にするために、ベクトルを表すために
Figure 2008503008
は以降ライトアローxと記載する
および
Figure 2008503008
は以降ライトアローwと記載する
(k=1,...,K)を使用することにする。
Figure 2008503008
実行可能性条件は下記のようになる。
Figure 2008503008
最適化問題(M)は、自然の解釈で直ちに簡単にすることができる有利な形を有する。Ωで実行可能な領域を表すことにする。すなわち、
Figure 2008503008
となる。Ωが正の象限R 内でベクトルライトアローw,..., ライトアローwにより決まる多面体セットであることに留意されたい。またΩを多面体(ライトアローw,..., ライトアローw)として表す。{ライトアローwλ,λ∈S}を多面体(ライトアローw,..., ライトアローw)の最大頂点により決まる最大ベクトルであるとしよう。その場合、各ベクトルライトアローw(k=1,...,K)は、最大ベクトル{ライトアローwλ,λ∈S}の凸状組合せにより支配される。すなわち、下記のようになる。
Figure 2008503008
この場合、ライトアローwλ・ライトアローx≦1(λ∈S)を満足させるすべての
Figure 2008503008
に対して、ライトアローx∈Ωも満足させなければならない。それは、ライトアローx≧0であるからであり、
Figure 2008503008
であるからである。
このことは、ライトアローwに対応する制約は、最大ベクトル{ライトアローwλ,λ∈S}に対応する制約から入手することができることを意味する。それ故、それがある他のライトアローwベクトルの凸状組合せにより支配されている場合には、ベクトルライトアローwに対応する制約を無視することができる。最大ベクトル{ライトアローwλ,λ∈S}は最大頂点により完全に決まることに留意されたい。多面体(ライトアローw,..., ライトアローw)は、単なるすべての最大頂点の凸包である。この場合、下記の特性が得られる。
特性1.(M)への最適解は、多面体(ライトアローw,..., ライトアローw)の頂点により決まる。
すなわち、点ライトアローwが多面体の内部に位置する場合には、最適解を決定する際に役に立たない。もとの問題の場合には、サーバ容量を割り当てる場合には、平均エンド・ツウ・エンド応答時間制約を満足させるあるクラスのジョブは、自動的に満足する他のクラスのジョブの平均応答時間制約を意味することができる。この場合、後者のジョブ・クラスに対する平均応答時間制約の厳しさはもっと緩くなり、前者のジョブ・クラスの制約から入手することができる。この場合、多面体の最大頂点は、その応答時間制約がもっと厳しいジョブのクラスに対応し、他のジョブ・クラスに対する制約から入手することはできない。
定式を簡単にした後で、この問題に対する最適解の発見方法に戻って説明する。最適化問題(M)は、線形制約を含む分離可能な凸状計画問題である。このような線形制約を含む分離可能な凸状計画問題は、線形プログラムに変換することができ、多項式時間で解くことができることに留意されたい。このようなプログラムについては以下に説明する。
さらに、(M)の目的関数は、各変数において単調増加しないタイプであることが分かる。何故なら、最適解は、必ず実行可能な領域の境界上に位置していなければならないからである。すなわち、
特性2.(M)に対する最適解は、必ず多面体(ライトアローw,..., ライトアローw)の境界上に位置していなければならない。
このことは、最適解が非常にしばしば内部の点である一般的な凸状最適化問題と比較すると、若干直感的でないことに留意されたい。
3.1.線形コスト関数を含む平均遅延保証
この節の残りの部分では、コスト関数が線形である場合について考察する。すなわち、f(c)=cである。それ故、コスト構造はIT費用に全面的に依存する。次に、平均遅延制約を満たすように全容量を最小限度に低減する問題は、下式により表すことができる。
Figure 2008503008
定式(M1)から、最適解xは、到着強度に依存しないことが分かる。すなわち、平均エンド・ツウ・エンド遅延保証を確保するために必要な余分な容量は、重量w だけで決まる。それ故、稼働中のシステムに対して上記プラニング問題をオンラインで容易に適応させることができる。何故なら、外部からの負荷に対する予測した容量要件に、余分な容量に対する解を追加するだけでよいからである。
この双対問題(dual problem)を分析すれば、有利な構造および特性を容易に使用することができ、また効率的な解を容易に開発することができる。さらに、この双対解(dual solution)は、多くの場合、感度および堅牢さの分析の際に重要な役割を演じる。ここで、この双対問題について考察する。
最初に、ラグランジュ問題について考察する。
Figure 2008503008
ここで、sはラグランジュ乗数である。
Karush-Kuhn-Tucker(KKT)条件を使用すると、最適解に対する下記の特性が得られる。
Figure 2008503008
命題1.最適解ライトアローxおよびs,..., sに対して
Figure 2008503008
このことは下記のように証明することができる。相補緩み条件(12)から下式のようになる。
Figure 2008503008
ここで、最後から2番目の等式は最適条件(11)に従う。
所与のs=(s,...,s)の場合には、ラグランジュの双対関数(dual function)q(s)は、下式のように定義される。
Figure 2008503008
それ故、(M1)の双対問題は下式のようになる。
Figure 2008503008
hを下式のように定義しよう。
Figure 2008503008
その場合、gは下式により表すことができる。
Figure 2008503008
最後のステップの最小値はu=hのところで得られる。これにより下記の命題となる。
命題2.目的値がhに等しい場合には、問題(D2)に対する最適解は
Figure 2008503008
であると仮定する。それ故、問題(D1)に対する最適解s,..., s
Figure 2008503008
となる。また最適目標値は、g=hである。
問題(D2)は、下式のように書き換えることができる。
Figure 2008503008
この問題は有利な幾何学的解釈を有する。目的関数Σ√w が最大になるように、多面体(ライトアローw,..., ライトアローw)上の最良点ライトアローwを発見したい。
図2は問題(D3)の幾何学的解釈を示す。T次元の空間を考えてみよう。この場合、各点は加重サービス時間要件ベクトル
Figure 2008503008
に対応する。多面体(ライトアローw,..., ライトアローw)をライトアローw,..., ライトアローwにより決まる正の象限R 内の多面体としよう。問題(D3)は、原点に向かって面Σ√w=cを移動し、面と多面体が交差する多面体(ライトアローw,..., ライトアローw)の境界上に第1の点ライトアローwを発見することである。所与のベクトル
Figure 2008503008
の場合には、超平面ライトアローw・ライトアローx=1は、1/xが超平面とt軸の交点になるように一意に決まる。それ故、問題(M1)に対してライトアローxが実行可能な場合には、多面体(ライトアローw,..., ライトアローw)は、対応する超平面の下に位置していなければならない。何故なら、ライトアローw・ライトアローxは各kに対して1以下でなければならないからである。この超平面を実行可能な超平面と呼ぶことにする。ライトアローwを通る超平面を実行可能なものにするために、ライトアローwは多面体のある面上に位置していなければならない。何故なら、そうでなければ、多面体が超平面の下に来ないからである。このことは、任意のベクトルライトアローwの場合、(M1)内の対応する制約が束縛するものである場合には、その制約は同じ面上に位置していなければならないことを意味する。
(D3)の目的関数Σ√wの勾配は、(1/√w,...,1/√w)/2である。これらの勾配は、図2の矢印が示す。グラフの鎖線は、垂線が下式で表されるwを通る超平面を表す。
Figure 2008503008
この超平面は、Σ(w−w )/√w =0で表すことができる。全多面体がこの超平面以下に位置する場合には、ライトアローwは最適解である。何故なら、ライトアローwから改善する方向はどこにもないからである。この超平面をw最適超平面と呼ぶ。何故なら、この超平面がライトアローwが最適解であるかどうかを決めるからである。それ故、任意のライトアローwに対して、対応するw最適超平面が実行可能な超平面である場合には、ライトアローwが最適解となる。一方、ライトアローwを最適なものにするために、全多面体は、その対応するw超平面の下に位置していなければならない。上記観察により、下記の副命題が得られる。
副命題3.(D3)の最適解は、下式で表す場合だけ、wのところで達成される。
Figure 2008503008
意見4.その加重サービス要件ベクトルがライトアローwであるジョブ・クラスを1つだけ含む場合を考えてみよう。超平面ライトアローw・ライトアローx=1(但し、
Figure 2008503008
)は、w最適超平面である。それ故、
Figure 2008503008
がもとの問題(M1)への最適な割当てとなる。
最適双対解の場合には、s>0である場合には、(M1)内の対応する制約が拘束力を有し、クラスkに対する平均応答時間制約が喪失するのを避けるために、ライトアローwがなんらかの増大をした場合には、容量を増大しなければならない。それ故、s>0であるこれらのクラスをボトルネック・クラスと呼ぶことにする。問題(D2)の最適解
Figure 2008503008
は、ボトルネック・クラスの相対的に厳格なレベルを反映していて、
Figure 2008503008
は、ボトルネック・クラスに対するプールした等価のサービス要件である。すべてのクラスに対する平均エンド・ツウ・エンド応答時間制約を満足させる最適な容量の割当ては、この等価のボトルネック(仮想)クラスに対する最適な容量の割当てを発見するのと同じことである。
定理5.ライトアローwが問題(D3)の最適解であると仮定した場合、それが下記の最適化問題の最適解である場合だけ、ライトアローxは(M)の最適解である。
Figure 2008503008
このことは、下記のように証明することができる。最初に、目的関数の凸部の形が厳しいので、(P)は一意の解を有さなければならない。
1つの制約を有する最適化問題(P)への最適解
Figure 2008503008
は、下式により表すことができる。
Figure 2008503008
これをチェックするために、sを1つの制約に対応する双対変数(dual variable)としよう。この場合、(11)から下式が得られる。
Figure 2008503008
相補緩み制約(12)はΣ =1になる。s=(Σ√w のように設定すると、(17)が得られる。
ここで、ライトアローwをsで表すと、(D1)の解は下式で表される。
Figure 2008503008
ここで、第2の等式は最適条件(11)からのもので、最後の等式は命題1に基づくものである。
この式を(17)に代入すると、下式が得られる。
Figure 2008503008
この節を終わるに当たって、2つの最も簡単なシステム、一層システムおよび二層システムについて考察する。T=1がx=1/max である場合に、割当て問題への最適解は簡単である。下記の定理は、二層システムに対する最適容量割当てを示す。
定理6.二層システムについて考えてみよう。下式となると仮定しよう。
Figure 2008503008
もし
Figure 2008503008
である場合には、最適な容量割当ては下式で表される。
Figure 2008503008
そうでない場合、
Figure 2008503008
を、
Figure 2008503008
および
Figure 2008503008
となるような多面体の境界上の
Figure 2008503008
に接続している{w,...,w}の頂点としよう。その場合には、問題(M)に対する最適解は下式のようになる。
Figure 2008503008
ここで、
Figure 2008503008
およびw=θである。
このことは下記のように証明することができる。第1の部分は副命題3および定理5から直ちに得られる。第2の部分の場合には、
Figure 2008503008

Figure 2008503008
および
Figure 2008503008
の両方を通過する境界に沿った最良点であることに留意されたい。それ故、それは最適なものでなければならない。
4.テール分布保証
この節においては、テール分布保証制約(2)を含む容量立案問題を考察する。この問題は下式のように定式化することができる。
Figure 2008503008
第2節のところですでに説明したように、各クラスkに対して、定常状態のエンド・ツウ・エンド応答時間Rは、確率的には、M/G/1 PSキューである各層のところの定常状態の遅延の合計に等しい。それ故、テール確率保証を研究するために、最初にPSキューの応答時間のテールの行動を理解する必要がある。ここで、層tR のところのクラスkの遅延は分布関数
Figure 2008503008
に従うものと仮定する。R の分布は、他の層のところの容量割当てに依存しないことに留意されたい。
それ故、各層のところの遅延は独立しているので、各クラスkに対して、制約(18)の左辺は、クラスkジョブが行ったすべての層上のyに関するG のコンボルーションにより計算することができる。コンボルーションの後で、制約(18)の左辺は、容量割当てベクトルライトアローc=(c,c,..., c)の関数として表される。それ故、問題(T)は、非線形プログラムになる。しかし、(ラプラス変換を除いて)PSの下には応答時間テール分布に対する閉の形の式はなく、それ故、ライトアローcの関数として(18)の左辺に対して閉の形の式を入手することはほとんど不可能である。いくつかの場合でも、この式(または近似)を使用することができるが、この式は、通常、非常に複雑な関数であり、非線形問題を解くのが難しくなる。それ故、当然、優れた近い最適解および/または境界を探すことになる。
本発明によれば、制約(18)を近似することにより、上限および下限を入手し、問題(T)のほぼ最適解が得られる。実際、分布関数G についてのいくつかの仮定の下では、この解が漸近的に最適であることが証明されている。
4.1.下限
問題(T)に対する下限を入手するために、制約(18)を緩和したいと思う。下記の副命題は(18)を緩和するための簡単な方法を示す。
副命題7.すべてのクラスに対するエンド・ツウ・エンド遅延Rが制約(2)を満足させる場合には、下式のようになる。
Figure 2008503008
このことは下記のように証明することができる。各k、tに対して、
Figure 2008503008
および
Figure 2008503008
であるので、下式のようになる。
Figure 2008503008
副命題7は、基本的には、エンド・ツウ・エンド遅延についてのテール分布保証が満足する場合には、これらの保証は各層のところの遅延に対して満足すると述べている。それ故、制約(2)を(19)で置換することにより、下記の問題(T)に対する下限を入手することができる。
定理8.Σ(c )は問題(T)の下限である。この場合、下式のようになる。
Figure 2008503008
4.2.実行可能な解および上限
(20)により入手した解ライトアローcは、問題(T)に対する下限を示すが、問題(T)に対しては実行不能であり、エンド・ツウ・エンド遅延に関するテール分布要件を保証しない。問題(T)に対する実行可能な解を入手するために、最初にランダム変数Rt,n をR のn個の独立コピーの合計であると定義する。
Figure 2008503008
はクラスkジョブ(k=1,...,K)が行く層の組を示し、Tは組
Figure 2008503008
の層の総数を示す。クラスkジョブが、層tに行かなかった場合には、R =0と設定することに留意されたい。さらに、下記のように仮定する。
仮定1.各クラスkに対して、下式の場合には、
Figure 2008503008
下式のようになる。
Figure 2008503008
任意の固定のクラスkに対して、すべてのR が確率的順序方向1≦t≦Tに比較できる場合には、仮定1は満足する。X≦stYまたはY≦stXである場合には、XおよびYは、確率的順序方向≦stに比較することができる。実際、この場合、各固定クラスkに対して、応答時間Rt* が確率的に他のものを支配するようにボトルネック層tが存在する。そのため、
Figure 2008503008

Figure 2008503008
であることを意味する。特に、任意の固定クラスkに対して、R がすべて指数ランダム変数である場合、またはすべて同じ形のパラメータを含むワイブル・ランダム変数である場合には、これらを確率的に比較することができる。また、任意の固定クラスkに対して、S が分布において同じである場合には、結合引数により、R が確率的に比較することができることを証明することができる。
t,n (c,y)がyに関してG (c,y)のn番目のコンボルーションであると定義すると、下式のようになる。
Figure 2008503008
下記の定理は、問題(T)に対する実行可能な解を示す。
定理9.仮定1が成立すると仮定する。
Figure 2008503008
は、問題(T)に対して実行することができる。それ故、テール分布制約を保証する。この場合、
Figure 2008503008
となり、下式のようになる。
Figure 2008503008
また、Σ(c*t)は、問題(T)に対する上限である。
このことは下記のように証明することができる。c*tの割当ての下で(18)が満足するのを証明するにはこれで十分である。最初に、c*tの定義により、各tおよびkに対して下式のようになることを容易に理解することができる。
Figure 2008503008
ここで、Kは、層tのところでサービスを受ける必要がある一組のジョブ・クラスを示す。これは(21)と同じものである。それ故、(18)は仮定1に従う。
4.3.漸近的最適性
この節においては、第4.1節および第4.2節ですでに説明した解の効果について説明する。そのために、下記の簡単にするための仮定を行う。
仮定2.各クラスkおよび各層tに対して下式のようになる。
Figure 2008503008
(25)は近似に過ぎないことに留意されたい。サブ指数的サービス時間を含むM/G/1 PSキューの場合、F がe−√yより重いテールを有している場合には、上記仮定は、大きなyに対して漸近的に真であることが証明されている。この場合、F は、層tのところのクラスkジョブに対する公称サービス要件ランダム変数S に対する分布関数である。それ故、仮定2の下で、下式のようになる。
(c,U)=F ((c−q)U
この式は、公称サービス時間分布の関数として、(20)の下限を示す方法を示す。さらに、F の相補を
Figure 2008503008
であるとした場合、および
Figure 2008503008
の逆関数が下式となることが分かった場合には、下式のようになる。
Figure 2008503008
(20)の下限を下式で表すことができる。
Figure 2008503008
t,n をF のn番目のコンボルーションとして示し、相補
Figure 2008503008
を示す。それ故、上記引数により、(23)の上限を下式のように簡単にすることができる。
Figure 2008503008
ここで、
Figure 2008503008
である。
仮定3.各k、tに対して下式のようにκ<∞およびδ>0が存在する。
Figure 2008503008
および任意のδ>0に対して下式のようになる。
Figure 2008503008
指数分布およびワイブル分布の両方は、仮定3を満足させる。特に、両方の場合に対して下式のようになる。
Figure 2008503008
一方、パレート分布の場合には、仮定3は成立しない。
命題10.仮定3が成立する場合には、下式のようになる。
Figure 2008503008
このことは下記のように証明することができる。仮定3により、任意のδ>0に対して、任意のy≧yに対して下式になるように、y>0が存在する。
Figure 2008503008
および
Figure 2008503008
それ故、任意のy≧yに対して下式のようになる。
Figure 2008503008
ここで
Figure 2008503008
としよう。その場合には、任意の∈<∈に対して、φk,t(∈)≧yとなる。
それ故、下式のようになる。
Figure 2008503008
テール分布関数は単調なものでり、下式で表されるので、
Figure 2008503008
下式のようになる。
Figure 2008503008
それ故、結果は下記のようになる。
命題10が、すべてのkに対してε→0になるにつれて、各tに対してc*t/c →1になることを意味することは容易に理解できる。これにより下記の漸近的結果が生じる。
定理11.仮定(1−3)が成立するなら、(20)および(23)により得る解は、すべてのkに対してε→0になるにつれて、各tに対してc*t=c →1になるという意味で漸近的に最適になる。
実際には、上記定理が成立するには、すべてのkに対してεが0になる必要はない。それどころか、以下に説明するように、最低のεが0になるだけでよい。
推論12.仮定(2−3)が成立し、任意の0≦y≦∞に対して、F (y)≧δになるようなδ>0が存在する場合には、(23)により入手した解は、ε=minεである場合に、ε→0であるという意味で漸近的に最適なものである。
このことは下記のように証明することができる。各層tについて、下記のように定義する。
Figure 2008503008
および
Figure 2008503008
さらに、下式のようになるとしよう。
Figure 2008503008
および
Figure 2008503008
その場合には、下式のようになる。
Figure 2008503008
命題10から、ε→0になる場合に、各tに対して
Figure 2008503008
となり、ε →0となることを証明するのに十分である。κ=max/minであるとしよう。任意のδ>0の場合には、y=maxk,tφ (δ)のように設定し、
Figure 2008503008
である。ここで、最初に、任意の{ε:1≦k≦K}の場合、ε≦∈であれば、ε →δとなることを証明する。k=argminεであるとしよう、その場合、φk0,t(ε)≧φ k0(∈)≧κyとなる。一方、 の定義により、下式のようになる。
Figure 2008503008
それ故、下式のようになる。
Figure 2008503008
この式は、ε ≦δであることを意味する。同様に、
Figure 2008503008
であることを確認することができる。
意見13.パレット分布は、仮定3を満足させないし、漸近的結果は成立しない。しかし、前の節で得られた境界の比率は、εが0になると一定の係数により制約される。
Figure 2008503008
の場合には、21/aにより制約される。この場合、a=mink,t である。
4.4.例:指数的な場合
各層R のところの応答時間が指数的に分布している場合、すなわち
Figure 2008503008
である場合を考察する。この場合には、γ(∈)は、パラメータ(n,1)を含むガンマ・テール分布関数の逆数であることを示し、その場合、φ (∈)=m γ(∈)であり、γt,τ (ε)=m γτ(∈)である。それ故、下式のようになる。
Figure 2008503008
この式は、問題(T)の実行可能な解であり、Σ(c*t)は(T)の最適解の上限である。同様に、目標値Σ(c )を含む解は、
Figure 2008503008
問題(T)の下限を示す。この場合には、下式のようになる。
Figure 2008503008
すなわち、最適性比率は、Tおよびεだけに依存する定数により制約を受ける。そのため下記の定理が得られる。
定理14.応答時間{R ,1≦t≦T}が独立していて、各クラスに対して同じように分布している指数ランダム変数である場合には、(34)および(35)は、それぞれ上限および下限を示す2つの解である。さらに、最適性比率は、Tおよびεだけに依存する定数であるmaxγT(ε)/γ(ε)により制約される。
指数的な場合に対して仮定(1−3)が満たされるので、前の節で入手した漸近的結果が成立する。
推論15.応答時間{R ,1≦t≦T}が独立していて、各クラスに対して同じように分布している指数ランダム変数である場合には、(23)により入手した解は、漸近的に最適である。
5.平均保証およびテール保証
両方の制約(1)および(2)を満足させるために必要な最低容量は、下記の問題を解くことにより入手される。
Figure 2008503008
問題(T)と同様に、テール分布制約が問題を難しくする。第4節で行ったように仮定1が成立するものと仮定してこれらの制約を置換した場合には、下記の問題を解くことにより実行可能な解を入手することができる。
Figure 2008503008
または、下記の問題を解くことにより、最適解の下限を入手することができる。
Figure 2008503008
定理16.仮定1の下では、下記のことが成立する。
(i)(C1)に対する任意の実行可能な解を(C)に対して実行することができる。
(ii)(C)に対する最適解を(C2)に対して実行することができ、(C2)に対する最適解は、(C)に対する解に対する下限を示す。
(iii)仮定(2−3)の下では、(C1)および(C2)xおよびx*に対する最適解は、すべてのkに対してε→0になるにつれて、各tに対して(x=x →1になるという意味で漸近的に最適である。
このことは、上記定理9、8および11から直接証明することができる。
6.数字による結果
この節においては、本発明の近似方法の性能を証明するために数字による結果を使用する。これらの近似解が、最適解とどれくらい似ているか、性能がシステム・パラメータによりどんな影響を受けるかを証明する。また、近似性能に対する平均エンド・ツウ・エンド遅延制約の影響も調査する。最後に、いくつかの実験を通して、第3節で入手した最適解が堅牢なものであることを証明する。
6.1.近似性能
この節全体を通して、各クラスに対する各層内の応答時間は、指数的に分布していて、簡単にするために、すべてのクラスが同じテール分布要件εを有するものと仮定する。最初に、エンド・ツウ・エンド応答時間テール要件だけを含み、平均遅延要件は含んでいないシステムについて考察する。第4節においては、最適な全コストの上限(UB)を入手するための実行可能な解、および最適な全コストの下限(LB)のための解を説明した。図3、図4および図5は、それぞれ、異なるテール分布要件ε、異なる数の層T、および異なる数のクラスKに対してこれら2つの限界がどのように作用するのかを示す。各図面は、最適解に対する上限(UB)の比率(UB比率)、最適解に対する下限(LB)の比率(LB比率)、およびLBに対するUBの比率(最適性比率)を示す3つの曲線からなる。
これらの図面から、最初に、異なるε、TおよびKに対してUB比率が非常に安定していることが分かる。その値はほとんどの場合、約1.2〜1.3である。それ故、第4節で説明した実行可能な解を近似すると、可能な最適解に匹敵する合理的なコストになる。クラスの数が変化しても下限(LB)の性能は非常に安定しているが、層の数が増大したり、テール分布保証の厳しさが低減すると(εが増大すると)、この性能は劣化する。LBに対するUBの比率(最適性比率)は、εまたはTが低減すると低減する傾向を示す。
テール分布制約の他に、平均エンド・ツウ・エンド応答時間制約を適用すると、LBに対するUBの比率が低減し、この比率は平均制約がより厳格になると低減する。
テール分布条件を自動的に満たすように平均制約が極度に厳しくなると、この比率は1に等しくなる。表1〜表6(図6A〜図6F)は、それぞれ、平均制約およびテール制約の両方が行われている場合、ε、TおよびKの異なる値の場合の限界を示す。比較のためにテール分布制約だけの場合の限界も示してある。この場合、テール分布要件Uに対するエンド・ツウ・エンド応答時間の閾値は、平均エンド・ツウ・エンド応答時間の閾値
Figure 2008503008
の2倍に設定される。いくつかの例の場合、平均制約を追加すると、下限が非常に有意に増大することが分かる。しかし、εが小さい場合には、すべての平均エンド・ツウ・エンド応答時間の制約が自動的に満たされ、問題はテール制約だけを含むものになる。この場合、上限および下限の両方は、平均エンド・ツウ・エンド応答時間の制約の追加により影響を受けない。
6.2.堅牢さ
1つの実際的な関心事は、平均サービス時間要件m は、通常、ある種の測定および予測機構から入手されることである。誤差は、測定および予測にはつきものである。それ故、全容量を最小限度に低減するばかりでなく、予測したパラメータから入力パラメータが若干ズレた場合でも、大部分のエンド・ツウ・エンド応答時間制約が依然として満たされるような方法で容量の割当てを行うことが望ましい。すなわち、この解は、データが不確かな場合でも堅牢でなければならない。分かり易くするために、平均エンド・ツウ・エンド応答時間の制約だけを考慮した場合の堅牢さの結果だけを示す。
第3節においては、サービス時間要件がある不確かさを有していて、ボトルネック・クラスの数がTより小さい場合に、これらのボトルネックでないクラスに対する制約が、ボトルネック・クラスより違反する可能性が少ないことについて注目する。それ故、層の数が少ない場合には、(M)問題の最適解は非常に堅牢であると予想する。数字の例によりこのことを証明するために、
Figure 2008503008
は以降wハットtkと記載する
は、[w (1−Δ),w (1+Δ)]内で均一に分布していると見なす。この場合、Δは、w についての予測の不確実性がどの程度のものであるかを測定する。表4および表5は、K、TおよびΔが異なる場合で、本当の入力パラメータが(wハットtk)であるが、容量を予測したパラメータ(w )を含む問題(M)の最適解に基づいて割り当てた場合の制約違反の平均(100のサンプルについて)数を示す。この場合、各層内の公称サーバ使用の予測qは正確なものであると仮定する。この解の堅牢さは非常に満足すべきものである。何故なら、表4および表5内のすべての値が小さいからである。このことは、容量を割り当てるために(M)の解を使用した場合には、パラメータが予測したものより25%ズレた場合でも、非常に少ないクラスしかその平均エンド・ツウ・エンド遅延閾値を超えないことを意味する。
各行および/または列に沿って表の値をチェックすると、制約違反の平均数がΔ、TおよびKによりどのような影響を受けるかが分かる。不確実性のレベルΔまたは層の数Tが増大すると、若干より多くのクラスが予測しなかった長いエンド・ツウ・エンド遅延を起こす。しかし、システムのクラスの全数Kは、その平均応答時間制約が違反を起こしたクラスの数に大きな影響を与えない。
表6は、入力パラメータが(w )および(wハットtk)である場合の問題の最適目標値の相対的な違いを示す。表6は、パラメータ(w )または(wハットtk)に基づいて立案した場合、全コストが大きく変化しないことを示す。
7.非ゼロsの数に基づくケースの説明
ここで、相補緩み制約(12)内の非ゼロsの数に依存する可能なケースについて説明する。明らかに、sすべてがゼロであるわけではない。
1つの非ゼロs
非ゼロsが正確に1つである場合には、s≠0およびs=...=s=0であると仮定する。この場合、(11)から下式が得られる。
Figure 2008503008
相補緩み制約(12)は下式のようになる。
Figure 2008503008
この場合、下式のように設定する必要がある。
Figure 2008503008
ライトアローxに対する解は下式のようになる。
Figure 2008503008
また、目標値は下式のようになる。
Figure 2008503008
もとの問題が1つの制約しか有していない場合には、上式は最適解を示す。もとの問題の制約が2つ以上である場合には、実行可能性の制約をチェックする必要がある。解ライトアローxが実行可能性の制約(8)を満足させる場合には、その解は最適解である。実行可能性の制約(8)を保証するためには、下式を満足させなければならない。
Figure 2008503008
この式は下式と同じものである。
Figure 2008503008
非ゼロsがT個である場合:
非ゼロsの数が正確にT個であると仮定する。このことは、クラスの数Kが層の数Tより大きいかまたは等しいこと(K≧T)を意味する。skj≠0(j=1,...,T)であると仮定しよう。さらに、対応するベクトル
Figure 2008503008
が直線的に独立していると仮定しよう。このことは一組の式
Figure 2008503008
に対して一意の解ライトアローxが存在することを意味する。ベクトル
Figure 2008503008
を通過する一意の超平面は、ライトアローx・ライトアローx=1で表すことができる。このことは式にxとしてj=1,...,Tに対して
Figure 2008503008
を挿入することにより容易にチェックすることができる。この超平面とt軸との交点が1/x である。この交点は超平面の式にx=0(j=1,...,T,j≠t)を割り当てることにより入手できる。すべての軸との交点の合計が正確に目的関数であることが分かる。
次に、任意の実行可能なライトアローxに対する拘束制約に対応するベクトルライトアローwは、同じファセット上に位置しなければならないことを証明する。このことは矛盾により証明することができる。
,...,xを入手し、ライトアローx≧0であることを確認した後で、相補緩み制約(12)に基づいてK−Tsをゼロに設定しなければならない。残りのTsは、最適性条件(11)から入手することができる。すべてのs,..., sが負でない場合には、解x,..., xおよびs,..., sが最適解である。
8.例示としての設計システムおよび方法
上記の原理に基づいて、最適化問題(M1)を解くための下記の例示としてのアルゴリズムが得られる。
アルゴリズムI:
ステップ1:
Figure 2008503008
であるとしよう。
ステップ2:すべてのk=1,...,Kに対して
Figure 2008503008
であるならば、停止する。最適解
Figure 2008503008
を戻す。
そうでない場合には、
Figure 2008503008
として、ステップ3へ行く。
ステップ3:下式を解く。
Figure 2008503008
また、
Figure 2008503008
と設定する。この場合、sは、(43)の解である。
それ故、上記本発明の原理の詳細な説明により、そのような方法を実施するための例示としての方法および設計システムについて以下に説明する。しかし、本発明はこのような説明に限定されないことを理解されたい。
ここで図7を参照すると、この図は、上記本発明の例示としての原理による平均分布保証およびテール分布保証両方に対する下限を決定するためのプロセスを示す流れ図である。
図に示すように、プロセス700は下記のような動作を行う。
ステップ710において、入力パラメータを入手する。各クラスk、分布関数F 、および層tのところの公称サービス時間の平均mに対して、エンド・ツウ・エンド遅延サービス要件(V,U,ε)を入手する。各層tに対して、公称トラフィック量qおよび容量コスト関数f(c)を入手する。
ステップ720において、各k、tに対して、プロセスがφ =min{y:F (y)≧1−ε}を計算する。
ステップ730において、プロセスはg(x)=f(q+1/x)を定義し、下式を解く。
Figure 2008503008
上記問題は、(M1)のフォーマットに変換することができ、次にアルゴリズムIにより解くことができることに留意されたい。
最後に、ステップ740において、ステップ730における上記問題の最適目標値が容量割当て問題の下限を示す。
ここで図8を参照すると、この図は、上記本発明の例示としての原理による平均分布保証およびテール分布保証の両方に対する上限を決定するためのプロセスを示す流れ図である。
図に示すように、プロセス800は下記のような動作を行う。
ステップ810において、入力パラメータを入手する。各クラスk、分布関数F 、層tのところの公称サービス時間の平均mに対して、エンド・ツウ・エンド遅延サービス要件(V,U,ε)を入手する。各層tに対して、公称トラフィック量qおよび容量コスト関数f(c)を入手する。
ステップ820において、各k、tに対して、プロセスがFt,T 、すなわちF のT番目のコンボルーションを入手する。
ステップ830において、各k、tに対して、プロセスがφ =min{y:F (y)≧1−ε}を計算する。
ステップ840において、プロセスが、g(x)=f(q+1/x)を定義し、下式を解く。
Figure 2008503008
この場合も、上記問題を(M1)のフォーマットに変換することができ、次にアルゴリズムIにより解くことができる。
最後に、ステップ850において、ステップ840における上記問題の最適目標値が、容量割当て問題への上限を示す。解xの場合には、1/x+qが層tに対する実行可能な容量割当てである。
ここで図9を参照すると、この図は、本発明のある実施形態による容量割当てを計算するための設計システムを示すブロック図である。通常、設計システム900は、例えば、図7のステップ710および図8のステップ810に示すように、入力として容量割当て入力パラメータを受信する。次に、本明細書に記載する1つまたは複数の容量割当て方法(例えば、アルゴリズムIにより定式化した図7のプロセス700および図8のプロセス800)が、容量割当て結果(すなわち、コストを最小限度まで低減し、エンド・ツウ・エンド性能を保証するために、入力シナリオによる容量の割当て方法)を計算するために使用される。
設計システム900は、スタンドアローンの計算システムであってもよいし、結果を計算するネットワークの1つまたは複数のコンポーネントと動作できるように接続することもできる。設計システム900が計算した結果は、自動的に実施することもできるし、および/または効率的に設計されたネットワークを実現するために手動により実施することもできる。
ここで図10を参照すると、この図は、本発明のある実施形態による容量割当てを計算するための設計システムを実行するのに適しているコンピュータ・システムの一般的なハードウェア・アーキテクチャを示すブロック図である。より詳細に説明すると、図9の設計システム900は、本発明の方法を実行するためにこのようなコンピューティング・システム1000を実施することができることを理解されたい。また、1つまたは複数のシステム・コンポーネント(例えば、設計中のネットワーク内の)は、このようなコンピューティング・システム1000を実施することができる。もちろん、本発明が特定のコンピューティング・システムの実施態様に限定されないことを理解されたい。
この例示としての実施態様の場合には、本発明の方法の少なくとも一部を実施するためのプロセッサ1010は、バス1050または代わりの接続装置を介してメモリ1020、入出力(I/O)装置1030、およびネットワーク・インタフェース1040と動作できるように結合している。
本明細書で使用する場合、「プロセッサ」という用語は、例えば、中央処理ユニット(CPU)および/または他の処理回路(例えば、デジタル信号プロセッサ(DSP)、マイクロプロセッサ等)を含むデバイスのような任意の処理デバイスを含むことを理解されたい。さらに、「プロセッサ」という用語は、2つ以上の処理デバイスを指すことができること、および処理デバイスに関連する種々の素子を他の処理デバイスと共有することができることを理解されたい。
本明細書で使用する場合、「メモリ」という用語は、メモリ、および例えば、ランダム・アクセス・メモリ(RAM)、読出し専用メモリ(ROM)、固定記憶媒体(例えば、ハード・ドライブ)、取外し可能な記憶媒体(例えば、ディスケット)、フラッシュ・メモリ等のようなプロセッサまたはCPUに関連する他のコンピュータ読み取り可能媒体を含む。
さらに、本明細書で使用する場合、「I/O装置」という用語は、処理ユニットにデータを入力するための1つまたは複数の入力装置(例えば、キーボード、マウス等)、および処理ユニットに関連する結果を提供するための1つまたは複数の出力装置(例えば、CRTディスプレイ等)を含む。このような入力装置は、設計結果を生成するために、ユーザが本発明の設計システムが使用する設計入力を供給するための1つの機構であってもよいことを理解されたい。別の方法としては、設計入力は、ディスケットから、またはコンピュータ・バス1050に接続しているある他のソース(例えば、他のコンピュータ・システム)から設計システム内に読み込むことができる。また、設計方法への入力も、1つまたは複数の入力装置により入手することができる。出力装置は、設計方法の結果を提示するユーザまたは他のコンピュータ・システムのための1つの機構であってもよい。
さらに、本明細書で使用する場合、「ネットワーク・インタフェース」という用語は、例えば、コンピューティング・システム1000が他のコンピュータ・システムと通信することができるようにすることができる1つまたは複数のデバイスを含む。それ故、ネットワーク・インタフェースは、適当な通信プロトコルにより他のコンピュータ・システムのトランシーバと通信するように構成されているトランシーバを備えることができる。本発明は任意の特定の通信プロトコルに限定されないことを理解されたい。
設計システムにより本発明を説明してきたが、本発明の方法は、コンピュータ読み取り可能媒体の形で分散することができ、分散のために実際に使用する信号を送る媒体の特定のタイプが何であれ、本発明を実施することができ、その利点を実現することができることを理解されたい。本明細書で使用する場合、「コンピュータ読み取り可能媒体」という用語は、例えば、フレキシブル・ディスク、ハード・ディスク・ドライブ、RAM、コンパクト・ディスク(CD)ROM等のような記録することができるタイプの媒体、デジタルまたはアナログ通信リンク、例えば、無線周波および光伝送等のような伝送形態を使用する有線または無線通信リンクのような送信タイプの媒体を含む。コンピュータ読み取り可能媒体は、特定のデータ処理システムで使用するために復号される符号化したフォーマットの形をとることができる。
それ故、本明細書に記載するように、本発明の方法を実行するための命令またはコードを含む、1つまたは複数のコンピュータ・プログラムまたはそのソフトウェア・コンポーネントは、1つまたは複数の関連する記憶媒体(例えば、ROM、固定または取外し可能な記憶装置)に格納することができ、使用できるようになった場合に、(例えば、RAM内に)全部または一部をロードすることができ、プロセッサ1010により実行することができる。
いずれの場合でも、本明細書に記載し、添付の図面に示す本発明の技術は、例えば、関連するメモリ、特定実装向け集積回路、機能回路等を含む1つまたは複数の動作できるようにプログラムされた汎用デジタル・コンピュータのような種々の形のハードウェア、ソフトウェアまたはその組合せで実施することができることを理解されたい。本明細書に記載する本発明の技術を使用すれば、通常の当業者であれば本発明の技術の他の実施態様を思い付くことができるだろう。
本明細書に説明するように、本発明は、エンド・ツウ・エンド性能保証を行う多層環境でリソース割当て問題の有利な解決方法を提供する。より詳細に説明すると、本発明は、各クラスの要求に対してエンド・ツウ・エンド応答時間の平均分布およびテール分布の両方上でサービス保証を行う。この問題を、容量割当てベクトルの凸状の分離可能な関数を最小化するために、非線形プログラムとして説明のために定式化した。最適解に対する構造上の特性および最適性条件を証明した。また、問題の重要な部分を説明するために幾何学的解釈も行った。
さらに、すでに説明したように、エンド・ツウ・エンド応答時間のテール確率のための要件を含む問題は難しい問題である。適当な仮定の下で、解のための一定の要因を挙げ、また、それが漸近的に最適なものであることを証明した。これらの仮定は非常に一般的なもので、共通の問題を集めることにより容易に満たされる。数字による結果は、さらに、本発明の方法の有利な性能を証明した。
都合のよいことに、本発明は多層アーキテクチャを解決する。本発明は、また、エンド・ツウ・エンド応答時間の平均分布およびテール分布の両方の制約を解決する。さらに、本発明の解は、ほぼ最適解であり、効率的に入手することができる。本発明の解は堅牢なものである。本発明の解は、サービス要件が不確実な場合でも使用することができる。さらに、本発明の解は、変化する環境に適応するようにオンラインで容易に入手することができる。
添付の図面を参照しながら本発明の例示としての実施形態について説明してきたが、本発明は、これらの実施形態そのものに限定されないこと、当業者であれば本発明の範囲または精神から逸脱することなしに、種々の他の変更および修正を行うことができることを理解されたい。
本発明の例示としての原理を実施することができるフィードフォワード多層システムを示すブロック図である。 本発明のある実施形態によるある問題の幾何学的解釈をグラフにより示す図面である。 本発明のある実施形態によるテール分布要件の関数としての近似性能をグラフで示す図面である。 本発明のある実施形態による層の数の関数としての近似性能をグラフで示す図面である。 本発明のある実施形態によるクラスの数の関数としての近似性能をグラフで示す図面である。 本発明のある実施形態による平均制約およびテール制約の両方が存在する場合の異なる値の下の境界を表で示す図面である。 本発明のある実施形態による平均制約およびテール制約の両方が存在する場合の異なる値の下の境界を表で示す図面である。 本発明のある実施形態による平均制約およびテール制約の両方が存在する場合の異なる値の下の境界を表で示す図面である。 本発明のある実施形態による平均制約およびテール制約の両方が存在する場合の異なる値の下の境界を表で示す図面である。 本発明のある実施形態による平均制約およびテール制約の両方が存在する場合の異なる値の下の境界を表で示す図面である。 本発明のある実施形態による平均制約およびテール制約の両方が存在する場合の異なる値の下の境界を表で示す図面である。 本発明の例示としての原理による平均分布保証およびテール分布保証の両方のための下限を決定するためのプロセスを示す流れ図である。 本発明の例示としての原理による平均分布保証およびテール分布保証の両方のための上限を決定するためのプロセスを示す流れ図である。 本発明のある実施形態による容量割当てを計算するための設計システムを示すブロック図である。 本発明のある実施形態による容量割当てを計算するための設計システムを実施するのに適しているコンピュータ・システムの一般的なハードウェア・アーキテクチャを示すブロック図である。

Claims (23)

  1. その各層が1つまたは複数のコンピューティング装置を有する多層コンピューティング・システムの容量割当てを設計するための方法であって、
    容量割当てに関連する入力パラメータを入手するステップと、
    前記入力パラメータの少なくとも一部に基づいて容量割当てを計算するステップであって、前記容量割当てを1つまたは複数のエンド・ツウ・エンド性能測定値が複数のサービス・クラスを実質的に満足させるように計算することができるステップとを含む方法。
  2. 前記容量割当てを計算する前記ステップが、コスト関数を実質的に最小化するステップをさらに含む、請求項1に記載の方法。
  3. 前記容量割当てを計算する前記ステップが、前記複数のサービス・クラスのための1つまたは複数の平均遅延保証を実質的に満足させるステップをさらに含む、請求項1に記載の方法。
  4. 前記容量割当てを計算する前記ステップが、前記複数のサービス・クラスのための1つまたは複数のテール分布保証を実質的に満足させるステップをさらに含む、請求項1に記載の方法。
  5. 前記容量割当てを計算する前記ステップが、前記複数のサービス・クラスのための1つまたは複数の平均遅延保証および1つまたは複数のテール分布保証を実質的に満足させるステップをさらに含む、請求項1に記載の方法。
  6. 前記容量割当てを計算する前記ステップが、前記複数のサービス・クラスのための前記1つまたは複数の平均遅延保証および前記1つまたは複数のテール分布保証を実質的に満足させるために、容量割当て問題を最適化問題として定式化するステップをさらに含む、請求項5に記載の方法。
  7. 前記容量割当てを計算する前記ステップが、前記最適化問題を線形制約を含む分離可能な凸状計画問題として定式化するステップをさらに含む、請求項6に記載の方法。
  8. 前記容量割当てを計算する前記ステップが、前記計画問題に対する実行可能な解を表す凸包の境界上で最適解を発見することにより、前記分離可能な凸状計画問題を解くステップをさらに含む、請求項7に記載の方法。
  9. 前記求解ステップが、多項式時間内で前記分離可能な凸状計画問題を解くステップをさらに含む、請求項8に記載の方法。
  10. その各層が1つまたは複数のコンピューティング装置を有する多層コンピューティング・システムのための容量割当てを設計する装置であって、
    メモリと、
    前記メモリと結合していて、(i)容量割当てに関連する入力パラメータを入手し、(ii)前記入力パラメータの少なくとも一部に基づいて容量割当てを計算するために動作する少なくとも1つのプロセッサであって、前記容量割当てを1つまたは複数のエンド・ツウ・エンド性能測定値が複数のサービス・クラスを実質的に満足させるように計算することができるプロセッサとを備える装置。
  11. 前記容量割当てを計算する前記動作が、コスト関数を実質的に最小化するステップをさらに含む、請求項10に記載の装置。
  12. 前記容量割当てを計算する前記動作が、前記複数のサービス・クラスのための1つまたは複数の平均遅延保証を実質的に満足させるステップをさらに含む、請求項10に記載の装置。
  13. 前記容量割当てを計算する前記動作が、前記複数のサービス・クラスのための1つまたは複数のテール分布保証を実質的に満足させるステップをさらに含む、請求項10に記載の装置。
  14. 前記容量割当てを計算する前記動作が、前記複数のサービス・クラスのための1つまたは複数の平均遅延保証および1つまたは複数のテール分布保証を実質的に満足させるステップをさらに含む、請求項10に記載の装置。
  15. 前記容量割当てを計算する前記動作が、前記複数のサービス・クラスのための前記1つまたは複数の平均遅延保証および前記1つまたは複数のテール分布保証を実質的に満足させるために、容量割当て問題を最適化問題として定式化するステップをさらに含む、請求項14に記載の装置。
  16. 前記容量割当てを計算する前記動作が、前記最適化問題を線形制約を含む分離可能な凸状計画問題として定式化するステップをさらに含む、請求項15に記載の装置。
  17. 前記容量割当てを計算する前記動作が、前記計画問題に対する実行可能な解を表す凸包の境界上で最適解を発見することにより、前記分離可能な凸状計画問題を解くステップをさらに含む、請求項16に記載の装置。
  18. 前記求解動作が、多項式時間内で前記分離可能な凸状計画問題を解くステップをさらに含む、請求項17に記載の装置。
  19. その各層が1つまたは複数のコンピューティング装置を有する多層コンピューティング・システムの容量割当てを設計するための製造のための物品であって、前記製造のための物品が、実行した場合に、
    容量割当てに関連する入力パラメータを入手するステップと、
    前記入力パラメータの少なくとも一部に基づいて容量割当てを計算するステップであって、前記容量割当てを1つまたは複数のエンド・ツウ・エンド性能測定値が複数のサービス・クラスを実質的に満足させるように計算することができるステップと
    を実施する1つまたは複数のプログラムを含む機械読み取り可能媒体を有する物品。
  20. 前記容量割当てを計算する前記ステップが、コスト関数を実質的に最小化するステップをさらに含む、請求項19に記載の物品。
  21. 前記容量割当てを計算する前記ステップが、前記複数のサービス・クラスのための1つまたは複数の平均遅延保証を実質的に満足させるステップをさらに含む、請求項19に記載の物品。
  22. 前記容量割当てを計算する前記ステップが、前記複数のサービス・クラスのための1つまたは複数のテール分布保証を実質的に満足させるステップをさらに含む、請求項19に記載の物品。
  23. 前記容量割当てを計算する前記ステップが、前記複数のサービス・クラスのための1つまたは複数の平均遅延保証および1つまたは複数のテール分布保証を実質的に満足させるステップをさらに含む、請求項19に記載の物品。
JP2007527185A 2004-06-10 2004-11-18 エンド・ツウ・エンド遅延保証を含む多層インフラストラクチャのコストを最小限度まで低減するための方法および装置 Pending JP2008503008A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/865,064 US7626917B2 (en) 2004-06-10 2004-06-10 Methods and apparatus for cost minimization of multi-tiered infrastructure with end-to-end delay guarantees
PCT/US2004/038890 WO2006001820A1 (en) 2004-06-10 2004-11-18 Methods and apparatus for cost minimization of multi-tiered infrastructure with end-to-end delay guarantees

Publications (1)

Publication Number Publication Date
JP2008503008A true JP2008503008A (ja) 2008-01-31

Family

ID=34959540

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007527185A Pending JP2008503008A (ja) 2004-06-10 2004-11-18 エンド・ツウ・エンド遅延保証を含む多層インフラストラクチャのコストを最小限度まで低減するための方法および装置

Country Status (6)

Country Link
US (1) US7626917B2 (ja)
JP (1) JP2008503008A (ja)
KR (1) KR100925137B1 (ja)
CN (1) CN1938684A (ja)
TW (1) TWI353135B (ja)
WO (1) WO2006001820A1 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7594016B1 (en) * 2003-11-12 2009-09-22 Hewlett-Packard Development Company, L.P. Calculating numbers of servers for tiers of a multi-tiered system
US20070294072A1 (en) * 2006-06-16 2007-12-20 Ming-Shiahn Tsai Testing model
JP4752767B2 (ja) * 2007-01-12 2011-08-17 日本電気株式会社 システム構成候補導出装置、方法およびプログラム
US20080255936A1 (en) * 2007-04-13 2008-10-16 Yahoo! Inc. System and method for balancing goal guarantees and optimization of revenue in advertisement delivery under uneven, volatile traffic conditions
JP5418289B2 (ja) 2010-02-23 2014-02-19 富士通株式会社 経路決定装置,経路決定方法及び経路決定プログラム
JP5716587B2 (ja) 2011-07-19 2015-05-13 富士通株式会社 経路決定装置,経路決定方法,管理プログラム及び管理装置
US9697028B1 (en) 2013-12-13 2017-07-04 Amazon Technologies, Inc. Directed placement for request instances
CN113378481B (zh) * 2021-07-06 2024-02-06 国网江苏省电力有限公司营销服务中心 基于多目标进化算法的互联网数据中心需求响应优化方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4256925A (en) * 1978-12-12 1981-03-17 Satellite Business Systems Capacity reallocation method and apparatus for a TDMA satellite communication network with demand assignment of channels
EP0364090A3 (en) * 1988-08-26 1990-11-14 AT&T Corp. Method and apparatus for efficient resource allocation
US6144639A (en) * 1996-09-03 2000-11-07 Sbc Technology Resources, Inc. Apparatus and method for congestion control in high speed networks

Also Published As

Publication number Publication date
KR100925137B1 (ko) 2009-11-05
US7626917B2 (en) 2009-12-01
TW200610315A (en) 2006-03-16
TWI353135B (en) 2011-11-21
US20050278690A1 (en) 2005-12-15
WO2006001820A1 (en) 2006-01-05
CN1938684A (zh) 2007-03-28
KR20070035489A (ko) 2007-03-30

Similar Documents

Publication Publication Date Title
Quang et al. A deep reinforcement learning approach for VNF forwarding graph embedding
RU2688270C2 (ru) Вычисление долгосрочных расписаний для передач данных по глобальной вычислительной сети
Guhlich et al. Revenue management approach to due date quoting and scheduling in an assemble-to-order production system
Guo et al. Dynamic performance optimization for cloud computing using M/M/m queueing system
US20080162232A1 (en) Method and apparatus for business process analysis and optimization
US9400697B2 (en) Multi-dimensional computing and communication resource allocation using bin-packing with per-branch combination tries
Johari et al. Matching while learning
Mostafavi et al. A stochastic approximation approach for foresighted task scheduling in cloud computing
CN116782298A (zh) 一种在云边系统中实现资源抢占式卸载方法
JP2008503008A (ja) エンド・ツウ・エンド遅延保証を含む多層インフラストラクチャのコストを最小限度まで低減するための方法および装置
Cao et al. A deep reinforcement learning approach to multi-component job scheduling in edge computing
CN117692503A (zh) 动态微服务图部署和概率请求路由的联合优化方法及系统
CN114020469A (zh) 基于边缘节点的多任务学习方法、装置、介质与设备
CN117978725A (zh) 基于图神经网络的算力网络工作流调度方法及装置
Hu et al. Dynamic cloud manufacturing service composition with re-entrant services: an online policy perspective
Yang et al. Optimal resource allocation for time-reservation systems
Lin et al. Optimal capacity allocation for web systems with end-to-end delay guarantees
Radha et al. Allocation of resources and scheduling in cloud computing with cloud migration
Bessai et al. Business process scheduling strategies in cloud environments with fairness metrics
Zhong et al. Dynamic inventory pooling policies to deliver differentiated service
Deniziak et al. Synthesis of real time distributed applications for cloud computing
Sivasamy et al. Modelling of a cloud platform via M/M1+ M2/1 queues of a Jackson network
Nia et al. A coordinated heuristic approach for virtual network embedding in cloud infrastructure
Carvalho et al. A Semi-Markov Decision Model-based brokering mechanism for mobile cloud market
Sun Scheduling Problems in Next Generation Computing Networks

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20071030

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100727

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101027

RD12 Notification of acceptance of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7432

Effective date: 20101027

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20101029

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101214

RD14 Notification of resignation of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7434

Effective date: 20101220

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110628