JP6161312B2 - データセンタにおけるQoS認識バランシング - Google Patents
データセンタにおけるQoS認識バランシング Download PDFInfo
- Publication number
- JP6161312B2 JP6161312B2 JP2013023964A JP2013023964A JP6161312B2 JP 6161312 B2 JP6161312 B2 JP 6161312B2 JP 2013023964 A JP2013023964 A JP 2013023964A JP 2013023964 A JP2013023964 A JP 2013023964A JP 6161312 B2 JP6161312 B2 JP 6161312B2
- Authority
- JP
- Japan
- Prior art keywords
- qos
- job
- jobs
- resource
- balance point
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L47/00—Traffic control in data switching networks
- H04L47/70—Admission control; Resource allocation
- H04L47/76—Admission control; Resource allocation using dynamic resource allocation, e.g. in-call renegotiation requested by the user or requested by the network in response to changing network conditions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/48—Program initiating; Program switching, e.g. by interrupt
- G06F9/4806—Task transfer initiation or dispatching
- G06F9/4843—Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
- G06F9/4881—Scheduling strategies for dispatcher, e.g. round robin, multi-level priority queues
- G06F9/4893—Scheduling strategies for dispatcher, e.g. round robin, multi-level priority queues taking into account power or heat criteria
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5083—Techniques for rebalancing the load in a distributed system
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L47/00—Traffic control in data switching networks
- H04L47/70—Admission control; Resource allocation
- H04L47/83—Admission control; Resource allocation based on usage prediction
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Description
オペレーションの負荷配置にはいくつかの重要な考慮する点がある。例えば、良好に統合するジョブのグループ、即ち、物理資源をより有効に活用することができるジョブのグループを検出するために、ジョブの負荷パターンが相補的であるか、いくつかのジョブをグルーピングすることがリスクを削減するか、およびジョブのグループがQoS要件の混合を含むかについて考える必要がある。これらの考慮する点の各々は、ジョブのグループが特定の物理資源上で一緒に実行する時の振舞い方の判断にかなり影響を与える。さらに、実際の状況において、関連する特定のジョブによっては、これらの考慮する点の1つ以上を優先することもある。
図1は資源の関数として確率密度関数(PDF)と例示的なジョブに対して予約された資源とを示す図である。図1によれば、予約された資源rtが分布曲線の残存テールにおける累積確率が許容される不足の確率を下回るほど大きいことが分かる。監視の際、rtがジョブに対して行われた実際の予約に必ずしも一致しないことに留意されない。多くの場合、実際の予約は手動で設定され、この予約は仮想化の前にジョブが一度有していた物理資源に一致することもある。仮想化の前にも不足のリスクはあったが、通常、QoSを真剣に考慮しなくても、これらの予約は、等式(2)で計算されるように、rtのQoSのパフォーマンスを満たす場合もあれば満たさない場合もある。但し、監視ツールは、rtが導出される前にxtを最初に測定してモデリングする必要がある。
次いで、ジョブ1,2,...,kは予約r(1),r(2),...,r(k−1),s(k)を得ることができ、残存ジョブは全く予約されない。予約なしではあるが、残存ジョブは、最初のk個のジョブの未使用の予約を利用することにより、それらのQoS要件を問題なく満たすことができる。等式(6)に示したように、統計パッキングに対する全体予約は、等式(4)に示された全体予約から有効に削減されることは明らかである。統計パッキングアルゴリズムに可能ないくつかのばらつきがあることが理解されよう。例えば、Daniel H.Greene、Maurice Chu、Haitham Hindi、Bryan T.Preas、Nitin Parekhによる「Statistical Packing of Resource Requirements in Data Centers」と題された米国特許出願公開2010/0100877A1と、Daniel H.Greene、Lara Crawford、Maurice Chu、John Handley「Long Term Resource Provisioning with Cascading Allocations」と題された本出願と同時出願されている米国特許出願を参照されたい。特に、等式(5)におけるようにジョブは必ずしも独立している必要はなく、むしろ、相関関係にあるジョブの結合した分布を学習することができる。この特許のバランシング技術は多種多様な統計パッキング方法のいずれかに基づいて行うことができる。
前のセクションで説明した統計パッキングアルゴリズムは、ジョブのグルーピングを候補にあげ、どのグループが最良の統合を有しているかを判定し、物理資源間のジョブの移行が統合に有効に作用するロケーションを判断するように適用することができる。つまり、ジョブをパッキングしかつ予約された全体資源を判定するためにグループ統合がいかにうまく作用するかの簡単な測定が提供されている。良いパッキングとは、少ない資源の予約を行うと同時にグループのQoS要件も満たすことである。
しかしながら、これらのジョブの結合された資源ニーズは通常平均値μ(1)+μ(2と標準偏差値√(σ(1))2+(σ(2))2を用いて分布される。
よって、適切な結合予約は、
結合された標準偏差値は、個別の標準偏差値では直線形に成長しないので、必要とされる予約、r(T)<r(1)+r(2)において削減されることに注意されたい。独立したジョブの結合によって保険会社が複数の独立したリスクをプールすることによってリスク削減を達成するのに非常に似たリスク削減を得ることができる。例えば、n個のジョブを同じσと結合することによって結合予約のσ項において1/√nの削減が得られる(不確実性による部分)。そこで、大まかにいえば、同じ物理資源へ独立したジョブを結合することによって1/√nの削減を得ることができる。
図5は、本発明の一実施形態による、データセンタ内のマシン間でジョブを配置するための例示的なコンピュータシステムを示している。一実施形態において、コンピュータおよび通信システム500は、プロセッサ502、メモリ504、および記憶装置506を含む。記憶装置506はジョブ配置アプリケーション508のみならずアプリケーション510、512などの他のアプリケーションを記憶する。動作中、ジョブ配置アプリケーション508は記憶装置506からメモリ504へロードされ、次いで、プロセッサ502によって実行される。プログラムを実行している間、プロセッサ502は前述した機能を実行する。コンピュータおよび通信システム500は、任意選択のディスプレイ514、キーボード516、およびポインティングデバイス518に連結される。
Claims (10)
- 2つの物理資源間の負荷をバランシングするためのコンピュータ実行可能な方法であって、
物理資源ごとに、
前記物理資源を共有する複数のジョブに対して資源使用モデルを確立するステップと、
前記ジョブに関連付けられたサービス品質(QoS)格付けを識別するステップと、
前記資源使用モデルと前記QoS格付けに基づいて前記物理資源に対するQoSバランスポイントを計算するステップであって、前記QoSバランスポイントは、それを上回ると実質的な資源のプロビジョニングが必要とされる、QoSの格付けを表している、ステップと、
第1の物理資源に関連付けられた第1のQoSバランスポイントと第2の物理資源に関連付けられた第2のQoSバランスポイントとの差を検出することに応答して、前記第1と前記第2のQoSバランスポイントの差が削減されるように前記第1と前記第2の物理資源間で移動される1つ以上のジョブを識別するステップと、
を含む、方法。 - コンピュータによって実行されると、前記コンピュータに2つの物理資源間の負荷をバランシングするための方法を実行させる命令を記憶するコンピュータ読出可能記憶媒体であって、
前記方法は、
物理資源ごとに、
前記物理資源を共有する複数のジョブに対して資源使用モデルを確立するステップと、
前記ジョブに関連付けられたサービス品質(QoS)格付けを識別するステップと、
前記資源使用モデルと前記QoS格付けに基づいて前記物理資源に対するQoSバランスポイントを計算するステップであって、前記QoSバランスポイントは、それを上回ると実質的な資源のプロビジョニングが必要とされる、QoSの格付けを表している、ステップと、
第1の物理資源に関連付けられた第1のQoSバランスポイントと第2の物理資源に関連付けられた第2のQoSバランスポイントとの差を検出することに応答して、前記第1と前記第2のQoSバランスポイントの差が削減されるように前記第1と前記第2の物理資源間で移動される1つ以上のジョブを識別するステップと、
を含む、
ことよりなるコンピュータ読出可能記憶媒体。 - 2つの物理資源間で負荷をバランシングするための計算システムであって、
前記2つの物理資源上で実行されるジョブごとに資源使用モデルを構築するように構成されている資源使用モデル構築手段と、
前記ジョブに関連付けられたQoS格付けを識別するように構成されているサービス品質(QoS)識別手段と、
資源使用モデルと前記物理資源上で実行しているジョブに関連付けられたQoS格付けに基づいて物理資源ごとにQoSバランスポイントを計算するように構成されているQoSバランスポイント計算手段であって、前記QoSバランスポイントが、それを上回ると実質的な資源のプロビジョニングが必要とされる、QoSの格付けを表しているQoSバランスポイント計算手段と、
第1の物理資源に関連付けられた第1のQoSバランスポイントと第2の物理資源に関連付けられた第2のQoSバランスポイントとの差を検出することに応答して、前記第1と前記第2のQoSバランスポイントの差が削減されるように前記第1と前記第2の物理資源間で移動される1つ以上のジョブを識別するように構成されているジョブ移行識別手段と、
を含む計算システム。 - 前記2つの物理資源に対する前記QoSバランスポイントを管理者へ提示し、
前記管理者から、前記第1と前記第2の物理資源の間で移動する前記1つ以上のジョブを識別する入力を受信する、
ように構成されているユーザインターフェースを更に含む、請求項3に記載のシステム。 - 移動される1つ以上のジョブを識別している間、前記ジョブ移行識別手段がQoSバランスを改良することができる移動の限界便益を計算するように更に構成されており、前記システムが前記計算に基づいてジョブを選択して移動を終了するように構成されているジョブ移行メカニズムを更に含む、請求項3に記載のシステム。
- 前記1つ以上のジョブの移動によって影響されるリスクの相関関係を計算するように構成されているリスク相関計算手段と、
前記リスクの相関関係が所定のしきい値を下回ることに応答して、前記識別された1つ以上のジョブの移動を終了するように構成されているジョブ移行コントローラと、
を更に含む請求項3に記載のシステム。 - 前記資源使用モデルは時変性であり、前記資源使用モデル構築手段は前記ジョブに関連付けられた資源使用履歴に基づいて前記時変性の資源使用モデルを構築する、請求項3に記載のシステム。
- 2つのジョブ間の相補性レベルを測定するように構成されている相補性測定メカニズムと、
相補性レベルが所定のしきい値を上回ることに応答して、前記2つのジョブを同じ物理資源上に配置するように構成されているジョブ配置メカニズムと、
を更に含む請求項3に記載のシステム。 - 前記相補性レベルを測定している間、前記相補性測定メカニズムは前記2つのジョブに関連付けられたピーク時の資源使用間で時間的相関関係を計算する、請求項8に記載のシステム。
- 1つ以上の他の互いに関連しているジョブのロケーションと、配置される前記ジョブに関連付けられるネットワーク接続要件と、前記配置されるジョブに関連付けられるセキュリティ要件の1つ以上に基づいて、特定の物理資源へジョブを配置するように構成されているジョブ配置メカニズムを更に含む、請求項3に記載のシステム。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201261603366P | 2012-02-26 | 2012-02-26 | |
US61/603,366 | 2012-02-26 | ||
US13/688,035 US9374314B2 (en) | 2012-02-26 | 2012-11-28 | QoS aware balancing in data centers |
US13/688,035 | 2012-11-28 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013175177A JP2013175177A (ja) | 2013-09-05 |
JP6161312B2 true JP6161312B2 (ja) | 2017-07-12 |
Family
ID=47826926
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013023964A Expired - Fee Related JP6161312B2 (ja) | 2012-02-26 | 2013-02-12 | データセンタにおけるQoS認識バランシング |
Country Status (3)
Country | Link |
---|---|
US (1) | US9374314B2 (ja) |
EP (1) | EP2631800A3 (ja) |
JP (1) | JP6161312B2 (ja) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105657066B (zh) * | 2016-03-23 | 2019-06-14 | 天津书生云科技有限公司 | 用于存储系统的负载再均衡方法及装置 |
US20140122695A1 (en) * | 2012-10-31 | 2014-05-01 | Rawllin International Inc. | Dynamic resource allocation for network content delivery |
WO2015090419A1 (en) * | 2013-12-19 | 2015-06-25 | Huawei Technologies Co., Ltd. | Dynamically splitting a wi-fi access point into virtual access points according to the number of transmitting stations |
CN107688492B (zh) * | 2016-08-05 | 2021-11-09 | 阿里巴巴集团控股有限公司 | 资源的控制方法、装置和集群资源管理系统 |
US10261838B2 (en) | 2016-08-11 | 2019-04-16 | General Electric Company | Method and device for allocating resources in a system |
US20180174082A1 (en) * | 2016-12-16 | 2018-06-21 | Palo Alto Research Center Incorporated | Perceived quality of service |
CN106802854B (zh) * | 2017-02-22 | 2020-09-18 | 苏州浪潮智能科技有限公司 | 一种多控制器系统的故障监控系统 |
US11005924B1 (en) | 2020-04-01 | 2021-05-11 | Netapp, Inc. | Disparity of quality of service (QoS) settings of volumes across a cluster |
US11140219B1 (en) * | 2020-04-07 | 2021-10-05 | Netapp, Inc. | Quality of service (QoS) setting recommendations for volumes across a cluster |
US11693563B2 (en) | 2021-04-22 | 2023-07-04 | Netapp, Inc. | Automated tuning of a quality of service setting for a distributed storage system based on internal monitoring |
WO2023021554A1 (ja) * | 2021-08-16 | 2023-02-23 | 日本電信電話株式会社 | 移動先決定装置、物理サーバ、移動先決定システム、移動先決定方法、及びプログラム |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7441045B2 (en) * | 1999-12-13 | 2008-10-21 | F5 Networks, Inc. | Method and system for balancing load distribution on a wide area network |
JP3861087B2 (ja) * | 2003-10-08 | 2006-12-20 | 株式会社エヌ・ティ・ティ・データ | 仮想マシン管理装置及びプログラム |
CN1936849A (zh) | 2005-09-19 | 2007-03-28 | 国际商业机器公司 | 资源动态调整方法及设备 |
GB0706283D0 (en) * | 2007-03-30 | 2007-05-09 | British Telecomm | Data network monitoring system and method |
JP5035011B2 (ja) * | 2008-02-22 | 2012-09-26 | 日本電気株式会社 | 仮想サーバ管理装置および仮想サーバ管理方法 |
US8656404B2 (en) | 2008-10-16 | 2014-02-18 | Palo Alto Research Center Incorporated | Statistical packing of resource requirements in data centers |
JP4839361B2 (ja) * | 2008-11-11 | 2011-12-21 | 株式会社日立製作所 | 仮想マシン移動管理サーバおよび仮想マシン移動方法 |
JP5412926B2 (ja) * | 2009-04-02 | 2014-02-12 | 日本電気株式会社 | 仮想マシン管理システム,仮想マシン配置設定方法及びそのプログラム |
US8190744B2 (en) * | 2009-05-28 | 2012-05-29 | Palo Alto Research Center Incorporated | Data center batch job quality of service control |
US8422365B2 (en) * | 2009-09-21 | 2013-04-16 | Cisco Technology, Inc. | Energy efficient scaling of network appliance service performance |
US8433802B2 (en) * | 2010-01-26 | 2013-04-30 | International Business Machines Corporation | System and method for fair and economical resource partitioning using virtual hypervisor |
US8423998B2 (en) * | 2010-06-04 | 2013-04-16 | International Business Machines Corporation | System and method for virtual machine multiplexing for resource provisioning in compute clouds |
US9594579B2 (en) * | 2011-07-29 | 2017-03-14 | Hewlett Packard Enterprise Development Lp | Migrating virtual machines |
-
2012
- 2012-11-28 US US13/688,035 patent/US9374314B2/en active Active
-
2013
- 2013-02-12 JP JP2013023964A patent/JP6161312B2/ja not_active Expired - Fee Related
- 2013-02-26 EP EP13156725.7A patent/EP2631800A3/en not_active Withdrawn
Also Published As
Publication number | Publication date |
---|---|
US20130223216A1 (en) | 2013-08-29 |
US9374314B2 (en) | 2016-06-21 |
EP2631800A2 (en) | 2013-08-28 |
EP2631800A3 (en) | 2013-12-18 |
JP2013175177A (ja) | 2013-09-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6161312B2 (ja) | データセンタにおけるQoS認識バランシング | |
US10296364B2 (en) | Capacity risk management for virtual machines | |
Hieu et al. | Virtual machine consolidation with multiple usage prediction for energy-efficient cloud data centers | |
Usmani et al. | A survey of virtual machine placement techniques in a cloud data center | |
US9218213B2 (en) | Dynamic placement of heterogeneous workloads | |
CN103729248B (zh) | 一种基于缓存感知的确定待迁移任务的方法和装置 | |
CN104102543B (zh) | 一种云计算环境中负载调整的方法和装置 | |
CN108182105B (zh) | 基于Docker容器技术的局部动态迁移方法及控制系统 | |
CN107370799B (zh) | 一种混合移动云环境中高能效的多用户在线计算迁移方法 | |
US11716384B2 (en) | Distributed resource management by improving cluster diversity | |
CN105893113A (zh) | 虚拟机的管理系统及管理方法 | |
Laili et al. | An iterative budget algorithm for dynamic virtual machine consolidation under cloud computing environment | |
Gohil et al. | A comparative analysis of virtual machine placement techniques in the cloud environment | |
Rahmani et al. | Burst‐aware virtual machine migration for improving performance in the cloud | |
CN112000460A (zh) | 一种基于改进贝叶斯算法的服务扩缩容的方法及相关设备 | |
Su et al. | A Robust Predictive—Reactive Allocating Approach, Considering Random Design Change in Complex Product Design Processes | |
Kaur et al. | Load balancing techniques of cloud computing | |
Garg et al. | Optimal virtual machine scheduling in virtualized cloud environment using VIKOR method | |
Varghese et al. | Entropy Based Monotonic Task Scheduling and Dynamic Resource Mapping in Federated Cloud Environment. | |
CN115952054A (zh) | 一种仿真任务资源管理方法、装置、设备及介质 | |
CN115086324A (zh) | 服务链分配方法和系统、计算机设备和存储介质 | |
CN108279968A (zh) | 一种虚拟机资源的调度方法及装置 | |
Wei et al. | Towards multi-resource physical machine provisioning for IaaS clouds | |
CN115269110A (zh) | 云计算平台的资源分配方法、装置、电子设备和存储介质 | |
Narang et al. | Various load balancing techniques in cloud computing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160210 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170214 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170314 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170512 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170523 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170613 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6161312 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |