JP5305664B2 - データ処理システムの区画相互間で資源をトレードするための方法、プログラム及び装置 - Google Patents

データ処理システムの区画相互間で資源をトレードするための方法、プログラム及び装置 Download PDF

Info

Publication number
JP5305664B2
JP5305664B2 JP2008000815A JP2008000815A JP5305664B2 JP 5305664 B2 JP5305664 B2 JP 5305664B2 JP 2008000815 A JP2008000815 A JP 2008000815A JP 2008000815 A JP2008000815 A JP 2008000815A JP 5305664 B2 JP5305664 B2 JP 5305664B2
Authority
JP
Japan
Prior art keywords
resource
partition
partitions
resources
desirability
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008000815A
Other languages
English (en)
Other versions
JP2008171425A (ja
Inventor
ジョス・マニュエル・アカパディ
アンドリュー・ダンシア
ダイアン・ガーザ・フレミング
カトリーヌ・モリアティ・ニュネ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JP2008171425A publication Critical patent/JP2008171425A/ja
Application granted granted Critical
Publication of JP5305664B2 publication Critical patent/JP5305664B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5061Partitioning or combining of resources
    • G06F9/5077Logical partitioning of resources; Management or configuration of virtualized resources

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Storage Device Security (AREA)

Description

本発明は、メモリのような資源に対するアクセスが待ち時間又はアクセス時間に関して非一様となることがあるデータ処理システムにおいて、論理区画(LPAR)相互間で資源を交換又はトレードするための方法に係り、より具体的には、それぞれの区画による利用可能な資源の利用率を改良するように資源をトレードする前記方法に係る。さらに詳細に説明すれば、本発明は、それぞれの区画相互間の資源のトレード及び再割り振りが、それぞれの区画による資源の使用に関する総合的システム品質を改良するためのポリシによってガイドされる前記方法に係る。
大型の対称マルチプロセッサ・システムが単一の大型データ処理システムとして使用されることは、ますます少なくなってきた。その代わり、これらのデータ処理システムは、複数の区画に分割又は区画化されて、論理区画(LPAR)システムとも呼ばれる、より小さなシステムとして使用されることが多くなってきた。LPARシステム内の論理区画は、単一のオペレーティング・システム(OS)の複数のコピー又は複数の異種OSが、単一のプラットフォーム上で同時に実行されることを可能にする。その内部でOSイメージが実行される各区画には、プラットフォーム資源の重複しないサブセットが割り振られる。これらの割り振り可能な資源は、アーキテクチャ的に別個の1つ以上のプロセッサ及びそれらの割り込み管理エリア、システム・メモリ領域、I/Oアダプタ・バススロットを含むことができる。区画の資源は、プラットフォーム・ファームウェアによって、OSイメージに対し表される。例えば、LPARシステム内のハードウェア資源は、I/Oアダプタ、CPU、不揮発性RAM(NVRAM)及びハードディスク・ドライブを含むことができる。ハードウェア資源は、その必要性が変わるのに応じて、1つの区画から他の区画に移動させることができる。
一の区画が作成される場合、区画メモリを提供するように幾つかの異なるメモリ領域を要求することができる。これらのメモリ領域の各々は、ハードウェアに依存して、異なる待ち時間又はアクセス時間を有することがある。これらのメモリ領域のうち或るメモリ領域が、この区画に対しローカル(局所的)である場合、当該メモリ領域は、より短い待ち時間を有することがある。一方、この区画から離れている他のメモリ領域は、過度に長い待ち時間を有することがある。幾つかのワークロードについては、これは望ましくないことがある。例えば、一の区画のCPUが当該CPUと同じカード上にあるメモリを割り振られるならば、このメモリは当該CPUに対しローカルであり、従って当該CPUがこのメモリにアクセスするのに必要な時間はより短くなる。一方、このメモリが異なるカード上にあれば、当該CPUはこのメモリにアクセスするためにバッファを通過しなければならず、その結果、待ち時間はより長くなる。もし、当該CPUが大量の計算のような活動を行っていて、その活動ではCPUとメモリの間の局所性(locality)が重要であれば、遠隔メモリを使用するときの品質は、ローカル・メモリを使用するときの品質よりも低くなるであろう。一方、当該CPUが単にI/O装置にアクセスしているのであれば、局所性は重要でないことがある。さらに、一のメモリ領域については、局所性又は遠隔性(remoteness)のレベルが存在することがある。これを理解するには、次の3つの代替的な環境、すなわち、メモリがCPUのキャッシュ・コントローラに直接的に接続されている第1の環境と、メモリがCPUのキャッシュ・コントローラに直接的に接続されていないがCPUと同じノード内にある第2の環境と、メモリがCPUと同じフレーム内にあるがメモリへのアクセスは1つ以上のバッファを通過しなければならない第3の環境とを、それぞれ相対的に検討すればよい。
前述のメモリ・アクセス時間の非一様性が、LPARシステムの総合的スループットに著しく影響し得ることが分かった。同じワークロードを実行している異なる論理区画の性能が一致しないという事象がしばしば認められている。例えば、2つの区画がそれぞれのメモリ量、CPU及びOSに関して同一に構成されているように見えた場合でも、これらの区画相互間で10%の性能差を観察した。さらに、一の区画がメモリの割り振りに関してローカルでなければ、一のCPUを当該区画に移動させると、遠隔メモリ・アクセスの数が増加することがある。同様に、割り振り済みのメモリのうちの或るもの又は全てに関してローカルであった一の区画からCPUが取り除かれると、遠隔アクセスの数が増加することがある。
前述の(メモリ資源の相対的な局所性が変動することに起因し得る)望ましくない影響にも拘わらず、現在の一般的な慣行は、一旦メモリが一の区画に割り振られた後、この区画が実行中であれば、この区画は、それが受け取った全ての資源を最大限に活用することを期待される、というものである。非常に多くの場合、これは割り振りを経由してメモリ・アクセスを分散させることを意味し、その結果、平均メモリ待ち時間値を導出する。この平均メモリ待ち時間値は、アクセス時間のミックス及び各領域がどれだけのメモリを提供したかに依存する。現在の慣行の他の例は、動的な再割り振り中に、より貧困な区画にメモリを与える、というものである。この状況では、メモリの任意の範囲が1つの区画から取り除かれて、他の区画に与えられる。この状況では、メモリを取り除くか又はスチールするための要求が特定の区画に対する標的化動作であるという意味で、メモリの局所性は、考慮に入れられていない。
もし、それぞれの区画への資源の割り振りが、資源局所性の相対的な重要度を考慮に入れて行われるならば、LPARシステムの総合的品質を改良することができるばかりか、著しく高い効率で資源を使用することができるであろう。
本発明の実施形態に従ったLPARシステムでは、「資源望ましさ」(desirability of resource)ポリシは、CPU及びメモリのようなアフィニティ領域に関連する、各資源ごとの局所性の望ましいレベルをリストする。各区画ごとに、それぞれの資源のための望ましい局所性レベルは、非常に望ましいレベルから重要でないレベルまで及ぶ、レベルの範囲に含まれる。「資源局所性レベル」とは、一の資源がその区画に対しどれくらい接近し又は離れているか、という相対的な尺度を与える数値である。本発明の実施形態は、局所性レベルに基づいて資源を管理するために、LPARシステムの区画ロード・マネージャ(PLM)を使用することができる。このPLMは、ハードウェア管理コンソール(HMC)上に、ポリシ・ベース資源再割り振りの集中インフラストラクチャを提供する。しかし、局所性レベルに基づいて資源を管理するために、PLMとは異なる、別個のデーモン又は背景プロセスのようなエンティティも使用することができる。本発明の1つの実施形態は、複数の論理区画を含むように構成され、それぞれの区画相互間で資源が選択的に割り振られるようにしたデータ処理システムのための方法に向けられている。この方法は、特定の時間に前記区画の各々に対する資源の割り振りを評価することにより、少なくとも1つの資源を有する一の区画を選択するステップを含む。前記少なくとも1つの資源は、前記選択した区画に関するその局所性のレベルに起因して、低い望ましさを有すると見なされるものである。また、この方法は、前記低い望ましさの資源と適合する(matching)資源を有する、他の区画の各々を識別するステップと、前記低い望ましさの資源を前記識別した各区画の前記適合する資源とトレードする結果として生ずる、前記システムの総合的利益を決定するステップと、前記低い望ましさの資源を前記システムの最大の総合的利益を提供するものと決定した前記識別した区画の前記適合する資源とトレードするように、前記複数の資源を再割り振りするステップとをさらに含む。前記再割り振りするステップは、前記再割り振りの結果として前記システムの少なくとも幾らかの総合的利益が得られることを条件として、実行される。
図1は、本発明を実装することができる、複数の論理区画(LPAR)に分割又は区画化された典型的なプラットフォーム100を示す。このLPARプラットフォーム100内のハードウェアは、例えば、後述する図4のデータ処理システム400として実装することができる。LPARプラットフォーム100は、区画化ハードウェア130、オペレーティング・システム(OS)102〜108及びハイパーバイザ110を含む。OS 102〜108は、単一のOSの複数のコピーであるか、又はプラットフォーム100上で同時に実行される複数の異種OSである。これらのOSは、ハイパーバイザ110とインタフェースするように設計された、OS/400を使用して実装することができる。OS 102〜108は、区画112〜118内にそれぞれ位置する。また、これらの区画は、ファームウェア・ローダ122〜128をそれぞれ含む。区画112〜118がインスタンス化される場合、ハイパーバイザ110の区画マネージャによって、オープン・ファームウェアのコピーが各区画にロードされる。その後、区画ファームウェアを実行するために、これらの区画に割り振られたプロセッサが当該区画のメモリにディスパッチされる。
区画化ハードウェア130は、複数のプロセッサ132〜138、複数のシステム・メモリ140〜146、複数のI/Oアダプタ148〜162及び記憶装置170を含む。また、区画化ハードウェア130は、各区画におけるエラーの処理のような種々のサービスを提供するために使用することができる、サービス・プロセッサ190を含む。プロセッサ132〜138、システム・メモリ140〜146、NVRAM 198及びI/Oアダプタ148〜162の各々は、LPARプラットフォーム100内の複数の区画のうちの1つに割り振ることができる。これらの区画の各々は、OS 102〜108のうちの1つに対応する。
区画管理ファームウェア(ハイパーバイザ)110は、LPARプラットフォーム100の区画化を作成し且つ実行するために、区画112〜118のための多くの機能及びサービスを行う。ハイパーバイザ110は、基礎となるハードウェアと同一の、ファームウェアで実装された仮想計算機である。ハイパーバイザ・ソフトウェアは、IBM社から入手可能である。ファームウェアは、「ソフトウェア」であって、電力なしにその内容を保持するようなメモリ・チップ(例えば、読み取り専用メモリ(ROM)、プログラマブルROM(PROM)、電気的に消去可能なプログラマブルROM(EEPROM)、不揮発性RAM(NVRAM)等)に格納される。従って、ハイパーバイザ110は、LPARプラットフォーム100の全てのハードウェア資源を仮想化することにより、独立のOSイメージ102〜108の同時的な実行を可能にする。
異なる区画の動作は、ハードウェア管理コンソール(HMC)180によって制御することができる。HMC 180は、別個の分散コンピューティング・システムである。システム管理者は、異なる区画への資源の再割り振りを含む種々の機能を、HMC 180を通して行うことができる。
図1に示すタイプの環境では、1つの区画内にある資源又はプログラムは、他の区画内の動作に影響を及ぼすことはできない。さらに、有用であるためには、資源の割り振りは粒度を細かくする必要がある。
図2は、図1のハードウェア管理コンソール(HMC)内に存在することができる、区画ロード・マネージャ(PLM)200を示す。PLM 200は、それぞれの区画への資源の割り振りを周期的に評価することにより、本発明の実施形態を実装するために設けられる。また、PLM 200は、異なる区画相互間の資源の選択的なトレード又は交換によって、資源の使用に関する総合的品質を改良することができるか否かを決定するように適合されている。これらのタスクを行うために、PLM 200は、CPU 202、メモリ204及びI/Oバス206を有する。さらに、PLM 200は、「資源望ましさ」ポリシ210を保持するためのデータベース208を有する。
特定の区画に割り振られる各資源ごとに、すなわち特定の区画内でCPU及びメモリのようなアフィニティ領域に関連する各資源ごとに、ポリシ210は、当該各資源のための局所性の望ましいレベルをリストする。一般に、資源局所性の望ましいレベルは、特定の区画のワークロードによって決定され、資源が特定の区画に関してローカルであることがどれくらい重要であるかを指示する。資源局所性レベルは、非常に望ましいレベルから重要でないレベルにまで及ぶ、レベルの範囲内で分類される。例えば、特定の区画が大量の計算を行っていれば、互いに近いCPU及びメモリを有することは非常に望ましいであろう。一方、ワークロードが記憶ディスクとのデータ転送のようなI/Oとの動作を含むのであれば、CPUとメモリの間の待ち時間、従って資源局所性レベルは、相対的に重要でないであろう。
PLM 200は、資源割り振りを評価し、そして総合的システム品質を改良するために、区画相互間で資源をシフトすることの望ましさを評価する、という前述のタスクを行うように構成されたアルゴリズムを有する。また、このアルゴリズムは、一の区画のリストされた資源局所性レベルを使用して、この区画のための「最小勝ち」値("minimum win" value)及び「最大負け」値("maximum loss" value)を決定するように構成される。「最小勝ち」値は、一の区画内の割り当て済み資源の変更に起因する、当該区画が容認できる最小の利益を指示する数値である。勝ち値は、この区画のための資源局所性レベルの増加分を表し、前述のように、この区画に対する資源局所性の相対的重要度も表す。同様に、「最大負け」値は、一の区画が容認できる資源局所性の最大の減少分であり、資源の変更に起因する資源局所性レベルの減少分と、この区画に対する局所性の重要度の両方を表す。前述の最小勝ち値及び最大負け値を計算するようにアルゴリズムを構成する際に、他のアプローチも採用することができる。
最小勝ち値及び最大負け値は、この区画への資源のシフトイン及びこの区画からの資源のシフトアウトを制限するためのしきい値を確立する。もし、その区画に対する利益が過小であるか、又はその区画に対する損失が過大であれば、資源の移転は許可されないであろう。従って、しきい値は、資源のシフティング又は再平衡化により品質を向上させるための活動を行うだけの価値がある範囲を定義するように作用する。さらに、前記アルゴリズムは、各区画のための勝ち値及び負け値を使用して、この区画のための資源望ましさ係数を計算する。例えば、資源望ましさ係数は、一の区画のための勝ち値及び負け値の比とすることができ、又はかかる両方の値を表す異なる関係から計算することができる。それぞれの区画のための資源望ましさ係数は、現在の資源割り振りセットの品質を決定するために必要である。
本発明の方法によれば、前記アルゴリズムは、資源割り振りの評価を行った後、最低の資源望ましさ係数を有する特定の区画を選択する。この位置を共有する複数の区画があれば、資源トレードを最も最近に受け入れた区画を選択する。次に、選択した区画の最も望ましくない資源を識別する。他の全ての区画について、前記望ましくない資源と適合する資源を評価することにより、前記望ましくない資源を前記適合する資源の1つとトレードすると、総合的利益が得られるか否かを決定する。この評価は、それぞれの区画のための勝ち値/負け値に基づいて行われ、最終的に最良の適合資源が選ばれる。
最良の適合資源は、各区画のための勝ち値及び負け値の組み合わせを考慮して決定され、その望ましい目標は、選択した最低ランクの区画の資源の望ましさを向上させることである。これを達成するための有用な計算は、勝ち又は負けのパーセンテージを取ることである。勝ちの場合は、パーセンテージ利得を取る。負けの場合は、容認可能な総合的負けに基づくパーセンテージを使用する。例えば、一の区画が200点の負けを容認し、負け値が100であれば、負け値のために50%を使用する。次に、この負け値を勝ち値から引く。この手順は、資源トレード又は再平衡化に起因する利益だけでなく、そのために引き起こされるあらゆる不利益をも考慮していることに留意されたい。
図3は、前述の手順を実施するための一層詳細なステップを示す。本発明の有用な実施形態では、PLM 200は、それぞれの区画へのシステム資源の割り振りを周期的に評価する。周期的な各評価の後、図3の手順を実施する。ステップ302では、前記評価によって最低の資源望ましさ係数(RDF)を有するものとして決定した区画を選択し、前述のように、その区画の最も望ましくない資源を識別する。ステップ304〜306では、前述と同様に、前記最も望ましくない資源と適合する資源を有する他の区画を識別し、当該識別した区画の当該適合する資源とのトレードを評価する。
図2のポリシ210は、前述の資源局所性レベルのリストに加えて、1セットの有用な規則を有する。これらの規則は、区画相互間の資源の提案されたトレード又は交換を評価するプロセスを規制するために使用する。例えば、1つの規則は、時間的制約を確立することにより、区画相互間の資源の割り振りを再平衡化するためのトレードが特定の時間ウィンドウ内でのみ生じるように制限することができる。従って、図3のステップ308では、提案されたトレードがそのような時間的制約によって阻止されるか否かを決定することが必要である。
資源トレードは大規模な動作になることがあるので、システムの利用率が高いときは、資源をトレードすることは不適当である。従って、他の規則は、各区画がその勝ちパラメータ値及び負けパラメータ値の両方にそれぞれ利用率レベルを割り振ることを可能にすることにより、システムの利用率が高い間は資源の動的な再平衡化を制限することができる。利用率がカットオフ値以上になれば、一の区画は、利用率がカットオフ値以下になるか又は保留期間が終了するまで、一の資源を保留し、保留期間中は資源の交換に参加しないようにすることができる。これがカットオフ値を提供するのは、それぞれの区画がシステムの利用率に起因して資源の再平衡化に対する要求を受け入れない場合である。評価プロセスに含まれるステップ310は、この規則を考慮して、前記識別した区画とのトレードを許可するためにはシステムの利用率が高すぎるか否かを決定する。
前述のように、それぞれの区画のための資源望ましさ係数を決定することに加えて、各区画のための資源の望ましさ目標を計算することが有益となることがある。その場合、ポリシ210は、それぞれの資源の望ましさ目標に到達した区画相互間のトレードを除外することができる。資源の望ましさ目標から最も遠い区画には、資源トレードの優先権が与えられる。一方、資源の望ましさ目標を超える区画は、その区画のための最大負けしきい値を超えていないことを条件として、他の区画を支援するためにトレードに参加することができる。ステップ312では、この規則を考慮して、前記識別した区画がその資源の望ましさ目標に到達したという理由で、前記識別した区画とのトレードが阻止されるか否かを決定する。
ステップ314では、前記識別した区画の最大しきい値及び最小しきい値によって、資源を再平衡化するための提案されたトレードが阻止されるか否かを決定する。ステップ314の決定がNOであれば、ステップ316で、前述のように、提案されたトレードのための勝ち/負けの組み合わせを評価する。
ステップ320は、提案された資源トレードを評価する際に、それ以上の区画を考慮する必要があるか否かを決定するためのものである。しかし、ステップ320とステップ308〜314の全てYES枝路との間には、ステップ302で選択した最低の資源望ましさ係数を有する区画とのトレードを明示的に禁止するためのステップ318が置かれている。
ステップ320の後、適合する資源を有するものとして識別した残りの区画が存在しなければ、ステップ322に進み、そこでトレードを許可するような少なくとも1つの識別済みの区画が存在するか否かを決定する。そのような区画が存在しなければ、プロセスは終了する。さもなければ、ステップ324に進み、そこで評価プロセス中に何れかの最良の勝ち/負けの組み合わせが見つかったことを条件として、提案された資源トレード又は再平衡化をそのような組み合わせについて実施する。
他の規則として、ポリシ210は、一の区画が自発的にライブ・トレードに参加するのか、又は資源再割り振りが行われている場合に限りライブ・トレードに参加するのか、を定義することができる。例えば、手動による動的区画化動作又は自動化PLM動作に起因してメモリが除去又は追加される場合のような動的な資源割り振り中に、当該区画は、望ましさに基づいて資源の再割り振りを許可することができる。もし、一の区画がライブ・トレードに参加することが可能であれば、望ましさに基づいた資源の再平衡化はいつでも許可されるであろう。
図4は、図1に示すように区画化することが可能であり、本発明を実装するために使用される、データ処理システム400を示す。データ処理システム400は、システム・バス406に接続した複数のプロセッサ402及び404を含む、対称マルチプロセッサ(SMP)システムとすることができる。代替的に、単一プロセッサ・システムも使用することもできる。システム・バス406に接続したメモリ・コントローラ/キャッシュ408は、ローカル・メモリ408に対するインタフェースを提供する。システム・バス406に接続したI/Oバス・ブリッジ410は、I/Oバス412に対するインタフェースを提供する。メモリ・コントローラ/キャッシュ408及びI/Oバスブリッジ410は、図示のように統合化することができる。
I/Oバス412に接続した周辺機器コンポーネント間接続(PCI)バス・ブリッジ414は、PCIローカル・バス416に対するインタフェースを提供する。PCIバス416には、多数のモデムを接続することができる。典型的なPCIバス実装は、4つのPCI拡張スロット又はアドイン・コネクタをサポートする。通信リンクは、拡張ボードを通してPCIローカル・バス416に接続したモデム418及びネットワーク・アダプタ420を通して提供することができる。
追加のPCIバス・ブリッジ422及び424は、追加のPCIバス426及び428のためのインタフェースを提供し、これらの追加のPCIバス426及び428から追加のモデム又はネットワーク・アダプタをサポートすることができる。このように、データ処理システム400は、多数のネットワーク・コンピュータへの接続を可能にする。また、メモリ・マップ式グラフィックス・アダプタ430及びハードディスク432を、直接的又は間接的にI/Oバス412に接続することができる。図示の例は、本発明に関するアーキテクチャ上の制限を暗示するものではない。例えば、図4のデータ処理システム400は、OSとして拡張対話エグゼクティブ(AIX)を搭載したIBM社のRISC/システム6000システムとすることができる。
本発明は、完全にソフトウェアの実施形態又はハードウェア及びソフトウェア要素の両方を含んでいる実施形態の形式を取ることができる。好ましい実施形態では、本発明は、ファームウェア、常駐ソフトウェア、マイクロコード等を含む、ソフトウェアで実装される。
さらに、本発明は、コンピュータ又は任意の命令実行システムに関連して又はこれらによって使用するためのプログラム・コードを提供する、コンピュータ使用可能媒体又はコンピュータ可読媒体からアクセス可能なコンピュータ・プログラム製品の形式を取ることができる。この記載の目的上、コンピュータ使用可能媒体又はコンピュータ可読媒体は、コンピュータ又は任意の命令実行システムに関連して又はこれらによって使用するためのプログラムを保持し、格納し、通信し、伝送し、移送することができる、任意の有形的装置とすることができる。
媒体は、電子、磁気、光学、電磁気、赤外線又は半導体式のシステム又は伝送媒体とすることができる。コンピュータ可読媒体の例には、半導体又は固体メモリ、磁気テープ、取り外し可能なフレキシブル・ディスク、ランダム・アクセス・メモリ(RAM)、読み取り専用メモリ(ROM)、剛体磁気ディスク及び光ディスク等がある。光ディスクの例には、読み取り専用のCD−ROM、読み書き可能なCD−R/W及びDVDがある。
プログラム・コードを格納及び/又は実行するのに適したデータ処理システムは、システム・バスを通してメモリ要素に直接的又は間接的に接続された少なくとも1つのプロセッサを含む。メモリ要素は、プログラム・コードの実行中に使用されるローカル・メモリ、バルク記憶装置、プログラム・コードの実行中にバルク記憶装置からの検索回数を減少させるために少なくとも幾らかのプログラム・コードの一時的記憶領域を提供するキャッシュ・メモリを含むことができる。
I/O装置(キーボード、ディスプレイ、ポインティング装置等を含む)は、システムに対し直接的に又は介在するI/Oコントローラを通して接続することができる。
また、ネットワーク・アダプタをデータ処理システムに対し結合することもできる。そのようにすると、当該データ処理システムは、介在する専用又は公衆ネットワークを通して、他のデータ処理システム、遠隔プリンタ又は記憶装置に結合されるようになる。ネットワーク・アダプタの例には、モデム、ケーブル・モデム及びイーサネット(登録商標)・カード等がある。
本発明の実施形態を実装することができる、典型的な論理区画(LPAR)プラットフォームを示すブロック図である。 図1のLPARプラットフォームとともに使用するための典型的な区画ロード・マネージャ(PLM)を示す概略図である。 本発明の実施形態に従った方法のステップを示すフローチャートである。 図1に示すように区画化することができるデータ処理システムを示すブロック図である。
符号の説明
200 区画ロード・マネージャ(PLM)
202 CPU
204 メモリ
208 データベース
210 資源の望ましさポリシ

Claims (13)

  1. データ処理システムにおいて、複数の論理区画を含むように構成され、それぞれの区画相互間で複数の資源を選択的に割り振る方法であって、
    (a)特定の時間に前記区画の各々に対する資源の割り振りを評価することにより、少なくとも1つの資源を有する一の区画を選択する、資源の割り振りを評価するステップを含み、
    前記少なくとも1つの資源は、前記選択した区画に関するその局所性のレベルに起因して、低い望ましさの資源と見なされる、前記資源の割り振りを評価するステップと、
    (b)前記低い望ましさの資源と適合する資源を有する、他の区画の各々を識別するステップと、
    (c)前記低い望ましさの資源を前記識別した各区画の前記適合する資源とトレードする結果として生ずる、前記システムの総合的利益を決定するステップと、
    (d)前記低い望ましさの資源を前記システムの最大の総合的利益を提供するものと決定した前記識別した区画の前記適合する資源とトレードするように、前記複数の資源を再割り振りするステップとを含み、
    前記複数の区画のうちの少なくとも1つの区画は、他の区画との資源トレードにいつでも参加することを許可され、
    前記複数の区画のうちの少なくとも1つの他の区画は、資源割り振りが行われている場合に限り、他の区画との資源トレードに参加することを許可され、
    前記再割り振りの結果として前記システムの少なくとも幾らかの総合的利益が得られることを条件として実行される、方法。
  2. 前記区画の各資源に割り当てられた所定の範囲内に含まれる資源局所性レベルは、前記範囲の一方の端部、非常に望ましい資源局所性レベルを指示し、前記範囲の他方の端部、重要でない資源局所性レベルを指示する、請求項1に記載の方法。
  3. 各区画に割り振られる資源の局所性を表すために、各区画のための資源望ましさ係数を計算し、それぞれの区画のための資源望ましさ係数を、前記低い望ましさの資源を有する前記区画を選択するために使用する、請求項1に記載の方法。
  4. 前記資源の割り振りを評価するステップ(a)において、各区画への資源のシフトイン及び当該各区画からの資源のシフトアウトを選択的に制限するしきい値を確立するために最小勝ち値及び最大負け値を各区画に割り当てられる、請求項1に記載の方法。
  5. 前記資源の割り振りを評価するステップ(a)において、前記複数の区画に関する資源の割り振りを管理するためのエンティティが設けられ、前記エンティティは、資源の望ましさに関係するポリシを保持する、請求項1に記載の方法。
  6. 前記資源の割り振りを評価するステップ(a)において、それぞれの区画に対する資源の割り振りを周期的に評価するとともに、前記複数の資源を再割り振りするステップ(d)において、提案された資源の再割り振りが前記システムに対し総合的利益を与えるか否かを決定する、請求項に記載の方法。
  7. 前記複数の資源を再割り振りするステップ(d)は、区画相互間の提案された資源の再割り振りの利益及び不利益の両方を考慮することにより、提案された資源の再割り振りのための前記システムに対する総合的利益を決定する、請求項6に記載の方法。
  8. 前記複数の区画のうちの各区画は、その割り振り済みの資源に関連する資源の望ましさ目標を有し、その資源の望ましさ目標に到達した一の区画は、他の区画との資源トレードに参加しない、請求項1に記載の方法。
  9. 前記複数の区画のうちの少なくとも1つの区画は、前記システムの利用率が予め指定された利用率レベルを超えるときは、他の区画との資源トレードに参加しない、請求項1に記載の方法。
  10. 請求項1ないし請求項9の何れか1項に記載の方法の各ステップを前記データ処理システムに実行させるためのプログラム。
  11. 複数の論理区画を含むように構成され、それぞれの区画相互間で複数の資源が選択的に割り振られるようにしたデータ処理システムにおいて、
    (a)特定の時間に前記区画の各々に対する資源の割り振りを評価することにより、少なくとも1つの資源を有する一の区画を選択するための第1の処理コンポーネントを備え、 前記少なくとも1つの資源は、前記選択した区画に関するその局所性のレベルに起因して、低い望ましさの資源と見なされ、
    (b)前記低い望ましさの資源と適合する資源を有する、他の区画の各々を識別するための第2の処理コンポーネントと、
    (c)前記低い望ましさの資源を前記識別した各区画の前記適合する資源とトレードする結果として生ずる、前記システムの総合的利益を決定するための第3の処理コンポーネントと、
    (d)前記低い望ましさの資源を前記システムの最大の総合的利益を提供するものと決定した前記識別した区画の前記適合する資源とトレードするように、前記複数の資源を再割り振りするための第4の処理コンポーネントとを含み、
    前記複数の区画のうちの少なくとも1つの区画は、他の区画との資源トレードにいつでも参加することを許可され、
    前記複数の区画のうちの少なくとも1つの他の区画は、資源割り振りが行われている場合に限り、他の区画との資源トレードに参加することを許可され、
    前記再割り振りの結果として前記システムの少なくとも幾らかの総合的利益が得られることを条件として前記再割り振りを実行する、装置。
  12. 前記複数の区画に関する資源の割り振りを管理するためのエンティティが設けられ、前記エンティティは、それぞれの区画に対する資源の割り振りを周期的に評価するとともに、提案された再割り振りが前記システムに対し総合的利益を与えるか否かを決定するためのアルゴリズムを有する、請求項11に記載の装置。
  13. 前記アルゴリズムは、区画相互間の資源の提案されたトレードの利益及び不利益の両方を考慮することにより、当該提案されたトレードのための前記システムに対する総合的利益を決定する、請求項12に記載の装置。
JP2008000815A 2007-01-10 2008-01-07 データ処理システムの区画相互間で資源をトレードするための方法、プログラム及び装置 Expired - Fee Related JP5305664B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/621637 2007-01-10
US11/621,637 US7698529B2 (en) 2007-01-10 2007-01-10 Method for trading resources between partitions of a data processing system

Publications (2)

Publication Number Publication Date
JP2008171425A JP2008171425A (ja) 2008-07-24
JP5305664B2 true JP5305664B2 (ja) 2013-10-02

Family

ID=39595389

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008000815A Expired - Fee Related JP5305664B2 (ja) 2007-01-10 2008-01-07 データ処理システムの区画相互間で資源をトレードするための方法、プログラム及び装置

Country Status (3)

Country Link
US (1) US7698529B2 (ja)
JP (1) JP5305664B2 (ja)
CN (1) CN101221517B (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008117470A1 (ja) * 2007-03-27 2008-10-02 Fujitsu Limited 仮想計算機制御プログラム、仮想計算機制御システムおよび仮想計算機移動方法
US8762999B2 (en) * 2007-09-27 2014-06-24 Oracle America, Inc. Guest-initiated resource allocation request based on comparison of host hardware information and projected workload requirement
US8424078B2 (en) 2007-11-06 2013-04-16 International Business Machines Corporation Methodology for secure application partitioning enablement
US9740517B2 (en) * 2008-12-29 2017-08-22 Microsoft Technology Licensing, Llc Dynamic virtual machine memory management
US9804874B2 (en) * 2011-04-20 2017-10-31 Microsoft Technology Licensing, Llc Consolidation of idle virtual machines on idle logical processors
US8745633B2 (en) * 2010-05-11 2014-06-03 Lsi Corporation System and method for managing resources in a partitioned computing system based on resource usage volatility
CN102486840A (zh) * 2010-12-03 2012-06-06 上海华虹集成电路有限责任公司 采用非rom方式引导程序的智能卡及其程序引导方法
CN102546782B (zh) * 2011-12-28 2015-04-29 北京奇虎科技有限公司 一种分布式系统及其数据操作方法
CN104715044B (zh) * 2011-12-28 2018-01-05 北京奇虎科技有限公司 一种分布式系统及其数据操作方法
US9483315B2 (en) * 2015-02-03 2016-11-01 International Business Machines Corporation Autonomous dynamic optimization of platform resources
CN112181585A (zh) * 2015-03-03 2021-01-05 华为技术有限公司 虚拟机的资源分配方法及装置
US11366701B1 (en) * 2020-07-28 2022-06-21 Management Services Group, Inc. High performance computer with a control board, modular compute boards and resource boards that can be allocated to the modular compute boards
US11323355B1 (en) * 2021-09-01 2022-05-03 Microsoft Technology Licensing, Llc Partition abstraction in distributed computing systems

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4476522A (en) 1981-03-09 1984-10-09 International Business Machines Corporation Programmable peripheral processing controller with mode-selectable address register sequencing
US4473522A (en) * 1981-10-26 1984-09-25 Colgate-Palmolive Company Crack elimination in soap
JPS6491261A (en) 1987-09-23 1989-04-10 Ibm Data processing system and access
CA2159269C (en) * 1995-09-27 2000-11-21 Chaitanya K. Baru Method and apparatus for achieving uniform data distribution in a parallel database system
US6424992B2 (en) * 1996-12-23 2002-07-23 International Business Machines Corporation Affinity-based router and routing method
US7748005B2 (en) * 2000-01-28 2010-06-29 Hewlett-Packard Development Company, L.P. System and method for allocating a plurality of resources between a plurality of computing domains
US7140020B2 (en) * 2000-01-28 2006-11-21 Hewlett-Packard Development Company, L.P. Dynamic management of virtual partition computer workloads through service level optimization
US7228546B1 (en) * 2000-01-28 2007-06-05 Hewlett-Packard Development Company, L.P. Dynamic management of computer workloads through service level optimization
US7073002B2 (en) * 2003-03-13 2006-07-04 International Business Machines Corporation Apparatus and method for controlling resource transfers using locks in a logically partitioned computer system
US7146482B2 (en) * 2003-11-25 2006-12-05 International Business Machines Corporation Memory mapped input/output emulation
US7234037B2 (en) * 2003-11-25 2007-06-19 International Business Machines Corporation Memory mapped Input/Output operations
US20060123217A1 (en) * 2004-12-07 2006-06-08 International Business Machines Corporation Utilization zones for automated resource management
JP4702127B2 (ja) * 2006-03-22 2011-06-15 日本電気株式会社 仮想計算機システム及びその物理リソース再構成方法並びにプログラム

Also Published As

Publication number Publication date
CN101221517A (zh) 2008-07-16
US7698529B2 (en) 2010-04-13
JP2008171425A (ja) 2008-07-24
CN101221517B (zh) 2010-06-16
US20080168457A1 (en) 2008-07-10

Similar Documents

Publication Publication Date Title
JP5305664B2 (ja) データ処理システムの区画相互間で資源をトレードするための方法、プログラム及び装置
US20220029895A1 (en) Managing data center resources to achieve a quality of service
RU2569805C2 (ru) Виртуальная архитектура неоднородной памяти для виртуальных машин
US9104453B2 (en) Determining placement fitness for partitions under a hypervisor
CN107548549B (zh) 分布式计算环境中的资源平衡
US7765552B2 (en) System and method for allocating computing resources for a grid virtual system
JP4374391B2 (ja) 複数のインスタンスアプリケーションに対し負荷分散装置を動作させるシステムおよび方法
JP4702127B2 (ja) 仮想計算機システム及びその物理リソース再構成方法並びにプログラム
US8291430B2 (en) Optimizing system performance using spare cores in a virtualized environment
JP3813056B2 (ja) 優先順位に基づくチャネル・サブシステム保留入出力作業キューの処理
JP3807916B2 (ja) コンピュータ環境の区画のグループを管理する方法およびシステム
JP3672236B2 (ja) コンピュータ環境の中央処理装置を管理する方法、システム、およびプログラム製品
US8752055B2 (en) Method of managing resources within a set of processes
US8782657B2 (en) Dynamic creation and destruction of IO resources based on actual load and resource availability
JP3872343B2 (ja) コンピュータ環境におけるワークロード管理
US8195784B2 (en) Linear programming formulation of resources in a data center
US8875153B2 (en) Routing workloads based on relative queue lengths of dispatchers
JP2007512632A (ja) アクティビティ情報を用いての仮想マシンの管理
KR20010050506A (ko) 계산환경의 논리 프로세서들을 관리하는 방법, 시스템 및프로그램 기억 장치
JP2005032242A (ja) リソースの利用およびアプリケーションの性能の監視システムおよび監視方法
US20080109817A1 (en) Schedule control program and schedule control method
KR20170094899A (ko) 컴퓨팅 리소스 관리 시스템 및 방법
Puttaswamy Scale-Out Algorithm for Apache Storm in SaaS Environment
JP2010211259A (ja) 仮想マシンシステム、情報処理装置、リソース管理方法、プログラム及び記録媒体
Fourati et al. Cloud Elasticity: VM vs container: A Survey

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100824

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120718

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120807

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121025

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130108

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130325

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130604

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130625

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees